正規表示式(正規表示式)
角色類
[AB]可以是 A 或 B.[[:alpha:]]可以是任何字母[[:lower:]]代表任何小寫字母。請注意,[a-z]接近但不匹配,例如,ú。[[:upper:]]代表任何大寫字母。請注意,[A-Z]接近但不匹配,例如,Ú。[[:digit:]]代表任何數字:0,1,2,…或 9,相當於[0-9]。
量詞
+,*和 ? 照常用於正規表示式。 - +至少匹配一次,*匹配 0 次或更多次,? 匹配 0 或 1 次。
行開始和結束指示符
你可以在字串中指定正規表示式的位置:
^...強制正規表示式位於字串的開頭...$強制正規表示式位於字串的末尾
與其他語言的差異
請注意,R 中的正規表示式通常與其他語言中使用的正規表示式略有不同。
-
R 需要雙反斜槓轉義(因為
\已經意味著通常在 R 字串中轉義),因此,例如,要捕獲大多數正規表示式引擎中的空白,只需要在 R 中鍵入\s,而不是\\s。 -
R 中的 UTF-8 字元應該用大寫 U 轉義,例如
[\U{1F600}]和[\U1F600]匹配😀,而在例如 Ruby 中,這將與小寫 u 匹配。
其他資源
以下站點 reg101 是在使用 R-script 之前檢查線上正規表示式的好地方。
在 [R 寫頻維基有一個專用的使用正規表示式的例子很多文字處理頁面。