轉義文字中的序列
字串和字元文字提供了一種轉義機制,允許明文字元程式碼,否則文字中不允許這些字元程式碼。轉義序列由反斜槓字元(\
)和一個或多個其他字元組成。相同的序列在字串文字中都有效。
完整的轉義序列集如下:
轉義序列 | 含義 |
---|---|
\\ |
表示反斜槓(\ )字元 |
\' |
表示單引號(' )字元 |
\" |
表示雙引號(" )字元 |
\n |
表示換行符(LF )字元 |
\r |
表示回車符(CR ) |
\t |
表示水平製表符(HT )字元 |
\f |
表示換頁(FF )字元 |
\b |
表示退格(BS )字元 |
\<octal> |
表示 0 到 255 範圍內的字元程式碼。 |
上面的 <octal>
由一個,兩個或三個八進位制數字(‘0’到'7’)組成,它們代表 0 到 255(十進位制)之間的數字。
請注意,反斜槓後跟任何其他字元是無效的轉義序列。無效的轉義序列被 JLS 視為編譯錯誤。
參考:
Unicode 轉義
除了上面描述的字串和字元轉義序列之外,Java 還有一個更通用的 Unicode 轉義機制,如 JLS 3.3 中所定義。 Unicode Escapes 。Unicode 轉義具有以下語法:
'\' 'u' <hex-digit> <hex-digit> <hex-digit> <hex-digit>
其中 <hex-digit>
是'0'
,'1'
,'2'
,'3'
,'4'
,'5'
,'6'
,'7'
,'8'
,'9'
,'a'
,'b'
,'c'
,'d'
,'e'
,'f'
,'A'
,'B'
,'C'
,'D'
,'E'
,'F'
。
Java 編譯器將 Unicode 轉義符對映到字元(嚴格來說是 16 位 Unicode 程式碼單元 ),並且可以在對映字元有效的原始碼中的任何位置使用。當你需要在文字中表示非 ASCII 字元時,它通常用於字元和字串文字。
在正規表示式中轉義
TBD