转义文字中的序列
字符串和字符文字提供了一种转义机制,允许明文字符代码,否则文字中不允许这些字符代码。转义序列由反斜杠字符(\
)和一个或多个其他字符组成。相同的序列在字符串文字中都有效。
完整的转义序列集如下:
转义序列 | 含义 |
---|---|
\\ |
表示反斜杠(\ )字符 |
\' |
表示单引号(' )字符 |
\" |
表示双引号(" )字符 |
\n |
表示换行符(LF )字符 |
\r |
表示回车符(CR ) |
\t |
表示水平制表符(HT )字符 |
\f |
表示换页(FF )字符 |
\b |
表示退格(BS )字符 |
\<octal> |
表示 0 到 255 范围内的字符代码。 |
上面的 <octal>
由一个,两个或三个八进制数字(‘0’到'7’)组成,它们代表 0 到 255(十进制)之间的数字。
请注意,反斜杠后跟任何其他字符是无效的转义序列。无效的转义序列被 JLS 视为编译错误。
参考:
Unicode 转义
除了上面描述的字符串和字符转义序列之外,Java 还有一个更通用的 Unicode 转义机制,如 JLS 3.3 中所定义。 Unicode Escapes 。Unicode 转义具有以下语法:
'\' 'u' <hex-digit> <hex-digit> <hex-digit> <hex-digit>
其中 <hex-digit>
是'0'
,'1'
,'2'
,'3'
,'4'
,'5'
,'6'
,'7'
,'8'
,'9'
,'a'
,'b'
,'c'
,'d'
,'e'
,'f'
,'A'
,'B'
,'C'
,'D'
,'E'
,'F'
。
Java 编译器将 Unicode 转义符映射到字符(严格来说是 16 位 Unicode 代码单元 ),并且可以在映射字符有效的源代码中的任何位置使用。当你需要在文字中表示非 ASCII 字符时,它通常用于字符和字符串文字。
在正则表达式中转义
TBD