转义文字中的序列
字符串和字符文字提供了一种转义机制,允许明文字符代码,否则文字中不允许这些字符代码。转义序列由反斜杠字符(\)和一个或多个其他字符组成。相同的序列在字符串文字中都有效。
完整的转义序列集如下:
| 转义序列 | 含义 |
|---|---|
\\ |
表示反斜杠(\)字符 |
\' |
表示单引号(')字符 |
\" |
表示双引号(")字符 |
\n |
表示换行符(LF)字符 |
\r |
表示回车符(CR) |
\t |
表示水平制表符(HT)字符 |
\f |
表示换页(FF)字符 |
\b |
表示退格(BS)字符 |
\<octal> |
表示 0 到 255 范围内的字符代码。 |
上面的 <octal> 由一个,两个或三个八进制数字(‘0’到'7’)组成,它们代表 0 到 255(十进制)之间的数字。
请注意,反斜杠后跟任何其他字符是无效的转义序列。无效的转义序列被 JLS 视为编译错误。
参考:
Unicode 转义
除了上面描述的字符串和字符转义序列之外,Java 还有一个更通用的 Unicode 转义机制,如 JLS 3.3 中所定义。 Unicode Escapes 。Unicode 转义具有以下语法:
'\' 'u' <hex-digit> <hex-digit> <hex-digit> <hex-digit>
其中 <hex-digit> 是'0','1','2','3','4','5','6','7','8','9','a','b','c','d','e','f','A','B','C','D','E','F'。
Java 编译器将 Unicode 转义符映射到字符(严格来说是 16 位 Unicode 代码单元 ),并且可以在映射字符有效的源代码中的任何位置使用。当你需要在文字中表示非 ASCII 字符时,它通常用于字符和字符串文字。
在正则表达式中转义
TBD