英文文本不仅仅是 ASCII

定期弹出的假设是,当仅处理英文文本时,不太可能遇到 ASCII 字符集之外的字符。为了避免正确处理 Unicode 的问题,人们很想做一些事情,比如剥离非 ASCII 字符或删除字母上的任何重音。

这些示例表明这种假设是错误的,即使对于英文文本,你也应该注意正确处理 Unicode 字符。