Unicode 格式控制字符

2018-06-16 14:14 更新

Unicode 格式控制字符(即,Unicode 字符数据库中“Cf”分类里的字符,如“左至右符号 (left-to-right mark)”或“右至左符号 (left-to-right mark)”)是用来控制被更高层级协议(如标记语言)忽略的文本范围的格式的控制代码。


允许在源文本中出现控制字符是有用的,以方便编辑和显示。所有格式控制字符可写入到注释,字符串字面量,正则表达式字面量中。


在某些语言中和控制字符用于创建必要的的分隔符分割词或短语。在 ECMAScript 源文本里,和还可以用在一个标识符后的第一个字符。


控制字符主要出现的文本的开头,标记它是 Unicode,并允许检测文本的编码和字节顺序。用于这一目的字符,有时也可能出现在文本开始的后面,例如,一个合并的文件。字符被视为空白字符(见 [7.2])。


表 1 总结了一些在注释,字符串字面量,正则表达式字面量之外被特殊对待的格式控制字符。


表-——控制字符的使用
字符编码值名称正式名称用途
\u200C零宽非连接符<ZWNJ>IdentifierPart
\u200D零宽连接符<ZWJ>IdentifierPart
\uFEFF位序掩码<BOM>Whitespace


以上内容是否对您有帮助:
在线笔记
App下载
App下载

扫描二维码

下载编程狮App

公众号
微信公众号

编程狮公众号