文本
文本由任何标记之外的所有字符组成(打开元素标记,关闭元素标记等)。
<?xml version="1.0"?>
<document>
This is some text and <b>this is some more text</b>.
</document>
文本的精确 XML 术语是字符数据。XML 规范实际上使用单词 text 作为整个 XML 文档或解析实体,因为它在语法级别定义 XML。然而,诸如 XDM(XQuery 和 XPath 数据模型)之类的一些数据模型(其将 XML 文档表示为树)将字符数据称为文本节点,使得文本通常被理解为实践中的字符数据的同义词。
字符数据可能不包含 <
字符 - 这将被解释为开放元素标记的第一个字符 - 它也不能包含 ]]>
字符序列。必须使用实体引用转义相应的字符。
<?xml version="1.0"?>
<document>
It is fine to escape the < character, as well as ]]>.
</document>
为方便起见,还可以通过 CDATA 部分转义更大块的文本(但由于显而易见的原因,仍然不允许序列 ]]>
):
<?xml version="1.0"?>
<document>
<![CDATA[
In a CDATA section, it is fine to write < or even & and entity references
such as & are not resolved.
]]>
</document>