文字
文字由任何標記之外的所有字元組成(開啟元素標記,關閉元素標記等)。
<?xml version="1.0"?>
<document>
This is some text and <b>this is some more text</b>.
</document>
文字的精確 XML 術語是字元資料。XML 規範實際上使用單詞 text 作為整個 XML 文件或解析實體,因為它在語法級別定義 XML。然而,諸如 XDM(XQuery 和 XPath 資料模型)之類的一些資料模型(其將 XML 文件表示為樹)將字元資料稱為文字節點,使得文字通常被理解為實踐中的字元資料的同義詞。
字元資料可能不包含 <
字元 - 這將被解釋為開放元素標記的第一個字元 - 它也不能包含 ]]>
字元序列。必須使用實體引用轉義相應的字元。
<?xml version="1.0"?>
<document>
It is fine to escape the < character, as well as ]]>.
</document>
為方便起見,還可以通過 CDATA 部分轉義更大塊的文字(但由於顯而易見的原因,仍然不允許序列 ]]>
):
<?xml version="1.0"?>
<document>
<![CDATA[
In a CDATA section, it is fine to write < or even & and entity references
such as & are not resolved.
]]>
</document>