XML CDATA


XML 文檔中的所有文本均會被解析器解析。

只有 CDATA 區段中的文本會被解析器忽略。


PCDATA - 被解析的字元數據

XML 解析器通常會解析 XML 文檔中所有的文本。

當某個 XML 元素被解析時,其標籤之間的文本也會被解析:

<message>This text is also parsed</message>

解析器之所以這麼做是因為 XML 元素可包含其他元素,就像這個實例中,其中的 <name> 元素包含著另外的兩個元素(first 和 last):

<name><first>Bill</first><last>Gates</last></name>

而解析器會把它分解為像這樣的子元素:

<name>
<first>Bill</first>
<last>Gates</last>
</name>

解析字元數據(PCDATA)是 XML 解析器解析的文本數據使用的一個術語。


CDATA - (未解析)字元數據

術語 CDATA 是不應該由 XML 解析器解析的文本數據。

像 "<" 和 "&" 字元在 XML 元素中都是非法的。

"<" 會產生錯誤,因為解析器會把該字元解釋為新元素的開始。

"&" 會產生錯誤,因為解析器會把該字元解釋為字元實體的開始。

某些文本,比如 JavaScript 代碼,包含大量 "<" 或 "&" 字元。為了避免錯誤,可以將腳本代碼定義為 CDATA。

CDATA 部分中的所有內容都會被解析器忽略。

CDATA 部分由 "<![CDATA[" 開始,由 "]]>" 結束:

<script>
<![CDATA[
function matchwo(a,b)
{
if (a < b && a < 0) then
{
return 1;
}
else
{
return 0;
}
}
]]>
</script>

在上面的實例中,解析器會忽略 CDATA 部分中的所有內容。

關於 CDATA 部分的注釋:

CDATA 部分不能包含字串 "]]>"。也不允許嵌套的 CDATA 部分。

標記 CDATA 部分結尾的 "]]>" 不能包含空格或換行。