HTML 編碼(又稱為 HTML 實體編碼或字符實體編碼)是將字符轉換為可以在 HTML 文件中安全顯示的形式,這樣可以避免 HTML 解析器將它們誤解為 HTML 標籤或其他特殊符號。HTML 編碼的目的是將某些字符(如 <、>、& 和 ")轉換為它們對應的字符實體,從而避免它們與 HTML 結構或語法衝突。
HTML 編碼的原理
在 HTML 文件中,有一些字符具有特殊的意義。例如:
< 用於開始一個 HTML 標籤。
> 用於結束一個 HTML 標籤。
& 用於引入 HTML 實體(如 < 表示 <)。
這些字符如果不進行編碼,會導致 HTML 解析器誤解並產生錯誤,因此需要將它們轉換成對應的字符實體來避免這些問題。
常見的 HTML 編碼字符
原字符 HTML 實體編碼
< <
> >
& &
" "
' '
空格  
© ©
® ®
€ €
HTML 編碼的範例
假設我們有以下的 HTML 內容:
html
<p>John <b>Doe</b> & Jane</p>
在這裡:
< 和 > 是 HTML 標籤,這些符號不會被編碼,因為它們被正常使用在 HTML 標籤中。
& 是一個特殊字符,應該編碼成 &。
手動 HTML 編碼
如果我們希望將 John <b>Doe</b> & Jane 這樣的文本插入到 HTML 中,而不被解析為 HTML 標籤,我們可以將其編碼成 HTML 實體的形式:
html
<p>John <b>Doe</b> & Jane</p>
編碼後的結果會顯示為:
css
John <b>Doe</b> & Jane
這樣,<b> 標籤會顯示為普通文本,而不會被解釋為一個 HTML 標籤。