介绍

DOM 扩展允许通过 DOM API 使用 PHP 对 XML 和 HTML 文档进行操作。

注意:

DOM 扩展使用 UTF-8 编码。使用 mb_convert_encoding()UConverter::transcode()iconv() 来处理其他编码。

添加注释

用户贡献的注释 1 条注释

captainjester at hotmail dot com
4 年前
在对部分 HTML 使用此功能时要小心。这只会采用包含至少一个 HTML 元素和一个 BODY 元素的完整 HTML 文档。如果您正在处理部分 HTML 并填充周围的缺失元素,并且没有在 META 元素中指定字符编码,那么它将被视为 ISO-8859-1 并且会破坏 UTF-8 字符串。示例

<?php
$body
= getHtmlBody();
$doc = new DOMDocument();
$doc->loadHtml("<html><body>".$body."</body></html>");
// $doc 将会把您的 HTML 当作 ISO-8859-1 处理。
// 这是正确的,但如果您的源代码是 UTF-8,可能不是您想要的。
?>

<?php
$body
= getHtmlBody();
$doc = new DOMDocument();
$doc->loadHtml("<html><head><meta charset=\"UTF-8\"><meta http-equiv=\"Content-Type\" content=\"text/html; charset=UTF-8\"></head><body>".$body."</body></html>");
// $doc 会将您的 HTML 正确地视为 UTF-8。
?>
To Top