PHP Conference Japan 2024

字符编码

PHP 的 XML 扩展通过不同的字符编码支持» Unicode字符集。字符编码有两种类型,源编码目标编码。PHP 对文档的内部表示始终使用UTF-8编码。

当 XML 文档被解析时,会进行源编码。在创建 XML 解析器时,可以指定源编码(此编码在 XML 解析器的生命周期中无法更改)。支持的源编码为ISO-8859-1US-ASCIIUTF-8。前两者是单字节编码,这意味着每个字符都由一个字节表示。UTF-8可以将由可变数量的位(最多 21 位)组成的字符编码为 1 到 4 个字节。PHP 使用的默认源编码为ISO-8859-1

当 PHP 将数据传递给 XML 处理程序函数时,会进行目标编码。创建 XML 解析器时,目标编码将设置为与源编码相同,但可以在任何时候更改。目标编码将影响字符数据以及标签名称和处理指令目标。

如果 XML 解析器遇到超出其源编码能够表示的范围内的字符,它将返回错误。

如果 PHP 在解析的 XML 文档中遇到无法在选定的目标编码中表示的字符,则问题字符将被“降级”。目前,这意味着此类字符将被问号替换。

添加注释

用户贡献的注释

此页面没有用户贡献的注释。
To Top