如果 Web 应用程序符合 UTF-8,则无需进一步操作。对于依赖于非 UTF-8 编码的路径进行 I/O 的应用程序,需要设置显式的 INI 指令。编码 INI 设置检查依赖于核心中的顺序
引入了几个用于代码页处理的函数
这些函数是线程安全的。
控制台输出代码页将根据 PHP 中使用的编码进行调整。根据具体的系统 OEM 代码页,可见输出可能正确或不正确。例如,在默认的 cmd.exe 和 OEM 代码页为 437 的系统上,当使用 UTF-8 时,代码页 1251、1252、1253 和其他一些代码页中的输出可以正确显示。在同一系统上,代码页 20932 中的字符可能无法正确显示。这与代码页、字体兼容性以及使用的特定控制台程序的特定系统规则有关。PHP 会根据 php.ini 中的编码规则自动设置控制台代码页。在某些情况下,使用替代控制台而不是直接使用 cmd.exe 可能会带来更好的体验。
但是要注意,在请求开始后运行时代码页切换可能会在 CLI 上带来意想不到的副作用。首选方法是 php.ini,当 PHP CLI 在不支持 Unicode 的控制台模拟器中使用时,可能需要设置它,以避免更改控制台代码页。实现此目的的最佳方法是将默认编码或内部编码设置为与 ANSI 代码页相对应。另一种方法是将 INI 指令 output_encoding 和 input_encoding 设置为所需的代码页,在这种情况下,内部代码页与 I/O 代码页之间的差异很可能会导致乱码。在极少数情况下,如果 PHP 恰好优雅地崩溃,则可能无法恢复原始控制台代码页。在这种情况下,可以使用 chcp 命令手动恢复它。
对于 DBCS 系统的特别注意事项 - 使用 ini_set() 在运行时切换代码页可能会导致显示问题。与非 DBCS 系统不同的是,扩展字符需要两个控制台单元才能显示。在某些情况下,字符只映射到字体的字形集中,而不会实际更改字体。这是 DBCS 系统的本质,最简单的方法是避免使用 ini_set() 来更改代码页,以防止显示问题。
由于流中支持 UTF-8,PHP 脚本不再局限于 ASCII 或 ANSI 文件名。这在 CLI 上开箱即用。对于其他 SAPI,对应服务器的文档很有用。
长路径支持是透明的。超过 260 字节的路径会自动以 \\?\
为前缀。最大路径长度限制为 2048 字节。请注意,路径段限制(基本名称长度)仍然存在。
为了最佳的可移植性,强烈建议将文件名、I/O 和其他相关主题处理为 UTF-8。此外,对于控制台应用程序,最好使用 TrueType 字体,并且不建议使用 ini_set() 来更改代码页。
通过 » WinEditLine 库 支持 readline 扩展。因此,交互式 CLI shell 也受支持(php.exe -a
)。
现在尊重 PHP_FCGI_CHILDREN。如果定义了此环境变量,则第一个 php-cgi.exe 进程将执行指定数量的子进程。它们将共享同一个 TCP 套接字。
添加了对 ftok() 的支持