PHP Conference Japan 2024

日语多字节编码基础

日语字符只能用多字节编码表示,并且根据平台和文本用途使用多种编码标准。更糟糕的是,这些编码标准之间略有不同。为了创建一个可在日语环境中使用的Web应用程序,开发人员必须牢记这些复杂性,以确保使用正确的字符编码。

  • 一个字符的存储空间最多可达六个字节。
  • 大多数日语多字节字符的宽度是单字节字符的两倍。这些字符在日语中称为“全角”,意思是“全角”。其他较窄的字符称为“半角”,意思是“半角”。但是,字符的图形属性取决于用于显示它们的字体。
  • 一些字符编码使用ISO-2022中定义的移位(转义)序列来切换特定代码区域的代码映射(00h7fh)。
  • SMTP/NNTP 以及报头和实体应根据 RFC 要求重新编码,应使用 ISO-2022-JP。虽然这些不是必需的,但这仍然是一个好主意,因为许多流行的用户代理无法识别任何其他编码方法。
  • 为移动电话服务(如 » i-mode» EZweb)创建的网页应该使用 Shift_JIS。
  • 支持用于移动电话服务(如 » i-mode» EZweb)的表情符号。

添加笔记

用户贡献笔记

此页面没有用户贡献的笔记。
To Top