日语多字节编码基础

日语字符只能用多字节编码表示,并且根据平台和文本用途使用多种编码标准。更糟糕的是,这些编码标准之间略有差异。为了创建一个在日语环境中可用的 Web 应用程序,开发人员必须牢记这些复杂性,以确保使用正确的字符编码。

  • 一个字符的存储空间最多可以有六个字节
  • 大多数日语多字节字符的宽度是单字节字符的两倍。这些字符在日语中被称为“全角”,意思是“全宽度”。其他更窄的字符被称为“半角”,意思是“半宽度”。然而,字符的图形属性取决于用于显示它们的字体。
  • 某些字符编码使用 ISO-2022 中定义的移位(转义)序列来切换特定代码区域(00h7fh)的代码映射。
  • ISO-2022-JP 应在 SMTP/NNTP 中使用,并且标题和实体应根据 RFC 要求重新编码。虽然这些不是必需的,但这仍然是一个好主意,因为一些流行的用户代理无法识别任何其他编码方法。
  • 为移动电话服务(例如 » i-mode» EZweb)创建的网页应该使用 Shift_JIS。
  • 支持移动电话服务(例如 » i-mode» EZweb)使用的表情符号。

添加注释

用户贡献的注释 1 个注释

-15
gullevek at gullevek dot org
13 年前
对于 ISO-2022-JP 编码。如果您将数据转换为此编码,强烈建议您使用 ISO-2022-JP-MS 作为扩展字符集,例如带圆圈的 1 ①。

另一方面,对于邮件标题,您必须使用 ISO-2022-JP *不带* -MS 扩展名。
To Top