支持编码汇总

支持编码汇总
IANA 字符集注册表中的名称 底层字符集 描述 附加说明
ISO-10646-UCS-4 ISO 10646 具有 31 位代码空间的通用字符集,由 ISO/IEC 10646 标准化为 UCS-4。它与 Unicode 代码映射的最新版本保持同步。 如果此名称在编码转换工具中使用,转换器会尝试通过前面的 BOM(字节顺序标记)识别后续字节的表示方式。
ISO-10646-UCS-4 UCS-4 见上文。 UCS-4 不同,字符串始终假定为大端形式。
ISO-10646-UCS-4 UCS-4 见上文。 UCS-4 不同,字符串始终假定为小端形式。
ISO-10646-UCS-2 UCS-2 具有 16 位代码空间的通用字符集,由 ISO/IEC 10646 标准化为 UCS-2。它与 Unicode 代码映射的最新版本保持同步。 如果此名称在编码转换工具中使用,转换器会尝试通过前面的 BOM(字节顺序标记)识别后续字节的表示方式。
ISO-10646-UCS-2 UCS-2 见上文。 UCS-2 不同,字符串始终假定为大端形式。
ISO-10646-UCS-2 UCS-2 见上文。 UCS-2 不同,字符串始终假定为小端形式。
UTF-32 Unicode 32 位单元宽度的 Unicode 转换格式,其编码空间引用 Unicode 的代码集标准。此编码方案与 UCS-4 不完全相同,因为 Unicode 的代码空间限制为 21 位值。 如果此名称在编码转换工具中使用,转换器会尝试通过前面的 BOM(字节顺序标记)识别后续字节的表示方式。
UTF-32BE Unicode 见上文 UTF-32 不同,字符串始终假定为大端形式。
UTF-32LE Unicode 见上文 UTF-32 不同,字符串始终假定为小端形式。
UTF-16 Unicode 16 位单元宽度的 Unicode 转换格式。值得注意的是,UTF-16 与 UCS-2 的规范不再相同,因为自 Unicode 2.0 以来引入了代理机制,而 UTF-16 现在指的是 21 位代码空间。 如果此名称在编码转换工具中使用,转换器会尝试通过前面的 BOM(字节顺序标记)识别后续字节的表示方式。
UTF-16BE Unicode 见上文。 UTF-16 不同,字符串始终假定为大端形式。
UTF-16LE Unicode 见上文。 UTF-16 不同,字符串始终假定为小端形式。
UTF-8 Unicode / UCS 8 位单元宽度的 Unicode 转换格式。 none
UTF-7 Unicode Unicode 的邮件安全转换格式,在 » RFC2152 中指定。 none
(none) Unicode UTF-7 的变体,专门用于 » IMAP 协议 none
US-ASCII(首选 MIME 名称)/ iso-ir-6 / ANSI_X3.4-1986 / ISO_646.irv:1991 / ASCII / ISO646-US / us / IBM367 / CP367 / csASCII ASCII / ISO 646 美国信息交换标准代码是一种常用的 7 位编码。也作为国际标准 ISO 646 标准化。 (none)
EUC-JP(首选 MIME 名称)/ Extended_UNIX_Code_Packed_Format_for_Japanese / csEUCPkdFmtJapanese US-ASCII / JIS X0201:1997(半角假名部分)/ JIS X0208:1990 / JIS X0212:1990 的组合 正如您所见,该名称源自日语扩展 UNIX 代码打包格式的缩写,此编码主要用于 UNIX 或类似平台。原始编码方案 Extended UNIX Code 是基于 ISO 2022 设计的。 EUC-JP 参照的字符集不同于 IBM932 / CP932,IBM932 / CP932 由 OS/2® 和 Microsoft® Windows® 使用。要与这些平台进行信息交换,请使用 EUCJP-WIN。
Shift_JIS(首选 MIME 名称)/ MS_Kanji / csShift_JIS JIS X0201:1997 / JIS X0208:1997 的组合 Shift_JIS 开发于 80 年代初,当时个人日语文字处理器进入市场,目的是为了与遗留编码方案 JIS X 0201:1976 保持兼容性。根据 IANA 的定义,Shift_JIS 的代码集略微不同于 IBM932 / CP932。但是,“SJIS”/“Shift_JIS”这些名称通常被错误地用来指代这些代码集。 对于 CP932 代码映射,请使用 SJIS-WIN。
(none) JIS X0201:1997 / JIS X0208:1997 / IBM 扩展 / NEC 扩展的组合 虽然此“编码”使用与 EUC-JP 相同的编码方案,但底层字符集不同。也就是说,某些代码点映射到与 EUC-JP 不同的字符。 none
Windows-31J / csWindows31J JIS X0201:1997 / JIS X0208:1997 / IBM 扩展 / NEC 扩展的组合 虽然此“编码”使用与 Shift_JIS 相同的编码方案,但底层字符集不同。这意味着某些代码点映射到与 Shift_JIS 不同的字符。 (none)
ISO-2022-JP(首选 MIME 名称)/ csISO2022JP US-ASCII / JIS X0201:1976 / JIS X0208:1978 / JIS X0208:1983 » RFC1468 (none)
JIS
ISO-8859-1
ISO-8859-2
ISO-8859-3
ISO-8859-4
ISO-8859-5
ISO-8859-6
ISO-8859-7
ISO-8859-8
ISO-8859-9
ISO-8859-10
ISO-8859-13
ISO-8859-14
ISO-8859-15
ISO-8859-16
byte2be
byte2le
byte4be
byte4le
BASE64
HTML-ENTITIES
7bit
8bit
EUC-CN
CP936
HZ
EUC-TW
CP950
BIG-5
EUC-KR
UHC (CP949)
ISO-2022-KR
Windows-1251 (CP1251)
Windows-1252 (CP1252)
CP866 (IBM866)
KOI8-R
KOI8-U
添加注释

用户贡献的注释

此页面没有用户贡献的注释。
To Top