ISO-10646-UCS-4 |
ISO 10646 |
具有 31 位代码空间的通用字符集,由 ISO/IEC 10646 标准化为 UCS-4。它与最新版本的 Unicode 代码映射保持同步。 |
如果此名称用于编码转换工具,则转换器会尝试通过前面的 BOM(字节顺序标记)来识别后续字节的表示方式(大端序或小端序)。 |
ISO-10646-UCS-4 |
UCS-4 |
见上文。 |
与UCS-4 相比,字符串始终假定为大端序形式。 |
ISO-10646-UCS-4 |
UCS-4 |
见上文。 |
与UCS-4 相比,字符串始终假定为小端序形式。 |
ISO-10646-UCS-2 |
UCS-2 |
具有 16 位代码空间的通用字符集,由 ISO/IEC 10646 标准化为 UCS-2。它与最新版本的 Unicode 代码映射保持同步。 |
如果此名称用于编码转换工具,则转换器会尝试通过前面的 BOM(字节顺序标记)来识别后续字节的表示方式(大端序或小端序)。 |
ISO-10646-UCS-2 |
UCS-2 |
见上文。 |
与UCS-2 相比,字符串始终假定为大端序形式。 |
ISO-10646-UCS-2 |
UCS-2 |
见上文。 |
与UCS-2 相比,字符串始终假定为小端序形式。 |
UTF-32 |
Unicode |
32 位单元宽度的 Unicode 变换格式,其编码空间引用 Unicode 的代码集标准。此编码方案与 UCS-4 不相同,因为 Unicode 的代码空间限制为 21 位值。 |
如果此名称用于编码转换工具,则转换器会尝试通过前面的 BOM(字节顺序标记)来识别后续字节的表示方式(大端序或小端序)。 |
UTF-32BE |
Unicode |
见上文 |
与UTF-32 相比,字符串始终假定为大端序形式。 |
UTF-32LE |
Unicode |
见上文 |
与UTF-32 相比,字符串始终假定为小端序形式。 |
UTF-16 |
Unicode |
16 位单元宽度的 Unicode 变换格式。值得注意的是,UTF-16 不再与 UCS-2 相同,因为自 Unicode 2.0 以来引入了代理机制,UTF-16 现在指的是 21 位代码空间。 |
如果此名称用于编码转换工具,则转换器会尝试通过前面的 BOM(字节顺序标记)来识别后续字节的表示方式(大端序或小端序)。 |
UTF-16BE |
Unicode |
见上文。 |
与UTF-16 相比,字符串始终假定为大端序形式。 |
UTF-16LE |
Unicode |
见上文。 |
与UTF-16 相比,字符串始终假定为小端序形式。 |
UTF-8 |
Unicode / UCS |
8 位单元宽度的 Unicode 变换格式。 |
无 |
UTF-7 |
Unicode |
Unicode 的邮件安全转换格式,在» RFC2152中指定。 |
无 |
(无) |
Unicode |
UTF-7 的一个变体,专门用于» IMAP 协议。 |
无 |
US-ASCII(首选 MIME 名称)/ iso-ir-6 / ANSI_X3.4-1986 / ISO_646.irv:1991 / ASCII / ISO646-US / us / IBM367 / CP367 / csASCII |
ASCII / ISO 646 |
美国信息交换标准代码是一种常用的 7 位编码。也作为国际标准 ISO 646 标准化。 |
(无) |
EUC-JP(首选 MIME 名称)/ Extended_UNIX_Code_Packed_Format_for_Japanese / csEUCPkdFmtJapanese |
US-ASCII / JIS X0201:1997(半角片假名部分)/ JIS X0208:1990 / JIS X0212:1990 的组合 |
顾名思义,此编码源于日语扩展 UNIX 代码打包格式的缩写,此编码主要用于 UNIX 或类似平台。原始编码方案扩展 UNIX 代码基于 ISO 2022 设计。 |
EUC-JP 引用的字符集与 IBM932 / CP932 不同,后者由 OS/2® 和 Microsoft® Windows® 使用。为了与这些平台进行信息交换,请使用 EUCJP-WIN。 |
Shift_JIS(首选 MIME 名称)/ MS_Kanji / csShift_JIS |
JIS X0201:1997 / JIS X0208:1997 的组合 |
Shift_JIS 开发于 80 年代初期,当时个人日语文字处理器进入市场,目的是为了保持与旧版编码方案 JIS X 0201:1976 的兼容性。根据 IANA 定义,Shift_JIS 的代码集与 IBM932 / CP932 略有不同。但是,“SJIS” / “Shift_JIS” 名称经常被错误地用于指代这些代码集。 |
对于 CP932 代码映射,请改用 SJIS-WIN。 |
(无) |
JIS X0201:1997 / JIS X0208:1997 / IBM 扩展 / NEC 扩展的组合 |
虽然此“编码”使用与 EUC-JP 相同的编码方案,但底层字符集不同。也就是说,某些代码点映射到与 EUC-JP 不同的字符。 |
无 |
Windows-31J / csWindows31J |
JIS X0201:1997 / JIS X0208:1997 / IBM 扩展 / NEC 扩展的组合 |
虽然此“编码”使用与 Shift_JIS 相同的编码方案,但底层字符集不同。这意味着某些代码点映射到与 Shift_JIS 不同的字符。 |
(无) |
ISO-2022-JP(首选 MIME 名称)/ csISO2022JP |
US-ASCII / JIS X0201:1976 / JIS X0208:1978 / JIS X0208:1983 |
» RFC1468 |
(无) |
JIS |
|
|
|
ISO-8859-1 |
|
|
|
ISO-8859-2 |
|
|
|
ISO-8859-3 |
|
|
|
ISO-8859-4 |
|
|
|
ISO-8859-5 |
|
|
|
ISO-8859-6 |
|
|
|
ISO-8859-7 |
|
|
|
ISO-8859-8 |
|
|
|
ISO-8859-9 |
|
|
|
ISO-8859-10 |
|
|
|
ISO-8859-13 |
|
|
|
ISO-8859-14 |
|
|
|
ISO-8859-15 |
|
|
|
ISO-8859-16 |
|
|
|
byte2be |
|
|
|
byte2le |
|
|
|
byte4be |
|
|
|
byte4le |
|
|
|
BASE64 |
|
|
|
HTML-ENTITIES |
|
|
|
7bit |
|
|
|
8bit |
|
|
|
EUC-CN |
|
|
|
CP936 |
|
|
|
HZ |
|
|
|
EUC-TW |
|
|
|
CP950 |
|
|
|
BIG-5 |
|
|
|
EUC-KR |
|
|
|
UHC (CP949) |
|
|
|
ISO-2022-KR |
|
|
|
Windows-1251 (CP1251) |
|
|
|
Windows-1252 (CP1252) |
|
|
|
CP866 (IBM866) |
|
|
|
KOI8-R |
|
|
|
KOI8-U |
|
|
|