ISO-10646-UCS-4 |
ISO 10646 |
具有 31 位代码空间的通用字符集,由 ISO/IEC 10646 标准化为 UCS-4。它与 Unicode 代码映射的最新版本保持同步。 |
如果此名称在编码转换工具中使用,转换器会尝试通过前面的 BOM(字节顺序标记)识别后续字节的表示方式。 |
ISO-10646-UCS-4 |
UCS-4 |
见上文。 |
与 UCS-4 不同,字符串始终假定为大端形式。 |
ISO-10646-UCS-4 |
UCS-4 |
见上文。 |
与 UCS-4 不同,字符串始终假定为小端形式。 |
ISO-10646-UCS-2 |
UCS-2 |
具有 16 位代码空间的通用字符集,由 ISO/IEC 10646 标准化为 UCS-2。它与 Unicode 代码映射的最新版本保持同步。 |
如果此名称在编码转换工具中使用,转换器会尝试通过前面的 BOM(字节顺序标记)识别后续字节的表示方式。 |
ISO-10646-UCS-2 |
UCS-2 |
见上文。 |
与 UCS-2 不同,字符串始终假定为大端形式。 |
ISO-10646-UCS-2 |
UCS-2 |
见上文。 |
与 UCS-2 不同,字符串始终假定为小端形式。 |
UTF-32 |
Unicode |
32 位单元宽度的 Unicode 转换格式,其编码空间引用 Unicode 的代码集标准。此编码方案与 UCS-4 不完全相同,因为 Unicode 的代码空间限制为 21 位值。 |
如果此名称在编码转换工具中使用,转换器会尝试通过前面的 BOM(字节顺序标记)识别后续字节的表示方式。 |
UTF-32BE |
Unicode |
见上文 |
与 UTF-32 不同,字符串始终假定为大端形式。 |
UTF-32LE |
Unicode |
见上文 |
与 UTF-32 不同,字符串始终假定为小端形式。 |
UTF-16 |
Unicode |
16 位单元宽度的 Unicode 转换格式。值得注意的是,UTF-16 与 UCS-2 的规范不再相同,因为自 Unicode 2.0 以来引入了代理机制,而 UTF-16 现在指的是 21 位代码空间。 |
如果此名称在编码转换工具中使用,转换器会尝试通过前面的 BOM(字节顺序标记)识别后续字节的表示方式。 |
UTF-16BE |
Unicode |
见上文。 |
与 UTF-16 不同,字符串始终假定为大端形式。 |
UTF-16LE |
Unicode |
见上文。 |
与 UTF-16 不同,字符串始终假定为小端形式。 |
UTF-8 |
Unicode / UCS |
8 位单元宽度的 Unicode 转换格式。 |
none |
UTF-7 |
Unicode |
Unicode 的邮件安全转换格式,在 » RFC2152 中指定。 |
none |
(none) |
Unicode |
UTF-7 的变体,专门用于 » IMAP 协议。 |
none |
US-ASCII(首选 MIME 名称)/ iso-ir-6 / ANSI_X3.4-1986 / ISO_646.irv:1991 / ASCII / ISO646-US / us / IBM367 / CP367 / csASCII |
ASCII / ISO 646 |
美国信息交换标准代码是一种常用的 7 位编码。也作为国际标准 ISO 646 标准化。 |
(none) |
EUC-JP(首选 MIME 名称)/ Extended_UNIX_Code_Packed_Format_for_Japanese / csEUCPkdFmtJapanese |
US-ASCII / JIS X0201:1997(半角假名部分)/ JIS X0208:1990 / JIS X0212:1990 的组合 |
正如您所见,该名称源自日语扩展 UNIX 代码打包格式的缩写,此编码主要用于 UNIX 或类似平台。原始编码方案 Extended UNIX Code 是基于 ISO 2022 设计的。 |
EUC-JP 参照的字符集不同于 IBM932 / CP932,IBM932 / CP932 由 OS/2® 和 Microsoft® Windows® 使用。要与这些平台进行信息交换,请使用 EUCJP-WIN。 |
Shift_JIS(首选 MIME 名称)/ MS_Kanji / csShift_JIS |
JIS X0201:1997 / JIS X0208:1997 的组合 |
Shift_JIS 开发于 80 年代初,当时个人日语文字处理器进入市场,目的是为了与遗留编码方案 JIS X 0201:1976 保持兼容性。根据 IANA 的定义,Shift_JIS 的代码集略微不同于 IBM932 / CP932。但是,“SJIS”/“Shift_JIS”这些名称通常被错误地用来指代这些代码集。 |
对于 CP932 代码映射,请使用 SJIS-WIN。 |
(none) |
JIS X0201:1997 / JIS X0208:1997 / IBM 扩展 / NEC 扩展的组合 |
虽然此“编码”使用与 EUC-JP 相同的编码方案,但底层字符集不同。也就是说,某些代码点映射到与 EUC-JP 不同的字符。 |
none |
Windows-31J / csWindows31J |
JIS X0201:1997 / JIS X0208:1997 / IBM 扩展 / NEC 扩展的组合 |
虽然此“编码”使用与 Shift_JIS 相同的编码方案,但底层字符集不同。这意味着某些代码点映射到与 Shift_JIS 不同的字符。 |
(none) |
ISO-2022-JP(首选 MIME 名称)/ csISO2022JP |
US-ASCII / JIS X0201:1976 / JIS X0208:1978 / JIS X0208:1983 |
» RFC1468 |
(none) |
JIS |
|
|
|
ISO-8859-1 |
|
|
|
ISO-8859-2 |
|
|
|
ISO-8859-3 |
|
|
|
ISO-8859-4 |
|
|
|
ISO-8859-5 |
|
|
|
ISO-8859-6 |
|
|
|
ISO-8859-7 |
|
|
|
ISO-8859-8 |
|
|
|
ISO-8859-9 |
|
|
|
ISO-8859-10 |
|
|
|
ISO-8859-13 |
|
|
|
ISO-8859-14 |
|
|
|
ISO-8859-15 |
|
|
|
ISO-8859-16 |
|
|
|
byte2be |
|
|
|
byte2le |
|
|
|
byte4be |
|
|
|
byte4le |
|
|
|
BASE64 |
|
|
|
HTML-ENTITIES |
|
|
|
7bit |
|
|
|
8bit |
|
|
|
EUC-CN |
|
|
|
CP936 |
|
|
|
HZ |
|
|
|
EUC-TW |
|
|
|
CP950 |
|
|
|
BIG-5 |
|
|
|
EUC-KR |
|
|
|
UHC (CP949) |
|
|
|
ISO-2022-KR |
|
|
|
Windows-1251 (CP1251) |
|
|
|
Windows-1252 (CP1252) |
|
|
|
CP866 (IBM866) |
|
|
|
KOI8-R |
|
|
|
KOI8-U |
|
|
|