Normalizer 类

(PHP 5 >= 5.3.0, PHP 7, PHP 8, PECL intl >= 1.0.0)

简介

规范化是一个过程,涉及将字符和字符序列转换为正式定义的底层表示。当需要比较文本以进行排序和搜索时,此过程最为重要,但它也用于存储文本以确保文本以一致的表示方式存储。

Unicode 联盟定义了多种规范化形式,以反映应用程序的不同需求

  • 规范化形式 D (NFD) - 规范分解
  • 规范化形式 C (NFC) - 规范分解,然后是规范合成
  • 规范化形式 KD (NFKD) - 兼容分解
  • 规范化形式 KC (NFKC) - 兼容分解,然后是规范合成
不同的形式是在文本的一组转换方面定义的,这些转换既由算法定义,也由一组数据文件定义。

类概要

class Normalizer {
/* 常量 */
public const int FORM_D;
public const int NFD;
public const int FORM_KD;
public const int NFKD;
public const int FORM_C;
public const int NFC;
public const int FORM_KC;
public const int NFKC;
public const int FORM_KC_CF;
public const int NFKC_CF;
/* 方法 */
public static getRawDecomposition(string $string, int $form = Normalizer::FORM_C): ?string
public static isNormalized(string $string, int $form = Normalizer::FORM_C): bool
public static normalize(string $string, int $form = Normalizer::FORM_C): string|false
}

预定义常量

以下常量定义了规范化器使用的规范化形式

Normalizer::FORM_C
规范化形式 C (NFC) - 规范分解,然后是规范合成
Normalizer::FORM_D
规范化形式 D (NFD) - 规范分解
Normalizer::NFD

Normalizer::FORM_KC
规范化形式 KC (NFKC) - 兼容分解,然后是规范合成
Normalizer::NFKC

Normalizer::FORM_KC_CF

Normalizer::FORM_KD
规范化形式 KD (NFKD) - 兼容分解
Normalizer::NFKD

Normalizer::NFC

Normalizer::NFKC_CF

变更日志

版本 描述
8.0.0 Normalizer::NONE 已被移除。

目录

添加注释

用户贡献的注释

此页面没有用户贡献的注释。
To Top