PHP Conference Japan 2024

idn_to_utf8

(PHP 5 >= 5.3.0, PHP 7, PHP 8, PECL intl >= 1.0.2, PECL idn >= 0.1)

idn_to_utf8将域名从 IDNA ASCII 转换为 Unicode

描述

过程式风格

idn_to_utf8(
    字符串 $domain,
    整数 $flags = IDNA_DEFAULT,
    整数 $variant = INTL_IDNA_VARIANT_UTS46,
    数组 &$idna_info = null
): 字符串|false

此函数将以 IDNA ASCII 兼容格式表示的 Unicode 域名转换为纯 Unicode,并以 UTF-8 编码。

参数

domain

要转换的以 IDNA ASCII 兼容格式表示的域名。

flags

转换选项 - IDNA_* 常量的组合(除了 IDNA_ERROR_* 常量)。

variant

INTL_IDNA_VARIANT_2003(自 PHP 7.2.0 起已弃用)用于 IDNA 2003 或 INTL_IDNA_VARIANT_UTS46(仅在 ICU 4.6 及更高版本中可用)用于 UTS #46。

idna_info

此参数仅在 variant 使用 INTL_IDNA_VARIANT_UTS46 时才能使用。在这种情况下,它将填充一个数组,其键为 'result',即转换的可能非法结果,'isTransitionalDifferent',一个布尔值,指示 UTS #46 的过渡机制的使用是否或将更改结果,以及 'errors',它是一个 整数,表示 IDNA_ERROR_* 错误常量的位集。

返回值

以 UTF-8 编码的 Unicode 域名,或在失败时返回 false

变更日志

版本 描述
7.4.0 variant 的默认值现在是 INTL_IDNA_VARIANT_UTS46 而不是已弃用的 INTL_IDNA_VARIANT_2003
7.2.0 INTL_IDNA_VARIANT_2003 已弃用;请改用 INTL_IDNA_VARIANT_UTS46

示例

示例 #1 idn_to_utf8() 示例

<?php

echo idn_to_utf8('xn--tst-qla.de');

?>

以上示例将输出

täst.de

参见

添加注释

用户贡献的注释 1 条注释

kushik.com
11 年前
<?php
// 对于 PHP 版本低于 5.3 的用户
class IDN {
// 调整 punycode 算法的偏差
private static function punyAdapt(
$delta,
$numpoints,
$firsttime
) {
$delta = $firsttime ? $delta / 700 : $delta / 2;
$delta += $delta / $numpoints;
for (
$k = 0; $delta > 455; $k += 36)
$delta = intval($delta / 35);
return
$k + (36 * $delta) / ($delta + 38);
}

// 将字符转换为 punycode 数字
private static function decodeDigit($cp) {
$cp = strtolower($cp);
if (
$cp >= 'a' && $cp <= 'z')
return
ord($cp) - ord('a');
elseif (
$cp >= '0' && $cp <= '9')
return
ord($cp) - ord('0')+26;
}

// 由 Unicode 代码点数字创建 UTF8 字符串
private static function utf8($cp) {
if (
$cp < 128) return chr($cp);
if (
$cp < 2048)
return
chr(192+($cp >> 6)).chr(128+($cp & 63));
if (
$cp < 65536) return
chr(224+($cp >> 12)).
chr(128+(($cp >> 6) & 63)).
chr(128+($cp & 63));
if (
$cp < 2097152) return
chr(240+($cp >> 18)).
chr(128+(($cp >> 12) & 63)).
chr(128+(($cp >> 6) & 63)).
chr(128+($cp & 63));
// 永远不应该到达这里
}

// 主解码函数
private static function decodePart($input) {
if (
substr($input,0,4) != "xn--") // 前缀检查...
return $input;
$input = substr($input,4); // 丢弃前缀
$a = explode("-",$input);
if (
count($a) > 1) {
$input = str_split(array_pop($a));
$output = str_split(implode("-",$a));
} else {
$output = array();
$input = str_split($input);
}
$n = 128; $i = 0; $bias = 72; // 初始化 punycode 变量
while (!empty($input)) {
$oldi = $i;
$w = 1;
for (
$k = 36;;$k += 36) {
$digit = IDN::decodeDigit(array_shift($input));
$i += $digit * $w;
if (
$k <= $bias) $t = 1;
elseif (
$k >= $bias + 26) $t = 26;
else
$t = $k - $bias;
if (
$digit < $t) break;
$w *= intval(36 - $t);
}
$bias = IDN::punyAdapt(
$i-$oldi,
count($output)+1,
$oldi == 0
);
$n += intval($i / (count($output) + 1));
$i %= count($output) + 1;
array_splice($output,$i,0,array(IDN::utf8($n)));
$i++;
}
return
implode("",$output);
}

public static function
decodeIDN($name) {
// 将其分割、解析并重新组合
return
implode(
".",
array_map("IDN::decodePart",explode(".",$name))
);
}

}
echo
IDN::decodeIDN($_SERVER['HTTP_HOST']);
?>
To Top