在 PHP 5.4 中,将有一个 createCollation 方法来使用您的自定义排序规则方法,以便能够使用 unicode 对数据集进行排序,例如:
<?php
setlocale(LC_COLLATE, 'fr_FR.UTF-8');
$db->createCollation('PHP_COLLATE', 'strcoll');
$db->query('SELECT * FROM my_table ORDER BY name COLLATE PHP_COLLATE;');
?>
但在此酷炫的功能可用之前,您需要做一些技巧,例如,对法语进行以下操作
<?php
function sqlite3_to_ascii($str, $charset = 'UTF-8')
{
if (!trim($str))
return $str;
if (preg_match('!^[[:ascii:]]+$!', $str))
return $str;
$str = htmlentities($str, ENT_NOQUOTES, $charset);
$str = preg_replace('#&([A-za-z])(?:acute|cedil|circ|grave|orn|ring|slash|th|tilde|uml);#', '\1', $str);
$str = preg_replace('#&([A-za-z]{2})(?:lig);#', '\1', $str);
$str = preg_replace('#&[^;]+;#', '', $str);
return $str;
}
$db->createFunction('to_ascii', 'sqlite3_to_ascii', 1);
$res = $db->query('SELECT * FROM test ORDER BY to_ascii(text);');
?>
这将在排序之前将非 ASCII 字符转换为 ASCII 字符。事实上,这对于非拉丁语言将不起作用,但对于拉丁语言,它比没有好。
请注意,这将使查询速度降低大约 1.8 倍(在 10,000 行表上测试)。