在 PHP 5.4 中,将有一个 createCollation 方法来使用自定义排序规则方法,以便能够使用 unicode 对数据集进行排序,如下所示
<?php
setlocale(LC_COLLATE, 'fr_FR.UTF-8');
$db->createCollation('PHP_COLLATE', 'strcoll');
$db->query('SELECT * FROM my_table ORDER BY name COLLATE PHP_COLLATE;');
?>
但在此酷炫功能可用之前,您必须使用一些技巧,例如法语:
<?php
function sqlite3_to_ascii($str, $charset = 'UTF-8')
{
if (!trim($str))
return $str;
if (preg_match('!^[[:ascii:]]+$!', $str))
return $str;
$str = htmlentities($str, ENT_NOQUOTES, $charset);
$str = preg_replace('#&([A-za-z])(?:acute|cedil|circ|grave|orn|ring|slash|th|tilde|uml);#', '\1', $str);
$str = preg_replace('#&([A-za-z]{2})(?:lig);#', '\1', $str);
$str = preg_replace('#&[^;]+;#', '', $str);
return $str;
}
$db->createFunction('to_ascii', 'sqlite3_to_ascii', 1);
$res = $db->query('SELECT * FROM test ORDER BY to_ascii(text);');
?>
这将在排序前将非ascii字符转换为ascii字符。实际上,这对于非拉丁语言不起作用,但对于拉丁语言来说,它比没有好。
请注意,这会使查询速度降低约 1.8 倍(在一个 10,000 行的表上测试)。