(PHP 4, PHP 5, PHP 7, PHP 8)
xml_parse_into_struct — 将 XML 数据解析到数组结构中
此函数将 XML 字符串解析到两个并行的数组结构中,一个 (index
) 包含指向 values
数组中相应值的地址的指针。最后两个参数必须通过引用传递。
parser
对 XML 解析器的引用。
data
包含 XML 数据的字符串。
values
包含 XML 数据值的数组
index
包含指向 $values 中相应值的地址的指针的数组。
以下示例说明了函数生成的数组的内部结构。我们使用一个简单的 note
标签嵌入在一个 para
标签中,然后我们解析它并打印出生成的结构
示例 #1 xml_parse_into_struct() 示例
<?php
$simple = "<para><note>simple note</note></para>";
$p = xml_parser_create();
xml_parse_into_struct($p, $simple, $vals, $index);
xml_parser_free($p);
echo "Index array\n";
print_r($index);
echo "\nVals array\n";
print_r($vals);
?>
当我们运行这段代码时,输出将是
Index array Array ( [PARA] => Array ( [0] => 0 [1] => 2 ) [NOTE] => Array ( [0] => 1 ) ) Vals array Array ( [0] => Array ( [tag] => PARA [type] => open [level] => 1 ) [1] => Array ( [tag] => NOTE [type] => complete [level] => 2 [value] => simple note ) [2] => Array ( [tag] => PARA [type] => close [level] => 1 ) )
当您的 XML 文档很复杂时,事件驱动的解析(基于 expat 库)会变得很复杂。此函数不会生成 DOM 样式的对象,但会生成适合以树状方式遍历的结构。因此,我们可以轻松地创建表示 XML 文件中数据的对象。让我们考虑以下代表小型氨基酸信息数据库的 XML 文件
示例 #2 moldb.xml - 小型分子信息数据库
<?xml version="1.0"?> <moldb> <molecule> <name>Alanine</name> <symbol>ala</symbol> <code>A</code> <type>hydrophobic</type> </molecule> <molecule> <name>Lysine</name> <symbol>lys</symbol> <code>K</code> <type>charged</type> </molecule> </moldb>
示例 #3 parsemoldb.php - 将 moldb.xml 解析到分子对象的数组中
<?php
class AminoAcid {
var $name; // aa 名称
var $symbol; // 三字母符号
var $code; // 单字母代码
var $type; // 疏水性、带电或中性
function __construct ($aa)
{
foreach ($aa as $k=>$v)
$this->$k = $aa[$k];
}
}
function readDatabase($filename)
{
// 读取氨基酸的 XML 数据库
$data = file_get_contents($filename);
$parser = xml_parser_create();
xml_parser_set_option($parser, XML_OPTION_CASE_FOLDING, 0);
xml_parser_set_option($parser, XML_OPTION_SKIP_WHITE, 1);
xml_parse_into_struct($parser, $data, $values, $tags);
xml_parser_free($parser);
// 循环遍历结构
foreach ($tags as $key=>$val) {
if ($key == "molecule") {
$molranges = $val;
// 数组中每对连续条目都是每个分子定义的
// 下限和上限范围
for ($i=0; $i < count($molranges); $i+=2) {
$offset = $molranges[$i] + 1;
$len = $molranges[$i + 1] - $offset;
$tdb[] = parseMol(array_slice($values, $offset, $len));
}
} else {
continue;
}
}
return $tdb;
}
function parseMol($mvalues)
{
for ($i=0; $i < count($mvalues); $i++) {
$mol[$mvalues[$i]["tag"]] = $mvalues[$i]["value"];
}
return new AminoAcid($mol);
}
$db = readDatabase("moldb.xml");
echo "** 氨基酸对象数据库:\n";
print_r($db);
?>
** Database of AminoAcid objects: Array ( [0] => aminoacid Object ( [name] => Alanine [symbol] => ala [code] => A [type] => hydrophobic ) [1] => aminoacid Object ( [name] => Lysine [symbol] => lys [code] => K [type] => charged ) )