mb_ereg_search_setpos

(PHP 4 >= 4.2.0, PHP 5, PHP 7, PHP 8)

mb_ereg_search_setpos — 设置下一个正则表达式匹配的起始点

描述

mb_ereg_search_setpos(int $offset): bool

mb_ereg_search_setpos() 设置 mb_ereg_search() 的匹配起始点。

参数

offset: 要设置的位置。如果为负数，则从字符串末尾开始计数。

返回值

成功时返回 true，失败时返回 false。

变更日志

版本	描述
7.1.0	已添加对负 `offset` 的支持。

备注

注意:
此函数将使用内部编码或 mb_regex_encoding() 指定的字符编码作为字符编码。

参见

mb_regex_encoding() - 设置/获取多字节正则表达式的字符编码
mb_ereg_search_init() - 为多字节正则表达式匹配设置字符串和正则表达式

发现问题？

了解如何改进此页面 • 提交拉取请求 • 报告错误

＋添加注释

用户贡献的注释 1 条注释

上

下

-4

phpnet at osps dot net ¶

3 年前

此方法，与 mb_ereg_search_pos 一样，似乎使用字节偏移量，而不是字符偏移量。这对于 mb_* 方法来说似乎违反直觉，因为 mb_* 方法本质上采用字符串的“字符”视图，而不是基于“字节”的视图。即使 mb_strpos 方法也返回字符偏移量。

以下代码揭示了这种面向字节的行为

<?php
 $x = 'abc456789'. "\u{1000}" .'abc4567890';
 $re = 'ab.';
 echo 'x='. $x .PHP_EOL;
 echo 're='. $re .PHP_EOL;
 mb_ereg_search_init( $x );
 mb_internal_encoding( mb_detect_encoding( $x) );
 echo 'mb_strlen='. mb_strlen( $x ) .PHP_EOL;
 echo 'strlen='. strlen( $x ) .PHP_EOL;
 foreach ( array( 0, 9, 10, 11, 12, 13 ) as $o ) {

 mb_ereg_search_setpos( $o );
 echo 'Offset='. $o
 .' mb_substr='. mb_substr( $x, $o )
 .' substr='. substr( $x, $o )
 .' mb_ereg_search_regs='. print_r( mb_ereg_search_regs( $re ), true )
 .PHP_EOL;
 }

?>
如果使用字符偏移量，我们预计偏移量 11 及以上将不会返回搜索结果，而我们看到的是

<?php

=abc456789ကabc4567890
re=ab.
mb_strlen=20
strlen=22
Offset=0 mb_substr=abc456789ကabc4567890 substr=abc456789ကabc4567890 mb_ereg_search_regs=Array
(
 [0] => abc
)

Offset=9 mb_substr=ကabc4567890 substr=ကabc4567890 mb_ereg_search_regs=Array
(
 [0] => abc
)

Offset=10 mb_substr=abc4567890 substr=��abc4567890 mb_ereg_search_regs=Array
(
 [0] => abc
)

Offset=11 mb_substr=bc4567890 substr=�abc4567890 mb_ereg_search_regs=Array
(
 [0] => abc
)

Offset=12 mb_substr=c4567890 substr=abc4567890 mb_ereg_search_regs=Array
(
 [0] => abc
)

Offset=13 mb_substr=4567890 substr=bc4567890 mb_ereg_search_regs=
?>

＋添加注释