php regf utf-8中的单词边界匹配 - php

我在utf-8 php文件中有以下php代码:

var_dump(setlocale(LC_CTYPE, 'de_DE.utf8', 'German_Germany.utf-8', 'de_DE', 'german'));
var_dump(mb_internal_encoding());
var_dump(mb_internal_encoding('utf-8'));
var_dump(mb_internal_encoding());
var_dump(mb_regex_encoding());
var_dump(mb_regex_encoding('utf-8'));
var_dump(mb_regex_encoding());
var_dump(preg_replace('/\bweiß\b/iu', 'weiss', 'weißbier'));

我希望最后一个正则表达式仅替换完整的单词,而不替换单词的一部分。

在我的Windows计算机上,它返回:

string 'German_Germany.1252' (length=19)
string 'ISO-8859-1' (length=10)
boolean true
string 'UTF-8' (length=5)
string 'EUC-JP' (length=6)
boolean true
string 'UTF-8' (length=5)
string 'weißbier' (length=9)

在网络服务器(Linux)上,我得到:

string(10) "de_DE.utf8"
string(10) "ISO-8859-1"
bool(true)
string(5) "UTF-8"
string(10) "ISO-8859-1"
bool(true)
string(5) "UTF-8"
string(9) "weissbier"

因此,正则表达式可以在Windows上正常运行,但不能在linux上运行。

因此,主要问题是,我该如何编写正则表达式以仅在单词边界处匹配?

第二个问题是如何让Windows知道我想在php应用程序中使用utf-8。

参考方案

即使在UTF-8模式下,\w\b之类的标准类速记也不支持Unicode。您只需要使用Unicode速记法即可,但是可以通过使用环视而不是交替来使它略显丑陋:

/(?<!\pL)weiß(?!\pL)/u

还请注意如何将花括号排除在Unicode类的简写之外;当类名由单个字母组成时,您可以这样做。

PHP strtotime困境 - php

有人可以解释为什么这在我的服务器上输出为true吗?date_default_timezone_set('Europe/Bucharest'); var_dump( strtotime('29.03.2015 03:00', time()) === strtotime('29.03.2015 04:00�…

PHP-全局变量的性能和内存问题 - php

假设情况:我在php中运行一个复杂的站点,并且我使用了很多全局变量。我可以将变量存储在现有的全局范围内,例如$_REQUEST['userInfo'],$_REQUEST['foo']和$_REQUEST['bar']等,然后将许多不同的内容放入请求范围内(这将是适当的用法,因为这些数据指的是要求自…

php-casperjs获取内部文本 - php

我正在为casperjs使用php包装器-https://github.com/alwex/php-casperjs我正在网上自动化一些重复的工作,我需要访问一个项目的innerText,但是我尚不清楚如何从casperjs浏览器访问dom。我认为在js中我会var arr = document.querySelector('label.input…

php:拆分字符串,直到第一次出现数字 - php

我有像cream 100G sup 5mg Children 我想在第一次出现数字之前将其拆分。所以结果应该是array( array('cream','100G'), array('sup','5mg Children') ); 可以告诉我如何为此创建图案吗?我试过了list(…

POST中的PHP重音符号提交 - php

我在Submit.php上有一个HTML表单,该页面被编码为UTF-8(使用meta标记),当表单提交到process.php(通过POST)时,一些变量存储在会话中,并且该页面使用Header:Location返回header.php,然后使用session变量重新显示一些输入的信息。如果我输入一个带重音的字符,例如é(&eacute),则当页面返​​回S…