欢迎您光临本站
首页 > PHP > 正文
faddei头像
faddei

2021-07-10

评论者
PHP
0 1

php将字符串分割成数组实现(中英文混合)分词,代码如下:

/*
*+----------------------------------------------------------------------
*   将字符串分割成数组实现中文分词
*   String $string  需要拆分的字符串
*   String $code    字符串的编码
*   return Array    分割之后的数组
*+----------------------------------------------------------------------
*/
function math($string,$code ='UTF-8'){
    if ($code == 'UTF-8') {
        $pa = "/[\x01-\x7f]|[\xc2-\xdf][\x80-\xbf]|\xe0[\xa0-\xbf][\x80-\xbf]|[\xe1-\xef][\x80-\xbf][\x80-\xbf]|\xf0[\x90-\xbf][\x80-\xbf][\x80-\xbf]|[\xf1-\xf7][\x80-\xbf][\x80-\xbf][\x80-\xbf]/";
    } else {
        $pa = "/[\x01-\x7f]|[\xa1-\xff][\xa1-\xff]/";
    }
    preg_match_all($pa, $string, $t_string);
    $math="";
    foreach($t_string[0] as $k=>$s){
        $math[]=$s;
    }
    return $math;
}
 
//调用示例
$string = 'IT基地59zone.com交流平台';
$arr = math($string);
var_dump($arr);

以上代码实现效果:

array(
    [0] => 'I',
    [1] => 'T',
    [2] => '基',
    [3] => '地',
    [4] => '5',
    [5] => '9',
    [6] => 'z',
    [7] => 'o',
    [8] => 'n',
    [9] => 'e',
    [10] => '.',
    [11] => 'c',
    [12] => 'o',
    [13] => 'm',
    [14] => '交',
    [15] => '流',
    [16] => '平',
    [17] => '台'
)


版权声明:本站所提供的文章、图片等内容均为用户发布或互联网整理而来,仅供学习参考,如有侵犯您的版权,请联系我们客服人员删除。

234

精彩推荐

暂无评论

文明用语