
PHP分词
发布日期:2021-05-07 01:08:45
浏览次数:26
分类:精选文章
本文共 1204 字,大约阅读时间需要 4 分钟。
废话不多说,直接上代码
常用的也就两种:
SCWS 和 phpanalysis
先给一段字符串:
$str = '真怕有一天,我们jg1552再次成为交叉线,我想那时就再也不可23454能回归了,快乐永远!$%是拿痛苦做代价,你现在^&%多幸福,多快乐,你以后^^&就会越FG伤心越难过,不想发生!';
一、SCWS
1、下载这两
a、pscws4中的 pscws4.class.php和xdb_r.class.php文件放到根目录的/extend/org下
b、修改命名规则,使之符合tp5
c、加命名空间,方便引入与调用
2、开始测试
$result=$this->get_tags($str);dump($result);//scws分词函数 public function get_tags($title){ //新建实例对象 $pscws=new Pscws('utf8'); $path = \Env::get('root_path'); $path = str_replace('\\','/',$path); //设置字典文件和规则集文件 $pscws->set_dict($path . 'application/Common/Conf/etc/dict.utf8.xdb'); $pscws->set_rule($path . 'application/Common/Conf/etc/rules.utf8.ini'); //调用send_text()方法 $pscws->send_text($title); $tags['words']= $pscws->get_result(); $pscws->close(); return $tags; }
结果图
二、phpanalysis
下载文件包
1、放到根目录extend中,修改命名并加命名空间
2、测试结果
$pa = new PhpAnalysis(); $pa::$loadInit = false; $pa->LoadDict(); $pa->SetSource($str); $pa->StartAnalysis( false ); $result = $pa->GetFinallyResult(); $result = explode(' ',$result); dump($result);
结果图
因此,可以看出,SCWS只能分割中文,遇到标点、字母、数字就会停止分割。但是分词速度很快
phpanalysis分词比较全面,会稍微慢点
发表评论
最新留言
感谢大佬
[***.8.128.20]2025年03月25日 01时50分43秒
关于作者

喝酒易醉,品茶养心,人生如梦,品茶悟道,何以解忧?唯有杜康!
-- 愿君每日到此一游!
推荐文章
vue项目通过vue.config.js配置文件进行proxy反向代理跨域
2021-05-08
android:使用audiotrack 类播放wav文件
2021-05-08
聊聊我的五一小假期
2021-05-08
数据库三个级别封锁协议
2021-05-08
ACM/NCPC2016 C Card Hand Sorting(upc 3028)
2021-05-08
ubuntu学习笔记-常用文件、命令以及作用(hosts、vim、ssh)
2021-05-08
SLAM学习笔记-求解视觉SLAM问题
2021-05-08
普歌-允异团队-HashMap面试题
2021-05-08
还在一个一个手动安装虚拟机吗?Cobbler自动部署装机一键最小化安装打把游戏就好了
2021-05-08
程序员应该知道的97件事
2021-05-08
create-react-app路由的实现原理
2021-05-08
Linux环境变量配置错误导致命令不能使用(杂谈)
2021-05-08
openstack安装(九)网络服务的安装--控制节点
2021-05-08
shell编程(六)语言编码规范之(变量)
2021-05-08
vimscript学习笔记(二)预备知识
2021-05-08
Android数据库
2021-05-08
HTML基础,块级元素/行内元素/行内块元素辨析【2分钟掌握】
2021-05-08
STM8 GPIO模式
2021-05-08
omnet++
2021-05-08