PHP中文分词的几种方式总结

SJY发表于:2018年05月10日 21:15 • 阅读:

不需要服务器,纯PHP实现中文分词的方法主要有以下几种

PullWord

永久免费的中文分词API,直接用CURL调用就可以。用了很长时间,后来发现越来越不好用,毕竟是共享的远程调用,用的人一多,就容易卡。最近几个月时不时的出现分词卡住的情况。

官网:http://pullword.com/

优点:分词功能强大,别人的服务器直接给你处理好了,直接调用API就可以了。

缺点:共享的东西,用的人一多就卡,时好时不好,不稳定。

SCWS 中文分词

里面有好几个版本,其中纯PHP能用的只有PSCWS23,速度肯定没服务器版本快,但也够用了。

官网:http://www.xunsearch.com/scws/index.php

优点:开源免费,把需要的文件上传到自己的虚拟主机就能直接使用。

缺点:分词功能一般,速度也一般。仅支持GBK编码,其他编码需要自己转换。

phpanalysis

分词功能还算丰富,纯PHP实现分词功能,速度尚可,足够了。

官网:http://www.phpbone.com/phpanalysis/

优点:分词功能丰富,速度可以。纯PHP实现,方便自己管理。

缺点:这个已经可以了,暂时没有大的缺点。

欢迎转载,但请保留原文地址 http://www.sjyhome.com/php/php-chinese-word-segmentation.html

回复(0)