登录 | 注册 | 购书 New!
卓越网购书 当当网购书 京东网购书
| 铃声下载 | PDF电子书下载 | DVD/CD媒体下载 | 绿色软件下载 | 最新源码 | 今天最热门 | 加入收藏 | 繁體中文 
首页 ASP源码 PHP源码 DotNET源码 JSP源码 CGI源码 FLASH源码 VB源码 VC源码 PB源码 Delphi源码 编程相关 设计方案 网页模板

ThinkPHP的中英文分词扩展

  • 源码作者:佚名
  • 源码大小:23.44 MB
  • 源码类别:PHP源码
  • 源码格式:完整源码
  • 发布时间:Nov 14, 2011 5:11:00 PM
  • 源码级别:
  • 下载总计:月:1 总:1173

源码简介:

可以对全半角混合了标点的中英文句子进行分词。可以自己选择最大词组字长、标点断句最小词组字长、是否保留分词结果中的单个字、是否保留标点符号等功能。更加详细的说明请查看下载包里面的Readme.txt

默认提供一个sqlite的字典文件。如果你的虚拟主机不支持sqlite,你可以将其导入mysql或自己造其他的字典。
由于本人能力有限,可能效率上不能令大家满意,请多包含。
字典的挂载、卸载和查询都将函数分离了,修改起来应该很容易。核心分词算法只需要findinDict返回一个true或者false告诉我字典中是否有这个词就行了。

还有一个需要注意的就是mbstring的扩展是必须的。没办法啊,中英文、全半角混合在一起分词,不用mbstring在计算句子长度等方面都很困难。
程序默认是作为ThinkPHP的扩展提供的,但是你可以去掉extends Base,直接使用分词类。Apache2开源协议,SO,用于商业闭源也无所谓啦,如果你不嫌弃我的程序的话

重要事项Attentions

  • 本站所有源码都经过我们亲自检查,杀毒,确保每个源码都能正常运行.
  • 为了保证您快速的下载,推荐使用[网际快车]或[迅雷]等专业工具下载.
  • 本站无限制人数下载!如果您发现该源码不能下载,请通知管理员.或先看看下载教程.
  • 为确保所下源码能正常使用,请使用[WinRAR v3.70]或以上版本解压本站源码.
  • 如果你下载的源码是7z,gz格式的话,请安装该类型的解压软件。
  • 站内源码包含整站及企业源码均由网上搜集,若无意中侵犯到您的权利,敬请来信联系我们.
  • 如果需要解压密码的话,解压密码就是:code.anysafer.com