该问题已被锁定!
5
关注
5003
浏览

中文分词过程中去除无意义词语的词库哪里有分享?

AI智能回复搜索中,请稍后...

为什么被折叠? 0 个回复被折叠
帅驴 初级会员 用户来自于: 广东省深圳市
2012-09-16 23:18
@lym62php的可以用么?
lym62 初级会员 用户来自于: 广东省深圳市
2012-08-13 22:57
开源中国有不少,http://www.oschina.net/project/tag/264/segment 另有一个“海量中文智能分词”,好像腾讯用的就是这个,不过不开源,是商业版的
麻辣兔子 注册会员 用户来自于: 上海市长宁区
2012-08-13 18:20
搜一下停止词库,看看有没有开源的

关于作者

问题动态

发布时间
2012-08-13 12:06
更新时间
2012-09-16 23:18
关注人数
5 人关注

相关问题

帖子列表截取中文字符乱码
1.话题 精华里面的头像都是统一网址 2.含中文的话题都无法打开页面。
3.1.9 一部分中文名注册提示用户名不符合规则
分词应该加一些过滤
前台英文,后台保留中文
给大家一个Markdown编辑器语法中文说明
基于什么考虑去除了如知乎的 上下级话题层级关系?
在IIS下中文搜索,中文主页,中文话题等不能用的可以暂时试试这个
II7 URL Rewrite Module 话题伪静态 中文支持解决方案
在IE浏览器内核下,中文无法注册