python 结巴分词(jieba)学习

源码下载的地址:https://github.com/fxsjy/jieba演示地址:http://jiebademo.ap01.aws.af.cm/特点1,支持三种分词模式:a,精确模式,试图将句子最精确地切开,适合文本分析;b,全模式,把句子中所有的可以成词的词语都扫描出来,速度非常快,但是不能解决歧义;c,搜索引擎模式,在精确模式的基础上,对长词再次切分,提高召回率,适合用于搜索引擎分词。2,支持繁体分词3,支持自定义词典安装1,Python2.x下的安装全自动安装:easy_installjieba或者pipinstalljieba半自动安装:先下载http://pypi.python.org/pypi/jieba/,解压后运行pythonsetup.pyinstall手动安装:...