pythonä¸æåè¯ï¼ç»å·´åè¯
ä¸æåè¯æ¯ä¸æææ¬å¤ççä¸ä¸ªåºç¡æ§å·¥ä½ï¼ç»å·´åè¯å©ç¨è¿è¡ä¸æåè¯ãå
¶åºæ¬å®ç°åçæä¸ç¹ï¼
åºäºTrieæ ç»æå®ç°é«æçè¯å¾æ«æï¼çæå¥åä¸æ±åææå¯è½æè¯æ
åµæææçæåæ ç¯å¾ï¼DAG)
éç¨äºå¨æè§åæ¥æ¾æ大æ¦çè·¯å¾, æ¾åºåºäºè¯é¢çæ大ååç»å
对äºæªç»å½è¯ï¼éç¨äºåºäºæ±åæè¯è½åçHMM模åï¼ä½¿ç¨äºViterbiç®æ³
å®è£
ï¼Linuxç¯å¢ï¼
ä¸è½½å·¥å
·å
ï¼è§£ååè¿å
¥ç®å½ä¸ï¼è¿è¡ï¼python setup.py install
模å¼
é»è®¤æ¨¡å¼ï¼è¯å¾å°å¥åæ精确å°åå¼ï¼éåææ¬åæ
å
¨æ¨¡å¼ï¼æå¥åä¸ææçå¯ä»¥æè¯çè¯è¯é½æ«æåºæ¥ï¼éåæç´¢å¼æ
æ¥å£
ç»ä»¶åªæä¾jieba.cut æ¹æ³ç¨äºåè¯
cutæ¹æ³æ¥å两个è¾å
¥åæ°ï¼
第ä¸ä¸ªåæ°ä¸ºéè¦åè¯çå符串
cut_allåæ°ç¨æ¥æ§å¶åè¯æ¨¡å¼
å¾
åè¯çå符串å¯ä»¥æ¯gbkå符串ãutf-8å符串æè
unicode
jieba.cutè¿åçç»ææ¯ä¸ä¸ªå¯è¿ä»£çgeneratorï¼å¯ä»¥ä½¿ç¨for循ç¯æ¥è·å¾åè¯åå¾å°çæ¯ä¸ä¸ªè¯è¯(unicode)ï¼ä¹å¯ä»¥ç¨list(jieba.cut(...))转å为list
å®ä¾
#! -*- coding:utf-8 -*-
import jieba
seg_list = jieba.cut("ææ¥å°å京æ¸
å大å¦", cut_all = True)
print "Full Mode:", ' '.join(seg_list)
seg_list = jieba.cut("ææ¥å°å京æ¸
å大å¦")
print "Default Mode:", ' '.join(seg_list)
温馨提示:答案为网友推荐,仅供参考