–
SnowNLP是一个python写的类库,可以方便的处理中文文本内容,是受到了TextBlob的启发而写的,由于现在大部分的自然语言处理库基本都是针对英文的,于是写了一个方便处理中文的类库,并且和TextBlob不同的是,这里没有用NLTK,所有的算法都是自己实现的,并且自带了一些训练好的字典。注意本程序都是处理的unicode编码,所以使用时请自行decode成unicode。
私信小编01即可获取Python学习资料
github
https://github.com/isnowfy/snownlp
汉字转换拼音样例代码:
from?snownlp?import?SnowNLP
s?=?SnowNLP(u'这个东西真心很赞')
s.pinyin????????#?[u'zhe',?u'ge',?u'dong',?u'xi',
????????????????#??u'zhen',?u'xin',?u'hen',?u'zan']
繁体转换简体样例代码:
from?snownlp?import?SnowNLP
s?=?SnowNLP(u'「繁體字」「繁體中文」的叫法在臺灣亦很常見。')
s.han???????????
#?u'「繁体字」「繁体中文」的叫法在台湾亦很常见。'