一.导入用到的模块
二.jieba分词
2.1三种分词模式:精确、全、搜索分词
结果如下:
2.2结巴分词并获取对应的词性
结果如下:
2.3打开本地文件,分词,获得出现频率靠前的20个词
结果如下:
三.词云制作
首先将导入的斗破文本分词,读入背景图片(此处可以不设置背景,默认背景为四边形)
此处特别说明,如果做的是中文词云,一定要读入中文字体,因为wordcloud默认字体不支持中文
背景色不设置的话,默认是黑的
之后就是用matplotlib将图片显示出来了
结果如下:
我在将没有什么个性化设置的样例放出来:
希望对大家有帮助,开心编程。
嗯,今天我才知道原来程序员还有个1024节日(o′o)
文章知识点与官方知识档案匹配,可进一步学习相关知识Python入门技能树人工智能自然语言处理208951 人正在系统学习中
声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!