中文词云!Python实现实例分享

十九大 告词云图

最近看到很多文章有中文词云图的应用,想起之前也做过类似的有趣实践,这里分享一下如何使用Python绘制词云图,附源码。

关键模块:python、jieba、wordcloud、matplotlib

在这个项目中我们具体导入了matplotlib、wordcloud 、jieba、collections 、numpy等模块。同时我们导入了一些自定义字典(Custom_dictionary.dic) ,比如中国梦、强军梦等。

word_segmentation()方法介绍

word_segmentation方法主要实现了文本切词处理,输出词汇列表。

  1. 获取Cstopword.dic读取中文停用词表,中文停词表 上很多,这里不贴了。
  2. 使用jieba模块进行文本内容分词(默认是精确分词)。
  3. 过滤数字、英文、标点、停词。

word_segmentation()源码

main()方法介绍

  1. 读取词云底图并生成颜色值
  2. 使用WordCloud模块绘制词云图,根据实际情况进行调参,可以获取更佳的词云效果。

底图部分截图

main()源码

后续,还将分享更多的有趣内容,多多关注哦。

声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2018年10月10日
下一篇 2018年10月10日

相关推荐