这款NLP神器火了!关键词一键提取、结果高度可视化,堪称「小白进阶大神」的实用工具包 | 开源…

如何快速优雅地处理你的NLP数据集/p>

试试这款 称「从小白到大神」的Texthero的工具包。

不仅编写界面友好美观,而且功能全面,预处理、表征、可视化样样精通,在Reddit上17个小时内就获得了近1.1k的热度。

下面是Texthero的使用界面。

PCA降维后的效果duangduang的:

效果如下:

使用效果

从展示界面来看,Texthero只需要编写少量代码,就能得到你想要的结果,为数据处理省去了不少时间。

事实上,只要掌握基本使用逻辑,萌新也能快速上手这款NLP数据处理神器。

使用指南

pip一下texthero后(或从GitHub上直接下载工具包,文末附代码链接),采用import导入它和pandas:

然后就可以开始使用了:

预处理

如果需要进行快速的数据预处理操作,直接使用「文本清理」就行:

光是预处理栏目就有这么多工具

再也不用编写一大堆代码,专门清理文本中的冗余数据了。

表征

同样,如果需要进行TF-IDF算法特征表示的话,同样只需要几行代码就能实现:

如果需要更多的算法,这里也有meanshift、NMF等算法可以选用,每种算法基本都集成在一行代码中,你想要的这里都有。

可视化界面非常清晰:

这么方便的NLP数据处理工具包,赶紧用起来~

传送门

代码链接:

https://github.com/jbesomi/texthero

项目链接:

https://texthero.org/

名 | 四场直播详解AI芯片所有知识点

7月8日—7月11日期间,燧原科技资深产品专家和软件架构师将为大家分别详细讲解:

  • 高端人工智能训练芯片的发展趋势

  • 剖析软件全栈的技术难点

  • 人工智能训练芯片在云计算中所面临的挑战和机遇

四场直播将讲透所有的芯片知识点,欢迎扫码 名~~

追踪AI技术和产品新动态

喜欢就点「在看」吧 !

声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2020年6月4日
下一篇 2020年6月4日

相关推荐