WordStat—内容分析和文本挖掘软件

软件简介

WordStat是一种灵活且易于使用的文本分析软件–无论您是需要文本挖掘工具来快速提取主题和趋势,还是需要使用最新的定量内容分析工具进行仔细而精确的测量。任何需要快速从大量文档中提取和分析信息的人都可以使用WordStat。我们的内容分析和文本挖掘软件可用于许多应用程序,例如开放式响应分析,商业智能,新闻 道的内容分析,欺诈检测等。

主要作用:

提取实体,关键字,短语,主题

使用最新主题建模探索内容

自动将内容分类

探索文本和数字之间的关系

使用交互式可视化工具

软件功能概述

使用文本挖掘来浏览文档内容

? 使用WordStat分析大量非结构化信息。该软件每分钟可处理2500万个单词,使用聚类,多维缩放,邻近图等功能快速提取主题并自动识别模式。

使用浏览器模式快速提取含义

? 使用资源管理器模式快速轻松地从大量文本数据中提取含义,特别是针对那些文本挖掘经验很少的人。只需单击一下,就可以提取文档中最常用的单词,短语和最突出的主题。

? 导入Word,Excel,HTML,XML,SPSS,Stata,NVivo,PDF和图像。连接并直接从 交媒体,电子邮件, 络调查平台和参考管理工具导入。

使用主题建模提取最显着的主题

? 使用基于单词,短语和相关单词(包括拼写错误)的最新自动主题提取功能,快速概览非常大型的文本集中最重要的主题。

探索连接

? 探索单词或概念之间的关系,并检索与特定连接关联的文本段。

与结构化数据相关的文本

? 探索非结构化文本与结构化数据(例如日期,数字或分类数据)之间的关系,以识别子组之间的时间趋势或差异,或使用统计和图形工具(对应分析,热图,气泡图等)。

使用字典分类您的文本数据

? 使用现有词典实现全文分析自动化,或使用单词,短语,邻近规则等创建您自己的分类模型。

为词典建筑获得独特的帮助

? 使用提取常用短语和技术术语并在文本集合中快速识别拼写错误,同义词,反义词和相关单词的工具,更快地构建词典。

使用机器学习分类您的文本数据

? 使用朴素贝叶斯和K最近邻来开发和优化自动文档分类模型。

一次单击即可返回源文件

?通过从几乎所有功能,图表或图形返回到文本来验证或深入分析。您可以使用“关键字检索”或“上下文中的关键字”功能来检索句子,段落或整个文档。这在建立分类法或消除词义歧义时特别有用。您还可以将QDA Miner代码附加到检索到的段。

执行定性编码

? 将 WordStat与最新的定性编码工具(QDA Miner)结合使用,以在需要时更精确地浏览数据或对特定文档或提取的文本段进行更深入的分析。

将非结构化文本转换为交互式地图(GIS映射)

? 将非结构化文本数据与地理信息相关联,并创建数据点,主题地图和热图的交互式图表,以及用于将位置名称,邮政编码和IP地址转换为纬度和经度的地理编码Web服务。

自动提取命名实体

? 自动提取命名的实体,可以使用简单的拖放操作将其添加到分类字典中。

出口结果

? 轻松将文本分析结果导出为常见的行业文件格式,例如Excel,SPSS,ASCII,HTML,XML,MS Word和图形(例如PNG,BMP和JPEG)。

使用PYTHON脚本转换文本

北京友万信息科技有限公司,专注分享商业数据分析、金融数据分析、应用统计分析、知识图谱、机器学习、计量经济、人工智能、 络爬虫、自动化 告与可重复研究等热门技术内容。定向培养Minitab、Stata、Python、R 语言数据人才,助力产学研政企商协同发展,为中国大数据产业蓄能。 邮箱:info@uone-tech.cn。

声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2022年2月15日
下一篇 2022年2月15日

相关推荐