基于评论、新闻的情感倾向分析作商品的价格预测

实验环境

●  操作系统：Windows、Linux
●  语言环境：Python、MATLAB、java
●  实验工具：NLTK、sklearn、MATLAB2015b、Pycharm

● 服务器： tomcat

用开源框架Scrapy分析Xpath路径抓取中关村价站

上述文件中product文件夹是定制好抓取电子产品价格的数据采集器，MySQL建立数据库见文件

应用scrapy爬虫框架，定制爬虫抓取中关村价产品的价格数据并且存储于MySQL数据库中

1.其中的过程是分析页的Xpath路径，根据要获取的数据的路径定位到价格数据（可以分析不同的站数据抓取）

2.存储数据打MySQL数据库中，主要是方便操作和使用

如果是在Linux服务器上做该定时任务只需要按照需要编写crontab即可。

爬虫定制方法以及页分析

这里为了处理抓取新闻数据时候需要处理动态页面的信息采用了beautifulsoup，通过调用相关接口处理JS页面。为保证数据的全面性而选取了百度新闻，同样需要分析页面源码的Xpath路径，为了剔除页的标签，需要同上的路径分析。最后可以通过用户提供的关键词获取新闻数据，效果如下图所示：

通过分析对比发现随机森林分类效果最好。

最终特征如下图所示：

图中分别是积极消极得分和平均分以及方差。

基于情感因素预测模型

模型建立过程详细见论文描述，最后得到各个模型的实验系统如图所示：

●  语料填充
●  文档路径
●  定制主题
●  全自动采集数据
●  模型更改

● 应用软件更改

原文发布时间为：2018-09-20

文章知识点与官方知识档案匹配，可进一步学习相关知识MySQL入门技能树数据库组成表31428 人正在系统学习中相关资源：ExWinner成套价软件

声明：本站部分文章及图片源自用户投稿，如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢！