文章目录
-
- 京东评论情感分析—-随机森林
-
- Step1: 读取数据集
- Step2: 分词、去停用词、生成词典
- Step3: 将评论 转化为 向量
- Step4: 拆分数据集为训练集、测试集
- Step5: 训练模型、评估模型
- Step6: 预测评论情感,输出分类结果
- 小结
京东评论情感分析—-随机森林
上次实现了朴素贝叶斯算法实现的评论情感分析,这次使用随机森林模型来对京东评论内容进行分析
Step1: 读取数据集
Step2: 分词、去停用词、生成词典
对所有评论信息进行分词,并去除停用词
遍历所有评论信息,统计词典
Step3: 将评论 转化为 向量
词袋模型,将所有评论信息通过字典映射,转化为向量,最后返回向量列表
Step4: 拆分数据集为训练集、测试集
评估随机森林模型的执行效率与预测准确度
Step5: 训练模型、评估模型
评估随机森林模型的预测准确度与效率
可见,随机森林模型对于训练集的预测准确度为100%,对于测试集的预测准确度为97.12%,也较为不错
但是随机森林模型的训练时间较长,效率有待提高
Step6: 预测评论情感,输出分类结果
以下代码预测100条评论的情绪类别,并输出预测准确率
声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!