基于字典与机器学习的中文微博情感分析研究 (2014.7 计算机应用与软件)

阅读笔记

创新点:

  • 基于层级结构的特征降维方法
  • 基于表情符 的特征极性值计算
  • 基于特征极性值的位置权重计算

1. 词典的构建

  • 极性副词词典的构建
    1.郝雷红. 现代汉语否定副词研究 中对否定副词范围界定的基础上,加入了若干否定副词
    2.采用 蔺璜 程度副词的特点范围与分类 对程度副词范围的界定构建极性程度副词词典
  • 表情符 词典的构建
    借助新浪微博中的表情符 构建表情符 词典,并根据表情符 表达的情感倾向性将其分为正向和负向两类。

2.词典与机器学习相结合的微博文本情感分析

  1. 基于层次结构的特征降维方法
    采用 χ2统计法进行特征选择,初步降低特征空间的维数,借助层次聚类算法(将向量空间分为褒义,贬义和中性三个子空间分别进行聚类,再将三个子空间聚类结果合并在一起)对特征空间进行降维,进一步降低特征空间的维数,最终达到特征降维的目的。

  2. 基于表情符 的特征极性值计算:

    基于字典与机器学习的中文微博情感分析研究   (2014.7 计算机应用与软件)
  3. 情感分类算法:借助SVM

声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2019年7月3日
下一篇 2019年7月3日

相关推荐