基于依存分析与特征组合的微博情感分析

被引:8
作者
夏梦南
杜永萍
左本欣
机构
[1] 北京工业大学计算机学院
基金
北京市自然科学基金;
关键词
情感分析; 特征选择; 情感要素抽取;
D O I
暂无
中图分类号
TP393.092 []; TP391.1 [文字信息处理];
学科分类号
080402 ; 081203 ; 0835 ;
摘要
针对微博短文本存在口语化、简洁化等社交网络特征,充分利用句法依存关系以及条件随机场(conditional random fields,CRFs),抽取候选评价对象,并在基于机器学习的微博情感分类方法的基础上结合情感分析词典,引入情感值、微博标签、主题等特征,优化分类性能。在COAE(Chinese opinion analysis evaluation)微博评测数据集上,以准确率、召回率、F1值为评价指标对所提方法进行验证,证实了基于句法依存分析与CRFs相结合的评价对象抽取方法的有效性,分析了各类特征对情感分类性能的影响,最终在COAE微博观点句识别任务中准确率达91.4%。
引用
收藏
页码:22 / 30
页数:9
相关论文
共 13 条
[1]   微博及中文微博信息处理研究综述 [J].
文坤梅 ;
徐帅 ;
李瑞轩 ;
辜希武 ;
李玉华 .
中文信息学报, 2012, 26 (06) :27-37
[2]   基于主题情感混合模型的无监督文本情感分析 [J].
孙艳 ;
周学广 ;
付伟 .
北京大学学报(自然科学版), 2013, 49 (01) :102-108
[3]   基于层次结构的多策略中文微博情感分析和特征抽取 [J].
谢丽星 ;
周明 ;
孙茂松 .
中文信息学报, 2012, 26 (01) :73-83
[4]   一种新的情感词汇语义倾向计算方法 [J].
杜伟夫 ;
谭松波 ;
云晓春 ;
程学旗 .
计算机研究与发展, 2009, 46 (10) :1713-1720
[5]  
面向热点话题型微博的情感分析研究[D]. 张想.哈尔滨工业大学 2013
[6]  
基于PAD模型的中文微博情感分析研究[D]. 曹海涛.大连理工大学 2013
[7]  
Thumbs up? sentiment classification using machine learning techniques. Bo Pang,Lillian Lee,Shivakumar Vaithyanathan. Proceedings of the 2002 Conference on Empirical Methods in Natural Language Processing (EMNLP) . 2002
[8]  
A Sentimental Education:Sentiment Analysis Using Subjectivity Summarization Based on Minimum Cuts. Pang Bo,Lee Lillian. Proc of ACL‘04 . 2004
[9]  
Topic sentiment mixture:Modeling facets and opinions in weblogs. Mei Q,Ling X,Wondra M,Su H,Zhai C X. Proceedings of the 16th International Conference on World Wide Web . 2007
[10]  
Expanding Domain Sentiment Lexicon through Double Propagation. Qiu G,Liu B,Bu J,Chen C. International Joint Conference on Artificial Intelligence (IJCAI-09) . 2009