基于语义约束LDA的商品特征和情感词提取

被引:52
作者
彭云 [1 ,2 ,3 ]
万常选 [1 ,3 ]
江腾蛟 [1 ,3 ]
刘德喜 [1 ,3 ]
刘喜平 [1 ,3 ]
廖国琼 [1 ,3 ]
机构
[1] 江西财经大学信息管理学院
[2] 江西师范大学计算机信息工程学院
[3] 数据与知识工程江西省高校重点实验室(江西财经大学)
关键词
LDA模型; 语义约束; 商品特征; 情感词;
D O I
10.13328/j.cnki.jos.005154
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
随着网络购物的发展,Web上产生了大量的商品评论文本数据,其中蕴含着丰富的评价知识.如何从这些海量评论文本中有效地提取商品特征和情感词,进而获取特征级别的情感倾向,是进行商品评论细粒度情感分析的关键.根据中文商品评论文本的特点,从句法分析、词义理解和语境相关等多角度获取词语间的语义关系,然后将其作为约束知识嵌入到主题模型,提出语义关系约束的主题模型SRC-LDA(semantic relation constrained LDA),用来实现语义指导下LDA的细粒度主题词提取.由于SRC-LDA改善了标准LDA对于主题词的语义理解和识别能力,从而提高了相同主题下主题词分配的关联度和不同主题下主题词分配的区分度,可以更多地发现细粒度特征词、情感词及其之间的语义关联性.实验结果表明,SRC-LDA对于细粒度特征和情感词的发现和提取具有较好的效果.
引用
收藏
页码:676 / 693
页数:18
相关论文
共 7 条
[1]   基于LDA的多粒度主题情感混合模型 [J].
欧阳继红 ;
刘燕辉 ;
李熙铭 ;
周晓堂 .
电子学报, 2015, 43 (09) :1875-1880
[2]   基于潜在狄利特雷分布模型的网络评论产品特征抽取方法 [J].
马柏樟 ;
颜志军 .
计算机集成制造系统, 2014, 20 (01) :96-103
[3]   基于主题情感混合模型的无监督文本情感分析 [J].
孙艳 ;
周学广 ;
付伟 .
北京大学学报(自然科学版), 2013, 49 (01) :102-108
[4]   基于CRFs的评价对象抽取特征研究 [J].
王荣洋 ;
鞠久朋 ;
李寿山 ;
周国栋 .
中文信息学报, 2012, (02) :56-61
[5]   基于句法路径的情感评价单元识别 [J].
赵妍妍 ;
秦兵 ;
车万翔 ;
刘挺 .
软件学报, 2011, 22 (05) :887-898
[6]   评价对象抽取及其倾向性分析 [J].
刘鸿宇 ;
赵妍妍 ;
秦兵 ;
刘挺 .
中文信息学报, 2010, 24 (01) :84-88+122
[7]  
一个用于汉语汽车评论的意见挖掘系统.[A].姚天昉;聂青阳;李建超;李林琳;娄德成;陈珂;付宇;.中国中文信息学会二十五周年学术会议.2006,