结合语义相似度改进LDA的文本主题分析

被引:8
作者
赵林静
机构
[1] 中国民航飞行学院计算机学院
关键词
评论短文本; 主题分析; HowNet语义相似度; LDA模型; 超参数β;
D O I
10.16208/j.issn1000-7024.2019.12.025
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
为对评论文本进行准确的主题分类,提出一种结合HowNet语义相似度和隐含狄利克雷分配(LDA)模型的主题聚类方法。不同于传统LDA模型,该方法通过HowNet常识知识库计算输入单词与当前主题聚类中单词间的语义相似度,以此调整LDA模型中的超参数β。为不同的单词分配不同的β值,以此监督聚类过程,在主题分析中实现从语法到语义的转变。实验结果表明,该方法能够有效提高主题聚类的准确性。
引用
收藏
页码:3514 / 3519
页数:6
相关论文
共 12 条
[1]   基于BTM主题模型的Web服务聚类方法研究 [J].
陈婷 ;
刘建勋 ;
曹步清 ;
李润 .
计算机工程与科学, 2018, 40 (10) :1737-1745
[2]   面向商品评论文本的情感分析与挖掘 [J].
李涵昱 ;
钱力 ;
周鹏飞 .
情报科学, 2017, 35 (01) :51-55+61
[3]   基于LDA主题模型的短文本分类 [J].
杨萌萌 ;
黄浩 ;
程露红 ;
马平 ;
包武杰 .
计算机工程与设计, 2016, 37 (12) :3371-3377
[4]   基于语义约束LDA的商品特征和情感词提取 [J].
彭云 ;
万常选 ;
江腾蛟 ;
刘德喜 ;
刘喜平 ;
廖国琼 .
软件学报, 2017, 28 (03) :676-693
[5]   轻型评论的情感分析研究 [J].
张林 ;
钱冠群 ;
樊卫国 ;
华琨 ;
张莉 .
软件学报, 2014, 25 (12) :2790-2807
[6]   基于Labeled-LDA模型的文本分类新算法 [J].
李文波 ;
孙乐 ;
张大鲲 .
计算机学报, 2008, (04) :620-627
[7]  
A new Gibbs sampling based algorithm for Bayesian model updating with incomplete complex modal data[J] . Sai Hung Cheung,Sahil Bansal.Mechanical Systems and Signal Processing . 2017
[8]  
Text classification method based on Self-Training and LDA topic models[J] . Miha Pavlinek,Vili Podgorelec.Expert Systems With Applications . 2017
[9]  
A survey on opinion mining and sentiment analysis: Tasks, approaches and applications[J] . Kumar Ravi,Vadlamani Ravi.Knowledge-Based Systems . 2015
[10]  
Incremental probabilistic Latent Semantic Analysis for video retrieval[J] . Ruben Fernandez-Beltran,Filiberto Pla.Image and Vision Computing . 2015