基于LDA模型的评论热点挖掘:原理与实现

被引:19
作者
余传明
张小青
陈雷
机构
[1] 上海理工大学管理学院
关键词
热点话题识别; 热点挖掘; 用户评论; 模型;
D O I
10.16353/j.cnki.1000-7490.2010.05.006
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
本文提出了潜在狄利克雷分布模型与自然语言处理技术相结合的一种挖掘用户评论热点的方法。为验证该方法的有效性,以22157篇餐馆评论为样本,利用Gibbs抽样计算模型参数,获取了评论热点及相应的热点词语。实验获得的9个主题内容较好地反映了餐馆评论中的热点,与现实生活中用户所关心的餐饮热点基本吻合,表明该模型具有较好的热点识别效果。
引用
收藏
页码:103 / 106
页数:4
相关论文
共 6 条
[1]   从用户评论中挖掘产品属性——基于SOM的实现 [J].
余传明 .
现代图书情报技术, 2009, (05) :61-66
[2]   网络热点事件发现系统的设计 [J].
刘星星 ;
何婷婷 ;
龚海军 ;
陈龙 .
中文信息学报, 2008, (06) :80-85
[3]   网络热点信息发现研究 [J].
曾依灵 ;
许洪波 .
通信学报, 2007, (12) :141-146
[4]   流量内容词语相关度的网络热点话题提取 [J].
周亚东 ;
孙钦东 ;
管晓宏 ;
李卫 ;
陶敬 .
西安交通大学学报, 2007, (10) :1142-1145+1150
[5]   Design and Implementation of On-Line Hot Topic Discovery Model [J].
YE Huimin CHENG Wei DAI Guanzhong School of Automatic Control Northwestern Polytechnical University Xian Shaanxi China Institute of Artificial Intelligence Beijing City University Beijing China .
Wuhan University Journal of Natural Sciences, 2006, (01) :21-26
[6]  
中文计算技术与语言问题研究[M]. - 电子工业出版社 , 萧国政, 2007