基于LDA模型的新闻话题的演化

被引:30
作者
楚克明
李芳
机构
[1] 上海交通大学计算机科学与工程系
关键词
潜在狄利克雷分配模型; 话题关联; 话题演化;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
新闻话题及演化的研究可以帮助人们快速了解和获取新闻内容。提出了一种挖掘新闻话题随时间变化的方法,通过话题抽取和话题关联实现话题的演化。首先应用LDA(Latent Dirichlet Allocation Model)对不同时间段的文集进行话题的自动抽取,话题数目在不同时间段是可变的;计算相邻时间段中任意两个话题的分布距离实现话题的关联。实验结果证明该方法不但可以描述同一个话题随时间的演化过程,还可以描述话题内容随时间的变化,反映了话题(或子话题)之间多对多的演化关系。
引用
收藏
页码:4 / 7+26 +26
页数:5
相关论文
共 2 条
[1]   话题检测与跟踪的评测及研究综述 [J].
洪宇 ;
张宇 ;
刘挺 ;
李生 .
中文信息学报, 2007, (06) :71-87
[2]  
On-line LDA:adaptive topic models for mining text streams with applications to topic detection and tracking .2 L.Alsumait,D.Barbara,C.Domeniconi. ICDM2008 .