基于LDA模型的主题词抽取方法

被引:46
作者
石晶 [1 ]
李万龙 [1 ,2 ]
机构
[1] 长春工业大学计算机科学与工程学院
[2] 吉林大学计算机科学与技术学院
关键词
LDA模型; Gibbs抽样; 主题词抽取;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
以LDA模型表示文本词汇的概率分布,通过香农信息抽取体现主题的关键词。采用背景词汇聚类及主题词联想的方式将主题词扩充到待分析文本之外,尝试挖掘文本的主题内涵。模型拟合基于快速Gibbs抽样算法进行。实验结果表明,快速Gibbs算法的速度约比传统Gibbs算法高5倍,准确率和抽取效率均较高。
引用
收藏
页码:81 / 83
页数:3
相关论文
共 2 条
[1]   基于LDA模型的文本分割 [J].
石晶 ;
胡明 ;
石鑫 ;
戴国忠 .
计算机学报, 2008, (10) :1865-1873
[2]   基于Labeled-LDA模型的文本分类新算法 [J].
李文波 ;
孙乐 ;
张大鲲 .
计算机学报, 2008, (04) :620-627