利用LDA的领域新兴主题探测技术综述

被引:24
作者
范云满 [1 ,2 ]
马建霞 [1 ]
机构
[1] 中国科学院国家科学图书馆兰州分馆
[2] 中国科学院大学
关键词
主题模型; LDA; 引文分析; 主题模型可视化;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
以LDA为基础,系统梳理新兴主题探测以及主题趋势探测技术中的LDA以及其他LDA改进主题模型的发展现状。介绍LDA的变分推导和Gibbs抽样两种参数推导算法;总结近年来LDA模型的改进,包括对主题演化建模的主题模型、对文档内容和元数据联合建模的模型、采用在线式学习的主题模型及将LDA和引文分析相结合的主题演化方法等,并对不同的改进模型进行深入对比和分析;梳理NIH-VB、TIARA、VxInsight等几种主要的主题模型可视化技术。最后通过对LDA模型的总结分析,探讨利用LDA模型探测领域新兴主题时的关键研究问题。
引用
收藏
页码:58 / 65
页数:8
相关论文
共 8 条
[1]   基于话题模型的科技文献话题发现和趋势分析 [J].
贺亮 ;
李芳 .
中文信息学报, 2012, 26 (02) :109-115
[2]   一种基于密度的自适应最优LDA模型选择方法 [J].
曹娟 ;
张勇东 ;
李锦涛 ;
唐胜 .
计算机学报, 2008, (10) :1780-1787
[3]  
基于概率主题模型的文献知识挖掘[J]. 王萍.情报学报. 2011 (06)
[4]   Probabilistic Topic Models [J].
Blei, David M. .
COMMUNICATIONS OF THE ACM, 2012, 55 (04) :77-84
[5]   A CORRELATED TOPIC MODEL OF SCIENCE [J].
Blei, David M. ;
Lafferty, John D. .
ANNALS OF APPLIED STATISTICS, 2007, 1 (01) :17-35
[6]  
Scholarly publishing in the Internet age: a citation analysis of computer science literature[J] . Abby A Goodrum,Katherine W McCain,Steve Lawrence,C Lee Giles.Information Processing and Management . 2001 (5)
[7]   Text Classification from Labeled and Unlabeled Documents using EM [J].
Kamal Nigam ;
Andrew Kachites Mccallum ;
Sebastian Thrun ;
Tom Mitchell .
Machine Learning, 2000, 39 :103-134
[8]   An introduction to variational methods for graphical models [J].
Jordan, MI ;
Ghahramani, Z ;
Jaakkola, TS ;
Saul, LK .
MACHINE LEARNING, 1999, 37 (02) :183-233