学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
基于MB-LDA模型的微博主题挖掘
被引:167
作者
:
论文数:
引用数:
h-index:
机构:
张晨逸
[
1
]
论文数:
引用数:
h-index:
机构:
孙建伶
[
1
]
论文数:
引用数:
h-index:
机构:
丁轶群
[
2
]
机构
:
[1]
浙江大学计算机科学与技术学院
[2]
浙江大学工业技术研究院
来源
:
计算机研究与发展
|
2011年
/ 48卷
/ 10期
关键词
:
微博;
主题挖掘;
LDA;
概率生成模型;
社交网络;
D O I
:
暂无
中图分类号
:
TP393.092 [];
学科分类号
:
080402 ;
摘要
:
随着微博的日趋流行,Twitter等微博网站已成为海量信息的发布体,对微博的研究也需要从单一的用户关系分析向微博本身内容的挖掘进行转变.在数据挖掘领域,尽管传统文本的主题挖掘已经得到了广泛的研究,但对于微博这种特殊的文本,因其本身带有一些结构化的社会网络方面的信息,传统的文本挖掘算法不能很好地对它进行建模.提出了一个基于LDA的微博生成模型MB-LDA,综合考虑了微博的联系人关联关系和文本关联关系,来辅助进行微博的主题挖掘.采用吉布斯抽样法对模型进行推导,不仅能挖掘出微博的主题,还能挖掘出联系人关注的主题.此外,模型还能推广到许多带有社交网络性质的文本中.在真实数据集上的实验表明,MB-LDA模型能有效地对微博进行主题挖掘.
引用
收藏
页码:1795 / 1802
页数:8
相关论文
共 1 条
[1]
An introduction to latent semantic analysis[J] . Thomas K. Landauer,Peter W. Foltz,Darrell Laham.Discourse Processes . 1998 (2-3)
←
1
→
共 1 条
[1]
An introduction to latent semantic analysis[J] . Thomas K. Landauer,Peter W. Foltz,Darrell Laham.Discourse Processes . 1998 (2-3)
←
1
→