Hadoop平台的微博热点事件挖掘

被引:3
作者
谢思发 [1 ]
林琛 [1 ,2 ]
苏旋 [3 ]
江弋 [1 ]
机构
[1] 厦门大学信息科学与技术学院
[2] 厦门大学深圳研究院
[3] 仟首网络科技有限公司
关键词
微博; Hadoop; 分布式; 热点事件;
D O I
暂无
中图分类号
TP393.092 [];
学科分类号
080402 ;
摘要
微博作为一种新兴的网络社交服务,其即时通讯功能强大,用户可利用各种手段在微博上实时、快捷地发布社会热点事件.但是微博平台在短时间内发布大量信息的特点在一定程度上造成了信息的碎片化,而且迅速的信息更新速度易造成重要信息的不易检索.本文采用Hadoop平台,利用其在大数据挖掘方面的优势,提出挖掘微博中热点词的分布式算法,提取热点词组织热点事件,方便用户查询.此外提出了线性时间复杂度的检测算法,检测热点事件的爆发时间段.文中采用Twitter和新浪微博上的数据集作为测试样本,进行了大量的实验,实验结果表明本文算法能有效的提取微博中的热点事件.
引用
收藏
页码:797 / 801
页数:5
相关论文
共 4 条
[1]   面向热点话题时间序列的有效聚类算法研究 [J].
韩忠明 ;
陈妮 ;
乐嘉锦 ;
段大高 ;
孙践知 .
计算机学报, 2012, 35 (11) :2337-2347
[2]   基于特定领域的中文微博热点话题挖掘系统BTopicMiner [J].
李劲 ;
张华 ;
吴浩雄 ;
向军 .
计算机应用, 2012, 32 (08) :2346-2349
[3]   基于主题的自适应、在线网络热点发现方法及新闻推荐系统 [J].
吴永辉 ;
王晓龙 ;
丁宇新 ;
徐军 ;
郭鸿志 .
电子学报, 2010, 38 (11) :2620-2624
[4]  
Bursty event detection from collaborative tags [J] . Junjie Yao,Bin Cui,Yuxin Huang,Yanhong Zhou.&nbsp&nbspWorld Wide Web . 2012 (2)