基于MFIHC聚类和TOPSIS的微博热点发现方法

被引:5
作者
魏德志 [1 ,2 ]
陈福集 [1 ]
林丽娜 [2 ]
机构
[1] 福州大学经济与管理学院
[2] 集美大学诚毅学院
关键词
网络舆情; TOPSIS; 热点发现; 聚类; 微博;
D O I
暂无
中图分类号
TP391.1 [文字信息处理]; TP393.092 [];
学科分类号
081203 ; 0835 ; 080402 ;
摘要
针对微博的文本存在短小、快速、变化等特点,导致热点发现困难的问题,提出了一种基于改进的FIHC聚类和TOPSIS的热点发现方法。首先把知网语义相似度引入FIHC聚类算法score函数的计算,考虑了频繁词之间的语义联系,更准确地生成基于频繁词的初始簇;然后对微博文本重复的初始簇进行消减,再采用SinglePass聚类的思想对消减完的话题簇进一步聚类最终得到热点话题;最后对热点话题采用改进的TOPSIS模型进行排序,更好地获得热点话题的排行。通过与其他文本聚类算法以及热点发现方法对比,该方法热点发现效果好,能够比较全面地反映当前的热点话题。
引用
收藏
页码:1014 / 1017+1041 +1041
页数:5
相关论文
共 11 条
[1]  
Dynamic Online HDP model for discovering evolutionary topics from Chinese social texts.[J].Xianghua Fu;Jianqiang Li;Kun Yang;Laizhong Cui;Lei Yang.Neurocomputing.2016,
[2]   Semantic search for public opinions on urban affairs: A probabilistic topic modeling-based approach [J].
Ma, Baojun ;
Zhang, Nan ;
Liu, Guannan ;
Li, Liangqiang ;
Yuan, Hua .
INFORMATION PROCESSING & MANAGEMENT, 2016, 52 (03) :430-445
[3]  
Burst topic discovery and trend tracing based on Storm.[J].Shihang Huang;Ying Liu;Depeng Dang.Physica A: Statistical Mechanics and its Applications.2014,
[4]  
Mining opinion components from unstructured reviews: A review.[J].Khairullah Khan;Baharum Baharudin;Aurnagzeb Khan;Ashraf Ullah.Journal of King Saud University - Computer and Information Sciences.2014,
[5]   结合时序和语义的中文微博话题检测与跟踪方法 [J].
陈铁明 ;
王小号 ;
庞卫巍 ;
江颉 .
网络与信息安全学报, 2016, 2 (05) :21-29
[6]   基于离散粒子群优化的微博热点话题发现算法 [J].
马慧芳 ;
吉余岗 ;
李晓红 ;
周汝南 .
计算机工程, 2016, 42 (03) :208-213
[7]   孤立点预处理和Single-Pass聚类结合的微博话题检测方法 [J].
叶施仁 ;
杨英 ;
杨长春 ;
朱明峰 .
计算机应用研究, 2016, 33 (08) :2294-2297
[8]   基于链接和萤火虫算法聚类博文发现热点话题 [J].
王雅琳 ;
陆向艳 ;
钟诚 .
计算机工程与设计, 2015, 36 (06) :1620-1625
[9]   基于时序信息的话题动态演化模型及追踪算法 [J].
陈婷 ;
胡改丽 ;
陈福集 .
武汉理工大学学报(信息与管理工程版), 2015, 37 (03) :354-359+377
[10]   基于微博意见领袖参与行为的热点话题检测研究 [J].
赵龙文 ;
陈明艳 ;
公荣涛 ;
姚海波 .
情报科学, 2015, 33 (04) :87-92