基于强度熵的中文关键词识别方法

被引:3
作者
闫蓉
高光来
机构
[1] 内蒙古大学计算机学院
关键词
抽取; 语言网络; 强度熵;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
文本的关键词识别是文本挖掘中的基本问题之一。在研究现有基于复杂网络的关键词识别方法的基础上,从整个复杂网络拓扑结构特征的信息缺失角度来考察各节点的重要程度。提出强度熵测度来量化评估各节点重要程度,用于解决中文关键词识别问题。实验结果表明,该评估方法简单有效,特别适用于带权复杂网络的节点重要性评估。
引用
收藏
页码:2356 / 2361
页数:6
相关论文
共 16 条
[1]   语言是一种复杂网络 [J].
刘海涛 .
山西大学学报(哲学社会科学版), 2013, 36 (05) :66-69
[2]   复杂网络中节点重要性排序的研究进展 [J].
刘建国 ;
任卓明 ;
郭强 ;
汪秉宏 .
物理学报, 2013, 62 (17) :9-18
[3]   基于小世界模型的复合关键词提取方法研究 [J].
马力 ;
焦李成 ;
白琳 ;
周雅夫 ;
董洛兵 .
中文信息学报, 2009, (03) :121-128
[4]   基于带权语言网络的网页关键词抽取 [J].
任克强 ;
赵光甫 ;
张国萍 .
计算机工程与应用 , 2008, (08) :155-157
[5]   一种基于复杂网络特征的中文文档关键词抽取算法 [J].
赵鹏 ;
蔡庆生 ;
王清毅 ;
耿焕同 .
模式识别与人工智能, 2007, 20 (06) :827-831
[6]   汉语词同现网络的小世界效应和无标度特性 [J].
刘知远 ;
孙茂松 .
中文信息学报, 2007, (06) :52-58
[7]   一种利用BC方法的关键词自动提取算法研究 [J].
张敏 ;
耿焕同 ;
王煦法 .
小型微型计算机系统, 2007, (01) :189-192
[8]   汉语词组网的组织结构与无标度特性 [J].
韦洛霞 ;
李勇 ;
康世勇 ;
罗诗裕 .
科学通报, 2005, (15) :1575-1579
[9]  
基于复杂网络的交通网络复杂性研究[D]. 胡一竑.复旦大学. 2008
[10]  
A new clustering algorithm based on data field in complex networks[J] . Yuhua Liu,Jianzhi Jin,Yi Zhang,Cui Xu.The Journal of Supercomputing . 2014 (3)