一种利用BC方法的关键词自动提取算法研究

被引:17
作者
张敏
耿焕同
王煦法
机构
[1] 中国科学技术大学计算机科学与技术系
关键词
关键词抽取; 中心度; 词语网络; 社会网络;
D O I
暂无
中图分类号
TP393.02 []; TP391.1 [文字信息处理];
学科分类号
081201 ; 1201 ; 081203 ; 0835 ;
摘要
通过分析几种常见关键词自动抽取方法的特点和不足,以KeyGraph算法思想为基础,构建词语网络并利用网络节点中心度(BetweennessCentrality)理论,提出了一种新的自动抽取关键词算法.通过分析和比较,新算法提取的关键词更能体现文档内容,并且相对低频而意义重要的关键词也能被提取出.最后,通过与TF和TFIDF算法的比较和分析,获得了令人满意的结果.
引用
收藏
页码:189 / 192
页数:4
相关论文
共 2 条
[1]   关键词自动标引的最大熵模型应用研究 [J].
李素建 ;
王厚峰 ;
俞士汶 ;
辛乘胜 .
计算机学报, 2004, (09) :1192-1197
[2]  
A measure of centrality based on the network efficiency. Latora V,Marchiori M. Cond-Mat/0402050 . 2004