学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
一种利用BC方法的关键词自动提取算法研究
被引:17
作者
:
论文数:
引用数:
h-index:
机构:
张敏
耿焕同
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学技术大学计算机科学与技术系
耿焕同
论文数:
引用数:
h-index:
机构:
王煦法
机构
:
[1]
中国科学技术大学计算机科学与技术系
来源
:
小型微型计算机系统
|
2007年
/ 01期
关键词
:
关键词抽取;
中心度;
词语网络;
社会网络;
D O I
:
暂无
中图分类号
:
TP393.02 [];
TP391.1 [文字信息处理];
学科分类号
:
081201 ;
1201 ;
081203 ;
0835 ;
摘要
:
通过分析几种常见关键词自动抽取方法的特点和不足,以KeyGraph算法思想为基础,构建词语网络并利用网络节点中心度(BetweennessCentrality)理论,提出了一种新的自动抽取关键词算法.通过分析和比较,新算法提取的关键词更能体现文档内容,并且相对低频而意义重要的关键词也能被提取出.最后,通过与TF和TFIDF算法的比较和分析,获得了令人满意的结果.
引用
收藏
页码:189 / 192
页数:4
相关论文
共 2 条
[1]
关键词自动标引的最大熵模型应用研究
[J].
李素建
论文数:
0
引用数:
0
h-index:
0
机构:
北京大学计算语言学研究所,北京大学计算语言学研究所,北京大学计算语言学研究所,人民日报社新闻信息中心北京,北京,北京,北京
李素建
;
王厚峰
论文数:
0
引用数:
0
h-index:
0
机构:
北京大学计算语言学研究所,北京大学计算语言学研究所,北京大学计算语言学研究所,人民日报社新闻信息中心北京,北京,北京,北京
王厚峰
;
俞士汶
论文数:
0
引用数:
0
h-index:
0
机构:
北京大学计算语言学研究所,北京大学计算语言学研究所,北京大学计算语言学研究所,人民日报社新闻信息中心北京,北京,北京,北京
俞士汶
;
辛乘胜
论文数:
0
引用数:
0
h-index:
0
机构:
北京大学计算语言学研究所,北京大学计算语言学研究所,北京大学计算语言学研究所,人民日报社新闻信息中心北京,北京,北京,北京
辛乘胜
.
计算机学报,
2004,
(09)
:1192
-1197
[2]
A measure of centrality based on the network efficiency. Latora V,Marchiori M. Cond-Mat/0402050 . 2004
←
1
→
共 2 条
[1]
关键词自动标引的最大熵模型应用研究
[J].
李素建
论文数:
0
引用数:
0
h-index:
0
机构:
北京大学计算语言学研究所,北京大学计算语言学研究所,北京大学计算语言学研究所,人民日报社新闻信息中心北京,北京,北京,北京
李素建
;
王厚峰
论文数:
0
引用数:
0
h-index:
0
机构:
北京大学计算语言学研究所,北京大学计算语言学研究所,北京大学计算语言学研究所,人民日报社新闻信息中心北京,北京,北京,北京
王厚峰
;
俞士汶
论文数:
0
引用数:
0
h-index:
0
机构:
北京大学计算语言学研究所,北京大学计算语言学研究所,北京大学计算语言学研究所,人民日报社新闻信息中心北京,北京,北京,北京
俞士汶
;
辛乘胜
论文数:
0
引用数:
0
h-index:
0
机构:
北京大学计算语言学研究所,北京大学计算语言学研究所,北京大学计算语言学研究所,人民日报社新闻信息中心北京,北京,北京,北京
辛乘胜
.
计算机学报,
2004,
(09)
:1192
-1197
[2]
A measure of centrality based on the network efficiency. Latora V,Marchiori M. Cond-Mat/0402050 . 2004
←
1
→