融合关键词增补与领域本体的共词分析方法研究

被引:19
作者
唐晓波
肖璐
机构
[1] 武汉大学信息资源研究中心
关键词
共词分析; 增补词典; 领域本体;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
针对传统共词分析中的不足,提出一个新的共词分析过程模型,该模型从两个方面对传统共词分析方法进行改进。首先,自标引关键词不能全面描述论文主题内容,需对其进行增补。选择高频自标引关键词构成增补词典,利用基于增补词典的分词技术从标题中提取论文候选关键词,按一定规则进行增补。其次,针对共现频次较难准确描述词对相似度,引入领域本体来计算高频关键词对的语义相似度,综合考虑共现频次和语义相似度值得到词对的相关度值。用相关度来描述词对相似度,并作为构建共词矩阵的依据。最后通过实验证明改进方法的有效性。
引用
收藏
页码:60 / 67
页数:8
相关论文
共 19 条
[1]   战略坐标视角下的专利技术主题分析——以第三代移动通信技术为例 [J].
沈君 ;
王续琨 ;
陈悦 ;
高继平 ;
滕立 ;
梁俊伟 .
情报杂志, 2012, 31 (11) :88-94
[2]   科技论文关键词的战略图分析 [J].
韩红旗 ;
安小米 .
情报理论与实践, 2012, (09) :86-90
[3]   共词分析中作者关键词规范化研究——以图书馆个性化信息服务研究为例 [J].
邵作运 ;
李秀霞 .
情报科学 , 2012, (05) :731-735
[4]   国内外共词分析研究综述 [J].
李颖 ;
贾二鹏 ;
马力 .
新世纪图书馆, 2012, (01) :23-27
[5]   基于字序列标注的中文关键词抽取研究 [J].
王昊 ;
邓三鸿 ;
苏新宁 .
现代图书情报技术, 2011, (12) :39-45
[6]   基于字角色标注的中文书目关键词标引研究 [J].
邓三鸿 ;
王昊 ;
秦嘉杭 ;
苏新宁 .
中国图书馆学报, 2012, 38 (02) :38-49
[7]   基于语义的共词分析方法研究 [J].
李纲 ;
王忠义 .
情报杂志 , 2011, (12) :145-149
[8]   一种基于关键词加权的共词分析方法 [J].
李纲 ;
李轶 .
情报科学, 2011, 29 (03) :321-324+332
[9]   国内中文自动分词技术研究综述 [J].
奉国和 ;
郑伟 .
图书情报工作, 2011, 55 (02) :41-45
[10]   基于词汇同现模型的关键词自动提取方法研究 [J].
肖红 ;
许少华 .
沈阳理工大学学报, 2009, 28 (05) :38-41