共现分析中的关键词选择与语义度量方法研究

被引:27
作者
巴志超 [1 ,2 ]
李纲 [1 ]
朱世伟 [2 ]
机构
[1] 武汉大学信息资源研究中心
[2] 山东省科学院情报研究所
关键词
共词分析; 语义建模; 词向量模型; 深度学习;
D O I
暂无
中图分类号
G353.1 [情报资料的分析和研究];
学科分类号
1205 ;
摘要
针对共词分析方法中存在的共现词对"同量不同质"现象、词对关联计算缺乏语义性等问题,提出一种基于论文属性加权的关键词选择和基于词模型的语义相关性度量方法。该方法一方面将加权机制扩展至模型生成关键词的进程中,从论文结构及主题权值概率视角考察关键词对领域研究特色的表征能力;另一方面对抽取的关键词进行词向量的表示,将关键词转化成低维实值的分布进行语义关联度量。以"深度学习"研究为例,从聚类分析、网络基础参数及分布结构等多个方面对比一般共词分析方法与本文所提方法的效果差异,验证了该方法具有一定的科学性和有效性。
引用
收藏
页码:197 / 207
页数:11
相关论文
共 28 条
[1]   一种基于加权LDA模型和多粒度的文本特征选择方法 [J].
李湘东 ;
巴志超 ;
黄莉 .
现代图书情报技术 , 2015, (05) :42-49
[2]   细粒度语义共词分析方法研究 [J].
王玉林 ;
王忠义 .
图书情报工作, 2014, (21) :73-80
[3]   共词分析方法的细粒度化与语义化研究 [J].
王忠义 ;
谭旭 ;
夏立新 .
情报学报, 2014, (09) :969-978
[4]   领域知识分析中的关键词选择方法研究——一种以学科为背景的全局视角 [J].
陈果 ;
肖璐 ;
赵雪芹 .
情报学报, 2014, (09) :959-968
[5]   基于加权隐含狄利克雷分配模型的新闻话题挖掘方法 [J].
李湘东 ;
巴志超 ;
黄莉 .
计算机应用, 2014, 34 (05) :1354-1359
[6]   基于加权关键词共现时间元的个性化学术研究时序路径发现及其可视化呈现方法 [J].
李树青 ;
孙颖 .
情报学报, 2014, (01) :55-67
[7]   科技论文关键词特征及其对共词分析的影响 [J].
胡昌平 ;
陈果 .
情报学报, 2014, 33 (01) :23-32
[8]   融合关键词增补与领域本体的共词分析方法研究 [J].
唐晓波 ;
肖璐 .
现代图书情报技术, 2013, (11) :60-67
[9]   共词分析中的词语贡献度特征选择研究 [J].
胡昌平 ;
陈果 .
现代图书情报技术, 2013, (Z1) :89-93