基于改进的TF*IDF方法分析学科研究热点——以情报学为例

被引:11
作者
刘小慧
李长玲
冯志刚
机构
[1] 山东理工大学科技信息研究所
关键词
研究热点; TF*IDF; 全文分词; 情报学;
D O I
10.13833/j.cnki.is.2017.07.015
中图分类号
G353.1 [情报资料的分析和研究]; TP391.1 [文字信息处理];
学科分类号
1205 ; 081203 ; 0835 ;
摘要
【目的/意义】提出一种TF*IDF改进算法,用于全文分词后的语词权重计算,提取高权重语词,分析学科研究热点。【方法/过程】以万方数据库中2015年《情报学报》的载文为例,对每篇文章全文分词,用改进的TF*IDF方法计算语词权重。【结果/结论】发现该改进算法准确可行,且运用该方法分析得到,用户研究、大数据、情报学、社交网络、技术领域、文献作者、突发事件、零被引等,是2015年情报学的研究热点。
引用
收藏
页码:82 / 87
页数:6
相关论文
共 14 条
[11]   文本分类中特征权重算法的改进 [J].
沈志斌 ;
白清源 .
南京师范大学学报(工程技术版), 2008, (04) :95-98+149
[12]   基于硕士学位论文的我国图书馆学与情报学研究热点分析 [J].
李长玲 ;
翟雪梅 .
情报科学, 2008, (07) :1056-1060
[13]   《情报学报》被引分析与研究 [J].
张学福 ;
冷伏海 ;
王巍 .
情报学报, 1998, (05) :69+71-76
[14]  
图书馆、情报与文献学研究热点与趋势分析(2000~2004)——基于CSSCI的分析[J]. 苏新宁.情报学报. 2007 (03)