基于潜在语义索引的文本特征词权重计算方法

被引:16
作者
李媛媛
马永强
机构
[1] 西南交通大学信息科学与技术学院
关键词
潜在语义索引; Sigmiod函数; 位置因子; 权重算法;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
潜在语义索引具有可计算性强,需要人参与少等优点。对其中重要的优化过程——权重计算,进行了深入分析。针对目前应用最广泛的TF-IDF方法中,采用线性处理的不合理性以及难以突出对文本内容起关键性作用的特征的缺点,提出了一种基于"Sigmiod函数"和"位置因子"的新权重方案。突出了文本中不同特征词的重要程度,更有利于潜在语义空间的构造。通过实验平台"中文潜在语义索引分析系统"的测试结果表明,该权重方法更利于基于潜在语义的检索性能的提高。
引用
收藏
页码:1460 / 1462+1466 +1466
页数:4
相关论文
共 4 条
[1]  
信息检索进展.[M].焦玉英主编;.科学出版社.2003,
[2]   隐含语义检索系统词条权重的处理 [J].
苏亮 ;
聂峰光 ;
郭力 ;
李晓霞 ;
梁春燕 .
计算机与应用化学, 2005, (11) :972-976
[3]   一种用于主题提取的非线性加权方法 [J].
韩客松 ;
王永成 .
情报学报, 2000, (06) :650-653
[4]   中文文本的关键词自动抽取和模糊分类 [J].
何新贵 ;
彭甫阳 .
中文信息学报, 1999, (01) :10-16