TFIDF算法研究综述

被引:206
作者
施聪莺
徐朝军
杨晓江
机构
[1] 南京师范大学教育技术系
关键词
TFIDF; 文本分类; VSM;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
文本分类中特征项权重的赋予对于分类效果有较大的影响,TFIDF算法是权重计算的重要算法之一。在回顾TFIDF算法发展历史的基础上,考察了其固有缺陷,总结诸多学者对其的改进方法,并对TFIDF算法新的应用领域进行了概括,并通过实验验证相关改进算法,为读者更好地应用TFIDF算法提供参考。
引用
收藏
页码:167 / 170+180 +180
页数:5
相关论文
共 13 条
[1]   一种基于TFIDF方法的中文关键词抽取算法 [J].
徐文海 ;
温有奎 .
情报理论与实践, 2008, (02) :298-302
[2]   文本分类中词语权重计算方法的改进与应用 [J].
熊忠阳 ;
黎刚 ;
陈小莉 ;
陈伟 .
计算机工程与应用, 2008, (05) :187-189
[3]   基于TFIDF的特征选择方法 [J].
王美方 ;
刘培玉 ;
朱振方 .
计算机工程与设计, 2007, (23) :5795-5796+5799
[4]   基于信息熵的改进TFIDF特征选择算法 [J].
周炎涛 ;
唐剑波 ;
王家琴 .
计算机工程与应用, 2007, (35) :156-158+171
[5]   Web文档中词语权重计算方法的改进 [J].
初建崇 ;
刘培玉 ;
王卫玲 .
计算机工程与应用, 2007, (19) :192-194+198
[6]   基于文本分类TFIDF方法的改进与应用 [J].
张玉芳 ;
彭时名 ;
吕佳 .
计算机工程, 2006, (19) :76-78
[7]   基于TFIDF的文本特征选择方法 [J].
柴玉梅 ;
王宇 .
微计算机信息, 2006, (24) :24-26
[8]   一种基于TFIDF的网络聊天关键词提取算法 [J].
许晓昕 ;
李安贵 .
计算机技术与发展, 2006, (03) :122-123+222
[9]   文本自动分类的测评研究进展 [J].
谭金波 ;
李艺 ;
杨晓江 .
现代图书情报技术, 2005, (05) :46-49+14
[10]   根据用户隐式反馈建立和更新用户兴趣模型 [J].
孙铁利 ;
杨凤芹 .
东北师大学报(自然科学版), 2003, (03) :99-104