基于TFIDF的文本特征选择方法

被引:31
作者
柴玉梅
王宇
机构
[1] 郑州大学信息工程学院
关键词
文本分类; 特征选择; 术语频率; 逆文档频率;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
本文在分析比较几种用于文本分类的特征选择方法的基础上,提出了一种基于术语频率和逆文档频率的特征选择方法TDF。采用KNN和NaiveBayes两种分类算法对该方法进行了测试。实验结果表明,TDF方法较其他几种方法有较好的分类精度。
引用
收藏
页码:24 / 26
页数:3
相关论文
共 3 条
[1]   人脸识别系统中的特征提取 [J].
王聃 ;
贾云伟 ;
林福严 .
微计算机信息, 2005, (11) :53-55
[2]   中文文本分类中特征抽取方法的比较研究 [J].
代六玲 ;
黄河燕 ;
陈肇雄 .
中文信息学报, 2004, (01) :26-32
[3]   关于文本特征抽取新方法的研究 [J].
李凡 ;
鲁明羽 ;
陆玉昌 .
清华大学学报(自然科学版), 2001, (07) :98-101