文本自动分类的测评研究进展

被引:11
作者
谭金波
李艺
杨晓江
机构
[1] 南京师范大学教育技术系
[2] 南京师范大学教育技术系 南京
[3] 南京
关键词
自动分类; 测评; 特征选择;
D O I
暂无
中图分类号
G254.1 [分类法];
学科分类号
1205 ; 120501 ;
摘要
分类是文本挖掘的基础和核心,是近年来数据挖掘和网络挖掘的一个研究热点。本文从定性和定量两个方面,介绍国内外文本分类研究现状,分析影响文本分类的重要因素,希望通过对文本分类系统和算法的评测总结发现研究中存在的共同问题,为文本自动分类的优化、改进提供理论和事实依据。
引用
收藏
页码:46 / 49+14 +14
页数:5
相关论文
共 8 条
[1]   基于VSM的中文文本分类系统的设计与实现 [J].
张东礼 ;
汪东升 ;
郑纬民 .
清华大学学报(自然科学版), 2003, (09) :1288-1291
[2]   用于文本挖掘的特征选择方法TFIDF及其改进 [J].
景丽萍 ;
黄厚宽 ;
石洪波 .
广西师范大学学报(自然科学版), 2003, (01) :142-145
[3]   向量空间法中单词权重函数的分析和构造 [J].
陆玉昌 ;
鲁明羽 ;
李凡 ;
周立柱 .
计算机研究与发展, 2002, (10) :1205-1210
[4]   SVM-KNN分类器——一种提高SVM分类精度的新方法 [J].
李蓉 ;
叶世伟 ;
史忠植 .
电子学报, 2002, (05) :745-748
[5]   基于向量空间模型的文本自动分类系统的研究与实现 [J].
庞剑锋 ;
卜东波 ;
白硕 .
计算机应用研究, 2001, (09) :23-26
[6]   独立于语种的文本分类方法 [J].
黄萱菁 ;
吴立德 ;
石崎洋之 ;
徐国伟 .
中文信息学报, 2000, (06) :1-7
[7]   文档中词语权重计算方法的改进 [J].
鲁松 ;
李晓黎 ;
白硕 ;
王实 .
中文信息学报, 2000, (06) :8-13+20
[8]  
基于统计的文本分类技术研究[D]. 程军.中国科学院研究生院(文献情报中心) 2003