基于粗糙集分类算法研究与实现

被引:5
作者
李勃 [1 ]
王艳兵 [2 ]
姚青 [2 ]
机构
[1] 鲁东大学计算机科学与技术学院
[2] 山东大学计算机科学与技术学院
关键词
数据挖掘; 分类; 决策树; 粗糙集; ID3; 熵;
D O I
暂无
中图分类号
TP18 [人工智能理论]; TP311.13 [];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ; 1201 ;
摘要
数据挖掘是人工智能中知识发现的重要组成部分,而分类又是一种主要的应用形式。ID3算法是数据挖掘中经典的决策树分类算法,ID3算法具有抗噪声能力差的缺点。通过对分类和粗糙集理论的研究,将可变精度粗糙集理论的思想应用在计算属性信息熵时设定阈值上,以放宽属性选择的要求,从而对经典的ID3算法作了相应的改进。改进后的ID3算法(称之为VPID3算法)可在一定程度上降低噪声对系统分类的干扰,提高了有数据有噪声情况下的分类精度。另外根据该算法设计并实现了一个分类器,并通过实验检验了该算法的性能。
引用
收藏
页码:142 / 144+157 +157
页数:4
相关论文
共 5 条
[1]   信息熵在粗糙集理论中的应用 [J].
梁吉业 ;
孟晓伟 .
山西大学学报(自然科学版), 2002, (03) :281-284
[2]   基于熵和变精度粗糙集的规则不确定性量度 [J].
陈湘晖 ;
朱善君 ;
吉吟东 .
清华大学学报(自然科学版), 2001, (03) :109-112
[3]  
Induction of decision trees.[J].J. R. Quinlan.Machine Learning.1986, 1
[4]  
数据挖掘.[M].(加)JiaweiHan;(加)MichelineKamber著;范明;孟小峰等译;.机械工业出版社.2001,
[5]  
Rough集理论与知识获取.[M].王国胤编著;.西安交通大学出版社.2001,