数据挖掘中决策树分类算法的研究与改进

被引:12
作者
但小容
陈轩恕
刘飞
柳德伟
机构
[1] 国网电力科学研究院
关键词
数据挖掘; 决策树; ID3算法; 改进; 加权简化信息熵;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
决策树分类算法是数据挖掘中一个重要的内容,而ID3算法又是决策树分类算法中的一种重要方法且被广泛应用。然而在实际应用过程中,现存的决策树算法也存在着很多不足之处,如计算效率低下、多值偏向等。为了解决这些问题,提出了一种基于ID3算法的加权简化信息熵算法,它提高了决策树的构建速度,减少了算法的计算运行时间,同时也克服了ID3算法往往偏向于选择取值较多的属性作为测试属性的缺陷。并且随着数据规模的增大,决策树的分类性能表现得越好。
引用
收藏
页码:41 / 43
页数:3
相关论文
共 4 条
[1]   决策树分类技术研究 [J].
栾丽华 ;
吉根林 .
计算机工程, 2004, (09) :94-96+105
[2]   决策树的优化算法 [J].
刘小虎 ;
李生 .
软件学报, 1998, (10) :78-81
[3]   一种新的决策树归纳学习算法 [J].
洪家荣,丁明峰,李星原,王丽薇 .
计算机学报, 1995, (06) :470-474
[4]  
数据挖掘原理与算法[M]. - 中国水利水电出版社 , 邵峰晶, 2003