基于样例选取的属性约简算法

被引:28
作者
王熙照
王婷婷
翟俊海
机构
[1] 河北省机器学习与计算智能重点实验室河北大学数学与计算机学院
关键词
信息系统; 样例选取; 粗糙集; 差别矩阵; 属性约简;
D O I
暂无
中图分类号
TP18 [人工智能理论];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ;
摘要
计算属性约简是粗糙集框架下归纳学习的关键部分.基于差别矩阵的属性约简算法是常用的属性约简算法之一.给定一个信息系统,利用该算法可以求出信息系统的所有属性约简.但是该算法需要的存储空间大,执行时间长,特别是对于大型数据库,差别矩阵的存储成为其应用的瓶颈.针对这一问题,提出了一种基于样例选取的属性约简算法,算法分为3步:首先从样例集中挑选出重要的样例;然后用选出的样例构造差别矩阵;最后计算信息系统的所有约简.实验结果显示,当处理大型数据库时,新算法能有效地减少存储空间和执行时间.
引用
收藏
页码:2305 / 2310
页数:6
相关论文
共 14 条
[1]   基于新的距离度量的K-Modes聚类算法 [J].
梁吉业 ;
白亮 ;
曹付元 .
计算机研究与发展, 2010, (10) :1749-1755
[2]   区间值信息系统的知识约简 [J].
张楠 ;
苗夺谦 ;
岳晓冬 .
计算机研究与发展, 2010, (08) :1362-1371
[3]   一种基于一致性准则的属性约简算法 [J].
杨明 .
计算机学报, 2010, 33 (02) :231-239
[4]   粗糙集理论与应用研究综述 [J].
王国胤 ;
姚一豫 ;
于洪 .
计算机学报, 2009, 32 (07) :1229-1246
[5]   一种隶属关系不确定的可能性模糊聚类方法 [J].
陈健美 ;
陆虎 ;
宋余庆 ;
宋顺林 ;
徐景 ;
谢从华 ;
倪巍伟 .
计算机研究与发展, 2008, (09) :1486-1492
[6]   一种基于改进差别矩阵的属性约简增量式更新算法 [J].
杨明 .
计算机学报, 2007, (05) :5815-5822
[7]   一种连续值属性约简方法ReCA [J].
商琳 ;
万琼 ;
姚望舒 ;
王金根 ;
陈世福 .
计算机研究与发展, 2005, (07) :1217-1224
[8]   Reduction Algorithms Based on Discernibility Matrix:The Ordered Attributes Method [J].
王珏 ;
王驹 .
Journal of Computer Science and Technology, 2001, (06) :489-504
[9]  
Top 10 algorithms in data mining[J] . Xindong Wu,Vipin Kumar,J. Ross Quinlan,Joydeep Ghosh,Qiang Yang,Hiroshi Motoda,Geoffrey J. McLachlan,Angus Ng,Bing Liu,Philip S. Yu,Zhi-Hua Zhou,Michael Steinbach,David J. Hand,Dan Steinberg.Knowledge and Information Systems . 2009 (1)
[10]  
Rough sets and Boolean reasoning[J] . Information Sciences . 2006 (1)