学习特征权值对K-均值聚类算法的优化

被引:52
作者
王熙照
王亚东
湛燕
袁方
机构
[1] 河北大学数学与计算机科学学院机器学习研究中心,哈尔滨工业大学计算机科学与工程学院,河北大学数学与计算机科学学院机器学习研究中心,河北大学数学与计算机科学学院机器学习研究中心保定,哈尔滨,保定,保定
关键词
K-均值聚类; 相似度量; 特征权值; 梯度下降技术;
D O I
暂无
中图分类号
TP311.12 [];
学科分类号
081202 ; 0835 ;
摘要
K 均值 (K means)算法聚类的结果依赖于距离度量的选取 传统的K 均值算法选择的相似性度量通常是欧几里德距离的倒数 ,这种距离通常涉及所有的特征 在距离公式中引入一些特征权参数后 ,其聚类结果将依赖于这些权值 ,从而可以通过调整这些权值优化聚类效果 由于K 均值算法是迭代算法 ,很难直接确定其权值以优化聚类结果 ,因此提出了一种间接的学习权值算法以改进聚类结果 从数学意义上讲 ,这种权值学习相当于欧氏空间中对一组点进行了一个线性变换 数值实验证实了算法的有效性
引用
收藏
页码:869 / 873
页数:5
相关论文
共 1 条
[1]  
运筹学基础.[M].何坚勇编著;.清华大学出版社.2000,