两阶段联合聚类协同过滤算法

被引:82
作者
吴湖 [1 ,2 ]
王永吉 [1 ,3 ]
王哲 [3 ,2 ]
王秀利 [4 ]
杜栓柱 [1 ]
机构
[1] 中国科学院软件研究所互联网软件技术实验室
[2] 中国科学院研究生院
[3] 中国科学院软件研究所计算机科学国家重点实验室
[4] 中央财经大学
关键词
协同过滤; 推荐系统; 联合聚类; 非负矩阵分解;
D O I
暂无
中图分类号
TP301.6 [算法理论];
学科分类号
081202 ;
摘要
提出一种两阶段评分预测方法.该方法基于一种新的联合聚类算法(BlockClust)和加权非负矩阵分解算法.首先对原始矩阵中的评分模式进行用户和物品两个维度的联合聚类,然后在这些类别的内部通过加权非负矩阵分解方法进行未知评分预测.这种方法的优势在于,首阶段聚类后的矩阵规模远远小于原始评分矩阵,并且同一类别内部的评分具有相似的模式,这样,在大幅度降低预测阶段计算量的同时又提高了非负矩阵分解算法在面对稀疏矩阵预测上的准确度.进一步给出了推荐系统的3种更新模式下如何高效更新预测模型的增量学习方法.在MovieLens数据集上比较了新算法及其他7种相关方法的性能,从而验证了该方法的有效性及其在大型实时推荐系统中的应用价值.
引用
收藏
页码:1042 / 1054
页数:13
相关论文
共 4 条
[1]   互联网推荐系统比较研究 [J].
许海玲 ;
吴潇 ;
李晓东 ;
阎保平 .
软件学报, 2009, 20 (02) :350-362
[2]   基于信息论的潜在概念获取与文本聚类 [J].
李晓光 ;
于戈 ;
王大玲 ;
鲍玉斌 .
软件学报, 2008, (09) :2276-2284
[3]   Latent semantic models for collaborative filtering [J].
Hofmann, T .
ACM TRANSACTIONS ON INFORMATION SYSTEMS, 2004, 22 (01) :89-115
[4]  
A Scalable Collaborative Filtering Framework Based onCo-clustering. George T,Merugu S. . 2005