运筹与管理 ›› 2020, Vol. 29 ›› Issue (4): 171-178.DOI: 10.12005/orms.2020.0104

• 理论分析与方法探讨 • 上一篇    下一篇

基于聚类矩阵近似的协同过滤推荐研究

张文1,3, 崔杨波2, 李健1, 陈进东4   

  1. 1.北京工业大学 经济管理学院,北京 100124;
    2.北京化工大学 经济管理学院,北京100029;
    3.西安文理学院 信息工程学院,陕西 西安 710065;
    4.北京信息科技大学 经济管理学院,北京 100101
  • 收稿日期:2018-08-20 出版日期:2020-04-25
  • 作者简介:张文(1981-),男,湖北人,教授,博士,研究方向:电子商务与推荐系统;崔杨波(1993-),女,河南人,硕士,研究方向:电子商务;李健(1976-),男,山东人,教授,博士,研究方向:智慧供应链;陈进东(1983-),男,重庆人,副教授,博士,研究方向:数据挖掘。
  • 基金资助:
    国家自然科学基金资助项目(71932002,61379046,71601023,61432001);西安市科技计划创新基金项目(2016CXWL21)

F-cluMA: a Collaborative Filtering Model Based on Clustered Matrix Approximation

ZHANG Wen1,3, CUI Yang-bo2, LI Jian1, CHEN Jin-dong4   

  1. 1. School of Economics and Management, Beijing University of Technology, Beijing 100124, China;
    2. School of Economics and Management, Beijing University of Chemical Technology, Beijing 100029, China;
    3. School of Information Engineering, Xi'an University, Xi'an 710065, China;
    4. School of Economics and Management, Beijing Information Science and Technology University, Beijing 100101, China
  • Received:2018-08-20 Online:2020-04-25

摘要: 由于推荐系统中存在巨量的用户和商品,现有的协同过滤方法很难处理用户-商品推荐中的数据稀疏性和计算可扩展性问题。本文提出了一种基于聚类矩阵近似的协同过滤推荐方法CF-cluMA。一方面,CF-cluMA方法通过对用户和商品进行分别聚类,并利用聚类后的用户-商品分块评分矩阵来刻画用户对于商品兴趣的局部性特点,以降低用户-商品评分矩阵的全局稀疏性。另一方面,CF-cluMA方法通过对局部稠密分块矩阵实施奇异值分解,并利用施密特变换近似全局用户-商品评分矩阵来预测用户对未知商品评分,以降低协同过滤算法的复杂性。在EachMovie电影评分真实数据集上的实验表明,相比于已有的基于矩阵近似的协同过滤推荐方法,本文所提出的CF-cluMA方法能够有效提升推荐系统的准确性并降低推荐系统的计算复杂性。本文的研究对于电子商务推荐系统具有重要的管理启示。

关键词: 谱聚类, 矩阵近似, 协同过滤, 数据稀疏性, 可扩展性

Abstract: It is extremely hard for the existing collaborative filtering algorithms to handle the problems of data sparsity and computation scalability in a recommendation system. This paper proposes a novel approach called CF-cluMA (Collaborative Filtering based on clustered Matrix Approximation) for collaborative filtering with the goal to tackle the problems. The CF-cluMA approach comprises two components. The first component is to partition the global user-item rating matrix into local dense block matrices by co-clustering its rows (users) and columns (items). The second one is to approximate the global user-item rating matrix by singular value decomposition (SVD) on the local dense blocks with Schimidt orthogonalization. The experiments on the EachMovie dataset demonstrate that the proposed CF-cluMA approach outperforms state-of-the-art collaborative filtering methods in terms of recommendation accuracy and computation complexity. This research has great managerial implications for recommendation systems in E-commerce.

Key words: spectral clustering, matrix approximation, collaborative filtering, data sparsity, computation scalability

中图分类号: