运筹与管理 ›› 2021, Vol. 30 ›› Issue (11): 99-105.DOI: 10.12005/orms.2021.0356

• 理论分析与方法探讨 • 上一篇    下一篇

基于时序矩阵分解的缺失销售数据估计

陈斯敏1, 杨磊1, 陈文娜2, 黄晓宇1   

  1. 1.华南理工大学 电子商务系,广东 广州 510006;
    2.华南理工大学 经济与金融学院,广东 广州 510006
  • 收稿日期:2020-05-14 出版日期:2021-11-25
  • 通讯作者: 黄晓宇(1977-),男,广东人,副教授,博士,主要研究方向为机器学习、统计与优化理论及应用。
  • 作者简介:陈斯敏(1996-),女,广东人,硕士研究生,主要研究方向为数据驱动的供应链运作优化;杨磊(1979-),男,山东人,教授,博士,主要研究方向为供应链管理;陈文娜(1983-),女,广东汕头人,硕士研究生,主要研究方向为金融工程,运作优化。
  • 基金资助:
    华南理工大学中央高校基本科研业务费项目(XYMS202107);国家社科基金后期资助项目(20FGLB034);广州市人文社会科学重点研究基地成果(PZL2021KF0027);广东省自然科学基金项目(2019A1515010792、2020A1515010830);广东省哲学社科基金项目(GD17XYJ25)

Estimating the Missing Sales Data with the Time Series Matrix Factorization Model

CHEN Si-min1, YANG Lei1, CHEN Wen-na2, HUANG Xiao-yu1   

  1. 1. Department of Electronic Business, South China University of Technology, Guangzhou 510006, China;
    2. School of Economics and Finance, South China University of Technology, Guangzhou 510006, China
  • Received:2020-05-14 Online:2021-11-25

摘要: 企业的历史销售记录是供应链优化研究的基础数据来源,然而,在日常的研究中,几乎所有可以通过公开途径获得的销售记录都是高度不完整的,这为研究者开展工作带来了极大的不便。为解决此问题,本文提出,以销售数据集中已有的数据为基础,使用面向时序数据的矩阵分解模型MAFTIS对其缺失的部分进行估算,从而把残缺的数据集补全完整。进一步地,为提高MAFTIS的计算效率,本文还为该模型设计了一种基于交替最小二乘法的求解策略MAFTISALS。在评估实验中,MAFTISALS被用于三个真实销售数据集的缺失记录估计,结果显示,与其它估计模型相比,MAFTISALS能获得更准确的估计结果,并且具有更高的收敛速度。

关键词: 销售数据, 缺失值估计, 矩阵分解

Abstract: The historical sales data are one of the most important data sources for supply chain optimization (SCO) research. However, for most SCO researchers, the publicly accessible sales data is usually highly incomplete, which makes their work difficult. In order to solve this problem, we propose to use MAFTIS, atime series matrix factorization model, to estimate the missing sales data with respective to the collected ones.In addition, to speed up the computation procedure of MAFTIS, we also present an alternating least square (ALS) based solution algorithm for the model.For evaluations, we apply the proposed method to estimate the missing entries of three real sales data sets, and all results show that, compared with competitive algorithms, our proposed model achieve the best performance in terms of prediction accuracy and convergence speed.

Key words: sales data, missing value estimation, matrix factorization

中图分类号: