CN115115416B

CN115115416B - 一种商品销量预测方法

Info

Publication number: CN115115416B
Application number: CN202210862555.1A
Authority: CN
Inventors: 尹键溶; 秦拯; 张吉昕
Original assignee: Hunan University
Current assignee: Hunan University
Priority date: 2022-07-21
Filing date: 2022-07-21
Publication date: 2024-07-02
Anticipated expiration: 2042-07-21
Also published as: CN115115416A

Abstract

本发明涉及一种商品销量预测方法。其发明内容主要包括：(1)基于多商品销量特征的滚动回归模型与深度学习模型的构建；(2)多种回归预测模型集成的销量精准预测方法。通过已被提出的商品历史销量和其它影响因素等特征，构建出滚动预测的回归模型，深度学习模型以及剔除异常值的深度学习模型。再将构建的多种模型进行回归集成，构建出最后的多模型集成回归预测学习器，从而对商品未来销量进行精准预测。

Description

一种商品销量预测方法

技术领域

本发明涉及深度学习和大数据技术，是处理工业环境给出的历史数据后使用集成学习模型对未来销量进行预测的方法。

背景技术

企业进行销量预测对于企业供应链管理有着十分重要的作用，目前业界主要采取人工业务规则的方式进行销量预测，随着近年来机器学习技术的高速发展，一些研究人员将机器学习用于商品销量预测，例如使用多元线性回归模型，岭回归模型，以及深度学习中的长短期记忆网络模型进行单一的销量预测等。

目前基于机器学习的销量预测方法广泛采用的是使用单一的深度学习模型对销量进行预测，而商品的销量中容易出现异常销量数据，使用不同的单一模型会使其对异常数据过于敏感或过于不敏感，单一的模型往往又难以处理一个商品从历史到未来的所有特征，所以利用它们进行销量预测出的结果往往精度不高。

集成学习作为随着深度学习而新兴的概念，并非一个单独的机器学习算法，而是通过构建多个机器学习模型，并将其结合成一个最终的强学习模型，完成最终的任务。能够在保证模型准确度的同时提升了模型防止过拟合的能力。

本发明提取商品的销量统计特征，促销优惠特征，假期周末特征等，结合多种机器学习方法，用其创建了了数个适用于时序预测的深度学习模型，并且将其均视为弱学习器。综合它们运算出来的结果，利用深度学习模型不断迭代，能够在不断迭代中不断更新样本权重的特殊机制，提出了加权分类的方法来集成各个模型的结果，从而出预测商品的未来销量。

本发明针对单一模型无法精确针对商品进行高精度的销量预测的问题，提出了一种基于集成学习模型商品销量预测方法，该方法能够在减少异常数据对于结果的干扰的同时大幅度提升对于商品未来销量预测的准确性。

发明内容

本发明提供一种商品销量预测方法，旨在解决单一模型无法精准覆盖不同类型商品销量特性，难以适应普遍存在的异常数据以及模型对商品预测销量准确度不高的问题。

根据本发明的第一方面，提供一种商品销量预测方法，其特征在于：

商品销量预测模型包括：第一基础预测模型，第二基础预测模型，第三基础预测模型，集成预测模型。本方法包括：

步骤10：根据商品销售的历史数据，构建训练数据集。

其中，训练数据集中包含多种商品的数据，对于任一种商品，对应一数据集D＝{(X₀，y₀)，…，(X_n，y_n)}，i＝0，1，…，n，y_i为第i日的销量，X_i＝(x_i-s，x_i-s+1，…，x_i-1)为第i日以前s日的销售特征数据集合，k＝i-s，i-s+1，…，i-1，x_k为第k日的销售特征数据，销售特征数据包括销量统计特征，促销优惠特征，假期周末特征。

步骤20：根据训练数据集构建第一基础预测模型。

其中，第一基础预测模型为滚动预测的线性回归模型步骤20包括：先赋给w，b初始值，用链式方法求出梯度且然后沿着梯度的反方向不断更新参数，其中w的更新公式为 b的更新公式为使损失函数不断减小至收敛。损失函数使用均方误差，即

步骤30：根据训练数据集构建第二基础预测模型。

其中，第二基础预测模型为LSTM长短时记忆神经网络预测模型，第二基础预测模型由输入层、包含128个神经元的两个隐藏层和输出层组成；步骤30包括：首先判断在所述第二基础预测模型中的细胞是否需要丢弃信息，在其隐藏层中对于输入的X_i，LSTM将会根据，f_i＝σ(W_f·[h_i-1，X_i]+b_f)，得到一个在0到1之间的数值给每个细胞状态中的值f_i，结果为1表示完全保留，0表示完全舍弃，其中W_f是遗忘门的权重矩阵，b_f是遗忘门的偏置项，h_i-1为第i日上一日LSTM的输出值，再使用tanh层创建一个新的候选值向量C_i＝tanh(W_c·[h_i-1，X_i]+b_c)，对f_i进行更新，其中W_c是tanh层的权重矩阵，b_c是tanh层的偏置项，最后通过sigmoid层得到o_i＝σ(W_o·[h_i-1，X_i]+b_o)，其中W_o是输出门的权重矩阵，b_o是输出门的偏置项，把细胞状态经过tanh层行处理后的值和所述sigmoid层的输出相乘得到h_i＝o_i·tanh(c_i)。

步骤40：根据训练数据集构建第三基础预测模型。

其中，第三基础预测模型为基于线性回归剔除异常的LSTM长短时记忆神经网络回归模型；步骤40包括：对每一个商品，根据第一基础预测模型进行预测得到商品的每日销量预测值y_predict＝{y_predict0，y_predict1，…，y_predictn}，根据商品的每日销量实际值y_real＝{y_real0，yr_eal1，…，yr_ealn}可以得到商品第i天的实际值和预测值的误差abs_i＝y_reali-y_predicti，再根据商品的平均销量AVE＝SUM/n，对商品的历史数据进行判断，若第i天的abs_i＞AVE，那么判断该商品在当日的销量数据出现了较大的误差，将其从训练数据集中剔除得到经过剔除异常的训练数据集，根据经过剔除异常的训练数据集构建LSTM长短时记忆神经网络预测模型得到第三基础预测模型。

步骤50：根据第一基础预测模型、第二基础预测模型、第三基础预测模型构建集成预测模型，包括以下步骤：

步骤51：对于每一种商品，根据待预测日期之前的历史数据得到待预测日期之前的每日商品销量预测值Y_predict＝{Y_LR，Y_LSTM，Y_{LSTM_LR}}，其中，Y_LR为第一基础预测模型的结果，Y_LSTM为第二基础预测模型的结果，Y_{LSTM_LR}为第三预测模型的结果。

步骤52：根据待预测日期之前的每日商品销量真实值y_real，计算出一段时间内的预测平均误差，选取平均误差最小的模型为商品历史最优模型M_best，其中M_best的取值为第一基础预测模型、第二基础预测模型、第三基础预测模型对应的标签值。

步骤53：将Y_predict作为输入特征，将对应的M_best作为输出特征，进行集成预测模型的子分类器模型训练，得到集成预测模型用以确定三种基础预测模型的权重。

步骤60：根据第一基础预测模型、第二基础预测模型、第三基础预测模型得到待预测日期的任一商品销量基础预测值，再根据集成预测模型确定的基础预测模型的权重，确定该商品的销量预测值。

进一步地，本发明所提供的商品销量预测方法，其特征在于，销量统计特征包括：过去预设数日的总销量，过去预设数周的总销量，该日是否为会员日，优惠券使用数量，是否为节假日，是否为周末；

进一步地，本发明所提供的商品销量预测方法，其特征在于，步骤53包括：

步骤a：对样本Y_predict中三个模型赋以样本基本权重D_k，其中k为训练步骤a-e执行的轮次，第一轮训练时，三个模型权重相等且总和为1；

步骤b：使用第k个基弱线性分类器训练数据，得到第k个基弱线性分类器的错误率；

步骤c：根据第k个基弱线性分类器的错误率，计算第k个基弱线性分类器的加权误差率其中I表示括号内条件成立时为1，否则为0，其中，G_k(Y_{predict_i})是基弱线性分类器的预测结果，W_ki为第k轮第i个样本Y_{predict_i}的权重，m为样本总数；

步骤d：根据分类器的加权误差率，求出该轮基弱线性分类器的权重

步骤e：对下一轮样本基本权重进行设置，D_k+1＝{W_k+1，1，W_k+1，2...Wk_+1，m}，其中，W_k+1，i为第k+1轮里第i个样本的权重，规范化因子

步骤f：重复步骤a-e训练，直到训练完成所有K个分类器，构建线性组合对于待预测日期即第m+1日，先通过所述第一基础预测模型、所述第二基础预测模型、所述第三基础预测模型得到Y_{predict_m+1}，在根据所述线性组合得出的商品预测数为f(Y_{predict_m+1})。

根据本发明的第二方面，提供一种计算机设备，其特征在于，包括：

存储器，用于存储指令；以及

处理器，用于调用存储器存储的指令执行如权利要求1-3中任一项的商品销量预测方法。

根据本发明的第三方面，提供一种计算机可读存储介质，其特征在于，存储有指令，指令被处理器执行时，执行如权利要求1-3的商品销量预测方法。

与现有技术相比，本发明所构思的上述技术方案至少具有以下有益效果：

1、将商品销量的单一维度通过统计分析进行了扩展，构建出多维特征池，并通过计算和其他商品销量的关联度选取了一些关联度最高的特征。

2、考虑到商品普遍存在的异常波动性，构建出检验商品异常值的方法，提高了销量预测在商品中的普遍性，进一步降低了商品预测误差。

3、针对不同商品存在的不同特性，使用集成学习确定了各自合适的模型权重，更贴近真实数据效果。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本发明。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本发明的实施例，并与说明书一起用于解释本发明的原理。

图1是根据一示例性实施例示出的商品销量预测方法示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。此外，下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。

这里将详细地对示例性实施例进行说明，其示例表示在附图中。

本发明所涉及的商品销量预测方法，商品销量预测模型包括：第一基础预测模型，第二基础预测模型，第三基础预测模型，集成预测模型。如图1所示，本方法包括：

步骤10：根据商品销售的历史数据，构建训练数据集。

步骤20：根据训练数据集构建第一基础预测模型。

其中，第一基础预测模型为滚动预测的线性回归模型步骤20包括：先赋给w，b初始值，用链式方法求出梯度目. 然后沿着梯度的反方向不断更新参数，其中w的更新公式为 b的更新公式为使损失函数不断减小至收敛。损失函数使用均方误差，即

步骤30：根据训练数据集构建第二基础预测模型。

步骤40：根据训练数据集构建第三基础预测模型。

其中，第三基础预测模型为基于线性回归剔除异常的LSTM长短时记忆神经网络回归模型；步骤40包括：对每一个商品，根据第一基础预测模型进行预测得到商品的每日销量预测值y_predict＝{y_predict0，y_predict1，…，y_predictn}，根据商品的每日销量实际值yr_eal＝{yr_eal0，yr_eal1，…，yr_ealn}可以得到商品第i天的实际值和预测值的误差abs_i＝y_reali-y_predicti，再根据商品的平均销量AVE＝SUM/n，对商品的历史数据进行判断，若第i天的abs_i＞AVE，那么判断该商品在当日的销量数据出现了较大的误差，将其从训练数据集中剔除得到经过剔除异常的训练数据集，根据经过剔除异常的训练数据集构建LSTM长短时记忆神经网络预测模型得到第三基础预测模型。

在一些实施例中，销量统计特征包括：过去预设数日的总销量，过去预设数周的总销量，该日是否为会员日，优惠券使用数量，是否为节假日，是否为周末。

在一些实施例中，步骤53包括：

步骤e：对下一轮样本基本权重进行设置，D_k+1＝{W_k+1，1，W_k+1，2...W_k+1，m}，其中，W_k+1，i为第k+1轮里第i个样本的权重，规范化因子

步骤f：重复步骤a-e训练，直到训练完成所有K个分类器，构建线性组合对于待预测日期即第m+1日，先通过所述第一基础预测模型、所述第二基础预测模型、所述第三基础预测模型得到Yp_{redict_m+1}，在根据所述线性组合得出的商品预测数为f(Y_{predict_m+1})。

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本发明的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本发明未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本发明的真正范围和精神由下面的权利要求指出。

应当理解的是，本发明并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。

Claims

1.一种商品销量预测方法，其特征在于：

商品销量预测模型包括：第一基础预测模型，第二基础预测模型，第三基础预测模型，集成预测模型，所述方法包括：

步骤10：根据商品销售的历史数据，构建训练数据集；

其中，所述训练数据集中包含多种商品的数据，对于任一种商品，对应一数据集D＝{(X₀，y₀)，…，(X_n，y_n)}，i＝0，1，…，n，y_i为第i日的销量，X_i＝(x_i-s，x_i-s+1，…，x_i-1)为第i日以前s日的销售特征数据集合，k＝i-s，i-s+1，…，i-1，x_k为第k日的销售特征数据，所述销售特征数据包括销量统计特征，促销优惠特征，假期周末特征；

步骤20：根据所述训练数据集构建所述第一基础预测模型；

其中，所述第一基础预测模型为滚动预测的线性回归模型所述步骤20包括：先赋给w，b初始值，用链式方法求出梯度且然后沿着梯度的反方向不断更新参数，其中w的更新公式为b的更新公式为使损失函数不断减小至收敛，损失函数使用均方误差，即

步骤30：根据所述训练数据集构建所述第二基础预测模型；

其中，所述第二基础预测模型为LSTM长短时记忆神经网络预测模型，所述第二基础预测模型由输入层、包含128个神经元的两个隐藏层和输出层组成；所述步骤30包括：首先判断在所述第二基础预测模型中的细胞是否需要丢弃信息，在其隐藏层中对于输入的X_i，LSTM将会根据，f_i＝σ(W_f·[h_i-1，X_i]+b_f)，得到一个在0到1之间的数值给每个细胞状态中的值f_i，结果为1表示完全保留，0表示完全舍弃，其中W_f是遗忘门的权重矩阵，b_f是遗忘门的偏置项，h_i-1为第i日上一日LSTM模型的输出值，再使用tanh层创建一个新的候选值向量C_i＝tanh(W_c·[h_i-1，X_i]+b_c)，对f_i进行更新，其中W_c是tanh层的权重矩阵，b_c是tanh层的偏置项，最后通过sigmoid层得到o_i＝σ(W_o·[h_i-1，X_i]+b_o)，其中W_o是输出门的权重矩阵，b_o是输出门的偏置项，把细胞状态经过tanh层行处理后的值和所述sigmoid层的输出相乘得到第i日LSTM模型的输出h_i＝o_i·tanh(c_i)；

步骤40：根据所述训练数据集构建所述第三基础预测模型；

其中，所述第三基础预测模型为基于线性回归剔除异常的LSTM长短时记忆神经网络回归模型；所述步骤40包括：对每一个商品，根据所述第一基础预测模型进行预测得到商品的每日销量预测值y_predict＝{y_predict0，y_predict1，…，y_predictn}，根据商品的每日销量实际值y_real＝{y_real0，y_real1，…，y_realn}可以得到商品第i天的实际值和预测值的误差abs_i＝y_reali-y_predicti，再根据商品的平均销量AVE＝SUM/n，对商品的历史数据进行判断，若第i天的abs_i＞AVE，那么判断该商品在当日的销量数据出现了较大的误差，将其从所述训练数据集中剔除得到经过剔除异常的训练数据集，根据所述经过剔除异常的训练数据集构建LSTM长短时记忆神经网络预测模型得到所述第三基础预测模型；

步骤50：根据所述第一基础预测模型、所述第二基础预测模型、所述第三基础预测模型构建集成预测模型，包括以下步骤：

步骤51：对于每一种商品，根据待预测日期之前的历史数据得到待预测日期之前的每日商品销量预测值Y_predict＝{Y_LR，Y_LSTM，Y_{LSTM_LR}}，其中，Y_LR为所述第一基础预测模型的结果，Y_LSTM为所述第二基础预测模型的结果，Y_{LSTM_LR}为所述第三基础预测模型的结果；

步骤52：根据待预测日期之前的每日商品销量真实值y_real，计算出一段时间内的预测平均误差，选取平均误差最小的模型为商品历史最优模型M_best，其中M_best的取值为所述第一基础预测模型、所述第二基础预测模型、所述第三基础预测模型对应的标签值；

步骤53：将Y_predict作为输入特征，将对应的M_best作为输出特征，进行所述集成预测模型的子分类器模型训练，得到所述集成预测模型用以确定三种基础预测模型的权重；

步骤60：根据所述第一基础预测模型、所述第二基础预测模型、所述第三基础预测模型得到待预测日期的任一商品销量基础预测值，再根据集成预测模型确定的基础预测模型的权重，确定该商品的销量预测值。

2.根据权利要求1所述的商品销量预测方法，其特征在于，所述销量统计特征包括：过去预设数日的总销量，过去预设数周的总销量，该日是否为会员日，优惠券使用数量，是否为节假日，是否为周末。

3.根据权利要求1所述的商品销量预测方法，其特征在于，所述步骤53包括：

步骤a：对样本Y_predict中三个模型赋以样本基本权重D_k，其中k为训练步骤a-e执行的轮次，第一轮训练时，三个模型样本基本权重相等且总和为1；

步骤e：对下一轮样本基本权重进行设置，D_k+1＝{W_k+1，1，W_k+1，2...W_k+1，m}，其中，W_k+1，i为第k+1轮里第i个样本的权重，i＝1，2，…，m，规范化因子

4.一种计算机设备，其特征在于，包括：

存储器，用于存储指令；以及

处理器，用于调用所述存储器存储的指令执行如权利要求1-3中任一项所述的商品销量预测方法。

5.一种计算机可读存储介质，其特征在于，存储有指令，所述指令被处理器执行时，执行如权利要求1-3所述的商品销量预测方法。