CN116245563B

CN116245563B - 基于AdaBoost算法构建的商品销量融合预测模型

Info

Publication number: CN116245563B
Application number: CN202310526079.0A
Authority: CN
Inventors: 徐小峰; 曹贵玲; 陈梦; 邓忆瑞; 尹萌娟; 陈优
Original assignee: China University of Petroleum East China
Current assignee: China University of Petroleum East China
Priority date: 2023-05-11
Filing date: 2023-05-11
Publication date: 2023-10-27
Anticipated expiration: 2043-05-11
Also published as: CN116245563A

Abstract

本发明涉及商品销售预测技术领域，具体的提供了一种基于AdaBoost算法构建的商品销量融合预测模型，包括以下步骤：1：基于多种预测模型构建基模型库；2：单一预测模型调参；3：构建弱学习器自动选择算法，完成弱学习器自动选择过程；4：识别弱学习器自动选择算法的输出结果作为初始弱学习器，进行融合训练，得到强学习器及强学习器预测结果；5：计算强学习器预测结果的平均绝对百分比误差，将强学习器的预测结果进行融合，得到最后的预测结果。通过汇总神经网络及机器学习中适用于预测商品销售的经典模型，将预测商品销量的经典模型汇集到基模型库，使用基模型库中经典的商品销量预测模型分别完成对每家门店产品的销量预测工作。

Description

基于AdaBoost算法构建的商品销量融合预测模型

技术领域

本发明涉及商品销售预测技术领域，具体的提供了一种基于AdaBoost算法构建的商品销量融合预测模型。

背景技术

在众多组合模型中，以Stacking和AdaBoost等为代表的集成学习算法凭借其强大的预测性能，获得了众多学者的青睐。Kalagotla等人融合了MLP、SVM(支持向量机)和LR(逻辑回归)三种模型，建立了用于预测糖尿病的Stacking融合模型。杨荣新等人基于Stacking集成算法提出了一种预测光伏发电功率的组合模型，通过对光伏电站的历史数据进行递归特征消除和特征选择后，以RF、XGBoost、LGBM三种模型作为Stacking融合模型的初级学习器，线性回归作为次级学习器，建立了预测光伏发电功率的Stacking融合模型。实验结果表明，该模型相较于单模型，预测准确度明显提升。邓威等人提出了一种基于特征选择和Stacking集成算法的用于预测配电网损的预测方法，通过相关性分析法和最大信息系数法进行特征重要性分析，然后集成RF、KNN、MLP、SVM、GBDT(梯度下降树)五种模型，构建了融合模型对配电网网损进行预测。Ganiyu和Dong将AdaBoost算法与GRU进行结，并通过预测原油价格，对比了该模型与现有AdaBoost-LSTM模型的预测性能，结果表明AdaBoost-GRU模型优于AdaBoost-LSTM集成模型。Xiao等人将LSTM和AdaBoost模型进行结合，用以预测短中期的海面温度，其预测性能明显优于LSTM和AdaBoost模型。

在模型融合预测中，目前在产品销量预测领域进行融合模型预测的研究相对较少，大部分的模型融合或组合预测还是应用在交通流或者电网稳定性预测领域。而研究表明，通常情况下，融合模型相较于单一预测模型往往具有更好的预测性能，某些种类的产品易腐、货架期短的特点使其对于销量预测的准确性具有极高的要求，因此建立产品销量融合预测模型是极为必要的，而如何在保持原有模型预测性能的基础上，实现好而更好是相关问题的难点。

发明内容

针对现有技术中存在的问题，本发明的目的是为了提供一种解决产品销量预测问题的模型，能够针对部分产品易腐、货架期短的特点进行设置，防止产品配置过多造成剩余，或者配置过少导致供应量不足。

为实现上述目的，本发明采取的技术方案是：基于AdaBoost算法构建的商品销量融合预测模型，包括以下步骤：

步骤1：汇总神经网络及机器学习中适用于预测商品销售的经典模型，基于多种预测模型构建基模型库；

步骤2：单一预测模型调参，选用随机搜索法完成单一预测模型的超参数调整优化工作；

步骤3：构建弱学习器自动选择算法，采用均方误差作为衡量预测模型准确度性能的指标，把预测最准确的模型和预测第二准确的模型筛选出来，用以后续融合预测模型构建的初始输入弱学习器模型，完成弱学习器自动选择过程；

步骤4：识别弱学习器自动选择算法的输出结果作为初始弱学习器，利用AdaBoost算法原理并行地、完全独立地对初始弱学习器进行融合训练，得到强学习器，获取对应的强学习器预测结果；

步骤5：基于真实值，计算强学习器预测结果的平均绝对百分比误差，利用平均绝对百分比误差将强学习器的预测结果进行融合，得到最后的商品销售预测结果。

上述的基于AdaBoost算法构建的商品销量融合预测模型，步骤1中所述预测模型包括基于长短期记忆网络、门控循环单元、时域卷积网络以及多层感知机、支持向量回顾模型五种预测模型。

上述的基于AdaBoost算法构建的生鲜销量融合预测模型，所述步骤2包括：

步骤2-1：根据超参数的取值和算法关系设置超参数的取值范围

步骤2-2：在范围内随机搜索，以模型准确率作为目标函数及评价指标；

步骤2—3：由于随机搜索可能会出现局部最优解，因此重复多次得到搜索结果；

步骤2-4：选择准确率最高的超参数组合作为最终的搜索结果，即确定最终的模型超参数取值。

上述的基于AdaBoost算法构建的商品销量融合预测模型，在步骤3中，所述均方误差为其中y_i和/>分别为预测目标的真实值和预测值，n为数据的样本数量，MSE值越小，预测模型的准确度越高。

上述的基于AdaBoost算法构建的商品销量融合预测模型，所述步骤3包括：

步骤3—1：将输入的数据集划分为训练集和测试集，利用训练集分别对单一预测模型调参基模型库中的经典预测模型进行训练，使其抓取并适应数据集的特征，再将测试集的数据输入到各个训练好的预测模型中，获取每个模型给出的预测结果；

步骤3—2：根据测试集的真实销量值y_i和预测销量值计算每个模型的均方误差MSE_n，其中n指代第n个预测模型；

步骤3—3：比较各个预测模型的MSE值，确定评估指标最小值对应的预测模型，用以后续融合预测模型构建的初始输入弱学习器模型，完成弱学习器自动选择过程。

上述的基于AdaBoost算法构建的商品销量融合预测模型，所述步骤4包括：

步骤4-1：识别弱学习器自动选择算法的输出结果，最小值及次小值对应的预测模型，并同时获取两种模型在弱学习器自动选择阶段具体的参数信息；

步骤4-2：分别以两个模型作为唯一的初始弱学习器F(x)、T(x)，F(x)代表MSE最小值对应的预测模型，T(x)代表MSE次小值对应的模型，利用AdaBoost算法原理，并行地、完全独立地进行融合训练，统一地将弱学习器训练个数K定为10，即在AdaBoost算法流程中共设定2K个弱学习器F_n(x)，n＝1，2，…k和T_n(x)，n＝1，2，…k；在第n个弱学习器的训练过程中，计算样本相对误差e_ni、学习器误差率e_n、学习器权重系数α_n，同时根据该学习器的预测效果更新样本权重D_ni+1，弱学习器F(x)的训练过程中，各参数的计算公式如下，

α_n＝e_n/(1-e_n)

式中，Z_n为规范化因子，其计算公式为参考AdaBoost.RT算法，采取的结合策略如下所示，f即为最终的强学习器预测，

弱学习器T(x)的训练过程同弱学习器F(x)的训练过程；

步骤4-3：分别利用弱学习器F(x)、T(x)进行融合训练得到强学习器f₁和f₂，分别获取对应的强学习器预测结果和/>

上述的基于AdaBoost算法构建的商品销量融合预测模型，所述步骤5包括：

步骤5-1：基于真实值y，计算两个强学习器f₁和f₂预测结果的平均绝对百分比误差

式中，y_i和分别为预测目标的真实值和预测值，n为数据的样本数量。

步骤5-2：利用RMSE数值，将强学习器f₁和f₂的预测结果和/>进行融合，得到预测结果。

本发明一种基于AdaBoost算法构建的商品销量融合预测模型的有益效果是：汇总神经网络及机器学习中适用于预测商品销售的经典模型，将神经网络及机器学习中适用于预测商品销量的经典模型汇集到基模型库，使用基模型库中经典的商品销量预测模型分别完成对每家门店产品的销量预测工作。从预测准确度角度出发，设定单一模型性能评价指标，根据前面的预测结果以及预测周期对应的真实销量数值，选择出预测准确度最高及次高的模型，将两种模型作为后续融合训练过程的初始弱学习器。利用AdaBoost算法，并行地对上述操作中选择出来的两种模型进行融合训练得到两个融合预测模型，最后通过既定的权重确定方法，将两个融合预测模型的预测结果进行融合，融合的结果作为门店最终的商品的销量预测值，实现“优中选优”，减少人为经验作用的同时提高预测的速度及精度。

将筛选出来的两个模型作为AdaBoost算法的弱学习器，进行集成训练，把弱学习器经过训练集成得到强学习器，并且使用RMSE确定后续融合的权重系数，RMSE越小，证明该模型的预测值越好，使用融合公式将结果进行融合得到最后一个预测结果，将从基模型库种筛选出预测最准确的模型和预测第二准确的模型这两个模型进行互补，从而提高预测精度。

附图说明

图1为本发明基于AdaBoost算法的自动选择弱学习器的融合预测模型的预测流程；

图2本发明中弱学习器自动选择过程。

具体实施方式

为使本领域技术人员更好的理解本发明的技术方案，下面结合具体实施方式及附图，对本发明的技术方案进行说明。

本发明记载的基于AdaBoost算法构建的销量融合预测模型的技术方案，首先，汇总神经网络及机器学习中适用于预测商品销售的经典模型，将神经网络及机器学习中适用于预测商品销量的经典模型汇集到基模型库，使用基模型库中经典的商品销量预测模型分别完成对每家门店产品的销量预测工作。其次，从预测准确度角度出发，设定单一模型性能评价指标，根据前面的预测结果以及预测周期对应的真实销量数值，选择出预测准确度最高及次高的模型，将两种模型作为后续融合训练过程的初始弱学习器。最后，利用AdaBoost算法，并行地对上述操作中选择出来的两种模型进行融合训练得到两个融合预测模型，最后通过既定的权重确定方法，将两个融合预测模型的预测结果进行融合，融合的结果作为门店最终的商品的销量预测值，实现“优中选优”，减少人为经验作用的同时提高预测的速度及精度。

具体的步骤为，如图1-2所示，

实施例1：

一种基于AdaBoost算法构建的销量融合预测模型，包括以下步骤：

步骤1：汇总神经网络及机器学习中适用于预测商品销售的经典模型，基于多种预测模型构建基模型库；预测模型包括基于长短期记忆网络、门控循环单元、时域卷积网络以及多层感知机、支持向量回顾模型五种预测模型。

步骤2：单一预测模型调参，选用随机搜索法完成单一预测模型的超参数调整优化工作；具体步骤为：

步骤2-3：由于随机搜索可能会出现局部最优解，因此重复多次得到搜索结果；

步骤3：构建弱学习器自动选择算法，采用均方误差作为衡量预测模型准确度性能的指标，均方误差为其中y_i和/>分别为预测目标的真实值和预测值，n为数据的样本数量，MSE值越小，预测模型的准确度越高。

把预测最准确的模型和预测第二准确的模型筛选出来，用以后续融合预测模型构建的初始输入弱学习器模型，完成弱学习器自动选择过程；具体步骤为：

步骤3-1：将输入的数据集划分为训练集和测试集，利用训练集分别对单一预测模型调参基模型库中的经典预测模型进行训练，使其抓取并适应数据集的特征，再将测试集的数据输入到各个训练好的预测模型中，获取每个模型给出的预测结果；

步骤3-2：根据测试集的真实销量值y_i和预测销量值计算每个模型的均方误差MSE_n，其中n指代第n个预测模型；

步骤3-3：比较各个预测模型的MSE值，确定评估指标最小值对应的预测模型，用以后续融合预测模型构建的初始输入弱学习器模型，完成弱学习器自动选择过程。

步骤4：识别弱学习器自动选择算法的输出结果作为初始弱学习器，利用AdaBoost算法原理并行地、完全独立地对初始弱学习器进行融合训练，得到强学习器，获取对应的强学习器预测结果；具体步骤为：

α_n＝e_n/(1-e_n)

弱学习器T(x)的训练过程同弱学习器F(x)的训练过程；

步骤5：基于真实值，计算强学习器预测结果的平均绝对百分比误差，利用平均绝对百分比误差将强学习器的预测结果进行融合，得到最后的生鲜商品销售预测结果，具体步骤为：

步骤5-1：根基于真实值y，计算两个强学习器f₁和f₂预测结果的平均绝对百分比误差

步骤5-2：利用RMSE数值，将强学习器f₁和f₂的预测结果和/>进行融合，

得到预测结果，实现预测精度的提升。

实施例1中记载的模型中，将筛选出来的两个模型作为AdaBoost算法的弱学习器，进行一个集成训练，将两个弱学习器分别经过步骤4.2的步骤集成训练成一个强学习器，具体描述就是把弱学习器经过AdaBoost算法进行10次训练，会得到对应的10个弱学习器，把这10个弱学习器进行集成得到一个强学习器，RMSE的作用就是为了确定后续融合的权重系数，RMSE越小，证明该模型的预测值越好。将得到的强学习器的预测结果根据上述融合公式把两个结果进行融合得到最后一个预测结果。

该融合的目的就是将从基模型库种筛选出预测最准确的模型和预测第二准确的模型这两个模型进行互补，从而提高预测精度。

实施例2

一种基于AdaBoost算法构建的自动选择弱学习器的商品销量融合预测模型，具体步骤如下：

步骤1、构建基模型库

基于长短期记忆网络LSTM、门控循环单元GRU、时域卷积网络TCN以及多层感知机MLP、支持向量回顾SVR模型五种预测模型构建基模型库。

步骤2、单一预测模型调参

选用随机搜索法完成单一预测模型的超参数调整优化工作。

步骤2.1.根据超参数的取值和算法关系设置超参数的取值范围

步骤2.2.在范围内随机搜索，以模型准确率作为目标函数及评价指标；

步骤2.3.由于随机搜索可能会出现局部最优解，因此重复多次得到搜索结果；

步骤2.4.选择准确率最高的超参数组合作为最终的搜索结果，即确定最终的模型超参数取值。

步骤3、构建弱学习器自动选择算法

首先定义如下符号：采用均方误差(Mean Square Error，MSE)作为衡量预测模型准确度性能的指标，同时采用赤池信息准则(Akaike information criterion，AIC)评估模型的复杂度。本文采用均方误差(Mean Square Error，MSE)作为衡量预测模型准确度性能的指标，同时采用赤池信息准则(Akaike information criterion，AIC)评估模型的复杂度。两种性能评估指标的原理公式如下。根据公式可知，MSE值越小，说明预测模型的准确度越高；AIC值越小，说明预测模型的复杂度越低。

AIC＝-2ln(L)+2k

式中，y_i和分别为预测目标的真实值和预测值，n为数据的样本数量，L为该模型下的最大似然函数，k为模型的参数数量。

步骤3.1.将输入的数据集划分为训练集和测试集，先利用训练集分别对单一预测模型调参基模型库中的经典预测模型进行训练，使其抓取并适应数据集的特征，再将测试集的数据输入到各个训练好的预测模型中，获取每个模型给出的预测结果；

步骤3.2.根据测试集的真实销量值y_i和预测销量值计算每个模型的均方误差MSE_n以及赤池信息准则AIC_n，其中n指代第n个预测模型。

步骤3.3.比较各个预测模型的MSE值和AIC值，分别确定出两个评估指标最小值对应的预测模型，用以后续融合预测模型构建的初始输入弱学习器模型，完成弱学习器自动选择过程。

步骤4、对原始的AdaBoost算法原理进行改进，提出融合预测算法

步骤4.1.识别弱学习器自动选择算法的输出结果，即MSE最小值对应的预测模型以及AIC最小值对应的模型，并同时获取两种模型在弱学习器自动选择阶段具体的参数信息；

步骤4.2分别以两个模型作为唯一的初始弱学习器F(x)、T(x)，利用AdaBoost算法原理，并行地、完全独立地进行融合训练。在该过程中，统一地将弱学习器训练个数K定为10，即在AdaBoost算法流程中共设定2K个弱学习器F_n(x)，n＝1，2，…k和T_n(x)，n＝1，2，…k。在第n个弱学习器的训练过程中，需要计算样本相对误差e_ni、学习器误差率e_n、学习器权重系数α_n，同时还要根据该学习器的预测效果更新样本权重D_ni+1，以弱学习器F(x)的训练过程为例，各参数的计算公式如下所示。弱学习器T(x)的训练过程同理。

α_n＝e_n/(1-e_n)

式中，Z_n为规范化因子，其计算公式为参考AdaBoost.RT算法，采取的结合策略如下所示，f即为最终的强学习器预测。

步骤4.3.分别利用弱学习器F(x)、T(x)进行融合训练得到强学习器f₁和f₂，分别获取对应的强学习器预测结果，记为和/>

步骤4.4根基于真实值y，计算两个强学习器f₁和f₂预测结果的平均绝对百分比误差(Mean Absolute Percentage Error，MAPE)，计算公式如下

步骤4.5利用MAPE数值，将强学习器f₁和f₂的预测结果和/>进行融合。本文采用的融合方式如下。

实施例2与实施例1不同之处在于同时使用均方误差(MeanSquareError，MSE)作为衡量预测模型准确度性能的指标，同时采用赤池信息准则(Akaikeinformationcriterion，AIC)评估模型的复杂度两个指标来限定弱学习器模型的选择指标，用两个最差值指标确定弱学习器的选择，能够更好的筛选出需要进行互补的模型，从而更精确的达到解决解决产品销量预测问题的目的。

上述实施例只是为了说明本发明的发明构思和特点，其目的在于让本领域内的普通技术人员能够了解本发明的内容并据以实施，并不能以此限定本发明的保护范围。凡是根据本发明内容的实质所做出的等效变化或修饰，都应该涵盖在本发明的保护范围之内。

Claims

1.基于AdaBoost算法构建的商品销量融合预测模型，其特征在于，包括以下步骤：

步骤1：汇总神经网络及机器学习中适用于预测商品销售的经典模型，基于多种预测模型构建基模型库，所述预测模型包括基于长短期记忆网络、门控循环单元、时域卷积网络以及多层感知机、支持向量回顾模型五种预测模型；

步骤2：单一预测模型调参，选用随机搜索法完成单一预测模型的超参数调整优化工作，包括：

步骤2-4：选择准确率最高的超参数组合作为最终的搜索结果，即确定最终的模型超参数取值；

步骤3：构建弱学习器自动选择算法，采用均方误差作为衡量预测模型准确度性能的指标，把预测最准确的模型和预测第二准确的模型筛选出来，用以后续融合预测模型构建的初始输入弱学习器模型，完成弱学习器自动选择过程，所述均方误差为其中y_i和/>分别为预测目标的真实值和预测值，n为数据的样本数量，MSE值越小，预测模型的准确度越高；

步骤4：识别弱学习器自动选择算法的输出结果作为初始弱学习器，利用AdaBoost算法原理并行地、完全独立地对初始弱学习器进行融合训练，得到强学习器，获取对应的强学习器预测结果，包括：

包括：

步骤4-2：分别以两个模型作为唯一的初始弱学习器F(x)、T(x)，F(x)代表MSE最小值对应的预测模型，T(x)代表MSE次小值对应的模型，利用AdaBoost算法原理，并行地、完全独立地进行融合训练，统一地将弱学习器训练个数K定为10，即在AdaBoost算法流程中共设定2K个弱学习器F_n(x),n＝1,2,…k和T_n(x),n＝1,2,…k；在第n个弱学习器的训练过程中，需要计算样本相对误差e_ni、学习器误差率e_n、学习器权重系数α_n，同时还要根据该学习器的预测效果更新样本权重D_ni+1，弱学习器F(x)的训练过程中，各参数的计算公式如下，

α_n＝e_n/(1-e_n)

弱学习器T(x)的训练过程同弱学习器F(x)的训练过程；

步骤5：基于真实值，计算强学习器预测结果的平均绝对百分比误差，利用平均绝对百分比误差将强学习器的预测结果进行融合，得到最后的生鲜商品销售预测结果，包括：

式中，y_i和分别为预测目标的真实值和预测值，n为数据的样本数量；

2.根据权利要求1所述的基于AdaBoost算法构建的商品销量融合预测模型，其特征是：所述步骤3包括：