CN116245563B - 基于AdaBoost算法构建的商品销量融合预测模型 - Google Patents
基于AdaBoost算法构建的商品销量融合预测模型 Download PDFInfo
- Publication number
- CN116245563B CN116245563B CN202310526079.0A CN202310526079A CN116245563B CN 116245563 B CN116245563 B CN 116245563B CN 202310526079 A CN202310526079 A CN 202310526079A CN 116245563 B CN116245563 B CN 116245563B
- Authority
- CN
- China
- Prior art keywords
- prediction
- model
- learner
- weak
- fusion
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000004927 fusion Effects 0.000 title claims abstract description 63
- 238000012549 training Methods 0.000 claims abstract description 46
- 238000000034 method Methods 0.000 claims abstract description 44
- 238000013528 artificial neural network Methods 0.000 claims abstract description 8
- 238000010801 machine learning Methods 0.000 claims abstract description 8
- 238000012360 testing method Methods 0.000 claims description 12
- 238000011156 evaluation Methods 0.000 claims description 11
- 238000004364 calculation method Methods 0.000 claims description 8
- 230000000694 effects Effects 0.000 claims description 8
- 230000006870 function Effects 0.000 claims description 5
- 238000005457 optimization Methods 0.000 claims description 4
- 238000012216 screening Methods 0.000 claims description 3
- 230000015654 memory Effects 0.000 claims description 2
- 238000012552 review Methods 0.000 claims description 2
- 238000012706 support-vector machine Methods 0.000 description 3
- 101001095088 Homo sapiens Melanoma antigen preferentially expressed in tumors Proteins 0.000 description 2
- 102100037020 Melanoma antigen preferentially expressed in tumors Human genes 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 238000007477 logistic regression Methods 0.000 description 2
- 230000007787 long-term memory Effects 0.000 description 2
- 238000010248 power generation Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000007476 Maximum Likelihood Methods 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000010219 correlation analysis Methods 0.000 description 1
- 239000010779 crude oil Substances 0.000 description 1
- 206010012601 diabetes mellitus Diseases 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000013210 evaluation model Methods 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0202—Market predictions or forecasting for commercial activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/049—Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Data Mining & Analysis (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Accounting & Taxation (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Biophysics (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Entrepreneurship & Innovation (AREA)
- Biomedical Technology (AREA)
- Computing Systems (AREA)
- Computational Linguistics (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Marketing (AREA)
- Game Theory and Decision Science (AREA)
- Economics (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及商品销售预测技术领域,具体的提供了一种基于AdaBoost算法构建的商品销量融合预测模型,包括以下步骤:1:基于多种预测模型构建基模型库;2:单一预测模型调参;3:构建弱学习器自动选择算法,完成弱学习器自动选择过程;4:识别弱学习器自动选择算法的输出结果作为初始弱学习器,进行融合训练,得到强学习器及强学习器预测结果;5:计算强学习器预测结果的平均绝对百分比误差,将强学习器的预测结果进行融合,得到最后的预测结果。通过汇总神经网络及机器学习中适用于预测商品销售的经典模型,将预测商品销量的经典模型汇集到基模型库,使用基模型库中经典的商品销量预测模型分别完成对每家门店产品的销量预测工作。
Description
技术领域
本发明涉及商品销售预测技术领域,具体的提供了一种基于AdaBoost算法构建的商品销量融合预测模型。
背景技术
在众多组合模型中,以Stacking和AdaBoost等为代表的集成学习算法凭借其强大的预测性能,获得了众多学者的青睐。Kalagotla等人融合了MLP、SVM(支持向量机)和LR(逻辑回归)三种模型,建立了用于预测糖尿病的Stacking融合模型。杨荣新等人基于Stacking集成算法提出了一种预测光伏发电功率的组合模型,通过对光伏电站的历史数据进行递归特征消除和特征选择后,以RF、XGBoost、LGBM三种模型作为Stacking融合模型的初级学习器,线性回归作为次级学习器,建立了预测光伏发电功率的Stacking融合模型。实验结果表明,该模型相较于单模型,预测准确度明显提升。邓威等人提出了一种基于特征选择和Stacking集成算法的用于预测配电网损的预测方法,通过相关性分析法和最大信息系数法进行特征重要性分析,然后集成RF、KNN、MLP、SVM、GBDT(梯度下降树)五种模型,构建了融合模型对配电网网损进行预测。Ganiyu和Dong将AdaBoost算法与GRU进行结,并通过预测原油价格,对比了该模型与现有AdaBoost-LSTM模型的预测性能,结果表明AdaBoost-GRU模型优于AdaBoost-LSTM集成模型。Xiao等人将LSTM和AdaBoost模型进行结合,用以预测短中期的海面温度,其预测性能明显优于LSTM和AdaBoost模型。
在模型融合预测中,目前在产品销量预测领域进行融合模型预测的研究相对较少,大部分的模型融合或组合预测还是应用在交通流或者电网稳定性预测领域。而研究表明,通常情况下,融合模型相较于单一预测模型往往具有更好的预测性能,某些种类的产品易腐、货架期短的特点使其对于销量预测的准确性具有极高的要求,因此建立产品销量融合预测模型是极为必要的,而如何在保持原有模型预测性能的基础上,实现好而更好是相关问题的难点。
发明内容
针对现有技术中存在的问题,本发明的目的是为了提供一种解决产品销量预测问题的模型,能够针对部分产品易腐、货架期短的特点进行设置,防止产品配置过多造成剩余,或者配置过少导致供应量不足。
为实现上述目的,本发明采取的技术方案是:基于AdaBoost算法构建的商品销量融合预测模型,包括以下步骤:
步骤1:汇总神经网络及机器学习中适用于预测商品销售的经典模型,基于多种预测模型构建基模型库;
步骤2:单一预测模型调参,选用随机搜索法完成单一预测模型的超参数调整优化工作;
步骤3:构建弱学习器自动选择算法,采用均方误差作为衡量预测模型准确度性能的指标,把预测最准确的模型和预测第二准确的模型筛选出来,用以后续融合预测模型构建的初始输入弱学习器模型,完成弱学习器自动选择过程;
步骤4:识别弱学习器自动选择算法的输出结果作为初始弱学习器,利用AdaBoost算法原理并行地、完全独立地对初始弱学习器进行融合训练,得到强学习器,获取对应的强学习器预测结果;
步骤5:基于真实值,计算强学习器预测结果的平均绝对百分比误差,利用平均绝对百分比误差将强学习器的预测结果进行融合,得到最后的商品销售预测结果。
上述的基于AdaBoost算法构建的商品销量融合预测模型,步骤1中所述预测模型包括基于长短期记忆网络、门控循环单元、时域卷积网络以及多层感知机、支持向量回顾模型五种预测模型。
上述的基于AdaBoost算法构建的生鲜销量融合预测模型,所述步骤2包括:
步骤2-1:根据超参数的取值和算法关系设置超参数的取值范围
步骤2-2:在范围内随机搜索,以模型准确率作为目标函数及评价指标;
步骤2—3:由于随机搜索可能会出现局部最优解,因此重复多次得到搜索结果;
步骤2-4:选择准确率最高的超参数组合作为最终的搜索结果,即确定最终的模型超参数取值。
上述的基于AdaBoost算法构建的商品销量融合预测模型,在步骤3中,所述均方误差为其中yi和/>分别为预测目标的真实值和预测值,n为数据的样本数量,MSE值越小,预测模型的准确度越高。
上述的基于AdaBoost算法构建的商品销量融合预测模型,所述步骤3包括:
步骤3—1:将输入的数据集划分为训练集和测试集,利用训练集分别对单一预测模型调参基模型库中的经典预测模型进行训练,使其抓取并适应数据集的特征,再将测试集的数据输入到各个训练好的预测模型中,获取每个模型给出的预测结果;
步骤3—2:根据测试集的真实销量值yi和预测销量值计算每个模型的均方误差MSEn,其中n指代第n个预测模型;
步骤3—3:比较各个预测模型的MSE值,确定评估指标最小值对应的预测模型,用以后续融合预测模型构建的初始输入弱学习器模型,完成弱学习器自动选择过程。
上述的基于AdaBoost算法构建的商品销量融合预测模型,所述步骤4包括:
步骤4-1:识别弱学习器自动选择算法的输出结果,最小值及次小值对应的预测模型,并同时获取两种模型在弱学习器自动选择阶段具体的参数信息;
步骤4-2:分别以两个模型作为唯一的初始弱学习器F(x)、T(x),F(x)代表MSE最小值对应的预测模型,T(x)代表MSE次小值对应的模型,利用AdaBoost算法原理,并行地、完全独立地进行融合训练,统一地将弱学习器训练个数K定为10,即在AdaBoost算法流程中共设定2K个弱学习器Fn(x),n=1,2,…k和Tn(x),n=1,2,…k;在第n个弱学习器的训练过程中,计算样本相对误差eni、学习器误差率en、学习器权重系数αn,同时根据该学习器的预测效果更新样本权重Dni+1,弱学习器F(x)的训练过程中,各参数的计算公式如下,
αn=en/(1-en)
式中,Zn为规范化因子,其计算公式为参考AdaBoost.RT算法,采取的结合策略如下所示,f即为最终的强学习器预测,
弱学习器T(x)的训练过程同弱学习器F(x)的训练过程;
步骤4-3:分别利用弱学习器F(x)、T(x)进行融合训练得到强学习器f1和f2,分别获取对应的强学习器预测结果和/>
上述的基于AdaBoost算法构建的商品销量融合预测模型,所述步骤5包括:
步骤5-1:基于真实值y,计算两个强学习器f1和f2预测结果的平均绝对百分比误差
式中,yi和分别为预测目标的真实值和预测值,n为数据的样本数量。
步骤5-2:利用RMSE数值,将强学习器f1和f2的预测结果和/>进行融合,得到预测结果。
本发明一种基于AdaBoost算法构建的商品销量融合预测模型的有益效果是:汇总神经网络及机器学习中适用于预测商品销售的经典模型,将神经网络及机器学习中适用于预测商品销量的经典模型汇集到基模型库,使用基模型库中经典的商品销量预测模型分别完成对每家门店产品的销量预测工作。从预测准确度角度出发,设定单一模型性能评价指标,根据前面的预测结果以及预测周期对应的真实销量数值,选择出预测准确度最高及次高的模型,将两种模型作为后续融合训练过程的初始弱学习器。利用AdaBoost算法,并行地对上述操作中选择出来的两种模型进行融合训练得到两个融合预测模型,最后通过既定的权重确定方法,将两个融合预测模型的预测结果进行融合,融合的结果作为门店最终的商品的销量预测值,实现“优中选优”,减少人为经验作用的同时提高预测的速度及精度。
将筛选出来的两个模型作为AdaBoost算法的弱学习器,进行集成训练,把弱学习器经过训练集成得到强学习器,并且使用RMSE确定后续融合的权重系数,RMSE越小,证明该模型的预测值越好,使用融合公式将结果进行融合得到最后一个预测结果,将从基模型库种筛选出预测最准确的模型和预测第二准确的模型这两个模型进行互补,从而提高预测精度。
附图说明
图1为本发明基于AdaBoost算法的自动选择弱学习器的融合预测模型的预测流程;
图2本发明中弱学习器自动选择过程。
具体实施方式
为使本领域技术人员更好的理解本发明的技术方案,下面结合具体实施方式及附图,对本发明的技术方案进行说明。
本发明记载的基于AdaBoost算法构建的销量融合预测模型的技术方案,首先,汇总神经网络及机器学习中适用于预测商品销售的经典模型,将神经网络及机器学习中适用于预测商品销量的经典模型汇集到基模型库,使用基模型库中经典的商品销量预测模型分别完成对每家门店产品的销量预测工作。其次,从预测准确度角度出发,设定单一模型性能评价指标,根据前面的预测结果以及预测周期对应的真实销量数值,选择出预测准确度最高及次高的模型,将两种模型作为后续融合训练过程的初始弱学习器。最后,利用AdaBoost算法,并行地对上述操作中选择出来的两种模型进行融合训练得到两个融合预测模型,最后通过既定的权重确定方法,将两个融合预测模型的预测结果进行融合,融合的结果作为门店最终的商品的销量预测值,实现“优中选优”,减少人为经验作用的同时提高预测的速度及精度。
具体的步骤为,如图1-2所示,
实施例1:
一种基于AdaBoost算法构建的销量融合预测模型,包括以下步骤:
步骤1:汇总神经网络及机器学习中适用于预测商品销售的经典模型,基于多种预测模型构建基模型库;预测模型包括基于长短期记忆网络、门控循环单元、时域卷积网络以及多层感知机、支持向量回顾模型五种预测模型。
步骤2:单一预测模型调参,选用随机搜索法完成单一预测模型的超参数调整优化工作;具体步骤为:
步骤2-1:根据超参数的取值和算法关系设置超参数的取值范围
步骤2-2:在范围内随机搜索,以模型准确率作为目标函数及评价指标;
步骤2-3:由于随机搜索可能会出现局部最优解,因此重复多次得到搜索结果;
步骤2-4:选择准确率最高的超参数组合作为最终的搜索结果,即确定最终的模型超参数取值。
步骤3:构建弱学习器自动选择算法,采用均方误差作为衡量预测模型准确度性能的指标,均方误差为其中yi和/>分别为预测目标的真实值和预测值,n为数据的样本数量,MSE值越小,预测模型的准确度越高。
把预测最准确的模型和预测第二准确的模型筛选出来,用以后续融合预测模型构建的初始输入弱学习器模型,完成弱学习器自动选择过程;具体步骤为:
步骤3-1:将输入的数据集划分为训练集和测试集,利用训练集分别对单一预测模型调参基模型库中的经典预测模型进行训练,使其抓取并适应数据集的特征,再将测试集的数据输入到各个训练好的预测模型中,获取每个模型给出的预测结果;
步骤3-2:根据测试集的真实销量值yi和预测销量值计算每个模型的均方误差MSEn,其中n指代第n个预测模型;
步骤3-3:比较各个预测模型的MSE值,确定评估指标最小值对应的预测模型,用以后续融合预测模型构建的初始输入弱学习器模型,完成弱学习器自动选择过程。
步骤4:识别弱学习器自动选择算法的输出结果作为初始弱学习器,利用AdaBoost算法原理并行地、完全独立地对初始弱学习器进行融合训练,得到强学习器,获取对应的强学习器预测结果;具体步骤为:
步骤4-1:识别弱学习器自动选择算法的输出结果,最小值及次小值对应的预测模型,并同时获取两种模型在弱学习器自动选择阶段具体的参数信息;
步骤4-2:分别以两个模型作为唯一的初始弱学习器F(x)、T(x),F(x)代表MSE最小值对应的预测模型,T(x)代表MSE次小值对应的模型,利用AdaBoost算法原理,并行地、完全独立地进行融合训练,统一地将弱学习器训练个数K定为10,即在AdaBoost算法流程中共设定2K个弱学习器Fn(x),n=1,2,…k和Tn(x),n=1,2,…k;在第n个弱学习器的训练过程中,计算样本相对误差eni、学习器误差率en、学习器权重系数αn,同时根据该学习器的预测效果更新样本权重Dni+1,弱学习器F(x)的训练过程中,各参数的计算公式如下,
αn=en/(1-en)
式中,Zn为规范化因子,其计算公式为参考AdaBoost.RT算法,采取的结合策略如下所示,f即为最终的强学习器预测,
弱学习器T(x)的训练过程同弱学习器F(x)的训练过程;
步骤4-3:分别利用弱学习器F(x)、T(x)进行融合训练得到强学习器f1和f2,分别获取对应的强学习器预测结果和/>
步骤5:基于真实值,计算强学习器预测结果的平均绝对百分比误差,利用平均绝对百分比误差将强学习器的预测结果进行融合,得到最后的生鲜商品销售预测结果,具体步骤为:
步骤5-1:根基于真实值y,计算两个强学习器f1和f2预测结果的平均绝对百分比误差
式中,yi和分别为预测目标的真实值和预测值,n为数据的样本数量。
步骤5-2:利用RMSE数值,将强学习器f1和f2的预测结果和/>进行融合,
得到预测结果,实现预测精度的提升。
实施例1中记载的模型中,将筛选出来的两个模型作为AdaBoost算法的弱学习器,进行一个集成训练,将两个弱学习器分别经过步骤4.2的步骤集成训练成一个强学习器,具体描述就是把弱学习器经过AdaBoost算法进行10次训练,会得到对应的10个弱学习器,把这10个弱学习器进行集成得到一个强学习器,RMSE的作用就是为了确定后续融合的权重系数,RMSE越小,证明该模型的预测值越好。将得到的强学习器的预测结果根据上述融合公式把两个结果进行融合得到最后一个预测结果。
该融合的目的就是将从基模型库种筛选出预测最准确的模型和预测第二准确的模型这两个模型进行互补,从而提高预测精度。
实施例2
一种基于AdaBoost算法构建的自动选择弱学习器的商品销量融合预测模型,具体步骤如下:
步骤1、构建基模型库
基于长短期记忆网络LSTM、门控循环单元GRU、时域卷积网络TCN以及多层感知机MLP、支持向量回顾SVR模型五种预测模型构建基模型库。
步骤2、单一预测模型调参
选用随机搜索法完成单一预测模型的超参数调整优化工作。
步骤2.1.根据超参数的取值和算法关系设置超参数的取值范围
步骤2.2.在范围内随机搜索,以模型准确率作为目标函数及评价指标;
步骤2.3.由于随机搜索可能会出现局部最优解,因此重复多次得到搜索结果;
步骤2.4.选择准确率最高的超参数组合作为最终的搜索结果,即确定最终的模型超参数取值。
步骤3、构建弱学习器自动选择算法
首先定义如下符号:采用均方误差(Mean Square Error,MSE)作为衡量预测模型准确度性能的指标,同时采用赤池信息准则(Akaike information criterion,AIC)评估模型的复杂度。本文采用均方误差(Mean Square Error,MSE)作为衡量预测模型准确度性能的指标,同时采用赤池信息准则(Akaike information criterion,AIC)评估模型的复杂度。两种性能评估指标的原理公式如下。根据公式可知,MSE值越小,说明预测模型的准确度越高;AIC值越小,说明预测模型的复杂度越低。
AIC=-2ln(L)+2k
式中,yi和分别为预测目标的真实值和预测值,n为数据的样本数量,L为该模型下的最大似然函数,k为模型的参数数量。
步骤3.1.将输入的数据集划分为训练集和测试集,先利用训练集分别对单一预测模型调参基模型库中的经典预测模型进行训练,使其抓取并适应数据集的特征,再将测试集的数据输入到各个训练好的预测模型中,获取每个模型给出的预测结果;
步骤3.2.根据测试集的真实销量值yi和预测销量值计算每个模型的均方误差MSEn以及赤池信息准则AICn,其中n指代第n个预测模型。
步骤3.3.比较各个预测模型的MSE值和AIC值,分别确定出两个评估指标最小值对应的预测模型,用以后续融合预测模型构建的初始输入弱学习器模型,完成弱学习器自动选择过程。
步骤4、对原始的AdaBoost算法原理进行改进,提出融合预测算法
步骤4.1.识别弱学习器自动选择算法的输出结果,即MSE最小值对应的预测模型以及AIC最小值对应的模型,并同时获取两种模型在弱学习器自动选择阶段具体的参数信息;
步骤4.2分别以两个模型作为唯一的初始弱学习器F(x)、T(x),利用AdaBoost算法原理,并行地、完全独立地进行融合训练。在该过程中,统一地将弱学习器训练个数K定为10,即在AdaBoost算法流程中共设定2K个弱学习器Fn(x),n=1,2,…k和Tn(x),n=1,2,…k。在第n个弱学习器的训练过程中,需要计算样本相对误差eni、学习器误差率en、学习器权重系数αn,同时还要根据该学习器的预测效果更新样本权重Dni+1,以弱学习器F(x)的训练过程为例,各参数的计算公式如下所示。弱学习器T(x)的训练过程同理。
αn=en/(1-en)
式中,Zn为规范化因子,其计算公式为参考AdaBoost.RT算法,采取的结合策略如下所示,f即为最终的强学习器预测。
步骤4.3.分别利用弱学习器F(x)、T(x)进行融合训练得到强学习器f1和f2,分别获取对应的强学习器预测结果,记为和/>
步骤4.4根基于真实值y,计算两个强学习器f1和f2预测结果的平均绝对百分比误差(Mean Absolute Percentage Error,MAPE),计算公式如下
式中,yi和分别为预测目标的真实值和预测值,n为数据的样本数量。
步骤4.5利用MAPE数值,将强学习器f1和f2的预测结果和/>进行融合。本文采用的融合方式如下。
实施例2与实施例1不同之处在于同时使用均方误差(MeanSquareError,MSE)作为衡量预测模型准确度性能的指标,同时采用赤池信息准则(Akaikeinformationcriterion,AIC)评估模型的复杂度两个指标来限定弱学习器模型的选择指标,用两个最差值指标确定弱学习器的选择,能够更好的筛选出需要进行互补的模型,从而更精确的达到解决解决产品销量预测问题的目的。
上述实施例只是为了说明本发明的发明构思和特点,其目的在于让本领域内的普通技术人员能够了解本发明的内容并据以实施,并不能以此限定本发明的保护范围。凡是根据本发明内容的实质所做出的等效变化或修饰,都应该涵盖在本发明的保护范围之内。
Claims (2)
1.基于AdaBoost算法构建的商品销量融合预测模型,其特征在于,包括以下步骤:
步骤1:汇总神经网络及机器学习中适用于预测商品销售的经典模型,基于多种预测模型构建基模型库,所述预测模型包括基于长短期记忆网络、门控循环单元、时域卷积网络以及多层感知机、支持向量回顾模型五种预测模型;
步骤2:单一预测模型调参,选用随机搜索法完成单一预测模型的超参数调整优化工作,包括:
步骤2-1:根据超参数的取值和算法关系设置超参数的取值范围
步骤2-2:在范围内随机搜索,以模型准确率作为目标函数及评价指标;
步骤2-3:由于随机搜索可能会出现局部最优解,因此重复多次得到搜索结果;
步骤2-4:选择准确率最高的超参数组合作为最终的搜索结果,即确定最终的模型超参数取值;
步骤3:构建弱学习器自动选择算法,采用均方误差作为衡量预测模型准确度性能的指标,把预测最准确的模型和预测第二准确的模型筛选出来,用以后续融合预测模型构建的初始输入弱学习器模型,完成弱学习器自动选择过程,所述均方误差为其中yi和/>分别为预测目标的真实值和预测值,n为数据的样本数量,MSE值越小,预测模型的准确度越高;
步骤4:识别弱学习器自动选择算法的输出结果作为初始弱学习器,利用AdaBoost算法原理并行地、完全独立地对初始弱学习器进行融合训练,得到强学习器,获取对应的强学习器预测结果,包括:
包括:
步骤4-1:识别弱学习器自动选择算法的输出结果,最小值及次小值对应的预测模型,并同时获取两种模型在弱学习器自动选择阶段具体的参数信息;
步骤4-2:分别以两个模型作为唯一的初始弱学习器F(x)、T(x),F(x)代表MSE最小值对应的预测模型,T(x)代表MSE次小值对应的模型,利用AdaBoost算法原理,并行地、完全独立地进行融合训练,统一地将弱学习器训练个数K定为10,即在AdaBoost算法流程中共设定2K个弱学习器Fn(x),n=1,2,…k和Tn(x),n=1,2,…k;在第n个弱学习器的训练过程中,需要计算样本相对误差eni、学习器误差率en、学习器权重系数αn,同时还要根据该学习器的预测效果更新样本权重Dni+1,弱学习器F(x)的训练过程中,各参数的计算公式如下,
αn=en/(1-en)
式中,Zn为规范化因子,其计算公式为参考AdaBoost.RT算法,采取的结合策略如下所示,f即为最终的强学习器预测,
弱学习器T(x)的训练过程同弱学习器F(x)的训练过程;
步骤4-3:分别利用弱学习器F(x)、T(x)进行融合训练得到强学习器f1和f2,分别获取对应的强学习器预测结果和/>
步骤5:基于真实值,计算强学习器预测结果的平均绝对百分比误差,利用平均绝对百分比误差将强学习器的预测结果进行融合,得到最后的生鲜商品销售预测结果,包括:
步骤5-1:根基于真实值y,计算两个强学习器f1和f2预测结果的平均绝对百分比误差
式中,yi和分别为预测目标的真实值和预测值,n为数据的样本数量;
步骤5-2:利用RMSE数值,将强学习器f1和f2的预测结果和/>进行融合,
2.根据权利要求1所述的基于AdaBoost算法构建的商品销量融合预测模型,其特征是:所述步骤3包括:
步骤3-1:将输入的数据集划分为训练集和测试集,利用训练集分别对单一预测模型调参基模型库中的经典预测模型进行训练,使其抓取并适应数据集的特征,再将测试集的数据输入到各个训练好的预测模型中,获取每个模型给出的预测结果;
步骤3-2:根据测试集的真实销量值yi和预测销量值计算每个模型的均方误差MSEn,其中n指代第n个预测模型;
步骤3-3:比较各个预测模型的MSE值,确定评估指标最小值对应的预测模型,用以后续融合预测模型构建的初始输入弱学习器模型,完成弱学习器自动选择过程。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310526079.0A CN116245563B (zh) | 2023-05-11 | 2023-05-11 | 基于AdaBoost算法构建的商品销量融合预测模型 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310526079.0A CN116245563B (zh) | 2023-05-11 | 2023-05-11 | 基于AdaBoost算法构建的商品销量融合预测模型 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116245563A CN116245563A (zh) | 2023-06-09 |
CN116245563B true CN116245563B (zh) | 2023-10-27 |
Family
ID=86629918
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310526079.0A Active CN116245563B (zh) | 2023-05-11 | 2023-05-11 | 基于AdaBoost算法构建的商品销量融合预测模型 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116245563B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116579722B (zh) * | 2023-07-14 | 2023-09-19 | 四川集鲜数智供应链科技有限公司 | 一种基于深度学习的商品分销出入库管理方法 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111563615A (zh) * | 2020-04-17 | 2020-08-21 | 国网天津市电力公司 | 一种基于特征分析与组合学习的负荷预测方法 |
CN111723949A (zh) * | 2020-06-24 | 2020-09-29 | 中国石油大学(华东) | 基于选择性集成学习的孔隙度预测方法 |
KR102177463B1 (ko) * | 2020-01-02 | 2020-11-11 | 주식회사 에스티씨 | 기계 학습 기반 판매량 예측 모델 생성 장치, 판매량 예측 장치 및 그 방법 |
CN113553540A (zh) * | 2020-04-24 | 2021-10-26 | 株式会社日立制作所 | 一种商品销量的预测方法 |
CN114549046A (zh) * | 2022-01-17 | 2022-05-27 | 北京滴普科技有限公司 | 基于融合模型的销售预测方法、系统、设备及存储介质 |
CN115115416A (zh) * | 2022-07-21 | 2022-09-27 | 湖南大学 | 一种商品销量预测方法 |
CN115660720A (zh) * | 2022-11-04 | 2023-01-31 | 内蒙古昆明卷烟有限责任公司 | 一种卷烟销量预测方法及设备 |
CN115691813A (zh) * | 2022-12-30 | 2023-02-03 | 神州医疗科技股份有限公司 | 基于基因组学和微生物组学的遗传性胃癌评估方法及系统 |
-
2023
- 2023-05-11 CN CN202310526079.0A patent/CN116245563B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102177463B1 (ko) * | 2020-01-02 | 2020-11-11 | 주식회사 에스티씨 | 기계 학습 기반 판매량 예측 모델 생성 장치, 판매량 예측 장치 및 그 방법 |
CN111563615A (zh) * | 2020-04-17 | 2020-08-21 | 国网天津市电力公司 | 一种基于特征分析与组合学习的负荷预测方法 |
CN113553540A (zh) * | 2020-04-24 | 2021-10-26 | 株式会社日立制作所 | 一种商品销量的预测方法 |
CN111723949A (zh) * | 2020-06-24 | 2020-09-29 | 中国石油大学(华东) | 基于选择性集成学习的孔隙度预测方法 |
CN114549046A (zh) * | 2022-01-17 | 2022-05-27 | 北京滴普科技有限公司 | 基于融合模型的销售预测方法、系统、设备及存储介质 |
CN115115416A (zh) * | 2022-07-21 | 2022-09-27 | 湖南大学 | 一种商品销量预测方法 |
CN115660720A (zh) * | 2022-11-04 | 2023-01-31 | 内蒙古昆明卷烟有限责任公司 | 一种卷烟销量预测方法及设备 |
CN115691813A (zh) * | 2022-12-30 | 2023-02-03 | 神州医疗科技股份有限公司 | 基于基因组学和微生物组学的遗传性胃癌评估方法及系统 |
Non-Patent Citations (2)
Title |
---|
Implementing Enhanced AdaBoost Algorithm for Sales Classification and Prediction;Von Kirby P. German等;《International Journal of Trade, Economics and Finance》;第8卷(第6期);270-273 * |
基于BP-AdaBoost 的电商短期销量预测模型;王丽红;《计算机系统应用》;260-264 * |
Also Published As
Publication number | Publication date |
---|---|
CN116245563A (zh) | 2023-06-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113537600B (zh) | 一种全过程耦合机器学习的中长期降水预报建模方法 | |
CN106971240A (zh) | 一种变量选择与高斯过程回归的短期负荷预测方法 | |
CN116245563B (zh) | 基于AdaBoost算法构建的商品销量融合预测模型 | |
CN106677763B (zh) | 一种基于动态集成建模的油井动液面预测方法 | |
CN105740984A (zh) | 一种基于性能预测的产品概念性能评价方法 | |
CN110059852A (zh) | 一种基于改进随机森林算法的股票收益率预测方法 | |
CN109919356B (zh) | 一种基于bp神经网络区间需水预测方法 | |
CN109143408B (zh) | 基于mlp的动态区域联合短时降水预报方法 | |
CN109947652A (zh) | 一种软件缺陷预测的改进排序学习方法 | |
CN115374995A (zh) | 一种分布式光伏、小风电场站功率预测方法 | |
CN110163444A (zh) | 一种基于gasa-svr的需水预测方法 | |
CN111310799A (zh) | 一种基于历史评估结果的主动学习算法 | |
CN113762387A (zh) | 一种基于混合模型预测的数据中心站多元负荷预测方法 | |
CN114004153A (zh) | 一种基于多源数据融合的侵彻深度预测方法 | |
CN116502455A (zh) | 一种激光选区熔化技术的工艺参数确定方法及系统 | |
Vavilova et al. | Application of genetic algorithm for adjusting the structure of multilayered neural network for prediction of investment processes | |
CN113282747A (zh) | 一种基于自动机器学习算法选择的文本分类方法 | |
CN117236278A (zh) | 一种基于数字孪生技术的芯片生产仿真方法及系统 | |
CN116822360A (zh) | 电力系统频率轨迹预测方法、装置、介质和设备 | |
CN116662925A (zh) | 一种基于加权稀疏神经网络工业过程软测量方法 | |
CN116384251A (zh) | 一种考虑风险规避的新能源发电功率组合预测方法及系统 | |
CN113240181B (zh) | 一种水库调度运行滚动模拟方法及装置 | |
CN109886288A (zh) | 一种用于电力变压器的状态评价方法及装置 | |
US20230214668A1 (en) | Hyperparameter adjustment device, non-transitory recording medium in which hyperparameter adjustment program is recorded, and hyperparameter adjustment program | |
CN112330029A (zh) | 一种基于多层convLSTM的渔场预测计算方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |