CN115115416B - 一种商品销量预测方法 - Google Patents
一种商品销量预测方法 Download PDFInfo
- Publication number
- CN115115416B CN115115416B CN202210862555.1A CN202210862555A CN115115416B CN 115115416 B CN115115416 B CN 115115416B CN 202210862555 A CN202210862555 A CN 202210862555A CN 115115416 B CN115115416 B CN 115115416B
- Authority
- CN
- China
- Prior art keywords
- prediction model
- sales
- commodity
- basic
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 31
- 238000005096 rolling process Methods 0.000 claims abstract description 5
- 238000012549 training Methods 0.000 claims description 39
- 238000013528 artificial neural network Methods 0.000 claims description 9
- 210000004027 cell Anatomy 0.000 claims description 9
- 239000011159 matrix material Substances 0.000 claims description 9
- 230000015654 memory Effects 0.000 claims description 9
- 238000012417 linear regression Methods 0.000 claims description 7
- 230000006870 function Effects 0.000 claims description 6
- 230000005856 abnormality Effects 0.000 claims description 4
- FGUUSXIOTUKUDN-IBGZPJMESA-N C1(=CC=CC=C1)N1C2=C(NC([C@H](C1)NC=1OC(=NN=1)C1=CC=CC=C1)=O)C=CC=C2 Chemical compound C1(=CC=CC=C1)N1C2=C(NC([C@H](C1)NC=1OC(=NN=1)C1=CC=CC=C1)=O)C=CC=C2 FGUUSXIOTUKUDN-IBGZPJMESA-N 0.000 claims description 3
- 230000007787 long-term memory Effects 0.000 claims description 3
- 230000014759 maintenance of location Effects 0.000 claims description 3
- 210000002569 neuron Anatomy 0.000 claims description 3
- 238000010606 normalization Methods 0.000 claims description 3
- 230000002159 abnormal effect Effects 0.000 abstract description 7
- 238000013136 deep learning model Methods 0.000 abstract description 7
- 230000010354 integration Effects 0.000 abstract 2
- 238000010801 machine learning Methods 0.000 description 6
- 238000013135 deep learning Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000013068 supply chain management Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0202—Market predictions or forecasting for commercial activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Accounting & Taxation (AREA)
- Mathematical Physics (AREA)
- Computational Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Pure & Applied Mathematics (AREA)
- Software Systems (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
- Biophysics (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Operations Research (AREA)
- Probability & Statistics with Applications (AREA)
- General Health & Medical Sciences (AREA)
- Algebra (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Biology (AREA)
- Computational Linguistics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Game Theory and Decision Science (AREA)
- Economics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及一种商品销量预测方法。其发明内容主要包括:(1)基于多商品销量特征的滚动回归模型与深度学习模型的构建;(2)多种回归预测模型集成的销量精准预测方法。通过已被提出的商品历史销量和其它影响因素等特征,构建出滚动预测的回归模型,深度学习模型以及剔除异常值的深度学习模型。再将构建的多种模型进行回归集成,构建出最后的多模型集成回归预测学习器,从而对商品未来销量进行精准预测。
Description
技术领域
本发明涉及深度学习和大数据技术,是处理工业环境给出的历史数据后使用集成学习模型对未来销量进行预测的方法。
背景技术
企业进行销量预测对于企业供应链管理有着十分重要的作用,目前业界主要采取人工业务规则的方式进行销量预测,随着近年来机器学习技术的高速发展,一些研究人员将机器学习用于商品销量预测,例如使用多元线性回归模型,岭回归模型,以及深度学习中的长短期记忆网络模型进行单一的销量预测等。
目前基于机器学习的销量预测方法广泛采用的是使用单一的深度学习模型对销量进行预测,而商品的销量中容易出现异常销量数据,使用不同的单一模型会使其对异常数据过于敏感或过于不敏感,单一的模型往往又难以处理一个商品从历史到未来的所有特征,所以利用它们进行销量预测出的结果往往精度不高。
集成学习作为随着深度学习而新兴的概念,并非一个单独的机器学习算法,而是通过构建多个机器学习模型,并将其结合成一个最终的强学习模型,完成最终的任务。能够在保证模型准确度的同时提升了模型防止过拟合的能力。
本发明提取商品的销量统计特征,促销优惠特征,假期周末特征等,结合多种机器学习方法,用其创建了了数个适用于时序预测的深度学习模型,并且将其均视为弱学习器。综合它们运算出来的结果,利用深度学习模型不断迭代,能够在不断迭代中不断更新样本权重的特殊机制,提出了加权分类的方法来集成各个模型的结果,从而出预测商品的未来销量。
本发明针对单一模型无法精确针对商品进行高精度的销量预测的问题,提出了一种基于集成学习模型商品销量预测方法,该方法能够在减少异常数据对于结果的干扰的同时大幅度提升对于商品未来销量预测的准确性。
发明内容
本发明提供一种商品销量预测方法,旨在解决单一模型无法精准覆盖不同类型商品销量特性,难以适应普遍存在的异常数据以及模型对商品预测销量准确度不高的问题。
根据本发明的第一方面,提供一种商品销量预测方法,其特征在于:
商品销量预测模型包括:第一基础预测模型,第二基础预测模型,第三基础预测模型,集成预测模型。本方法包括:
步骤10:根据商品销售的历史数据,构建训练数据集。
其中,训练数据集中包含多种商品的数据,对于任一种商品,对应一数据集D={(X0,y0),…,(Xn,yn)},i=0,1,…,n,yi为第i日的销量,Xi=(xi-s,xi-s+1,…,xi-1)为第i日以前s日的销售特征数据集合,k=i-s,i-s+1,…,i-1,xk为第k日的销售特征数据,销售特征数据包括销量统计特征,促销优惠特征,假期周末特征。
步骤20:根据训练数据集构建第一基础预测模型。
其中,第一基础预测模型为滚动预测的线性回归模型步骤20包括:先赋给w,b初始值,用链式方法求出梯度且 然后沿着梯度的反方向不断更新参数,其中w的更新公式为 b的更新公式为使损失函数不断减小至收敛。损失函数使用均方误差,即
步骤30:根据训练数据集构建第二基础预测模型。
其中,第二基础预测模型为LSTM长短时记忆神经网络预测模型,第二基础预测模型由输入层、包含128个神经元的两个隐藏层和输出层组成;步骤30包括:首先判断在所述第二基础预测模型中的细胞是否需要丢弃信息,在其隐藏层中对于输入的Xi,LSTM将会根据,fi=σ(Wf·[hi-1,Xi]+bf),得到一个在0到1之间的数值给每个细胞状态中的值fi,结果为1表示完全保留,0表示完全舍弃,其中Wf是遗忘门的权重矩阵,bf是遗忘门的偏置项,hi-1为第i日上一日LSTM的输出值,再使用tanh层创建一个新的候选值向量Ci=tanh(Wc·[hi-1,Xi]+bc),对fi进行更新,其中Wc是tanh层的权重矩阵,bc是tanh层的偏置项,最后通过sigmoid层得到oi=σ(Wo·[hi-1,Xi]+bo),其中Wo是输出门的权重矩阵,bo是输出门的偏置项,把细胞状态经过tanh层行处理后的值和所述sigmoid层的输出相乘得到hi=oi·tanh(ci)。
步骤40:根据训练数据集构建第三基础预测模型。
其中,第三基础预测模型为基于线性回归剔除异常的LSTM长短时记忆神经网络回归模型;步骤40包括:对每一个商品,根据第一基础预测模型进行预测得到商品的每日销量预测值ypredict={ypredict0,ypredict1,…,ypredictn},根据商品的每日销量实际值yreal={yreal0,yreal1,…,yrealn}可以得到商品第i天的实际值和预测值的误差absi=yreali-ypredicti,再根据商品的平均销量AVE=SUM/n,对商品的历史数据进行判断,若第i天的absi>AVE,那么判断该商品在当日的销量数据出现了较大的误差,将其从训练数据集中剔除得到经过剔除异常的训练数据集,根据经过剔除异常的训练数据集构建LSTM长短时记忆神经网络预测模型得到第三基础预测模型。
步骤50:根据第一基础预测模型、第二基础预测模型、第三基础预测模型构建集成预测模型,包括以下步骤:
步骤51:对于每一种商品,根据待预测日期之前的历史数据得到待预测日期之前的每日商品销量预测值Ypredict={YLR,YLSTM,YLSTM_LR},其中,YLR为第一基础预测模型的结果,YLSTM为第二基础预测模型的结果,YLSTM_LR为第三预测模型的结果。
步骤52:根据待预测日期之前的每日商品销量真实值yreal,计算出一段时间内的预测平均误差,选取平均误差最小的模型为商品历史最优模型Mbest,其中Mbest的取值为第一基础预测模型、第二基础预测模型、第三基础预测模型对应的标签值。
步骤53:将Ypredict作为输入特征,将对应的Mbest作为输出特征,进行集成预测模型的子分类器模型训练,得到集成预测模型用以确定三种基础预测模型的权重。
步骤60:根据第一基础预测模型、第二基础预测模型、第三基础预测模型得到待预测日期的任一商品销量基础预测值,再根据集成预测模型确定的基础预测模型的权重,确定该商品的销量预测值。
进一步地,本发明所提供的商品销量预测方法,其特征在于,销量统计特征包括:过去预设数日的总销量,过去预设数周的总销量,该日是否为会员日,优惠券使用数量,是否为节假日,是否为周末;
进一步地,本发明所提供的商品销量预测方法,其特征在于,步骤53包括:
步骤a:对样本Ypredict中三个模型赋以样本基本权重Dk,其中k为训练步骤a-e执行的轮次,第一轮训练时,三个模型权重相等且总和为1;
步骤b:使用第k个基弱线性分类器训练数据,得到第k个基弱线性分类器的错误率;
步骤c:根据第k个基弱线性分类器的错误率,计算第k个基弱线性分类器的加权误差率其中I表示括号内条件成立时为1,否则为0,其中,Gk(Ypredict_i)是基弱线性分类器的预测结果,Wki为第k轮第i个样本Ypredict_i的权重,m为样本总数;
步骤d:根据分类器的加权误差率,求出该轮基弱线性分类器的权重
步骤e:对下一轮样本基本权重进行设置,Dk+1={Wk+1,1,Wk+1,2...Wk+1,m},其中,Wk+1,i为第k+1轮里第i个样本的权重, 规范化因子
步骤f:重复步骤a-e训练,直到训练完成所有K个分类器,构建线性组合对于待预测日期即第m+1日,先通过所述第一基础预测模型、所述第二基础预测模型、所述第三基础预测模型得到Ypredict_m+1,在根据所述线性组合得出的商品预测数为f(Ypredict_m+1)。
根据本发明的第二方面,提供一种计算机设备,其特征在于,包括:
存储器,用于存储指令;以及
处理器,用于调用存储器存储的指令执行如权利要求1-3中任一项的商品销量预测方法。
根据本发明的第三方面,提供一种计算机可读存储介质,其特征在于,存储有指令,指令被处理器执行时,执行如权利要求1-3的商品销量预测方法。
与现有技术相比,本发明所构思的上述技术方案至少具有以下有益效果:
1、将商品销量的单一维度通过统计分析进行了扩展,构建出多维特征池,并通过计算和其他商品销量的关联度选取了一些关联度最高的特征。
2、考虑到商品普遍存在的异常波动性,构建出检验商品异常值的方法,提高了销量预测在商品中的普遍性,进一步降低了商品预测误差。
3、针对不同商品存在的不同特性,使用集成学习确定了各自合适的模型权重,更贴近真实数据效果。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
图1是根据一示例性实施例示出的商品销量预测方法示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。
这里将详细地对示例性实施例进行说明,其示例表示在附图中。
本发明所涉及的商品销量预测方法,商品销量预测模型包括:第一基础预测模型,第二基础预测模型,第三基础预测模型,集成预测模型。如图1所示,本方法包括:
步骤10:根据商品销售的历史数据,构建训练数据集。
其中,训练数据集中包含多种商品的数据,对于任一种商品,对应一数据集D={(X0,y0),…,(Xn,yn)},i=0,1,…,n,yi为第i日的销量,Xi=(xi-s,xi-s+1,…,xi-1)为第i日以前s日的销售特征数据集合,k=i-s,i-s+1,…,i-1,xk为第k日的销售特征数据,销售特征数据包括销量统计特征,促销优惠特征,假期周末特征。
步骤20:根据训练数据集构建第一基础预测模型。
其中,第一基础预测模型为滚动预测的线性回归模型步骤20包括:先赋给w,b初始值,用链式方法求出梯度目. 然后沿着梯度的反方向不断更新参数,其中w的更新公式为 b的更新公式为使损失函数不断减小至收敛。损失函数使用均方误差,即
步骤30:根据训练数据集构建第二基础预测模型。
其中,第二基础预测模型为LSTM长短时记忆神经网络预测模型,第二基础预测模型由输入层、包含128个神经元的两个隐藏层和输出层组成;步骤30包括:首先判断在所述第二基础预测模型中的细胞是否需要丢弃信息,在其隐藏层中对于输入的Xi,LSTM将会根据,fi=σ(Wf·[hi-1,Xi]+bf),得到一个在0到1之间的数值给每个细胞状态中的值fi,结果为1表示完全保留,0表示完全舍弃,其中Wf是遗忘门的权重矩阵,bf是遗忘门的偏置项,hi-1为第i日上一日LSTM的输出值,再使用tanh层创建一个新的候选值向量Ci=tanh(Wc·[hi-1,Xi]+bc),对fi进行更新,其中Wc是tanh层的权重矩阵,bc是tanh层的偏置项,最后通过sigmoid层得到oi=σ(Wo·[hi-1,Xi]+bo),其中Wo是输出门的权重矩阵,bo是输出门的偏置项,把细胞状态经过tanh层行处理后的值和所述sigmoid层的输出相乘得到hi=oi·tanh(ci)。
步骤40:根据训练数据集构建第三基础预测模型。
其中,第三基础预测模型为基于线性回归剔除异常的LSTM长短时记忆神经网络回归模型;步骤40包括:对每一个商品,根据第一基础预测模型进行预测得到商品的每日销量预测值ypredict={ypredict0,ypredict1,…,ypredictn},根据商品的每日销量实际值yreal={yreal0,yreal1,…,yrealn}可以得到商品第i天的实际值和预测值的误差absi=yreali-ypredicti,再根据商品的平均销量AVE=SUM/n,对商品的历史数据进行判断,若第i天的absi>AVE,那么判断该商品在当日的销量数据出现了较大的误差,将其从训练数据集中剔除得到经过剔除异常的训练数据集,根据经过剔除异常的训练数据集构建LSTM长短时记忆神经网络预测模型得到第三基础预测模型。
步骤50:根据第一基础预测模型、第二基础预测模型、第三基础预测模型构建集成预测模型,包括以下步骤:
步骤51:对于每一种商品,根据待预测日期之前的历史数据得到待预测日期之前的每日商品销量预测值Ypredict={YLR,YLSTM,YLSTM_LR},其中,YLR为第一基础预测模型的结果,YLSTM为第二基础预测模型的结果,YLSTM_LR为第三预测模型的结果。
步骤52:根据待预测日期之前的每日商品销量真实值yreal,计算出一段时间内的预测平均误差,选取平均误差最小的模型为商品历史最优模型Mbest,其中Mbest的取值为第一基础预测模型、第二基础预测模型、第三基础预测模型对应的标签值。
步骤53:将Ypredict作为输入特征,将对应的Mbest作为输出特征,进行集成预测模型的子分类器模型训练,得到集成预测模型用以确定三种基础预测模型的权重。
步骤60:根据第一基础预测模型、第二基础预测模型、第三基础预测模型得到待预测日期的任一商品销量基础预测值,再根据集成预测模型确定的基础预测模型的权重,确定该商品的销量预测值。
在一些实施例中,销量统计特征包括:过去预设数日的总销量,过去预设数周的总销量,该日是否为会员日,优惠券使用数量,是否为节假日,是否为周末。
在一些实施例中,步骤53包括:
步骤a:对样本Ypredict中三个模型赋以样本基本权重Dk,其中k为训练步骤a-e执行的轮次,第一轮训练时,三个模型权重相等且总和为1;
步骤b:使用第k个基弱线性分类器训练数据,得到第k个基弱线性分类器的错误率;
步骤c:根据第k个基弱线性分类器的错误率,计算第k个基弱线性分类器的加权误差率其中I表示括号内条件成立时为1,否则为0,其中,Gk(Ypredict_i)是基弱线性分类器的预测结果,Wki为第k轮第i个样本Ypredict_i的权重,m为样本总数;
步骤d:根据分类器的加权误差率,求出该轮基弱线性分类器的权重
步骤e:对下一轮样本基本权重进行设置,Dk+1={Wk+1,1,Wk+1,2...Wk+1,m},其中,Wk+1,i为第k+1轮里第i个样本的权重, 规范化因子
步骤f:重复步骤a-e训练,直到训练完成所有K个分类器,构建线性组合对于待预测日期即第m+1日,先通过所述第一基础预测模型、所述第二基础预测模型、所述第三基础预测模型得到Ypredict_m+1,在根据所述线性组合得出的商品预测数为f(Ypredict_m+1)。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本发明未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。
Claims (5)
1.一种商品销量预测方法,其特征在于:
商品销量预测模型包括:第一基础预测模型,第二基础预测模型,第三基础预测模型,集成预测模型,所述方法包括:
步骤10:根据商品销售的历史数据,构建训练数据集;
其中,所述训练数据集中包含多种商品的数据,对于任一种商品,对应一数据集D={(X0,y0),…,(Xn,yn)},i=0,1,…,n,yi为第i日的销量,Xi=(xi-s,xi-s+1,…,xi-1)为第i日以前s日的销售特征数据集合,k=i-s,i-s+1,…,i-1,xk为第k日的销售特征数据,所述销售特征数据包括销量统计特征,促销优惠特征,假期周末特征;
步骤20:根据所述训练数据集构建所述第一基础预测模型;
其中,所述第一基础预测模型为滚动预测的线性回归模型所述步骤20包括:先赋给w,b初始值,用链式方法求出梯度且然后沿着梯度的反方向不断更新参数,其中w的更新公式为b的更新公式为使损失函数不断减小至收敛,损失函数使用均方误差,即
步骤30:根据所述训练数据集构建所述第二基础预测模型;
其中,所述第二基础预测模型为LSTM长短时记忆神经网络预测模型,所述第二基础预测模型由输入层、包含128个神经元的两个隐藏层和输出层组成;所述步骤30包括:首先判断在所述第二基础预测模型中的细胞是否需要丢弃信息,在其隐藏层中对于输入的Xi,LSTM将会根据,fi=σ(Wf·[hi-1,Xi]+bf),得到一个在0到1之间的数值给每个细胞状态中的值fi,结果为1表示完全保留,0表示完全舍弃,其中Wf是遗忘门的权重矩阵,bf是遗忘门的偏置项,hi-1为第i日上一日LSTM模型的输出值,再使用tanh层创建一个新的候选值向量Ci=tanh(Wc·[hi-1,Xi]+bc),对fi进行更新,其中Wc是tanh层的权重矩阵,bc是tanh层的偏置项,最后通过sigmoid层得到oi=σ(Wo·[hi-1,Xi]+bo),其中Wo是输出门的权重矩阵,bo是输出门的偏置项,把细胞状态经过tanh层行处理后的值和所述sigmoid层的输出相乘得到第i日LSTM模型的输出hi=oi·tanh(ci);
步骤40:根据所述训练数据集构建所述第三基础预测模型;
其中,所述第三基础预测模型为基于线性回归剔除异常的LSTM长短时记忆神经网络回归模型;所述步骤40包括:对每一个商品,根据所述第一基础预测模型进行预测得到商品的每日销量预测值ypredict={ypredict0,ypredict1,…,ypredictn},根据商品的每日销量实际值yreal={yreal0,yreal1,…,yrealn}可以得到商品第i天的实际值和预测值的误差absi=yreali-ypredicti,再根据商品的平均销量AVE=SUM/n,对商品的历史数据进行判断,若第i天的absi>AVE,那么判断该商品在当日的销量数据出现了较大的误差,将其从所述训练数据集中剔除得到经过剔除异常的训练数据集,根据所述经过剔除异常的训练数据集构建LSTM长短时记忆神经网络预测模型得到所述第三基础预测模型;
步骤50:根据所述第一基础预测模型、所述第二基础预测模型、所述第三基础预测模型构建集成预测模型,包括以下步骤:
步骤51:对于每一种商品,根据待预测日期之前的历史数据得到待预测日期之前的每日商品销量预测值Ypredict={YLR,YLSTM,YLSTM_LR},其中,YLR为所述第一基础预测模型的结果,YLSTM为所述第二基础预测模型的结果,YLSTM_LR为所述第三基础预测模型的结果;
步骤52:根据待预测日期之前的每日商品销量真实值yreal,计算出一段时间内的预测平均误差,选取平均误差最小的模型为商品历史最优模型Mbest,其中Mbest的取值为所述第一基础预测模型、所述第二基础预测模型、所述第三基础预测模型对应的标签值;
步骤53:将Ypredict作为输入特征,将对应的Mbest作为输出特征,进行所述集成预测模型的子分类器模型训练,得到所述集成预测模型用以确定三种基础预测模型的权重;
步骤60:根据所述第一基础预测模型、所述第二基础预测模型、所述第三基础预测模型得到待预测日期的任一商品销量基础预测值,再根据集成预测模型确定的基础预测模型的权重,确定该商品的销量预测值。
2.根据权利要求1所述的商品销量预测方法,其特征在于,所述销量统计特征包括:过去预设数日的总销量,过去预设数周的总销量,该日是否为会员日,优惠券使用数量,是否为节假日,是否为周末。
3.根据权利要求1所述的商品销量预测方法,其特征在于,所述步骤53包括:
步骤a:对样本Ypredict中三个模型赋以样本基本权重Dk,其中k为训练步骤a-e执行的轮次,第一轮训练时,三个模型样本基本权重相等且总和为1;
步骤b:使用第k个基弱线性分类器训练数据,得到第k个基弱线性分类器的错误率;
步骤c:根据第k个基弱线性分类器的错误率,计算第k个基弱线性分类器的加权误差率其中I表示括号内条件成立时为1,否则为0,其中,Gk(Ypredict_i)是基弱线性分类器的预测结果,Wki为第k轮第i个样本Ypredict_i的权重,m为样本总数;
步骤d:根据分类器的加权误差率,求出该轮基弱线性分类器的权重
步骤e:对下一轮样本基本权重进行设置,Dk+1={Wk+1,1,Wk+1,2...Wk+1,m},其中,Wk+1,i为第k+1轮里第i个样本的权重,i=1,2,…,m,规范化因子
步骤f:重复步骤a-e训练,直到训练完成所有K个分类器,构建线性组合对于待预测日期即第m+1日,先通过所述第一基础预测模型、所述第二基础预测模型、所述第三基础预测模型得到Ypredict_m+1,在根据所述线性组合得出的商品预测数为f(Ypredict_m+1)。
4.一种计算机设备,其特征在于,包括:
存储器,用于存储指令;以及
处理器,用于调用所述存储器存储的指令执行如权利要求1-3中任一项所述的商品销量预测方法。
5.一种计算机可读存储介质,其特征在于,存储有指令,所述指令被处理器执行时,执行如权利要求1-3所述的商品销量预测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210862555.1A CN115115416B (zh) | 2022-07-21 | 2022-07-21 | 一种商品销量预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210862555.1A CN115115416B (zh) | 2022-07-21 | 2022-07-21 | 一种商品销量预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115115416A CN115115416A (zh) | 2022-09-27 |
CN115115416B true CN115115416B (zh) | 2024-07-02 |
Family
ID=83333650
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210862555.1A Active CN115115416B (zh) | 2022-07-21 | 2022-07-21 | 一种商品销量预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115115416B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115577991B (zh) * | 2022-12-08 | 2023-04-18 | 南京风船云聚信息技术有限公司 | 一种基于大数据的商业智能数据分析系统及分析方法 |
CN116151861B (zh) * | 2023-04-21 | 2023-07-18 | 杭州比智科技有限公司 | 基于间断时间序列样本构建的销量预测模型的构建方法 |
CN116245563B (zh) * | 2023-05-11 | 2023-10-27 | 中国石油大学(华东) | 基于AdaBoost算法构建的商品销量融合预测模型 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109509030A (zh) * | 2018-11-15 | 2019-03-22 | 北京旷视科技有限公司 | 销量预测方法及其模型的训练方法、装置和电子系统 |
CN109978612A (zh) * | 2019-03-18 | 2019-07-05 | 北京工业大学 | 一种基于深度学习的便利店销量预测方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107239963A (zh) * | 2016-03-29 | 2017-10-10 | 阿里巴巴集团控股有限公司 | 抢购平台商品上线方法、装置及抢购系统 |
CN113553540A (zh) * | 2020-04-24 | 2021-10-26 | 株式会社日立制作所 | 一种商品销量的预测方法 |
-
2022
- 2022-07-21 CN CN202210862555.1A patent/CN115115416B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109509030A (zh) * | 2018-11-15 | 2019-03-22 | 北京旷视科技有限公司 | 销量预测方法及其模型的训练方法、装置和电子系统 |
CN109978612A (zh) * | 2019-03-18 | 2019-07-05 | 北京工业大学 | 一种基于深度学习的便利店销量预测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN115115416A (zh) | 2022-09-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN115115416B (zh) | 一种商品销量预测方法 | |
Ardia et al. | Questioning the news about economic growth: Sparse forecasting using thousands of news-based sentiment values | |
CN107967542B (zh) | 一种基于长短期记忆网络的售电量预测方法 | |
CN111563706A (zh) | 一种基于lstm网络的多变量物流货运量预测方法 | |
Liu et al. | LSTM based reserve prediction for bank outlets | |
CN113139605A (zh) | 基于主成分分析和lstm神经网络的电力负荷预测方法 | |
CN115760380A (zh) | 一种融合用电信息的企业信用评估方法与系统 | |
Foryś | Machine learning in house price analysis: regression models versus neural networks | |
Sadouk et al. | A novel cost‐sensitive algorithm and new evaluation strategies for regression in imbalanced domains | |
CN114819395A (zh) | 一种基于长短期记忆神经网络和支持向量回归组合模型的行业中长期负荷预测方法 | |
Mitchell et al. | Nowcasting Euro area GDP growth using Bayesian quantile regression | |
CN117196695B (zh) | 一种目标产品的销量数据的预测方法及装置 | |
Wu et al. | A forecasting model based support vector machine and particle swarm optimization | |
CN110648023A (zh) | 基于二次指数平滑改进gm(1,1)的数据预测模型的建立方法 | |
CN115083511A (zh) | 基于图表示学习与注意力的外围基因调控特征提取方法 | |
Pundir et al. | Machine learning for revenue forecasting: A case study in retail business | |
CN110673470B (zh) | 基于局部加权因子模型的工业非平稳过程软测量建模方法 | |
CN113159419A (zh) | 一种群体特征画像分析方法、装置、设备及可读存储介质 | |
CN112884028A (zh) | 一种系统资源调整方法、装置及设备 | |
Agyarko et al. | Modelling the volatility of the Ghana stock market: A comparative study | |
Greberg et al. | Using Gradient Boosting to Identify Pricing Errors in GLM-Based Tariffs for Non-life Insurance | |
CN114386196B (zh) | 一种板带力学性能预测准确性评估方法 | |
Zannetos | Statistical attributes of group depreciation | |
Irawan et al. | Prediction of Incoming Orders Using the Long Short-term Memory Method at PT. Xyz | |
Nawaz | Analysis of Transactional Data with Long Short-Term Memory Recurrent Neural Networks |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |