CN117710010A - 产品销量预测方法、装置、电子设备及存储介质 - Google Patents
产品销量预测方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN117710010A CN117710010A CN202311610758.2A CN202311610758A CN117710010A CN 117710010 A CN117710010 A CN 117710010A CN 202311610758 A CN202311610758 A CN 202311610758A CN 117710010 A CN117710010 A CN 117710010A
- Authority
- CN
- China
- Prior art keywords
- nonlinear
- prediction
- sample
- data
- sales
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 58
- 238000012549 training Methods 0.000 claims abstract description 23
- 230000007246 mechanism Effects 0.000 claims description 23
- 238000007781 pre-processing Methods 0.000 claims description 15
- 238000004590 computer program Methods 0.000 claims description 14
- 238000012545 processing Methods 0.000 claims description 14
- 230000015654 memory Effects 0.000 claims description 11
- 238000010586 diagram Methods 0.000 claims description 8
- 238000005457 optimization Methods 0.000 claims description 7
- 230000002159 abnormal effect Effects 0.000 claims description 6
- 230000009466 transformation Effects 0.000 claims description 6
- 230000006870 function Effects 0.000 description 7
- 238000004891 communication Methods 0.000 description 6
- 239000011159 matrix material Substances 0.000 description 5
- YHXISWVBGDMDLQ-UHFFFAOYSA-N moclobemide Chemical compound C1=CC(Cl)=CC=C1C(=O)NCCN1CCOCC1 YHXISWVBGDMDLQ-UHFFFAOYSA-N 0.000 description 5
- 230000004913 activation Effects 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 238000003062 neural network model Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000000306 recurrent effect Effects 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000013136 deep learning model Methods 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000010200 validation analysis Methods 0.000 description 2
- 208000000044 Amnesia Diseases 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000002790 cross-validation Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000007787 long-term memory Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 230000001373 regressive effect Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0202—Market predictions or forecasting for commercial activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
- G06N3/0442—Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Business, Economics & Management (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Accounting & Taxation (AREA)
- Strategic Management (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Finance (AREA)
- Health & Medical Sciences (AREA)
- Development Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Game Theory and Decision Science (AREA)
- Economics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及计算机技术领域,提供一种产品销量预测方法、装置、电子设备及存储介质,该方法获取产品的历史销量数据以及预测时间段的外部影响数据;基于线性预测模型,应用历史销量数据,确定预测时间段的线性预测值以及非线性残差;基于非线性预测模型,应用外部影响数据与非线性残差,确定预测时间段的非线性预测值;基于线性预测值以及非线性预测值,确定产品在预测时间段的销量预测值。结合线性预测模型以及非线性预测模型,得到预测时间段的线性预测值和非线性预测值,进而得到销量预测值,同时考虑了销量的线性和非线性趋势,使得到的销量预测值更加准确。而且,线性预测模型和非线性预测模型联合训练得到,可以进一步提升模型的性能。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及一种产品销量预测方法、装置、电子设备及存储介质。
背景技术
销量预测可视为一个时间序列预测问题,即通过之前一段时间的销量来预测后一段时间的销量。目前,对于销量预测的主流方法,通常是基于深度学习模型的方法。
基于深度学习模型的方法是利用通过外部影响因素以及产品的销量训练得到的销量预测模型,进行销量预测。这种方法虽然能够提升销量预测效率,但是由于销量时间序列既包含了线性趋势,又含有非线性规律,而销量预测模型无法同时准确地进行线性趋势预测以及非线性规律预测,进而无法保证预测精度。
因此,现急需提供一种产品销量预测方法。
发明内容
本发明提供一种产品销量预测方法、装置、电子设备及存储介质,用以解决现有技术中存在的缺陷。
本发明提供一种产品销量预测方法,包括:
获取产品的历史销量数据以及预测时间段的外部影响数据;
基于线性预测模型,应用所述历史销量数据,确定所述预测时间段的线性预测值以及非线性残差;
基于非线性预测模型,应用所述外部影响数据与所述非线性残差,确定所述预测时间段的非线性预测值;
基于所述线性预测值以及所述非线性预测值,确定所述产品在所述预测时间段的销量预测值;
其中,所述线性预测模型以及所述非线性预测模型基于所述产品的样本销量数据及其样本外部影响数据进行联合训练得到。
根据本发明提供的一种产品销量预测方法,所述线性预测模型以及所述非线性预测模型的训练步骤包括:
基于初始线性预测模型,应用所述样本销量数据中第一时间段的数据,确定第二时间段的线性样本预测值以及非线性样本残差;所述第一时间段先于所述第二时间段;
基于初始非线性预测模型,应用所述样本外部影响数据与所述非线性样本残差,确定所述第二时间段的非线性样本预测值;
基于所述线性样本预测值以及所述非线性样本预测值,确定所述第二时间段的样本销量预测值;
基于所述线性样本预测值以及所述样本销量数据中所述第二时间段的数据,计算第一损失,并基于所述样本销量预测值以及所述非线性样本残差,计算第二损失;
基于所述第一损失和所述第二损失,计算总损失,并基于所述总损失,对所述初始线性预测模型和所述初始非线性预测模型的结构参数进行迭代优化,得到所述线性预测模型和所述非线性预测模型。
根据本发明提供的一种产品销量预测方法,基于所述线性样本预测值以及所述样本销量数据中所述第二时间段的数据,计算第一损失,并基于所述样本销量预测值以及所述非线性样本残差,计算第二损失,包括:
计算所述线性样本预测值与所述第二时间段的数据的第一均方根误差,并将所述第一均方根误差作为所述第一损失;
计算所述样本销量预测值与所述非线性样本残差的第二均方根误差,并将所述第二均方根误差作为所述第二损失。
根据本发明提供的一种产品销量预测方法,基于初始线性预测模型,应用所述样本销量数据中第一时间段的数据,确定第二时间段的线性样本预测值以及非线性样本残差,包括:
基于箱线图,去除所述样本销量数据中的异常值,得到备选数据;
将所述备选数据进行对数变换或差分处理,并基于所述初始线性预测模型,应用处理所得结果中所述第一时间段的数据,确定所述线性样本预测值以及所述非线性样本残差。
根据本发明提供的一种产品销量预测方法,基于非线性预测模型,应用所述外部影响数据与所述非线性残差,确定所述预测时间段的非线性预测值,包括:
判断所述非线性残差是否为白噪声序列;
若所述非线性残差为白噪声序列,则基于所述非线性预测模型,应用所述外部影响数据与所述非线性残差,确定所述非线性预测值。
根据本发明提供的一种产品销量预测方法,基于非线性预测模型,应用所述外部影响数据与所述非线性残差,确定所述预测时间段的非线性预测值,包括:
将所述外部影响数据与所述非线性残差输入至所述非线性预测模型,由所述非线性预测模型基于注意力机制,确定所述非线性预测值。
根据本发明提供的一种产品销量预测方法,将所述外部影响数据与所述非线性残差输入至所述非线性预测模型,由所述非线性预测模型基于注意力机制,确定所述非线性预测值,包括:
将所述外部影响数据与所述非线性残差按时间进行对齐;
基于特征工程,对所述外部影响数据以及所述非线性残差进行预处理,并将预处理结果输入至所述非线性预测模型,由所述非线性预测模型基于注意力机制,确定所述非线性预测值。
本发明还提供一种产品销量预测装置,包括:
数据获取模块,用于获取产品的历史销量数据以及预测时间段的外部影响数据;
线性预测模块,用于基于线性预测模型,应用所述历史销量数据,确定所述预测时间段的线性预测值以及非线性残差;
非线性预测模块,用于基于非线性预测模型,应用所述外部影响数据与所述非线性残差,确定所述预测时间段的非线性预测值;
销量预测模块,用于基于所述线性预测值以及所述非线性预测值,确定所述产品在所述预测时间段的销量预测值;
其中,所述线性预测模型以及所述非线性预测模型基于所述产品的样本销量数据及其样本外部影响数据进行联合训练得到。
本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述任一种所述的产品销量预测方法。
本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述的产品销量预测方法。
本发明还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述的产品销量预测方法。
本发明提供的产品销量预测方法、装置、电子设备及存储介质,该方法首先获取产品的历史销量数据以及预测时间段的外部影响数据;然后基于线性预测模型,应用历史销量数据,确定预测时间段的线性预测值以及非线性残差;此后基于非线性预测模型,应用外部影响数据与非线性残差,确定预测时间段的非线性预测值;最后基于线性预测值以及非线性预测值,确定产品在所述预测时间段的销量预测值。该方法结合线性预测模型以及非线性预测模型,得到预测时间段的线性预测值和非线性预测值,进而得到销量预测值,同时考虑了销量的线性和非线性趋势,使得到的销量预测值更加准确。而且,该方法中线性预测模型和非线性预测模型联合训练得到,可以进一步提升模型的性能。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明提供的产品销量预测方法的流程示意图;
图2是本发明提供的产品销量预测装置的结构示意图;
图3是本发明提供的电子设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的说明书和权利要求书中的术语“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在发明的描述中,除非另有说明,“多个”的含义是两个或两个以上。此外,说明书以及权利要求中“和/或”表示所连接对象的至少其中之一,字符“/”,一般表示前后关联对象是一种“或”的关系。
由于销量等时间序列既包含了线性趋势,又含有非线性规律,而现有的销量预测模型无法同时准确地进行线性趋势预测以及非线性规律预测,进而无法保证预测精度,导致预测结果不可靠。因此,本发明实施例中提供了一种产品销量预测方法。
图1为本发明实施例中提供的一种产品销量预测方法的流程示意图,如图1所示,该方法包括:
S1,获取产品的历史销量数据以及预测时间段的外部影响数据;
S2,基于线性预测模型,应用所述历史销量数据,确定所述预测时间段的线性预测值以及非线性残差;
S3,基于非线性预测模型,应用所述外部影响数据与所述非线性残差,确定所述预测时间段的非线性预测值;
S4,基于所述线性预测值以及所述非线性预测值,确定所述产品在所述预测时间段的销量预测值;
其中,所述线性预测模型以及所述非线性预测模型基于所述产品的样本销量数据及其样本外部影响数据进行联合训练得到。
具体地,本发明实施例中提供的产品销量预测方法,其执行主体为产品销量预测装置,该装置可以配置于计算机内,该计算机可以为本地计算机或云计算机,本地计算机可以是电脑、平板等,此处不作具体限定。
首先执行步骤S1,获取产品的历史销量数据以及预测时间段的外部影响数据。该产品可以是商品,例如可以是电子产品、日用品以及食品等。历史销量数据可以是过去预设时间段内的销量数据的时间序列,预设时间段的长度可以根据需要进行设定。
预测时间段是未来某一天或某一段时间,例如可以是未来一天、未来第七天,或者可以是未来7-14天中的每一天等,此处不作具体限定。外部影响数据可以包括天气、季节、节假日等影响因素的时间序列。其中,天气可以是气温。
然后执行步骤S2,可以将历史销量数据作为线性预测模型的输入,由线性预测模型对历史销量数据进行编解码,得到预设时间段的线性预测值以及非线性残差。
该线性预测值是通过线性预测模型对历史销量数据进行拟合得到的预测时间段具有线性分布的销量数据的预测值,非线性残差是指线性预测值与实际销量数据之间具有非线性分布的残差。该线性预测模型可以是神经网络模型。
此后执行步骤S3,可以将外部影响数据与非线性残差作为非线性预测模型的输入,由非线性预测模型对外部影响数据以及非线性残差进行编解码,得到预测时间段的非线性预测值。
该非线性预测值是通过非线性预测模型预测得到的具有非线性分布的销量数据的预测值。该非线性预测模型也可以是神经网络模型。
非线性预测模型除了得到非线性预测值,还可以输出随机误差。
最后执行步骤S4,可以将线性预测值以及所述非线性预测值进行线性求和或加权求和,并将求和结果作为产品在预测时间段的销量预测值。
本发明实施例中,线性预测模型以及非线性预测模型可以利用产品的样本销量数据及其样本外部影响数据进行联合训练得到。
在线性预测模型以及非线性预测模型的训练过程中,可以先将样本销量数据中第一时间段的数据输入至初始线性预测模型,由初始线性预测模型得到第二时间段的线性样本预测值以及非线性样本残差。其中,第一时间段先于第二时间段,且第二时间段与预测时间段的时长相等。该初始线性预测模型可以基于初始神经网络模型构建。
然后,可以将样本外部影响数据与非线性样本残差输入至初始非线性预测模型,由初始非线性预测模型确定第二时间段的非线性样本预测值。
此后,可以将线性样本预测值以及非线性样本预测值进行线性求和或加权求和,确定第二时间段的样本销量预测值。
此后,可以利用样本销量预测值与样本销量数据中第二时间段的数据,计算损失,并利用该损失,对初始线性预测模型和初始非线性预测模型的结构参数进行迭代优化,直至达到预设迭代次数或者损失收敛,分别得到线性预测模型和非线性预测模型。其中,预设迭代次数可以根据需要进行设定,此处不作具体限定。
在结构参数迭代优化过程中,可以使用交叉验证即通过训练模型的不同组合,选择在验证集上性能最好的结构参数组合。对于每个交叉验证的迭代,使用训练集来训练模型,得出然后在相应的验证集上进行评估。结构参数的调优主要分成三类:网格搜索,随机搜索和贝叶斯调参,可以采用贝叶斯调参通过建模结构参数和性能之间的关系来动态地选择下一个尝试的结构参数组合。这种方法在多次试验后通常能够更快地找到各结构参数的最优解。
本发明实施例中提供的产品销量预测方法,首先获取产品的历史销量数据以及预测时间段的外部影响数据;然后基于线性预测模型,应用历史销量数据,确定预测时间段的线性预测值以及非线性残差;此后基于非线性预测模型,应用外部影响数据与非线性残差,确定预测时间段的非线性预测值;最后基于线性预测值以及非线性预测值,确定产品在所述预测时间段的销量预测值。该方法结合线性预测模型以及非线性预测模型,得到预测时间段的线性预测值和非线性预测值,进而得到销量预测值,同时考虑了销量的线性和非线性趋势,使得到的销量预测值更加准确。而且,该方法中线性预测模型和非线性预测模型联合训练得到,可以进一步提升模型的性能。
在上述实施例的基础上,本发明实施例中提供的产品销量预测方法中,线性预测模型可以是自回归整合移动平均模型(Autoregressive Integrated Moving AverageModel,ARIMA),ARIMA可以包括自回归模型(auto regressive model,AR)、移动平均模型(moving average model,MA)以及差分整合(I)。
ARIMA的优势在于对数据的自回归和移动平均部分进行建模,从而揭示数据的内在规律,可以提供对线性趋势和非线性趋势的理解。
ARIMA模型可以表示为:
其中,L为滞后算子(lag operato),Li为L的i次幂,p为自回归项数,q为滑动平均项数,d为差分阶数,Xt为t时刻的销量数据,为第i个自回归项的系数,θi为第i个滑动平均项的系数,εt为t时刻的噪声项。
在上述实施例的基础上,本发明实施例中提供的产品销量预测方法中,非线性预测模型可以是循环神经网络(Recurrent Neural Network,RNN)模型,例如可以是长短期记忆网络(Long Short-Term Memory,LSTM)模型、双向循环神经网络(Bidirectional RNN,Bi-RNN)等。其中,LSTM模型可以记住和利用历史销量数据中的长期模式,提高了对销量波动的敏感性。而且,LSTM模型在每一个层中都有一个cell状态来储存长期记忆并且都使用了非线性激活函数,因此LSTM模型能够很好的过滤历史销量数据中的非线性趋势。
对于一个时间序列X,LSTM模型引入了门机制来进行信息保护和控制。其中,输入门用于控制记忆单元更新的信息量,遗忘门用于控制前一时刻,输出门是用于控制输出至下一时隐藏状态的信息量具体公式如下:
定义LSTM模型t时刻的隐藏状态为Ht,t时刻的细胞状态为Ct,
遗忘门(Forget Gate)有:
ft=σ(Wf·[Ht-1,Xt]+bf)
其中,ft是遗忘门的输出,σ是sigmoid激活函数,Wf和bf是遗忘门的权重矩阵和偏差。
输入门(Input Gate)有:
it=σ(Wi·[Ht-1,Xt]+bi)
其中,it是输入门的输出,Wi和bi是输入门的权重矩阵和偏差。
细胞候选值(Candidate Cell Value)有:
C′t=tanh(Wc·[Ht-1,Xt]+bc)
其中,C′t是细胞候选值,tanh是双曲正切激活函数,Wc和bc是用于计算细胞候选值的权重矩阵和偏差。
细胞状态更新(Cell State Update)有:
Ct=ft·Ct-1+it·C′t
其中,Ct是更新后的细胞状态,Ct-1是前一个时间步骤的细胞状态。
输出门(Output Gate)有:
ot=σ(Wo·[Ht-1,Xt]+bo)
其中,ot是输出门的输出,Wo和bo是输出门的权重矩阵和偏差。隐藏状态更新(Hidden State Update)有:
Ht=ot·tanh(Ct)
其中,Ht是隐藏状态。
本发明实施例中,将ARIMA模型与LSTM模型相结合,可以削弱LSTM模型的记忆遗失,可以提升销量的预测精度。
在上述实施例的基础上,所述线性预测模型以及所述非线性预测模型的训练步骤包括:
基于初始线性预测模型,应用所述样本销量数据中第一时间段的数据,确定第二时间段的线性样本预测值以及非线性样本残差;所述第一时间段先于所述第二时间段;
基于初始非线性预测模型,应用所述样本外部影响数据与所述非线性样本残差,确定所述第二时间段的非线性样本预测值;
基于所述线性样本预测值以及所述非线性样本预测值,确定所述第二时间段的样本销量预测值;
基于所述线性样本预测值以及所述样本销量数据中所述第二时间段的数据,计算第一损失,并基于所述样本销量预测值以及所述非线性样本残差,计算第二损失;
基于所述第一损失和所述第二损失,计算总损失,并基于所述总损失,对所述初始线性预测模型和所述初始非线性预测模型的结构参数进行迭代优化,得到所述线性预测模型和所述非线性预测模型。
具体地,在线性预测模型以及非线性预测模型的训练过程中,计算损失时,可以利用线性样本预测值以及样本销量数据中第二时间段的数据,计算第一损失,并利用样本销量预测值以及非线性样本残差,计算第二损失。
其中,计算第一损失和第二损失时采用的损失函数可以需要进行选择,此处不作具体限定。
此后,可以将第一损失与第二损失进行加权求和或线性求和,得到总损失,然后利用总损失,对初始线性预测模型和初始非线性预测模型的结构参数进行迭代优化,得到线性预测模型和非线性预测模型。
本发明实施例中,第一损失的引入,可以有助于提升线性预测模型的精度,第二损失的引入,可以有助于提升线性预测模型以及非线性预测模型的整体精度,进而保证了销量预测值的准确性。
在上述实施例的基础上,基于所述线性样本预测值以及所述样本销量数据中所述第二时间段的数据,计算第一损失,并基于所述样本销量预测值以及所述非线性样本残差,计算第二损失,包括:
计算所述线性样本预测值与所述第二时间段的数据的第一均方根误差,并将所述第一均方根误差作为所述第一损失;
计算所述样本销量预测值与所述非线性样本残差的第二均方根误差,并将所述第二均方根误差作为所述第二损失。
具体地,本发明实施例中,第一损失可以是线性样本预测值与第二时间段的数据的第一均方根误差,第二损失可以是样本销量预测值与非线性样本残差的第二均方根误差。即有:
其中,Loss1为第一均方根误差,Loss2为第二均方根误差,N为第二时间段的时间节点数,为t时刻的线性样本预测值,/>为t时刻的样本销量预测值,y(t)为第二时间段中t时刻的数据,∩(t)为t时刻的非线性样本残差。
例如,总损失是第一损失与第二损失加权求和得到,则有:
Total_Loss=α×Loss1+β×Loss2
其中,Total_Loss为总损失,Loss1为第一损失,Loss2为第二损失,α和β分别为第一损失和第二损失的权重。
本发明实施例中,通过均方根误差计算损失,可以实现损失的快速计算,提高模型训练效率。
在上述实施例的基础上,基于初始线性预测模型,应用所述样本销量数据中第一时间段的数据,确定第二时间段的线性样本预测值以及非线性样本残差,包括:
基于箱线图,去除所述样本销量数据中的异常值,得到备选数据;
将所述备选数据进行对数变换或差分处理,并基于所述初始线性预测模型,应用处理所得结果中所述第一时间段的数据,确定所述线性样本预测值以及所述非线性样本残差。
具体地,为避免样本销量数据中的异常值对模型的训练过程产生影响,需要对样本销量数据进行预处理。该预处理操作可以包括绘制样本销量数据的箱线图,并利用箱线图去除样本销量数据中的异常值,得到备选数据。该异常值可以是由于数据采集错误或特殊促销事件引起的销量异常。
此后,可以将备选数据进行对数变换或差分处理,以使备选数据变为平稳的时间序列,保证模型对销量数据的理解和预测性能。
可以理解的是,平稳的时间序列是指时间序列的方差和均值均不随时间而变化。
假设一个时间序列X,如果它满足以下三个条件:
(1)X的二阶矩都存在;
(2)对于所有的时刻t,有E[{Xt}]=μ,其中μ是常数;
(3)对于任意时刻t、s,协方差函数γ(t,s)只与时间差t-s有关;
则称时间序列X是弱平稳的。对于一般的未知概率分布来说,只要进行多次重复试验,就可以获得足够的样本观测值来进行统计推断。而对于时间序列,历史无法重演,不能够得到足够的样本观测值,所以当时间序列X满足弱平稳性时,其均值就是一个与时间无关的常数,这样就可以利用一段时间的历史数据来进行预测。
同样地,在基于线性预测模型,应用所述历史销量数据,确定所述预测时间段的线性预测值以及非线性残差,之前包括:
基于箱线图,去除所述历史销量数据中的异常值,得到第一序列;
将所述第一序列进行对数变换或差分处理,得到第二序列;
基于所述线性预测模型,应用第二序列,确定线性预测值以及非线性残差。
在上述实施例的基础上,基于非线性预测模型,应用所述外部影响数据与所述非线性残差,确定所述预测时间段的非线性预测值,包括:
判断所述非线性残差是否为白噪声序列;
若所述非线性残差为白噪声序列,则基于所述非线性预测模型,应用所述外部影响数据与所述非线性残差,确定所述非线性预测值。
具体地,为保证非线性残差中的信息被完全提取,可以先通过检验模型判断非线性残差是否为白噪声序列,并且在非线性残差是白噪声序列的情况下,利用非线性预测模型,应用外部影响数据与非线性残差,确定非线性预测值,如此不仅可以提高非线性预测模型的准确性,还可以减少计算量,节约计算成本。
在上述实施例的基础上,基于非线性预测模型,应用所述外部影响数据与所述非线性残差,确定所述预测时间段的非线性预测值,包括:
将所述外部影响数据与所述非线性残差输入至所述非线性预测模型,由所述非线性预测模型基于注意力机制,确定所述非线性预测值。
具体地,非线性预测模型中可以引入注意力(attention)机制,从而消除某些市场因素对于销量预测的影响,增加销量预测的精度和预测时间段的长度。
例如,非线性预测模型可以是LSTM-Attention模型,在LSTM模型中加入注意力机制,可以为每个时间步骤的输入分配权重,通过注意力机制对外部影响数据进行加权融合,确定融合数据,并利用融合数据,对非线性残差进行加权,得到非线性预测值。
注意力机制允许非线性预测模型动态地关注外部因素中的不同部分,以便更好地捕捉其影响。
在这里引入注意力机制是为了告诉非线性预测模型哪些时刻在整个时间序列占据的权重更大,首先计算注意力分数,来衡量在每个时间节点计算外部影响数据与当前时刻的非线性残差之间的关联程度。然后将外部影响数据和非线性残差作为查询(query)和键(key),通过二者的乘积计算关联程度,产生注意力分数矩阵,其中每个元素表示查询向量与对应键向量之间的关联程度。
将注意力分数通过softmax函数进行归一化,以获得注意力权重。这些权重表示了每个外部影响数据在当前时刻的权重分配。
最后将外部影响数据与注意力权重相乘,以对不同部分进行加权融合,得到一个融合数据αt,并计算X′t=αt·Xt-1,则αt是由该时刻X′t和上一时刻Xt-1二者共同决定的,且它们的权重之和为1。然后利用X′t改写Xt代入非线性预测模型,完成attention的引入。
在上述实施例的基础上,将所述外部影响数据与所述非线性残差输入至所述非线性预测模型,由所述非线性预测模型基于注意力机制,确定所述非线性预测值,包括:
将所述外部影响数据与所述非线性残差按时间进行对齐;
基于特征工程,对所述外部影响数据以及所述非线性残差进行预处理,并将预处理结果输入至所述非线性预测模型,由所述非线性预测模型基于注意力机制,确定所述非线性预测值。
具体地,为保证外部影响数据的质量和一致性,需要对外部影响数据进行预处理,例如可以包括缺失值处理、平滑处理、标准化等处理方式。其中,标准化可以采用Z-score方式实现。
然后,将外部影响数据与非线性残差按时间进行对齐,以确保每一时刻都有相应的非线性残差和外部影响数据。
此后,通过特征工程,将外部影响数据转换成与非线性残差具有相同的时间节点数的数据,得到外部影响数据的预处理结果以及非线性残差的预处理结果,以便于顺利输入至非线性预测模型进行处理。
最终,将外部影响数据的预处理结果以及非线性残差的预处理结果输入至非线性预测模型,由非线性预测模型利用注意力机制,确定出非线性预测值。
在上述实施例的基础上,基于初始非线性预测模型,应用所述样本外部影响数据与所述非线性样本残差,确定所述第二时间段的非线性样本预测值,包括:
将所述样本外部影响数据与所述非线性样本残差输入至所述初始非线性预测模型,由所述初始非线性预测模型基于注意力机制,确定所述非线性样本预测值。
在上述实施例的基础上,将所述样本外部影响数据与所述非线性样本残差输入至所述初始非线性预测模型,由所述初始非线性预测模型基于注意力机制,确定所述非线性样本预测值,包括:
将所述样本外部影响数据与所述非线性样本残差按时间进行对齐;
基于特征工程,对所述样本外部影响数据与所述非线性样本残差进行预处理,并将预处理结果输入至所述初始非线性预测模型,由所述初始非线性预测模型基于注意力机制,确定所述非线性样本预测值。
综上所述,当本发明提供了一种线性预测模型-非线性预测模型-注意力机制的模型结构。先通过线性预测模型过滤历史销量数据中的线性趋势,再通过非线性预测模型提取线性预测模型得到的非线性残差中的非线性信息以及对预设时间段内的销量产生独立影响的外部影响数据,并在非线性预测模型中引入注意力机制,利用两种模型的优势融会贯通,相辅相成,以更全面、精准地捕捉销量数据中的潜在模式,从而提高对销量数据的预测精度。
如图2所示,在上述实施例的基础上,本发明实施例中提供了一种产品销量预测装置,包括:
数据获取模块21,用于获取产品的历史销量数据以及预测时间段的外部影响数据;
线性预测模块22,用于基于线性预测模型,应用所述历史销量数据,确定所述预测时间段的线性预测值以及非线性残差;
非线性预测模块23,用于基于非线性预测模型,应用所述外部影响数据与所述非线性残差,确定所述预测时间段的非线性预测值;
销量预测模块24,用于基于所述线性预测值以及所述非线性预测值,确定所述产品在所述预测时间段的销量预测值;
其中,所述线性预测模型以及所述非线性预测模型基于所述产品的样本销量数据及其样本外部影响数据进行联合训练得到。
在上述实施例的基础上,本发明实施例中提供的产品销量预测装置,还包括训练模块,用于:
基于初始线性预测模型,应用所述样本销量数据中第一时间段的数据,确定第二时间段的线性样本预测值以及非线性样本残差;所述第一时间段先于所述第二时间段;
基于初始非线性预测模型,应用所述样本外部影响数据与所述非线性样本残差,确定所述第二时间段的非线性样本预测值;
基于所述线性样本预测值以及所述非线性样本预测值,确定所述第二时间段的样本销量预测值;
基于所述线性样本预测值以及所述样本销量数据中所述第二时间段的数据,计算第一损失,并基于所述样本销量预测值以及所述非线性样本残差,计算第二损失;
基于所述第一损失和所述第二损失,计算总损失,并基于所述总损失,对所述初始线性预测模型和所述初始非线性预测模型的结构参数进行迭代优化,得到所述线性预测模型和所述非线性预测模型。
在上述实施例的基础上,本发明实施例中提供的产品销量预测装置,所述训练模块,具体用于:
计算所述线性样本预测值与所述第二时间段的数据的第一均方根误差,并将所述第一均方根误差作为所述第一损失;
计算所述样本销量预测值与所述非线性样本残差的第二均方根误差,并将所述第二均方根误差作为所述第二损失。
在上述实施例的基础上,本发明实施例中提供的产品销量预测装置,所述训练模块,还具体用于:
基于箱线图,去除所述样本销量数据中的异常值,得到备选数据;
将所述备选数据进行对数变换或差分处理,并基于所述初始线性预测模型,应用处理所得结果中所述第一时间段的数据,确定所述线性样本预测值以及所述非线性样本残差。
在上述实施例的基础上,本发明实施例中提供的产品销量预测装置,所述非线性预测模块具体用于:
判断所述非线性残差是否为白噪声序列;
若所述非线性残差为白噪声序列,则基于所述非线性预测模型,应用所述外部影响数据与所述非线性残差,确定所述非线性预测值。
在上述实施例的基础上,本发明实施例中提供的产品销量预测装置,所述非线性预测模块还具体用于:
将所述外部影响数据与所述非线性残差输入至所述非线性预测模型,由所述非线性预测模型基于注意力机制,确定所述非线性预测值。
在上述实施例的基础上,本发明实施例中提供的产品销量预测装置,所述非线性预测模块还具体用于:
将所述外部影响数据与所述非线性残差按时间进行对齐;
基于特征工程,对所述外部影响数据以及所述非线性残差进行预处理,并将预处理结果输入至所述非线性预测模型,由所述非线性预测模型基于注意力机制,确定所述非线性预测值。
具体地,本发明实施例中提供的产品销量预测装置中各模块的作用与上述方法类实施例中各步骤的操作流程是一一对应的,实现的效果也是一致的,具体参见上述实施例,本发明实施例中对此不再赘述。
图3示例了一种电子设备的实体结构示意图,如图3所示,该电子设备可以包括:处理器(Processor)310、通信接口(Communications Interface)320、存储器(Memory)330和通信总线340,其中,处理器310,通信接口320,存储器330通过通信总线340完成相互间的通信。处理器310可以调用存储器330中的逻辑指令,以执行上述各实施例中提供的产品销量预测方法。
此外,上述的存储器330中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,计算机程序可存储在非暂态计算机可读存储介质上,所述计算机程序被处理器执行时,计算机能够执行上述各实施例中提供的产品销量预测方法。
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各实施例中提供的产品销量预测方法。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种产品销量预测方法,其特征在于,包括:
获取产品的历史销量数据以及预测时间段的外部影响数据;
基于线性预测模型,应用所述历史销量数据,确定所述预测时间段的线性预测值以及非线性残差;
基于非线性预测模型,应用所述外部影响数据与所述非线性残差,确定所述预测时间段的非线性预测值;
基于所述线性预测值以及所述非线性预测值,确定所述产品在所述预测时间段的销量预测值;
其中,所述线性预测模型以及所述非线性预测模型基于所述产品的样本销量数据及其样本外部影响数据进行联合训练得到。
2.根据权利要求1所述的产品销量预测方法,其特征在于,所述线性预测模型以及所述非线性预测模型的训练步骤包括:
基于初始线性预测模型,应用所述样本销量数据中第一时间段的数据,确定第二时间段的线性样本预测值以及非线性样本残差;所述第一时间段先于所述第二时间段;
基于初始非线性预测模型,应用所述样本外部影响数据与所述非线性样本残差,确定所述第二时间段的非线性样本预测值;
基于所述线性样本预测值以及所述非线性样本预测值,确定所述第二时间段的样本销量预测值;
基于所述线性样本预测值以及所述样本销量数据中所述第二时间段的数据,计算第一损失,并基于所述样本销量预测值以及所述非线性样本残差,计算第二损失;
基于所述第一损失和所述第二损失,计算总损失,并基于所述总损失,对所述初始线性预测模型和所述初始非线性预测模型的结构参数进行迭代优化,得到所述线性预测模型和所述非线性预测模型。
3.根据权利要求2所述的产品销量预测方法,其特征在于,基于所述线性样本预测值以及所述样本销量数据中所述第二时间段的数据,计算第一损失,并基于所述样本销量预测值以及所述非线性样本残差,计算第二损失,包括:
计算所述线性样本预测值与所述第二时间段的数据的第一均方根误差,并将所述第一均方根误差作为所述第一损失;
计算所述样本销量预测值与所述非线性样本残差的第二均方根误差,并将所述第二均方根误差作为所述第二损失。
4.根据权利要求2所述的产品销量预测方法,其特征在于,基于初始线性预测模型,应用所述样本销量数据中第一时间段的数据,确定第二时间段的线性样本预测值以及非线性样本残差,包括:
基于箱线图,去除所述样本销量数据中的异常值,得到备选数据;
将所述备选数据进行对数变换或差分处理,并基于所述初始线性预测模型,应用处理所得结果中所述第一时间段的数据,确定所述线性样本预测值以及所述非线性样本残差。
5.根据权利要求1-4中任一项所述的产品销量预测方法,其特征在于,基于非线性预测模型,应用所述外部影响数据与所述非线性残差,确定所述预测时间段的非线性预测值,包括:
判断所述非线性残差是否为白噪声序列;
若所述非线性残差为白噪声序列,则基于所述非线性预测模型,应用所述外部影响数据与所述非线性残差,确定所述非线性预测值。
6.根据权利要求1-4中任一项所述的产品销量预测方法,其特征在于,基于非线性预测模型,应用所述外部影响数据与所述非线性残差,确定所述预测时间段的非线性预测值,包括:
将所述外部影响数据与所述非线性残差输入至所述非线性预测模型,由所述非线性预测模型基于注意力机制,确定所述非线性预测值。
7.根据权利要求1-4中任一项所述的产品销量预测方法,其特征在于,将所述外部影响数据与所述非线性残差输入至所述非线性预测模型,由所述非线性预测模型基于注意力机制,确定所述非线性预测值,包括:
将所述外部影响数据与所述非线性残差按时间进行对齐;
基于特征工程,对所述外部影响数据以及所述非线性残差进行预处理,并将预处理结果输入至所述非线性预测模型,由所述非线性预测模型基于注意力机制,确定所述非线性预测值。
8.一种产品销量预测装置,其特征在于,包括:
数据获取模块,用于获取产品的历史销量数据以及预测时间段的外部影响数据;
线性预测模块,用于基于线性预测模型,应用所述历史销量数据,确定所述预测时间段的线性预测值以及非线性残差;
非线性预测模块,用于基于非线性预测模型,应用所述外部影响数据与所述非线性残差,确定所述预测时间段的非线性预测值;
销量预测模块,用于基于所述线性预测值以及所述非线性预测值,确定所述产品在所述预测时间段的销量预测值;
其中,所述线性预测模型以及所述非线性预测模型基于所述产品的样本销量数据及其样本外部影响数据进行联合训练得到。
9.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1-7中任一项所述的产品销量预测方法。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-7中任一项所述的产品销量预测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311610758.2A CN117710010A (zh) | 2023-11-28 | 2023-11-28 | 产品销量预测方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311610758.2A CN117710010A (zh) | 2023-11-28 | 2023-11-28 | 产品销量预测方法、装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117710010A true CN117710010A (zh) | 2024-03-15 |
Family
ID=90157983
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311610758.2A Pending CN117710010A (zh) | 2023-11-28 | 2023-11-28 | 产品销量预测方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117710010A (zh) |
-
2023
- 2023-11-28 CN CN202311610758.2A patent/CN117710010A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111563706A (zh) | 一种基于lstm网络的多变量物流货运量预测方法 | |
CN110245801A (zh) | 一种基于组合挖掘模型的电力负荷预测方法及系统 | |
Dubois et al. | Data-driven predictions of the Lorenz system | |
CN111680786B (zh) | 一种基于改进权重门控单元的时序预测方法 | |
CN110059867B (zh) | 一种swlstm结合gpr的风速预测方法 | |
CN112733997B (zh) | 基于woa-lstm-mc的水文时间序列预测优化方法 | |
CN111461463A (zh) | 一种基于tcn-bp的短期负荷预测方法、系统及设备 | |
CN115587666A (zh) | 基于季节趋势分解和混合神经网络的负荷预测方法及系统 | |
CN110210656B (zh) | 基于站点行为分析的共享单车流量预测方法及系统 | |
CN112862004B (zh) | 基于变分贝叶斯深度学习的电网工程造价管控指标预测方法 | |
CN116303786B (zh) | 一种基于多维数据融合算法的区块链金融大数据管理系统 | |
Yang et al. | An ensemble prediction system based on artificial neural networks and deep learning methods for deterministic and probabilistic carbon price forecasting | |
CN116227180A (zh) | 基于数据驱动的机组组合智能决策方法 | |
CN116665798A (zh) | 一种空气污染趋势预警方法及相关装置 | |
CN118364963A (zh) | 基于lstm神经网络的建筑材料价格预测方法 | |
CN115062528A (zh) | 一种针对工业过程时序数据的预测方法 | |
CN107704944B (zh) | 一种基于信息论学习的股市波动区间预测模型的构建方法 | |
CN113408183A (zh) | 基于预测模型的车辆基地短期复合预测方法 | |
CN116628444A (zh) | 一种基于改进元学习的水质预警方法 | |
CN116681159A (zh) | 一种基于鲸鱼优化算法和dresn的短期电力负荷预测方法 | |
CN115619099A (zh) | 变电站安全防护评价方法、装置、计算机设备和存储介质 | |
CN117710010A (zh) | 产品销量预测方法、装置、电子设备及存储介质 | |
Yakushin et al. | Neural network model for forecasting statistics of communities of social networks | |
CN114363004A (zh) | 风险评估方法、装置、计算机设备和存储介质 | |
CN113344245A (zh) | 混合深度学习短期预测模型、方法、存储介质和计算设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |