CN111882157A - 一种基于深度时空神经网络的需求预测方法、系统及计算机可读存储介质 - Google Patents

一种基于深度时空神经网络的需求预测方法、系统及计算机可读存储介质 Download PDF

Info

Publication number
CN111882157A
CN111882157A CN202010586879.8A CN202010586879A CN111882157A CN 111882157 A CN111882157 A CN 111882157A CN 202010586879 A CN202010586879 A CN 202010586879A CN 111882157 A CN111882157 A CN 111882157A
Authority
CN
China
Prior art keywords
demand
data
sequence data
demand sequence
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010586879.8A
Other languages
English (en)
Inventor
吕赐兴
晏晓辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dongguan University of Technology
Original Assignee
Dongguan University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dongguan University of Technology filed Critical Dongguan University of Technology
Priority to CN202010586879.8A priority Critical patent/CN111882157A/zh
Publication of CN111882157A publication Critical patent/CN111882157A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0631Resource planning, allocation, distributing or scheduling for enterprises or organisations
    • G06Q10/06315Needs-based resource requirements planning or analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/04Manufacturing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Physics & Mathematics (AREA)
  • Development Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Tourism & Hospitality (AREA)
  • General Health & Medical Sciences (AREA)
  • Game Theory and Decision Science (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Educational Administration (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Manufacturing & Machinery (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

为了对未来的需求进行更好的预测,本发明公开了一种基于深度时空神经网络的需求预测方法,包括以下步骤:采集历史订单的需求序列数据,对采集历史订单的需求序列数据进行预处理,得到预处理后的历史订单的需求序列数据;基于预处理后的历史订单的需求序列数据构建数据集;搭建基于注意力机制和因果扩展卷积的神经网络的需求序列预测模型;利用数据集对需求序列预测模型进行训练,得到训练后的需求序列预测模;通过预处理后的历史订单的需求序列数据,结合训练后的需求序列预测模,得到未来的需求预测结果。本发明还公开了一种基于深度时空神经网络的需求预测系统,以及对应存储有需求预测方法和/或需求预测系统的计算机可读存储介质。

Description

一种基于深度时空神经网络的需求预测方法、系统及计算机 可读存储介质
技术领域
本发明涉及信息预测领域,更具体地,涉及一种基于深度时空神经网络的需求预测方法、系统及计算机可读存储介质。
背景技术
制造业供应风险的影响因素识别及供应风险的管理和控制成为了提升制造效率的关键。其中,制造供应链需求信息的预测是研究中的一个关键点,因为准确的预测能够有效避免牛鞭效应。显然,供应链的递归效应决定了应当先预测下游的需求信息,然后根据需求产生相应订单,最后根据订单信息才能制定生产决策,并为库存管理提供依据.所以精准的需求预测可以控制库存成本,缩减供应提前期,同时降低断货、缺货的风险。
现有的预测方法主要包括定性法、因果关系法、仿真法和时间序列法。
定性方法主要依赖于人的主观判断,适用于只能获得很少的历史数据或专家的意见十分重要的场合,适用场景有限。主要有集体讨论法、类比法、市场研究法、德尔菲法。
因果关系法假定需求预测与某些外界因素(如经济状况、利率)等高度相关,找到这些外界因素与需求之间的关联性,通过预测外界因素的变化来预测需求。
仿真法通过建立仿真模型,通过仿真模型模拟需求方来预测需求。
时间序列数据法利用相关的预测模型,以历史数据作为输入,基于历史观察数据来预测未来的需求。如何找到并描述时间序列数据的变化规律,建立相应的预测模型从而降低模型的预测误差对时间序列数据预测至关重要。
发明内容
本发明克服了上述现有的技术不足,提供一种基于深度时空神经网络的需求预测方法、系统及计算机可读存储介质。本发明结合实际需求数据突发性较强和时空依赖的特点进行模型训练和定量预测,其可以显著提高需求预测的精度。
为解决上述技术问题,本发明的技术方案如下:
一种基于深度时空神经网络的需求预测方法,包括以下步骤:
采集历史订单的需求序列数据,对采集历史订单的需求序列数据进行预处理,得到预处理后的历史订单的需求序列数据;
基于预处理后的历史订单的需求序列数据构建数据集,所述的数据集包括输入需求序列数据和预测结果序列数据;并数据集划分为训练数据子集和测试数据子集;所述的输入需求序列数据包括预处理后的历史订单的需求序列数据;
搭建基于注意力机制和因果扩展卷积的神经网络的需求序列预测模型;
利用数据集对需求序列预测模型进行训练,得到训练后的需求序列预测模型;
通过预处理后的历史订单的需求序列数据,结合训练后的需求序列预测模型,得到未来的需求预测结果。
本发明中通过基于因果扩展卷积的神经网络模型实现对供应链需求的预测功能,有效的提高了预测准确性,并且当数据样本差异性较大时,基于因果扩展卷积的神经网络模型的优势更加显著。
在一种优选的方案中,所述的预处理包括以下子步骤:
对采集历史订单的需求序列数据中存在缺失信息的需求序列数据和存在错误的需求序列数据进行删除;
若时间节点缺乏对应的需求序列数据,则以上述时间节点周围的时间节点的同类需求的平均值进行填充到上述时间节点中。
在一种优选的方案中,所述的数据集包括以下内容:
预处理后的历史订单的需求序列数据采用滑动窗口方法,通过选择一个需求序列数据为一个周期进行滑窗,从而构建多个训练窗口,扩大训练集数量;最后的a个需求序列数据作为预测结果序列数据,剩余的需求序列数据作为输入需求序列数据;所述的a是预设值;
将数据集中x的需求序列数据作为训练数据子集,将数据集中y的需求序列数据作为测试数据子集,所述的p+q=1。
在一种优选的方案中,所述的p=0.8。
在一种优选的方案中,所述的“搭建基于注意力机制和因果扩展卷积的神经网络的需求序列预测模型”中的需求序列预测模型包括以下内容:
需求序列预测模型的时空层包括β个inception模块,每个inception模块包含γ个分支,每个分支都包含因果卷积和扩展卷积。
本优选方案中,通过inception神经网络模块作为神经网络对数据进行训练,不仅灵活性高,且具备可移植性。
在一种优选的方案中,所述的β的取值范围是[3,7]。
在一种优选的方案中,所述的γ=5。
在一种优选的方案中,所述的“利用数据集对需求序列预测模型进行训练”包括以下内容:
inception模块的隐藏单元的输出值通过下式进行表达:
y=w·x+b
式中,所述的y表示输出值,所述的x表示输入值,所述的w表示权重值的矩阵,所述的b表示偏置值向量;
对输入数据进行训练时,通过损失函数评估需求序列预测模型的目标输出和实际输出的差距的函数,所述的函数值越小说明实际输出与目标输出的差值越小,表示权重值越合适;
通过Adam算法对损失函数进行优化,定义初始学习率δ,对损失函数进行迭代更新。
在一种优选的方案中,所述的损失函数通过下式进行表达:
Figure BDA0002554997320000031
式中,所述的Loss表示损失值;所述的y_result表示每次神经网络的输出值;所述的y_real表示实际的原始数据;所述的i表示输入的第i个需求序列数据;所述的n表示输入的需求序列数据的数量。
本优选方案中,将神经元的输出值y_result减去真实值y_real,再进行平方,最后使用计算平均计算得到方差;得到的方差也就是损失函数的损失值。
在一种优选的方案中,所述的δ=0.001。
本发明还公开了一种基于深度时空神经网络的需求预测系统,包括采集模块、预处理模块、数据集模块、建模模块和预测模块,其中,
所述的采集模块用于采集历史订单的需求序列数据;
所述的预处理模块用于将采集模块的历史订单的需求序列数据进行预处理,得到预处理后的历史订单的需求序列数据;
所述的数据集模块通过预处理模块的预处理后的历史订单的需求序列数据构建数据集,所述的数据集包括输入需求序列数据和预测结果序列数据;并数据集划分为训练数据子集和测试数据子集;所述的输入需求序列数据包括预处理后的历史订单的需求序列数据;
所述的建模模块用于构建基于注意力机制和因果扩展卷积的神经网络的需求序列预测模型;再通过数据集模块的数据集对需求序列预测模型进行训练,得到训练后的需求序列预测模型;
所述的预测模块根据建模模块的训练后的需求序列预测模型,结合预处理模块的预处理后的历史订单的需求序列数据,得到未来的需求预测结果。
本发明中通过基于因果扩展卷积的神经网络模型实现对供应链需求的预测功能,有效的提高了预测准确性,并且当数据样本差异性较大时,基于因果扩展卷积的神经网络模型的优势更加显著。
在一种优选的方案中,所述的预处理模块包括以下功能:
对采集历史订单的需求序列数据中存在缺失信息的需求序列数据和存在错误的需求序列数据进行删除;
若时间节点缺乏对应的需求序列数据,则以上述时间节点周围的时间节点的同类需求的平均值进行填充到上述时间节点中。
在一种优选的方案中,所述的数据集模块包括以下功能:
预处理后的历史订单的需求序列数据采用滑动窗口方法,通过选择一个需求序列数据为一个周期进行滑窗,从而构建多个训练窗口,扩大训练集数量;最后的a个需求序列数据作为预测结果序列数据,剩余的需求序列数据作为输入需求序列数据;所述的a是预设值;
将数据集中x的需求序列数据作为训练数据子集,将数据集中y的需求序列数据作为测试数据子集,所述的p+q=1。
在一种优选的方案中,所述的p=0.8。
在一种优选的方案中,所述的建模模块的需求序列预测模型包括以下内容:
需求序列预测模型的时空层包括β个inception模块,每个inception模块包含γ个分支,每个分支都包含因果卷积和扩展卷积。
在一种优选的方案中,所述的β的取值范围是[3,7]。
本优选方案中,通过inception神经网络模块作为神经网络对数据进行训练,不仅灵活性高,且具备可移植性。
在一种优选的方案中,所述的γ=5。
在一种优选的方案中,所述的建模模块中的中的训练包括以下内容:
inception模块的隐藏单元的输出值通过下式进行表达:
y=w·x+b
式中,所述的y表示输出值,所述的x表示输入值,所述的w表示权重值的矩阵,所述的b表示偏置值向量;
对输入数据进行训练时,通过损失函数评估需求序列预测模型的目标输出和实际输出的差距的函数,所述的函数值越小说明实际输出与目标输出的差值越小,表示权重值越合适;
通过Adam算法对损失函数进行优化,定义初始学习率δ,对损失函数进行迭代更新。
在一种优选的方案中,所述的损失函数通过下式进行表达:
Figure BDA0002554997320000051
式中,所述的Loss表示损失值;所述的y_result表示每次神经网络的输出值;所述的y_real表示实际的原始数据;所述的i表示输入的第i个需求序列数据;所述的n表示输入的需求序列数据的数量。
本优选方案中,将神经元的输出值y_result减去真实值y_real,再进行平方,最后使用计算平均计算得到方差;得到的方差也就是损失函数的损失值。
本优选方案中,将神经元的输出值y_result减去真实值y_real,再进行平方,最后使用计算平均计算得到方差;得到的方差也就是损失函数的损失值。
在一种优选的方案中,所述的δ=0.001。
本发明还公开了一种计算机可读存储介质,存储有一种基于深度时空神经网络的需求预测方法和/或一种基于深度时空神经网络的需求预测系统。
与现有技术相比,本发明技术方案的有益效果是:
本发明中通过基于因果扩展卷积的神经网络模型实现对供应链需求的预测功能,有效的提高了预测准确性,并且当数据样本差异性较大时,基于因果扩展卷积的神经网络模型的优势更加显著。
附图说明
图1为实施例的流程图。
图2为实施例的基于注意力机制和因果扩展卷积的神经网络的需求序列预测模型图。
图3为实施例的Inception模块图。
图4为需求序列数据示意图。
具体实施方式
附图仅用于示例性说明,不能理解为对本专利的限制;
为了更好说明本实施例,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺寸;
对于本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。
下面结合附图和实施例对本发明的技术方案做进一步的说明。
实施例
如图1所示,一种基于深度时空神经网络的需求预测方法,包括以下步骤:
采集历史订单的需求序列数据(如图4所示),对采集历史订单的需求序列数据进行预处理,得到预处理后的历史订单的需求序列数据;
基于预处理后的历史订单的需求序列数据构建数据集,数据集包括输入需求序列数据和预测结果序列数据;并数据集划分为训练数据子集和测试数据子集;输入需求序列数据包括预处理后的历史订单的需求序列数据;
搭建基于注意力机制和因果扩展卷积的神经网络的需求序列预测模型;
利用数据集对需求序列预测模型进行训练,得到训练后的需求序列预测模型;
通过预处理后的历史订单的需求序列数据,结合训练后的需求序列预测模型,得到未来的需求预测结果。
本实施例中通过基于因果扩展卷积的神经网络模型实现对供应链需求的预测功能,有效的提高了预测准确性,并且当数据样本差异性较大时,基于因果扩展卷积的神经网络模型的优势更加显著。
在实施例中,还可以进行以下扩展:预处理包括以下子步骤:
对采集历史订单的需求序列数据中存在缺失信息的需求序列数据和存在错误的需求序列数据进行删除;
若时间节点缺乏对应的需求序列数据,则以上述时间节点周围的时间节点的同类需求的平均值进行填充到上述时间节点中。
在实施例及上述改进实施例中,还可以进行以下扩展:数据集包括以下内容:
预处理后的历史订单的需求序列数据采用滑动窗口方法,通过选择一个需求序列数据为一个周期进行滑窗,从而构建多个训练窗口,扩大训练集数量;最后的a个需求序列数据作为预测结果序列数据,剩余的需求序列数据作为输入需求序列数据;a是预设值;
将数据集中x的需求序列数据作为训练数据子集,将数据集中y的需求序列数据作为测试数据子集,p+q=1。
在实施例及上述改进实施例中,还可以进行以下扩展:a的取值范围是[6,16]。
在实施例及上述改进实施例中,还可以进行以下扩展:p=0.8。
在实施例及上述改进实施例中,还可以进行以下扩展:“搭建基于注意力机制和因果扩展卷积的神经网络的需求序列预测模型”中的需求序列预测模型包括以下内容:
需求序列预测模型的时空层(如图2所示)包括β个inception模块,每个inception模块包含γ个分支,每个分支都包含因果卷积和扩展卷积。
本扩展实施例中,通过inception神经网络模块作为神经网络对数据进行训练,不仅灵活性高,且具备可移植性。
在实施例及上述改进实施例中,还可以进行以下扩展:γ=5,其中,
每个Inception模块包含5个因果和扩展卷积的分支,在分支前和分支后将多个数据矩阵按深度链接起来,参见图3。
5个因果和扩展卷积的分支具体包括:
Figure BDA0002554997320000071
分支1采用1*1的卷积核,按照扩张率1进行卷积,其通道数为256,加上批归一化层和ReLU激活层。
Figure BDA0002554997320000072
分支2采用1*1的卷积核,按照扩张率1进行卷积;再进行采用1*2的卷积核,按照扩张率2进行卷积;通道数为256,加上批归一化层和ReLU激活层。
Figure BDA0002554997320000073
分支3采用1*1的卷积核,按照扩张率1进行卷积;再进行采用1*2的卷积核,按照扩张率2进行卷积;最后进行采用1*2的卷积核,按照扩张率2进行卷积;通道数为256,加上批归一化层和ReLU激活层。
Figure BDA0002554997320000074
分支4采用1*1的卷积核,按照扩张率1进行卷积;再进行采用1*2的卷积核,按照扩张率2进行卷积;第三次进行采用1*2的卷积核,按照扩张率2进行卷积;第四次进行采用1*2的卷积核,按照扩张率2进行卷积;通道数为256,加上批归一化层和ReLU激活层。
Figure BDA0002554997320000075
分支5采用1*1的卷积核,按照扩张率1进行卷积;再对数据进行平均池,即对1*3的局部接受域中的所有值求均值。通道数为64,加上批归一化层和ReLU激活层。
在实施例及上述改进实施例中,还可以进行以下扩展:β的取值范围是[3,7]。
在实施例及上述改进实施例中,还可以进行以下扩展:γ=5。
在实施例及上述改进实施例中,还可以进行以下扩展:“利用数据集对需求序列预测模型进行训练”包括以下内容:
inception模块的隐藏单元的输出值通过下式进行表达:
y=w·x+b
式中,y表示输出值,x表示输入值,w表示权重值的矩阵,b表示偏置值向量;
对输入数据进行训练时,通过损失函数评估需求序列预测模型的目标输出和实际输出的差距的函数,函数值越小说明实际输出与目标输出的差值越小,表示权重值越合适;
通过Adam算法对损失函数进行优化,定义初始学习率δ,对损失函数进行迭代更新。
在实施例及上述改进实施例中,还可以进行以下扩展:损失函数通过下式进行表达:
Figure BDA0002554997320000081
式中,Loss表示损失值;y_result表示每次神经网络的输出值;y_real表示实际的原始数据;i表示输入的第i个需求序列数据;n表示输入的需求序列数据的数量。
本改进方案中,将神经元的输出值y_result减去真实值y_real,再进行平方,最后使用计算平均计算得到方差;得到的方差也就是损失函数的损失值。
在实施例及上述改进实施例中,还可以进行以下扩展:δ=0.001。
本优选法方案中,初始学习率为0.001,迭代1000回合,每隔50回合,学习率变为原来的0.1倍。训练完毕后寻找损失最小的模型作为特征生成器模型,从而得到神经网络的模型参数。
一种基于深度时空神经网络的需求预测系统,包括采集模块、预处理模块、数据集模块、建模模块和预测模块,其中,
采集模块用于采集历史订单的需求序列数据;
预处理模块用于将采集模块的历史订单的需求序列数据进行预处理,得到预处理后的历史订单的需求序列数据;
数据集模块通过预处理模块的预处理后的历史订单的需求序列数据构建数据集,数据集包括输入需求序列数据和预测结果序列数据;并数据集划分为训练数据子集和测试数据子集;输入需求序列数据包括预处理后的历史订单的需求序列数据;
建模模块用于构建基于注意力机制和因果扩展卷积的神经网络的需求序列预测模型;再通过数据集模块的数据集对需求序列预测模型进行训练,得到训练后的需求序列预测模型;
预测模块根据建模模块的训练后的需求序列预测模型,结合预处理模块的预处理后的历史订单的需求序列数据,得到未来的需求预测结果。
本发明中通过基于因果扩展卷积的神经网络模型实现对供应链需求的预测功能,有效的提高了预测准确性,并且当数据样本差异性较大时,基于因果扩展卷积的神经网络模型的优势更加显著。
在实施例中,还可以进行以下扩展:预处理模块包括以下功能:
对采集历史订单的需求序列数据中存在缺失信息的需求序列数据和存在错误的需求序列数据进行删除;
若时间节点缺乏对应的需求序列数据,则以上述时间节点周围的时间节点的同类需求的平均值进行填充到上述时间节点中。
在实施例及上述改进实施例中,还可以进行以下扩展:数据集模块包括以下功能:
预处理后的历史订单的需求序列数据采用滑动窗口方法,通过选择一个需求序列数据为一个周期进行滑窗,从而构建多个训练窗口,扩大训练集数量;最后的a个需求序列数据作为预测结果序列数据,剩余的需求序列数据作为输入需求序列数据;a是预设值;
将数据集中x的需求序列数据作为训练数据子集,将数据集中y的需求序列数据作为测试数据子集,p+q=1。
在实施例及上述改进实施例中,还可以进行以下扩展:a的取值范围是[6,16]。
在实施例及上述改进实施例中,还可以进行以下扩展:p=0.8。
在实施例及上述改进实施例中,还可以进行以下扩展:建模模块的需求序列预测模型包括以下内容:
需求序列预测模型的时空层包括β个inception模块,每个inception模块包含γ个分支,每个分支都包含因果卷积和扩展卷积。
在实施例及上述改进实施例中,还可以进行以下扩展:β的取值范围是[3,7]。
本优选方案中,通过inception神经网络模块作为神经网络对数据进行训练,
不仅灵活性高,且具备可移植性。
在实施例及上述改进实施例中,还可以进行以下扩展:γ=5。
在实施例及上述改进实施例中,还可以进行以下扩展:建模模块中的中的训练包括以下内容:
inception模块的隐藏单元的输出值通过下式进行表达:
y=w·x+b
式中,y表示输出值,x表示输入值,w表示权重值的矩阵,b表示偏置值向量;
对输入数据进行训练时,通过损失函数评估需求序列预测模型的目标输出和实际输出的差距的函数,函数值越小说明实际输出与目标输出的差值越小,表示权重值越合适;
通过Adam算法对损失函数进行优化,定义初始学习率δ,对损失函数进行迭代更新。
在实施例及上述改进实施例中,还可以进行以下扩展:损失函数通过下式进行表达:
Figure BDA0002554997320000101
式中,Loss表示损失值;y_result表示每次神经网络的输出值;y_real表示实际的原始数据;i表示输入的第i个需求序列数据;n表示输入的需求序列数据的数量。
本优选方案中,将神经元的输出值y_result减去真实值y_real,再进行平方,最后使用计算平均计算得到方差;得到的方差也就是损失函数的损失值。
本优选方案中,将神经元的输出值y_result减去真实值y_real,再进行平方,最后使用计算平均计算得到方差;得到的方差也就是损失函数的损失值。
在实施例及上述改进实施例中,还可以进行以下扩展:δ=0.001。
在上述具体实施方式的具体内容中,各技术特征可以进行任意不矛盾的组合,为使描述简洁,未对上述各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
相同或相似的标号对应相同或相似的部件;
附图中描述位置关系的用语仅用于示例性说明,不能理解为对本专利的限制;
显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。

Claims (10)

1.一种基于深度时空神经网络的需求预测方法,其特征在于,包括以下步骤:
采集历史订单的需求序列数据,对采集历史订单的需求序列数据进行预处理,得到预处理后的历史订单的需求序列数据;
基于预处理后的历史订单的需求序列数据构建数据集,所述的数据集包括输入需求序列数据和预测结果序列数据;并数据集划分为训练数据子集和测试数据子集;所述的输入需求序列数据包括预处理后的历史订单的需求序列数据;
搭建基于注意力机制和因果扩展卷积的神经网络的需求序列预测模型;
利用数据集对需求序列预测模型进行训练,得到训练后的需求序列预测模型;
通过预处理后的历史订单的需求序列数据,结合训练后的需求序列预测模型,得到未来的需求预测结果。
2.根据权利要求1所述的需求预测方法,其特征在于,所述的预处理包括以下子步骤:
对采集历史订单的需求序列数据中存在缺失信息的需求序列数据和存在错误的需求序列数据进行删除;
若时间节点缺乏对应的需求序列数据,则以上述时间节点周围的时间节点的同类需求的平均值进行填充到上述时间节点中。
3.根据权利要求1所述的需求预测方法,其特征在于,所述的数据集包括以下内容:
预处理后的历史订单的需求序列数据采用滑动窗口方法,通过选择一个需求序列数据为一个周期进行滑窗,从而构建多个训练窗口,扩大训练集数量;最后的a个需求序列数据作为预测结果序列数据,剩余的需求序列数据作为输入需求序列数据;所述的a是预设值;
将数据集中x的需求序列数据作为训练数据子集,将数据集中y的需求序列数据作为测试数据子集,所述的p+q=1。
4.根据权利要求1至3中任一权利要求所述的需求预测方法,其特征在于,所述的“搭建基于注意力机制和因果扩展卷积的神经网络的需求序列预测模型”中的需求序列预测模型包括以下内容:
需求序列预测模型的时空层包括β个inception模块,每个inception模块包含γ个分支,每个分支都包含因果卷积和扩展卷积。
5.根据权利要求4所述的需求预测方法,其特征在于,所述的“利用数据集对需求序列预测模型进行训练”包括以下内容:
inception模块的隐藏单元的输出值通过下式进行表达:
y=w·x+b
式中,所述的y表示输出值,所述的x表示输入值,所述的w表示权重值的矩阵,所述的b表示偏置值向量;
对输入数据进行训练时,通过损失函数评估需求序列预测模型的目标输出和实际输出的差距的函数,所述的函数值越小说明实际输出与目标输出的差值越小,表示权重值越合适;
通过Adam算法对损失函数进行优化,定义初始学习率δ,对损失函数进行迭代更新。
6.根据权利要求5所述的需求预测方法,其特征在于,所述的损失函数通过下式进行表达:
Figure FDA0002554997310000021
式中,所述的Loss表示损失值;所述的y_result表示每次神经网络的输出值;所述的y_real表示实际的原始数据;所述的i表示输入的第i个需求序列数据;所述的n表示输入的需求序列数据的数量。
7.一种基于深度时空神经网络的需求预测系统,其特征在于,包括采集模块、预处理模块、数据集模块、建模模块和预测模块,其中,
所述的采集模块用于采集历史订单的需求序列数据;
所述的预处理模块用于将采集模块的历史订单的需求序列数据进行预处理,得到预处理后的历史订单的需求序列数据;
所述的数据集模块通过预处理模块的预处理后的历史订单的需求序列数据构建数据集,所述的数据集包括输入需求序列数据和预测结果序列数据;并数据集划分为训练数据子集和测试数据子集;所述的输入需求序列数据包括预处理后的历史订单的需求序列数据;
所述的建模模块用于构建基于注意力机制和因果扩展卷积的神经网络的需求序列预测模型;再通过数据集模块的数据集对需求序列预测模型进行训练,得到训练后的需求序列预测模型;
所述的预测模块根据建模模块的训练后的需求序列预测模型,结合预处理模块的预处理后的历史订单的需求序列数据,得到未来的需求预测结果。
8.根据权利要求7所述的需求预测系统,其特征在于,所述的预处理模块包括以下功能:
对采集历史订单的需求序列数据中存在缺失信息的需求序列数据和存在错误的需求序列数据进行删除;
若时间节点缺乏对应的需求序列数据,则以上述时间节点周围的时间节点的同类需求的平均值进行填充到上述时间节点中。
9.根据权利要求7或8所述的需求预测系统,其特征在于,所述的数据集模块包括以下功能:
预处理后的历史订单的需求序列数据采用滑动窗口方法,通过选择一个需求序列数据为一个周期进行滑窗,从而构建多个训练窗口,扩大训练集数量;最后的a个需求序列数据作为预测结果序列数据,剩余的需求序列数据作为输入需求序列数据;所述的a是预设值;
将数据集中x的需求序列数据作为训练数据子集,将数据集中y的需求序列数据作为测试数据子集,所述的p+q=1。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有一种基于深度时空神经网络的需求预测方法和/或一种基于深度时空神经网络的需求预测系统,所述的一种基于深度时空神经网络的需求预测方法被处理器执行时实现如权利要求1至6中任一权利要求所述的需求预测方法的步骤;所述的一种基于深度时空神经网络的需求预测系统被处理器执行时实现如权利要求7至9中任一权利要求所述的需求预测系统的内容。
CN202010586879.8A 2020-06-24 2020-06-24 一种基于深度时空神经网络的需求预测方法、系统及计算机可读存储介质 Pending CN111882157A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010586879.8A CN111882157A (zh) 2020-06-24 2020-06-24 一种基于深度时空神经网络的需求预测方法、系统及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010586879.8A CN111882157A (zh) 2020-06-24 2020-06-24 一种基于深度时空神经网络的需求预测方法、系统及计算机可读存储介质

Publications (1)

Publication Number Publication Date
CN111882157A true CN111882157A (zh) 2020-11-03

Family

ID=73157868

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010586879.8A Pending CN111882157A (zh) 2020-06-24 2020-06-24 一种基于深度时空神经网络的需求预测方法、系统及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN111882157A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113379125A (zh) * 2021-06-11 2021-09-10 武汉大学 一种基于TCN和LightGBM组合模型的物流仓储销售量预测方法
CN116109234A (zh) * 2022-12-01 2023-05-12 北京交通大学 一种基于预测与决策一体化的快递系统智能订单分配方法
CN116541667A (zh) * 2023-06-29 2023-08-04 厦门大学 一种浮标时间序列数据缺失值的插补方法及系统
CN116627991A (zh) * 2023-07-26 2023-08-22 山东朝阳轴承有限公司 基于物联网的企业信息化数据存储方法及系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005157685A (ja) * 2003-11-25 2005-06-16 Toshiba Corp エネルギー需要予測システム
CN107832897A (zh) * 2017-11-30 2018-03-23 浙江工业大学 一种基于深度学习的股票市场预测方法
KR20180060317A (ko) * 2016-11-28 2018-06-07 한국전력공사 심층 신경망 기반 수용가 전력 수요 예측 장치 및 방법
CN110085327A (zh) * 2019-04-01 2019-08-02 东莞理工学院 基于注意力机制的多通道lstm神经网络流感疫情预测方法
CN110472779A (zh) * 2019-07-30 2019-11-19 东莞理工学院 一种基于时间卷积网络的电力系统短期负荷预测方法
CN111126680A (zh) * 2019-12-11 2020-05-08 浙江大学 一种基于时间卷积神经网络的道路断面交通流量预测方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005157685A (ja) * 2003-11-25 2005-06-16 Toshiba Corp エネルギー需要予測システム
KR20180060317A (ko) * 2016-11-28 2018-06-07 한국전력공사 심층 신경망 기반 수용가 전력 수요 예측 장치 및 방법
CN107832897A (zh) * 2017-11-30 2018-03-23 浙江工业大学 一种基于深度学习的股票市场预测方法
CN110085327A (zh) * 2019-04-01 2019-08-02 东莞理工学院 基于注意力机制的多通道lstm神经网络流感疫情预测方法
CN110472779A (zh) * 2019-07-30 2019-11-19 东莞理工学院 一种基于时间卷积网络的电力系统短期负荷预测方法
CN111126680A (zh) * 2019-12-11 2020-05-08 浙江大学 一种基于时间卷积神经网络的道路断面交通流量预测方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
吴学华等: "基于多指标与卷积神经网络的化工产品需求预测", 《自动化仪表》, 31 August 2018 (2018-08-31), pages 17 *
张冬;明新国;赵成雷;李冬;王鹏鹏;: "基于BP神经网络和设备特性的工业设备备件需求预测", 机械设计与研究, no. 01, 20 February 2010 (2010-02-20) *
葛彦强;汪向征;王爱民;: "改进灰色神经网络的冰箱订单需求预测研究", 计算机仿真, no. 05, 15 May 2012 (2012-05-15) *
陆敬筠等: "基于自注意力的扩展卷积神经网络情感分类", 《计算机工程与设计》, 16 June 2020 (2020-06-16), pages 2 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113379125A (zh) * 2021-06-11 2021-09-10 武汉大学 一种基于TCN和LightGBM组合模型的物流仓储销售量预测方法
CN113379125B (zh) * 2021-06-11 2022-05-13 武汉大学 一种基于TCN和LightGBM组合模型的物流仓储销售量预测方法
CN116109234A (zh) * 2022-12-01 2023-05-12 北京交通大学 一种基于预测与决策一体化的快递系统智能订单分配方法
CN116109234B (zh) * 2022-12-01 2023-08-08 北京交通大学 一种基于预测与决策一体化的快递系统智能订单分配方法
CN116541667A (zh) * 2023-06-29 2023-08-04 厦门大学 一种浮标时间序列数据缺失值的插补方法及系统
CN116541667B (zh) * 2023-06-29 2023-11-03 厦门大学 一种浮标时间序列数据缺失值的插补方法及系统
CN116627991A (zh) * 2023-07-26 2023-08-22 山东朝阳轴承有限公司 基于物联网的企业信息化数据存储方法及系统
CN116627991B (zh) * 2023-07-26 2023-09-26 山东朝阳轴承有限公司 基于物联网的企业信息化数据存储方法及系统

Similar Documents

Publication Publication Date Title
CN113962364B (zh) 一种基于深度学习的多因素用电负荷预测方法
CN111882157A (zh) 一种基于深度时空神经网络的需求预测方法、系统及计算机可读存储介质
CN111079931A (zh) 一种基于图神经网络的状态空间概率性多时间序列预测方法
CN109583565A (zh) 基于注意力模型长短时记忆网络的洪水预测方法
CN111680786B (zh) 一种基于改进权重门控单元的时序预测方法
CN111178585A (zh) 基于多算法模型融合的故障接报量预测方法
CN111985719A (zh) 一种基于改进的长短期记忆网络的电力负荷预测方法
CN116845889B (zh) 一种基于层次化超图神经网络的电力负载预测方法
CN114694379B (zh) 一种基于自适应动态图卷积的交通流预测方法及系统
CN110807508B (zh) 计及复杂气象影响的母线峰值负荷预测方法
CN116169670A (zh) 一种基于改进神经网络的短期非居民负荷预测方法及系统
CN109784562B (zh) 一种基于大数据时空聚类的智慧电网电力负荷预测方法
CN117575663A (zh) 基于深度学习的装修成本估算方法及系统
CN116489038A (zh) 网络流量的预测方法、装置、设备和介质
CN115080795A (zh) 一种多充电站协同负荷预测方法及装置
CN114154716A (zh) 一种基于图神经网络的企业能耗预测方法及装置
CN114091776A (zh) 一种基于K-means的多分支AGCNN短期电力负荷预测方法
Wang et al. A Transformer-based multi-entity load forecasting method for integrated energy systems
CN115713044B (zh) 一种多工况切换下的机电设备剩余寿命分析方法和装置
CN116865254A (zh) 一种电力负荷指标预测方法、系统、设备及介质
CN115115119A (zh) 一种基于灰色关联的oa-gru的短期电力负荷预测方法
CN115510948A (zh) 一种基于鲁棒图分类的区块链钓鱼检测方法
CN114662009A (zh) 一种基于图卷积的工业互联网工厂协同推荐算法
Gao et al. Integrated deep neural networks-based complex system for urban water management
CN116188921B (zh) 一种基于多图融合的隧道瓦斯浓度预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB03 Change of inventor or designer information

Inventor after: Lv Cixing

Inventor after: Yan Xiaohui

Inventor after: Zhou Zirong

Inventor before: Lv Cixing

Inventor before: Yan Xiaohui

CB03 Change of inventor or designer information