CN114595897B - 基于动态异构图卷积的多价值链汽车配件需求预测方法 - Google Patents

基于动态异构图卷积的多价值链汽车配件需求预测方法 Download PDF

Info

Publication number
CN114595897B
CN114595897B CN202210264743.4A CN202210264743A CN114595897B CN 114595897 B CN114595897 B CN 114595897B CN 202210264743 A CN202210264743 A CN 202210264743A CN 114595897 B CN114595897 B CN 114595897B
Authority
CN
China
Prior art keywords
sample
node
purchasing
matrix
selling
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210264743.4A
Other languages
English (en)
Other versions
CN114595897A (zh
Inventor
郭兵
沈艳
吴欣
锁信华
翁方芃
黄婉华
沈云柯
李川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sichuan University
Original Assignee
Sichuan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sichuan University filed Critical Sichuan University
Priority to CN202210264743.4A priority Critical patent/CN114595897B/zh
Publication of CN114595897A publication Critical patent/CN114595897A/zh
Application granted granted Critical
Publication of CN114595897B publication Critical patent/CN114595897B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Computational Linguistics (AREA)
  • Development Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Game Theory and Decision Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明实施例提供了一种基于动态异构图卷积的多价值链汽车配件需求预测方法,该方法包括:获取历史第一时间段内与目标制造厂相关的多价值链历史数据,根据多价值链历史数据构建动态异构图;将动态异构图按单位时间处理成多个静态异构图,分别得到每个静态异构图的邻接矩阵和特征矩阵;将多个静态异构图的邻接矩阵和特征矩阵分别按时间先后顺序输入至训练好的动态异构图卷积神经网络结合长短期记忆网络的预测模型(DHGCN_LSTM)中,得到目标制造厂在未来第二时间段内的配件需求预测结果。本发明充分考虑了多价值链结构中上下游商家对制造厂配件采购的影响,提升了汽车配件采购需求预测的准确率,以为汽车企业的相关配件采购部门提供优质的配件采购服务。

Description

基于动态异构图卷积的多价值链汽车配件需求预测方法
技术领域
本发明实施例涉及数据处理技术领域,尤其涉及一种基于动态异构图卷积的多价值链汽车配件需求预测方法。
背景技术
基于现有的关于汽车配件采购需求预测的相关研究,目前国内外对配件需求的预测研究大多站在配件代理商的角度对配件进行需求预测,而实际上在汽车制造企业中,核心制造厂位于整个制造系统的核心位置,核心制造厂的配件采购需求受到配件供应商的生产计划、核心制造厂的整车制造计划、经销商的配件需求等多种复杂因素的影响。
这就使得相关技术中从配件代理商的角度和/或主要基于单价值链对配件进行需求预测研究的方法,缺乏对其他价值链中同种配件需求的考虑,没有充分考虑到汽车价值链的全局结构、多价值链的跨链协作、多链联合决策等的配件采购需求。因此,目前关于汽车配件采购需求预测的方法缺乏对多价值链中其他部分对配件采购影响的考虑,导致预测结果的准确率稳定性较差。
发明内容
基于上述技术问题,本发明实施例提供一种基于动态异构图卷积的多价值链汽车配件需求预测方法,以核心制造厂的角度基于多价值链对汽车配件采购需求进行预测,提升了预测汽车配件采购需求的准确率。
本发明实施例提供了一种基于动态异构图卷积的多价值链汽车配件需求预测方法,所述方法包括:
获取历史第一时间段内与目标制造厂相关的多价值链历史数据,根据所述多价值链历史数据提取出采购节点和销售节点,并根据采购节点与采购节点、销售节点与销售节点、采购节点与销售节点之间的关系构建动态异构图;
将所述动态异构图按单位时间处理成多个静态异构图,并得到每个静态异构图的邻接矩阵,所述邻接矩阵表征所述静态异构图中各节点之间的关系;
根据所述多价值链历史数据中,每个静态异构图对应的单位时间内的配件采购相关数据和配件整车销售相关数据,得到每个静态异构图的特征矩阵;
将多个静态异构图的邻接矩阵和特征矩阵分别按时间先后顺序,输入至训练好的DHGCN_LSTM模型中,得到所述目标制造厂在未来第二时间段内的配件需求预测结果。
可选地,所述DHGCN_LSTM模型的训练过程包括以下步骤:
构建初始DHGCN_LSTM模型并初始化模型参数;
获取多个样本数据,所述样本数据包括:样本制造厂和样本经销商预设历史时长的多价值链样本历史数据;其中,所述预设历史时长包括第一历史时长和第二历史时长,第一历史时长的多价值链样本历史数据用于得到所述初始DHGCN_LSTM模型的输入,第二历史时长的多价值链样本历史数据中的实际配件需求结果用于验证所述初始DHGCN_LSTM模型输出的配件需求预测结果;
针对所述多个样本数据中的样本制造厂和样本经销商第一历史时长的多价值链样本历史数据,根据所述多价值链样本历史数据提取出样本采购节点和样本销售节点,并根据样本采购节点与样本采购节点、样本销售节点与样本销售节点、样本采购节点与样本销售节点之间的关系,构建多个样本动态异构图;
将每个样本动态异构图均按所述单位时间处理成多个样本静态异构图,得到每个样本静态异构图的样本邻接矩阵,所述样本邻接矩阵表征所述样本静态异构图中各节点之间的关系;
根据所述第一历史时长的多价值链样本历史数据中,每个样本静态异构图对应的单位时间内的样本配件采购相关数据和样本配件整车销售相关数据,得到每个样本静态异构图的样本特征矩阵;
将多个样本静态异构图的样本邻接矩阵和样本特征矩阵分别按时间先后顺序,输入至所述初始DHGCN_LSTM模型中,得到样本制造厂第二历史时长的配件需求预测结果;
根据所述样本制造厂第二历史时长的配件需求预测结果与所述样本制造厂第二历史时长的多价值链样本历史数据中的实际配件需求结果,对所述初始DHGCN_LSTM模型的模型参数进行迭代更新,直至满足预设条件时结束训练,得到所述训练好的DHGCN_LSTM模型。
可选的,所述得到每个样本静态异构图的样本邻接矩阵,包括:
分别得到每个样本静态异构图的样本采购节点邻居矩阵、样本销售节点邻居矩阵和样本采购节点-样本销售节点关联矩阵;
将每个样本静态异构图的样本采购节点邻居矩阵、样本销售节点邻居矩阵和样本采购节点-样本销售节点关联矩阵进行拼接,得到所述每个样本静态异构图的样本邻接矩阵;
其中,所述样本采购节点邻居矩阵表征所述样本静态异构图中样本采购节点之间的关系,所述样本销售节点邻居矩阵表征所述样本静态异构图中样本销售节点之间的关系。
可选的,所述将每个样本静态异构图的样本采购节点邻居矩阵、样本销售节点邻居矩阵和样本采购节点-样本销售节点关联矩阵进行拼接,得到所述每个样本静态异构图的样本邻接矩阵,包括:
通过下式得到所述每个样本静态异构图的样本邻接矩阵:
Figure BDA0003552197620000031
其中,AHG为样本静态异构图的样本邻接矩阵,AP为样本采购节点邻居矩阵,AS为样本销售节点邻居矩阵,AD为样本采购节点-样本销售节点关联矩阵。
可选的,在所述样本采购节点邻居矩阵中,若第一样本采购节点与第二样本采购节点为基于元路径的邻居,则所述第一样本采购节点与所述第二样本采购节点之间的关系在所述样本采购节点邻居矩阵中表示为1,反之为0;
在所述样本销售节点邻居矩阵中,若第一样本销售节点与第二样本销售节点为基于元路径的邻居,则所述第一样本销售节点与所述第二样本销售节点之间的关系在所述样本销售节点邻居矩阵中表示为1,反之为0;
在所述样本采购节点-样本销售节点关联矩阵中,若第三样本采购节点与第三样本销售节点之间存在供给关系,则所述第三样本采购节点与第三样本销售节点之间的关系在所述样本采购节点-样本销售节点关联矩阵中表示为1,反之为0;
其中,所述第一样本采购节点与所述第二样本采购节点为任意两个样本采购节点,所述第一样本销售节点与所述第二样本销售节点为任意两个样本销售节点,所述第三样本采购节点为任意的样本采购节点,所述第三样本销售节点为任意的样本销售节点。
可选的,所述第一样本采购节点与第二样本采购节点为基于元路径的邻居指的是:所述第一样本采购节点与第二样本采购节点之间存在一个第三样本销售节点,且所述第一样本采购节点和所述第二样本采购节点均与所述第三样本销售节点存在供给关系;
所述第一样本销售节点与第二样本销售节点为基于元路径的邻居指的是:所述第一样本销售节点与第二样本销售节点之间存在一个第三样本采购节点,且所述第一样本销售节点或所述第二样本销售节点均与所述第三样本采购节点存在供给关系。
可选的,所述样本配件采购相关数据包括:样本历史配件采购数据、样本配件缺货量、样本库存周期;所述样本配件整车销售相关数据包括:样本配件整车保有量、样本配件寿命、样本配件整车历史销售数据;
所述根据所述第一历史时长的多价值链样本历史数据中,每个样本静态异构图对应的单位时间内的样本配件采购相关数据和样本配件整车销售相关数据,得到每个样本静态异构图的样本特征矩阵,包括:
针对所述样本静态异构图中的各样本采购节点,根据所述各样本采购节点的样本历史配件采购数据、样本配件缺货量、样本库存周期确定各样本采购节点的特征向量,将各样本采购节点的特征向量拼接成所述样本静态异构图的样本采购节点的特征矩阵;
针对所述样本静态异构图中的各样本销售节点,根据所述各样本销售节点的样本配件整车保有量、样本配件寿命、样本配件整车历史销售数据确定各样本销售节点的特征向量,将各样本销售节点的特征向量拼接成所述样本静态异构图的样本销售节点的特征矩阵;
将每个样本静态异构图的样本采购节点的特征矩阵和每个样本静态异构图的样本销售节点的特征矩阵进行拼接,得到所述每个样本静态异构图的样本特征矩阵。
可选的,所述将多个样本静态异构图的样本邻接矩阵和样本特征矩阵分别按时间先后顺序,输入至所述初始DHGCN_LSTM模型中,得到样本制造厂第二历史时长的配件需求预测结果,包括:
将所述多个样本静态异构图的样本邻接矩阵和样本特征矩阵分别按时间先后顺序,输入至初始DHGCN_LSTM模型中的GCN部分,得到多个新的样本特征矩阵;
将所述多个新的样本特征矩阵进行拼接压缩处理后,输入至初始DHGCN_LSTM模型中的LSTM部分,得到所述样本制造厂第二历史时长的配件需求预测结果。
可选的,所述将所述多个新的样本特征矩阵进行拼接压缩处理后,输入至初始DHGCN_LSTM模型中的LSTM部分,包括:
将所述多个新的样本特征矩阵进行拼接,得到一个样本三维矩阵;
通过权重矩阵将样本三维矩阵中的特征向量维度压缩为1,从而实现将所述样本三维矩阵压缩为一个样本二维矩阵;
通过滑动窗口对所述样本二维矩阵进行序列化表示,得到一个包含多个元素的序列;
将所述序列中的多个元素依次输入至所述初始DHGCN_LSTM模型中的LSTM部分。
可选的,所述历史第一时间段与所述未来第二时间段为连续的时间段,所述第一历史时长与所述第二历史时长在时间上连续。
通过本发明实施例的方法,根据获取到的历史第一时间段内与目标制造厂相关的多价值链历史数据构建动态异构图,将动态异构图按单位时间处理成多个静态异构图后,再将多个静态异构图的邻接矩阵和特征矩阵分别按照时间先后顺序输入至预先训练好的DHGCN_LSTM模型,得到目标制造厂在未来第二时间段内的配件需求预测结果。在本方法中,针对模型输入,充分考虑了核心制造厂涉及的多价值产业链中各价值链部分对配件采购的影响;针对预测模型,选取了能够提取出多价值链中丰富的空间关联特征并充分感知长时间跨度的历史数据的DHGCN_LSTM模型(动态异构图卷积神经网络结合长短期记忆网络的预测模型),从而使得预测汽车配件采购需求的准确率有了较好的提升,以为汽车制造企业的相关配件采购部门提供时优质的配件采购服务。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一实施例示出的一种基于动态异构图卷积的多价值链汽车配件需求预测方法的流程图;
图2是本发明一实施例示出的一种汽车产业“网状”多价值链结构图;
图3是本发明一实施例示出的一种采购-销售异构网络图;
图4是本发明一实施例示出的DHGCN_LSTM的网络结构;
图5是本发明一实施例示出的DHGCN_LSTM模型的训练流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
随着信息网络技术的不断发展,制造业的竞争也日渐激烈。汽车制造企业如何在要求苛刻的市场竞争中提高竞争力,高效持续的发展是近年来汽车制造企业首要考虑的战略问题。对于制造企业来说采购成本一般占到企业60%以上的资金成本,因此采购管理成为了企业管理的重要战略点。供应链中的采购管理的目的主要体现在:减少采购风险,提高物流效率。因此配件采购的精准预测有利于企业合理的安排生产计划和销售计划,减少采购次数和库存积压,进而节省资金,避免不必要的成本消耗,并提高企业自身在市场中的竞争力。
而如前所述,当前已有的关于汽车配件采购需求预测的相关方法均没有充分考虑价值链的全局结构,多价值链的跨链协作、多链联合决策等的配件采购需求。而实际上核心制造厂在多价值链中处于中心位置,配件的采购需求不仅受到上游零件供应商的生产计划的影响,还受到下游经销商配件销售的影响,基于此,本发明提供了一种基于动态异构图卷积的多价值链汽车配件需求预测方法,从核心制造厂的角度针对多价值链的结构和配件采购影响因素构造动态异构图,并将异构图的特征矩阵和邻接矩阵输入至训练好的DHGCN_LSTM模型,以得到准确率显著提升的配件需求预测结果。
参照图1,图1是本发明一实施例示出的一种基于动态异构图卷积的多价值链汽车配件需求预测方法的流程图。如图1所示,该方法包括以下步骤:
步骤S11:获取历史第一时间段内与目标制造厂相关的多价值链历史数据,根据所述多价值链历史数据提取出采购节点和销售节点,并根据采购节点与采购节点、销售节点与销售节点、采购节点与销售节点之间的关系构建动态异构图。
本实施例中,若需对目标制造厂的配件采购需求进行预测,可以先从第三方平台上获取历史第一时间段内与目标制造厂相关的多价值链历史数据,该多价值链历史数据可呈现为多价值链网状结构。其中,本实施例的目标制造厂可以为任意想要进行配件需求预测的汽车核心制造厂或汽车企业的相关采购部门等等,第三方平台为可以获取到汽车产业多价值链相关数据的任意公共平台或共享数据库,历史第一时间段为预设的历史时间段,该历史第一时间段与模型训练时输入数据的历史时长相对应,如该历史第一时间段可以为过去12个月,或过去6个月等等,本实施例对此不作任何限制。
如图2所示,图2是本发明一实施例示出的一种汽车产业“网状”多价值链结构图。在图2中,具有零件供应商、核心制造厂、经销商等类型的企业,这些企业为汽车相关的企业提供了生产、制造、销售等服务,可以进行不同价值链之间的协作和多链业务,构成一个协调发展的系统。其中核心制造厂处于中心位置,零件供应商向核心制造厂供应零件,反过来核心制造厂也需按照计划向零件供应商采购零件,而核心制造厂加工后需要通过经销商销售给客户,可见,核心制造厂的配件采购需求不仅受到上游零件供应商的生产计划的影响,还受到下游经销商配件销售的影响。
本发明考虑到工业场景中的图数据十分复杂,而且高度异构,如果将多价值链中的所有数据考虑在内进行模型预测则不仅极大地增加了计算资源且预测效果也不佳,基于此,为了提高模型的训练的效率,且考虑到零件供应商大多是受外部因素的影响,对配件采购的影响能较为直观的看出来,因此本发明实施例从多价值链网状结构中提取出对采购、销售两种节点进行异构图构造,从而进行多价值链数据的分析。其中,本实施例中的采购节点指的是核心制造厂,销售节点指的是经销商。
本实施例可以根据获取到的多价值链历史数据(即从获取到的多价值链网状结构)提取出采购节点和销售节点,并根据采购节点与采购节点之间的关系、销售节点与销售节点之间的关系,以及,采购节点与销售节点之间的关系构建异构图。其中,异构图指的是:给定图G=(V,E),V为图G的顶点集合,E为图G的边集合。给定TV和TE分别代表顶点类型的集合和边类型的集合。如果|TV|>1或|TE|>1,则图G为异构的图。图3是本发明一实施例示出的一种采购-销售异构网络图。如图3所示,异构网络图包含两个类型的节点:{采购节点、销售节点};包含三个类型的边:{采购节点-采购节点、销售节点-销售节点、采购节点-销售节点}。
可以理解,历史第一时间段内的多价值链历史数据中采购节点与销售节点之间的关联关系通常情况下可能会随着时间存在变化,例如这个月的核心制造厂P1供给经销商S1,下个月变为核心制造厂p2供给经销商S1等等,因此,本实施例中根据历史第一时间段内与目标制造厂相关的多价值链历史数据所构建的异构图为动态异构图。
步骤S12:将所述动态异构图按单位时间处理成多个静态异构图,并得到每个静态异构图的邻接矩阵,所述邻接矩阵表征所述静态异构图中各节点之间的关系。
本实施例中,由于根据历史第一时间段内目标制造厂的多价值链历史数据构建的采购-销售异构图是动态的,异构图中的每个节点之间的关联关系存在变化,因此,本实施例对构建的动态异构图进行进一步处理,将该动态异构图按单位时间转变为多个静态异构图,得到按时间排序的多个静态异构图。其中,本实施例中的单位时间可以为任意设定的时间长度,如一周、两周,一个月、两个月、一个季度等等,优选的,单位时间可以为一个月。例如,历史第一时间段为半年,单位时间为1个月,则可以将动态异构图按单位时间处理成6个静态异构图,分别为第一个单位时间(即第一个月)对应的静态异构图、第二个单位时间(即第二个月)对应的静态异构图……第六个单位时间(即第六个月)对应的静态异构图。
得到多个静态异构图后,可以得到每个静态异构图的邻接矩阵,其中,静态异构图的邻接矩阵为该静态异构图中各节点之间关系的集合(即异构图中边的集合),也就是说,邻接矩阵表征了静态异构图中各节点之间的关系。
步骤S13:根据所述多价值链历史数据中,每个静态异构图对应的单位时间内的配件采购相关数据和配件整车销售相关数据,得到每个静态异构图的特征矩阵。
本实施例的多价值链历史数据中至少包括:配件采购相关数据和配件整车销售相关数据,这些都是跟核心制造厂制定配件采购计划息息相关的数据。本实施例中可以根据多价值链历史数据中,每个静态异构图对应的单位时间内的配件采购相关数据和配件整车销售相关数据,确定出每个静态异构图的特征矩阵。例如,可以根据第一个单位时间内的配件采购相关数据和配件整车销售相关数据,确定出第一个静态异构图的特征矩阵;可以根据第四个单位时间内的配件采购相关数据和配件整车销售相关数据,确定出第四个静态异构图的特征矩阵等。
步骤S14:将多个静态异构图的邻接矩阵和特征矩阵分别按时间先后顺序,输入至训练好的DHGCN_LSTM模型中,得到所述目标制造厂在未来第二时间段内的配件需求预测结果。
本实施例中,得到多个静态异构图的邻接矩阵和特征矩阵后,将该多个静态异构图的邻接矩阵和特征矩阵分别按时间先后顺序,输入至训练好的DHGCN_LSTM模型中。例如,按照时间顺序将第一个静态异构图的邻接矩阵和特征矩阵输入至训练好的DHGCN_LSTM模型,再将第二个静态异构图的邻接矩阵和特征矩阵输入至训练好的DHGCN_LSTM模型……直至将最后一个静态异构图的邻接矩阵和特征矩阵输入至训练好的DHGCN_LSTM模型,从而得到目标制造厂在未来第二时间段内的配件需求预测结果。
其中,本实施例的DHGCN_LSTM模型为事先训练好的、基于与核心制造厂相关的多价值链历史数据进行训练的、用于预测未来第二时间段内的核心制造厂配件需求的DHGCN_LSTM组合模型,该DHGCN_LSTM组合模型即为动态异构图卷积神经网络(DynamicHeterogeneous Graph Convolution Networks,DHGCN)结合长短期记忆网络(Long-ShortTerm Memory,LSTM)的预测模型。也就是说,本实施例中DHGCN_LSTM模型的输入为:多个静态异构图的邻接矩阵和特征矩阵;DHGCN_LSTM模型的输出为:目标制造厂在未来第二时间段内的配件需求预测结果。
在本实施例中,站在核心制造厂的角度,通过专门针对核心制造厂所涉及的多价值链历史结构数据进行训练的DHGCN_LSTM模型对目标制造厂未来的配件需求进行预测,能够极大地提高配件需求的准确率,以使更好地帮助企业合理的安排生产、销售计划,从而提高企业自身在市场中的竞争力。
结合以上实施例,在一种实施方式中,本发明还提供了一种基于动态异构图卷积的多价值链汽车配件需求预测方法,在该方法中还包括了DHGCN_LSTM模型的训练方法,具体地,该DHGCN_LSTM模型的训练过程可以包括如下步骤:
步骤S21:构建初始DHGCN_LSTM模型并初始化模型参数。
本实施例中,首先建立初始的DHGCN_LSTM模型,即建立初始的动态异构图卷积神经网络(Dynamic Heterogeneous Graph Convolution Networks,DHGCN)结合长短期记忆网络(Long-Short Term Memory,LSTM)的预测模型,并对该初始DHGCN_LSTM模型中的模型参数进行初始化设置。
步骤S22:获取多个样本数据,所述样本数据包括:样本制造厂和样本经销商预设历史时长的多价值链样本历史数据。
模型必须基于海量的训练数据进行训练,因此进行模型训练,首先需要获取足够多的训练样本集。本实施例需获取多个样本数据,该样本数据包括:样本制造厂和样本经销商预设历史时长的多价值链样本历史数据,也就是预设历史时长的、与样本制造厂相关的多价值链样本历史数据,本实施例的样本制造厂为用于模型训练的核心制造厂,样本经销商为用于模型训练的经销商,预设历史时长包括第一历史时长和第二历史时长。其中,第一历史时长的多价值链样本历史数据用于进行处理后得到初始DHGCN_LSTM模型的输入,第二历史时长的多价值链样本历史数据中的实际配件需求结果用于验证初始DHGCN_LSTM模型输出的配件需求预测结果。并且,本实施例中的历史第一时间段与第一历史时长相对应,未来第二时间段与第二历史时长相对应。
也就是说,用于模型训练所选取的多个样本数据中,可以是根据需要选取任意多个核心制造厂和经销商过去一段时间的多价值链样本历史数据,以将该过去一段时间的多价值链样本历史数据用于进行处理后得到初始DHGCN_LSTM模型的输入的多价值链样本历史数据,以及用于验证初始DHGCN_LSTM模型输出的配件需求预测结果的多价值链样本历史数据。可以理解的是:每个样本数据对包括:第一历史时长的多价值链样本历史数据和其对应的第二历史时长的多价值链样本历史数据,其中,第二历史时长的多价值链样本历史数据中的实际配件需求结果为初始DHGCN_LSTM模型的标签。其中,在一种具体实施例中,每次模型训练时的核心制造厂和经销商的数量是固定的,若需要改变核心制造厂和经销商的数量,则需要重新训练模型。
其中,在一优选实施方式中,历史第一时间段与未来第二时间段为连续的时间段,第一历史时长与第二历史时长在时间上连续。
本实施例中,在DHGCN_LSTM模型实际应用时,用于模型输入的历史时间段必须与模型预测的未来时间段连续;例如,用过去12个月的多价值链样本历史数据通过模型来预测未来1个月的配件需求,也就是说,历史第一时间段为过去任意时间段至目前的时间段,而未来第二时间段为目前至未来任意时间段的时间段。
本实施例中,在初始DHGCN_LSTM模型训练时,用于模型输入的第一历史时长必须与模型预测的第二历史时长在时间上连续;例如,获取了某核心制造厂过去100个月的多价值链样本历史数据,想要用其来训练出一个根据过去12个月的多价值链历史数据预测未来一个月的配件需求的DHGCN_LSTM模型,则可将100个月的多价值链样本历史数据分为多个样本数据:第一个样本数据的第一历史时长为过去100个月中的第1-12个月,第一个样本数据的第二历史时长为过去100个月中的第13个月;第二个样本数据的第一历史时长为过去100个月中的第2-13个月,第一个样本数据的第二历史时长为过去100个月中的第14个月;第三个样本数据的第一历史时长为过去100个月中的第3-14个月,第一个样本数据的第二历史时长为过去100个月中的第15个月……以此类推。可以理解,本实施例在训练样本数据上的选择,可以选择多个不同核心制造厂的多个预设历史时长的多价值链样本历史数据;也可以选择一个核心制造厂过去一段时间内的多价值链样本历史数据,从而将其分为多个预设历史时长的多价值链样本历史数据;还可以是前两种情况的结合,本实施例对此不作任何限制。
步骤S23:针对所述多个样本数据中的样本制造厂和样本经销商第一历史时长的多价值链样本历史数据,根据所述多价值链样本历史数据提取出样本采购节点和样本销售节点,并根据样本采购节点与样本采购节点、样本销售节点与样本销售节点、样本采购节点与样本销售节点之间的关系,构建多个样本动态异构图。
本实施例中,获取训练样本集后,可以针对多个样本数据中的样本制造厂和样本经销商第一历史时长的多价值链样本历史数据,其中,该多价值链样本历史数据可呈现为多价值链网状结构,根据该样本制造厂和样本经销商第一历史时长的多价值链网状结构提取出样本采购节点和样本销售节点,并根据样本采购节点与样本采购节点之间的关系、样本销售节点与样本销售节点之间的关系,以及,样本采购节点与样本销售节点之间的关系,构建多个样本动态异构图。本实施例中的样本采购节点即为用作模型训练的样本核心制造厂,样本销售节点即为用作模型训练的样本经销商。具体地,本步骤中“构建样本动态异构图”的方法与上述步骤S11中“构建动态异构图”的方法相同或相似,在此申请人不再过多赘述。
步骤S24:将每个样本动态异构图均按所述单位时间处理成多个样本静态异构图,得到每个样本静态异构图的样本邻接矩阵,所述样本邻接矩阵表征所述样本静态异构图中各节点之间的关系。
本实施例中,得到多个样本动态异构图后,可以将多个样本动态异构图中的每个动态异构图均按照单位时间分别处理成多个样本静态异构图,从而再根据每个样本静态异构图,得到表征样本静态异构图中各节点之间关系的样本静态异构图的邻接矩阵。其中,本实施例用于模型应用的单位时间与用于模型训练的单位时间相同。具体地,本步骤中“得到多个样本静态异构图及样本静态异构图的样本邻接矩阵”的方法与上述步骤S12中“得到多个样本静态异构图及样本静态异构图的样本邻接矩阵”的方法相同或相似,在此申请人不再过多赘述。
其中,结合以上实施例,在一可选实施方式中,本实施例中的步骤S24中的“得到每个样本静态异构图的样本邻接矩阵”可以具体包括步骤S31和步骤S32:
步骤S31:分别得到每个样本静态异构图的样本采购节点邻居矩阵、样本销售节点邻居矩阵和样本采购节点-样本销售节点关联矩阵。
本实施例在得到多个样本静态异构图后,可以根据多个样本静态异构图中的每个样本静态异构图,分别得到每个样本静态异构图的样本采购节点邻居矩阵、样本销售节点邻居矩阵和样本采购节点-样本销售节点关联矩阵。其中,样本采购节点邻居矩阵表征样本静态异构图中样本采购节点之间的关系,样本销售节点邻居矩阵表征样本静态异构图中样本销售节点之间的关系。
步骤S32:将每个样本静态异构图的样本采购节点邻居矩阵、样本销售节点邻居矩阵和样本采购节点-样本销售节点关联矩阵进行拼接,得到所述每个样本静态异构图的样本邻接矩阵。
本实施例在得到每个样本静态异构图的样本采购节点邻居矩阵、样本销售节点邻居矩阵和样本采购节点-样本销售节点关联矩阵后,再分别将该样本采购节点邻居矩阵、该样本销售节点邻居矩阵和该样本采购节点-样本销售节点关联矩阵进行拼接,从而分别得到每个样本静态异构图的样本邻接矩阵。
其中,结合以上实施例,在一可选实施方式中,本实施例中的步骤S32可以具体通过下式(1)得到每个样本静态异构图的样本邻接矩阵:
Figure BDA0003552197620000141
其中,AHG为样本静态异构图的样本邻接矩阵,(V,E)表示为样本静态异构图,V为样本静态异构图的顶点集合,E为样本静态异构图的边集合,AP为样本采购节点邻居矩阵,AS为样本销售节点邻居矩阵,AD为样本采购节点-样本销售节点关联矩阵,T为第一历史时长。其中,样本采购节点邻居矩阵为M×M大小,M表示样本采购节点的数量,样本销售节点邻居矩阵为N×N大小,N表示样本销售节点的数量,样本采购节点-样本销售节点关联矩阵为M×N大小。
在一可选实施方式中,在所述样本采购节点邻居矩阵中,若第一样本采购节点与第二样本采购节点为基于元路径的邻居,则所述第一样本采购节点与所述第二样本采购节点之间的关系在所述样本采购节点邻居矩阵中表示为1,反之为0;其中,所述第一样本采购节点与所述第二样本采购节点为任意两个样本采购节点。
在所述样本销售节点邻居矩阵中,若第一样本销售节点与第二样本销售节点为基于元路径的邻居,则所述第一样本销售节点与所述第二样本销售节点之间的关系在所述样本销售节点邻居矩阵中表示为1,反之为0;其中,所述第一样本销售节点与所述第二样本销售节点为任意两个样本销售节点。
而在所述样本采购节点-样本销售节点关联矩阵中,若第三样本采购节点与第三样本销售节点之间存在供给关系,则所述第三样本采购节点与第三样本销售节点之间的关系在所述样本采购节点-样本销售节点关联矩阵中表示为1,反之为0;其中,所述第三样本采购节点为任意的样本采购节点,所述第三样本销售节点为任意的样本销售节点。
结合以上实施例,在一可选实施例中,在本实施例中,元路径的定义为:元路径的作用为捕捉异构节点和边之间的关系。通常,一条元路径δ可以定义为:
Figure BDA0003552197620000151
其中,v1,v2,…,vn便是由边e1,e2,…,en连接的不同类型的点。例如,对于汽车制造异构图G,其中的一条元路径可以表示为“销售节点s1-采购节点p1-销售节点s2”,表示销售节点s1、s2均与采购节点p1存在联系。
基于元路径的邻居为:给定元路径δ,节点vi的邻居可以定义为通过元路径δ与节点vi连接的节点集Vi,其中节点的本身也包含在Vi当中。以汽车制造异构图G为例,元路径“销售节点s1-采购节点p1-销售节点s2”,销售节点s1基于该元路径的所有邻居为所有与采购节点p1有联系的销售节点,包括s1本身。
在本实施例中,所述第一样本采购节点与第二样本采购节点为基于元路径的邻居指的是:所述第一样本采购节点与第二样本采购节点之间存在一个第三样本销售节点,且所述第一样本采购节点和所述第二样本采购节点均与所述第三样本销售节点存在供给关系。
也就是说,第一样本采购节点与第二样本采购节点均与同一个第三样本销售节点存在供给关系,则第一样本采购节点与第二样本采购节点为基于元路径的邻居。
在本实施例中,所述第一样本销售节点与第二样本销售节点为基于元路径的邻居指的是:所述第一样本销售节点与第二样本销售节点之间存在一个第三样本采购节点,且所述第一样本销售节点和所述第二样本销售节点均与所述第三样本采购节点存在供给关系。
也就是说,第一样本销售节点与第二样本销售节点均与同一个第三样本采购节点存在供给关系,则第一样本销售节点与第二样本销售节点为基于元路径的邻居。
可以理解的是,通过本实施例中模型训练方法训练出来DHGCN_LSTM模型,在模型应用时,也需要根据上述相应的“确定样本静态异构图的样本邻接矩阵”的方法,得到每个静态异构图的邻接矩阵。
步骤S25:根据所述第一历史时长的多价值链样本历史数据中,每个样本静态异构图对应的单位时间内的样本配件采购相关数据和样本配件整车销售相关数据,得到每个样本静态异构图的样本特征矩阵。
本实施例中,多价值链样本历史数据中至少包括:样本配件采购相关数据和样本配件整车销售相关数据,在得到多个样本静态异构图后,可以根据获取到的第一历史时长的多价值链样本历史数据中,每个样本静态异构图对应的单位时间内的样本配件采购相关数据和样本配件整车销售相关数据,分别得到每个样本静态异构图的样本特征矩阵。具体地,本步骤中“确定样本静态异构图的样本特征矩阵”的方法与上述步骤S13中“确定静态异构图的特征矩阵”的方法相同或相似,在此申请人不再过多赘述。
其中,结合以上实施例,在一可选实施例中,所述样本配件采购相关数据包括:样本历史配件采购数据、样本配件缺货量、样本库存周期;所述样本配件整车销售相关数据包括:样本配件整车保有量、样本配件寿命、样本配件整车历史销售数据;上述步骤S25具体可以包括步骤S41-步骤S43:
步骤S41:针对所述样本静态异构图中的各样本采购节点,根据所述各样本采购节点的样本历史配件采购数据、样本配件缺货量、样本库存周期确定各样本采购节点的特征向量,将各样本采购节点的特征向量拼接成所述样本静态异构图的样本采购节点的特征矩阵。
汽车企业的配件采购与制造中心的生产计划与下游零售商的客户需求有关,因此需要考虑汽车考虑配件采购的影响因素和配件需求的影响因素,而配件采购的影响因素有配件缺货量、库存周期和配件历史采购数据。本实施例中,针对每个样本静态异构图中的各样本采购节点,可以根据第一历史时长的多价值链样本历史数据中,每个样本静态异构图对应的单位时间内的各样本采购节点的样本历史配件采购数据、样本配件缺货量、样本库存周期,分别确定每个样本静态异构图中各样本采购节点的特征向量,再将每个样本静态异构图中的各样本采购节点的特征向量分别拼接成每个样本静态异构图的样本采购节点的特征矩阵。示例的,可以用f1(p1)∈Rd表示样本采购节点p1的向量表示,样本静态异构图的样本采购节点的特征矩阵以XP表示:
Figure BDA0003552197620000171
步骤S42:针对所述样本静态异构图中的各样本销售节点,根据所述各样本销售节点的样本配件整车保有量、样本配件寿命、样本配件整车历史销售数据确定各样本销售节点的特征向量,将各样本销售节点的特征向量拼接成所述样本静态异构图的样本销售节点的特征矩阵。
而配件需求的影响因素有配件整车保有量、配件寿命和历史配件整车销售数据。因此在本实施例中,针对每个样本静态异构图中的各样本销售节点,可以根据第一历史时长的多价值链样本历史数据中,每个样本静态异构图对应的单位时间内的各样本销售节点的样本配件整车保有量、样本配件寿命、样本配件整车历史销售数据,分别确定每个样本静态异构图中各样本销售节点的特征向量,再将每个样本静态异构图中的各样本销售节点的特征向量分别拼接成每个样本静态异构图的样本销售节点的特征矩阵。示例的,可以用f1(s1)∈Rd表示样本销售节点S1的向量表示,样本静态异构图的样本销售节点的特征矩阵以XS表示:
Figure BDA0003552197620000172
步骤S43:将每个样本静态异构图的样本采购节点的特征矩阵和每个样本静态异构图的样本销售节点的特征矩阵进行拼接,得到所述每个样本静态异构图的样本特征矩阵。
本实施例中,得到每个样本静态异构图的样本采购节点的特征矩阵,和每个样本静态异构图的样本销售节点的特征矩阵后,将将每个样本静态异构图的样本采购节点的特征矩阵和每个样本静态异构图的样本销售节点的特征矩阵进行拼接,从而得到每个样本静态异构图的样本特征矩阵。示例的,样本静态异构图的样本特征矩阵以XHG表示:
Figure BDA0003552197620000181
可以理解的是,通过本实施例中模型训练方法训练出来DHGCN_LSTM模型,在模型应用时,需要根据上述相应的方法,根据各采购节点的历史配件采购数据、配件缺货量、库存周期确定各采购节点的特征向量,将各采购节点的特征向量拼接成静态异构图的采购节点的特征矩阵;根据各销售节点的配件整车保有量、配件寿命、配件整车历史销售数据确定各销售节点的特征向量,将各销售节点的特征向量拼接成静态异构图的样本销售节点的特征矩阵,从而将每个静态异构图的采购节点的特征矩阵和每个静态异构图的销售节点的特征矩阵进行拼接,得到每个静态异构图的特征矩阵。
步骤S26:将多个样本静态异构图的样本邻接矩阵和样本特征矩阵分别按时间先后顺序,输入至所述初始DHGCN_LSTM模型中,得到样本制造厂第二历史时长的配件需求预测结果。
本实施例中,在得到多个样本静态异构图的样本邻接矩阵和样本特征矩阵后,即可将该多个样本静态异构图的样本邻接矩阵和样本特征矩阵分别按时间先后顺序,输入至初始DHGCN_LSTM模型中。例如,针对每一个样本动态异构图,按照时间顺序将该样本动态异构图处理成的第一个样本静态异构图的样本邻接矩阵和样本特征矩阵输入至初始DHGCN_LSTM模型,再将第二个样本静态异构图的样本邻接矩阵和样本特征矩阵输入至初始DHGCN_LSTM模型……直至将该样本动态异构图处理成的最后一个样本静态异构图的样本邻接矩阵和样本特征矩阵输入至初始DHGCN_LSTM模型,从而得到样本制造厂第二历史时长的配件需求预测结果。
其中,本实施例的初始DHGCN_LSTM模型为基于与核心制造厂相关的多价值链历史数据进行训练的、用于预测第二时长的核心制造厂配件需求的DHGCN_LSTM组合模型,其中,本实施例中的第一时长和第二时长均可在模型训练时自由设置。本实施例中初始DHGCN_LSTM模型的输入为:多个样本静态异构图的样本邻接矩阵和样本特征矩阵;初始DHGCN_LSTM模型的输出为:样本制造厂第二历史时长的配件需求预测结果。
具体地,DHGCN_LSTM的公式如下所示:
[XT+1,…,XT+t]=DHGCN_LSTM(A;(X1,…,XT-1,XT))   公式(1)
其中,T为第一历史时长,DHGCN_LSTM根据第一历史时长的多价值链样本历史数据预测出未来t时刻(第二历史时长)的配件采购需求数据。A为异构图的邻接矩阵,X为异构图的特征矩阵,+1…为陆续增加单位时间。
结合以上实施例,在一可选实施例中,本发明还提出一种基于动态异构图卷积的多价值链汽车配件需求预测方法,在该方法中,上述步骤S26具体可以包括步骤S51和步骤S52:
步骤S51:将所述多个样本静态异构图的样本邻接矩阵和样本特征矩阵分别按时间先后顺序,输入至初始DHGCN_LSTM模型中的GCN部分,得到多个新的样本特征矩阵。
本实施例中,初始DHGCN_LSTM模型为组合模型,分为GCN部分和LSTM部分。而多价值链的“网状”结构是非欧式数据结构,为了嵌入空间结构信息和节点特征,可用GCN部分来提取异构图的结构特征,将节点特征与所有直接连接的邻居的特征进行卷积。也即,GCN(Graph Convolutional Networks,图卷积神经网络)部分用于从多价值链样本历史数据(即非欧式数据)中提取出空间关联特征。
本实施例可以是将该多个样本静态异构图的样本邻接矩阵和样本特征矩阵分别按时间先后顺序,输入至初始DHGCN_LSTM模型中的GCN部分,分别得到经GCN特征提取后的多个新的样本特征矩阵。例如,针对每一个样本动态异构图,按照时间顺序将该样本动态异构图处理成的第一个样本静态异构图的样本邻接矩阵和样本特征矩阵输入至初始DHGCN_LSTM模型中的GCN部分,再将第二个样本静态异构图的样本邻接矩阵和样本特征矩阵输入至初始DHGCN_LSTM模型中的GCN部分……直至将该样本动态异构图处理成的最后一个样本静态异构图的样本邻接矩阵和样本特征矩阵输入至初始DHGCN_LSTM模型中的GCN部分,从而分别得到多个新的样本特征矩阵。
具体地,本实施例中GCN的公式如下:
Figure BDA0003552197620000201
其中,在公式(2)中,
Figure BDA0003552197620000202
Figure BDA0003552197620000203
表示自关联结构的矩阵,AHG表示异构图的邻接矩阵,IN表示对角矩阵,其对角线均为1;
Figure BDA0003552197620000204
表示度矩阵,
Figure BDA0003552197620000205
W表示权重矩阵;H(L)表示L层的特征矩阵,H(0)即为输入的特征矩阵XHG;σ为ReLU激活函数。卷积层的输出表示为H∈RN×d,N表示节点的总数量,d表示特征的维度,R表示自然数。
步骤S52:将所述多个新的样本特征矩阵进行拼接压缩处理后,输入至初始DHGCN_LSTM模型中的LSTM部分,得到所述样本制造厂第二历史时长的配件需求预测结果。
本实施例中,得到每个样本动态异构图的多个新的样本特征矩阵,将该多个新的样本特征矩阵进行拼接压缩处理后再输入至初始DHGCN_LSTM模型中的LSTM部分,从而得到LSTM部分的输出,即整个初始DHGCN_LSTM模型输出的结果:样本制造厂第二历史时长的配件需求预测结果。其中,LSTM(Long-Short Term Memory,长短期记忆网络)部分用于对时间序列的空间关联数据进行预测以输出最后的配件需求预测结果。
结合以上实施例,在一可选实施例中,上述步骤S52具体可以包括步骤S61-步骤S64:
步骤S61:将所述多个新的样本特征矩阵进行拼接,得到一个样本三维矩阵。
本实施例中,得到每个样本动态异构图的多个新的样本特征矩阵,将卷积层的输出数据(即多个新的样本特征矩阵)拼接为一个T×N×d的样本三维矩阵,其中T为第一历史时长,N为样本采购节点和样本销售节点的总数量,d为节点特征数量,公式如下,其中H为新的样本特征矩阵:
Figure BDA0003552197620000211
步骤S62:通过权重矩阵将样本三维矩阵中的特征向量维度压缩为1,从而实现将所述样本三维矩阵压缩为一个样本二维矩阵。
本实施例中,得到样本三维矩阵D后,为了便于将其输入值LSTM部分,需要对其进行进一步的处理,具体地,可以使用一个大小为1×(T·N)的权重矩阵
Figure BDA00035521976200002114
沿着特征方向对每一个点进行一维卷积运算,从而将样本三维矩阵D压缩为T×N的样本二维矩阵
Figure BDA00035521976200002115
公式如下:
Figure BDA0003552197620000212
步骤S63:通过滑动窗口对所述样本二维矩阵进行序列化表示,得到一个包含多个元素的序列。
本实施例中,得到样本二维矩阵后,可以使用一个窗体大小为N×w的滑动窗口对样本二维矩阵
Figure BDA00035521976200002116
进行处理,得到一个长度为K的序列,即
Figure BDA0003552197620000213
Figure BDA0003552197620000214
其中每个
Figure BDA0003552197620000215
w代表着第一历史时长T与预测时间长度(即第二历史时长)t之和;T为12个月,t为1个月,则w为13,而如果有100个月的样本数据,则可以通过窗口划分为多个训练块,
Figure BDA0003552197620000216
则为第一个训练块,
Figure BDA0003552197620000217
而x1表示第一个单位时间的处理好的配件采购历史数据,x2表示第二个单位时间的处理好的配件采购历史数据等等以此类推;
Figure BDA0003552197620000218
则为第二个训练块,
Figure BDA0003552197620000219
……以此类推,从而得到处理好的配件采购历史数据
Figure BDA00035521976200002110
步骤S64:将所述序列中的多个元素依次输入至所述初始DHGCN_LSTM模型中的LSTM部分。
本实施例中,得到处理好的配件采购历史数据
Figure BDA00035521976200002111
后,则将
Figure BDA00035521976200002112
作为初始DHGCN_LSTM模型中LSTM模型的输入。其中,LSTM部分由3个门组成:输入门、遗忘门、输出门。对于输入配件采购历史数据
Figure BDA00035521976200002113
中的每一个数据,计算方式如下:
遗忘门:
ft=sigmoid(Wf·[ht-1,xt]+bf)     公式(5)
输入门:
it=sigmoid(Wi·[ht-1,xt]+bi)       公式(6)
Figure BDA0003552197620000223
Figure BDA0003552197620000224
输出门:
Ot=sigmoid(Wo·[ht-1,xt]+bo)        公式(9)
ht=Ot*tanh(Ct)                 公式(10)
其中,xt为t时刻的输入数据即
Figure BDA0003552197620000221
等等,ht-1表示t-1时刻的输出的状态,即接收到的上一个节点的输入,其中,h0可以设为1。ft表示遗忘门,it表示输入门,
Figure BDA0003552197620000222
表示通过单元状态得到的当前时刻暂时的细胞状态,Ct表示更新后当前的细胞状态,ht表示最终的输出,即最后输出的配件需求预测结果,Wf、Wi、Wc、Wo表示训练过程中的参数,bf、bi、bc、bo为训练过程中的偏置矩阵,“·”为矩阵中样本点相乘,“*”为矩阵相乘,sigmoid(·)和tanh(·)为激活函数。
其中请参考图4,图4是本发明一实施例示出的DHGCN_LSTM的网络结构。如图4所示,G1、G2......GT为多个针对单位时间依次得到的样本静态异构图,将G1、G2......GT(将G1、G2......GT分别对应的邻接矩阵和特征矩阵)按照时间顺序依次输入值GCN网络进行处理得到多个新的样本特征矩阵,将该多个新的样本特征矩阵拼接压缩后得到样本二维矩阵,再将样本二维矩阵输入至LSTM网络从而得到输出结果。
步骤S27:根据所述样本制造厂第二历史时长的配件需求预测结果与所述样本制造厂第二历史时长的多价值链样本历史数据中的实际配件需求结果,对所述初始DHGCN_LSTM模型的模型参数进行迭代更新,直至满足预设条件时结束训练,得到所述训练好的DHGCN_LSTM模型。
本实施例中,初始DHGCN_LSTM模型输出第二历史时长的配件需求预测结果后,根据样本制造厂第二历史时长的配件需求预测结果与样本制造厂第二历史时长的多价值链样本历史数据中的实际配件需求结果(即模型的标签),计算更新模型参数的梯度,从而对初始DHGCN_LSTM模型的模型参数进行迭代更新,直至满足预设条件时结束训练,从而得到训练好的DHGCN_LSTM模型。其中,本实施例的预设条件为样本制造厂第二历史时长的配件需求预测结果与样本制造厂第二历史时长的实际配件需求结果之间的误差小于第一误差阈值,或模型的迭代次数达到迭代阈值;其中,第一误差阈值为配件需求预测所能允许的最大误差,迭代阈值为DHGCN_LSTM模型所能允许的最大迭代次数。
此外,在一可选的实施方式中,得到训练好的DHGCN_LSTM模型,还会通过设置测试集对该训练好的DHGCN_LSTM模型进行进一步的测试,将测试集中的第一历史时长的多价值链样本历史数据处理后输入至该训练好的DHGCN_LSTM模型,将该训练好的DHGCN_LSTM模型的输出与该测试集中的第二历史时长的多价值链样本历史数据中的实际配件需求结果进行误差计算,从而验证该训练好的DHGCN_LSTM模型是否满足要求(小于第二误差阈值)其中,第二误差阈值为事先设置好的满足测试要求的最大误差:如果小于则表征DHGCN_LSTM模型通过测试,将训练好的DHGCN_LSTM模型最为最终的DHGCN_LSTM模型;如果不小于,则重新划分训练集和测试集,再重新根据上述模型训练方法进行初始DHGCN_LSTM模型的训练,直至满足要求,得到最终的DHGCN_LSTM模型。
在本实施例中,通过进行汽车配件需求预测模型的训练时,充分考虑了核心制造厂涉及的多价值产业链中各价值链部分对配件采购的影响,并选取了能够提取出多价值链中丰富的空间关联特征并充分感知长时间跨度的历史数据的初始DHGCN_LSTM模型进行训练,从而使得使用训练好的DHGCN_LSTM模型进行汽车配件采购需求预测的准确率有了大幅度提升,从而为汽车制造企业的相关配件采购部门提供了优质的配件采购服务。
在一可选的实施方式中,请参考图5,图5是本发明一实施例示出的DHGCN_LSTM模型的训练流程图。如图5所示,开始后首先构建初始DHGCN_LSTM模型并进行初始化模型参数;然后根据异构图邻接矩阵和异构图特征矩阵组成的训练集,然后按时间顺序依次输入DHGCN_LSTM模型的GCN模型,并执行GCN模型,从而聚合异构图的邻居节点信息,得到更新的特征矩阵;看是否到达第一历史时长(时间长度T):如没达到时间长度T,则继续将后续异构图邻接矩阵和异构图特征矩阵输入GCN模型,并执行GCN模型;如到达时间长度T,则拼接时间长度T的GCN的输出结果,并在拼接后压缩为一个二维矩阵;将二维矩阵输入DHGCN_LSTM模型的LSTM模型,并执行LSTM模型,得到LSTM模型的输出后与训练集中的标签计算更新参数的梯度,从而更新模型参数;将训练集中的多个样本数据按前述方法进行模型参数的更新,并判断梯度误差是否达到要求,或,迭代次数是否到达最大值:如果梯度误差达到要求,或,迭代次数到达最大值,则判断模型训练是否结束;如果梯度误差没有达到要求,或,迭代次数没有到达最大值,则判断继续将训练集中的多个样本数据按前述方法再次进行模型参数的迭代更新。判断模型训练是否结束,如果模型训练未结束,则继续将训练集中的多个样本数据按前述方法再次进行模型参数的迭代更新;如果模型训练结束,则将根据异构图邻接矩阵和异构图特征矩阵组成的测试集输入DHGCN_LSTM模型进行模型测试,从而得到DHGCN_LSTM模型输出的预测结果,再根据测试集中的标签与模型输出结果计算误差指标,如果满足要求则结束整个DHGCN_LSTM模型模型的训练,得到最终的DHGCN_LSTM预测模型。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明实施例所必须的。
尽管已描述了本发明实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
以上对本发明所提供的一种基于动态异构图卷积的多价值链汽车配件需求预测方法,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (4)

1.一种基于动态异构图卷积的多价值链汽车配件需求预测方法,其特征在于,所述方法包括:
获取历史第一时间段内与目标制造厂相关的多价值链历史数据,根据所述多价值链历史数据提取出采购节点和销售节点,并根据采购节点与采购节点、销售节点与销售节点、采购节点与销售节点之间的关系构建动态异构图;
将所述动态异构图按单位时间处理成多个静态异构图,并得到每个静态异构图的邻接矩阵,所述邻接矩阵表征所述静态异构图中各节点之间的关系;
根据所述多价值链历史数据中,每个静态异构图对应的单位时间内的配件采购相关数据和配件整车销售相关数据,得到每个静态异构图的特征矩阵;
将多个静态异构图的邻接矩阵和特征矩阵分别按时间先后顺序,输入至训练好的DHGCN_LSTM模型中,得到所述目标制造厂在未来第二时间段内的配件需求预测结果;
所述DHGCN_LSTM模型的训练过程包括以下步骤:
构建初始DHGCN_LSTM模型并初始化模型参数;
获取多个样本数据,所述样本数据包括:样本制造厂和样本经销商预设历史时长的多价值链样本历史数据;其中,所述预设历史时长包括第一历史时长和第二历史时长,第一历史时长的多价值链样本历史数据用于得到所述初始DHGCN_LSTM模型的输入,第二历史时长的多价值链样本历史数据中的实际配件需求结果用于验证所述初始DHGCN_LSTM模型输出的配件需求预测结果;
针对所述多个样本数据中的样本制造厂和样本经销商第一历史时长的多价值链样本历史数据,根据所述多价值链样本历史数据提取出样本采购节点和样本销售节点,并根据样本采购节点与样本采购节点、样本销售节点与样本销售节点、样本采购节点与样本销售节点之间的关系,构建多个样本动态异构图;
将每个样本动态异构图均按所述单位时间处理成多个样本静态异构图,得到每个样本静态异构图的样本邻接矩阵,所述样本邻接矩阵表征所述样本静态异构图中各节点之间的关系;
根据所述第一历史时长的多价值链样本历史数据中,每个样本静态异构图对应的单位时间内的样本配件采购相关数据和样本配件整车销售相关数据,得到每个样本静态异构图的样本特征矩阵;
将多个样本静态异构图的样本邻接矩阵和样本特征矩阵分别按时间先后顺序,输入至所述初始DHGCN_LSTM模型中,得到样本制造厂第二历史时长的配件需求预测结果;
根据所述样本制造厂第二历史时长的配件需求预测结果与所述样本制造厂第二历史时长的多价值链样本历史数据中的实际配件需求结果,对所述初始DHGCN_LSTM模型的模型参数进行迭代更新,直至满足预设条件时结束训练,得到所述训练好的DHGCN_LSTM模型;
所述得到每个样本静态异构图的样本邻接矩阵,包括:
分别得到每个样本静态异构图的样本采购节点邻居矩阵、样本销售节点邻居矩阵和样本采购节点-样本销售节点关联矩阵;
将每个样本静态异构图的样本采购节点邻居矩阵、样本销售节点邻居矩阵和样本采购节点-样本销售节点关联矩阵进行拼接,得到所述每个样本静态异构图的样本邻接矩阵;
其中,所述样本采购节点邻居矩阵表征所述样本静态异构图中样本采购节点之间的关系,所述样本销售节点邻居矩阵表征所述样本静态异构图中样本销售节点之间的关系;
所述将每个样本静态异构图的样本采购节点邻居矩阵、样本销售节点邻居矩阵和样本采购节点-样本销售节点关联矩阵进行拼接,得到所述每个样本静态异构图的样本邻接矩阵,包括:
通过下式得到所述每个样本静态异构图的样本邻接矩阵:
Figure FDA0004054612260000021
其中,AHG为样本静态异构图的样本邻接矩阵,AP为样本采购节点邻居矩阵,AS为样本销售节点邻居矩阵,AD为样本采购节点-样本销售节点关联矩阵;
在所述样本采购节点邻居矩阵中,若第一样本采购节点与第二样本采购节点为基于元路径的邻居,则所述第一样本采购节点与所述第二样本采购节点之间的关系在所述样本采购节点邻居矩阵中表示为1,反之为0;
在所述样本销售节点邻居矩阵中,若第一样本销售节点与第二样本销售节点为基于元路径的邻居,则所述第一样本销售节点与所述第二样本销售节点之间的关系在所述样本销售节点邻居矩阵中表示为1,反之为0;
在所述样本采购节点-样本销售节点关联矩阵中,若第三样本采购节点与第三样本销售节点之间存在供给关系,则所述第三样本采购节点与第三样本销售节点之间的关系在所述样本采购节点-样本销售节点关联矩阵中表示为1,反之为0;
其中,所述第一样本采购节点与所述第二样本采购节点为任意两个样本采购节点,所述第一样本销售节点与所述第二样本销售节点为任意两个样本销售节点,所述第三样本采购节点为任意的样本采购节点,所述第三样本销售节点为任意的样本销售节点;
所述元路径旨在捕捉异构图中节点与边之间的关系;所述第一样本采购节点与第二样本采购节点为基于元路径的邻居指的是:所述第一样本采购节点与第二样本采购节点之间存在一个第三样本销售节点,且所述第一样本采购节点和所述第二样本采购节点均与所述第三样本销售节点存在供给关系;
所述第一样本销售节点与第二样本销售节点为基于元路径的邻居指的是:所述第一样本销售节点与第二样本销售节点之间存在一个第三样本采购节点,且所述第一样本销售节点或所述第二样本销售节点均与所述第三样本采购节点存在供给关系;
所述样本配件采购相关数据包括:样本历史配件采购数据、样本配件缺货量、样本库存周期;所述样本配件整车销售相关数据包括:样本配件整车保有量、样本配件寿命、样本配件整车历史销售数据;
所述根据所述第一历史时长的多价值链样本历史数据中,每个样本静态异构图对应的单位时间内的样本配件采购相关数据和样本配件整车销售相关数据,得到每个样本静态异构图的样本特征矩阵,包括:
针对所述样本静态异构图中的各样本采购节点,根据所述各样本采购节点的样本历史配件采购数据、样本配件缺货量、样本库存周期确定各样本采购节点的特征向量,将各样本采购节点的特征向量拼接成所述样本静态异构图的样本采购节点的特征矩阵;
针对所述样本静态异构图中的各样本销售节点,根据所述各样本销售节点的样本配件整车保有量、样本配件寿命、样本配件整车历史销售数据确定各样本销售节点的特征向量,将各样本销售节点的特征向量拼接成所述样本静态异构图的样本销售节点的特征矩阵;
将每个样本静态异构图的样本采购节点的特征矩阵和每个样本静态异构图的样本销售节点的特征矩阵进行拼接,得到所述每个样本静态异构图的样本特征矩阵。
2.根据权利要求1所述的方法,其特征在于,所述将多个样本静态异构图的样本邻接矩阵和样本特征矩阵分别按时间先后顺序,输入至所述初始DHGCN_LSTM模型中,得到样本制造厂第二历史时长的配件需求预测结果,包括:
将所述多个样本静态异构图的样本邻接矩阵和样本特征矩阵分别按时间先后顺序,输入至初始DHGCN_LSTM模型中的GCN部分,得到多个新的样本特征矩阵;
将所述多个新的样本特征矩阵进行拼接压缩处理后,输入至初始DHGCN_LSTM模型中的LSTM部分,得到所述样本制造厂第二历史时长的配件需求预测结果。
3.根据权利要求2所述的方法,其特征在于,所述将所述多个新的样本特征矩阵进行拼接压缩处理后,输入至初始DHGCN_LSTM模型中的LSTM部分,包括:
将所述多个新的样本特征矩阵进行拼接,得到一个样本三维矩阵;
通过权重矩阵将样本三维矩阵中的特征向量维度压缩为1,从而实现将所述样本三维矩阵压缩为一个样本二维矩阵;
通过滑动窗口对所述样本二维矩阵进行序列化表示,得到一个包含多个元素的序列;
将所述序列中的多个元素依次输入至所述初始DHGCN_LSTM模型中的LSTM部分。
4.根据权利要求1所述的方法,其特征在于,所述历史第一时间段与所述未来第二时间段为连续的时间段,所述第一历史时长与所述第二历史时长在时间上连续。
CN202210264743.4A 2022-03-17 2022-03-17 基于动态异构图卷积的多价值链汽车配件需求预测方法 Active CN114595897B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210264743.4A CN114595897B (zh) 2022-03-17 2022-03-17 基于动态异构图卷积的多价值链汽车配件需求预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210264743.4A CN114595897B (zh) 2022-03-17 2022-03-17 基于动态异构图卷积的多价值链汽车配件需求预测方法

Publications (2)

Publication Number Publication Date
CN114595897A CN114595897A (zh) 2022-06-07
CN114595897B true CN114595897B (zh) 2023-04-18

Family

ID=81810271

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210264743.4A Active CN114595897B (zh) 2022-03-17 2022-03-17 基于动态异构图卷积的多价值链汽车配件需求预测方法

Country Status (1)

Country Link
CN (1) CN114595897B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112862092A (zh) * 2021-01-26 2021-05-28 中山大学 一种异构图卷积网络的训练方法、装置、设备和介质
CN114007228A (zh) * 2021-11-01 2022-02-01 天津大学 基于异构图神经网络流量预测的基站智能控制方法
CN114154716A (zh) * 2021-12-03 2022-03-08 北京航天创智科技有限公司 一种基于图神经网络的企业能耗预测方法及装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210398439A1 (en) * 2020-06-18 2021-12-23 The Hong Kong University Of Science And Technology Peer-inspired student performance prediction in interactive online question pools with graph neural network

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112862092A (zh) * 2021-01-26 2021-05-28 中山大学 一种异构图卷积网络的训练方法、装置、设备和介质
CN114007228A (zh) * 2021-11-01 2022-02-01 天津大学 基于异构图神经网络流量预测的基站智能控制方法
CN114154716A (zh) * 2021-12-03 2022-03-08 北京航天创智科技有限公司 一种基于图神经网络的企业能耗预测方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
陈明露等.基于多价值链的汽车零配件需求预测研究.《现代计算机》.2020,第3-8页. *

Also Published As

Publication number Publication date
CN114595897A (zh) 2022-06-07

Similar Documents

Publication Publication Date Title
Chandriah et al. RNN/LSTM with modified Adam optimizer in deep learning approach for automobile spare parts demand forecasting
US20200090195A1 (en) Electronic neural network system for dynamically producing predictive data using varying data
Cheung et al. Thompson sampling for online personalized assortment optimization problems with multinomial logit choice models
US8374903B2 (en) Information criterion-based systems and methods for constructing combining weights for multimodel forecasting and prediction
US8180664B2 (en) Methods and systems for forecasting with model-based PDF estimates
US20140207705A1 (en) Residual risk analysis system, method and computer program product therefor
CN110717824A (zh) 基于知识图谱的银行对公客群风险传导测算的方法及装置
CN111160968A (zh) Sku级别商品销量预测方法及装置
Filimonov et al. Modified profile likelihood inference and interval forecast of the burst of financial bubbles
Do Chung et al. Demand learning and dynamic pricing under competition in a state-space framework
US10685363B2 (en) System, method and computer program for forecasting residual values of a durable good over time
US20190378180A1 (en) Method and system for generating and using vehicle pricing models
US11537825B2 (en) Systems and methods for features engineering
US9324026B2 (en) Hierarchical latent variable model estimation device, hierarchical latent variable model estimation method, supply amount prediction device, supply amount prediction method, and recording medium
CN113506143A (zh) 商品折扣生成方法、装置、设备以及计算机可读存储介质
Gong et al. Bandits atop reinforcement learning: Tackling online inventory models with cyclic demands
US20140122173A1 (en) Estimating semi-parametric product demand models
CN117252307B (zh) 流量预测方法、装置、计算机设备和存储介质
CN114595897B (zh) 基于动态异构图卷积的多价值链汽车配件需求预测方法
EP3309735A1 (en) System, method and computer program for improved forecasting residual values of a durable good over time
CN113837782A (zh) 时间序列模型的周期项参数优化方法、装置、计算机设备
Kokare et al. Study and Analysis of Stock Market Prediction Techniques
CN116151635B (zh) 一种基于多维关系图的抗风险企业决策的优化方法和装置
CN112101611B (zh) 房地产客户复购时间的预测方法、服务器及存储介质
US20230131735A1 (en) Affinity graph extraction and updating systems and methods

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant