CN115640893A - 一种产业链的产业数据预测方法、装置及存储介质 - Google Patents

一种产业链的产业数据预测方法、装置及存储介质 Download PDF

Info

Publication number
CN115640893A
CN115640893A CN202211289528.6A CN202211289528A CN115640893A CN 115640893 A CN115640893 A CN 115640893A CN 202211289528 A CN202211289528 A CN 202211289528A CN 115640893 A CN115640893 A CN 115640893A
Authority
CN
China
Prior art keywords
data
industrial
period
industrial chain
difference
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211289528.6A
Other languages
English (en)
Inventor
邓立邦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Southern Finance Holdings Co ltd
Original Assignee
Guangdong Southern Finance Holdings Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Southern Finance Holdings Co ltd filed Critical Guangdong Southern Finance Holdings Co ltd
Priority to CN202211289528.6A priority Critical patent/CN115640893A/zh
Publication of CN115640893A publication Critical patent/CN115640893A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种产业链的产业数据预测方法、装置及存储介质,对各历史周期中同一产业链节点的产业数据的分组,每一组为一滑动窗口,从而得到若干不定长的滑动窗口;在预测时,利用固定的滑动窗口获取第一输入数据;基于若干不定长的滑动窗口,获取第二输入数据和第三输入数据;最后基于取第一输入数据、第二输入数据和第三输入数据,提取出数据在不同时间周期的特征,实现数据的预测,提高了预测结果准确性;此外,在获取第三输入数据时,对相邻产业链节点的数据进行拼接,进一步提高预测结果的准确性。

Description

一种产业链的产业数据预测方法、装置及存储介质
技术领域
本发明涉及数据分析技术领域,尤其涉及一种产业链的产业数据预测方法、装置及存储介质。
背景技术
产业链上下游的产能与销售数据预测,是社会经济和商业发展中的常见问题,也最难解决的问题之一。
目前已有的预测方法和模型有着比较显著的使用限制,一是通过标准的数学模型和公式,例如kalman filter、ARIMA(差分整合移动平均自回归模型)等,二是引入机器学习算法,包括时间卷积网络,LSTM多变量分析模型等。
采用传统的数学模型和公式对无力世界的预测比较精确,对符合正态分布等规则以及有固定时间周期特性的数据也有不错的预测效果。但对非线性及非平稳时间序列对数据,特别是对社会经济类型的数据,时间滑动窗口的尺寸在整个周期中不稳定,传统的数学方式的使用前提难以被满足。
而采用现有的机器学习方法,无论是时间卷积网络,还是循环神经网络和LSTM;其采用固定的滑动时间窗口,提取数据在固定时间周期上的特征,难以兼顾及提取数据在不同时间周期的特征,预测结果准确性较低;其次,现有的机器学习方法,无法学习产业链中相邻产业链节点之间数据特征的关联性,进一步降低了预测结果的准确性。
发明内容
本发明实施例提供一种产业链的产业数据预测方法、装置及存储介质,能提高产业链的产业数据预测的准确性。
本发明一实施例提供了一种产业链的产业数据预测方法,包括:获取当前预测周期的前N个历史周期的产业链数据,并逐一计算每一相邻历史周期中同一产业链节点的产业数据之间的差值,根据差值将各历史周期中同一产业链节点的产业数据划分为不同数据组,获得各产业链节点所对应的各合并周期数据组;其中,所述产业链数据包括:产业链上若干个产业链节点的产业数据;
获取当前预测周期的前T个历史周期的第一产业链数据,获得第一输入数据;其中,T≤N;
分别获取每一产业链节点所对应的K个第一选定合并周期数据组;其中,所述K个第一选定合并周期数据组为与当前预测周期相邻的前K个合并周期的合并周期数据组;计算每一第一选定合并周期数据组的数据均值,获得若干第一产业数据均值,将所有第一产业数据均值作为第二输入数据;其中,K≤N;
分别获取每一产业链节点所对应的E个第二选定合并周期数据组;其中,所述E个第二选定合并周期数据组为与当前预测周期相邻的前E个合并周期的合并周期数据组;计算每一第二选定合并周期数据组的数据均值,获得若干第二产业数据均值;将归属于同一产业链节点的第二产业数据均值分为同一组,获得若干产业数据均值组;将相邻产业链节点所对应的产业数据均值组拼接为一输入数据组,获得若干输入数据组,将所有输入数据组作为第三输入数据;其中,E≤N;
将所述第一输入数据、第二输入数据及所述第三输入数据输入至预设的产业数据预测模型中,以使所述产业数据预测模型通过第一子网络提取第一输入数据的第一数据特征,通过第二子网络提取第二输入数据的第二数据特征,通过第三子网络提取第三输入数据的第三数据特征,并基于第一数据特征、第二数据特征以及第三数据特征通过第四子网络生成当前预测周期的各产业数据的预测结果。
进一步的,所述根据差值将各历史周期中同一产业链节点的产业数据划分为不同数据组,包括:
根据各相邻历史周期中同一产业链节点的产业数据之间的差值,计算算术平均值;
将所述算术平均值的二分之一作为基准值;
将各差值与基准值进行比较,确定各差值与基准值的大小关系,得到各差值的第一数据关系;
依次比对相邻差值的第一数据关系是否相同,继而确定分割点差值;其中,所述分割点差值的第一数据关系与前一相邻差值的第一数据关系不同;
根据分割点差值确定数据分割点,继而根据各数据分割点将各历史周期中同一产业链节点的产业数据划分为不同数据组。
进一步的,所述根据差值将各历史周期中同一产业链节点的产业数据划分为不同数据组,包括:
逐一计算相邻两差值之间的比值,获得若干第一比值;
根据各第一比值确定分割点差值;其中,所述分割点差值与前一相邻差值的第一比值不在预设范围内;
根据分割点差值确定数据分割点,继而根据各数据分割点将各历史周期中同一产业链节点的产业数据划分为不同数据组。
进一步的,所述根据差值将各历史周期中同一产业链节点的产业数据划分为不同数据组,包括:
通过k-means算法,将各差值进行分类;
根据各差值的类别确定分割点差值;其中,所述分割点差值的类别与前一相邻差值的类别不同;
根据分割点差值确定数据分割点,继而根据各数据分割点将各历史周期中同一产业链节点的产业数据划分为不同数据组。
进一步的,所述第一子网络为前馈网络;所述第二子网络和所述第三子网络均为循环网络;所述第四子网络为全连接网络。
在上述方法项实施例的基础上,本发明对应提供了装置项实施例;
本发明一实施例提供了一种产业链的产业数据预测装置,包括:历史周期数据处理模块、第一输入数据提取模块、第二输入数据提取模块、第三输入数据提取模块以及数据预测模块;
所述历史周期数据处理模块,用于获取当前预测周期的前N个历史周期的产业链数据,并逐一计算每一相邻历史周期中同一产业链节点的产业数据之间的差值,根据差值将各历史周期中同一产业链节点的产业数据划分为不同数据组,获得各产业链节点所对应的各合并周期数据组;其中,所述产业链数据包括:产业链上若干个产业链节点的产业数据;
所述第一输入数据提取模块,用于获取当前预测周期的前T个历史周期的第一产业链数据,获得第一输入数据;其中,T≤N;
所述第二输入数据提取模块,用于
分别获取每一产业链节点所对应的K个第一选定合并周期数据组;其中,所述K个第一选定合并周期数据组为与当前预测周期相邻的前K个合并周期的合并周期数据组;计算每一第一选定合并周期数据组的数据均值,获得若干第一产业数据均值,将所有第一产业数据均值作为第二输入数据;其中,K≤N;
所述第三输入数据提取模块,用于分别获取每一产业链节点所对应的E个第二选定合并周期数据组;其中,所述E个第二选定合并周期数据组为与当前预测周期相邻的前E个合并周期的合并周期数据组;计算每一第二选定合并周期数据组的数据均值,获得若干第二产业数据均值;将归属于同一产业链节点的第二产业数据均值分为同一组,获得若干产业数据均值组;将相邻产业链节点所对应的产业数据均值组拼接为一输入数据组,获得若干输入数据组,将所有输入数据组作为第三输入数据;其中,E≤N;
所述数据预测模块,用于将所述第一输入数据、第二输入数据及所述第三输入数据输入至预设的产业数据预测模型中,以使所述产业数据预测模型通过第一子网络提取第一输入数据的第一数据特征,通过第二子网络提取第二输入数据的第二数据特征,通过第三子网络提取第三输入数据的第三数据特征,并基于第一数据特征、第二数据特征以及第三数据特征通过第四子网络生成当前预测周期的各产业数据的预测结果。
进一步的,历史周期数据处理模块,根据差值将各历史周期中同一产业链节点的产业数据划分为不同数据组,包括:
根据各相邻历史周期中同一产业链节点的产业数据之间的差值,计算算术平均值;
将所述算术平均值的二分之一作为基准值;
将各差值与基准值进行比较,确定各差值与基准值的大小关系,得到各差值的第一数据关系;
依次比对相邻差值的第一数据关系是否相同,继而确定分割点差值;其中,所述分割点差值的第一数据关系与前一相邻差值的第一数据关系不同;
根据分割点差值确定数据分割点,继而根据各数据分割点将各历史周期中同一产业链节点的产业数据划分为不同数据组。
进一步的,历史周期数据处理模块,根据差值将各历史周期中同一产业链节点的产业数据划分为不同数据组,包括:逐一计算相邻两差值之间的比值,获得若干第一比值;
根据各第一比值确定分割点差值;其中,所述分割点差值与前一相邻差值的第一比值不在预设范围内;
根据分割点差值确定数据分割点,继而根据各数据分割点将各历史周期中同一产业链节点的产业数据划分为不同数据组。
进一步的,历史周期数据处理模块,根据差值将各历史周期中同一产业链节点的产业数据划分为不同数据组,包括:
通过k-means算法,将各差值进行分类;
根据各差值的类别确定分割点差值;其中,所述分割点差值的类别与前一相邻差值的类别不同;
根据分割点差值确定数据分割点,继而根据各数据分割点将各历史周期中同一产业链节点的产业数据划分为不同数据组。
在上述方法项实施例的基础上,本发明对应提供了存储介质项实施例;
本发明实施例提供了一种存储介质,所述存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述存储介质所在设备执行本发明任意一项所述的产业链的产业数据预测方法。
通过实施本发明实施例具有如下有益效果:
本发明实施例提供了一种产业链的产业数据预测方法、装置及存储介质,与现有技术相比,基于对各历史周期中同一产业链节点的产业数据的分组,每一组为一滑动窗口,从而得到若干不定长的滑动窗口;在预测时,除了利用固定的滑动窗口获取第一输入数据外,还基于若干不定长的滑动窗口,获取第二输入数据和第三输入数据;最后基于取第一输入数据、第二输入数据和第三输入数据,提取出数据在不同时间周期的特征,实现数据的预测,提高了预测结果准确性;此外,在获取第三输入数据时,对相邻产业链节点的数据进行拼接,这样可以使得模型提取相邻产业链节点的关联特征,进一步提高预测结果的准确性。
附图说明
图1是本发明一实施例提供的一种产业链的产业数据预测方法的流程示意图。
图2是本发明一实施例提供的一种产业数据预测模型的网络结构示意图。
图3是本发明一实施例提供的一种产业链的产业数据预测装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,本发明一实施例提供了一种产业链的产业数据预测方法,至少包括如下步骤:
步骤S101:获取当前预测周期的前N个历史周期的产业链数据,并逐一计算每一相邻历史周期中同一产业链节点的产业数据之间的差值,根据差值将各历史周期中同一产业链节点的产业数据划分为不同数据组,获得各产业链节点所对应的各合并周期数据组;其中,所述产业链数据包括:产业链上若干个产业链节点的产业数据。
步骤S102:获取当前预测周期的前T个历史周期的第一产业链数据,获得第一输入数据;其中,T≤N。
步骤S103:分别获取每一产业链节点所对应的K个第一选定合并周期数据组;其中,所述K个第一选定合并周期数据组为与当前预测周期相邻的前K个合并周期的合并周期数据组;计算每一第一选定合并周期数据组的数据均值,获得若干第一产业数据均值,将所有第一产业数据均值作为第二输入数据;其中,K≤N;
步骤S104:分别获取每一产业链节点所对应的E个第二选定合并周期数据组;其中,所述E个第二选定合并周期数据组为与当前预测周期相邻的前E个合并周期的合并周期数据组;计算每一第二选定合并周期数据组的数据均值,获得若干第二产业数据均值;将归属于同一产业链节点的第二产业数据均值分为同一组,获得若干产业数据均值组;将相邻产业链节点所对应的产业数据均值组拼接为一输入数据组,获得若干输入数据组,将所有输入数据组作为第三输入数据;其中,E≤N。
步骤S105:将所述第一输入数据、第二输入数据及所述第三输入数据输入至预设的产业数据预测模型中,以使所述产业数据预测模型通过第一子网络提取第一输入数据的第一数据特征,通过第二子网络提取第二输入数据的第二数据特征,通过第三子网络提取第三输入数据的第三数据特征,并基于第一数据特征、第二数据特征以及第三数据特征通过第四子网络生成当前预测周期的各产业数据的预测结果。
对于步骤S101、首先对产业链数据进行说明,在社会经济和商业发展中对产业链上下游的产能与销售数据预测是一个很常见的问题,一条产业链通常包含上游、下游各个企业,以一产业链中各企业作为各产业链节点,将产业链中所有企业的产业数据作为本发明的产业链数据;需要说明的是,在本发明中产业数据包括但不限于:某一产品的产量、某一产品销量、企业营收或行业数据等。
紧接着根据实际需求获取当前预测周期的前N个历史周期的产业链数据,作为后续预测的数据基础。每一周期的时间跨度可以根据实际需求进行调整,例如可以将1个月作为一个周期,也可以将一个星期作为一个周期;而上述N的值也可以根据实际需求进行设定,可以是当前预测周期的前5个、前10个、前20个等历史周期。
在获取N个历史周期后,需要根据相邻历史周期中同一产业链节点的产业数据之间的差值对各历史周期中每一产业链节点的产业数据进行分组,从而生成若干不等长时间滑动窗口;在本发明中可采用下述三种分组方式中的任意一种。
第一种:在一个优选的实施例中,根据差值将各历史周期中同一产业链节点的产业数据划分为不同数据组,包括:根据各相邻历史周期中同一产业链节点的产业数据之间的差值,计算算术平均值;将所述算术平均值的二分之一作为基准值;将各差值与基准值进行比较,确定各差值与基准值的大小关系,得到各差值的第一数据关系;依次比对相邻差值的第一数据关系是否相同,继而确定分割点差值;其中,所述分割点差值的第一数据关系与前一相邻差值的第一数据关系不同;根据分割点差值确定数据分割点,继而根据各数据分割点将各历史周期中同一产业链节点的产业数据划分为不同数据组,获得各产业链节点所对应的各合并周期数据组。
具体的,假定某一产业链有A、B、C、D,四个产业链节点,各产业节点依次相邻,A为B的上游节点,B为C的上游节点、C为D的上游节点,所形成的产业链为:A-B-C-D;以A节点的产业a为例,若现在有5个历史周期1、2、3、4、5;产业a在这5个周期的产业数据分别为a1、a2、a3、a4、a5、;则各相邻历史周期中同一产业链节点的产业数据之间的差值分别为:Δ(a1,a2)、Δ(a2,a3)、Δ(a3,a4)、Δ(a4,a5);然后计算上述5个差值的算术平均值M;然后将算术平均值的二分之一,即M/2,作为基准值;
假设Δ(a1,a2)、Δ(a2,a3)大于M/2;Δ(a3,a4)、Δ(a4,a5)小于M/2;此时,设Δ(a1,a2)和Δ(a2,a3)的第一数据关系均为大于M/2,这两个相邻差值的第一数据关系相同,Δ(a3,a4)和Δ(a4,a5)的第一数据关系均为小于M/2,这两个相邻差值的第一数据关系相同;而Δ(a2,a3)和Δ(a3,a4)这两个相邻差值的第一数据关系不同,此时将Δ(a3,a4)作为上述分割点差值;而这一分割点差值对应的是产业数据a3,和产业数据a4,则此时将确定数据分割点在产业数据a3,和产业数据a4之间,将产业a在这5个周期的产业数据分为两组,即a1、a2和a3分为第一个合并周期数据组,a4和a5分为第二个合并周期数据组。第一个合并周期数据组包含了3个历史周期的数据,第二个合并周期数据组包含了2个历史周期的数据;因此形成了时间尺度不同的两个滑动窗口。其他产业节点各历史周期的产业数据的分组以上述相同的方法进行分组。
第二种:在一个优选的实施中,所述根据差值将各历史周期中同一产业链节点的产业数据划分为不同数据组,包括:逐一计算相邻两差值之间的比值,获得若干第一比值;根据各第一比值确定分割点差值;其中,所述分割点差值与前一相邻差值的第一比值不在预设范围内;根据分割点差值确定数据分割点,继而根据各数据分割点将各历史周期中同一产业链节点的产业数据划分为不同数据组。
同样以A节点的产业a为例,若现在有5个历史周期1、2、3、4、5;产业a在这5个周期的产业数据分别为a1、a2、a3、a4、a5、;则各相邻历史周期中同一产业链节点的产业数据之间的差值分别为:Δ(a1,a2)、Δ(a2,a3)、Δ(a3,a4)、Δ(a4,a5);
Δ(a1,a2)与Δ(a2,a3)的比值为N1,Δ(a2,a3)与Δ(a3,a4)的比值为N2,Δ(a3,a4)与Δ(a4,a5)的比值为N3。预设范围为[0.75-1.25];
假设N1和N3在[0.75-1.25]内,N2不在[0.75-1.25]内;则此时确定Δ(a3,a4)为上述分割点差值,将Δ(a3,a4)作为上述分割点差值,而这一分割点差值对应的是产业数据a3,和产业数据a4,则此时将确定数据分割点在产业数据a3和产业数据a4之间,将产业a在这5个周期的产业数据分为两组,即a1、a2和a3分为第一个数据组,a4和a5分为第二个数据组。
第三种:在一个优选的实施例中,所述根据差值将各历史周期中同一产业链节点的产业数据划分为不同数据组,包括:
通过k-means算法,将各差值进行分类;根据各差值的类别确定分割点差值;其中,所述分割点差值的类别与前一相邻差值的类别不同;根据分割点差值确定数据分割点,继而根据各数据分割点将各历史周期中同一产业链节点的产业数据划分为不同数据组。
同样以A节点的产业a为例,若现在有5个历史周期1、2、3、4、5;产业a在这5个周期的产业数据分别为a1、a2、a3、a4、a5、;则各相邻历史周期中同一产业链节点的产业数据之间的差值分别为:Δ(a1,a2)、Δ(a2,a3)、Δ(a3,a4)、Δ(a4,a5);
Δ(a1,a2)、Δ(a2,a3)和Δ(a4,a5)的类别相同,Δ(a3,a4)的类别不同与其他差值;由于Δ(a3,a4)与前一相邻差值Δ(a2,a3)的类别不同,Δ(a4,a5)与前一相邻差值Δ(a3,a4)的类别不同;此时,将Δ(a3,a4)和Δ(a4,a5)均作为分割点差值,而Δ(a3,a4)对应的是产业数据a3,和产业数据a4,则此时确定第一个数据分割点在产业数据a3和产业数据a4之间,而Δ(a4,a5)对应的是产业数据a4,和产业数据a5,则此时确定第二个数据分割点在产业数据a4和产业数据a5之间。最终将产业a在这5个周期的产业数据分为三组组,即a1、a2和a3分为第一个数据组,a4为第二个数据组,a5为第三个数据组。
对于步骤S102,示意性的假定某一产业链有A、B、C、D,四个产业链节点;A节点对应产业a、B节点对应产业b、C节点对应产业c、D节点对应产业d;
此时获取距离当前预测周期的前T个历史周期产业a的数据a1、a2……at,获取产业距离当前预测周期的前T个历史周期产业b的数据得到b1、b2……bt,获取距离当前预测周期的前T个历史周期产业c的数据得到c1、c2……ct,获取距离当前预测周期的前T个历史周期产业d的数据得到d1、d2……dt;最终得到上述第一输入数据:{a1、a2……at、b1、b2……bt、c1、c2……ct、d1、d2……dt}。需要说明的是上述T的具体数值可以根据实际需求调整,一般T值取得相对较小,以获取短期的特征数据。
对于步骤S103:示意性的,假设有5个历史周期1月、2月、3月、4月、5月;产业a在5个历史周期的产业数据为:a1、a2……a5;产业b在5个历史周期的产业数据为:b1、b2……b5;产业c在5个历史周期的产业数据为:c1、c2……c5;产业d在5个历史周期的产业数据为:d1、d2……d5;
假设,对于产业a来说是1月、2月这两个历史周期的产业数据(a1、a2)被分为了一合并周期数据组A1,3月这一历史周期的产业数据(a3)被分为了一合并周期数据组A2,4月和5月这两个历史周期的产业数据(a4、a5)被分为了一合并周期数据组A3;则此时对于产业a来说,1月、2月是一个合并周期,3月单独形成了一个合并周期,4月和5月形成了一个合并周期;假定k为2,当前预测周期为6月,则此时取与6月相邻的2个合并周期(4月和5月形成的一个合并周期、以及3月形成的一个合并周期)的合并周期数据组,作为产业a的两个第一选定合并周期数据组,即将A2和A3,作为产业a的第一选定合并周期数据组;然后计算数据组A2的数据均值aG2=3;数据组A3的数据均值
Figure BDA0003900838650000121
aG1、aG2即为产业a的两个第一产业数据均值;
假设,对于产业b来说是1月、2月、3月这三个历史周期的产业数据(b1、b2、b3)被分为了一合并周期数据组B1,4月和5月这两个历史周期的产业数据(b4、b 5)被分为了一合并周期数据组B2;则此时对于产业b来说,1月、2月、3月成为一个合并周期,4月和5月形成了一个合并周期;则此时取与6月相邻的2个合并周期(4月和5月形成的一个合并周期、以及3月形成的一个合并周期)的合并周期数据组,作为产业b的两个第一选定合并周期数据组,即将B1和B2,作为产业b的第一选定合并周期数据组;然后计算数据组B1的数据均值
Figure BDA0003900838650000131
数据组A3的数据均值
Figure BDA0003900838650000132
bG1、bG2即为产业b的两个第一产业数据均值;
按上述方法,计算出各个产业链节点所对应的第一产业数据均值,最终得到第二输入数据:{aG1、aG2、bG1、bG2、cG1、cG2、dG1、dG2};从而获得中期特征数据;要说明的是,虽然本实施例以K为2进行说明,但是上述K的具体数值可以根据实际需求调整,只需需满足K≤N即可。
对于步骤S104:示意性的,假设E为3,参照步骤S103的方法,得到各个产业链节点的第二产业数据均值;假设分别为:aG1、aG2、aG3、bG1、bG2、bG3、cG1、cG2、cG3、dG1、dG2、dG3;则此时{aG1、aG2、aG3}为一产业数据均值组,{bG1、bG2、bG3}为一产业数据均值组,{cG1、cG2、cG3}为一产业数据均值组,{dG1、dG2、dG3}为一产业数据均值组;由于产业节点A与B相邻、B与C相邻、C与D相邻;
因此将{aG1、aG2、aG3}和{bG1、bG2、bG3}拼接为一输入数据组,得到{aG1、aG2、aG3、bG1、bG2、bG3};
将{bG1、bG2、bG3}和{cG1、cG2、cG3}拼接为一输入数据组,得到{bG1、bG2、bG3、cG1、cG2、cG3};
将{cG1、cG2、cG3}和{dG1、dG2、dG3}拼接为一输入数据组得到{cG1、cG2、cG3、dG1、dG2、dG3};
将上述三组输入数据组作为上述第三输入数据,从而获取到长期特征数据。需要说明的是上述E的具体数值可以根据实际需求调整,但需满足E≤N。
对于步骤S105:在一个优选的实施例中,所述第一子网络为前馈网络;所述第二子网络和所述第三子网络均为循环网络;所述第四子网络为全连接网络。
具体的如图2所示,本发明的产业数据预测模型,包含前馈网络、第一循环网络、第二循环网络以及一个全连接网络;前馈网络接收第一输入数据,从第一输入数据中提取短期特征,第一循环网络接收第二输入数据,从第二输入数据中提取短期特征提取中期特征,第二循环网络接收第三输入数据,从第三输入数据中提取长期期特征。全连接层网络接收上述三个网络所提取的特征,然后输出最终的预测结果。最终的预测结果为当前预测周期的各产业预测数据:如a产业的预测数据ay、b产业的预测数据by、c产业的预测数据cy、d产业的预测数据dy。
本发明所提供的产业链的产业数据预测方法,通过进行动态的时间窗口划分,利用前馈式网络的优点,对进行短期特征提取;结合两层通过方差周期均值计算的不定长窗口滑动训练循环神经网络,进行中期及长期特征提取,最后使用全连接架构的模型,可充分发挥双向层级传递型数据的特性,在神经网络模型中充分提取、均衡及优化特定场景中短、中、长期的影响因子,更精确的提取数据特征,获得更准确的预测结果。
为更好的说明本发明的产业数据预测方法,以下列举实际产业场景对上述方法进行进一步的说明:
一、在汽车的产业链中,电池原材料、电池生产、新能源汽车属于产业链的上下游,数据特征符合双向逐层传递数据特征,可以通过本申请方法对各产业链节点的产业数据进行预测。
将电池正极生产商月度产量数据作为第一个产业链节点的产业数据;将电池生成商的月度电池装机量作为第一个产业链节点的产业数据;将新能源汽车销售商的,新能源汽车月度销量数据作为第三个产业链节点的产业数据;
获取上述各产业数据的历史数据,然后按本发明上述方法2、对电池原材料生产月度数据、电池装机量月度数据、新能源汽车销量数据进行动态窗口分组计算预处理。
紧接着建立模型,初始化模型参数(将网络参数全置为1),将输入数据上述方式拆分为三种形态,分别作为前馈网络,第一循环网络,第二循环网络的输入,将下一月度各产业链节点的产业数据作为输出,进行训练。当模型训练收敛(如预测值与实际值误差小于0.001),停止训练。
利用训练的模型进行预测,例如基于前5个月三个产业链节点的月度数据进行预测,预测得到下一月份电池正极生产商月度产量数据、电池生产商装机量、新能源汽车销量。
二、在餐饮行业中,大豆产量、酱油生产、餐饮企业属于产业链的上下游,数据特征符合双向逐层传递数据特征,可以通过本申请方法对各产业链节点的产业数据进行预测。
将大豆月度产量数据作为第一个产业链节点的产业数据;将面向餐饮业的酱油生产企业酱油销量作为第一个产业链节点的产业数据;将餐饮企业营收数据作为第三个产业链节点的产业数据;
获取上述各产业数据的历史数据,然后按本发明上述方法对大豆月度产量、面向餐饮业的酱油生产企业月度销量、餐饮企业月度营收进行动态窗口分组计算预处理。
紧接着建立模型,初始化模型参数(将网络参数全置为1),将输入数据上述方式拆分为三种形态,分别作为前馈网络,第一循环网络,第二循环网络的输入,将下一月度各产业链节点的产业数据作为输出,进行训练。当模型训练收敛(如预测值与实际值误差小于0.001),停止训练。
利用训练的模型进行预测,例如基于前5个月三个产业链节点的月度数据进行预测,预测得到下一月份大豆月度产量、面向餐饮业的酱油生产企业酱油销量及餐饮企业营收数据。
三、在我国橡胶行业产业链中,原材料天然橡胶主要依靠进口,处于中游的橡胶加工企业对天然橡胶进行加工后,交付给下游的橡胶制品企业,例如轮胎生产企业(轮胎是橡胶需求最大的领域,超过74%,2021年数据)。链条中的数据特征符合双向逐层传递数据特征,可以通过本申请方法对各环节数据进行预测。
将橡胶月度进口数据作为第一个产业链节点的产业数据;将橡胶加工企业营收数据作为第一个产业链节点的产业数据;将轮胎生产企业销售数据作为第三个产业链节点的产业数据;
获取上述各产业数据的历史数据,然后按本发明上述方法对对橡胶月度进口量、橡胶加工企业月度营收数据、轮胎生产企业月度销售数据进行动态窗口分组计算预处理。
紧接着建立模型,初始化模型参数(将网络参数全置为1),将输入数据上述方式拆分为三种形态,分别作为前馈网络,第一循环网络,第二循环网络的输入,将下一月度各产业链节点的产业数据作为输出,进行训练。当模型训练收敛(如预测值与实际值误差小于0.001),停止训练。
利用训练的模型进行预测,例如基于前5个月三个产业链节点的月度数据进行预测,预测得到下一月份橡胶进口量、橡胶加工企业营收、轮胎生产企业销售数据。
在上述方法项实施例的基础上,本发明一实施例对应提供了一装置项实施例;
如图3所示,本发明一实施例提供了一种产业链的产业数据预测装置,包括:历史周期数据处理模块、第一输入数据提取模块、第二输入数据提取模块、第三输入数据提取模块以及数据预测模块;
所述历史周期数据处理模块,用于获取当前预测周期的前N个历史周期的产业链数据,并逐一计算每一相邻历史周期中同一产业链节点的产业数据之间的差值,根据差值将各历史周期中同一产业链节点的产业数据划分为不同数据组,获得各产业链节点所对应的各合并周期数据组;其中,所述产业链数据包括:产业链上若干个产业链节点的产业数据;
所述第一输入数据提取模块,用于获取当前预测周期的前T个历史周期的第一产业链数据,获得第一输入数据;其中,T≤N;
分别获取每一产业链节点所对应的K个第一选定合并周期数据组;其中,所述K个第一选定合并周期数据组为与当前预测周期相邻的前K个合并周期的合并周期数据组;计算每一第一选定合并周期数据组的数据均值,获得若干第一产业数据均值,将所有第一产业数据均值作为第二输入数据;其中,K≤N;分别获取每一产业链节点所对应的E个第二选定合并周期数据组;其中,所述E个第二选定合并周期数据组为与当前预测周期相邻的前E个合并周期的合并周期数据组;计算每一第二选定合并周期数据组的数据均值,获得若干第二产业数据均值;将归属于同一产业链节点的第二产业数据均值分为同一组,获得若干产业数据均值组;将相邻产业链节点所对应的产业数据均值组拼接为一输入数据组,获得若干输入数据组,将所有输入数据组作为第三输入数据;其中,E≤N;
所述数据预测模块,用于将所述第一输入数据、第二输入数据及所述第三输入数据输入至预设的产业数据预测模型中,以使所述产业数据预测模型通过第一子网络提取第一输入数据的第一数据特征,通过第二子网络提取第二输入数据的第二数据特征,通过第三子网络提取第三输入数据的第三数据特征,并基于第一数据特征、第二数据特征以及第三数据特征通过第四子网络生成当前预测周期的各产业数据的预测结果。
在一个优选的实施例中,历史周期数据处理模块,根据差值将各历史周期中同一产业链节点的产业数据划分为不同数据组,包括:
根据各相邻历史周期中同一产业链节点的产业数据之间的差值,计算算术平均值;
将所述算术平均值的二分之一作为基准值;
将各差值与基准值进行比较,确定各差值与基准值的大小关系,得到各差值的第一数据关系;
依次比对相邻差值的第一数据关系是否相同,继而确定分割点差值;其中,所述分割点差值的第一数据关系与前一相邻差值的第一数据关系不同;
根据分割点差值确定数据分割点,继而根据各数据分割点将各历史周期中同一产业链节点的产业数据划分为不同数据组。
在一个优选的实施例中,历史周期数据处理模块,根据差值将各历史周期中同一产业链节点的产业数据划分为不同数据组,包括:
逐一计算相邻两差值之间的比值,获得若干第一比值;
根据各第一比值确定分割点差值;其中,所述分割点差值与前一相邻差值的第一比值不在预设范围内;
根据分割点差值确定数据分割点,继而根据各数据分割点将各历史周期中同一产业链节点的产业数据划分为不同数据组。
在一个优选的实施例中,历史周期数据处理模块,根据差值将各历史周期中同一产业链节点的产业数据划分为不同数据组,包括:
通过k-means算法,将各差值进行分类;
根据各差值的类别确定分割点差值;其中,所述分割点差值的类别与前一相邻差值的类别不同;
根据分割点差值确定数据分割点,继而根据各数据分割点将各历史周期中同一产业链节点的产业数据划分为不同数据组。
需说明的是,以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。另外,本发明提供的装置实施例附图中,模块之间的连接关系表示它们之间具有通信连接,具体可以实现为一条或多条通信总线或信号线。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
所述领域的技术人员可以清楚地了解到,为的方便和简洁,上述描述的装置的具体工作过程,可参考前述方法实施例中对应的过程,在此不再赘述。
在上述方法项实施例的基础上,本发明对应提供了存储介质项实施例;
本发明一实施例提供了一种存储介质,所述存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述存储介质所在设备执行本发明任意一项所述的产业链的产业数据预测方法。
所述存储介质为计算机可读存储介质,所述计算机程序存储在所述计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。

Claims (10)

1.一种产业链的产业数据预测方法,其特征在于,包括:
获取当前预测周期的前N个历史周期的产业链数据,并逐一计算每一相邻历史周期中同一产业链节点的产业数据之间的差值,根据差值将各历史周期中同一产业链节点的产业数据划分为不同数据组,获得各产业链节点所对应的各合并周期数据组;其中,所述产业链数据包括:产业链上若干个产业链节点的产业数据;
获取当前预测周期的前T个历史周期的第一产业链数据,获得第一输入数据;其中,T≤N;
分别获取每一产业链节点所对应的K个第一选定合并周期数据组;其中,所述K个第一选定合并周期数据组为与当前预测周期相邻的前K个合并周期的合并周期数据组;计算每一第一选定合并周期数据组的数据均值,获得若干第一产业数据均值,将所有第一产业数据均值作为第二输入数据;其中,K≤N;
分别获取每一产业链节点所对应的E个第二选定合并周期数据组;其中,所述E个第二选定合并周期数据组为与当前预测周期相邻的前E个合并周期的合并周期数据组;计算每一第二选定合并周期数据组的数据均值,获得若干第二产业数据均值;将归属于同一产业链节点的第二产业数据均值分为同一组,获得若干产业数据均值组;将相邻产业链节点所对应的产业数据均值组拼接为一输入数据组,获得若干输入数据组,将所有输入数据组作为第三输入数据;其中,E≤N;
将所述第一输入数据、第二输入数据及所述第三输入数据输入至预设的产业数据预测模型中,以使所述产业数据预测模型通过第一子网络提取第一输入数据的第一数据特征,通过第二子网络提取第二输入数据的第二数据特征,通过第三子网络提取第三输入数据的第三数据特征,并基于第一数据特征、第二数据特征以及第三数据特征通过第四子网络生成当前预测周期的各产业数据的预测结果。
2.如权利要求1所述的产业链的产业数据预测方法,其特征在于,所述根据差值将各历史周期中同一产业链节点的产业数据划分为不同数据组,包括:
根据各相邻历史周期中同一产业链节点的产业数据之间的差值,计算算术平均值;
将所述算术平均值的二分之一作为基准值;
将各差值与基准值进行比较,确定各差值与基准值的大小关系,得到各差值的第一数据关系;
依次比对相邻差值的第一数据关系是否相同,继而确定分割点差值;其中,所述分割点差值的第一数据关系与前一相邻差值的第一数据关系不同;
根据分割点差值确定数据分割点,继而根据各数据分割点将各历史周期中同一产业链节点的产业数据划分为不同数据组。
3.如权利要求1所述的产业链的产业数据预测方法,其特征在于,所述根据差值将各历史周期中同一产业链节点的产业数据划分为不同数据组,包括:
逐一计算相邻两差值之间的比值,获得若干第一比值;
根据各第一比值确定分割点差值;其中,所述分割点差值与前一相邻差值的第一比值不在预设范围内;
根据分割点差值确定数据分割点,继而根据各数据分割点将各历史周期中同一产业链节点的产业数据划分为不同数据组。
4.如权利要求1所述的产业链的产业数据预测方法,其特征在于,所述根据差值将各历史周期中同一产业链节点的产业数据划分为不同数据组,包括:
通过k-means算法,将各差值进行分类;
根据各差值的类别确定分割点差值;其中,所述分割点差值的类别与前一相邻差值的类别不同;
根据分割点差值确定数据分割点,继而根据各数据分割点将各历史周期中同一产业链节点的产业数据划分为不同数据组。
5.如权利要求1所述的产业链的产业数据预测方法,其特征在于,所述第一子网络为前馈网络;所述第二子网络和所述第三子网络均为循环网络;所述第四子网络为全连接网络。
6.一种产业链的产业数据预测装置,其特征在于,包括:历史周期数据处理模块、第一输入数据提取模块、第二输入数据提取模块、第三输入数据提取模块以及数据预测模块;
所述历史周期数据处理模块,用于获取当前预测周期的前N个历史周期的产业链数据,并逐一计算每一相邻历史周期中同一产业链节点的产业数据之间的差值,根据差值将各历史周期中同一产业链节点的产业数据划分为不同数据组,获得各产业链节点所对应的各合并周期数据组;其中,所述产业链数据包括:产业链上若干个产业链节点的产业数据;
所述第一输入数据提取模块,用于获取当前预测周期的前T个历史周期的第一产业链数据,获得第一输入数据;其中,T≤N;
所述第二输入数据提取模块,用于分别获取每一产业链节点所对应的K个第一选定合并周期数据组;其中,所述K个第一选定合并周期数据组为与当前预测周期相邻的前K个合并周期的合并周期数据组;计算每一第一选定合并周期数据组的数据均值,获得若干第一产业数据均值,将所有第一产业数据均值作为第二输入数据;其中,K≤N;
所述第三输入数据提取模块,用于分别获取每一产业链节点所对应的E个第二选定合并周期数据组;其中,所述E个第二选定合并周期数据组为与当前预测周期相邻的前E个合并周期的合并周期数据组;计算每一第二选定合并周期数据组的数据均值,获得若干第二产业数据均值;将归属于同一产业链节点的第二产业数据均值分为同一组,获得若干产业数据均值组;将相邻产业链节点所对应的产业数据均值组拼接为一输入数据组,获得若干输入数据组,将所有输入数据组作为第三输入数据;其中,E≤N;
所述数据预测模块,用于将所述第一输入数据、第二输入数据及所述第三输入数据输入至预设的产业数据预测模型中,以使所述产业数据预测模型通过第一子网络提取第一输入数据的第一数据特征,通过第二子网络提取第二输入数据的第二数据特征,通过第三子网络提取第三输入数据的第三数据特征,并基于第一数据特征、第二数据特征以及第三数据特征通过第四子网络生成当前预测周期的各产业数据的预测结果。
7.如权利要求6所述的产业链的产业数据预测装置,其特征在于,历史周期数据处理模块,根据差值将各历史周期中同一产业链节点的产业数据划分为不同数据组,包括:
根据各相邻历史周期中同一产业链节点的产业数据之间的差值,计算算术平均值;
将所述算术平均值的二分之一作为基准值;
将各差值与基准值进行比较,确定各差值与基准值的大小关系,得到各差值的第一数据关系;
依次比对相邻差值的第一数据关系是否相同,继而确定分割点差值;其中,所述分割点差值的第一数据关系与前一相邻差值的第一数据关系不同;
根据分割点差值确定数据分割点,继而根据各数据分割点将各历史周期中同一产业链节点的产业数据划分为不同数据组。
8.如权利要求6所述的产业链的产业数据预测装置,其特征在于,历史周期数据处理模块,根据差值将各历史周期中同一产业链节点的产业数据划分为不同数据组,包括:
逐一计算相邻两差值之间的比值,获得若干第一比值;
根据各第一比值确定分割点差值;其中,所述分割点差值与前一相邻差值的第一比值不在预设范围内;
根据分割点差值确定数据分割点,继而根据各数据分割点将各历史周期中同一产业链节点的产业数据划分为不同数据组。
9.如权利要求6所述的产业链的产业数据预测装置,其特征在于,历史周期数据处理模块,根据差值将各历史周期中同一产业链节点的产业数据划分为不同数据组,包括:
通过k-means算法,将各差值进行分类;
根据各差值的类别确定分割点差值;其中,所述分割点差值的类别与前一相邻差值的类别不同;
根据分割点差值确定数据分割点,继而根据各数据分割点将各历史周期中同一产业链节点的产业数据划分为不同数据组。
10.一种存储介质,其特征在于,所述存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述存储介质所在设备执行如权利要求1至5中任意一项所述的产业链的产业数据预测方法。
CN202211289528.6A 2022-10-20 2022-10-20 一种产业链的产业数据预测方法、装置及存储介质 Pending CN115640893A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211289528.6A CN115640893A (zh) 2022-10-20 2022-10-20 一种产业链的产业数据预测方法、装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211289528.6A CN115640893A (zh) 2022-10-20 2022-10-20 一种产业链的产业数据预测方法、装置及存储介质

Publications (1)

Publication Number Publication Date
CN115640893A true CN115640893A (zh) 2023-01-24

Family

ID=84944800

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211289528.6A Pending CN115640893A (zh) 2022-10-20 2022-10-20 一种产业链的产业数据预测方法、装置及存储介质

Country Status (1)

Country Link
CN (1) CN115640893A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117708759A (zh) * 2024-02-04 2024-03-15 深圳市蕾奥规划设计咨询股份有限公司 定位企业所属产业链环节的方法及装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117708759A (zh) * 2024-02-04 2024-03-15 深圳市蕾奥规划设计咨询股份有限公司 定位企业所属产业链环节的方法及装置
CN117708759B (zh) * 2024-02-04 2024-05-17 深圳市蕾奥规划设计咨询股份有限公司 定位企业所属产业链环节的方法及装置

Similar Documents

Publication Publication Date Title
CN108510006B (zh) 一种基于数据挖掘的企业用电量分析与预测方法
CN110245801A (zh) 一种基于组合挖掘模型的电力负荷预测方法及系统
CN111563706A (zh) 一种基于lstm网络的多变量物流货运量预测方法
CN111182564B (zh) 一种基于lstm神经网络的无线链路质量预测方法
CN113255844B (zh) 基于图卷积神经网络交互的推荐方法及系统
CN112149352B (zh) 一种结合gbdt自动特征工程对营销活动点击的预测方法
CN107833214A (zh) 视频清晰度检测方法、装置、计算设备及计算机存储介质
CN113344615A (zh) 一种基于gbdt和dl融合模型的营销活动预测方法
CN114722269B (zh) 一种基于图神经网络的物品推荐方法、装置及存储介质
CN115099519A (zh) 一种基于多机器学习模型融合的油井产量预测方法
CN115640893A (zh) 一种产业链的产业数据预测方法、装置及存储介质
CN111709523A (zh) 一种基于内部集成的宽度学习方法
CN110766190A (zh) 一种配电网负荷预测方法
CN113657678A (zh) 一种基于信息新鲜度的电网电力数据预测方法
CN113139570A (zh) 一种基于最优混合估值的大坝安全监测数据补全方法
CN116542701A (zh) 一种基于cnn-lstm组合模型的碳价预测方法及系统
CN118365221A (zh) 一种基于节点亲密度的可解释性开源项目推荐方法
CN110059126B (zh) 基于lkj异常值数据的复杂关联网络分析方法及系统
CN114880538A (zh) 基于自监督的属性图社团检测方法
CN110972174A (zh) 一种基于稀疏自编码器的无线网络中断检测方法
CN114742564A (zh) 一种融合复杂关系的虚假评论者群体检测方法
CN113111573B (zh) 基于gru的滑坡位移预测方法
CN114679372A (zh) 一种基于节点相似性的图注意力网络的链路预测方法
CN114239949A (zh) 一种基于双阶段注意力机制的网站访问量预测方法及系统
CN111967973B (zh) 银行客户数据处理方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20230124