CN114282657A - 一种市场数据长期预测模型训练方法、装置、设备及存储介质 - Google Patents
一种市场数据长期预测模型训练方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN114282657A CN114282657A CN202111651046.6A CN202111651046A CN114282657A CN 114282657 A CN114282657 A CN 114282657A CN 202111651046 A CN202111651046 A CN 202111651046A CN 114282657 A CN114282657 A CN 114282657A
- Authority
- CN
- China
- Prior art keywords
- data
- training
- preset
- gru model
- market
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012549 training Methods 0.000 title claims abstract description 104
- 238000000034 method Methods 0.000 title claims abstract description 64
- 230000007774 longterm Effects 0.000 title claims abstract description 29
- 230000006870 function Effects 0.000 claims description 67
- 238000012545 processing Methods 0.000 claims description 14
- 238000004590 computer program Methods 0.000 claims description 9
- 238000009499 grossing Methods 0.000 claims description 7
- 238000012216 screening Methods 0.000 claims description 5
- 238000012795 verification Methods 0.000 claims description 4
- 230000015654 memory Effects 0.000 claims description 3
- 238000010200 validation analysis Methods 0.000 claims description 2
- 238000013528 artificial neural network Methods 0.000 abstract description 4
- 238000004519 manufacturing process Methods 0.000 description 10
- 230000008569 process Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 6
- 230000011218 segmentation Effects 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- YHXISWVBGDMDLQ-UHFFFAOYSA-N moclobemide Chemical compound C1=CC(Cl)=CC=C1C(=O)NCCN1CCOCC1 YHXISWVBGDMDLQ-UHFFFAOYSA-N 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 235000015097 nutrients Nutrition 0.000 description 2
- 239000002994 raw material Substances 0.000 description 2
- 235000013599 spices Nutrition 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000009193 crawling Effects 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 235000019800 disodium phosphate Nutrition 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000002759 z-score normalization Methods 0.000 description 1
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请提供一种市场数据长期预测模型训练方法、装置、设备及存储介质,涉及神经网络技术领域。该方法包括:获取样本数据集;根据所述样本数据集,训练预设门控循环单元结构GRU模型;根据改进型损失函数,验证训练中的预设GRU模型,在所述改进型损失函数满足预设条件后,获取目标GRU模型,所述目标GRU模型用于根据市场环境数据预测销售数据,所述改进型损失函数由两时间序列的变动趋势、变动幅度以及点之间的距离确定。该方法通过改进型损失函数与预设GRU模型,保证预测市场情况的高效性和准确性。
Description
技术领域
本申请涉及神经网络技术领域,具体而言,涉及一种市场数据长期预测模型训练方法、装置、设备及存储介质。
背景技术
模型预测是通过预测模型,当输入的数据改变后,输出数据会有什么样的变化的过程。
现有技术中,为了生产、销售更有保障,通常需要训练模型对市场情况进行预测。目前,主要通过LSTM(Long Short-Term Memory)模型进行模型预测,但是LSTM模型的复杂度太高,不利于高效、准确的预测市场情况。
发明内容
本申请的目的在于,针对上述现有技术的不足,提供一种市场数据长期预测模型训练方法、装置、设备及存储介质,以解决现有技术中预测模型的复杂度太高导致预测市场情况低效、不准确的问题。
为实现上述目的,本申请实施例采用的技术方案如下:
第一方面,本申请实施例提供一种市场数据长期预测模型训练方法,该方法包括:
获取样本数据集,其中,所述样本数据集包括:预设时间段的市场数据,所述市场数据标注有实际销售数据;
根据所述样本数据集,训练预设门控循环单元结构GRU模型;
根据改进型损失函数,验证训练中的预设GRU模型,在所述改进型损失函数满足预设条件后,获取目标GRU模型,所述目标GRU模型用于根据市场环境数据预测销售数据,所述改进型损失函数由两时间序列的变动趋势、变动幅度以及点之间的距离确定。
可选地,所述根据所述样本数据集,训练预设门控循环单元结构GRU模型,包括:
根据所述样本数据集中各数据的时间维度,提取数据特征;
将所述实际销售数据对应的数据特征作为输出、其他市场数据对应的数据特征作为输入,训练所述预设GRU模型。
可选地,所述将所述实际销售数据对应的数据特征作为输出、其他市场数据对应的数据特征作为输入,训练所述预设GRU模型,包括:
将所述实际销售数据进行平滑处理后,作为输出特征数据;
将所述其他市场数据求z-score标准化处理后,作为输入特征数据;
根据所述输入特征数据、所述输出特征数据,训练所述预设GRU模型。
可选地,所述根据所述输入特征数据、所述输出特征数据,训练所述预设GRU模型,包括:
根据所述输入特征数据和所述输出特征数据构建CART回归树;
A、根据所述CART回归树,筛选新的特征数据;
B、将所述新的特征数据重构为满足所述GRU模型格式要求的待训练特征数据;
C、采用所述待训练特征数据训练所述预设GRU模型。
可选地,所述根据改进型损失函数,验证训练中的所述预设GRU模型,在所述改进型损失函数满足预设条件后,获取目标GRU模型,包括:
循环执行所述A~C,根据所述改进型损失函数,验证训练中的所述预设GRU模型,在所述改进型损失函数满足预设条件后,获取目标GRU模型。
可选地,所述样本数据集包括:训练数据集和验证数据集;
所述根据所述样本数据集,训练预设门控循环单元结构GRU模型,包括:
根据所述训练数据集,训练预设门控循环单元结构GRU模型;
所述根据改进型损失函数,验证训练中的所述预设GRU模型,在所述改进型损失函数满足预设条件后,获取目标GRU模型,包括:
根据所述验证数据集和所述改进型损失函数,验证训练中的所述预设GRU模型,在所述改进型损失函数满足预设条件后,获取目标GRU模型。
第二方面,本申请实施例提供一种市场数据长期预测方法,该方法包括:
获取待预测市场环境数据;
将所述待预测市场环境数据作为输入数据,采用上述第一方面的目标GRU模型,获取输出的销售预测数据。
第三方面,本申请实施例提供一种市场数据长期预测模型训练装置,包括:
获取模块,用于获取样本数据集,其中,所述样本数据集包括:预设时间段的市场数据,所述市场数据标注有实际销售数据;
训练模块,用于根据所述样本数据集,训练预设门控循环单元结构GRU模型;
目标模块,根据改进型损失函数,验证训练中的所述预设GRU模型,在所述改进型损失函数满足预设条件后,获取目标GRU模型,所述目标GRU模型用于根据市场环境数据预测销售数据,所述改进型损失函数由两时间序列的变动趋势、变动幅度以及点之间的距离确定。
第四方面,本申请实施例提供一种计算机设备,包括:存储器和处理器,所述存储器存储有所述处理器可执行的计算机程序,所述处理器执行所述计算机程序时实现上述第一方面或第二方面所述的方法。
第五方面,本申请实施例提供一种计算机可读存储介质,所述可读存储介质上存储有计算机程序,所述计算机程序被读取并执行时,实现上述第一方面或第二方面所述的方法。
相对现有技术而言,本申请具有以下有益效果:
本申请实施例提供的一种市场数据长期预测模型训练方法、装置、设备及存储介质中,通过获取样本数据集,样本数据集包括:预设时间段的市场数据,市场数据标注有实际销售数据,再根据样本数据集,训练预设GRU模型,最后根据改进型损失函数,验证训练中的预设GRU模型,在改进型损失函数满足预设条件后,获取目标GRU模型,其中,训练预设GRU模型,相比现有技术中的LSTM模型,具有较少的参数,计算速度更快,即可以高效的预测市场情况,并且,本申请采用改进型损失函数,考虑了两时间序列的变动趋势、变动幅度以及点之间的距离,通过权重系数调整两条序列之间的变动趋势和变动幅度和序列值的相对重要性,使得GRU模型在训练时,保证预测序列和真实序列的绝对距离较近,保证预测序列和真实序列的变动趋势一致,使得目标GRU模型能够学习到市场数据的长期信息,提高预测市场情况的准确性。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例提供的一种市场数据长期预测模型训练方法的流程示意图;
图2为本申请实施例中提供的两条时间序列在相同分割点分段的示意图;
图3为本申请实施例提供的一种训练预设GRU模型的流程示意图;
图4为本申请实施例提供的一种市场数据的处理方法的流程示意图;
图5为本申请实施例提供的另一种训练预设GRU模型的流程示意图;
图6为本申请实施例提供的一种市场数据长期预测方法的流程示意图;
图7为本申请实施例提供的一种市场数据长期预测模型训练装置的示意图;
图8为本申请实施例提供的一种计算机设备的示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。
需要说明的是,在不冲突的情况下,本发明的实施例中的特征可以相互结合。
为了提高企业的盈利,企业对产品进行生产决策前,需要预测产品的市场需求,根据市场需求的大小指定产品的生产计划,示例地,若市场需求较小,则指定产品的生产计划的生产量较少,若市场需求较大,则指定产品的生产计划的生产量较多,因此,市场需求对企业安排产品的生产计划具有导向性作用,准确预测市场需求成为企业避免产品缺货或者产品压货的关键环节。目前,企业主要通过工作人员的个人经验对产品的市场需求进行预测,这完全取决于工作人员的主观经验,缺乏对多个因素的综合考虑,且主观经验的不确定性较高,容易造成误判,进而给公司造成巨大的财产损失,因此,可通过人工智能的方法预测产品的市场需求,根据产品以往的市场数据进行建模,预测产品将来的市场需求,从而实现企业对产品的生产决策。
为了解决现有预测模型的复杂度太高导致预测市场情况低效、不准确的问题,使得模型的预测市场情况更高效、更准确,本申请的方案中,提供一种市场数据长期预测模型训练方法、装置、设备及存储介质。
图1为本申请实施例提供的一种市场数据长期预测模型训练方法的流程示意图,如图1所示,该方法包括:
S101,获取样本数据集。
在进行建模前,需获取样本数据集,其中,样本数据集可以包含产品以往一段时间内的市场数据,即,样本数据集包括:预设时间段的市场数据。该预设时间段的市场数据可为近一个月的市场数据,也可为近一个季度的市场数据,在本申请实施例中不作具体限制。当然,预设时间段越接近当前时间并且预设时间段越长,市场数据越多,预测的市场需求更准确。
在本本申请实施例中,产品需求通过产品销售预测数据进行标识,则预设时间段的市场数据中标注有实际销售数据。
S102,根据样本数据集,训练预设GRU模型。
预设门控循环单元结构GRU(Gated Recurrent Unit,GRU)模型,在隐藏层加入时序,即上一个时刻的神经网络输出会被用于下一个时刻,能通过时序影响神经网络输出。因此,GRU模型适用于时序数据,即适用于本申请中将产品以往的市场数据用于将来时刻,以预测产品销售预测数据。GRU模型相比现有技术中的LSTM模型,具有较少的参数,计算速度更快。
GRU模型中当前时刻的隐层输出为上一时刻隐层输出和新生成的隐层输出的加权和,如下述公式(1)所示:
S103,根据改进型损失函数,验证训练中的预设GRU模型,在改进型损失函数满足预设条件后,获取目标GRU模型。
损失函数用于衡量训练中的预设GRU模型的优劣,即预设GRU模型参数的优劣。损失函数是模型参数的函数,可将训练中的预设GRU模型参数带入损失函数中,以计算获得对应的损失值。若训练中的预设GRU模型的损失值得到预设条件,则GRU模型训练过程结束,此时的预设GRU模型为目标GRU模型。
目标GRU模型为根据市场数据建立的模型,通过该目标GRU模型可预测产品的销售预测数据,进而对企业安排产品的生产计划起导向性作用。
改进型损失函数由两时间序列的变动趋势、变动幅度以及点之间的距离确定,其中,两条时间序列中,其中一条时间序列表示上述S101获取的实际的市场数据,另一条时间序列表示GRU模型的预测数据,可选地,其计算过程如下:
首先,对两条时间序列在相同分割点进行分段,根据分段后每个时间段的斜率的正负情况标记为1,-1或者0,即斜率为正设为1,为负设为-1,不变为0。分段后,两条时间序列如公式(2)所示:
S1={(m11,t1),(m12,t2),…,(m1n,tn)} 公式(2)
S2={(m21,t1),(m22,t2),…,(m2n,tn)}
其中,t1、t2...tn表示序列S1和S2共同的第1、2...n段时间区间,m11表示序列S1第1段时间区间的变化趋势,m12表示序列S1第2段时间区间的变化趋势,m1n表示序列S1第n段时间区间的变化趋势,m21表示序列S2第1段时间区间的变化趋势,m22表示序列S2第2段时间区间的变化趋势,m2n表示序列S2第n段时间区间的变化趋势。
示例地,图2为本申请实施例提供的两条时间序列在相同分割点分段的示意图,如图2所示,t1时间段内,S1和S2对应的斜率都为正,则m11=1,m21=1,t2时间段内,S1对应的斜率为负,S2对应的斜率都为正,则m12=-1,m22=1,t3时间段内,S1对应的斜率为正,S2对应的斜率都为负,则m13=1,m23=-1,则两条时间序列可表示为公式(3):
S1={(1,t1),(-1,t2),(1,t3)} 公式(3)
S2={(1,t1),(1,t2),(-1,t3)}
其次,根据两条时间序列每个时间段内的振幅,可获得S1、S2对应的振幅变化序列A1、A2,如公式(4)所示:
A1={(Δy11,t1),(Δy12,t2),…,(Δy1n,tn)} 公式(4)
A2={(Δy21,t1),(Δy22,t2),…,(Δy2n,tn)}
其中,Δyij为序列Si在第j段两端点对应序列值的差值。
示例地,如图2所示,t1时间段内,S1两端点对应序列值分别为0.0和2.0,则Δy11为2(2.0-0.0),S2两端点对应序列值分别为1.0和2.0,则Δy21为1(1.0-0.0),依此,t2时间段内,S1两端点对应序列值的差值Δy12为-1,S2两端点对应序列值的差值Δy22为1,t3时间段内,S1两端点对应序列值的差值Δy13为2,S2两端点对应序列值的差值Δy23为-1,则S1、S2对应的振幅变化序列A1、A2,如公式(5)所示:
A1={(2,t1),(-1,t2),(2,tn)} 公式(5)
A2={(1,t1),(1,t2),(-1,tn)}
再次,根据两条时间序列在相同分割点分段后的各个分割点的序列值,可得两条时间序列S1、S2对应的序列值Y1、Y2,如公式(6)所示:
Y1={y11,y12,…,y1(n+1))} 公式(6)
Y2={y21,y22,…,y2(n+1))}
示例地,如图2所示,两条时间序列S1、S2对应的序列值Y1、Y2,如公式(7)所示:
Y1={0,2,1,3)} 公式(7)
Y2={0,1,2,1)}
根据上述S1、S2、A1、A2、Y1、Y2,两条时间序列之间的改进型损失函数可定义为公式(8)所示:
其中,D(S1,S2)表示两条时间序列之间的改进型损失函数的损失值,S表示对应的m值,A表示对应的Δy值,α表示权重系数,可调节两条序列之间的变动趋势和变动幅度和序列值的相对重要性。
综上,本申请实施例提供的一种市场数据长期预测模型训练方法,通过获取样本数据集,样本数据集包括:预设时间段的市场数据,市场数据标注有实际销售数据,再根据样本数据集,训练预设GRU模型,最后根据改进型损失函数,验证训练中的预设GRU模型,在改进型损失函数满足预设条件后,获取目标GRU模型,其中,训练预设GRU模型,相比现有技术中的LSTM模型,具有较少的参数,计算速度更快,即可以高效的预测市场情况,并且,本申请采用改进型损失函数,考虑了两时间序列的变动趋势、变动幅度以及点之间的距离,通过权重系数调整两条序列之间的变动趋势和变动幅度和序列值的相对重要性,使得GRU模型在训练时,保证预测序列和真实序列的绝对距离较近,保证预测序列和真实序列的变动趋势一致,使得目标GRU模型能够学习到市场数据的长期信息,提高预测市场情况的准确性。
在上述图1所示的一种市场数据长期预测模型训练方法的基础上,本申请实施例还提供了一种训练预设GRU模型的实现方法。如下结合附图对该实施例进行具体解释说明。图3为本申请实施例提供的一种训练预设GRU模型的流程示意图。如图3所示,上述方法S102,根据样本数据集,训练预设GRU模型,包括:
S301,根据样本数据集中各数据的时间维度,提取数据特征。
在本申请实施例中,将样本数据集的时间维度设置为月,即将样本数据集按照月进行整理,当然,还可以将时间维度设置为周、年等,在本申请实施例中不作具体限制。
企业对产品进行生产决策前,需根据产品的以往销售数据以及产品的其他数据进行建模,从而得到销售数据与其他数据之间的关系,进而可根据其他数据进行销售数据的预测。示例地,产品的其他数据可包括价格数据、石油数据。
收集产品以往的销售数据、价格数据,其中,该销售数据、价格数据可从生产产品的企业中获得,通过该销售数据和价格数据计算产品的数量占比和价格合计对数,该数量占比为产品的销售数据占所有同类产品的总销量的百分比,该价格合计对数为该类产品的价格总和再对其求对数,示例地,求对数可以采用ln函数,当然,还可以采用其它对数函数,在此不作具体限制。
收集其他数据,如石油数据,其中,石油数据可包括从网络中通过数据爬取获得纽约石油收盘价和纽约石油收盘价涨跌情况。
提取数据特征,示例地,本申请实施例中,提取的数据特征可包括三个,分别为产品特征、石油特征、时间特征,其中,产品特征可包括营养品数量占比、原料药数量占比、香料数量占比、新材料数量占比、营养品价格合计对数、原料药价格合计对数、香料价格合计对数、新材料价格合计对数,石油特征可包括纽约石油收盘价、纽约石油收盘价涨跌百分比,时间特征可包括月份特征和季度特征。将时间维度为月的样本数据集,按照数据特征可构建01特征数据。
S302,将实际销售数据对应的数据特征作为输出、其他市场数据对应的数据特征作为输入,训练预设GRU模型。
由于本申请实施例需预测产品的市场需求,市场需求可通过销售数据表示,因此,需预测产品的销售数据。则在本申请实施例中,预设GRU模型的输出为销量数据,在训练GRU模型时,输出数据即为实际的销售数据对应的数据特征,相应地,除实际销售数据之外地其他市场数据对应的数据特征为GRU模型的输入数据,通过该输入数据和输出数据对预设GRU模型进行训练。
示例地,本申请实施例中的输出数据可为产品的月历史销售数据,输入数据即其他市场数据可为产品的数量占比、价格合计对数、纽约石油收盘价等,当然,该输入数据和输出数据仅为示意,还可以为其它数据,在本申请实施例中不作具体限制。
本申请实施例提供的一种训练预设GRU模型的方法,通过根据样本数据集中各数据的时间维度,提取数据特征,将实际销售数据对应的数据特征作为输出、其他市场数据对应的数据特征作为输入,训练预设GRU模型,使得企业可以对产品的实际数据进行建模,进而进行产品销售数据的预测。
在上述图3所示的一种训练预设GRU模型方法的基础上,本申请实施例还提供了一种市场数据的处理方法。如下结合附图对该实施例进行具体解释说明。图4为本申请实施例提供的一种市场数据的处理方法的流程示意图。如图4所示,上述方法S302,将实际销售数据对应的数据特征作为输出、其他市场数据对应的数据特征作为输入,训练预设GRU模型,包括:
S401,将实际销售数据进行平滑处理后,作为输出特征数据。
将实际销售数据进行平滑处理,其中,平滑处理可通过求对数进行计算,示例地,求对数可通过ln函数进行实现,还可通过log函数进行实现,在本申请实施例中不作具体限制。
S402,将其他市场数据求z-score标准化处理后,作为输入特征数据。
z-score标准化的计算如下述公式(9)所示:
其中,x可表示输入的产品的每个时间维度的数据,其中每个时间维度的数据为其他市场数据,u可表示输入的产品的多个时间维度的数据的均值,δ可表示输入的产品的多个时间维度的数据的标准差,示例地,若本申请实施例中的时间维度设置为月,则x可表示输入的产品的月数据,u可表示输入的产品的12个月的月数据的均值,δ可表示输入的产品的12个月的月数据的标准差。
S403,根据输入特征数据、输出特征数据,训练预设GRU模型。
采用标准化后的其他市场数据和平滑处理后的实际销售数据,训练预设GRU模型。
本申请实施例通过将实际销售数据进行平滑处理后,作为输出特征数据,将其他市场数据求z-score标准化处理后,作为输入特征数据,通过处理后的实际销售数据和其他市场数据,消除了量纲关系,使得数据可以统一划分到同一个范围内,避免数据的差异性较大。
在上述图4所示的一种市场数据的处理方法的基础上,本申请实施例还提供了另一种训练预设GRU模型的方法。如下结合附图对该实施例进行具体解释说明。图5为本申请实施例提供的另一种训练预设GRU模型的流程示意图。如图5所示,上述方法S403,根据输入特征数据、输出特征数据,训练预设GRU模型,包括:
根据输入特征数据和输出特征数据构建分类与回归树(Classification andRegression Tree,CART),分类与回归树还可成为CART回归树。
S501,根据CART回归树,筛选新的特征数据。
示例地,在本申请实施例中,回归树节点可通过均方差(Mean Square Error,MSE)进行节点划分,回归树的最大深度可设置为5,叶节点最小样本数可设置为2,当然,还可通过其他方法进行节点划分,最大深度和叶节点最小样本数也可为其他数值,在本申请实施例中不作具体限制。
示例地,根据CART回归树,筛选出的新的特征数据如下表所示:
其中,分数为筛选的依据,若特征对应的分数越高,该特征的价值越高,选择分数最高的预设数量的特征作为新的特征数据。
S502,将新的特征数据重构为满足GRU模型格式要求的待训练特征数据。
数据重构为将原有的数据格式转换为符合GRU模型的数据格式。
举例说明,在本申请实施例中,新的特征数据各数据格式为二维数据(数据量,特征数),GRU模型的数据格式为三维数据,因此,可根据预设的步长将二维数据转换为三维数据(数据量、步长、特征数)。
示例地,新的特征数据的数据格式可为:
A=[[0.1,0.2],[0.5,0.8],[0.8,0.2],[0.4,0.5]]
则新的特征数据为4*2格式,即二维数据。预设的步长为2时,将A进行数据重构,得到A′为:
A′=[[[0.1,0.2],[0.5,0.8]],[[0.8,0.2],[0.4,0.5]]]
则重构后的待训练特征数据为2*2*2格式,即三维数据,该待训练特征数据符合GRU模型的数据格式。
S503,采用待训练特征数据训练预设GRU模型。
本申请实施例采用待训练特征数据训练预设GRU模型,根据改进型损失函数,验证训练中的预设GRU模型,若改进型损失函数满足预设条件,获取目标GRU模型,若改进型损失函数不满足预设条件,循环执行S501~S503,直到改进型损失函数满足预设条件,获取目标GRU模型。
本申请实施例通过构建CART回归树,筛选新的特征数据,将新的特征数据重构为满足GRU模型格式要求的待训练特征数据,采用待训练特征那个数据训练预设GRU模型,通过选择价值最高的部分特征数据作为新的特征数据训练预设GRU模型,可以提高模型的训练效率,同时,选择价值最高的部分特征数据,在进行模型预测时,可以不受价值低的特征数据的干扰,提高模型预测的准确性。
在上述图1所示的一种市场数据长期预测模型训练方法的基础上,本申请实施例还提供了另一种获取目标GRU模型的实现方法,上述S101中的样本数据集包括:训练数据集和验证数据集,其中训练数据集用于训练预设GRU模型,验证数据集用于判断GRU模型训练是否结束。
上述S102,根据样本数据集,训练预设GRU模型,包括:
根据训练数据集,训练预设门控循环单元结构GRU模型。
上述S103,根据改进型损失函数,验证训练中的预设GRU模型,在改进型损失函数满足预设条件后,获取目标GRU模型,包括:
根据验证数据集和改进型损失函数,验证训练中的预设GRU模型,在改进型损失函数满足预设条件后,获取目标GRU模型,若改进型损失函数不满足预设条件,继续进行训练,直到改进型损失函数满足预设条件,获取目标GRU模型。
在上述图1所示的一种市场数据长期预测模型训练方法的基础上,本申请实施例还提供了一种市场数据长期预测的实现方法。如下结合附图对该实施例进行具体解释说明。图6为本申请实施例提供的一种市场数据长期预测方法的流程示意图。如图6所示,上述S103,根据改进型损失函数,验证训练中的预设GRU模型,在改进型损失函数满足预设条件后,获取目标GRU模型后,包括:
S601,获取待预测市场环境数据。
获取待预测市场环境数据,如要预测未来一段时间的产品销量,则获取的待预测市场环境数据可以为产品的市场价格,当然,待预测市场环境数据还可以为其他数据,在本申请实施例中不作具体限制。
S602,将待预测市场环境数据作为输入数据,采用目标GRU模型,获取输出的销售预测数据。
需要说明的是,销售预测数据可以是预测未来一段时间的销量、销售趋势等。
将待预测市场环境数据通过z-score标准化以及数据重构,输入目标GRU模型中,输出平滑后的销售预测数据,在本申请实施例中平滑处理采用对数函数,则需要将平滑后的销售预测数据求对应的指数,得到销售预测数据,当然,若平滑处理采用其他方式,对平滑后的销售预测数据的处理为其他方式的对应方式,在本申请实施例中不作具体限制。
本申请实施例通过获取待预测市场环境数据,将待预测市场环境数据作为输入数据,采用上述实施例中的目标GRU模型,可以获得输出的销售预测数据,即,获得销售数据的长期预测结果。
将本申请实施例中的目标GRU与ARIMA、LSTM、标准GRU通过实验进行比较,其中,超参数的选择采用网格搜索以及人工调参的方式确定,得到的实验结果表明,选取的三个月的预测结果中,ARIMA、LSTM、标准GRU以及目标GRU的预测值变动趋势和真实值变动趋势保持一致,都是先下降后上升,但目标GRU的预测值与真实值的距离要比其他模型的预测值都要近;选取的四个月的预测结果中,除了目标GRU之外,其他预测模型预测值变动趋势均与真实值变动趋势不一致,且目标GRU的预测值与真实值的距离要比其他模型的预测值都要近,说明采用本申请实施例训练的目标GRU模型,能够更好地进行长期预测。
图7为本申请实施例提供的一种市场数据长期预测模型训练装置的示意图,如图7所示,该市场数据长期预测模型训练装置包括:
获取模块701,用于获取样本数据集,其中,样本数据集包括:预设时间段的市场数据,市场数据标注有实际销售数据;
训练模块702,用于根据样本数据集,训练预设门控循环单元结构GRU模型;
目标模块703,用于根据改进型损失函数,验证训练中的预设GRU模型,在改进型损失函数满足预设条件后,获取目标GRU模型,目标GRU模型用于根据市场环境数据预测销售数据,改进型损失函数由两时间序列的变动趋势、变动幅度以及点之间的距离确定。
可选地,训练模块702,具体用于根据样本数据集中各数据的时间维度,提取数据特征;将实际销售数据对应的数据特征作为输出、其他市场数据对应的数据特征作为输入,训练预设GRU模型。
可选地,训练模块702,具体用于将实际销售数据进行平滑处理后,作为输出特征数据;将其他市场数据求z-score标准化处理后,作为输入特征数据;根据输入特征数据、输出特征数据,训练预设GRU模型。
可选地,训练模块702,具体用于根据输入特征数据和输出特征数据构建CART回归树;A、根据CART回归树,筛选新的特征数据;B、将新的特征数据重构为满足GRU模型格式要求的待训练特征数据;C、采用待训练特征数据训练预设GRU模型。
可选地,目标模块703,具体用于循环执行A~C,根据改进型损失函数,验证训练中的预设GRU模型,在改进型损失函数满足预设条件后,获取目标GRU模型。
以上这些模块可以是被配置成实施以上方法的一个或多个集成电路,例如:一个或多个特定集成电路(Application Specific Integrated Circuit,简称ASIC),或,一个或多个微处理器(digital singnal processor,简称DSP),或,一个或者多个现场可编程门阵列(Field Programmable Gate Array,简称FPGA)等。再如,当以上某个模块通过处理元件调度程序代码的形式实现时,该处理元件可以是通用处理器,例如中央处理器(CentralProcessing Unit,简称CPU)或其它可以调用程序代码的处理器。再如,这些模块可以集成在一起,以片上系统(system-on-a-chip,简称SOC)的形式实现。
图8为本申请实施例提供的一种计算机设备的示意图,该计算机设备可以是具备计算处理功能的计算设备或服务器。
该计算机设备包括:处理器801、存储介质802、总线803。处理器801和存储介质802通过总线803连接。
存储介质802用于存储程序,处理器801调用存储介质802存储的程序,以执行上述方法实施例。具体实现方式和技术效果类似,这里不再赘述。
可选地,本发明还提供一种程序产品,例如计算机可读存储介质,包括程序,该程序在被处理器执行时用于执行上述方法实施例。
在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(英文:processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(英文:Read-Only Memory,简称:ROM)、随机存取存储器(英文:Random Access Memory,简称:RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
上仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。
Claims (10)
1.一种市场数据长期预测模型训练方法,其特征在于,包括:
获取样本数据集,其中,所述样本数据集包括:预设时间段的市场数据,所述市场数据标注有实际销售数据;
根据所述样本数据集,训练预设门控循环单元结构GRU模型;
根据改进型损失函数,验证训练中的预设GRU模型,在所述改进型损失函数满足预设条件后,获取目标GRU模型,所述目标GRU模型用于根据市场环境数据预测销售数据,所述改进型损失函数由两时间序列的变动趋势、变动幅度以及点之间的距离确定。
2.根据权利要求1所述的方法,其特征在于,所述根据所述样本数据集,训练预设门控循环单元结构GRU模型,包括:
根据所述样本数据集中各数据的时间维度,提取数据特征;
将所述实际销售数据对应的数据特征作为输出、其他市场数据对应的数据特征作为输入,训练所述预设GRU模型。
3.根据权利要求2所述的方法,其特征在于,所述将所述实际销售数据对应的数据特征作为输出、其他市场数据对应的数据特征作为输入,训练所述预设GRU模型,包括:
将所述实际销售数据进行平滑处理后,作为输出特征数据;
将所述其他市场数据求z-score标准化处理后,作为输入特征数据;
根据所述输入特征数据、所述输出特征数据,训练所述预设GRU模型。
4.根据权利要求3所述的方法,其特征在于,所述根据所述输入特征数据、所述输出特征数据,训练所述预设GRU模型,包括:
根据所述输入特征数据和所述输出特征数据构建CART回归树;
A、根据所述CART回归树,筛选新的特征数据;
B、将所述新的特征数据重构为满足所述GRU模型格式要求的待训练特征数据;
C、采用所述待训练特征数据训练所述预设GRU模型。
5.根据权利要求4所述的方法,其特征在于,所述根据改进型损失函数,验证训练中的所述预设GRU模型,在所述改进型损失函数满足预设条件后,获取目标GRU模型,包括:
循环执行所述A~C,根据所述改进型损失函数,验证训练中的所述预设GRU模型,在所述改进型损失函数满足预设条件后,获取目标GRU模型。
6.根据权利要求1-5任一项所述的方法,其特征在于,所述样本数据集包括:训练数据集和验证数据集;
所述根据所述样本数据集,训练预设门控循环单元结构GRU模型,包括:
根据所述训练数据集,训练预设门控循环单元结构GRU模型;
所述根据改进型损失函数,验证训练中的所述预设GRU模型,在所述改进型损失函数满足预设条件后,获取目标GRU模型,包括:
根据所述验证数据集和所述改进型损失函数,验证训练中的所述预设GRU模型,在所述改进型损失函数满足预设条件后,获取目标GRU模型。
7.一种市场数据长期预测方法,其特征在于,包括:
获取待预测市场环境数据;
将所述待预测市场环境数据作为输入数据,采用权利要求1-6任一项所述的目标GRU模型,获取输出的销售预测数据。
8.一种市场数据长期预测模型训练装置,其特征在于,包括:
获取模块,用于获取样本数据集,其中,所述样本数据集包括:预设时间段的市场数据,所述市场数据标注有实际销售数据;
训练模块,用于根据所述样本数据集,训练预设门控循环单元结构GRU模型;
目标模块,用于根据改进型损失函数,验证训练中的所述预设GRU模型,在所述改进型损失函数满足预设条件后,获取目标GRU模型,所述目标GRU模型用于根据市场环境数据预测销售数据,所述改进型损失函数由两时间序列的变动趋势、变动幅度以及点之间的距离确定。
9.一种计算机设备,其特征在于,包括:存储器和处理器,所述存储器存储有所述处理器可执行的计算机程序,所述处理器执行所述计算机程序时实现上述权利要求1-7中任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被读取并执行时,实现上述权利要求1-7中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111651046.6A CN114282657A (zh) | 2021-12-30 | 2021-12-30 | 一种市场数据长期预测模型训练方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111651046.6A CN114282657A (zh) | 2021-12-30 | 2021-12-30 | 一种市场数据长期预测模型训练方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114282657A true CN114282657A (zh) | 2022-04-05 |
Family
ID=80878637
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111651046.6A Pending CN114282657A (zh) | 2021-12-30 | 2021-12-30 | 一种市场数据长期预测模型训练方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114282657A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116911908A (zh) * | 2023-07-25 | 2023-10-20 | 维妮科技(深圳)有限公司 | 一种基于人工智能的销售数据预测方法及系统 |
-
2021
- 2021-12-30 CN CN202111651046.6A patent/CN114282657A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116911908A (zh) * | 2023-07-25 | 2023-10-20 | 维妮科技(深圳)有限公司 | 一种基于人工智能的销售数据预测方法及系统 |
CN116911908B (zh) * | 2023-07-25 | 2024-02-27 | 维妮科技(深圳)有限公司 | 一种基于人工智能的销售数据预测方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102044205B1 (ko) | 빅데이터와 기계학습을 이용한 타겟 정보 예측 시스템 및 예측 방법 | |
Kell et al. | Evaluation of the prediction skill of stock assessment using hindcasting | |
CN110390408B (zh) | 交易对象预测方法和装置 | |
CN108399564B (zh) | 信用评分方法及装置 | |
KR101802866B1 (ko) | 빅데이터와 기계학습을 이용한 타겟 정보 예측 시스템 및 예측 방법 | |
CN109409561B (zh) | 多时间尺度时间序列协同预测模型的构建方法 | |
CN111275503B (zh) | 一种获取流失用户召回成功率的数据处理方法及装置 | |
CN111582538A (zh) | 一种基于图神经网络的社群价值预测方法及系统 | |
WO2019214455A1 (zh) | 一种数据序列预测方法及计算设备 | |
Tyralis et al. | On the prediction of persistent processes using the output of deterministic models | |
CN113554175B (zh) | 一种知识图谱构建方法、装置、可读存储介质及终端设备 | |
CN115699044A (zh) | 软件项目的风险评估方法、装置、计算机设备、存储介质 | |
CN115081515A (zh) | 能效评价模型构建方法、装置、终端及存储介质 | |
US20110231336A1 (en) | Forecasting product/service realization profiles | |
CN114282657A (zh) | 一种市场数据长期预测模型训练方法、装置、设备及存储介质 | |
CN117853158A (zh) | 基于动态量本利分析的企业运营数据预测方法及装置 | |
CN113988459A (zh) | 一种基于电力营销数据的中小企业成长性评估方法及系统 | |
US20230419195A1 (en) | System and Method for Hierarchical Factor-based Forecasting | |
CN117217812A (zh) | 一种用户行为预测方法、装置、计算机设备及存储介质 | |
CN117235633A (zh) | 机构分类方法、装置、计算机设备及存储介质 | |
CN113656692B (zh) | 基于知识迁移算法的产品推荐方法、装置、设备及介质 | |
CN111160929A (zh) | 一种客户类型的确定方法及装置 | |
CN115759401A (zh) | 一种电力市场成员竞价行为预测标签生成方法和系统 | |
CN112463964B (zh) | 文本分类及模型训练方法、装置、设备及存储介质 | |
Needle | Management strategy evaluation for North Sea haddock |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information |
Country or region after: China Address after: No. 309 Liuhe Road, Binjiang District, Hangzhou City, Zhejiang Province (High tech Zone) Applicant after: Zhongkong Technology Co.,Ltd. Address before: No. six, No. 309, Binjiang District Road, Hangzhou, Zhejiang Applicant before: ZHEJIANG SUPCON TECHNOLOGY Co.,Ltd. Country or region before: China |