CN111144552A - 一种粮食品质多指标预测方法及装置 - Google Patents
一种粮食品质多指标预测方法及装置 Download PDFInfo
- Publication number
- CN111144552A CN111144552A CN201911381924.XA CN201911381924A CN111144552A CN 111144552 A CN111144552 A CN 111144552A CN 201911381924 A CN201911381924 A CN 201911381924A CN 111144552 A CN111144552 A CN 111144552A
- Authority
- CN
- China
- Prior art keywords
- lstm
- prediction
- index
- model
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 38
- 238000012549 training Methods 0.000 claims abstract description 46
- 238000013256 Gubra-Amylin NASH model Methods 0.000 claims abstract description 28
- 235000013305 food Nutrition 0.000 claims abstract description 6
- 241000209140 Triticum Species 0.000 claims description 56
- 235000021307 Triticum Nutrition 0.000 claims description 56
- 230000006870 function Effects 0.000 claims description 45
- 235000013339 cereals Nutrition 0.000 claims description 39
- 230000015654 memory Effects 0.000 claims description 28
- 210000002569 neuron Anatomy 0.000 claims description 28
- 239000011159 matrix material Substances 0.000 claims description 19
- 238000009826 distribution Methods 0.000 claims description 16
- 230000004913 activation Effects 0.000 claims description 12
- 210000004027 cell Anatomy 0.000 claims description 12
- 230000008569 process Effects 0.000 claims description 10
- 230000002194 synthesizing effect Effects 0.000 claims 4
- 230000003993 interaction Effects 0.000 abstract description 4
- 238000004458 analytical method Methods 0.000 description 12
- 230000008859 change Effects 0.000 description 9
- 238000004364 calculation method Methods 0.000 description 8
- 238000004422 calculation algorithm Methods 0.000 description 7
- 108010068370 Glutens Proteins 0.000 description 6
- 230000035784 germination Effects 0.000 description 6
- 235000021312 gluten Nutrition 0.000 description 6
- 230000003042 antagnostic effect Effects 0.000 description 5
- 238000013528 artificial neural network Methods 0.000 description 5
- 102000003992 Peroxidases Human genes 0.000 description 4
- 235000014113 dietary fatty acids Nutrition 0.000 description 4
- 229930195729 fatty acid Natural products 0.000 description 4
- 239000000194 fatty acid Substances 0.000 description 4
- 150000004665 fatty acids Chemical class 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000013441 quality evaluation Methods 0.000 description 4
- 238000004062 sedimentation Methods 0.000 description 4
- 230000006403 short-term memory Effects 0.000 description 4
- 230000006866 deterioration Effects 0.000 description 3
- 230000007787 long-term memory Effects 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 108040007629 peroxidase activity proteins Proteins 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000007418 data mining Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 210000003205 muscle Anatomy 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 102000016938 Catalase Human genes 0.000 description 1
- 108010053835 Catalase Proteins 0.000 description 1
- 244000068988 Glycine max Species 0.000 description 1
- 235000010469 Glycine max Nutrition 0.000 description 1
- 238000012300 Sequence Analysis Methods 0.000 description 1
- 240000008042 Zea mays Species 0.000 description 1
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 1
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000010835 comparative analysis Methods 0.000 description 1
- 239000000306 component Substances 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 239000008358 core component Substances 0.000 description 1
- 235000005822 corn Nutrition 0.000 description 1
- 238000002790 cross-validation Methods 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 229920006395 saturated elastomer Polymers 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06395—Quality analysis or management
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Development Economics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Data Mining & Analysis (AREA)
- Marketing (AREA)
- Educational Administration (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Game Theory and Decision Science (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及一种粮食品质多指标预测方法及装置,包括:获取N种粮食品质指标时间序列数据;将N种粮食品质指标时间序列数据输入到训练好的LSTM‑GAN预测模型中,得到各指标的预测值;LSTM‑GAN预测模型包括LSTM模型和GAN模型,LSTM模型至少包括N个LSTM单元,N为指标的种类数,将训练集中的各类别的粮食品质指标时间序列数据输入到对应的LSTM单元中进行预测,并将预测结果发送给GAN模型,由GAN模型综合各指标的预测结果确定对应的状态信息,并依据训练集中的真实指标数据对应状态信息对各LSTM单元的参数进行调整,使预测误差满足要求,实现对LSTM‑GAN预测模型的训练。本发明由于考虑了各类别的粮食品质指标的关联性和相互作用,提高了预测结果的准确性。
Description
技术领域
本发明涉及一种粮食品质多指标预测方法及装置,属于粮食品质评价及分析技术领域。
背景技术
小麦籽粒品质随储藏时间延长逐渐产生劣变,同时反映在多指标不同程度的数值变化上,因此可通过研究小麦多指标时序数据的变化趋势来了解其储藏品质的劣变程度,并以此调控小麦的储藏过程。由于小麦储藏环境的差异性以及多指标间的不同相互作用,其多指标时间序列数据的预测存在一定的误差,而且随着储藏时间延长其误差不断增大,还可能影响到小麦品质评价的准确性。为此,需要探索更为有效的小麦品质多指标预测算法,以提高预测结果的准确性及稳定性,为小麦品质评价提供一定的技术支持。
时间序列是按时间顺序获得的一系列观测值,随着信息技术不断发展,时间序列数据量与日俱增,并存在于社会生活的各个方面,如金融收益、气象研究、网络安全等,小麦多生理生化指标随储藏时间表现出明显的变化趋势,体现出了一定的时间序列特性。而时间序列数据挖掘的主要任务是分析时间序列的历史数据,预测将来一段时间的可能数据,并分析未来发展趋势,因此,小麦品质多生理生化指标数据可采用相关的时间序列预测算法,以此提高小麦品质指标预测分析的效率及准确性。
近年来人工智能算法及神经网络模型发展迅速,有效提高了数据挖掘及预测分析的效率和准确性,其中在数据预测分析领域,循环神经网络(Recurrent Neural Network,RNN)是一种可以处理任意长度时序数据的人工神经网络,其拓扑结构包含自反馈机制,具有一定的记忆能力,适用于小麦多指标时序数据的预测分析。然而RNN在对长序列进行训练时会出现梯度消失或梯度爆炸,为此,长短期记忆网络(Long Short-Term Memory,LSTM)通过引入门控单元来控制记忆的迭代速度,进一步提高了预测模型的效率及稳定性。
其中,在长短期记忆网络LSTM模型中,记忆单元是核心组件,如图1所示,每个LSTM记忆单元包含一个元组(cell),在t时刻其状态为ct,包含了序列的长期记忆信息;在t时刻隐含层的状态为ht,包含了序列的短期记忆信息,长期记忆的更新速度远低于短期记忆,记忆单元信息的读取和修改是通过控制遗忘门、输入门以及输出门来实现的。在时刻t时,LSTM记忆单元的输入包括:序列输入xt、记忆单元t-1时刻的状态ct-1以及隐含层t-1时刻的状态ht-1;其输出包括:t时刻记忆单元的状态ct与隐含层的状态ht。在t时刻假定输入层数据为xt,则此刻隐含层状态ht和输出层的预测值为yt为:
ht=f(Uxt+Wht-1+bh) (1)
yt=g(Vht+by) (2)
其中,ht-1为t-1时刻的隐含层状态;U、V分别表示输入层与隐含层、隐含层与输出层之间的权重矩阵;W表示隐含层中的自反馈权重矩阵;bh、by分别表示隐含层、输出层的偏置项;f、g分别表示隐含层、输出层的激活函数。则LSTM中遗忘门、输入门、输出门在t时刻的状态ft、it、ot和记忆单元的状态ct与隐含层状态ht计算公式为:
it=σ(Wxixt+Whiht-1+Wcict-1+bi) (3)
ft=σ(Wxfxt+Whfht-1+Wcfct-1+bf) (4)
ot=σ(Wxoxt+Whoht-1+Wcoct+bo) (5)
ct=ftct-1+lttanh(Wxcxt+Whcht-1+bc) (6)
ht=ottanh(ct) (7)
其中,Wxc、Wxi、Wxf、Wxo为连接输入信号xt的权重矩阵;Whc、Whi、Whf、Who为连接隐含层输出信号ht的权重矩阵;Wci、Wcf、Wco为连接神经元激活函数输出矢量ct和门函数的对角矩阵;bi、bc、bf、bo为偏置向量;tanh为双曲正切激活函数,σ表示sigmoid激活函数,其作用是将变量映射至区间[0,1]中。
由于LSTM记忆单元对于时间序列长短期信息的有效把握,所以LSTM模型可对小麦单个指标的变化趋势进行较为准确的预测分析。然而不同指标只是分别表现了小麦储藏期间的某个方面特性,单个指标在分析小麦整体品质时并不具有代表性,在进行小麦多指标时序分析时,多指标间的关联性及储藏环境的差异性仍会对预测结果产生一定的影响,而LSTM模型并不适用于小麦多指标序列数据的预测分析。
在人工智能的对抗学习领域,生成式对抗网络(Generative adversarialnetwork,GAN)是由Goodfellow等人在2014年依据二人零和博弈提出的一种生成式模型,其框架中包含一组相互对抗的生成器和判别器模块,用以判断和监视模型学习的效果,也可以用于回归预测分析。在生成式对抗网络中,判别器是一个二分类模型,可用交叉熵计算目标函数:
其中,J(D)表示目标函数,G、D分别表示生成器、判别器的可微函数,E是目标函数的期望值,x是真实数据样本,z是随机噪声矢量,D(x)表示判别器的判别结果,G(z)是判别器的生成数据,pdata(x)表示判别器判别出真实数据的概率,pz(z)表示判别器判别出随机噪声矢量的概率。第一项表示D判断出x是真实数据的情况,第二项则表示D判别出数据是由生成器G将噪声矢量z映射而成的生成数据,G与D进行二元零和博弈,生成器G的目标函数J(G)=-J(D)。因此,GAN模型的优化问题可转化为极大极小博弈问题:
因为G在训练初期所生成的数据不够逼真,所以D很容易将生成数据与真实数据区分开来,导致G误差梯度下降较为缓慢,因此通过最大化logD(G(z))而非最小化log(1-D(G(z)))来训练G是一个更好的策略。生成器G采用神经网络训练其目标函数,而不是直接取J(D)的相反数,即使判别器D准确地拒绝了所有生成样本,G仍可以继续学习直至达到模型要求的效果,为此可以将极大极小博弈改为非饱和博弈:
GAN为对抗学习提供了比较有效的方法,已广泛应用于回归预测、图像处理等领域问题的解决。GAN虽然可用于多指标的对抗学习以获得小麦品质的整体变化特征,然而GAN中生成器和判别器的网络结构如果选择不当会直接导致模型性能的下降,导致小麦多指标序列预测的精度较低。而目前已有的LSTM和GAN的结合方式中,也只是改变神经网络的编码方式或者仅用于训练特征的提取,均不能有效提高小麦多指标时序数据预测的效率和准确性。
发明内容
本发明的目的是提供一种粮食品质多指标预测方法及装置,用于解决现有的粮食多指标数据预测不准确的问题。
为解决上述技术问题,本发明提供了一种粮食品质多指标预测方法,步骤如下:
1)获取N种粮食品质指标时间序列数据;
2)将所述N种粮食品质指标时间序列数据输入到训练好的LSTM-GAN预测模型中,得到各指标的预测值;
所述LSTM-GAN预测模型包括LSTM模型和GAN模型,LSTM模型至少包括N个LSTM单元,N为指标的种类数,将训练集中的各类别的粮食品质指标时间序列数据输入到对应的LSTM单元中进行预测,并将预测结果发送给GAN模型,由GAN模型综合各指标的预测结果确定对应的状态信息,并依据训练集中的真实指标数据对应状态信息对各LSTM单元的参数进行调整,使预测误差满足要求,实现对LSTM-GAN预测模型的训练。
为解决上述技术问题,本发明还提供了一种粮食品质多指标预测装置,包括处理器和存储器,所述处理器用于处理存储器所述存储器中的指令以实现如下方法:
1)获取N种粮食品质指标时间序列数据;
2)将所述N种粮食品质指标时间序列数据输入到训练好的LSTM-GAN预测模型中,得到各指标的预测值;
所述LSTM-GAN预测模型包括LSTM模型和GAN模型,LSTM模型至少包括N个LSTM单元,N为指标的种类数,将训练集中的各类别的粮食品质指标时间序列数据输入到对应的LSTM单元中进行预测,并将预测结果发送给GAN模型,由GAN模型综合各指标的预测结果确定对应的状态信息,并依据训练集中的真实指标数据对应状态信息对各LSTM单元的参数进行调整,使预测误差满足要求,实现对LSTM-GAN预测模型的训练。
本发明的有益效果是:利用GAN模型确定各个LSTM单元的预测结果对应的状态信息,将该状态信息与训练集中的真实指标数据对应状态信息进行比较,并根据比较结果对各LSTM单元进行调整,使小粮食品质多指标在相应时刻的预测数值更加准确。本发明由于考虑了各类别的粮食品质指标的关联性和相互作用,提高了预测结果的准确性。
进一步的,为了考虑各类别的粮食品质指标的关联性和相互作用以提高预测结果的准确性,GAN模型包括生成器和判别器,生成器用于综合各LSTM单元中的预测结果得到对应的状态信息以及综合各真实指标数据确定对应的状态信息;判别器用于根据生成器得到两种状态信息确定预测结果对应的状态信息的误差,并将误差结果反馈给生成器和LSTM模型,生成器和LSTM模型根据收到的反馈进行调整,以使判别器输出结果达到最优。
进一步的,所述LSTM-GAN预测模型的目标函数为:
V(G,L,D)=Et~p(data)[logD(t)]+Et~g(data)[log(1-D(L(G(t))))]
=∫tpdata(t)log(D(t))+pdata(L(G(t)))log(1-D(t))dt
其中,V(G,L,D)表示LSTM-GAN预测模型的目标函数,E表示目标函数的期望值,D(t)表示判别器的判别结果,L(G(t))表示LSTM单元的预测结果,G(t)表示生成器的生成数据,pdata(t)表示真实指标数据的概率分布,p(data)表示真实指标数据的概率,g(data)表示生成指标数据的概率。
进一步的,判别器达到最优结果的输出为:
进一步的,为了对LSTM单元进行调整,LSTM单元包括输入门、遗忘门和输出门,对LSTM单元的调整指的是对其遗忘门状态函数进行修正,采用的公式为:
ft=(σ+lossgt)(Wxfxt+Whfht-1+Wcfct-1+bf)
其中,ft表示遗忘门状态函数,σ表示sigmoid激活函数,loss表示第k个神经元的误差项,gt表示在t时刻生成器输出的小麦品质状态信息,Wxf表示连接输入信号xt的权重矩阵,Whf表示连接隐含层输出信号ht的权重矩阵,ht-1表示t-1时刻的隐含层状态,Wcf表示连接神经元激活函数输出矢量ct和门函数的对角矩阵,ct-1表示在t-1时刻的记忆单元的状态,bf表示偏置向量,表示第k个神经元的期望输出,yk表示第k个神经元的实际输出,m表示输出层神经元的个数。
附图说明
图1是现有技术的长短期记忆网络单元结构;
图2是本发明的LSTM-GAN预测模型的网络结构图;
图3(a)是本发明的脂肪酸值的预测结果与实际值对比图;
图3(b)是本发明的降落数值的预测结果与实际值对比图;
图3(c)是本发明的沉降值的预测结果与实际值对比图;
图3(d)是本发明的发芽率的预测结果与实际值对比图;
图3(e)是本发明的过氧化氢酶的预测结果与实际值对比图;
图3(f)是本发明的导电率的预测结果与实际值对比图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及具体实施例对本发明进行进一步详细说明。
粮食品质多指标预测方法实施例:
本实施例提供了一种粮食品质多指标预测方法,该方法以长短期记忆网络LSTM和生成式对抗网络GAN为基础,改进LSTM和GAN的网络训练过程来融合多指标整体变化趋势特征,采用一种LSTM-GAN拓扑结构来提升多指标预测分析的准确性。以实现小麦品质多指标预测为例,该粮食品质多指标预测方法包括如下步骤:
步骤一:构建LSTM-GAN预测模型。
由于LSTM模型可计算和预估小麦指标数据的时序状态信息,但是往往只能对单目标进行预测分析;GAN模型虽然可用于多指标的对抗学习以获得小麦品质的整体变化特征,然而GAN模型中生成器和判别器的网络结构如果选择不当会直接导致模型性能的下降。因此,本实施例改进LSTM和GAN的网络训练过程来融合多指标整体变化趋势特征,提出了一种LSTM-GAN测试模型来提升多指标预测分析的准确性。
如图2所示,LSTM-GAN预测模型包括LSTM模型和GAN模型。其中,GAN模型包括生成器G和判别器D;LSTM模型包括N个LSTM单元,N为指标的种类数,根据实际预测时所使用的指标种类来确定。生成器G接收输入层传来的多指标数据,根据加权计算得出小麦的整体品质状态权值序列,并输出至网络其他部分参与计算;LSTM单元在单指标时序预测的基础上,利用生成器G传来的状态数据对神经网络训练过程进行微调,以此完成对LSTM单元中记忆状态的更新;判别器D通过比对预测序列和真实序列的数据信息来计算预测状态信息的误差,并将计算结果反馈至生成器G和LSTM单元。LSTM-GAN预测模型通过不断的对抗和迭代使得综合误差逐渐下降,并输出更为准确的多指标预测分析结果。
步骤二:确定LSTM-GAN预测模型的目标函数。
由图2中的LSTM-GAN预测模型的网络结构可知,生成器G的首次输入为小麦多生理生化指标数据,由多指标的对抗学习生成多指标总体状态序列,输出的状态序列将多指标体现品质变化的共性叠加在了一起,可有效提高小麦整体品质评价的准确性。用pt(data)表示小麦样本真实指标数据的分布情况(预测指标数据是由生成器G输出至判别器D,用gt(data)表示小麦样本预测指标数据的分布情况),在t时刻生成器G输出的小麦品质状态信息G(t)可由标准化多指标训练集在此时刻的时序数据加权得出:
其中,n表示指标数据的种类,Wit为生成器G构造整体状态序列的权值矩阵,随着后续模型的优化,权值矩阵Wit也会多次更新,直到生成器G的计算结果达到判别器D的判别目标。而判别器D会对生成器G产生的序列进行评估,由公式(8)中二分类判别器的目标函数可知判别器的输出只有两种结果,即判别数据是否来源于真实数据。为了获得适用于小麦多指标预测的对抗学习方法,本实施例改进GAN的对抗学习方式,将判别器D的目标转化为鉴别生成序列与真实序列的相似程度,其目标及优化函数如下:
其中,D(t)表示判别器D的判别结果,G(t)表示生成器G的生成数据,E表示目标函数的期望值,pdata(t)表示真实指标数据的概率分布,p(data)表示真实指标数据的概率,g(data)表示生成指标数据的概率。
对于生成器G输出的状态序列,由LSTM模型控制有效记忆信息的保留,通过减小无关信息所产生的影响,以提高整体模型训练的效率和准确度。LSTM模块的目标与生成器G相同,都是取得更小的误差,经过长短期记忆单元优化过生成序列为L(G(t)),由式(14)可以得出LSTM-GAN预测模型计算的整体目标函数为:
其中,L(G(t))表示LSTM单元的预测结果。
根据以上公式(15)的推导,可观察出LSTM-GAN预测模型中几个组成部分的相互关系。由于对于任意的(a,b)∈R2且不等于0,函数alog(y)+blog(1-y)的关于y的最大值为a/(a+b),因此判别器D达到最优结果的输出为:
为衡量两个概率分布之间的差异性,采用JS散度计算两个指标序列之间的相似程度。在给定最优判别器的条件下,将式(16)代入式(15),可将GAN模型的目标函数转换为最小化真实分布Pt与生成分布Pl(g(t))之间的JS散度:
上述判别器D在训练过程中会逐渐接近最优,生成器G也会使真实数据分布Pt和生成数据分布Pl(g(t))之间的JS散度越来越小,即生成状态序列和小麦多指标数据序列的相似程度更加接近,因此,LSTM-GAN预测模型通过对抗训练的方法提取出小麦多指标数据序列的变化特征,逐渐匹配到小麦真实指标数据的特征分布,使多指标的预测结果更加准确。
步骤三:LSTM-GAN预测模型训练及参数优化。
LSTM-GAN预测模型的训练过程可采用反向传播算法和实时递归算法,通过调整相应的权值信息使误差结果逐渐降低,其中反向传播算法效率更高,在计算时间上具有优势,因此本实施例采用反向传播训练方式。改进模型中输入门it和输出门ot作用不变,为了使LSTM记忆单元存储更为有效的时序信息,其中遗忘门ft根据判别器D的判别结果选择性的遗忘掉无效的LSTM记忆单元信息,采用如下计算过程:
ft=(σ+loss gt)(Wxfxt+Whfht-1+Wcfct-1+bf) (18)
其中,σ表示sigmoid激活函数,loss表示第k个神经元的误差项,gt表示在t时刻生成器G输出的小麦品质状态信息,同G(t)的表示含义相同,Wxf表示连接输入信号xt的权重矩阵,Whf表示连接隐含层输出信号ht的权重矩阵,ht-1表示在t-1时刻的隐含层状态,Wcf表示连接神经元激活函数输出矢量ct和门函数的对角矩阵,ct-1表示在t-1时刻的记忆单元的状态,bf表示偏置向量,表示第k个神经元的期望输出,yk表示第k个神经元的实际输出,m为输出层神经元的个数。最后根据相应的误差项,计算每个权重的梯度,反复应用链式规则使整体损失函数达到最小。用q代表训练过程的迭代次数,则第k个神经元权值的更新方式为:
由于小麦储藏期间多指标随储藏时间变化的数值存在一定差异,所以小麦品质受不同时期储藏条件影响导致的劣变程度不一,因此,采用LSTM模型对于小麦多指标数据进行时序建模时,可有效区别不同储藏时期对于品质的影响程度,根据小麦多指标时序数据对于品质状态信息进行预估,再通过以上反向误差传播算法训练LSTM-GAN预测模型得出多指标预测结果。
为了检验LSTM-GAN预测模型预测多指标数据的误差大小,在本实施例中,选取脂肪酸值、降落数值、沉降值、发芽率、过氧化物酶、电导率这6个指标,对这6个指标在0d到210d的96组时序数值,根据交叉验证方法划分为72组训练集和24组测试集进行对比分析。为避免因多指标数值差异及计量单位对模型训练误差所产生的影响,采用Z-score标准化公式对多指标时序数据进行预处理。
另外,由于LSTM模型的结构参数通常可对训练结果产生较大影响,因此需要分析训练时序窗口长度、隐含层层数和其中神经元个数对于模型训练的效率及准确度所产生的影响。
为了比较小麦长期及短期时序数据对整体预测误差的影响,采用相同的LSTM-GAN预测模型网络结构参数(隐含层神经元个数=10,隐含层层数=2),来比较不同的训练时序窗口长度这一变量对多指标数据进行训练及预测的影响,在LSTM-GAN预测模型中梯度下降采用自适应矩估计优化器(Adaptive moment estimation,Adam)方法优化学习率,计算训练时序窗口长度为2、4、6、8时的模型误差数据如表1所示。
表1
窗口长度 | 2 | 4 | 6 | 8 |
脂肪酸值 | 0.260 | 0.258 | 0.308 | 0.328 |
降落数值 | 0.325 | 0.263 | 0.228 | 0.277 |
沉降值 | 0.356 | 0.447 | 0.336 | 0.407 |
发芽率 | 0.652 | 0.530 | 0.483 | 0.511 |
过氧化物酶 | 0.424 | 0.455 | 0.402 | 0.415 |
电导率 | 0.412 | 0.324 | 0.329 | 0.374 |
表1中,当训练窗口时序长度为4时,脂肪酸值、电导率取得了较小的误差;而训练窗口时序长度为6时,降落数值、沉降值、发芽率、过氧化物酶指标的训练误差较小,因此,不同指标对于小麦品质状态序列的长短期记忆信息的依赖程度不同,综合多指标可知当训练窗口长度为6时整体预测误差最小。
除训练窗口长度外,LSTM-GAN预测模型中隐含层的网络结构仍需进一步优化,在模型时序长度为6时,采用2、3、5层隐含层和每层6、8、10、12个神经元对多指标数据进行训练,计算得出的模型训练误差数据如表2所示。
表2
由表2可知,实验中隐含层层数越多,误差也随之逐渐增大,这是由于隐含层层数过多产生了过拟合现象,2层隐含层的网络结构已经能够得出较低的预测误差结果;同时隐含层神经元个数并不是越多越好,需要根据数据分布选择适当的神经元个数,当隐含层神经元个数为10时有助于快速训练得出更准确的预测结果。
通过对模型结构参数的优化,由LSTM-GAN预测模型预测多指标的时序数据时,小麦指标在筋力方面的表现需要进一步对比分析,为比较不同指标变化规律的差异,以强筋麦小麦为例对多指标真实值与预测值比较如图3(a)~3(f)所示。由图3可观察多指标预测值误差较大的样本所在的批次,在某些特定条件下发芽率、过氧化物酶指标相应批次误差较大,说明小麦品质在此期间发生了过快劣变导致实际值低于预测值,因此在多指标预测中应充分考虑储藏时期及环境变化对多指标数据造成的影响。
另外,为了比较不同筋力小麦的指标预测情况,用LSTM-GAN预测模型分别训练强筋、中筋、弱筋这3种筋力小麦多指标数据,得出如表3所示的误差计算结果。其中,3种筋力小麦的总体误差分别为2.042、1.974、1.943,它们没有明显的数值差异,均可由LSTM-GAN模型得出较为准确的小麦多生理生化指标时序预测结果。
表3
在上述的粮食品质多指标预测方法中,利用GAN模型中生成器和判别器博弈的方法来判别LSTM模型训练过程中小麦品质的真实变化状态,由多指标对抗学习提取小麦品质整体劣变状态特征,再经过LSTM模型对多指标的长短期记忆数据序列进行调整,使小麦品质多指标在相应时刻的预测数值更加准确。当然,上述的粮食品质多指标预测方法是以对小麦品质多指标预测为例进行说明的,作为其他的实施方式,该方法也可以对玉米、大豆等其他种类的粮食进行品质多指标预测。
粮食品质多指标预测装置实施例:
本实施例提供了一种粮食品质多指标预测装置,包括处理器和存储器,该处理器用于处理存储器存储器中的指令,以实现一种粮食品质多指标预测方法,由于该粮食品质多指标预测方法已经在上述的粮食品质多指标预测方法实施例中进行了详细介绍,此处不再赘述。
Claims (10)
1.一种粮食品质多指标预测方法,其特征在于,步骤如下:
1)获取N种粮食品质指标时间序列数据;
2)将所述N种粮食品质指标时间序列数据输入到训练好的LSTM-GAN预测模型中,得到各指标的预测值;
所述LSTM-GAN预测模型包括LSTM模型和GAN模型,LSTM模型至少包括N个LSTM单元,N为指标的种类数,将训练集中的各类别的粮食品质指标时间序列数据输入到对应的LSTM单元中进行预测,并将预测结果发送给GAN模型,由GAN模型综合各指标的预测结果确定对应的状态信息,并依据训练集中的真实指标数据对应状态信息对各LSTM单元的参数进行调整,使预测误差满足要求,实现对LSTM-GAN预测模型的训练。
2.根据权利要求1所述的粮食品质多指标预测方法,其特征在于,GAN模型包括生成器和判别器,生成器用于综合各LSTM单元中的预测结果得到对应的状态信息以及综合各真实指标数据确定对应的状态信息;判别器用于根据生成器得到两种状态信息确定预测结果对应的状态信息的误差,并将误差结果反馈给生成器和LSTM模型,生成器和LSTM模型根据收到的反馈进行调整,以使判别器输出结果达到最优。
5.根据权利要求2或3所述的粮食品质多指标预测方法,其特征在于,LSTM单元包括输入门、遗忘门和输出门,对LSTM单元的调整指的是对其遗忘门状态函数进行修正,采用的公式为:
ft=(σ+loss gt)(Wxfxt+Whfht-1+Wcfct-1+bf)
6.一种粮食品质多指标预测装置,其特征在于,包括处理器和存储器,所述处理器用于处理存储器所述存储器中的指令以实现如下方法:
1)获取N种粮食品质指标时间序列数据;
2)将所述N种粮食品质指标时间序列数据输入到训练好的LSTM-GAN预测模型中,得到各指标的预测值;
所述LSTM-GAN预测模型包括LSTM模型和GAN模型,LSTM模型至少包括N个LSTM单元,N为指标的种类数,将训练集中的各类别的粮食品质指标时间序列数据输入到对应的LSTM单元中进行预测,并将预测结果发送给GAN模型,由GAN模型综合各指标的预测结果确定对应的状态信息,并依据训练集中的真实指标数据对应状态信息对各LSTM单元的参数进行调整,使预测误差满足要求,实现对LSTM-GAN预测模型的训练。
7.根据权利要求6所述的粮食品质多指标预测装置,其特征在于,GAN模型包括生成器和判别器,生成器用于综合各LSTM单元中的预测结果得到对应的状态信息以及综合各真实指标数据确定对应的状态信息;判别器用于根据生成器得到两种状态信息确定预测结果对应的状态信息的误差,并将误差结果反馈给生成器和LSTM模型,生成器和LSTM模型根据收到的反馈进行调整,以使判别器输出结果达到最优。
10.根据权利要求7或8所述的粮食品质多指标预测装置,其特征在于,LSTM单元包括输入门、遗忘门和输出门,对LSTM单元的调整指的是对其遗忘门状态函数进行修正,采用的公式为:
ft=(σ+loss gt)(Wxfxt+Whfht-1+Wcfct-1+bf)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911381924.XA CN111144552B (zh) | 2019-12-27 | 2019-12-27 | 一种粮食品质多指标预测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911381924.XA CN111144552B (zh) | 2019-12-27 | 2019-12-27 | 一种粮食品质多指标预测方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111144552A true CN111144552A (zh) | 2020-05-12 |
CN111144552B CN111144552B (zh) | 2023-04-07 |
Family
ID=70521188
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911381924.XA Active CN111144552B (zh) | 2019-12-27 | 2019-12-27 | 一种粮食品质多指标预测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111144552B (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112232595A (zh) * | 2020-11-06 | 2021-01-15 | 河南工业大学 | 基于ipso-svm模型的储藏小麦品质预测方法 |
CN112395753A (zh) * | 2020-11-11 | 2021-02-23 | 中国农业大学 | 定向调控稻谷品质的干燥方法、装置、设备及储存介质 |
CN113177578A (zh) * | 2021-04-06 | 2021-07-27 | 安徽农业大学 | 一种基于lstm的农产品品质分类方法 |
CN113269259A (zh) * | 2021-05-31 | 2021-08-17 | 北京邮电大学 | 一种目标信息的预测方法及装置 |
CN113361768A (zh) * | 2021-06-04 | 2021-09-07 | 重庆科技学院 | 一种粮食库健康状况预测方法,存储设备及服务器 |
WO2022032874A1 (zh) * | 2020-08-14 | 2022-02-17 | 贵州东方世纪科技股份有限公司 | 一种基于对抗神经网络的有资料地区水文参数率定方法 |
CN118505095A (zh) * | 2024-07-17 | 2024-08-16 | 佛山市持信数据服务有限公司 | 一种送检水样的监测方法、装置、电子设备及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180137412A1 (en) * | 2016-11-16 | 2018-05-17 | Cisco Technology, Inc. | Network traffic prediction using long short term memory neural networks |
CN109002917A (zh) * | 2018-07-13 | 2018-12-14 | 山东省农业信息中心 | 基于lstm神经网络的粮食总产量多维时间序列预测方法 |
CN109670036A (zh) * | 2018-12-17 | 2019-04-23 | 广州大学 | 一种新闻评论自动生成方法及其装置 |
-
2019
- 2019-12-27 CN CN201911381924.XA patent/CN111144552B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180137412A1 (en) * | 2016-11-16 | 2018-05-17 | Cisco Technology, Inc. | Network traffic prediction using long short term memory neural networks |
CN109002917A (zh) * | 2018-07-13 | 2018-12-14 | 山东省农业信息中心 | 基于lstm神经网络的粮食总产量多维时间序列预测方法 |
CN109670036A (zh) * | 2018-12-17 | 2019-04-23 | 广州大学 | 一种新闻评论自动生成方法及其装置 |
Non-Patent Citations (1)
Title |
---|
赵岩;周俊冬;任双双;: "基于深度学习算法的粮堆温度预测研究" * |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022032874A1 (zh) * | 2020-08-14 | 2022-02-17 | 贵州东方世纪科技股份有限公司 | 一种基于对抗神经网络的有资料地区水文参数率定方法 |
CN112232595A (zh) * | 2020-11-06 | 2021-01-15 | 河南工业大学 | 基于ipso-svm模型的储藏小麦品质预测方法 |
CN112232595B (zh) * | 2020-11-06 | 2023-02-14 | 河南工业大学 | 基于ipso-svm模型的储藏小麦品质预测方法 |
CN112395753A (zh) * | 2020-11-11 | 2021-02-23 | 中国农业大学 | 定向调控稻谷品质的干燥方法、装置、设备及储存介质 |
CN112395753B (zh) * | 2020-11-11 | 2021-10-29 | 中国农业大学 | 定向调控稻谷品质的干燥方法、装置、设备及储存介质 |
CN113177578A (zh) * | 2021-04-06 | 2021-07-27 | 安徽农业大学 | 一种基于lstm的农产品品质分类方法 |
CN113269259A (zh) * | 2021-05-31 | 2021-08-17 | 北京邮电大学 | 一种目标信息的预测方法及装置 |
CN113361768A (zh) * | 2021-06-04 | 2021-09-07 | 重庆科技学院 | 一种粮食库健康状况预测方法,存储设备及服务器 |
CN118505095A (zh) * | 2024-07-17 | 2024-08-16 | 佛山市持信数据服务有限公司 | 一种送检水样的监测方法、装置、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN111144552B (zh) | 2023-04-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111144552B (zh) | 一种粮食品质多指标预测方法及装置 | |
CN109002686B (zh) | 一种自动生成样本的多牌号化工过程软测量建模方法 | |
CN113723007B (zh) | 基于drsn和麻雀搜索优化的设备剩余寿命预测方法 | |
CN113505477B (zh) | 基于svae-wgan的过程工业软测量数据补充方法 | |
CN112557034B (zh) | 一种基于pca_cnns的轴承故障诊断方法 | |
CN111461463A (zh) | 一种基于tcn-bp的短期负荷预测方法、系统及设备 | |
CN112686372A (zh) | 基于深度残差gru神经网络的产品性能预测方法 | |
CN116562908A (zh) | 一种基于双层vmd分解和ssa-lstm的电价预测方法 | |
CN112257847A (zh) | 一种基于CNN和LSTM预测地磁Kp指数的方法 | |
CN112287592A (zh) | 一种基于深度置信网络的工业设备故障诊断方法及系统 | |
CN115982141A (zh) | 一种针对时序数据预测的特征优化方法 | |
CN115096357A (zh) | 一种基于ceemdan-pca-lstm的室内环境质量预测方法 | |
Urgun et al. | Composite power system reliability evaluation using importance sampling and convolutional neural networks | |
Phan et al. | Efficiency enhancement of evolutionary neural architecture search via training-free initialization | |
Zhao et al. | Remaining useful life prediction method based on convolutional neural network and long short-term memory neural network | |
CN113033898A (zh) | 基于k均值聚类与bi-lstm神经网络的电负荷预测方法及系统 | |
CN116933025A (zh) | 基于vmd与dbo-lstm-at的变压器顶层油温预测方法 | |
CN116865255A (zh) | 基于改进熵权法和seceemd的短期风电功率预测方法 | |
CN110728292A (zh) | 一种多任务联合优化下的自适应特征选择算法 | |
CN116596396A (zh) | 一种基于k近邻插值和slstm的工业聚乙烯过程质量预测方法 | |
CN110991604A (zh) | 一种基于小波循环神经网络的时序金融数据预测方法 | |
CN115759343A (zh) | 一种基于e-lstm的用户电量预测方法和装置 | |
CN113887570B (zh) | 一种基于神经网络的太阳耀斑二分类预测方法 | |
CN115481715A (zh) | 一种基于am-gru-bpnn的产品质量指标预测方法、系统 | |
CN115016275A (zh) | 智能化饲喂与畜禽舍大数据物联网系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |