CN115409252A - 基于lstm的植物生长数据多步预测方法、装置、介质及设备 - Google Patents
基于lstm的植物生长数据多步预测方法、装置、介质及设备 Download PDFInfo
- Publication number
- CN115409252A CN115409252A CN202211019093.3A CN202211019093A CN115409252A CN 115409252 A CN115409252 A CN 115409252A CN 202211019093 A CN202211019093 A CN 202211019093A CN 115409252 A CN115409252 A CN 115409252A
- Authority
- CN
- China
- Prior art keywords
- lstm
- plant growth
- data
- step prediction
- training
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000008635 plant growth Effects 0.000 title claims abstract description 89
- 238000000034 method Methods 0.000 title claims abstract description 42
- 238000012549 training Methods 0.000 claims abstract description 49
- 230000007246 mechanism Effects 0.000 claims abstract description 27
- 238000006243 chemical reaction Methods 0.000 claims abstract description 23
- 230000009131 signaling function Effects 0.000 claims abstract description 16
- 239000013598 vector Substances 0.000 claims description 26
- 238000005070 sampling Methods 0.000 claims description 19
- 238000004590 computer program Methods 0.000 claims description 17
- 230000015654 memory Effects 0.000 claims description 15
- 238000013528 artificial neural network Methods 0.000 claims description 13
- 230000009466 transformation Effects 0.000 claims description 9
- 239000002356 single layer Substances 0.000 claims description 8
- 238000001914 filtration Methods 0.000 claims description 5
- 230000006870 function Effects 0.000 description 24
- 230000008569 process Effects 0.000 description 8
- 238000004364 calculation method Methods 0.000 description 7
- 239000010410 layer Substances 0.000 description 7
- 238000012545 processing Methods 0.000 description 7
- 210000004027 cell Anatomy 0.000 description 6
- 238000013507 mapping Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 239000000284 extract Substances 0.000 description 4
- 230000007774 longterm Effects 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 238000000354 decomposition reaction Methods 0.000 description 3
- 238000009499 grossing Methods 0.000 description 3
- 241000196324 Embryophyta Species 0.000 description 2
- 230000004913 activation Effects 0.000 description 2
- 239000000654 additive Substances 0.000 description 2
- 230000000996 additive effect Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000010365 information processing Effects 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000012731 temporal analysis Methods 0.000 description 2
- 238000000700 time series analysis Methods 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 238000003915 air pollution Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000001149 cognitive effect Effects 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000002059 diagnostic imaging Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000010355 oscillation Effects 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/02—Agriculture; Fishing; Forestry; Mining
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- Tourism & Hospitality (AREA)
- Theoretical Computer Science (AREA)
- Marketing (AREA)
- General Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Quality & Reliability (AREA)
- Animal Husbandry (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Entrepreneurship & Innovation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Agronomy & Crop Science (AREA)
- Development Economics (AREA)
- Marine Sciences & Fisheries (AREA)
- Mining & Mineral Resources (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请涉及基于LSTM的植物生长数据多步预测方法、装置、介质及设备,其中方法包括:获取植物生长的时间序列数据;采用signal函数对所述时间序列数据进行波长转换,得到重构时间序列数据;通过所述重构时间序列数据对基于LSTM的编码器和解码器进行预训练,得到输入特征;以所述输入特征训练融入注意力机制的LSTM,基于训练完成的LSTM对植物生长数据进行多步预测。通过对时间序列数据进行波长转换,能对时间序列数据起到去噪作用。而且对基于LSTM的编码器和解码器的预训练,提取重构时间序列数据中适当的特征作为输入特征,通过输入特征对LSTM模型进行训练,能较好的使得注意力机制融入LSTM模型,缩小LSTM多步预测的误差,提升植物生长数据多步预测的准确性。
Description
技术领域
本申请涉及智能农业技术领域,具体涉及基于LSTM的植物生长数据多步预测方法、装置、介质及设备。
背景技术
长短期记忆网络(Long Short-Term Memory,LSTM)是一种时间循环神经网络,是为了解决一般的RNN(循环神经网络)存在的长期依赖问题而专门设计出来的,所有的RNN都具有一种重复神经网络模块的链式形式。在标准RNN中,这个重复的结构模块只有一个非常简单的结构,例如一个tanh层。
时间序列分析和预测一直是各个领域和实际应用中具有重要意义的研究课
题,包括智能农业和植物生长预测、金融存量预测、异常或入侵预测、检测、医学成像和空气污染预测。时间序列数据通常是按时间顺序聚合的一系列观测数据。它们的复杂性通常相当高,这使得它们的分析成为一项非常具有挑战性的任务。由于这种性质,使用浅层机器学习和神经网络模型来分析数据产生了
许多瓶颈。因此,开发和使用更复杂的模型,可以自动从时间序列或图像数据
中提取和学习深度表示,已成为当前研究的重点。
相关技术中,对于植物生长的短期预测通常采用单步预测,而对于植物生长的长期预测通常采用多步预测,因为多步预测可以预测未来多个时间步的植物生长数据。在许多实际问题中,在对复杂多时期的植物生长数据预测中,多步预测对于时间序列的分析则显得尤为重要。
针对上述中的相关技术,发明人认为存在有以下缺陷:虽然在植物生长预测方面,多步预测能预测多步,但是预测的误差也会因预测步数的增加而积累,最终导致多步预测的结果准确性降低。
发明内容
为了缩减多步预测的误差,提升多步预测的结果准确性,本申请提供基于LSTM的植物生长数据多步预测方法、装置、介质及设备。
在本申请的第一方面提供了基于LSTM的植物生长数据多步预测方法,具体包括:
获取植物生长的时间序列数据;
采用signal函数对所述时间序列数据进行波长转换,得到重构时间序列数据;
通过所述重构时间序列数据对基于LSTM的编码器和解码器进行预训练,得到输入特征;
以所述输入特征训练融入注意力机制的LSTM,基于训练完成的LSTM对植物生长数据进行多步预测。
通过采用上述技术方案,使用signal函数对时间序列数据进行处理,能对时间序列数据进行信号分解、处理和重构,实现波长转换。而且对基于LSTM的编码器和解码器的预训练,提取重构时间序列数据中的特征作为输入特征,通过输入特征对LSTM模型进行训练,能较好的使得注意力机制融入LSTM模型,缩小LSTM多步预测的误差,提升植物生长数据多步预测的准确性。
可选的,所述采用signal函数对所述时间序列数据进行波长转换,得到重构时间序列数据,包括:
采用小波变换对所述时间序列数据进行表示,得到表示结果;
将所述表示结果分解为低频近似集与高频细节集,所述高频细节集包括至少一个高频分量;
对所述高频分量滤波处理,对所述低频近似集与滤波处理后的所述高频细节集二次采样,获得重构时间序列数据。
通过采用上述技术方案,通过小波变换对时间序列数据进行表示、分解和重构,接着对表示结果分解为低频近似集与高频细节集,接着对高频分量中的噪声对应的特定波段频率进滤除,从而使得对整个时间序列数据的去噪以及非平稳性质的处理,接着对分解的时间序列数据进行二次采样,重新恢复时间序列数据,从而得到重构时间序列数据。
可选的,所述二次采样的采样频率设置为2倍。
通过采用上述技术方案,如果采样频率少于2倍的信号频率时,会导致原来的时间序列数据的高频信号被采集成低频信号,可能导致重构时间序列数据的信号较原来的时间序列数据的信号发生偏差,将采样频率设置为2倍,能使得采样频率较为合理,进而使得重构时间序列数据与原来的时间序列数据偏差较小。
可选的,所述通过所述重构时间序列数据对基于LSTM的编码器和解码器进行预训练,得到输入特征,包括:
对基于LSTM的编码器和解码器进行预训练,从所述重构时间序列数据中提取嵌入内容;
将所述嵌入内容作为输入特征。
通过采用上述技术方案,将重构时间序列数据作为输入编码器中包含的各个LSTM单元,接着由编码器统一输出传递到解码器,通过此预训练过程提取重构时间序列数据中有用且具有代表性的嵌入内容,最终将嵌入内容作为LSTM模型的输入特征,以便后续通过输入特征对LSTM模型进行训练。
可选的,所述通过所述重构时间序列数据对基于LSTM的编码器和解码器进行预训练,得到输入特征之后,包括:
通过LSTM的编码器将所述重构时间序列数据压缩到由LSTM隐藏状态序列组成的向量中;
将所述重构时间序列数据作为区间状态向量传递至LSTM的解码器。
通过采用上述技术方案,基于LSTM的编码器能够对重构时间序列数据中的特征进行提取,接着将其编码压缩为一个LSTM隐藏状态序列中的一个向量表示,将多个向量作为区间状态向量发送至LSTM的解码器,解码器根据特征对应的向量,学习到编码器提取的特征,最终根据特征生成完整时间序列预测结果,从而增强编码器和解码器之间的相关性,得到收敛状态较好的预训练模型,进而通过预训练初始化LSTM模型的全部参数,使得其在初始阶段具备植物生长数据的预测能力。
可选的,所述以所述输入特征训练融入注意力机制的LSTM,基于训练完成的LSTM对植物生长数据进行多步预测,包括:
通过所述输入特征使LSTM生成学习的嵌入状态;
计算得到嵌入状态相对应的注意力权重;
基于所述注意力权重,在LSTM中融入注意力机制;
由LSTM的单层神经网络输出植物生长数据值,以使得对植物生长数据进行多步预测。
通过采用上述技术方案,通过输入特征对LSTM模型进行训练,使得LSTM模型学习到嵌入状态,接着采用注意力权重计算公式,计算出嵌入状态对应的注意力权重,将注意力权重分配给输入特征,为输入特征进行注意力加权,从而使得LSTM模型各个部分形成长期性依赖,从而训练得到一个具有注意力机制的LSTM模型,由LSTM的单层神经网络计算输出植物生长数据值,进而使得LSTM多步预测的结果较为准确。
在本申请的第二方面提供了基于LSTM的植物生长数据多步预测装置,具体包括:
数据获取模块,用于获取植物生长的时间序列数据;
波长转换模块,用于采用signal函数对所述时间序列数据进行波长转换,得到重构时间序列数据;
特征获取模块,用于通过所述重构时间序列数据对基于LSTM的编码器和解码器进行预训练,得到输入特征;
训练预测模块,用于将所述输入特征训练融入注意力机制的LSTM,基于训练完成的LSTM对植物生长数据进行多步预测。
通过采用上述技术方案,数据获取模块获取到植物生长不同时刻的时间序列数据,波长转换模块将时间序列数据进行去噪和非平稳性质的处理,得到重构时间序列数据,从而提升时间序列数据的准确性,接着将重构时间序列数据输入到基于LSTM的编码器和解码器进行预训练,提取到重构时间序列数据中有用的特征作为输入特征,最后训练预测模块通过注意力机制为输入特征分配注意力权重以进行最终预测,从而实现缩小多步预测的误差,提升LSTM植物生长数据多步预测的准确性。
综上所述,本申请包括以下至少一种有益技术效果:
1.对时间序列数据进行波长转换,能对时间序列数据起到去噪作用,减少时间序列数据存在的误差对应模型精度的影响,提升预测结果的准确性,而且对基于LSTM的编码器和解码器的预训练,提取重构时间序列数据中适当的特征作为输入特征,通过输入特征对LSTM模型进行训练,能较好的使得注意力机制融入LSTM模型,缩小LSTM多步预测的误差,提升植物生长数据多步预测的准确性;
2.通过输入特征对LSTM模型进行训练,使得LSTM模型学习到嵌入状态,接着采用注意力权重计算公式,计算出嵌入状态对应的注意力权重,将注意力权重分配给输入特征,为输入特征进行注意力加权,从而使得LSTM模型各个部分形成长期性依赖,从而训练得到一个具有注意力机制的LSTM模型,进而使得LSTM多步预测的结果较为准确。
附图说明
图1是本申请实施例提供的一种基于LSTM的植物生长数据多步预测方法的流程示意图;
图2是本申请实施例提供的一种基于LSTM的植物生长数据多步预测方法的注意力机制示意图;
图3是本申请实施例提供的另一种基于LSTM的植物生长数据多步预测方法的流程示意图;
图4是本申请实施例提供的一种基于LSTM的编码器和解码器的流程示意图;
图5是本申请实施例提供的一种softmax函数求解示意图;
图6是本申请实施例提供的一种基于LSTM的植物生长数据多步预测装置的结构示意图;
图7是本申请实施例提供的另一种基于LSTM的植物生长数据多步预测装置的结构示意图。
附图标记说明:11、数据获取模块;12、波长转换模块;13、特征获取模块;14、训练预测模块。
具体实施方式
为了使本技术领域的人员更好地理解本说明书中的技术方案,下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。
在本申请实施例的描述中,“示性的”、“例如”或者“举例来说”等词用于表示作例子、例证或说明。本申请实施例中被描述为“示性的”、“例如”或者“举例来说”的任何实施例或设计方案不应被解释为比其它实施例或设计方案更优选或更具优势。确切而言,使用“示性的”、“例如”或者“举例来说”等词旨在以具体方式呈现相关概念。
在本申请实施例的描述中,术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,单独存在B,同时存在A和B这三种情况。另外,除非另有说明,术语“多个”的含义是指两个或两个以上。例如,多个系统是指两个或两个以上的系统,多个屏幕终端是指两个或两个以上的屏幕终端。此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”,除非是以其他方式另外特别强调。
参见图1,本申请实施例公开了一种基于LSTM的植物生长数据多步预测方法的流程示意图,可依赖于计算机程序实现,也可运行于基于冯诺依曼体系的基于LSTM的植物生长数据多步预测装置上。该计算机程序可集成在应用中,也可作为独立的工具类应用运行,具体包括:
S101:获取植物生长的时间序列数据。
具体的,在本申请实施例中,时间序列数据为在不同时间上收集的数据,用于所描述现象随时间变化的情况。这类数据反映了某一事物、现象等随时间的变化状态或程度。时间序列数据可分为平稳过程、去趋势平稳过程以及差分平稳过程等等很多种类。植物生长的时间序列数据则为不同时间反映植物生长动态的数据,例如不同时间内植物茎的直径变化值。与其他生物系统一样,植物生长为高度复杂和动态的系统,因此植物生长的时间序列数据变化很大,复杂性较高,也就需要更为复杂的深度学习模型来支撑,而时间序列数据作为模型的输入,对于预测分析十分重要。需要说明的是,获取植物生长的时间序列数据的方式为接收外部终端输入的数据,外部终端为计算机或手机。
S102:采用signal函数对时间序列数据进行波长转换,得到重构时间序列数据。
具体的,通常情况下,采用单步时间序列实现从时间序列数据映射到单个输出目标值,较难映射到多个输出目标值。具体表述如下:𝑡+1=𝑇(𝑥0……𝑥𝑡),其中,𝑇为单步时间序列预测𝑇模型,输入的𝑥0……𝑥𝑡为原始的时间序列数据,起到映射到各输出目标值𝑡+1的作用。本申请实施例中实现多步预测,则从时间序列数据映射到多个输出目标值来实现,具体表述如下:𝑡+1……𝑡+k)=𝑇(𝑥0……𝑥𝑡)。其中,输入的𝑥0……𝑥𝑡为原始的时间序列数据,通过此模型𝑇(也就是基于LSTM的模型),从而起到映射到对应的多个输出目标值𝑡+1……𝑡+k的作用,进而使得模型能进行多步预测。需要说明的是,本申请实施例采用signal函数,即信号处理函数。signal函数对时间序列数据的处理体现在:对输入的时间序列数据进行信号分解和重构实现波长转换,最终得到重构时间序列数据,其中波长转换为信号波长的变换。如图2所示,为本申请实施例公开的一种基于LSTM的植物生长数据多步预测方法的注意力机制示意图,由图可看出,时间序列数据输入到signal函数,其中包含信号的分解和重构过程,signal函数输出重构时间序列数据。
S103:通过重构时间序列数据对基于LSTM的编码器和解码器进行预训练,得到输入特征。
具体的,在本申请实施例中,预训练指使用尽可能多的训练数据,从中提取出尽可能多的共性特征,从而让模型对特定任务的学习负担变轻。编码器和解码器为采用LSTM开发的编码器-解码器框架,编码器和解码器中包括至少一个LSTM单元。重构时间序列数据输入到编码器,编码器提取重构时间序列数据中的特征作为输入特征,将该特征传递给解码器,解码器学习适当特征生成预测结果。通过预训练的方式将编码器与解码器建立联系,增加编码器与解码器的相关性,得到收敛状态较好的预训练模型,最终使用预训练模型的参数初始化LSTM模型的参数,LSTM模型无需从零开始学习,便能较好的提高模型的收敛速度和多步预测的结果的准确性。
S104:以输入特征训练融入注意力机制的LSTM,基于训练完成的LSTM对植物生长数据进行多步预测。
具体的,在本申请实施例中,注意力机制源于对人类视觉的研究。在认知科学中,由于信息处理的瓶颈,人类会选择性地关注所有信息的一部分,同时忽略其他可见的信息。上述机制通常被称为注意力机制。注意力机制主要有两个方面:决定需要关注输入的哪部分;分配有限的信息处理资源给重要的部分。将编码器提取得到的输入特征对LSTM进行训练,得到训练完成的LSTM模型,同时将注意力机制融入到LSTM中。融入的具体方式为:注意力机制获取不同输入特征的注意力权重,根据注意力权重,给不同输入特征分配与注意力权重对应的注意力,从而使得LSTM能对植物生长数据做出准确的多步预测。
参见图3,本申请实施例公开了另一基于LSTM的植物生长数据多步预测方法的流程示意图,可依赖于计算机程序实现,也可运行于基于冯诺依曼体系的LSTM植物生长数据多步预测装置上。该计算机程序可集成在应用中,也可作为独立的工具类应用运行,具体包括:
S201:获取植物生长的时间序列数据。
具体的,具体可参考S101步骤,在此不做赘述。
S202:采用小波变换对时间序列数据进行表示,得到表示结果;
S203:将表示结果分解为低频近似集与高频细节集,高频细节集包括至少一个高频分量;
S204:对高频分量滤波处理后,对低频近似集与滤波处理后的高频细节集二次采样,获得重构时间序列数据,二次采样的采样频率设置为2倍。
具体的,对时间序列数据进波长转换主要涉及对原始的时间序列数据的表示、分解和重构,首先采用小波函数对时间序列数据进行表示,小波函数又称凌波函数、小波分析或小波变换、小波转换,指用有限长或快速衰减的、为母小波的震荡波形来表示信号;接着采用离散小波变换将表示结果进行分解,得到低频近似集和高频细节集。
离散小波变换(DiscreteWavelet Transform,DWT),是对基本小波的尺度和平移进行离散化。在图像处理中,常采用二进小波作为小波变换函数,即使用2的整数次幂进行划分。低频近似集为低频信号的合集,高频细节集为高频信号的合集。离散小波变换通过一对低通滤波器和高通滤波器来实现离散小波变换。其中,低通滤波器可以将输入信号的高频部分滤掉而输出低频部分,高通滤波器可以滤掉低频部分而输出高频部分,低通滤波器即尺度函数,高通滤波器即小波函数。其中,尺度函数形成的子空间对小波变换来说是非常重要的性质,子空间为维度小于等于全部空间的部分空间。需要说明的是,小波函数与尺度函数均属于signal函数(信号处理函数)。
具体公式表示如下:
原始的时间序列数据,表示为𝑋=[𝑥0……𝑥𝑛−1],𝑁=2𝑗。
其中𝑗=0,1,……𝑗−1;𝑘=0,1,𝑁−1;𝑛=0,1,……2𝑗−1,𝜑、𝛾分别表示小波函
数和尺度函数。
由于噪声分量主要集中在高频分量中,高频分量指信号里频率比较高的有用信号,一般是低频信号频率的整数倍。因此对高频分量中存在的噪声分量通过滤波器进行滤除。最后通过二次采样的方式,对低频近似集和去噪后的高频细节集二次采样,进行重构得到重构时间序列数据,从而使得对原始的时间序列数据的重建,实现对时间序列数据的去噪。其中,二次采样的采样频率设置为2倍的合理频率,从而使得重构时间序列数据与原始的时间序列数据偏差较小,如果采样频率少于2倍时,会导致原本的高频信号被采样成低频信号。
S205:对基于LSTM的编码器和解码器进行预训练,从重构时间序列数据中提取嵌入内容;
S206:将嵌入内容作为输入特征。
S207:通过LSTM的编码器将输入特征压缩到由LSTM隐藏状态序列组成的向量中,并汇总为区间状态向量。
S208:将区间状态向量传递至LSTM的解码器。
具体的,如图4所示,首先通过重构时间序列数据对基于LSTM的编码器进行预训练,其中,基于LSTM的编码器中包括至少一个LSTM单元,编码器从重构时间序列中提取有用且具有代表性的嵌入内容,其中,有用且具有代表性的嵌入内容指的是重构时间序列中有用的特征。将这些嵌入内容作为输入特征,接着对输入特征进行编码,将输入特征压缩为对应的向量,并添加至LSTM隐藏状态序列组成的向量中,隐藏状态相当于神经网络记忆,它包含相关网络之前所见过的数据的信息。最后将所有输入特征对应的向量汇总为区间状态向量,区间状态由多个LSTM单元状态信息组成。将区间状态向量发送至基于LSTM的解码器,其中,基于LSTM的解码器中同样包括至少一个LSTM单元,解码器根据编码器提取的输入特征对应的向量,学习到编码器提取的输入特征,进而学习到如何生成不同时间的植物生长数据,实现植物生长数据的多步预测的效果。同时得到了收敛状态较好的预训练模型,根据预训练模型的参数初始化基于LSTM的模型参数,从而使其多步预测精准度得到提升。
需要说明的是,编码器和解码器中的多个LSTM单元,LSTM单元内部还存在隐藏状态ℎ𝑡和存储单元状态𝑐𝑡。LSTM单元包括三个控制门,分别是输入门𝑖𝑡、遗忘门𝑓𝑡和输出门𝑜𝑡,输入门𝑖𝑡控制当前时刻的候选状态有多少信息需要保存,遗忘门𝑓𝑡控制上一个时刻的内部状态需要遗忘多少信息,输出门𝑜𝑡控制当前时刻的内部状态有多少信息需要输出给外部状态。
LSTM单元的输入输出操作需要设置设𝑖𝑡和𝑐𝑡,其分别为:
输入门和存储单元在时间t的候选状态的值。计算如下:
𝑖𝑡=𝜎(𝑊𝑖𝑥𝑡+𝑈𝑖ℎ𝑡−1+𝑏𝑖);
设𝑓𝑡和𝑐𝑡分别表示遗忘门的值和时间t时存储单元的状态。计算如下:
𝑓𝑡=𝜎(𝑊𝑓𝑥𝑡+𝑈𝑓ℎ𝑡−1+𝑏𝑓);
设𝑜𝑡和ℎ𝑡分别表示时间t时输出门和存储单元的值。计算如下:
𝑜𝑡=𝜎(𝑊𝑜𝑥𝑡+𝑈𝑜ℎ𝑡−1+𝑉𝑜𝑐𝑡+𝑏𝑜);
ℎ𝑡=𝑜𝑡∗𝑡ℎ𝑎𝑛(𝑐𝑡)𝑥𝑡是t时刻存储单元的输入向量,𝑊𝑖、𝑊𝑓、𝑊𝑐、𝑊𝑜、𝑈𝑖、𝑈𝑓、𝑈𝑐、𝑈𝑜和𝑉𝑜是权重矩阵。𝑏𝑖、𝑏𝑓、𝑏𝑐、𝑏𝑜是偏差变量。σ为Sigmoid激活函数层。𝑡𝑎𝑛ℎ为激活函数,𝑡𝑎𝑛ℎ为双曲函数中的一个,tanh()为双曲正切。
具体的,首先通过遗忘门决定单元状态哪些信息被抛弃,旧状态𝑐𝑡−1乘以𝑓𝑡,再加上新的候选状态的值𝑖𝑡∗ t就得到了新的状态𝑐𝑡,最后到输出门𝑜𝑡控制输出阶段,通过ℎ𝑡=𝑜𝑡∗𝑡ℎ𝑎𝑛(𝑐𝑡)𝑥𝑡,得到最终的输出。需要说明的是,此部分为现有技术,在此不再赘述。
S209:通过输入特征使LSTM生成学习的嵌入状态。
S210:计算得到嵌入状态相对应的注意力权重。
S211:基于注意力权重,在LSTM中融入注意力机制。
S212:由LSTM的单层神经网络输出植物生长数据值,以使得对植物生长数据进行多步预测。
具体的,将提取到的输入特征输入到LSTM内部层,通过转移函数(h1……hn)生成学习的嵌入状态,其中嵌入状态为模型学习到输入特征后的状态。如图5所示,接着计算嵌入状态对应的注意力权重,具体如下公式表述:
𝑒𝑡=𝑉T∙𝑡𝑎𝑛ℎ(𝑊𝑒∙ℎ𝑡+𝑈𝑒∙d𝑡−1+𝑏),需要说明的是,注意力机制融入从计算𝑒𝑡开始,此公式为该模型使用的注意力打分公式,注意力打分公式具体采用加性模型。当线性模型的种种条件不能满足时,考虑使用平滑性模型来替代,平滑性模型对非线性关系建模,也被成为加性模型;
其中,V是指一些键值矩阵,在本申请实施例中为LSTM输出状态特征矩阵,𝑉T则为V的转置。𝑏为偏置矢量。ℎ𝑡为t状态下的学习到的嵌入状态。其余参数为权重矩阵。
𝑒𝑡计算出来后,再使用softmax函数计算每个时刻的注意力分数,。需要说明的是,softmax函数又称归一化函数,它是二分类函数sigmoid在多分类上推广,目前是将多分类的结果以概率的形式展现出来。
接着通过公式计算注意力权重:𝐶𝑡=,需要说明的是,注意力机制为将注意力集中在重要的信息上,忽略不重要的信息。注意力机制的本质是对特征分配注意力权重的过程。在本申请实施例中,通过上述公式计算获取到输入特征被分配的注意力权重。
最后就是由LSTM的单层神经网络输出植物生长数据值,单层神经网络为神经网络的输入层、输出层和中间层中的一层。在本申请实施例中单层神经网络为模型的输出层,植物生长数据值采用植物茎的直径变化值(Stem Diameter Variations,SDV),在其他实施例中也可采用其他的植物生长数据。具体通过如下公式进行结果的计算:
ℎ𝑠=𝑡𝑎𝑛ℎ(𝑊𝑝𝐶+𝑊𝑥ℎ𝑛);
其中,𝑊𝑝、𝑊𝑥、𝑊𝑠为权重矩阵,𝑏𝑠为偏置矢量,𝐶为上文计算出来的注意力权重,ℎ𝑠是(h1……hn)从状态1到状态n预测结果的输出门输出的神经元状态结果,参数的下标是表示状态,下标s表示结束状态。通过此公式,得出SDV值的最终预测,从而使得LSTM的多步预测结果的得出。
本申请实施例基于LSTM的植物生长数据多步预测方法的实施原理为:获取到不同时间的植物生长的时间序列数据后,经由小波变换对时间序列数据进行表示,通过离散小波变换将其分解为低频近似集和高频细节集,并对高频分量中的噪声分量进行滤波处理。接着进行二次采样,得到重构时间序列数据。将重构时间序列数据输入到基于LSTM的编码器中,编码器从重构时间序列数据提取输入特征,将输入特征编码为向量发送至基于LSTM的解码器进行预训练。最后通过输入特征对融入注意力机制的LSTM进行训练,基于训练完成的LSTM对植物生长数据进行多步预测。
下述为本申请装置实施例,可以用于执行本申请方法实施例。对于本申请装置实施例中未披露的细节,请参照本申请方法实施例。
请参见图6,为本申请实施例提供的基于LSTM的植物生长数据多步预测装置的结构示意图。该植物生长数据多步预测装置可以通过软件、硬件或者两者的结合实现成为装置的全部或一部分。该装置1包括数据获取模块11、波长转换模块12、特征获取模块13和训练预测模块14。
数据获取模块11,用于获取植物生长的时间序列数据;
波长转换模块12,用于采用signal函数对时间序列数据进行波长转换,得到重构时间序列数据;
特征获取模块13,用于通过重构时间序列数据对基于LSTM的编码器和解码器进行预训练,得到输入特征;
训练预测模块14,用于将输入特征训练融入注意力机制的LSTM,基于训练完成的LSTM对植物生长数据进行多步预测。
可选的,如图6所示,波长转换模块12,具体用于:
采用小波变换对时间序列数据进行表示,得到表示结果;
将表示结果分解为低频近似集与高频细节集,高频细节集包括至少一个高频分量;
对高频分量滤波处理,对低频近似集与滤波处理后的高频细节集二次采样,获得重构时间序列数据。
可选的,如图6所示,特征获取模块13,具体用于:
对基于LSTM的编码器和解码器进行预训练,从重构时间序列数据中提取嵌入内容;
将嵌入内容作为输入特征。
可选的,如图7所示,装置1还包括:
编码模块15,用于通过LSTM的编码器将输入特征压缩到由LSTM隐藏状态序列组成的向量中,并汇总为区间状态向量;
解码模块16,用于将区间状态向量传递至LSTM的解码器。
可选的,如图6所示,训练预测模块14,具体用于:
通过输入特征使LSTM生成学习的嵌入状态;
计算得到嵌入状态相对应的注意力权重;
基于注意力权重,在LSTM中融入注意力机制;
由LSTM的单层神经网络输出植物生长数据值,以使得对植物生长数据多步预测。
需要说明的是,上述实施例提供的基于LSTM的植物生长数据多步预测装置在执行基于LSTM的植物生长数据多步预测方法时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的基于LSTM的植物生长数据多步预测装置与基于LSTM的植物生长数据多步预测方法实施例属于同一构思,其体现实现过程详见方法实施例,这里不再赘述。
本申请实施例还公开一种计算机可读存储介质,并且,计算机可读存储介质存储有计算机程序,其中,计算机程序被处理器执行时,采用了上述实施例的基于LSTM的植物生长数据多步预测方法。
其中,计算机程序可以存储于计算机可读介质中,计算机程序包括计算机程序代码,计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间件形式等,计算机可读介质包括能够携带计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM)、随机存取存储器(RAM)、电载波信号、电信信号以及软件分发介质等,需要说明的是,计算机可读介质包括但不限于上述元器件。
其中,通过本计算机可读存储介质,将上述实施例的基于LSTM的植物生长数据多步预测方法存储于计算机可读存储介质中,并且,被加载并执行于处理器上,以方便上述方法的存储及应用。
本申请实施例还公开一种电子设备,计算机可读存储介质中存储有计算机程序,计算机程序被处理器加载并执行时,采用了上述基于LSTM的植物生长数据多步预测方法。
其中,电子设备可以采用台式电脑、笔记本电脑或者云端服务器等电子设备,并且,电子设备包括但不限于处理器以及存储器,例如,电子设备还可以包括输入输出设备、网络接入设备以及总线等。
其中,处理器可以采用中央处理单元(CPU),当然,根据实际的使用情况,也可以采用其他通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等,通用处理器可以采用微处理器或者任何常规的处理器等,本申请对此不做限制。
其中,存储器可以为电子设备的内部存储单元,例如,电子设备的硬盘或者内存,也可以为电子设备的外部存储设备,例如,电子设备上配备的插接式硬盘、智能存储卡(SMC)、安全数字卡(SD)或者闪存卡(FC)等,并且,存储器还可以为电子设备的内部存储单元与外部存储设备的组合,存储器用于存储计算机程序以及电子设备所需的其他程序和数据,存储器还可以用于暂时地存储已经输出或者将要输出的数据,本申请对此不做限制。
其中,通过本电子设备,将上述实施例的基于LSTM的植物生长数据多步预测方法存储于电子设备的存储器中,并且,被加载并执行于电子设备的处理器上,方便使用。
以上所述者,仅为本公开的示例性实施例,不能以此限定本公开的范围。即但凡依本公开教导所作的等效变化与修饰,皆仍属本公开涵盖的范围内。本领域技术人员在考虑说明书及实践这里的公开后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未记载的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的范围和精神由权利要求限定。
Claims (9)
1.基于LSTM的植物生长数据多步预测方法,其特征在于,包括:
获取植物生长的时间序列数据;
采用signal函数对所述时间序列数据进行波长转换,得到重构时间序列数据;
通过所述重构时间序列数据对基于LSTM的编码器和解码器进行预训练,得到输入特征;
以所述输入特征训练融入注意力机制的LSTM,基于训练完成的LSTM对植物生长数据进行多步预测。
2.根据权利要求1所述的基于LSTM的植物生长数据多步预测方法,其特征在于,所述采用signal函数对所述时间序列数据进行波长转换,得到重构时间序列数据,包括:
采用小波变换对所述时间序列数据进行表示,得到表示结果;
将所述表示结果分解为低频近似集与高频细节集,所述高频细节集包括至少一个高频分量;
对所述高频分量滤波处理后,对所述低频近似集与滤波处理后的所述高频细节集二次采样,获得重构时间序列数据。
3.根据权利要求2所述的基于LSTM的植物生长数据多步预测方法,其特征在于:所述二次采样的采样频率设置为2倍。
4.根据权利要求1所述的基于LSTM的植物生长数据多步预测方法,其特征在于,所述通过所述重构时间序列数据对基于LSTM的编码器和解码器进行预训练,得到输入特征,包括:
对基于LSTM的编码器和解码器进行预训练,从所述重构时间序列数据中提取嵌入内容;
将所述嵌入内容作为输入特征。
5.根据权利要求1所述的基于LSTM的植物生长数据多步预测方法,其特征在于,所述通过所述重构时间序列数据对基于LSTM的编码器和解码器进行预训练,得到输入特征之后,还包括:
通过LSTM的编码器将所述输入特征压缩到由LSTM隐藏状态序列组成的向量中,并汇总为区间状态向量;
将所述区间状态向量传递至LSTM的解码器。
6.根据权利要求1所述的基于LSTM的植物生长数据多步预测方法,其特征在于,所述以所述输入特征训练融入注意力机制的LSTM,基于训练完成的LSTM对植物生长数据进行多步预测,包括:
通过所述输入特征使所述LSTM生成学习的嵌入状态;
计算得到嵌入状态相对应的注意力权重;
基于所述注意力权重,在LSTM中融入注意力机制;
由LSTM的单层神经网络输出植物生长数据值,以使得对植物生长数据进行多步预测。
7.基于LSTM的植物生长数据多步预测装置,其特征在于,包括:
数据获取模块(11),用于获取植物生长的时间序列数据;
波长转换模块(12),采用signal函数对所述时间序列数据进行波长转换,得到重构时间序列数据;
特征获取模块(13),用于通过所述重构时间序列数据对基于LSTM的编码器和解码器进行预训练,得到输入特征;
训练预测模块(14),用于将所述输入特征训练融入注意力机制的LSTM,基于训练完成的LSTM对植物生长数据进行多步预测。
8.一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,其特征在于,所述计算机程序被处理器加载并执行时,采用了权利要求1-6中任一项所述的方法。
9.一种电子设备,包括存储器、处理器及存储在存储器中并能够在处理器上运行的计算机程序,其特征在于,所述处理器加载并执行计算机程序时,采用了权利要求1-6中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211019093.3A CN115409252A (zh) | 2022-08-24 | 2022-08-24 | 基于lstm的植物生长数据多步预测方法、装置、介质及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211019093.3A CN115409252A (zh) | 2022-08-24 | 2022-08-24 | 基于lstm的植物生长数据多步预测方法、装置、介质及设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115409252A true CN115409252A (zh) | 2022-11-29 |
Family
ID=84162704
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211019093.3A Pending CN115409252A (zh) | 2022-08-24 | 2022-08-24 | 基于lstm的植物生长数据多步预测方法、装置、介质及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115409252A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115994833A (zh) * | 2023-03-14 | 2023-04-21 | 中化现代农业有限公司 | 一种作物生长时间序列预测方法、装置及存储介质 |
CN116307266A (zh) * | 2023-05-15 | 2023-06-23 | 山东建筑大学 | 作物生长预测方法、装置、电子设备及存储介质 |
-
2022
- 2022-08-24 CN CN202211019093.3A patent/CN115409252A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115994833A (zh) * | 2023-03-14 | 2023-04-21 | 中化现代农业有限公司 | 一种作物生长时间序列预测方法、装置及存储介质 |
CN116307266A (zh) * | 2023-05-15 | 2023-06-23 | 山东建筑大学 | 作物生长预测方法、装置、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111860573B (zh) | 模型训练方法、图像类别检测方法、装置和电子设备 | |
CN109683161B (zh) | 一种基于深度admm网络的逆合成孔径雷达成像的方法 | |
CN115409252A (zh) | 基于lstm的植物生长数据多步预测方法、装置、介质及设备 | |
CN111915007B (zh) | 一种基于神经网络的磁共振谱降噪方法 | |
CN113377909B (zh) | 释义分析模型训练方法、装置、终端设备及存储介质 | |
CN116316591A (zh) | 基于混合双向门控循环的短期光伏功率预测方法及系统 | |
CN115659254A (zh) | 一种双模态特征融合的配电网电能质量扰动分析方法 | |
CN115951883A (zh) | 分布式微服务架构的服务组件管理系统及其方法 | |
CN115018170A (zh) | 一种短期风电功率预测方法、装置、设备及存储介质 | |
Pandhiani et al. | Time series forecasting by using hybrid models for monthly streamflow data | |
Asogbon et al. | GBRAMP: A generalized backtracking regularized adaptive matching pursuit algorithm for signal reconstruction | |
CN116913258B (zh) | 语音信号识别方法、装置、电子设备和计算机可读介质 | |
Ma et al. | Denoised labels for financial time series data via self-supervised learning | |
CN110705279A (zh) | 一种词汇表的选择方法、装置及计算机可读存储介质 | |
CN117079005A (zh) | 一种光缆故障监测方法、系统、装置及可读存储介质 | |
CN113850012A (zh) | 数据处理模型生成方法、装置、介质及电子设备 | |
CN117095460A (zh) | 基于长短时关系预测编码的自监督群体行为识别方法及其识别系统 | |
CN113920208A (zh) | 图像处理方法及装置、计算机可读存储介质和电子设备 | |
EP4287182A1 (en) | Method and apparatus for training a speech recognition model, electronic device and storage medium | |
Feng et al. | Spatiotemporal prediction based on feature classification for multivariate floating-point time series lossy compression | |
CN111091099A (zh) | 一种场景识别模型的构建方法、场景识别方法及设备 | |
CN113160823B (zh) | 基于脉冲神经网络的语音唤醒方法、装置及电子设备 | |
CN112836752A (zh) | 基于深度值的特征图融合的智能采样参数控制方法 | |
Suzuki et al. | Knowledge transferred fine-tuning: Convolutional neural network is born again with anti-aliasing even in data-limited situations | |
CN113627556B (zh) | 一种图像分类的实现方法、装置、电子设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |