CN115860269A - 一种基于三重注意力机制的农作物产量预测方法 - Google Patents

一种基于三重注意力机制的农作物产量预测方法 Download PDF

Info

Publication number
CN115860269A
CN115860269A CN202310136305.4A CN202310136305A CN115860269A CN 115860269 A CN115860269 A CN 115860269A CN 202310136305 A CN202310136305 A CN 202310136305A CN 115860269 A CN115860269 A CN 115860269A
Authority
CN
China
Prior art keywords
data
feature combination
nonlinear
graph
layer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310136305.4A
Other languages
English (en)
Other versions
CN115860269B (zh
Inventor
金子龙
叶文峥
马廷淮
荣欢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Information Science and Technology
Original Assignee
Nanjing University of Information Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Information Science and Technology filed Critical Nanjing University of Information Science and Technology
Priority to CN202310136305.4A priority Critical patent/CN115860269B/zh
Publication of CN115860269A publication Critical patent/CN115860269A/zh
Application granted granted Critical
Publication of CN115860269B publication Critical patent/CN115860269B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

本发明公开了智慧农业技术领域的一种基于三重注意力机制的农作物产量预测方法,解决现有方法对农作物产量预测精确度不高等技术问题。其包括:获取历年生长期内的目标农作物种植区农作物产量数据、遥感影像数据和气象环境数据,预处理后农作物单产预测的输入特征参数和单产数据分别作为深度学习模型的输入特征和输出数据;将输入特征和输出数据构建为非线性特征组合数据集并划分为测试集和训练集;搭建农作物产量预测TAM模型使用非线性特征组合数据集进行训练优化,将待测农作物的输入特征输入到农作物产量预测TAM模型中获得该农作物单产预估结果。本发明相比于现有方法提高了农作物产量的预测精确度。

Description

一种基于三重注意力机制的农作物产量预测方法
技术领域
本发明涉及一种基于三重注意力机制的农作物产量预测方法,属于智慧农业技术领域。
背景技术
构建农作物产量预测模型,准确预测农作物产量及其空间分布对保障国家粮食安全和挖掘区域可利用的农业资源具有重要意义。农作物产量形成是一个复杂的过程,中间涉及非常多的生理生化过程,气象条件、土壤条件、地理环境、物候信息等都是其产量预估需要考虑的因素,产量可看成是一段时期内多个影响因子相互叠加的结果。
当前在农作物生长时期预估产量所采用的手段主要包括:经验估产法:根据农业生产的基本条件和农作物的生长情况,考虑到增产技术措施和当年气候对产量的影响,凭经验和眼力来评定农作物单位面积产量;要素测定法:在农作物成熟时期,对其计算产量的要素进行测定;卫星遥感预测法:一种是利用环境和气象卫星的高度分辨辐射计,以进行大面积作物生态环境和产量预测。另一种为遥感农作物产量预测,是以陆地卫星影像为主,进行统计分层,并参照航空像片进行定点抽样,以计算面积,即利用面积抽样框图或其他抽样方法,随机抽取样本,把地面监测与遥感分层结合起来,以预测产量;回归模式预测法:探讨农作物生长期各项因素与产量间的回归关系;传统机器学习模型预测:随机森林、决策树、人工神经网络等相结合以确定最佳农作物产量。以上的方法难以在大空间尺度范围下应用,难以处理数据中的非线性关系,预测的精确度有待提高。
发明内容
本发明的目的在于克服现有技术中的不足,提供一种基于三重注意力机制的农作物产量预测方法,通过农作物生长期内的非线性特征组合数据集预测产量,得到更加准确的预测精度。
为达到上述目的,本发明是采用下述技术方案实现的:
第一方面,本发明提供了一种基于三重注意力机制的农作物产量预测方法,方法包括:
获取待测农作物种植区遥感影像数据和气象环境数据,经预处理得到农作物单产的预测输入特征;
将预测输入特征输入到训练好的农作物产量预测TAM模型;
根据农作物产量预测TAM模型的输出,确定农作物产量预测结果;
其中所述农作物产量预测TAM模型的构建训练方法包括:
步骤1:获取训练集S;
步骤2:将训练集S输入卷积神经网络,得到非线性特征组合图S3
步骤3:将非线性特征组合图S3输入第一重通道注意力机制,得到非线性特征组合图S4
步骤4:将非线性特征组合图S4输入第二重空间注意力机制,得出非线性特征组合图S6
步骤5:将非线性特征组合图S6依次经过第一全连接层和双向门控循环单元层处理,得到各个时间步长非线性特征组合时序数据的映射输出;
步骤6:第三重非线性特征注意力机制根据映射输出计算得到农作物产量输出。
优先地,所述气象环境数据采用ARCGIS进行处理,获得包含平均蒸散量、干旱指数、降水量、最高温度、最低温度和土壤含水量特征的栅格数据。
优先地,所述步骤1中,获取数据集S包括:
步骤1-1:获取待测农作物种植区历年生长期内的农作物播种面积数据、产量数据、遥感影像数据和气象环境数据;
步骤1-2:预处理得到农作物单产的输入特征参数和单产数据,并作为训练农作物产量预测TAM模型的输入特征和输出数据;
步骤1-3:将输入特征和输出数据构建为非线性特征组合数据集,采用留一法从所述非线性特征组合数据集中每次选取一个数据集作为测试集,其余全部作为训练集S。
优先地,将训练集输入到所述农作物产量预测TAM模型中进行持续更新优化后,将测试集中的输入特征输入至所述农作物产量预测TAM模型中,得到预测产值;所述预测产值与测试集数据中的输出数据计算损失误差,评估农作物产量预测TAM模型的预测性能。
优先地,所述步骤2中,将训练集S输入卷积神经网络,得到非线性特征组合图S3,包括:
所述卷积神经网络包括第一隐藏层、最大池化层和第二隐藏层;
步骤2-1:所述第一隐藏层使用2d卷积神经网络按输入时序初步提取训练集S的空间特征,得到非线性特征组合图S1
步骤2-2:所述最大池化层对所述非线性特征组合图S1降维,得到非线性特征组合降维图S2
步骤2-3:所述第二隐藏层使用2d卷积神经网络提取非线性特征组合降维图S2,得到非线性特征组合图S3
优先地,所述步骤3中,将非线性特征组合图S3输入第一重通道注意力机制,得到非线性特征组合图S4,包括:所述第一重通道注意力机制包括第一全局最大池化层、第一全局平均池化层和感知机层;
步骤3-1:所述第一全局最大池化层在所述非线性特征组合图S3的每个通道上找到最大值组成非线性特征组合图
Figure SMS_1
;其中,x mij 表示第m个特征图区域R中位于(i,j)处的元素,R表示第m个特征图矩阵区域的全部元素;
步骤3-2:所述第一全局平均池化层在非线性特征组合图S3的每个通道上计算平均值组成非线性组合图
Figure SMS_2
;其中,x aij 表示第a个特征图区域R中位于(i,j)处的元素,R表示第a个特征图矩阵区域的全部元素,|R|表示全部元素的个数;
步骤3-3:所述感知机层分别对非线性特征组合图Sm和Sa计算通道的注意力权重生成两次二维映射,且进行加和操作,然后通过Sigmoid激活函数获得归一化注意力权重
Figure SMS_3
;其中/>
Figure SMS_4
表示sigmoid函数,MLP表示感知机操作,Sm表示全局最大池化层的非线性特征组合图,Sa表示全局平均池化层的非线性特征组合图;
步骤3-4:As通过乘法逐通道加权非线性特征组合图S3,得到经过第一重通道注意力机制的非线性特征组合图S4
Figure SMS_5
;其中,As为归一化注意力权重,/>
Figure SMS_6
表示元素乘法。
优先地,所述步骤4中,将非线性特征组合图S4输入第二重空间注意力机制,得出非线性特征组合图S6,包括:
所述第二重空间注意力机制包括第二全局最大池化层、第二全局平均池化层和第三隐藏层;
步骤4-1:所述第二全局最大池化层在非线性特征组合图S4的每个通道上找到最大值组成非线性特征组合图:
Figure SMS_7
;其中,GMP表示对S4进行第二全局最大池操作;
步骤4-2:所述第二全局平均池化层在非线性组合图S4的每个通道上计算平均值组成非线性特征组合图
Figure SMS_8
;其中,GAP表示对S4进行第二全局平均池化层操作;将非线性特征组合图Sm 和Sa 基于每个通道拼接起来,得到非线性特征组合图S5
Figure SMS_9
;其中,concat为拼接操作;
步骤4-3:所述第三隐藏层将非线性特征组合图S5降维变成单通道的非线性特征组合图,通过Sigmoid激活函数计算空间权重系数
Figure SMS_10
;其中,/>
Figure SMS_11
表示sigmoid函数,Conv表示第三隐藏层的卷积操作;
步骤4-4:As 通过点乘操作加权非线性特征组合图S4,得到非线性特征组合图S6
Figure SMS_12
,/>
Figure SMS_13
表示元素乘法。
优先地,所述步骤5中,依次经过第一全连接层和双向门控循环单元层对非线性特征组合图S6处理,包括:
步骤5-1:所述第一全连接层将非线性特征组合图S6的分布式特征表示映射到样本标记空间,得到非线性特征组合图S6的时序特征映射;
步骤5-2:所述双向门控循环单元层维持非线性特征组合图S6的时间步长的链式结构;每个时间步长的输入xt会同时提供给两个方向相反的门控循环单元神经网络,而输出映射ht则由(t-1)时刻向前的隐层状态的输出
Figure SMS_14
和反向的隐层状态的输出/>
Figure SMS_15
共同决定;在t时刻的隐层状态通过前向隐层状态/>
Figure SMS_16
和反向隐层状态/>
Figure SMS_17
加权求和得到:
Figure SMS_18
;/>
Figure SMS_19
Figure SMS_20
其中,GRU()表示对输入非线性特征组合向量的非线性变换,把非线性特征组合编码成对应的GRU隐层状态;wt、vt分别表示t时刻双向GRU所对应的前向隐层状态
Figure SMS_21
和反向隐状态/>
Figure SMS_22
所对应的权重,bt表示t时刻隐层状态所对应的偏置;将各个时间步长的非线性特征组合时序数据映射输出为hk
优先地,所述步骤6中,所述第三重非线性特征注意力机制根据映射输出计算得到农作物产量输出包括:所述第三重非线性特征注意力机制包括激活层和第二全连接层;
步骤6-1:所述激活层根据输出映射hk计算得到不同非线性特征向量的注意力权重值;对输出映射hk进行正交变换,得到其隐式表示
Figure SMS_23
;其中,wz为注意力机制层权重矩阵,bz为偏差向量;
步骤6-2:通过点乘法计算每个输入特征分配注意概率分布值{α1,α2,…,αt},并生成注意力权重矩阵:
Figure SMS_24
其中,
Figure SMS_25
是隐式表示uk的矩阵转置操作;us为随机初始化的时间序列注意力机制矩阵;
步骤6-3:利用t时间步内的输出信息hk及分配的注意力权重计算非线性特征表示p:
Figure SMS_26
;使用所述第二全连接层计算得到农作物产量输出y:/>
Figure SMS_27
;其中,r为非线性特征组合样本数,wr和br分别对应输出层的权重矩阵和偏移量。
一种基于三重注意力机制的农作物产量预测装置,包括处理器及存储介质;
所述存储介质用于存储指令;
所述处理器用于根据所述指令进行操作以执行根据上述任一项所述方法的步骤。
与现有技术相比,本发明所达到的有益效果:
本发明提供了一种基于三重注意力机制的农作物产量预测方法,从目标区域历年农作物种植区生长期的时空数据中学习时间特征和空间特征,构建了学习农作物生长过程中的时空数据的农作物产量预测TAM模型,提高了农作物产量预测TAM模型对农作物产量预测的精确度和稳定性。
附图说明
图1为本发明提供的农作物产量预测TAM模型的流程图;
图2为本发明提供的农作物产量预测TAM模型的结构图;
图3为本发明提供的一种基于三重注意力机制的农作物产量预测方法的流程图;
图4为本发明提供的农作物产量预测TAM模型的构建训练方法流程图。
具体实施方式
下面结合附图对本发明作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本发明的保护范围。
实施例一:
参见图3、图4所示,本实施例提供了一种基于三重注意力机制的农作物产量预测方法,该方法包括步骤:
(一)获取待测农作物种植区遥感影像数据和气象环境数据并经过预处理得到该农作物单产的预测输入特征;
(二)将预测输入特征输入到训练好的农作物产量预测TAM模型;
(三)根据农作物产量预测TAM模型的输出,确定农作物产量预测结果。
获取农作物种植区信息的过程中,遥感影像数据采集用中等分辨率成像光谱仪卫星图像,该卫星影像有较高的时间分辨率,能获取足够多的农作物产量的多时影像。遥感影像数据采用MODIS重投影工具、ArcGIS进行处理,获得融合后遥感影像。
将待测农作物种植区的历年生长期内的农作物产量数据和播种面积数据处理,得到单位面积产量数据,即单产数据,并且具体的年份和农作物种植区一一对应。该单产数据作为后续深度学习模型的输出数据。使用MODIS重投影工具、ArcGIS对遥感影像数据进行处理得到融合后遥感影像,融合后遥感影像包括MOD09A1七个波段的地表反射率遥感影像、MOD11A2陆地表面昼夜温度遥感影像和MCD12Q农作物种植区掩膜数据。
ARCGIS对气象环境数据进行处理,获得包含平均蒸散量、干旱指数、降水量、最高温度、最低温度和土壤含水量的栅格数据。将处理得到的遥感影像数据和气象环境数据数据时空维度对齐整理作为农作物单产预测的输入特征参数,即作为农作物产量预测TAM模型的输入特征。
其中农作物产量预测TAM模型的构建训练方法详细步骤包括:
步骤1:获取训练集S;
步骤2:将训练集S输入卷积神经网络处理,得到非线性特征组合图S3
步骤3:将非线性特征组合图S3输入第一重通道注意力机制,得到非线性特征组合图S4
步骤4:将非线性特征组合图S4输入第二重空间注意力机制,得出非线性特征组合图S6
步骤5:将非线性特征组合图S6依次经过第一全连接层和双向门控循环单元层处理,得到各个时间步长非线性特征组合时序数据的映射输出;
步骤6:第三重非线性特征注意力机制根据映射输出计算得到农作物产量输出。
具体地,在步骤1中:
步骤1-1:获取历年生长期内的目标农作物种植区农作物的播种面积数据、产量数据、遥感数据和气象环境数据;
步骤1-2:预处理得出的农作物的单产预测的输入特征参数和单产数据,并作为训练农作物产量预测TAM模型的输入特征和输出数据。
步骤1-3:将输入特征和输出数据构建为非线性特征组合数据集,采用留一法从非线性特征组合数据集中每次选取一个数据集作为测试集,其余全部作为训练集S。农作物产量预测TAM模型迭代训练时,每次从线性特征组合数据集中选取其中一个数据集作为测试集,非线性特征组合数据集内剩余的数据集作为训练集去优化模型。
可选地,在步骤2至步骤6过程中,训练集S输入到农作物产量预测TAM模型中进行训练,采用Adam优化方法,用正向传播求损失,反向传播求梯度的方法在训练时持续更新优化该模型的参数,经过多轮训练后得到最优参数,进而获得训练后的农作物产量预测TAM模型。
测试集用于对最终筛选出来农作物产量预测TAM模型的泛化能力进行评价。将测试集数据中的输入特征输入到所述农作物产量预测TAM模型中,得到预测产值,通过预测产值与测试集数据中的输出数据计算损失误差,评估模型的预测性能。
实施例二:
参见图1和图2所示,本实施例中搭建的农作物产量预测TAM模型,包含第一全连接层、卷积神经网络、第一重通道注意力机制、第二重空间注意力机制和第三重非线性特征注意力机制。
可选地,构建实施例一的训练步骤2,卷积神经网络包括第一隐藏层、最大池化层和第二隐藏层。
步骤2-1:第一隐藏层使用2d卷积神经网络按输入时序初步提取训练集S的空间特征,得到非线性特征组合图S1
步骤2-2:最大池化层对所述非线性特征组合图S1降维,得到非线性特征组合降维图S2
步骤2-3:第二隐藏层使用2d卷积神经网络提取非线性特征组合降维图S2,得到非线性特征组合图S3
可选地,构建实施例一的训练步骤3,第一重通道注意力机制包括第一全局最大池化层、第一全局平均池化层和感知机层。
步骤3-1:所述第一全局最大池化层在所述非线性特征组合图S3的每个通道上找到最大值组成非线性特征组合图
Figure SMS_28
;其中,x mij 表示第m个特征图区域R中位于(i,j)处的元素,R表示第m个特征图矩阵区域的全部元素;
步骤3-2:所述第一全局平均池化层在非线性特征组合图S3的每个通道上计算平均值组成非线性组合图
Figure SMS_29
;其中,x aij 表示第a个特征图区域R中位于(i,j)处的元素,R表示第a个特征图矩阵区域的全部元素,|R|表示全部元素的个数;
步骤3-3:所述感知机层分别对非线性特征组合图Sm和Sa计算通道的注意力权重生成两次二维映射,且进行加和操作,然后通过Sigmoid激活函数获得归一化注意力权重
Figure SMS_30
;其中/>
Figure SMS_31
表示sigmoid函数,MLP表示感知机操作,Sm表示全局最大池化层的非线性特征组合图,Sa表示全局平均池化层的非线性特征组合图;
步骤3-4:As通过乘法逐通道加权非线性特征组合图S3,得到经过第一重通道注意力机制的非线性特征组合图S4
Figure SMS_32
;其中,As为归一化注意力权重,/>
Figure SMS_33
表示元素乘法。
可选地,构建实施例一的训练步骤4,第二重空间注意力机制包括第二全局平均池化层、第二全局最大池化层和第三隐藏层。
步骤4-1:所述第二全局最大池化层在非线性特征组合图S4的每个通道上找到最大值组成非线性特征组合图:
Figure SMS_34
;其中,GMP表示对S4进行第二全局最大池操作;
步骤4-2:所述第二全局平均池化层在非线性组合图S4的每个通道上计算平均值组成非线性特征组合图
Figure SMS_35
;其中,GAP表示对S4进行第二全局平均池化层操作;将非线性特征组合图Sm 和Sa 基于每个通道拼接起来,得到非线性特征组合图S5
Figure SMS_36
;其中,concat为拼接操作;
步骤4-3:所述第三隐藏层将非线性特征组合图S5降维变成单通道的非线性特征组合图,通过Sigmoid激活函数计算空间权重系数
Figure SMS_37
;其中,/>
Figure SMS_38
表示sigmoid函数,Conv表示第三隐藏层的卷积操作;
步骤4-4:As 通过点乘操作加权非线性特征组合图S4,得到非线性特征组合图S6
Figure SMS_39
,/>
Figure SMS_40
表示元素乘法。
可选地,构建实施例一的训练步骤5:非线性特征组合图S6输入至第一全连接层后经过双向门控循环单元层进行处理。
步骤5-1:所述第一全连接层将非线性特征组合图S6的分布式特征表示映射到样本标记空间,得到非线性特征组合图S6的时序特征映射;
步骤5-2:所述双向门控循环单元层维持非线性特征组合图S6的时间步长的链式结构;每个时间步长的输入xt会同时提供给两个方向相反的门控循环单元神经网络,而输出映射ht则由(t-1)时刻向前的隐层状态的输出
Figure SMS_41
和反向的隐层状态的输出/>
Figure SMS_42
共同决定;在t时刻的隐层状态通过前向隐层状态/>
Figure SMS_43
和反向隐层状态/>
Figure SMS_44
加权求和得到:
Figure SMS_45
Figure SMS_46
Figure SMS_47
其中,GRU()表示对输入非线性特征组合向量的非线性变换,把非线性特征组合编码成对应的GRU隐层状态;wt、vt分别表示t时刻双向GRU所对应的前向隐层状态
Figure SMS_48
和反向隐状态/>
Figure SMS_49
所对应的权重,bt表示t时刻隐层状态所对应的偏置;将各个时间步长的非线性特征组合时序数据映射输出为hk
可选地,构建实施例一的训练步骤5,第三重非线性特征注意力机制包括激活层和第二全连接层。
步骤6-1:所述激活层根据输出映射hk计算得到不同非线性特征向量的注意力权重值;对输出映射hk进行正交变换,得到其隐式表示
Figure SMS_50
;其中,wz为注意力机制层权重矩阵,bz为偏差向量;
步骤6-2:通过点乘法计算每个输入特征分配注意概率分布值{α1,α2,…,αt},并生成注意力权重矩阵:
Figure SMS_51
其中,
Figure SMS_52
是隐式表示uk的矩阵转置操作;us为随机初始化的时间序列注意力机制矩阵;
步骤6-3:利用t时间步内的输出信息hk及分配的注意力权重计算非线性特征表示p:
Figure SMS_53
;使用所述第二全连接层计算得到农作物产量输出y:/>
Figure SMS_54
;其中,r为非线性特征组合样本数,wr和br分别对应输出层的权重矩阵和偏移量。
实施例三:
本实施例根据实施例二和实施例一的农作物产量预测方法和农作物产量预测TAM模型,基于河南省各县历年生长期内冬小麦的产量数据、农作物播种面积数据、遥感影像数据、气象环境数据构成原始数据集。
本实施例主要使用3种MODIS产品数据,其时间覆盖为2002—2017年。MOD09A1V6产品提供了500m和8d的地表反射率,包括7个波段,如红波段、短波红外波段和近红外波段等,可以反映农作物的生长状态和环境。MOD11A2V6产品可在1km×1km的网格中提供每8d的地表昼夜地表温度影像,地表昼夜地表温度与作物冠层温度联系紧密。MCD12Q1V6产品以年为单位提供全球土地覆盖类型,其中包括草原、农田、城市和水体等17类土地类型,其空间分辨率为500m,可用来矢量掩膜冬小麦种植区。
气象数据从TerraClimate(全球陆地表面每月气候和气候水平衡的数据集)中获得,包括小麦整个生育期每月的降水量、最高温度、最低温度、干旱指数、土壤含水量和平均蒸散量。这些数据集对1958—2019年间的全球地表具有高空间分辨率(约4km)。
本实施例选取2002-2017年的相关月值数据作为影响因素进行冬小麦产量预测;从《河南省统计年鉴》选取2003-2017年河南省105个县(包括县级市)冬小麦单位产量数据。
将原始数据集进行预处理:利用河南省各县冬小麦历年发育期内的产量和播种面积数据计算获得单位面积产量数据。为统一影像分辨率,首先利用Modis重投影工具软件将MOD11A2的空间分辨率重采样为500m,投影转换为WGS84坐标系统。再利用MCD12Q1中冬小麦种植区以及河南省各县的shp矢量文件图的掩膜数据裁剪河南省各县的MOD09A1和MOD11A2遥感影像。接着对MOD09A1和MOD11A2遥感影像各个波段数据进行提取、融合。即,利用GDAL库分别读取MOD09A1和MOD11A2遥感影像。将其波段按顺序排列,共计9个波段,包括MOD09A1的7个波段和MOD11A2的2个波段。
然后将融合后的遥感影像中河南省冬小麦种植区的时空信息特征与冬小麦生长期内的气象环境数据特征时空维度对齐整理,作为冬小麦产量预测的输入特征,冬小麦单产数据作为模型的输出数据,构建非线性特征组合数据集。采用留一法从所述非线性特征组合数据集中每次选取一个数据集作为测试集,其余全部作为训练集。年单位面积产量为标签,年份为2002-2017年,逐年验证模型训练结果。
将冬小麦的非线性特征组合数据集输入到农作物产量预测TAM模型进行超参数优化。农作物产量预测TAM模型参数优化具体包括输入特征维度、第一/二隐藏层层数、卷积神经网络参数、双向门控循环单元层的层数、降维系数、第一/二全连接层的参数、输出特征维度和模型批量训练数目、模型训练轮数和模型训练学习率。
冬小麦的农作物产量预测TAM模型的超参数优化完毕后,再次使用所有的训练集数据来训练模型的参数。采用Adam优化方法,用正向传播求损失,反向传播求梯度的方法获得模型的权重参数,直至训练集损失函数值收敛至最低值。模型训练好后,终止训练,保存最优的模型。进而评估农作物产量预测TAM模型的预测性能(评价指标):
根据测试集样本的预测值和真实值计算均方误差(MSE)、平均绝对误差(MAE)、均方根误差(RMSE)评估模型精度。得出冬小麦的农作物产量预测TAM模型的MSE、MAE、RMSE分别是0.21吨/公顷;0.15吨/公顷;0.46吨/公顷。
使用相同的非线性特征组合数据集,在下述模型计算得:
使用训练集数据训练传统的LASSO模型、决策树模型、随机森林模型以及长短期记忆网络(LSTM)模型、CNN-LSTM模型,并在测试集上测试,得到的结果是:
LASSO模型的MSE、MAE、RMSE分别是1.47吨/公顷;1.15吨/公顷;1.21吨/公顷;
决策树模型的MSE、MAE、RMSE分别是1.06吨/公顷;0.96吨/公顷;1.02吨/公顷;
长短期记忆网络(LSTM)模型的MSE、MAE;RMSE分别是0.74吨/公顷;0.69吨/公顷;0.86吨/公顷;
CNN-LSTM模型的MSE、MAE、RMSE分别是0.63吨/公顷,0.56吨/公顷、0.79吨/公顷。
由此可以看出,通过同数据集训练出上述不同的模型,误差指标越小的,则模型预测准确度越高。即使用本发明提供的基于三重注意力机制的农作物产量预测方法的模型在农作物产量预测的精度上高于传统方法以及普通的神经网络方法。
冬小麦有播种期、出苗期、分蘖期、越冬期、返青期、起身期、拔节期、孕穗期、抽穗期、开花期、灌浆期和成熟期;10月中旬播种,次年7月初收获;灌浆期对应于五月上旬,利用播种期至灌浆期的输入特征参数输入到本发明的农作物产量预测TAM模型中预测冬小麦单产时得到的MSE、MAE、RMSE分别是0.24吨/公顷、0.19吨/公顷和0.49吨/公顷,与利用播种期至成熟期得到的MSE、MAE、RMSE分别是0.21吨/公顷、0.15吨/公顷和0.46吨/公顷相差很小。故此,相比其他现有农作物产量预测模型,本发明可以提供提前2个月对农作物的产量精准预测。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
实施例四:
本实施例提供了一种基于三重注意力机制的农作物产量预测装置,包括处理器及存储介质;
轻量级遥感目标检测装置,包括处理器及存储介质;
所述存储介质用于存储指令;
所述处理器用于根据所述指令进行操作以执行根据实施例一和实施例二所述方法的步骤。
实施例五:
本实施例提供了一种存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现实施例一或实施例二中所述方法的步骤。
所述计算机程序被处理器执行时实现实施例一所述方法的步骤。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和变形,这些改进和变形也应视为本发明的保护范围。

Claims (10)

1.一种基于三重注意力机制的农作物产量预测方法,其特征在于,方法包括:
获取待测农作物种植区遥感影像数据和气象环境数据,经预处理得到农作物单产的预测输入特征;
将预测输入特征输入到训练好的农作物产量预测TAM模型;
根据农作物产量预测TAM模型的输出,确定农作物产量预测结果;
其中所述农作物产量预测TAM模型的构建训练方法包括:
步骤1:获取训练集S;
步骤2:将训练集S输入卷积神经网络,得到非线性特征组合图S3
步骤3:将非线性特征组合图S3输入第一重通道注意力机制,得到非线性特征组合图S4
步骤4:将非线性特征组合图S4输入第二重空间注意力机制,得出非线性特征组合图S6
步骤5:将非线性特征组合图S6依次经过第一全连接层和双向门控循环单元层处理,得到各个时间步长非线性特征组合时序数据的映射输出;
步骤6:第三重非线性特征注意力机制根据映射输出计算得到农作物产量输出。
2.根据权利要求1所述的一种基于三重注意力机制的农作物产量预测方法,其特征在于,所述气象环境数据采用ARCGIS进行处理,获得包含平均蒸散量、干旱指数、降水量、最高温度、最低温度和土壤含水量特征的栅格数据。
3.根据权利要求1所述的一种基于三重注意力机制的农作物产量预测方法,其特征在于,所述步骤1中,获取数据集S包括:
步骤1-1:获取待测农作物种植区历年生长期内的农作物播种面积数据、产量数据、遥感影像数据和气象环境数据;
步骤1-2:预处理得到农作物单产的输入特征参数和单产数据,并作为训练农作物产量预测TAM模型的输入特征和输出数据;
步骤1-3:将输入特征和输出数据构建为非线性特征组合数据集,采用留一法从所述非线性特征组合数据集中每次选取一个数据集作为测试集,其余全部作为训练集S。
4.根据权利要求3所述的一种基于三重注意力机制的农作物产量预测方法,其特征在于,将训练集输入到所述农作物产量预测TAM模型中进行持续更新优化后,将测试集中的输入特征输入至所述农作物产量预测TAM模型中,得到预测产值;所述预测产值与测试集数据中的输出数据计算损失误差,评估农作物产量预测TAM模型的预测性能。
5.根据权利要求1所述的一种基于三重注意力机制的农作物产量预测方法,其特征在于,所述步骤2中,将训练集S输入卷积神经网络,得到非线性特征组合图S3,包括:
所述卷积神经网络包括第一隐藏层、最大池化层和第二隐藏层;
步骤2-1:所述第一隐藏层使用2d卷积神经网络按输入时序初步提取训练集S的空间特征,得到非线性特征组合图S1
步骤2-2:所述最大池化层对所述非线性特征组合图S1降维,得到非线性特征组合降维图S2
步骤2-3:所述第二隐藏层使用2d卷积神经网络提取非线性特征组合降维图S2,得到非线性特征组合图S3
6.根据权利要求1所述的一种基于三重注意力机制的农作物产量预测方法,其特征在于,所述步骤3中,将非线性特征组合图S3输入第一重通道注意力机制,得到非线性特征组合图S4,包括:
所述第一重通道注意力机制包括第一全局最大池化层、第一全局平均池化层和感知机层;
步骤3-1:所述第一全局最大池化层在所述非线性特征组合图S3的每个通道上找到最大值组成非线性特征组合图
Figure QLYQS_1
;其中,x mij 表示第m个特征图区域R中位于(i,j)处的元素,R表示第m个特征图矩阵区域的全部元素;
步骤3-2:所述第一全局平均池化层在非线性特征组合图S3的每个通道上计算平均值组成非线性组合图
Figure QLYQS_2
;其中,x aij 表示第a个特征图区域R中位于(i,j)处的元素,R表示第a个特征图矩阵区域的全部元素,|R|表示全部元素的个数;
步骤3-3:所述感知机层分别对非线性特征组合图Sm和Sa计算通道的注意力权重生成两次二维映射,且进行加和操作,然后通过Sigmoid激活函数获得归一化注意力权重
Figure QLYQS_3
;其中/>
Figure QLYQS_4
表示sigmoid函数,MLP表示感知机操作,Sm表示全局最大池化层的非线性特征组合图,Sa表示全局平均池化层的非线性特征组合图;
步骤3-4:As通过乘法逐通道加权非线性特征组合图S3,得到经过第一重通道注意力机制的非线性特征组合图S4
Figure QLYQS_5
;其中,As为归一化注意力权重,/>
Figure QLYQS_6
表示元素乘法。
7.根据权利要求1所述的一种基于三重注意力机制的农作物产量预测方法,其特征在于,所述步骤4中,将非线性特征组合图S4输入第二重空间注意力机制,得出非线性特征组合图S6,包括:
所述第二重空间注意力机制包括第二全局最大池化层、第二全局平均池化层和第三隐藏层;
步骤4-1:所述第二全局最大池化层在非线性特征组合图S4的每个通道上找到最大值组成非线性特征组合图:
Figure QLYQS_7
;其中,GMP表示对S4进行第二全局最大池操作;
步骤4-2:所述第二全局平均池化层在非线性组合图S4的每个通道上计算平均值组成非线性特征组合图
Figure QLYQS_8
;其中,GAP表示对S4进行第二全局平均池化层操作;将非线性特征组合图Sm 和Sa 基于每个通道拼接起来,得到非线性特征组合图S5
Figure QLYQS_9
;其中,concat为拼接操作;
步骤4-3:所述第三隐藏层将非线性特征组合图S5降维变成单通道的非线性特征组合图,通过Sigmoid激活函数计算空间权重系数
Figure QLYQS_10
;其中,/>
Figure QLYQS_11
表示sigmoid函数,Conv表示第三隐藏层的卷积操作;
步骤4-4:As 通过点乘操作加权非线性特征组合图S4,得到非线性特征组合图S6
Figure QLYQS_12
,/>
Figure QLYQS_13
表示元素乘法。
8.根据权利要求1所述的一种基于三重注意力机制的农作物产量预测方法,其特征在于,所述步骤5中,依次经过第一全连接层和双向门控循环单元层对非线性特征组合图S6处理,包括:
步骤5-1:所述第一全连接层将非线性特征组合图S6的分布式特征表示映射到样本标记空间,得到非线性特征组合图S6的时序特征映射;
步骤5-2:所述双向门控循环单元层维持非线性特征组合图S6的时间步长的链式结构;每个时间步长的输入xt会同时提供给两个方向相反的门控循环单元神经网络,而输出映射ht则由(t-1)时刻向前的隐层状态的输出
Figure QLYQS_14
和反向的隐层状态的输出/>
Figure QLYQS_15
共同决定;在t时刻的隐层状态通过前向隐层状态/>
Figure QLYQS_16
和反向隐层状态/>
Figure QLYQS_17
加权求和得到:
Figure QLYQS_18
Figure QLYQS_19
Figure QLYQS_20
其中,GRU()表示对输入非线性特征组合向量的非线性变换,把非线性特征组合编码成对应的GRU隐层状态;wt、vt分别表示t时刻双向GRU所对应的前向隐层状态
Figure QLYQS_21
和反向隐状态
Figure QLYQS_22
所对应的权重,bt表示t时刻隐层状态所对应的偏置;将各个时间步长的非线性特征组合时序数据映射输出为hk
9.根据权利要求8所述的一种基于三重注意力机制的农作物产量预测方法,其特征在于,所述步骤6中,所述第三重非线性特征注意力机制根据映射输出计算得到农作物产量输出包括:所述第三重非线性特征注意力机制包括激活层和第二全连接层;
步骤6-1:所述激活层根据输出映射hk计算得到不同非线性特征向量的注意力权重值;对输出映射hk进行正交变换,得到其隐式表示
Figure QLYQS_23
;其中,wz为注意力机制层权重矩阵,bz为偏差向量;
步骤6-2:通过点乘法计算每个输入特征分配注意概率分布值{α1,α2,…,αt},并生成注意力权重矩阵:
Figure QLYQS_24
其中,
Figure QLYQS_25
是隐式表示uk的矩阵转置操作;us为随机初始化的时间序列注意力机制矩阵;
步骤6-3:利用t时间步内的输出信息hk及分配的注意力权重计算非线性特征表示p:
Figure QLYQS_26
;使用所述第二全连接层计算得到农作物产量输出y:/>
Figure QLYQS_27
;其中,r为非线性特征组合样本数,wr和br分别对应输出层的权重矩阵和偏移量。
10.一种基于三重注意力机制的农作物产量预测装置,其特征在于,包括处理器及存储介质;
所述存储介质用于存储指令;
所述处理器用于根据所述指令进行操作以执行根据权利要求1至9任一项所述方法的步骤。
CN202310136305.4A 2023-02-20 2023-02-20 一种基于三重注意力机制的农作物产量预测方法 Active CN115860269B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310136305.4A CN115860269B (zh) 2023-02-20 2023-02-20 一种基于三重注意力机制的农作物产量预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310136305.4A CN115860269B (zh) 2023-02-20 2023-02-20 一种基于三重注意力机制的农作物产量预测方法

Publications (2)

Publication Number Publication Date
CN115860269A true CN115860269A (zh) 2023-03-28
CN115860269B CN115860269B (zh) 2023-05-16

Family

ID=85658456

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310136305.4A Active CN115860269B (zh) 2023-02-20 2023-02-20 一种基于三重注意力机制的农作物产量预测方法

Country Status (1)

Country Link
CN (1) CN115860269B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116307266A (zh) * 2023-05-15 2023-06-23 山东建筑大学 作物生长预测方法、装置、电子设备及存储介质
CN116563706A (zh) * 2023-05-08 2023-08-08 哈尔滨工业大学 一种针对多光谱图像反射率多特征的作物产量估计方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105115469A (zh) * 2015-07-29 2015-12-02 华中农业大学 水稻稻穗表型参数自动测量和穗重预测方法
CN109886496A (zh) * 2019-02-27 2019-06-14 中南大学 一种基于气象信息的农产量预测方法
CN110705692A (zh) * 2019-09-25 2020-01-17 中南大学 一种基于空间和时间注意力的长短期记忆网络对工业非线性动态过程产品质量预测方法
CN111027752A (zh) * 2019-11-19 2020-04-17 浙江大学 一种深度时空特征联合学习的农作物产量估测方法
CN111325381A (zh) * 2020-01-22 2020-06-23 中国农业机械化科学研究院 一种多源异构农田大数据产量预测方法、系统与装置
CN115222100A (zh) * 2022-06-23 2022-10-21 郑州大学 基于三维循环卷积神经网络和多时相遥感影像的农作物产量预测方法
CN115331104A (zh) * 2022-08-17 2022-11-11 中国农业大学 一种基于卷积神经网络的农作物种植信息提取方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105115469A (zh) * 2015-07-29 2015-12-02 华中农业大学 水稻稻穗表型参数自动测量和穗重预测方法
CN109886496A (zh) * 2019-02-27 2019-06-14 中南大学 一种基于气象信息的农产量预测方法
CN110705692A (zh) * 2019-09-25 2020-01-17 中南大学 一种基于空间和时间注意力的长短期记忆网络对工业非线性动态过程产品质量预测方法
CN111027752A (zh) * 2019-11-19 2020-04-17 浙江大学 一种深度时空特征联合学习的农作物产量估测方法
CN111325381A (zh) * 2020-01-22 2020-06-23 中国农业机械化科学研究院 一种多源异构农田大数据产量预测方法、系统与装置
CN115222100A (zh) * 2022-06-23 2022-10-21 郑州大学 基于三维循环卷积神经网络和多时相遥感影像的农作物产量预测方法
CN115331104A (zh) * 2022-08-17 2022-11-11 中国农业大学 一种基于卷积神经网络的农作物种植信息提取方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116563706A (zh) * 2023-05-08 2023-08-08 哈尔滨工业大学 一种针对多光谱图像反射率多特征的作物产量估计方法
CN116563706B (zh) * 2023-05-08 2024-05-17 哈尔滨工业大学 一种针对多光谱图像反射率多特征的作物产量估计方法
CN116307266A (zh) * 2023-05-15 2023-06-23 山东建筑大学 作物生长预测方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN115860269B (zh) 2023-05-16

Similar Documents

Publication Publication Date Title
Han et al. Modeling maize above-ground biomass based on machine learning approaches using UAV remote-sensing data
Cunha et al. A scalable machine learning system for pre-season agriculture yield forecast
US20190050510A1 (en) Development of complex agricultural simulation models from limited datasets
CN115860269B (zh) 一种基于三重注意力机制的农作物产量预测方法
Ahmad et al. A machine‐learning based ConvLSTM architecture for NDVI forecasting
Wang et al. Integrating remotely sensed leaf area index and leaf nitrogen accumulation with RiceGrow model based on particle swarm optimization algorithm for rice grain yield assessment
Wang et al. Monitoring maize growth conditions by training a BP neural network with remotely sensed vegetation temperature condition index and leaf area index
Haque et al. Crop yield prediction using deep neural network
CN114529097B (zh) 多尺度农作物物候期遥感降维预测方法
Bellis et al. Detecting intra-field variation in rice yield with unmanned aerial vehicle imagery and deep learning
Fajardo et al. Within‐farm wheat yield forecasting incorporating off‐farm information
Yu et al. Deep convolutional neural networks for estimating maize above-ground biomass using multi-source UAV images: A comparison with traditional machine learning algorithms
Han et al. Combining self-organizing maps and biplot analysis to preselect maize phenotypic components based on UAV high-throughput phenotyping platform
CN117423003B (zh) 一种冬小麦越冬期苗情分级遥感监测方法
CN115169728A (zh) 一种基于简化神经网络的土壤肥力预测方法
Bazrafshan et al. Evaluation and uncertainty assessment of wheat yield prediction by multilayer perceptron model with bayesian and copula bayesian approaches
Zhu et al. Identification of soybean based on Sentinel-1/2 SAR and MSI imagery under a complex planting structure
Wang et al. Relative importance of radar variables for nowcasting heavy rainfall: A machine learning approach
Han et al. Integrating an attention-based deep learning framework and the SAFY-V model for winter wheat yield estimation using time series SAR and optical data
Zhang et al. Enhancing model performance in detecting lodging areas in wheat fields using UAV RGB Imagery: Considering spatial and temporal variations
Rasheed et al. A framework base on deep neural network (DNN) for land use land cover (LULC) and rice crop classification without using survey data
Feng et al. Prediction of cotton yield based on soil texture, weather conditions and UAV imagery using deep learning
Linker et al. Concurrent data assimilation and model-based optimization of irrigation scheduling
Sadenova et al. Modelling of Forecasting Crop Yields Based on Earth Remote Sensing Data and Remote Sensing Methods
Abhishek et al. Dryspells and Minimum Air Temperatures Influence Rice Yields and their Forecast Uncertainties in Rainfed Systems

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant