CN115660166A

CN115660166A - 一种多种作物估产方法、装置、电子设备及存储介质

Info

Publication number: CN115660166A
Application number: CN202211303797.3A
Authority: CN
Inventors: 朱秀芳; 杨子毅; 潘耀忠; 代佳佳
Original assignee: Beijing Normal University
Current assignee: Beijing Normal University
Priority date: 2022-10-24
Filing date: 2022-10-24
Publication date: 2023-01-31

Abstract

本发明公开了一种多种作物估产方法、装置、电子设备及存储介质，涉及作物估产技术领域，该方法包括确定目标区域的农业气象指标值、以及目标区域内每种作物的县级遥感植被指数指标值和县级趋势单产指标值；根据气候特征对目标区域进行估产分区；在每个估产子区域中，采用随机森林重要性评价算法对每种作物的估产初始指标值进行重要性排序并筛选；结合留一法和随机森林回归算法，将筛选后的估产指标值按照重要性排序依次加入建模过程，得到相应单产估算模型并计算其模型精度，最后将构建精度最高模型的估产指标确定每个估产子区域内每种作物的建模指标，以用于产量估计。本发明能够准确预测不同农业气候状况下的作物单产。

Description

一种多种作物估产方法、装置、电子设备及存储介质

技术领域

本发明涉及作物估产技术领域，特别是涉及一种多种作物估产方法、装置、电子设备及存储介质。

背景技术

随着全球气候变化和人类活动的不断加剧，各种自然灾害频繁发生。其中，旱涝灾害严重威胁着农业生产、生态环境，并且拥有持续时间长、发生频率高、覆盖面积广的特点。

进入21世纪以来，遥感技术在农业领域方面的应用发展迅速，其时空分辨率的提升更加有利于农作物的监测和估产。目前已有许多学者针对不同作物研究了相应的单产估算模型，主要的单产估算模型包括有四种：经验统计模型、光能利用率模型、作物生长模拟模型和耦合模型。其中，经验统计模型因操作简单、计算方便，而被广泛应用。基于气象数据的单产估算模型属于经验统计模型的一种，它通过建立各类气象数据与实际单产之间的关系来对作物单产进行估计。遥感数据在经验统计模型的应用包括：1)以遥感波段作为自变量进行估产建模。2)利用遥感数据计算植被指数，以植被指数作为自变量进行估产建模。常用来进行作物估产建模的植被指数有归一化植被指数(NDVI)、增强型植被指数(EVI)、绿度植被指数(GVI)和调节土壤的植被指数(SAVI) 等。

目前，基于一套指标完成县级多种主要粮食作物单产估计的研究较少，且没有充分考虑气候在区域间的差异和年际间的波动，不同指标的代表性、适应性、计算的复杂度，也没有充分考虑气候指标和遥感指标之间的互补关系，从而影响模型的可推广能力和精度的稳定性。

发明内容

本发明的目的是提供一种多种作物估产方法、装置、电子设备及存储介质，能够准确预测不同农业气候状况下的作物单产，可以为精细化筛选变量进行估产建模提供方法参考。

为实现上述目的，本发明提供了如下方案：

第一方面，本发明提供了一种多种作物估产方法，包括：

获取目标区域样本数据，并对所述样本数据进行处理，得到目标区域估产初始指标值；所述样本数据包括若干年的气象历史数据、遥感历史数据和县级历史单产数据；所述目标区域包括多个县级区域；所述目标区域估产初始指标值包括所述目标区域的农业气象指标值、以及所述目标区域内每种作物的县级遥感植被指数指标值和县级趋势单产指标值；其中，所述农业气象指标值和所述县级遥感植被指数指标值均为多个；

根据所述农业气象指标值，对所述目标区域进行分区操作，得到多个估产子区域；

在每个所述估产子区域中，采用随机森林重要性评价算法，对每种作物的估产初始指标值进行重要性排序并进行初次筛选操作，得到初次筛选操作后的估产指标值；

结合留一法和随机森林回归算法，将初次筛选操作后的估产指标值按照重要性排序依次加入建模过程，得到在每个估产子区域内每种作物对应的初始单产估算模型集；

计算在每个估产子区域内每种作物对应的所述初始单产估算模型集中每个单产估算模型的精度，并将初始单产估算模型集中模型精度最高的单产估算模型确定为标记估产子区域内标记作物的最终单产估算模型；所述标记区域为任一估产子区域，所述标记作物为任一目标区域的作物；所述最终单产估算模型用于估算未来时段标记估产子区域内标记作物的产量。

第二方面，本发明提供了一种多种作物估产装置，包括：

估产初始指标值计算模块，用于获取目标区域样本数据，并对所述样本数据进行处理，得到目标区域估产初始指标值；所述样本数据包括若干年的气象历史数据、遥感历史数据和县级历史单产数据；所述目标区域包括多个县级区域；所述目标区域估产初始指标值包括所述目标区域的农业气象指标值、以及所述目标区域内每种作物的县级遥感植被指数指标值和县级趋势单产指标值；其中，所述农业气象指标值和所述县级遥感植被指数指标值均为多个；

估产子区域确定模块，用于根据所述农业气象指标值，对所述目标区域进行分区操作，得到多个估产子区域；

筛选模块，用于在每个所述估产子区域中，采用随机森林重要性评价算法，对每种作物的估产初始指标值进行重要性排序并进行初次筛选操作，得到初次筛选操作后的估产指标值；

初始单产估算模型集构建模块，用于结合留一法和随机森林回归算法，将初次筛选操作后的估产指标值按照重要性排序依次加入建模过程，得到在每个估产子区域内每种作物对应的初始单产估算模型集；

最终单产估算模型确定模块，用于计算在每个估产子区域内每种作物对应的所述初始单产估算模型集中每个单产估算模型的精度，并将初始单产估算模型集中模型精度最高的单产估算模型确定为标记估产子区域内标记作物的最终单产估算模型；所述标记区域为任一估产子区域，所述标记作物为任一目标区域的作物；所述最终单产估算模型用于估算未来时段标记估产子区域内标记作物的产量。

第三方面，本发明提供了一种电子设备，包括存储器及处理器，所述存储器用于存储计算机程序，所述处理器运行所述计算机程序以使所述电子设备执行根据第一方面所述的多种作物估产方法。

第四方面，本发明提供了一种计算机可读存储介质，其存储有计算机程序，所述计算机程序被处理器执行时实现第一方面所述的多种作物估产方法。

根据本发明提供的具体实施例，本发明公开了以下技术效果：

综合使用遥感数据和气象数据，结合留一法建模策略和随机森林变量重要性评价方法，分区分层次选择高精度高稳定性的输入变量，基于随机森林回归算法构建了目标区域多种作物的单产估算模型，以能够准确预测不同农业气候状况下的作物单产，可以为精细化筛选变量进行估产建模提供方法参考。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本发明多种作物估产方法的流程示意图；

图2为本发明多种作物估产装置的结构示意图；

图3为本发明多种作物估产整体流程示意图；

图4为本发明估产初始指标重要性排序结果图；图4中(a)为水稻1、2 区估产初始指标重要性排序结果图，图4中(b)为大豆1、2区估产初始指标重要性排序结果图，图4中(c)为玉米1、2区估产初始指标重要性排序结果图；

图5为本发明经过初次筛选操作后的估产指标重要性综合平均排序结果图；图5中(a)为水稻1、2区经过初次筛选操作后的估产指标重要性综合平均排序结果图，图5中(b)为大豆1、2区经过初次筛选操作后的估产指标重要性综合平均排序结果图，图5中(c)为玉米1、2区经过初次筛选操作后的估产指标重要性综合平均排序结果图；

图6为本发明估产模型平均绝对相对误差(MARE)随变量个数增加的变化图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

为使本发明的上述目的、特征和优点能够更加明显易懂，下面结合附图和具体实施方式对本发明作进一步详细的说明。

实施例一

如图1所示，本发明实施例提供的一种多种作物估产方法，包括：

步骤100：获取目标区域样本数据，并对所述样本数据进行处理，得到目标区域估产初始指标值；所述样本数据包括若干年的气象历史数据、遥感历史数据和县级历史单产数据；所述目标区域包括多个县级区域；所述目标区域估产初始指标值包括所述目标区域的农业气象指标值、以及所述目标区域内每种作物的县级遥感植被指数指标值和县级趋势单产指标值；其中，所述农业气象指标值和所述县级遥感植被指数指标值均为多个。

所述县级趋势单产指标值的尺度为年；多个所述农业气象指标包括多个第一类农业气象指标和多个第二类农业气象指标；多个所述第一类农业气象指标包括以年为尺度的降水Z指数、累积降水、降水距平、降水距平平均值、降水距平变化率、生长度日GDD、高温度日KDD、有效积温、活动积温、积温距平、生长季开始、生长季结束、生长季长度和平均日照时数；多个所述第二类农业气象指标包括以月为尺度的降水Z指数、累积降水、降水距平、生长度日 GDD、高温度日KDD、有效积温和积温距平；多个所述县级遥感植被指数指标包括在县级耕地范围内的月NDVI平均值和月NDVI距平平均值。

其中，所述气象数据包括气象站点逐日降水数据、温度数据和日照时数数据；所述对所述样本数据进行处理，得到目标区域估产初始指标，具体包括:

首先根据目标区域的气象历史数据，确定所述目标区域的农业气象指标，其次根据目标区域的遥感历史数据和土地利用数据，确定所述目标区域内每种作物的县级遥感植被指数指标，接着根据所述目标区域的县级历史单产数据，采用3a直线滑动平均算法，确定所述目标区域内每种作物的县级趋势单产指标。

步骤200：根据所述农业气象指标值，对所述目标区域进行分区操作，得到多个估产子区域；具体包括：

利用所有所述第一类农业气象指标和SKATER聚类算法，对所述目标区域进行分区操作，得到多个估产子区域。

步骤300：在每个所述估产子区域中，采用随机森林重要性评价算法，对每种作物的估产初始指标值进行重要性排序并进行初次筛选操作，得到初次筛选操作后的估产指标值，具体包括：

首先在每个所述估产子区域中，采用袋外误差法对每种作物的估产初始指标值进行重要性评价，并按照重要性程度将重要性评价结果进行排序，得到重要性排序结果。其次从所述重要性排序结果，筛选出每种指标类型对应的重要性最高指标，并作为初次筛选操作后的估产指标值。

步骤400：结合留一法和随机森林回归算法，将初次筛选操作后的估产指标值按照重要性排序依次加入建模过程，得到在每个估产子区域内每种作物对应的初始单产估算模型集。

步骤500：计算在每个估产子区域内每种作物对应的所述初始单产估算模型集中每个单产估算模型的精度，并将初始单产估算模型集中模型精度最高的单产估算模型确定为标记估产子区域内标记作物的最终单产估算模型；所述标记区域为任一估产子区域，所述标记作物为任一目标区域的作物；所述最终单产估算模型用于估算未来时段标记估产子区域内标记作物的产量。

所述计算在每个估产子区域内每种作物对应的所述初始单产估算模型集中每个单产估算模型的精度，具体包括：

计算在每个估产子区域内每种作物对应的所述初始单产估算模型集中每个单产估算模型的目标均值；所述目标均值为平均绝对相对误差的均值；其中，将目标均值最小的单产估算模型确定为精度最高的单产估算模型。

进一步，本发明实施例还包括：

根据构建最终单产估算模型所用的建模指标，确定目标区域内每个估产子区域内每种作物的建模指标。

获取现阶段目标区域研究对象的相关数据，并根据所述相关数据确定研究对象对应的建模指标值。

根据研究对象对应的建模指标值，构建研究对象的最终单产估算模型，并根据研究对象的最终单产估算模型确定所述研究对象的单产；所述研究对象为目标区域中任一估产子区域内的任一作物。

实施例二

为了执行上述实施例一对应的方法，以实现相应的功能和技术效果，下面提供一种多种作物估产装置。

如图2所示，本发明实施例提供的一种多种作物估产装置，包括：

估产初始指标值计算模块1，用于获取目标区域样本数据，并对所述样本数据进行处理，得到目标区域估产初始指标值；所述样本数据包括若干年的气象历史数据、遥感历史数据和县级历史单产数据；所述目标区域包括多个县级区域；所述目标区域估产初始指标值包括所述目标区域的农业气象指标值、以及所述目标区域内每种作物的县级遥感植被指数指标值和县级趋势单产指标值；其中，所述农业气象指标值和所述县级遥感植被指数指标值均为多个。

估产子区域确定模块2，用于根据所述农业气象指标值，对所述目标区域进行分区操作，得到多个估产子区域。

筛选模块3，用于在每个所述估产子区域中，采用随机森林重要性评价算法，对每种作物的估产初始指标值进行重要性排序并进行初次筛选操作，得到初次筛选操作后的估产指标值。

初始单产估算模型集构建模块4，用于结合留一法和随机森林回归算法，将初次筛选操作后的估产指标值按照重要性排序依次加入建模过程，得到在每个估产子区域内每种作物对应的初始单产估算模型集。

最终单产估算模型确定模块5，用于计算在每个估产子区域内每种作物对应的所述初始单产估算模型集中每个单产估算模型的精度，并将初始单产估算模型集中模型精度最高的单产估算模型确定为标记估产子区域内标记作物的最终单产估算模型；所述标记区域为任一估产子区域，所述标记作物为任一目标区域的作物；所述最终单产估算模型用于估算未来时段标记估产子区域内标记作物的产量。

实施例三

黑龙江作为粮食单产多年保持第一的大省，建立该省的大宗作物的单产估算模型，对于及时掌握该省的农情有积极作用，同时可以为其他区域的估产建模提供方法参考。

根据《黑龙江统计年鉴—2021》，水稻、大豆、玉米三种作物的总产量为黑龙江农作物总产量的98％，但针对该省三种作物的单产估算模型研究较少，建模时使用的样本为单一的遥感数据或者社会统计、生产力数据，没有考虑黑龙江省内气候差异对粮食单产的影响。因此，本发明实施例首先根据黑龙江的农业气候状况对黑龙江进行分区，其次在各区内以遥感植被指数、气象指标、趋势单产作为因变量，以黑龙江的三种大宗作物的实际单产作为自变量，利用随机森林重要性评价方法和回归方法对因变量进行筛选，最终选择精度和重要性排序最高的因变量作为模型的输入变量进行建模，为黑龙江大宗作物的单产估算模型研究提供参考，具体思路如下：

本发明实施例首先使用气象历史数据、县级历史单产数据和遥感历史数据，计算候选建模指标，分别为14个农业气象指标、2个县级遥感植被指数指标和县级趋势单产指标。然后，使用14个农业气象指标进行估产分区；接着利用随机森林重要性评价算法对候选建模指标的重要性进行评估，并对候选建模指标进行初步筛选。接着，在不同估产分区中基于初步筛选后的候选建模指标的重要性顺序并结合留一法和随机森林回归算法，逐一将初步筛选后的候选建模指标加入建模过程，得到单产估算模型，且以估计的预测产量和实际产量间的平均绝对相对误差(MARE)为指标进行模型精度验证。最后，将模型精度最高的候选建模指标作为最终建模指标，并采用留一法确定最后建立的所有模型的MARE的最大值、最小值、均值和均方根误差，以此来反映最终建模的精度和稳定性。

黑龙江省介于东经121°11′—135°05′，北纬43°26′—53°33′之间，东北部与俄罗斯接壤，西部与内蒙古相邻，南部与吉林省相邻，地势大致呈西北部、北部和东南部高，东北部、西南部低，由山地、台地、平原和水面构成，其属于温带大陆性季风气候，多年平均降水量为400～800mm，多年平均气温为-4～6℃，拥有丰富的黑土资源、较高的农业机械化水平，是全国耕地面积最多的省份之一，也是全国粮食单产最高的省份之一。于此同时，黑龙江位于高纬度地区，也是对气候变暖响应最敏感的地区之一，主要表现为气候变干、降水量减少等，使得农作物种植面临着极大挑战。

如图3所示，本发明实施例提供的多种作物估产方法，包括以下步骤：

1)利用黑龙江气象站点数据计算各类农业气象指标，并基于SKATER聚类算法和农业气象指标对黑龙江地区进行分区，得到多个估产分区。

2)基于MOD09Q1.061遥感数据和土地利用数据计算黑龙江各县每种作物的遥感指被指数指标；所述遥感指被指数指标包括月NDVI平均值和月 NDVI距平平均值。

3)利用黑龙江各县历史单产数据，采用3a直线滑动平均法拟合每种作物的趋势单产。

4)在三种作物的不同估产分区内，利用随机森林重要性评价方法对三种作物的候选建模指标进行重要性评估并进行初步筛选。该候选建模指标包括农业气象指标、遥感指被指数指标、趋势单产。

5)结合留一法和随机森林回归算法，将初步筛选后的候选建模指标按照重要性排序逐个加入建模过程，得到单产估算模型，并评估建立的所有模型的精度，选出使得各年份整体建模精度最高的变量作为最终建模变量，并建立最终单产估算模型。

其中，在本发明实施例中，样本数据包括：1)来自于中国气象局气象信息中心的中国国家级地面气象站的2000-2021年的中国气象要素站点观测逐日数据，该数据包括日照、降水、气温等不同类型的日观测数据；2)来自于国家统计局黑龙江省调查总队的玉米、水稻、大豆作物空间分布和三种作物的 2014-2021年的历史单产数据；3)来自于美国航空航天局的2004-2021年的8 天合成的MOD09Q1.06遥感数据，空间分辨率为250m。

农业气象指标值的计算过程为：

本发明实施例利用2000-2021年黑龙江气象站点逐日降水数据、温度数据和日照时数数据计算了14个指标值，具体包括：降水Z指数、累积降水、降水距平、降水距平平均值、降水距平变化率、生长度日GDD、高温度日KDD、有效积温、活动积温、积温距平、生长季开始、生长季结束、生长季长度、平均日照时数。其中所有指标值均参与了估产分区，而降水Z指数、累积降水、降水距平、生长度日GDD、高温度日KDD、有效积温、积温距平，这7个指标值作为候选的估产建模指标值。要特别进行说明的是：在进行估产分区时，各个站点的各类指标值以年为尺度进行计算，并且取多年平均值作为该指标值的最终值，而在进行估产建模时，各个站点的各类指标值以月为尺度进行计算。

遥感植被指数指标值的计算过程为：

NDVI作为遥感领域重要的植被指数，可以较好的反应植被的生长状况以及分布特征。本发明实施例以8天合成的分辨率为250米的地表反射率产品 MOD09Q1.061遥感数据为数据源，计算2004年-2021年共计17年NDVI数据，然后采用自适应滤波算法对NDVI数据进行滤波，对滤波后的NDVI数据按照自然月逐像元筛除17年内的最大值和最小值，计算剩余15个NDVI数值的平均值，作为多年的NDVI月平均值，进而逐像元计算17年每个月份的 NDVI距平(某年某月的NDVI值与该月历史的NDVI平均值的差值)，最后以县为单元，统计三种作物在耕地范围内每个月份的NDVI平均值(后续简称 NDVI)及NDVI距平均值(后续简称NDVI距平)。

趋势单产指标值的计算过程为：

实际单产一般由趋势单产、气象单产、随机单产三部分组成。趋势单产一般是指由作物品种、社会生产力等因素影响的单产分量，气象单产是指由气象因子(主要以农业气象灾害为主)影响的波动性单产分量，随机单产是指由一些随机因素影响的单产分量，但由于随机单产的不确定，在进行单产模拟的过程中一般忽略不计。本发明实施例采用3a直线滑动平均算法拟合趋势单产。该算法将历史实际单产在3a内进行线性回归，形成回归方程及拟合直线。随着滑动直线不断向后移动，不断求得新的回归方程。将每个时间点上基于回归方程求得的预测值平均化，进而得到趋势单产。其中，趋势单产是以年为尺度确定的。

估产分区的计算过程为：

黑龙江的热量资源和降水变率在空间上均呈现不均匀分布，对其进行气候分区，可以针对不同的气候特征建立相对精确的单产估算模型。本发明实施例使用SKATER(Spatial"K"luster Analysis by Tree Edge Removal)聚类算法对黑龙江气候特征进行估产分区。该算法是一种基于最小生成树的图聚类算法，通过切除最小生成树的边来获得满足空间邻接约束的聚类结果。

整体来说三种作物的分区结果类似，只是水稻和其他两种作物在绥化市西北角的分区有所差异。另外，针对三种作物，大兴安岭地区都被单独分区，这是因为大兴安岭地区年平均气温较其他地区寒冷所致。然而，若将大兴安岭地区单独建模，会出现样本过少，影响建模精度的问题，为此将其归入邻近的2 区进行建模，即后续估产时分两个区单独建模，以下简称大豆1、2区，水稻 1、2区，玉米1、2区。

候选建模指标重要性计算与初次筛选过程为：

随机森林算法是由Breiman在2001年提出来的机器学习算法，不仅具有分类回归的功能，还可以对数据进行重要性评价。本发明实施例使用袋外误差法进行候选建模指标重要性评价。袋外误差指的是未参与建模的数据对构建好的分类器的常规误差进行无偏估计的结果，由于其高效性，不再需要交叉验证或者使用单独的测试集进行无偏估计。

具体步骤如下：

1)在黑龙江整省内针对三种不同的作物进行候选建模指标重要性排序，然后根据重要性排序结果进行候选建模指标的初步筛选，得到初步筛选后的建模指标。

2)结合留一法和随机森林建模法，将初步筛选后的建模指标按重要性排序后逐一加入建模过程，得到相应的单产估算模型，并计算每个单产估算模型的MARE均值。

3)将MARE均值最小时对应的参与建模的变量作为最终的建模变量。

首先逐月确定出候选建模指标，并采用随机森林重要性评价算法，对生长季每个月的候选建模指标进行重要性评价，结果如表1所示。其次，按类型计算每种类型内各月候选建模指标的综合排名，并按照综合排名得到初步筛选后的建模指标，其重要性评价结果如图4所示。在图4中，编号0-3依次为三种作物的积温距平、大于10度积温、作物KDD、作物GDD指标；编号4-6依次为三种作物的降水距平、单站降水Z指数、累积降水指标；编号7-8依次为三种作物的NDVI、NDVI距平值。其中，在气温类指标中无论哪种作物的积温距平(编号为0的指标)的重要性排名均最高，三种降水类指标(编号为 4-6的指标)在三种作物中的重要性排名差异很小，但降水距平计算最为简单，不仅可以反应旱涝状况，还可以反应降水量相较于同期减少或增加了多少； NDVI距平值的综合排名高于NDVI。因此，在后续分区建模的温度类、降水类和植被指数类指标中分别选择积温距平、降水距平和NDVI距平参与建模。

利用初步筛选后的建模指标，分区分作物类型进行进一步的重要性评价，并计算各初步筛选后的建模指标的综合平均排名，结果如图5所示。大多数情况下，趋势单产的重要性都排在首位。综合来看，趋势单产的重要性>NDVI 距平>积温距平>降水距平。

在图5中，A-D分别表示趋势单产、积温距平、降水距平、NDVI距平，角标1和2分别表示估产子区域1和估产子区域2。

表1水稻、大豆、玉米的1、2区初筛指标的重要性排序表

应用留一法进行最终模型的建立和精度验证。具体步骤为：

留出某一年的数据不参与建模而作为验证数据，应用其他年份数据建立单产估算模型，利用验证数据进行估产精度验证。例如留出2021年的数据不参与建模，利用2016—2020年数据建模，按照重要性排序，逐一将变量加入随机森林中建立单产估算模型，对按照留一法计算出来的逐年的所有模型的验证精度情况进行综合分析，选出所有年份平均精度最高的变量作为最终的建模输入变量，基于最终筛选的建模输入变量建立的模型即为最终的单产估算模型，最后利用留一法中基于最终筛选的建模输入变量建立的模型的平均绝对相对误差(MARE)的统计值(最大值、最小值、平均值、)来衡量最终单产估算模型的精度和稳定性。

其中，y_i为县i的统计单产，

为模型预测的县i的单产，n为县的个数， MARE值越小表示模型精度越高。

结合留一法和随机森林建模法，将初步筛选后的建模指标按重要性排序后逐一加入建模过程，得到相应的单产估算模型，并计算相应的MARE，结果如图6所示。在图6中，横坐标为逐一加入初步筛选后的建模指标后所确定参与建模的变量总个数，纵坐标是6个MARE的范围(用色带宽度表示)和平均值(用实线表示)。例如，在水稻1区中第一次加入趋势单产，所建立的每个模型的MARE和6个MARE的均值(通过随机森林回归算法建立了6个模型，基于2016-2021年，共计6年的数据，每次留出1年的数据不参与建模，而作为验证数据，用其他年份数据建立模型并进行精度验证，整个过程经历6 遍，对应6个模型)；第二次加入趋势单产、5月NDVI距平，重复上面的步骤；第三次加入趋势单产、5月NDVI距平、5月积温距平，重复上述步骤，以此类推直到加入最后一个初步筛选后的建模指标建模并计算相应的MARE。比较随参与建模的变量总个数增加时MARE均值的变化，选择MARE均值最小时对应的参与建模的变量为最终的变量。例如，在水稻1区，加入最后一个变量后各个模型的整体精度最高，因此以全部变量作为最终的建模变量；而针对水稻2区，累计加入十三个变量后各个模型的整体精度最高，以前十三个变量作为建模的最终变量。在各区针对不同作物筛选的最终的建模变量，及由最终的建模变量建立的模型的精度的范围如表2所示。整体来说，三种作物中水稻的平均估产精度最高，其次是大豆，最后是玉米，但所有作物在不同估产分区的MARE均在0.085以下。

表2最终各分区的单产估算模型建模变量和精度表

本发明实施例使用统计数据、气象数据和遥感数据，利用SKATER聚类方法在黑龙江省进行气候分析，利用随机森林回归算法结合留一法，分区、分作物逐步进行建模变量筛选，最终分区建立了水稻、大豆、玉米三种主要作物的单产估算模型。得到的主要结论如下：

(1)三种作物的分区结果类似，只有水稻和其他两种作物在绥化市西北角的分区有所差异。(2)在全区基于随机森林的变量重要性评价结果显示在温度类指标中积温距平最优，在降水类指标中降水距平、单站降水Z指数、累积降水指标表现相当。分区进一步评价变量重要性的结果显示趋势单产的重要性>NDVI距平的重要性>积温距平的重要性>降水距平的重要性。(3)针对三种作物在不同区域筛选的最终指标使用留一法建立的6个模型的MARE均小于10％，其中水稻的平均估产精度最高(平均MARE在水稻1区为0.040，在水稻2区为0.034)，其次是大豆(平均MARE在大豆1区为0.066，在大豆 2区为0.046)，最后是玉米(平均MARE在玉米1区为0.073，在玉米2区为0.056)，所有模型的MARE的方差均小于0.05％，说明单产估算模型精度表现出良好的稳定性。

本发明实施例针对不同的作物，利用农业气象指标，对黑龙江省进行分区，有利于精细化单产估算模型的建立。在进行气候分区时，使用了SKATER聚类方法。SKATER不仅考虑了数据的属性，还考虑了数据的空间邻接关系，比起传统的聚类方法(如K-means、ISODATA)，其分区结果在空间上更连续、也更合理。

根据输入指标的重要性并计算其综合平均排名，选用了积温距平和降水距平作为气象类指标参与建模。积温距平和降水距平计算简单，可以反应出热量资源和降水资源的变化，也可以指示农业气象灾害，如高温、冷害、洪涝和干旱。然而，影响作物生长的气象因素不仅仅包括温度、降水，还有光照、辐射、空气湿度等并未在实施列中考虑。此外，除了气象因素，非气象因素，例如病虫害也会影响作物的单产。无论是气象因素还是非气象因素，如果影响了作物生长，都可能导致NDVI偏离历史常年的平均，因此NDVI距平不仅可以反映气象因子的影响，还可以反映其他胁迫的影响，是一个更加综合的指标。

在分区后的指标重要性排序中，将玉米、大豆、水稻的不同区域的相同指标的排名分别求平均值，结果显示趋势单产对于水稻、大豆、玉米的重要性的综合平均排名分别为1、1、4.5名，积温距平的综合平均排名分别为10.2、10.4、 10.8名，降水距平的综合平均排名为12.6、13.2、11.2名。不论哪一种作物，排名最高的指标均为趋势单产，说明趋势单产对于单产的影响最大，加入趋势单产建模可以提高建模的精度。三种作物的气象类指标中积温距平的综合平均排名高于降水距平，这可能是由于气温是黑龙江地区农作物生长的主要限制因子。

实施例四

本发明实施例提供一种电子设备包括存储器及处理器，该存储器用于存储计算机程序，该处理器运行计算机程序以使电子设备执行实施例一的多种作物估产方法。

可选地，上述电子设备可以是服务器。

另外，本发明实施例还提供一种计算机可读存储介质，其存储有计算机程序，该计算机程序被处理器执行时实现实施例一的多种作物估产方法。

本说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似部分互相参见即可。

本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处。综上所述，本说明书内容不应理解为对本发明的限制。

Claims

1.一种多种作物估产方法，其特征在于，包括：

2.根据权利要求1所述的一种多种作物估产方法，其特征在于，还包括：

根据构建最终单产估算模型所用的建模指标，确定目标区域内每个估产子区域内每种作物的建模指标；

获取现阶段目标区域研究对象的相关数据，并根据所述相关数据确定研究对象对应的建模指标值；

3.根据权利要求1所述的一种多种作物估产方法，其特征在于，所述县级趋势单产指标值的尺度为年；多个所述农业气象指标包括多个第一类农业气象指标和多个第二类农业气象指标；多个所述第一类农业气象指标包括以年为尺度的降水Z指数、累积降水、降水距平、降水距平平均值、降水距平变化率、生长度日GDD、高温度日KDD、有效积温、活动积温、积温距平、生长季开始、生长季结束、生长季长度和平均日照时数；多个所述第二类农业气象指标包括以月为尺度的降水Z指数、累积降水、降水距平、生长度日GDD、高温度日KDD、有效积温和积温距平；多个所述县级遥感植被指数指标包括在县级耕地范围内的月NDVI平均值和月NDVI距平平均值。

4.根据权利要求1或者3所述的一种多种作物估产方法，其特征在于，所述气象数据包括气象站点逐日降水数据、温度数据和日照时数数据；所述对所述样本数据进行处理，得到目标区域估产初始指标值，具体包括:

根据目标区域的气象历史数据，确定所述目标区域的农业气象指标；

根据目标区域的遥感历史数据和土地利用数据，确定所述目标区域内每种作物的县级遥感植被指数指标；

根据所述目标区域的县级历史单产数据，采用3a直线滑动平均算法，确定所述目标区域内每种作物的县级趋势单产指标。

5.根据权利要求3所述的一种多种作物估产方法，其特征在于，所述根据所述农业气象指标值，对所述目标区域进行分区操作，得到多个估产子区域，具体包括：

6.根据权利要求1所述的一种多种作物估产方法，其特征在于，在每个所述估产子区域中，采用随机森林重要性评价算法，对每种作物的估产初始指标值进行重要性排序并进行初次筛选操作，得到初次筛选操作后的估产指标值，具体包括：

在每个所述估产子区域中，采用袋外误差法对每种作物的估产初始指标值进行重要性评价，并按照重要性程度将重要性评价结果进行排序，得到重要性排序结果；

从所述重要性排序结果，筛选出每种指标类型对应的重要性最高指标，并作为初次筛选操作后的估产指标值。

7.根据权利要求1所述的一种多种作物估产方法，其特征在于，所述计算在每个估产子区域内每种作物对应的所述初始单产估算模型集中每个单产估算模型的精度，具体包括：

8.一种多种作物估产装置，其特征在于，包括：

9.一种电子设备，其特征在于，包括存储器及处理器，所述存储器用于存储计算机程序，所述处理器运行所述计算机程序以使所述电子设备执行根据权利要求1至7中任一项所述的多种作物估产方法。

10.一种计算机可读存储介质，其特征在于，其存储有计算机程序，所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的多种作物估产方法。