CN110909933A - 一种耦合作物模型与机器学习语言的农业干旱快速诊断和评估方法 - Google Patents

一种耦合作物模型与机器学习语言的农业干旱快速诊断和评估方法 Download PDF

Info

Publication number
CN110909933A
CN110909933A CN201911141251.0A CN201911141251A CN110909933A CN 110909933 A CN110909933 A CN 110909933A CN 201911141251 A CN201911141251 A CN 201911141251A CN 110909933 A CN110909933 A CN 110909933A
Authority
CN
China
Prior art keywords
data
drought
crop
model
simulation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911141251.0A
Other languages
English (en)
Other versions
CN110909933B (zh
Inventor
张朝
李子悦
陶福禄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Normal University
Original Assignee
Beijing Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Normal University filed Critical Beijing Normal University
Priority to CN201911141251.0A priority Critical patent/CN110909933B/zh
Publication of CN110909933A publication Critical patent/CN110909933A/zh
Application granted granted Critical
Publication of CN110909933B publication Critical patent/CN110909933B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/24Earth materials
    • G01N33/245Earth materials for agricultural purposes
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/24Earth materials
    • G01N33/246Earth materials for water content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/02Agriculture; Fishing; Forestry; Mining
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A40/00Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
    • Y02A40/10Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture
    • Y02A40/22Improving land use; Improving water use or availability; Controlling erosion

Landscapes

  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • Analytical Chemistry (AREA)
  • Pathology (AREA)
  • Immunology (AREA)
  • Marketing (AREA)
  • Environmental & Geological Engineering (AREA)
  • General Life Sciences & Earth Sciences (AREA)
  • Geology (AREA)
  • Remote Sensing (AREA)
  • General Business, Economics & Management (AREA)
  • Biochemistry (AREA)
  • Food Science & Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Molecular Biology (AREA)
  • Development Economics (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Game Theory and Decision Science (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)

Abstract

本发明公开了一种耦合作物模型与机器语言的农业干旱诊断和评估方法,包括:S1、获取研究区内相关数据;S2、利用步骤S1获取的数据来完成研究区内作物模型的本地化;S3、针对作物不同生育阶段,设置不同干旱降水情景数据,并将其输入到本地化后的作物模型中,得出研究区内各格点的各个干旱情景下的模拟数据;S4、基于S3中干旱情景数据与对应作物模型模拟数据,计算特征变量;S5、基于S4中特征变量将对应作物模型模拟的产量损失率数据作为预测变量,构建样本数据集,并将其输入到随机森林模型中构建作物干旱脆弱性模型;S6、利用所述作物干旱脆弱性模型来诊断和评估在研究时段内的作物干旱情况。

Description

一种耦合作物模型与机器学习语言的农业干旱快速诊断和评 估方法
技术领域
本发明涉及农业信息技术领域,具体而言涉及一种耦合作物模型与机器学习语言的农业干旱快速诊断和评估方法。
背景技术
干旱作为一种复杂多发的极端气象灾害,每年在全球造成的直接经济损失可达所有自然灾害损失的43%以上,在我国造成的损失约占全球干旱总损失的42%。其中,农业因其与天气密切相关的特性,更是成为了受干旱影响最大的领域之一。农业干旱是指农作物生长过程中土壤水分不足,因水分供需不平衡而阻碍作物正常生长的现象。目前,针对农业干旱及其对农作物长势和产量影响的研究主要有以下三种:
(1)基于盆栽或大田试验探索作物在干旱胁迫下的生理响应和生理机制研究。这类研究具有较强的机理性,可以为厘清水分胁迫下作物的响应机理提供重要的参考,也为其他干旱胁迫的响应研究提供先验知识。但它的耗时较长,人力物力投入较大,通常局限于小尺度。
(2)基于干旱指标构建与作物长势或产量信息相关的统计关系研究。目前,用于表征干旱情况的指数已经发展了数百种,包括基于气象数据的干旱指数:标准降水指数(SPI)、帕尔默干旱指数(PDSI)和标准化降水蒸散指数(SPEI),基于遥感数据的干旱指数:条件植被指数(VCI)、归一化植被指数(NDVI)、植被供水指数(VSWI)、温度植被干旱指数(TVDI)、冠层温度和冠层含水量,以及基于土壤湿度的农业干旱监测指数:土壤湿度亏缺指数(SMDI)、土壤湿度距平(SMA)、标准化土壤湿度指数(SSMI)、土壤湿度百分位(SMP)等。但是,大部分干旱指数多针对气象干旱,缺乏农学意义;少部分针对于农业干旱的指数受限于根区土壤水分数据,也难以实现大范围高精度的研究。此外,干旱指数的选取对结果影响较大,增加干旱指数的农学意义并提高指数的农业干旱监测能力是目前研究的热点。
(3)基于作物模型探索干旱胁迫对作物生长的影响研究。随着人们对作物生理生态过程机理认识的不断深入,特别是利用数学方法对植物生理过程(如冠层光能截获及光合作用)进行很好的描述。作物模型作为机理性强的工具,在农田科学管理、精准农业、气候变化影响评价、以及农业决策管理等方面已有大量研究开展。虽然作物模型具有较强的机理性,但是现有基于作物模型的干旱研究大多对真实情景做了较大程度的简化,难以反映真实的干旱情况,且模型在模拟过程中存在大量的不确定,模型模拟精度有待提高。例如微波遥感因其不受云层干扰,拥有全天时和全天候观测能力,可以获取大范围的土壤湿度,但是目前也仅可以反演表层2-5cm的土壤湿度并且可获得的公开数据在中国地区数据较粗糙,质量并不高。以看出,现有土壤湿度数据大多时空精度偏低且多停留于浅层土壤,而粮食作物根系通常都在20cm左右(甚至更深),大多数研究难以反映作物真实的水分胁迫状况。
因此,如何利用现有的多源数据高精反演出大范围的、长时间序列的土壤湿度数据,更加合理地模拟干旱情景,从而进行区域农业干旱的高精度预测预警,实现干旱情境下区域的业务化估产仍是当前亟需解决的问题。也即,需要新技术来至少部分解决现有技术中上述局限性。
发明内容
为了至少部分解决现有技术中存在的不足,本发明首次将多源数据同化作物模型系统与机器学习算法结合起来应用到区域农业干旱研究中,在大区域上反演了较高精度的深层土壤湿度数据(例如20cm和50cm),并实现对复杂机理模型的优化和代理,可以在作物例如小麦成熟之前更加合理的预测农业干旱造成的产量损失与受灾面积。
根据本发明一方面,提供了一种耦合作物模型与机器学习语言的农业干旱诊断和评估方法,包括如下步骤:
S1、获取研究区内相关数据,所述数据包括研究区的气象数据、土壤属性数据、作物产量数据、物候数据以及研究区域全生育期内的遥感LAI时序数据;
S2、利用步骤S1获取的物候数据、土壤属性数据及LAI数据进行分阶段同化,来完成研究区内作物模型的本地化;
S3、针对作物不同生育阶段,设置不同干旱降水情景数据,并将其输入到本地化后的作物模型中,得出研究区内各格点的各个干旱情景下的模拟数据,所述模拟数据包括模拟产量、模拟产量损失率、一定深度的模拟土壤湿度和模拟LAI,其中,干旱降水情景包括在各生育阶段内0%,10%,30%,50%,70%,90%,100%连续降雨时长为零的情景;
S4、基于S3中干旱情景数据与对应作物模型模拟数据,计算各生育阶段和全生育期的标准降水指数(SPI),一定深度土壤层的标准化土壤湿度指数(SSMI)和相对叶面积指数(RLAI),作为特征变量,例如当作物小麦时,生育阶段可以包括3个阶段,也即出苗-返青、返青-抽穗以及抽穗-成熟期,SSMI可以选择20cm以及50cm深度的数值,这样就可以得到4个生育阶段(加上全生育期)以及4个特征变量(SPI,SSMI-20cm和SSMI-50cm,RLAI),一共4×4=16个特征变量;
S5、基于S4中特征变量将对应作物模型模拟的产量损失率数据作为预测变量,构建样本数据集,并将其输入到随机森林模型中构建作物干旱脆弱性模型,其回归决策树表示为式(1):
Figure BDA0002280991900000051
式中h(x)为随机森林的最终预测结果,h(x,θi)为随机森林中的某棵回归决策树的预测结果,x为该决策树使用的相应特征变量的集合,θi为独立同分布的随机向量,K为决策树个数,N为训练样本子集个数;
S6、利用所述作物干旱脆弱性模型根据特征变量得到对应的产量损失率,从而来诊断和评估在研究时段内的作物干旱情况。
根据本发明的实施方案,其中所述作物选自小麦、玉米、大豆、水稻。
根据本发明的实施方案,其中所述作物模型为MCWLA系列模型。
根据本发明的实施方案,其中步骤S3中模拟土壤湿度为20cm以及50cm土壤层湿度。
根据本发明的实施方案,其中遥感LAI数据选自Copernicus LAI,GLASS LAI以及GLOBMAP LAI。
根据本发明的实施方案,其中所述作物为小麦,步骤S3中生育阶段包括出苗-返青、返青-抽穗以及抽穗-成熟。
根据本发明的实施方案,其中所述标准化土壤湿度指数(SSMI)为20cm的标准化土壤湿度指数(SSMI_20cm)和50cm的标准化土壤湿度指数(SSMI_50cm)。
根据本发明的实施方案,其中步骤S6中作物干旱情况包括干旱产量损失以及干旱空间分布。
根据本发明的实施方案,其中所述模拟产量损失率以下式(2)所示
Figure BDA0002280991900000061
其中Ysi指第i个干旱情景的模拟产量(kg/ha),Ysi是指理想无灾害年的模拟产量(kg/ha),YLRsi指第i个干旱情景的模拟产量损失率(%)。
本发明将作物模型与机器学习算法混合建模,充分利用了现有的易于获取的多源数据产品在格点尺度上实现了深层土壤湿度数据反演,节省了大量的时间、人力、金钱成本,更是解决了如何在大区域尺度上快速进行干旱损失评估与预测的问题。本技术可以为采取不同适应性措施缓解干旱对产量影响的研究提供前期准备与理论参考,为区域农业干旱研究提供重要的科学依据,也有助于国家有关部门进行粮情判断、粮食调控、粮食贸易等科学决策。
附图说明
附图中相同的附图标记标示了相同或类似的部件或部分。本发明的目标及特征考虑到如下结合附图的描述将更加明显,附图中:
图1是根据本发明一个实施方案的耦合作物模型与机器学习语言的农业干旱诊断和评估方法的流程示意图。
图2是根据本发明一个实施方案的基于随机森林的干旱脆弱性模型构建流程示意图;
图3是模型本地化前后MCWLA-Wheat模型对研究区内站点20cm和50cm土壤层的土壤湿度模拟结果对比图;
图4是利用本发明的干旱脆弱性模型模拟研究区内小麦干旱产量损失的结果比较图;
图5是利用本发明的干旱脆弱性模型模拟研究区内小麦干旱产量损失的空间分布图。
具体实施方式
为清楚地说明本发明中的方案,下面给出优选的实施例并结合附图详细说明。以下的说明本质上仅仅是示例性的而并不是为了限制本公开的应用或用途
应该理解的是,本发明所引用的作物模型、遥感数据、随机森林回归、多元线性回归等本身是已知的,例如模型的各个子模块、各种参数、运行机制,模型的本地化等等,因此本发明重点阐述作物模型和机器学习语言之间耦合过程。
图1是根据本发明的一个实施方案的耦合作物模型与机器学习语言的农业干旱诊断和评估方法的流程示意图;图2是根据本发明一个实施方案的基于随机森林的干旱脆弱性模型构建流程示意图。参考图1和2,根据本发明的耦合作物模型与机器学习语言的农业干旱诊断和评估方法,包括如下步骤:
首先,获取研究区内相关的数据用来运行或优化模型(本地化)。这些数据可以包括研究区的气象数据、土壤属性数据、作物产量数据、物候数据以及研究区域全生育期内的遥感LAI时序数据。这些数据可以通过实测、遥感或者统计的方法得出。
更具体地,图中示出了所采用的作物模型为MCWLA(Model to capture the Crop-Weather relationship over a Large Area)系列模型中的MCWLA-Wheat(小麦)。MCWLA系列模型是为满足区域尺度作物生长模拟需求所开发的作物生长模型,已经成功应用在了国内外多个作物生长模拟研究中,表现稳健良好。当然也可以适用其他适当的作物模型。气象数据可以包括每日最高气温、最低气温、太阳辐射、水汽压、降水和风速等。土壤属性数据包括基于土壤质地的渗透率和有效田间持水量等。遥感LAI数据可以选自Copernicus LAI,GLASS LAI以及GLOBMAP LAI等等。在该示例中使用的遥感数据是北京师范大学梁顺林教授团队反演制作的GLASS LAI产品,该产品是对MODIS LAI产品的改进,其在生产过程中已经包括了S-G滤波预处理,在数据质量上有一定提升且具有更好的时间完整性和空间连续性。
基于上述数据,进行作物模型的优化(本地化)。作物模型的本地化方法已经为本领域技术人员所熟知,具体的一种方法例如可以参见本申请人之前的专利201910094036.3,因此下面对优化方法简单地进行说明。
参考附图,利用研究区域全生育期内的遥感LAI时序数据,通过识别约束条件下曲线的拐点和峰值来判断小麦种植区,并提取出种植区域内小麦的关键生育期。同时,将小麦的LAI曲线做归一化处理,用于下面的研究步骤。更具体地,根据LAI曲线识别小麦种植区的具体方法为:①基于农气站的资料,设置研究区域小麦关键生育期(返青期和抽穗期)的约束;②在约束时期内对关键生育期进行识别,其中对返青期的识别需要满足如下条件:1)返青期节点之前的遥感反演数据维持在较低值的水平,不存在异常的高值;2)返青期节点之后的遥感反演数据需要识别出连续上升趋势。对抽穗期的识别需要满足如下条件:1)峰值节点前至少有连续三期的遥感数据反映出上升趋势;2)峰值节点后至少有连续三期的遥感数据呈现下降趋势;③将②中能够同时识别出返青期和抽穗期的格点作为小麦种植区域。
然后,利用县级产量、小麦种植格点的关键生育期信息、农气站实测土壤湿度数据、归一化LAI数据优化作物生长模型MCWLA-Wheat的基础参数组,完成模型的多元数据同化,得到了各县的本地化MCWLA-Wheat模型。更具体地,优化可以采用“校准型”策略,对MCWLA-Wheat模型中的19个不同功能的参数进行了优化。优化的核心思路是依据多源数据构建不同的代价函数,并通过求解代价函数的最小值(NRMSE最小值)来寻找模型的最优参数组:
Figure BDA0002280991900000091
Figure BDA0002280991900000092
式中n是数据个数,S和O分别表示模拟和观测数值,
Figure BDA0002280991900000093
是观测值的平均值。具体的优化方法为:①构建县级记录产量与模拟产量的代价函数,利用PSO(粒子群优化法)来迭代完成模型中影响生物物理过程的多个参数的优化;②构建步骤(2)中得到的生育期与模拟生育期的代价函数,利用二分法来迭代完成模型中影响作物生长发育的关键参数的优化;③构建站点记录土壤湿度与其10km缓冲区内模拟土壤湿度的代价函数,利用PSO来迭代完成模型中影响土壤水初始化的关键参数的优化;④构建步骤(2)中得到的归一化LAI与归一化模拟LAI的代价函数,利用PSO来迭代完成模型中影响叶面积发育的关键参数的优化。表1是进行模型本地化(优化)时调整的MCWLA-Wheat模型参数及其含义和先验区间具体参数,具体如下:
表1:
Figure BDA0002280991900000101
本地化完成之后,针对作物不同生育阶段,设置不同干旱降水情景数据,并将其输入到本地化后的作物模型中,得出研究区内各格点的各个干旱情景下的模拟数据,所述模拟数据包括模拟产量、模拟产量损失率、一定深度的模拟土壤湿度和模拟LAI,其中,干旱降水情景包括在各生育阶段内0%,10%,30%,50%,70%,90%,100%连续降雨时长为零的情景。
更具体地,干旱情景可以设置基于多年平均日降雨数据进行的。根据灾害统计年鉴,首先可以为每一个县选择一个无灾害年份,并参考已有研究,在格点尺度上将各县无灾害年的每日降雨数据替换成多年平均日降雨数据(例如2000~2015年),将基于替换了降雨数据之后的无灾害年气象数据的模拟产量作为该县的无灾害年的理想产量,记作Yck,用于式(2)中干旱情景的产量损失计算。根据一定期限(例如2001~2008年)研究区设定生育阶段内无降雨天数的历史记录情况,再考虑极端干旱情况的出现,本研究针对不同作为的不同生育阶段(例如小麦可以包括出苗-返青、返青-抽穗、抽穗-成熟3个生育期阶段,其他作物可以类似的设置)设置了该生育阶段连续0%,10%,30%,50%,70%,90%,100%时长降雨为零的干旱情景。因此,对于小麦,除去全生育期都无干旱的情景,得到了一共7×7×7-1=342种干旱情景,其中每一个干旱情景的县产量损失率计算如下:
Figure BDA0002280991900000111
式中Ysi指第i个干旱情景的模拟产量(kg/ha),Yck是指理想无灾害年的模拟产量(kg/ha),YLRsi指第i个干旱情景的模拟产量损失率(%)。其中县级产量可以基于每个格点的模拟产量与格点小麦种植比例数据汇总计算得到。
基于上述干旱情景数据与对应作物模型模拟数据,可以计算三个生育阶段(P1、P2、P3)和全生育期(P4)的标准降水指数(SPI),20cm和50cm深度土壤层的标准化土壤湿度指数(SSMI)和相对叶面积指数(RLAI),具体如下:
(1)SPI用于监测地表干旱,可以基于各干旱情景的降雨数据来计算获得,其计算例如可以是基于Taesam Lee(2009)(https://www.mathworks.com/matlabcentral/fileexchange/26018-standardized-precipitation-index)在
Figure BDA0002280991900000123
上提供的SPI计算程序。据世界气象组织报道3~6月时间尺度的SPI比较适合监测农业干旱,因此本发明选择3个月作为时间尺度,基于干旱情景的降雨数据计算SPI指数,获得干旱情景SPI数据集;
(2)SSMI用于监测地下干旱,可以基于各干旱情景下作物模型同化系统输出的土壤湿度数据来计算获得,其计算可以表示为式5;
Figure BDA0002280991900000121
式中,SM为某时间尺度的土壤湿度值,
Figure BDA0002280991900000122
为该时间尺度上的多年平均土壤湿度,σ为该时间尺度上多年土壤湿度标准差;例如可以选择20cm和50cm深度土壤层的标准化土壤湿度指数(SSMI),当然也可以选择其他适当的深度。
(3)RLAI用于监测作物在干旱胁迫下的生长状况,可以基于各干旱情景下作物模型同化系统输出的LAI数据来计算获得,其计算可以通过各干旱情景下作物模型输出的绝对LAI值除以全生育期内最大LAI计算获得。
这16个因子(SPI_P1、SPI_P2、SPI_P3、SPI_P4、SSMI_20cm_P1、SSMI_20cm_P2、SSMI_20cm_P3、SSMI_20cm_P4、SSMI_50cm_P1、SSMI_50cm_P2、SSMI_50cm_P3、SSMI_50cm_P4、RLAI_P1、RLAI_P2、RLAI_P3、RLAI_P4)即为后续随机森林建模中使用的特征变量,其对应的产量损失率(YLRsi)即为预测变量,这两者结合构建了样本数据集。
然后,将此样本数据集输入到随机森林模型,构建作物干旱脆弱性模型,其基于回归决策树的预测原理可以表示为式(1):
Figure BDA0002280991900000131
式中h(x)为随机森林的最终预测结果,h(x,θi)为随机森林中的某棵回归决策树的预测结果,x为该决策树使用的相应特征变量的集合(例如每棵决策树均可以在16个特征变量(因子)中随机选择特征变量),θi为独立同分布的随机向量,K为决策树个数,N为训练样本子集个数;
更具体的,随机森林回归算法为了提高模型的预测精度并防止出现过拟合的情况,结合了袋装法得到训练样本子集,并结合随机子空间法得到节点分裂特征。基本思想如下:(1)袋装法通过有放回地随机抽样,从原始样本数据集中重复抽样得到K个与原始样本数据集大小相等的训练样本N,每个训练样本构成一棵决策树。每次进行Bootstrap重抽样时,未被抽中的样本的概率为(1-1/N)N,当N趋向于无穷大时,未被抽中样本的概率越接近1/e,约为0.368,即原始样本中有36.8%的数据未被抽中,这些数据被称为袋外数据(Outof Bag,OOB),因其未参与回归树的构建,故可用来估计预测袋外数据误差(OOB误差)及评估自变量对因变量的影响程度。另外,基于OOB预测误差可以检验模型的泛化能力,不需再使用测试集检验模型的精度。通过袋装法得到的K个训练样本都不相同,保证了回归树的差异性;(2)随机子空间法通过袋装法得到K棵回归树后,每个分裂节点随机抽取所有特征中的M个特征作为当前节点分裂的特征子集,根据分类回归树(Classification andRegression Tree,CART)方法在特征子集中选择最优分裂方式进行分裂。通过随机子空间法得到的回归树具有随机性和独立性;(3)每棵回归树自上向下分裂生长,直到某个叶子节点到达输出估测值。然后,将森林内所有回归树输出的结果求平均得到最终干旱脆弱性模型。
利用所述作物干旱脆弱性模型来诊断和评估在研究时段内的作物干旱情况,例如模拟干旱产量损失以及干旱空间分布。
下面结合具体实施例,来进一步阐述本发明的方法:
以华北平原地区小麦为例,示例性说明本发明的方法的具体应用,但不用来限制本发明的范围。
选择河北、山东、河南和安徽四省的小麦种植区域作为研究区域,共涉及159个县。研究区域地处111.5°E–118.2°E,32.1°N–38.8°N,地形以平原为主,占据了大部分华北平原的小麦主产区。气候属温带季风性气候,平均温度约15.6℃,年均降水量约834.5mm。获取以下数据:气象数据采用了拥有足够插值精度(R2>0.8),由Yuan等人制作的全国0.5°×0.5°格网气象数据集中2000-2008年的部分,该数据集包含了MCWLA-Wheat模型模拟所需的天步长气象数据,包括最高气温(℃)、最低气温(℃)、太阳辐射(MJ/m2)、相对湿度(%)(可利用公式转换为模型所需水汽压数据)、日总降水量(mm)、风速(m/s)等数据。模型模拟中的土壤属性数据来源于FAO土壤数据库,包括基于土壤质地的渗透率和有效田间持水量,分辨率为5′。土壤属性数据库主要应用于土壤水平衡部分的计算。2001-2008年县级小麦单产记录从中国种植业信息网和县级统计年鉴上整理得出,主要用于作物生长模型的参数本地化与模拟效果评估。农业气象站的物候记录数据从中国气象数据网获得。遥感数据使用的是2001-2008年的GLASS LAI产品,该产品的空间分辨率为1km,时间分辨率为8天,满足本技术的需求。
对研究区域全生育期内的GLASS LAI数据按时间序列合成,对每个格点单元的LAI节点数据使用三次样条插值得到连续的LAI曲线。然后识别得到的LAI曲线的拐点和峰值,将其分别作为小麦返青期和抽穗期的标志。首先,对研究区域小麦返青期和和抽穗期的可能时期进行划定以避免将其他地物误识别为小麦。其中,返青期的时间设定在每年的2-3月,抽穗期设定在4月左右。然后,在划定的可能时期内进行识别,其中对返青期的识别需要满足如下条件:(1)返青期节点之前的遥感反演数据维持在较低值的水平,不存在异常的高值;(2)返青期节点之后的遥感反演数据需要识别出连续上升趋势。对抽穗期的识别需要满足如下条件:(1)峰值节点前至少有连续三期的遥感数据反映出上升趋势;(2)峰值节点后至少有连续三期的遥感数据呈现下降趋势。成熟期的遥感反演是一个较为棘手的技术问题。天气状况,农民的种植收获习惯,格点内可能存在的其他植被的生长以及背景噪音的影响等等都会影响对遥感反演的LAI曲线末端的识别。因此,为了提高效率,各个格点单元的成熟期由农气站的记录进行反距离权重空间插值获得。
基于上述步骤识别返青期和抽穗期的原则,对初步划定的约65万个1km×1km格点2001-2008年的GLASS LAI数据进行处理,如果一个格点在某一年的LAI反演数据完全符合上述提取规则,则认为当地在当年种植了小麦,反之则认为该格点在当前年份没有种植小麦。最终,保留在2001-2008年期间至少有一年被识别为种植了小麦的格点,作为研究区域内小麦的种植区以及潜在的研究区。
然后,分步同化了4种不同的数据,共计对MCWLA-Wheat模型中的19个不同功能的参数进行了优化,具体内容如下:
①将上述准备的数据输入MCWLA-Wheat模型,并根据参数的先验区间初始化参数,在县级尺度上模拟2001~2008的产量。将其与实测单产数据构建代价函数,使用PSO优化方法为每个县都获得一套适用于2001~2008年的生物物理过程参数。同一个县内的格点使用同一套参数。
②针对MCWLA-Wheat模型中作物生长发育的模拟方程是一个时间上的单调函数,且每个发育阶段仅设置了一个待优化参数的特点,选择了二分法逐格点逐年实现对作物生长发育参数的优化。对返青期和抽穗期相关参数的校准是基于格点尺度以及年步长进行的,每个格点在每一年都会对相关的作物生长发育参数进行重新校准以获得与遥感反演数据相匹配的物候模拟结果。对于成熟期相关参数的校准采用了参数先验的办法,即在2001-2008年对每个格点的成熟期进行参数校准,在每个格点获得一个使模拟和农气站插值成熟期年际误差最小的成熟期作物生长发育参数,然后将该参数应用于当前格点2001-2008年的模型模拟。
③以研究区内29个农业气象站为中心,设置10km范围的缓冲区。对于任意一个缓冲区,标记区内有效的小麦种植格点。对于标记的格点,基于②得到的校准后的结果,采用粒子群优化算法进行参数优化。首先,逐年逐格点运行作物生长模型,模拟20cm和50cm土壤层的土壤湿度;然后,将各格点模拟结果与其对应的中心农气站记录的2001~2008年土壤湿度比较,使用PSO优化方法为每个标记格点都获得一套适用于2001~2008年的土壤初始化参数。然后将其使用反距离权重法插值到整个研究区的每一个格点。图2是模型本地化前后MCWLA-Wheat模型对研究区内站点20cm和50cm土壤层的土壤湿度模拟结果图,如图2所示,在同化之后土壤湿度模拟精度大幅度提高。
④基于MCWLA-Wheat模型模拟的2001~2008年间每日LAI数据,在格点尺度上与GLASS LAI进行匹配计算NRMSE以构建代价函数,最终每个格点都获得一套适用于2001~2008年的叶面积发育参数。
之后将小麦的生育期时段分成出苗-返青,返青-抽穗,抽穗-成熟三个阶段。其中出苗-返青期大约时长4个月,返青-抽穗期大约时长2个月,抽穗-成熟期时长大约1个半月。针对每个生育阶段都设置了该生育阶段连续10%,30%,50%,70%,90%,100%时长降雨为零的干旱情景。可以其中将连续10%、30%天数降雨为零的干旱定义为轻度干旱;连续50%、70%天数降雨为零的干旱定义为中度干旱;连续90%、100%天数降雨为零的干旱定义为重度干旱。
本实施例中一共选择了16个特征进行随机森林回归建模,分别是出苗-返青期,返青-抽穗期,抽穗-成熟期和全生育期的SPI,SSMI_20cm,SSMI_50cm和RLAI指数。其中SPI的时间尺度是三个月,用于监测地表干旱;20cm和50cm深度的SSMI用来反映土壤水分亏缺程度,用于监测地下干旱;而RLAI用来监测作物在干旱胁迫下的生长状况。
更具体地,本发明将每个格点各干旱情景下的冬小麦16个特征作为特征变量,对应的冬小麦产量损失率作为预测变量,再将两者结合作为原始样本(共342组数据)输入随机森林回归模型。通过Bootstrap方法重新有放回地抽样得到500个与原始样本数据集大小相等的训练样本子集,共生成了500棵回归树,构成随机森林。在回归树生长过程中,每个节点进行分裂时,利用据分类回归树(Classification and Regression Tree,CART)方法随机选取总特征变量个数的1/3个变量进行分裂,分裂过程中无需剪枝。每棵回归树自上向下分裂生长,直到某个叶子节点到达输出估测值。将森林内所有回归树输出的结果求平均得到最终干旱脆弱性模型。根据这个干旱脆弱性模型,我们可以仅通过输入这16个特征变量,得到较高精度的干旱产量损失率。
基于随机森林回归构建的小麦干旱脆弱性模型,我们选择2002年产量损失超过10%的真实干旱事件进行损失评估,以此来评价验证脆弱性模型的损失模拟能力。图4展示了代表县的损失模拟结果,可以看出随机森林回归效果在稳定性上优于传统多元线性回归(多元线性回归为本领域所熟知,在此没有赘述),小麦产量损失模拟结果具有较高的可信度。图5展示了2002年的基于随机森林回归的小麦损失的空间模拟情况,可以看出基于随机森林回归的干旱脆弱性模型在评估大区域产量损失的空间分布上基本与灾害统计年鉴保持一致。
与现有技术相比,本发明能够实现如下的优势:
1.可以采用大区域尺度作物生长模型,因此数据准备资料获取容易,在数据具有较好的时间完整性和空间连续性,节省大量遥感数据预处理的时间成本。
2.本丰满充分发挥了多源数据和作物模型的优势,以农气站记录的土壤湿度数据为基础,能够校准格点尺度的土壤湿度初始化参数,极大提高了土壤湿度的模拟精度,解决了大区域尺度上深层土壤湿度数据缺失的问题。可以花费最少的时间和人力在大区域上反演较高精度的深层土壤湿度数据。
3.本发明的干旱脆弱性模型的构建基于反映地下干旱情况的SSMI,反映地表干旱的SPI和反映作物生长状况的相对LAI指标完成,更加综合与全面地刻画了作物对农业干旱的响应情况。
4.本发明首次将多源数据同化作物模型系统结合机器学习算法应用到区域农业干旱研究中,基于机理性强的作物模型的干旱情景模拟结果具有可解释性。而基于作物模型的输出数据,使用随机森林回归构建干旱脆弱性模型实现对复杂机理模型的代理,是机器学习算法在农业灾害研究中的突破。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的装置及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (9)

1.一种耦合作物模型与机器学习语言的农业干旱诊断和评估方法,包括如下步骤:
S1、获取研究区内相关数据,所述数据包括研究区的气象数据、土壤属性数据、作物产量数据、物候数据以及研究区域全生育期内的遥感LAI时序数据;
S2、利用步骤S1获取的物候数据、土壤属性数据及LAI数据进行分阶段同化,来完成研究区内作物模型的本地化;
S3、针对作物不同生育阶段,设置不同干旱降水情景数据,并将其输入到本地化后的作物模型中,得出研究区内各格点的各个干旱情景下的模拟数据,所述模拟数据包括模拟产量、模拟产量损失率、一定深度土壤层的模拟土壤湿度和模拟LAI,其中,干旱降水情景包括在各生育阶段内0%,10%,30%,50%,70%,90%,100%连续降雨时长为零的情景;
S4、基于S3中干旱情景数据与对应作物模型模拟数据,计算各生育阶段和全生育期的标准降水指数(SPI),一定深度土壤层的标准化土壤湿度指数(SSMI)和相对叶面积指数(RLAI),作为特征变量;
S5、基于S4中特征变量将对应作物模型模拟的产量损失率数据作为预测变量,构建样本数据集,并将其输入到随机森林模型中构建作物干旱脆弱性模型,其回归决策树表示为式(1):
Figure FDA0002280991890000011
式中h(x)为随机森林的最终预测结果,h(x,θi)为随机森林中的某棵回归决策树的预测结果,x为该决策树使用的相应特征变量的集合,θi为独立同分布的随机向量,K为决策树个数,N为训练样本子集个数;
S6、利用所述作物干旱脆弱性模型,根据研究时段内特征变量来诊断和评估在所述研究时段内的作物干旱情况。
2.根据权利要求1所述的方法,其特征在于,所述作物选自小麦、玉米、大豆、水稻。
3.根据权利要求1所述的方法,其特征在于,所述作物模型为MCWLA系列模型。
4.根据权利要求1所述的方法,其特征在于,步骤S3中模拟土壤湿度为20cm以及50cm土壤层湿度。
5.根据权利要求4所述的基于集合同化策略的区域农作物估产方法,其特征在于,遥感LAI数据选自Copernicus LAI,GLASS LAI以及GLOBMAP LAI。
6.根据权利要求2所述的方法,其特征在于,所述作物为小麦,步骤S3中生育阶段包括出苗-返青、返青-抽穗以及抽穗-成熟。
7.根据权利要求1所述的基于集合同化策略的区域农作物估产方法,其特征在于,所述标准化土壤湿度指数(SSMI)为20cm的标准化土壤湿度指数(SSMI_20cm)和50m的标准化土壤湿度指数(SSMI_50cm)。
8.根据权利要求1所述的基于集合同化策略的区域农作物估产方法,其特征在于,步骤S6中作物干旱情况包括模拟干旱产量损失率以及干旱空间分布。
9.根据权利要求1所述的基于集合同化策略的区域农作物估产方法,其特征在于,所述模拟产量损失率以下式(2)所示
Figure FDA0002280991890000021
其中Ysi指第i个干旱情景的模拟产量(kg/ha),Yck是指理想无灾害年的模拟产量(kg/ha),YLRsi指第i个干旱情景的模拟产量损失率(%)。
CN201911141251.0A 2019-11-20 2019-11-20 一种耦合作物模型与机器学习语言的农业干旱快速诊断和评估方法 Active CN110909933B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911141251.0A CN110909933B (zh) 2019-11-20 2019-11-20 一种耦合作物模型与机器学习语言的农业干旱快速诊断和评估方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911141251.0A CN110909933B (zh) 2019-11-20 2019-11-20 一种耦合作物模型与机器学习语言的农业干旱快速诊断和评估方法

Publications (2)

Publication Number Publication Date
CN110909933A true CN110909933A (zh) 2020-03-24
CN110909933B CN110909933B (zh) 2020-07-17

Family

ID=69818324

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911141251.0A Active CN110909933B (zh) 2019-11-20 2019-11-20 一种耦合作物模型与机器学习语言的农业干旱快速诊断和评估方法

Country Status (1)

Country Link
CN (1) CN110909933B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111881418A (zh) * 2020-07-27 2020-11-03 中国农业科学院农业信息研究所 一种基于二分法的大豆气象产量预测方法及系统
CN113592201A (zh) * 2021-08-31 2021-11-02 中国农业科学院农业环境与可持续发展研究所 一种拔节后受冻冬小麦产量损失早期预测方法
CN113762768A (zh) * 2021-09-02 2021-12-07 中国水利水电科学研究院 基于天气发生器和作物模型的农业旱灾动态风险评估方法
CN114117352A (zh) * 2021-12-01 2022-03-01 水利部牧区水利科学研究所 一种确定草原干旱等级的方法、装置、电子设备及介质
CN115310796A (zh) * 2022-07-29 2022-11-08 西安理工大学 一种不同类型干旱间传播关系的确定方法及系统
CN115639979A (zh) * 2022-09-15 2023-01-24 河南大学 基于随机森林回归模型的高分辨率spei数据集开发方法
CN116433030A (zh) * 2023-04-26 2023-07-14 中国农业科学院农业环境与可持续发展研究所 旱情损失量的快速评估方法、系统、介质及设备
CN117892638A (zh) * 2024-03-14 2024-04-16 河海大学 一种利用条件概率函数的干旱形成时间预测方法及系统

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080184385A1 (en) * 2006-09-29 2008-07-31 Hon-Ming Lam Use of GmRD22-like genes to protect against abiotic stress
CN103605901A (zh) * 2013-11-29 2014-02-26 民政部国家减灾中心 一种区域旱灾风险估计方法
CN104361249A (zh) * 2014-11-25 2015-02-18 民政部国家减灾中心 基于作物生长模型的作物旱灾致灾强度指数计算方法
CN104732045A (zh) * 2015-04-22 2015-06-24 民政部国家减灾中心 一种基于作物生长模型确定作物旱灾自然脆弱性曲线的方法
EP2950633A1 (en) * 2013-01-31 2015-12-09 Valent Biosciences Corporation Methods to induce drought tolerance in crops
CN105389740A (zh) * 2015-12-29 2016-03-09 中国科学院遥感与数字地球研究所 一种基于作物生长模型的农业旱灾风险评估方法
CN109034656A (zh) * 2018-08-21 2018-12-18 北京师范大学 一种地下水脆弱性评价方法
CN109377067A (zh) * 2018-11-02 2019-02-22 河南工程学院 一种区域承灾体脆弱性评价方法
CN109829234A (zh) * 2019-01-30 2019-05-31 北京师范大学 一种基于高分辨率遥感数据和作物模型的跨尺度高精度动态作物长势监测和估产方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080184385A1 (en) * 2006-09-29 2008-07-31 Hon-Ming Lam Use of GmRD22-like genes to protect against abiotic stress
EP2950633A1 (en) * 2013-01-31 2015-12-09 Valent Biosciences Corporation Methods to induce drought tolerance in crops
CN103605901A (zh) * 2013-11-29 2014-02-26 民政部国家减灾中心 一种区域旱灾风险估计方法
CN104361249A (zh) * 2014-11-25 2015-02-18 民政部国家减灾中心 基于作物生长模型的作物旱灾致灾强度指数计算方法
CN104732045A (zh) * 2015-04-22 2015-06-24 民政部国家减灾中心 一种基于作物生长模型确定作物旱灾自然脆弱性曲线的方法
CN105389740A (zh) * 2015-12-29 2016-03-09 中国科学院遥感与数字地球研究所 一种基于作物生长模型的农业旱灾风险评估方法
CN109034656A (zh) * 2018-08-21 2018-12-18 北京师范大学 一种地下水脆弱性评价方法
CN109377067A (zh) * 2018-11-02 2019-02-22 河南工程学院 一种区域承灾体脆弱性评价方法
CN109829234A (zh) * 2019-01-30 2019-05-31 北京师范大学 一种基于高分辨率遥感数据和作物模型的跨尺度高精度动态作物长势监测和估产方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
DEJAN DODIG: "Assessing drought tolerance and regionalpatterns of genetic diversity among spring and winter bread wheat using simple sequence repeats and phenotypic data", 《CROP AND PASTURE SCIENCE》 *
张兴明: "基于网格脆弱性曲线的世界小麦旱灾风险评价", 《灾害学》 *
申海凤: "冬小麦干旱风险分时分区研究——以河北省邢台市为例", 《中国优秀硕士学位论文全文数据库 农业科技辑》 *

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111881418A (zh) * 2020-07-27 2020-11-03 中国农业科学院农业信息研究所 一种基于二分法的大豆气象产量预测方法及系统
CN111881418B (zh) * 2020-07-27 2023-05-16 中国农业科学院农业信息研究所 一种基于二分法的大豆气象产量预测方法及系统
CN113592201A (zh) * 2021-08-31 2021-11-02 中国农业科学院农业环境与可持续发展研究所 一种拔节后受冻冬小麦产量损失早期预测方法
CN113592201B (zh) * 2021-08-31 2023-06-20 中国农业科学院农业环境与可持续发展研究所 一种拔节后受冻冬小麦产量损失早期预测方法
CN113762768A (zh) * 2021-09-02 2021-12-07 中国水利水电科学研究院 基于天气发生器和作物模型的农业旱灾动态风险评估方法
CN114117352A (zh) * 2021-12-01 2022-03-01 水利部牧区水利科学研究所 一种确定草原干旱等级的方法、装置、电子设备及介质
CN115310796A (zh) * 2022-07-29 2022-11-08 西安理工大学 一种不同类型干旱间传播关系的确定方法及系统
CN115639979A (zh) * 2022-09-15 2023-01-24 河南大学 基于随机森林回归模型的高分辨率spei数据集开发方法
CN116433030A (zh) * 2023-04-26 2023-07-14 中国农业科学院农业环境与可持续发展研究所 旱情损失量的快速评估方法、系统、介质及设备
CN117892638A (zh) * 2024-03-14 2024-04-16 河海大学 一种利用条件概率函数的干旱形成时间预测方法及系统
CN117892638B (zh) * 2024-03-14 2024-05-17 河海大学 一种利用条件概率函数的干旱形成时间预测方法及系统

Also Published As

Publication number Publication date
CN110909933B (zh) 2020-07-17

Similar Documents

Publication Publication Date Title
CN110909933B (zh) 一种耦合作物模型与机器学习语言的农业干旱快速诊断和评估方法
CN109829234B (zh) 一种基于高分辨率遥感数据和作物模型的跨尺度高精度动态作物长势监测和估产方法
Amichev et al. Hybrid poplar growth in bioenergy production systems: biomass prediction with a simple process-based model (3PG)
CN102592181A (zh) 一种作物种植面积统计数据空间分布的优化方法
CN111898922B (zh) 一种多尺度农作物产量评估方法及系统
CN109800921B (zh) 基于遥感物候同化和粒子群优化的区域冬小麦估产方法
CN102073869A (zh) 基于点位数据和遥感影像数据的区域耕地质量监测方法
CN101595812B (zh) 一种作物收获指数的获取方法
CN105740759A (zh) 基于多时相数据中特征提取的中稻信息决策树分类方法
Zhao et al. Modeling climatically suitable areas for soybean and their shifts across China
CN114254964B (zh) 水稻区域气候品质评估方法及系统
Yan et al. A quantitative knowledge-based model for designing suitable growth dynamics in rice
CN107680000A (zh) 区域作物种植选择方法
Behrman et al. Modeling differential growth in switchgrass cultivars across the Central and Southern Great Plains
CN113822479A (zh) 一种兼顾生产、环境和经济效益的区域农业种植结构多目标优化方法
CN110705182A (zh) 耦合作物模型和机器学习的作物育种适应时间预测方法
Bosi Parameterization and evaluation of mechanistic crop models for estimating Urochloa brizantha cv. BRS Piatã productivity under full sun and in silvopastoral system.
CN116595333B (zh) 土壤-气候智慧型的水稻目标产量与氮肥用量确定方法
Freitas et al. Adaptation, calibration and evaluation of a simple agrometeorological model for wood Eucalyptus productivity estimation
CN115952421A (zh) 耦合生态过程模型与机器学习算法的高精度时空模拟方法
Hu et al. Retrieval of photosynthetic capability for yield gap attribution in maize via model-data fusion
CN112380497B (zh) 用于区域玉米的秸秆系数估算方法及系统
Chen et al. Cotton growth monitoring and yield estimation based on assimilation of remote sensing data and crop growth model
Shi et al. Yield estimation of Lycium barbarum L. based on the WOFOST model
CN117744898B (zh) 一种大田粮食作物产量年际预测模型构建方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant