CN116050163A - 一种基于气象站的生态系统碳水通量计算方法及系统 - Google Patents

一种基于气象站的生态系统碳水通量计算方法及系统 Download PDF

Info

Publication number
CN116050163A
CN116050163A CN202310097077.4A CN202310097077A CN116050163A CN 116050163 A CN116050163 A CN 116050163A CN 202310097077 A CN202310097077 A CN 202310097077A CN 116050163 A CN116050163 A CN 116050163A
Authority
CN
China
Prior art keywords
flux
water flux
carbon
data
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310097077.4A
Other languages
English (en)
Other versions
CN116050163B (zh
Inventor
罗格平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xinjiang Institute of Ecology and Geography of CAS
Original Assignee
Xinjiang Institute of Ecology and Geography of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xinjiang Institute of Ecology and Geography of CAS filed Critical Xinjiang Institute of Ecology and Geography of CAS
Priority to CN202310097077.4A priority Critical patent/CN116050163B/zh
Publication of CN116050163A publication Critical patent/CN116050163A/zh
Application granted granted Critical
Publication of CN116050163B publication Critical patent/CN116050163B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Geometry (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Medical Informatics (AREA)
  • Computer Hardware Design (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开一种基于气象站的生态系统碳水通量计算方法及系统,涉及生态系统碳水通量计算技术领域。根据植被功能类型和/或气候类型对涡度相关通量站进行选择性组合,得到多个表征生态系统的不同情景的组合和每一组合对应的碳水通量数据集,以进一步构建多个碳水通量模型和一个用于预测决定系数的评价模型,利用该评价模型确定目标区域的每一气象站适用的碳水通量模型,从而基于气象站的观测数据来计算碳水通量,相较于基于涡度相关通量站获取碳水通量的方式,这种方式可挖掘目标区域内所有气象站的高精度碳水通量信息,所得到的碳水通量数据量显著增加,且计算精度高,能够同时满足生态系统碳监测和碳核算的数据量和精度的要求。

Description

一种基于气象站的生态系统碳水通量计算方法及系统
技术领域
本发明涉及生态系统碳水通量计算技术领域,特别是涉及一种基于气象站的生态系统碳水通量计算方法及系统。
背景技术
陆地生态系统生产力和碳源、碳汇的时空分布仍然不是很清楚。一是因为生态系统碳观测数据的严重缺乏和碳监测的支持能力不足。涡度相关通量站是获取生态系统碳通量观测数据的主流渠道,但通量站的建设、观测、管理与数据处理成本高昂,造成目前全球的通量站稀少,仅721个,且分布很不均匀,导致无法全面有效覆盖复杂多样的生态系统,碳观测数据严重缺乏,完全无法满足生态系统碳监测和碳核算的需求,无法全面认知生态系统碳动态的驱动机制,已成为制约全球陆地生态系统碳循环研究的主要瓶颈之一。二是因为传统的生态系统碳核算技术与方法面临诸多限制和挑战。生物地球化学模型/生态系统模型、大气二氧化碳反演模型、陆面过程模型和经验统计模型等单独或集成是目前碳核算和评估的主流方法,这些模型基本都是基于对已知的机理过程或经验认知的集成和耦合,对正在研究或尚不成熟的机制和过程考虑不足或简化处理,且缺乏足够的碳观测数据支撑校验,且这些模型的输入数据多为具有较大不确定性的空间格网数据,如再分析数据,空间分辨率通常为25-100km,这致使碳估算结果存在很高的不确定性,完全无法满足生态系统碳核算精度的要求。
与十分稀少的涡度相关通量站相比,气象站较为丰富,且分布广泛,全球公开的有近3万个,是通量站的40余倍,但气象站在生态系统碳监测中的潜力尚未得以挖掘。基于此,亟需一种基于气象站的生态系统碳水通量计算技术。
发明内容
本发明的目的是提供一种基于气象站的生态系统碳水通量计算方法及系统,可利用气象站的观测数据来计算碳水通量,提高碳水通量的数据量,且计算精度高。
为实现上述目的,本发明提供了如下方案:
一种基于气象站的生态系统碳水通量计算方法,所述计算方法包括:
获取目标区域中每一涡度相关通量站的第一观测数据集;所述第一观测数据集包括所述涡度相关通量站的碳水通量观测数据和气象观测数据以及所述涡度相关通量站所在位置的植被土壤地形数据;或者,所述第一观测数据集包括所述涡度相关通量站的碳水通量观测数据和气象观测数据以及所述涡度相关通量站所在位置的植被土壤地形数据和遥感数据;
根据植被功能类型和/或气候类型对所述涡度相关通量站进行选择性组合,得到多个组合和每一所述组合对应的碳水通量数据集;所述组合表征一种景观或生态系统的情景;所述碳水通量数据集包括所述组合内的所有所述涡度相关通量站的第一观测数据集;
对于每一所述组合,通过多种划分方式分别对所述组合对应的碳水通量数据集进行划分,得到每一种所述划分方式对应的训练集和测试集;对于每一种所述划分方式,以所述训练集作为输入,利用第一机器学习算法训练得到所述组合在所述划分方式下的用于预测站点碳水通量的碳水通量模型;以所述测试集作为所述碳水通量模型的输入,计算得到所述组合在所述划分方式下的决定系数;计算每一碳水通量影响因子在所述训练集和所述测试集之间的欧式距离,得到所述组合在所述划分方式下的距离集合;根据所有所述组合在所有所述划分方式下的决定系数和距离集合构建评价数据集;所述碳水通量影响因子即为所述第一观测数据集中除所述碳水通量观测数据之外的数据;
以所述评价数据集作为输入,利用第二机器学习算法训练得到用于预测决定系数的评价模型;
对于所述目标区域中的每一气象站,利用所述评价模型确定所述气象站适用的碳水通量模型,并利用所述气象站适用的碳水通量模型计算所述气象站的碳水通量。
在一些实施例中,所述气象观测数据包括气温、降水、饱和水汽压差、气压、向下的短波辐射、大气相对湿度、风速、风向和日照时数;所述植被土壤地形数据包括土壤质地、土地覆被类型和位置地形;所述遥感数据包括植被指数、波段光谱、地表水分指数、地表温度和地表湿度。
在一些实施例中,所述植被功能类型包括农田、草地、落叶阔叶林、常绿阔叶林、常绿针叶林、混交林、稀树草原、灌木林、湿地和荒漠;所述气候类型包括干旱、半干旱、半湿润和湿润。
在一些实施例中,所述碳水通量数据集的构建方法为:按照预定时间尺度对所述组合内的所有所述涡度相关通量站的第一观测数据集进行随机采样,得到碳水通量数据集;不同所述碳水通量数据集的预定时间尺度相同或者不同。
在一些实施例中,所述碳水通量观测数据包括碳通量观测数据和水通量观测数据,所述碳水通量模型包括用于预测站点碳通量的碳通量模型和用于预测站点水通量的水通量模型,则所述以所述训练集作为输入,利用第一机器学习算法训练得到所述组合在所述划分方式下的用于预测站点碳水通量的碳水通量模型具体包括:
以所述训练集中除所述碳水通量观测数据之外的数据作为输入,以所述训练集中的所述碳通量观测数据作为标签,利用第一机器学习算法训练得到所述组合在所述划分方式下的用于预测站点碳通量的碳通量模型;
以所述训练集中除所述碳水通量观测数据之外的数据作为输入,以所述训练集中的所述水通量观测数据作为标签,利用第一机器学习算法训练得到所述组合在所述划分方式下的用于预测站点水通量的水通量模型。
在一些实施例中,训练所述碳通量模型时,所述气象观测数据包括气温、降水、饱和水汽压差以及向下的短波辐射;所述植被土壤地形数据包括土壤质地和位置地形;所述遥感数据包括植被指数;训练所述水通量模型时,所述气象观测数据包括气温、降水、饱和水汽压差、向下的短波辐射以及风速;所述植被土壤地形数据包括土壤质地和位置地形;所述遥感数据包括植被指数和地表水分指数。
在一些实施例中,所述利用所述评价模型确定所述气象站适用的碳水通量模型具体包括:
获取所述气象站的第二观测数据集;所述第二观测数据集的数据与所述第一观测数据集中除碳水通量观测数据之外的其他数据的类型相同;
对于每一所述碳水通量模型,计算每一所述碳水通量影响因子在训练所述碳水通量模型时所用的训练集和所述第二观测数据集之间的欧式距离,得到应用距离集合;以所述应用距离集合作为输入,利用所述评价模型计算将所述碳水通量模型应用至所述气象站的应用决定系数,得到所述碳水通量模型对应的应用决定系数;
根据所有所述碳水通量模型对应的应用决定系数确定所述气象站适用的碳水通量模型。
在一些实施例中,所述根据所有所述碳水通量模型对应的应用决定系数确定所述气象站适用的碳水通量模型具体包括:
对于每一所述碳水通量模型,判断所述碳水通量模型对应的应用决定系数是否大于或等于预设阈值;若是,则所述碳水通量模型适用于所述气象站;若否,则所述碳水通量模型不适用于所述气象站;所有适用于所述气象站的碳水通量模型组成备选集;
选取所述备选集中应用决定系数最大的碳水通量模型作为所述气象站适用的碳水通量模型。
在一些实施例中,所述预设阈值大于或者等于0.5。
一种基于气象站的生态系统碳水通量计算系统,所述计算系统包括:
数据获取模块,用于获取目标区域中每一涡度相关通量站的第一观测数据集;所述第一观测数据集包括所述涡度相关通量站的碳水通量观测数据和气象观测数据以及所述涡度相关通量站所在位置的植被土壤地形数据;或者,所述第一观测数据集包括所述涡度相关通量站的碳水通量观测数据和气象观测数据以及所述涡度相关通量站所在位置的植被土壤地形数据和遥感数据;
碳水通量数据集构建模块,用于根据植被功能类型和/或气候类型对所述涡度相关通量站进行选择性组合,得到多个组合和每一所述组合对应的碳水通量数据集;所述组合表征一种景观或生态系统的情景;所述碳水通量数据集包括所述组合内的所有所述涡度相关通量站的第一观测数据集;
评价数据集构建模块,用于对于每一所述组合,通过多种划分方式分别对所述组合对应的碳水通量数据集进行划分,得到每一种所述划分方式对应的训练集和测试集;对于每一种所述划分方式,以所述训练集作为输入,利用第一机器学习算法训练得到所述组合在所述划分方式下的用于预测站点碳水通量的碳水通量模型;以所述测试集作为所述碳水通量模型的输入,计算得到所述组合在所述划分方式下的决定系数;计算每一碳水通量影响因子在所述训练集和所述测试集之间的欧式距离,得到所述组合在所述划分方式下的距离集合;根据所有所述组合在所有所述划分方式下的决定系数和距离集合构建评价数据集;所述碳水通量影响因子即为所述第一观测数据集中除所述碳水通量观测数据之外的数据;
评价模型构建模块,用于以所述评价数据集作为输入,利用第二机器学习算法训练得到用于预测决定系数的评价模型;
计算模块,用于对于所述目标区域中的每一气象站,利用所述评价模型确定所述气象站适用的碳水通量模型,并利用所述气象站适用的碳水通量模型计算所述气象站的碳水通量。
根据本发明提供的具体实施例,本发明公开了以下技术效果:
本发明用于提供一种基于气象站的生态系统碳水通量计算方法及系统,根据植被功能类型和/或气候类型对涡度相关通量站进行选择性组合,得到多个表征生态系统的不同情景的组合和每一组合对应的碳水通量数据集,以进一步构建多个碳水通量模型和一个用于预测决定系数的评价模型,利用该评价模型确定目标区域的每一气象站适用的碳水通量模型,并利用气象站适用的碳水通量模型计算碳水通量,从而基于气象站的观测数据来计算碳水通量,相较于基于涡度相关通量站获取碳水通量的方式,这种方式可挖掘目标区域内所有气象站的高精度碳水通量信息,所得到的碳水通量数据量显著增加,且计算精度高,能够同时满足生态系统碳监测和碳核算的数据量和精度的要求。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例1所提供的计算方法的方法流程图;
图2为本发明实施例1所提供的计算方法的原理框图;
图3为本发明实施例3所提供的计算系统的系统框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的目的是提供一种基于气象站的生态系统碳水通量计算方法及系统,可利用气象站的观测数据来计算碳水通量,提高碳水通量的数据量,且计算精度高。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
实施例1:
本实施例用于提供一种基于气象站的生态系统碳水通量计算方法,如图1和图2所示,所述计算方法包括:
S1:获取目标区域中每一涡度相关通量站的第一观测数据集;所述第一观测数据集包括所述涡度相关通量站的碳水通量观测数据和气象观测数据以及所述涡度相关通量站所在位置的植被土壤地形数据;或者,所述第一观测数据集包括所述涡度相关通量站的碳水通量观测数据和气象观测数据以及所述涡度相关通量站所在位置的植被土壤地形数据和遥感数据;
本实施例的目标区域可以是一个流域(即由分水线所包围的河流集水区)、一个地区、一个国家、一个大洲(地球上大陆和它附近岛屿的总称,如欧亚大陆)或整个陆地(如全球)。
由于遥感技术的发展时间尚短,如果是获取涡度相关通量站多年前的数据,则很有可能无法获得遥感数据,则本实施例的第一观测数据集可以仅包括碳水通量观测数据、气象观测数据以及植被土壤地形数据;如果是获取涡度相关通量站近年的数据,则本实施例的第一观测数据集也可以同时包括碳水通量观测数据、气象观测数据、植被土壤地形数据以及遥感数据。当第一观测数据集包括碳水通量观测数据、气象观测数据以及植被土壤地形数据时,本实施例可以基于每一涡度相关通量站的不含遥感的第一观测数据集,经后续的S2-S5计算基于气象站的不含遥感的碳水通量;当第一观测数据集包括碳水通量观测数据、气象观测数据、植被土壤地形数据以及遥感数据时,本实施例可以基于每一涡度相关通量站的含遥感的第一观测数据集,经后续的S2-S5计算基于气象站的含遥感的碳水通量。
具体的,本实施例的碳水通量观测数据包括碳通量观测数据和水通量观测数据,碳通量可为GPP或NEE,GPP(gross primaryproductivity,总初级生产力)是指单位时间内生物通过光合作用途径所固定的光合产物量或有机碳总量,又称总第一性生产力;NEE(netecosystem exchange,净生态系统碳交换量)是指陆地与大气系统间的CO2通量净交换量。气象观测数据可以包括气温(可包括日最高温、日最低温、日均温、日较差)、降水、饱和水汽压差(vaporpressure deficit,VPD)、气压、向下的短波辐射(Downward short waveradiation,DSR)、大气相对湿度、风速、风向和日照时数,也可以包括其他类型的气象数据。植被土壤地形数据包括土壤质地、土地覆被类型和位置地形,土壤质地是指土壤中不同大小直径的矿物颗粒的组合状况,可以包括砂的百分比、粉砂百分比、粘土百分比,土地覆被类型是指可以识别和定义的土地覆被类别,可以包括水体、湿地、人工地表、耕地、永久性冰雪、森林、草地、灌木丛、裸地和苔原,位置地形是指地物形状和地貌的总称,具体指地表以上分布的固定物体所共同呈现出的高低起伏的各种状态,五种突出地形分别是平原、高原、丘陵、盆地、山地,可以包括经度、纬度、坡度、坡向和高程。遥感数据是指基于遥感的地表生物物理参量数据,可以包括植被指数、波段光谱、地表水分指数、地表温度和地表湿度,植被指数可以包括归一化植被指数(NDVI)、增强植被指数(EVI)、叶面积指数(LAI)和光合有效辐射吸收比例(Fraction of Photosynthetically Active Radiation,FPAR)。
需要说明的是,本实施例所获得的每一涡度相关通量站的第一观测数据集均是与该涡度相关通量站相匹配的。优选的,本实施例还可对第一观测数据集进行质量控制和标准化处理,得到处理后的第一观测数据集,并以处理后的第一观测数据集作为新的第一观测数据集,执行S2。质量控制和标准化处理可以采用现有的方法,在此不再赘述。
通过S1,本实施例可利用地理信息系统和遥感技术分别产生目标区域内每一涡度相关通量站的含遥感的第一观测数据集和不含遥感的第一观测数据集,以得到满足目标区域的气象站碳水通量监测和评估的数据。
S2:根据植被功能类型和/或气候类型对所述涡度相关通量站进行选择性组合,得到多个组合和每一所述组合对应的碳水通量数据集;所述组合表征一种景观或生态系统的情景;所述碳水通量数据集包括所述组合内的所有所述涡度相关通量站的第一观测数据集;
本实施例中,植被功能类型(Plant Function Type,PFT)可以包括农田(cropland,CRO)、草地(grassland,GRA)、落叶阔叶林(deciduous broadleaf forest,DBF)、常绿阔叶林(evergreen broadleaf forest,EBF)、常绿针叶林(evergreenneedleleaf forest,ENF)、混交林(mixed forest,MF)、稀树草原(savannah,SAV)、灌木林(shrubland,SHR)、湿地(wetland,WET)和荒漠(Desert)。气候类型可以包括干旱、半干旱、半湿润和湿润。本实施例可先根据需求设定多种可能的生态系统的情景,然后基于每一情景,将与该情景的植被功能类型、气候类型或植被功能类型和气候类型相同的涡度相关通量站相组合。比如,生态系统的情景为草地和干旱,则选取出所有植被功能类型为草地、气候类型为干旱的涡度相关通量站,并进行组合。需要说明的是,涡度相关通量站的植被功能类型和气候类型是指涡度相关通量站所处位置的植被功能类型和气候类型。
碳水通量数据集的构建方法可以为:按照预定时间尺度对组合内的所有涡度相关通量站的第一观测数据集进行随机采样,得到碳水通量数据集,预定时间尺度可以为1天、8天、1个月和1个季度等,即每间隔1个预定时间尺度,对第一观测数据集内的数据进行1次采样,从而得到碳水通量数据集。不同碳水通量数据集的预定时间尺度相同或者不同。
本实施例的组合个数可为成百上千个,从而通过S2,可构建成百上千个不同时间尺度的碳水通量数据集,可表征景观或生态系统成百上千个情景。本实施例对分布于不同流域、地区、国家、大洲和全球尺度的涡度相关通量站,按照植被功能类型和/或气候类型进行组合,形成成百上千个组合,每个组合表征一种可能的景观或生态系统情景,后续便可基于每个组合内的通量、遥感、地理和生态数据,利用不同机器学习方法,构建成百上千个碳水通量模型。
S3:对于每一所述组合,通过多种划分方式分别对所述组合对应的碳水通量数据集进行划分,得到每一种所述划分方式对应的训练集和测试集;对于每一种所述划分方式,以所述训练集作为输入,利用第一机器学习算法训练得到所述组合在所述划分方式下的用于预测站点碳水通量的碳水通量模型;以所述测试集作为所述碳水通量模型的输入,计算得到所述组合在所述划分方式下的决定系数;计算每一碳水通量影响因子在所述训练集和所述测试集之间的欧式距离,得到所述组合在所述划分方式下的距离集合;根据所有所述组合在所有所述划分方式下的决定系数和距离集合构建评价数据集;所述碳水通量影响因子即为所述第一观测数据集中除所述碳水通量观测数据之外的数据;
本实施例的划分方式可以为:采用K折交叉验证方式,将碳水通量数据集划分为K份,然后随机选取其中的K-1份组成训练集,剩余的1份组成测试集,通过此种方式,可以获得K种训练集和测试集。当然,本实施例也可以通过调节训练集和测试集的比例来对碳水通量数据集进行划分,划分得到多种训练集和测试集。
S3中,以训练集作为输入,利用第一机器学习算法训练得到组合在划分方式下的用于预测站点碳水通量的碳水通量模型可以包括:以训练集中除碳水通量观测数据之外的数据作为输入,以训练集中的碳水通量观测数据作为标签,利用第一机器学习算法训练得到组合在划分方式下的用于预测站点碳水通量的碳水通量模型。
本实施例中,碳水通量观测数据包括碳通量观测数据和水通量观测数据,碳水通量模型包括用于预测站点碳通量的碳通量模型和用于预测站点水通量的水通量模型,则S3中,以训练集作为输入,利用第一机器学习算法训练得到组合在划分方式下的用于预测站点碳水通量的碳水通量模型可以包括:以训练集中除碳水通量观测数据之外的数据作为输入,以训练集中的碳通量观测数据作为标签,利用第一机器学习算法训练得到组合在划分方式下的用于预测站点碳通量的碳通量模型;以训练集中除碳水通量观测数据之外的数据作为输入,以训练集中的水通量观测数据作为标签,利用第一机器学习算法训练得到组合在划分方式下的用于预测站点水通量的水通量模型。
需要说明的是,上述训练过程中,当第一观测数据集包括碳水通量观测数据、气象观测数据以及植被土壤地形数据时,则以训练集中的气象观测数据和植被土壤地形数据作为输入;当第一观测数据集包括碳水通量观测数据、气象观测数据、植被土壤地形数据以及遥感数据时,则以训练集中的气象观测数据、植被土壤地形数据和遥感数据作为输入。通过这一训练方式,可以得到多个碳水通量模型,每一碳水通量模型均包括碳通量模型和水通量模型,分别用于预测碳通量和水通量,碳水通量模型的个数等于组合的个数与划分方式的个数的乘积。
本实施例可在碳水通量模型的训练过程中引入超参数优化,从而提高碳水通量模型的训练效果。第一机器学习算法可以包括长短期记忆人工神经网络(Long Short-TermMemory,LSTM)算法、随机森林(Random Forest,RF)算法、支持向量机(Support VectorMachine,SVM)算法、反向传播人工神经网络(Back-propagation artificial neuralnetwork,BP-ANN)算法、建模动画和渲染系统(Modelling Animation And RenderingSystem,MARS)、极端梯度提升(eXtreme Gradient Boosting,XGB)算法、集成算法以及上述算法的组合,集成算法包括Boosting算法与Bagging算法。基于每一种第一机器学习算法,均可以训练得到一种碳水通量模型,比如,以随机森林算法为例,训练得到的碳水通量模型即为随机森林模型。本实施例的碳水通量模型还可为多层感知器(Multi-LayerPerceptron,MLP),多种第一机器学习算法对应的模型的Stacking堆叠模型和多层感知器与一种或多种第一机器学习算法对应的模型的Stacking堆叠模型。
利用第一机器学习算法,本实施例可构建成百上千个碳水通量模型,能够用于模拟计算生态系统成百上千个情景的多时间尺度碳水通量,此处的碳水通量模型相较于生物地球化学模型/生态系统模型、大气二氧化碳反演模型、陆面过程模型和经验统计模型,由于碳水通量模型的输入数据为实际观测数据,而非再分析数据,且碳水通量模型是基于实际观测数据训练得到的,而非是对已知的机理过程或经验认知的集成和耦合,故计算精度更高。
本实施例可用决定系数R2或相对误差表征碳水通量模型在测试集上的精度。同时,碳水通量模型的决定系数大小,还取决于碳水通量模型训练集中碳水通量影响因子和测试集中对应的碳水通量影响因子之间的地理与生态差异,故决定系数可表征为各个碳水通量影响因子的欧式距离的函数,由决定系数和各个碳水通量影响因子的欧式距离可形成包括数千条样本的评价数据集。基于该评价数据集,利用第二机器学习算法,可构建用于预测决定系数R2的评价模型。S3所构建的多个碳水通量模型迁移应用至气象站之前,可以利用该评价模型预测各个碳水通量模型在气象站应用的应用决定系数,以确定适用于气象站的碳水通量模型。
S3中,以测试集作为碳水通量模型的输入,计算得到组合在划分方式下的决定系数可以包括:以测试集中除碳水通量观测数据之外的数据作为输入,利用碳水通量模型计算得到碳水通量预测值,并以测试集中的碳水通量观测数据作为碳水通量实际值,根据碳水通量预测值和碳水通量实际值即可计算得到组合在划分方式下的决定系数,碳水通量预测值包括碳通量预测值和水通量预测值,碳水通量实际值包括碳通量实际值和水通量实际值,则根据碳通量预测值和碳通量实际值可以计算得到一个决定系数,根据水通量预测值和水通量实际值可以计算得到一个决定系数,计算两个决定系数的平均值,则可得到组合在划分方式下的决定系数。当第一观测数据集包括碳水通量观测数据、气象观测数据以及植被土壤地形数据时,则以测试集中的气象观测数据和植被土壤地形数据作为输入;当第一观测数据集包括碳水通量观测数据、气象观测数据、植被土壤地形数据以及遥感数据时,则以测试集中的气象观测数据、植被土壤地形数据和遥感数据作为输入。通过这一方式,能够计算得到每一组合在每一划分方式下的决定系数。
S3中,计算每一碳水通量影响因子在训练集和测试集之间的欧式距离,得到组合在划分方式下的距离集合可以包括:对于每一碳水通量影响因子,利用下式(1)计算碳水通量影响因子在训练集和测试集之间的欧式距离,所有碳水通量影响因子的欧式距离组成组合在划分方式下的距离集合。如果第一观测数据集包括碳水通量观测数据、气象观测数据以及植被土壤地形数据,则碳水通量影响因子包括气象观测数据和植被土壤地形数据中的每一种类型的数据,比如温度、降水等;如果第一观测数据集包括碳水通量观测数据、气象观测数据、植被土壤地形数据以及遥感数据,则碳水通量影响因子包括气象观测数据、植被土壤地形数据和遥感数据中的每一种类型的数据。通过这一方式,能够计算得到每一组合在每一划分方式下的距离集合。
对于每一碳水通量影响因子,欧式距离的计算公式如下:
式(1)中,d(x,y)为欧式距离;xi为训练集中第i个样本的碳水通量影响因子的值,i=1,2,...,t;yi为测试集中第i个样本的碳水通量影响因子的值。由于训练集和测试集的样本个数不一定相同,本实施例可随机在训练集和测试集中均选取t个样本来计算欧式距离,保证训练集和测试集的样本个数相同;对于训练集和测试集均包括多年数据的情况,还可以对于每一天,将每一年在该天的数据进行平均,得到每一天的平均数据,从而训练集和测试集均包括365或者366天中每一天的平均数据,以每一天的平均数据作为样本,从而保证训练集和测试集的样本个数相同;还可以对训练集和测试集中的数据按照从小到大的顺序或者从大到小的顺序进行排序,并将排序后的数据均分为t份,计算每一份的平均数据,从而训练集和测试集均包括t份平均数据,以t份平均数据作为t个样本,保证训练集和测试集的样本个数相同。
通过S3,本实施例可得到每一组合在每一划分方式下的决定系数和距离集合,且决定系数和距离集合相对应,基于此,本实施例可建立评价数据集,评价数据集的结构如表1所示:
表1
ID <![CDATA[R<sup>2</sup>]]> <![CDATA[d<sub>1</sub>]]> <![CDATA[d<sub>2</sub>]]> <![CDATA[d<sub>u-1</sub>]]> <![CDATA[d<sub>u</sub>]]>
1
2
 
表1中,R2为决定系数;d1,d2,…,du-1,du为碳水通量模型训练集不同碳水通量影响因子与测试集中对应碳水通量影响因子之间的欧式距离。
S4:以所述评价数据集作为输入,利用第二机器学习算法训练得到用于预测决定系数的评价模型;
S4中,以评价数据集作为输入,利用第二机器学习算法训练得到用于预测决定系数的评价模型可以包括:以评价数据集中的距离集合作为输入,以评价数据集中的决定系数作为标签,利用第二机器学习算法训练得到用于预测决定系数的评价模型。其中,第二机器学习算法可以包括多元线性回归算法、长短期记忆人工神经网络算法、随机森林算法、支持向量机算法、反向传播人工神经网络算法、建模动画和渲染系统、极端梯度提升算法和集成算法。
以多元线性回归算法为例,训练得到的评价模型R2-M如下:
z=a0+a1d1+a2d2+…+au-1du-1+audu; (2)
式(2)中,z为评价模型的决定系数;a0,a1,a2,…,au-1,au均为回归参数;d1,d2,…,du-1,du为不同碳水通量影响因子的欧式距离。
为了验证是否可基于评价模型来确定气象站适用的碳水通量模型,本实施例可先将该评价模型应用至涡度相关通量站,由于涡度相关通量站仅比气象站多一个碳水通量数据,而其他数据类型相同,故如果可基于评价模型来确定涡度相关通量站适用的碳水通量模型,便可以基于评价模型来确定气象站适用的碳水通量模型。具体的,对于每一碳水通量模型,本实施例计算每一碳水通量影响因子在训练碳水通量模型时所用的训练集和涡度相关通量站的第一观测数据集之间的欧式距离,具体以第一观测数据集替换式(1)中的测试集,即可得到将该碳水通量模型应用至每一涡度相关通量站的距离集合,以该距离集合作为输入,利用评价模型计算将碳水通量模型应用至每一涡度相关通量站的决定系数预测值;同时,以涡度相关通量站的第一观测数据集中除碳水通量观测数据之外的数据作为输入,利用碳水通量模型计算得到碳水通量预测值,并以第一观测数据集中的碳水通量观测数据作为碳水通量实际值,根据碳水通量预测值和碳水通量实际值即可计算得到决定系数真实值,从而可得到将碳水通量模型应用至每一涡度相关通量站的决定系数真实值;基于上述方式,可得到将每一碳水通量模型应用到每一涡度相关通量站的决定系数预测值和决定系数真实值。如果将每一碳水通量模型应用到每一涡度相关通量站的决定系数预测值和决定系数真实值均大于预设阈值或者均小于预设阈值,则该决定系数预测值和决定系数真实值是一致的,根据一致情况计算准确率,准确率等于一致的数量除以总数量,总数量即为碳水通量模型的个数与涡度相关通量站的个数的乘积。经真实数据验证,发现准确率较高,即认为可基于评价模型来确定通量站适用的碳水通量模型,即评价模型是可靠的,可以基于评价模型来确定气象站适用的碳水通量模型。
S5:对于所述目标区域中的每一气象站,利用所述评价模型确定所述气象站适用的碳水通量模型,并利用所述气象站适用的碳水通量模型计算所述气象站的碳水通量。
其中,利用评价模型确定气象站适用的碳水通量模型可以包括:
(1)获取气象站的第二观测数据集,第二观测数据集的数据与第一观测数据集中除碳水通量观测数据之外的其他数据的类型相同。
若第一观测数据集包括碳水通量观测数据、气象观测数据以及植被土壤地形数据,则第二观测数据集包括气象观测数据和植被土壤地形数据;若第一观测数据集包括碳水通量观测数据、气象观测数据、植被土壤地形数据以及遥感数据,则第二观测数据集包括气象观测数据、植被土壤地形数据和遥感数据。
(2)对于每一碳水通量模型,计算每一碳水通量影响因子在训练碳水通量模型时所用的训练集和第二观测数据集之间的欧式距离,得到应用距离集合;以应用距离集合作为输入,利用评价模型计算将碳水通量模型应用至气象站的应用决定系数,得到碳水通量模型对应的应用决定系数。
利用第二观测数据集替换式(1)的测试集,即可利用式(1)计算得到每一碳水通量影响因子的欧式距离,从而可得到应用距离集合。
本实施例还可构建所有碳水通量模型分别迁移应用到各个气象站的应用决定系数所组成的数据库,以评估碳水通量模型迁移至气象站的适用性,数据库如下表2所示。
表2
ID <![CDATA[d<sub>1</sub>]]> <![CDATA[d<sub>2</sub>]]> <![CDATA[d<sub>u-1</sub>]]> <![CDATA[d<sub>u</sub>]]> <![CDATA[R<sup>2</sup>-M]]>
1
2
 
表2中,d1,d2,…,du-1,du为碳水通量模型的训练集的碳水通量影响因子与气象站的第二观测数据集对应碳水通量影响因子之间的欧式距离;R2-M为碳水通量模型迁移应用至气象站的应用决定系数。
(3)根据所有碳水通量模型对应的应用决定系数确定气象站适用的碳水通量模型。
具体的,对于每一碳水通量模型,判断碳水通量模型对应的应用决定系数是否大于或等于预设阈值;若是,则碳水通量模型适用于气象站;若否,则碳水通量模型不适用于气象站;所有适用于气象站的碳水通量模型组成备选集,选取备选集中应用决定系数最大的碳水通量模型作为气象站适用的碳水通量模型。如果备选集内的碳水通量模型的个数为0,则证明该气象站没有适用的碳水通量模型。通过上述手段,即可确定每一气象站是否有适用的碳水通量模型,以及有适用的碳水通量模型的气象站适用的碳水通量模型。
决定系数的高低决定了碳水通量模型在涡度相关通量站的适用性,碳水通量模型应用至某个涡度相关通量站的决定系数越高,意味着碳水通量模型的训练集与该涡度相关通量站的第一观测数据集越相似(通常决定系数≥0.5),故本实施例的预设阈值可为0.5,则若应用决定系数≥0.5,则碳水通量模型才可以应用至该气象站,若应用决定系数小于0.5,则认为碳水通量模型的迁移精度较低,无法应用至该气象站。至此,建立了碳水通量模型迁移应用到气象站的适用性评估框架和方法体系。
优选的,满足以下标准的应用决定系数所对应的碳水通量模型,才可应用至气象站,低标准,0.5≤应用决定系数<0.6;中标准,0.6≤应用决定系数<0.7;高标准,应用决定系数≥0.7,从而可基于不同标准评估构建的碳水通量模型是否能迁移应用至气象站,或者哪些气象站能够选配到适用的碳水通量模型。需要说明的是,不是所有建立的碳水通量模型都可迁移应用到气象站,也不是所有的气象站都可选配到适用的碳水通量模型。
在确定气象站适用的碳水通量模型后,即可依据气象站的实际观测数据来准确计算碳水通量(即包括碳通量和水通量),从而可生成基于气象站挖掘的包括碳水通量的数据集,综合目标区域内所有气象站的数据集,即可分析目标区域不同生态系统和生态系统组合碳通量年际、季节、日尺度碳水动态过程和特征,相较于通过涡度相关通量站获取碳水通量数据的方式,数据量显著增加,碳水通量的监测能力得以提高。
本实施例基于碳水通量模型的决定系数及其碳水通量影响因子的欧式距离,建立通量站点的碳水通量模型迁移应用至气象站的评价框架和方法体系,用于评估目标区域内每一气象站是否能匹配到满足精度要求的碳水通量模型,并利用满足精度要求的碳水通量模型挖掘该气象站点的碳水通量,构建气象站点高精度碳水通量数据集。这种技术方法可挖掘全球数万个气象站点的高精度碳水通量信息,破解全球仅仅数百涡度相关通量站无法满足生态系统碳水通量评估的卡脖子问题,该技术方法产生的气象站点碳水通量能够满足生态系统碳监测和碳核算的精度要求。
基于生态系统碳监测和碳核算支撑能力严重不足,缺乏高精度的碳监测和碳核算新技术和新方法这一问题,本实施例考虑到,随着数据挖掘理论和机器学习、遥感大数据等先进技术的发展,已具备利用有限珍贵的涡度相关通量站观测数据挖掘全球分布广泛的气象站的碳通量数据潜力,故本实施例基于珍贵的涡度相关通量站的数据构建碳水通量模型,并提出将基于涡度相关通量站构建的碳水通量模型迁移应用至气象站的适用性评估框架和碳水通量模型筛选技术与方法,利用筛选的碳水通量模型、丰富的气象站点和多源遥感数据,构建具有准观测属性的气象站点碳水通量数据集,这对缺乏碳通量观测数据的生态系统碳监测和碳核算是方法和技术方面的重大突破,可显著促进全球碳循环研究,可显著降低以往因碳通量观测数据不足对生态系统碳监测和碳核算的不确定性。
过去3年,已利用全球FluxNet通量站网、欧洲通量网、美国通量网数据,深入研究了“机器学习技术+多重抽样技术+碳水通量观测数据+遥感大数据+气象站点观测数据”的观测站点尺度碳通量模拟新技术和新方法,构建了数千个通量站的碳水通量模型,经过模型适用性评估体系的评估,全球10000余个气象站点中有60%的气象站可满足碳水通量模型适用迁移的要求,并构建了全球6000多个气象站的高精度的具有“准观测属性”日尺度碳水通量数据集,为高精度开发碳核算模型和技术提供扎实基础。
本实施例提出一种基于分布不均稀有的涡度相关通量站,评估分布广泛气象站点碳通量和水通量的技术方法,包括:获取目标区域的涡度相关通量站的第一观测数据集,基于有限的涡度相关通量站,融合遥感大数据和机器学习技术,构建成百上千个碳水通量模型,提出将构建的碳水通量模型迁移应用至气象站点的适用性评估框架和方法体系,包括计算碳水通量模型的决定系数R2以及训练集和测试集中每个碳水通量影响因子的欧式距离,生成由R2和欧式距离组成的评价数据集,基于该评价数据集,构建评价模型,利用评价模型预测上述构建的碳水通量模型应用到目标区域所有气象站点的碳水通量预测的R2,利用预测精度R2≥0.5的碳水通量模型,模拟该目标区域气象站点多时间尺度的碳水通量,构建满足预测精度要求的气象站点碳水通量数据集,该数据集具备准观测数据的属性。目前国内外尚未有研发基于气象站的碳水通量监测和评估的技术方法,本方法具有从零到有的原创性。
应用前沿技术手段挖掘以气象站为主的地面观测数据潜力,构建气象站为主的高精度碳水通量数据集,是破解生态系统高精度监测碳核算“卡脖子”问题的潜在有效途径。在充分评估全球通量站和气象站点的分布和数量、地理与气候条件的空间异质性,深入开展气象站点碳通量构建的理论、方法与技术研究。首先利用全球涡度相关通量站和遥感、生态地理大数据,基于机器学习、多重抽样技术、遥感和地理信息技术,研发生态系统成百上千个基于通量站的碳水通量模型,在此基础上,发展碳水通量模型迁移应用至气象站点的适应性评估框架和方法体系,挑选满足精度要求的、可迁移至气象站点的适宜的碳水通量模型,构建气象站点的碳水通量数据集,该数据集具有“准观测”属性,可用于监测和核算陆地不同生态系统碳通量速率、过程与时空变化趋势,且构建的气象站点碳水通量数据集,也可用于评估基于生态过程模型/陆面过程模型等区域/全球尺度生态系统碳动态模拟的精度,也可对区域/全球模拟结果进行数据同化,构建更高精度区域/全球尺度碳通量数据集。因此,本项研究可深化陆地生态系统碳循环,具备显著提升区域/全球尺度生态系统碳动态过程评估精度的潜力,这对支持气候变化应对政策的制定以及未来气候变化的预测都具有重要意义。
实施例2:
与实施例1不同的是,本实施例分别计算生态系统碳通量和生态系统水通量,计算碳通量和水通量的过程与实施例1计算碳水通量的过程大致相同,仅是将实施例1的碳水通量分别替换为碳通量和水通量即可,且计算碳通量和水通量的唯一区别在于第一观测数据集所包括的数据类型不同。
若不考虑影响因子的独立性,则计算碳通量时所用的第一观测数据集包括涡度相关通量站的碳通量观测数据、气象观测数据、植被土壤地形数据和遥感数据,计算水通量时所用的第一观测数据集包括涡度相关通量站的水通量观测数据、气象观测数据、植被土壤地形数据和遥感数据,此时计算碳通量和水通量时,气象观测数据、植被土壤地形数据和遥感数据所包括的数据类型相同,气象观测数据包括气温(日最高温,日最低温,日均温,日较差)、降水、饱和水汽压差、向下的短波辐射、大气相对湿度、风速、日照时数(也可替换为太阳辐射),土壤地形数据包括砂的百分比、粉砂百分比、粘土百分比、经度、纬度、坡度、坡向、高程,遥感数据包括归一化植被指数、增强植被指数、叶面积指数、光合有效辐射吸收比例和地表水分指数。有时还需要考虑时间因子,比如一年中的第几天。
若考虑影响因子的独立性,则计算碳通量时所用的第一观测数据集包括涡度相关通量站的碳通量观测数据、气象观测数据、植被土壤地形数据和遥感数据,计算水通量时所用的第一观测数据集包括涡度相关通量站的水通量观测数据、气象观测数据、植被土壤地形数据和遥感数据,此时,在计算碳通量和水通量时,气象观测数据、植被土壤地形数据和遥感数据所包括的数据类型不同。在计算碳通量时,气象观测数据包括气温(日均温和日较差,或者,日最高温、日最低温和日均温)、降水、饱和水汽压差(也可替换为大气相对湿度)、向下的短波辐射(也可替换为日照时数或太阳辐射),植被土壤地形数据包括砂的百分比、粉砂百分比、粘土百分比、经度、纬度、坡度、坡向、高程,遥感数据包括归一化植被指数(也可替换为增强植被指数、叶面积指数或者光合有效辐射吸收比例)。在计算水通量时,气象观测数据包括气温(日均温和日较差,或者,日最高温、日最低温和日均温)、降水、饱和水汽压差(也可替换为大气相对湿度)、向下的短波辐射(也可替换为日照时数或太阳辐射)、风速,植被土壤地形数据包括砂的百分比、粉砂百分比、粘土百分比、经度、纬度、坡度、坡向、高程,遥感数据包括归一化植被指数(也可替换为增强植被指数或者叶面积指数或者光合有效辐射吸收比例)和地表水分指数。
实施例3:
本实施例用于提供一种基于气象站的生态系统碳水通量计算系统,如图3所示,所述计算系统包括:
数据获取模块M1,用于获取目标区域中每一涡度相关通量站的第一观测数据集;所述第一观测数据集包括所述涡度相关通量站的碳水通量观测数据和气象观测数据以及所述涡度相关通量站所在位置的植被土壤地形数据;或者,所述第一观测数据集包括所述涡度相关通量站的碳水通量观测数据和气象观测数据以及所述涡度相关通量站所在位置的植被土壤地形数据和遥感数据;
碳水通量数据集构建模块M2,用于根据植被功能类型和/或气候类型对所述涡度相关通量站进行选择性组合,得到多个组合和每一所述组合对应的碳水通量数据集;所述组合表征一种景观或生态系统的情景;所述碳水通量数据集包括所述组合内的所有所述涡度相关通量站的第一观测数据集;
评价数据集构建模块M3,用于对于每一所述组合,通过多种划分方式分别对所述组合对应的碳水通量数据集进行划分,得到每一种所述划分方式对应的训练集和测试集;对于每一种所述划分方式,以所述训练集作为输入,利用第一机器学习算法训练得到所述组合在所述划分方式下的用于预测站点碳水通量的碳水通量模型;以所述测试集作为所述碳水通量模型的输入,计算得到所述组合在所述划分方式下的决定系数;计算每一碳水通量影响因子在所述训练集和所述测试集之间的欧式距离,得到所述组合在所述划分方式下的距离集合;根据所有所述组合在所有所述划分方式下的决定系数和距离集合构建评价数据集;所述碳水通量影响因子即为所述第一观测数据集中除所述碳水通量观测数据之外的数据;
评价模型构建模块M4,用于以所述评价数据集作为输入,利用第二机器学习算法训练得到用于预测决定系数的评价模型;
计算模块M5,用于对于所述目标区域中的每一气象站,利用所述评价模型确定所述气象站适用的碳水通量模型,并利用所述气象站适用的碳水通量模型计算所述气象站的碳水通量。
本说明书中每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种基于气象站的生态系统碳水通量计算方法,其特征在于,所述计算方法包括:
获取目标区域中每一涡度相关通量站的第一观测数据集;所述第一观测数据集包括所述涡度相关通量站的碳水通量观测数据和气象观测数据以及所述涡度相关通量站所在位置的植被土壤地形数据;或者,所述第一观测数据集包括所述涡度相关通量站的碳水通量观测数据和气象观测数据以及所述涡度相关通量站所在位置的植被土壤地形数据和遥感数据;
根据植被功能类型和/或气候类型对所述涡度相关通量站进行选择性组合,得到多个组合和每一所述组合对应的碳水通量数据集;所述组合表征一种景观或生态系统的情景;所述碳水通量数据集包括所述组合内的所有所述涡度相关通量站的第一观测数据集;
对于每一所述组合,通过多种划分方式分别对所述组合对应的碳水通量数据集进行划分,得到每一种所述划分方式对应的训练集和测试集;对于每一种所述划分方式,以所述训练集作为输入,利用第一机器学习算法训练得到所述组合在所述划分方式下的用于预测站点碳水通量的碳水通量模型;以所述测试集作为所述碳水通量模型的输入,计算得到所述组合在所述划分方式下的决定系数;计算每一碳水通量影响因子在所述训练集和所述测试集之间的欧式距离,得到所述组合在所述划分方式下的距离集合;根据所有所述组合在所有所述划分方式下的决定系数和距离集合构建评价数据集;所述碳水通量影响因子即为所述第一观测数据集中除所述碳水通量观测数据之外的数据;
以所述评价数据集作为输入,利用第二机器学习算法训练得到用于预测决定系数的评价模型;
对于所述目标区域中的每一气象站,利用所述评价模型确定所述气象站适用的碳水通量模型,并利用所述气象站适用的碳水通量模型计算所述气象站的碳水通量。
2.根据权利要求1所述的计算方法,其特征在于,所述气象观测数据包括气温、降水、饱和水汽压差、气压、向下的短波辐射、大气相对湿度、风速、风向和日照时数;所述植被土壤地形数据包括土壤质地、土地覆被类型和位置地形;所述遥感数据包括植被指数、波段光谱、地表水分指数、地表温度和地表湿度。
3.根据权利要求1所述的计算方法,其特征在于,所述植被功能类型包括农田、草地、落叶阔叶林、常绿阔叶林、常绿针叶林、混交林、稀树草原、灌木林、湿地和荒漠;所述气候类型包括干旱、半干旱、半湿润和湿润。
4.根据权利要求1所述的计算方法,其特征在于,所述碳水通量数据集的构建方法为:按照预定时间尺度对所述组合内的所有所述涡度相关通量站的第一观测数据集进行随机采样,得到碳水通量数据集;不同所述碳水通量数据集的预定时间尺度相同或者不同。
5.根据权利要求1所述的计算方法,其特征在于,所述碳水通量观测数据包括碳通量观测数据和水通量观测数据,所述碳水通量模型包括用于预测站点碳通量的碳通量模型和用于预测站点水通量的水通量模型,则所述以所述训练集作为输入,利用第一机器学习算法训练得到所述组合在所述划分方式下的用于预测站点碳水通量的碳水通量模型具体包括:
以所述训练集中除所述碳水通量观测数据之外的数据作为输入,以所述训练集中的所述碳通量观测数据作为标签,利用第一机器学习算法训练得到所述组合在所述划分方式下的用于预测站点碳通量的碳通量模型;
以所述训练集中除所述碳水通量观测数据之外的数据作为输入,以所述训练集中的所述水通量观测数据作为标签,利用第一机器学习算法训练得到所述组合在所述划分方式下的用于预测站点水通量的水通量模型。
6.根据权利要求5所述的计算方法,其特征在于,训练所述碳通量模型时,所述气象观测数据包括气温、降水、饱和水汽压差以及向下的短波辐射;所述植被土壤地形数据包括土壤质地和位置地形;所述遥感数据包括植被指数;训练所述水通量模型时,所述气象观测数据包括气温、降水、饱和水汽压差、向下的短波辐射以及风速;所述植被土壤地形数据包括土壤质地和位置地形;所述遥感数据包括植被指数和地表水分指数。
7.根据权利要求1所述的计算方法,其特征在于,所述利用所述评价模型确定所述气象站适用的碳水通量模型具体包括:
获取所述气象站的第二观测数据集;所述第二观测数据集的数据与所述第一观测数据集中除碳水通量观测数据之外的其他数据的类型相同;
对于每一所述碳水通量模型,计算每一所述碳水通量影响因子在训练所述碳水通量模型时所用的训练集和所述第二观测数据集之间的欧式距离,得到应用距离集合;以所述应用距离集合作为输入,利用所述评价模型计算将所述碳水通量模型应用至所述气象站的应用决定系数,得到所述碳水通量模型对应的应用决定系数;
根据所有所述碳水通量模型对应的应用决定系数确定所述气象站适用的碳水通量模型。
8.根据权利要求7所述的计算方法,其特征在于,所述根据所有所述碳水通量模型对应的应用决定系数确定所述气象站适用的碳水通量模型具体包括:
对于每一所述碳水通量模型,判断所述碳水通量模型对应的应用决定系数是否大于或等于预设阈值;若是,则所述碳水通量模型适用于所述气象站;若否,则所述碳水通量模型不适用于所述气象站;所有适用于所述气象站的碳水通量模型组成备选集;
选取所述备选集中应用决定系数最大的碳水通量模型作为所述气象站适用的碳水通量模型。
9.根据权利要求8所述的计算方法,其特征在于,所述预设阈值大于或者等于0.5。
10.一种基于气象站的生态系统碳水通量计算系统,其特征在于,所述计算系统包括:
数据获取模块,用于获取目标区域中每一涡度相关通量站的第一观测数据集;所述第一观测数据集包括所述涡度相关通量站的碳水通量观测数据和气象观测数据以及所述涡度相关通量站所在位置的植被土壤地形数据;或者,所述第一观测数据集包括所述涡度相关通量站的碳水通量观测数据和气象观测数据以及所述涡度相关通量站所在位置的植被土壤地形数据和遥感数据;
碳水通量数据集构建模块,用于根据植被功能类型和/或气候类型对所述涡度相关通量站进行选择性组合,得到多个组合和每一所述组合对应的碳水通量数据集;所述组合表征一种景观或生态系统的情景;所述碳水通量数据集包括所述组合内的所有所述涡度相关通量站的第一观测数据集;
评价数据集构建模块,用于对于每一所述组合,通过多种划分方式分别对所述组合对应的碳水通量数据集进行划分,得到每一种所述划分方式对应的训练集和测试集;对于每一种所述划分方式,以所述训练集作为输入,利用第一机器学习算法训练得到所述组合在所述划分方式下的用于预测站点碳水通量的碳水通量模型;以所述测试集作为所述碳水通量模型的输入,计算得到所述组合在所述划分方式下的决定系数;计算每一碳水通量影响因子在所述训练集和所述测试集之间的欧式距离,得到所述组合在所述划分方式下的距离集合;根据所有所述组合在所有所述划分方式下的决定系数和距离集合构建评价数据集;所述碳水通量影响因子即为所述第一观测数据集中除所述碳水通量观测数据之外的数据;
评价模型构建模块,用于以所述评价数据集作为输入,利用第二机器学习算法训练得到用于预测决定系数的评价模型;
计算模块,用于对于所述目标区域中的每一气象站,利用所述评价模型确定所述气象站适用的碳水通量模型,并利用所述气象站适用的碳水通量模型计算所述气象站的碳水通量。
CN202310097077.4A 2023-01-16 2023-01-16 一种基于气象站的生态系统碳水通量计算方法及系统 Active CN116050163B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310097077.4A CN116050163B (zh) 2023-01-16 2023-01-16 一种基于气象站的生态系统碳水通量计算方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310097077.4A CN116050163B (zh) 2023-01-16 2023-01-16 一种基于气象站的生态系统碳水通量计算方法及系统

Publications (2)

Publication Number Publication Date
CN116050163A true CN116050163A (zh) 2023-05-02
CN116050163B CN116050163B (zh) 2023-08-11

Family

ID=86120414

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310097077.4A Active CN116050163B (zh) 2023-01-16 2023-01-16 一种基于气象站的生态系统碳水通量计算方法及系统

Country Status (1)

Country Link
CN (1) CN116050163B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117153291A (zh) * 2023-10-31 2023-12-01 水利部交通运输部国家能源局南京水利科学研究院 一种灌区稻田碳汇价值计算方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011014782A1 (en) * 2009-07-31 2011-02-03 Carbon Auditors Inc. Greenhouse gas grid and tracking system
CN105678091A (zh) * 2016-01-28 2016-06-15 华东师范大学 一种快速反演湿地植被初级生产力的方法
CN109378032A (zh) * 2018-09-25 2019-02-22 中国科学院地理科学与资源研究所 一种生态模型模拟不确定性分析方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011014782A1 (en) * 2009-07-31 2011-02-03 Carbon Auditors Inc. Greenhouse gas grid and tracking system
CN105678091A (zh) * 2016-01-28 2016-06-15 华东师范大学 一种快速反演湿地植被初级生产力的方法
CN109378032A (zh) * 2018-09-25 2019-02-22 中国科学院地理科学与资源研究所 一种生态模型模拟不确定性分析方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
HAIYANG SHI 等: "Evaluation of water flux predictive models developed using eddy-covariance observations and machine learning: a meta-analysis", HYDROLOGY AND EARTH SYSTEM SCIENCES *
何立杰;何洪林;任小丽;葛蓉;杨涛;朱超;: "基于贝叶斯机器学习的生态模型参数优化方法研究", 地球信息科学学报, no. 10 *
康满春;朱丽平;许行;查同刚;张志强;: "基于Biome-BGC模型的北方杨树人工林碳水通量对气候变化的响应研究", 生态学报, no. 07 *
施婷婷;高玉芳;袁凤辉;TAKESHI OHTA;: "温带混交林碳水通量模拟及其对冠层分层方式的响应――耦合的气孔导度-光合作用-能量平衡模型", 生态学报, no. 15 *
龚元;纪小芳;花雨婷;张银龙;李楠;: "基于涡动相关技术的森林生态系统二氧化碳通量研究进展", 浙江农林大学学报, no. 03 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117153291A (zh) * 2023-10-31 2023-12-01 水利部交通运输部国家能源局南京水利科学研究院 一种灌区稻田碳汇价值计算方法及系统
CN117153291B (zh) * 2023-10-31 2024-01-02 水利部交通运输部国家能源局南京水利科学研究院 一种灌区稻田碳汇价值计算方法及系统

Also Published As

Publication number Publication date
CN116050163B (zh) 2023-08-11

Similar Documents

Publication Publication Date Title
CN108536908B (zh) 基于非点源氮磷流失风险对流域水环境安全评估的方法
He et al. Alternative future analysis for assessing the potential impact of climate change on urban landscape dynamics
CN101916337B (zh) 一种基于地理信息系统的水稻生产潜力动态预测方法
CN110598290A (zh) 考虑气候变化的流域未来水电发电能力预测方法和系统
CN113902580B (zh) 一种基于随机森林模型的历史耕地分布重建方法
CN103529189A (zh) 一种基于定性和定量辅助变量的土壤有机质空间分布预测方法
CN114254802B (zh) 气候变化驱动下植被覆盖时空变化的预测方法
CN110909447B (zh) 一种高精度电离层区域短期预报方法
CN114861277B (zh) 一种长时序国土空间功能与结构模拟方法
Sun et al. Causes for the increases in both evapotranspiration and water yield over vegetated mainland China during the last two decades
CN116050163B (zh) 一种基于气象站的生态系统碳水通量计算方法及系统
Song et al. Heuristic cellular automaton model for simulating soil organic carbon under land use and climate change: A case study in eastern China
CN109657988B (zh) 基于hasm和欧氏距离算法的烟叶品质分区方法
Roshani et al. Groundwater level fluctuations in coastal aquifer: Using artificial neural networks to predict the impacts of climatical CMIP6 scenarios
CN117251989A (zh) 一种气象站点的碳水通量信息确定方法、系统及电子设备
CN117494419A (zh) 一种多模型耦合的流域水土流失遥感监测方法
CN117493476A (zh) 一种融合物理机制和人工智能的径流回溯模拟方法及系统
Saha et al. Relative impacts of projected climate and land use changes on terrestrial water balance: a case study on Ganga River basin
CN117709087A (zh) 一种基于气象站的生态系统碳水通量计算方法及系统
CN114004141A (zh) 一种河流流域地下水超采区预测决策平台
Serur et al. Evaluation of the ArcSWAT model in simulating catchment hydrology: in Weyib River basin, bale mountainous area of southeastern Ethiopia
Paul Assessment of change in future flow of Brahmaputra Basin applying SWAT model using multi-member ensemble climate data
Wang et al. Spatiotemporal Pattern Simulation of Fractional Vegetation Coverage in the South Qilian Mountains Based on Bp Neural Network
CN117217075A (zh) 一种基于通量观测的格网尺度生态系统碳水通量评估方法
Ishigooka et al. Modeling of continental-scale crop water requirement and available water resources

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant