CN114974453B - 一种大气二氧化碳柱浓度高覆盖度重建方法 - Google Patents
一种大气二氧化碳柱浓度高覆盖度重建方法 Download PDFInfo
- Publication number
- CN114974453B CN114974453B CN202210597699.9A CN202210597699A CN114974453B CN 114974453 B CN114974453 B CN 114974453B CN 202210597699 A CN202210597699 A CN 202210597699A CN 114974453 B CN114974453 B CN 114974453B
- Authority
- CN
- China
- Prior art keywords
- concentration
- column
- data
- column concentration
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- CURLTUGMZLYLDI-UHFFFAOYSA-N Carbon dioxide Chemical compound O=C=O CURLTUGMZLYLDI-UHFFFAOYSA-N 0.000 title claims abstract description 52
- 238000000034 method Methods 0.000 title claims abstract description 30
- 229910002092 carbon dioxide Inorganic materials 0.000 title claims abstract description 26
- 239000001569 carbon dioxide Substances 0.000 title claims abstract description 20
- 238000012795 verification Methods 0.000 claims abstract description 20
- 230000008859 change Effects 0.000 claims abstract description 17
- 238000007637 random forest analysis Methods 0.000 claims abstract description 16
- 238000012545 processing Methods 0.000 claims abstract description 6
- 229910052799 carbon Inorganic materials 0.000 claims description 22
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 claims description 21
- 238000002790 cross-validation Methods 0.000 claims description 6
- 238000012544 monitoring process Methods 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 5
- 238000005259 measurement Methods 0.000 claims description 4
- 238000012216 screening Methods 0.000 abstract description 4
- 238000003066 decision tree Methods 0.000 description 10
- 230000008569 process Effects 0.000 description 7
- 238000011161 development Methods 0.000 description 5
- 238000010521 absorption reaction Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 239000005431 greenhouse gas Substances 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 238000010200 validation analysis Methods 0.000 description 2
- 238000010792 warming Methods 0.000 description 2
- 238000012952 Resampling Methods 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 101150113811 abo2 gene Proteins 0.000 description 1
- 239000000443 aerosol Substances 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000006386 neutralization reaction Methods 0.000 description 1
- 239000000843 powder Substances 0.000 description 1
- 238000013138 pruning Methods 0.000 description 1
- 238000003908 quality control method Methods 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/20—Identification of molecular entities, parts thereof or of chemical compositions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/20—Ensemble learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/01—Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/70—Machine learning, data mining or chemometrics
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/80—Management or planning
- Y02P90/84—Greenhouse gas [GHG] management systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Computing Systems (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- Data Mining & Analysis (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Artificial Intelligence (AREA)
- Economics (AREA)
- Tourism & Hospitality (AREA)
- Mathematical Physics (AREA)
- General Business, Economics & Management (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Crystallography & Structural Chemistry (AREA)
- Development Economics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Marketing (AREA)
- Educational Administration (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Primary Health Care (AREA)
- Computational Linguistics (AREA)
- Databases & Information Systems (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供了一种大气二氧化碳柱浓度高覆盖度重建方法,包括:步骤1、分析大气CO2来源和变化影响因子,将CO2柱浓度产品与各变化影响因子的数据统一到相同的分辨率,进行数据匹配,通过计算CO2柱浓度和各变化影响因子间的Person相关性,进行变量筛选;步骤2、利用筛选出的变化影响因子组成建模数据集,利用随机森林模型对建模数据集进行建模,并调整模型参数,使得模型验证结果最优,得到CO2柱浓度预测模型;步骤3、将区域内的所有的建模数据进行标准空间网格化处理,利用搭建好的CO2柱浓度预测模型进行预测,得到区域内每天的所有网格点CO2柱浓度数据集。本发明能获取到区域全覆盖的CO2柱浓度的日尺度级数据。
Description
技术领域
本发明属于大气二氧化碳浓度预测技术领域,具体涉及到一种大气二氧化碳柱浓度高覆盖度重建方法。
背景技术
工业革命以来,全球大气CO2浓度急剧增加,根据地面观测数据表明,大气CO2浓度从工业革命初的280ppm增加到2020年的413.2ppm,并且每年还以接近2ppm的增量不断升高。CO2作为最重要的温室气体,是全球变暖的重要影响因子。随着大气CO2浓度增大,全球温室效应也不断增大,极端天气、自然灾害频发,极端事件显著增多,使得世界各国纷纷制定碳中和气候目标,积极应对气候变化成为全球性挑战。为应对气候变化,人类积极寻求全球性合作。2015年气候变化巴黎大会通过的《巴黎协定》,代表了全球绿色低碳转型的大方向,为2020年以后全球合作应对气候变化构建了制度框架。《巴黎协定》确立了全球应对气候变化的共同目标:到21世纪末将全球气温升幅控制在工业化前水平基础上不超过2℃,努力控制在1.5℃以内,尽快实现全球温室气体排放达峰,在21世纪下半叶实现温室气体净零排放。准确预测大气CO2的浓度变化,并且有效应对,是实现地球可持续发展的重大科学问题。
大气CO2是地球碳循环的重要组成部分,是大气、陆地、海洋碳交换之间的媒介,对地表碳源碳汇的研究有十分重要的作用。然而,关于碳源碳汇的研究还有许多不确定的问题,比如区域中小尺度碳排放强度的测算,碳源碳汇的地理位置的确定。若想解决这类问题,需要利用更高时空分辨率和更高覆盖度的大气CO2浓度数据。
由于大气散射导致的光路传输过程中路径加长,传输过程中由于云层遮盖的问题而无法得到有效的辐射信号,气溶胶类型、大小不一致导致存在复杂的大气散射现象,在CO2浓度反演过程中因为精度不高被剔除。如OCO-2卫星,在经过质量控制后,有效的观测数据仅占所有观测数据的10%左右。
OCO-2卫星是继GOSAT卫星之后全球第二颗碳卫星,在2014年发射升空,OCO-2上携带单一的传感器,由三个同视轴的长狭缝光栅成像光谱仪组成,设有三个观测通道:分别为CO2弱吸收带通道WCO2(波段1.591~1.621μm)、CO2强吸收带通道SCO2(波段2.043~2.083μm)和O2-A吸收带通道ABO2(波段0.758~0.773μm),各个波段的光谱分辨率均大于0.17㎝-1,信噪比>400,即使是在黑暗的海洋区域当太阳高度角高达80°时依然能获取有效数据。OCO-2具有3种常规观测模式:耀斑观测、天底观测及目标观测模式,当卫星飞跃太阳直射半球时,在10km的成像宽度内,OCO-2的每个观测通道每秒收集24个波段的波谱信息,每天产生约一百万个观测点。一个月内有7%-12%的观测点通过云校正以及其他数据质量筛选过程,以反演大气CO2柱浓度。
OCO-2卫星的重返周期为16天,即便是能够进行监测的区域,其数据也仅是16天获取一次,无法反映真实的CO2柱浓度的季度均值和空间分布结果。
因此,本领域需要设计一种新的大气二氧化碳柱浓度高覆盖度重建方法。
发明内容
本发明的目的是提供一种大气二氧化碳柱浓度高覆盖度重建方法,以解决背景技术中提出的目前受卫星观测模式影响和反演精度影响导致的卫星遥感CO2柱浓度数据覆盖度不够的问题。
本发明的技术方案是,
一种大气二氧化碳柱浓度高覆盖度重建方法,包括以下步骤:
步骤1、分析大气CO2来源和变化影响因子,将CO2柱浓度产品与各变化影响因子的数据统一到相同的分辨率,进行数据匹配,通过计算CO2柱浓度和各变化影响因子间的Person相关性,进行变量筛选;
步骤2、利用筛选出的变化影响因子组成建模数据集,利用随机森林模型对建模数据集进行建模,并调整模型参数,使得模型验证结果最优,得到CO2柱浓度预测模型;
步骤3、将区域内的所有的建模数据进行标准空间网格化处理,利用搭建好的CO2柱浓度预测模型进行预测,得到区域内每天的所有网格点CO2柱浓度数据集。
在一种具体的实施方式中,步骤1中,CO2柱浓度产品为卫星监测得到的CO2柱浓度数据。
在一种具体的实施方式中,步骤1中,CO2柱浓度产品为OCO-2卫星监测得到的L2级的Lite_FP文件CO2柱浓度产品根据官方说明手册筛选反演质量最好的部分CO2柱浓度数据;将CO2柱浓度产品与各变化影响因子的数据统一重采样到5km×5km的空间分辨率。
在一种具体的实施方式中,步骤1中,所述变化影响因子包括时间、气象因子类变量、人为排放类变量和植被碳汇类变量;气象因子类变量包括温度、相对湿度、大气压、垂直风速、水平风速、边界层高度;人为排放类变量包括夜间灯光数据;植被碳汇类变量包括归一化植被指数。
在一种具体的实施方式中,处理夜间灯光数据时,采用了分区域计算夜间灯光均值,分区域夜间灯光均值的计算公式如下:
DNmean表示分区域的灯光均值,DNall表示分区域的灯光总值,Areacity表示分区域的面积。
在一种具体的实施方式中,选取气象因子类变量时,选取与二氧化碳观测卫星的过境时间相差小于2小时的时间点的气象数据进行匹配。
在一种具体的实施方式中,步骤2中,调整模型参数包括调整随机森林中最小叶数目和调整学习周期数据。
在一种具体的实施方式中,步骤2中,模型验证采用了三种精度验证方式对模型精度进行评估,包括:直接拟合结果对比,基于样本的十折交叉验证结果对比,基于空间位置的十折交叉验证结果对比;
且三种精度验证方式均采用了R2、RMSE和MAE作为统计指标对模型精度进行评定,R2即决定系数,RMSE即均方根误差,MAE即平均绝对误差;其中R2、RMSE、MAE的公式分别如下所示:
其中,x表示卫星的CO2柱浓度测量结果,y表示模型拟合的CO2柱浓度结果,表示匹配数据集中卫星观测的CO2柱浓度均值,/>表示模型拟合的CO2柱浓度均值,n表示数据条数;
其中,Xi表示模型拟合CO2柱浓度结果,表示模型拟合CO2柱浓度的均值,n表示数据条数;
其中,Yi表示模型拟合CO2柱浓度结果,表示模型拟合CO2柱浓度结果的均值,n表示数据条数。
在一种具体的实施方式中,步骤3中,利用搭建好的CO2柱浓度预测模型进行预测,具体是指,利用建立好的CO2柱浓度预测模型,对区域内每个像素点的CO2柱浓度进行预测,得到区域内所有网格点CO2柱浓度数据集,即得到全覆盖的CO2浓度数据产品集。
在一种具体的实施方式中,步骤3中,还包括通过与二氧化碳观测卫星观测的原始CO2浓度进行对比,分析所获取的数据集与原始数据的差异。
本发明的有益效果包括:
本发明能够获取到区域全覆盖的CO2柱浓度的日尺度级数据,经过验证,搭建的模型的各种精度验证结果均优于目前的模型精度,且得到的区域CO2柱浓度数据与OCO-2卫星观测原始数据基本一致。
由于卫星绕地球飞行时,卫星扫描的区域有一定的周期性,如OCO-2卫星的重返周期为16天,也即是说该卫星能够进行监测的区域,其数据是16天获取一次;而采用本发明进行重建后,得到的CO2柱浓度数据的时间分辨率为1天,在时间维度上能进行更精细的探测,从而对于CO2排放的短期异常能做到有效的监测。
相比于OCO-2卫星监测的CO2柱浓度数据在区域内的覆盖度非常有限,采用本发明进行重建后,得到的CO2柱浓度数据实现了区域的基本全覆盖。
除了上面所描述的目的、特征和优点之外,本发明还有其它的目的、特征和优点。下面将参照图,对本发明作进一步详细的说明。
附图说明
构成本申请的一部分的附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1为本发明中一种实施例的流程图;
图2为本发明中OCO-2卫星CO2柱浓度中国区域2015~2018年一月观测结果对比图;
图3为本发明中夜间灯光数据京津冀区域均值结果图;
图4为本发明中随机森林模型的三种精度验证结果(直接拟合结果对比,基于样本的十折交叉验证结果对比,基于空间位置的十折交叉验证结果对比)对比图;
图5为本发明中OCO-2卫星CO2柱浓度京津冀区域2015~2018年四季观测结果空间分布对比图;
图6为本发明中模型重建得到的京津冀区域2015~2018年四季全覆盖CO2柱浓度空间分布图;
图7为本发明中重建得到的CO2柱浓度数据集与原始卫星观测数据月均值对比图。
具体实施方式
以下结合附图对本发明的实施例进行详细说明,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
如图1所示,是本发明一种大气二氧化碳柱浓度高覆盖度重建方法的流程图,包括如下步骤:
步骤1、分析大气CO2来源和变化影响因子,将CO2柱浓度产品与各变化影响因子的数据统一到相同的分辨率,进行数据匹配,通过计算CO2柱浓度和各变化影响因子间的Person相关性,进行变量筛选。
CO2柱浓度产品为OCO-2卫星监测得到的CO2柱浓度数据,该产品的空间分辨率为1.29km×2.25km,时间分辨率为16天。OCO-2的2级数据有三种CO2柱浓度产品,包括V7、V7r和Lite_FP文件产品,在数据应用中,Lite_FP通常有着最有效的数据量和相对稳定的空间覆盖率,所以本发明选取的L2级的Lite_FP进行研究,并根据官方说明手册筛选反演质量最好的部分CO2柱浓度数据,筛选出的数据如图2所示(此处展示了中国全境的月均值数据)。
所述变化影响因子包括时间、气象因子类变量、人为排放类变量和植被碳汇类变量;气象因子类变量包括温度、相对湿度、大气压、垂直风速、水平风速、边界层高度;人为排放类变量包括夜间灯光数据;植被碳汇类变量包括归一化植被指数。
将CO2柱浓度产品与各变化影响因子的数据统一重采样到5km×5km的空间分辨率,进行数据匹配。
选择了时间、温度、相对湿度、大气压、垂直风速、水平风速、边界层高度、夜间灯光数据、归一化植被指数的数据作为建模数据集,变量的Person相关系数如表1所示。
表1
特别的,为契合本实施例使用的OCO-2当地时13:30卫星过境时间,选择了当地时13:00的气象数据进行匹配。
特别的,在处理夜间灯光数据时,本实施例采用了分区域夜间灯光均值,分区域夜间灯光均值的计算公式如下:
DNmean表示分区域的灯光均值,DNall表示分区域的灯光总值,Areacity表示分区域的面积。得到的分区域夜间灯光均值结果如图3所示。
区域的经济发展水平与人口数量、工业发展水平息息相关,这两者与人为碳排放量的大小密切相关,采用分区域的夜光均值,能够有效反映出该区域的整体经济发展水平,继而有效反映人为碳排放量的大小。大气CO2呈现聚集状、团雾状分布,一定范围内的CO2柱浓度差异较小,而不同格网点的夜间灯光值差异巨大,点与点的匹配模式并不能有效对应CO2的浓度大小,所以采用区域整体夜光均值的计算方式,以表现区域的整体排放情况,与CO2柱浓度相对应。
步骤2、利用筛选出的变化影响因子组成建模数据集,利用随机森林模型对建模数据集进行建模,并调整模型参数,使得模型验证结果最优,得到CO2柱浓度预测模型。
具体的,通过对2015年1月1日至2019年12月31日的数据进行匹配,总共匹配到62964条数据。本发明选用的模型为随机森林模型,最早由Cutler等人于2004年提出,它是一个包含多个决策树的集成学习算法,可以看做是决策树的提升版。
随机森林算法的基本过程:
(1)一个样本容量为N的样本,采用bootstrap抽样法,有放回的抽取n次,每次抽取1组,最终形成了n个样本集,n个样本数据集分别建立完全生长的决策树。
(2)当每个样本有M个属性时,在决策树的每个节点需要分裂时,随机从这M个属性中选取出m个属性,满足条件m<<M。然后从这m个属性中采用基尼指数来选择1个属性作为该节点的分裂属性,基尼指数表示在样本集合中一个随机选中的样本被分错的概率,基尼指数越小表示集合中被选中的样本被分错的概率越小,计算公式如下:
pk表示选中的样本属于k类别的概率。
(3)决策树形成过程中每个节点都要按照上一步骤来分裂,一直到不能够再分裂为止,整个决策树形成过程中都是自由生长,没有进行剪枝处理。
(4)按照前面三个步骤建立大量的决策树,最后构建n颗决策树子树,对n棵决策子树的预测值采用均值作为最终结果,这样就构成了随机森林预测值了。
随机森林模型具有以下优势:
(1)随机森林回归的调节参数少,仅需调整随机森林中回归树的数量即可,模型调试费时较少。
(2)随机森林不会出现严重的过拟合现象,因为在建立决策树的过程中,随机抽取子样本与随机选取特征,可以降低各个回归树之间的相关性,从而降低随机森林模型的泛化误差。
在参数调整模块,主要调整随机森林中最小叶数目(MinLeafSize)和学习周期数据(NumLearningCycles)两个参数,本实施例中,通过不断的尝试,MinLeafSize最终设置为4,NumLearningCycles最终设置为30,能得到最好的模型效果。
模型参数调整完成后需要对调整后的模型精度进行验证,除了统计模型训练完成后的直接拟合结果,还采用了十折交叉验证(10-CV)的方式对模型进行验证,多种方式验证能避免模型中潜在的过拟合问题。本实施例通过对62964条数据进行随机拆分成10等份,用其中9份进行训练,剩下一份进行预测,将预测得到的结果与原始的数据结果进行比对,重复这个过程十次,直到每一份数据都进行了预测,最终得到了所有数据的预测值。在本实施例中同时采用了基于随机样本的10-CV验证和基于空间位置的10-CV验证。
同时,三种精度验证方式均采用了决定系数(R2)、均方根误差(RMSE)、平均绝对误差(MAE)等统计指标对模型精度进行评定,其中R2、RMSE、MAE的公式分别如下所示:
其中,x表示卫星的CO2柱浓度测量结果,y表示模型拟合的CO2柱浓度结果,表示匹配数据集中卫星观测的CO2柱浓度均值,/>表示模型拟合的CO2柱浓度均值,n表示数据条数;
其中,Xi表示模型拟合CO2柱浓度结果,表示模型拟合CO2柱浓度的均值,n表示数据条数;
其中,Yi表示模型拟合CO2柱浓度结果,表示模型拟合CO2柱浓度结果的均值,n表示数据条数。
使用上述精度指标对模型的精度进行验证,得到的结果如图4所示。得到的的直接拟合结果:R2=0.96,RMSE=1.09ppm,MAE=0.56ppm,基于样本的随机10-CV验证结果:R2=0.91,RMSE=1.68ppm,MAE=0.88ppm,基于经纬度的空间10-CV验证结果:R2=0.91,RMSE=1.68ppm,MAE=0.88ppm。从验证结果可以看出,本研究的模型的预测结果与实际的CO2柱浓度结果是比较接近的,同时通过基于样本的10-CV验证和基于经纬度的空间10-CV验证的结果来看,其R2是比较接近的(0.96VS 0.91),可以判定模型不存在严重的过拟合现象,同时在不同空间位置上面的预测能力也较强,可以用来进行面域的CO2柱浓度预测。
步骤3、将区域内的所有的建模数据进行标准空间网格化处理,利用搭建好的CO2柱浓度预测模型进行预测,得到区域内所有网格点CO2柱浓度数据集。
具体的,为了更好的展示重建结果,首先,利用原始的OCO-2卫星观测数据进行了京津冀区域的CO2柱浓度季度均值制图,在制图时绘制了2015年-2018年春夏秋冬四季的OCO-2卫星CO2柱浓度季度均值结果,如图5所示。通过图5可以看出,原始的OCO-2卫星CO2柱浓度覆盖度在京津冀地区的覆盖度非常低,很多区域都无法进行有效的CO2柱浓度监测,同时,OCO-2卫星的重返周期为16天,即便是能够进行监测的区域,其数据也仅是16天获取一次,图中所显示的季度均值结果也仅为16天一景数据的季度平均,无法反映真实的CO2柱浓度的季度均值和空间分布结果。
步骤3中,利用搭建好的CO2柱浓度预测模型进行预测,具体是指,利用建立好的CO2柱浓度预测模型,对区域内每个像素点的CO2柱浓度进行预测,得到区域内所有网格点CO2柱浓度数据集,即得到全覆盖的CO2浓度数据产品集。
本实施例利用本发明搭建好的CO2柱浓度预测模型,利用多源遥感卫星数据,对京津冀区域的CO2柱浓度进行面域预测,并绘制了2015年至2018年四年间的CO2柱浓度季度均值图,如图6所示。从图6可以看出,相比于OCO-2卫星直接观测得到的CO2柱浓度数据,通过本实施例所建立的CO2柱浓度预测模型,能够进行区域的CO2柱浓度预测,空间分布完整,不存在空缺值,能对区域碳源碳汇进行更加精确研究。此外,本实施例得到的CO2柱浓度数据的时间分辨率为1天,相比于OCO-2卫星监测的CO2柱浓度数据16天的时间分辨率,在时间维度上能进行更精细的探测,对于CO2排放的短期异常能做到有效的监测。
为了对模型得到的CO2柱浓度数据进行更精细的对比,还统计了原始的OCO-2卫星CO2柱浓度月均值和本发明搭建好的CO2柱浓度预测模型拟合面域的CO2柱浓度月均值,得到的结果如图7所示。通过图7可以看出,CO2柱浓度预测模型预测的面域CO2柱浓度月均值和原始OCO-2卫星观测的CO2柱浓度具有良好的一致性,其随时间变化趋势基本一致。通过两组数据的月均值对比,如表2所示,也可以发现CO2柱浓度预测模型模拟的CO2柱浓度整体结果和原始OCO-2卫星观测结果基本一致,所有月份偏差都在2ppm以内,所有偏差绝对值平均值为0.53ppm,证明本发明具有良好的模型性能,具有较强的CO2柱浓度预测能力。
表2
以上内容是结合具体的优选实施方式对本发明作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演和替换,都应当视为属于本发明的保护范围。
Claims (7)
1.一种大气二氧化碳柱浓度高覆盖度重建方法,其特征在于,包括以下步骤:
步骤1、分析大气CO2来源和变化影响因子,将CO2柱浓度产品与各变化影响因子的数据统一到相同的分辨率,进行数据匹配,通过计算CO2柱浓度和各变化影响因子间的Person相关性,进行变量筛选;所述变化影响因子包括时间、气象因子类变量、人为排放类变量和植被碳汇类变量;气象因子类变量包括温度、相对湿度、大气压、垂直风速、水平风速、边界层高度;人为排放类变量包括夜间灯光数据;植被碳汇类变量包括归一化植被指数;
步骤2、利用筛选出的变化影响因子组成建模数据集,利用随机森林模型对建模数据集进行建模,并调整模型参数,使得模型验证结果最优,得到CO2柱浓度预测模型;
步骤3、将区域内的所有的建模数据进行标准空间网格化处理,利用搭建好的CO2柱浓度预测模型进行预测,得到区域内每天的所有网格点CO2柱浓度数据集;
处理夜间灯光数据时,采用了分区域夜间灯光均值,分区域计算夜间灯光均值的计算公式如下:
DNmean表示分区域的灯光均值,DNall表示分区域的灯光总值,Areacity表示分区域的面积;
选取气象因子类变量时,选取与二氧化碳观测卫星的过境时间相差小于2小时的时间点的气象数据进行匹配。
2.根据权利要求1所述的大气二氧化碳柱浓度高覆盖度重建方法,其特征在于,步骤1中,CO2柱浓度产品为卫星监测得到的CO2柱浓度数据。
3.根据权利要求2所述的大气二氧化碳柱浓度高覆盖度重建方法,其特征在于,步骤1中,CO2柱浓度产品为OCO-2卫星监测得到的L2级的Lite_FP文件CO2柱浓度产品根据官方说明手册筛选反演质量最好的部分CO2柱浓度数据;将CO2柱浓度产品与各变化影响因子的数据统一重采样到5km×5km的空间分辨率。
4.根据权利要求1所述的大气二氧化碳柱浓度高覆盖度重建方法,其特征在于,步骤2中,调整模型参数包括调整随机森林中最小叶数目和调整学习周期数据。
5.根据权利要求1所述的大气二氧化碳柱浓度高覆盖度重建方法,其特征在于,步骤2中,模型验证采用了三种精度验证方式对模型精度进行评估,包括:直接拟合结果对比,基于样本的十折交叉验证结果对比,基于空间位置的十折交叉验证结果对比;
且三种精度验证方式均采用了R2、RMSE和MAE作为统计指标对模型精度进行评定,R2即决定系数,RMSE即均方根误差,MAE即平均绝对误差;其中R2、RMSE、MAE的公式分别如下所示:
其中,x表示卫星的CO2柱浓度测量结果,y表示模型拟合的CO2柱浓度结果,表示匹配数据集中卫星观测的CO2柱浓度均值,/>表示模型拟合的CO2柱浓度均值,n表示数据条数;
其中,Xi表示模型拟合CO2柱浓度结果,表示模型拟合CO2柱浓度的均值,n表示数据条数;
其中,Yi表示模型拟合CO2柱浓度结果,表示模型拟合CO2柱浓度结果的均值,n表示数据条数。
6.根据权利要求1所述的大气二氧化碳柱浓度高覆盖度重建方法,其特征在于,步骤3中,利用搭建好的CO2柱浓度预测模型进行预测,具体是指,利用建立好的CO2柱浓度预测模型,对区域内每个像素点的CO2柱浓度进行预测,得到区域内所有网格点CO2柱浓度数据集,即得到全覆盖的CO2浓度数据产品集。
7.根据权利要求1所述的大气二氧化碳柱浓度高覆盖度重建方法,其特征在于,步骤3中,还包括通过与二氧化碳观测卫星观测的原始CO2浓度进行对比,分析所获取的数据集与原始数据的差异。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210597699.9A CN114974453B (zh) | 2022-05-30 | 2022-05-30 | 一种大气二氧化碳柱浓度高覆盖度重建方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210597699.9A CN114974453B (zh) | 2022-05-30 | 2022-05-30 | 一种大气二氧化碳柱浓度高覆盖度重建方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114974453A CN114974453A (zh) | 2022-08-30 |
CN114974453B true CN114974453B (zh) | 2023-08-29 |
Family
ID=82957051
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210597699.9A Active CN114974453B (zh) | 2022-05-30 | 2022-05-30 | 一种大气二氧化碳柱浓度高覆盖度重建方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114974453B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115656444B (zh) * | 2022-11-11 | 2024-06-11 | 北京航空航天大学 | 一种大型场馆内二氧化碳场浓度重建方法 |
CN116312849A (zh) * | 2023-01-13 | 2023-06-23 | 中南大学 | 基于随机森林模型和卫星遥感的全覆盖甲烷浓度测算方法 |
CN117828992A (zh) * | 2024-01-04 | 2024-04-05 | 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院) | 一种高时空分辨ccn数浓度精准预测方法及系统 |
CN117824093A (zh) * | 2024-01-10 | 2024-04-05 | 华中师范大学 | 一种智慧教室环境适切性调节方法及系统 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105205466A (zh) * | 2015-09-21 | 2015-12-30 | 广州地理研究所 | 一种基于夜间灯光影像的能源碳排放量遥感估算方法 |
CN107748736A (zh) * | 2017-10-13 | 2018-03-02 | 河海大学 | 一种基于随机森林的多因子遥感地表温度空间降尺度方法 |
CN108334838A (zh) * | 2018-01-30 | 2018-07-27 | 天津中科智能识别产业技术研究院有限公司 | 基于灯光遥感数据国家宏观经济指标估测方法 |
CN109460445A (zh) * | 2018-11-14 | 2019-03-12 | 许昌学院 | 基于夜光遥感数据的城镇空间特征指数构建及城镇体系评价方法 |
CN109740977A (zh) * | 2019-03-14 | 2019-05-10 | 华北电力大学 | 基于灰色关联分析的燃气机组碳排放影响因素的评价方法 |
CN110208878A (zh) * | 2019-06-14 | 2019-09-06 | 广西海佩智能科技有限公司 | 绿色屋顶气象监测与热岛效应影响评估方法 |
CN111861797A (zh) * | 2020-07-31 | 2020-10-30 | 生态环境部环境规划院 | 一种快速核算城镇和农村生活二氧化碳排放的方法及核算系统 |
CN113919448A (zh) * | 2021-12-14 | 2022-01-11 | 武汉大学 | 一种任意时空位置二氧化碳浓度预测影响因素分析方法 |
CN114444356A (zh) * | 2022-01-27 | 2022-05-06 | 河南大学 | 一种获取居民空间碳排放量的方法及装置 |
-
2022
- 2022-05-30 CN CN202210597699.9A patent/CN114974453B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105205466A (zh) * | 2015-09-21 | 2015-12-30 | 广州地理研究所 | 一种基于夜间灯光影像的能源碳排放量遥感估算方法 |
CN107748736A (zh) * | 2017-10-13 | 2018-03-02 | 河海大学 | 一种基于随机森林的多因子遥感地表温度空间降尺度方法 |
CN108334838A (zh) * | 2018-01-30 | 2018-07-27 | 天津中科智能识别产业技术研究院有限公司 | 基于灯光遥感数据国家宏观经济指标估测方法 |
CN109460445A (zh) * | 2018-11-14 | 2019-03-12 | 许昌学院 | 基于夜光遥感数据的城镇空间特征指数构建及城镇体系评价方法 |
CN109740977A (zh) * | 2019-03-14 | 2019-05-10 | 华北电力大学 | 基于灰色关联分析的燃气机组碳排放影响因素的评价方法 |
CN110208878A (zh) * | 2019-06-14 | 2019-09-06 | 广西海佩智能科技有限公司 | 绿色屋顶气象监测与热岛效应影响评估方法 |
CN111861797A (zh) * | 2020-07-31 | 2020-10-30 | 生态环境部环境规划院 | 一种快速核算城镇和农村生活二氧化碳排放的方法及核算系统 |
CN113919448A (zh) * | 2021-12-14 | 2022-01-11 | 武汉大学 | 一种任意时空位置二氧化碳浓度预测影响因素分析方法 |
CN114444356A (zh) * | 2022-01-27 | 2022-05-06 | 河南大学 | 一种获取居民空间碳排放量的方法及装置 |
Non-Patent Citations (1)
Title |
---|
全球碳盘点卫星遥感监测方法、进展与挑战;刘良云等;《遥感学报》;第243-267页 * |
Also Published As
Publication number | Publication date |
---|---|
CN114974453A (zh) | 2022-08-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114974453B (zh) | 一种大气二氧化碳柱浓度高覆盖度重建方法 | |
CN108280789B (zh) | 一种精细时空尺度二氧化碳排放要素间影响的空间分析方法 | |
Kalacska et al. | Estimating peatland water table depth and net ecosystem exchange: A comparison between satellite and airborne imagery | |
Chi et al. | Machine learning-based estimation of ground-level NO2 concentrations over China | |
CN112884079A (zh) | 一种基于Stacking集成模型的近地面二氧化氮浓度估算方法 | |
CN110751094A (zh) | 一种基于gee综合遥感影像和深度学习方法的作物估产技术 | |
CN108876917A (zh) | 一种森林地上生物量遥感估测通用模型构建方法 | |
Jiménez et al. | Exploring the merging of the global land evaporation WACMOS-ET products based on local tower measurements | |
Deng et al. | Woody plant encroachment enhanced global vegetation greening and ecosystem water‐use efficiency | |
CN111670668B (zh) | 基于高光谱遥感处方图的水稻农用无人机精准追肥方法 | |
Fricke et al. | Using local climate zones to compare remotely sensed surface temperatures in temperate cities and hot desert cities | |
CN115128013A (zh) | 一种基于分区算法的土壤有机质含量空间预测评估方法 | |
CN115015486B (zh) | 一种基于回归树模型的碳排放量测算方法 | |
CN111160799A (zh) | 一种自然资源数据库构建方法 | |
Fu et al. | Spatio-temporal monitoring of marsh vegetation phenology and its response to hydro-meteorological factors using CCDC algorithm with optical and SAR images: In case of Honghe National Nature Reserve, China | |
CN117075138A (zh) | 一种区域30米森林冠层高度遥感测算方法、系统及介质 | |
CN116223395A (zh) | 近地表痕量气体浓度反演模型及反演方法 | |
CN116822141A (zh) | 利用卫星微光遥感反演夜间大气气溶胶光学厚度的方法 | |
CN115169646A (zh) | 利用葵花八号卫星数据的小时级地表臭氧浓度遥感方法 | |
Odebiri et al. | Mapping soil organic carbon distribution across South Africa's major biomes using remote sensing-topo-climatic covariates and Concrete Autoencoder-Deep neural networks | |
He et al. | Seamless reconstruction and spatiotemporal analysis of satellite-based XCO2 incorporating temporal characteristics: A case study in China during 2015–2020 | |
Zhao et al. | The simultaneous prediction of yield and maturity date for wheat–maize by combining satellite images with crop model | |
Gupta et al. | An evaluation of long-term gridded datasets of total columnar ozone retrieved from MERRA-2 and AIRS over the Indian region | |
Jalili | The effect of land use on land surface temperature in the Netherlands | |
Pegahfar | Future precipitation and near surface air-temperature projection using CMIP6 models based on TOPSIS method: case study, Sistan-and-Baluchestan Province of Iran |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |