CN113191536A - 基于机器学习的近地面环境要素预测模型训练和预测方法 - Google Patents

基于机器学习的近地面环境要素预测模型训练和预测方法 Download PDF

Info

Publication number
CN113191536A
CN113191536A CN202110402502.7A CN202110402502A CN113191536A CN 113191536 A CN113191536 A CN 113191536A CN 202110402502 A CN202110402502 A CN 202110402502A CN 113191536 A CN113191536 A CN 113191536A
Authority
CN
China
Prior art keywords
data
environmental
prediction model
monitoring data
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110402502.7A
Other languages
English (en)
Inventor
黄小猛
张博
梁逸爽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tsinghua University
Original Assignee
Tsinghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tsinghua University filed Critical Tsinghua University
Priority to CN202110402502.7A priority Critical patent/CN113191536A/zh
Publication of CN113191536A publication Critical patent/CN113191536A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01WMETEOROLOGY
    • G01W1/00Meteorology
    • G01W1/10Devices for predicting weather conditions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Environmental & Geological Engineering (AREA)
  • Economics (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Operations Research (AREA)
  • Development Economics (AREA)
  • Marketing (AREA)
  • Game Theory and Decision Science (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Atmospheric Sciences (AREA)
  • Biodiversity & Conservation Biology (AREA)
  • Ecology (AREA)
  • Environmental Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明实施例提供了一种近地面环境要素的预测模型的训练方法、和预测方法,训练包括:获取第一地区的遥感影像数据、气象监测数据、空气质量监测数据和环境数据;获取第一地区的近地面环境要素的监测值;生成训练样本,其中,训练样本中以遥感影像数据中的至少部分数据,和气象监测数据、空气质量监测数据和环境数据中的至少部分数据作为模型输入数据,以近地面环境要素的监测值作为标签值;使用训练样本训练近地面环境要素预测模型。

Description

基于机器学习的近地面环境要素预测模型训练和预测方法
技术领域
本发明涉及机器学习领域和环境监测领域,尤其涉及基于机器学习的近地面环境要素预测模型训练和预测方法。
背景技术
随着经济快速发展,工业化和城镇化进程加速环境承担压力不断加大,大气污染问题日趋严重。监测近地面PM2.5/10浓度、臭氧浓度、温度等环境要素,并揭示其在时间和空间上分布规律,对于开展大气污染特性研究有着十分重要的意义。
目前,常见的监测方法有地面监测和遥感监测。地面监测基于观测站进行全天候连续观测,能够直接得到近地面PM2.5/10、臭氧、温度环境要素数值浓度及其随时间变化的准确信息。但是,地面监测的仪器设施价格比较昂贵,并且只能在数量有限的地面站点进行,无法准确得到这些要素在空间上连续而完整的分布信息,难以对其变化趋势进行宏观分析。而卫星遥感数据覆盖面广、数据易获取且采集成本低,其本身就具备连续并且完整覆盖空间区域的属性特征。但是,卫星遥感监测不可以直接提供地面 PM2.5/10浓度、臭氧浓度、温度等环境要素的时空分布及变化趋势。
因此,需要一种更好的预测上述环境要素的方法。
发明内容
本发明的实施例提供一种近地面环境要素的预测模型的训练方法、和相应的预测方法,相较于传统的监测方法,该方法通过从遥感影像数据、气象监测数据、空气质量监测数据和环境数据中确定相关性更强的数据组合,用于训练近地面环境要素的预测模型,并基于训练好的该模型进行近地面环境要素的预测。利用该方法,一方面可以获得更广阔地区在更多时间区间的近地面环境要素预测数据,另一方面在各种状况下的近地面环境要素的预测中,具有更强的通用性和准确性。
本发明为解决上述技术问题采用的技术方案为,一方面提供一种近地面环境要素预测模型的训练方法,所述方法包括:
获取第一地区的遥感影像数据、气象监测数据、空气质量监测数据和环境数据;
获取第一地区的近地面环境要素的监测值;
生成训练样本,其中,所述训练样本中以遥感影像数据中的至少部分数据,和气象监测数据、空气质量监测数据和环境数据各自的中的至少部分数据作为模型输入数据,以所述近地面环境要素的监测值作为标签值;
使用所述训练样本训练所述近地面环境要素预测模型。
优选地,所述生成训练样本包括:
根据数据之间的相关性以及数据的属性特征,将遥感影像数据、气象监测数据、空气质量监测数据和环境数据分别分成多组数据;
基于测试样本的评测结果,选择遥感影像数据、气象监测数据、空气质量监测数据和环境数据中的至少一组数据作为模型输入数据。
优选地,所述近地面环境要素包括近地面细颗粒物浓度、近地面臭氧浓度、近地面温度中的一种。
优选地,所述遥感影像数据包括卫星遥感影像数据;
所述气象监测数据包括,所述第一地区的多个监测站点的气象监测数据;
所述空气质量监测数据包括所述第一地区的多个监测站点的空气质量监测数据。
所述环境数据包括:监测站点的经度、纬度、高程数据、下垫面数据中的一种或多种。
优选地,所述近地面环境要素预测模型基于反向传播网络。
具体地,所述近地面环境要素预测模型包括输入层、至少一个隐藏层、输出层,其中相邻隐藏层之间的传递函数为双曲正切S型传递函数,邻接输出层的隐藏层与输出层之间的传递函数为线性传递函数。
更具体地,所述方法还包括,根据所述预先设定的评价指标,确定隐藏层中神经单元的数量。
优选地,所述方法还包括,
通过以多个测试样本测试经过训练的所述近地面环境要素预测模型, 确定所述多个测试样本中的若干第一测试样本,所述第一测试样本的预测误差大于预定阈值;
在所述第一测试样本的数量未达到预定阈值时,所述第一测试样本的数量达到预定阈值时,对所述近地面环境要素预测模型的输出结果施加线性修正;
或者,在所述第一测试样本的数量达到预定阈值时,增加所述近地面环境要素预测模型的隐藏层的层数,然后重启所述近地面环境要素预测模型的训练。
优选地,所述遥感影像数据、气象监测数据、空气质量监测数据、环境数据和所述近地面环境要素的监测值在时间和空间上相互匹配。
第二方面,提供一种近地面环境要素的预测方法,所述方法包括:
获取第二地区的遥感影像数据、气象监测数据、空气质量监测数据和环境数据;
将所述遥感影像数据中的至少部分数据,和气象监测数据、空气质量监测数据和环境数据中的至少部分数据输入到通过权利要求1的方法训练好的近地面环境要素的预测模型中,得到第二地区的近地面环境要素的预测值。
附图说明
为了更清楚说明本发明实施例的技术方案,下面将对实施例描述中所需使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种近地面环境要素预测模型的训练方法的流程图;
图2为本发明实施例提供的一种近地面环境要素预测方法的流程图;
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如前所述,传统的监测方法有地面监测和遥感监测。地面监测能够直接得到近地面PM2.5/10、臭氧、温度环境要素数值浓度及其随时间变化的准确信息,但是地面监测代价昂贵且只能在数量有限的地面站点进行。而卫星遥感数据覆盖面广、数据易获取且采集成本低,其本身就具备连续并且完整覆盖空间区域的属性特征。但是,不能直接提供地面PM2.5/10浓度、臭氧浓度、温度等环境要素的时空分布及变化趋势。
发明人在研究后认为,如果可以利用卫星遥感监测数据、以及便于大量获取的其他地面监测数据,例如气象数据,确定近地面PM2.5/10浓度、臭氧浓度、温度环境要素的时空分布及变化趋势,可在更大的空间尺度上解决对近地面PM2.5/10浓度、臭氧浓度、温度环境要素的监测问题。
并且,由于近地面PM2.5/10、臭氧、温度的时空分布受到气象场、排放源、复杂下垫面、理化生过程的耦合等多种因素的影响,具有较强的非线性特性。而机器学习神经网络是一种非线性映射,常用于逼近某种算法或者函数,非常适合用来解决非线性问题,同时神经网络无论是在训练还是在仿真过程中均采用了并行分布处理方法,可以大大提高运算效率。因此,可以采用机器学习的方法来探索变量间非线性关系并中找出数据规律,从而得出更为准确的近地面PM2.5/10、臭氧、温度等的预测值。
然而,现有技术多聚焦于某些特定区域内一个或几个具体问题的解决,相关的机器学习方法的使用尚未成熟与完善,对如何确定机器学习的最优网络结构、如何自动整合并在模型中恰当使用样本数据、如何去除天气对预测结果的影响以及如何优化处理预测结果中的奇异值等问题都还缺少解决的方案,所建立的预测模型无论在通用性、还是在预测结果的准确度方面都需要提高。
为解决上述问题,本发明实施例提供一种近地面环境要素预测模型的训练方法。图1为本发明实施例提供的一种近地面环境要素预测模型的训练方法的流程图。如图所示,该方法至少包括以下步骤:
步骤11,获取第一地区的遥感影像数据、气象监测数据、空气质量监测数据和环境数据。
第一地区是训练数据的相关地区,例如,一个实施例中,以中国陆地区域内的一个/些地区的遥感影像数据、气象监测数据、空气质量监测数据和环境数据作为训练数据,第一地区可以为这个/这些地区中的一个/多个地区。
在不同的实施例中,可以获得不同的具体的遥感影像数据、气象监测数据、空气质量监测数据和环境数据。在一个实施例中,所述遥感影像数据包括卫星遥感影像数据;所述气象监测数据包括,所述第一地区的多个监测站点的气象监测数据;所述空气质量监测数据包括所述第一地区的多个监测站点的空气质量监测数据。所述环境数据包括:监测站点的经度、纬度、高程数据、下垫面数据中的一种或多种。
在一个具体的实施例中,遥感影像数据可以包括如Landsat 8(美国陆地卫星计划Landsat的第八颗卫星)和/或MODIS(中分辨率成像光谱仪) 卫星遥感影像数据。
在一个具体的实施例中,气象监测数据可以包括美国国家气候数据中心(National Climatic Data Center,简称NCDC)公布与中国大陆地区的合作372个监测站点的气象监测数据。
在一个具体的实施例中,空气质量监测数据可以包括中国环境监测总站(ChinaNational Environmental Monitoring Center,简称CNEMC) 1671个监测站点空气质量监测数据。
在一个具体的实施例中,环境数据(由于其不是一定于所有场景均需要,常常是在特定场景中需要的数据,因此也可以称为补充环境数据)可以包括分布在污染问题相对敏感、高程或地表覆盖类型发生明显变化、 CNEMC和NCDC监测站点的经度、纬度、高程数据、下垫面数据。
由于不同数据来源的遥感影像数据、气象监测数据、空气质量监测数据和环境数据,存在着空间和时间度量上的差异,为了后续步骤中的模型训练,根据一种实施方式,可以将遥感影像数据、气象监测数据、空气质量监测数据和环境数据在空间和时间上进行匹配。根据又一种实施方式,还可以将上述数据在匹配后按预定方式进行融合,以方便训练。
在一个实施例中,可以对Landsat 8/MODIS等卫星遥感影像进行正射校正和空间位置配准,利用Google Earth Engine(GEE)遥感影像中各波段的波段反射率,同时对大气层太阳辐射值进行反射补偿修正,并根据其中的相关波段进行植被指数NDVI的计算。
实践中,遥感影像中存在的云层图像往往会影响近地面影像的获取,因此不同的实施例中,可以采用不同的方式去除遥感影像中云层图像。在一个实施例中,可以利用Google Earth Engine(GEE)对研究区内 Landsat8/MODIS等遥感影像数据的云层识别与分类,并根据不同的云层特性采用对应的算法进行“去云”处理。在不同的例子中,可以采用逆光同态滤波法、时间平均法、综合采用同态滤波、小波变换以及非监督分类等方法中的一种或多种进行“去云”处理。
在一个实施例中,可以对于气象数据、空气质量监测数据和环境数据,采用邻近分析算法NAA(Near Analysis Algorithm)实现时空自动匹配与融合。在一个实施例中,还可以对于上述融合后的数据,结合卫星的过境时间以获取与卫星影像时刻相吻合(±1h)的CNEMC和NOAA地面观测数据,从而共同构成预测模型的输入数据。
步骤12,获取第一地区的近地面环境要素的监测值。
在不同的实施例中,近地面环境要素可以是不同的具体的近地面环境要素。在一个实施例中,所述近地面环境要素包括近地面细颗粒物浓度、近地面臭氧浓度、近地面温度中的一种。在一个具体的实施例中,近地面环境要素为近地面细颗粒物(PM2.5/PM10)浓度,因此,该实施例中的近地面环境要素预测模型也可以相应地具体为近地面PM2.5/PM10浓度预测模型。
在不同的实施例中,近地面环境要素可以具有不同的具体获取方式。在一个实施例中,监测值可以是由空气质量监测站点直接监测到的近地面环境要素的值。例如,由PM2.5/PM10空气质量地面监测站点监测到的第一地区的PM2.5/PM10浓度值。在一个例子中,地面监测站点可以包括由近地面监测设施/设备构成的观测点。
在一个实施例中,所述遥感影像数据、气象监测数据、空气质量监测数据、环境数据和所述近地面环境要素的监测值在时间和空间上相互匹配。
步骤13,生成训练样本,其中,所述训练样本中以遥感影像数据中的至少部分数据,和气象监测数据、空气质量监测数据和环境数据各自的中的至少部分数据作为模型输入数据,以所述近地面环境要素的监测值作为标签值。
在一个实施例中,生成训练样本可以包括:根据数据之间的相关性以及数据的属性特征,将遥感影像数据、气象监测数据、空气质量监测数据和环境数据分别分成多组数据;基于测试样本的评测结果,选择遥感影像数据、气象监测数据、空气质量监测数据和环境数据中的至少一组数据作为模型输入数据。
具体的,可以利用各类数据的相关性分析模型,根据相关性的强弱以及数据本身的类别特点,对所有可能的输入数据进行分类与分组。
例如,在一个实施例中,所述的输入数据可被划分为以下五组:强相关波段组:遥感影像中与PM2.5/10、臭氧、温度强相关波段的反射率,如: Landsat 8OLI和MODIS遥感影像中的蓝波段、红波段热红外等。该组数据是遥感影像的PM2.5/10、臭氧、温度反演运算的基础,在寻优过程中将会被首先并且自始至终的考虑;其他波段组:遥感影像中其它波段的反射率以及根据遥感影像解析所得的植被覆盖指数NDVI、地表覆盖类型等信息组合;空间参数组:包括经度、维度、高程;气象参数组:包括气压、湿度、风速、风向、降水;云覆盖参数:云的类别、厚度、云在地面的投射影响区域、云层覆盖率。在不同的具体例子中,上述五组数据可以进一步衍生出不同的组合。例如,在一个具体的例子中,可以由强相关波段组和任一其他组构成输入数据,因此,上述五组数据可衍生出15种不同的输入数据的组合,将不同组合输入到机器学习模型(近地面环境要素预测模型),进行训练学习及验证测试,再通过若干评价指标(例如,R2、ME和 RMSE)的综合评判,便可确定近地面环境要素预测模型的与输出结果最具相关性的输入数据的优化组合。关于近地面环境要素预测模型及其训练、以及评价指标,参见对后续步骤的详细描述。
以近地面环境要素的监测值作为训练样本中的标签值。需要注意的是,具体的实施例中,即使来自同一数据监测来源,近地面环境要素本身的监测值通常不用作训练样本中的输入数据。例如,一个例子中,一个监测点提供了近地面温度和湿度、气压数据,如果该例子中,其预测模型是近地面的温度预测模型,则湿度和气压数据可以用作输入数据,而温度用于标签数据。
步骤14,使用训练样本训练近地面环境要素预测模型。
近地面环境要素预测模型基于神经网络模型。在一个实施例中,近地面环境要素预测模型可以基于反向传播网络。在一个实施例中,近地面环境要素预测模型可以包括输入层、至少一个隐藏层、输出层,其中相邻隐藏层之间的传递函数为双曲正切S型传递函数,邻接输出层的隐藏层与输出层之间的传递函数为线性传递函数。
在一个具体的实施例中,构建的多层BPN网络模型由一个输入层,L 个中间隐藏层(L≥1)和一个输出层组成。其中,每一层的单元同与之相邻层的所有单元连接,同一层的单元之间没有连接。当一组学习样本提供给多层BPN网络模型后,神经元的激活值从输入层经各中间隐藏层向输出层传播,同时在输出层的各神经元上获得网络的输入响应。接着,按照减少目标输出与实际误差的方向,从输出层经过各中间层逐层修正各连接权重值,最后回到输入层。
其中,所述连接权重值的修正表示为
Figure RE-GDA0003106449590000091
表示第l-1隐藏层中内第j个神经元与第l隐藏层中第i个神经元的连接权重,而
Figure RE-GDA0003106449590000092
则表示是第l隐藏层中第i个神经元的偏置,且须满足公式
Figure RE-GDA0003106449590000093
Figure RE-GDA0003106449590000094
其中,
Figure RE-GDA0003106449590000095
表示第l隐藏层中第i个神经元的输入值,f(·)代表传递方程(transfer function)。模型隐藏层之间采用Tansig函数方程进行传递,最后一个隐藏层与输出层之间采用Purelin函数方程。在一个例子中。输入输出数据还可以统一进行标准化处理,标准化后的数据范围为[-1,1]。
在不同的实施例中,隐藏层的神经单元的数量可以不同,还可以在训练过程中调整隐藏层的神经单元的数量。因此,在一个实施例中,还可以根据所述预先设定的评价指标,确定隐藏层中神经单元的数量。
在一个实施例中,可以利用柯尔莫哥罗夫(Kolmogorov)定理,在训练过程中,逐步扩大隐藏层中间节点(神经单元)个数,确定“最优”节点个数。在一个具体的实施例中,可以将多个训练样本分为训练数据集与测试验证数据集,其中,训练数据集与测试验证数据集采用机器学习中常用的“留出法”通过多次随机取样的方式选取。在一个例子中,训练集可以占比70%,测试验证集可以占比30%。根据训练数据集,训练过程由正向传播过程和反向传播过程组成。在正向传播过程中,输入信息通过输入层经隐含层,逐层处理并传向输出层。若在输出层得不到期望的输出值,则取预测值与监测值的误差的平方和作为目标函数,转入反向传播,逐层求出目标函数对各神经元权值的偏导数,构成目标函数对权值向量的梯量,作为修改权值的依据,该过程循环往复,直至综合误差满足预定条件,训练过程结束。
在一个例子中,可以通过评价指标对训练过的模型进行评价。在一个例子中,所述评价指标为
Figure RE-GDA0003106449590000101
Figure RE-GDA0003106449590000102
Figure RE-GDA0003106449590000103
中的一个或多个,
其中PMF为模型预测值;PMS为PM2.5/10、臭氧、温度要素的监测值; N为样本数目。
实际生产中,预测模型的输出可能和标签具有很大的差异,即产生“奇异值”,奇异值产生的原因可能有很多。例如,在一个例子中,特定地区会公开其特定阶段的监测数据都存在不准确的问题,因此可以从训练和验证数据集中去掉该特定地区的特定阶段的不正常数据。在另一个例子中,也可以分析产生该“奇异值”时所对应的气象条件,主要分析的因素可以包括风、雪、云、雨、湿度,根据分析结果确定对于训练和验证数据集进行何种处理。
发明人在进一步研究中还发现,在利用测试验证数据集对近地面环境要素预测模型进行验证的过程中,当上述“奇异值”发生较多时(例如,发生数量达到预定阈值),可能是因为近地面环境要素预测模型的学习- 拟合能力不够导致,所以可以通过调整近地面环境要素预测模型的结构加强其拟合能力。而当上述“奇异值”发生较少时(例如,发生数量达不到预定阈值),则不必修改近地面环境要素预测模型,只对模型输出值进行线性修正即可(例如,按预定比例修正)。因此,在一个实施例中,可以通过以多个测试样本测试经过训练的所述近地面环境要素预测模型,确定所述多个测试样本中的若干第一测试样本,所述第一测试样本的预测误差大于预定阈值;在所述第一测试样本的数量未达到预定阈值时,对所述近地面环境要素预测模型的输出结果施加线性修正;或者,在所述第一测试样本的数量达到预定阈值时,增加所述近地面环境要素预测模型的隐藏层的层数,然后重启所述近地面环境要素预测模型的训练。
图2为本发明实施例提供的一种近地面环境要素的预测方法的流程图。如图所示,该方法至少包含以下步骤:
步骤21,获取第二地区的遥感影像数据、气象监测数据、空气质量监测数据和环境数据。
该步骤中,第二地区为待测地区,即意图对该地区的近地面环境要素进行预测的地区。在不同的实施例中,其可以是与第一地区相同或不同的地区。
步骤22,将遥感影像数据中的至少部分数据,和气象监测数据、空气质量监测数据和环境数据中的至少部分数据作为模型输入数据,输入到通过图1所示方法训练好的近地面环境要素的预测模型中,得到第二地区的近地面环境要素的预测值。
使用本说明书实施例提供的一种近地面环境要素预测模型的训练方法、以及相应的近地面环境要素预测方法,具有如下优点:
第一、与传统的地面监测方法相比,该方法的预测结果可以更好、更准的揭示近地面环境要素,如PM2.5/10浓度、臭氧浓度、温度环境要素在时空上的分布规律,可逐步替代部分地面环境监测基站/微站的PM2.5/10浓度、臭氧浓度、温度环境要素测量工作,减少在基础设施建设、运营及维护方面的支出以及在人力、物力方面的投入,大大降低政府在相关领域的开支,经济效益显著。
第二、通过该方法获得的预测结果,在准确度和通用性上相对传统预测方法有很大程度的提高。
第三、将通过该方法获得的预测结果用于实际的环境监测工作,可以有效避免大气环境监测数据受到人为因素的干扰,更为客观的反应大气环境状况,可以从技术上和方法上补充并完善我国在利用遥感影像进行环境监测方面的欠缺。
第四、该方法利用的输入数据类型多样且具有多时间相位的特征,该方法从输入参数及时空特性对预测结果的影响出发,获得最优化的输入参数组合,分析预测结果中的奇异值,对模型预测运算进行修正,最终获得更优的预测结果。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
专业人员应该还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器 (RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种近地面环境要素预测模型的训练方法,所述方法包括:
获取第一地区的遥感影像数据、气象监测数据、空气质量监测数据和环境数据;
获取第一地区的近地面环境要素的监测值;
生成训练样本,其中,所述训练样本中以遥感影像数据中的至少部分数据,和气象监测数据、空气质量监测数据和环境数据中的至少部分数据作为模型输入数据,以所述近地面环境要素的监测值作为标签值;
使用所述训练样本训练所述近地面环境要素预测模型。
2.根据权利要求1所述的方法,其中,所述生成训练样本包括:
根据数据之间的相关性以及数据的属性特征,将遥感影像数据、气象监测数据、空气质量监测数据和环境数据分别分成多组数据;
基于测试样本的评测结果,选择遥感影像数据、气象监测数据、空气质量监测数据和环境数据中的至少一组数据作为模型输入数据。
3.根据权利要求1所述的方法,其中,所述近地面环境要素包括近地面细颗粒物浓度、近地面臭氧浓度、近地面温度中的一种。
4.根据权利要求1所述的方法,其中,
所述遥感影像数据包括卫星遥感影像数据;
所述气象监测数据包括,所述第一地区的多个监测站点的气象监测数据;
所述空气质量监测数据包括所述第一地区的多个监测站点的空气质量监测数据。
所述环境数据包括:监测站点的经度、纬度、高程数据、下垫面数据中的一种或多种。
5.根据权利要求1所述的方法,其中,所述近地面环境要素预测模型基于反向传播网络。
6.根据权利要求5所述的方法,所述近地面环境要素预测模型包括输入层、至少一个隐藏层、输出层,其中相邻隐藏层之间的传递函数为双曲正切S型传递函数,邻接输出层的隐藏层与输出层之间的传递函数为线性传递函数。
7.根据权利要求5所述的方法,还包括,根据所述预先设定的评价指标,确定隐藏层中神经单元的数量。
8.根据权利要求1所述的方法,还包括,
通过以多个测试样本测试经过训练的所述近地面环境要素预测模型,确定所述多个测试样本中的若干第一测试样本,所述第一测试样本的预测误差大于预定阈值;
在所述第一测试样本的数量未达到预定阈值时,对所述近地面环境要素预测模型的输出结果施加线性修正;
或者,在所述第一测试样本的数量达到预定阈值时,增加所述近地面环境要素预测模型的隐藏层的层数,然后重启所述近地面环境要素预测模型的训练。
9.根据权利要求1所述的方法,其中,所述遥感影像数据、气象监测数据、空气质量监测数据、环境数据和所述近地面环境要素的监测值在时间和空间上相互匹配。
10.一种近地面环境要素的预测方法,所述方法包括:
获取第二地区的遥感影像数据、气象监测数据、空气质量监测数据和环境数据;
将所述遥感影像数据中的至少部分数据,和气象监测数据、空气质量监测数据和环境数据中的至少部分数据输入到通过权利要求1的方法训练好的近地面环境要素的预测模型中,得到第二地区的近地面环境要素的预测值。
CN202110402502.7A 2021-04-14 2021-04-14 基于机器学习的近地面环境要素预测模型训练和预测方法 Pending CN113191536A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110402502.7A CN113191536A (zh) 2021-04-14 2021-04-14 基于机器学习的近地面环境要素预测模型训练和预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110402502.7A CN113191536A (zh) 2021-04-14 2021-04-14 基于机器学习的近地面环境要素预测模型训练和预测方法

Publications (1)

Publication Number Publication Date
CN113191536A true CN113191536A (zh) 2021-07-30

Family

ID=76974018

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110402502.7A Pending CN113191536A (zh) 2021-04-14 2021-04-14 基于机器学习的近地面环境要素预测模型训练和预测方法

Country Status (1)

Country Link
CN (1) CN113191536A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114414090A (zh) * 2021-12-14 2022-04-29 厦门大学 基于遥感影像和多层感知的地表温度预测方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
张博等: "基于机器学习和卫星遥感的PM2.5/10空间连续分布反演方法研究", 《地球环境学报》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114414090A (zh) * 2021-12-14 2022-04-29 厦门大学 基于遥感影像和多层感知的地表温度预测方法及系统

Similar Documents

Publication Publication Date Title
CN113919448B (zh) 一种任意时空位置二氧化碳浓度预测影响因素分析方法
CN109784552B (zh) 一种基于Re-ESF算法的空间变系数PM2.5浓度估算模型的构建方法
CN110174359B (zh) 一种基于高斯过程回归的航空高光谱影像土壤重金属浓度评估方法
CN109117883B (zh) 基于长短时记忆网络的sar影像海冰分类方法及系统
CN112749627A (zh) 一种基于多源遥感影像的烟草动态监测的方法和装置
CN113189014B (zh) 一种融合卫星遥感和地面监测数据的臭氧浓度估算方法
CN113642475B (zh) 基于卷积神经网络模型的大西洋飓风强度估算方法
CN110595968B (zh) 一种基于静止轨道卫星的pm2.5浓度估算方法
CN113901384A (zh) 顾及全局空间自相关性和局部异质性的地面pm2.5浓度建模方法
CN115356249A (zh) 基于机器学习融合模型的卫星偏振pm2.5估算方法和系统
CN113108918B (zh) 一种极轨气象卫星热红外遥感数据反演气温方法
CN111192267A (zh) 一种基于unet网络的多源感知融合遥感图像分割方法及应用
CN111784022A (zh) 一种基于Wrapper方法与SVM方法结合的短时邻近大雾预测方法
CN112668613A (zh) 基于气象预报和机器学习的卫星红外成像效果预测方法
CN114972984A (zh) 基于随机森林的积雪时空分析与预测方法
CN116343046A (zh) 基于自优化机器学习的多源遥感城市河流水质监测方法
CN114973019A (zh) 一种基于深度学习的地理空间信息变化检测分类方法及系统
CN113191536A (zh) 基于机器学习的近地面环境要素预测模型训练和预测方法
CN110321528B (zh) 一种基于半监督地理空间回归分析的高光谱影像土壤重金属浓度评估方法
Chen et al. A novel predictor for exploring PM2. 5 spatiotemporal propagation by using convolutional recursive neural networks
CN111879709A (zh) 湖泊水体光谱反射率检验方法及装置
CN115598027A (zh) 一种基于遥感和机器学习技术的pm2.5反演方法
CN112966710B (zh) 基于线性判别分析的fy-3d红外高光谱云检测方法
CN116400724A (zh) 一种输电线路无人机智能巡检方法
CN114880933A (zh) 一种基于再分析资料的无探空站点地基微波辐射计大气温湿廓线反演方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20210730