CN115526330A - 有机物走航数据校准方法、装置、计算机设备和存储介质 - Google Patents

有机物走航数据校准方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN115526330A
CN115526330A CN202210510530.5A CN202210510530A CN115526330A CN 115526330 A CN115526330 A CN 115526330A CN 202210510530 A CN202210510530 A CN 202210510530A CN 115526330 A CN115526330 A CN 115526330A
Authority
CN
China
Prior art keywords
data
regression model
fixed station
organic matter
meteorological data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210510530.5A
Other languages
English (en)
Inventor
黄渤
陈希
陈小敏
黄金燕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Hexin Instrument Co Ltd
Original Assignee
Guangzhou Hexin Instrument Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Hexin Instrument Co Ltd filed Critical Guangzhou Hexin Instrument Co Ltd
Priority to CN202210510530.5A priority Critical patent/CN115526330A/zh
Publication of CN115526330A publication Critical patent/CN115526330A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请涉及一种有机物方法、装置、计算机设备和存储介质。方法包括:获取至少一个固定站的有机物数据以及各固定站对应的气象数据;基于各固定站的有机物数据以及各固定站对应的气象数据建立各固定站对应的回归模型,得到回归模型集合,回归模型表示固定站的有机物数据与气象数据之间的映射关系;根据观测到的走航有机物数据对应的时间以及空间,在回归模型集合中确定目标回归模型;将所述观测到的走航有机物数据、走航气象数据以及目标气象数据输入至所述目标回归模型进行校准,得到校准后的走航有机物数据。采用本方法能够校准走航有机物数据,使得评价结果更准确。

Description

有机物走航数据校准方法、装置、计算机设备和存储介质
技术领域
本申请涉及计算机数据处理技术领域,特别是涉及一种有机物方法、装置、计算机设备和存储介质。
背景技术
随着环境监控技术的发展,大气中的污染物浓度除了受到排放影响外,还受到各种条件的影响,难以知道浓度的变化时由于哪一种条件的变化引起。如果对大气中的污染物进行检测时不考虑更多的因素,这可能导致关于空气质量管理策略有效性的错误结论。
传统技术中利用了变化点分析方法来不同条件对污染物浓度变化的贡献,但该方法依赖于客观条件的序列状态的变化,导致数据整体的突然升高或者降低,造成检测数据与实际数据差异大,造成检测效率低下。
发明内容
基于此,有必要针对上述技术问题,提供一种有机物数据校准方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
第一方面,本申请提供了一种有机物数据校准方法。所述方法包括:获取至少一个固定站的有机物数据以及各所述固定站对应的气象数据,其中,所述气象数据为所述固定站所处的范围区域内与大气相关的参数以及大气扩散指数;基于各所述固定站的有机物数据以及各所述固定站对应的气象数据建立各所述固定站对应的回归模型,得到回归模型集合,所述回归模型表示所述固定站的有机物数据与所述气象数据之间的映射关系;根据观测到的走航有机物数据对应的时间以及空间,在所述回归模型集合中确定目标回归模型;将所述观测到的走航有机物数据、走航气象数据以及目标气象数据输入至所述目标回归模型进行校准,得到校准后的走航有机物数据,其中,所述目标气象数据为根据所述目标回归模型所对应的所述气象数据进行自定义后的气象数据,所述走航气象数据为所述目标回归模型所对应的走航车所在的范围内的所述气象数据。
第二方面,本申请还提供了一种有机物数据校准装置。所述装置包括:数据获取模块,用于获取至少一个固定站的有机物数据以及各所述固定站对应的气象数据,其中,所述气象数据为所述固定站所处的范围区域内与大气相关的参数以及大气扩散指数;回归模型集合得到模块,用于基于各所述固定站的有机物数据以及各所述固定站对应的气象数据建立各所述固定站对应的回归模型,得到回归模型集合,所述回归模型表示所述固定站的有机物数据与所述气象数据之间的映射关系;目标回归模型确定模块,用于根据观测到的走航有机物数据对应的时间以及空间,在所述回归模型集合中确定目标回归模型;校准后的走航有机物数据得到模块,用于将所述观测到的走航有机物数据、走航气象数据以及目标气象数据输入至所述目标回归模型进行校准,得到校准后的走航有机物数据,其中,所述目标气象数据为根据所述目标回归模型所对应的所述气象数据进行自定义后的气象数据,所述走航气象数据为所述目标回归模型所对应的走航车所在的范围内的所述气象数据。
第三方面,本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:获取至少一个固定站的有机物数据以及各所述固定站对应的气象数据,其中,所述气象数据为所述固定站所处的范围区域内与大气相关的参数以及大气扩散指数;基于各所述固定站的有机物数据以及各所述固定站对应的气象数据建立各所述固定站对应的回归模型,得到回归模型集合,所述回归模型表示所述固定站的有机物数据与所述气象数据之间的映射关系;根据观测到的走航有机物数据对应的时间以及空间,在所述回归模型集合中确定目标回归模型;将所述观测到的走航有机物数据、走航气象数据以及目标气象数据输入至所述目标回归模型进行校准,得到校准后的走航有机物数据,其中,所述目标气象数据为根据所述目标回归模型所对应的所述气象数据进行自定义后的气象数据,所述走航气象数据为所述目标回归模型所对应的走航车所在的范围内的所述气象数据。
第四方面,本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:获取至少一个固定站的有机物数据以及各所述固定站对应的气象数据,其中,所述气象数据为所述固定站所处的范围区域内与大气相关的参数以及大气扩散指数;基于各所述固定站的有机物数据以及各所述固定站对应的气象数据建立各所述固定站对应的回归模型,得到回归模型集合,所述回归模型表示所述固定站的有机物数据与所述气象数据之间的映射关系;根据观测到的走航有机物数据对应的时间以及空间,在所述回归模型集合中确定目标回归模型;将所述观测到的走航有机物数据、走航气象数据以及目标气象数据输入至所述目标回归模型进行校准,得到校准后的走航有机物数据,其中,所述目标气象数据为根据所述目标回归模型所对应的所述气象数据进行自定义后的气象数据,所述走航气象数据为所述目标回归模型所对应的走航车所在的范围内的所述气象数据。
第五方面,本申请还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:获取至少一个固定站的有机物数据以及各所述固定站对应的气象数据,其中,所述气象数据为所述固定站所处的范围区域内与大气相关的参数以及大气扩散指数;基于各所述固定站的有机物数据以及各所述固定站对应的气象数据建立各所述固定站对应的回归模型,得到回归模型集合,所述回归模型表示所述固定站的有机物数据与所述气象数据之间的映射关系;根据观测到的走航有机物数据对应的时间以及空间,在所述回归模型集合中确定目标回归模型;将所述观测到的走航有机物数据、走航气象数据以及目标气象数据输入至所述目标回归模型进行校准,得到校准后的走航有机物数据,其中,所述目标气象数据为根据所述目标回归模型所对应的所述气象数据进行自定义后的气象数据,所述走航气象数据为所述目标回归模型所对应的走航车所在的范围内的所述气象数据。
上述有机物数据校准方法、装置、计算机设备、存储介质和计算机程序产品,通过获取至少一个固定站的有机物数据以及各固定站对应的气象数据,其中,气象数据为固定站所处的范围区域内与大气相关的参数以及大气扩散指数;基于各固定站的有机物数据以及各固定站对应的气象数据建立各固定站对应的回归模型,得到回归模型集合,回归模型表示固定站的有机物数据与气象数据之间的映射关系;根据观测到的走航有机物数据对应的时间以及空间,在回归模型集合中确定目标回归模型;将观测到的走航有机物数据、走航气象数据以及目标气象数据输入至目标回归模型进行校准,得到校准后的走航有机物数据,其中,目标气象数据为根据目标回归模型所对应的气象数据进行自定义后的气象数据,走航气象数据为目标回归模型所对应的走航车所在的范围内的气象数据。
通过获取各固定站的有机物数据以及各固定站对应的气象数据,能够保证获取两种数据时候无论从时间上以及空间上的都有一一对应的关系,避免有机物数据与气象数据之间出现了错为对应;基于各固定站的有机物数据以及各固定站对应的气象数据建立固定站对应的回归模型,能够使得建立回归模型的数据的稳定性以及可靠性,从而使得到的回归模型的准确率能够满足预设条件;根据观测到的走航有机物数据对应的时间以及空间,选取符合预设条件的目标回归模型,能够依据时间和空间这两个条件,得到可以从固定站的有机物数据泛化到走航有机物数据,提高回归模型的应用范围,同时也能够集合走航有机物数据所带来的优点;利用目标回归模型将观测到的走航有机物数据、走航气象数据以及目标气象数据进行校准,得到校准后的走航有机物数据,能够对走航有机物数据的影响因素减少一部分,提高走航有机物数据的准确性,更能反馈有机物的分布以及浓度情况。
通过对固定站的有机物数据以及固定站对应的气象数据建立回归模型,并把回归模型泛化到观测到的走航有机物数据中进行应用,得到校准后的走航有机物数据,能够建立去气象影响的方法,使走航数据校准至同一气象条件下,来去除气象差异对走航数据的影响,增加数据的可比性和空间代表性。
附图说明
图1为一个实施例中有机物数据校准方法的应用环境图;
图2为一个实施例中有机物数据校准方法的流程示意图;
图3为一个实施例中有机物数据校准步骤的流程示意图;
图4为另一个实施例中有机物数据校准方法的流程示意图;
图5为又一个实施例中有机物数据校准方法的流程示意图;
图6为再一个实施例中有机物数据校准方法的流程示意图;
图7为一个实施例中有机物数据校准后评价方法的流程示意图;
图8为一个实施例中有机物数据校准技术路线的流程示意图;
图9为一个实施例中某省内24个校准站点与160个走航点位分布;
图10为一个实施例中A站点TVOC模拟效果;
图11为一个实施例中24个固定站点各月份的拟合优度统计;
图12为一个实施例中时间适应性分析;
图13为一个实施例中空间适应性分析;
图14为一个实施例中六阶段走航数据校准结果;
图15为一个实施例中校准前后固定站与走航点数据一致性对比;
图16为一个实施例中权重比例为1:0的各阶段城市综合评价结果;
图17为一个实施例中权重比例为0:1的各阶段城市综合评价结果;
图18为一个实施例中权重比例为5:5的各阶段城市综合评价结果(权重比例5:5,空气站和工业区同权重考虑);
图19为一个实施例中有机物数据校准装置的结构框图;
图20为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请实施例提供的有机物数据校准方法,可以应用于如图1所示的应用环境中。其中,终端102获取数据,服务器104响应终端102的指令接收终端102的数据,并且对获取得到的数据进行计算,服务器104将数据的计算结果传输回终端102,并且由终端102进行显示。终端102通过网络与服务器104进行通信。数据存储系统可以存储服务器104需要处理的数据。数据存储系统可以集成在服务器104上,也可以放在云上或其他网络服务器上。服务器 104通过获取至少一个固定站的有机物数据以及各固定站对应的气象数据,其中,气象数据为固定站所处的范围区域内与大气相关的参数以及大气扩散指数;基于各固定站的有机物数据以及各固定站对应的气象数据建立各固定站对应的回归模型,得到回归模型集合,回归模型表示固定站的有机物数据与气象数据之间的映射关系;根据观测到的走航有机物数据对应的时间以及空间,在回归模型集合中确定目标回归模型;将观测到的走航有机物数据、走航气象数据以及目标气象数据输入至目标回归模型进行校准,得到校准后的走航有机物数据,其中,目标气象数据为根据目标回归模型所对应的气象数据进行自定义后的气象数据,走航气象数据为目标回归模型所对应的走航车所在的范围内的气象数据。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑、物联网设备和便携式可穿戴设备,物联网设备可为智能音箱、智能电视、智能空调、智能车载设备等。便携式可穿戴设备可为智能手表、智能手环、头戴设备等。服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了一种有机物数据校准方法,以该方法应用于图1 中的服务器为例进行说明,包括以下步骤:
步骤202,获取至少一个固定站的有机物数据以及各固定站对应的气象数据。
其中,固定站可以是位置相对固定的,里面具有至少一个可以测量多种有机物数据的仪器的地方,由于固定站的位置并不随时发生变化,因此固定站中可以布置多个测量仪器以及边缘计算点,对于计算量不大的数据,能够及时进行处理,减轻网络传输的负担以及减少服务器资源的占比。
其中,有机物数据可以是总挥发性有机化合物数据,英文为Total VolatileOrganic Compounds Data,简称TVOC,总挥发性有机化合物是三种影响室内空气品质污染中影响较为严重的一种。总挥发性有机化合物是指室温下饱和蒸气压超过了133.32帕斯卡的有机物,其沸点在50℃至250℃,在常温下可以蒸发的形式存在于空气中,它的毒性、刺激性、致癌性和特殊的气味性,会影响皮肤和黏膜,对人体产生急性损害。
其中,气象数据可以是通过观测而得到反映天气的一组数据,气象数据可分为观测气候资料和观测天气资料。其中,观测气候资料通常所指的是用常规气象仪器和专业气象器材所观测到各种原始资料的集合以及加工、整理、整编所形成的各种资料,但随着现代气候的发展,气候研究内容不断扩大和深化,气候资料概念和内涵得以进一步的延伸,泛指整个气候系统的有关原始资料的集合和加工产品。观测天气资料是为天气分析和预报服务的一种实时性很强的气象资料。观测天气资料和观测气候资料主要区别是:观测天气资料随着时间的推移转化为观测气候资料;观测气候资料的内容比观测天气资料要广泛得多;观测气候资料是长时间序列的资料,而观测天气资料是短时间内的资料。
具体地,服务器响应终端的指令,从终端处获取至少一个固定站的有机物数据以及各固定站对应的气象数据,气象数据为固定站所处的范围区域内与大气相关的参数以及大气扩散指数,有机物数据可以是挥发性有机物(Volatile Organic Compounds,VOCs),而气象数据可以是范围内的地表温度、地表湿度、垂直温度、10m U/V风矢量、10米风速,边界层高度等数据,气象数据响应终端的指令输入至服务器中需要进行筛选的步骤,具体筛选操作如下,气象数据来源于欧洲中期天气预报中心(ECMWF)的ERA-5数据集,该数据是基于数据同化系统的全球气象再分析资料,时间覆盖范围从1979年1月~至今,时间分辨率为小时,空间分辨率为0.25°×0.25°。该数据集在全球的气象分析中被广泛使用。校准提取了固定时间以及固定区域范围内的地表温度、地表湿度、垂直温度、10m U/V风矢量、10米风速,边界层高度作为模式的输入数据。将垂直温度进行高度差处理,计算温度差以及温度差,用来表征地表逆温强度。考虑到气象条件对污染物浓度影响的滞后性,除了选择当日气象数据外,还选择了前一日,前两日和前三日的数据。为了增加模拟的准确性,对所有的气象数据进行二次方处理。如果校准的时候遇到偏差较大的情况,还加入了其它表征指数来表征区域传输和大气累积对TVOC的影响,例如一氧化碳指数。一氧化碳指数的计算方式为:瞬时一氧化碳监测值减去一氧化碳平均值。服务器获取到数据后将数据存储在服务器的存储单元中,需要使用数据的时候服务器将从存储单元中调用对应的数据到服务器的中央处理器中进行计算。
举例来说,服务器响应终端的指令,从终端处获取固定站A、B、C的有机物数据以及数据固定站A、B、C对应的气象数据,例如有机物数据为烷烃(直链烷烃和环烷烃)、烯烃、炔烃、苯系物、醇类、醛类、醚类、酮类、酸类、酯类、卤代烃及其它,气象数据为地表温度、地表湿度、垂直温度、10m U/V风矢量、10米风速,边界层高度,气象数据获取前先进行筛选。将从终端处获取到的固定站的有机物数据以及固定站对应的气象数据存储到服务器的存储单元中,以供需要时调用。
步骤204,基于各固定站的有机物数据以及各固定站对应的气象数据建立各固定站对应的回归模型,得到回归模型集合。
其中,回归模型可以是一种预测性的建模技术,它研究的是因变量(目标)和自变量(预测器)之间的关系。这种技术通常用于预测分析,时间序列模型以及发现变量之间的因果关系。例如,司机的鲁莽驾驶与道路交通事故数量之间的关系,最好的研究方法就是回归。回归模型重要的基础或者方法就是回归分析,回归分析是研究一个变量(被解释变量)关于另一个(些)变量(解释变量)的具体依赖关系的计算方法和理论,是建模和分析数据的重要工具。在这里,我们使用曲线/线来拟合这些数据点,在这种方式下,从曲线或线到数据点的距离差异最小。
其中,回归模型集合可以是多个回归模型所组成的一个集合,其中该集合里面的回归模型可以是针对不同的数据所建立不同的归回模型,也可以是同一个模型经过参数微调所能计算不同数据的模型。一般情况下,需要根据获取的数据的情况对回归模型集合中的回归模型进行选取,该选取可以是人工选取,也可以是计算机自动选取。
具体地,根据各个固定站的有机物数据以及各个固定站对应的气象数据建立起各个固定站对应的回归模型,因为各个固定站所检测到的有机物数据以及各个固定站所处的范围区域内与大气相关的参数以及大气扩散指数都是不相同的,因此通过固定站的有机物数据与气象数据之间的映射关系而建立起来的回归模型,对于各个固定站是有所区别的,统计各个固定站对应建立起来的回归模型所组成的集合,为回归模型集合。
举例来说,基于固定站A、B、C的对应的有机物数据X、Y、Z以及数据固定站A、B、 C对应的气象数据a、b、c建立固定站A、B、C分别对应的回归模型。由于不同得固定站对应的数据是有区别的,固定站A、B、C的回归模型中的对应关系分别为X=f(a)、Y=f(b) 以及Z=f(c),因此针对固定站A、B、C所建立起来的回归模型也不相同,将固定站A、B、 C对应的回归模型统计起来,则得到由固定站A、B、C的回归模型所形成的回归模型集合。
步骤206,根据观测到的走航有机物数据对应的时间以及空间,在回归模型集合中确定目标回归模型。
其中,走航有机物数据可以是通过走航的方式获得的有机物数据,通过该方式获得的有机物数据与固定站获得的有机物数据的类型是一样的,例如固定站获得的有机物数据为烷烃 (直链烷烃和环烷烃)、烯烃、炔烃、苯系物、醇类、醛类、醚类、酮类、酸类、酯类、卤代烃及其它,共12类物种,而通过走航的方式所获取到的有机物数据也为上述这些类别,走航可以是通过移动监测设备边走边测、实时监测分析在线数据、建立地理位置-物种-浓度关联性等手段。
其中,走航有机物数据对应的时间可以是获得走航有机物数据的时间与对应的固定站获得有机物数据的时间要匹配起来,也就是说两者的时间要遵从一定的对应关系,为后续的回归模型进行走航有机物数据的泛化提供基础。
其中,走航有机物数据对应的空间可以是获得走航有机物数据的空间与对应的固定站的空间要匹配起来,也就是说两者的空间要遵从一定的对应关系,为后续的回归模型进行走航有机物数据的泛化提供基础。
其中,目标回归模型可以是通过观测到的走航有机物数据对应的时间与固定站的有机物数据对应的时间所形成的对应关系,以及观测到的走航有机物数据对应的空间与固定站对应的时间所形成的对应关系,从回归模型集合中选取满足预设条件的回归模型用作泛化的回归模型。
具体地,基于观测到的走航有机物数据对应的时间与固定站的有机物数据对应的时间所形成的对应关系,以及观测到的走航有机物数据对应的空间与固定站对应的时间所形成的对应关系,根据预设的条件(时间一样、距离小于预设值等)对回归模型集合中的回归模型进行选择,得到泛化到观测到的走航有机物数据的目标回归模型。对于不同时间和空间的观测到的走航有机物数据一般情况下选择到的目标回归模型是不同的,但由于固定站的数量限制以及空间分布不均匀,因此选择目标回归模型时观测到的走航有机物数据对应的时间以及空间之间应满足两者最优化,同时也会考虑气象数据以及实时天气数据的影响。
举例来说,观测到的走航有机物数据对应的时间为t,而对应的空间为s,选取回归模型集合中的回归模型的时候要参照固定站的有机物数据T,以及固定站的空间S,看t和T以及 s和S之间的对应关系能不能满足预设条件,如果能够满足,则使用该固定站对应的回归模型作为目标回归模型,如果不满足,则继续寻找,直到满足预设条件。
步骤208,将观测到的走航有机物数据、走航气象数据以及目标气象数据输入至目标回归模型进行校准,得到校准后的走航有机物数据。
其中,走航气象数据是走航测量点所处区域内对应的气象数据。目标气象数据根据校准要求指定,设定的气象条件归一化的目标,该目标并不是与固定站的气象相同,而是指时间一段时间内的均值或者是某一日气象条件。因为本专利的目的,是消除因走航监测时间不同而带来的气象影响的差异。因此,我们的目标是将所有的走航数据,归一化至同一气象条件下,这个“同一气象条件”就是“目标气象数据”。走航气象数据的类型与目标气象数据需要保持一致。包括:地表温度、地表湿度、垂直温度、10m U/V风矢量、10米风速,边界层高度。
其中,校准可以是在规定条件下,为确定计量仪器或测量系统的示值,或实物量具或标准物质所代表的值,与相对应的被测量的已知值之间关系的一组操作。也就是说使用观测到的走航有机物数据、走航气象数据、目标气象数据、校准系数以及校准比例得到校准后的数据。
其中,校准后的走航有机物数据可以是通过校准后的观测到的走航有机物数据,校准的时候需要选取合适的目标回归模型,同时也需要目标归回模型对应的目标气象数据,校准后的走航有机物数据相比观测到的走航有机物数据具有更好的准确性,而和固定站的有机物数据相比则空间代表性(覆盖范围)以及高时空分辨率会更有优势。
具体地,将观测到的走航有机物数据以及目标回归模型对应的已经经过筛选并且预处理的走航气象数据和目标气象数据输入至符合预设条件的回归模型中进行校准,校准时还需要根据需求增加校准比例,以提高校准后的数据的精度,得到校准后的走航有机物数据。校准后的走航有机物数据相对固定站的有机物数据从空间代表性(覆盖范围)以及高时空分辨率会更有优势,同时通过校准,能够去除气象条件差异对走航数据结果的影响,减少校准后的走航有机物数据因为变量的变化而导致数据的不稳定。其中,
举例来说,将已经经过筛选并且预处理的走航气象数据和目标气象数据a、b、c以及观测到的走航有机物数据x、y、z分别输入至各自对应的目标回归模型,不同的目标回归模型里面的对应关系有所差异,因此输出结果并不具有相关性,通过各自对应的目标回归模型进行校准,结合校准系数k以及校准比例j,得到了已经校准的校准后的走航有机物数据x’、 y’、z’。
在一个具体的实施例中,回归模型为:TVOC=(-0.5)×风速+10,走航车所处区域当日风速2m/s,观测TVOC为-0.5×2+10=9,目标气象数据(假定是当月平均值,那校准的目标就是,将当日的TVOC校准至月均值气象条件下):风速为3m/s,那么校准方法为:校准TVOC=9+((-0.5)×(3-2))*1(假设比例为1)=9-0.5=8.5,应该理解的是,对于更多参数的情况,应该考虑更多参数所带来的影响,例如真实情况对于回归模型产生影响的参数为n个,则需要将n个参数都输入至回归模型中进行计算。
应该理解的是,对于本有机物数据校准方法中的有机物数据,可以使用无机物数据进行取代,对于由有机物数据进一步得到的数据,也可以使用由无机物数据采用同样的方法进一步得到的数据进行替换,该方法依然成立。对于本方法中若采用有机物数据,则后续的数据的使用也需要采用与有机物数据相关的数据,不应采用与无机物数据相关的数据,以保证该方法的准确性。其中,上述所提到的无机物数据可以是二氧化氮、二氧化硫、一氧化碳、臭氧8小时浓度、可吸入颗粒物(PM10)、细颗粒物(PM2.5)等,使用的时候可以只采用一个无机物数据,也可以采用多个无机物数据。
上述有机物数据校准方法中,通过获取至少一个固定站的有机物数据以及各固定站对应的气象数据,其中,气象数据为固定站所处的范围区域内与大气相关的参数以及大气扩散指数;基于各固定站的有机物数据以及各固定站对应的气象数据建立各固定站对应的回归模型,得到回归模型集合,回归模型表示固定站的有机物数据与气象数据之间的映射关系;根据观测到的走航有机物数据对应的时间以及空间,在回归模型集合中确定目标回归模型;将观测到的走航有机物数据、走航气象数据以及目标气象数据输入至目标回归模型进行校准,得到校准后的走航有机物数据,其中,目标气象数据为根据目标回归模型所对应的气象数据进行自定义后的气象数据,走航气象数据为目标回归模型所对应的走航车所在的范围内的气象数据。
通过获取各固定站的有机物数据以及各固定站对应的气象数据,能够保证获取两种数据时候无论从时间上以及空间上的都有一一对应的关系,避免有机物数据与气象数据之间出现了错为对应;基于各固定站的有机物数据以及各固定站对应的气象数据建立固定站对应的回归模型,能够使得建立回归模型的数据的稳定性以及可靠性,从而使得到的回归模型的准确率能够满足预设条件;根据观测到的走航有机物数据对应的时间以及空间,选取符合预设条件的目标回归模型,能够依据时间和空间这两个条件,得到可以从固定站的有机物数据泛化到走航有机物数据,提高回归模型的应用范围,同时也能够集合走航有机物数据所带来的优点;利用目标回归模型将观测到的走航有机物数据、走航气象数据以及目标气象数据进行校准,得到校准后的走航有机物数据,能够对走航有机物数据的影响因素减少一部分,提高走航有机物数据的准确性,更能反馈有机物的分布以及浓度情况。
通过对固定站的有机物数据以及固定站对应的气象数据建立回归模型,并把回归模型泛化到观测到的走航有机物数据中进行应用,得到校准后的走航有机物数据,能够建立去气象影响的方法,使走航数据校准至同一气象条件下,来去除气象差异对走航数据的影响,增加数据的可比性和空间代表性。
在一个实施例中,如图3所示,基于各固定站的有机物数据以及各固定站对应的气象数据建立各固定站对应的回归模型,得到回归模型集合,包括:
步骤302,根据固定站的有机物数据以及固定站对应的气象数据的参数类型建立初始回归模型。
其中,参数类型可以是固定站的有机物数据以及固定站对应的气象数据中包含的参数的种类,因为回归模型是用来表示固定站的有机物数据以及固定站对应的气象数据之间的对应关系,因此初始回归模型根据参数种类的不同而建立起表现方式不同的回归模型。
其中,初始回归模型可以是还没经过任何参数调整,只是根据固定站的有机物数据以及固定站对应的气象数据建立起来的回归模型,各个固定站对应的有机物数据以及气象数据正常情况下是不相同,因此各个固定站所对应的初始回归模型会有相应的差别。
具体地,根据固定站的有机物数据中所包含的数据类型以及固定站对应的气象数据中所包含的数据的类型,也可以根据同一个固定站不同的月份,选取合适的理论回归模型进行建模,其中理论回归模型可以是根据数学或者物理的理论知识而建立起来的模型,这些模型的参数都是理论情况中得到的,实际情况下需要进行调整,经过对理论模型的选取并进行匹配,得到初始回归模型。
举例来说,根据固定站A、B、C对应的有机物数据以及固定站A、B、C对应的气象数据的参数类型从现有的数学和物理模型中选取合理的模型,并进行匹配,经过匹配后得到m1模型适合固定站A的数据类型,m2模型适合固定站B的数据类型,m3模型适合固定站C的数据类型,因此m1为固定站A的初始回归模型,m2为固定站B的初始回归模型,m3为固定站C的初始回归模型。
步骤304,将各固定站的有机物数据以及各固定站对应的气象数据分别输入至初始回归模型,并对初始回归模型的参数进行优化,得到各固定站对应的优化后回归模型。
其中,参数进行优化可以是对回归模型中所带有的参数进行调整,使得回归模型的对应关系更为准确,也就是说使得回归模型的性能更好。一般情况下,回归模型有可调参数以及不可调参数,参数进行优化的指令只能对可调参数进行调整,调整范围根据具体的业务需求进行限定。
其中,优化后回归模型可以是初始回归模型通过优化后所得到的回归模型,也就是说初始回归模型通过参数调整的方式把其中的可调参数的值进行合理的调整,使得初始回归模型的模型性能更好,对应关系更准确。同时经过优化后的回归模型,具有更强的唯一性,也就是说只能是对应的固定站的数据进行使用,其它固定站的数据使用的话会导致输出结果不准确。
具体地,将各个固定站对应的有机物数据以及各个固定站对应的气象数据输入至已经匹配过的初始回归模型,并对性能不能满足预设条件的初始回归模型中的可调节参数进行调整,使得初始回归模型中的对应关系更为准确,同时也让初始回归模型的误差满足预设条件,经过可调参数调整的初始回归模型则为固定站对应的优化后回归模型,对于该固定站的数据,能够随时且准确使用。
举例来说,m1为固定站A的初始回归模型,m2为固定站B的初始回归模型,m3为固定站C的初始回归模型,分别将固定站A、固定站B以及固定站C的数据输入至模型m1、 m2以及m3中,并对模型m1、m2以及m3中的可调节参数进行调整,使得模型m1、m2以及m3的误差小于预设值,得到固定站A、固定站B以及固定站C分别对应的优化后回归模型m1’、m2’以及m3’。
步骤306,将各固定站对应的优化后回归模型进行模拟效果评估,得到各固定站对应的回归模型。
其中,模拟效果评估可以是对优化后回归模型中的模拟性能进行评估和论证,以决定是否采纳。判别模拟性能是否满足需求需要预设一个条件,如果模拟性能满足预设条件,则该优化后回归模型的模拟性能达到要求,否则该优化后回归模型的模拟性能不能达到要求,需要重新对可调参数进行调整或者选择更适合的初始回归模型。
具体地,将固定站对应的优化后回归模型中的模拟性能进行评估和论证,判别优化后回归模型中的模拟性能是否满足预设条件,如果满足则得到固定站对应的回归模型,如果不满足则重新调整回归模型中的可调参数或者重新选择初始回归模型,直到优化后回归模型中的模拟性能满足预设条件,对于各个固定站采取同样的模拟效果评估,直到所有获得所有固定站对应的回归模型。
举例来说,固定站A、固定站B以及固定站C分别对应的优化后回归模型m1’、m2’以及m3’,分别对优化后回归模型m1’、m2’以及m3’进行模拟效果评估,如果通过了,直接得到固定站对应的回归模型,如果不通过将重新调整可调整参数或者重新选择初始回归模型,直到得到固定站A、固定站B以及固定站C分别对应的回归模型。
步骤308,将各固定站对应的回归模型进行汇集,得到回归模型集合。
具体地,将每一个固定站对应的回归模型汇聚到一起,这些回归模型已经能够满足预设要求,能够对于对应的固定站正常使用,得到由各个回归模型所形成的回归模型集合。
举例来说,将固定站A、固定站B以及固定站C分别对应的回归模型集中到一起,得到由固定站A、固定站B以及固定站C分别对应的回归模型所形成的回归模型集合。
本实施例中,通过固定站的有机物数据以及固定站对应的气象数据对初始回归模型进行优化,并且对优化后回归模型的模拟效果进行评估,然后对多个回归模型进行汇集,得到回归模型集合,能够保证每一个固定站对应的回归模型都能够满足使用要求,同时也满足每一个固定站跟每一个回归模型一一对应,避免使用不满足条件的回归模型。
在一个实施例中,如图4所示,将各固定站对应的优化后回归模型进行模拟效果评估,得到各固定站对应的回归模型,包括:
步骤402,将各固定站对应的优化后回归模型的测试结果输入至模拟效果评估算法进行模拟效果评估,得到各固定站对应的拟合优度。
其中,测试结果可以是将各个固定站对应的测试集数据(分别为有机物数据以及气象数据)输入至优化后回归模型中进行计算所得到的结果。
其中,模拟效果评估算法可以是用来对优化后回归模型进行模拟效果评估的算法,模拟效果评估算法会根据输入量进行评估,评估结束后会输出一个数值,对于不同固定站,由于主要都是检测有机物数据以及气象数据,因此对于每一个优化后回归模型都可以采用相同的模拟效果评估算法进行评估。
其中,拟合优度可以是回归直线对观测值的拟合程度。度量拟合优度的统计量是可决系数(亦称确定系数)R2。R2最大值为1,R2的值越接近1,说明回归直线对观测值的拟合程度越好;反之,R2的值越小,说明回归直线对观测值的拟合程度越差。R2衡量的是回归方程整体的拟合度,是表达因变量与所有自变量之间的总体关系。R2等于回归平方和在总平方和中所占的比率,即回归方程所能解释的因变量变异性的百分比。实际值与平均值的总误差中,回归误差与剩余误差是此消彼长的关系。因而回归误差从正面测定线性模型的拟合优度,剩余误差则从反面来判定线性模型的拟合优度。
具体地,将使用固定站的有机物数据以及固定站对应的气象数据的测试集数据对各个固定站对应的优化后回归模型进行测试,经过测试后得到对应的测试结果,使用测试集数据以及测试结果输入至模拟效果评估算法进行模拟效果评估,得到每一个测试集数据以及测试结果对应的拟合优度。上述提到的模拟效果评估算法的公式如下:
Figure RE-GDA0003949990490000141
其中Obs表示观测值,Sim表示模拟值,
Figure RE-GDA0003949990490000142
表示模拟值的平均值。R2最大值为1。R2的值越接近1,说明模拟值对观测值的拟合程度越好;反之,R2的值越小,说明模拟值对观测值的拟合程度越差。
举例来说,将固定站A、固定站B以及固定站C分别对应的优化后回归模型m1’、m2’以及m3’使用各自对应的测试集数据进行测试,得到优化后回归模型m1’、m2’以及m3’分别对应的拟合优度开方值R1、R2以及R3,对于拟合优度开方值R1、R2以及R3进行平方,得到优化后回归模型m1’、m2’以及m3’对应的拟合优度。
步骤404,若固定站对应的拟合优度达到预设的条件,则得到固定站对应的回归模型。
其中,预设的条件可以是根据实际情况预先设定的条件,如果满足该条件的要求,则认为优化后回归模型的模拟效果是达到业务的需求,如果不满足该条件,表示优化后回归模型的模拟效果暂时无法达到业务要求,需要对优化后回归模型进行调整。
具体地,预先设置拟合优度需要达到的条件,该条件可以是人为根据实际情况进行设定,也可以计算机通过数据的情况进行设置,如果是计算机进行设置后不能满足需求,则可以使用人工设置的条件取代计算机设置的条件。对于各个固定站对于的拟合优度分别与对应的预设条件进行对比,拟合优度能够满足预设的条件,则认为该固定站赌赢的回归模型性能达到要求,则输出该固定站对应的回归模型。
举例来说,人工设定拟合优度的值必须大于0.8,固定站对应的优化后回归模型的模拟效果必须达到业务的需求,避免误差过大,对于固定站A、固定站B以及固定站C分别对应的优化后回归模型m1’、m2’以及m3’的拟合优度分别为0.85、0.93以及0.88,都能满足预设的条件,则优化后回归模型m1’、m2’以及m3’分别为固定站A、固定站B以及固定站 C对应的回归模型。
步骤406,若固定站对应的拟合优度达不到预设的条件,则修改优化后回归模型的参数,并重复模拟效果评估,直到拟合优度达到预设条件,则得到固定站对应的回归模型。
具体地,如果固定站对应的优化后回归模型的拟合优度无法达到预设的条件,则把计算节点返回到对优化后回归模型的参数修改的位置,修改参数后重新使用不同的测试集数据模拟出不同的测试结果,并且对该测试结果进行模拟效果评估,生成新的拟合优度,然后重新与预设的条件进行对比。预设重复模拟效果评估次数,如果模拟效果评估次数大于预设值,则提示重新选择初始归回模型,直到所有的固定站对应的优化后回归模型满足预设条件。
举例来说,人工设定拟合优度的值必须大于0.8,固定站对应的优化后回归模型的模拟效果必须达到业务的需求,避免误差过大,对于固定站A、固定站B以及固定站C分别对应的优化后回归模型m1’、m2’以及m3’的拟合优度分别为0.75、0.63以及0.78,均未能达到预设条件,则把三个优化后回归模型的计算节点退回至参数修改,通过修改参数后重新获得测试结果,然后对测试结果进行模拟效果评估,直到全部优化后回归模型都能满足预设的拟合优度,得到固定站A、固定站B以及固定站C分别对应的回归模型。
本实施例中,通过使用拟合优对对优化后回归模型进行模拟效果评估,如果通过评估,则可以正常使用,如果不能通过评估,则返回到修改环节,修改后再评估,直到所有优化后回归模型都能满足预设条件,能够从准确的标准上判断优化后回归模型能否达到所需要的性能,保证后续对回归模型的使用后所得到的结果的准确性,以及提高回归模型使用的效率。
在一个实施例中,如图5所示,将观测到的走航有机物数据、走航气象数据以及目标气象数据输入至目标回归模型进行校准,得到校准后的走航有机物数据,包括:
步骤502,根据观测到的走航有机物数据对应的测量仪器以及述固定站的有机物数据对应的测量仪器确定校准比例。
其中,测量仪器可以是用来测量观测到的走航有机物数据、固定站的有机物数据以及气象数据的仪器,由于需要泛化固定站得到的回归模型到走航数据,因此固定站的测量仪器的数据和走航数据的测量仪器的数据之间具有较高的一致性。
具体地,获取观测到的走航有机物数据对应的测量仪器属性,同时也获取固定站的有机物数据对应的测量仪器的属性,对比两者的属性是否具有较高的一致性,对于两者所生成的数据也进行一致性的对比。若两者的数据具有较高的一致性,则通过两者的测量仪器进行除法运算,得到由两者的测量仪器固有性质所构成的校准比例。
举例来说,固定站测量有机物数据使用的仪器为ACGCMS,走航测量有机物数据使用的仪器为SPIMS,要想将由固定站点计算出的公式运用在走航测量的数据上,必须有一个前提,两种仪器的数据之间具有较高的一致性。通过对比两种仪器的数据一致性发现,相关系数为 0.75,相关程度较高。但由于仪器原理,检测物种之间存在一定差异,两者的浓度存在一定差异,SPIMS/ACGCMS的比例为1.39。
步骤504,基于校准系数、校准比例、走航气象数据、目标气象数据以及观测到的走航有机物数据进行组合计算,得到校准后的走航有机物数据。
其中,校准系数可以是目标回归模型中的其中一个参数,因为目标回归模型已经适配了对应的观测到的走航有机物数据对应的时间以及空间,因此校准系数也能够适配观测到的走航有机物数据的校准。
其中,组合计算可以是对多个参数进行不同的数学运算,最后得到一个结果,这当中的数学运算可以是加减乘除、求导、求积分、求对数、求指数或者求幂等。
具体地,将通过泛化而得到的校准系数,根据固定站以及走航进行数据测量的测量仪器得到的校准比例,被选中的回归模型对应的气象数据以及观测到走航有机物数据进行至少一步的数学运算,计算得到的结果为校准后的走航有机物数据。
举例来说,通过泛化而得到的校准系数为k,根据固定站以及走航进行数据测量仪器之间经过除法运算得到的校准比例是1.39,目标归回模型对应的目标气象数据为a以及观测到走航有机物数据x进行加法以及乘法运算,计算后得到了校准后的走航有机物数据,上述提到的加法和乘法运算例如如下公式:校准TVOC=观测TVOC+(目标气象-观测气象)×系数×比例。
本实施例中,通过观测到的走航有机物数据对应的时间以及空间确定校准系数以及观测到的走航有机物数据对应的测量仪器以及固定站的有机物数据对应的测量仪器确定校准比例,能够对观测到的走航有机物数据进行校准时引入更多的参数,以达到校准的时候考虑到更大的范围,更多的因素,可以使校准后的走航有机物数据与实际的差异更小,更能反映VOCs的分布情况。
在一个实施例中,如图6所示,基于校准系数、校准比例、走航气象数据、目标气象数据以及观测到的走航有机物数据进行组合计算,得到校准后的走航有机物数据,包括:
步骤602,确定目标气象数据对应的时空条件下的观测气象数据。
其中,时空条件可以是为了计算目标气象数据所划定的空间或者时间的条件,例如某一日、月均或者年均的气象,也可校为指定的A区域。
其中,观测气象数据可以是通过观测而得到反映天气的一组数据,观测气象数据可分为观测气候资料和观测天气资料。观测天气资料和观测气候资料主要区别是:观测天气资料随着时间的推移转化为观测气候资料;观测气候资料的内容比观测天气资料要广泛得多;观测气候资料是长时间序列的资料,而观测天气资料是短时间内的资料。
具体地,根据目标气象数据所对应的计算需求,确定与目标气象数据计算相关的时间条件与空间条件,该时间条件一般情况下为一个时间段,但也可以为多个时间段的集合,而空间条件一般为目标气象数据相邻的区域,但也可以根据实际情况,对相邻区域的形状和大小进行调整,然后基于确定的时间和空间获取对应的观测气象数据。
举例来说,根据目标气象数据a的具体表现形式,确定用于优化目标气象数据所对应的时间段t以及空间s,上述的时间段t以及空间s可以根据需要实时进行调整,基于上述的时间段t以及空间s,获取到对应的观测天气数据A。
步骤604,对时空条件对应的观测气象数据进行去差异处理,得到优化后目标气象数据。
其中,优化后目标气象数据可以是目标气象数据通过归一化调整而获得的气象数据,归一化调整后的气象数据能够表达一段时间内的均值或者是某一日气象条件。
具体地,基于校准目的和目标气象数据所确定的时间和空间条件对应的观测气象数据,使用归一化处理的方法,使得目标气象数据的气象条件与观测到的走航有机物数据的气象条件相同,有助于目标回归模型的泛化,得到优化后目标气象数据。
举例来说,得到目标气象数据的时间为t,而空间为s,而对应的观测天气数据为A,通过归一化的处理方法,使得观测天气数据A的气象条件与观测到的走航有机物数据a的气象条件处于相同的状态下,有助于使用目标回归模型,得到优化后目标气象数据A’。
步骤606,将校准系数、校准比例、优化后目标气象数据以及观测到的走航有机物数据进行组合计算,得到校准后的走航有机物数据。
具体地,将通过泛化而得到的校准系数,根据固定站以及走航进行数据测量的测量仪器得到的校准比例,优化后目标气象数据,被选中的回归模型对应的目标气象数据以及观测到走航有机物数据进行至少一步的数学运算,计算得到的结果为校准后的走航有机物数据。
举例来说,通过泛化而得到的校准系数为k,根据固定站以及走航进行数据测量仪器之间经过除法运算得到的校准比例是1.39,优化后目标气象数据A’,目标归回模型对应的目标气象数据为a以及观测到走航有机物数据x进行加法以及乘法运算,计算后得到了校准后的走航有机物数据,上述提到的加法和乘法运算例如如下公式:校准TVOC=观测TVOC+(目标气象-观测气象)×系数×比例。
本实施例中,通过观测到的走航有机物数据对应的时间以及空间对目标回归毛行对应的气象数据进行优化,然后基于优化后气象数据以及气象数据得到目标气象数据,能够去除因为走航有机物数据对应的时间以及空间和固定站的有机物数据对应的时间和空间而导致的差异性,使得目标气象数据的准确性更高,所得到的校准后的走航有机物数据也更准确。
在一个实施例中,如图7所示,方法还包括:
步骤702,根据校准后的走航有机物数据确定至少一个评价维度,评价维度为对环境质量进行评价的环境参数排名以及所述校准后的走航有机物数据对应的区域的权重。
其中,评价维度可以是对校准后的走航有机物数据进行评价的不同评价方向,对于校准后的走航有机物数据的评价维度可以选择区域VOCs浓度水平、臭氧生成潜势贡献、问题点位数量、排放是否超标等多个维度中的一个或者多个,选择的时候应该注意校准后的走航有机物数据是否对应上这些评价维度,也就是说校准后的走航有机物数据能不能参与这些维度的评价。
具体地,根据校准后的走航有机物数据的数据表现类型,从评价维度集合中选取需要进行的评价维度,例如区域VOCs浓度水平、臭氧生成潜势贡献、问题点位数量、排放是否超标等多个维度中的一个或者多个,选取后用作评价的评价维度将从评价维度集合中提取出来,为输入数据进行评价做好准备。
举例来说,利用固定站A对应的回归模型泛化到观测后的走航有机物数据中进行校准,得到了校准后的走航有机物数据U,根据校准后的走航有机物数据U的表现类型从评价维度集合中选取了用以评价该数据的评价维度1-评价维度6,这些评价维度是对环境质量进行评价的参数。
步骤704,将各评价维度代入综合得分计算模型,得到区域挥发性有机物综合评价,区域挥发性有机物综合评价用于科学评判不同区域的挥发性有机物污染程度,综合得分计算模型根据地区不同进行参数的调整。
其中,综合得分计算模型可以是根据已加权评价维度对区域挥发性有机物进行评价的模型,该模型中的参数为各个已加权评价维度,如果有多个已加权评价维度,则需要包括多个 (所有)的已加权评价维度,以保证综合得分计算模型的评价结果具有可信性。
其中,区域挥发性有机物综合评价可以是根据综合得分计算模型计算得到关于该区域挥发性有机物的总和评价结果,该评价结果中包含多个子评价,例如TVOC浓度排名,臭氧生成潜势排名,异常点个数排名以及超标浓度个数排名等。
具体地,将各个已加权评价维度输入至综合得分计算模型中进行评价,输入的已加权评价维度可以为一个,也可以为多个,一般情况下,校准后的走航有机物数据需要使用多个已加权评价维度,则综合得分计算模型需要包括多个(所有)的已加权评价维度,以保证综合得分计算模型的评价结果具有可信性,经过模型的计算后,得到区域挥发性有机物综合评价,综合得分计算模型的主要计算公式如下:
R综i=R空i×W空i+R工i×W工i
式中,R综i为i区域的综合排名得分;R空i为i区域基于空气站周边走航数据的排名得分;R工i为i区域基于工业区周边走航数据的排名得分;W空i为和W工i分别为i区域空气站和工业区权重比例系数,其加和为1。此权重比例系数基于区域工业结构、环境管理压力等因素取值,如某区域的工业结构以科技创新和技术服务等非污染行业为主,其整体环境管理压力来自于居民生活和商业活动排放,则可将W空i给予更高的数值;反之,某区域的工业结构以石油化工、印刷、汽车制造、家具喷涂等污染行业为主,其整体环境管理压力来自于工业企业的排放,则可将W工i给予更高的数值。
单个功能区的综合评价则会从区域VOCs浓度水平、臭氧生成潜势贡献、问题点位数量、排放是否超标等多个维度出发,以各维度的排名为参数,赋予各维度一定的权重系数,建立基于数值统计的功能区VOCs综合排名得分规则,对于多功能区域中重点区域进行综合排名,确定重点管控区域。
功能区综合排名得分计算公式:
R空i=RC空i×W1+RO空i×W2+RN空i×W3+RE空i×W4
R工i=RC工i×W1+RO工i×W2+RN工i×W3+RE工i×W4
式中,RC为ΣVOCs浓度排名;RO为臭氧生成潜势排名;RN为异常点个数排名;RE 为超标浓度个数排名。W1、W2、W3、W4为以上参数的权重系数,其加和为1,实际应用过程中可根据城市环境管理需求调整,如某区域更强调对于VOCs浓度的管控,可对浓度的权重系数(即W1)赋值更高;如某区域更侧重于臭氧管控,可对臭氧生成潜势的权重系数(即 W2)赋值更高;如某区域更强调对于异常点的管控,可对异常点的权重系数(即W3)赋值更高;如某区域更强调对于VOCs超标排放行为的管控,可对超标浓度个数的权重系数(即W4) 赋值更高。
排名规则:
①ΣVOCs浓度、臭氧生成潜势、异常点位数量、超标浓度个数排名按数值从小到大确定名次,数值越小,排名越靠前;
②异常点数量相同时,按异常点浓度从小到大确定名次,数值越小,排名越靠前;
③超标浓度个数相同时,按超标浓度从小到大确定名次,数值越小,排名越靠前;
④ΣVOCs浓度为校准后的走航有机物均值浓度;臭氧生成潜势为校准后的走航有机物均值浓度乘以相应的mir值;异常点位数量为TVOC浓度值大于某一限值的点位个数;超标浓度个数为异常点位中TVOC浓度值超过当地大气环境标准的个数。
本实施例中,通过使用多个评价维度,并且对不同的评价维度进行加权计算,得到区域挥发性有机物综合评价,能够使得区域挥发性有机物综合评价更具有说服力,以及能够突出环境较差的方面,进一步来看,能够增加区域VOCs的空间代表性,以及为科学评判不同区域的VOCs污染程度及管控提供可靠依据。
在一个实施例中,目前已建立了比较完善的VOCs组分自动监测网络,基本覆盖了各地级市,给数据校准提供了有力的基础,总体技术流程如图8所示。
(一)固定站TVOC模拟
利用具有长期观测数据的固定站TVOC数据与气象数据,构建数学回归模型,以气象数据作为输入参数来模拟TVOC的变化,构建可靠的TVOC与气象因素的相关关系。
1、筛选气象因素
气象数据来源于欧洲中期天气预报中心(ECMWF)的ERA-5数据集,该数据是基于数据同化系统的全球气象再分析资料,时间覆盖范围从1979年1月~至今,时间分辨率为小时,空间分辨率为0.25°×0.25°。该数据集在全球的气象分析中被广泛使用。本次校准提取了 2020年10月1日至2021年9月30日某省范围内的地表温度、地表湿度、垂直温度、10m U/V风矢量、10米风速,边界层高度作为模式的输入数据。将垂直温度进行高度差处理,计算950-1000hpa温度差以及900-950hpa温度差,用来表征地表逆温强度。考虑到气象条件对污染物浓度影响的滞后性,除了选择当日气象数据外,还选择了前一日,前两日和前三日的数据。为了增加模拟的准确性,对所有的气象数据进行二次方处理。在校准过程中我们发现,在发生污染过程或者大气区域传输的时候,气象参数并不能很好的拟合TVOC的浓度,从而降低校准的准确度。因此除了常规气象参数外,本次还加入了CO指数来表征区域传输和大气累积对TVOC的影响。CO指数的计算方式为:瞬时CO监测值减去CO平均值。
2、建立回归模型
回归模型中,气象参数可解释部分即为气象条件对污染物浓度的影响,未解析部分认为是排放或其他因素的影响。该相关关系会根据不同的月份以及固定站点的改变而发生改变。
回归模型计算公式如下,
Figure RE-GDA0003949990490000211
式中,x1……x32为气象参数,COindex为CO指数,α1……α65为包括气象参数和CO指数在内的所有自变量的的系数,∈为常数项。针对24个固定站的12个月分别建立了回归方程,方程总数为24×12个。
3、模拟效果评估
模拟效果用拟合优度R2来表示,计算公式为:
Figure RE-GDA0003949990490000212
其中,Obs表示观测值,Sim表示模拟值,表示模拟值的平均值。R2最大值为1。R2的值越接近1,说明模拟值对观测值的拟合程度越好;反之,R2的值越小,说明模拟值对观测值的拟合程度越差。
(二)走航数据校准
将归回模型泛化至走航数据中。在一定的空间范围内,我们认为距离较近的固定站点区域和移动走航区域上,污染物受到气象的影响规律基本一致。基于不同固定站点不同月份对应的公式以后,可对走航数据开始校准。主要分为以下几个步骤:
1、对回归模型进行时空适应性分析。即判断某个站点的方程,运用至不同时间和不同距离时,模拟效果的变化。结果表明,时间越近且距离越小的泛化效果最好。因此在泛化时,需要选择相同月份及最近距离的站点所对应的回归方程;2、识别距离。基于固定站点及走航车所在的经纬度坐标,通过距离计算公式,计算出目标走航站点与不同固定站点的距离;3、识别月份。根据目标走航站点的监测时间记录,识别出对应的月份;4、确定回归模型。根据距离识别和月份识别,筛选出与目标走航站点距离最近且月份相同的回归模型用于泛化;5、确定气象条件。气象归一化的目标,可以根据不同的分析目的来选择。若选择整个走航时间段的气象平均值,即可分析平均气象条件下的VOCs排放分布;若选择某个月份的气象平均值,即可去除月份差异性,分析在某个月份的气象背景下,VOCs的排放分布;6、开始建准。针对每个目标走航站点,利用以下方法进行校准:校准TVOC=观测TVOC+(目标气象-观测气象)×系数×比例。其中,目标气象来自步骤5,观测TVOC为走航观测数据,观测气象来自ECMWF全球再分析气象数据,系数来自步骤4,比例为1.39。由于固定站点使用的仪器为ACGCMS,走航使用的仪器为SPIMS,要想将由固定站点计算出的公式运用在走航数据上,必须有一个前提,两种仪器的数据之间具有较高的一致性。通过对比两种仪器的数据一致性发现,相关系数为0.75,相关程度较高。但由于仪器原理,检测物种之间存在一定差异,两者的浓度存在一定差异,SPIMS/ACGCMS的比例为1.39。
(三)区域VOCs综合评价
由于不同走航区域,其排放强度、排放来源、排放物种活性不同,对区域VOCs贡献不同,本研究将城市按其功能属性划分走航区域类型,分为以空气站周边居民生活和商业活动为主的生活区和以工业生产为主的工业区2种类型。
1、设计排名规则
(1)TVOC浓度、臭氧生成潜势、异常点位数量、超标浓度个数排名按数值从小到大确定名次,数值越小,排名越靠前;(2)异常点数量相同时,按异常点浓度从小到大确定名次,数值越小,排名越靠前;(3)超标浓度个数相同时,按超标浓度从小到大确定名次,数值越小,排名越靠前;(4)超标浓度限值4000μg/m3(参考《大气污染物排放限值》DB44/27-2001)。
2、计算综合排名得分
区域VOCs综合评价计算公式为:R综i=R空i×W空i+R工i×W工i
式中,R综i为i城市的综合排名得分;R空i为i城市基于空气站周边走航数据的排名得分;R工i为i城市基于工业区周边走航数据的排名得分;W空i为和W工i分别为i城市空气站和工业区权重比例系数,其加和为1。此权重比例系数基于城市工业结构、环境管理压力等因素取值,如某城市的工业结构以科技创新和技术服务等非污染行业为主,其整体环境管理压力来自于居民生活和商业活动排放,则可将W空i给予更高的数值;反之,某城市的工业结构以石油化工、印刷、汽车制造、家具喷涂等污染行业为主,其整体环境管理压力来自于工业企业的排放,则可将W工i给予更高的数值。
城市中单个功能区的综合评价则会从区域VOCs浓度水平、臭氧生成潜势贡献、问题点位数量、排放是否超标等多个维度出发,以各维度的排名为参数,赋予各维度一定的权重系数,建立基于数值统计的功能区VOCs综合排名得分规则,对全省各城市重点区域进行综合排名,确定重点管控区域。
功能区综合排名得分计算公式:
R空i=RC空i×W1+RO空i×W2+RN空i×W3+RE空i×W4
R工i=RC工i×W1+RO工i×W2+RN工i×W3+RE工i×W4
式中,RC为ΣVOCs浓度排名;RO为臭氧生成潜势排名;RN为异常点个数排名;RE 为超标浓度个数排名。W1、W2、W3、W4为以上参数的权重系数,其加和为1,实际应用过程中可根据城市环境管理需求调整,如某城市更强调对于VOCs浓度的管控,可对浓度的权重系数(即W1)赋值更高;如某城市更侧重于臭氧管控,可对臭氧生成潜势的权重系数(即 W2)赋值更高;如某城市更强调对于异常点的管控,可对异常点的权重系数(即W3)赋值更高;如某城市更强调对于VOCs超标排放行为的管控,可对超标浓度个数的权重系数(即W4) 赋值更高。
排名规则:
①ΣVOCs浓度、臭氧生成潜势、异常点位数量、超标浓度个数排名按数值从小到大确定名次,数值越小,排名越靠前;
②异常点数量相同时,按异常点浓度从小到大确定名次,数值越小,排名越靠前;
③超标浓度个数相同时,按超标浓度从小到大确定名次,数值越小,排名越靠前;
④ΣVOCs浓度为校准后的走航有机物均值浓度;臭氧生成潜势为校准后的走航有机物均值浓度乘以相应的mir值;异常点位数量为TVOC浓度值大于某一限值的点位个数;超标浓度个数为异常点位中TVOC浓度值超过当地大气环境标准的个数。
在一个实施例中,对于有机物走航数据校准方法的实际应用情况,可参考以下的例子。
一、背景介绍
自2019年12月29日至2021年10月8日,共开展6轮次16个城市的走航巡查,走航站点分布如图9中圆点所示,共160个走航站点。图9中五边形为某省内24个VOCs组分站,利用其2020年10月1月至2021年9月30日的逐小时数据来探究TVOC与气象因素变化的对应关系。固定站数据使用之前,进行了异常值剔除处理。异常点编程剔除方法:先识别>1000的异常点,然后在前60和后60位中(前后五分钟),把大于整个数据99百分位数的数据设为中位值。
二、建立回归方程与时空适应性分析
2.1方程建立
由于气象条件与污染物的排放均存在季节性差异,二者之间的关系可能会随着不同月份发生变化。因此,基于24个站点全年12个月的数据,逐月进行多元回归的方程模拟,建立了24*12个方程式。以A站点为例,图10中显示了该站点不同月份的模拟结果,其中黑色线为观测值,灰色线为模拟值,R2为拟合优度。从图10中可知,回归方程可以较好的模拟出TVOC的变化过程,拟合优度在0.57至0.83之间,同时P<0.01,通过了T检验。
图11统计了24个固定站在不同月份中的拟合优度(R2),表中白色对应的拟合优度范围在0~0.3之间,表示低度拟合;浅灰色对应的拟合优度范围在0.3~0.7之间,表示中度拟合;深灰色对应的拟合优度范围在0.7~1.0之间,表示高度拟合。中度拟合和高度拟合的总占比为 91%,表明回归方程可以较好的模拟出大部分站点的TVOC变化,构建较为可靠的方程来连接气象参数以及TVOC浓度,提高了后续校准的准确性。
2.2时空适应性检验
为确认改模拟方法的时空适应性,评估在部分固定站点或某些站点的部分月份数据缺失的情况下,已有模拟方法的适用性(即某个月份对应的方程是否适用于其他月份,某个站点的方程是否适用于其他站点),以A站点12个月的方程为例,将全年气象参数代入同一个方程中,统计R2的变化。以R2保留率来表征其适应性,R2保留率=R2替换后/R2替换前*100%,保留率越高,表示方程的时间适应性更强。从图12中可知,其中以A站点结果为例,图中深灰色背景表示使用当月方程,浅灰色背景表示R2保留率超过40%的月份,1月份的公式在本月的适应性最好,在临近月份2-4月和12月的R2保留率在50%左右。随着时间间隔的增加, R2保留率逐渐降低,适应性变差。其他月份出现相似的情况,临近月份的R2保留率较高,相隔较远的月份保留率较低。综上所述,在走航校准过程中,尽量选择同一月份的方程进行校准,若无相同月份,则选择相近月份来代替。
图13以A站点1月份方程为例,将该公式运用到其他23个固定站中,观察R2的变化。图中圆点大小为R2保留率的多少,圆点越大则表明目标公式在该点的空间适应性强,反之则弱。从图中可以看到,圆点最大的为A站点,以该圆点为中心的周围站点中,距离最近的B站点R2保留率为73%,其他较远的站点,保留率较低。因此,在校准过程中,应该选择距离最近的站点方程进行校准,以提高准确性。
三、公式泛化及效果验证
3.1将公式运用至走航数据中
以6次走航时段内的平均气象为目标气象条件,将6个阶段内的走航数据校准至该气象条件下(使用不同的目标气象条件只影响校准后的浓度值,不影响不同站点之间的相对关系),如图14所示。具体步骤为:1.计算出每个走航点到24个固定站点的距离。2.明确走航监测的月份。3.确定公式,选择距离走航点最近的固定站,相同的月份对应的公式。4.开始校准,校准公式为:校准TVOC=观测TVOC+(目标气象-观测气象)*系数*1.39。校准结果如图14 所示,其中黑色实线为走航观测值,黑色虚线为校准值,若校准后,TVOC浓度增加,则表示监测当时的气象条件相对整体平均气象处于较好水平,原因可能有:风速更大,水平扩散能力更强,上风向污染较少,边界层高度更高,垂直扩散能力强等,从而让监测到的TVOC浓度变小,在校准至较差气象条件后,TVOC浓度将增加,反之则校准后的TVOC浓度将减少。通过统一气象的方法,可以剔除由于走航监测时间和空间不同、受气象条件影响带来的TVOC浓度差异,相当于更能代表本地排放的影响,增加了数据之间的可比性,其结果也为后续针对性做好对应城市、区域、站点的污染管控提供指导意见。
3.2准确性分析
本次需要校准的六个阶段走航数据,并不是在固定站相同位置进行长期观测。由于存在空间差异,气象条件不同,各区域排放量不同,导致校准前的走航数据与最近固定站在同一时刻的监测数据相关性较差,相关系数仅为0.29。当把固定站数据与走航数据都同一至目标气象条件下以后,相关系数提高至0.56。表明,当去除了气象差异的影响以后,走航数据的变化更接近于最近的固定站点数据,可靠性增加。校准之后的数据,可以更好的表征当地的 TVOC排放情况,如图15所示。
四、区域VOCs综合评价
将去除气象影响的走航数据按照其所在的城市进行区域平均,得到16个城市的平均走航数据。
综合考虑某省VOCs浓度水平、臭氧生成潜势贡献、问题点位数量、排放是否超标等多个维度,以各维度的排名为参数,赋予各维度一定的权重系数,建立基于数值统计的VOCs区域综合排名得分规则,对全省各城市重点区域进行综合排名,确定重点管控区域。
综合排名得分计算公式:R=RC×0.15+Ro×0.2+RN×0.15+RE×0.5
式中,R为综合排名得分(根据空气站和工业区,下文中分别表示为R和R);RC为ΣVOCs浓度排名;RO为臭氧生成潜势排名;RN为异常点个数排名;RE为超标浓度个数排名。0.15、0.2、0.15和0.5为以上参数的权重系数,实际应用过程中可根据管理需求调整(如本技术方案中设定的权重系数,在考虑VOCs浓度、组分的臭氧生成潜势贡献基础上,更强调对于高值点的管控,因此给予高值点的权重更高。空气站区域与工业区区域采用了相同的计算公式,但其排名得分结果并不相同。)
全省16个走航城市的走航区域涉及国控站和工业区/敏感区,由于不同走航区域,其排放强度、排放来源、排放物种活性不同,对区域VOCs贡献不同,本发明将分别针对空气站和工业区不同权重比例进行综合排名方法探究。
R综i=R空i×W空i+R工i×W工i
式中,R综i为i城市的综合排名得分;R空i为i城市基于空气站周边走航数据的排名得分;R工i为i城市基于工业区周边走航数据的排名得分;W空i为和W工i分别为i城市空气站和工业区权重比例系数。本发明将按1:0、0:1和5:5的比例进行以下分析,三种比例分别对应“仅关注空气站”,“仅关注工业区”和“空气站和工业区同权重考虑”三种情境。最终结果如图16(权重比例1:0,仅关注空气站)、图17(权重比例0:1,仅关注工业区)以及图18 (权重比例5:5,空气站和工业区同权重考虑)所示。
当给予空气站和工业区不同权重比例时,年度综合排名存在一定差异。
当空气站和工业区权重比例为1:0时,即仅考虑空气站周边走航情况影响。2020年各走航城市排名靠后城市依次为江门、佛山、茂名、广州、东莞;2021年排名靠后城市依次为广州、潮州、茂名、佛山、江门。广州、潮州、汕头2021年排名明显下滑。
当空气站和工业区权重比例为0:1时,即仅考虑工业区周边走航情况影响。2020年各走航城市排名靠后城市依次为佛山、广州、东莞、惠州、肇庆;2021年排名靠后城市依次为佛山、东莞、汕头、茂名、阳江。佛山、东莞排名持续靠后,2021年汕头、茂名、潮州排名下滑明显。
当空气站和工业区权重比例为5:5时,即同时考虑空气站和工业区周边走航情况对城市综合排名的影响,且二者贡献相当。2020年各走航城市排名靠后城市依次为佛山、广州、东莞、江门、惠州;2021年排名靠后城市依次为佛山、广州、茂名、东莞、潮州。总体来看,佛山、广州、东莞、茂名江门排名较后,2021年潮州、汕头排名下滑明显。
应该理解的是,虽然如上的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
基于同样的发明构思,本申请实施例还提供了一种用于实现上述所涉及的有机物数据校准方法的有机物数据校准装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个有机物数据校准装置实施例中的具体限定可以参见上文中对于有机物数据校准方法的限定,在此不再赘述。
在一个实施例中,如图19所示,提供了一种有机物数据校准装置,包括:数据获取模块、回归模型集合得到模块、目标回归模型确定模块和校准后的走航有机物数据得到模块,其中:
数据获取模块1902,用于获取至少一个固定站的有机物数据以及各固定站对应的气象数据,其中,气象数据为固定站所处的范围区域内与大气相关的参数以及大气扩散指数;
回归模型集合得到模块1904,用于基于各固定站的有机物数据以及各固定站对应的气象数据建立各固定站对应的回归模型,得到回归模型集合,回归模型表示固定站的有机物数据与气象数据之间的映射关系;
目标回归模型确定模块1906,用于根据观测到的走航有机物数据对应的时间以及空间,在回归模型集合中确定目标回归模型;
校准后的走航有机物数据得到模块1908,用于将观测到的走航有机物数据、走航气象数据以及目标气象数据输入至目标回归模型进行校准,得到校准后的走航有机物数据,其中,目标气象数据为根据目标回归模型所对应的气象数据进行自定义后的气象数据,走航气象数据为目标回归模型所对应的走航车所在的范围内的气象数据。
在其中一个实施例中,回归模型集合得到模块,用于根据固定站的有机物数据以及固定站对应的气象数据的参数类型建立初始回归模型;将各固定站的有机物数据以及各固定站对应的气象数据分别输入至初始回归模型,并对初始回归模型的参数进行优化,得到各固定站对应的优化后回归模型;将各固定站对应的优化后回归模型进行模拟效果评估,得到各固定站对应的回归模型;将各固定站对应的回归模型进行汇集,得到回归模型集合。
在其中一个实施例中,回归模型集合得到模块,用于将各固定站对应的优化后回归模型的测试结果输入至模拟效果评估算法进行模拟效果评估,得到各固定站对应的拟合优度;若固定站对应的拟合优度达到预设的条件,则得到固定站对应的回归模型;若固定站对应的拟合优度达不到预设的条件,则修改优化后回归模型的参数,并重复模拟效果评估,直到拟合优度达到预设条件,则得到固定站对应的回归模型。
在其中一个实施例中,校准后的走航有机物数据得到模块,用于根据观测到的走航有机物数据对应的时间以及空间确定校准系数;根据观测到的走航有机物数据对应的测量仪器以及固定站的有机物数据对应的测量仪器确定校准比例;基于校准系数、校准比例、目标气象数据以及观测到的走航有机物数据进行组合计算,得到校准后的走航有机物数据。
在其中一个实施例中,校准后的走航有机物数据得到模块,用于确定目标气象数据对应的时空条件下的观测气象数据,时空条件为计算目标气象数据所对应的时间和空间,观测气象数据为时空条件下实时变化的气象数据;基于时空条件以及观测气象数据进行去差异处理,得到目标气象数据;将校准系数、校准比例、目标气象数据以及观测到的走航有机物数据进行组合计算,得到校准后的走航有机物数据。
在其中一个实施例中,区域挥发性有机物综合评价得到模块,用于根据校准后的走航有机物数据确定至少一个评价维度,评价维度为对环境质量进行评价的环境参数排名以及所述校准后的走航有机物数据对应的区域的权重;将各评价维度代入综合得分计算模型,得到区域挥发性有机物综合评价,区域挥发性有机物综合评价用于科学评判不同区域的挥发性有机物污染程度,综合得分计算模型根据地区不同进行参数的调整。
上述有机物数据校准装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图20所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储服务器数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种有机物数据校准方法。
本领域技术人员可以理解,图20中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,还提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,存储有计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述各方法实施例中的步骤。
需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory, DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。

Claims (10)

1.一种有机物数据校准方法,其特征在于,所述方法包括:
获取至少一个固定站的有机物数据以及各所述固定站对应的气象数据,其中,所述气象数据包括所述固定站所处的范围区域内与大气相关的参数以及大气扩散指数;
基于各所述固定站的有机物数据以及各所述固定站对应的气象数据建立各所述固定站对应的回归模型,得到回归模型集合,所述回归模型表示所述固定站的有机物数据与所述气象数据之间的映射关系;
根据观测到的走航有机物数据对应的时间以及空间,在所述回归模型集合中确定目标回归模型;
将所述观测到的走航有机物数据、走航气象数据以及目标气象数据输入至所述目标回归模型进行校准,得到校准后的走航有机物数据,其中,所述目标气象数据为根据所述目标回归模型所对应的所述气象数据进行自定义后的气象数据,所述走航气象数据为所述目标回归模型所对应的走航车所在的范围内的所述气象数据。
2.根据权利要求1所述的方法,其特征在于,所述基于各所述固定站的有机物数据以及各所述固定站对应的气象数据建立各所述固定站对应的回归模型,得到回归模型集合,包括:
根据所述固定站的有机物数据以及所述固定站对应的气象数据的参数类型建立初始回归模型;
将各所述固定站的有机物数据以及各所述固定站对应的气象数据分别输入至所述初始回归模型,并对所述初始回归模型的参数进行优化,得到各所述固定站对应的优化后回归模型;
将各所述固定站对应的优化后回归模型进行模拟效果评估,得到各所述固定站对应的回归模型;
将各所述固定站对应的回归模型进行汇集,得到所述回归模型集合。
3.根据权利要求2所述的方法,其特征在于,所述将各所述固定站对应的优化后回归模型进行模拟效果评估,得到各所述固定站对应的回归模型,包括:
将各所述固定站对应的优化后回归模型的测试结果输入至模拟效果评估算法进行所述模拟效果评估,得到各所述固定站对应的拟合优度;
若所述固定站对应的拟合优度达到预设的条件,则得到所述固定站对应的回归模型;
若所述固定站对应的拟合优度达不到所述预设的条件,则修改所述优化后回归模型的参数,并重复所述模拟效果评估,直到所述拟合优度达到所述预设条件,则得到所述固定站对应的回归模型。
4.根据权利要求1所述的方法,其特征在于,所述将所述观测到的走航有机物数据、走航气象数据以及目标气象数据输入至所述目标回归模型进行校准,得到校准后的走航有机物数据,包括:
根据所述观测到的走航有机物数据对应的测量仪器以及所述固定站的有机物数据对应的测量仪器确定校准比例;
基于校准系数、所述校准比例、所述走航气象数据、所述目标气象数据以及所述观测到的走航有机物数据进行组合计算,得到所述校准后的走航有机物数据,所述校准系数为所述目标回归模型中的其中一个参数。
5.根据权利要求4所述的方法,其特征在于,所述基于所述校准系数、所述校准比例、所述走航气象数据、所述目标气象数据以及所述观测到的走航有机物数据进行组合计算,得到所述校准后的走航有机物数据,包括:
确定所述目标气象数据对应的时空条件下的观测气象数据,所述时空条件为计算所述目标气象数据所对应的时间和空间,所述观测气象数据为所述时空条件下实时变化的气象数据;
对所述时空条件对应的所述观测气象数据进行去差异处理,得到优化后目标气象数据;
将所述校准系数、所述校准比例、所述优化后目标气象数据以及所述观测到的走航有机物数据进行所述组合计算,得到所述校准后的走航有机物数据。
6.根据权利要求1至5任意一项所述的方法,其特征在于,所述方法还包括:
根据所述校准后的走航有机物数据确定至少一个评价维度,所述评价维度为对环境质量进行评价的环境参数排名以及所述校准后的走航有机物数据对应的区域的权重;
将所述各评价维度代入综合得分计算模型,得到区域挥发性有机物综合评价,所述区域挥发性有机物综合评价用于科学评判不同区域的挥发性有机物污染程度,所述综合得分计算模型根据地区不同进行参数的调整。
7.一种有机物数据校准装置,其特征在于,所述装置包括:
数据获取模块,用于获取至少一个固定站的有机物数据以及各所述固定站对应的气象数据,其中,所述气象数据为所述固定站所处的范围区域内与大气相关的参数以及大气扩散指数;
回归模型集合得到模块,用于基于各所述固定站的有机物数据以及各所述固定站对应的气象数据建立各所述固定站对应的回归模型,得到回归模型集合,所述回归模型表示所述固定站的有机物数据与所述气象数据之间的映射关系;
目标回归模型确定模块,用于根据观测到的走航有机物数据对应的时间以及空间,在所述回归模型集合中确定目标回归模型;
校准后的走航有机物数据得到模块,用于将所述观测到的走航有机物数据、走航气象数据以及目标气象数据输入至所述目标回归模型进行校准,得到校准后的走航有机物数据,其中,所述目标气象数据为根据所述目标回归模型所对应的所述气象数据进行自定义后的气象数据,所述走航气象数据为所述目标回归模型所对应的走航车所在的范围内的所述气象数据。
8.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述的方法的步骤。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
10.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
CN202210510530.5A 2022-05-11 2022-05-11 有机物走航数据校准方法、装置、计算机设备和存储介质 Pending CN115526330A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210510530.5A CN115526330A (zh) 2022-05-11 2022-05-11 有机物走航数据校准方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210510530.5A CN115526330A (zh) 2022-05-11 2022-05-11 有机物走航数据校准方法、装置、计算机设备和存储介质

Publications (1)

Publication Number Publication Date
CN115526330A true CN115526330A (zh) 2022-12-27

Family

ID=84695954

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210510530.5A Pending CN115526330A (zh) 2022-05-11 2022-05-11 有机物走航数据校准方法、装置、计算机设备和存储介质

Country Status (1)

Country Link
CN (1) CN115526330A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116663334A (zh) * 2023-07-28 2023-08-29 北京工业大学 一种监测站点大气污染物本地排放贡献的量化识别方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116663334A (zh) * 2023-07-28 2023-08-29 北京工业大学 一种监测站点大气污染物本地排放贡献的量化识别方法
CN116663334B (zh) * 2023-07-28 2023-10-13 北京工业大学 一种监测站点大气污染物本地排放贡献的量化识别方法

Similar Documents

Publication Publication Date Title
Li et al. Predicting ground-level PM2. 5 concentrations in the Beijing-Tianjin-Hebei region: A hybrid remote sensing and machine learning approach
Hansen et al. Assessing the observed impact of anthropogenic climate change
Lee et al. Quantifying the agreement between observed and simulated extratropical modes of interannual variability
CN108918815B (zh) 一种土壤重金属风险预测方法
Bonthoux et al. Point count duration: five minutes are usually sufficient to model the distribution of bird species and to study the structure of communities for a French landscape
Liu et al. A data calibration method for micro air quality detectors based on a LASSO regression and NARX neural network combined model
Lee et al. Spatial cluster detection of regression coefficients in a mixed‐effects model
CN113836808A (zh) 一种基于重污染特征约束的pm2.5深度学习预测方法
CN112733419A (zh) 一种突发大气污染事故源反演准确性提升方法
CN115526330A (zh) 有机物走航数据校准方法、装置、计算机设备和存储介质
Estévez et al. A quality control procedure for long-term series of daily precipitation data in a semiarid environment
Kim et al. Long-term behavior and stability of calibration models for NO and NO 2 low-cost sensors
Liu et al. Research on data correction method of micro air quality detector based on combination of partial least squares and random forest regression
Sigamani et al. Air quality index prediction with influence of meteorological parameters using machine learning model for IoT application
CN112148821B (zh) 一种城市混合职住空间计算方法和系统
CN113486295A (zh) 基于傅里叶级数的臭氧总量变化预测方法
CN116739619A (zh) 一种能源电力碳排放监测分析建模方法及装置
CN117078077A (zh) 一种高速公路路域的生态脆弱性评价方法
Moral et al. Mapping and hazard assessment of atmospheric pollution in a medium sized urban area using the Rasch model and geostatistics techniques
CN116050475A (zh) 关键污染物浓度预测模型的训练方法、装置和计算机设备
CN113688506B (zh) 基于微站等多维数据的潜在大气污染源识别方法
CN116702926A (zh) 一种空气质量模式预报机器学习集成订正方法
Morsi Electronic noses for monitoring environmental pollution and building regression model
CN115809728A (zh) 大气污染扩散条件预测方法、装置、计算机设备
CN115510763A (zh) 一种基于数据驱动探索的空气污染物浓度预测方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination