CN109753631A - 一种基于主动学习和克里金插值的空气质量推测算法 - Google Patents

一种基于主动学习和克里金插值的空气质量推测算法 Download PDF

Info

Publication number
CN109753631A
CN109753631A CN201811468938.0A CN201811468938A CN109753631A CN 109753631 A CN109753631 A CN 109753631A CN 201811468938 A CN201811468938 A CN 201811468938A CN 109753631 A CN109753631 A CN 109753631A
Authority
CN
China
Prior art keywords
air quality
concentration
monitoring station
data
air
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811468938.0A
Other languages
English (en)
Inventor
於志文
常慧娟
郭斌
王亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Northwestern Polytechnical University
Original Assignee
Northwestern Polytechnical University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Northwestern Polytechnical University filed Critical Northwestern Polytechnical University
Priority to CN201811468938.0A priority Critical patent/CN109753631A/zh
Publication of CN109753631A publication Critical patent/CN109753631A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Feedback Control In General (AREA)

Abstract

本发明涉及一种基于主动学习和克里金插值的空气质量推测算法,该方法通过克里金插值预估所插数据的误差,提出基于置信度的计算方法,寻找对模型置信度最大的位置对空气质量优先采样,经过采样融合后准确推测其他位置的空气质量,以更加全面地利用空气监测站数据预测空气质量,并更好的了解城市空气质量的走势,进一步地为市政人员后期针对性地控制大气污染提供更好的依据。

Description

一种基于主动学习和克里金插值的空气质量推测算法
技术领域
本发明涉及信息加工技术领域,具体涉及一种基于主动学习和克里金插值的空气质量推测算法。具体地说,利用空气监测站收集空气中个污染物浓度信息,选取最少的位置对空气质量进行采样并最大程度准确地推测其他位置的空气质量。
背景技术
随着社会经济的发展和人民生活水平的提高,空气质量也越来越被大家所关注。空气一直是维护人类及生物生存的保护膜,对人类及生物生存起重要作用,但随着工业及交通运输业的不断发展,大量的有害物质被排放到空气中,空气质量每况愈下,由其导致的酸雨、全球变暖都在破坏着人类的自然环境和生态系统。在循环经济、绿色经济、经济与环境可持续发展的趋势下,了解空气污染变化趋势,掌握及时、准确、全面的空气质量信息、对空气质量进行精准预测是必要的措施之一,准确获取城市中每个位置的空气质量就成为一项必不可少的研究工作,从而为监控空气污染状况并对制定治理措施提供依据。但由于空气质量监测站需占用大量空间且成本高昂,仅能在少数位置部署,因此选取哪些位置对空气质量进行采样,能最大程度地推测其他位置的空气质量是一项具有挑战的工作。
鉴于空气质量具有空间自相关性,因此选用克里金插值作为基础的空气质量推测算法,但克里金插值法缺乏最优采样位置的选择方法,所以结合了主动学习的思想,寻找对模型置信度贡献最大的位置优先采样,最终建立基于主动学习的插值模型,选取最少的位置对空气质量进行采样以推测其他位置的空气质量。
发明内容
要解决的技术问题
为了避免现有技术的不足之处,本发明提出一种基于主动学习和克里金插值的空气质量推测算法。
技术方案
一种基于主动学习和克里金插值的空气质量推测算法,其特征在于步骤如下:
步骤1:利用空气质量监测站收集空气中各污染物浓度信息数据,将数据整理成四元组<监测站id,监测站位置,检测时间,空气质量指数>的格式;原始数据表示为(station_id,time,PM25_Concentration,PM10_Concentration,NO2_Concentration,CO_Concentration,O3_Concentration,SO2_Concentration),其中station_id代表监测站id,time代表所监测的污染物浓度信息的时间,(PM25_Concentration,PM10_Concentration,NO2_
Concentration,CO_Concentration,O3_Concentration,SO2_Concentration)代表空气中悬浮颗粒物,二氧化氮,一氧化碳,臭氧,二氧化硫污染物浓度;
步骤2:分别针对五种空气污染物浓度数据使用公式计算得到5个I值,取最大的I值为空气质量指数,即AQI;C为污染物浓度;Cl、Ch为该污染物浓度限值,Il、Ih为对应的AQI限值,4个数均为常量,可通过查阅空气质量指数及对应的污染物浓度限值表获得;
表1空气质量指数及对应的污染物浓度限值
步骤3:计算各空气监测站距离之间的半方差,衡量各监测站之间的空间相关程度即半变异函数,计算公式如下:
其中h为各监测站之间距离,n是由h分开的成对样本的数量,z(xi)是第i个监测站的空气质量指数,z(xi+h)为与监测站xi距离为h得监测站的空气质量指数值;
步骤4:将监测站分为两部分,收集了空气质量数据的监测站为标记样本,即已知点,其余未收集空气质量数据的监测站为未标记样本,即未知点,利用收集到的监测站数据以及根据监测站之间的距离与半方差之间的关系所拟合的模型对未标记样本进行插值估算,估算公式如下:
其中z0为未标记样本的AQI估计值,zxi为标记样本的AQI值,s是用来估算未知点的已知点的数目,λxi为各zxi在估计时影响大小的系数,由以下方程组计算:
其中γ(xi,xj)为xi与xj之间的半变异函数值,μ为拉格朗日常数;
步骤5:采用以下公式作为对所插数据的预估误差作为置信度评判的指标:
MSE(Z0)=σ2{1-rTR-1r+(1-FR-1r)2/FTR-1F}
其中σ2为方差,R称为相关矩阵,由所有已知样本点之间的半变异函数值组成,r称为相关矢量,由未知点与所有已知样本点之间的半变异函数值组成,计算公式如下:
F=[1 ... 1]T
步骤6:直接选择对未收集数据的监测站预估值误差最大的点为置信度最低的未标记样本,从插值结果中选择满足置信度要求的未标记样本并主动收集该监测站数据,加入到标记样本集中,并从未标记样本集中去除该样本;
步骤7:重新训练克里金插值模型,直至满足精度要求、成本要求或数量要求为止;此时已选取最少的位置对空气质量进行采样并最大程度准确地推测出了其他位置的空气质量。
有益效果
本发明提出的一种基于主动学习和克里金插值的空气质量推测算法,可以更加全面地利用空气监测站数据预测空气质量,利用空气污染物浓度数据以及监测站位置数据判断任意位置的空气质量指数等重要属性,更好的了解城市空气质量的走势,进一步地为市政人员后期针对性地控制大气污染提供更好的依据。
附图说明
图1为本发明实施例一种基于主动学习和克里金插值的空气质量推测方法的整体框架图
图2为基于主动学习的克里金插值算法流程图
具体实施方式
现结合实施例、附图对本发明作进一步描述:
为了能够利用已有空气质量数据便捷地检测任意城市的空气质量情况,本发明提供了一种基于主动学习和克里金插值的的空气质量推测方法,该方法利用空气监测站监测空气中各污染物浓度信息,收集到空气质量指数(AQI)数据,提出了空气质量推测方法。
该方法通过克里金插值预估所插数据的误差,提出基于置信度的计算方法,寻找对模型置信度最大的位置对空气质量优先采样,经过采样融合后准确推测其他位置的空气质量,以更加全面地利用空气监测站数据预测空气质量,并更好的了解城市空气质量的走势,进一步地为市政人员后期针对性地控制大气污染提供更好的依据。
为实现上述目的,本发明采取的技术方案为:基于主动学习和克里金插值的的空气质量推测方法包括以下步骤:
S1、利用空气质量监测站收集空气中各污染物浓度信息数据。将数据整理成四元组<监测站id,监测站位置,监测时间,空气质量指数>的格式。原始数据表示为(station_id,time,PM25_Concentration,PM10_Concentration,NO2_Concentration,CO_Concentration,O3_Concentration,SO2_Concentration),其中station_id代表监测站id,time代表所监测的污染物浓度信息的时间,(PM25_Concentration,PM10_Concentration,NO2_Concentration,CO_Concentration,O3_Concentration,SO2_Concentration)代表空气中悬浮颗粒物,二氧化氮,一氧化碳,臭氧,二氧化硫污染物浓度。
S2、分别针对五种空气污染物浓度数据使用公式计算得到5个I值,取最大的I值为空气质量指数,即AQI;C为污染物浓度;Cl、Ch为该污染物浓度限值,Il、Ih为对应的AQI限值,4个数均为常量,可通过查阅空气质量指数及对应的污染物浓度限值表获得。例如,SO2浓度为60μg/m3,即C为60,查表可得,Cl为50,Ch为150,Il为50,Ih为100,带入公式计算可得I值。
表1空气质量指数及对应的污染物浓度限值
S3、计算各空气监测站距离之间的半方差,衡量各监测站之间的空间相关程度即半变异函数,计算公式如下:
其中n是由监测站xi与监测站xj之间的距离分开的成对样本的数量,z(xi)是第i个监测站的空气质量指数值,z(xj)是j个监测站的空气质量指数值。
S4、将监测站分为两部分,收集了空气质量数据的监测站为标记样本,即已知点,其余未收集空气质量数据的监测站为未标记样本,即未知点,利用收集到的监测站数据以及根据监测站之间的距离与半方差之间的关系所拟合的模型(常见模型有球面模型、指数模型、高斯模型等)对未标记样本进行插值估算,估算公式如下:
其中z0为未标记样本的AQI估计值,为标记样本的AQI值,s是用来估算未知点的已知点的数目,为各在估计时影响大小的系数,由以下方程组计算:
其中γ(xi,xj)为xi与xj之间的半变异函数值,μ为拉格朗日常数。
S5、采用以下公式作为对所插数据的预估误差作为置信度评判的指标:
MSE(Z0)=σ2{1-rTR-1r+(1-FR-1r)2/FTR-1F}
其中σ2为方差,R称为相关矩阵,由所有已知样本点之间的半变异函数值组成,r为相关矢量,由未知点与所有已知样本点之间的半变异函数值组成,计算公式如下:
F=[1 ... 1]T
S6、直接选择对未收集数据的监测站预估值误差最大的点为置信度最低的未标记样本,从插值结果中选择满足置信度要求的未标记样本并主动收集该监测站数据,加入到标记样本集中,并从未标记样本集中去除该样本。
S7、重新训练插值模型,直至满足精度要求、成本要求或数量要求为止。此时已选取最少的位置对空气质量进行采样并最大程度准确地推测出了其他位置的空气质量。

Claims (1)

1.一种基于主动学习和克里金插值的空气质量推测算法,其特征在于步骤如下:
步骤1:利用空气质量监测站收集空气中各污染物浓度信息数据,将数据整理成四元组<监测站id,监测站位置,检测时间,空气质量指数>的格式;原始数据表示为(station_id,time,PM25_Concentration,PM10_Concentration,NO2_Concentration,CO_Concentration,O3_Concentration,SO2_Concentration),其中station_id代表监测站id,time代表所监测的污染物浓度信息的时间,(PM25_Concentration,PM10_Concentration,NO2_Concentration,CO_Concentration,O3_Concentration,SO2_Concentration)代表空气中悬浮颗粒物,二氧化氮,一氧化碳,臭氧,二氧化硫污染物浓度;
步骤2:分别针对五种空气污染物浓度数据使用公式计算得到5个I值,取最大的I值为空气质量指数,即AQI;C为污染物浓度;Cl、Ch为该污染物浓度限值,Il、Ih为对应的AQI限值,4个数均为常量,可通过查阅空气质量指数及对应的污染物浓度限值表获得;
表1空气质量指数及对应的污染物浓度限值
步骤3:计算各空气监测站距离之间的半方差,衡量各监测站之间的空间相关程度即半变异函数,计算公式如下:
其中h为各监测站之间距离,n是由h分开的成对样本的数量,z(xi)是第i个监测站的空气质量指数,z(xi+h)为与监测站xi距离为h得监测站的空气质量指数值;
步骤4:将监测站分为两部分,收集了空气质量数据的监测站为标记样本,即已知点,其余未收集空气质量数据的监测站为未标记样本,即未知点,利用收集到的监测站数据以及根据监测站之间的距离与半方差之间的关系所拟合的模型对未标记样本进行插值估算,估算公式如下:
其中z0为未标记样本的AQI估计值,为标记样本的AQI值,s是用来估算未知点的已知点的数目,为各在估计时影响大小的系数,由以下方程组计算:
其中γ(xi,xj)为xi与xj之间的半变异函数值,μ为拉格朗日常数;
步骤5:采用以下公式作为对所插数据的预估误差作为置信度评判的指标:
MSE(Z0)=σ2{1-rTR-1r+(1-FR-1r)2/FTR-1F}
其中σ2为方差,R称为相关矩阵,由所有已知样本点之间的半变异函数值组成,r称为相关矢量,由未知点与所有已知样本点之间的半变异函数值组成,计算公式如下:
F=[1 ... 1]T
步骤6:直接选择对未收集数据的监测站预估值误差最大的点为置信度最低的未标记样本,从插值结果中选择满足置信度要求的未标记样本并主动收集该监测站数据,加入到标记样本集中,并从未标记样本集中去除该样本;
步骤7:重新训练克里金插值模型,直至满足精度要求、成本要求或数量要求为止;此时已选取最少的位置对空气质量进行采样并最大程度准确地推测出了其他位置的空气质量。
CN201811468938.0A 2018-12-04 2018-12-04 一种基于主动学习和克里金插值的空气质量推测算法 Pending CN109753631A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811468938.0A CN109753631A (zh) 2018-12-04 2018-12-04 一种基于主动学习和克里金插值的空气质量推测算法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811468938.0A CN109753631A (zh) 2018-12-04 2018-12-04 一种基于主动学习和克里金插值的空气质量推测算法

Publications (1)

Publication Number Publication Date
CN109753631A true CN109753631A (zh) 2019-05-14

Family

ID=66403531

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811468938.0A Pending CN109753631A (zh) 2018-12-04 2018-12-04 一种基于主动学习和克里金插值的空气质量推测算法

Country Status (1)

Country Link
CN (1) CN109753631A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110209992A (zh) * 2019-05-24 2019-09-06 西北工业大学 一种基于空间和跨域相关性的感知位置选择方法
CN116448966A (zh) * 2023-06-15 2023-07-18 吉林省中农阳光数据有限公司 基于智能物联网和深度学习相结合的空气质量评估方法
CN117093832A (zh) * 2023-10-18 2023-11-21 山东公用环保集团检测运营有限公司 一种用于空气质量数据缺失的数据插补方法及系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103353923A (zh) * 2013-06-26 2013-10-16 中山大学 基于空间特征分析的自适应空间插值方法及其系统
CN105550784A (zh) * 2016-01-20 2016-05-04 中科宇图科技股份有限公司 一种空气质量监测站优化布点方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103353923A (zh) * 2013-06-26 2013-10-16 中山大学 基于空间特征分析的自适应空间插值方法及其系统
CN105550784A (zh) * 2016-01-20 2016-05-04 中科宇图科技股份有限公司 一种空气质量监测站优化布点方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
常慧娟 等: "基于主动学习和克里金插值的空气质量推测", 《大数据》, no. 6, 15 November 2018 (2018-11-15), pages 54 *
韩忠华: "Kriging模型及代理优化算法研究进展", 《航空学报》, vol. 37, no. 11, 29 March 2016 (2016-03-29), pages 3200 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110209992A (zh) * 2019-05-24 2019-09-06 西北工业大学 一种基于空间和跨域相关性的感知位置选择方法
CN116448966A (zh) * 2023-06-15 2023-07-18 吉林省中农阳光数据有限公司 基于智能物联网和深度学习相结合的空气质量评估方法
CN116448966B (zh) * 2023-06-15 2023-09-12 吉林省中农阳光数据有限公司 基于智能物联网和深度学习相结合的空气质量评估方法
CN117093832A (zh) * 2023-10-18 2023-11-21 山东公用环保集团检测运营有限公司 一种用于空气质量数据缺失的数据插补方法及系统
CN117093832B (zh) * 2023-10-18 2024-01-26 山东公用环保集团检测运营有限公司 一种用于空气质量数据缺失的数据插补方法及系统

Similar Documents

Publication Publication Date Title
CN109753631A (zh) 一种基于主动学习和克里金插值的空气质量推测算法
CN106650017B (zh) 一种利用固定位置污染物探测器辨识城市空间多污染物源的方法
CN107391951B (zh) 一种基于环形邻域梯度排序的空气污染溯源方法
CN104504099B (zh) 基于位置轨迹的交通出行状态切分方法
CN108008099B (zh) 一种污染源定位方法
CN103369466B (zh) 一种地图匹配辅助室内定位方法
AU2020102518A4 (en) A method of gas sensor calibration based on linear optimization
CN108519465B (zh) 一种基于大数据的空气污染智能监测系统
CN108614071B (zh) 分布式室外大气质量监测精度校正系统及参数更新方法
CN104766341B (zh) 一种基于dsm和核密度估计的遥感影像建筑物变化检测方法
CN111563331B (zh) 一种基于移动监测的区域大气污染分布预测方法
CN110426037A (zh) 一种封闭环境下的行人运动轨迹实时获取方法
CN109781809B (zh) 一种甲醛浓度人工智能测算方法
CN107966242A (zh) 适用于深海浮标的一键式气压传感器现场校准系统及方法
Bierlaire et al. Modeling route choice behavior from smartphone GPS data
CN108120437B (zh) 一种基于地磁场强度序列特征点对齐的行人路径匹配方法
Kulmala et al. Towards a concentration closure of sub-6 nm aerosol particles and sub-3 nm atmospheric clusters
CN104897873A (zh) 一种开放型土壤碳通量监测仪及监测方法
CN106403953A (zh) 一种用于水下自主导航与定位的方法
Sepulveda‐Jauregui et al. A new method for field measurement of dissolved methane in water using infrared tunable diode laser absorption spectroscopy
CN107656905B (zh) 一种利用误差传递的空气质量数据实时校准方法
CN109033524A (zh) 一种基于鲁棒混合模型的化工过程浓度变量在线估计方法
CN103235216B (zh) 一种基于LabVIEW的增氧机自动测试系统
CN206074306U (zh) 一种分层采水样杆装置
CN104483361B (zh) 一种提高电化学分析仪器测量精度的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20190514