CN112966442B - 基于因果中心性的雾霾分析识别方法 - Google Patents

基于因果中心性的雾霾分析识别方法 Download PDF

Info

Publication number
CN112966442B
CN112966442B CN202110251379.3A CN202110251379A CN112966442B CN 112966442 B CN112966442 B CN 112966442B CN 202110251379 A CN202110251379 A CN 202110251379A CN 112966442 B CN112966442 B CN 112966442B
Authority
CN
China
Prior art keywords
monitoring
causality
causal
haze
factors
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110251379.3A
Other languages
English (en)
Other versions
CN112966442A (zh
Inventor
王博丞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University of Media and Communications
Original Assignee
Zhejiang University of Media and Communications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University of Media and Communications filed Critical Zhejiang University of Media and Communications
Priority to CN202110251379.3A priority Critical patent/CN112966442B/zh
Publication of CN112966442A publication Critical patent/CN112966442A/zh
Application granted granted Critical
Publication of CN112966442B publication Critical patent/CN112966442B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2474Sequence data queries, e.g. querying versioned data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2111/00Details relating to CAD techniques
    • G06F2111/10Numerical modelling

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Medical Informatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Hardware Design (AREA)
  • Geometry (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Computational Linguistics (AREA)
  • Databases & Information Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于因果中心性的雾霾分析识别方法,包含:获取若干检测站点检测到的监测数据;针对不同的监测因素构建区域内部数据关联模型和构建区域间数据关联模型;计算每个监测因素和雾霾浓度之间的因果关系值;根据因果关系值构成因果矩阵;根据因果矩阵计算因果中心性特征值用于表征各个检测站点的拓扑中心性;将监测因素间的因果关系值和因果中心性特征值输入搭建好的预测模型对其进行训练得到一个训练完成的预测模型。本发明的基于因果中心性的雾霾分析识别方法,结合因果关系和复杂网络中心性分析方法,对气象数据和工业废气排放数据进行建模,充分利用地域间雾霾因果关联程度和方向性信息等特征,显著提高了雾霾气象识别和预测水平。

Description

基于因果中心性的雾霾分析识别方法
技术领域
本发明涉及一种基于因果中心性的雾霾分析识别方法。
背景技术
雾霾天气严重影响人们的生命和健康。特别是在华北,长江三角洲和中国中部,这些地区人口密集、经济发达,对自然资源的需求远远高于中国其他地区。随着工厂和私家车化石燃料消耗的增加,排放到空气中的二氧化硫和氮氧化物不仅对人类和植物造成直接危害,而且还会造成酸雨,雾霾,温室效应和光化学烟雾等二次污染。许多发达国家也出现了严重的烟雾污染。作为空气污染物的罪魁祸首,PM2.5浓度增加了呼吸道和心血管疾病的死亡率。
空气质量评估的方法可分为三类,基于物理特性、基于统计特征和混合方法。污染物扩散模型是基于物理特征的方法之一。它建立了一个数学公式,如高斯羽流模型,它带来气象数据,街道结构,交通流量,然后评估空气质量。对于基于统计特征的方法,通常使用时间序列分析和显着性检验来评估空气质量。统计中的线性和非线性回归模型反映了不同空气成分的固有属性。Chenet al表明个别气象因子可以间接影响当地PM2.5浓度与其他气象因素的相互作用。他们测试了不同气象因子与PM2.5之间的收敛交叉映射(CCM)因果关系。此外,湿度和PM2.5浓度之间的正双向耦合,以及风,太阳辐射和PM2.5浓度之间的负双向耦合是通过比较因果关系方向的结果来解释。另一方面,确认空气污染只是由自然因素造成的,并不能令人信服。人类活动和工业生产的影响也至关重要。Kolluru等讨论了不同旅行模式对乘客在印度国道上长途旅行的污染物暴露的贡献。通过方差分析(ANOVA)方法研究了CO,CO2和PM2.5的浓度,得出结论:避开穿过城市的国家高速公路可以减少高达25%的PM2.5和50%的CO质量暴露。周等人表明人口密度,产业结构,工业烟尘(粉尘)排放和道路密度对PM2.5浓度有显着的正向影响,仅对中国经济增长产生显着的负面影响。
对于混合模型,大多数空气质量评估方法结合了物理和统计方法的优点,并通过人工智能算法预测空气质量。这包括各种带有机器学习的应用程序。Cordero等使用多元线性回归,随机森林和人工神经网络测量NO2浓度。朱等人基于选择性集成算法,在中国雾霾预测中实现了高分类精度。但是,机器学习中的特征选择是一个难题。在迭代求解之后,直到预测结果出来之前,没有通用标准来确定特征是否合适。
发明内容
本发明提供了一种基于因果中心性的雾霾分析识别方法,采用如下的技术方案:
一种基于因果中心性的雾霾分析识别方法,包含以下步骤:
获取若干检测站点检测到的监测数据,监测数据包含多个监测因素和雾霾浓度的数据;
针对不同的监测因素分别构建区域内部数据关联模型;
针对不同的监测因素分别构建区域间数据关联模型;
根据构建的区域内部数据关联模型和区域间数据关联模型计算每个监测因素和雾霾浓度之间的因果关系值;
根据计算出的每个检测站点检测到的各监测因素与雾霾浓度之间的因果关系值构成因果矩阵;
根据因果矩阵计算因果中心性特征值用于表征各个检测站点的拓扑中心性;
将监测因素间的因果关系值和因果中心性特征值输入搭建好的预测模型对其进行训练得到一个训练完成的预测模型。
进一步地,构建的区域内部数据关联模型和区域间数据关联模型符合下述公式:
Figure GDA0004143799160000021
其中,w是每种监测因素的系数,F对应了某一种监测因素,m是时间序列的滞后长度,N是时间序列的观测长度,n是监测因素的个数,t是时间,ηt是噪声项。
进一步地,在根据构建的区域内部数据关联模型和区域间数据关联模型计算每个监测因素和雾霾浓度之间的因果关系值中,根据下述公式计算每个监测因素和雾霾浓度之间的因果关系值:
Figure GDA0004143799160000022
其中,NC为因果关系值,w是每种监测因素的系数,F对应了某一种监测因素,m是时间序列的滞后长度,N是时间序列的观测长度,n是检测因素的个数。
进一步地,在根据因果矩阵计算因果中心性特征值用于表征各个监测站的拓扑中心性中,根据下述公式计算因果中心值:
Figure GDA0004143799160000023
其中,Center表示因果中心值,l表示站点之间的拓扑特征路径长度,k是某一站点的拓扑中心度,i和j分别代表了两个不同的站点标记,L是所有相互连通的站点集合。
进一步地,预测模型采用支持向量机算法。
进一步地,预测模型的参数优化算法为梯度下降。
进一步地,监测因素包含气象因素。
进一步地,气象因素包含气温、压强、日照强度、相对湿度、地表温度、降雨、蒸发量和平均风速。
进一步地,监测因素包含工业污染物因素。
进一步地,工业污染物因素包含二氧化硫、二氧化氮、一氧化碳和臭氧。
本发明的有益之处在于所提供的基于因果中心性的雾霾分析识别方法,结合因果关系和复杂网络中心性分析方法,对气象数据和工业废气排放数据进行建模,充分利用地域间雾霾因果关联程度和方向性信息等特征,显著提高了雾霾气象识别和预测水平。
附图说明
图1是本发明的基于因果中心性的雾霾分析识别方法的示意图。
具体实施方式
以下结合附图和具体实施例对本发明作具体的介绍。
如图1所示为本发明的一种基于因果中心性的雾霾分析识别方法,具体包含以下步骤:S1:获取若干检测站点检测到的监测数据,监测数据包含多个监测因素和雾霾浓度的数据。S2:针对不同的监测因素分别构建区域内部数据关联模型。S3:针对不同的监测因素分别构建区域间数据关联模型。S4:根据构建的区域内部数据关联模型和区域间数据关联模型计算每个监测因素和雾霾浓度之间的因果关系值。S5:根据计算出的每个检测站点检测到的各监测因素与雾霾浓度之间的因果关系值构成因果矩阵。S6:根据因果矩阵计算因果中心性特征值用于表征各个检测站点的拓扑中心性。S7:将监测因素间的因果关系值和因果中心性特征值输入搭建好的预测模型对其进行训练得到一个训练完成的预测模型。上述的基于因果中心性的雾霾分析识别方法,结合因果关系和复杂网络中心性分析方法,对气象数据和工业废气排放数据进行建模,充分利用地域间雾霾因果关联程度和方向性信息等特征,显著提高了雾霾气象识别和预测水平。以下具体介绍上述步骤。
对于步骤S1:获取若干检测站点检测到的监测数据,监测数据包含多个监测因素和雾霾浓度的数据。
本发明分析的数据来源于中国国家气象数据中心和环保部网站。在本发明中,获取的数据涵盖了京津冀地区79个检测站点的监测数据。这些监测数据包含多个监测因素。在本发明中,多个监测因素主要为气象因素和工业污染物因素,其中,气象因素包含气温、压强、日照强度、相对湿度、地表温度、降雨、蒸发量和平均风速,工业污染物因素包含二氧化硫、二氧化氮、一氧化碳和臭氧。即,本发明的监测数据涉及79个检测站点的12个监测因素以及雾霾浓度的数据。
对于步骤S2:针对不同的监测因素分别构建区域内部数据关联模型。
对于步骤S3:针对不同的监测因素分别构建区域间数据关联模型。
本发明中,构建的区域内部数据关联模型和区域间数据关联模型的共同数学表达式如下述公式所示,即,在正常时间序列下(随日期变化),某一因素的现状被认为是由自身过去值的累计以及其他因素的共同作用而导致。
Figure GDA0004143799160000041
其中,w是每种监测因素的系数,F对应了某一种监测因素,m是时间序列的滞后长度,N是时间序列的观测长度,n是监测因素的个数,本发明中,n为12,t是时间,ηt是噪声项。
对于步骤S4:根据构建的区域内部数据关联模型和区域间数据关联模型计算每个监测因素和雾霾浓度之间的因果关系值。
在根据构建的区域内部数据关联模型和区域间数据关联模型计算每个监测因素和雾霾浓度之间的因果关系值中,根据下述公式计算每个监测因素和雾霾浓度之间的因果关系值:
Figure GDA0004143799160000042
其中,NC为因果关系值,w是每种监测因素的系数,F对应了某一种监测因素,m是时间序列的滞后长度,N是时间序列的观测长度,n是检测因素的个数。
在迭代过程中,不断求解NC最大值,来代表各因素与雾霾浓度之间的关系。允许NC值出现正负,代表因果方向。
对于步骤S5:根据计算出的每个检测站点检测到的各监测因素与雾霾浓度之间的因果关系值构成因果矩阵。
为79个检测站点计算各个监测因素与雾霾浓度之间的因果关系值,最终形成12x79x79大小因果矩阵。12是监测因素数量,79x79代表了各个检测站点之间各个因素的相互影响因果值。
对于步骤S6:根据因果矩阵计算因果中心性特征值用于表征各个检测站点的拓扑中心性。
对于这12个79x79大小矩阵,计算因果中心值,用以表征各个检测站点在地图上的拓扑中心性。根据下述公式计算因果中心值:
Figure GDA0004143799160000043
其中,Center表示因果中心值,l表示站点之间的拓扑特征路径长度,k是某一站点的拓扑中心度,i和j分别代表了两个不同的站点标记,L是所有相互连通的站点集合。
对于步骤S7:将监测因素间的因果关系值和因果中心性特征值输入搭建好的预测模型对其进行训练得到一个训练完成的预测模型。
在本发明中,预测模型采用支持向量机算法,模型采用批次大小为32,参数优化算法为梯度下降。当预测模型训练完成后,当将相关的数据输入到预测模型中后,能够进行雾霾天气的预测。
以上显示和描述了本发明的基本原理、主要特征和优点。本行业的技术人员应该了解,上述实施例不以任何形式限制本发明,凡采用等同替换或等效变换的方式所获得的技术方案,均落在本发明的保护范围内。

Claims (7)

1.一种基于因果中心性的雾霾分析识别方法,其特征在于,包含以下步骤:
获取若干检测站点检测到的监测数据,所述监测数据包含多个监测因素和雾霾浓度的数据;
针对不同的所述监测因素分别构建区域内部数据关联模型;
针对不同的所述监测因素分别构建区域间数据关联模型;
根据构建的所述区域内部数据关联模型和所述区域间数据关联模型计算每个所述监测因素和所述雾霾浓度之间的因果关系值;
根据计算出的每个检测站点检测到的各监测因素与所述雾霾浓度之间的因果关系值构成因果矩阵;
根据所述因果矩阵计算因果中心性特征值用于表征各个检测站点的拓扑中心性;
将所述监测因素间的所述因果关系值和所述因果中心性特征值输入搭建好的预测模型对其进行训练得到一个训练完成的所述预测模型;
构建的所述区域内部数据关联模型和所述区域间数据关联模型符合下述公式:
Figure FDA0004163555850000011
其中,w是每种监测因素的系数,F对应了某一种监测因素,m是时间序列的滞后长度,N是时间序列的观测长度,n是监测因素的个数,t是时间,ηt是噪声项;
在所述根据构建的所述区域内部数据关联模型和所述区域间数据关联模型计算每个所述监测因素和所述雾霾浓度之间的因果关系值中,根据下述公式计算每个所述监测因素和雾霾浓度之间的因果关系值:
Figure FDA0004163555850000012
其中,NC为因果关系值,w是每种监测因素的系数,F对应了某一种监测因素,m是时间序列的滞后长度,N是时间序列的观测长度,n是检测因素的个数;
在所述根据所述因果矩阵计算因果中心性特征值用于表征各个监测站的拓扑中心性中,根据下述公式计算因果中心值:
Figure FDA0004163555850000013
其中,Center表示因果中心值,l表示站点之间的拓扑特征路径长度,k是某一站点的拓扑中心度,i和j分别代表了两个不同的站点标记,L是所有相互连通的站点集合。
2.根据权利要求1所述的基于因果中心性的雾霾分析识别方法,其特征在于,
所述预测模型采用支持向量机算法。
3.根据权利要求2所述的基于因果中心性的雾霾分析识别方法,其特征在于,
所述预测模型的参数优化算法为梯度下降。
4.根据权利要求1所述的基于因果中心性的雾霾分析识别方法,其特征在于,
所述监测因素包含气象因素。
5.根据权利要求4所述的基于因果中心性的雾霾分析识别方法,其特征在于,
所述气象因素包含气温、压强、日照强度、相对湿度、地表温度、降雨、蒸发量和平均风速。
6.根据权利要求1所述的基于因果中心性的雾霾分析识别方法,其特征在于,
所述监测因素包含工业污染物因素。
7.根据权利要求6所述的基于因果中心性的雾霾分析识别方法,其特征在于,
所述工业污染物因素包含二氧化硫、二氧化氮、一氧化碳和臭氧。
CN202110251379.3A 2021-03-08 2021-03-08 基于因果中心性的雾霾分析识别方法 Active CN112966442B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110251379.3A CN112966442B (zh) 2021-03-08 2021-03-08 基于因果中心性的雾霾分析识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110251379.3A CN112966442B (zh) 2021-03-08 2021-03-08 基于因果中心性的雾霾分析识别方法

Publications (2)

Publication Number Publication Date
CN112966442A CN112966442A (zh) 2021-06-15
CN112966442B true CN112966442B (zh) 2023-05-23

Family

ID=76277039

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110251379.3A Active CN112966442B (zh) 2021-03-08 2021-03-08 基于因果中心性的雾霾分析识别方法

Country Status (1)

Country Link
CN (1) CN112966442B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103975807A (zh) * 2014-05-23 2014-08-13 杨宏协 一种气候感应调节仪器
CN109492830A (zh) * 2018-12-17 2019-03-19 杭州电子科技大学 一种基于时空深度学习的移动污染源排放浓度预测方法
CN109656974A (zh) * 2018-11-30 2019-04-19 叶竹梅 一种实现雾霾在线监测的大数据处理方法
CN110378520A (zh) * 2019-06-26 2019-10-25 浙江传媒学院 一种pm2.5浓度预测和预警方法
CN111367959A (zh) * 2020-02-17 2020-07-03 大连理工大学 一种零时滞非线性扩展Granger因果分析方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103975807A (zh) * 2014-05-23 2014-08-13 杨宏协 一种气候感应调节仪器
CN109656974A (zh) * 2018-11-30 2019-04-19 叶竹梅 一种实现雾霾在线监测的大数据处理方法
CN109492830A (zh) * 2018-12-17 2019-03-19 杭州电子科技大学 一种基于时空深度学习的移动污染源排放浓度预测方法
CN110378520A (zh) * 2019-06-26 2019-10-25 浙江传媒学院 一种pm2.5浓度预测和预警方法
CN111367959A (zh) * 2020-02-17 2020-07-03 大连理工大学 一种零时滞非线性扩展Granger因果分析方法

Also Published As

Publication number Publication date
CN112966442A (zh) 2021-06-15

Similar Documents

Publication Publication Date Title
Wang et al. Regional prediction of ground-level ozone using a hybrid sequence-to-sequence deep learning approach
US11938784B2 (en) Health protection system for passengers on a train in a polluted indoor environment and method thereof
CN106650825A (zh) 一种机动车尾气排放数据融合系统
CN112085163A (zh) 一种基于注意力增强图卷积神经网络agc和门控循环单元gru的空气质量预测方法
Ceylan et al. Forecasting PM10 levels using ANN and MLR: A case study for Sakarya City
Asghari et al. Predicting air pollution in Tehran: Genetic algorithm and back propagation neural network
CN111582580B (zh) 一种考虑人群污染物暴露的出行路径规划方法
CN111077048A (zh) 基于移动设备的机会式群体智能空气质量监测及评估方法
CN106526710A (zh) 一种雾霾预测方法及装置
Nadiri et al. Supervised intelligence committee machine to evaluate field performance of photocatalytic asphalt pavement for ambient air purification
CN108629450A (zh) 一种液化天然气公交车尾气排放预测方法
Baran Prediction of air quality index by extreme learning machines
Sonawani et al. NO2 pollutant concentration forecasting for air quality monitoring by using an optimised deep learning bidirectional GRU model
Perez et al. Forecasting of hourly PM2. 5 in south-west zone in Santiago de Chile
Mishra et al. Air quality analysis and smog detection in smart cities for safer transport using machine learning (ML) regression models
Zito et al. Predicting Real-Time Roadside CO and $\hbox {NO} _ {2} $ Concentrations Using Neural Networks
CN112966442B (zh) 基于因果中心性的雾霾分析识别方法
Kaur et al. Air pollution detection using modified traingular mutation based particle swarm optimization
Czech et al. Air pollution as a result of the development of motorization
Purnomo et al. Achieving sustainable environment through prediction of air pollutants in Yogyakarta using adaptive neuro fuzzy inference system
Hajek et al. Air quality indices and their modelling by hierarchical fuzzy inference systems
Ojeda-Magaña et al. Air pollution analysis with a pfcm clustering algorithm applied in a real database of salamanca (mexico)
Ozdemir et al. Prediction of tropospheric ozone concentration by employing artificial neural networks
Kosovac et al. Machine learning modeling for reducing greenhouse gas emissions in urban areas
Dunea et al. Comparing statistical and neural network approaches for urban air pollution time series analysis

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant