CN114004514A - 一种大气臭氧污染发生气象条件等级判别方法 - Google Patents
一种大气臭氧污染发生气象条件等级判别方法 Download PDFInfo
- Publication number
- CN114004514A CN114004514A CN202111301564.5A CN202111301564A CN114004514A CN 114004514 A CN114004514 A CN 114004514A CN 202111301564 A CN202111301564 A CN 202111301564A CN 114004514 A CN114004514 A CN 114004514A
- Authority
- CN
- China
- Prior art keywords
- ozone
- grade
- pollution
- ozone pollution
- samples
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- CBENFWSGALASAD-UHFFFAOYSA-N Ozone Chemical compound [O-][O+]=O CBENFWSGALASAD-UHFFFAOYSA-N 0.000 title claims abstract description 240
- 238000012850 discrimination method Methods 0.000 title description 2
- 238000012549 training Methods 0.000 claims abstract description 46
- 238000000034 method Methods 0.000 claims abstract description 41
- 238000012544 monitoring process Methods 0.000 claims abstract description 18
- 238000010606 normalization Methods 0.000 claims abstract description 12
- 238000012545 processing Methods 0.000 claims abstract description 11
- 238000001556 precipitation Methods 0.000 claims description 18
- 238000000605 extraction Methods 0.000 claims description 10
- 238000012216 screening Methods 0.000 claims description 10
- 239000002243 precursor Substances 0.000 claims description 8
- 230000002349 favourable effect Effects 0.000 claims description 5
- 238000007781 pre-processing Methods 0.000 claims description 5
- 238000005070 sampling Methods 0.000 claims description 4
- 229910052757 nitrogen Inorganic materials 0.000 claims description 3
- 238000007619 statistical method Methods 0.000 claims description 2
- 230000000694 effects Effects 0.000 abstract description 5
- 238000011156 evaluation Methods 0.000 abstract description 5
- 230000008859 change Effects 0.000 abstract description 4
- 238000005516 engineering process Methods 0.000 abstract description 2
- 238000005457 optimization Methods 0.000 description 9
- 238000013528 artificial neural network Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 210000004709 eyebrow Anatomy 0.000 description 5
- 241001122767 Theaceae Species 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 4
- 238000013480 data collection Methods 0.000 description 4
- 230000007613 environmental effect Effects 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- MWUXSHHQAYIFBG-UHFFFAOYSA-N nitrogen oxide Inorganic materials O=[N] MWUXSHHQAYIFBG-UHFFFAOYSA-N 0.000 description 3
- 230000005855 radiation Effects 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000009194 climbing Effects 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 239000003344 environmental pollutant Substances 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000006552 photochemical reaction Methods 0.000 description 2
- 231100000719 pollutant Toxicity 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 230000002265 prevention Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000013277 forecasting method Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000011478 gradient descent method Methods 0.000 description 1
- 229930195733 hydrocarbon Natural products 0.000 description 1
- 150000002430 hydrocarbons Chemical class 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 238000013179 statistical model Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01W—METEOROLOGY
- G01W1/00—Meteorology
- G01W1/10—Devices for predicting weather conditions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Economics (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Educational Administration (AREA)
- Development Economics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Entrepreneurship & Innovation (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Environmental & Geological Engineering (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Evolutionary Biology (AREA)
- Primary Health Care (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Atmospheric Sciences (AREA)
- Biodiversity & Conservation Biology (AREA)
- Ecology (AREA)
- Environmental Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
Abstract
本发明涉及大气污染监测技术,其公开了一种大气臭氧污染发生气象条件等级判别方法,有效反映气象条件变化对臭氧污染发生的影响,可用于历史臭氧污染发生气象条件评估以及未来臭氧污染发生气象条件预测,为评估大气臭氧污染防治效果及制定大气臭氧污染防治措施提供科学依据。该方案可概况为:1、确定影响大气臭氧污染发生的敏感物理参量作为模型输入参数;2、进行样本收集及预处理;3、将模型训练样本进行归一化处理4、分区域建立臭氧污染发生气象条件等级判别模型并训练;5、在实际应用中,将待判别目标区域内的敏感物理参量数据作为模型输入参数,基于训练好的判别模型,得到大气臭氧污染发生气象条件等级的判别结果。
Description
技术领域
本发明涉及大气污染监测技术,具体涉及一种大气臭氧污染发生气象条件等级判别方法。
背景技术
大气中的臭氧是一种二次污染物,主要由大气中的氮氧化物和碳氢化合物在特殊气象条件下经过一系列光化学反应生成。随着城市化、工业化进程的不断加快,机动车保有量逐年增加,臭氧前体物排放量不断增加,以臭氧污染为特征的大气光化学污染已经成为不可忽视的问题,特别是夏季,臭氧有逐渐取代PM2.5成为首要污染物的趋势,引起社会的广泛关注。
准确的臭氧污染预报有利于广大市民和社会各界合理安排生活、工作以及各种社会活动,有利于环境管理和决策部门及时发出警报并采取有效措施,来预防严重污染事件的发生。目前,比较流行的大气臭氧污染预报方法有以下几种:
1、根据经验和统计模型建立的臭氧浓度预报模型。主要是综合考虑多项臭氧污染发生高影响气象因子,建立臭氧浓度预报方程,这种方法计算较为简单方便,但是在理论和时效性方面无法满足需求。
2、利用环境气象数值预报模式提供部分臭氧污染预报功能。主要是根据气象要素的预报值和污染源的排放状况,利用数学模式以得到臭氧浓度的时空分布,但这种方法计算过程复杂,对计算机性能的要求较高,成本较大,且主要是对臭氧浓度进行预报。
3、基于机器学习法的近地面臭氧浓度预报方法。主要是依靠机器学习方法能有效地捕捉大气成分变化中隐藏的非线性特征的优势,通过特征变量构建模型,对大气成分进行预测。
可以看出,前期工作主要是对臭氧浓度进行预报,从而判定是否发生臭氧污染。实际上,大气臭氧污染的发生主要受气象条件和污染源排放等因素影响,短期内污染源一般较为稳定,气象条件是影响其发生的主要因素,但是,目前没有相关工作提供一种方法反映气象条件对大气臭氧污染发生的影响。
发明内容
本发明所要解决的技术问题是:提出一种大气臭氧污染发生气象条件等级判别方法,有效反映气象条件变化对臭氧污染发生的影响,可用于历史臭氧污染发生气象条件评估以及未来臭氧污染发生气象条件预测,为评估大气臭氧污染防治效果及制定大气臭氧污染防治措施提供科学依据。
本发明解决上述技术问题采用的技术方案是:
一种大气臭氧污染发生气象条件等级判别方法,包括以下步骤:
S1、确定影响大气臭氧污染发生的敏感物理参量作为模型输入参数;
S2、获取目标区域内一段时间内的臭氧浓度数据和影响大气臭氧污染发生的敏感物理参量历史数据,并进行预处理,构建训练样本;
S3、对训练样本进行归一化处理;
S4、分区域建立臭氧污染发生气象条件等级判别模型,利用归一化处理后的训练样本进行模型训练;
S5、以待判别目标区域内的敏感物理参量数据作为模型输入参数,基于训练好的臭氧污染发生气象条件等级判别模型,计算获得大气臭氧污染发生气象条件等级的判别结果。
作为进一步优化,步骤S1中,通过分析臭氧与气象因子和前体物的关系,获得影响大气臭氧污染发生的敏感物理参量作为模型输入参数,所述敏感物理参量包括:气温、前一小时降水量、相对湿度、混合层高度以及前一夜平均NO2质量浓度。
作为进一步优化,步骤S2中,获取臭氧浓度数据和影响大气臭氧污染发生的敏感物理参量历史数据的方法为:
通过气象数据来获取气温、前一小时降水量、相对湿度以及混合层高度数据;通过空气质量监测数据来获取臭氧质量浓度和前一夜平均NO2质量浓度数据。
作为进一步优化,所述臭氧质量浓度为城市内所有有效环境监测站的小时数据平均值,对应气象数据为距离有效环境监测站的中心最近位置的数据。
作为进一步优化,步骤S2中,所述预处理包括:
划分臭氧污染发生气象条件的等级,将臭氧质量浓度与臭氧污染发生气象条件等级建立关联;根据对历史数据的统计分析获得目标区域各等级的样本数,在获得多个目标区域的各等级的样本数后,根据各个目标区域的样本数量确定需要建模的数量,然后进行样本筛选。
作为进一步优化,所述划分臭氧污染发生气象条件的等级,将臭氧质量浓度与臭氧污染发生气象条件等级建立关联,具体包括:
将臭氧污染发生气象条件划分为3个等级,每个等级对应不同的小时臭氧质量浓度,小时臭氧质量浓度越低,等级越低;臭氧污染发生气象条件为1级时,表明气象条件非常不利于臭氧污染发生;臭氧污染发生气象条件为2级时,表明气象条件不利于臭氧污染发生;臭氧污染发生气象条件为3级时,表明气象条件有利于臭氧污染发生。
作为进一步优化,所述根据各个目标区域的样本数量确定需要建模的数量,具体包括:
根据目标区域的样本中包含臭氧污染发生气象条件等级高(比如:臭氧污染发生气象条件等级为3级)的样本的数量,将所有目标区域的城市类型划分为“易发生臭氧污染城市”和“其他城市”两类;其中,对于分类为“易发生臭氧污染城市”的城市,单独建一个模型,对分类为“其他城市”的城市,将污染特征相似且相互临近的城市的样本合并共建一个模型,若“其他城市”中某个城市与周边临近城市污染特征差距较大且样本量足够,也单独建一个模型;以此统计出需要建模的数量,以及每个模型对应的候选样本集。
作为进一步优化,所述进行样本筛选,具体包括:
在各个模型对应的候选样本集中,根据各等级臭氧浓度分布频率按比例进行随机抽样,获得各个模型对应的训练样本集:
若模型仅对应一个城市,则首先确定该模型对应的候选样本集中各个等级需要抽取的样本总数N,然后计算需要筛选样本的各等级不同臭氧浓度区间的样本频率Pi,i为各等级中臭氧浓度区间的个数,最后通过计算Pi与N的乘积获得各等级不同臭氧浓度区间需要抽取的样本数,进行随机抽取;
若模型对应多个城市,首先确定此多个城市的候选样本集中各个等级需要抽取的样本总数N,对于其中的每一个城市的样本筛选方式为:根据该城市的相应等级的样本数占此多个城市该等级的样本总数的比例w,计算获得相应等级需要抽取的样本总数w*N,然后计算需要筛选样本的各等级不同臭氧浓度区间的样本频率Pi,i为各等级中臭氧浓度区间的个数,最后通过计算Pi与w*N的乘积获得各等级不同臭氧浓度区间需要抽取的样本数,进行随机抽取。
作为进一步优化,步骤S4中,所述分区域建立的臭氧污染发生气象条件等级判别模型,包括输入层、隐含层和输出层,其中输入层的节点数为5个,输出层的节点数为3个,隐含层个数和节点数根据训练误差和判别准确率综合选择。
作为进一步优化,步骤S5中,所述待判别目标区域内的敏感物理参量数据为历史实况数据或者预报数据。
本发明的有益效果是:
(1)、从应用角度出发,本发明确定的五项物理参量对大气臭氧污染发生的影响不会随时间地点显著变化,且均为常规参量,获取方法比较普遍、简单;
(2)、根据大量历史数据分析获得目标区域臭氧污染特征,并据此分区域建立大气臭氧污染发生气象条件等级判别模型,理论性更强,准确性较好;
(3)、臭氧污染发生气象条件等级判别模型基于神经网络建立,能适应于臭氧污染发生与气温、降水、相对湿度、混合层高度等因素之间复杂的非线性关系,有效判别臭氧污染发生时的气象条件等级,且计算效率高,对计算机性能要求较低,成本低;
(4)通过对大气臭氧污染发生气象条件等级进行判别,能有效反映气象条件变化对臭氧污染发生的影响;在实际应用中,模型的输入数据可以包括历史实况数据或者预报数据,可以根据应用需求采用不同的输入数据,输入数据为历史实况数据时,判别结果可用于历史臭氧污染发生气象条件评估,输入数据为预报数据时,判别结果可用于未来臭氧污染发生气象条件预报。
附图说明
图1是本发明中的大气臭氧污染发生气象条件等级判别方法流程图;
图2为臭氧质量浓度日变化趋势图;
图3为臭氧质量浓度月变化趋势图。
具体实施方式
本发明旨在提出一种大气臭氧污染发生气象条件等级判别方法,有效反映气象条件变化对臭氧污染发生的影响,提供历史臭氧污染发生气象条件评估以及未来臭氧污染发生气象条件预测,为评估大气臭氧污染防治效果及制定大气臭氧污染防治措施提供科学依据。
其核心思想是:首先,通过分析臭氧与气象因子和前体物的关系,确定影响大气臭氧污染发生的敏感物理参量作为模型输入参数;然后,获取目标区域内一段时间内的臭氧浓度数据和影响大气臭氧污染发生的敏感物理参量历史数据,进行预处理,将臭氧质量浓度与臭氧污染发生气象条件等级建立联系,将臭氧污染发生气象条件划分为三个等级组成模型训练样本;接着,多维输入样本属于不同的量纲,且数量级相差较大时,将模型训练样本进行归一化处理;然后,分区域建立臭氧污染发生气象条件等级判别模型并训练;最后,在实际应用中,将待判别目标区域内的敏感物理参量数据作为模型输入参数,基于训练好的判别模型,得到大气臭氧污染发生气象条件等级的判别结果。
本发明方案的具体实现过程如图1所示,其包括以下步骤:
1、确定模型输入物理量参数:
通过分析臭氧与气象因子和前体物的关系,获得影响大气臭氧污染发生的敏感物理参量作为模型输入参数,所述物理参量包括气温、前一小时降水量、相对湿度、混合层高度、前一夜平均NO2质量浓度(夜间对应的具体时段根据本地日臭氧污染发生时段确定,不同地区会有差异)。
2、样本数据收集及预处理:
(1)样本数据收集:
包括历史空气质量监测数据和气象实况数据;其中,所述气温、降水、相对湿度、混合层高度来自于气象数据,所述臭氧质量浓度和NO2质量浓度数据来自于空气质量监测数据。
(2)臭氧污染发生气象条件等级划分:
根据中国环境保护部发布的《环境空气质量指数(AQI)技术规定(试行)》(HJ 633-2012),将小时臭氧质量浓度与臭氧污染发生气象条件等级建立联系,臭氧污染发生气象条件划分为3个等级,如表1所示:
表1:小时臭氧质量浓度与臭氧污染发生气象条件等级关系示意
从表1可以看出:
小时臭氧质量浓度为0~160μg/m3时,空气质量为优(一级),对应臭氧污染发生气象条件等级定义为1级,表明气象条件非常不利于臭氧污染发生;
小时臭氧质量浓度为160~200μg/m3时,空气质量为良(二级),对应臭氧污染发生气象条件等级定义为2级,表明气象条件不利于臭氧污染发生;
小时臭氧质量浓度大于200μg/m3时,发生臭氧污染(轻度污染及以上),对应臭氧污染发生气象条件等级定义为3级,表明气象条件有利于臭氧污染发生。
(3)小时臭氧浓度数据和气象要素时空匹配:
臭氧污染发生与太阳辐射关系密切,样本数据选择时段为主要臭氧污染时段,根据目标区域的历史臭氧污染月均值分布和日均值分布特征确定;由于每个城市的环境监测站较少,且主要集中在城区,因此,以一个城市为研究对象,即小时臭氧浓度为城市内所有有效环境监测站的小时数据平均值,对应气象要素为距离有效环境监测站的中心最近位置的数据(如最近的格点数据或站点数据)。
(4)区域划分:
受地形地貌、气候条件及前体物分布等影响,不同区域臭氧污染特征有差异,发生的气象条件也不同,分区域建立臭氧污染发生气象条件等级判别模型更符合理论实际。综合考虑城市地理位置和样本数分区域建立判别模型,分区方法为:根据大量历史数据分析获得目标区域三个等级的样本数,根据三级样本数分为易发生臭氧污染城市和其他城市,其中,易发生臭氧污染的城市单独建一个模型,其他城市中污染特征相似且相互临近的城市合并建一个模型,若某个城市与周边临近城市污染特征差距较大且样本量足够,也可单独建一个模型。以此统计出需要建模的数量,以及每个模型对应的候选样本集。
(5)样本筛选:
训练模型时,三个等级样本数量要基本保持一致,需要对样本数较多的等级进行随机筛选提取,提取数量以样本数最少的等级为准,但不低于30个,否则继续以样本数更多的等级为准,当只有一个等级满足条件时,直接取100。
为了保证模型训练样本符合实际分布规律,根据各等级臭氧浓度分布频率(即每个等级中不同的浓度区间的样本数占对应等级中所有样本数的比例)按比例进行随机抽样,具体提取方法为:
1)若模型仅对应一个城市,则首先确定该模型对应的候选样本集中各个等级需要抽取的样本总数N,然后计算需要筛选样本的各等级不同臭氧浓度区间的样本频率Pi,i为各等级中臭氧浓度区间的个数,最后通过计算Pi与N的乘积获得各等级不同臭氧浓度区间需要抽取的样本数,进行随机抽取;
例如:对于仅对应一个城市的某个模型,各个等级需要抽取50个样本,即N=50,对于臭氧污染发生气象条件的等级为1级对应的小时臭氧浓度为0~160μg/m3,以10μg/m3作为区间划分范围,则其一共存在16个浓度区间,分别为:C1=0~10μg/m3、C2=10~20μg/m3、 C3=20~30μg/m3…C16=150~160μg/m3。
假设该城市的候选样本集中,1级样本有4501个,其中臭氧浓度区间为0~10μg/m3的样本有45个,占比1%,即P1=1%,臭氧浓度区间为10~20μg/m3的样本有135个,占比3%,即P2=3%,臭氧浓度区间为20~30μg/m3的样本有248个,占比5.5%,即P3=5.5%...臭氧浓度区间为150~160μg/m3的样本有171个,占比3.8%,即P16=5.5%
则可以通过计算得出:
需要在臭氧浓度区间为0~10μg/m3的45个样本中抽取50*1%=0.5个,采用四舍五入的方式,最终确定需要抽取1个样本;
需要在臭氧浓度区间为10~20μg/m3的135个样本中抽取50*3%=1.5个,采用四舍五入的方式,最终确定需要抽取2个样本;
需要在臭氧浓度区间为20~30μg/m3的248个样本中抽取50*5.5%=2.75个,采用四舍五入的方式,最终确定需要抽取3个;
…需要在臭氧浓度区间为150~160μg/m3的171个样本中抽取50*3.8%=1.9个,采用四舍五入的方式,最终确定需要抽取2个样本。
需要注意的是,由于采用了四舍五入的方式对各个浓度区间计算出来的抽取个数进行了处理,还需要对少数区间的抽取的样本个数进行微调,使得最终在1级所有浓度区间抽取的样本总数为50个。
2)若模型对应多个城市,首先确定此多个城市的候选样本集中各个等级需要抽取的样本总数N,对于其中的每一个城市的样本筛选方式为:根据该城市的相应等级的样本数占此多个城市该等级的样本总数的比例w,计算获得相应等级需要抽取的样本总数w*N,然后计算需要筛选样本的各等级不同臭氧浓度区间的样本频率Pi,最后通过计算Pi与w*N的乘积获得各等级不同臭氧浓度区间需要抽取的样本数,进行随机抽取。
3、模型输入数据归一化处理:
多维输入样本属于不同的量纲,且数量级相差较大时,必须将各输入参数进行归一化处理,避免由于数量级的差异影响网络识别精度,采用最大最小值标准化方法将输入参数归一化到0~1之间。
4、建立臭氧污染发生气象条件等级判别模型:
分区域建立的臭氧污染发生气象条件等级判别模型,包括输入层、隐含层和输出层:
输入层输入模型训练样本,输入物理参量为气温、前一小时降水量、相对湿度、混合层高度、前一夜平均NO2质量浓度等五项,故输入层节点数为5。
输出层为3个臭氧污染发生气象条件等级特征量,分别为1、2、3,故输出层节点数为3。
隐含层个数及节点数的选择也很重要,节点数太少容易导致训练结果差,节点数太多易导致训练时间长,利用训练误差和判别准确率选择合适的隐含层节点数。训练误差是指网络训练结果与期待结果数值的均方差。网络训练结果与期待结果一致时为正确,不一致时为错误,判别准确率是指正确样本数占总样本数的百分比。
通过选择合适的传递函数、学习训练函数、训练次数、目标误差、目标误差衡量指标,经过信号正向传播与误差反向传播,权值和阈值的调整反复进行,一直进行到预先设定的学习训练次数,或输出误差减小到允许的程度,最终得到需要的判别模型。
5、获得臭氧污染发生气象条件等级判别结果:
将目标区域内对大气臭氧污染发生影响显著的敏感物理参量的历史实况数据或者预报数据作为模型输入参数,得到大气臭氧污染发生气象条件等级的判别结果,可以根据应用需求选择单站数据或者网格化数据。历史实况数据的判别结果可用于历史臭氧污染发生气象条件评估,预报数据的判别结果可用于未来臭氧污染发生气象条件预报。
实施例:
本实施例选择四川省作为实例研究区域,对技术方案进行详细说明,具体步骤如下:
1、确定模型输入物理量参数:
通过分析目标区域内的省会城市成都市的臭氧与气象因子和前体物的关系,获得影响大气臭氧污染发生的敏感物理参量作为模型输入参数,所述物理参量包括气温、前一小时降水量、相对湿度、混合层高度、前一夜NO2质量浓度;根据目标区域的历史臭氧污染日均值分布特征(如图2所示),夜间时段选择22时至次日08时(北京时,下同),数据波动较小。
表2为气温、相对湿度、混合层高度、前一夜NO2质量浓度与臭氧质量浓度的相关系数,均在0.5以上;表3为小时最大降水量对臭氧的清除效率,降水对臭氧起正清除作用,且在不同等级的清除率均较大且相差不大,主要是因为降水发生时,云量一般较多,云层会吸收太阳辐射,不利于光化学反应发生。
表2:各物理参量与臭氧的相关系数
物理参量 | 气温 | 相对湿度 | 混合层高度 | 前一夜NO<sub>2</sub>浓度 |
相关系数 | 0.73 | -0.79 | 0.51 | 0.52 |
表3:小时最大降水量对臭氧的清除效率
小时最大降水量/mm | 0.1~0.9 | 1.0~4.9 | 5.0~9.9 | ≥10.0 |
平均清除率/% | 25.42 | 24.46 | 23.00 | 34.60 |
从表2和表3可以看出,本发明中选取的气温、前一小时降水量、相对湿度、混合层高度、前一夜NO2质量浓度这五项参数均是对大气臭氧污染发生影响显著的物理参量。
2、样本数据收集及预处理:
(1)样本数据收集:
包括2018-2020年的历史空气质量监测数据和全国智能网格实况融合分析产品(CLDAS),所述气温、降水、相对湿度、混合层高度来自于CLDAS数据,所述臭氧质量浓度、NO2质量浓度数据来自于空气质量监测数据。
(2)臭氧污染发生气象条件等级划分:
本实施例中对臭氧污染发生气象条件等级的划分按照表1中的方式分为3个等级。
(3)小时臭氧浓度数据和气象要素时空匹配:
臭氧污染发生与太阳辐射关系密切,样本数据选择时段为主要臭氧污染时段,根据目标区域的历史臭氧污染日均值分布(如图2所示)和月均值分布(如图3所示)特征,主要臭氧污染时段为每年4-9月的每日09-21时;由于每个城市的环境监测站较少,且主要集中在城区,因此,以一个城市为研究对象,即小时臭氧浓度为城市内所有有效环境监测站的小时数据平均值,对应气象要素为距离有效环境监测站的中心最近的格点数据。
(4)区域划分:
受地形地貌、气候条件及前体物分布等影响,不同区域臭氧污染特征有差异,发生的气象条件也不同,分区域建立臭氧污染发生气象条件等级判别模型更符合理论实际。综合考虑城市地理位置和样本数分区域建立判别模型,分区方法为:根据大量历史数据分析获得目标区域三个等级的样本数(见表4),根据三级样本数分为易发生臭氧污染城市(成都、德阳、眉山、自贡)和其他城市,其中,易发生臭氧污染的城市单独建一个模型(成都、德阳、眉山、自贡),其他城市中污染特征相似且相互临近的城市合并建一个模型,若某个城市与周边临近城市污染特征差距较大且样本量足够,也单独建一个模型(如绵阳),最终确定的12个模型及各级样本数如表5所示。
表4:2018-2020年4-9月09-21时四川省21市州各等级样本数
城市 | 1级 | 2级 | 3级 |
成都 | 4501 | 415 | 266 |
绵阳 | 4887 | 261 | 33 |
宜宾 | 4802 | 298 | 91 |
攀枝花 | 4898 | 88 | 16 |
泸州 | 4793 | 308 | 87 |
自贡 | 4649 | 347 | 169 |
德阳 | 4695 | 357 | 130 |
南充 | 5056 | 123 | 10 |
广元 | 5132 | 44 | 3 |
遂宁 | 4946 | 213 | 28 |
内江 | 4871 | 248 | 59 |
乐山 | 4959 | 170 | 54 |
眉山 | 4610 | 441 | 127 |
广安 | 4922 | 244 | 20 |
达州 | 4985 | 178 | 26 |
雅安 | 5003 | 152 | 26 |
巴中 | 4307 | 25 | 0 |
资阳 | 4837 | 309 | 36 |
阿坝州 | 5135 | 0 | 0 |
甘孜州 | 5126 | 13 | 0 |
凉山州 | 4885 | 110 | 14 |
表5:模型编号、包含城市及各等级统计样本数
模型编号 | 城市 | 1级 | 2级 | 3级 |
1 | 成都 | 4501 | 415 | 266 |
2 | 绵阳 | 4887 | 261 | 33 |
3 | 德阳 | 4695 | 357 | 130 |
4 | 自贡 | 4649 | 347 | 169 |
5 | 眉山 | 4610 | 441 | 127 |
6 | 南充、达州、广安 | 14963 | 545 | 56 |
7 | 遂宁、资阳、内江 | 14654 | 770 | 123 |
8 | 宜宾、泸州 | 9595 | 606 | 178 |
9 | 雅安、乐山 | 9962 | 322 | 80 |
10 | 凉山州、攀枝花 | 9783 | 198 | 30 |
11 | 广元、巴中 | 9439 | 69 | 3 |
12 | 阿坝州、甘孜州 | 10261 | 13 | 0 |
(5)样本筛选:
训练模型时,三个等级样本数量要基本保持一致,需要对样本数较多的等级进行随机筛选提取,提取数量以样本数最少的等级为准,但不低于30个,否则继续以样本数更多的等级为准,当只有一个等级满足条件时,直接取100。
为了保证模型训练样本符合实际分布规律,根据各等级臭氧浓度分布频率按比例进行随机抽样,具体提取方法为:
1)若模型仅对应一个城市,则首先确定该模型对应的候选样本集中各个等级需要抽取的样本总数N,然后计算需要筛选样本的各等级不同臭氧浓度区间的样本频率Pi,i为各等级中臭氧浓度区间的个数,最后通过计算Pi与N的乘积获得各等级不同臭氧浓度区间需要抽取的样本数,进行随机抽取;
2)若模型对应多个城市,首先确定此多个城市的候选样本集中各个等级需要抽取的样本总数N,对于其中的每一个城市的样本筛选方式为:根据该城市的相应等级的样本数占此多个城市该等级的样本总数的比例w,计算获得相应等级需要抽取的样本总数w*N,然后计算需要筛选样本的各等级不同臭氧浓度区间的样本频率Pi,最后通过计算Pi与w*N的乘积获得各等级不同臭氧浓度区间需要抽取的样本数,进行随机抽取。
3、模型输入数据归一化处理:
多维输入样本属于不同的量纲,且数量级相差较大时,必须将各输入参数进行归一化处理,避免由于数量级的差异影响网络识别精度,采用最大最小值标准化方法将输入参数归一化到0~1之间,公式为:
式中X为原始数据,Xmax,Xmin分别为原始数据的最大值和最小值。
4、建立臭氧污染发生气象条件等级判别模型:
本实施例基于BP(BackPropagation)神经网络分区域建立臭氧污染发生气象条件等级判别模型,包括一个输入层、两个隐含层和一个输出层:
输入层输入模型训练样本,输入物理参量为气温、前一小时降水量、相对湿度、混合层高度、前一夜平均NO2质量浓度等五项,故输入层节点数为5。
输出层为3个臭氧污染发生气象条件等级特征量,分别为1、2、3,故输出层节点数为3。
隐含层节点数的选择也很重要,节点数太少容易导致训练结果差,节点数太多易导致训练时间长,利用训练误差和判别准确率选择合适的隐含层节点数。训练误差是指网络训练结果与期待结果数值的均方差。网络训练结果与期待结果一致时为正确,不一致时为错误,判别准确率是指正确样本数占总样本数的百分比。
在本实例中,随着隐含层节点数的增加,训练误差在减小,但隐含层节点数过多时,网络训练结果会过度吻合,因此,从节省计算资源和达到理想的判别能力出发,第一层隐含层节点数设置在[7,9]之间比较合适,第二层隐含层节点数比第一层多1~2即可。
模型训练采用的传递函数为对数S型传递函数(logsig)、学习训练函数为有动量和自适应学习速率的梯度下降法(traingdx),训练次数为10000,目标误差衡量指标为均方差(MSE),目标误差根据具体要求进行选择。在其他的实例中,这些参数可以根据具体情况进行调整。经过信号正向传播与误差反向传播,权值和阈值的调整反复进行,一直进行到预先设定的学习训练次数,或输出误差减小到允许的程度,最终得到需要的判别模型。
5、获得臭氧污染发生气象条件等级判别结果:
将目标区域内2021年4月1日至8月16日的气温、前一小时降水量、相对湿度、混合层高度、前一夜NO2质量浓度等物理参量的历史实况数据作为模型输入参数,得到四川省大气臭氧污染发生气象条件等级判别结果。
为了验证模型的有效性,我们对各个城市的臭氧污染发生气象条件等级判别准确率进行统计,如表6所示:
表6:2021年4月1日至8月16日四川省大气臭氧污染发生气象条件等级判别准确率
城市 | 判别准确率(%) | 城市 | 判别准确率(%) |
成都 | 67.66 | 乐山 | 65.05 |
绵阳 | 79.10 | 眉山 | 73.15 |
宜宾 | 78.22 | 广安 | 85.68 |
攀枝花 | 72.99 | 达州 | 87.34 |
泸州 | 75.11 | 雅安 | 67.53 |
自贡 | 73.26 | 巴中 | 90.17 |
德阳 | 59.43 | 资阳 | 68.55 |
南充 | 86.52 | 阿坝州 | 93.24 |
广元 | 84.90 | 甘孜州 | 95.62 |
遂宁 | 72.65 | 凉山州 | 62.87 |
内江 | 74.97 | — | —— |
从表6可以看出,所有城市的判别准确率均在50%以上,15个城市的判别准确率在70%以上。因此,本发明建立的臭氧污染发生气象条件等级判别模型具有较为准确的识别判断能力,有望成为大气臭氧污染防治的一个新的评估、预报方法。
需要说明的是,本实施例中的建模采用BP神经网络,实际操作中,也可以采用其他机器学习方法替代BP神经网络,比如:随机森林、长短时记忆神经网络(LSTM)、GRU(GatedRecurrent)神经网络等。此外,对于区域划分方式、样本处理方式、模型输入物理量个数、臭氧污染发生气象条件等级的个数等也可以根据实际需求进行相应调整。因此,本申请请求保护的方案包含但不仅限于上述实施例,对于本领域技术普通技术人员来说,在不脱离本发明原理的情况下,还可以在上述实施例的基础上作出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。
Claims (10)
1.一种大气臭氧污染发生气象条件等级判别方法,其特征在于,包括以下步骤:
S1、确定影响大气臭氧污染发生的敏感物理参量作为模型输入参数;
S2、获取目标区域内一段时间内的臭氧浓度数据和影响大气臭氧污染发生的敏感物理参量历史数据,并进行预处理,构建训练样本;
S3、对训练样本进行归一化处理;
S4、分区域建立臭氧污染发生气象条件等级判别模型,利用归一化处理后的训练样本进行模型训练;
S5、以待判别目标区域内的敏感物理参量数据作为模型输入参数,基于训练好的臭氧污染发生气象条件等级判别模型,计算获得大气臭氧污染发生气象条件等级的判别结果。
2.如权利要求1所述的大气臭氧污染发生气象条件等级判别方法,其特征在于,
步骤S1中,通过分析臭氧与气象因子和前体物的关系,获得影响大气臭氧污染发生的敏感物理参量作为模型输入参数,所述敏感物理参量包括:气温、前一小时降水量、相对湿度、混合层高度以及前一夜平均NO2质量浓度。
3.如权利要求2所述的大气臭氧污染发生气象条件等级判别方法,其特征在于,
步骤S2中,获取臭氧浓度数据和影响大气臭氧污染发生的敏感物理参量历史数据的方法为:通过气象数据来获取气温、前一小时降水量、相对湿度以及混合层高度数据;通过空气质量监测数据来获取臭氧质量浓度和前一夜平均NO2质量浓度数据。
4.如权利要求3所述的大气臭氧污染发生气象条件等级判别方法,其特征在于,
所述臭氧质量浓度为城市内所有有效环境监测站的小时数据平均值,对应气象数据为距离有效环境监测站的中心最近位置的数据。
5.如权利要求1所述的大气臭氧污染发生气象条件等级判别方法,其特征在于,
步骤S2中,所述预处理包括:
划分臭氧污染发生气象条件的等级,将臭氧质量浓度与臭氧污染发生气象条件等级建立关联;根据对历史数据的统计分析获得目标区域各等级的样本数,在获得多个目标区域的各等级的样本数后,根据各个目标区域的样本数量确定需要建模的数量,然后进行样本筛选。
6.如权利要求5所述的大气臭氧污染发生气象条件等级判别方法,其特征在于,
所述划分臭氧污染发生气象条件的等级,将臭氧质量浓度与臭氧污染发生气象条件等级建立关联,具体包括:
将臭氧污染发生气象条件划分为3个等级,每个等级对应不同的小时臭氧质量浓度,小时臭氧质量浓度越低,等级越低;臭氧污染发生气象条件为1级时,表明气象条件非常不利于臭氧污染发生;臭氧污染发生气象条件为2级时,表明气象条件不利于臭氧污染发生;臭氧污染发生气象条件为3级时,表明气象条件有利于臭氧污染发生。
7.如权利要求5所述的大气臭氧污染发生气象条件等级判别方法,其特征在于,
所述根据各个目标区域的样本数量确定需要建模的数量,具体包括:
根据目标区域的样本中包含臭氧污染发生气象条件等级高的样本的数量,将所有目标区域的城市类型划分为“易发生臭氧污染城市”和“其他城市”两类;其中,对于分类为“易发生臭氧污染城市”的城市,单独建一个模型,对分类为“其他城市”的城市,将污染特征相似且相互临近的城市的样本合并共建一个模型,若“其他城市”中某个城市与周边临近城市污染特征差距较大且样本量足够,也单独建一个模型;以此统计出需要建模的数量,以及每个模型对应的候选样本集。
8.如权利要求5所述的大气臭氧污染发生气象条件等级判别方法,其特征在于,
所述进行样本筛选,具体包括:
在各个模型对应的候选样本集中,根据各等级臭氧浓度分布频率按比例进行随机抽样,获得各个模型对应的训练样本集:
若模型仅对应一个城市,则首先确定该模型对应的候选样本集中各个等级需要抽取的样本总数N,然后计算需要筛选样本的各等级不同臭氧浓度区间的样本频率Pi,i为各等级中臭氧浓度区间的个数,最后通过计算Pi与N的乘积获得各等级不同臭氧浓度区间需要抽取的样本数,进行随机抽取;
若模型对应多个城市,首先确定此多个城市的候选样本集中各个等级需要抽取的样本总数N,对于其中的每一个城市的样本筛选方式为:根据该城市的相应等级的样本数占此多个城市该等级的样本总数的比例w,计算获得相应等级需要抽取的样本总数w*N,然后计算需要筛选样本的各等级不同臭氧浓度区间的样本频率Pi,最后通过计算Pi与w*N的乘积获得各等级不同臭氧浓度区间需要抽取的样本数,进行随机抽取。
9.如权利要求1所述的大气臭氧污染发生气象条件等级判别方法,其特征在于,
步骤S4中,所述分区域建立的臭氧污染发生气象条件等级判别模型,包括输入层、隐含层和输出层,其中输入层的节点数为5个,输出层的节点数为3个,隐含层个数和节点数根据训练误差和判别准确率综合选择。
10.如权利要求1-9任意一项所述的大气臭氧污染发生气象条件等级判别方法,其特征在于,步骤S5中,所述待判别目标区域内的敏感物理参量数据为历史实况数据或者预报数据。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111301564.5A CN114004514A (zh) | 2021-11-04 | 2021-11-04 | 一种大气臭氧污染发生气象条件等级判别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111301564.5A CN114004514A (zh) | 2021-11-04 | 2021-11-04 | 一种大气臭氧污染发生气象条件等级判别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114004514A true CN114004514A (zh) | 2022-02-01 |
Family
ID=79927500
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111301564.5A Pending CN114004514A (zh) | 2021-11-04 | 2021-11-04 | 一种大气臭氧污染发生气象条件等级判别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114004514A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116504327A (zh) * | 2022-09-26 | 2023-07-28 | 中国疾病预防控制中心环境与健康相关产品安全所 | 近地面o3人群暴露的时空精细化分析评估方法及系统 |
CN116630447A (zh) * | 2023-07-24 | 2023-08-22 | 成都海风锐智科技有限责任公司 | 一种基于图像处理的天气预测方法 |
-
2021
- 2021-11-04 CN CN202111301564.5A patent/CN114004514A/zh active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116504327A (zh) * | 2022-09-26 | 2023-07-28 | 中国疾病预防控制中心环境与健康相关产品安全所 | 近地面o3人群暴露的时空精细化分析评估方法及系统 |
CN116504327B (zh) * | 2022-09-26 | 2024-01-30 | 中国疾病预防控制中心环境与健康相关产品安全所 | 近地面o3人群暴露的时空精细化分析评估方法及系统 |
CN116630447A (zh) * | 2023-07-24 | 2023-08-22 | 成都海风锐智科技有限责任公司 | 一种基于图像处理的天气预测方法 |
CN116630447B (zh) * | 2023-07-24 | 2023-10-20 | 成都海风锐智科技有限责任公司 | 一种基于图像处理的天气预测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107610469B (zh) | 一种考虑多因素影响的日维度区域交通指数预测方法 | |
CN110363347B (zh) | 基于决策树索引的神经网络预测空气质量的方法 | |
CN113496311A (zh) | 光伏电站发电功率预测方法及系统 | |
CN105260803A (zh) | 一种系统用电量预测方法 | |
CN110222882A (zh) | 一种电力系统中长期负荷的预测方法和装置 | |
CN114004514A (zh) | 一种大气臭氧污染发生气象条件等级判别方法 | |
CN104680261A (zh) | 基于重点大客户负荷曲线聚类的电力负荷运行控制方法 | |
CN112182951B (zh) | 一种考虑多重不确定性的土地利用规划方法 | |
CN113554466A (zh) | 一种短期用电量预测模型构建方法、预测方法和装置 | |
CN114429053B (zh) | 流域尺度wefe系统适配性模拟优化方法 | |
CN114819374B (zh) | 区域新能源超短期功率预测方法及系统 | |
CN117236199B (zh) | 城市水网区域河湖水质提升与水安全保障方法及系统 | |
CN115759488A (zh) | 一种基于边缘计算的碳排放监测预警分析系统及其方法 | |
CN113159102B (zh) | 一种多时间尺度的光伏功率预测方法及系统 | |
CN115034485A (zh) | 一种基于数据空间的风电功率区间预测方法及装置 | |
CN115907822A (zh) | 一种考虑区域及经济影响的负荷特征指标关联性挖掘方法 | |
CN114723142A (zh) | 一种基于非支配排序遗传算法和flus模型的多目标土地利用模拟系统与方法 | |
CN114037138A (zh) | 基于双层分解和深度学习的地铁短时进站客流预测系统及实施方法 | |
CN112633565A (zh) | 一种光伏功率集合区间预测方法 | |
Qu et al. | Research on short‐term output power forecast model of wind farm based on neural network combination algorithm | |
CN110135652B (zh) | 一种长期汛期径流预测方法 | |
CN118070010A (zh) | 一种基于生成对抗网络的可再生能源场景生成方法 | |
CN110019167B (zh) | 一种中长期新能源资源资料库构建方法及系统 | |
CN117634678A (zh) | 基于实际运行场景的低碳园区碳排放预测方法 | |
CN114676931B (zh) | 一种基于数据中台技术的电量预测系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |