CN115659195B - 一种大气污染在线识别方法 - Google Patents
一种大气污染在线识别方法 Download PDFInfo
- Publication number
- CN115659195B CN115659195B CN202211454170.8A CN202211454170A CN115659195B CN 115659195 B CN115659195 B CN 115659195B CN 202211454170 A CN202211454170 A CN 202211454170A CN 115659195 B CN115659195 B CN 115659195B
- Authority
- CN
- China
- Prior art keywords
- clustering
- air quality
- information
- cluster
- pollution
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 43
- 230000000694 effects Effects 0.000 claims abstract description 125
- 238000013441 quality evaluation Methods 0.000 claims abstract description 96
- 230000007613 environmental effect Effects 0.000 claims abstract description 44
- 230000008859 change Effects 0.000 claims abstract description 27
- 238000009826 distribution Methods 0.000 claims abstract description 26
- 238000003915 air pollution Methods 0.000 claims abstract description 21
- 230000008569 process Effects 0.000 claims abstract description 15
- 238000011156 evaluation Methods 0.000 claims description 118
- RAHZWNYVWXNFOC-UHFFFAOYSA-N Sulphur dioxide Chemical compound O=S=O RAHZWNYVWXNFOC-UHFFFAOYSA-N 0.000 claims description 34
- CURLTUGMZLYLDI-UHFFFAOYSA-N Carbon dioxide Chemical compound O=C=O CURLTUGMZLYLDI-UHFFFAOYSA-N 0.000 claims description 30
- MWUXSHHQAYIFBG-UHFFFAOYSA-N Nitric oxide Chemical compound O=[N] MWUXSHHQAYIFBG-UHFFFAOYSA-N 0.000 claims description 30
- 238000001303 quality assessment method Methods 0.000 claims description 23
- UGFAIRIUMAVXCW-UHFFFAOYSA-N Carbon monoxide Chemical compound [O+]#[C-] UGFAIRIUMAVXCW-UHFFFAOYSA-N 0.000 claims description 16
- 229910002091 carbon monoxide Inorganic materials 0.000 claims description 16
- 239000001569 carbon dioxide Substances 0.000 claims description 15
- 229910002092 carbon dioxide Inorganic materials 0.000 claims description 15
- 238000006116 polymerization reaction Methods 0.000 claims description 8
- 230000002776 aggregation Effects 0.000 claims description 7
- 238000004220 aggregation Methods 0.000 claims description 7
- 238000011109 contamination Methods 0.000 claims description 7
- 239000006185 dispersion Substances 0.000 claims description 7
- 238000012937 correction Methods 0.000 claims description 6
- 238000007405 data analysis Methods 0.000 abstract description 2
- 235000010269 sulphur dioxide Nutrition 0.000 description 16
- 239000000356 contaminant Substances 0.000 description 6
- 238000012549 training Methods 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 239000004291 sulphur dioxide Substances 0.000 description 3
- 238000004088 simulation Methods 0.000 description 2
- 241000202755 Areca Species 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000001154 acute effect Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000001684 chronic effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 239000000539 dimer Substances 0.000 description 1
- 239000003344 environmental pollutant Substances 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 231100000719 pollutant Toxicity 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000004062 sedimentation Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
Images
Landscapes
- Sampling And Sample Adjustment (AREA)
Abstract
本发明涉及数据识别技术领域,具体涉及一种大气污染在线识别方法。方法包括:通过对获取的污染信息、环境信息和空气质量评价的分析,采用自适应聚类半径的聚类算法,同时考虑簇内样本分布、簇间分布和污染信息与空气质量评价的变化相似性,从多个聚类原则对聚类过程进行调整。根据最终聚类效果获取环境信息对空气质量评价的影响程度,对待识别采集点直接获取的信息进行调整,获得最终获取空气质量评价,进而对实时空气情况数据进行分析,得到准确的、真实的大气污染在线识别效果。本发明通过准确地获取环境信息对空气质量评价的影响程度,进而获得最终获取空气质量评价,提高对实时空气情况数据分析的精确,能够得到准确的大气污染在线识别效果。
Description
技术领域
本发明涉及数据识别技术领域,具体涉及一种大气污染在线识别方法。
背景技术
大气污染是由于人类活动或自然过程引起某些物质进入大气中,呈现出足够的浓度,达到足够的时间,并因此危害了自然环境、人体舒适和人体健康的现象。大气污染物由人为源或者天然源进入大气,并参与大气的循环过程。大气污染物在大气中滞留一段时间之后,又通过大气中的化学反应、生物活动和物理沉降从大气中去除。如果输出大气污染物的速率小于输入大气污染物的速率,大气污染物就会在大气环境中相对集聚,造成大气中某种大气污染物的浓度升高。当大气污染物浓度升高到一定程度时,就会直接或间接地对人、生物或材料等造成急性、慢性危害。
现有技术中,检测大气污染的方法大多仅为使用空气质量检测传感器获取空气中各项指标的成分,需要海量的大气污染数据和地理数据,建立复杂的仿真模型,对数据的离散值和缺失值较为敏感,通过仿真模型识别出异常数据。但是大气中各种各项指标在不同区域以及不同高度位置的传感器获取的数据也是不一定的,即不同环境信息和不同传感器信息对所获取的空气质量评价不同,因此直接根据采集到的数据对最终空气质量评价进行识别会受到环境信息的影响,导致最终识别结果不准确。
发明内容
为了解决上述技术问题,本发明的目的在于提供一种大气污染在线识别方法,所采用的技术方案具体如下:
本发明提出了一种大气污染在线识别方法,所述方法包括:
获得每个采集点的污染信息、至少两种环境信息和空气质量评价;
根据所述污染信息和所述环境信息获得不同采集点的初始聚类距离,并进行初始聚类,得到至少两个聚类簇;根据各个所述聚类簇中样本的分布离散程度获得第一聚类效果评价指标;根据整体所述聚类簇的分布离散程度获得第二聚类效果评价指标;确定每个采集点在预设邻域时段内的污染信息与空气质量评价的变化相似性;根据所述变化相似性和各个所述聚类簇中污染信息的分布离散程度获得第三聚类效果评价指标;
改变所述初始聚类过程中的聚类半径,根据所述第一聚类效果评价指标、所述第二聚类效果评价指标和所述第三聚类效果评价指标确定最优聚类半径;
利用所述最优聚类半径根据采集点的所述初始聚类距离对采集点进行聚类,得到至少两个第一聚类簇;任选一个目标环境信息,在初始聚类距离获取过程中去除所述目标环境信息,获得最终聚类距离,并进行聚类,得到至少两个第二聚类簇;根据待识别采集点所属的第一聚类簇和第二聚类簇对应的空气质量评价差异获取所述目标环境信息对空气质量评价的影响程度;
根据所述待识别采集点对应的每个所述环境信息的影响程度调整所述待识别采集点的实时空气质量评价,获得最终空气质量评价,确定所述待识别采集点的大气污染情况。
进一步地,所述根据各个所述聚类簇中样本的分布离散程度获得第一聚类效果评价指标,包括:
获取各个所述聚类簇内每个样本与对应聚类簇中心之间的第一污染信息差异距离,所述第一污染信息差异距离的累加和作为第一聚类效果评价指标。
进一步地,所述根据整体所述聚类簇的分布离散程度获得第二聚类效果评价指标,包括:
获取各个所述聚类簇内的污染信息与所有所述聚类簇对应的污染信息均值之间的第二污染信息差异距离,所述二污染信息差异距离的累加和作为第二聚类效果评价指标。
进一步地,所述确定每个采集点在预设邻域时段内的污染信息与空气质量评价的变化相似性的方法包括:
根据每个采集点在预设邻域时段内的污染信息与空气质量评价的变化相似性公式获得所述变化相似性,所述每个采集点在预设邻域时段内的污染信息与空气质量评价的变化相似性公式为:
其中,表示所述污染信息的各个指标与空气质量评价的相关性,/>表示所述预设邻域时段的时间长度,/>表示第/>个所述采集点的所述污染信息,/>表示第/>个所述采集点的所述污染信息对应的所述空气质量评价,/>为修正系数。
进一步地,所述根据所述变化相似性和各个所述聚类簇中污染信息的分布离散程度获得第三聚类效果评价指标包括:
所述第三聚类效果评价指标的公式为:
其中,表示所述污染信息的第三聚类效果评价指标,/>表示所述聚类簇的数量,表示以自然常数为底的指数函数,/>表示所述污染信息与空气质量评价的变化相关性,/>表示在第/>个所述聚类簇对应的所述污染信息的方差。
进一步地,所述根据所述第一聚类效果评价指标、所述第二聚类效果评价指标和所述第三聚类效果评价指标确定最优聚类半径,包括:
根据所述第一聚类效果评价指标、所述第二聚类效果评价指标和所述第三聚类效果评价指标获得综合聚类效果评价指标;
污染信息的所述第一聚类效果评价指标和所述第三聚类效果评价指标与综合聚类效果评价指标呈负相关关系;污染信息的所述第二聚类效果评价指标与综合聚类效果评价指标呈正相关关系;根据所述综合聚类效果评价指标的数值确定所述最优聚类半径。
进一步地,所述根据所述综合聚类效果评价指标的数值确定所述最优聚类半径包括:
若所述综合聚类效果评价指标大于预设指标阈值,则取所述综合聚类效果评价指标对应的所述聚类半径作为所述最优聚类半径;
若所述综合聚类效果评价指标不大于所述预设指标阈值,则增大所述聚类半径继续对所述污染信息和所述环境信息进行聚类,直至对应的所述综合聚类效果评价指大于所述预设指标阈值。
进一步地,所述每个采集点的污染信息和环境信息包括:
每个所述采集点的环境信息包括时间信息、环境风速和坐标位置。
进一步地,所述根据待识别采集点所属的第一聚类簇和第二聚类簇对应的空气质量评价差异获取环境信息对空气质量评价的影响程度,包括:
获取所述待识别采集点所属的所述第一聚类簇和第二聚类簇中空气质量评价均值的差值绝对值,以所述差值绝对值作为所述目标环境信息对空气质量评价的影响程度;
所述影响程度包括:时间信息对空气质量评价的第一影响程度、环境风速对空气质量评价的第二影响程度和坐标位置对空气质量评价的第三影响程度。
进一步地,确定最终空气质量评价包括:
根据最终空气质量评价公式获得所述最终空气质量评价,所述最终空气质量评价公式为:
其中,表示所述最终空气质量评价,/>表示所述待识别采集点的采集传感器的数量,/>表示所述第一影响程度,/>表示所述第二影响程度,/>表示所述第三影响程度,/>表示待识别采集点的环境风速,/>表示所述待识别采集点在采集传感器处的实时空气质量评价。
本发明具有如下有益效果:
本发明实施例通过对获取的污染信息、环境信息和空气质量评价的分析,采用自适应聚类半径的聚类算法,同时考虑簇内样本分布、簇间分布和污染信息与空气质量评价的变化相似性,从多个聚类原则对聚类过程进行调整,能够增强环境信息对空气质量评价的影响程度的获取准确性,能够保证最终获取的聚类效果,方便后续环境信息对空气质量评价的影响程度的获取。根据最终聚类效果获取环境信息对空气质量评价的影响程度,能够多方面、多维度综合分析待识别采集点的空气质量情况,通过对应的影响程度对待识别采集点直接获取的信息进行调整,获得最终获取空气质量评价,根据最终空气质量评价能够增强对历史数据的空气质量情况判断的准确性,提高对实时空气情况数据分析的精确,能够得到准确的、真实的大气污染在线识别效果。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
图1为本发明一个实施例所提供的一种大气污染在线识别方法流程图。
具体实施方式
为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的一种大气污染在线识别方法,其具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外,一或多个实施例中的特定特征、结构或特点可由任何合适形式组合。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。
下面结合附图具体的说明本发明所提供的一种大气污染在线识别方法的具体方案。
请参阅图1,其示出了本发明一个实施例提供的一种大气污染在线识别方法的方法流程图,该方法包括:步骤001、步骤002、步骤003、步骤004和步骤005。
步骤001:获得每个采集点的污染信息、至少两种环境信息和空气质量评价。
在采集数据时,不仅需要获取每个采集点的污染信息,还需要获取每个采集点的环境信息和空气质量评价,以便后续更好地、更准确地对待识别采集点的大气污染情况进行评价识别。
在本发明实施例中,将采集的每个采集点的污染信息和环境信息组成向量A{a,b,c,d,e,f,g,h},其中a表示一氧化碳含量,b表示二氧化硫含量,c表示,d表示二氧化碳含量,e表示一氧化氮含量,f表示时间信息,g表示环境风速,h表示坐标位置,以及对应的空气质量评价H。
需要说明的是,空气质量评价的获取方法为本领域技术人员熟知的技术手段,在此不再赘述。将获取到的每个采集点的空气质量评价归一化,使其数值范围在0到1之间,数值越大代表空气质量越好。在本发明实施例中,将实时向量A输入预先训练好的全连接网络输出对应的实时空气质量评价。全连接神经网络为本领域技术人员熟知的技术手段,具体网络结构和训练方法在此不再赘述,在此仅简述本发明一个实施例提供的全连接网络的训练过程:
输入:上述获取的向量A{a,b,c,d,e,f,g,h};输出:实时空气质量评价。
训练过程:人为对获取的历史数据进行打标签,标签内容为0-1的评价指标,作为神经网络的训练集。其中,损失函数为均方差损失函数。
步骤002:根据所述污染信息和环境信息获得不同采集点的初始聚类距离,并进行初始聚类,得到至少两个聚类簇。根据各个聚类簇中样本的分布离散程度获得第一聚类效果评价指标。根据整体聚类簇的分布离散程度获得第二聚类效果评价指标。确定每个采集点在预设邻域时段内的污染信息与空气质量评价的变化相似性;根据变化相似性和各个聚类簇中污染信息的分布离散程度获得第三聚类效果评价指标。
在不同区域,其空气污染主要指标也是不同的。例如,靠近发电厂,则二氧化硫含量为主要空气污染源。因此,可以在分析大气污染情况时,分析出该区域内的主要污染指标,并对其进行重点监测。
每个采集点的环境信息也会对每个采集点的污染信息产生影响,并且还会影响对应污染信息的可靠性。因此,需要获取环境信息对于最终大气污染识别结果的影响程度,使得获取的大气污染识别结果更真实、更准确。通过聚类过程能够有效获取影响程度,即通过聚类能够将同一区域内相同影响程度的采集点归为一簇,共同分析,进而获得一个参考性强的影响程度。
在本发明实施例中,为了保证好的聚类效果,使用一种自适应聚类半径的DBSCAN聚类算法,具体操作如下:
1. 根据污染信息和环境信息获得不同采集点的初始聚类距离,并进行初始聚类,得到至少两个聚类簇。需要说明的是,DBSCAN聚类算法为本领域技术人员熟知的技术手段,不再赘述。在本发明实施例中,聚类时的预设半径r=3。在本发明实施例中,因为考虑到了一氧化碳含量、二氧化硫含量、、二氧化碳含量和一氧化氮含量五种污染信息,以及时间信息、环境风速和坐标位置三种环境信息。因此,初始聚类距离表达式为:
其中,表示初始聚类距离,/>表示任意两个采集点的污染信息中一氧化碳含量的差值,/>表示任意两个采集点的污染信息中二氧化硫含量的差值,/>表示任意两个采集点的污染信息中/>的差值,/>表示任意两个采集点的污染信息中二氧化碳含量的差值,/>表示任意两个采集点的污染信息中一氧化氮含量的差值,/>表示任意两个采集点的环境信息中时间信息的差值,/>表示任意两个采集点的环境信息中环境风速的差值,/>表示任意两个采集点的环境信息中坐标位置的差值。
2. 根据获取的聚类结果,进行聚类效果的评价:
(1)根据各个聚类簇中样本的分布离散程度获得第一聚类效果评价指标,具体包括:获取各个聚类簇内每个样本与对应聚类簇中心之间的第一污染信息差异距离,第一污染信息差异距离的累加和作为第一聚类效果评价指标,即表达式为:
其中,表示第一污染信息差异距,/>表示聚类簇内第/>个采集点的污染信息中一氧化碳含量,/>表示聚类簇内第/>个采集点的污染信息中二氧化硫含量,/>表示聚类簇内第/>个采集点的污染信息中/>,/>表示聚类簇内第/>个采集点的污染信息中二氧化碳含量,/>表示聚类簇内第/>个采集点的污染信息中一氧化氮含量,/>表示聚类簇中心对应的污染信息中一氧化碳含量,/>表示聚类簇中心对应的污染信息中二氧化硫含量,/>表示聚类簇中心对应的污染信息中/>,/>表示聚类簇中心对应的污染信息中二氧化碳含量,/>表示聚类簇中心对应的污染信息中一氧化氮含量。
(2) 根据整体聚类簇的分布离散程度获得第二聚类效果评价指标,具体包括:获取各个聚类簇内的污染信息与所有聚类簇的污染信息均值之间的第二污染信息差异距离,第二污染信息差异距离的累加和作为第二聚类效果评价指标,即表达式为:
其中,表示第二污染信息差异距离,/>表示第/>个聚类簇的污染信息中一氧化碳含量的均值,/>表示第/>个聚类簇的污染信息中二氧化硫含量的均值,/>表示第/>个聚类簇的污染信息中/>的均值,/>表示第/>个聚类簇的污染信息中二氧化碳含量的均值,/>表示第/>个聚类簇的污染信息中一氧化氮含量的均值,/>表示所有聚类簇的污染信息中一氧化碳含量的均值,/>表示所有聚类簇的污染信息中二氧化硫含量的均值,/>表示所有聚类簇的污染信息中/>的均值,/>表示所有聚类簇的污染信息中二氧化碳含量的均值,/>表示所有聚类簇的污染信息中一氧化氮含量的均值。
(3) 对获取的每个采集点的污染信息和空气质量评价进行分析。根据获取的每个采集点的空气质量评价确定其中对空气质量评价影响较大的污染信息因素筛选出来,进而获取的评价结果更接近真实情况。
根据每个采集点在预设邻域时段内的污染信息与空气质量评价获取每个采集点在预设邻域时段内的污染信息与空气质量评价的变化相似性,表达式为:
其中,表示每个采集点在预设邻域时段内的污染信息与空气质量评价的变化相似性,/>表示预设邻域时段的时间长度,/>表示第/>个采集点污染信息的数值,/>表示第/>个采集点污染信息对应的空气质量评价,/>为修正系数。
需要说明的是,因为在一个优选实施例中考虑到了一氧化碳含量、二氧化硫含量、、二氧化碳含量和一氧化氮含量五种污染信息,因此可获得五种变化相关性。即每个采集点在预设领域时段内的污染信息与空气质量评价的变化相似性/>包括每个采集点在预设邻域时段内的污染信息的一氧化碳含量与空气质量评价的变化相似性/>、二氧化硫含量与空气质量评价的变化相似性/>、/>与空气质量评价的变化相似性/>、二氧化碳含量与空气质量评价的变化相似性/>和一氧化氮含量与空气质量评价的变化相似性/>。
中的/>从2开始取值是为了保证后续使用的数据均为历史数据;/>表示预设邻域时段的时间长度,且该数量不小于2;在每个采集点在预设邻域时段内的污染信息与空气质量评价的变化相似性的表达式中,修正系数能够保证整体数值的分母不为0;/>中的分子和分母上分别加上1的目的是保证该分式的分母不为0,该分式中每个采集点在预设邻域时段内的污染信息与空气质量评价的比值绝对值越大时,代表变化相似性越大;/>的值越大,代表采集点在预设邻域时段内的污染信息与空气质量评价的变化相似性就越大。
(4) 根据变化相似性和各个聚类簇中污染信息的分布离散程度获得第三聚类效果评价指标,具体包括:
根据获取的区域中对于某些数据敏感的,故需要对于获取的聚类簇中,其中数据相关性越大,则其在聚类结果中所有聚类簇相应的数据差异就越小。
根据变化相似性和各个聚类簇中污染信息的分布离散程度获得第三聚类效果评价指标:
需要说明的是,因为在一个优选实施例中考虑到了一氧化碳含量、二氧化硫含量、、二氧化碳含量和一氧化氮含量五种污染信息,因此可获得五种变化相关性,所以在计算第三聚类效果评价指标时,需要将对应的五种变化相关性累加作为最终的第三聚类效果评价指标。
即当一个污染信息的指标其对应的与空气质量评价相关性越强,那么对于要在同一要求下获取其他变量对空气评价的影响程度,就需要获取的聚类簇中的簇内元素之间指标的差异越小,则越能保证后续获取的其他因素对于空气评价的影响程度的准确性。当获取的变化相似性和各个聚类簇中污染信息的分布离散程度越小时,即所求第三聚类效果评价指标越小,则说明聚类效果越好。
步骤003:改变初始聚类过程中的聚类半径,根据第一聚类效果评价指标、第二聚类效果评价指标和第三聚类效果评价指标确定最优聚类半径。
1. 根据第一聚类效果评价指标、第二聚类效果评价指标和第三聚类效果评价指标获得综合聚类效果评价指标。
污染信息的第一聚类效果评价指标和第三聚类效果评价指标/>与综合聚类效果评价指标/>呈负相关关系;污染信息的第二聚类效果评价指标/>与综合聚类效果评价指标呈正相关关系;在本发明实施例中,综合聚类效果评价指标的表达式为:
2. 改变初始聚类过程中的聚类半径根据综合聚类效果评价指标确定最优聚类半径:
若综合聚类效果评价指标大于预设指标阈值,则取综合聚类效果评价指标对应的聚类半径作为最优聚类半径;
若综合聚类效果评价指标不大于预设指标阈值,则增大聚类半径继续对污染信息进行聚类;直至对应的综合聚类效果评价指标大于预设指标阈值。
在本发明实施例中,将综合聚类效果评价指标归一化处理,方便预设指标阈值的设置,指标阈值设置为0.7,不同生产环境不同,具体预设阈值可根据具体实施方式具体设置。
例如,初始聚类半径r为3,聚类后分析得到的综合聚类效果评价指标,将综合聚类效果评价指标归一化处理得到数值0.5,由于小于预设指标阈值0.7,增大初始聚类半径r为4,将得到的综合聚类效果评价指标归一化处理得到数值0.8,大于0.7,取该综合聚类效果评价指标对应的聚类半径4作为最优聚类半径。
步骤004:利用最优聚类半径根据采集点的初始聚类距离对采集点进行聚类,得到至少两个第一聚类簇;任选一个目标环境信息,在初始聚类距离获取过程中去除目标环境信息,获得最终聚类距离,并进行聚类,得到至少两个第二聚类簇;根据待识别采集点所属的第一聚类簇和第二聚类簇对应的空气质量评价差异获取目标环境信息对空气质量评价的影响程度。
在本发明实施例中,使用的聚类算法为自适应聚类半径的DBSCAN聚类算法。利用最优聚类半径对采集点的污染信息和环境信息进行聚类,能够多方面、多维度地反映出采集点的大气污染情况的准确性。需要说明的是,DBSCAN聚类算法为本领域技术人员熟知的技术手段,不再赘述。
任选一个环境信息,采集点去除选择的环境信息的聚类距离最为最终聚类距离,最终聚类距离的表达式为:
其中,表示最终聚类距离,/>表示任意两个采集点的污染信息中一氧化碳含量的差值,/>表示任意两个采集点的污染信息中二氧化硫含量的差值,/>表示任意两个采集点的污染信息中/>的差值,/>表示任意两个采集点的污染信息中二氧化碳含量的差值,/>表示任意两个采集点的污染信息中一氧化氮含量的差值,/>表示任意两个采集点的环境信息中时间信息的差值,/>表示任意两个采集点的环境信息中环境风速的差值,/>表示任意两个采集点的环境信息中坐标位置的差值,/>表示任意两个采集点的去除任选的一个环境信息的差值。例如,目标环境信息为时间信息,则/>,/>。
利用最终聚类距离对采集点进行聚类,得到至少两个第二聚类簇。
获取待识别采集点所属的第一聚类簇和第二聚类簇中空气质量评价均值的差值绝对值,以差值绝对值作为环境信息对空气质量评价的影响程度,具体包括:
需要说明的是,因为在一个优选实施例中考虑到了时间信息、环境风速和坐标位置三种环境信息,因此可通过改变目标环境信息的类别,获得三种环境信息对空气质量评价的影响程度。
步骤005:根据所述待识别采集点对应的每个所述环境信息的影响程度调整所述待识别采集点的实时空气质量评价,获得最终空气质量评价,确定所述待识别采集点的大气污染情况。
根据待识别采集点的风速和影响程度调整待识别采集点的实时空气质量评价,获得最终空气质量评价指标:
其中,表示最终空气质量评价,/>表示待识别采集点的采集传感器的数量,/>表示第一影响程度,/>表示第二影响程度,/>表示第三影响程度,/>表示待识别采集点的环境风速,/>表示待识别采集点在采集传感器处的实时空气质量评价。另外,Ho为待识别采集点在采集传感器处的实时空气质量评价,采集传感器有x个,因此说待识别采集点对应的Ho也有x个。
待识别采集点的风速对空气质量评价的第二影响程度和风速的差值能够反映整体环境风速对最终空气质量评价的影响,即风速越大,所采集到的空气质量评价越不准确,结合时间信息对空气质量评价的第一影响程度、环境风速对空气质量评价的第二影响程度以及实时空气质量评价,获得的最终空气质量评价对大气污染情况的识别更准确、更及时。当所求最终空气质量评价越小时,则说明待识别采集点的空气质量越差。
在本发明实施例中,设置评价阈值为0.1,不同生产环境不同,具体阈值可根据具体实施方式具体设置。
需要说明的是:上述本发明实施例先后顺序仅仅为了描述,不代表实施例的优劣。在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
综上所述,本发明通过对获取的污染信息、环境信息和空气质量评价的分析,获取环境信息对空气质量评价的影响程度,对待识别采集点直接获取的信息进行调整,结合环境信息对空气质量评价的影响程度和空气质量评价对实时空气情况数据进行分析,得到准确的、真实的大气污染在线识别效果。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (5)
1.一种大气污染在线识别方法,其特征在于,该方法包括以下步骤:
获得每个采集点的污染信息、至少两种环境信息和空气质量评价;
根据所述污染信息和所述环境信息获得不同采集点的初始聚类距离,并进行初始聚类,得到至少两个聚类簇;根据各个所述聚类簇中样本的分布离散程度获得第一聚类效果评价指标;根据整体所述聚类簇的分布离散程度获得第二聚类效果评价指标;确定每个采集点在预设邻域时段内的污染信息与空气质量评价的变化相似性;根据所述变化相似性和各个所述聚类簇中污染信息的分布离散程度获得第三聚类效果评价指标;
改变所述初始聚类过程中的聚类半径,根据所述第一聚类效果评价指标、所述第二聚类效果评价指标和所述第三聚类效果评价指标确定最优聚类半径;
利用所述最优聚类半径根据采集点的所述初始聚类距离对采集点进行聚类,得到至少两个第一聚类簇;任选一个目标环境信息,在初始聚类距离获取过程中去除所述目标环境信息,获得最终聚类距离,并进行聚类,得到至少两个第二聚类簇;根据待识别采集点所属的第一聚类簇和第二聚类簇对应的空气质量评价差异获取所述目标环境信息对空气质量评价的影响程度;
根据所述待识别采集点对应的每个所述环境信息的影响程度调整所述待识别采集点的实时空气质量评价,获得最终空气质量评价,确定所述待识别采集点的大气污染情况;
所述确定每个采集点在预设邻域时段内的污染信息与空气质量评价的变化相似性的方法包括:
根据每个采集点在预设邻域时段内的污染信息与空气质量评价的变化相似性公式获得所述变化相似性,所述每个采集点在预设邻域时段内的污染信息与空气质量评价的变化相似性公式为:其中,/>表示所述污染信息的各个指标与空气质量评价的相关性,/>表示所述预设邻域时段的时间长度,/>表示第/>个所述采集点的所述污染信息,/>表示第/>个所述采集点的所述污染信息对应的所述空气质量评价,/>为修正系数;所述根据所述变化相似性和各个所述聚类簇中污染信息的分布离散程度获得第三聚类效果评价指标包括:
所述第三聚类效果评价指标的公式为:其中,/>表示所述第三聚类效果评价指标,/>表示所述聚类簇的数量,/>表示以自然常数为底的指数函数,/>表示所述污染信息与空气质量评价的变化相关性,/>表示在第/>个所述聚类簇对应的所述污染信息的方差;
所述每个采集点的污染信息和环境信息包括:
每个所述采集点的环境信息包括时间信息、环境风速和坐标位置;
所述根据待识别采集点所属的第一聚类簇和第二聚类簇对应的空气质量评价差异获取所述目标环境信息对空气质量评价的影响程度,包括:
获取所述待识别采集点所属的所述第一聚类簇和第二聚类簇中空气质量评价均值的差值绝对值,以所述差值绝对值作为所述目标环境信息对空气质量评价的影响程度;
所述影响程度包括:时间信息对空气质量评价的第一影响程度、环境风速对空气质量评价的第二影响程度和坐标位置对空气质量评价的第三影响程度;
确定最终空气质量评价包括:
2.根据权利要求1所述的一种大气污染在线识别方法,其特征在于,所述根据各个所述聚类簇中样本的分布离散程度获得第一聚类效果评价指标,包括:
获取各个所述聚类簇内每个样本与对应聚类簇中心之间的第一污染信息差异距离,所述第一污染信息差异距离的累加和作为第一聚类效果评价指标。
3.根据权利要求1所述的一种大气污染在线识别方法,其特征在于,所述根据整体所述聚类簇的分布离散程度获得第二聚类效果评价指标,包括:
获取各个所述聚类簇内的污染信息与所有所述聚类簇对应的污染信息均值之间的第二污染信息差异距离,所述第二污染信息差异距离的累加和作为第二聚类效果评价指标。
4.根据权利要求1所述的一种大气污染在线识别方法,其特征在于,所述根据所述第一聚类效果评价指标、所述第二聚类效果评价指标和所述第三聚类效果评价指标确定最优聚类半径,包括:
根据所述第一聚类效果评价指标、所述第二聚类效果评价指标和所述第三聚类效果评价指标获得综合聚类效果评价指标;
污染信息的所述第一聚类效果评价指标和所述第三聚类效果评价指标与综合聚类效果评价指标呈负相关关系;污染信息的所述第二聚类效果评价指标与综合聚类效果评价指标呈正相关关系;根据所述综合聚类效果评价指标的数值确定所述最优聚类半径。
5.根据权利要求4所述的一种大气污染在线识别方法,其特征在于,所述根据所述综合聚类效果评价指标的数值确定所述最优聚类半径包括:
若所述综合聚类效果评价指标大于预设指标阈值,则取所述综合聚类效果评价指标对应的所述聚类半径作为所述最优聚类半径;
若所述综合聚类效果评价指标不大于所述预设指标阈值,则增大所述聚类半径继续对所述污染信息和所述环境信息进行聚类,直至对应的所述综合聚类效果评价指大于所述预设指标阈值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211454170.8A CN115659195B (zh) | 2022-11-21 | 2022-11-21 | 一种大气污染在线识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211454170.8A CN115659195B (zh) | 2022-11-21 | 2022-11-21 | 一种大气污染在线识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115659195A CN115659195A (zh) | 2023-01-31 |
CN115659195B true CN115659195B (zh) | 2023-06-27 |
Family
ID=85019326
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211454170.8A Active CN115659195B (zh) | 2022-11-21 | 2022-11-21 | 一种大气污染在线识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115659195B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117633697B (zh) * | 2024-01-26 | 2024-05-03 | 西安艺琳农业发展有限公司 | 基于物联网的生猪智能监测方法及系统 |
CN118034619B (zh) * | 2024-04-12 | 2024-07-05 | 湖南医标通信息科技有限公司 | 时间管理标签打印机的打印信息管理方法及系统 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107340364A (zh) * | 2017-05-31 | 2017-11-10 | 北京市环境保护监测中心 | 基于海量大气污染浓度数据的污染空间分析方法及装置 |
CN108387692A (zh) * | 2018-04-25 | 2018-08-10 | 深圳森阳环保材料科技有限公司 | 一种大气污染智能监测系统 |
CN110298560B (zh) * | 2019-06-13 | 2022-12-06 | 南方科技大学 | 一种大气污染排放控制效果的评估方法、装置及存储介质 |
CN112508056B (zh) * | 2020-11-13 | 2022-04-29 | 东南大学 | 基于移动多源感知的城市空气质量监测方法 |
CN113804829A (zh) * | 2021-08-20 | 2021-12-17 | 重庆市生态环境监测中心 | 一种大气污染天空地一体化实时监测系统及方法 |
CN114239271A (zh) * | 2021-12-16 | 2022-03-25 | 中科三清科技有限公司 | 一种大气污染预警方法、装置和设备 |
-
2022
- 2022-11-21 CN CN202211454170.8A patent/CN115659195B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN115659195A (zh) | 2023-01-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN115659195B (zh) | 一种大气污染在线识别方法 | |
CN110796284B (zh) | 细颗粒物污染等级的预测方法、装置及计算机设备 | |
Gore et al. | An approach for classification of health risks based on air quality levels | |
CN110378520A (zh) | 一种pm2.5浓度预测和预警方法 | |
CN111289697B (zh) | Cems运行状态监控与数据作假识别方法及系统 | |
Cacciola et al. | Aspects about air pollution prediction on urban environment | |
CN115169504B (zh) | 一种煤气精脱硫工艺中的设备异常识别方法 | |
CN110610209A (zh) | 一种基于数据挖掘的空气质量预测方法及系统 | |
CN115876258A (zh) | 基于多源数据的畜禽养殖环境异常监测及报警系统 | |
CN118312924B (zh) | 基于多维传感器的空气质量大数据评估系统 | |
CN116244657A (zh) | 基于生成对抗网络和集成学习的列车轴温异常识别方法 | |
CN111413492A (zh) | 一种用于检测新型冠状病毒covid-2019肺炎的方法及系统 | |
CN112702408A (zh) | 基于多感知功能的物联网系统及方法 | |
CN112257351A (zh) | 一种考虑地形和风向的环境空气质量监测异常值检测方法 | |
CN115563546A (zh) | 一种气体嗅觉智能识别方法、系统、介质、设备及终端 | |
CN114970977A (zh) | 数字化城市空气质量监测数据的异常数据检测方法及系统 | |
CN114217025A (zh) | 评估空气质量浓度预测中气象数据对其影响的分析方法 | |
CN117764413A (zh) | 一种基于机器学习的精确碳排放核算算法 | |
CN113628741A (zh) | 一种基于呼出气体标志物检测的健康状态识别方法 | |
Mihirani et al. | Machine Learning-based Air Pollution Prediction Model | |
CN117435949A (zh) | 基于人工智能的工业废水处理效果检测评价方法 | |
CN116933084A (zh) | 一种污染物排放的预测方法和装置 | |
CN112201355B (zh) | 一种健康评估迭代分类器模型的构建方法 | |
Pal et al. | Effectiveness of machine learning algorithms in forecasting AQI | |
Azizan et al. | A Framework to Spatially Cluster Air Quality Monitoring Stations in Peninsular Malaysia using the Hybrid Clustering Method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |