CN115659195B - 一种大气污染在线识别方法 - Google Patents

一种大气污染在线识别方法 Download PDF

Info

Publication number
CN115659195B
CN115659195B CN202211454170.8A CN202211454170A CN115659195B CN 115659195 B CN115659195 B CN 115659195B CN 202211454170 A CN202211454170 A CN 202211454170A CN 115659195 B CN115659195 B CN 115659195B
Authority
CN
China
Prior art keywords
clustering
air quality
information
cluster
pollution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202211454170.8A
Other languages
English (en)
Other versions
CN115659195A (zh
Inventor
高飞
刘旗龙
曹磊
吕婧
王雨薇
张淳
李毅辉
陈浩
杏艳
陈静
牛天田
王琼
赵万年
赵佳奇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shaanxi Province Environmental Monitoring Center Station
3Clear Technology Co Ltd
Original Assignee
Shaanxi Province Environmental Monitoring Center Station
3Clear Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shaanxi Province Environmental Monitoring Center Station, 3Clear Technology Co Ltd filed Critical Shaanxi Province Environmental Monitoring Center Station
Priority to CN202211454170.8A priority Critical patent/CN115659195B/zh
Publication of CN115659195A publication Critical patent/CN115659195A/zh
Application granted granted Critical
Publication of CN115659195B publication Critical patent/CN115659195B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Sampling And Sample Adjustment (AREA)

Abstract

本发明涉及数据识别技术领域,具体涉及一种大气污染在线识别方法。方法包括:通过对获取的污染信息、环境信息和空气质量评价的分析,采用自适应聚类半径的聚类算法,同时考虑簇内样本分布、簇间分布和污染信息与空气质量评价的变化相似性,从多个聚类原则对聚类过程进行调整。根据最终聚类效果获取环境信息对空气质量评价的影响程度,对待识别采集点直接获取的信息进行调整,获得最终获取空气质量评价,进而对实时空气情况数据进行分析,得到准确的、真实的大气污染在线识别效果。本发明通过准确地获取环境信息对空气质量评价的影响程度,进而获得最终获取空气质量评价,提高对实时空气情况数据分析的精确,能够得到准确的大气污染在线识别效果。

Description

一种大气污染在线识别方法
技术领域
本发明涉及数据识别技术领域,具体涉及一种大气污染在线识别方法。
背景技术
大气污染是由于人类活动或自然过程引起某些物质进入大气中,呈现出足够的浓度,达到足够的时间,并因此危害了自然环境、人体舒适和人体健康的现象。大气污染物由人为源或者天然源进入大气,并参与大气的循环过程。大气污染物在大气中滞留一段时间之后,又通过大气中的化学反应、生物活动和物理沉降从大气中去除。如果输出大气污染物的速率小于输入大气污染物的速率,大气污染物就会在大气环境中相对集聚,造成大气中某种大气污染物的浓度升高。当大气污染物浓度升高到一定程度时,就会直接或间接地对人、生物或材料等造成急性、慢性危害。
现有技术中,检测大气污染的方法大多仅为使用空气质量检测传感器获取空气中各项指标的成分,需要海量的大气污染数据和地理数据,建立复杂的仿真模型,对数据的离散值和缺失值较为敏感,通过仿真模型识别出异常数据。但是大气中各种各项指标在不同区域以及不同高度位置的传感器获取的数据也是不一定的,即不同环境信息和不同传感器信息对所获取的空气质量评价不同,因此直接根据采集到的数据对最终空气质量评价进行识别会受到环境信息的影响,导致最终识别结果不准确。
发明内容
为了解决上述技术问题,本发明的目的在于提供一种大气污染在线识别方法,所采用的技术方案具体如下:
本发明提出了一种大气污染在线识别方法,所述方法包括:
获得每个采集点的污染信息、至少两种环境信息和空气质量评价;
根据所述污染信息和所述环境信息获得不同采集点的初始聚类距离,并进行初始聚类,得到至少两个聚类簇;根据各个所述聚类簇中样本的分布离散程度获得第一聚类效果评价指标;根据整体所述聚类簇的分布离散程度获得第二聚类效果评价指标;确定每个采集点在预设邻域时段内的污染信息与空气质量评价的变化相似性;根据所述变化相似性和各个所述聚类簇中污染信息的分布离散程度获得第三聚类效果评价指标;
改变所述初始聚类过程中的聚类半径,根据所述第一聚类效果评价指标、所述第二聚类效果评价指标和所述第三聚类效果评价指标确定最优聚类半径;
利用所述最优聚类半径根据采集点的所述初始聚类距离对采集点进行聚类,得到至少两个第一聚类簇;任选一个目标环境信息,在初始聚类距离获取过程中去除所述目标环境信息,获得最终聚类距离,并进行聚类,得到至少两个第二聚类簇;根据待识别采集点所属的第一聚类簇和第二聚类簇对应的空气质量评价差异获取所述目标环境信息对空气质量评价的影响程度;
根据所述待识别采集点对应的每个所述环境信息的影响程度调整所述待识别采集点的实时空气质量评价,获得最终空气质量评价,确定所述待识别采集点的大气污染情况。
进一步地,所述根据各个所述聚类簇中样本的分布离散程度获得第一聚类效果评价指标,包括:
获取各个所述聚类簇内每个样本与对应聚类簇中心之间的第一污染信息差异距离,所述第一污染信息差异距离的累加和作为第一聚类效果评价指标。
进一步地,所述根据整体所述聚类簇的分布离散程度获得第二聚类效果评价指标,包括:
获取各个所述聚类簇内的污染信息与所有所述聚类簇对应的污染信息均值之间的第二污染信息差异距离,所述二污染信息差异距离的累加和作为第二聚类效果评价指标。
进一步地,所述确定每个采集点在预设邻域时段内的污染信息与空气质量评价的变化相似性的方法包括:
根据每个采集点在预设邻域时段内的污染信息与空气质量评价的变化相似性公式获得所述变化相似性,所述每个采集点在预设邻域时段内的污染信息与空气质量评价的变化相似性公式为:
Figure 144695DEST_PATH_IMAGE001
其中,
Figure 937202DEST_PATH_IMAGE002
表示所述污染信息的各个指标与空气质量评价的相关性,/>
Figure 529989DEST_PATH_IMAGE003
表示所述预设邻域时段的时间长度,/>
Figure 800564DEST_PATH_IMAGE004
表示第/>
Figure 628318DEST_PATH_IMAGE005
个所述采集点的所述污染信息,/>
Figure 201513DEST_PATH_IMAGE006
表示第/>
Figure 346842DEST_PATH_IMAGE007
个所述采集点的所述污染信息对应的所述空气质量评价,/>
Figure 952267DEST_PATH_IMAGE008
为修正系数。
进一步地,所述根据所述变化相似性和各个所述聚类簇中污染信息的分布离散程度获得第三聚类效果评价指标包括:
所述第三聚类效果评价指标的公式为:
Figure 230933DEST_PATH_IMAGE009
其中,
Figure 316307DEST_PATH_IMAGE010
表示所述污染信息的第三聚类效果评价指标,/>
Figure 773701DEST_PATH_IMAGE011
表示所述聚类簇的数量,
Figure 323762DEST_PATH_IMAGE012
表示以自然常数为底的指数函数,/>
Figure 315988DEST_PATH_IMAGE013
表示所述污染信息与空气质量评价的变化相关性,/>
Figure 824461DEST_PATH_IMAGE014
表示在第/>
Figure 407365DEST_PATH_IMAGE015
个所述聚类簇对应的所述污染信息的方差。
进一步地,所述根据所述第一聚类效果评价指标、所述第二聚类效果评价指标和所述第三聚类效果评价指标确定最优聚类半径,包括:
根据所述第一聚类效果评价指标、所述第二聚类效果评价指标和所述第三聚类效果评价指标获得综合聚类效果评价指标;
污染信息的所述第一聚类效果评价指标和所述第三聚类效果评价指标与综合聚类效果评价指标呈负相关关系;污染信息的所述第二聚类效果评价指标与综合聚类效果评价指标呈正相关关系;根据所述综合聚类效果评价指标的数值确定所述最优聚类半径。
进一步地,所述根据所述综合聚类效果评价指标的数值确定所述最优聚类半径包括:
若所述综合聚类效果评价指标大于预设指标阈值,则取所述综合聚类效果评价指标对应的所述聚类半径作为所述最优聚类半径;
若所述综合聚类效果评价指标不大于所述预设指标阈值,则增大所述聚类半径继续对所述污染信息和所述环境信息进行聚类,直至对应的所述综合聚类效果评价指大于所述预设指标阈值。
进一步地,所述每个采集点的污染信息和环境信息包括:
每个所述采集点的污染信息包括一氧化碳含量、二氧化硫含量、
Figure 308587DEST_PATH_IMAGE016
、二氧化碳含量和一氧化氮含量;
每个所述采集点的环境信息包括时间信息、环境风速和坐标位置。
进一步地,所述根据待识别采集点所属的第一聚类簇和第二聚类簇对应的空气质量评价差异获取环境信息对空气质量评价的影响程度,包括:
获取所述待识别采集点所属的所述第一聚类簇和第二聚类簇中空气质量评价均值的差值绝对值,以所述差值绝对值作为所述目标环境信息对空气质量评价的影响程度;
所述影响程度包括:时间信息对空气质量评价的第一影响程度、环境风速对空气质量评价的第二影响程度和坐标位置对空气质量评价的第三影响程度。
进一步地,确定最终空气质量评价包括:
根据最终空气质量评价公式获得所述最终空气质量评价,所述最终空气质量评价公式为:
Figure 361512DEST_PATH_IMAGE017
其中,
Figure 572045DEST_PATH_IMAGE018
表示所述最终空气质量评价,/>
Figure 582857DEST_PATH_IMAGE019
表示所述待识别采集点的采集传感器的数量,/>
Figure 534108DEST_PATH_IMAGE020
表示所述第一影响程度,/>
Figure 438610DEST_PATH_IMAGE021
表示所述第二影响程度,/>
Figure 85624DEST_PATH_IMAGE022
表示所述第三影响程度,/>
Figure 849311DEST_PATH_IMAGE023
表示待识别采集点的环境风速,/>
Figure 739339DEST_PATH_IMAGE024
表示所述待识别采集点在采集传感器处的实时空气质量评价。
本发明具有如下有益效果:
本发明实施例通过对获取的污染信息、环境信息和空气质量评价的分析,采用自适应聚类半径的聚类算法,同时考虑簇内样本分布、簇间分布和污染信息与空气质量评价的变化相似性,从多个聚类原则对聚类过程进行调整,能够增强环境信息对空气质量评价的影响程度的获取准确性,能够保证最终获取的聚类效果,方便后续环境信息对空气质量评价的影响程度的获取。根据最终聚类效果获取环境信息对空气质量评价的影响程度,能够多方面、多维度综合分析待识别采集点的空气质量情况,通过对应的影响程度对待识别采集点直接获取的信息进行调整,获得最终获取空气质量评价,根据最终空气质量评价能够增强对历史数据的空气质量情况判断的准确性,提高对实时空气情况数据分析的精确,能够得到准确的、真实的大气污染在线识别效果。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
图1为本发明一个实施例所提供的一种大气污染在线识别方法流程图。
具体实施方式
为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的一种大气污染在线识别方法,其具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外,一或多个实施例中的特定特征、结构或特点可由任何合适形式组合。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。
下面结合附图具体的说明本发明所提供的一种大气污染在线识别方法的具体方案。
请参阅图1,其示出了本发明一个实施例提供的一种大气污染在线识别方法的方法流程图,该方法包括:步骤001、步骤002、步骤003、步骤004和步骤005。
步骤001:获得每个采集点的污染信息、至少两种环境信息和空气质量评价。
在采集数据时,不仅需要获取每个采集点的污染信息,还需要获取每个采集点的环境信息和空气质量评价,以便后续更好地、更准确地对待识别采集点的大气污染情况进行评价识别。
优选的,每个采集点的污染信息包括一氧化碳含量、二氧化硫含量、
Figure 498348DEST_PATH_IMAGE025
、二氧化碳含量和一氧化氮含量,每个采集点的环境信息包括时间信息、环境风速和坐标位置。
在本发明实施例中,将采集的每个采集点的污染信息和环境信息组成向量A{a,b,c,d,e,f,g,h},其中a表示一氧化碳含量,b表示二氧化硫含量,c表示
Figure 581842DEST_PATH_IMAGE026
,d表示二氧化碳含量,e表示一氧化氮含量,f表示时间信息,g表示环境风速,h表示坐标位置,以及对应的空气质量评价H。
需要说明的是,空气质量评价的获取方法为本领域技术人员熟知的技术手段,在此不再赘述。将获取到的每个采集点的空气质量评价归一化,使其数值范围在0到1之间,数值越大代表空气质量越好。在本发明实施例中,将实时向量A输入预先训练好的全连接网络输出对应的实时空气质量评价。全连接神经网络为本领域技术人员熟知的技术手段,具体网络结构和训练方法在此不再赘述,在此仅简述本发明一个实施例提供的全连接网络的训练过程:
输入:上述获取的向量A{a,b,c,d,e,f,g,h};输出:实时空气质量评价。
训练过程:人为对获取的历史数据进行打标签,标签内容为0-1的评价指标,作为神经网络的训练集。其中,损失函数为均方差损失函数。
步骤002:根据所述污染信息和环境信息获得不同采集点的初始聚类距离,并进行初始聚类,得到至少两个聚类簇。根据各个聚类簇中样本的分布离散程度获得第一聚类效果评价指标。根据整体聚类簇的分布离散程度获得第二聚类效果评价指标。确定每个采集点在预设邻域时段内的污染信息与空气质量评价的变化相似性;根据变化相似性和各个聚类簇中污染信息的分布离散程度获得第三聚类效果评价指标。
在不同区域,其空气污染主要指标也是不同的。例如,靠近发电厂,则二氧化硫含量为主要空气污染源。因此,可以在分析大气污染情况时,分析出该区域内的主要污染指标,并对其进行重点监测。
每个采集点的环境信息也会对每个采集点的污染信息产生影响,并且还会影响对应污染信息的可靠性。因此,需要获取环境信息对于最终大气污染识别结果的影响程度,使得获取的大气污染识别结果更真实、更准确。通过聚类过程能够有效获取影响程度,即通过聚类能够将同一区域内相同影响程度的采集点归为一簇,共同分析,进而获得一个参考性强的影响程度。
在本发明实施例中,为了保证好的聚类效果,使用一种自适应聚类半径的DBSCAN聚类算法,具体操作如下:
1. 根据污染信息和环境信息获得不同采集点的初始聚类距离,并进行初始聚类,得到至少两个聚类簇。需要说明的是,DBSCAN聚类算法为本领域技术人员熟知的技术手段,不再赘述。在本发明实施例中,聚类时的预设半径r=3。在本发明实施例中,因为考虑到了一氧化碳含量、二氧化硫含量、
Figure 298737DEST_PATH_IMAGE027
、二氧化碳含量和一氧化氮含量五种污染信息,以及时间信息、环境风速和坐标位置三种环境信息。因此,初始聚类距离表达式为:
Figure 594721DEST_PATH_IMAGE028
其中,
Figure 473815DEST_PATH_IMAGE029
表示初始聚类距离,/>
Figure 197051DEST_PATH_IMAGE030
表示任意两个采集点的污染信息中一氧化碳含量的差值,/>
Figure 734999DEST_PATH_IMAGE031
表示任意两个采集点的污染信息中二氧化硫含量的差值,/>
Figure 365831DEST_PATH_IMAGE032
表示任意两个采集点的污染信息中/>
Figure 302694DEST_PATH_IMAGE033
的差值,/>
Figure 866006DEST_PATH_IMAGE034
表示任意两个采集点的污染信息中二氧化碳含量的差值,/>
Figure 888320DEST_PATH_IMAGE035
表示任意两个采集点的污染信息中一氧化氮含量的差值,/>
Figure 322844DEST_PATH_IMAGE036
表示任意两个采集点的环境信息中时间信息的差值,/>
Figure 645372DEST_PATH_IMAGE037
表示任意两个采集点的环境信息中环境风速的差值,/>
Figure 725059DEST_PATH_IMAGE038
表示任意两个采集点的环境信息中坐标位置的差值。
2. 根据获取的聚类结果,进行聚类效果的评价:
(1)根据各个聚类簇中样本的分布离散程度获得第一聚类效果评价指标,具体包括:获取各个聚类簇内每个样本与对应聚类簇中心之间的第一污染信息差异距离,第一污染信息差异距离的累加和作为第一聚类效果评价指标,即表达式为:
Figure 641194DEST_PATH_IMAGE039
其中,
Figure 676146DEST_PATH_IMAGE040
表示第一聚类效果评价指标,/>
Figure 259705DEST_PATH_IMAGE041
表示聚类簇的数量,/>
Figure 351771DEST_PATH_IMAGE042
表示第/>
Figure 614256DEST_PATH_IMAGE043
个聚类簇对应的簇内采集点的污染信息的数量,/>
Figure 531527DEST_PATH_IMAGE044
表示第一污染信息差异距离。
其中,因为在一个优选实施例中考虑到了一氧化碳含量、二氧化硫含量、
Figure 766331DEST_PATH_IMAGE045
、二氧化碳含量和一氧化氮含量五种污染信息,因此第一污染信息差异距离/>
Figure 972840DEST_PATH_IMAGE046
的表达式为:
Figure 457042DEST_PATH_IMAGE047
其中,
Figure 912425DEST_PATH_IMAGE048
表示第一污染信息差异距,/>
Figure 795543DEST_PATH_IMAGE049
表示聚类簇内第/>
Figure 497920DEST_PATH_IMAGE050
个采集点的污染信息中一氧化碳含量,/>
Figure 610363DEST_PATH_IMAGE051
表示聚类簇内第/>
Figure 462913DEST_PATH_IMAGE052
个采集点的污染信息中二氧化硫含量,/>
Figure 460257DEST_PATH_IMAGE053
表示聚类簇内第/>
Figure 474481DEST_PATH_IMAGE054
个采集点的污染信息中/>
Figure 339799DEST_PATH_IMAGE055
,/>
Figure 464881DEST_PATH_IMAGE056
表示聚类簇内第/>
Figure 181646DEST_PATH_IMAGE057
个采集点的污染信息中二氧化碳含量,/>
Figure 38875DEST_PATH_IMAGE058
表示聚类簇内第/>
Figure 984965DEST_PATH_IMAGE059
个采集点的污染信息中一氧化氮含量,/>
Figure 323192DEST_PATH_IMAGE060
表示聚类簇中心对应的污染信息中一氧化碳含量,/>
Figure 38339DEST_PATH_IMAGE061
表示聚类簇中心对应的污染信息中二氧化硫含量,/>
Figure 925523DEST_PATH_IMAGE062
表示聚类簇中心对应的污染信息中/>
Figure 827751DEST_PATH_IMAGE063
,/>
Figure 557285DEST_PATH_IMAGE064
表示聚类簇中心对应的污染信息中二氧化碳含量,/>
Figure 658096DEST_PATH_IMAGE065
表示聚类簇中心对应的污染信息中一氧化氮含量。
当获取的聚类簇内样本的分布离散程度越小,即所求第一聚类效果评价指标
Figure 185024DEST_PATH_IMAGE066
越小时,则说明聚类效果越好。
(2) 根据整体聚类簇的分布离散程度获得第二聚类效果评价指标,具体包括:获取各个聚类簇内的污染信息与所有聚类簇的污染信息均值之间的第二污染信息差异距离,第二污染信息差异距离的累加和作为第二聚类效果评价指标,即表达式为:
Figure 512231DEST_PATH_IMAGE067
其中,
Figure 390930DEST_PATH_IMAGE068
阿表示第二聚类效果评价指标,/>
Figure 956035DEST_PATH_IMAGE069
表示聚类簇的数量,/>
Figure 450601DEST_PATH_IMAGE070
表示第二污染信息差异距离。
其中,因为在一个优选实施例中考虑到了一氧化碳含量、二氧化硫含量、
Figure 327422DEST_PATH_IMAGE071
、二氧化碳含量和一氧化氮含量五种污染信息,因此第二污染信息差异距离/>
Figure 929917DEST_PATH_IMAGE072
的表达式为:
Figure 208583DEST_PATH_IMAGE073
其中,
Figure 342892DEST_PATH_IMAGE074
表示第二污染信息差异距离,/>
Figure 972587DEST_PATH_IMAGE075
表示第/>
Figure 322316DEST_PATH_IMAGE076
个聚类簇的污染信息中一氧化碳含量的均值,/>
Figure 127592DEST_PATH_IMAGE077
表示第/>
Figure 432803DEST_PATH_IMAGE078
个聚类簇的污染信息中二氧化硫含量的均值,/>
Figure 812444DEST_PATH_IMAGE079
表示第/>
Figure 962934DEST_PATH_IMAGE080
个聚类簇的污染信息中/>
Figure 481771DEST_PATH_IMAGE081
的均值,/>
Figure 223462DEST_PATH_IMAGE082
表示第/>
Figure 553381DEST_PATH_IMAGE083
个聚类簇的污染信息中二氧化碳含量的均值,/>
Figure 773141DEST_PATH_IMAGE084
表示第/>
Figure 146485DEST_PATH_IMAGE085
个聚类簇的污染信息中一氧化氮含量的均值,/>
Figure 668864DEST_PATH_IMAGE086
表示所有聚类簇的污染信息中一氧化碳含量的均值,/>
Figure 757518DEST_PATH_IMAGE087
表示所有聚类簇的污染信息中二氧化硫含量的均值,/>
Figure 374444DEST_PATH_IMAGE088
表示所有聚类簇的污染信息中/>
Figure 8819DEST_PATH_IMAGE089
的均值,/>
Figure 561154DEST_PATH_IMAGE090
表示所有聚类簇的污染信息中二氧化碳含量的均值,/>
Figure 674123DEST_PATH_IMAGE091
表示所有聚类簇的污染信息中一氧化氮含量的均值。
当获取的整体聚类簇的分布离散程度越大时,即所求第二聚类效果评价指标
Figure 704527DEST_PATH_IMAGE092
越大,则说明聚类效果越好。
(3) 对获取的每个采集点的污染信息和空气质量评价进行分析。根据获取的每个采集点的空气质量评价确定其中对空气质量评价影响较大的污染信息因素筛选出来,进而获取的评价结果更接近真实情况。
根据每个采集点在预设邻域时段内的污染信息与空气质量评价获取每个采集点在预设邻域时段内的污染信息与空气质量评价的变化相似性,表达式为:
Figure 786883DEST_PATH_IMAGE093
其中,
Figure 775699DEST_PATH_IMAGE094
表示每个采集点在预设邻域时段内的污染信息与空气质量评价的变化相似性,/>
Figure 307787DEST_PATH_IMAGE095
表示预设邻域时段的时间长度,/>
Figure 937DEST_PATH_IMAGE096
表示第/>
Figure 344324DEST_PATH_IMAGE097
个采集点污染信息的数值,/>
Figure 769621DEST_PATH_IMAGE098
表示第/>
Figure 760577DEST_PATH_IMAGE099
个采集点污染信息对应的空气质量评价,/>
Figure 661013DEST_PATH_IMAGE100
为修正系数。
需要说明的是,因为在一个优选实施例中考虑到了一氧化碳含量、二氧化硫含量、
Figure 921224DEST_PATH_IMAGE101
、二氧化碳含量和一氧化氮含量五种污染信息,因此可获得五种变化相关性。即每个采集点在预设领域时段内的污染信息与空气质量评价的变化相似性/>
Figure 392788DEST_PATH_IMAGE102
包括每个采集点在预设邻域时段内的污染信息的一氧化碳含量与空气质量评价的变化相似性/>
Figure 436486DEST_PATH_IMAGE103
、二氧化硫含量与空气质量评价的变化相似性/>
Figure 612383DEST_PATH_IMAGE104
、/>
Figure 992680DEST_PATH_IMAGE105
与空气质量评价的变化相似性/>
Figure 759779DEST_PATH_IMAGE106
、二氧化碳含量与空气质量评价的变化相似性/>
Figure 19335DEST_PATH_IMAGE107
和一氧化氮含量与空气质量评价的变化相似性/>
Figure 139868DEST_PATH_IMAGE108
在本发明实施例中,修正系数
Figure 171410DEST_PATH_IMAGE109
取2,不同生产环境不同,具体修正系数数值可根据具体实施方式具体设置。
Figure 702885DEST_PATH_IMAGE110
中的/>
Figure 319243DEST_PATH_IMAGE111
从2开始取值是为了保证后续使用的数据均为历史数据;/>
Figure 305785DEST_PATH_IMAGE112
表示预设邻域时段的时间长度,且该数量不小于2;在每个采集点在预设邻域时段内的污染信息与空气质量评价的变化相似性的表达式中,修正系数能够保证整体数值的分母不为0;/>
Figure 923324DEST_PATH_IMAGE113
中的分子和分母上分别加上1的目的是保证该分式的分母不为0,该分式中每个采集点在预设邻域时段内的污染信息与空气质量评价的比值绝对值越大时,代表变化相似性越大;/>
Figure 907591DEST_PATH_IMAGE114
的值越大,代表采集点在预设邻域时段内的污染信息与空气质量评价的变化相似性就越大。
(4) 根据变化相似性和各个聚类簇中污染信息的分布离散程度获得第三聚类效果评价指标,具体包括:
根据获取的区域中对于某些数据敏感的,故需要对于获取的聚类簇中,其中数据相关性越大,则其在聚类结果中所有聚类簇相应的数据差异就越小。
根据变化相似性和各个聚类簇中污染信息的分布离散程度获得第三聚类效果评价指标:
Figure 675827DEST_PATH_IMAGE115
其中,
Figure 141093DEST_PATH_IMAGE116
表示污染信息的第三聚类效果评价指标,/>
Figure 412806DEST_PATH_IMAGE117
表示聚类簇的数量,/>
Figure 692609DEST_PATH_IMAGE118
表示以自然常数为底的指数函数,/>
Figure 823507DEST_PATH_IMAGE119
表示污染信息与空气质量评价的变化相关性,/>
Figure 680080DEST_PATH_IMAGE120
表示在第/>
Figure 540720DEST_PATH_IMAGE121
个聚类簇对应的污染信息的方差。
需要说明的是,因为在一个优选实施例中考虑到了一氧化碳含量、二氧化硫含量、
Figure 663528DEST_PATH_IMAGE122
、二氧化碳含量和一氧化氮含量五种污染信息,因此可获得五种变化相关性,所以在计算第三聚类效果评价指标时,需要将对应的五种变化相关性累加作为最终的第三聚类效果评价指标。
即当一个污染信息的指标其对应的与空气质量评价相关性越强,那么对于要在同一要求下获取其他变量对空气评价的影响程度,就需要获取的聚类簇中的簇内元素之间指标的差异越小,则越能保证后续获取的其他因素对于空气评价的影响程度的准确性。当获取的变化相似性和各个聚类簇中污染信息的分布离散程度越小时,即所求第三聚类效果评价指标越小,则说明聚类效果越好。
步骤003:改变初始聚类过程中的聚类半径,根据第一聚类效果评价指标、第二聚类效果评价指标和第三聚类效果评价指标确定最优聚类半径。
1. 根据第一聚类效果评价指标、第二聚类效果评价指标和第三聚类效果评价指标获得综合聚类效果评价指标。
污染信息的第一聚类效果评价指标
Figure 436766DEST_PATH_IMAGE123
和第三聚类效果评价指标/>
Figure 896698DEST_PATH_IMAGE124
与综合聚类效果评价指标/>
Figure 611844DEST_PATH_IMAGE125
呈负相关关系;污染信息的第二聚类效果评价指标/>
Figure 374395DEST_PATH_IMAGE126
与综合聚类效果评价指标
Figure 539272DEST_PATH_IMAGE127
呈正相关关系;在本发明实施例中,综合聚类效果评价指标的表达式为:
Figure 900764DEST_PATH_IMAGE128
其中,
Figure 234532DEST_PATH_IMAGE129
为综合聚类效果评价指标,/>
Figure 292617DEST_PATH_IMAGE130
为污染信息的第一聚类效果评价指标,/>
Figure 611036DEST_PATH_IMAGE131
为污染信息的第二聚类效果评价指标,/>
Figure 881611DEST_PATH_IMAGE132
为污染信息的第三聚类效果评价指标。
当所求综合聚类效果评价指标
Figure 305770DEST_PATH_IMAGE133
越大时,则说明聚类效果越好。
2. 改变初始聚类过程中的聚类半径根据综合聚类效果评价指标确定最优聚类半径:
若综合聚类效果评价指标大于预设指标阈值,则取综合聚类效果评价指标对应的聚类半径作为最优聚类半径;
若综合聚类效果评价指标不大于预设指标阈值,则增大聚类半径继续对污染信息进行聚类;直至对应的综合聚类效果评价指标大于预设指标阈值。
在本发明实施例中,将综合聚类效果评价指标归一化处理,方便预设指标阈值的设置,指标阈值设置为0.7,不同生产环境不同,具体预设阈值可根据具体实施方式具体设置。
例如,初始聚类半径r为3,聚类后分析得到的综合聚类效果评价指标,将综合聚类效果评价指标归一化处理得到数值0.5,由于小于预设指标阈值0.7,增大初始聚类半径r为4,将得到的综合聚类效果评价指标归一化处理得到数值0.8,大于0.7,取该综合聚类效果评价指标对应的聚类半径4作为最优聚类半径。
步骤004:利用最优聚类半径根据采集点的初始聚类距离对采集点进行聚类,得到至少两个第一聚类簇;任选一个目标环境信息,在初始聚类距离获取过程中去除目标环境信息,获得最终聚类距离,并进行聚类,得到至少两个第二聚类簇;根据待识别采集点所属的第一聚类簇和第二聚类簇对应的空气质量评价差异获取目标环境信息对空气质量评价的影响程度。
在本发明实施例中,使用的聚类算法为自适应聚类半径的DBSCAN聚类算法。利用最优聚类半径对采集点的污染信息和环境信息进行聚类,能够多方面、多维度地反映出采集点的大气污染情况的准确性。需要说明的是,DBSCAN聚类算法为本领域技术人员熟知的技术手段,不再赘述。
利用最优聚类半径根据采集点的初始聚类距离
Figure 534757DEST_PATH_IMAGE134
对采集点进行聚类,得到至少两个第一聚类簇。
任选一个环境信息,采集点去除选择的环境信息的聚类距离最为最终聚类距离,最终聚类距离的表达式为:
Figure 939807DEST_PATH_IMAGE135
其中,
Figure 748494DEST_PATH_IMAGE136
表示最终聚类距离,/>
Figure 699263DEST_PATH_IMAGE137
表示任意两个采集点的污染信息中一氧化碳含量的差值,/>
Figure 774185DEST_PATH_IMAGE138
表示任意两个采集点的污染信息中二氧化硫含量的差值,/>
Figure 810406DEST_PATH_IMAGE139
表示任意两个采集点的污染信息中/>
Figure 953942DEST_PATH_IMAGE140
的差值,/>
Figure 553026DEST_PATH_IMAGE141
表示任意两个采集点的污染信息中二氧化碳含量的差值,/>
Figure 327078DEST_PATH_IMAGE142
表示任意两个采集点的污染信息中一氧化氮含量的差值,/>
Figure 912911DEST_PATH_IMAGE143
表示任意两个采集点的环境信息中时间信息的差值,/>
Figure 328980DEST_PATH_IMAGE144
表示任意两个采集点的环境信息中环境风速的差值,/>
Figure 737832DEST_PATH_IMAGE145
表示任意两个采集点的环境信息中坐标位置的差值,/>
Figure 745103DEST_PATH_IMAGE146
表示任意两个采集点的去除任选的一个环境信息的差值。例如,目标环境信息为时间信息,则/>
Figure 349390DEST_PATH_IMAGE147
,/>
Figure 566221DEST_PATH_IMAGE148
利用最终聚类距离对采集点进行聚类,得到至少两个第二聚类簇。
获取待识别采集点所属的第一聚类簇和第二聚类簇中空气质量评价均值的差值绝对值,以差值绝对值作为环境信息对空气质量评价的影响程度,具体包括:
Figure 939564DEST_PATH_IMAGE149
其中,
Figure 993102DEST_PATH_IMAGE150
为环境信息对空气质量评价的影响程度,/>
Figure 350265DEST_PATH_IMAGE151
表示待识别采集点所属的第一聚类簇中的空气质量评价均值,/>
Figure 252012DEST_PATH_IMAGE152
表示待识别采集点所属的第二聚类簇中的空气质量评价均值。
环境信息对空气质量评价的影响程度
Figure 479862DEST_PATH_IMAGE153
越大,则说明环境信息对空气质量评价的影响越大。
需要说明的是,因为在一个优选实施例中考虑到了时间信息、环境风速和坐标位置三种环境信息,因此可通过改变目标环境信息的类别,获得三种环境信息对空气质量评价的影响程度。
环境信息对空气质量评价的影响程度包括:时间信息对空气质量评价的第一影响程度
Figure 563356DEST_PATH_IMAGE154
、环境风速对空气质量评价的第二影响程度/>
Figure 139306DEST_PATH_IMAGE155
和坐标位置对空气质量评价第三的影响程度/>
Figure 841814DEST_PATH_IMAGE156
步骤005:根据所述待识别采集点对应的每个所述环境信息的影响程度调整所述待识别采集点的实时空气质量评价,获得最终空气质量评价,确定所述待识别采集点的大气污染情况。
根据待识别采集点的风速和影响程度调整待识别采集点的实时空气质量评价,获得最终空气质量评价指标:
Figure 924170DEST_PATH_IMAGE157
其中,
Figure 178565DEST_PATH_IMAGE158
表示最终空气质量评价,/>
Figure 235952DEST_PATH_IMAGE159
表示待识别采集点的采集传感器的数量,/>
Figure 335627DEST_PATH_IMAGE160
表示第一影响程度,/>
Figure 944594DEST_PATH_IMAGE161
表示第二影响程度,/>
Figure 366960DEST_PATH_IMAGE162
表示第三影响程度,/>
Figure 592536DEST_PATH_IMAGE163
表示待识别采集点的环境风速,/>
Figure 964743DEST_PATH_IMAGE164
表示待识别采集点在采集传感器处的实时空气质量评价。另外,Ho为待识别采集点在采集传感器处的实时空气质量评价,采集传感器有x个,因此说待识别采集点对应的Ho也有x个。
待识别采集点的风速对空气质量评价的第二影响程度和风速的差值能够反映整体环境风速对最终空气质量评价的影响,即风速越大,所采集到的空气质量评价越不准确,结合时间信息对空气质量评价的第一影响程度、环境风速对空气质量评价的第二影响程度以及实时空气质量评价,获得的最终空气质量评价对大气污染情况的识别更准确、更及时。当所求最终空气质量评价越小时,则说明待识别采集点的空气质量越差。
在本发明实施例中,设置评价阈值为0.1,不同生产环境不同,具体阈值可根据具体实施方式具体设置。
若所求最终空气质量评价
Figure 962305DEST_PATH_IMAGE165
小于评价阈值,认为待识别采集点的大气受到污染;若所求最终空气质量评价/>
Figure 558502DEST_PATH_IMAGE165
不小于评价阈值,认为待识别采集点的大气没有受到污染。
需要说明的是:上述本发明实施例先后顺序仅仅为了描述,不代表实施例的优劣。在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
综上所述,本发明通过对获取的污染信息、环境信息和空气质量评价的分析,获取环境信息对空气质量评价的影响程度,对待识别采集点直接获取的信息进行调整,结合环境信息对空气质量评价的影响程度和空气质量评价对实时空气情况数据进行分析,得到准确的、真实的大气污染在线识别效果。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (5)

1.一种大气污染在线识别方法,其特征在于,该方法包括以下步骤:
获得每个采集点的污染信息、至少两种环境信息和空气质量评价;
根据所述污染信息和所述环境信息获得不同采集点的初始聚类距离,并进行初始聚类,得到至少两个聚类簇;根据各个所述聚类簇中样本的分布离散程度获得第一聚类效果评价指标;根据整体所述聚类簇的分布离散程度获得第二聚类效果评价指标;确定每个采集点在预设邻域时段内的污染信息与空气质量评价的变化相似性;根据所述变化相似性和各个所述聚类簇中污染信息的分布离散程度获得第三聚类效果评价指标;
改变所述初始聚类过程中的聚类半径,根据所述第一聚类效果评价指标、所述第二聚类效果评价指标和所述第三聚类效果评价指标确定最优聚类半径;
利用所述最优聚类半径根据采集点的所述初始聚类距离对采集点进行聚类,得到至少两个第一聚类簇;任选一个目标环境信息,在初始聚类距离获取过程中去除所述目标环境信息,获得最终聚类距离,并进行聚类,得到至少两个第二聚类簇;根据待识别采集点所属的第一聚类簇和第二聚类簇对应的空气质量评价差异获取所述目标环境信息对空气质量评价的影响程度;
根据所述待识别采集点对应的每个所述环境信息的影响程度调整所述待识别采集点的实时空气质量评价,获得最终空气质量评价,确定所述待识别采集点的大气污染情况;
所述确定每个采集点在预设邻域时段内的污染信息与空气质量评价的变化相似性的方法包括:
根据每个采集点在预设邻域时段内的污染信息与空气质量评价的变化相似性公式获得所述变化相似性,所述每个采集点在预设邻域时段内的污染信息与空气质量评价的变化相似性公式为:
Figure QLYQS_2
其中,/>
Figure QLYQS_3
表示所述污染信息的各个指标与空气质量评价的相关性,/>
Figure QLYQS_4
表示所述预设邻域时段的时间长度,/>
Figure QLYQS_5
表示第/>
Figure QLYQS_6
个所述采集点的所述污染信息,/>
Figure QLYQS_7
表示第/>
Figure QLYQS_8
个所述采集点的所述污染信息对应的所述空气质量评价,/>
Figure QLYQS_1
为修正系数;所述根据所述变化相似性和各个所述聚类簇中污染信息的分布离散程度获得第三聚类效果评价指标包括:
所述第三聚类效果评价指标的公式为:
Figure QLYQS_9
其中,/>
Figure QLYQS_10
表示所述第三聚类效果评价指标,/>
Figure QLYQS_11
表示所述聚类簇的数量,/>
Figure QLYQS_12
表示以自然常数为底的指数函数,/>
Figure QLYQS_13
表示所述污染信息与空气质量评价的变化相关性,/>
Figure QLYQS_14
表示在第/>
Figure QLYQS_15
个所述聚类簇对应的所述污染信息的方差;
所述每个采集点的污染信息和环境信息包括:
每个所述采集点的污染信息包括一氧化碳含量、二氧化硫含量、
Figure QLYQS_16
、二氧化碳含量和一氧化氮含量;
每个所述采集点的环境信息包括时间信息、环境风速和坐标位置;
所述根据待识别采集点所属的第一聚类簇和第二聚类簇对应的空气质量评价差异获取所述目标环境信息对空气质量评价的影响程度,包括:
获取所述待识别采集点所属的所述第一聚类簇和第二聚类簇中空气质量评价均值的差值绝对值,以所述差值绝对值作为所述目标环境信息对空气质量评价的影响程度;
所述影响程度包括:时间信息对空气质量评价的第一影响程度、环境风速对空气质量评价的第二影响程度和坐标位置对空气质量评价的第三影响程度;
确定最终空气质量评价包括:
根据最终空气质量评价公式获得所述最终空气质量评价,所述最终空气质量评价公式为:
Figure QLYQS_18
其中,/>
Figure QLYQS_19
表示所述最终空气质量评价,/>
Figure QLYQS_20
表示所述待识别采集点的采集传感器的数量,/>
Figure QLYQS_21
表示所述第一影响程度,/>
Figure QLYQS_22
表示所述第二影响程度,
Figure QLYQS_23
表示所述第三影响程度,/>
Figure QLYQS_24
表示所述待识别采集点的环境风速,/>
Figure QLYQS_17
表示所述待识别采集点在采集传感器处的实时空气质量评价。
2.根据权利要求1所述的一种大气污染在线识别方法,其特征在于,所述根据各个所述聚类簇中样本的分布离散程度获得第一聚类效果评价指标,包括:
获取各个所述聚类簇内每个样本与对应聚类簇中心之间的第一污染信息差异距离,所述第一污染信息差异距离的累加和作为第一聚类效果评价指标。
3.根据权利要求1所述的一种大气污染在线识别方法,其特征在于,所述根据整体所述聚类簇的分布离散程度获得第二聚类效果评价指标,包括:
获取各个所述聚类簇内的污染信息与所有所述聚类簇对应的污染信息均值之间的第二污染信息差异距离,所述第二污染信息差异距离的累加和作为第二聚类效果评价指标。
4.根据权利要求1所述的一种大气污染在线识别方法,其特征在于,所述根据所述第一聚类效果评价指标、所述第二聚类效果评价指标和所述第三聚类效果评价指标确定最优聚类半径,包括:
根据所述第一聚类效果评价指标、所述第二聚类效果评价指标和所述第三聚类效果评价指标获得综合聚类效果评价指标;
污染信息的所述第一聚类效果评价指标和所述第三聚类效果评价指标与综合聚类效果评价指标呈负相关关系;污染信息的所述第二聚类效果评价指标与综合聚类效果评价指标呈正相关关系;根据所述综合聚类效果评价指标的数值确定所述最优聚类半径。
5.根据权利要求4所述的一种大气污染在线识别方法,其特征在于,所述根据所述综合聚类效果评价指标的数值确定所述最优聚类半径包括:
若所述综合聚类效果评价指标大于预设指标阈值,则取所述综合聚类效果评价指标对应的所述聚类半径作为所述最优聚类半径;
若所述综合聚类效果评价指标不大于所述预设指标阈值,则增大所述聚类半径继续对所述污染信息和所述环境信息进行聚类,直至对应的所述综合聚类效果评价指大于所述预设指标阈值。
CN202211454170.8A 2022-11-21 2022-11-21 一种大气污染在线识别方法 Active CN115659195B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211454170.8A CN115659195B (zh) 2022-11-21 2022-11-21 一种大气污染在线识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211454170.8A CN115659195B (zh) 2022-11-21 2022-11-21 一种大气污染在线识别方法

Publications (2)

Publication Number Publication Date
CN115659195A CN115659195A (zh) 2023-01-31
CN115659195B true CN115659195B (zh) 2023-06-27

Family

ID=85019326

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211454170.8A Active CN115659195B (zh) 2022-11-21 2022-11-21 一种大气污染在线识别方法

Country Status (1)

Country Link
CN (1) CN115659195B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117633697B (zh) * 2024-01-26 2024-05-03 西安艺琳农业发展有限公司 基于物联网的生猪智能监测方法及系统

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107340364A (zh) * 2017-05-31 2017-11-10 北京市环境保护监测中心 基于海量大气污染浓度数据的污染空间分析方法及装置
CN108387692A (zh) * 2018-04-25 2018-08-10 深圳森阳环保材料科技有限公司 一种大气污染智能监测系统
CN110298560B (zh) * 2019-06-13 2022-12-06 南方科技大学 一种大气污染排放控制效果的评估方法、装置及存储介质
CN112508056B (zh) * 2020-11-13 2022-04-29 东南大学 基于移动多源感知的城市空气质量监测方法
CN113804829A (zh) * 2021-08-20 2021-12-17 重庆市生态环境监测中心 一种大气污染天空地一体化实时监测系统及方法
CN114239271A (zh) * 2021-12-16 2022-03-25 中科三清科技有限公司 一种大气污染预警方法、装置和设备

Also Published As

Publication number Publication date
CN115659195A (zh) 2023-01-31

Similar Documents

Publication Publication Date Title
CN110796284B (zh) 细颗粒物污染等级的预测方法、装置及计算机设备
Gore et al. An approach for classification of health risks based on air quality levels
CN115659195B (zh) 一种大气污染在线识别方法
CN110378520A (zh) 一种pm2.5浓度预测和预警方法
CN111289697B (zh) Cems运行状态监控与数据作假识别方法及系统
CN115876258B (zh) 基于多源数据的畜禽养殖环境异常监测及报警系统
Cacciola et al. Aspects about air pollution prediction on urban environment
CN114839343B (zh) 一种便携式水质监测巡检仪装置及使用方法
CN113758890A (zh) 一种气体浓度计算方法、装置、设备及存储介质
CN110334767B (zh) 一种用于空气质量分类的改进随机森林方法
CN112702408A (zh) 基于多感知功能的物联网系统及方法
CN114935527A (zh) 一种基于油井天然气开采的传感器智能清洁方法及系统
CN114217025A (zh) 评估空气质量浓度预测中气象数据对其影响的分析方法
CN114066070A (zh) 基于人工智能和数值计算的天气预报方法
CN115169504B (zh) 一种煤气精脱硫工艺中的设备异常识别方法
Pal et al. Effectiveness of machine learning algorithms in forecasting AQI
CN114970977A (zh) 数字化城市空气质量监测数据的异常数据检测方法及系统
CN113628741A (zh) 一种基于呼出气体标志物检测的健康状态识别方法
JP3896928B2 (ja) におい測定装置
Azizan et al. A Framework to Spatially Cluster Air Quality Monitoring Stations in Peninsular Malaysia using the Hybrid Clustering Method
Hussain et al. A Deep Learning Approach for Classification and Measurement of Hazardous Gases Using Multi-Sensor Data Fusion
CN112201355B (zh) 一种健康评估迭代分类器模型的构建方法
Sharan et al. Bi-LSTM based Air Pollution Risk Likelihood Prognostication using Ensemble Approach
KR20190027263A (ko) 냄새 측정 장치 및 그 동작방법
MAHMOOD et al. One Step Ahead Prediction of Ozone Concentration for Determination of Outdoor Air Quality Level

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant