CN117408520A - 一种数据服务智能识别方法及系统 - Google Patents
一种数据服务智能识别方法及系统 Download PDFInfo
- Publication number
- CN117408520A CN117408520A CN202311686730.7A CN202311686730A CN117408520A CN 117408520 A CN117408520 A CN 117408520A CN 202311686730 A CN202311686730 A CN 202311686730A CN 117408520 A CN117408520 A CN 117408520A
- Authority
- CN
- China
- Prior art keywords
- dust monitoring
- dust
- pollution source
- abnormal
- monitoring points
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 41
- 238000012544 monitoring process Methods 0.000 claims abstract description 421
- 239000000428 dust Substances 0.000 claims abstract description 403
- 230000002159 abnormal effect Effects 0.000 claims abstract description 121
- 230000008859 change Effects 0.000 claims abstract description 115
- 238000009792 diffusion process Methods 0.000 claims abstract description 48
- 230000001174 ascending effect Effects 0.000 claims description 32
- 238000012795 verification Methods 0.000 claims description 27
- 238000004422 calculation algorithm Methods 0.000 claims description 12
- 238000003915 air pollution Methods 0.000 claims description 9
- 238000004590 computer program Methods 0.000 claims description 6
- 238000007637 random forest analysis Methods 0.000 claims description 4
- 238000003066 decision tree Methods 0.000 claims description 3
- 238000011835 investigation Methods 0.000 claims description 2
- 238000012545 processing Methods 0.000 abstract description 4
- 230000005856 abnormality Effects 0.000 description 11
- 239000002912 waste gas Substances 0.000 description 6
- 238000009776 industrial production Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000011109 contamination Methods 0.000 description 4
- 238000009435 building construction Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 239000007789 gas Substances 0.000 description 2
- 230000002265 prevention Effects 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N15/00—Investigating characteristics of particles; Investigating permeability, pore-volume or surface-area of porous materials
- G01N15/06—Investigating concentration of particle suspensions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Tourism & Hospitality (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Marketing (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Development Economics (AREA)
- General Business, Economics & Management (AREA)
- Educational Administration (AREA)
- Entrepreneurship & Innovation (AREA)
- Chemical & Material Sciences (AREA)
- Game Theory and Decision Science (AREA)
- Pathology (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Immunology (AREA)
- Biochemistry (AREA)
- Analytical Chemistry (AREA)
- Dispersion Chemistry (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Primary Health Care (AREA)
- Sampling And Sample Adjustment (AREA)
Abstract
本发明涉及数据处理技术领域,提出了一种数据服务智能识别方法及系统,包括:采集粉尘监测点处空气中的粉尘含量,构建粉尘监测序列,计算粉尘监测点的异常代表得分,获取异常粉尘监测点;根据异常粉尘监测点的位置,获取密集粉尘监测点,计算密集粉尘监测点的异常代表得分,获取渐变粉尘监测点;计算所有渐变粉尘监测点的粉尘浓度扩散变化率,确定高可信度疑似污染源监测点,计算高可信度疑似污染源监测点的平稳浓度持续指数,获取真实污染源监测点;根据真实污染源监测点的位置和粉尘监测序列,对污染源真实所在位置采取污染防治措施。本发明旨在解决粉尘污染源较多导致的难以快速准确地获取污染源真实位置的问题。
Description
技术领域
本发明涉及数据处理技术领域,具体涉及一种数据服务智能识别方法及系统。
背景技术
随着信息智能管理时代的发展,对于城市空气质量监测的方式逐渐信息化、智能化,越来越多的城市空气监测采用智能监测的方法。作为城市空气中污染源之一的粉尘,其主要来源为工业生产时产生的废气粉尘,此类粉尘的来源由于排放量大、浓度高的特点,会对城市空气产生持续性的污染,所以绝大部分的工业生产都应具备相应的废气处理装置,当废气处理达标后才可在空气中进行排放。
然而工业生产难免存在部分企业在废气处理装置上缺乏管理维护,甚至采用劣质的处理装置,导致最后废气的排放不达标,对城市空气造成污染,因此,获取污染源的真实所在位置,进而对污染源真实所在位置采取污染防治措施具有非常重要的现实意义。
但是由于城市中产生粉尘的因素较多,空气粉尘污染来源情况复杂,对于突发污染状况,难以快速准确地获取污染源真实位置,导致对空气污染状况的污染防治措施实行延误。
发明内容
为了解决城市中粉尘污染源较多导致的难以快速准确地获取污染源真实位置的技术问题,本发明的目的在于提供一种数据服务智能识别方法及系统,所采用的技术方案具体如下:
第一方面,本发明实施例提供了一种数据服务智能识别方法,该方法包括以下步骤:
采集粉尘监测点处空气中的粉尘含量,构建粉尘监测序列;
根据粉尘监测序列的异常程度,计算粉尘监测点的异常代表得分,获取异常粉尘监测点;
根据异常粉尘监测点的位置,获取密集粉尘监测点;
根据密集粉尘监测点的异常代表得分,获取疑似污染源粉尘监测点和验证粉尘监测点;
根据疑似污染源粉尘监测点和验证粉尘监测点,获取渐变粉尘监测点和渐变粉尘监测点升序序列;
根据渐变粉尘监测点的异常代表得分、粉尘监测序列和渐变粉尘监测点升序序列,计算所有渐变粉尘监测点的粉尘浓度扩散变化率;
根据所有渐变粉尘监测点的粉尘浓度扩散变化率,获取疑似污染源粉尘监测点的污染源真实度,确定高可信度疑似污染源监测点;
根据高可信度疑似污染源监测点的异常代表得分和粉尘监测序列,计算高可信度疑似污染源监测点的平稳浓度持续指数,获取真实污染源监测点;
根据真实污染源监测点的位置和粉尘监测序列,对污染源真实所在位置采取污染防治措施。
优选的,所述根据粉尘监测序列的异常程度,计算粉尘监测点的异常代表得分,获取异常粉尘监测点,包括:
将粉尘监测点的粉尘监测序列作为孤立森林算法的输入,获取粉尘监测点的粉尘监测序列中每个元素的异常值分数;
将粉尘监测点的粉尘监测序列中所有元素的异常值分数的平均值记为粉尘监测点的异常代表得分;
将异常代表得分大于预设第一阈值的粉尘监测点记为异常粉尘监测点。
优选的,所述根据异常粉尘监测点的位置,获取密集粉尘监测点,包括:
将所有异常粉尘监测点之间的欧氏距离的均值记为第一均值;
将第一均值的向上取整值记为第一整数;
将第一整数作为异常监测算法中的参数值,使用异常监测算法获取异常粉尘监测点的局部离群因子;
将局部离群因子小于等于预设第二阈值的异常粉尘监测点记为密集粉尘监测点。
优选的,所述根据密集粉尘监测点的异常代表得分,获取疑似污染源粉尘监测点和验证粉尘监测点,包括:
将密集粉尘监测点根据异常代表得分升序排列,获取密集粉尘监测点升序序列;
将密集粉尘监测点升序序列中前10%的密集粉尘监测点记为疑似污染源粉尘监测点;
将密集粉尘监测点升序序列中后90%的密集粉尘监测点记为验证粉尘监测点。
优选的,所述根据疑似污染源粉尘监测点和验证粉尘监测点,获取渐变粉尘监测点和渐变粉尘监测点升序序列,包括:
任选一个疑似污染源粉尘监测点作为验证起点,任选一个验证粉尘监测点作为验证终点,将验证起点与验证终点的连线记为疑似污染扩散路径;
将疑似污染扩散路径两侧与疑似污染扩散路径的距离小于预设最小污染距离的所有验证粉尘监测点记为渐变粉尘监测点;
将渐变粉尘监测点按照与验证起点的距离升序排列,获取渐变粉尘监测点升序序列。
优选的,所述根据渐变粉尘监测点的异常代表得分、粉尘监测序列和渐变粉尘监测点升序序列,计算所有渐变粉尘监测点的粉尘浓度扩散变化率,包括:
任选一个渐变粉尘监测点记为待测渐变粉尘监测点,将待测渐变粉尘监测点的粉尘监测序列中第一个异常数据的采集时刻,记为待测渐变粉尘监测点的异常开始时刻;
将渐变粉尘监测点升序序列中位于待测渐变粉尘监测点之前,同时与待测渐变粉尘监测点相邻的渐变粉尘监测点记为待测渐变粉尘监测点的邻近粉尘监测点;
将待测渐变粉尘监测点与待测渐变粉尘监测点的邻近粉尘监测点的异常开始时刻的差值记为第一差值;
将第一差值与数字1的和记为第一分母;
将待测渐变粉尘监测点与待测渐变粉尘监测点的邻近粉尘监测点的异常代表得分的差值记为第一分子;
将第一分子与第一分母的比值记为待测渐变粉尘监测点的粉尘浓度扩散变化率;
按照上述方法计算所有渐变粉尘监测点的粉尘浓度扩散变化率。
优选的,所述根据所有渐变粉尘监测点的粉尘浓度扩散变化率,获取疑似污染源粉尘监测点的污染源真实度,确定高可信度疑似污染源监测点,包括:
将渐变粉尘监测点与相邻的前一个渐变粉尘监测点的粉尘浓度扩散变化率的差值记为渐变粉尘监测点的扩散差值;
将所有渐变粉尘监测点的扩散差值之和记为第一累加和;
将第一累加和的相反数记为第一相反数;
将第一相反数的归一化值记为疑似污染源粉尘监测点的污染源真实度;
将污染源真实度大于预设第四阈值的疑似污染源粉尘监测点记为高可信度疑似污染源监测点。
优选的,所述根据高可信度疑似污染源监测点的异常代表得分和粉尘监测序列,计算高可信度疑似污染源监测点的平稳浓度持续指数,获取真实污染源监测点,包括:
将高可信度疑似污染源监测点的粉尘监测序列中出现异常的采集时刻的个数记为第二分子;
将高可信度疑似污染源监测点的粉尘监测序列中所有出现异常的采集时刻的异常值分数的平均值记为第一均值;
将高可信度疑似污染源监测点的粉尘监测序列中出现异常的采集时刻的异常值分数与第一均值的差值的平方记为出现异常的采集时刻的相对异常值;
将所有出现异常的采集时刻的相对异常值之和记为第二累加和;
将第二累加和与数字1的和记为第二分母;
将第二分子与第二分母的比值记为高可信度疑似污染源监测点的平稳浓度持续指数;
将平稳浓度持续指数最大的高可信度疑似污染源监测点记为真实污染源监测点。
优选的,所述根据真实污染源监测点的位置和粉尘监测序列,对污染源真实所在位置采取污染防治措施,包括:
将以真实污染源监测点的位置为中心,以第一预设长度为半径的圆形区域记为污染源区域;
在污染源区域内进行排查,获取污染源真实所在位置;
预设决策树数量,将风险级别分为严重污染、中度污染和轻度污染三个级别,将真实污染源监测点的粉尘监测序列作为随机森林算法的输入,获取污染源的风险级别;
将污染源的风险级别导入风控预警系统中,风控预警系统基于污染源的风险级别进行处理预案匹配,根据污染源的风险级别在空气污染智慧管理平台上发出预警信息,相关工作人员对污染源真实所在位置采取污染防治措施。
第二方面,本发明实施例还提供了一种数据服务智能识别系统,包括存储器、处理器以及存储在所述存储器中并在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述任意一项所述方法的步骤。
本发明至少具有如下有益效果:
本发明先根据粉尘监测点的异常程度,获取异常粉尘监测点,根据异常粉尘监测点的局部离群因子,获取密集粉尘监测点,然后根据工业污染的扩散性特征,剔除由于建筑施工等原因造成的小范围短时污染情况,后续仅对密集粉尘监测点进行分析,提高了获取污染源真实所在位置的效率;根据密集粉尘监测点的异常代表得分,确定疑似污染源粉尘监测点和验证粉尘监测点,计算疑似污染源粉尘监测点的污染源真实度,确定高可信度疑似污染源监测点,计算高可信度疑似污染源监测点的平稳浓度持续指数,综合污染的扩散性和密集性特征,以及污染扩散的平稳性获取真实污染源监测点,提高了获取污染源真实所在位置的准确性,解决了粉尘污染源较多导致的难以快速准确地获取污染源真实位置的问题。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
图1为本发明一个实施例提供的一种数据服务智能识别方法的步骤流程图;
图2为疑似污染扩散路径的示意图。
具体实施方式
为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的一种数据服务智能识别方法及系统,其具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外,一个或多个实施例中的特定特征、结构或特点可由任何合适形式组合。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。
下面结合附图具体的说明本发明所提供的一种数据服务智能识别方法及系统的具体方案。
请参阅图1,其示出了本发明一个实施例提供的一种数据服务智能识别方法的步骤流程图,该方法包括以下步骤:
步骤S001,采集粉尘监测点处空气中的粉尘含量,构建粉尘监测序列,并对粉尘监测序列进行预处理。
具体的,在需要监测空气粉尘含量的目标区域均匀设置N个粉尘监测点,N经验取值为100,将粉尘监测点按照与目标区域中心点的距离升序排列,获取粉尘监测点的编号,在每个粉尘监测点处设置激光粉尘测量仪,每隔T分钟,采集一次空气中的粉尘含量,共采集n次。
将粉尘监测点的粉尘含量按照采集时刻排列,构建粉尘监测序列,采用均值滤波的方法对粉尘监测序列进行去噪。其中均值滤波均为公知技术,本发明不再赘述,T经验取值为30,n经验取值为336。
至此,获取到粉尘监测序列。
步骤S002,根据粉尘监测序列的异常程度,计算粉尘监测点的异常代表得分,获取异常粉尘监测点,根据异常粉尘监测点的位置,获取密集粉尘监测点。
需要说明的是,正常无污染时空气中的粉尘含量较低,而当粉尘监测点处出现空气污染时,粉尘监测序列的元素值会出现异常,可以先根据粉尘监测序列的异常程度,获取异常粉尘监测点。
具体的,首先将同一粉尘监测点的粉尘监测序列作为孤立森林算法的输入,输出粉尘监测点的粉尘监测序列中每个元素的异常值分数,用以衡量粉尘监测点在每个采集时刻粉尘含量的异常程度。
进一步的,将粉尘监测点的粉尘监测序列中所有元素的异常值分数的平均值记为粉尘监测点的异常代表得分,粉尘监测点的异常代表得分越高,说明粉尘监测点越可能出现异常,设置阈值,当粉尘监测点的异常代表得分大于阈值/>时,判定粉尘监测点为异常粉尘监测点,阈值/>经验取值为0.7。
需要说明的是,由于产生粉尘污染时,粉尘会因为空气的流动性,跟随风向进行扩散,导致局部区域内的多个区域都会产生污染情况,即污染区域的周边区域也会受到粉尘的污染,所以如果某处工业生产产生废气污染时,粉尘监测点出现的异常是密集且连续的。
但是当某些区域存在如建筑施工、车辆尾气排放等情况的粉尘污染时,由于其粉尘含量较低,扩散性较弱,只能在小部分区域产生一定的空气粉尘含量超标情况,所以在对空气污染溯源时,需要剔除上述情况,以提高对空气污染溯源的准确性。
具体的,获取每个异常粉尘监测点的位置,计算异常粉尘监测点之间的欧氏距离的均值,将/>的向上取整值记为/>,以/>作为LOF异常监测算法中的k值,获取异常粉尘监测点的LOF局部离群因子/>。
进一步的,当异常粉尘监测点的LOF局部离群因子大于1时,判定异常粉尘监测点为离群粉尘监测点,即局部区域内的空气污染状况仅有此异常粉尘监测点出现异常,异常粉尘监测点的异常越可能是建筑施工等情况导致的;当异常粉尘监测点的LOF局部离群因子小于等于1时,判定异常粉尘监测点为密集粉尘监测点,异常粉尘监测点的异常越可能是工业生产导致的粉尘污染。
至此,获取到密集粉尘监测点。
步骤S003,根据密集粉尘监测点的异常代表得分,获取疑似污染源粉尘监测点和验证粉尘监测点,确定疑似污染扩散路径,得到渐变粉尘监测点,计算所有渐变粉尘监测点的粉尘浓度扩散变化率。
需要说明的是,随着粉尘的扩散,空气中粉尘的含量逐渐降低,异常程度较低,但是,在污染的源头处,粉尘的含量会出现突变,粉尘监测序列的异常程度较高,可以先根据粉尘监测点的异常程度,获取与污染源距离较近的多个粉尘监测点。
具体的,将密集粉尘监测点根据异常代表得分升序排列,选取前10%的密集粉尘监测点作为疑似污染源粉尘监测点,剩余的密集粉尘监测点作为验证粉尘监测点。
选取任意一个疑似污染源粉尘监测点,将疑似污染源粉尘监测点与验证粉尘监测点的连线记为疑似污染扩散路径,将疑似污染扩散路径两侧与疑似污染扩散路径的距离小于最小污染距离P的验证粉尘监测点记为渐变粉尘监测点,最小污染距离P经验取值为80米,疑似污染扩散路径的示意图如图2所示。
将渐变粉尘监测点按照与疑似污染源粉尘监测点的距离升序排列,获取渐变粉尘监测点升序序列。
进一步的,当渐变粉尘监测点的粉尘监测序列中元素的异常值分数大于阈值时,判定渐变粉尘监测点在对应采集时刻出现异常。
需要说明的是,城市中粉尘的扩散情况复杂,可能存在粉尘在扩散过程中被建筑、植被阻挡等情况,导致局部区域的空气中粉尘堆积,浓度较大,此时依赖浓度的变化对粉尘溯源的可靠性较低。由于工业产生的废气会随着空气的传播而扩散,具有时序性以及扩散性。随着时间的推进,空气中的粉尘扩散范围逐渐变大,空气中粉尘的浓度逐渐下降。可以结合浓度变化的时序性,根据粉尘污染的扩散性特征确定污染源的实际位置。
具体的,将渐变粉尘监测点的粉尘监测序列中第一个异常数据的采集时刻,记为渐变粉尘监测点的异常开始时刻。渐变粉尘监测点升序序列中第个渐变粉尘监测点的粉尘浓度扩散变化率可以表示如下:
式中,为渐变粉尘监测点升序序列中第/>个渐变粉尘监测点的粉尘浓度扩散变化率,/>为渐变粉尘监测点升序序列中第/>个渐变粉尘监测点的异常代表得分,/>为渐变粉尘监测点升序序列中第/>个渐变粉尘监测点的异常代表得分。/>为渐变粉尘监测点升序序列中第/>个渐变粉尘监测点的异常开始时刻,/>为渐变粉尘监测点升序序列中第个渐变粉尘监测点的异常开始时刻。
至此,获取到所有渐变粉尘监测点的粉尘浓度扩散变化率。
步骤S004,根据所有渐变粉尘监测点的粉尘浓度扩散变化率,获取疑似污染源粉尘监测点的污染源真实度,确定高可信度疑似污染源监测点。
具体的,基于所有渐变粉尘监测点的粉尘浓度扩散变化率,疑似污染源粉尘监测点的污染源真实度可以表示如下:
式中,为疑似污染源粉尘监测点的污染源真实度,/>为归一化函数,/>为第/>个渐变粉尘监测点的粉尘浓度扩散变化率,/>为第/>个渐变粉尘监测点的粉尘浓度扩散变化率,/>为渐变粉尘监测点的个数。
需要说明的是,当相邻的渐变粉尘监测点的粉尘浓度扩散变化率差异越大,说明疑似污染源粉尘监测点的异常越可能是建筑阻挡等因素造成的,疑似污染源粉尘监测点的污染源真实度值越小;当相邻的渐变粉尘监测点的粉尘浓度扩散变化率差异越小,说明疑似污染源粉尘监测点与污染源真实所在位置距离越近,疑似污染源粉尘监测点的污染源真实度值越大。
进一步的,设定阈值(/>经验取值为0.2),当疑似污染源粉尘监测点的污染源真实度大于阈值/>时,判定疑似污染源粉尘监测点为高可信度疑似污染源监测点,当疑似污染源粉尘监测点的污染源真实度小于等于阈值/>时,判定疑似污染源粉尘监测点为低可信度疑似污染源。
至此,将疑似污染源粉尘监测点划分为高可信度疑似污染源监测点和低可信度疑似污染源。
步骤S005,根据高可信度疑似污染源监测点的异常代表得分和粉尘监测序列,计算高可信度疑似污染源监测点的平稳浓度持续指数,获取真实污染源监测点。
需要说明的是,与污染源真实所在位置距离最近的疑似污染源粉尘监测点,其异常值出现的时间最早,污染浓度越高,并且高浓度持续时间越长,而受其影响的疑似污染源粉尘监测点则会因为污染的扩散性导致异常值分数并不平稳,浓度平稳的时间段存在间隔。
具体的,高可信度疑似污染源监测点的平稳浓度持续指数可以表示如下:
其中,为高可信度疑似污染源监测点的平稳浓度持续指数,/>为高可信度疑似污染源监测点的粉尘监测序列中出现异常的采集时刻的个数,/>为高可信度疑似污染源监测点的粉尘监测序列中第/>个出现异常的采集时刻的异常值分数,/>为高可信度疑似污染源监测点的异常代表得分。
进一步需要说明的是,当高可信度疑似污染源监测点的粉尘监测序列中出现异常的采集时刻的异常值分数差异越小,持续时间越长时,高可信度疑似污染源监测点的平稳浓度持续指数越大,与污染源真实所在位置距离越近;当高可信度疑似污染源监测点的粉尘监测序列中出现异常的采集时刻的异常值分数差异越大,持续时间越短时,高可信度疑似污染源监测点的平稳浓度持续指数越小,越可能为受到污染源影响而出现异常。
进一步的,计算所有高可信度疑似污染源监测点的平稳浓度持续指数,将平稳浓度持续指数最大的高可信度疑似污染源监测点判定为真实污染源监测点。
至此,获取到真实污染源监测点。
步骤S006,根据真实污染源监测点的位置和粉尘监测序列,对污染源真实所在位置采取污染防治措施。
具体的,将以真实污染源监测点的位置为中心,以为半径的圆形区域记为污染源区域,在污染源区域内进行排查,获取污染源真实所在位置,/>经验取值为100米,将真实污染源监测点的粉尘监测序列输入至随机森林算法中,决策树数量为10,对污染源的污染程度进行风险级别评估,风险级别分为:严重污染、中度污染、轻度污染三个级别。其中随机森林算法为公知技术,本发明不再赘述其训练过程,风险级别评估则是基于不同城市不同的公开数据标准获取,利用平台中的先验数据进行训练获取,本发明不再赘述获取过程。
进一步的,将得出的风险级别导入风控预警系统中,风控预警系统基于风险级别进行处理预案匹配,进而最终在空气污染智慧管理平台上发出预警信息,相关工作人员对污染源真实所在位置采取污染防治措施,实现精准的风控打击。
至此,实现对城市空气污染的防控。
基于与上述方法相同的发明构思,本发明实施例还提供了一种数据服务智能识别系统,包括存储器、处理器以及存储在所述存储器中并在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述一种数据服务智能识别方法中任意一项所述方法的步骤。
综上所述,本发明实施例解决了粉尘污染源较多导致的难以快速准确地获取污染源真实位置的问题,本发明通过分析粉尘监测序列的异常程度,获取异常粉尘监测点,根据异常粉尘监测点的位置,获取密集粉尘监测点,根据密集粉尘监测点的异常代表得分,获取疑似污染源粉尘监测点和验证粉尘监测点,计算疑似污染源粉尘监测点的污染源真实度,确定高可信度疑似污染源监测点,进而获取真实污染源监测点,根据真实污染源监测点的位置获取污染源真实所在位置,对污染源真实所在位置采取污染防治措施。
需要说明的是:上述本发明实施例先后顺序仅仅为了描述,不代表实施例的优劣。且上述对本说明书特定实施例进行了描述。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种数据服务智能识别方法,其特征在于,该方法包括以下步骤:
采集粉尘监测点处空气中的粉尘含量,构建粉尘监测序列;
根据粉尘监测序列的异常程度,计算粉尘监测点的异常代表得分,获取异常粉尘监测点;
根据异常粉尘监测点的位置,获取密集粉尘监测点;
根据密集粉尘监测点的异常代表得分,获取疑似污染源粉尘监测点和验证粉尘监测点;
根据疑似污染源粉尘监测点和验证粉尘监测点,获取渐变粉尘监测点和渐变粉尘监测点升序序列;
根据渐变粉尘监测点的异常代表得分、粉尘监测序列和渐变粉尘监测点升序序列,计算所有渐变粉尘监测点的粉尘浓度扩散变化率;
根据所有渐变粉尘监测点的粉尘浓度扩散变化率,获取疑似污染源粉尘监测点的污染源真实度,确定高可信度疑似污染源监测点;
根据高可信度疑似污染源监测点的异常代表得分和粉尘监测序列,计算高可信度疑似污染源监测点的平稳浓度持续指数,获取真实污染源监测点;
根据真实污染源监测点的位置和粉尘监测序列,对污染源真实所在位置采取污染防治措施。
2.根据权利要求1所述的一种数据服务智能识别方法,其特征在于,所述根据粉尘监测序列的异常程度,计算粉尘监测点的异常代表得分,获取异常粉尘监测点,包括:
将粉尘监测点的粉尘监测序列作为孤立森林算法的输入,获取粉尘监测点的粉尘监测序列中每个元素的异常值分数;
将粉尘监测点的粉尘监测序列中所有元素的异常值分数的平均值记为粉尘监测点的异常代表得分;
将异常代表得分大于预设第一阈值的粉尘监测点记为异常粉尘监测点。
3.根据权利要求1所述的一种数据服务智能识别方法,其特征在于,所述根据异常粉尘监测点的位置,获取密集粉尘监测点,包括:
将所有异常粉尘监测点之间的欧氏距离的均值记为第一均值;
将第一均值的向上取整值记为第一整数;
将第一整数作为异常监测算法中的参数值,使用异常监测算法获取异常粉尘监测点的局部离群因子;
将局部离群因子小于等于预设第二阈值的异常粉尘监测点记为密集粉尘监测点。
4.根据权利要求1所述的一种数据服务智能识别方法,其特征在于,所述根据密集粉尘监测点的异常代表得分,获取疑似污染源粉尘监测点和验证粉尘监测点,包括:
将密集粉尘监测点根据异常代表得分升序排列,获取密集粉尘监测点升序序列;
将密集粉尘监测点升序序列中前10%的密集粉尘监测点记为疑似污染源粉尘监测点;
将密集粉尘监测点升序序列中后90%的密集粉尘监测点记为验证粉尘监测点。
5.根据权利要求1所述的一种数据服务智能识别方法,其特征在于,所述根据疑似污染源粉尘监测点和验证粉尘监测点,获取渐变粉尘监测点和渐变粉尘监测点升序序列,包括:
任选一个疑似污染源粉尘监测点作为验证起点,任选一个验证粉尘监测点作为验证终点,将验证起点与验证终点的连线记为疑似污染扩散路径;
将疑似污染扩散路径两侧与疑似污染扩散路径的距离小于预设最小污染距离的所有验证粉尘监测点记为渐变粉尘监测点;
将渐变粉尘监测点按照与验证起点的距离升序排列,获取渐变粉尘监测点升序序列。
6.根据权利要求1所述的一种数据服务智能识别方法,其特征在于,所述根据渐变粉尘监测点的异常代表得分、粉尘监测序列和渐变粉尘监测点升序序列,计算所有渐变粉尘监测点的粉尘浓度扩散变化率,包括:
任选一个渐变粉尘监测点记为待测渐变粉尘监测点,将待测渐变粉尘监测点的粉尘监测序列中第一个异常数据的采集时刻,记为待测渐变粉尘监测点的异常开始时刻;
将渐变粉尘监测点升序序列中位于待测渐变粉尘监测点之前,同时与待测渐变粉尘监测点相邻的渐变粉尘监测点记为待测渐变粉尘监测点的邻近粉尘监测点;
将待测渐变粉尘监测点与待测渐变粉尘监测点的邻近粉尘监测点的异常开始时刻的差值记为第一差值;
将第一差值与数字1的和记为第一分母;
将待测渐变粉尘监测点与待测渐变粉尘监测点的邻近粉尘监测点的异常代表得分的差值记为第一分子;
将第一分子与第一分母的比值记为待测渐变粉尘监测点的粉尘浓度扩散变化率;
按照上述方法计算所有渐变粉尘监测点的粉尘浓度扩散变化率。
7.根据权利要求1所述的一种数据服务智能识别方法,其特征在于,所述根据所有渐变粉尘监测点的粉尘浓度扩散变化率,获取疑似污染源粉尘监测点的污染源真实度,确定高可信度疑似污染源监测点,包括:
将渐变粉尘监测点与相邻的前一个渐变粉尘监测点的粉尘浓度扩散变化率的差值记为渐变粉尘监测点的扩散差值;
将所有渐变粉尘监测点的扩散差值之和记为第一累加和;
将第一累加和的相反数记为第一相反数;
将第一相反数的归一化值记为疑似污染源粉尘监测点的污染源真实度;
将污染源真实度大于预设第四阈值的疑似污染源粉尘监测点记为高可信度疑似污染源监测点。
8.根据权利要求1所述的一种数据服务智能识别方法,其特征在于,所述根据高可信度疑似污染源监测点的异常代表得分和粉尘监测序列,计算高可信度疑似污染源监测点的平稳浓度持续指数,获取真实污染源监测点,包括:
将高可信度疑似污染源监测点的粉尘监测序列中出现异常的采集时刻的个数记为第二分子;
将高可信度疑似污染源监测点的粉尘监测序列中所有出现异常的采集时刻的异常值分数的平均值记为第一均值;
将高可信度疑似污染源监测点的粉尘监测序列中出现异常的采集时刻的异常值分数与第一均值的差值的平方记为出现异常的采集时刻的相对异常值;
将所有出现异常的采集时刻的相对异常值之和记为第二累加和;
将第二累加和与数字1的和记为第二分母;
将第二分子与第二分母的比值记为高可信度疑似污染源监测点的平稳浓度持续指数;
将平稳浓度持续指数最大的高可信度疑似污染源监测点记为真实污染源监测点。
9.根据权利要求1所述的一种数据服务智能识别方法,其特征在于,所述根据真实污染源监测点的位置和粉尘监测序列,对污染源真实所在位置采取污染防治措施,包括:
将以真实污染源监测点的位置为中心,以第一预设长度为半径的圆形区域记为污染源区域;
在污染源区域内进行排查,获取污染源真实所在位置;
预设决策树数量,将风险级别分为严重污染、中度污染和轻度污染三个级别,将真实污染源监测点的粉尘监测序列作为随机森林算法的输入,获取污染源的风险级别;
将污染源的风险级别导入风控预警系统中,风控预警系统基于污染源的风险级别进行处理预案匹配,根据污染源的风险级别在空气污染智慧管理平台上发出预警信息,相关工作人员对污染源真实所在位置采取污染防治措施。
10.一种数据服务智能识别系统,包括存储器、处理器以及存储在所述存储器中并在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1-9任意一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311686730.7A CN117408520B (zh) | 2023-12-11 | 2023-12-11 | 一种数据服务智能识别方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311686730.7A CN117408520B (zh) | 2023-12-11 | 2023-12-11 | 一种数据服务智能识别方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117408520A true CN117408520A (zh) | 2024-01-16 |
CN117408520B CN117408520B (zh) | 2024-03-29 |
Family
ID=89492809
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311686730.7A Active CN117408520B (zh) | 2023-12-11 | 2023-12-11 | 一种数据服务智能识别方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117408520B (zh) |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104270414A (zh) * | 2014-09-12 | 2015-01-07 | 苏州合欣美电子科技有限公司 | 一种电子产品生产线粉尘监测点优化方法 |
CN111443015A (zh) * | 2020-03-04 | 2020-07-24 | 平安国际智慧城市科技股份有限公司 | 大气污染物的溯源方法、装置、计算机设备及存储介质 |
WO2021056160A1 (zh) * | 2019-09-23 | 2021-04-01 | 广州禾信仪器股份有限公司 | 一种VOCs污染的溯源方法 |
WO2021174751A1 (zh) * | 2020-03-02 | 2021-09-10 | 平安国际智慧城市科技股份有限公司 | 基于大数据的污染源定位方法、装置、设备及存储介质 |
CN114329245A (zh) * | 2021-12-29 | 2022-04-12 | 神彩科技股份有限公司 | 一种空气污染的溯源方法、装置、服务器及存储介质 |
CN115760467A (zh) * | 2022-10-20 | 2023-03-07 | 中国矿业大学(北京) | 一种天空地一体化的露天矿区粉尘监测方法及系统 |
CN116381160A (zh) * | 2023-05-08 | 2023-07-04 | 河北先河环保科技股份有限公司 | 基于监测数据的大气污染综合溯源方法及终端 |
CN116626233A (zh) * | 2023-05-08 | 2023-08-22 | 河北先河环保科技股份有限公司 | 基于多源数据融合的大气污染溯源方法、终端及存储介质 |
CN116975378A (zh) * | 2023-09-21 | 2023-10-31 | 江苏云天精筑环境科技有限公司 | 一种基于大数据的设备环境监测方法及系统 |
CN117109582A (zh) * | 2023-08-11 | 2023-11-24 | 合肥工业大学 | 结合传感网络和机器学习的大气污染源定位系统及方法 |
-
2023
- 2023-12-11 CN CN202311686730.7A patent/CN117408520B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104270414A (zh) * | 2014-09-12 | 2015-01-07 | 苏州合欣美电子科技有限公司 | 一种电子产品生产线粉尘监测点优化方法 |
WO2021056160A1 (zh) * | 2019-09-23 | 2021-04-01 | 广州禾信仪器股份有限公司 | 一种VOCs污染的溯源方法 |
WO2021174751A1 (zh) * | 2020-03-02 | 2021-09-10 | 平安国际智慧城市科技股份有限公司 | 基于大数据的污染源定位方法、装置、设备及存储介质 |
CN111443015A (zh) * | 2020-03-04 | 2020-07-24 | 平安国际智慧城市科技股份有限公司 | 大气污染物的溯源方法、装置、计算机设备及存储介质 |
CN114329245A (zh) * | 2021-12-29 | 2022-04-12 | 神彩科技股份有限公司 | 一种空气污染的溯源方法、装置、服务器及存储介质 |
CN115760467A (zh) * | 2022-10-20 | 2023-03-07 | 中国矿业大学(北京) | 一种天空地一体化的露天矿区粉尘监测方法及系统 |
CN116381160A (zh) * | 2023-05-08 | 2023-07-04 | 河北先河环保科技股份有限公司 | 基于监测数据的大气污染综合溯源方法及终端 |
CN116626233A (zh) * | 2023-05-08 | 2023-08-22 | 河北先河环保科技股份有限公司 | 基于多源数据融合的大气污染溯源方法、终端及存储介质 |
CN117109582A (zh) * | 2023-08-11 | 2023-11-24 | 合肥工业大学 | 结合传感网络和机器学习的大气污染源定位系统及方法 |
CN116975378A (zh) * | 2023-09-21 | 2023-10-31 | 江苏云天精筑环境科技有限公司 | 一种基于大数据的设备环境监测方法及系统 |
Non-Patent Citations (1)
Title |
---|
赵存有: "综采工作面粉尘运移机理分析", 《煤炭技术》, vol. 42, no. 12, 10 December 2023 (2023-12-10), pages 157 - 159 * |
Also Published As
Publication number | Publication date |
---|---|
CN117408520B (zh) | 2024-03-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2021051609A1 (zh) | 细颗粒物污染等级的预测方法、装置及计算机设备 | |
CN110319982B (zh) | 基于机器学习的埋地式燃气管线泄漏判断方法 | |
CN110427533B (zh) | 基于时序粒子跟踪的污染传播模式可视分析方法及系统 | |
CN111024898B (zh) | 一种基于CatBoost模型的车辆尾气浓度超标判别方法 | |
CN109543874B (zh) | 一种结合气象条件影响的机场空气质量预测方法 | |
CN113435471A (zh) | 深度特征聚类的高排放移动源污染识别方法及系统 | |
CN115860590B (zh) | 一种企业排放污染数据的智能分析预警方法及系统 | |
CN108197731B (zh) | 一种基于共同训练的机动车尾气遥测与车检结果一致性方法 | |
CN104515725B (zh) | 一种识别异常粒子的方法和系统及其细胞分析仪 | |
US20240133391A1 (en) | Prediction method for stall and surging of axial-flow compressor based on deep autoregressive network | |
CN117195135B (zh) | 一种水污染异常溯源检测方法及系统 | |
CN117113236B (zh) | 一种智慧城市监控系统及数据处理方法 | |
CN113189014A (zh) | 一种融合卫星遥感和地面监测数据的臭氧浓度估算方法 | |
CN117805502B (zh) | 一种基于大数据的城市电磁辐射监测方法及系统 | |
CN110672144B (zh) | 污染源检测方法和装置 | |
CN115659195A (zh) | 一种大气污染在线识别方法 | |
CN116402369A (zh) | 一种智慧城市交通运行安全监测数据评估系统及方法 | |
CN116910677A (zh) | 一种工业仪表故障诊断方法及系统 | |
CN117454283A (zh) | 一种用于风电机组运行检测数据的状态评估方法 | |
CN117408520B (zh) | 一种数据服务智能识别方法及系统 | |
CN110866558A (zh) | 一种基于多源数据融合分析的旋转设备状态预警方法 | |
CN106909502A (zh) | 偶然正确性测试用例识别方法和软件错误定位方法 | |
CN109856321A (zh) | 异常高值点位的确定方法 | |
CN116823067A (zh) | 管网水质清污状态的确定方法、装置及电子设备 | |
CN116011661A (zh) | 一种气象环境负氧离子实时监测算法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |