CN111737321A - 基于数据挖掘的城市大气污染联防联控区域划分方法 - Google Patents
基于数据挖掘的城市大气污染联防联控区域划分方法 Download PDFInfo
- Publication number
- CN111737321A CN111737321A CN202010627532.3A CN202010627532A CN111737321A CN 111737321 A CN111737321 A CN 111737321A CN 202010627532 A CN202010627532 A CN 202010627532A CN 111737321 A CN111737321 A CN 111737321A
- Authority
- CN
- China
- Prior art keywords
- pollution
- urban
- atmospheric pollution
- joint
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 55
- 230000007123 defense Effects 0.000 title claims abstract description 41
- 238000007418 data mining Methods 0.000 title claims abstract description 23
- 238000003915 air pollution Methods 0.000 claims abstract description 24
- 238000004364 calculation method Methods 0.000 claims abstract description 6
- 239000003344 environmental pollutant Substances 0.000 claims description 23
- 231100000719 pollutant Toxicity 0.000 claims description 23
- 238000004422 calculation algorithm Methods 0.000 claims description 15
- 238000005065 mining Methods 0.000 claims description 14
- 230000008859 change Effects 0.000 claims description 12
- 239000011159 matrix material Substances 0.000 claims description 11
- 239000000809 air pollutant Substances 0.000 claims description 6
- 231100001243 air pollutant Toxicity 0.000 claims description 6
- 238000012546 transfer Methods 0.000 claims description 3
- 238000009826 distribution Methods 0.000 abstract description 7
- 230000002265 prevention Effects 0.000 abstract description 3
- 230000002159 abnormal effect Effects 0.000 abstract description 2
- 230000005540 biological transmission Effects 0.000 description 9
- 230000001360 synchronised effect Effects 0.000 description 6
- 238000004088 simulation Methods 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 4
- 238000011156 evaluation Methods 0.000 description 4
- 238000012544 monitoring process Methods 0.000 description 4
- 238000010276 construction Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000005034 decoration Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000009792 diffusion process Methods 0.000 description 2
- 238000004868 gas analysis Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000003860 storage Methods 0.000 description 2
- 102000016979 Other receptors Human genes 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000000691 measurement method Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000010287 polarization Effects 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Tourism & Hospitality (AREA)
- Probability & Statistics with Applications (AREA)
- Artificial Intelligence (AREA)
- Databases & Information Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Educational Administration (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Development Economics (AREA)
- Fuzzy Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及大气污染防治,尤其涉及一种基于数据挖掘的城市大气污染联防联控区域划分方法,利用数据挖掘中的频繁项集技术作为城市间的空气污染相似距离的度量方法,然后采用层次聚类的方法来识别划分联防联控区域。本方法只需要挖掘大气污染数据,发现城市之间的污染模式来确定城市的污染相似距离,基于数据挖掘的方法不需要额外的地理数据,对大气污染数据分布没有要求,对数据的缺失值和异常值不敏感。模型参数较少,不需要复杂的计算,容易实施。本方法具有模型参数少、可解释性强、准确率高、占用资源少、鲁棒性好等优势。
Description
技术领域
本发明涉及大气污染防治,尤其涉及一种基于数据挖掘的城市大气污染联防联控区域划分方法。
背景技术
随着中国经济的快速发展,我国城市区域出现严重的大气污染。大气污染对国家的经济发展和人民的健康都产生了严重的影响。中国的大气污染具有较强的区域性,因此对于大气污染,不能仅对单一的城市治理,而要对具有污染关联的城市群采取区域联防联控能治理政策。国家大型赛事和会议期间采取的区域空气保障措施取得良好效果,也表明了区域联防联控政策比单一城市治理更具优势。科学合理的联防联控区域划分方法是城市大气污染联防联控政策的关键,而目前几乎找不到符合上述场景(城市大气污染联防区域划分)的应用方法。能找到的方法多用于城市大气污染的监测技术和城市间大气污染物的扩散路径模拟以及城市间大气污染传输规律的分析技术。
相关的学术文献1(Wang,H.,Zhao,L.,2018.A joint prevention and controlmechanism for air pollution in the Beijing-Tianjin-Hebei region in chinabased on long-term and massive data mining of pollutant concentration.ATMOSENVIRON 174,25-42.DOI:10.1016/j.atmosenv.2017.11.027)利用城市的污染物浓度数据之间的皮尔森系数(Pearson Correlation Coefficient)作为城市大气污染之间的关联距离度量方法,采用聚类方法来划分污染联合治理区域性。该方法的优点是能直接的运用污染物浓度数据,不需要复杂理论模型,从数据的角度分析城市污染的相似性,划分联防联控区域。
但该方法依赖于皮尔逊相关系数来衡量城市污染之间的相似性距离。皮尔逊相关系数是度量两个正态分布的变量之间线性相关程度,并且皮尔斯相关系数易受极值影响,这导致皮尔森相关系数不适合用于度量复杂的非线性的城市大气污染之间的相似性,会使联防联控区域划分结果不可靠。
学术文献2(Liu,J.,Li,W.,Wu,J.,2018.A framework for delineating theregional boundaries of PM2.5 pollution:A case study of China.ENVIRON POLLUT235,642-651.DOI:10.1016/j.envpol.2017.12.064)通过计算城市之间的PM2.5时间序列数据之间的互关联系数来度量城市的之间的关系。采用时间聚类方法来用于划定PM 2.5的边界并确定PM 2.5污染物相互作用的区域。
此研究的局限主要是对数据的分布要求较高,对数据的缺失和缺失异常值敏感,无法适应复杂的大气污染数据,方法容易造成区域划分不准确。
学术文献3(薛安,耿恩泽.基于复杂网络的中国城市PM_(2.5)区域划分[J].应用基础与工程科学学报,2015,23(S1):68-78.DOI:10.16058/j.issn.1005-0930.2015.s1.008)以城市作为节点,以城市间PM2.5质量浓度的相关性与距离的比值作为边的权重,构建了中国城市PM2.5污染加权网络,并采用Girvan Newman算法(GN算法)对网络进行划分,得到了PM2.5污染的区域分布情况。
此研究的局限主要是要求大气污染数据符合正态分布,并且建立的城市大气污染网络结构模型复杂。GN算法的时间复杂度高,计算效率慢。
相关的现有专利1(CN201710399019.1基于海量大气污染浓度数据的污染空间分析方法及装置)提供一种基于海量大气污染数据的污染空间分析方法及装置,采用双聚类算法,能够获得区县级的大气污染排放高值区域。
包括步骤1)获取地面高密度监测网络监测到的目标区域的大气污染浓度数据;2)将获取到的大气污染浓度数据排列成矩阵的形式,得到大气污染浓度数据矩阵;3)对所述大气污染浓度数据矩阵进行双聚类处理,得到多个不同传感器监测站点的双聚类块;4)将双聚类处理后的大气污染浓度数据利用空间分析工具插值到空气质量模型的网格中,对大气污染浓度数据进行网格化处理;5)将每个网格内的大气污染浓度与周边网格内的大气污染浓度进行对比,确定出高浓度排放网格,最后得到不同双聚类块的高值区域。
现有专利2(CN201910930648.1城市间大气污染传输矩阵的构建方法)属于大气污染控制领域,特别涉及城市间大气污染传输矩阵的构建方法。本发明的目的在于提供一种城市间大气污染传输矩阵的构建方法。通过空气质量仿真软件模拟,分析在不同气象条件下污染物的传播机理,分析城市间大气污染传输规律。
包括步骤:1)统计各城市大气污染物质排放情况;2)在不同气象条件下,计算各城市的污染源对其他受体城市大气污染的贡献率,并以此为依据制作城市间大气污染传输矩阵;3)基于上述城市间大气污染传输矩阵,分析城市间大气污染传输规律。
现有专利3(CN201910024455.X一种大气污染叠加风险区识别及评价方法)涉及一种大气污染叠加风险区识别及评价方法,将受到多个大气污染源影响的污染区域视为污染叠加区域,对其所受叠加污染的严重程度进行风险区域识别及分级评价,
包括步骤:1)根据《大气污染物综合排放标准》中规定的大气污染物的排放限值设置标准大气中各气体成分的存在百分比;2)对大气污染物的来源进行分类;3)采集大气样本进行气体成分和含量的识别;4)对采集点进行区域定位,并监测采集点的风速、风向和大气稳定度;5)对识别出的超标准气体进行气体分析,得出混合气体的组成成分;6)气体分析结果与超标准气体的位置信息结合;7)根据颜色叠加程度对大气污染情况进行分级评价。
上述三项相关的现有专利基本上是侧重大气污染的空间扩散和传播模拟分析,缺乏指导大气污染联防联控区域划分的技术。所述方法需要运用的空气质量仿真模型(AQM),如:CALPUFF和WRF模型。AQM仿真模型需要大量的地理气象数据(地面数据、高空数据、降水数据)。仿真模型需要处理海量的数据,对计算和存储资源都有较高要求。
科学合理的城市大气污染联防联控区域划分方法是保障大气污染联防联控政策的前提,现有技术存在的以下问题:
1.方法的使用受限,现有的研究多建立在数据符合正态分布的假设前提下。
2.实用性差,需要海量的大气污染数据和地理数据,建立复杂的仿真模型,对计算和存储资源都有较高要求。
3.现有的方法对数据的离散值和缺失值较为敏感,会使算法结果缺乏稳健性和可靠性。
发明内容
本发明所要解决的技术问题是克服现有技术中存在的不足,提供一种利用频繁项集聚类方法来划分大气污染区域的方法,针对解决传统基于皮尔森系数作为城市大气污染相似性度量的方法的局限性以及需要借助大气质量模拟软件带来的计算复杂等问题。
本发明是通过以下技术方案予以实现:
一种基于数据挖掘的城市大气污染联防联控区域划分方法:
步骤000:建立城市大气污染共增的项集数据库;
步骤100:根据得到的城市大气污染共增数据库,挖掘城市污染共增模式;
步骤200:根据挖掘的项集,确定城市间大气污染的关联距离;
步骤300:根据建立城市大气污染之间的距离矩阵,采用层次聚类方法对各城市进行联防联控区域划分。
根据上述技术方案,优选地,步骤000包括如下步骤:基于采集自全国城市大气质量实时发布平台的空气污染物数据,对每天的城市污染物浓度,和其前一天相比,计算城市大气污染浓度每天的变化状态,将每天大气污染物浓度变化状态为增长的城市统计作为一条项集,将所有项集整合建立城市空气污染共增数据库。
根据上述技术方案,优选地,步骤100包括以下步骤:
步骤110:设置频繁项集挖掘参数;
步骤120:采用频繁项集挖掘算法,挖掘城市空气污染共增模式之间的频繁项集。
根据上述技术方案,优选地,步骤110包括以下步骤:设置频繁项集挖掘的最小的支持度,即确定城市具有污染相似性的最小相似程度,假设X为项集,则其支持度的计算公式为其中T是组成数据库D的项集,|D|表示数据中的项集总数,如果一个项集是一个频繁的项集,那么它的支持值不小于用户指定的最小支持度。
根据上述技术方案,优选地,步骤120包括以下步骤:项集的支持度表明城市污染之间的关联距离的大小。通过对数据关联距离设置可以从区域中去除不具有污染关联性的城市,排除某些大气污染仅于自身的污染物排放有关,较少受到污染转移的城市。
根据上述技术方案,优选地,步骤200包括以下步骤:根据挖掘的城市之间的频繁项集的支持度计算城市污染之间的相似距离。
根据上述技术方案,优选地,步骤300包括以下步骤:聚类的簇间距离,使用平均链接算法,簇间公式为其中,Davg(Ti,Tj)为簇Ti,Tj之间的距离,|Ti|,|Tj|为簇Ti,Tj中城市的个数。然后设置聚类的终止条件,即可得到联防联控区域划分范围,联防区域的个数。
一种根据权利要求1的基于数据挖掘的城市大气污染联防联控区域划分方法,采用大气污染物浓度数或空气质量指数替代空气污染物数据。
一种根据权利要求1的基于数据挖掘的城市大气污染联防联控区域划分方法,采用共减或共增和共减替代共增。
本发明的有益效果是:提出一种基于数据挖掘的城市大气污染联防联控区域划分方法。基于数据挖掘的频繁项集聚类方法可用于寻找相似的污染模式和识别联合控制区。与现有技术方案相比,本发明的优点具有如下优点:
1.方法无数据的分布限制,具有更好的鲁棒性。
2.不需要借助空气治理仿真软件来建立复杂的数学模型。方法结构简洁、处理高效,不需要大量的计算资源。
3.只需要挖掘城市大气污染数据,不需要海量的地理和气象数据辅助算法的实现
4.基于数据挖掘的聚类方法可以更好地理解大气污染的时空格局,同时划分结果具有可解释性。
附图说明
图1示出了本发明的实施例的京津冀城市层次聚类树状图。
图2示出了本发明的实施例的京津冀城市频繁项集聚类区域划分结果图。
具体实施方式
为了使本技术领域的技术人员更好地理解本发明的技术方案,下面结合附图和最佳实施例对本发明作进一步的详细说明。
如图所示,本发明针对传统基于皮尔森系数作为城市大气污染相似性度量的方法的局限性以及需要借助大气质量模拟软件带来的计算复杂等问题,本发明提出了一种利用频繁项集聚类方法来划分大气污染区域的方法。首先,利用城市间频繁项集的支持度作为城市间的相似距离度量的依据。然后,利用层次聚类的方法来识别划分联防联控区域。本算法具有模型参数少、可解释性强、准确率高、占用资源少、鲁棒性好等优势。
为了达到上述目的,本发明的技术方案如下:
(1)建立城市大气污染共增的项集数据库
基于采集自全国城市空气质量实时发布平台(http://106.37.208.233:20035/)的大气污染物数据,对于城市每天的污染物浓度,和其前一天相比,计算城市大气污染浓度每天的变化状态。将区域内所有的大气污染物浓度变化状态为增长的城市整合作为一条项集。将所有项集整合建立城市大气污染增长状态的项集数据库。
假设C1,C2,C3,C4,C5为城市,每个项集为同天污染物浓度增长的城市。则可得到城市大气污染共增项集数据库,如表1所示。
表1城市大气污染共增项集数据库
序号(id) | 项集(Items) |
1 | C<sub>1</sub>,C<sub>2</sub>,C<sub>3</sub> |
2 | C<sub>4</sub>,C<sub>5</sub> |
3 | C<sub>1</sub>,C<sub>4</sub>,C<sub>5</sub> |
4 | C<sub>2</sub>,C<sub>3</sub>,C<sub>4</sub>,C<sub>5</sub> |
5 | C<sub>1</sub>,C<sub>2</sub>,C<sub>3</sub>,C<sub>4</sub>,C<sub>5</sub> |
(2)根据城市大气污染共增数据库,挖掘城市污染频繁共增模式,步骤如下:
首先,设定频繁项集挖掘参数。频繁项集挖掘(Frequent itemset mining)是一种数据挖掘技术,用于发现经常一起出现的项目组(项集),并揭示隐藏在数据库中的有趣关联。支持度(sup)是表示的是项集同时出现在数据库中的频繁程度的参数。首先,设置频繁项集挖掘的最小的支持度(minsup),即确定城市具有污染相似性的最小相似程度。假设X为项集,则其支持度的计算公式如下所示:
其中T是组成数据库D的项集,|D|表示数据中的项集总数。如果一个项集是一个频繁的项集,那么它的支持值不小于用户指定的最小支持度。
然后,采用频繁项集挖掘算法(Frequent Itemsets),挖掘城市大气污染共增模式之间的频繁项集。项集的支持度表明城市污染之间的关联距离的大小。通过对数据关联距离设置可以从区域中去除不具有污染关联性的城市,排除某些大气污染仅于自身的污染物排放有关,较少受到污染转移的城市。
(3)根据挖掘的项集,确定城市间大气污染的关联距离,步骤如下:
根据挖掘的城市之间的频繁项集的支持度计算城市污染之间的相似距离,在本发明中,假设C1,C2为两个城市,则距离测度公式如下所示:
其中,表示城市C1,C2之间的大气污染相似,sup(C1,C2)表示城市C1,C2频繁项集的支持度,如果城市不具有频繁共增模式,则设置为1。根据公式(1)、(2),建立各城市大气污染的相似距离矩阵,假设C1,C2,C3,C4,C5为城市,则距离矩阵如下所示:
(4)根据城市大气污染关联距离矩阵,采用层次聚类方法对各城市进行联防联控区域划分。聚类的簇间距离,使用平均链接算法,簇间公式如下所示:
其中,Davg(Ti,Tj)为簇Ti,Tj之间的距离,|Ti|,|Tj|为簇Ti,Tj中城市的个数。然后设置聚类的终止条件,即可得到联防联控区域划分范围,联防区域的个数。
以下具体阐述本发明的实施方案,以中国京津冀地区13城市PM2.5大气污染为例,划分京津冀城市PM2.5大气污染联防联控区域。
第一步,建立城市大气污染增长状态的项集数据库
采集京津冀地区13个城市2015-2018年每日的PM2.5浓度,计算城市每日的PM2.5浓度值的变化,将每日浓度变化为增长的城市组成为一个项集,则京津冀城市大气污染增长状态的项集数据库如表2所示:
表2京津冀城市大气污染增长项集数据库
第二步,根据得到的城市大气污染共增数据库,设置最小支持度为0.1,挖掘城市污染共增模式,确定京津冀城市大气污染之间的相似距离,结果如表3所示
表3京津冀城市大气污染共增模式相似距离
第三步,根据建立城市大气污染之间的距离,采用层次聚类方法对各城市进行联防联控区域划分。聚类过程如图1所示,聚类结果如图2所示:
基于数据挖掘的城市空气联防联控区域划分方法,京津冀13个城市在实施联防联控时,应当分为3个联合治理区域,其中保定、廊坊、天津、北京、承德、秦皇岛、唐山为区域,1,邯郸、邢台、衡水、石家庄、沧州为区域2,张家口为区域3。
本发明可推广至挖掘各种大气污染物浓度数或空气质量指数(AQI)之间的频繁项集来对污染联防联控区域划分。算法中城市大气污染的项集数据库表示为城市大气污染之间的同步变化关联距离,城市大气污染的同步变化可以泛化为共增、共减、共增和共减等模式。对同步变化的方式可以做成算法的配置项,对城市大气污染的同步增长和同步降低可以通过增加权重来综合度量城市的大气污染的相似距离。进一步,同步变化的时间间隔可以根据城市所处的地理环境进行调整。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (9)
1.一种基于数据挖掘的城市大气污染联防联控区域划分方法,其特征在于包括以下步骤:
步骤000:建立城市大气污染共增的项集数据库;
步骤100:根据得到的城市大气污染共增数据库,挖掘城市污染共增模式;
步骤200:根据挖掘的项集,确定城市间大气污染的关联距离;
步骤300:根据建立城市大气污染之间的距离矩阵,采用层次聚类方法对各城市进行联防联控区域划分。
2.根据权利要求1所述的一种基于数据挖掘的城市大气污染联防联控区域划分方法,其特征在于步骤000包括如下步骤:基于采集自全国城市大气质量实时发布平台的空气污染物数据,对每天的城市污染物浓度,和其前一天相比,计算城市大气污染浓度每天的变化状态,将每天大气污染物浓度变化状态为增长的城市统计作为一条项集,将所有项集整合建立城市空气污染共增数据库。
3.根据权利要求1所述的一种基于数据挖掘的城市大气污染联防联控区域划分方法,其特征在于步骤100包括以下步骤:
步骤110:设置频繁项集挖掘参数;
步骤120:采用频繁项集挖掘算法,挖掘城市空气污染共增模式之间的频繁项集。
5.根据权利要求3所述的一种基于数据挖掘的城市大气污染联防联控区域划分方法,其特征在于步骤120包括以下步骤:项集的支持度表明城市污染之间的关联距离的大小。通过对数据关联距离设置可以从区域中去除不具有污染关联性的城市,排除某些大气污染仅于自身的污染物排放有关,较少受到污染转移的城市。
6.根据权利要求1所述的一种基于数据挖掘的城市大气污染联防联控区域划分方法,其特征在于步骤200包括以下步骤:根据挖掘的城市之间的频繁项集的支持度计算城市污染之间的相似距离。
8.一种根据权利要求1-7中任一一项的基于数据挖掘的城市大气污染联防联控区域划分方法,其特征在于:采用大气污染物浓度数或空气质量指数替代空气污染物数据。
9.一种根据权利要求1-7中任一一项的基于数据挖掘的城市大气污染联防联控区域划分方法,其特征在于:采用共减或共增和共减替代共增。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010627532.3A CN111737321B (zh) | 2020-07-02 | 2020-07-02 | 基于数据挖掘的城市大气污染联防联控区域划分方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010627532.3A CN111737321B (zh) | 2020-07-02 | 2020-07-02 | 基于数据挖掘的城市大气污染联防联控区域划分方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111737321A true CN111737321A (zh) | 2020-10-02 |
CN111737321B CN111737321B (zh) | 2024-06-14 |
Family
ID=72652493
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010627532.3A Active CN111737321B (zh) | 2020-07-02 | 2020-07-02 | 基于数据挖掘的城市大气污染联防联控区域划分方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111737321B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113723800A (zh) * | 2021-08-27 | 2021-11-30 | 上海幻电信息科技有限公司 | 风险识别模型训练方法及装置、风险识别方法及装置 |
CN114062618A (zh) * | 2022-01-17 | 2022-02-18 | 京友科技(深圳)有限公司 | 基于物联网实现多环境下空气监测汇总系统 |
CN117114245A (zh) * | 2023-10-18 | 2023-11-24 | 长春市联心花信息科技有限公司 | 一种基于数字孪生的城市数据集成方法 |
CN118505450A (zh) * | 2024-02-27 | 2024-08-16 | 南京纳仕嘉科技有限公司 | 一种基于大数据的应急警示教育管理系统及方法 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101887450A (zh) * | 2010-05-19 | 2010-11-17 | 东北电力大学 | 一种随机型分布式数据流频繁项集挖掘系统及其方法 |
CN103678530A (zh) * | 2013-11-30 | 2014-03-26 | 武汉传神信息技术有限公司 | 一种频繁项集快速检出的方法 |
CN105354243A (zh) * | 2015-10-15 | 2016-02-24 | 东南大学 | 基于归并聚类的并行化频繁概率子图搜索方法 |
CN107870934A (zh) * | 2016-09-27 | 2018-04-03 | 武汉安天信息技术有限责任公司 | 一种app用户聚类方法及装置 |
US20180315161A1 (en) * | 2017-04-27 | 2018-11-01 | Daegu Gyeongbuk Institute Of Science And Technology | Frequent pattern mining method and apparatus |
CN109543876A (zh) * | 2018-10-17 | 2019-03-29 | 天津大学 | 一种城市问题的可视化分析方法 |
CN110188131A (zh) * | 2019-06-03 | 2019-08-30 | 西北工业大学 | 一种频繁模式挖掘方法及装置 |
CN111274282A (zh) * | 2020-01-07 | 2020-06-12 | 北京科技大学 | 一种空气质量挖掘系统、方法及数据采集监控装置 |
-
2020
- 2020-07-02 CN CN202010627532.3A patent/CN111737321B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101887450A (zh) * | 2010-05-19 | 2010-11-17 | 东北电力大学 | 一种随机型分布式数据流频繁项集挖掘系统及其方法 |
CN103678530A (zh) * | 2013-11-30 | 2014-03-26 | 武汉传神信息技术有限公司 | 一种频繁项集快速检出的方法 |
CN105354243A (zh) * | 2015-10-15 | 2016-02-24 | 东南大学 | 基于归并聚类的并行化频繁概率子图搜索方法 |
CN107870934A (zh) * | 2016-09-27 | 2018-04-03 | 武汉安天信息技术有限责任公司 | 一种app用户聚类方法及装置 |
US20180315161A1 (en) * | 2017-04-27 | 2018-11-01 | Daegu Gyeongbuk Institute Of Science And Technology | Frequent pattern mining method and apparatus |
CN109543876A (zh) * | 2018-10-17 | 2019-03-29 | 天津大学 | 一种城市问题的可视化分析方法 |
CN110188131A (zh) * | 2019-06-03 | 2019-08-30 | 西北工业大学 | 一种频繁模式挖掘方法及装置 |
CN111274282A (zh) * | 2020-01-07 | 2020-06-12 | 北京科技大学 | 一种空气质量挖掘系统、方法及数据采集监控装置 |
Non-Patent Citations (4)
Title |
---|
CHEE CHIN-HOONG 等: "Algorithms for frequent itemset mining: a literature review", ARTIFICIAL INTELLIGENCE REVIEW: AN INTERNATIONAL SCIENCE AND ENGINEERING JOURNAL, no. 4, 30 April 2019 (2019-04-30), pages 1 - 19 * |
YINLIX: "Kmeans算法找相似商品、FP树找频繁项集", Retrieved from the Internet <URL:www.bing.com> * |
爨玉伟: "多数据库聚类技术", 中国优秀硕士学位论文全文数据库 信息科技辑, no. 10, 15 October 2014 (2014-10-15), pages 1 - 65 * |
胡秋灵;杨哲;: "基于高频AQI数据的关中城市群空气污染规律探索", 中国环境管理, no. 02 * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113723800A (zh) * | 2021-08-27 | 2021-11-30 | 上海幻电信息科技有限公司 | 风险识别模型训练方法及装置、风险识别方法及装置 |
CN113723800B (zh) * | 2021-08-27 | 2024-06-07 | 上海幻电信息科技有限公司 | 风险识别模型训练方法及装置、风险识别方法及装置 |
CN114062618A (zh) * | 2022-01-17 | 2022-02-18 | 京友科技(深圳)有限公司 | 基于物联网实现多环境下空气监测汇总系统 |
CN114062618B (zh) * | 2022-01-17 | 2022-03-18 | 京友科技(深圳)有限公司 | 基于物联网实现多环境下空气监测汇总系统 |
CN117114245A (zh) * | 2023-10-18 | 2023-11-24 | 长春市联心花信息科技有限公司 | 一种基于数字孪生的城市数据集成方法 |
CN118505450A (zh) * | 2024-02-27 | 2024-08-16 | 南京纳仕嘉科技有限公司 | 一种基于大数据的应急警示教育管理系统及方法 |
Also Published As
Publication number | Publication date |
---|---|
CN111737321B (zh) | 2024-06-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111737321A (zh) | 基于数据挖掘的城市大气污染联防联控区域划分方法 | |
Yu et al. | Spatiotemporal patterns and characteristics of remotely sensed region heat islands during the rapid urbanization (1995–2015) of Southern China | |
CN106570581B (zh) | 能源互联网环境下基于属性关联的负荷预测系统及其方法 | |
CN109947879B (zh) | 一种基于复杂网络的海洋观测大数据可视化分析方法 | |
CN114186491B (zh) | 基于改进lur模型的细颗粒物浓度时空特征分布方法 | |
Deng et al. | Pattern of spatio-temporal variability of extreme precipitation and flood-waterlogging process in Hanjiang River basin | |
CN115015486B (zh) | 一种基于回归树模型的碳排放量测算方法 | |
CN114519926A (zh) | 基于物联网的环保监测用仪表智能控制系统 | |
CN113987912A (zh) | 一种基于地理信息的污染物在线监测系统 | |
CN108764527B (zh) | 一种土壤有机碳库时空动态预测最优环境变量筛选方法 | |
Yadav et al. | Statistical evaluation of sigma schemes for estimating dispersion in low wind conditions | |
CN108072597A (zh) | 基于支持向量机和树叶磁学的大气颗粒物浓度监测方法 | |
CN117993786A (zh) | 一种基于时空图卷积网络的空气质量评估方法 | |
Pei et al. | Analysis of spring drought in Northeast China from the perspective of atmosphere, snow cover, and soil | |
CN113657610A (zh) | 一种基于随机森林的冰雹气候特征预测方法 | |
CN112200399B (zh) | 一种地震成灾风险评估和经济损失预测方法 | |
CN117077558A (zh) | 一种时空精细化的风速场构建方法 | |
CN113128811A (zh) | 一种基于强降水的电网系统地质灾害风险评估方法及系统 | |
CN114881309B (zh) | 一种城市活力与碳排空间特征相关性的测度方法 | |
He et al. | The urban hierarchy and agglomeration effects influence the response of NPP to climate change and human activities | |
Guo et al. | Research on key technologies of spatio-temporal analysis and prediction of marine ecological environment based on association rule mining analysis | |
CN114969143A (zh) | 基于数据挖掘的城市间大气污染物时空关联特征分析方法 | |
Chen et al. | Internet of things technology in ecological security assessment system of intelligent land | |
CN112860822A (zh) | 一种基于地理国情视角的土地资源承载力综合分析方法 | |
LI et al. | EXPLORING THE DRIVING MECHANISMS OF REGIONAL VEGETATION COVER CHANGE USING A COMBINATION OF FACTOR REGRESSION AND FACTOR INTERACTION IN THE LIAOHE RIVER BASIN, CHINA. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |