CN111949749A - 基于高阶图卷积网络的空气质量监测站点位置推荐方法 - Google Patents
基于高阶图卷积网络的空气质量监测站点位置推荐方法 Download PDFInfo
- Publication number
- CN111949749A CN111949749A CN202010747802.4A CN202010747802A CN111949749A CN 111949749 A CN111949749 A CN 111949749A CN 202010747802 A CN202010747802 A CN 202010747802A CN 111949749 A CN111949749 A CN 111949749A
- Authority
- CN
- China
- Prior art keywords
- air quality
- distribution
- node
- area
- aqi
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012544 monitoring process Methods 0.000 title claims abstract description 71
- 238000000034 method Methods 0.000 title claims abstract description 36
- 238000010586 diagram Methods 0.000 claims abstract description 30
- 239000003344 environmental pollutant Substances 0.000 claims description 50
- 231100000719 pollutant Toxicity 0.000 claims description 47
- 238000012549 training Methods 0.000 claims description 27
- 230000003993 interaction Effects 0.000 claims description 20
- 239000011159 matrix material Substances 0.000 claims description 17
- 230000004927 fusion Effects 0.000 claims description 11
- 230000007613 environmental effect Effects 0.000 claims description 9
- 230000008859 change Effects 0.000 claims description 6
- 238000012545 processing Methods 0.000 claims description 6
- 230000008569 process Effects 0.000 claims description 5
- 238000012935 Averaging Methods 0.000 claims description 3
- 238000013507 mapping Methods 0.000 claims description 3
- 238000013139 quantization Methods 0.000 claims description 3
- 239000000126 substance Substances 0.000 claims description 3
- 230000009466 transformation Effects 0.000 claims description 3
- 238000002759 z-score normalization Methods 0.000 claims description 3
- 238000010276 construction Methods 0.000 claims 1
- 238000001514 detection method Methods 0.000 abstract description 2
- 238000012806 monitoring device Methods 0.000 description 10
- MWUXSHHQAYIFBG-UHFFFAOYSA-N nitrogen oxide Inorganic materials O=[N] MWUXSHHQAYIFBG-UHFFFAOYSA-N 0.000 description 5
- 238000011160 research Methods 0.000 description 5
- UGFAIRIUMAVXCW-UHFFFAOYSA-N Carbon monoxide Chemical compound [O+]#[C-] UGFAIRIUMAVXCW-UHFFFAOYSA-N 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- CURLTUGMZLYLDI-UHFFFAOYSA-N Carbon dioxide Chemical compound O=C=O CURLTUGMZLYLDI-UHFFFAOYSA-N 0.000 description 2
- 229910002091 carbon monoxide Inorganic materials 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 229930195733 hydrocarbon Natural products 0.000 description 2
- 150000002430 hydrocarbons Chemical class 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 238000003915 air pollution Methods 0.000 description 1
- 229910002092 carbon dioxide Inorganic materials 0.000 description 1
- 239000001569 carbon dioxide Substances 0.000 description 1
- 238000005094 computer simulation Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 239000004744 fabric Substances 0.000 description 1
- 239000007789 gas Substances 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000013618 particulate matter Substances 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 235000013311 vegetables Nutrition 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Databases & Information Systems (AREA)
- Tourism & Hospitality (AREA)
- Evolutionary Computation (AREA)
- Development Economics (AREA)
- Educational Administration (AREA)
- Remote Sensing (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于高阶图卷积网络的空气质量监测站点位置推荐方法,属于环境检测技术领域,包括:收集整个城市区域的外部环境特征数据和已建立观测站点节点区域的空气质量分布数据;基于该城市区域对应的空气质量分布推断模型,利用已建立观测站点节点区域的空气质量分布数据和整个城市区域的外部环境特征数据,预测任意未建立观测站节点区域的空气质量AQI分布;根据任意未建立观测站节点区域的空气质量AQI分布,基于城市时空图节点之间关联性的信息熵最小化贪心算法,推荐新的空气质量监测站点位置。本发明基于城市原有的监测设备,推荐若干具有实际应用价值的最优站点位置来新建监测设备,可以最大程度上提升空推断模型对整个城市空气质量分布预测的精度。
Description
技术领域
本发明涉及环境检测领域中城市区域观测站点选址规划问题,特别涉及一种基于高阶图卷积网络的空气质量监测站点位置推荐方法。
背景技术
最近这些年来,随着经济的增长,环境问题也变得日益突出,大气污染问题正受到前所未有的关注和重视。城市空气质量,如一氧化碳(CO),二氧化碳(CO2),碳氢化物(HC),氮氧化物(NOx),以及固体颗粒物(PM2.5、PM10)等污染物浓度与人们的身体健康息息相关。
为了及时、准确地反应大气环境质量及发展趋势,需要精确的空气质量监测设备。但是这些监测设备的成本费用,以及后期维护费用是昂贵的,所以,在一个城市不同区域安装大量的空气监测设备是不现实的。因此,基于有限数量的大气监测设备,合理的设备点位布设是城市区域大气监测的第一个基本环节。
另一方面,随着城市规模的不断扩大,原有的环境设备数量过少,覆盖面不够,不足以全面、精确地反映整个城市区域空气质量分布现状。因此,需要在已有监测设备的基础上,建立新的监测设备从而满足城市区域空气质量分布预测精度要求。
近年来,我国也开展了空气质量监测网络的优化方法与技术研究,目前只局限于城市尺度的监测网络优化,且监测项目主要以常规大气污染物为主,而对于区域空气质量监测网络布点优化方法的研究较少,尚没有建立规范的区域空气质量监测网络的优化布点方法体系与标准。
因此,需要在原有已建立监测设备的基础上,推荐若干最优站点位置,以最大程度上提升空推断模型对整个城市空气质量分布预测的精度,从而达到及时、准确地反应城市区域大气环境质量及发展趋势的目的。这样,既可以满足对大气环境质量监测的精度要求,又可以节约经济成本。
选址布点方法主要应用于环境监测设备选址、公共服务设施选址、餐厅以及广告投放选址等领域。这些年来,关于选址布点的研究主要分为以下两类:知识驱动型和数据驱动型。知识驱动型方法利用数学模型和物理知识,通过计算仿真,来解决选址问题;但为了达到稳定状态,仿真过程不仅需要复杂的系统编程,而且会消耗大量的计算能力,建模中不切实际的假设和简化也会使模型效率进一步降低,于是研究方向转向了数据驱动型。但以上这些方法忽略了交通、土地用途等复杂外界环境特征对空气质量分布的影响,并且研究方法不能基于已建立的观测站点。
发明内容
本发明的目的在于克服上述背景技术中的不足,以基于城市原有的监测设备,推荐若干具有实际应用价值的最优站点位置来新建监测设备。
为实现以上目的,一方面,采用一种基于高阶图卷积网络的空气质量监测站点位置推荐方法,包括如下步骤:
收集整个城市区域的外部环境特征数据,并利用该城市区域已建立的空气质量监测站点,收集已建立观测站点节点区域的空气质量分布数据;
在任意给定时间戳时,基于该城市区域对应的空气质量分布推断模型,利用已建立观测站点节点区域的空气质量分布数据和整个城市区域的外部环境特征数据,预测任意未建立观测站节点区域的空气质量AQI分布,其中空气质量分布推断模型中的权重参数表示该城市时空图节点与节点之间反映空气质量时空变化趋势的关联程度;
根据任意未建立观测站节点区域的空气质量AQI分布,基于城市时空图节点之间关联性的信息熵最小化贪心算法,推荐新的空气质量监测站点位置。
进一步地,所述收集整个城市区域的外部环境特征数据,以及利用该城市区域已建立的空气质量监测站点,收集已建立观测站点节点区域的空气质量分布数据,包括:
收集整个城市区域的外部环境特征数据,该外部环境特征数据包括空气质量值、气象数据、路网信息、POI数目以及交通量;
对所述外部环境特征数据进行Z-Score Normalization,将复杂外部环境特征数据进行线性变换,将其结果映射到[0,1]范围内,作为所述整个城市区域的外部环境特征数据;
利用所述已建立的空气质量监测站点,收集空气质量数据,并对空气质量数据进行one-hot编码处理,得到所述已建立观测站点节点的空气质量分布数据。
进一步地,所述空气质量分布推断模型包括高阶图卷积网络和全连接网络,所述基于该城市区域对应的空气质量分布推断模型,利用已观测区域节点区域的空气质量分布数据和整个城市区域的外部环境特征数据,预测任意未建立观测站节点区域的空气质量AQI分布,包括:
高阶图卷积网络根据所述已观测区域节点区域的空气质量分布数据,利用所述城市区域对应的时空图,捕捉污染物分布的时空交互特征;
全连接网络用于捕获外部环境信息,并将其与污染物分布的时空交互特征进行融合训练,预测任意未建立观测站节点区域的空气质量AQI分布。
进一步地,所述城市区域对应的时空图的构建过程包括:
基于所述城市的地理信息,将该城市区域划分成不相交的网格,每个网格与空气质量指标值AQI相关联;
将该城市区域内每个网格看作一个节点,构建所述城市区域对应的时空图G=(V;ε;A),其中,V是与随时间变化的AQI数值相关联节点的集和,V=U∪L,U表示没有建立观测站点的节点,L为已建立观测站点的节点,L中的节点l∈L作为标签节点,U中的节点u∈U作为未标签节点;ε是边的集合,表示节点之间的连通性;A∈RN×N为图G的邻接矩阵。
进一步地,所述高阶图卷积网络的K阶卷积操作定义为:
所述高阶图卷积网络从所述已观测区域节点区域的污染源分布特征fl∈R|L|×P中提取的K阶特征作为所述污染物分布的时空交互特征如下:
GC{k}=[GC1,GC2,...,GCk]
其中,GC{k}∈RN×(K×P)是图卷积网络提取的K阶特征集合。
进一步地,所全连接网络用于捕获外部环境信息特征,并将其与污染物分布的时空交互特征进行融合训练,预测任意未建立观测站节点区域的空气质量AQI分布,包括:
将所述污染物分布的时空交互特征GC{k}∈RN×(K×P)通过全连接网络ffc1:
ffc1:RN×(K×P)→RN×P
GC=ffc1(GC{k},Wfc1)
其中,污染物特征GC∈RN×P,训练参数Wfc1∈RP×(K×P)。;
采用全连接网络ffc2捕获外部环境信息特征:
ffc2:RN×M→RN×P
GCf=ffc2(fm,Wfc2)
其中,fm∈RN×M为M个外部环境特征数据,Wfc2∈RP×M,外部环境信息特征GCf∈RN×P;
采用全连接网络ffc3将外部环境信息特征GCf∈RN×P与污染物特征GC∈RN×P进行融合:
ffc3:RN×P→RN×P
GCall=ffc3((GC+GCf),Wfc3)
其中,Wfc3∈RP×P,总特征GCall∈RN×P;
预测任意未建立观测站节点区域的空气质量AQI分布Fu:
F=softmax(GCall)
其中,Fl∈R|L|×P为标签节点区域的空气质量AQI分布输出,Fu∈R|U|×P为未标签节点区域的空气质量AQI分布输出。
进一步地,还包括:
定义所述空气质量分布推断模型的交叉熵损失函数如下:
H(Y,Fl)=-diag(Vl)∑[Y*log(Fl)]
其中,*表示Hadamard product,diag(Vl)表示一个对角阵,该对角阵的元素,当(i,i)∈Vl时,设置为1,其余元素为0,Y为已知训练标签数据;
在所述交叉熵损失函数上面增加正则化项,得到总的损失函数,包括:
将图卷积权重矩阵的L1范数添加到损失函数作为正则项,L1正则化定义为:
将基于L2范数的卷积特征正则化项添加到损失函数作为正则项,L2正则化定义为:
总的损失函数定义如下:
Loss=H(Y,Fl)+α·R1+β·R2;
进一步地,所述根据任意未建立观测站节点区域的空气质量AQI分布,基于城市时空图节点之间关联性的信息熵最小化贪心算法,推荐新的空气质量监测站点位置,包括:
计算所述空气质量分布推断模型的平均卷积权重参数,定义如下:
引入信息熵来表示所述时空图中节点与节点之间反映空气质量时空变化趋势的关联程度,计算未观测区域U的每个节点平均权重的信息熵,定义如下:
根据计算出平均卷积权重参数的信息熵将信息熵值最小的未标签节点的位置推荐优先级标记为最低,基于空气质量分布推断模型预测的AQI分布将平均权重信息熵值最小的未标签节点加入到标签节点,其对应的AQI预测值作为标签数据,组成新的AQI标签数据
重复执行直到完成对所有未标签区域节点的优先级标记,并根据未标签区域节点的优先级,推荐新的空气质量监测站点位置。
进一步地,还包括:
对多个时刻的数据结果进行分析,对未标签区域节点位置的推荐优先级进行平均;
根据节点平均推荐优先级,选择优先级最高的top-N个站点来建立新的空气质量监测设备。
另一方面,采用一种基于高阶图卷积网络的空气质量监测站点位置推荐系统,包括:数据获取模块、预测模块和位置推荐模块,其中:
数据获取模块用于收集整个城市区域的外部环境特征数据,并利用该城市区域已建立的空气质量监测站点,收集已建立观测站点节点区域的空气质量分布数据;
预测模块用于在任意给定时间戳时,基于该城市区域对应的空气质量分布推断模型,利用已建立观测站点节点区域的空气质量分布数据和整个城市区域的外部环境特征数据,预测任意未建立观测站节点区域的空气质量AQI分布;其中空气质量分布推断模型中的权重参数表示该城市时空图节点与节点之间反映空气质量时空变化趋势的关联程度;其中所述空气质量分布推断模型包括高阶图卷积网络和全连接网络,高阶图卷积网络用于根据已建立观测站点节点的AQI分布,利用所述城市区域对应的时空图,捕捉污染物分布的时空交互特征;全连接网络用于捕获外部环境信息,并将其与污染物分布的时空交互特征进行融合训练,预测任意未观测区域污染物的分布;
位置推荐模块用于根据任意未建立观测站节点区域的空气质量AQI分布,基于城市时空图节点之间关联性的信息熵最小化贪心算法,推荐新的空气质量监测站点位置。
与现有技术相比,本发明存在以下技术效果:本发明通过将城市区域建模成时空图结构,空气质量分布推断模型中卷积网络可以捕捉大气污染物分布的时空交互性,全连接网络用来捕获复杂的外部环境信息,并将其与污染物特征进行融合,从而精确地推断整个城市区域空气质量分布。并且基于已经训练好的空气质量分布推断模型,设计了一种基于城市时空图节点之间关联性的信息熵最小化贪心算法,根据提升城市污染物排放分布预测精度的能力来标记未标签节点的推荐优先级从而完成监测设备布点选址问题。基于这些新的监测设备,可以最大程度上提升空气质量分布推断模型对整个城市污染物排放分布预测的精度,从而达到及时、准确地反应城市区域大气环境质量及发展趋势的目的。
附图说明
下面结合附图,对本发明的具体实施方式进行详细描述:
图1是一种基于高阶图卷积网络的空气质量监测站点位置推荐方法的流程图;
图2是城市区域网格划分示意图;
图3是空气质量分布推断模型原理流程图;
图4是高阶图卷积网络结构图;
图5是基于信息熵最小化的贪心算法的基本框架图;
图6是一种基于高阶图卷积网络的空气质量监测站点位置推荐系统的结构图。
具体实施方式
为了更进一步说明本发明的特征,请参阅以下有关本发明的详细说明与附图。所附图仅供参考与说明之用,并非用来对本发明的保护范围加以限制。
如图1所示,本实施例公开了一种基于高阶图卷积网络的空气质量监测站点位置推荐方法,其设计要点在于构建空气质量分布推断模型,其权重参数实际上表示的是城市时空图节点与节点之间反映空气质量时空变化趋势的关联程度。并设计了一种基于城市时空图节点之间关联性的信息熵最小化贪心算法,根据提升城市污染物排放分布预测精度的能力来标记未标签节点的推荐优先级从而完成监测设备布点选址问题。该方法包括如下步骤S1至S3:
S1、收集整个城市区域的外部环境特征数据,并利用该城市区域已建立的空气质量监测站点,收集已建立观测站点节点区域的空气质量分布数据;
S2、在任意给定时间戳时,基于该城市区域对应的空气质量分布推断模型,利用已建立观测站点节点区域的空气质量分布数据和整个城市区域的外部环境特征数据,预测任意未建立观测站节点区域的空气质量AQI分布,其中空气质量分布推断模型中的权重参数表示该城市时空图节点与节点之间反映空气质量时空变化趋势的关联程度;
S3、根据任意未建立观测站节点区域的空气质量AQI分布,基于城市时空图节点之间关联性的信息熵最小化贪心算法,推荐新的空气质量监测站点位置。
进一步地,上述步骤S1:收集整个城市区域的外部环境特征数据,并利用该城市区域已建立的空气质量监测站点,收集已建立观测站点节点区域的空气质量分布数据,包括:
收集整个城市区域的外部环境特征数据,该外部环境特征数据包括空气质量值、气象数据、路网信息、POI数目以及交通量;
对所述外部环境特征数据进行Z-Score Normalization,将复杂外部环境特征数据进行线性变换,将其结果映射到[0,1]范围内,作为所述整个城市区域的外部环境特征数据;
利用所述已建立的空气质量监测站点,收集空气质量数据,并对空气质量数据进行one-hot编码处理,得到所述已建立观测站点节点的空气质量分布数据。
需要说明的是,该外部环境特征数据包括空气质量值、区域气象数据、区域地理信息路网信息、区域POI数目以及交通量,空气质量分布数据如PM2.5、PM10和AQI等,路网信息如各区域高速路长度,十字路口数目,主路长度等;这些数据特征集合表示为F={f1,f2,…,fm},fm表示收集到的第m个特征。POIs类型如以下列表1所示:
表1 POIs类型列表
1 | 公园 | 6 | 公司 |
2 | 学校 | 7 | 酒店 |
3 | 体育馆 | 8 | 文化教育中心 |
4 | 商业中心 | 9 | 汽车维修站 |
5 | 菜市场 | 10 | 加油站 |
进一步地,所述空气质量分布推断模型是首先构造时空图,然后通过高阶卷积操作来捕获空间特征,最后达到推断空气质量分布的目的:
(1)城市区域划分:
如图2所示,基于城市地理信息,将该城市区域划分成不相交的网格,每个网格是1km×1km的子区域,每一个网格与随时间变化的空气质量值相关联,用空气质量指标AQI来表示空气质量的等级,即每一个网格与随时间变化的AQI数值相关联。
(2)构造时空图:
将城市区域内每个网格看作一个节点,构建时空图G=(V;ε;A),V是与随时间变化的AQI数值相关联节点的集和,|V|=N;ε是边的集合,表示节点之间的连通性;A∈RN×N为图G的邻接矩阵。
特别地,时空图STG中每一个顶点vi∈V是三维表示的,前两维表示为该节点的地理位置信息,第三维表示为随时间变化的AQI数值。
在时空图中,V可表示为V=U∪L,其中,U表示未建立观测站点的节点,L为已建立观测站点的节点,L中的节点l∈L作为标签节点,U中的节点u∈U作为未标签节点,一般来说,|L|<<|U|。
需要说明的是,时空图的空间相关性通过同一时刻下节点之间的地理距离特征来反映,时间相关性通过同一节点相关联的不同时刻AQI数值来反映。
(3)构造空气质量分布推断模型:
如图3所示,空气质量分布推断模型的网络框架的目的是在任意给定时间戳{ti|i=1,2,3…}时,基于时空图G=(V;ε;A),利用已建立观测站点节点的AQI分布fl和外部环境特征数据,来预测任意未观测区域节点的AQI分布fu。具体为:
将ti时刻标签节点l∈L的观测AQI数据fl∈R|L|×P作为时空图信号输入,其中,P是经由one-hot编码表示后节点特征标签的数目。空气质量分布推断模型主要是学习一个函数F(·),将输入fl∈R|L|×P映射到输出fu∈R|U|×P:
F(fl,G(V,E,A))=fu
其中,|L|为标签节点的数目,|U|为未标签节点的数目。
所述空气质量分布推断模型包括高阶图卷积网络和全连接网络,高阶图卷积网络用于根据已建立观测站点节点区域的AQI分布,利用所述城市区域对应的时空图,捕捉污染物分布的时空交互特征;全连接网络用于捕获外部环境信息,并将其与污染物分布的时空交互特征进行融合训练,预测任意未观测区域污染物的分布。
首先定义时空图节点的k阶邻居矩阵。时空图的一阶邻居矩阵即为邻接矩阵A,k阶邻接矩阵可以通过A的k次幂得到。如图4所示,一个节点(五角星)的K阶邻居节点为图中的黑色边可以到达的节点。
高阶图卷积网络的K阶卷积操作定义为:
所述高阶图卷积网络从所述已观测区域节点的污染源分布特征fl∈R|L|×P中提取的K阶特征作为所述污染物分布的时空交互特征如下:
GC{k}=[GC1,GC2,...,GCk]
其中,GC{k}∈RN×(K×P)是图卷积网络提取的K阶特征集合。
将所述污染物分布的时空交互特征GC{k}∈RN×(K×P)通过全连接网络ffc1:
ffc1:RN×(K×P)→RN×P
GC=ffc1(GC{k},Wfc1)
其中,污染物特征GC∈RN×P,训练参数Wfc1∈RP×(K×P)。;
采用全连接网络ffc2捕获外部环境信息特征:
ffc2:RN×M→RN×P
GCf=ffc2(fm,Wfc2)
其中,fm∈RN×M为M个外部环境特征数据,Wfc2∈RP×M,外部环境信息特征GCf∈RN×P;
采用全连接网络ffc3将外部环境信息特征GCf∈RN×P与污染物特征GC∈RN×P进行融合:
ffc3:RN×P→RN×P
GCall=ffc3((GC+GCf),Wfc3)
其中,Wfc3∈RP×P,总特征GCall∈RN×P;
预测任意未建立观测站节点区域的空气质量AQI分布Fu:
F=softmax(GCall)
其中,Fl∈R|L|×P为标签节点区域的空气质量AQI分布输出,Fu∈R|U|×P为未标签节点区域的空气质量AQI分布输出。
需要说明的是,通过将城市区域建模成时空图结构,空气质量分布推断模型中卷积网络可以捕捉大气污染物分布的时空交互性,全连接网络用来捕获复杂的外部环境信息,并将其与污染物特征进行融合,从而精确地推断整个城市区域空气质量分布。
优选地,还包括对空气质量分布推断模型进行训练优化,过程如下:
(1)定义交叉熵损失函数如下:
H(Y,Fl)=-diag(Vl)∑[Y*log(Fl)]
其中,*表示Hadamard product,diag(Vl)表示一个对角阵,该对角阵的元素,当(i,i)∈Vl时,设置为1,其余元素为0,Y为已知训练标签数据。
(2)为了使图卷积特征更具有稳定性和可解释性,在所述交叉熵损失函数上面增加正则化项:
将图卷积权重矩阵的L1范数添加到损失函数作为正则项,以使这些权重矩阵尽可能稀疏。L1正则化定义如下:
为了限制从图卷积提取的相邻阶特征之间的差异,将基于L2范数的卷积特征正则化项添加到损失函数中。L2正则化定义定义如下:
总的损失函数定义如下:
Loss=H(Y,Fl)+α·R1+β·R2
其中,参数α和β用于分别控制图卷积权重和特征上正则化项的权重大小。
进一步地,如图5所示,在上述空气质量分布推断模型预测出的任意未建立观测站节点区域的AQI分布的基础上,基于城市时空图节点之间关联性的信息熵最小化贪心算法,根据提升城市污染物排放分布预测精度的能力来标记未标签节点的推荐优先级从而完成监测设备布点选址问题。
在每一次迭代训练中,计算训练好的空气质量分布推断模型每个节点的平均卷积参数。空气质量分布推断模型的权重参数,反应的是整个城市区域节点与节点之间随时间变化的对于污染物分布预测重要性的关联程度。
在未标签节点区域,根据节点之间的关联性,求出信息熵最低的节点,将该节点从未标签节点中加入到标签节点,其AQI值为空气质量分布预测的预测值,并将该节点位置推荐优先级标记为最低,然后驱动空气质量分布推断模型进行新一轮的训练,更新网络节点与节点之间的关联程度。重复以上过程,直到预测出最后一个未标签节点,并将该节点位置推荐优先级标记为最高。越往后标记的标签节点的位置,相对于其他节点,不确定性越高,即与其余节点间的关联性越低,所以推荐为新建站点的优先级越高。我们根据节点推荐优先级来选择优先级最高的top-N个站点来建立新的污染物监测设备,然后基于新建立的监测设备得监测数据,可以最大程度上提升空气质量分布推断模型对整个城市污染物排放分布预测的精度。
即上述步骤S3:根据任意未建立观测站节点区域的空气质量AQI分布,基于城市时空图节点之间关联性的信息熵最小化贪心算法,推荐新的空气质量监测站点位置,包括如下细分步骤:
S31、计算所述空气质量分布推断模型的平均卷积权重参数,定义如下:
S32、引入信息熵来表示所述时空图中节点与节点之间反映空气质量时空变化趋势的关联程度,计算未观测区域U的每个节点平均权重的信息熵,定义如下:
S33、根据计算出平均卷积权重参数的信息熵将信息熵值最小的未标签节点的位置推荐优先级标记为最低,基于空气质量分布推断模型预测的AQI分布将平均权重信息熵值最小的未标签节点加入到标签节点,其对应的AQI预测值作为标签数据,组成新的AQI标签数据
S36、重复执行步骤S31~S35,直到完成对所有未标签区域节点的优先级标记,并根据未标签区域节点的优先级,推荐新的空气质量监测站点位置。
需要说明的是,本实施例中监测设备布点选址的最终目标是在|U|个候选位置(本文默认为在整个城市未建立监测设备的所有区域),推荐top-N(N为正整数)个具有实际物理意义的和应用价值的位置作为站点来建立污染物监测设备;然后基于新建立的监测设备,可以最大程度上提升空气质量分布推断模型对整个城市污染物排放分布预测的精度。
优选地,在上述步骤S36之后,还包括:
输入其他时刻的数据,重复步骤S31~S36,对多个时刻的数据结果进行分析,对未标签区域节点位置的推荐优先级进行平均;
根据节点平均推荐优先级来选择优先级最高的top-N个站点来建立新的污染物监测设备。
需要说明的是,这些优先级最高的top-N个站点,信息熵最高,不确定性大,与其余节点之间的关联程度比较低,因此基于这些位置建立新的监测设备,可以最大程度上提升空气质量分布推断模型对整个城市污染物排放分布预测的精度。
如图6所示,本实施例还公开了一种基于高阶图卷积网络的空气质量监测站点位置推荐系统,包括:数据获取模块10、预测模块20和位置推荐模块30,其中:
数据获取模块10用于收集整个城市区域的外部环境特征数据,并利用该城市区域已建立的空气质量监测站点,收集已建立观测站点节点区域的空气质量分布数据;
预测模块20用于在任意给定时间戳时,基于该城市区域对应的空气质量分布推断模型,利用已建立观测站点节点区域的空气质量分布数据和整个城市区域的外部环境特征数据,预测任意未建立观测站节点区域的空气质量AQI分布;其中空气质量分布推断模型中的权重参数表示该城市时空图节点与节点之间反映空气质量时空变化趋势的关联程度;其中所述空气质量分布推断模型包括高阶图卷积网络和全连接网络,高阶图卷积网络用于根据已建立观测站点节点的AQI分布,利用所述城市区域对应的时空图,捕捉污染物分布的时空交互特征;全连接网络用于捕获外部环境信息,并将其与污染物分布的时空交互特征进行融合训练,预测任意未观测区域污染物的分布;
位置推荐模块30用于根据任意未建立观测站节点区域的空气质量AQI分布,基于城市时空图节点之间关联性的信息熵最小化贪心算法,推荐新的空气质量监测站点位置。
需要说明的是,本实施例公开的一种基于空气质量推断的监测站点位置推荐系统与上述实施例公开的一种基于高阶图卷积网络的空气质量监测站点位置推荐方法具有相同或相应的的技术特征,实现相同的技术效果,该处不再赘述。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种基于高阶图卷积网络的空气质量监测站点位置推荐方法,其特征在于,包括:
收集整个城市区域的外部环境特征数据,并利用该城市区域已建立的空气质量监测站点,收集已建立观测站点节点区域的空气质量分布数据;
在任意给定时间戳时,基于该城市区域对应的空气质量分布推断模型,利用已建立观测站点节点区域的空气质量分布数据和整个城市区域的外部环境特征数据,预测任意未建立观测站节点区域的空气质量AQI分布,其中空气质量分布推断模型中的权重参数表示该城市时空图节点与节点之间反映空气质量时空变化趋势的关联程度;
根据任意未建立观测站节点区域的空气质量AQI分布,基于城市时空图节点之间关联性的信息熵最小化贪心算法,推荐新的空气质量监测站点位置。
2.如权利要求1所述的基于高阶图卷积网络的空气质量监测站点位置推荐方法,其特征在于,所述收集整个城市区域的外部环境特征数据,以及利用该城市区域已建立的空气质量监测站点,收集已建立观测站点节点的空气质量分布数据,包括:
收集整个城市区域的外部环境特征数据,该外部环境特征数据包括空气质量值、气象数据、路网信息、POI数目以及交通量;
对所述外部环境特征数据进行Z-Score Normalization,将复杂外部环境特征数据进行线性变换,将其结果映射到[0,1]范围内,作为所述整个城市区域的外部环境特征数据;
利用所述已建立的空气质量监测站点,收集空气质量数据,并对空气质量数据进行one-hot编码处理,得到所述已建立观测站点节点区域的空气质量分布数据。
3.如权利要求1所述的基于高阶图卷积网络的空气质量监测站点位置推荐方法,其特征在于,所述空气质量分布推断模型包括高阶图卷积网络和全连接网络,所述基于该城市区域对应的空气质量分布推断模型,利用已观测区域节点区域的空气质量分布数据和整个城市区域的外部环境特征数据,预测任意未建立观测站节点区域的空气质量AQI分布,包括:
高阶图卷积网络根据所述已观测区域节点区域的空气质量分布数据,利用所述城市区域对应的时空图,捕捉污染物分布的时空交互特征;
全连接网络用于捕获外部环境信息,并将其与污染物分布的时空交互特征进行融合训练,预测任意未建立观测站节点区域的空气质量AQI分布。
4.如权利要求3所述的基于高阶图卷积网络的空气质量监测站点位置推荐方法,其特征在于,所述城市区域对应的时空图的构建过程包括:
基于所述城市的地理信息,将该城市区域划分成不相交的网格,每个网格与空气质量指标值AQI相关联;
将该城市区域内每个网格看作一个节点,构建所述城市区域对应的时空图G=(V;ε;A),其中,V是与随时间变化的AQI数值相关联节点的集和,V=U∪L,U表示没有建立观测站点的节点,L为已建立观测站点的节点,L中的节点l∈L作为标签节点,U中的节点u∈U作为未标签节点;ε是边的集合,表示节点之间的连通性;A∈RN×N为图G的邻接矩阵。
6.如权利要求5所述的基于高阶图卷积网络的空气质量监测站点位置推荐方法,其特征在于,所全连接网络用于捕获外部环境信息,并将其与污染物分布的时空交互特征进行融合训练,预测任意未建立观测站节点区域的空气质量AQI分布,包括:
将所述污染物分布的时空交互特征GC{k}∈RN×(K×P)通过全连接网络ffc1:
ffc1:RN×(K×P)→RN×P
GC=ffc1(GC{k},Wfc1)
其中,污染物特征GC∈RN×P,训练参数Wfc1∈RP×(K×P)。;
采用全连接网络ffc2捕获外部环境信息特征:
ffc2:RN×M→RN×P
GCf=ffc2(fm,Wfc2)
其中,fm∈RN×M为M个外部环境特征数据,Wfc2∈RP×M,外部环境信息特征GCf∈RN×P;
采用全连接网络ffc3将外部环境信息特征GCf∈RN×P与污染物特征GC∈RN×P进行融合:
ffc3:RN×P→RN×P
GCall=ffc3((GC+GCf),Wfc3)
其中,Wfc3∈RP×P,总特征GCall∈RN×P;
预测任意未建立观测站节点区域的空气质量AQI分布Fu:
F=softmax(GCall)
其中,Fl∈R|L|×P为标签节点区域的空气质量AQI分布输出,Fu∈R|U|×P为未标签节点区域的空气质量AQI分布输出。
7.如权利要求3~6任一项所述的基于高阶图卷积网络的空气质量监测站点位置推荐方法,其特征在于,还包括:
定义所述空气质量分布推断模型的交叉熵损失函数如下:
H(Y,Fl)=-diag(Vl)∑[Y*log(Fl)]
其中,*表示Hadamard product,diag(Vl)表示一个对角阵,该对角阵的元素,当(i,i)∈Vl时,设置为1,其余元素为0,Y为已知训练标签数据;
在所述交叉熵损失函数上面增加正则化项,得到总的损失函数,包括:
将图卷积权重矩阵的L1范数添加到损失函数作为正则项,L1正则化定义为:
将基于L2范数的卷积特征正则化项添加到损失函数作为正则项,L2正则化定义为:
总的损失函数定义如下:
Loss=H(Y,Fl)+α·R1+β·R2;
利用总的损失函数对所述空气质量分布推断模型进行训练优化:
8.如权利要求6所述的基于高阶图卷积网络的空气质量监测站点位置推荐方法,其特征在于,所述根据任意未建立观测站节点区域的空气质量AQI分布,基于城市时空图节点之间关联性的信息熵最小化贪心算法,推荐新的空气质量监测站点位置,包括:
计算所述空气质量分布推断模型的平均卷积权重参数,定义如下:
引入信息熵来表示所述时空图中节点与节点之间反映空气质量时空变化趋势的关联程度,计算未观测区域U的每个节点平均权重的信息熵,定义如下:
根据计算出平均卷积权重参数的信息熵将信息熵值最小的未标签节点的位置推荐优先级标记为最低,基于空气质量分布推断模型预测的AQI分布将平均权重信息熵值最小的未标签节点加入到标签节点,其对应的AQI预测值作为标签数据,组成新的AQI标签数据
重复执行直到完成对所有未标签区域节点的优先级标记,并根据未标签区域节点的优先级,推荐新的空气质量监测站点位置。
9.如权利要求8所述的基于高阶图卷积网络的空气质量监测站点位置推荐方法,其特征在于,还包括:
对多个时刻的数据结果进行分析,对未标签区域节点位置的推荐优先级进行平均;
根据节点平均推荐优先级,选择优先级最高的top-N个站点来建立新的空气质量监测设备。
10.一种基于高阶图卷积网络的空气质量监测站点位置推荐系统,其特征在于,包括:数据获取模块、预测模块和位置推荐模块,其中:
数据获取模块用于收集整个城市区域的外部环境特征数据,并利用该城市区域已建立的空气质量监测站点,收集已建立观测站点节点区域的空气质量分布数据;
预测模块用于在任意给定时间戳时,基于该城市区域对应的空气质量分布推断模型,利用已建立观测站点节点区域的空气质量分布数据和整个城市区域的外部环境特征数据,预测任意未建立观测站节点区域的空气质量AQI分布;其中空气质量分布推断模型中的权重参数表示该城市时空图节点与节点之间反映空气质量时空变化趋势的关联程度;其中所述空气质量分布推断模型包括高阶图卷积网络和全连接网络,高阶图卷积网络用于根据已建立观测站点节点的AQI分布,利用所述城市区域对应的时空图,捕捉污染物分布的时空交互特征;全连接网络用于捕获外部环境信息,并将其与污染物分布的时空交互特征进行融合训练,预测任意未观测区域污染物的分布;
位置推荐模块用于根据任意未建立观测站节点区域的空气质量AQI分布,基于城市时空图节点之间关联性的信息熵最小化贪心算法,推荐新的空气质量监测站点位置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010747802.4A CN111949749A (zh) | 2020-07-30 | 2020-07-30 | 基于高阶图卷积网络的空气质量监测站点位置推荐方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010747802.4A CN111949749A (zh) | 2020-07-30 | 2020-07-30 | 基于高阶图卷积网络的空气质量监测站点位置推荐方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111949749A true CN111949749A (zh) | 2020-11-17 |
Family
ID=73338525
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010747802.4A Pending CN111949749A (zh) | 2020-07-30 | 2020-07-30 | 基于高阶图卷积网络的空气质量监测站点位置推荐方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111949749A (zh) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112632203A (zh) * | 2020-12-21 | 2021-04-09 | 武汉达梦数据技术有限公司 | 一种地质灾害监测点寻找方法和装置 |
CN113222328A (zh) * | 2021-03-25 | 2021-08-06 | 中国科学技术大学先进技术研究院 | 基于路段污染相似性的空气质量监测设备布点选址方法 |
CN114694767A (zh) * | 2022-05-31 | 2022-07-01 | 山东科技大学 | 基于时空图常微分方程网络的pm2.5浓度预测方法 |
CN114818984A (zh) * | 2022-05-31 | 2022-07-29 | 南京信息工程大学 | 一种基于人工智能的精细化城市积水水位拟合方法 |
CN114912707A (zh) * | 2022-06-01 | 2022-08-16 | 中科大数据研究院 | 一种基于多模态融合的空气质量预测系统及预测方法 |
WO2023101773A1 (en) * | 2021-11-30 | 2023-06-08 | Microsoft Technology Licensing, Llc. | Pollutant sensor placement |
CN116336398A (zh) * | 2023-05-24 | 2023-06-27 | 成都秦川物联网科技股份有限公司 | 基于物联网的智慧燃气泄漏安全监测方法、系统和介质 |
CN117074627A (zh) * | 2023-10-16 | 2023-11-17 | 三科智能(山东)集团有限公司 | 基于人工智能的医疗实验室空气质量监测系统 |
US12018996B2 (en) | 2023-05-24 | 2024-06-25 | Chengdu Qinchuan Iot Technology Co., Ltd. | Methods, systems, and mediums for monitoring gas leakage safety based on internet of things |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110276565A1 (en) * | 2010-05-04 | 2011-11-10 | Microsoft Corporation | Collaborative Location and Activity Recommendations |
CN110503139A (zh) * | 2019-08-07 | 2019-11-26 | 中国科学技术大学 | 一种城市区域尾气污染预测方法 |
-
2020
- 2020-07-30 CN CN202010747802.4A patent/CN111949749A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110276565A1 (en) * | 2010-05-04 | 2011-11-10 | Microsoft Corporation | Collaborative Location and Activity Recommendations |
CN110503139A (zh) * | 2019-08-07 | 2019-11-26 | 中国科学技术大学 | 一种城市区域尾气污染预测方法 |
Non-Patent Citations (1)
Title |
---|
李栋;张蕾;郭茂祖;刘银龙;: "基于时空卷积残差网络的空气质量预测", 计算机技术与发展, no. 06 * |
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112632203A (zh) * | 2020-12-21 | 2021-04-09 | 武汉达梦数据技术有限公司 | 一种地质灾害监测点寻找方法和装置 |
CN112632203B (zh) * | 2020-12-21 | 2021-12-14 | 武汉达梦数据技术有限公司 | 一种地质灾害监测点寻找方法和装置 |
CN113222328A (zh) * | 2021-03-25 | 2021-08-06 | 中国科学技术大学先进技术研究院 | 基于路段污染相似性的空气质量监测设备布点选址方法 |
CN113222328B (zh) * | 2021-03-25 | 2022-02-25 | 中国科学技术大学先进技术研究院 | 基于路段污染相似性的空气质量监测设备布点选址方法 |
WO2023101773A1 (en) * | 2021-11-30 | 2023-06-08 | Microsoft Technology Licensing, Llc. | Pollutant sensor placement |
CN114818984A (zh) * | 2022-05-31 | 2022-07-29 | 南京信息工程大学 | 一种基于人工智能的精细化城市积水水位拟合方法 |
CN114694767B (zh) * | 2022-05-31 | 2022-08-26 | 山东科技大学 | 基于时空图常微分方程网络的pm2.5浓度预测方法 |
CN114818984B (zh) * | 2022-05-31 | 2022-09-23 | 南京信息工程大学 | 一种基于人工智能的精细化城市积水水位拟合方法 |
CN114694767A (zh) * | 2022-05-31 | 2022-07-01 | 山东科技大学 | 基于时空图常微分方程网络的pm2.5浓度预测方法 |
CN114912707A (zh) * | 2022-06-01 | 2022-08-16 | 中科大数据研究院 | 一种基于多模态融合的空气质量预测系统及预测方法 |
CN116336398A (zh) * | 2023-05-24 | 2023-06-27 | 成都秦川物联网科技股份有限公司 | 基于物联网的智慧燃气泄漏安全监测方法、系统和介质 |
CN116336398B (zh) * | 2023-05-24 | 2023-07-25 | 成都秦川物联网科技股份有限公司 | 基于物联网的智慧燃气泄漏安全监测方法、系统和介质 |
US12018996B2 (en) | 2023-05-24 | 2024-06-25 | Chengdu Qinchuan Iot Technology Co., Ltd. | Methods, systems, and mediums for monitoring gas leakage safety based on internet of things |
CN117074627A (zh) * | 2023-10-16 | 2023-11-17 | 三科智能(山东)集团有限公司 | 基于人工智能的医疗实验室空气质量监测系统 |
CN117074627B (zh) * | 2023-10-16 | 2024-01-09 | 三科智能(山东)集团有限公司 | 基于人工智能的医疗实验室空气质量监测系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111949749A (zh) | 基于高阶图卷积网络的空气质量监测站点位置推荐方法 | |
CN110346517B (zh) | 一种智慧城市工业大气污染可视化预警方法及其系统 | |
CN106651036A (zh) | 空气质量预报系统 | |
CN114371260A (zh) | 一种工业企业无组织VOCs网格化监测、扩散预警及溯源方法 | |
CN116363601B (zh) | 一种污染监测设备的数据采集与分析方法及系统 | |
CN110346518B (zh) | 一种交通排放污染可视化预警方法及其系统 | |
CN113222442B (zh) | 实时交通大气污染排放清单计算方法以及决策辅助方法 | |
CN115759488B (zh) | 一种基于边缘计算的碳排放监测预警分析系统及其方法 | |
CN110826244B (zh) | 模拟轨道交通影响城市生长的共轭梯度元胞自动机方法 | |
CN113112068A (zh) | 一种村镇公共设施选址布局的方法及其系统 | |
Sharma | Review of most used urban growth models | |
CN114154702A (zh) | 基于多粒度图时空神经网络的污染物浓度预测方法及装置 | |
Motieyan et al. | A novel spatial index using spatial analyses and hierarchical fuzzy expert system for obtaining green TOD: a case study in Tehran city | |
CN111950871B (zh) | 一种基于空气质量推断的监测站点位置推荐方法及系统 | |
CN116796904A (zh) | 一种轨道交通新线客流预测方法、系统、电子设备及介质 | |
Al-Ahmadi et al. | A fuzzy cellular automata urban growth model (FCAUGM) for the city of Riyadh, Saudi Arabia. Part 1: Model structure and validation | |
CN114822709A (zh) | 大气污染多粒度精准成因分析方法及装置 | |
Han et al. | Deep-AIR: A hybrid CNN-LSTM framework for air quality modeling in metropolitan cities | |
Zhai et al. | Validation of temporal and spatial consistency of facility-and speed-specific vehicle-specific power distributions for emission estimation: A case study in Beijing, China | |
CN116662935A (zh) | 基于空气质量监测网络的大气污染物空间分布预测方法 | |
CN117114081A (zh) | 一种基于迁移学习的分布式光伏功率预测方法及装置 | |
Mirzahossein et al. | Residential development simulation based on learning by agent-based model | |
CN117808211B (zh) | 一种基于空气质量检测数据的评估方法及系统 | |
Hu et al. | Forecasting fine-grained sensing coverage in opportunistic vehicular sensing | |
Bharath et al. | Understanding the changing LULC and its effect on air quality through field-based measurement and model-based approach |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |