CN113222209B - 基于域适应的区域尾气迁移预测方法、系统及存储介质 - Google Patents

基于域适应的区域尾气迁移预测方法、系统及存储介质 Download PDF

Info

Publication number
CN113222209B
CN113222209B CN202110330528.5A CN202110330528A CN113222209B CN 113222209 B CN113222209 B CN 113222209B CN 202110330528 A CN202110330528 A CN 202110330528A CN 113222209 B CN113222209 B CN 113222209B
Authority
CN
China
Prior art keywords
domain
source
target
data
space
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110330528.5A
Other languages
English (en)
Other versions
CN113222209A (zh
Inventor
康宇
刘斌琨
许镇义
曹洋
李兵兵
夏秀山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Anhui Ecological Environment Monitoring Center Anhui Heavy Pollution Weather Forecast And Early Warning Center
Institute of Advanced Technology University of Science and Technology of China
Original Assignee
Anhui Ecological Environment Monitoring Center Anhui Heavy Pollution Weather Forecast And Early Warning Center
Institute of Advanced Technology University of Science and Technology of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Anhui Ecological Environment Monitoring Center Anhui Heavy Pollution Weather Forecast And Early Warning Center, Institute of Advanced Technology University of Science and Technology of China filed Critical Anhui Ecological Environment Monitoring Center Anhui Heavy Pollution Weather Forecast And Early Warning Center
Priority to CN202110330528.5A priority Critical patent/CN113222209B/zh
Publication of CN113222209A publication Critical patent/CN113222209A/zh
Application granted granted Critical
Publication of CN113222209B publication Critical patent/CN113222209B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Business, Economics & Management (AREA)
  • Evolutionary Computation (AREA)
  • Economics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Development Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Health & Medical Sciences (AREA)
  • Game Theory and Decision Science (AREA)
  • Biophysics (AREA)
  • Computing Systems (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明的一种基于域适应的区域尾气迁移预测方法、系统及存储介质,包括获取源区域和目标区域的历史尾气数据以及外部因素数据并处理,对源域数据和目标域数据以监测点为节点,两两相连,把权重为监测点距离的倒数构建图结构数据,并根据源区域和目标区域的尾气浓度变化特性划分时间序列集合;构建尾气时空特征提取模块,对源区域和目标区域的时间序列数据进行浅层特征提取与融合;构建自动编码器,利用编码器将属于不同特征空间的源域和目标域浅层时空特征非线性映射到同一特征空间;对浅层特征进行深度提取,并输出预测结果。本发明通过利用域适应方法实现源域数据的高效利用,从而实现对缺乏数据的目标域更高精度的区域尾气预测。

Description

基于域适应的区域尾气迁移预测方法、系统及存储介质
技术领域
本发明涉及环境检测领域中城市区域尾气污染预测技术领域,具体涉及一种基于域适应的区域尾气迁移预测方法、系统及存储介质。
背景技术
近年来,政府对机动车尾气污染越来越重视,对机动车尾气污染的预测和实时估计可以有效辅助政府对机动车尾气污染的治理以及相关政策的制定。由于交通流具有空间相关性和时间依赖性的特点,而尾气与交通流往往是强相关的,因此机动车尾气同样受到邻近区域尾气浓度和前一时刻该区域尾气浓度的影响。同时尾气浓度也易受气象因素等外部条件的影响。已有方法往往基于大量的尾气数据从而对下一时刻的尾气浓度进行预测,然而对于缺乏数据的地区,一般难以取得比较良好的实验结果。因此可以考虑利用有充足尾气数据的区域辅助缺乏数据的区域进行预测。
考虑到尾气浓度与路网结构、天气变化等因素具有高度相关性,而区域间路网结构,天气因素差别较大,从而导致不同区域间尾气的时空分布存在较大的差异,此外不同区域监测点数量也不相同,导致源域和目标域提取的特征分属不同特征空间,因此无法直接利用源域数据辅助目标域数据学习。针对上述挑战,本发明提出了一种基于域适应的区域尾气迁移学习预测方法旨在克服源区域和目标区域之间的尾气时空分布差异和监测点数目不同带来的影响,从而利用具有丰富数据的源域区域向数据稀缺的目标域区域进行知识迁移,以实现数据稀缺的目标区域的尾气浓度预测。
发明内容
本发明提出的一种基于域适应的区域尾气迁移预测方法、系统及存储介质,可解决现有方法在数据量较少的情况下,误差较大的技术问题。
为实现上述目的,本发明采用了以下技术方案:
一种基于域适应的区域尾气迁移预测方法,包括以下步骤:
S1:获取源区域和目标区域的历史尾气数据以及外部因素数据,并对进行数据预处理得到源域数据和目标域数据;
S2:对源域数据和目标域数据以监测点为节点,两两相连,边权重为监测点距离的倒数构建图结构数据,并根据源区域和目标区域的尾气浓度变化特性划分时间序列集合;
S3:构建尾气时空特征提取模块,对源区域和目标区域的时间序列数据进行浅层特征提取与融合;
S4:构建自动编码器,利用编码器将S3后属于不同特征空间的源域和目标域浅层时空特征非线性映射到同一特征空间,在共同特征空间内对源域和目标域的时空特征差异进行刻画,并利用解码器将源域和目标域特征映射到各自的特征空间;
S5:对解码器映射后的源域和目标域时空特征进行深度提取,并输出预测结果。
进一步的,S1的具体步骤如下:
S11:分别获取源区域和目标区域的历史尾气数据以及相应的外部因素数据;
S12:对源区域和目标区域的历史尾气数据进行插值,异常值处理,归一化化等预处理操作。
进一步的,所述S2具体包括:
S21:根据监测点地理位置信息将源区域和目标区域的数据构建成图数据Xt={V,E,W},Xt表示t时刻的图数据,V,E,W分别表示图的节点,边和权重;对于图Xt,节点是尾气监测站点,任意两个节点都是连通的,图的边权重为两节点之间距离的倒数;
S22:考虑到尾气的时间分布特性,将尾气的历史观测数据按照时间顺序以时间间隔Δt划分成历史观测序列;
根据时间序列长度l,将源区域和目标区域历史观测序列划分成
Figure BDA0002993212120000031
Figure BDA0002993212120000032
分别用Hs和Ht表示;
S23:对外部因素进行编码,获得外部因素的输入向量
Figure BDA0002993212120000033
进一步的,所述S3具体包括:
S31:将源域Hs和目标域尾气时间序列Ht分别送入源域时空图卷积网络和目标域时空图卷积网络的特征提取模块进行浅层特征提取;
特征提取模块由单层时空图卷积网络构成,内部结构为两层时间门控卷积层和一层空间图卷积层组的类似三明治的结构:
Figure BDA0002993212120000034
fs和ft是源域和目标域的单层时空图卷积的表示函数,
Figure BDA0002993212120000035
Figure BDA0002993212120000036
是源域和目标域经过提取的浅层特征;
S32:对于外部因素,利用双层全连接网络
Figure BDA0002993212120000037
Figure BDA0002993212120000038
对源区域和目标区域的外部因素进行特征提取再利用非线性激活函数tanh获得归一化的外部因素特征
Figure BDA0002993212120000039
Figure BDA00029932121200000310
源域和目标域全连接网络的输入维度均是24,输出维度分别是源域和目标域的空间节点数;
Figure BDA00029932121200000311
S33:对外部因素特征
Figure BDA00029932121200000312
Figure BDA00029932121200000313
浅层特征
Figure BDA00029932121200000314
Figure BDA00029932121200000315
进行特征融合,获取融合特征
Figure BDA00029932121200000316
Figure BDA00029932121200000317
Figure BDA00029932121200000318
⊙代表哈德玛积。
进一步的,所述S4具体包括:
S41:经过浅层特征提取得到的源域和目标域特征,由于源域和目标域拥有不同的空间节点数,源域和目标域特征实际是属于两个不同的特征空间,因此利用自动编码器进行非线性映射到共同特征空间
Figure BDA0002993212120000041
自动编码器分成编码器和解码器两部分,首先利用编码器将源域和目标域映射到相同的特征空间
Figure BDA0002993212120000042
源域编码器encoders的输入维度为源域的空间节点数,输出维度为共同特征空间的空间维大小;目标域编码器encodert的输入维度为目标域的空间节点数,输出维度为共同特征空间的空间维大小;
编码器有三层全连接网络构成,非线性激活函数为LeakyRelu:
Figure BDA0002993212120000043
S42:在公共特征空间内,对源域特征
Figure BDA0002993212120000044
和目标域特征
Figure BDA0002993212120000045
的差异性进行度量,通过最小化差异性度量实现源域和目标域的特征分布大致相同,实现源域到目标域的知识传递;
S43:将特征
Figure BDA0002993212120000046
Figure BDA0002993212120000047
利用解码器映射到对应的源域和目标域特征空间。源域解码器decoders的输入维度为共同特征空间
Figure BDA0002993212120000048
的空间节点数,输出维度为源域的空间维大小;目标域解码器decodert的输入维度为共同特征空间
Figure BDA0002993212120000049
的空间节点数,输出维度为目标域的空间维大小。解码器同样由三层全连接网络和非线性激活函数LeakyRelu组成。
Figure BDA00029932121200000410
Figure BDA0002993212120000051
Figure BDA0002993212120000052
是由解码器重构得到的源域和目标域特征
Figure BDA0002993212120000053
Le为重构损失,N为实例数。
进一步的,所述S42具体包括:
基于边缘概率分布的差异性度量Qm,φ表示核函数,ns和nt代表源域和目标域的实例数,i和j表示实例在源域和目标域的顺序;
Figure BDA0002993212120000054
Figure BDA0002993212120000055
分别表示源域的第i个样本的特征和目标域的第j个样本的特征;
Figure BDA0002993212120000056
基于条件概率分布的差异性度量Qc,C为类别数,使用时间点作为类别,则C为24.k表示第k类,
Figure BDA0002993212120000057
Figure BDA0002993212120000058
表示第k类源域和目标域的实例数,a和b表示当前实例在当前类别下源域和目标域的顺序;
Figure BDA0002993212120000059
Figure BDA00029932121200000510
分别表示在第k个类别中源域的第a个样本的特征和目标域的第b个样本的特征;
Figure BDA00029932121200000511
则通过联合边缘概率分布和条件概率分布共同刻画源域和目标域的差异性,从而获得迁移损失Ltrans
Figure BDA00029932121200000512
通过最小化迁移损失Ltrans,源域和目标域的特征分布趋于近似,从而实现源域到目标域的知识传递。
进一步的,所述S5具体包括:
对于源域特征和目标域特征利用单层时空图卷积网络和时间门控卷积层进行特征提取,并利用单层全连接网络进行预测结果输出;
Figure BDA0002993212120000061
Figure BDA0002993212120000062
Figure BDA0002993212120000063
分别代表源域和目标域的单层时空图卷积网络、时间门控卷积层、单层全连接网络;Xs和Xt代表源域和目标域的最终预测输出,预测损失Ls和Lt为:
Figure BDA0002993212120000064
其中Ys和Yt分别为源域和目标域的预测真值;
因此总体损失函数为:
L=Lt+αLs+βLe+γLtrans+μ||θ||2
α、β、γ、μ是平衡系数,θ为网络参数的集合,||θ||2意为网络的正则化项。
进一步的,所述S23中仅考虑时间信息对尾气浓度的影响,经过one-hot编码后,时间信息转换成长度为24的向量。
另一方面,本发明还公开一种基于域适应的区域尾气迁移预测系统,包括以下单元,
数据获取单元,用于获取源区域和目标区域的历史尾气数据以及外部因素数据,并对进行数据预处理得到源域数据和目标域数据;
集合划分单元,用于对源域数据和目标域数据以监测点为节点,两两相连,边权重为监测点距离的倒数构建图结构数据,并根据源区域和目标区域的尾气浓度变化特性划分时间序列集合;
特征提取模块,用于构建尾气时空特征提取模块,对源区域和目标区域的时间序列数据进行浅层特征提取与融合;
自动编码器单元,用于构建自动编码器,利用编码器将属于不同特征空间的源域和目标域浅层时空特征非线性映射到同一特征空间,在共同特征空间内对源域和目标域的时空特征差异进行刻画,并利用解码器将源域和目标域特征映射到各自的特征空间;
预测单元,用于对解码器映射后的源域和目标域时空特征进行深度提取,并输出预测结果。
第三方面,本发明的一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如上述方法的步骤。
由上述技术方案可知,本发明的基于域适应的区域尾气迁移预测方法,克服现有方法的不足,通过利用域适应方法实现源域数据的高效利用,从而实现对缺乏数据的目标域更高精度的区域尾气预测。
本发明通过将尾气时序数据构建成图数据以捕获尾气空间相关性,对外部因素编码以捕获对外部因素尾气分布的影响,在目标域仅有少量尾气数据时,也可以通过利用源域尾气数据,实现目标域尾气的高精度预测。
附图说明
图1是本发明的方法流程图;
图2是本发明的结构原理图;
图3是本发明的实例应用图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。
如图1和图2所示,本实施例所述的基于域适应的区域尾气迁移预测方法,包括以下步骤:
S1:获取源区域和目标区域的历史尾气数据以及外部因素数据,并对进行数据预处理得到源域数据和目标域数据;
S2:对源域数据和目标域数据以监测点为节点,两两相连,边权重为监测点距离的倒数构建图结构数据,并根据源区域和目标区域的尾气浓度变化特性划分时间序列集合;
S3:构建尾气时空特征提取模块,对源区域和目标区域的时间序列数据进行浅层特征提取与融合;
S4:由于上述提取到的源域尾气浅层时空特征和目标域尾气浅层时空特征分属不同的特征空间,因此构建自动编码器,利用编码器将属于不同特征空间的源域和目标域浅层时空特征非线性映射到同一特征空间,在共同特征空间内对源域和目标域的时空特征差异进行刻画,并利用解码器将源域和目标域特征映射到各自的特征空间;
S5:对解码器映射后的源域和目标域时空特征进行深度提取,并输出预测结果。
以下具体说明:
具体实施步骤如下:
上述步骤S1:获取源区域和目标区域的历史尾气数据以及外部因素数据,对所获数据进行数据预处理,具体包括如下细分步骤S11至S12:
S11:从政府官方网站分别获取源区域和目标区域的历史尾气数据以及相应的外部因素数据。
S12:对源区域和目标区域的历史尾气数据进行插值,异常值处理,归一化化等预处理操作。
进一步地,上述步骤S2:对源域数据和目标域数据以监测点为节点,两两相连,边权重为监测点距离的倒数构建图结构数据,并根据源区域和目标区域的尾气浓度变化特性划分时间序列集合。具体包括如下细分步骤S21至S23:
S21:根据监测点地理位置信息将源区域和目标区域的数据构建成图数据Xt={V,E,W},Xt表示t时刻的图数据,V,E,W分别表示图的节点,边和权重。对于图Xt,节点是尾气监测站点,任意两个节点都是连通的,图的边权重为两节点之间距离的倒数,注意:一般情况下源域图和目标域图具有不同的节点数和边权重。
S22:考虑到尾气的时间分布特性,将尾气的历史观测数据按照时间顺序以时间间隔Δt划分成历史观测序列。Δt取15分钟。根据时间序列长度l,将源区域和目标区域历史观测序列划分成
Figure BDA0002993212120000091
Figure BDA0002993212120000092
分别用Hs和Ht表示。
S23:对外部因素进行编码,获得外部因素的输入向量
Figure BDA0002993212120000093
本发明仅考虑时间信息对尾气浓度的影响,经过one-hot编码后,时间信息转换成长度为24的向量。
上述步骤S3:构建尾气时空特征提取模块,对源区域和目标区域的时间序列数据进行浅层特征提取与融合,具体包括如下细分步骤S31至S32:
S31:将源域Hs和目标域尾气时间序列Ht分别送入源域时空图卷积网络和目标域时空图卷积网络的特征提取模块进行浅层特征提取。特征提取模块由单层时空图卷积网络构成,内部结构为两层时间门控卷积层和一层空间图卷积层组的类似三明治的结构。
Figure BDA0002993212120000094
fs和ft是源域和目标域的单层时空图卷积的表示函数,
Figure BDA0002993212120000101
Figure BDA0002993212120000102
是源域和目标域经过提取的浅层特征。
S32:对于外部因素,利用双层全连接网络
Figure BDA0002993212120000103
Figure BDA0002993212120000104
对源区域和目标区域的外部因素进行特征提取再利用非线性激活函数tanh获得归一化的外部因素特征
Figure BDA0002993212120000105
Figure BDA0002993212120000106
源域和目标域全连接网络的输入维度均是24,输出维度分别是源域和目标域的空间节点数。
Figure BDA0002993212120000107
S33:对外部因素特征
Figure BDA0002993212120000108
Figure BDA0002993212120000109
浅层特征
Figure BDA00029932121200001010
Figure BDA00029932121200001011
进行特征融合,获取融合特征
Figure BDA00029932121200001012
Figure BDA00029932121200001013
Figure BDA00029932121200001014
⊙代表哈德玛积。
上述步骤S4:由于上述提取到的源域尾气浅层时空特征和目标域尾气浅层时空特征分属不同的特征空间,因此构建自动编码器,利用编码器将属于不同特征空间的源域和目标域浅层时空特征非线性映射到同一特征空间,在共同特征空间内对源域和目标域的时空特征差异进行刻画,并利用解码器将源域和目标域特征映射到各自的特征空间,具体包括如下细分步骤S41至S42:
S41:经过浅层特征提取得到的源域和目标域特征,由于源域和目标域拥有不同的空间节点数,源域和目标域特征实际是属于两个不同的特征空间,因此利用自动编码器进行非线性映射到共同特征空间
Figure BDA00029932121200001015
自动编码器分成编码器和解码器两部分,首先利用编码器将源域和目标域映射到相同的特征空间
Figure BDA00029932121200001016
源域编码器encoders的输入维度为源域的空间节点数,输出维度为共同特征空间的空间维大小;目标域编码器encodert的输入维度为目标域的空间节点数,输出维度为共同特征空间的空间维大小。编码器有三层全连接网络构成,非线性激活函数为LeakyRelu。
Figure BDA0002993212120000111
S42:在公共特征空间内,对源域特征
Figure BDA0002993212120000112
和目标域特征
Figure BDA0002993212120000113
的差异性进行度量,通过最小化差异性度量实现源域和目标域的特征分布大致相同,从而实现源域到目标域的知识传递。
基于边缘概率分布的差异性度量Qm,φ表示核函数,ns和nt代表源域和目标域的实例数,i和j表示实例在源域和目标域的顺序。
Figure BDA0002993212120000114
Figure BDA0002993212120000115
分别表示源域的第i个样本的特征和目标域的第j个样本的特征。
Figure BDA0002993212120000116
基于条件概率分布的差异性度量Qc,C为类别数,使用时间点作为类别,则C为24.k表示第k类,
Figure BDA0002993212120000117
Figure BDA0002993212120000118
表示第k类源域和目标域的实例数.a和b表示当前实例在当前类别下源域和目标域的顺序。
Figure BDA0002993212120000119
Figure BDA00029932121200001110
分别表示在第k个类别中源域的第a个样本的特征和目标域的第b个样本的特征。
Figure BDA00029932121200001111
因此本发明通过联合边缘概率分布和条件概率分布共同刻画源域和目标域的差异性。从而获得迁移损失Ltrans
Figure BDA0002993212120000121
通过最小化迁移损失Ltrans,源域和目标域的特征分布趋于近似,从而实现源域到目标域的知识传递。
S43:将特征
Figure BDA0002993212120000122
Figure BDA0002993212120000123
利用解码器映射到对应的源域和目标域特征空间。源域解码器decoders的输入维度为共同特征空间
Figure BDA0002993212120000124
的空间节点数,输出维度为源域的空间维大小;目标域解码器decodert的输入维度为共同特征空间
Figure BDA0002993212120000125
的空间节点数,输出维度为目标域的空间维大小。解码器同样由三层全连接网络和非线性激活函数LeakyRelu组成。
Figure BDA0002993212120000126
Figure BDA0002993212120000127
Figure BDA0002993212120000128
是由解码器重构得到的源域和目标域特征
Figure BDA0002993212120000129
Le为重构损失,N为实例数。
进一步地,上述步骤S5:对解码器映射后的源域和目标域时空特征进行深度提取,并输出预测结果,具体包括如下:
S51:对于源域特征和目标域特征利用单层时空图卷积网络和时间门控卷积层进行特征提取,并利用单层全连接网络进行预测结果输出。
Figure BDA00029932121200001210
Figure BDA00029932121200001211
Figure BDA00029932121200001212
分别代表源域和目标域的单层时空图卷积网络、时间门控卷积层、单层全连接网络。Xs和Xt代表源域和目标域的最终预测输出。预测损失Ls和Lt为:
Figure BDA0002993212120000131
其中Ys和Yt分别为源域和目标域的预测真值。
因此总体损失函数为:
L=Lt+αLs+βLe+γLtrans+μ||θ||2
α、β、γ、μ是平衡系数,θ为网络参数的集合,||θ||2意为网络的正则化项。
图3是展示了利用约10周的合肥尾气数据和一周的芜湖尾气数据对芜湖尾气污染预测的结果,并对预测值和真值均进行了归一化处理。可以看出本发明的方法具有较好的拟合效果。
综上所述,本发明的一种基于域适应的区域尾气迁移预测方法可以利用具有充足尾气数据的源区域提高数据不足的目标区域的尾气预测精度。
另一方面,本发明还公开一种基于域适应的区域尾气迁移预测系统,包括以下单元,
数据获取单元,用于获取源区域和目标区域的历史尾气数据以及外部因素数据,并对进行数据预处理得到源域数据和目标域数据;
集合划分单元,用于对源域数据和目标域数据以监测点为节点,两两相连,边权重为监测点距离的倒数构建图结构数据,并根据源区域和目标区域的尾气浓度变化特性划分时间序列集合;
特征提取模块,用于构建尾气时空特征提取模块,对源区域和目标区域的时间序列数据进行浅层特征提取与融合;
自动编码器单元,用于构建自动编码器,利用编码器将属于不同特征空间的源域和目标域浅层时空特征非线性映射到同一特征空间,在共同特征空间内对源域和目标域的时空特征差异进行刻画,并利用解码器将源域和目标域特征映射到各自的特征空间;
预测单元,用于对解码器映射后的源域和目标域时空特征进行深度提取,并输出预测结果。
第三方面,本发明的一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如上述方法的步骤。
可理解的是,本发明实施例提供的系统与本发明实施例提供的方法相对应,相关内容的解释、举例和有益效果可以参考上述方法中的相应部分。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (9)

1.一种基于域适应的区域尾气迁移预测方法,其特征在于,包括以下步骤:
S1:获取源区域和目标区域的历史尾气数据以及外部因素数据,并对进行数据预处理得到源域数据和目标域数据;
S2:对源域数据和目标域数据以监测点为节点,两两相连,边权重为监测点距离的倒数构建图结构数据,并根据源区域和目标区域的尾气浓度变化特性划分时间序列集合;
S3:构建尾气时空特征提取模块,对源区域和目标区域的时间序列数据进行浅层特征提取与融合;
S4:构建自动编码器,利用编码器将S3后属于不同特征空间的源域和目标域浅层时空特征非线性映射到同一特征空间,在共同特征空间内对源域和目标域的时空特征差异进行刻画,并利用解码器将源域和目标域特征映射到各自的特征空间;
S5:对解码器映射后的源域和目标域时空特征进行深度提取,并输出预测结果;
其中,所述S3具体包括:
S31:将源域Hs和目标域尾气时间序列Ht分别送入源域时空图卷积网络和目标域时空图卷积网络的特征提取模块进行浅层特征提取;
特征提取模块由单层时空图卷积网络构成,内部结构为两层时间门控卷积层和一层空间图卷积层组的类似三明治的结构:
Figure FDA0003428870060000011
fs和ft是源域和目标域的单层时空图卷积的表示函数,
Figure FDA0003428870060000012
Figure FDA0003428870060000013
是源域和目标域经过提取的浅层特征;
S32:对于外部因素,利用双层全连接网络
Figure FDA0003428870060000014
Figure FDA0003428870060000015
对源区域和目标区域的外部因素进行特征提取再利用非线性激活函数tanh获得归一化的外部因素特征
Figure FDA0003428870060000021
Figure FDA0003428870060000022
源域和目标域全连接网络的输入维度均是24,输出维度分别是源域和目标域的空间节点数;
Figure FDA0003428870060000023
S33:对外部因素特征
Figure FDA0003428870060000024
Figure FDA0003428870060000025
浅层特征
Figure FDA0003428870060000026
Figure FDA0003428870060000027
进行特征融合,获取融合特征
Figure FDA0003428870060000028
Figure FDA0003428870060000029
Figure FDA00034288700600000210
⊙代表哈德玛积。
2.根据权利要求1所述的基于域适应的区域尾气迁移预测方法,其特征在于:S1的具体步骤如下:
S11:分别获取源区域和目标区域的历史尾气数据以及相应的外部因素数据;
S12:对源区域和目标区域的历史尾气数据进行插值,异常值处理,归一化化等预处理操作。
3.根据权利要求2所述的基于域适应的区域尾气迁移预测方法,其特征在于:所述S2具体包括:
S21:根据监测点地理位置信息将源区域和目标区域的数据构建成图数据Xt={V,E,W},Xt表示t时刻的图数据,V,E,W分别表示图的节点,边和权重;对于图Xt,节点是尾气监测站点,任意两个节点都是连通的,图的边权重为两节点之间距离的倒数;
S22:考虑到尾气的时间分布特性,将尾气的历史观测数据按照时间顺序以时间间隔Δt划分成历史观测序列;
根据时间序列长度l,将源区域划分成
Figure FDA00034288700600000211
将目标区域历史观测序列划分成
Figure FDA0003428870060000031
源区域用Hs表示,目标区域历史观测序列用Ht表示;
S23:对外部因素进行编码,获得外部因素的输入向量
Figure FDA0003428870060000032
4.根据权利要求1所述的基于域适应的区域尾气迁移预测方法,其特征在于:所述S4具体包括:
S41:经过浅层特征提取得到的源域和目标域特征,由于源域和目标域拥有不同的空间节点数,源域和目标域特征实际是属于两个不同的特征空间,因此利用自动编码器进行非线性映射到共同特征空间
Figure FDA0003428870060000033
自动编码器分成编码器和解码器两部分,首先利用编码器将源域和目标域映射到相同的特征空间
Figure FDA0003428870060000034
源域编码器encoders的输入维度为源域的空间节点数,输出维度为共同特征空间的空间维大小;目标域编码器encodert的输入维度为目标域的空间节点数,输出维度为共同特征空间的空间维大小;
编码器有三层全连接网络构成,非线性激活函数为LeakyRelu:
Figure FDA0003428870060000035
S42:在公共特征空间内,对源域特征
Figure FDA0003428870060000036
和目标域特征
Figure FDA0003428870060000037
的差异性进行度量,通过最小化差异性度量实现源域和目标域的特征分布大致相同,实现源域到目标域的知识传递;
S43:将特征
Figure FDA0003428870060000038
Figure FDA0003428870060000039
利用解码器映射到对应的源域和目标域特征空间;源域解码器decoders的输入维度为共同特征空间
Figure FDA00034288700600000310
的空间节点数,输出维度为源域的空间维大小;目标域解码器decodert的输入维度为共同特征空间
Figure FDA00034288700600000311
的空间节点数,输出维度为目标域的空间维大小;解码器同样由三层全连接网络和非线性激活函数LeakyRelu组成;
Figure FDA0003428870060000041
Figure FDA0003428870060000042
Figure FDA0003428870060000043
是由解码器重构得到的源域和目标域特征
Figure FDA0003428870060000044
Le为重构损失,N为实例数。
5.根据权利要求4所述的基于域适应的区域尾气迁移预测方法,其特征在于:所述S42具体包括:
基于边缘概率分布的差异性度量Qm,φ表示核函数,ns和nt代表源域和目标域的实例数,i和j表示实例在源域和目标域的顺序;
Figure FDA0003428870060000045
Figure FDA0003428870060000046
分别表示源域的第i个样本的特征和目标域的第j个样本的特征;
Figure FDA0003428870060000047
基于条件概率分布的差异性度量Qc,C为类别数,使用时间点作为类别,则C为24.k表示第k类,
Figure FDA0003428870060000048
Figure FDA0003428870060000049
表示第k类源域和目标域的实例数,a和b表示当前实例在当前类别下源域和目标域的顺序;
Figure FDA00034288700600000410
Figure FDA00034288700600000411
分别表示在第k个类别中源域的第a个样本的特征和目标域的第b个样本的特征;
Figure FDA00034288700600000412
则通过联合边缘概率分布和条件概率分布共同刻画源域和目标域的差异性,从而获得迁移损失Ltrans
Figure FDA00034288700600000413
通过最小化迁移损失Ltrans,源域和目标域的特征分布趋于近似,从而实现源域到目标域的知识传递。
6.根据权利要求1所述的基于域适应的区域尾气迁移预测方法,其特征在于:所述S5具体包括:
对于源域特征和目标域特征利用单层时空图卷积网络和时间门控卷积层进行特征提取,并利用单层全连接网络进行预测结果输出;
Figure FDA0003428870060000051
Figure FDA0003428870060000052
Figure FDA0003428870060000053
分别代表源域和目标域的单层时空图卷积网络、时间门控卷积层、单层全连接网络;Xs和Xt代表源域和目标域的最终预测输出,预测损失Ls和Lt为:
Figure FDA0003428870060000054
其中Ys和Yt分别为源域和目标域的预测真值;
因此总体损失函数为:
L=Lt+αLs+βLe+γLtrans+μ||θ||2
α、β、γ、μ是平衡系数,θ为网络参数的集合,||θ||2意为网络的正则化项。
7.根据权利要求3所述的基于域适应的区域尾气迁移预测方法,其特征在于:所述S23中仅考虑时间信息对尾气浓度的影响,经过one-hot编码后,时间信息转换成长度为24的向量。
8.一种基于域适应的区域尾气迁移预测系统,其特征在于:包括以下单元,
数据获取单元,用于获取源区域和目标区域的历史尾气数据以及外部因素数据,并对进行数据预处理得到源域数据和目标域数据;
集合划分单元,用于对源域数据和目标域数据以监测点为节点,两两相连,边权重为监测点距离的倒数构建图结构数据,并根据源区域和目标区域的尾气浓度变化特性划分时间序列集合;
特征提取模块,用于构建尾气时空特征提取模块,对源区域和目标区域的时间序列数据进行浅层特征提取与融合;
自动编码器单元,用于构建自动编码器,利用编码器将属于不同特征空间的源域和目标域浅层时空特征非线性映射到同一特征空间,在共同特征空间内对源域和目标域的时空特征差异进行刻画,并利用解码器将源域和目标域特征映射到各自的特征空间;
预测单元,用于对解码器映射后的源域和目标域时空特征进行深度提取,并输出预测结果。
9.一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如权利要求1至7中任一项所述方法的步骤。
CN202110330528.5A 2021-03-25 2021-03-25 基于域适应的区域尾气迁移预测方法、系统及存储介质 Active CN113222209B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110330528.5A CN113222209B (zh) 2021-03-25 2021-03-25 基于域适应的区域尾气迁移预测方法、系统及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110330528.5A CN113222209B (zh) 2021-03-25 2021-03-25 基于域适应的区域尾气迁移预测方法、系统及存储介质

Publications (2)

Publication Number Publication Date
CN113222209A CN113222209A (zh) 2021-08-06
CN113222209B true CN113222209B (zh) 2022-02-25

Family

ID=77084377

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110330528.5A Active CN113222209B (zh) 2021-03-25 2021-03-25 基于域适应的区域尾气迁移预测方法、系统及存储介质

Country Status (1)

Country Link
CN (1) CN113222209B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114648078B (zh) * 2022-05-23 2022-09-13 山东省地质矿产勘查开发局八〇一水文地质工程地质大队(山东省地矿工程勘察院) 一种地热清洁能源深浅联动降碳增效监控系统
CN116992247B (zh) * 2023-09-27 2023-12-22 集利安(南通)电子科技有限公司 一种尾气分析仪的异常数据检测方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109948741A (zh) * 2019-03-04 2019-06-28 北京邮电大学 一种迁移学习方法及装置
CN110503139A (zh) * 2019-08-07 2019-11-26 中国科学技术大学 一种城市区域尾气污染预测方法
WO2021016087A1 (en) * 2019-07-19 2021-01-28 Arizona Board Of Regents On Behalf Of Arizona State University Systems for the generation of source models for transfer learning to application specific models

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111461355B (zh) * 2020-03-20 2023-10-31 北京工业大学 基于随机森林的二噁英排放浓度迁移学习预测方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109948741A (zh) * 2019-03-04 2019-06-28 北京邮电大学 一种迁移学习方法及装置
WO2021016087A1 (en) * 2019-07-19 2021-01-28 Arizona Board Of Regents On Behalf Of Arizona State University Systems for the generation of source models for transfer learning to application specific models
CN110503139A (zh) * 2019-08-07 2019-11-26 中国科学技术大学 一种城市区域尾气污染预测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于时空数据挖掘的城市移动源污染综合监管问题研究;许镇义;《中国优秀博硕士论文全文数据库(博士) 工程科技Ⅰ辑》;20210115;参见正文第四、五、七章,图4.2 *

Also Published As

Publication number Publication date
CN113222209A (zh) 2021-08-06

Similar Documents

Publication Publication Date Title
CN110232394B (zh) 一种多尺度图像语义分割方法
WO2022111219A1 (zh) 一种域自适应设备运检系统和方法
CN114120102A (zh) 边界优化的遥感图像语义分割方法、装置、设备及介质
CN115049936A (zh) 一种面向高分遥感影像的边界增强型语义分割方法
CN113222209B (zh) 基于域适应的区域尾气迁移预测方法、系统及存储介质
CN112862774B (zh) 一种遥感影像建筑物精确分割方法
CN115147598A (zh) 目标检测分割方法、装置、智能终端及存储介质
CN116449462B (zh) 海浪有效波高时空序列预测方法、系统、存储介质及设备
CN117575111A (zh) 一种基于迁移学习的农业遥感图像时空序列预测方法
CN112733693A (zh) 一种全局感知高分辨率遥感影像多尺度残差道路提取方法
CN115542427A (zh) 一种基于改进的神经网络模型的降雨预测方法及系统
CN117727046A (zh) 新型山洪前端仪器仪表读数自动识别方法及系统
CN117233869B (zh) 一种基于GRU-BiTCN的站点短期风速预测方法
CN117649526A (zh) 一种面向自动驾驶道路场景的高精度语义分割方法
CN116861262A (zh) 一种感知模型训练方法、装置及电子设备和存储介质
CN113469405B (zh) 基于子图分割的跨城市尾气迁移预测方法、系统及介质
CN114267422B (zh) 地表水质参数预测方法、系统、计算机设备及存储介质
CN114612404B (zh) 一种血管分割方法、装置、存储介质及电子设备
CN114612751B (zh) 一种基于语义学习的整机点云数据的下采样方法
CN112288694B (zh) 基于掩膜区域卷积神经网络的变电设备缺陷识别的方法
CN114399901A (zh) 一种控制交通系统的方法和设备
CN111666849A (zh) 多视角深度网络迭代进化的多源遥感影像水体检测方法
CN117422689B (zh) 一种基于改进MS-PReNet和GAM-YOLOv7的雨天绝缘子缺陷检测方法
CN118298184B (zh) 一种基于层级式误差修正的高分辨率遥感语义分割方法
CN117809293B (zh) 一种基于深度神经网络的小样本图像目标计数方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant