CN112578089A - 一种基于改进tcn的空气污染物浓度预测方法 - Google Patents

一种基于改进tcn的空气污染物浓度预测方法 Download PDF

Info

Publication number
CN112578089A
CN112578089A CN202011558387.4A CN202011558387A CN112578089A CN 112578089 A CN112578089 A CN 112578089A CN 202011558387 A CN202011558387 A CN 202011558387A CN 112578089 A CN112578089 A CN 112578089A
Authority
CN
China
Prior art keywords
residual
block
network
output
layer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011558387.4A
Other languages
English (en)
Other versions
CN112578089B (zh
Inventor
林涛
吉萌萌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hebei University of Technology
Original Assignee
Hebei University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hebei University of Technology filed Critical Hebei University of Technology
Priority to CN202011558387.4A priority Critical patent/CN112578089B/zh
Publication of CN112578089A publication Critical patent/CN112578089A/zh
Application granted granted Critical
Publication of CN112578089B publication Critical patent/CN112578089B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/0004Gaseous mixtures, e.g. polluted air
    • G01N33/0009General constructional details of gas analysers, e.g. portable test equipment
    • G01N33/0062General constructional details of gas analysers, e.g. portable test equipment concerning the measuring method or the display, e.g. intermittent measurement or digital display
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Chemical & Material Sciences (AREA)
  • Combustion & Propulsion (AREA)
  • Food Science & Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于改进TCN的空气污染物浓度预测方法,该预测方法以TCN为基础,提出一种收缩的TCN模型。收缩的TCN模型基于时间卷积的优势,网络能够保证当前信息只与历史的信息有关,并且通过空洞因子的存在可以接收更长的输入;而残差收缩路径的加入,使得网络能够达成在更多输入情况下,并能够根据不同输入样本的冗余信息各不相同,自适应产生样本阈值,有效提高了网络模型的预测能力,且不会存在未来信息的泄露。本发明预测方法做得到的预测结果接近实际值,通过与其它神经网络预测方法对比,本发明预测方法所得到的预测结果的稳定性更好,准确性更高。

Description

一种基于改进TCN的空气污染物浓度预测方法
技术领域
本发明涉及一种时间序列数据预测方法,具体说是一种基于改进TCN的空气污染物浓度预测方法。
背景技术
空气质量的好坏严重影响着人们的身体健康,也对经济社会可持续发展造成极大的威胁。因此,对于人类生活健康和国家可持续发展而言,开展环境空气质量精确预测也注定成为一项不可缺少的重要工作。我国在环境空气质量监测网络已经涵盖了国家、省、市、县四个层级,监测站点数量的突增以及监测技术的日益成熟,为空气质量预测提供了体量巨大且多种多样的数据源。其中空气污染物浓度的预测结果直接影响空气质量指数评估以及大气污染防治,因此大气污染物的预测结果准确性对于改善我国形势严峻的空气质量问题具有重要意义。
伴随着深度学习技术的飞速发展,诸多国内外学者在空气污染预测领域进行了大量的深入研究,并在污染气体浓度时序数据的预测方法上取得了较大的进展。主要方法包括传统的统计模型如灰色预测法,差分整合移动平均自回归模型(AutoregressiveIntegrated Moving Average model,ARIMA)等,机器学习算法如支持向量机(SupportVector Machine,SVM)等,深度学习算法如长短期记忆网络(Long Short-Term Memory,LSTM)、反向传播网咯(Back Propagation Network,BP)等。使用统计模型方法虽然较为通用,计算简单,但是面临滞后性问题,无法适应复杂的数据环境,精确度一般。而相较于经典的机器学习算法,深度学习在大数据上表现的更为优秀,可以通过使用更多的数据来更好的扩展,不需要特征工程,适应能力强,易于转换。而经过大量的研究表明,深度网络在语音,自然语言等许多领域已经实现了远超过机器学习方法的精确度。因此本文通过对深度学习在时间序列数据处理中的应用研究,发现由Colin Lea提出的时间卷积网络(TemporalConvolutional Network,TCN)模型在多个时间序列数据集都有着优异表现,相较于当前热门的LSTM更适合较长历史记录的领域。但TCN模型并未广泛运用在空气污染物预测相关的领域,时间卷积网络的潜力还尚待发掘。
发明内容
为了实现对空气污染物更加高效精确的预测,本发明提出一种基于改进TCN的空气污染物浓度预测方法,该预测方法以TCN为基础,提出一种改进的收缩的时间卷积网络(Shrinking Temporal Convolutional Network,STCN)模型。该模型能够根据各个样本中冗余信息含量不同而自适应的产生相应阈值,解决传统预测算法的各个样本冗余因素过多,预测精度不够等问题。
本发明解决所述技术问题的技术方案为:设计一种基于改进TCN的空气污染物浓度预测方法,其特征在于,该预测方法的具体实施步骤如下:
步骤一:将一种空气污染物浓度历史数据时间序列按一定时间间隔选取数据点,得到训练集的原始空气污染物浓度时间序列;训练集中的时间长度不少于一年;
步骤二:建立改进的TCN神经网络模型
2.1令训练集的原始空气污染物浓度时间序列为σ,设定TCN神经网络的输入为Xσ=(σ12…σh),其中,h为神经网络输入数据的维度,表示在待预测的空气污染物浓度数据点对应时刻点之前的原始空气污染物浓度序列数据点的个数;由训练集的原始空气污染物浓度时间序列σ得到多组Xσ;TCN神经网络的输出为
Figure BDA0002857043960000021
表示第h+1时刻的预测数据;
2.2根据预设的神经网络输入数据的维度,将一个h维度的污染物浓度时间序列Xσ输入到TCN神经网络的一维全卷积层;一维全卷积层网络采用因果卷积;
假设卷积核f:{0,…,k-1}→R,则一个h个维度的污染物浓度时间序列Xσ中某个元素σt的输出为:
Figure BDA0002857043960000031
上式中,σt表示输入序列中的某个元素,即Xσ中第t(1≤t≤h)时刻的污染物浓度数据,σt-i表示卷积的方向;
对一个h维度的污染物浓度时间序列Xσ中的每一个元素进行如公式(1)所示的操作,得到该Xσ的总体输出C(Xσ);
2.3构建残差收缩网络,残差收缩网络由串联的j个残差收缩网络块构成,一个残差收缩网络块包括l个残差收缩块,l个残差收缩块依次串联构成一个残差收缩网络块,每一个残差收缩块均包含一个空洞因果卷积模块和残差收缩路径模块,将空洞因果卷积模块的输入和残差收缩路径模块的输出进行跳跃连接,得到该残差收缩块的输出;第一个残差收缩块(底层)的输入为步骤2.2中的一维全卷积层的输出C(Xσ),最后一个残差收缩块(顶层)的输入为倒数第二个残差收缩块的输出,最后一个残差收缩块的输出为残差收缩网络块的输出;
空洞因果卷积模块由两组空洞因果卷积层、归一化层、激活函数Relu操作层、Dropout层按顺序由底层往上层依次衔接而成;将第一个空洞因果卷积层的输出经过归一化层、激活函数Relu操作层、Dropout层处理后的数据作为第二个空洞因果卷积层的输入,将第二个空洞因果卷积层的输出经过归一化层、激活函数Relu操作层、Dropout层处理后的数据作为该空洞因果卷积模块的输出,每一个空洞因果卷积层只包含一层空洞因果卷积网络;di为空洞因子,空洞因果卷积模块中的两个空洞因果卷积层的空洞因子相同,每个残差收缩块中的卷积核大小都相同,设为F(W)=(W(1),W(2)),F(W)的初始值由Glorot均匀分布方法初始化;
Figure BDA0002857043960000032
是偏移量,在网络中初始值设为0,f表示一个非线性激活函数,在该网络中采用Relu函数;每一个残差收缩块中的空洞因果卷积模块结构相同,卷积核大小相同,空洞因子di不同,di∈[d1…dl],i对应第i个残差收缩块;
对于第一个残差收缩网络块第一个残差收缩块(底层),将步骤2.2中一个Xσ的总体输出C(Xσ)作为其空洞因果卷积模块的输入样本,首先经过第一个空洞因果卷积层;在空洞因果卷积层上将使用上一层t和t-di时刻的数据,来预测当前层t时刻的数据,若t-di时刻的数据在输入样本中不存在,则以0替补;那么第一个空洞因果卷积层的输出结果如下:
Figure BDA0002857043960000041
其中
Figure BDA0002857043960000042
表示Xσ中的第t-d1时刻的污染物浓度数据经过一维全卷积层后的输出,C(σt)同理,d1为第一个残差收缩块的空洞因果卷积模块的两层空洞因果卷积层的空洞因子;W(1)、W(2)和b是一组针对于该层卷积核的权重和偏移量,W(1)、W(2)的初始值是由网络中Glorot均匀分布初始化方法生成,b的初始值为0,下同;
则第二个空洞因果卷积层的输出为:
Figure BDA0002857043960000043
Figure BDA0002857043960000044
为第一个空洞因果卷积层输出中的t-d1时刻数据经归一化层、激活函数Relu操作层、Dropout层处理后得到的结果,
Figure BDA0002857043960000045
同理;
将第二个空洞因果卷积层的输出经归一化层、激活函数Relu操作层、Dropout层处理后,得到第一个残差收缩块的空洞因果卷积模块的输出
Figure BDA0002857043960000046
对一维全卷积的输出C(Xσ)中的h个时刻的每个数据进行如上所示操作,得到总体输出E(Xσ)(1,1),以下简写为E(1 ,1)
将第一个残差收缩块的空洞因果卷积模块的输出E(1,1)作为第一个残差收缩块的残差收缩路径模块的输入,残差收缩路径模块首先对输出E(1,1)求绝对值,经过全局均值池化(Global Average Pooling,GAP)处理后,获得一个E(1,1)的特征值,记为记为A(1,1);将特征值记为A(1,1)输入到残差第一全连接网络层中,然后将残差第一全连接网络层的输出批处理归一化到0-1之间,再依次经过激活函数Relu处理、残差第二全连接层和激活函数Sigmoid处理后,获得一个系数,记为记为α(1,1);令残差收缩路径模块的自适应阈值为τ,对空洞因果卷积模块的输出E(1,1)进行软阈值化处理,得到残差收缩路径模块的输出
Figure BDA0002857043960000051
Figure BDA0002857043960000052
上式中,τ=α(1,1)×A(1,1)
将第一个残差收缩块的空洞因果卷积模块的输入和残差收缩路径模块的输出进行跳跃连接,得到第一个残差收缩网络块的第一个残差收缩块的输出:
Figure BDA0002857043960000053
其中,V和e表示跳跃连接的一组权重与偏移量;
同理,对于第一个残差收缩网络块第二个残差收缩块,其输出为:
Figure BDA0002857043960000054
Figure BDA0002857043960000055
为第一个残差收缩网络块的第二个残差收缩块的残差收缩路径模块的输出;
同理,对于第一个残差收缩网络块第l个残差收缩块,其输出为:
Figure BDA0002857043960000056
S(1,l-1)为第一个残差收缩网络块第l-1个残差收缩块的输出,
Figure BDA0002857043960000057
为第一个残差收缩网络块第l个残差收缩块的残差收缩路径模块的输出;
若残差收缩网络块为多个,则将多个残差收缩网络块依次串联,将前一个残差收缩网络块输出作为后一个残差收缩网络块的输入;同理,得到第二个残差收缩网络块的第一个残差收缩块的输出为:
Figure BDA0002857043960000058
Figure BDA0002857043960000059
为第二个残差收缩网络块的第一个残差收缩块的残差收缩路径模块的输出;
同理,得到第j个残差收缩网络块第l个残差收缩块的输出:
Figure BDA0002857043960000061
S(j,l-1)为第j个残差收缩网络块第l-1个残差收缩块的输出,
Figure BDA0002857043960000062
为第j个残差收缩网络块第l个残差收缩块的残差收缩路径模块的输出;
S(j,l)即为残差收缩网络的输出;
2.4将残差收缩网络块的最顶层的残差收缩块的输出S(j,l)输入到TCN神经网络的外层的全连接层中,外层的全连接层将最顶层的残差收缩块的输出进行综合,得到最后的预测结果
Figure BDA0002857043960000063
其中,g表示激活函数Linear,J和c表示外层的全连接层的一组权重和偏移量;
步骤三:对改进的TCN神经网络模型的网络参数的训练;
将由多组Xσ分别得到的预测结果与真实数据的均值平方误差MSE作为损失函数:
Figure BDA0002857043960000064
其中,yi表示真实值,
Figure BDA0002857043960000065
表示预测值,n为预测的数据点个数;
网络中的所有的权重参数初始值由Glorot均匀分布方法生成,偏移量初始值设为0;采用Adam优化器,使该损失函数值减小直至迭代次数达到设定值,把最后一次迭代得到的各权重和偏移量参数的值作为最优值;
步骤四:将步骤三中得到的各权重和偏移量参数的最优值代入到改进的TCN神经网络模型中,利用训练集的原始空气污染物浓度时间序列中的最后h个数据点,根据步骤二中的步骤2.2到步骤2.4,得到训练集的原始空气污染物浓度时间序列之后的第一个时刻点的预测污染物浓度数据;将获得的预测污染物浓度数据顺接在原始空气污染物浓度时间序列σ的末位之后并将其作为新的原始空气污染物浓度时间序列,选取新的原始空气污染物浓度时间序列最后的h个数据点,重复步骤二中的步骤2.2到步骤2.4,得到训练集的原始空气污染物浓度时间序列之后的第二个时刻点的预测污染物浓度数据;后续时刻点的预测污染物浓度参照此过程,依次获得。
与现有技术相比,本发明有益效果在于:本发明预测方法以TCN为基础,提出一种收缩的TCN模型。收缩的TCN模型基于时间卷积的优势,网络能够保证当前信息只与历史的信息有关,并且通过空洞因子的存在可以接收更长的输入,而残差收缩路径的加入,使得网络能够达成在更多输入情况下,并能够根据不同输入样本的冗余信息各不相同,自适应产生样本阈值,有效提高了网络模型的预测能力,且不会存在未来信息的泄露。本发明预测方法做得到的预测结果接近实际值,通过与其它神经网络预测方法对比,本发明预测方法所得到的预测结果的稳定性更好,准确性更高。
附图说明
此处所说明的附图用来提供对本发明实施例的进一步理解,构成本申请的一部分,并不构成对本发明实施例的限定。
图1为本发明预测方法一种实施例的改进的TCN神经网络模型结构示意图;
图2为本发明预测方法一种实施例的残差收缩网络块的一个残差收缩块的结构示意图。
图3为本发明预测方法一种实施例的残差收缩块中的空洞因果卷积模块的空洞因果卷积层的结构示意图;其中,图3(a)为空洞因子为1的空洞因果卷积层,图3(b)为空洞因子为2的空洞因果卷积层。
图4为采用本发明预测方法对北京2018年一月份744个时刻点的PM10浓度预测值与实际值的对比图。
图5为采用BP网络预测方法对北京2018年一月份744个时刻点的PM10浓度预测值与实际值的对比图。
图6为采用LSTM网络预测方法对北京2018年一月份744个时刻点的PM10浓度预测值与实际值的对比图。
图7为采用WaveNet网络预测方法对北京2018年一月份744个时刻点的PM10浓度预测值与实际值的对比图。
图8为采用改进前的TCN网络预测方法对北京2018年一月份744个时刻点的PM10浓度预测值与实际值的对比图。
图9为选定平方绝对误差(MAE)、平方绝对值百分比误差(MAPE)、平方均方误差(MSE)、均方根误差(RMSE)和决定系数(R2)五个评价指标来对本发明预测方法(用STCN表示)、BP网络预测方法(用BP表示)、LSTM网络预测方法(用LSTM表示)、WaveNet网络预测方法(用WaveNet表示)、改进前的TCN网络预测方法(用TCN表示)的预测结果进行评价的对比图。
具体实施方式
为了更加清晰的阐述本发明的技术方案,下面结合附图及实例,对本发明进一步详细描述。本发明的实施方式及其说明仅用于解释本发明,并不作为对本发明的限定。
本发明提供一种基于改进TCN的空气污染物浓度预测方法(简称预测方法,参见图1-4),该预测方法的具体实施步骤如下:
步骤一:将一种空气污染物浓度历史数据时间序列按一定时间间隔选取数据点,得到训练集的原始空气污染物浓度时间序列;训练集中的时间长度不少于一年;
步骤二:建立改进的TCN神经网络模型
2.1令训练集的原始空气污染物浓度时间序列为σ,设定TCN神经网络的输入为Xσ=(σ12…σh),其中,h为神经网络输入数据的维度,表示在待预测的空气污染物浓度数据点对应时刻点之前的原始空气污染物浓度序列数据点的个数(1,2…h是指按顺序选取,不指代具体时刻点)。由训练集的原始空气污染物浓度时间序列σ得到多组Xσ。TCN神经网络的输出为
Figure BDA0002857043960000081
表示第h+1时刻的预测数据。
2.2根据预设的神经网络输入数据的维度,将一个h维度的污染物浓度时间序列Xσ输入到TCN神经网络的一维全卷积层;一维全卷积层网络采用因果卷积,可以保证预测时刻h+1的数值只与历史时刻数据有关。
假设卷积核f:{0,…,k-1}→R,则一个h个维度的污染物浓度时间序列Xσ中某个元素σt的输出为:
Figure BDA0002857043960000091
上式中,σt表示输入序列中的某个元素,即Xσ中第t(1≤t≤h)时刻的污染物浓度数据,σt-i表示卷积的方向。
对一个h维度的污染物浓度时间序列Xσ中的每一个元素进行如公式(1)所示的操作,得到该Xσ的总体输出C(Xσ)。
2.3构建残差收缩网络,残差收缩网络由串联的j个残差收缩网络块构成,一个残差收缩网络块包括l个残差收缩块,l个残差收缩块依次串联构成一个残差收缩网络块,每一个残差收缩块均包含一个空洞因果卷积模块和残差收缩路径模块,将空洞因果卷积模块的输入和残差收缩路径模块的输出进行跳跃连接,得到该残差收缩块的输出;第一个残差收缩块(底层)的输入为步骤2.2中的一维全卷积层的输出C(Xσ),最后一个残差收缩块(顶层)的输入为倒数第二个残差收缩块的输出,最后一个残差收缩块的输出为残差收缩网络块的输出。
空洞因果卷积模块由两组空洞因果卷积层、归一化层、激活函数Relu操作层、Dropout层按顺序由底层往上层依次衔接而成。将第一个空洞因果卷积层的输出经过归一化层、激活函数Relu操作层、Dropout层处理后的数据作为第二个空洞因果卷积层的输入,将第二个空洞因果卷积层的输出经过归一化层、激活函数Relu操作层、Dropout层处理后的数据作为该空洞因果卷积模块的输出,每一个空洞因果卷积层只包含一层空洞因果卷积网络;di为空洞因子,空洞因果卷积模块中的两个空洞因果卷积层的空洞因子相同,每个残差收缩块中的卷积核大小都相同,设为F(W)=(W(1),W(2)),F(W)的初始值由Glorot均匀分布方法初始化。
Figure BDA0002857043960000092
是偏移量,在网络中初始值设为0,f表示一个非线性激活函数,在该网络中采用Relu函数。每一个残差收缩块中的空洞因果卷积模块结构相同,卷积核大小相同,空洞因子di不同,di∈[d1…dl],i对应第i个残差收缩块。
对于第一个残差收缩网络块第一个残差收缩块(底层),将步骤2.2中一个Xσ的总体输出C(Xσ)作为其空洞因果卷积模块的输入样本,首先经过第一个空洞因果卷积层,空洞因子的引入能够确保模型在不改变卷积核大小的情况下也能接受更长的输入。在空洞因果卷积层上将使用上一层t和t-di时刻的数据,来预测当前层t时刻的数据,若t-di时刻的数据在输入样本中不存在,则以0替补。那么第一个空洞因果卷积层的输出结果如下:
Figure BDA0002857043960000101
其中
Figure BDA0002857043960000102
表示Xσ中的第t-d1时刻的污染物浓度数据经过一维全卷积层后的输出,C(σt)同理,d1为第一个残差收缩块的空洞因果卷积模块的两层空洞因果卷积层的空洞因子;W(1)、W(2)和b是一组针对于该层卷积核的权重和偏移量,W(1)、W(2)的初始值是由网络中Glorot均匀分布初始化方法生成,b的初始值为0,下同。
则第二个空洞因果卷积层的输出为:
Figure BDA0002857043960000103
Figure BDA0002857043960000104
为第一个空洞因果卷积层输出中的t-d1时刻数据经归一化层、激活函数Relu操作层、Dropout层处理后得到的结果,
Figure BDA0002857043960000105
同理。
将第二个空洞因果卷积层的输出经归一化层、激活函数Relu操作层、Dropout层处理后,得到第一个残差收缩块的空洞因果卷积模块的输出
Figure BDA0002857043960000106
对一维全卷积的输出C(Xσ)中的h个时刻的每个数据进行如上所示操作,得到总体输出E(Xσ)(1,1),以下简写为E(1 ,1)
将第一个残差收缩块的空洞因果卷积模块的输出E(1,1)作为第一个残差收缩块的残差收缩路径模块的输入,残差收缩路径模块首先对输出E(1,1)求绝对值,经过全局均值池化(Global Average Pooling,GAP)处理后,获得一个E(1,1)的特征值,记为记为A(1,1);将特征值记为A(1,1)输入到残差第一全连接网络层中,然后将残差第一全连接网络层的输出批处理归一化到0-1之间,再依次经过激活函数Relu处理、残差第二全连接层和激活函数Sigmoid处理后,获得一个系数,记为记为α(1,1);令残差收缩路径模块的自适应阈值为τ,对空洞因果卷积模块的输出E(1,1)进行软阈值化处理,得到残差收缩路径模块的输出
Figure BDA0002857043960000111
Figure BDA0002857043960000112
上式中,τ=α(1,1)×A(1,1)。通过软阈值化,网络将与当前输入样本任务无关的特征,置为0;将有关的特征,保留下来。
将第一个残差收缩块的空洞因果卷积模块的输入和残差收缩路径模块的输出进行跳跃连接,得到第一个残差收缩网络块的第一个残差收缩块的输出:
Figure BDA0002857043960000113
其中,V和e表示跳跃连接的一组权重与偏移量。残差收缩网络中的跳跃连接是为了能够保证网络性能不会因为反向传播的梯度问题而退化。
同理,对于第一个残差收缩网络块第二个残差收缩块,其输出为:
Figure BDA0002857043960000114
Figure BDA0002857043960000115
为第一个残差收缩网络块的第二个残差收缩块的残差收缩路径模块的输出。
同理,对于第一个残差收缩网络块第l个残差收缩块,其输出为:
Figure BDA0002857043960000116
S(1,l-1)为第一个残差收缩网络块第l-1个残差收缩块的输出,
Figure BDA0002857043960000117
为第一个残差收缩网络块第l个残差收缩块的残差收缩路径模块的输出。
若残差收缩网络块为多个,则将多个残差收缩网络块依次串联,将前一个残差收缩网络块(朝底层方向为前)输出作为后一个残差收缩网络块(朝顶层方向为后)的输入。同理,得到第二个残差收缩网络块的第一个残差收缩块的输出为:
Figure BDA0002857043960000121
Figure BDA0002857043960000122
为第二个残差收缩网络块的第一个残差收缩块的残差收缩路径模块的输出。
同理,得到第j个残差收缩网络块第l个残差收缩块的输出:
Figure BDA0002857043960000123
S(j,l-1)为第j个残差收缩网络块第l-1个残差收缩块的输出,
Figure BDA0002857043960000124
为第j个残差收缩网络块第l个残差收缩块的残差收缩路径模块的输出。
S(j,l)即为残差收缩网络的输出。
2.4将残差收缩网络块的最顶层的残差收缩块的输出S(j,l)输入到TCN神经网络的外层的全连接层中,外层的全连接层将最顶层的残差收缩块的输出进行综合,得到最后的预测结果
Figure BDA0002857043960000125
其中,g表示激活函数Linear,J和c表示外层的全连接层的一组权重和偏移量。
步骤三:对改进的TCN神经网络模型的网络参数的训练。
将由多组Xσ分别得到的预测结果与真实数据的均值平方误差MSE作为损失函数:
Figure BDA0002857043960000126
其中,yi表示真实值,
Figure BDA0002857043960000127
表示预测值,n为预测的数据点个数;
网络中的所有的权重参数初始值由Glorot均匀分布方法生成,偏移量初始值设为0。采用Adam优化器,使该损失函数值减小直至迭代次数达到设定值,把最后一次迭代得到的各权重和偏移量参数的值作为最优值。
采用Adam优化器根据损失函数对各权重和偏移量参数的值进行优化为现有技术,其优化过程为:
1)参数设置
设置步长∈,默认为0.001;设置矩估计的指数衰减速率ρ1和ρ2,ρ1和ρ2在区间[0,1)内,默认分别为0.9和0.999;设置用于数值稳定的小常数δ,默认为10-8;迭代次数为100;
2)迭代计算
(1)初始化网络中权重和偏移量参数,设为θ[θ0,…,θj],该网络中权重使用Glorot均匀分布方法生成,偏移量初始值都为0。初始化一阶和二阶矩变量s=0,r=0。初始化时间t=0
(2)选取训练集中的m组样本{Xσ (1),…,Xσ (m)}的数据,对应目标为训练集的预测输出{Y(1),…Y(m)}。
计算梯度:
Figure BDA0002857043960000131
(对θ中逐元素应用操作)
其中,
Figure BDA0002857043960000132
表示Xσ (i)在网络中的预测输出,Y(i)表示真实值。
(3)t=t+1 (11)
更新有偏一阶矩估计:s=ρ1s+(1-ρ1)g (12)
更新有偏二阶矩估计:r=ρ2r+(1-ρ2)g⊙g (13)
修正一阶矩的偏差:
Figure BDA0002857043960000133
修正二阶矩的偏差:
Figure BDA0002857043960000134
计算更新:
Figure BDA0002857043960000135
(对θ中逐元素应用操作) (16)
应用更新:θ=θ+Δθ (17)
(4)重复步骤(2)(3),直至迭代次数达到100,把最后一次迭代得到的各权重和偏移量参数的值作为最优值。
步骤四:将步骤三中得到的各权重和偏移量参数的最优值代入到改进的TCN神经网络模型中,利用训练集的原始空气污染物浓度时间序列中的最后h个数据点,根据步骤二中的步骤2.2到步骤2.4,得到训练集的原始空气污染物浓度时间序列之后的第一个时刻点的预测污染物浓度数据;将获得的预测污染物浓度数据顺接在原始空气污染物浓度时间序列σ的末位之后并将其作为新的原始空气污染物浓度时间序列,选取新的原始空气污染物浓度时间序列最后的h个数据点,重复步骤二中的步骤2.2到步骤2.4,得到训练集的原始空气污染物浓度时间序列之后的第二个时刻点的预测污染物浓度数据;后续时刻点的预测污染物浓度参照此过程,依次获得。
实施例1
本实施例提供一种基于改进TCN的空气污染物浓度预测方法,该方法的具体步骤如下:
步骤一:选用北京的PM10浓度历史数据时间序列,将2016-2017两年的PM10浓度历史数据时间序列按每间隔1h选取浓度数据点,得到训练集的原始PM10浓度时间序列;
步骤二:建立改进的TCN神经网络模型
2.1令训练集的原始PM10浓度时间序列为σ,设定TCN神经网络的输入为Xσ=(σ112…σ6),输出为
Figure BDA0002857043960000141
表示第7时刻的预测PM10浓度数据。神经网络输入数据的维度为6,表示在待预测的PM10浓度数据点对应时刻点之前的原始PM10浓度时间序列数据点的个数。由训练集的原始PM10浓度时间序列σ得到多组Xσ
2.2根据预设的神经网络输入数据的维度,将一个6个维度的PM10浓度时间序列Xσ输入到TCN神经网络的一维全卷积层;一维全卷积层网络采用因果卷积,可以保证预测时刻7的数值只与历史时刻数据有关。
假设卷积核f:{0,…,k-1}→R,则一个6个维度的PM10浓度时间序列Xσ中某个元素σt的输出为:
Figure BDA0002857043960000142
上式中,σt表示输入序列中的某个元素,即Xσ中第t(1≤t≤6)时刻的PM10浓度数据,σt-i卷积的方向。
对一个6个维度的PM10浓度时间序列Xσ中的每一个元素进行如公式(1)所示的操作,得到该Xσ的总体输出C(Xσ)。
2.3构建残差收缩网络,残差收缩网络由两个残差收缩网络块串联构成,每一个残差收缩网络块包括3个残差收缩块,3个残差收缩块依次串联,每一个残差收缩块均包含一个空洞因果卷积模块和残差收缩路径模块,将空洞因果卷积模块的输入和残差收缩路径模块的输出进行跳跃连接,得到该残差收缩块的输出;第一个残差收缩块(底层)的输入为步骤2.2中的一维全卷积层的输出C(Xσ),最后一个残差收缩块(顶层)的输入为倒数第二个残差收缩块的输出,最后一个残差收缩块的输出为残差收缩网络块的输出。空洞因果卷积模块由两组空洞因果卷积层、归一化层、激活函数Relu操作层、Dropout层按顺序由底层往上层依次衔接而成。将第一个空洞因果卷积层的输出经过归一化层、激活函数Relu操作层、Dropout层处理后的数据作为第二个空洞因果卷积层的输入,将第二个空洞因果卷积层的输出经过归一化层、激活函数Relu操作层、Dropout层处理后的数据作为该空洞因果卷积模块的输出。归一化层均采用(0,1)标准化,Dropout层的丢弃率都为0.05。
两个残差收缩网络块结构相同,每一个残差收缩网络块的3个残差收缩块中的空洞因果卷积模块的空洞因子di∈[1,2,4],(W)初始值在网络由Glorot均匀分布方法初始化。
Figure BDA0002857043960000151
是偏移量,在网络中初始值设为0,f表示一个非线性激活函数,在该网络中采用ReLU函数,那么第一个残差收缩网络块的第一个残差收缩块中的空洞因果卷积模块中第一层空洞因果卷积层的输出为:
Figure BDA0002857043960000152
其中
Figure BDA0002857043960000153
表示Xσ中的第t-1时刻的PM10浓度数据经过一维全卷积层后的输出,C(σt)同理,空洞因子为1;
则第二个空洞因果卷积层的输出为:
Figure BDA0002857043960000154
Figure BDA0002857043960000155
为第一个空洞因果卷积层输出中的t-1时刻数据经归一化层、激活函数Relu操作层、Dropout层处理后得到的结果,
Figure BDA0002857043960000161
同理。
将第二个空洞因果卷积层的输出经归一化层、激活函数Relu操作层、Dropout层处理后,得到第一个残差收缩块的空洞因果卷积模块的输出
Figure BDA0002857043960000162
对一维全卷积的输出C(Xσ)中的6个时刻的每个数据进行如上所示操作,得到总体输出E(Xσ)(1,1),以下简写为E(1 ,1)
将第一个残差收缩块的空洞因果卷积模块的输出E(1,1)作为第一个残差收缩块的残差收缩路径模块的输入,残差收缩路径模块首先对输出E(1,1)求绝对值,经过全局均值池化(Global Average Pooling,GAP)处理后,获得一个E(1,1)的特征值,记为记为A(1,1);将特征值记为A(1,1)输入到残差第一全连接网络层中,然后将残差第一全连接网络层的输出批处理归一化到0-1之间,再依次经过激活函数Relu处理、残差第二全连接层和激活函数Sigmoid处理后,获得一个系数,记为记为α(1,1);令残差收缩路径模块的自适应阈值为τ,对空洞因果卷积模块的输出E(1,1)进行软阈值化处理,得到残差收缩路径模块的输出
Figure BDA0002857043960000163
Figure BDA0002857043960000164
上式中,τ=α(1,1)×A(1,1)。通过软阈值化,网络将与当前输入样本任务无关的特征,置为0;将有关的特征,保留下来。
将第一个残差收缩块的空洞因果卷积模块的输入和残差收缩路径模块的输出进行跳跃连接,得到第一个残差收缩网络块的第一个残差收缩块的输出:
Figure BDA0002857043960000165
其中,V和e表示跳跃连接的一组权重与偏移量,设置为1和0。残差收缩网络中的跳跃连接是为了能够保证网络性能不会因为反向传播的梯度问题而退化。
第一个残差收缩网络块的第二个残差收缩块中的第一个空洞因果卷积层的输出为:
Figure BDA0002857043960000171
其中
Figure BDA0002857043960000172
表示第一个残差收缩网络块的第二个残差收缩块输出中的t-2时刻数据,
Figure BDA0002857043960000173
同理,空洞因子为2。
第一个残差收缩网络块的第二个残差收缩块中的第二个空洞因果卷积层的输出为:
Figure BDA0002857043960000174
Figure BDA0002857043960000175
为第二个残差收缩块中第一个空洞因果卷积层输出中的t-2时刻数据经归一化层、激活函数Relu操作层、Dropout层处理后得到的结果,
Figure BDA0002857043960000176
同理。
同理,第一个残差收缩网络块的第二个残差收缩块的输出为:
Figure BDA0002857043960000177
Figure BDA0002857043960000178
为第一个残差收缩网络块的第二个残差收缩块的残差收缩路径模块的输出。
同理,第一个残差收缩网络块的第三个残差收缩块的输出为:
Figure BDA0002857043960000179
Figure BDA00028570439600001710
为第一个残差收缩网络块的第三个残差收缩块的残差收缩路径模块的输出。
同理,第二个残差收缩网络块的第一个残差收缩块的输出为:
Figure BDA00028570439600001711
Figure BDA00028570439600001712
为第二个残差收缩网络块的第一个残差收缩块的残差收缩路径模块的输出。
第二个残差收缩网络块的第二个残差收缩块的输出为:
Figure BDA00028570439600001713
Figure BDA00028570439600001714
为第二个残差收缩网络块的第二个残差收缩块的残差收缩路径模块的输出。
第二个残差收缩网络块的第三个残差收缩块的输出为:
Figure BDA0002857043960000181
Figure BDA0002857043960000182
为第二个残差收缩网络块的第三个残差收缩块的残差收缩路径模块的输出。
S(2,3)即为残差收缩网络的输出。
2.4将残差收缩网络的输出S(2,3)输入到TCN神经网络的外层的全连接层中,外层的全连接层将最顶层的残差收缩块的输出进行综合,得到最后的预测结果
Figure BDA0002857043960000183
其中,g表示激活函数Linear,J和c表示外层的全连接层的一组权重和偏移量。
步骤三:对改进的TCN神经网络模型的网络参数的训练。
将由多组Xσ分别得到的预测结果与真实数据的均值平方误差MSE作为损失函数:
Figure BDA0002857043960000184
其中,yi表示真实值,
Figure BDA0002857043960000185
表示预测值,n为预测的数据点个数;
网络中的所有的权重参数初始值由Glorot均匀分布方法生成,偏移量初始值设为0。采用Adam优化器,使该损失函数值减小直至迭代次数达到100,把最后一次迭代得到的各权重和偏移量参数的值作为最优值。
步骤四:将步骤三中得到的各权重和偏移量参数的最优值代入到改进的TCN神经网络模型中,利用训练集的原始PM10浓度时间序列中的最后6个数据点,根据步骤二中的步骤2.2到步骤2.4,得到2018年一月份的第一天的第一个时刻点的预测PM10浓度数据;将获得的预测PM10浓度数据顺接在原始PM10浓度时间序列σ的末位之后并将其作为新的原始PM10浓度时间序列,选取新的原始PM10浓度时间序列最后的6个数据点,重复步骤二中的步骤2.2到步骤2.4,得到2018年一月份的第一天的第二个时刻点的预测PM10浓度数据;后续时刻点的预测PM10浓度参照此过程,依次获得2018年一月份的744个时刻点的预测PM10浓度数据。
根据本发明预测方法,得到2018年一月份744个时刻点的PM10浓度预测值;将2018年一月份744个时刻点的PM10浓度的实际值作为测试集;2018年一月份的预测的744个时刻点的PM10浓度数据
Figure BDA0002857043960000191
与测试集中的实际数据yi进行对比,如图4所示(本发明预测方法所得预测数据用STCN表示,实际数据yi用Actual表示,下同);
对同样的训练集和测试集,采用BP网络预测方法(用BP表示)、LSTM网络预测方法(用LSTM表示)、WaveNet网络预测方法(用WaveNet表示)、改进前的TCN网络预测方法(用TCN表示)分别进行预测,该四种预测方法的结果与测试集中的实际数据yi的对比图见图5-8。
选定平方绝对误差(MAE)、平方绝对值百分比误差(MAPE)、平方均方误差(MSE)、均方根误差(RMSE)和决定系数(R2)五个评价指标来对本发明预测方法(用STCN表示)、BP网络预测方法(用BP表示)、LSTM网络预测方法(用LSTM表示)、WaveNet网络预测方法(用WaveNet表示)、改进前的TCN网络预测方法(用TCN表示)的预测结果进行评价。具体计算公式为:
Figure BDA0002857043960000192
数值越小说明预测越准确;
Figure BDA0002857043960000193
数值越小说明预测越准确;
Figure BDA0002857043960000194
数值越小说明预测越准确;
Figure BDA0002857043960000195
数值越小说明预测越准确;
Figure BDA0002857043960000196
数值越大说明预测越准确;
其中,yi表示真实值,
Figure BDA0002857043960000197
表示预测值,
Figure BDA0002857043960000198
为真实值yi的平均值。
五种预测方法的五种评价指标的对比如图9所示,结果显示,本发明预测方法所得结果更接近实测PM10浓度,通过与其它神经网络预测方法对比,本发明预测方法所得到的预测结果的稳定性更好,准确性更高。
本发明未述及之处适用于现有技术。

Claims (8)

1.一种基于改进TCN的空气污染物浓度预测方法,其特征在于,该预测方法的具体实施步骤如下:
步骤一:将一种空气污染物浓度历史数据时间序列按一定时间间隔选取数据点,得到训练集的原始空气污染物浓度时间序列;训练集中的时间长度不少于一年;
步骤二:建立改进的TCN神经网络模型
2.1令训练集的原始空气污染物浓度时间序列为σ,设定TCN神经网络的输入为Xσ=(σ1,σ2…σh),其中,h为神经网络输入数据的维度,表示在待预测的空气污染物浓度数据点对应时刻点之前的原始空气污染物浓度序列数据点的个数;由训练集的原始空气污染物浓度时间序列σ得到多组Xσ;TCN神经网络的输出为
Figure FDA0002857043950000011
表示第h+1时刻的预测数据;
2.2根据预设的神经网络输入数据的维度,将一个h维度的污染物浓度时间序列Xσ输入到TCN神经网络的一维全卷积层;一维全卷积层网络采用因果卷积;
假设卷积核f:{0,...,k-1}→R,则一个h个维度的污染物浓度时间序列Xσ中某个元素σt的输出为:
Figure FDA0002857043950000012
上式中,σt表示输入序列中的某个元素,即Xσ中第t时刻的污染物浓度数据,σt-i表示卷积的方向;
对一个h维度的污染物浓度时间序列Xσ中的每一个元素进行如公式(1)所示的操作,得到该Xσ的总体输出C(Xσ);
2.3构建残差收缩网络,残差收缩网络由串联的j个残差收缩网络块构成,一个残差收缩网络块包括l个残差收缩块,l个残差收缩块依次串联构成一个残差收缩网络块,每一个残差收缩块均包含一个空洞因果卷积模块和残差收缩路径模块,将空洞因果卷积模块的输入和残差收缩路径模块的输出进行跳跃连接,得到该残差收缩块的输出;第一个残差收缩块的输入为步骤2.2中的一维全卷积层的输出C(Xσ),最后一个残差收缩块的输入为倒数第二个残差收缩块的输出,最后一个残差收缩块的输出为残差收缩网络块的输出;
空洞因果卷积模块由两组空洞因果卷积层、归一化层、激活函数Relu操作层、Dropout层按顺序由底层往上层依次衔接而成;将第一个空洞因果卷积层的输出经过归一化层、激活函数Relu操作层、Dropout层处理后的数据作为第二个空洞因果卷积层的输入,将第二个空洞因果卷积层的输出经过归一化层、激活函数Relu操作层、Dropout层处理后的数据作为该空洞因果卷积模块的输出,每一个空洞因果卷积层只包含一层空洞因果卷积网络;di为空洞因子,空洞因果卷积模块中的两个空洞因果卷积层的空洞因子相同,每个残差收缩块中的卷积核大小都相同,设为F(W)=(W(1),W(2)),F(W)的初始值由Glorot均匀分布方法初始化;
Figure FDA0002857043950000023
是偏移量,在网络中初始值设为0,f表示一个非线性激活函数,在该网络中采用Relu函数;每一个残差收缩块中的空洞因果卷积模块结构相同,卷积核大小相同,空洞因子di不同,di∈[d1…dl],i对应第i个残差收缩块;
对于第一个残差收缩网络块第一个残差收缩块,将步骤2.2中一个Xσ的总体输出C(Xσ)作为其空洞因果卷积模块的输入样本,首先经过第一个空洞因果卷积层;在空洞因果卷积层上将使用上一层t和t-di时刻的数据,来预测当前层t时刻的数据,若t-di时刻的数据在输入样本中不存在,则以0替补;那么第一个空洞因果卷积层的输出结果如下:
Figure FDA0002857043950000021
其中
Figure FDA0002857043950000022
表示Xσ中的第t-d1时刻的污染物浓度数据经过一维全卷积层后的输出,C(σt)同理,d1为第一个残差收缩块的空洞因果卷积模块的两层空洞因果卷积层的空洞因子;W(1)、W(2)和b是一组针对于该层卷积核的权重和偏移量,W(1)、W(2)的初始值是由网络中Glorot均匀分布初始化方法生成,b的初始值为0,下同;
则第二个空洞因果卷积层的输出为:
Figure FDA0002857043950000031
Figure FDA0002857043950000032
为第一个空洞因果卷积层输出中的t-d1时刻数据经归一化层、激活函数Relu操作层、Dropout层处理后得到的结果,
Figure FDA0002857043950000033
同理;
将第二个空洞因果卷积层的输出经归一化层、激活函数Relu操作层、Dropout层处理后,得到第一个残差收缩块的空洞因果卷积模块的输出
Figure FDA0002857043950000034
对一维全卷积的输出C(Xσ)中的h个时刻的每个数据进行如上所示操作,得到总体输出E(Xσ)(1,1),以下简写为E(1,1)
将第一个残差收缩块的空洞因果卷积模块的输出E(1,1)作为第一个残差收缩块的残差收缩路径模块的输入,残差收缩路径模块首先对输出E(1,1)求绝对值,经过全局均值池化处理后,获得一个E(1,1)的特征值,记为记为A(1,1);将特征值记为A(1,1)输入到残差第一全连接网络层中,然后将残差第一全连接网络层的输出批处理归一化到0-1之间,再依次经过激活函数Relu处理、残差第二全连接层和激活函数Sigmoid处理后,获得一个系数,记为记为α(1,1);令残差收缩路径模块的自适应阈值为τ,对空洞因果卷积模块的输出E(1,1)进行软阈值化处理,得到残差收缩路径模块的输出
Figure FDA0002857043950000035
Figure FDA0002857043950000036
上式中,τ=α(1,1)×A(1,1)
将第一个残差收缩块的空洞因果卷积模块的输入和残差收缩路径模块的输出进行跳跃连接,得到第一个残差收缩网络块的第一个残差收缩块的输出:
Figure FDA0002857043950000037
其中,V和e表示跳跃连接的一组权重与偏移量;
同理,对于第一个残差收缩网络块第二个残差收缩块,其输出为:
Figure FDA0002857043950000041
Figure FDA0002857043950000042
为第一个残差收缩网络块的第二个残差收缩块的残差收缩路径模块的输出;
同理,对于第一个残差收缩网络块第l个残差收缩块,其输出为:
Figure FDA0002857043950000043
S(1,l-1)为第一个残差收缩网络块第l-1个残差收缩块的输出,
Figure FDA0002857043950000044
为第一个残差收缩网络块第l个残差收缩块的残差收缩路径模块的输出;
若残差收缩网络块为多个,则将多个残差收缩网络块依次串联,将前一个残差收缩网络块输出作为后一个残差收缩网络块的输入;同理,得到第二个残差收缩网络块的第一个残差收缩块的输出为:
Figure FDA0002857043950000045
Figure FDA0002857043950000046
为第二个残差收缩网络块的第一个残差收缩块的残差收缩路径模块的输出;
同理,得到第j个残差收缩网络块第l个残差收缩块的输出:
Figure FDA0002857043950000047
S(j,l-1)为第j个残差收缩网络块第l-1个残差收缩块的输出,
Figure FDA0002857043950000048
为第j个残差收缩网络块第l个残差收缩块的残差收缩路径模块的输出;
S(j,l)即为残差收缩网络的输出;
2.4将残差收缩网络块的最顶层的残差收缩块的输出S(j,l)输入到TCN神经网络的外层的全连接层中,外层的全连接层将最顶层的残差收缩块的输出进行综合,得到最后的预测结果
Figure FDA0002857043950000049
其中,g表示激活函数Linear,J和c表示外层的全连接层的一组权重和偏移量;
步骤三:对改进的TCN神经网络模型的网络参数的训练;
将由多组Xσ分别得到的预测结果与真实数据的均值平方误差MSE作为损失函数:
Figure FDA0002857043950000051
其中,yi表示真实值,
Figure FDA0002857043950000052
表示预测值,n为预测的数据点个数;
网络中的所有的权重参数初始值由Glorot均匀分布方法生成,偏移量初始值设为0;采用Adam优化器,使该损失函数值减小直至迭代次数达到设定值,把最后一次迭代得到的各权重和偏移量参数的值作为最优值;
步骤四:将步骤三中得到的各权重和偏移量参数的最优值代入到改进的TCN神经网络模型中,利用训练集的原始空气污染物浓度时间序列中的最后h个数据点,根据步骤二中的步骤2.2到步骤2.4,得到训练集的原始空气污染物浓度时间序列之后的第一个时刻点的预测污染物浓度数据;将获得的预测污染物浓度数据顺接在原始空气污染物浓度时间序列σ的末位之后并将其作为新的原始空气污染物浓度时间序列,选取新的原始空气污染物浓度时间序列最后的h个数据点,重复步骤二中的步骤2.2到步骤2.4,得到训练集的原始空气污染物浓度时间序列之后的第二个时刻点的预测污染物浓度数据;后续时刻点的预测污染物浓度参照此过程,依次获得。
2.根据权利要求1所述的一种基于改进TCN的空气污染物浓度预测方法,其特征在于,训练集中的时间长度为两年,数据点之间的时间间隔为1h。
3.根据权利要求1所述的一种基于改进TCN的空气污染物浓度预测方法,其特征在于,设定TCN神经网络的输入维度为6。
4.根据权利要求1所述的一种基于改进TCN的空气污染物浓度预测方法,其特征在于,残差收缩网络由两个残差收缩网络块串联构成,每一个残差收缩网络块包括3个残差收缩块。
5.根据权利要求1所述的一种基于改进TCN的空气污染物浓度预测方法,其特征在于,残差收缩网络中的归一化层均采用(0,1)标准化,Dropout层的丢弃率都为0.05。
6.根据权利要求1所述的一种基于改进TCN的空气污染物浓度预测方法,其特征在于,一个残差收缩网络块的3个残差收缩块中的空洞因果卷积模块中的空洞因子di∈[1,2,4]。
7.根据权利要求1所述的一种基于改进TCN的空气污染物浓度预测方法,其特征在于,采用Adam优化器计算各权重和偏移量参数的最优值时,迭代次数为100。
8.根据权利要求1所述的一种基于改进TCN的空气污染物浓度预测方法,其特征在于,空气污染物为PM10。
CN202011558387.4A 2020-12-24 2020-12-24 一种基于改进tcn的空气污染物浓度预测方法 Active CN112578089B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011558387.4A CN112578089B (zh) 2020-12-24 2020-12-24 一种基于改进tcn的空气污染物浓度预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011558387.4A CN112578089B (zh) 2020-12-24 2020-12-24 一种基于改进tcn的空气污染物浓度预测方法

Publications (2)

Publication Number Publication Date
CN112578089A true CN112578089A (zh) 2021-03-30
CN112578089B CN112578089B (zh) 2023-04-07

Family

ID=75140641

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011558387.4A Active CN112578089B (zh) 2020-12-24 2020-12-24 一种基于改进tcn的空气污染物浓度预测方法

Country Status (1)

Country Link
CN (1) CN112578089B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113283580A (zh) * 2021-04-30 2021-08-20 太原理工大学 一种太阳能电池板故障自动检测方法
CN114098681A (zh) * 2021-11-12 2022-03-01 南京海量物联科技有限公司 一种基于tcn模型和ppg信号的智能血压预测方法
CN115860286A (zh) * 2023-03-01 2023-03-28 江苏省生态环境监测监控有限公司 一种基于时序门机制的空气质量预测方法及系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108009674A (zh) * 2017-11-27 2018-05-08 上海师范大学 基于cnn和lstm融合神经网络的空气pm2.5浓度预测方法
CN109492822A (zh) * 2018-11-24 2019-03-19 上海师范大学 空气污染物浓度时空域关联预测方法
CN109685246A (zh) * 2018-11-13 2019-04-26 平安科技(深圳)有限公司 环境数据预估方法、装置及存储介质、服务器
AU2019100364A4 (en) * 2019-04-05 2019-05-09 Shenyuan Huang A Method of Air Quality Prediction Using Long Short-Term Memory Neural Network
CN110363347A (zh) * 2019-07-12 2019-10-22 江苏天长环保科技有限公司 基于决策树索引的神经网络预测空气质量的方法
CN110472779A (zh) * 2019-07-30 2019-11-19 东莞理工学院 一种基于时间卷积网络的电力系统短期负荷预测方法
CN111832814A (zh) * 2020-07-01 2020-10-27 北京工商大学 一种基于图注意力机制的空气污染物浓度预测方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108009674A (zh) * 2017-11-27 2018-05-08 上海师范大学 基于cnn和lstm融合神经网络的空气pm2.5浓度预测方法
CN109685246A (zh) * 2018-11-13 2019-04-26 平安科技(深圳)有限公司 环境数据预估方法、装置及存储介质、服务器
CN109492822A (zh) * 2018-11-24 2019-03-19 上海师范大学 空气污染物浓度时空域关联预测方法
AU2019100364A4 (en) * 2019-04-05 2019-05-09 Shenyuan Huang A Method of Air Quality Prediction Using Long Short-Term Memory Neural Network
CN110363347A (zh) * 2019-07-12 2019-10-22 江苏天长环保科技有限公司 基于决策树索引的神经网络预测空气质量的方法
CN110472779A (zh) * 2019-07-30 2019-11-19 东莞理工学院 一种基于时间卷积网络的电力系统短期负荷预测方法
CN111832814A (zh) * 2020-07-01 2020-10-27 北京工商大学 一种基于图注意力机制的空气污染物浓度预测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
朱启兵等: "基于小波神经网络的污水处理厂出水水质预测", 《计算机工程与应用》 *
邢杰等: "基于集成神经网络的CSTR状态预测", 《计算机与应用化学》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113283580A (zh) * 2021-04-30 2021-08-20 太原理工大学 一种太阳能电池板故障自动检测方法
CN114098681A (zh) * 2021-11-12 2022-03-01 南京海量物联科技有限公司 一种基于tcn模型和ppg信号的智能血压预测方法
CN115860286A (zh) * 2023-03-01 2023-03-28 江苏省生态环境监测监控有限公司 一种基于时序门机制的空气质量预测方法及系统

Also Published As

Publication number Publication date
CN112578089B (zh) 2023-04-07

Similar Documents

Publication Publication Date Title
CN112578089B (zh) 一种基于改进tcn的空气污染物浓度预测方法
CN107688850B (zh) 一种深度神经网络压缩方法
CN109816095B (zh) 基于改进门控循环神经网络的网络流量预测方法
CN107688849A (zh) 一种动态策略定点化训练方法及装置
CN107679618A (zh) 一种静态策略定点化训练方法及装置
CN111260124A (zh) 一种基于注意力机制深度学习的混沌时间序列预测方法
CN111753207B (zh) 一种基于评论的神经图协同过滤方法
CN115545350B (zh) 综合深度神经网络与强化学习的车辆路径问题求解方法
WO2022126683A1 (zh) 面向多任务的预训练语言模型自动压缩方法及平台
CN111626764A (zh) 基于Transformer+LSTM神经网络模型的商品销量预测方法及装置
CN113240105B (zh) 一种基于图神经网络池化的电网稳态判别方法
CN112686376A (zh) 一种基于时序图神经网络的节点表示方法及增量学习方法
CN111461907A (zh) 一种面向社交网络平台的动态网络表征学习方法
CN114707712A (zh) 一种发电机组备件需求的预测方法
CN111123894B (zh) 一种基于lstm和mlp结合的化工过程故障诊断方法
CN112257847A (zh) 一种基于CNN和LSTM预测地磁Kp指数的方法
CN113052373A (zh) 一种基于改进elm模型的月径流变化趋势预测方法
CN110633417B (zh) 一种基于服务质量的web服务推荐的方法及系统
CN108009635A (zh) 一种支持增量更新的深度卷积计算模型
CN111292121A (zh) 一种基于园区画像的园区负荷预测方法及系统
CN110738363A (zh) 一种光伏发电功率预测模型及其构建方法和应用
CN116303786B (zh) 一种基于多维数据融合算法的区块链金融大数据管理系统
Abbas System identification using optimally designed functional link networks via a fast orthogonal search technique.
CN114638421A (zh) 一种发电机组备件需求的预测方法
CN113612660B (zh) 一种基于种群自适应差分进化的lstm网络流量预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant