CN116485015A - 一种基于Conv-LSTM-RA网络的空气质量指数预测方法 - Google Patents
一种基于Conv-LSTM-RA网络的空气质量指数预测方法 Download PDFInfo
- Publication number
- CN116485015A CN116485015A CN202310354751.2A CN202310354751A CN116485015A CN 116485015 A CN116485015 A CN 116485015A CN 202310354751 A CN202310354751 A CN 202310354751A CN 116485015 A CN116485015 A CN 116485015A
- Authority
- CN
- China
- Prior art keywords
- network
- lstm
- air quality
- conv
- concentration
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 25
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 46
- 238000009826 distribution Methods 0.000 claims abstract description 4
- 230000015654 memory Effects 0.000 claims abstract description 3
- 238000007781 pre-processing Methods 0.000 claims abstract description 3
- 238000012360 testing method Methods 0.000 claims description 23
- MWUXSHHQAYIFBG-UHFFFAOYSA-N Nitric oxide Chemical compound O=[N] MWUXSHHQAYIFBG-UHFFFAOYSA-N 0.000 claims description 16
- RAHZWNYVWXNFOC-UHFFFAOYSA-N Sulphur dioxide Chemical compound O=S=O RAHZWNYVWXNFOC-UHFFFAOYSA-N 0.000 claims description 16
- 238000004364 calculation method Methods 0.000 claims description 15
- 238000012549 training Methods 0.000 claims description 15
- CBENFWSGALASAD-UHFFFAOYSA-N Ozone Chemical compound [O-][O+]=O CBENFWSGALASAD-UHFFFAOYSA-N 0.000 claims description 8
- 230000015556 catabolic process Effects 0.000 claims description 6
- 238000006731 degradation reaction Methods 0.000 claims description 6
- 238000011176 pooling Methods 0.000 claims description 5
- MGWGWNFMUOTEHG-UHFFFAOYSA-N 4-(3,5-dimethylphenyl)-1,3-thiazol-2-amine Chemical compound CC1=CC(C)=CC(C=2N=C(N)SC=2)=C1 MGWGWNFMUOTEHG-UHFFFAOYSA-N 0.000 claims description 4
- JCXJVPUVTGWSNB-UHFFFAOYSA-N nitrogen dioxide Inorganic materials O=[N]=O JCXJVPUVTGWSNB-UHFFFAOYSA-N 0.000 claims description 4
- 238000004140 cleaning Methods 0.000 claims description 3
- 238000011156 evaluation Methods 0.000 claims description 3
- 239000011159 matrix material Substances 0.000 claims description 3
- 238000000605 extraction Methods 0.000 abstract 1
- 239000003570 air Substances 0.000 description 35
- 238000010586 diagram Methods 0.000 description 3
- 230000007613 environmental effect Effects 0.000 description 3
- 230000006403 short-term memory Effects 0.000 description 3
- 238000003915 air pollution Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000003912 environmental pollution Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000007787 long-term memory Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 210000002569 neuron Anatomy 0.000 description 2
- 239000012080 ambient air Substances 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000003344 environmental pollutant Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 231100000719 pollutant Toxicity 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
- G06N3/0442—Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Computing Systems (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Software Systems (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Development Economics (AREA)
- Primary Health Care (AREA)
- Educational Administration (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本专利公开了一种基于Conv‑LSTM‑RA网络的空气质量指数预测方法,首先,对获取到的历史空气质量数据进行预处理;其次,利用卷积神经网络(CNN)中的一维卷积结构(Conv1D)进行特征提取,并在卷积神经网络中加入残差模块,以获取更多的特征信息;然后,使用长短期记忆(LSTM)在时间维度上根据设定的窗口进行未来空气质量指数的预测;最后,在LSTM中使用注意力机制,利用注意力机制学习输入序列的权重分布,得出最终预测结果。与现有的单一网络模型相比,本发明提出的混合模型方法能够更加有效的预测数据,提高预测模型的准确率。
Description
技术领域
本发明属于空气质量预测技术领域,特别涉及一种基于Conv-LSTM-RA网络的空气质量指数预测方法。
背景技术
近年来,我国科技和经济水平处于高速发展的时期,在人民生活质量显著提高的同时,环境污染问题也越发严重。其中,空气污染作为环境污染的主要方面之一,受到人们的广泛关注。
空气质量指数(AQI,Air Quality Index)是定量描述空气质量状况的无量纲指数,根据环境空气质量标准和PM10、PM2.5、CO、SO2、NO2、O3等污染物对人体健康、生态、环境的影响,将常规监测的空气污染物浓度简化成为单一的概念性指数值形式,来表示空气污染程度和空气质量状况的分级指数。我国各地环保局实时发布的空气质量指数相关数值,是环境监测的重要指标。基于AQI指数实施日常监测和评价空气质量,定量描述空气质量状况,对生产生活具有指导意义。AQI指数为制定环境保护政策和污染防治措施提供决策依据,从而达到改善环境、促进人们身体健康的最终目的。因此,对空气质量指数准确、高效、全面的预测是十分重要的。
王鑫等使用LSTM(long short term memory network)循环神经网络对故障时间序列进行预测,这种方法并未充分提取相关的特征信息;Shi等人提出了ConvLSTM(Conventional LSTM)网络对降雨量的预测,王海瑶等人提出了CNN-AGU的空气质量指数预测方法,但是上述技术方案都没有解决卷积神经网络中的退化问题。
发明内容
发明目的:针对传统的一些神经网络模型只是简单的堆放LSTM或者CNN,不能全面地反映空气质量的复杂特性,本发明提出了一种基于Conv-LSTM-RA网络的空气质量指数预测方法,在长短期记忆中加入卷积神经网络、残差网络和注意力机制,利用CNN中的降维操作和残差网络提取更多的与空气质量相关的特征信息,并使用注意力机制来捕捉不同时刻的重要信息。
技术方案:本发明提出了一种基于Conv-LSTM-RA网络的空气质量指数预测方法,具体步骤如下:
步骤1:对已获取到的历史数据集命名为AirQuality,对其进行预处理,得到处理之后的数据集,将其命名为Pro_AirQuality,所述历史数据集包括PM2.5浓度、PM10浓度、二氧化硫浓度、二氧化氮浓度、一氧化氮浓度、臭氧浓度、温度、降雨量、风向和空气质量指数;
步骤2:搭建CNN卷积神经网络,并在卷积神经网络中加入残差网络,利用一维卷积结构和残差模块提取更多的与空气质量相关的特征;
步骤3:在搭建好的CNN和残差网络之后使用长短期记忆LSTM在时间维度上根据设定的窗口进行未来空气质量指数的预测;
步骤4:在步骤3搭建的Conv-LSTM网络中加入注意力机制RA,搭建Conv-LSTM-RA网络,对不同时间段的数据赋予不同的权重,学习输入序列中的权重分布,输出特征Hk;
步骤5:利用搭建好的Conv-LSTM-RA网络对数据集进行训练并在测试集上进行验证,实现对空气质量指数(AQI)的预测。
进一步地,所述步骤1数据预处理的具体步骤为:
(1.1)将已获取到的历史数据集AirQuality定义为:AirQuality=[x1,x2,x3,…,xt,…,xn]T,共n条数据,其中xt=[x1 t,x2 t,…,x10 t]表示第t个小时的PM2.5浓度、PM10浓度、二氧化硫浓度、二氧化氮浓度、一氧化氮浓度、臭氧浓度、温度、降雨量、风向和空气质量指数;
Jk表示第t+1小时到第t+k小时的PM2.5浓度、PM10浓度、二氧化硫浓度、二氧化氮浓度、一氧化氮浓度、臭氧浓度、温度、降雨量、风向和空气质量指数;
(1.2)进行数据清洗,使用线性插值的方法填充数据集中的空值,用one-hot编码方式对wd列转换为数据类型;
(1.3)使用Z-score方法对步骤(1.2)中处理好的数据进行归一化处理,将处理之后的数据集定以为Pro_AirQuality;;
(1.4)构造训练集和测试集,将步骤(1.3)获得的数据集Pro_AirQuality中数据打乱随机划分,设置70%的训练集和30%的测试集,其中训练集为tr,测试集为te。
进一步地,所述步骤2的具体步骤为:
(2.1)搭建CNN卷积神经网络,将第t+1小时到第t+k小时的数据Jk进行一维卷积计算和最大池化计算,提取与空气质量相关的特征Mk;
(2.2)在步骤(2.1)中的CNN网络中加入残差网络,在CNN的输入和输出之间直接引入一条通路,实现跳跃连接,消除卷积神经网络的退化问题,提取更多的特征信息Mk+Jk。
进一步地,所述步骤3中在搭建好的CNN和残差网络之后加入LSTM的具体步骤为:
在步骤(2.2)中已搭建好的CNN和残差网络中加入LSTM,利用LSTM的门控单元结构来学习时间顺序上的信息,通过输入门、遗忘门和输出门计算得到输出Ht-k+i和隐藏层状态输出ht-k+i。
进一步地,所述步骤4中在Conv-LSTM网络中加入注意力机制RA的具体步骤为:
(4.1)在Conv-LSTM网络中加入注意力机制RA,其中权重序列的计算公式如下:
st-k+i=v·(w·ht-k+i+b)
其中,v,w为权重矩阵,可学习的参数,b为偏置项;
(4.2)由步骤(4.1)得到注意力分布at-k+i与Conv-LSTM网络计算获得的Ht-k+i做加权求和计算,具体公式如下:
Hk=∑at-k+iHt-k+i
进一步地,所述步骤5中具体步骤为:
(5.1)将步骤4中的特征Hk拼接成特征向量Yk并输入到回归层进行训练,将训练好的Conv-LSTM-RA网络应用到测试集中,输出预测值实现用第t+1小时到第t+k小时的数据预测第t+k+1小时的空气质量指数;
(5.2)对测试集数据最终的预测结果进行评价与分析,将测试值与实际值yi进行比较,采用平均绝对误差MAE和确定系数R2作为评价指标,其具体计算公式如下:
有益效果:
本发明将长短期记忆和卷积神经网络相结合,利用CNN的卷积层和池化层来提取与空气质量相关的特征,LSTM对时间序列进行预测;同时在卷积神经网络中加入残差网络,消除了CNN的退化问题,在LSTM中加入注意力机制来学习较早时刻的重要信息。使用卷积神经网络中的卷积层和池化层进行降维,提取与空气质量相关的特征。在CNN网络中加入残差网络,在CNN的输入和输出之间直接引入一条通路,实现跳跃连接,消除卷积神经网络的退化问题,提取更多的特征信息Mk+Jk,从而提高预测准确率。另外,在Conv-LSTM网络中加入注意力机制,可以有效避免神经元状态随着时间推移较早时刻的权重越来越小,注意力机制可以分析当前隐藏状态输出与之前隐藏状态输出的关联,发现时间序列中不同时刻的数据特征,从而为不同时刻赋予不同的权重,有效学习较早时刻的重要信息。附图说明
图1为Conv-LSTM-RA网络的整体流程框图;
图2为在CNN中加入残差网络图;
图3为将注意力机制加到Conv-LSTM网络中图。
具体实施方式
下面结合附图和具体实施方式,进一步阐明本发明。应理解这些实施例仅用于说明本发明而不用于限制本发明的范围,在阅读本发明之后,本领域技术人员对本发明的各种等价形式的修改均落于本申请所附权利要求所限定的范围。
如附图1所示,本发明公开的基于Conv-LSTM-RA网络的空气质量指数预测方法,具体步骤如下:
步骤1:对已获取到的历史数据集命名为AirQuality,对其进行预处理,得到处理之后的数据集,将其命名为Pro_AirQuality,具体步骤如下:
(1.1)将已获取到的历史数据集AirQuality定义为:AirQuality=[x1,x2,x3,…,xt,…,xn]T,共n条数据,其中xt=[x1 t,x2 t,…,x10 t]表示第t小时的PM2.5浓度、PM10浓度、二氧化硫浓度、二氧化氮浓度、一氧化氮浓度、臭氧浓度、温度、降雨量、风向和空气质量指数。
Jk表示第t+1小时到第t+k小时的PM2.5浓度、PM10浓度、二氧化硫浓度、二氧化氮浓度、一氧化氮浓度、臭氧浓度、温度、降雨量、风向和空气质量指数。
(1.2)进行数据清洗,使用线性插值的方法填充数据集中的空值,用one-hot编码方式对wd列转换为数据类型。
(1.3)使用Z-score方法对步骤(1.2)中处理好的数据进行归一化处理,将处理之后的数据集定以为Pro_AirQuality。
(1.4)构造训练集和测试集,将步骤(1.3)获得的数据集Pro_AirQuality中数据打乱随机划分,设置70%的训练集和30%的测试集,其中训练集为tr,测试集为te。
步骤2:搭建CNN卷积神经网络,并在卷积神经网络中加入残差网络,利用一维卷积结构和残差模块提取更多的与空气质量相关的特征,参见图2,具体步骤如下:
(2.1)搭建卷积神经网络,将第t+1小时到第t+k小时的数据Jk进行一维卷积计算和最大池化计算,提取与空气质量相关的特征Mk。
(2.2)在步骤(2.1)中的CNN网络中加入残差网络,在CNN的输入和输出之间直接引入一条通路,实现跳跃连接,消除卷积神经网络的退化问题,提取更多的特征信息Mk+Jk,从而提高预测准确率,具体参见图2。
步骤3:在搭建好的CNN和残差网络之后使用长短期记忆(LSTM)在时间维度上根据设定的窗口进行未来空气质量指数的预测。具体步骤如下:
在步骤(2.2)中已搭建好的CNN中加入LSTM,利用LSTM的门控单元结构来学习时间顺序上的信息,通过输入门、遗忘门和输出门计算得到输出Ht-k+i和隐藏层状态输出ht-k+i。
步骤4:在Conv-LSTM网络中加入注意力机制对不同时间段的数据赋予不同的权重,学习输入序列中的权重分布,参见图3,具体步骤如下:
(4.1)在Conv-LSTM网络中加入注意力机制,可以有效避免神经元状态随着时间推移较早时刻的权重越来越小,注意力机制可以分析当前隐藏状态输出与之前隐藏状态输出的关联,发现时间序列中不同时刻的数据特征,从而为不同时刻赋予不同的权重,有效学习较早时刻的重要信息,其中权重序列的计算公式如下:
st-k+i=v·(w·ht-k+i+b)
其中,v,w为权重矩阵,可学习的参数,b为偏置项。
(4.2)由步骤(4.1)得到注意力分布at-k+i与Conv-LSTM模块计算获得的Ht-k+i做加权求和计算,具体公式如下:
Hk=∑at-k+iHt-k+i
步骤5:利用搭建好的Conv-LSTM-RA网络对数据集进行训练并在测试集上进行验证,实现对空气质量指数(AQI)的预测,具体步骤如下:
(5.1)将步骤(4.2)中的特征Hk拼接成特征向量Yk并输入到回归层进行训练,将训练好的Conv-LSTM-RA网络应用到测试集中,输出预测值实现用第t+1小时到第t+k小时的数据预测第t+k+1小时的空气质量指数。
(5.2)为评价模型效果,因此对测试集数据最终的预测结果进行评价与分析,将测试值与实际值yi进行比较,采用平均绝对误差MAE和确定系数R2作为评价指标,其具体计算公式如下:
上述实施方式只为说明本发明的技术构思及特点,其目的在于让熟悉此项技术的人能够了解本发明的内容并据以实施,并不能以此限制本发明的保护范围。凡根据本发明精神实质所做的等效变换或修饰,都应涵盖在本发明的保护范围之内。
Claims (6)
1.一种基于Conv-LSTM-RA网络的空气质量指数预测方法,其特征在于,具体步骤如下:
步骤1:对已获取到的历史数据集命名为AirQuality,对其进行预处理,得到处理之后的数据集,将其命名为Pro_AirQuality,所述历史数据集包括PM2.5浓度、PM10浓度、二氧化硫浓度、二氧化氮浓度、一氧化氮浓度、臭氧浓度、温度、降雨量、风向和空气质量指数;
步骤2:搭建CNN卷积神经网络,并在卷积神经网络中加入残差网络,利用一维卷积结构和残差模块提取更多的与空气质量相关的特征;
步骤3:在搭建好的CNN和残差网络之后使用长短期记忆LSTM在时间维度上根据设定的窗口进行未来空气质量指数的预测;
步骤4:在步骤3搭建的Conv-LSTM网络中加入注意力机制RA,搭建Conv-LSTM-RA网络,对不同时间段的数据赋予不同的权重,学习输入序列中的权重分布,输出特征Hk;
步骤5:利用搭建好的Conv-LSTM-RA网络对数据集进行训练并在测试集上进行验证,实现对空气质量指数(AQI)的预测。
2.根据权利要求1所述的基于Conv-LSTM-RA网络的空气质量指数预测方法,其特征在于,所述步骤1数据预处理的具体步骤为:
(2.1)将已获取到的历史数据集AirQuality定义为:AirQuality=[x1,x2,x3,…,xt,…,xn]T,共n条数据,其中xt=[x1 t,x2 t,…,x10 t]表示第t个小时的PM2.5浓度、PM10浓度、二氧化硫浓度、二氧化氮浓度、一氧化氮浓度、臭氧浓度、温度、降雨量、风向和空气质量指数;Jk表示第t+1小时到第t+k小时的PM2.5浓度、PM10浓度、二氧化硫浓度、二氧化氮浓度、一氧化氮浓度、臭氧浓度、温度、降雨量、风向和空气质量指数;
(2.2)进行数据清洗,使用线性插值的方法填充数据集中的空值,用one-hot编码方式对wd列转换为数据类型;
(2.3)使用Z-score方法对步骤(2.2)中处理好的数据进行归一化处理,将处理之后的数据集定以为Pro_AirQuality;
(2.4)构造训练集和测试集,将步骤(2.3)获得的数据集Pro_AirQuality中数据打乱随机划分,设置70%的训练集和30%的测试集,其中训练集为tr,测试集为te。
3.根据权利要求1所述的基于Conv-LSTM-RA网络的空气质量指数预测方法,其特征在于,所述步骤2的具体步骤为:
(3.1)搭建CNN卷积神经网络,将第t+1小时到第t+k小时的数据Jk进行一维卷积计算和最大池化计算,提取与空气质量相关的特征Mk;
(3.2)在步骤(3.1)中的CNN网络中加入残差网络,在CNN的输入和输出之间直接引入一条通路,实现跳跃连接,消除卷积神经网络的退化问题,提取更多的特征信息Mk+Jk。
4.根据权利要求3所述的基于Conv-LSTM-RA网络的空气质量指数预测方法,其特征在于,所述步骤3中在搭建好的CNN和残差网络之后加入LSTM的具体步骤为:
在步骤(3.2)中已搭建好的CNN和残差网络中加入LSTM,利用LSTM的门控单元结构来学习时间顺序上的信息,通过输入门、遗忘门和输出门计算得到输出Ht-k+i和隐藏层状态输出ht-k+i。
5.根据权利要求4所述的基于Conv-LSTM-RA网络的空气质量指数预测方法,其特征在于,所述步骤4中在Conv-LSTM网络中加入注意力机制RA的具体步骤为:
(5.1)在Conv-LSTM网络中加入注意力机制RA,其中权重序列的计算公式如下:
st-k+i=v·(w·ht-k+i+b)
其中,v,w为权重矩阵,可学习的参数,b为偏置项;
(5.2)由步骤(5.1)得到注意力分布at-k+i与Conv-LSTM网络计算获得的Ht-k+i做加权求和计算,具体公式如下:
Hk=∑at-k+iHt-k+i。
6.根据权利要求1所述的基于Conv-LSTM-RA网络的空气质量指数预测方法,其特征在于,所述步骤5中具体步骤为:
(6.1)将步骤4中的特征Hk拼接成特征向量Yk并输入到回归层进行训练,将训练好的Conv-LSTM-RA网络应用到测试集中,输出预测值实现用第t+1小时到第t+k小时的数据预测第t+k+1小时的空气质量指数;
(6.2)对测试集数据最终的预测结果进行评价与分析,将测试值与实际值yi进行比较,采用平均绝对误差MAE和确定系数R2作为评价指标,其具体计算公式如下:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310354751.2A CN116485015A (zh) | 2023-04-04 | 2023-04-04 | 一种基于Conv-LSTM-RA网络的空气质量指数预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310354751.2A CN116485015A (zh) | 2023-04-04 | 2023-04-04 | 一种基于Conv-LSTM-RA网络的空气质量指数预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116485015A true CN116485015A (zh) | 2023-07-25 |
Family
ID=87216143
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310354751.2A Pending CN116485015A (zh) | 2023-04-04 | 2023-04-04 | 一种基于Conv-LSTM-RA网络的空气质量指数预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116485015A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117554574A (zh) * | 2023-11-27 | 2024-02-13 | 武汉宇境科技有限公司 | 基于物联网的微型空气质量自动监测仪 |
-
2023
- 2023-04-04 CN CN202310354751.2A patent/CN116485015A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117554574A (zh) * | 2023-11-27 | 2024-02-13 | 武汉宇境科技有限公司 | 基于物联网的微型空气质量自动监测仪 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112949945B (zh) | 一种改进双向长短期记忆网络的风电功率超短期预测方法 | |
CN108491970B (zh) | 一种基于rbf神经网络的大气污染物浓度预测方法 | |
CN112116080A (zh) | 一种融合了注意力机制的cnn-gru水质预测方法 | |
CN116757534B (zh) | 一种基于神经训练网络的智能冰箱可靠性分析方法 | |
CN113554466B (zh) | 一种短期用电量预测模型构建方法、预测方法和装置 | |
CN113344288B (zh) | 梯级水电站群水位预测方法、装置及计算机可读存储介质 | |
CN112116162A (zh) | 基于ceemdan-qfoa-lstm的输电线覆冰厚度预测方法 | |
CN111222992A (zh) | 一种基于注意力机制的长短期记忆神经网络的股票价格预测方法 | |
CN116485015A (zh) | 一种基于Conv-LSTM-RA网络的空气质量指数预测方法 | |
CN111898825A (zh) | 一种光伏发电功率短期预测方法及装置 | |
CN111832703B (zh) | 一种流程制造工业不规则采样动态序列建模方法 | |
CN114357670A (zh) | 一种基于bls和自编码器的配电网用电数据异常预警方法 | |
CN114444561A (zh) | 基于CNNs-GRU融合深度学习模型的PM2.5预测方法 | |
CN116401516A (zh) | 一种基于深度学习的电力负荷异常数据检测与修正方法 | |
CN115877483A (zh) | 一种基于随机森林和gru的台风路径预报方法 | |
CN115343784A (zh) | 一种基于seq2seq-attention模型的局部气温预测方法 | |
CN113762591B (zh) | 一种基于gru和多核svm对抗学习的短期电量预测方法及系统 | |
CN113159395A (zh) | 一种基于深度学习的污水处理厂进水流量预测方法及系统 | |
CN112986393A (zh) | 一种桥梁拉索损伤的检测方法和系统 | |
CN117371608A (zh) | 基于深度学习的猪舍多点位温湿度预测方法及系统 | |
CN112836876A (zh) | 一种基于深度学习的配电网线路负荷预测方法 | |
CN117151770A (zh) | 一种基于注意力机制的lstm碳价预测方法和系统 | |
CN115759343A (zh) | 一种基于e-lstm的用户电量预测方法和装置 | |
CN113095534A (zh) | 一种ARIMA与改进Elman神经网络组合的风电功率预测方法 | |
CN116090661A (zh) | 一种滑坡位移智能预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |