CN113177672B - 基于长短时记忆网络的pm2.5预测方法 - Google Patents
基于长短时记忆网络的pm2.5预测方法 Download PDFInfo
- Publication number
- CN113177672B CN113177672B CN202110593273.1A CN202110593273A CN113177672B CN 113177672 B CN113177672 B CN 113177672B CN 202110593273 A CN202110593273 A CN 202110593273A CN 113177672 B CN113177672 B CN 113177672B
- Authority
- CN
- China
- Prior art keywords
- time
- short
- long
- memory network
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000015654 memory Effects 0.000 title claims abstract description 33
- 238000000034 method Methods 0.000 title claims abstract description 18
- 239000011159 matrix material Substances 0.000 claims abstract description 13
- 238000006243 chemical reaction Methods 0.000 claims description 3
- 238000012544 monitoring process Methods 0.000 claims description 3
- 238000010606 normalization Methods 0.000 claims description 3
- 238000005096 rolling process Methods 0.000 claims description 3
- 230000007787 long-term memory Effects 0.000 claims 1
- 230000006403 short-term memory Effects 0.000 claims 1
- 238000012417 linear regression Methods 0.000 abstract description 5
- 230000000694 effects Effects 0.000 abstract description 4
- 238000003062 neural network model Methods 0.000 abstract description 4
- 239000003344 environmental pollutant Substances 0.000 abstract description 3
- 231100000719 pollutant Toxicity 0.000 abstract description 3
- 238000010586 diagram Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N15/00—Investigating characteristics of particles; Investigating permeability, pore-volume or surface-area of porous materials
- G01N15/06—Investigating concentration of particle suspensions
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/0004—Gaseous mixtures, e.g. polluted air
- G01N33/0009—General constructional details of gas analysers, e.g. portable test equipment
- G01N33/0027—General constructional details of gas analysers, e.g. portable test equipment concerning the detector
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/0004—Gaseous mixtures, e.g. polluted air
- G01N33/0009—General constructional details of gas analysers, e.g. portable test equipment
- G01N33/0062—General constructional details of gas analysers, e.g. portable test equipment concerning the measuring method or the display, e.g. intermittent measurement or digital display
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- Biochemistry (AREA)
- Analytical Chemistry (AREA)
- Immunology (AREA)
- Business, Economics & Management (AREA)
- Pathology (AREA)
- Biophysics (AREA)
- Human Resources & Organizations (AREA)
- Medicinal Chemistry (AREA)
- Food Science & Technology (AREA)
- Combustion & Propulsion (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Economics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Strategic Management (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Entrepreneurship & Innovation (AREA)
- Dispersion Chemistry (AREA)
- General Business, Economics & Management (AREA)
- Game Theory and Decision Science (AREA)
- Marketing (AREA)
- Development Economics (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于长短时记忆网络的PM2.5预测方法,建立长短时记忆网络模型,所述长短时记忆网络模型包括依次设立的LSTM层和Dense层,初始化所述长短时记忆网络模型的参数并将所述数据矩阵Z作为输入,得到输出预测值W,将所述预测值W与所述目标值Y进行对比,根据对比结果修改所述长短时记忆网络模型的参数,直至对比结果的误差在设定的范围内。本发明利用长短时记忆网络,更好的刻画PM2.5浓度本身具有的时间序列关系,最终训练得到的预测模型相较于线性回归和神经网络模型具有更高的准确度,同时本发明充分考虑了包括其他污染物及天气因素对PM2.5浓度的影响,预测效果更加精确。
Description
技术领域
本发明涉及数据处理领域,特别涉及一种基于长短时记忆网络的PM2.5预测方法。
背景技术
PM2.5浓度预测作为回归预测,现有方法主要包括线性回归和神经网络等,在预测效果上有一定的准确性,但未考虑到PM2.5浓度前后时刻具有的连续性,即下一个时段浓度值变化与上个时间段的含量具有很强的记忆关系,因此,使用该方式所得到的PM2.5浓度并不精确。
发明内容
本发明的目的是克服上述现有技术中存在的问题,提供一种基于长短时记忆网络的PM2.5预测方法,利用长短时记忆网络,更好的刻画PM2.5浓度本身具有的时间序列关系,最终训练得到的预测模型相较于线性回归和神经网络模型具有更高的准确度。
为此,本发明提供一种基于长短时记忆网络的PM2.5预测方法,包括如下步骤:
S1:获取目标空气质量监测站点中M个时间节点的每一个时间节点的PM2.5的值以及其他N-1个空气参数的值,其中M为正整数;
S2:截取第m个时间节点之前的F个时间节点的每一个时间节点的PM2.5的值以及其他N-1个空气参数的值,其中m、F以及N均为正整数,m∈M,F<m;
构建第f个时间节点的特征向量基数Hf,使得
Hf=[x1,x2,…,xn,…,xN]
其中,x1表示F个时间节点中第f个时间节点的PM2.5的值,xn表示F个时间节点中第f个时间节点的第n个空气参数的值,且n∈N,f为正整数;
S3:构建数据矩阵Z,使得
Z=[H1,H2,…,Hf,…,HF]
其中,f∈F;
S4:设置目标值Y,使得
Y=Tm+r
其中,Tm+r表示第m个时间节点之后第r个时间节点的PM2.5的值,r为正整数;
S5:建立长短时记忆网络模型,所述长短时记忆网络模型包括依次设立的LSTM层和Dense层,初始化所述长短时记忆网络模型的参数并将所述数据矩阵Z作为输入,得到输出预测值W,将所述预测值W与所述目标值Y进行对比,根据对比结果修改所述长短时记忆网络模型的参数,直至对比结果的误差在设定的范围内。
进一步,本发明使用滚动时间窗口的方式进行所述步骤S1至步骤S4,使得所述数据矩阵Z遍历所述M个时间节点的每一个时间节点的PM2.5的值以及其他N-1个空气参数的值。
进一步,在步骤S2中,在得到构建的第f个时间节点的特征向量基数Hf之后,对所述特征向量基数Hf进行归一化处理。
进一步,在步骤S1中,在得到M个时间节点的每一个时间节点的PM2.5的值以及其他N-1个空气参数的值之后,对数据进行清洗。
进一步,在步骤S5中,所述所述数据矩阵Z作为输入进入所述LSTM层,输出得到多维向量,在将所述LSTM层输出的所述多维向量送入所述Dense层进行向量转换得到一维数值,并将该输出的所述一维数值作为所述预测值W。
本发明提供的基于长短时记忆网络的PM2.5预测方法,具有如下有益效果:
1、本发明利用长短时记忆网络,更好的刻画PM2.5浓度本身具有的时间序列关系,最终训练得到的预测模型相较于线性回归和神经网络模型具有更高的准确度;
2、本发明充分考虑了包括其他污染物及天气因素对PM2.5浓度的影响,预测效果更加精确;
附图说明
图1为本发明的整体数据流程示意图;
图2为本发明的实测数据统计示意图。
具体实施方式
下面结合附图,对本发明的多个具体实施方式进行详细描述,但应当理解本发明的保护范围并不受具体实施方式的限制。
具体的,如图1所示,本发明实施例提供了一种基于长短时记忆网络的PM2.5预测方法,包括如下步骤:
S1:获取目标空气质量监测站点中M个时间节点的每一个时间节点的PM2.5的值以及其他N-1个空气参数的值,其中M为正整数;
S2:截取第m个时间节点之前的F个时间节点的每一个时间节点的PM2.5的值以及其他N-1个空气参数的值,其中m、F以及N均为正整数,m∈M,F<m;
构建第f个时间节点的特征向量基数Hf,使得
Hf=[x1,x2,…,xn,…,xN]
其中,x1表示F个时间节点中第f个时间节点的PM2.5的值,xn表示F个时间节点中第f个时间节点的第n个空气参数的值,且n∈N,f为正整数;
S3:构建数据矩阵Z,使得
Z=[H1,H2,…,Hf,…,HF]
其中,f∈F;
S4:设置目标值Y,使得
Y=Tm+r
其中,Tm+r表示第m个时间节点之后第r个时间节点的PM2.5的值,r为正整数;
S5:建立长短时记忆网络模型,所述长短时记忆网络模型包括依次设立的LSTM层和Dense层,初始化所述长短时记忆网络模型的参数并将所述数据矩阵Z作为输入,得到输出预测值W,将所述预测值W与所述目标值Y进行对比,根据对比结果修改所述长短时记忆网络模型的参数,直至对比结果的误差在设定的范围内。
上述技术方案中,本发明利用长短时记忆网络模型,更好的刻画PM2.5浓度本身具有的时间序列关系,最终训练得到的预测模型相较于线性回归和神经网络模型具有更高的准确度。同时,本发明的长短时记忆网络模型,其预测间隔的时间点可以认为的进行限定,可以使得操作性更强,所得到的数据更加的准确。同时,本发明充分考虑了包括其他污染物及天气因素对PM2.5浓度的影响,预测效果更加精确。
在本实施例中,本发明使用滚动时间窗口的方式进行所述步骤S1至步骤S4,使得所述数据矩阵Z遍历所述M个时间节点的每一个时间节点的PM2.5的值以及其他N-1个空气参数的值。
这样就可以使得每一个时间节点的数值都可以参与到本发明的模型运算中,这样也就使得模型运算的时候,具有连续性,使得数据得到的更加的接近与真实值,从而使得预测结果更加精确。与此同时,本发明将数据充分的进行利用,这样就会使得数据的利用率更高。
在本实施例中,在步骤S2中,在得到构建的第f个时间节点的特征向量基数Hf之后,对所述特征向量基数Hf进行归一化处理。这样可使得将数据的有效性进行筛查,得到的数据更加的准确,将一些明显错误的数据筛查出来,提升预测的准确度。
在本实施例中,在步骤S1中,在得到M个时间节点的每一个时间节点的PM2.5的值以及其他N-1个空气参数的值之后,对数据进行清洗。对数据清洗可以将数据进行删选,去除一些问题数据,提升预测的准确度。
在本实施例中,在步骤S5中,所述所述数据矩阵Z作为输入进入所述LSTM层,输出得到多维向量,在将所述LSTM层输出的所述多维向量送入所述Dense层进行向量转换得到一维数值,并将该输出的所述一维数值作为所述预测值W。
图2为本发明所提供的方法,在进行具体是时间适合所得到的数据,统计之后绘制的图表,仅供参考。
以上公开的仅为本发明的几个具体实施例,但是,本发明实施例并非局限于此,任何本领域的技术人员能思之的变化都应落入本发明的保护范围。
Claims (5)
1.基于长短时记忆网络的PM2.5预测方法,其特征在于,包括如下步骤:
S1:获取目标空气质量监测站点中M个时间节点的每一个时间节点的PM2.5的值以及该时间节点的其他N-1个空气参数的值,其中M为正整数;
S2:截取第m个时间节点之前的F个时间节点的每一个时间节点的PM2.5的值以及该时间节点的其他N-1个空气参数的值,其中m、F以及N均为正整数,m∈M,F<m;
构建第f个时间节点的特征向量基数Hi,使得
Hi=[x1,x2,…,xn,…,xN]
其中,x1表示F个时间节点中第f个时间节点的PM2.5的值,xn表示F个时间节点中第f个时间节点的第n个空气参数的值,且n∈N,f为正整数;
S3:构建数据矩阵Z,使得
Z=[H1,H2,…,Hf,…,HF]
其中,f∈F;
S4:设置目标值Y,使得
Y=Tm+r
其中,Tm+r表示第m个时间节点之后第r个时间节点的PM2.5的值,r为正整数;
S5:建立长短时记忆网络模型,所述长短时记忆网络模型包括依次设立的LSTM层和Dense层,初始化所述长短时记忆网络模型的参数并将所述数据矩阵Z作为输入,得到输出预测值W,将所述预测值W与所述目标值Y进行对比,根据对比结果修改所述长短时记忆网络模型的参数,直至对比结果的误差在设定的范围内。
2.如权利要求1所述的基于长短时记忆网络的PM2.5预测方法,其特征在于,使用滚动时间窗口的方式进行所述步骤S1至步骤S4,使得所述数据矩阵Z遍历所述M个时间节点的每一个时间节点的PM2.5的值以及该时间节点的其他N-1个空气参数的值。
3.如权利要求1所述的基于长短时记忆网络的PM2.5预测方法,其特征在于,在步骤S2中,在得到构建的第f个时间节点的特征向量基数Hf之后,对所述特征向量基数Hf进行归一化处理。
4.如权利要求1所述的基于长短时记忆网络的PM2.5预测方法,其特征在于,在步骤S1中,在得到M个时间节点的每一个时间节点的PM2.5的值以及该时间节点的其他N-1个空气参数的值之后,对数据进行清洗。
5.如权利要求1所述的基于长短时记忆网络的PM2.5预测方法,其特征在于,在步骤S5中,所述数据矩阵Z作为输入进入所述LSTM层,输出得到多维向量,在将所述LSTM层输出的所述多维向量送入所述Dense层进行向量转换得到一维数值,并将该输出的所述一维数值作为所述预测值W。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110593273.1A CN113177672B (zh) | 2021-05-28 | 2021-05-28 | 基于长短时记忆网络的pm2.5预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110593273.1A CN113177672B (zh) | 2021-05-28 | 2021-05-28 | 基于长短时记忆网络的pm2.5预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113177672A CN113177672A (zh) | 2021-07-27 |
CN113177672B true CN113177672B (zh) | 2023-12-15 |
Family
ID=76928061
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110593273.1A Active CN113177672B (zh) | 2021-05-28 | 2021-05-28 | 基于长短时记忆网络的pm2.5预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113177672B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111239014B (zh) * | 2020-01-09 | 2022-10-21 | 河北工业大学 | 一种空气中pm2.5的检测方法、装置、设备及介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108717586A (zh) * | 2018-05-10 | 2018-10-30 | 江南大学 | 一种基于长短时记忆网络的水产养殖环境溶解氧预测方法 |
CN110147877A (zh) * | 2019-05-24 | 2019-08-20 | 福州大学 | 基于卷积长短时网络的pm2.5预测方法 |
CN111131424A (zh) * | 2019-12-18 | 2020-05-08 | 武汉大学 | 一种基于emd和多变量lstm相结合的服务质量预测方法 |
WO2021017313A1 (zh) * | 2019-07-31 | 2021-02-04 | 平安科技(深圳)有限公司 | 房颤的检测方法、装置、计算机设备及存储介质 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10855550B2 (en) * | 2016-11-16 | 2020-12-01 | Cisco Technology, Inc. | Network traffic prediction using long short term memory neural networks |
CN111130839B (zh) * | 2019-11-04 | 2021-07-16 | 清华大学 | 一种流量需求矩阵预测方法及其系统 |
-
2021
- 2021-05-28 CN CN202110593273.1A patent/CN113177672B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108717586A (zh) * | 2018-05-10 | 2018-10-30 | 江南大学 | 一种基于长短时记忆网络的水产养殖环境溶解氧预测方法 |
CN110147877A (zh) * | 2019-05-24 | 2019-08-20 | 福州大学 | 基于卷积长短时网络的pm2.5预测方法 |
WO2021017313A1 (zh) * | 2019-07-31 | 2021-02-04 | 平安科技(深圳)有限公司 | 房颤的检测方法、装置、计算机设备及存储介质 |
CN111131424A (zh) * | 2019-12-18 | 2020-05-08 | 武汉大学 | 一种基于emd和多变量lstm相结合的服务质量预测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN113177672A (zh) | 2021-07-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110674604B (zh) | 基于多维时序帧卷积lstm的变压器dga数据预测方法 | |
CN111832222B (zh) | 一种污染物浓度的预测模型训练方法、预测方法及装置 | |
CN106529714A (zh) | 一种用户流失的预测方法及系统 | |
CN113177672B (zh) | 基于长短时记忆网络的pm2.5预测方法 | |
CN111428201B (zh) | 基于经验模态分解和前馈神经网络对时序数据的预测方法 | |
CN111369057A (zh) | 一种基于深度学习的空气质量预测优化方法及系统 | |
CN112085926B (zh) | 一种河道水污染预警方法及系统 | |
CN111398523B (zh) | 基于分布的传感器数据校准方法及系统 | |
CN110418283A (zh) | 基于WiFi数据的位置指纹库创建方法 | |
CN111652257A (zh) | 一种样本数据清洗方法及系统 | |
CN112465055A (zh) | 一种基于卷积神经网络的网络故障诊断方法 | |
Kulkarni et al. | SLANT+: A nonlinear model for opinion dynamics in social networks | |
CN109685823B (zh) | 一种基于深度森林的目标跟踪方法 | |
CN117313516A (zh) | 一种基于时空图嵌入的发酵产物预测方法 | |
CN111949937A (zh) | 一种基于链式方程的分布式光伏数据多重插补方法 | |
CN110633516B (zh) | 一种电子器件性能退化趋势的预测方法 | |
CN117290706A (zh) | 一种时空卷积融合概率稀疏注意力机制的交通流预测方法 | |
Minić | Estimation of parameters of Nadarajah-Haghighi extension of the exponential distribution using perfect and imperfect ranked set sample | |
CN108134687B (zh) | 一种基于马尔可夫链的灰色模型局域网峰值流量预测方法 | |
CN114943328A (zh) | 基于bp神经网络非线性组合的sarima-gru时序预测模型 | |
CN114647904A (zh) | 一种基于数字孪生字典的自适应稀疏图学习轴承寿命预测方法 | |
CN113516170A (zh) | 基于贝叶斯神经网络随机加法饱和结构的图像分类方法 | |
Wang | Ensemble2: Anomaly Detection via EVT-Ensemble Framework for Seasonal KPIs in Communication Network | |
CN113159409A (zh) | 一种基于组感知图神经网络的全国城市空气质量预测方法 | |
CN113033768A (zh) | 一种基于图卷积网络的缺失特征重表示方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |