CN113177672B - 基于长短时记忆网络的pm2.5预测方法 - Google Patents

基于长短时记忆网络的pm2.5预测方法 Download PDF

Info

Publication number
CN113177672B
CN113177672B CN202110593273.1A CN202110593273A CN113177672B CN 113177672 B CN113177672 B CN 113177672B CN 202110593273 A CN202110593273 A CN 202110593273A CN 113177672 B CN113177672 B CN 113177672B
Authority
CN
China
Prior art keywords
time
short
long
memory network
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110593273.1A
Other languages
English (en)
Other versions
CN113177672A (zh
Inventor
陈倩文
陈美霖
陈美颐
李欣蕾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fuxin Boyuan Technology Co ltd
Original Assignee
Fuxin Boyuan Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuxin Boyuan Technology Co ltd filed Critical Fuxin Boyuan Technology Co ltd
Priority to CN202110593273.1A priority Critical patent/CN113177672B/zh
Publication of CN113177672A publication Critical patent/CN113177672A/zh
Application granted granted Critical
Publication of CN113177672B publication Critical patent/CN113177672B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N15/00Investigating characteristics of particles; Investigating permeability, pore-volume or surface-area of porous materials
    • G01N15/06Investigating concentration of particle suspensions
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/0004Gaseous mixtures, e.g. polluted air
    • G01N33/0009General constructional details of gas analysers, e.g. portable test equipment
    • G01N33/0027General constructional details of gas analysers, e.g. portable test equipment concerning the detector
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/0004Gaseous mixtures, e.g. polluted air
    • G01N33/0009General constructional details of gas analysers, e.g. portable test equipment
    • G01N33/0062General constructional details of gas analysers, e.g. portable test equipment concerning the measuring method or the display, e.g. intermittent measurement or digital display
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Biochemistry (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)
  • Business, Economics & Management (AREA)
  • Pathology (AREA)
  • Biophysics (AREA)
  • Human Resources & Organizations (AREA)
  • Medicinal Chemistry (AREA)
  • Food Science & Technology (AREA)
  • Combustion & Propulsion (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Economics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Strategic Management (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Dispersion Chemistry (AREA)
  • General Business, Economics & Management (AREA)
  • Game Theory and Decision Science (AREA)
  • Marketing (AREA)
  • Development Economics (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于长短时记忆网络的PM2.5预测方法,建立长短时记忆网络模型,所述长短时记忆网络模型包括依次设立的LSTM层和Dense层,初始化所述长短时记忆网络模型的参数并将所述数据矩阵Z作为输入,得到输出预测值W,将所述预测值W与所述目标值Y进行对比,根据对比结果修改所述长短时记忆网络模型的参数,直至对比结果的误差在设定的范围内。本发明利用长短时记忆网络,更好的刻画PM2.5浓度本身具有的时间序列关系,最终训练得到的预测模型相较于线性回归和神经网络模型具有更高的准确度,同时本发明充分考虑了包括其他污染物及天气因素对PM2.5浓度的影响,预测效果更加精确。

Description

基于长短时记忆网络的PM2.5预测方法
技术领域
本发明涉及数据处理领域,特别涉及一种基于长短时记忆网络的PM2.5预测方法。
背景技术
PM2.5浓度预测作为回归预测,现有方法主要包括线性回归和神经网络等,在预测效果上有一定的准确性,但未考虑到PM2.5浓度前后时刻具有的连续性,即下一个时段浓度值变化与上个时间段的含量具有很强的记忆关系,因此,使用该方式所得到的PM2.5浓度并不精确。
发明内容
本发明的目的是克服上述现有技术中存在的问题,提供一种基于长短时记忆网络的PM2.5预测方法,利用长短时记忆网络,更好的刻画PM2.5浓度本身具有的时间序列关系,最终训练得到的预测模型相较于线性回归和神经网络模型具有更高的准确度。
为此,本发明提供一种基于长短时记忆网络的PM2.5预测方法,包括如下步骤:
S1:获取目标空气质量监测站点中M个时间节点的每一个时间节点的PM2.5的值以及其他N-1个空气参数的值,其中M为正整数;
S2:截取第m个时间节点之前的F个时间节点的每一个时间节点的PM2.5的值以及其他N-1个空气参数的值,其中m、F以及N均为正整数,m∈M,F<m;
构建第f个时间节点的特征向量基数Hf,使得
Hf=[x1,x2,…,xn,…,xN]
其中,x1表示F个时间节点中第f个时间节点的PM2.5的值,xn表示F个时间节点中第f个时间节点的第n个空气参数的值,且n∈N,f为正整数;
S3:构建数据矩阵Z,使得
Z=[H1,H2,…,Hf,…,HF]
其中,f∈F;
S4:设置目标值Y,使得
Y=Tm+r
其中,Tm+r表示第m个时间节点之后第r个时间节点的PM2.5的值,r为正整数;
S5:建立长短时记忆网络模型,所述长短时记忆网络模型包括依次设立的LSTM层和Dense层,初始化所述长短时记忆网络模型的参数并将所述数据矩阵Z作为输入,得到输出预测值W,将所述预测值W与所述目标值Y进行对比,根据对比结果修改所述长短时记忆网络模型的参数,直至对比结果的误差在设定的范围内。
进一步,本发明使用滚动时间窗口的方式进行所述步骤S1至步骤S4,使得所述数据矩阵Z遍历所述M个时间节点的每一个时间节点的PM2.5的值以及其他N-1个空气参数的值。
进一步,在步骤S2中,在得到构建的第f个时间节点的特征向量基数Hf之后,对所述特征向量基数Hf进行归一化处理。
进一步,在步骤S1中,在得到M个时间节点的每一个时间节点的PM2.5的值以及其他N-1个空气参数的值之后,对数据进行清洗。
进一步,在步骤S5中,所述所述数据矩阵Z作为输入进入所述LSTM层,输出得到多维向量,在将所述LSTM层输出的所述多维向量送入所述Dense层进行向量转换得到一维数值,并将该输出的所述一维数值作为所述预测值W。
本发明提供的基于长短时记忆网络的PM2.5预测方法,具有如下有益效果:
1、本发明利用长短时记忆网络,更好的刻画PM2.5浓度本身具有的时间序列关系,最终训练得到的预测模型相较于线性回归和神经网络模型具有更高的准确度;
2、本发明充分考虑了包括其他污染物及天气因素对PM2.5浓度的影响,预测效果更加精确;
附图说明
图1为本发明的整体数据流程示意图;
图2为本发明的实测数据统计示意图。
具体实施方式
下面结合附图,对本发明的多个具体实施方式进行详细描述,但应当理解本发明的保护范围并不受具体实施方式的限制。
具体的,如图1所示,本发明实施例提供了一种基于长短时记忆网络的PM2.5预测方法,包括如下步骤:
S1:获取目标空气质量监测站点中M个时间节点的每一个时间节点的PM2.5的值以及其他N-1个空气参数的值,其中M为正整数;
S2:截取第m个时间节点之前的F个时间节点的每一个时间节点的PM2.5的值以及其他N-1个空气参数的值,其中m、F以及N均为正整数,m∈M,F<m;
构建第f个时间节点的特征向量基数Hf,使得
Hf=[x1,x2,…,xn,…,xN]
其中,x1表示F个时间节点中第f个时间节点的PM2.5的值,xn表示F个时间节点中第f个时间节点的第n个空气参数的值,且n∈N,f为正整数;
S3:构建数据矩阵Z,使得
Z=[H1,H2,…,Hf,…,HF]
其中,f∈F;
S4:设置目标值Y,使得
Y=Tm+r
其中,Tm+r表示第m个时间节点之后第r个时间节点的PM2.5的值,r为正整数;
S5:建立长短时记忆网络模型,所述长短时记忆网络模型包括依次设立的LSTM层和Dense层,初始化所述长短时记忆网络模型的参数并将所述数据矩阵Z作为输入,得到输出预测值W,将所述预测值W与所述目标值Y进行对比,根据对比结果修改所述长短时记忆网络模型的参数,直至对比结果的误差在设定的范围内。
上述技术方案中,本发明利用长短时记忆网络模型,更好的刻画PM2.5浓度本身具有的时间序列关系,最终训练得到的预测模型相较于线性回归和神经网络模型具有更高的准确度。同时,本发明的长短时记忆网络模型,其预测间隔的时间点可以认为的进行限定,可以使得操作性更强,所得到的数据更加的准确。同时,本发明充分考虑了包括其他污染物及天气因素对PM2.5浓度的影响,预测效果更加精确。
在本实施例中,本发明使用滚动时间窗口的方式进行所述步骤S1至步骤S4,使得所述数据矩阵Z遍历所述M个时间节点的每一个时间节点的PM2.5的值以及其他N-1个空气参数的值。
这样就可以使得每一个时间节点的数值都可以参与到本发明的模型运算中,这样也就使得模型运算的时候,具有连续性,使得数据得到的更加的接近与真实值,从而使得预测结果更加精确。与此同时,本发明将数据充分的进行利用,这样就会使得数据的利用率更高。
在本实施例中,在步骤S2中,在得到构建的第f个时间节点的特征向量基数Hf之后,对所述特征向量基数Hf进行归一化处理。这样可使得将数据的有效性进行筛查,得到的数据更加的准确,将一些明显错误的数据筛查出来,提升预测的准确度。
在本实施例中,在步骤S1中,在得到M个时间节点的每一个时间节点的PM2.5的值以及其他N-1个空气参数的值之后,对数据进行清洗。对数据清洗可以将数据进行删选,去除一些问题数据,提升预测的准确度。
在本实施例中,在步骤S5中,所述所述数据矩阵Z作为输入进入所述LSTM层,输出得到多维向量,在将所述LSTM层输出的所述多维向量送入所述Dense层进行向量转换得到一维数值,并将该输出的所述一维数值作为所述预测值W。
图2为本发明所提供的方法,在进行具体是时间适合所得到的数据,统计之后绘制的图表,仅供参考。
以上公开的仅为本发明的几个具体实施例,但是,本发明实施例并非局限于此,任何本领域的技术人员能思之的变化都应落入本发明的保护范围。

Claims (5)

1.基于长短时记忆网络的PM2.5预测方法,其特征在于,包括如下步骤:
S1:获取目标空气质量监测站点中M个时间节点的每一个时间节点的PM2.5的值以及该时间节点的其他N-1个空气参数的值,其中M为正整数;
S2:截取第m个时间节点之前的F个时间节点的每一个时间节点的PM2.5的值以及该时间节点的其他N-1个空气参数的值,其中m、F以及N均为正整数,m∈M,F<m;
构建第f个时间节点的特征向量基数Hi,使得
Hi=[x1,x2,…,xn,…,xN]
其中,x1表示F个时间节点中第f个时间节点的PM2.5的值,xn表示F个时间节点中第f个时间节点的第n个空气参数的值,且n∈N,f为正整数;
S3:构建数据矩阵Z,使得
Z=[H1,H2,…,Hf,…,HF]
其中,f∈F;
S4:设置目标值Y,使得
Y=Tm+r
其中,Tm+r表示第m个时间节点之后第r个时间节点的PM2.5的值,r为正整数;
S5:建立长短时记忆网络模型,所述长短时记忆网络模型包括依次设立的LSTM层和Dense层,初始化所述长短时记忆网络模型的参数并将所述数据矩阵Z作为输入,得到输出预测值W,将所述预测值W与所述目标值Y进行对比,根据对比结果修改所述长短时记忆网络模型的参数,直至对比结果的误差在设定的范围内。
2.如权利要求1所述的基于长短时记忆网络的PM2.5预测方法,其特征在于,使用滚动时间窗口的方式进行所述步骤S1至步骤S4,使得所述数据矩阵Z遍历所述M个时间节点的每一个时间节点的PM2.5的值以及该时间节点的其他N-1个空气参数的值。
3.如权利要求1所述的基于长短时记忆网络的PM2.5预测方法,其特征在于,在步骤S2中,在得到构建的第f个时间节点的特征向量基数Hf之后,对所述特征向量基数Hf进行归一化处理。
4.如权利要求1所述的基于长短时记忆网络的PM2.5预测方法,其特征在于,在步骤S1中,在得到M个时间节点的每一个时间节点的PM2.5的值以及该时间节点的其他N-1个空气参数的值之后,对数据进行清洗。
5.如权利要求1所述的基于长短时记忆网络的PM2.5预测方法,其特征在于,在步骤S5中,所述数据矩阵Z作为输入进入所述LSTM层,输出得到多维向量,在将所述LSTM层输出的所述多维向量送入所述Dense层进行向量转换得到一维数值,并将该输出的所述一维数值作为所述预测值W。
CN202110593273.1A 2021-05-28 2021-05-28 基于长短时记忆网络的pm2.5预测方法 Active CN113177672B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110593273.1A CN113177672B (zh) 2021-05-28 2021-05-28 基于长短时记忆网络的pm2.5预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110593273.1A CN113177672B (zh) 2021-05-28 2021-05-28 基于长短时记忆网络的pm2.5预测方法

Publications (2)

Publication Number Publication Date
CN113177672A CN113177672A (zh) 2021-07-27
CN113177672B true CN113177672B (zh) 2023-12-15

Family

ID=76928061

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110593273.1A Active CN113177672B (zh) 2021-05-28 2021-05-28 基于长短时记忆网络的pm2.5预测方法

Country Status (1)

Country Link
CN (1) CN113177672B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111239014B (zh) * 2020-01-09 2022-10-21 河北工业大学 一种空气中pm2.5的检测方法、装置、设备及介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108717586A (zh) * 2018-05-10 2018-10-30 江南大学 一种基于长短时记忆网络的水产养殖环境溶解氧预测方法
CN110147877A (zh) * 2019-05-24 2019-08-20 福州大学 基于卷积长短时网络的pm2.5预测方法
CN111131424A (zh) * 2019-12-18 2020-05-08 武汉大学 一种基于emd和多变量lstm相结合的服务质量预测方法
WO2021017313A1 (zh) * 2019-07-31 2021-02-04 平安科技(深圳)有限公司 房颤的检测方法、装置、计算机设备及存储介质

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10855550B2 (en) * 2016-11-16 2020-12-01 Cisco Technology, Inc. Network traffic prediction using long short term memory neural networks
CN111130839B (zh) * 2019-11-04 2021-07-16 清华大学 一种流量需求矩阵预测方法及其系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108717586A (zh) * 2018-05-10 2018-10-30 江南大学 一种基于长短时记忆网络的水产养殖环境溶解氧预测方法
CN110147877A (zh) * 2019-05-24 2019-08-20 福州大学 基于卷积长短时网络的pm2.5预测方法
WO2021017313A1 (zh) * 2019-07-31 2021-02-04 平安科技(深圳)有限公司 房颤的检测方法、装置、计算机设备及存储介质
CN111131424A (zh) * 2019-12-18 2020-05-08 武汉大学 一种基于emd和多变量lstm相结合的服务质量预测方法

Also Published As

Publication number Publication date
CN113177672A (zh) 2021-07-27

Similar Documents

Publication Publication Date Title
CN110674604B (zh) 基于多维时序帧卷积lstm的变压器dga数据预测方法
CN111832222B (zh) 一种污染物浓度的预测模型训练方法、预测方法及装置
CN106529714A (zh) 一种用户流失的预测方法及系统
CN113177672B (zh) 基于长短时记忆网络的pm2.5预测方法
CN111428201B (zh) 基于经验模态分解和前馈神经网络对时序数据的预测方法
CN111369057A (zh) 一种基于深度学习的空气质量预测优化方法及系统
CN112085926B (zh) 一种河道水污染预警方法及系统
CN111398523B (zh) 基于分布的传感器数据校准方法及系统
CN110418283A (zh) 基于WiFi数据的位置指纹库创建方法
CN111652257A (zh) 一种样本数据清洗方法及系统
CN112465055A (zh) 一种基于卷积神经网络的网络故障诊断方法
Kulkarni et al. SLANT+: A nonlinear model for opinion dynamics in social networks
CN109685823B (zh) 一种基于深度森林的目标跟踪方法
CN117313516A (zh) 一种基于时空图嵌入的发酵产物预测方法
CN111949937A (zh) 一种基于链式方程的分布式光伏数据多重插补方法
CN110633516B (zh) 一种电子器件性能退化趋势的预测方法
CN117290706A (zh) 一种时空卷积融合概率稀疏注意力机制的交通流预测方法
Minić Estimation of parameters of Nadarajah-Haghighi extension of the exponential distribution using perfect and imperfect ranked set sample
CN108134687B (zh) 一种基于马尔可夫链的灰色模型局域网峰值流量预测方法
CN114943328A (zh) 基于bp神经网络非线性组合的sarima-gru时序预测模型
CN114647904A (zh) 一种基于数字孪生字典的自适应稀疏图学习轴承寿命预测方法
CN113516170A (zh) 基于贝叶斯神经网络随机加法饱和结构的图像分类方法
Wang Ensemble2: Anomaly Detection via EVT-Ensemble Framework for Seasonal KPIs in Communication Network
CN113159409A (zh) 一种基于组感知图神经网络的全国城市空气质量预测方法
CN113033768A (zh) 一种基于图卷积网络的缺失特征重表示方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant