CN110428082A - 基于注意力神经网络的水质预测方法 - Google Patents

基于注意力神经网络的水质预测方法 Download PDF

Info

Publication number
CN110428082A
CN110428082A CN201910466102.5A CN201910466102A CN110428082A CN 110428082 A CN110428082 A CN 110428082A CN 201910466102 A CN201910466102 A CN 201910466102A CN 110428082 A CN110428082 A CN 110428082A
Authority
CN
China
Prior art keywords
water quality
neural network
model
attention
quality indicator
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910466102.5A
Other languages
English (en)
Other versions
CN110428082B (zh
Inventor
周剑
褚飞飞
严筱永
王嫄嫄
陈阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Post and Telecommunication University
Original Assignee
Nanjing Post and Telecommunication University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Post and Telecommunication University filed Critical Nanjing Post and Telecommunication University
Priority to CN201910466102.5A priority Critical patent/CN110428082B/zh
Publication of CN110428082A publication Critical patent/CN110428082A/zh
Application granted granted Critical
Publication of CN110428082B publication Critical patent/CN110428082B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/049Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A20/00Water conservation; Efficient water supply; Efficient water use
    • Y02A20/152Water filtration

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Strategic Management (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Development Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Tourism & Hospitality (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Game Theory and Decision Science (AREA)
  • Educational Administration (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • Primary Health Care (AREA)
  • Feedback Control In General (AREA)

Abstract

基于注意力神经网络的水质预测方法,包括如下步骤:步骤1:采集某一水质指标的数据;步骤2:将该水质指标的数据进行z‑score标准化处理;步骤3:使用处理好的该水质指标的数据构造训练集Training;步骤4:构造基于注意力神经网络的水质预测模型;步骤5:使用构造的训练集Training训练构造的基于注意力神经网络的水质预测模型;步骤6:使用训练好的基于注意力神经网络的水质预测模型预测未来时刻的该水质指标的数据。本发明提出的水质预测方法,在双向LSTM神经网络中引入注意力机制,考虑每个时刻水质指标的数据对预测结果的重要程度不同,赋予每个时刻水质指标不同的权重,从而降低了水质预测时产生的相对误差,提高了预测精确度。

Description

基于注意力神经网络的水质预测方法
技术领域
本发明属于水质预测领域,具体为一种基于注意力神经网络的水质预测方法。
背景技术
近几年来,随着我国经济的快速发展,自然或人为因素导致天然的水体不断恶化,同时生活及工业用水量剧增导致陆地水逐渐枯竭,因此水问题俨然已经成为了我国最严重的环境问题。在水体中含有各种污染物,它们的浓度的高低直接影响水质的好坏,如果能够提前发现水质问题,分析原因,制定相应的预防措施,改善水体水质环境,从一定程度上可以缓解我国水资源不足问题,因此预测水质指标变化趋势的研究具有重要现实意义。
目前水质预测方法有很多,主流预测方法是神经网络方法。BP神经网络能够对水质指标的数据变化趋势进行预测,提高了水质预测精确度,但是BP神经网络容易陷入局部极小值,且收敛速度非常慢;LSTM循环神经网络解决了神经网络中的长期依赖问题,能够记住长期信息,而且预测水质指标的数据变化趋势相比于BP神经网络也更加准确。虽然LSTM在水质预测上取得较好的精确度,但是LSTM神经网络也存在一些局限性,如不同时刻水质指标对预测结果的影响程度是相同的,并没有考虑最近时刻水质指标可能会预测结果影响更大的问题。
发明内容
针对上述问题,本发明提出了一种基于注意力神经网络的水质预测方法。该方法在双向LSTM神经网络中引入注意力机制,考虑每个时刻水质指标的数据对预测结果的重要程度不同,赋予每个时刻水质指标不同的权重,从而降低了水质预测时产生的相对误差,提高了预测精确度。
基于注意力神经网络的水质预测方法,包括如下步骤:
步骤1:采集某一水质指标的数据;
步骤2:将步骤1采集到的该水质指标的数据进行z-score标准化处理;
步骤3:使用步骤2中处理好的该水质指标的数据构造训练集Training;
步骤4:构造基于注意力神经网络的水质预测模型;
步骤5:使用步骤3中构造的训练集Training训练步骤4中构造的基于注意力神经网络的水质预测模型;
步骤6:使用步骤5中训练好的基于注意力神经网络的水质预测模型预测未来时刻的该水质指标的数据。
进一步地,所述步骤1中,监测一定时间内某一水域,获得按时间排序的该水质指标的数据集合G,G={g1,g2,…gi,…gn},其中n表示该水质指标的数据集合G中元素的数量,gi为第i个时间节点的该水质指标的数据。
进一步地,所述步骤2中,使用z-score标准化方法对每个时间节点的该水质指标的数据进行标准化处理,通过下式计算
其中,gi表示z-score标准化前第i个时间节点的该水质指标的数据,表示z-score标准化后第i个时间节点的该水质指标的数据,μx与σx分别表示该水质指标的数据集合的均值与标准差;
通过对采集到的该水质指标的数据进行z-score标准化,获得z-score标准化后的该水质指标的数据集合其中n表示z-score标准化后该水质指标的数据集合G*中元素的数量,gi *为第i个时间节点z-score标准化后的该水质指标的数据。
进一步地,所述步骤3中,将处理好的该水质指标的数据集合G*用于构造训练集Training,构造训练集Training的具体步骤如下:
构造训练集Training={{xi,yi}},0<i≤m,其中,m表示水质指标训练样本数量;设置d为窗口大小,xi表示第i个训练样本的输入,其中xi中包含d个时间节点的该水质指标的数据;yi表示第i个训练样本输出,表示z-score标准化后第i+d个时间节点的该水质指标的数据。
进一步地,所述步骤4中,构造双向LSTM神经网络模型和前馈注意力模型,将二种模型构造为基于注意力神经网络的水质预测模型,具体步骤如下:
步骤4-1:构造双向LSTM神经网络模型,具体步骤如下:
步骤4-1-1:使用向前和向后两个结构相同的LSTM神经网络,输出隐状态矩阵H:
H=(h1,h2,...,hq)
其中,hq表示双向LSTM神经网络在第q个时间节点输出的隐状态向量;设置q的值等于d的值,设置单向LSTM神经网络隐状态单元数为u,hq为长度u的向量;
步骤4-1-2:设置双向LSTM神经网络输入层到隐含层的连接权重矩阵U、隐含层到隐含层的连接权重矩阵W、隐含层到输出层的连接权重矩阵V均为随机小实数;
步骤4-1-3:设置双向LSTM神经网络激活函数;将双向LSTM神经网络中的输入门、遗忘门和输出门的激活函数为sigmoid函数,候选门中的激活函数为tanh函数;
步骤4-2:构造前馈注意力模型,具体步骤如下:
步骤4-2-1:使用两层感知器作为前馈注意力模型的内部隐含层;设置两层感知器第一层单元数为da,设置两层感知器第二层单元数为1,其中,双向LSTM神经网络模型到前馈注意力模型中的第一层感知器的连接权重矩阵为wa1,wa1为大小da×u的连接权重矩阵,前馈注意力模型中的第一层感知器到第二层感知器的连接权重向量为wa2,wa2为长度da的连接权重向量;
步骤4-2-2:设置前馈注意力模型初始权重参数为随机小实数;
步骤4-3:使用全连接层作为基于注意力神经网络的水质预测模型的输出层;设置全连接层单元数为1,其中,前馈注意力模型到全连接层之间的连接权重向量为Wy,Wy是长度为μ的连接权重向量;设置全连接层初始权重参数为随机小实数;
步骤4-4:将步骤4-1构造好的双向LSTM神经网络模型和步骤4-2构造好的前馈注意力模型构造为基于注意力神经网络的水质预测模型;具体步骤如下:
步骤4-4-1:使用步骤4-1中构造好的双向LSTM神经网络模型作为基于注意力神经网络的水质预测模型的输入层,双向LSTM神经网络模型的输出为隐状态矩阵H;
步骤4-4-2:使用步骤4-2中构造好的前馈注意力模型作为基于注意力神经网络的水质预测模型的隐含层,将步骤4-4-1中输出的隐状态矩阵H作为前馈注意力模型的输入,前馈注意力模型的输出为上下文向量c;
步骤4-4-3:使用步骤4-2中构造好的全连接层作为基于注意力神经网络的水质预测模型的输出层,将步骤4-4-2中输出的上下文向量c作为全连接层的输入,全连接层的输出为预测值;
步骤4-4-4:基于注意力神经网络的水质预测模型选用均方误差作为损失函数。
进一步地,所述步骤5中,训练基于注意力神经网络的水质预测模型具体步骤如下:
步骤5-1:将训练集Training中输入到注意力神经网络的水质预测模型,通过模型得到与xi对应的实际输出
步骤5-2:使用均方误差公式计算实际预测值与期望输出值的误差;利用反向传播算法将误差反向传递给每一个神经元,然后每个神经元会采用随机梯度下降更新每条连接线的连接权重;其中,在双向LSTM神经网络模型中需要更新的连接权重矩阵为输入层到隐含层的连接权重矩阵U、隐含层到隐含层的连接权重矩阵W、隐含层到输出层的连接权重矩阵V;在前馈注意力模型中需要更新的连接权重是双向LSTM神经网络模型到前馈注意力模型中的第一层感知器的连接权重矩阵wa1和前馈注意力模型中的第一层感知器到第二层感知器的连接权重向量wa2;在全连接层中需要更新的连接权重是前馈注意力模型到全连接层之间的连接权重向量Wy
步骤5-3:设置迭代100次,在迭代过程中不断更新基于注意力神经网络预测模型中的连接权重。
进一步地,所述步骤6中,预测未来时刻的该水质指标的数据具体步骤如下:
步骤6-1:获得该水质指标的当前数据,并将其进行z-score标准化,得到z-score标准化后该水质指标的当前数据:
步骤6-2:将输入到训练好的基于注意力神经网络的水质预测模型的输入层中,即双向LSTM神经网络模型中,其中,前向LSTM神经网络通过下式计算隐状态向量
其中,it表示该水质指标当前数据中的第t个时间节点的需要更新的信息,ft表示该水质指标当前数据中的第t个时间节点的需要丢弃的信息,ot表示该水质指标当前数据中的第t个时间节点的需要输出的信息;表示该水质指标当前数据中的第t个时间节点的候选门,候选门是备选更新内容的神经元;ct表示该水质指标当前数据中的第t个时间节点的细胞状态,细胞状态是决定了需要输出信息内容的神经元;表示该水质指标当前数据中的第t个时间节点的输出的隐状态向量,ht-1表示该水质指标当前数据中的第t-1个时间节点的输出的隐状态向量,ct-1表示该水质指标当前数据中的第t-1个时间节点的细胞状态;
xt *是长度为θ的向量,wix、wfx、wox和wcx是大小为u×θ的连接权重矩阵,其中wix、wfx、wox和wcx是输入数据分别到输入门、遗忘门、输出门和候选门的连接权重矩阵;wih、wfh、woh和woh是大小为u×u的连接权重矩阵,其中wih、wfh、woh和woh是输入门、遗忘门、输出门和候选门分别到隐层单元的连接矩阵权重;wic、wfc、woc和wcc是大小为u×u的连接权重矩阵,其中wic、wfc、woc和wcc是输入门、遗忘门、输出门和候选门分别到细胞状态的连接权重矩阵;bi、bf、bo和bc分别是输入门、遗忘门、输出门和候选门的偏置向量,bi、bf、bo和bc是长度为θ的偏置向量;
同理,通过相似前向LSTM神经网络公式计算后向LSTM神经网络隐状态向量
步骤6-3:两个单向LSTM神经网络分别得到隐状态向量通过下式计算隐状态向量ht
其中,表示前向LSTM神经网络的隐状态向量,表示后向LSTM神经网络的隐状态向量,表示将前向和后向的LSTM神经网络的隐状态向量进行拼接,得到长度为2u的向量,Whh是大小u×2u的连接权重矩阵;
步骤6-4:将ht输入到基于注意力神经网络的水质预测模型的隐含层中,即前馈注意力模型,通过下式计算上下文向量c;
βt=tanh(wa1ht)
et=wa2βt
at=softmax(et)
其中,wa1为大小为da×u的连接权重矩阵,wa2为长度为da的连接权重向量。ht表示第t个时间节点双向LSTM神经网络模型输出的隐状态向量,βt表示第t个时间节点第一层感知器输出的长度为da的连接权重向量,et表示第t个时间节点隐状态向量的相似度权重,at表示第t个时间节点的隐状态向量归一化后的相似度权重,C为长度u的向量;
步骤6-5:使用全连接层作为输出层,将步骤6-4输出上下文向量c作为输入,输出预测值通过下式计算:
其中,Wy表示前馈注意力模型到全连接层长度为μ的连接权重向量。
本发明达到的有益效果为:本发明针对LSTM神经网络不考虑每个时刻水质指标的数据对预测结果有着不同重要程度,即不考虑赋予每个时刻水质指标的数据不同的权重,提出一种基于注意力神经网络的水质预测方法,该方法考虑水质样本中每个时刻水质指标的数据对预测结果的重要程度不同,赋予水质样本中每个时刻水质指标的数据不同的权重,从而降低了水质预测时产生的相对误差,提高预测精确度,使得水体水质的预测具有更高实时性和广泛的实用性。
附图说明
图1为基于注意力神经网络的水质预测方法流程图。
图2为注意力神经网络的水质预测模型图。
具体实施方式
下面结合说明书附图对本发明的技术方案做进一步的详细说明。
基于注意力神经网络的水质预测方法,包括如下步骤:
步骤1:采集某一水质指标的数据。
所述步骤1中,监测一定时间内某一水域,获得按时间排序的该水质指标的数据集合G,G={g1,g2,…gi,…gn},其中n表示该水质指标的数据集合G中元素的数量,gi为第i个时间节点的该水质指标的数据。
步骤2:将步骤1采集到的该水质指标的数据进行z-score标准化处理。
所述步骤2中,使用z-score标准化方法对每个时间节点的该水质指标的数据进行标准化处理,通过下式计算
其中,gi表示z-score标准化前第i个时间节点的该水质指标的数据,表示z-score标准化后第i个时间节点的该水质指标的数据,μx与σx分别表示该水质指标的数据集合的均值与标准差。
通过对采集到的该水质指标的数据进行z-score标准化,获得z-score标准化后的该水质指标的数据集合其中n表示z-score标准化后该水质指标的数据集合G*中元素的数量,gi *为第i个时间节点z-score标准化后的该水质指标的数据。
步骤3:使用步骤2中处理好的该水质指标的数据构造训练集Training。
所述步骤3中,将处理好的该水质指标的数据集合G*用于构造训练集Training,构造训练集Training的具体步骤如下:
构造训练集Training={{xi,yi}},0<i≤m,其中,m表示水质指标训练样本数量;设置d为窗口大小,xi表示第i个训练样本的输入,其中xi中包含d个时间节点的该水质指标的数据;yi表示第i个训练样本输出,表示z-score标准化后第i+d个时间节点的该水质指标的数据。
步骤4:构造基于注意力神经网络的水质预测模型。
所述步骤4中,构造双向LSTM神经网络模型和前馈注意力模型,将二种模型构造为基于注意力神经网络的水质预测模型,具体步骤如下:
步骤4-1:构造双向LSTM神经网络模型,具体步骤如下:
步骤4-1-1:使用向前和向后两个结构相同的LSTM神经网络,输出隐状态矩阵H:
H=(h1,h2,...,hq)
其中,hq表示双向LSTM神经网络在第q个时间节点输出的隐状态向量;设置q的值等于d的值,设置单向LSTM神经网络隐状态单元数为u,hq为长度u的向量。
步骤4-1-2:设置双向LSTM神经网络输入层到隐含层的连接权重矩阵U、隐含层到隐含层的连接权重矩阵W、隐含层到输出层的连接权重矩阵V均为随机小实数。
步骤4-1-3:设置双向LSTM神经网络激活函数;将双向LSTM神经网络中的输入门、遗忘门和输出门的激活函数为sigmoid函数,候选门中的激活函数为tanh函数。
步骤4-2:构造前馈注意力模型,具体步骤如下:
步骤4-2-1:使用两层感知器作为前馈注意力模型的内部隐含层;设置两层感知器第一层单元数为da,设置两层感知器第二层单元数为1,其中,双向LSTM神经网络模型到前馈注意力模型中的第一层感知器的连接权重矩阵为wa1,wa1为大小da×u的连接权重矩阵,前馈注意力模型中的第一层感知器到第二层感知器的连接权重向量为wa2,wa2为长度da的连接权重向量。
步骤4-2-2:设置前馈注意力模型初始权重参数为随机小实数。
步骤4-3:使用全连接层作为基于注意力神经网络的水质预测模型的输出层;设置全连接层单元数为1,其中,前馈注意力模型到全连接层之间的连接权重向量为Wy,Wy是长度为μ的连接权重向量;设置全连接层初始权重参数为随机小实数。
步骤4-4:将步骤4-1构造好的双向LSTM神经网络模型和步骤4-2构造好的前馈注意力模型构造为基于注意力神经网络的水质预测模型;具体步骤如下:
步骤4-4-1:使用步骤4-1中构造好的双向LSTM神经网络模型作为基于注意力神经网络的水质预测模型的输入层,双向LSTM神经网络模型的输出为隐状态矩阵H。
步骤4-4-2:使用步骤4-2中构造好的前馈注意力模型作为基于注意力神经网络的水质预测模型的隐含层,将步骤4-4-1中输出的隐状态矩阵H作为前馈注意力模型的输入,前馈注意力模型的输出为上下文向量c。
步骤4-4-3:使用步骤4-2中构造好的全连接层作为基于注意力神经网络的水质预测模型的输出层,将步骤4-4-2中输出的上下文向量c作为全连接层的输入,全连接层的输出为预测值。
步骤4-4-4:基于注意力神经网络的水质预测模型选用均方误差作为损失函数。
步骤5:使用步骤3中构造的训练集Training训练步骤4中构造的基于注意力神经网络的水质预测模型。
所述步骤5中,训练基于注意力神经网络的水质预测模型具体步骤如下:
步骤5-1:将训练集Training中输入到注意力神经网络的水质预测模型,通过模型得到与xi对应的实际输出
步骤5-2:使用均方误差公式计算实际预测值与期望输出值的误差;利用反向传播算法将误差反向传递给每一个神经元,然后每个神经元会采用随机梯度下降更新每条连接线的连接权重;其中,在双向LSTM神经网络模型中需要更新的连接权重矩阵为输入层到隐含层的连接权重矩阵U、隐含层到隐含层的连接权重矩阵W、隐含层到输出层的连接权重矩阵V;在前馈注意力模型中需要更新的连接权重是双向LSTM神经网络模型到前馈注意力模型中的第一层感知器的连接权重矩阵wa1和前馈注意力模型中的第一层感知器到第二层感知器的连接权重向量wa2;在全连接层中需要更新的连接权重是前馈注意力模型到全连接层之间的连接权重向量Wy
步骤5-3:设置迭代100次,在迭代过程中不断更新基于注意力神经网络预测模型中的连接权重。
步骤6:使用步骤5中训练好的基于注意力神经网络的水质预测模型预测未来时刻的该水质指标的数据。
所述步骤6中,预测未来时刻的该水质指标的数据具体步骤如下:
步骤6-1:获得该水质指标的当前数据,并将其进行z-score标准化,得到z-score标准化后该水质指标的当前数据:
步骤6-2:将输入到训练好的基于注意力神经网络的水质预测模型的输入层中,即双向LSTM神经网络模型中,其中,前向LSTM神经网络通过下式计算隐状态向量
其中,it表示该水质指标当前数据中的第t个时间节点的需要更新的信息,ft表示该水质指标当前数据中的第t个时间节点的需要丢弃的信息,ot表示该水质指标当前数据中的第t个时间节点的需要输出的信息;表示该水质指标当前数据中的第t个时间节点的候选门,候选门是备选更新内容的神经元;ct表示该水质指标当前数据中的第t个时间节点的细胞状态,细胞状态是决定了需要输出信息内容的神经元;表示该水质指标当前数据中的第t个时间节点的输出的隐状态向量,ht-1表示该水质指标当前数据中的第t-1个时间节点的输出的隐状态向量,ct-1表示该水质指标当前数据中的第t-1个时间节点的细胞状态。
xt *是长度为θ的向量,wix、wfx、wox和wcx是大小为u×θ的连接权重矩阵,其中wix、wfx、wox和wcx是输入数据分别到输入门、遗忘门、输出门和候选门的连接权重矩阵;wih、wfh、woh和woh是大小为u×u的连接权重矩阵,其中wih、wfh、woh和woh是输入门、遗忘门、输出门和候选门分别到隐层单元的连接矩阵权重;wic、wfc、woc和wcc是大小为u×u的连接权重矩阵,其中wic、wfc、woc和wcc是输入门、遗忘门、输出门和候选门分别到细胞状态的连接权重矩阵;bi、bf、bo和bc分别是输入门、遗忘门、输出门和候选门的偏置向量,bi、bf、bo和bc是长度为θ的偏置向量。
同理,通过相似前向LSTM神经网络公式计算后向LSTM神经网络隐状态向量
步骤6-3:两个单向LSTM神经网络分别得到隐状态向量通过下式计算隐状态向量ht
其中,表示前向LSTM神经网络的隐状态向量,表示后向LSTM神经网络的隐状态向量,表示将前向和后向的LSTM神经网络的隐状态向量进行拼接,得到长度为2u的向量,Whh是大小u×2u的连接权重矩阵。
步骤6-4:将ht输入到基于注意力神经网络的水质预测模型的隐含层中,即前馈注意力模型,通过下式计算上下文向量c:
βt=tanh(wa1ht)
et=wa2βt
at=softmax(et)
其中,wa1为大小为da×u的连接权重矩阵,wa2为长度为da的连接权重向量。ht表示第t个时间节点双向LSTM神经网络模型输出的隐状态向量,βt表示第t个时间节点第一层感知器输出的长度为da的连接权重向量,et表示第t个时间节点隐状态向量的相似度权重,at表示第t个时间节点的隐状态向量归一化后的相似度权重,C为长度u的向量。
步骤6-5:使用全连接层作为输出层,将步骤6-4输出上下文向量c作为输入,输出预测值通过下式计算:
其中,Wy表示前馈注意力模型到全连接层长度为μ的连接权重向量。
本发明针对LSTM神经网络不考虑每个时刻水质指标的数据对预测结果有着不同重要程度,即不考虑赋予每个时刻水质指标的数据不同的权重,提出一种基于注意力神经网络的水质预测方法,该方法考虑水质样本中每个时刻水质指标的数据对预测结果的重要程度不同,赋予水质样本中每个时刻水质指标的数据不同的权重,从而降低了水质预测时产生的相对误差,提高预测精确度,使得水体水质的预测具有更高实时性和广泛的实用性。
以上所述仅为本发明的较佳实施方式,本发明的保护范围并不以上述实施方式为限,但凡本领域普通技术人员根据本发明所揭示内容所作的等效修饰或变化,皆应纳入权利要求书中记载的保护范围内。

Claims (7)

1.基于注意力神经网络的水质预测方法,其特征在于:包括如下步骤:
步骤1:采集某一水质指标的数据;
步骤2:将步骤1采集到的该水质指标的数据进行z-score标准化处理;
步骤3:使用步骤2中处理好的该水质指标的数据构造训练集Training;
步骤4:构造基于注意力神经网络的水质预测模型;
步骤5:使用步骤3中构造的训练集Training训练步骤4中构造的基于注意力神经网络的水质预测模型;
步骤6:使用步骤5中训练好的基于注意力神经网络的水质预测模型预测未来时刻的该水质指标的数据。
2.根据权利要求1所述的基于注意力神经网络的水质预测方法,其特征在于:所述步骤1中,监测一定时间内某一水域,获得按时间排序的该水质指标的数据集合G,G={g1,g2,…gi,…gn},其中n表示该水质指标的数据集合G中元素的数量,gi为第i个时间节点的该水质指标的数据。
3.根据权利要求1所述的基于注意力神经网络的水质预测方法,其特征在于:所述步骤2中,使用z-score标准化方法对每个时间节点的该水质指标的数据进行标准化处理,通过下式计算
其中,gi表示z-score标准化前第i个时间节点的该水质指标的数据,表示z-score标准化后第i个时间节点的该水质指标的数据,μx与σx分别表示该水质指标的数据集合的均值与标准差;
通过对采集到的该水质指标的数据进行z-score标准化,获得z-score标准化后的该水质指标的数据集合其中n表示z-score标准化后该水质指标的数据集合G*中元素的数量,gi *为第i个时间节点z-score标准化后的该水质指标的数据。
4.根据权利要求1所述的基于注意力神经网络的水质预测方法,其特征在于:所述步骤3中,将处理好的该水质指标的数据集合G*用于构造训练集Training,构造训练集Training的具体步骤如下:
构造训练集Training={{xi,yi}},0<i≤m,其中,m表示水质指标训练样本数量;设置d为窗口大小,xi表示第i个训练样本的输入,其中xi中包含d个时间节点的该水质指标的数据;yi表示第i个训练样本输出,表示z-score标准化后第i+d个时间节点的该水质指标的数据。
5.根据权利要求1所述的基于注意力神经网络的水质预测方法,其特征在于:所述步骤4中,构造双向LSTM神经网络模型和前馈注意力模型,将二种模型构造为基于注意力神经网络的水质预测模型,具体步骤如下:
步骤4-1:构造双向LSTM神经网络模型,具体步骤如下:
步骤4-1-1:使用向前和向后两个结构相同的LSTM神经网络,输出隐状态矩阵H:
H=(h1,h2,...,hq)
其中,hq表示双向LSTM神经网络在第q个时间节点输出的隐状态向量;设置q的值等于d的值,设置单向LSTM神经网络隐状态单元数为u,hq为长度u的向量;
步骤4-1-2:设置双向LSTM神经网络输入层到隐含层的连接权重矩阵U、隐含层到隐含层的连接权重矩阵W、隐含层到输出层的连接权重矩阵V均为随机小实数;
步骤4-1-3:设置双向LSTM神经网络激活函数;将双向LSTM神经网络中的输入门、遗忘门和输出门的激活函数为sigmoid函数,候选门中的激活函数为tanh函数;
步骤4-2:构造前馈注意力模型,具体步骤如下:
步骤4-2-1:使用两层感知器作为前馈注意力模型的内部隐含层;设置两层感知器第一层单元数为da,设置两层感知器第二层单元数为1,其中,双向LSTM神经网络模型到前馈注意力模型中的第一层感知器的连接权重矩阵为wa1,wa1为大小da×u的连接权重矩阵,前馈注意力模型中的第一层感知器到第二层感知器的连接权重向量为wa2,wa2为长度da的连接权重向量;
步骤4-2-2:设置前馈注意力模型初始权重参数为随机小实数;
步骤4-3:使用全连接层作为基于注意力神经网络的水质预测模型的输出层;设置全连接层单元数为1,其中,前馈注意力模型到全连接层之间的连接权重向量为Wy,Wy是长度为μ的连接权重向量;设置全连接层初始权重参数为随机小实数;
步骤4-4:将步骤4-1构造好的双向LSTM神经网络模型和步骤4-2构造好的前馈注意力模型构造为基于注意力神经网络的水质预测模型;具体步骤如下:
步骤4-4-1:使用步骤4-1中构造好的双向LSTM神经网络模型作为基于注意力神经网络的水质预测模型的输入层,双向LSTM神经网络模型的输出为隐状态矩阵H;
步骤4-4-2:使用步骤4-2中构造好的前馈注意力模型作为基于注意力神经网络的水质预测模型的隐含层,将步骤4-4-1中输出的隐状态矩阵H作为前馈注意力模型的输入,前馈注意力模型的输出为上下文向量c;
步骤4-4-3:使用步骤4-2中构造好的全连接层作为基于注意力神经网络的水质预测模型的输出层,将步骤4-4-2中输出的上下文向量c作为全连接层的输入,全连接层的输出为预测值;
步骤4-4-4:基于注意力神经网络的水质预测模型选用均方误差作为损失函数。
6.根据权利要求1所述的基于注意力神经网络的水质预测方法,其特征在于:所述步骤5中,训练基于注意力神经网络的水质预测模型具体步骤如下:
步骤5-1:将训练集Training中输入到注意力神经网络的水质预测模型,通过模型得到与xi对应的实际输出
步骤5-2:使用均方误差公式计算实际预测值与期望输出值的误差;利用反向传播算法将误差反向传递给每一个神经元,然后每个神经元会采用随机梯度下降更新每条连接线的连接权重;其中,在双向LSTM神经网络模型中需要更新的连接权重矩阵为输入层到隐含层的连接权重矩阵U、隐含层到隐含层的连接权重矩阵W、隐含层到输出层的连接权重矩阵V;在前馈注意力模型中需要更新的连接权重是双向LSTM神经网络模型到前馈注意力模型中的第一层感知器的连接权重矩阵wa1和前馈注意力模型中的第一层感知器到第二层感知器的连接权重向量wa2;在全连接层中需要更新的连接权重是前馈注意力模型到全连接层之间的连接权重向量Wy
步骤5-3:设置迭代100次,在迭代过程中不断更新基于注意力神经网络预测模型中的连接权重。
7.根据权利要求1所述的基于注意力神经网络的水质预测方法,其特征在于:所述步骤6中,预测未来时刻的该水质指标的数据具体步骤如下:
步骤6-1:获得该水质指标的当前数据,并将其进行z-score标准化,得到z-score标准化后该水质指标的当前数据:
步骤6-2:将输入到训练好的基于注意力神经网络的水质预测模型的输入层中,即双向LSTM神经网络模型中,其中,前向LSTM神经网络通过下式计算隐状态向量
其中,it表示该水质指标当前数据中的第t个时间节点的需要更新的信息,ft表示该水质指标当前数据中的第t个时间节点的需要丢弃的信息,ot表示该水质指标当前数据中的第t个时间节点的需要输出的信息;表示该水质指标当前数据中的第t个时间节点的候选门,候选门是备选更新内容的神经元;ct表示该水质指标当前数据中的第t个时间节点的细胞状态,细胞状态是决定了需要输出信息内容的神经元;表示该水质指标当前数据中的第t个时间节点的输出的隐状态向量,ht-1表示该水质指标当前数据中的第t-1个时间节点的输出的隐状态向量,ct-1表示该水质指标当前数据中的第t-1个时间节点的细胞状态;
xt *是长度为θ的向量,wix、wfx、wox和wcx是大小为u×θ的连接权重矩阵,其中wix、wfx、wox和wcx是输入数据分别到输入门、遗忘门、输出门和候选门的连接权重矩阵;wih、wfh、woh和woh是大小为u×u的连接权重矩阵,其中wih、wfh、woh和woh是输入门、遗忘门、输出门和候选门分别到隐层单元的连接矩阵权重;wic、wfc、woc和wcc是大小为u×u的连接权重矩阵,其中wic、wfc、woc和wcc是输入门、遗忘门、输出门和候选门分别到细胞状态的连接权重矩阵;bi、bf、bo和bc分别是输入门、遗忘门、输出门和候选门的偏置向量,bi、bf、bo和bc是长度为θ的偏置向量;
同理,通过相似前向LSTM神经网络公式计算后向LSTM神经网络隐状态向量
步骤6-3:两个单向LSTM神经网络分别得到隐状态向量通过下式计算隐状态向量ht
其中,表示前向LSTM神经网络的隐状态向量,表示后向LSTM神经网络的隐状态向量,表示将前向和后向的LSTM神经网络的隐状态向量进行拼接,得到长度为2u的向量,Whh是大小u×2u的连接权重矩阵;
步骤6-4:将ht输入到基于注意力神经网络的水质预测模型的隐含层中,即前馈注意力模型,通过下式计算上下文向量c;
βt=tanh(wa1ht)
et=wa2βt
at=softmax(et)
其中,wa1为大小为da×u的连接权重矩阵,wa2为长度为da的连接权重向量。ht表示第t个时间节点双向LSTM神经网络模型输出的隐状态向量,βt表示第t个时间节点第一层感知器输出的长度为da的连接权重向量,et表示第t个时间节点隐状态向量的相似度权重,at表示第t个时间节点的隐状态向量归一化后的相似度权重,C为长度u的向量;
步骤6-5:使用全连接层作为输出层,将步骤6-4输出上下文向量c作为输入,输出预测值通过下式计算:
其中,Wy表示前馈注意力模型到全连接层长度为μ的连接权重向量。
CN201910466102.5A 2019-05-31 2019-05-31 基于注意力神经网络的水质预测方法 Active CN110428082B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910466102.5A CN110428082B (zh) 2019-05-31 2019-05-31 基于注意力神经网络的水质预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910466102.5A CN110428082B (zh) 2019-05-31 2019-05-31 基于注意力神经网络的水质预测方法

Publications (2)

Publication Number Publication Date
CN110428082A true CN110428082A (zh) 2019-11-08
CN110428082B CN110428082B (zh) 2022-07-22

Family

ID=68408449

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910466102.5A Active CN110428082B (zh) 2019-05-31 2019-05-31 基于注意力神经网络的水质预测方法

Country Status (1)

Country Link
CN (1) CN110428082B (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110824142A (zh) * 2019-11-13 2020-02-21 杭州鲁尔物联科技有限公司 一种地质灾害的预测方法、装置及设备
CN110852515A (zh) * 2019-11-15 2020-02-28 北京工业大学 基于混合长短时记忆神经网络的水质指标预测方法
CN111047012A (zh) * 2019-12-06 2020-04-21 重庆大学 基于深度双向长短期记忆网络的空气质量预测方法
CN111369078A (zh) * 2020-02-14 2020-07-03 迈拓仪表股份有限公司 一种基于长短期记忆神经网络的供水水质预测方法
CN111915097A (zh) * 2020-08-14 2020-11-10 南通大学 基于改进遗传算法优化lstm神经网络的水质预测方法
CN112116080A (zh) * 2020-09-24 2020-12-22 中国科学院沈阳计算技术研究所有限公司 一种融合了注意力机制的cnn-gru水质预测方法
CN112949821A (zh) * 2021-01-28 2021-06-11 河北师范大学 基于双重注意力机制的网络安全态势感知方法
CN113033861A (zh) * 2019-12-25 2021-06-25 广东奥博信息产业股份有限公司 一种基于时间序列模型的水质预测方法及系统
CN113029993A (zh) * 2021-03-24 2021-06-25 中南大学 一种基于注意力机制的紫外光谱快速总氮在线检测方法
CN114881303A (zh) * 2022-04-21 2022-08-09 海南大学 一种基于双注意力机制的水质长期预测方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108830487A (zh) * 2018-06-21 2018-11-16 王芊霖 基于长短时神经网络的电力负荷预测方法
CN108846512A (zh) * 2018-06-05 2018-11-20 南京邮电大学 基于择优分类的水质预测方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108846512A (zh) * 2018-06-05 2018-11-20 南京邮电大学 基于择优分类的水质预测方法
CN108830487A (zh) * 2018-06-21 2018-11-16 王芊霖 基于长短时神经网络的电力负荷预测方法

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110824142A (zh) * 2019-11-13 2020-02-21 杭州鲁尔物联科技有限公司 一种地质灾害的预测方法、装置及设备
CN110824142B (zh) * 2019-11-13 2022-06-24 杭州鲁尔物联科技有限公司 一种地质灾害的预测方法、装置及设备
CN110852515A (zh) * 2019-11-15 2020-02-28 北京工业大学 基于混合长短时记忆神经网络的水质指标预测方法
CN110852515B (zh) * 2019-11-15 2022-05-06 北京工业大学 基于混合长短时记忆神经网络的水质指标预测方法
CN111047012A (zh) * 2019-12-06 2020-04-21 重庆大学 基于深度双向长短期记忆网络的空气质量预测方法
CN113033861A (zh) * 2019-12-25 2021-06-25 广东奥博信息产业股份有限公司 一种基于时间序列模型的水质预测方法及系统
CN111369078A (zh) * 2020-02-14 2020-07-03 迈拓仪表股份有限公司 一种基于长短期记忆神经网络的供水水质预测方法
CN111915097A (zh) * 2020-08-14 2020-11-10 南通大学 基于改进遗传算法优化lstm神经网络的水质预测方法
CN112116080A (zh) * 2020-09-24 2020-12-22 中国科学院沈阳计算技术研究所有限公司 一种融合了注意力机制的cnn-gru水质预测方法
CN112949821A (zh) * 2021-01-28 2021-06-11 河北师范大学 基于双重注意力机制的网络安全态势感知方法
CN112949821B (zh) * 2021-01-28 2024-02-02 河北师范大学 基于双重注意力机制的网络安全态势感知方法
CN113029993A (zh) * 2021-03-24 2021-06-25 中南大学 一种基于注意力机制的紫外光谱快速总氮在线检测方法
CN114881303A (zh) * 2022-04-21 2022-08-09 海南大学 一种基于双注意力机制的水质长期预测方法

Also Published As

Publication number Publication date
CN110428082B (zh) 2022-07-22

Similar Documents

Publication Publication Date Title
CN110428082A (zh) 基于注意力神经网络的水质预测方法
CN107688850B (zh) 一种深度神经网络压缩方法
CN109858647B (zh) 一种耦合gis和gbdt算法的区域洪涝灾害风险评价与预估方法
Johari et al. Modelling the mechanical behaviour of unsaturated soils using a genetic algorithm-based neural network
CN110909926A (zh) 基于tcn-lstm的太阳能光伏发电预测方法
Wilson et al. Towards a generic artificial neural network model for dynamic predictions of algal abundance in freshwater lakes
CN109583565B (zh) 基于注意力模型长短时记忆网络的洪水预测方法
CN106022954B (zh) 基于灰色关联度的多重bp神经网络负荷预测方法
CN109829541A (zh) 基于学习自动机的深度神经网络增量式训练方法及系统
CN110824915B (zh) 基于ga-dbn网络的废水处理智能监控方法及系统
Baran et al. Stochastic models that predict trout population density or biomass on a mesohabitat scale
CN108171319A (zh) 网络连接自适应深度卷积模型的构建方法
CN110070172A (zh) 基于双向独立循环神经网络的序列预测模型的建立方法
CN108596274A (zh) 基于卷积神经网络的图像分类方法
CN112487193B (zh) 一种基于自编码器的零样本图片分类方法
CN109002927A (zh) 基于递归神经网络的油田勘探储量预测方法
CN110197251A (zh) 基于深度学习网络的预测方法、装置、设备及存储介质
CN114693005A (zh) 基于卷积傅里叶神经网络的三维地下油藏动态预测方法
CN114692732A (zh) 一种在线标签更新的方法、系统、装置及存储介质
CN116451556A (zh) 一种混凝土坝变形观测量统计模型构建方法
CN109408896B (zh) 一种污水厌氧处理产气量多元智能实时监控方法
CN113836783A (zh) 斜拉桥主梁温致挠度监测基准值的数字回归模型建模方法
CN117034060A (zh) 基于ae-rcnn的洪水分级智能预报方法
Pang et al. A nonlinear perturbation model based on artificial neural network
Kumarasiri et al. Rainfall forecasting: an artificial neural network approach

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant