CN109521176B - 一种基于改进深度极限学习机的虚拟水质监测方法 - Google Patents

一种基于改进深度极限学习机的虚拟水质监测方法 Download PDF

Info

Publication number
CN109521176B
CN109521176B CN201910089332.4A CN201910089332A CN109521176B CN 109521176 B CN109521176 B CN 109521176B CN 201910089332 A CN201910089332 A CN 201910089332A CN 109521176 B CN109521176 B CN 109521176B
Authority
CN
China
Prior art keywords
water quality
learning machine
monitoring
sample
virtual
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201910089332.4A
Other languages
English (en)
Other versions
CN109521176A (zh
Inventor
蒋鹏
李雷
许欢
刘俊
林广�
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Dianzi University
Original Assignee
Hangzhou Dianzi University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Dianzi University filed Critical Hangzhou Dianzi University
Priority to CN201910089332.4A priority Critical patent/CN109521176B/zh
Publication of CN109521176A publication Critical patent/CN109521176A/zh
Application granted granted Critical
Publication of CN109521176B publication Critical patent/CN109521176B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/18Water

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Food Science & Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Testing And Monitoring For Control Systems (AREA)

Abstract

本发明公开了一种基于改进深度极限学习机的虚拟水质监测方法,本发明针对水质监测中监测站点的建设成本高,设备维护繁琐等问题,利用与虚拟监测位置相关的站点的历史数据,提出了一种改进的深度极限学习机用于实现对虚拟位置处的水质预测。在该方法中,为了提取水质监测网络采集到的水质数据中更具不变性的鲁棒性特征,开发出了一种新的深层极限学习机模型,该模型将局部去噪准则和收缩惩罚项引入基于极限学习机的自编码器。然后,在此基础上利用加权极值学习机对虚拟位置处的水质参数实际值进行预测,实现了对未知位置处的水质监测。本发明可以更好地对实时的未知站点处的水质信息进行实时预测,且具有较好的预测准确度。

Description

一种基于改进深度极限学习机的虚拟水质监测方法
技术领域
本发明涉及一种虚拟水质监测方法,尤其涉及一种基于改进深度极限学习机的虚拟水质监测方法。
背景技术
水质监测应在空间尺度上尽可能大范围的提供水体当前状态的信息,并突出可能需要新的管理措施的地方,或者确定当前的管理做法是否足够。因此,整个水体中监测点的数量越多,它们准确代表其当前状态的概率就越高。然而,根据市场调研,在中国,一个具有五个水质参数(高锰酸盐指数、氨氮、总磷、水温、pH)的小型自动监测站的建设成本高达400万元人民币,甚至不包括后期的设备维护和人力资源。因此,在存在大范围监测的需求下,需要在资源需求和科学严谨性之间取得平衡。常见的做法就是通过空间插值来实现水质的在空间分布中的预测,进而对监测网络进行优化,减少监测站点的个数,降低维护费用,提高监测效率。
目前,基于数学模型的空间插值技术被广泛的运用在水质空间分布的插值预测中,常见的如克里金插值法、反向距离权重、信息熵法等。除此之外,随着人工智能技术的发展,人工神经网络也逐渐被运用于水质空间分布的预测之中,并相对于传统的数学模型有更高的预测精度。然而,当前运用于水质空间分布预测神经网络模型常为浅层模型,容易陷入局部最优,且对水质空间数据的高层特征提出能力不足,和深度模型相比明显存在不足。
发明内容
本发明针对现有技术的不足,提供了一种基于改进深度极限学习机的虚拟水质监测方法。
本发明包括以下步骤:
步骤1:对水质监测网络采集的水质参数含量数据进行空间相关性分析,确定对未知位置进行插值所需要利用的站点,详细过程如下:
1)计算相关系数ρX,Y,具体计算如下:
Figure BDA0001962769670000021
式(1)中N为样本总量,Xi,Yi分别为两个样本的实际观测值,
Figure BDA0001962769670000022
分别为两个样本数据的均值。
2)根据计算出的所有站点之间的相关系数,得到与需要预测站点处相关性较大的站点,即ρX,Y>0.6时,呈强相关程度及其以上的站点。
步骤2:样本进行预处理:所述样本为与预测站点具有强相关程度及以上的若干个监测站点所监测的水质参数值,将数据集按照“留出法”划分成训练集和测试集;采用最大最小法分别对训练集和测试集进行归一化处理,转化为[0,1]之间的值。
步骤3:初始化改进的深度极限学习机模型结构:模型主要由两部分构成,第一部分是通过堆叠基于极限学习机的降噪收缩自编码器(ELM-CDAE)构成,第二部分是为加权极限学习机(WELM)。其中第一部分中的ELM-CDAE数量m为3,各ELM-CDAE中隐藏层中的神经元个数为8,激活函数g(x)为sigmod函数,引入的噪声为高斯噪声。
步骤4:采用无监督逐层贪婪预训练算法对堆叠的ELM-CDAE进行训练,对于每一个ELM-CDAE的输出权重均采用下述过程进行计算:
1)对输入样本X利用高斯噪声进行干扰得到加噪后的输入
Figure BDA0001962769670000031
2)利用所有加噪后的样本
Figure BDA0001962769670000032
对当前的ELM-CDAE进行训练,按照下式计算第i个ELM-CDAE中的输出权重矩阵βi(i=1,2,…,m):
Figure BDA0001962769670000033
其中I为单位矩阵,C和λ为正则化参数,H为隐藏层输出矩阵,
Figure BDA0001962769670000034
为隐藏层输出矩阵H对输入样本x的偏导,HT为矩阵H的转置。
步骤5:计算模型第一部分的输出fSELM-DCAE(x):
fSELM-DCAE(x)=βm(g(βm-1(...g(β0x))) (3)
步骤6:利用第一部分的输出fSELM-DCAE(x)作为第二部分WELM的输入,计算WELM的输出权重矩阵β,计算如下:
Figure BDA0001962769670000035
其中T为插值位置处的实际观测值,W为权重矩阵,根据样本采集时间所处的季度在总的样本集中所占的比例确定。
步骤7:将相关站点的实时水质数据输入到训练好的模型中对虚拟监测位置的水质进行预测,对给定的输入x,预测结果Y可表示为:
Y=g(fSELM-DCAE(x))*β (5)
本发明的虚拟水质监测方法中,将局部降噪准则和收缩正则项引入基于极限学习机的自编码器形成ELM-CDAE,并堆叠ELM-CDAE形成深度的极限学习机。为了能够提升模型的泛化能力,在有监督学习阶段采用WELM实现对虚拟位置处的水质监测,与传统的方法相比,本发明的预测精度有了较大提升。
附图说明
图1是ELM-CDAE结构图。
图2是基于ELM-CDAE的改进深度极限学习机结构图。
具体实施方式
本发明具体实现过程如下:
本发明主要包括ELM-CDAE和基于ELM-CDAE的深度极限学习机两部分内容。
如图1所示,本发明将局部降噪准则和收缩正则项引入基于极限学习机的自编码器从而形成ELM-CDAE。单个ELM-CDAE的训练过程可详述如下:
步骤1:初始化ELM-CDAE模型:选用的干扰噪声为高斯噪声,隐藏层节点个数l为8,输入权重和偏置均随机产生。
步骤2:利用噪声对输入的水质数据x进行加噪处理,得到加噪后的输入
Figure BDA0001962769670000041
并使得
Figure BDA0001962769670000042
的统计分布满足
Figure BDA0001962769670000043
步骤3:计算隐藏层输出H:
Figure BDA0001962769670000044
其中N为样本数量,l为隐藏层节点个数,aj,bj,xi分别为输入权重向量、偏置向量和输入向量。
步骤4:计算输出权重β,得到输出Y=Hβ,其中β的计算方法如下:
Figure BDA0001962769670000051
基于ELM-CDAE的深度极限学习机结构如图2所示,该模型通过堆叠ELM-CDAE实现数据的无监督预训练,然后通过WELM实现对数据的有监督学习,利用该模型实现对水质的虚拟监测过程如下:
步骤1:对水质监测网络采集的水质参数含量数据进行空间相关性分析,确定对未知位置进行插值所需要利用的站点,详细过程如下:
1)计算相关系数ρX,Y,具体计算如下:
Figure BDA0001962769670000052
式(8)中N为样本总量,Xi,Yi分别为两个样本的实际观测值,
Figure BDA0001962769670000053
分别为两个样本数据的均值。
2)根据计算出的所有站点之间的相关系数,得到与需要预测站点处相关性较大的站点,即ρX,Y>0.6时,呈强相关程度及其以上的站点。
步骤2:样本进行预处理:所述样本为与预测站点具有强相关程度及以上的若干个监测站点所监测的水质参数值,将数据集按照“留出法”划分成训练集和测试集;采用最大最小法分别对训练集和测试集进行归一化处理,转化为[0,1]之间的值;
步骤3:初始化改进的深度极限学习机模型结构:模型主要由两部分构成,第一部分是通过堆叠基于极限学习机的降噪收缩自编码器(ELM-CDAE)构成,第二部分是为加权极限学习机(WELM)。其中第一部分中的ELM-CDAE数量m为3,各ELM-CDAE中隐藏层中的神经元个数为8,激活函数g(x)为sigmod函数,引入的噪声为高斯噪声。
步骤4:采用无监督逐层贪婪预训练算法对堆叠的ELM-CDAE进行训练,对于每一个ELM-CDAE的输出权重均采用下述过程进行计算:
1)对所有输入样本X利用高斯噪声进行干扰得到加噪后的输入
Figure BDA0001962769670000061
2)利用所有加噪后的样本
Figure BDA0001962769670000062
对当前的ELM-CDAE进行训练,按照下式计算第i个ELM-CDAE中的输出权重矩阵βi(i=1,2,…,m):
Figure BDA0001962769670000063
其中I为单位矩阵,C和λ为正则化参数,H为隐藏层输出矩阵,
Figure BDA0001962769670000064
为隐藏层输出矩阵对单个输入样本x的偏导,HT为矩阵H的转置。
步骤5:计算模型第一部分对于单个输入x对应的输出fSELM-DCAE(x),计算如下:
fSELM-DCAE(x)=βm(g(βm-1(...g(β0x))) (10)
步骤6:利用第一部分的输出fSELM-DCAE(x)作为第二部分WELM的输入,计算WELM的输出权重矩阵β,计算如下:
Figure BDA0001962769670000065
其中T为插值位置处的实际观测值,W为权重矩阵,根据样本采集时间所处的季度在总的样本集中所占的比例确定。
步骤7:将相关站点的实时水质数据输入到训练好的模型中对虚拟监测位置的水质进行预测,对给定的输入x,预测结果Y可表示为:
Y=g(fSELM-DCAE(x))*β (12)
对训练得到的深度极限学习机模型进行分析和对比,经分析和对比,相比于其他已有的方法,用深度极限学习机模型可以更好地对实时的未知站点处的水质信息进行实时预测,且具有较好的预测准确度。
以上实施例仅用以说明本发明的技术方案而非限制,仅仅参照较佳实施例对本发明进行了详细说明。本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的精神和范围,均应涵盖在本发明的权利要求范围当中。

Claims (1)

1.一种基于改进深度极限学习机的虚拟水质监测方法,其特征在于:该方法包括以下步骤:
步骤1:对水质监测网络采集的水质参数含量数据进行空间相关性分析,确定对未知位置进行插值所需要利用的站点,详细过程如下:
1)计算相关系数ρX,Y,具体计算如下:
Figure FDA0001962769660000011
式(1)中N为样本总量,Xi,Yi分别为两个样本的实际观测值,
Figure FDA0001962769660000012
分别为两个样本数据的均值;
2)根据计算出的所有站点之间的相关系数,得到与需要预测站点处相关性较大的站点,即ρX,Y>0.6时,呈强相关程度及其以上的站点;
步骤2:样本进行预处理:所述样本为与预测站点具有强相关程度及以上的若干个监测站点所监测的水质参数值,将数据集按照“留出法”划分成训练集和测试集;采用最大最小法分别对训练集和测试集进行归一化处理,转化为[0,1]之间的值;
步骤3:初始化改进的深度极限学习机模型结构:模型主要由两部分构成,第一部分是通过堆叠基于极限学习机的降噪收缩自编码器构成,第二部分是加权极限学习机;其中第一部分中的降噪收缩自编码器数量m为3,各降噪收缩自编码器中隐藏层中的神经元个数为8,激活函数g(x)为sigmod函数,引入的噪声为高斯噪声;
步骤4:采用无监督逐层贪婪预训练算法对堆叠的降噪收缩自编码器进行训练,对于每一个降噪收缩自编码器的输出权重均采用下述过程进行计算:
1)对输入样本X利用高斯噪声进行干扰得到加噪后的输入
Figure FDA0001962769660000021
2)利用所有加噪后的样本
Figure FDA0001962769660000022
对当前的降噪收缩自编码器进行训练,按照下式计算第i个降噪收缩自编码器中的输出权重矩阵βi,i=1,2,…,m:
Figure FDA0001962769660000023
其中I为单位矩阵,C和λ为正则化参数,H为隐藏层输出矩阵,
Figure FDA0001962769660000024
为隐藏层输出矩阵H对输入样本x的偏导,HT为矩阵H的转置;
步骤5:计算模型第一部分的输出fSELM-DCAE(x):
fSELM-DCAE(x)=βm(g(βm-1(...g(β0x))) (3)
步骤6:利用第一部分的输出fSELM-DCAE(x)作为第二部分加权极限学习机的输入,计算加权极限学习机的输出权重矩阵β,计算如下:
Figure FDA0001962769660000025
其中T为插值位置处的实际观测值,W为权重矩阵,根据样本采集时间所处的季度在总的样本集中所占的比例确定;
步骤7:将相关站点的实时水质数据输入到训练好的模型中对虚拟监测位置的水质进行预测,对给定的输入x,预测结果Y可表示为:
Y=g(fSELM-DCAE(x))*β (5)。
CN201910089332.4A 2019-01-30 2019-01-30 一种基于改进深度极限学习机的虚拟水质监测方法 Expired - Fee Related CN109521176B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910089332.4A CN109521176B (zh) 2019-01-30 2019-01-30 一种基于改进深度极限学习机的虚拟水质监测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910089332.4A CN109521176B (zh) 2019-01-30 2019-01-30 一种基于改进深度极限学习机的虚拟水质监测方法

Publications (2)

Publication Number Publication Date
CN109521176A CN109521176A (zh) 2019-03-26
CN109521176B true CN109521176B (zh) 2021-08-31

Family

ID=65799769

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910089332.4A Expired - Fee Related CN109521176B (zh) 2019-01-30 2019-01-30 一种基于改进深度极限学习机的虚拟水质监测方法

Country Status (1)

Country Link
CN (1) CN109521176B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103728431A (zh) * 2014-01-09 2014-04-16 重庆科技学院 基于极限学习机的工业污水cod在线软测量方法
CN103942461A (zh) * 2014-05-14 2014-07-23 浙江师范大学 基于在线贯序极限学习机的水质参数预测方法
CN107491840A (zh) * 2017-08-21 2017-12-19 浙江理工大学 基于elm神经网络模型的流动磨损特性预测及寿命评估方法
CN107563567A (zh) * 2017-09-18 2018-01-09 河海大学 基于稀疏自编码的核极限学习机洪水预报方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103728431A (zh) * 2014-01-09 2014-04-16 重庆科技学院 基于极限学习机的工业污水cod在线软测量方法
CN103942461A (zh) * 2014-05-14 2014-07-23 浙江师范大学 基于在线贯序极限学习机的水质参数预测方法
CN107491840A (zh) * 2017-08-21 2017-12-19 浙江理工大学 基于elm神经网络模型的流动磨损特性预测及寿命评估方法
CN107563567A (zh) * 2017-09-18 2018-01-09 河海大学 基于稀疏自编码的核极限学习机洪水预报方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Extreme Learning Machine for Regression and;Guang-Bin Huang et al;《IEEE transactions on systems》;20120430;第42卷(第2期);第513-529页 *
Weighted extremelearningmachineforimbalancelearning;Weiwei Zong et al;《Neurocomputing》;20120927;第229-242页 *
基于改进极限学习机的软测量建模;周馨等;《计算机应用》;20170310(第03期);第668-672页 *

Also Published As

Publication number Publication date
CN109521176A (zh) 2019-03-26

Similar Documents

Publication Publication Date Title
CN108900346B (zh) 基于lstm网络的无线网络流量预测方法
CN108696331B (zh) 一种基于生成对抗网络的信号重构方法
CN110852515B (zh) 基于混合长短时记忆神经网络的水质指标预测方法
CN108596327B (zh) 一种基于深度学习的地震速度谱人工智能拾取方法
CN108764520B (zh) 一种基于多层循环神经网络和d-s证据理论的水质参数预测方法
CN108920812B (zh) 一种机械加工表面粗糙度预测方法
CN111967688B (zh) 一种基于卡尔曼滤波器与卷积神经网络的电力负荷预测方法
CN111860982A (zh) 一种基于vmd-fcm-gru的风电场短期风电功率预测方法
CN112884056A (zh) 基于优化的lstm神经网络的污水水质预测方法
CN106022954B (zh) 基于灰色关联度的多重bp神经网络负荷预测方法
CN106656357B (zh) 一种工频通信信道状态评估系统和方法
CN113687433B (zh) 一种基于Bi-LSTM的大地电磁信号去噪方法及系统
CN107729988B (zh) 基于动态深度置信网络的蓝藻水华预测方法
CN112765902A (zh) 基于TentFWA-GD的RBF神经网络软测量建模方法及其应用
CN106405683B (zh) 基于g-l混合噪声特性核岭回归技术的风速预报方法及装置
CN115982141A (zh) 一种针对时序数据预测的特征优化方法
CN115561005A (zh) 基于eemd分解和轻量化神经网络的化工过程故障诊断方法
CN108631817B (zh) 一种基于时频分析和径向神经网络进行跳频信号频段预测的方法
CN113109782B (zh) 一种直接应用于雷达辐射源幅度序列的分类方法
CN117370766A (zh) 一种基于深度学习的卫星任务规划方案评估方法
CN112215421A (zh) 一种基于生成对抗网络的深度学习水质指标预测方法
CN109521176B (zh) 一种基于改进深度极限学习机的虚拟水质监测方法
CN111310974A (zh) 一种基于ga-elm的短期需水预测方法
CN115032682A (zh) 一种基于图论的多站台地震震源参数估计方法
CN111859241B (zh) 一种基于声传递函数学习的非监督声源定向方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB03 Change of inventor or designer information

Inventor after: Jiang Peng

Inventor after: Li Lei

Inventor after: Xu Huan

Inventor after: Liu Jun

Inventor after: Lin Guang

Inventor before: Jiang Peng

Inventor before: Li Lei

Inventor before: Xu Huan

Inventor before: Lin Guang

CB03 Change of inventor or designer information
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20210831

CF01 Termination of patent right due to non-payment of annual fee