CN105911003A - 基于rbm回归的水质toc浓度分析方法 - Google Patents

基于rbm回归的水质toc浓度分析方法 Download PDF

Info

Publication number
CN105911003A
CN105911003A CN201610228307.6A CN201610228307A CN105911003A CN 105911003 A CN105911003 A CN 105911003A CN 201610228307 A CN201610228307 A CN 201610228307A CN 105911003 A CN105911003 A CN 105911003A
Authority
CN
China
Prior art keywords
layer
boltzmann machine
represent
limited boltzmann
machine rbm
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610228307.6A
Other languages
English (en)
Other versions
CN105911003B (zh
Inventor
黄鸿
石光耀
黄云彪
金莹莹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing University
Original Assignee
Chongqing University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University filed Critical Chongqing University
Priority to CN201610228307.6A priority Critical patent/CN105911003B/zh
Publication of CN105911003A publication Critical patent/CN105911003A/zh
Application granted granted Critical
Publication of CN105911003B publication Critical patent/CN105911003B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • G01N21/31Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2201/00Features of devices classified in G01N21/00
    • G01N2201/12Circuits of general importance; Signal processing

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Data Mining & Analysis (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Investigating Or Analysing Materials By Optical Means (AREA)

Abstract

本发明公开了一种基于RBM回归的水质TOC浓度分析方法,多次采集光源发出的光通过不同已知浓度的TOC溶液时的光谱数据,得到每种浓度对应的吸收光谱数据;分别计算光谱数据的吸光度;将所有吸光度值作为训练样本输入限制波尔兹曼机中训练,得到不同迭代次数对应的训练后的受限波尔兹曼机和对应的重构后的训练样本;将重构后的训练样本组合成新的训练样本送入BP神经网络模型中进行训练,得到训练后的BP神经网络模型;将测试样本按训练样本方式处理,并将重构后的测试样本组合成新的测试样本送入BP神经网络模型中进行测试,即得待测溶液的TOC浓度。本方法可提高TOC浓度反演精度,改善浓度反演算法的重复性和可移植性,满足在线检测精度要求。

Description

基于RBM回归的水质TOC浓度分析方法
技术领域
本发明涉及水质TOC浓度检测,具体指一种基于RBM回归的水质TOC浓度分析方法,属于水质检测分析处理领域,适用于因浓度高、光程短,光谱吸收不充分等导致的信噪比低,即传统方法问题较大情况下的溶液TOC浓度反演。
背景技术
总有机碳TOC(Total Organic Carbon)是表征水体中有机物质总量的综合指标,它代表了水体中所含有机物质的总和,直接反映了水体被有机物质污染的程度。目前,TOC测量已经广泛地应用到江河、湖泊以及海洋监测等方面。对于地表水、饮用水、工业用水等方面的质量控制,TOC同样是重要的测量参数,实际上TOC测量已经成为世界上水体质量控制的主要检测手段。2003年国家四部委在新颁布的排污费用征收标准管理办法中,已经把TOC正式列入水污染物污染当量值表。
常规TOC测量是根据碳是构成有机体的基本元素这个原理而进行的,碳是整个生物圈物质和能量循环的主体。碳循环进入水体后主要以不同的化合物结构和不同的形态方式存在,它进入水体主要有两种途径,一方面是通过大气与水体之间的交换,水体与大气为了达到碳平衡,会吸收大量的气态碳直至饱和;另一方面是由于生活污染物的排放、石油开发、工业生产以及养殖的发展,使得水体中碳构成的有机物质成分增加。因此,总体来讲TOC比COD或BOD5更能直接合理的表征水体受到有机物质污染的程度。
现在我国水环境污染日趋严重,江河、湖泊不断受到石油泄漏、生活污染物排放、倾废等行为的影响,特别是随着现代工业如有机化工,精细化工、高分子工业、电子工业的迅速发展,水体中的有机污染物呈现出多样化、复杂化的特点,特别是有些持久性有机污染物POPs(Persistent Organic Pollutants),又称难降解有机污染物,它们是一类具有毒性、易于在生物体内富集、在环境中能够持久存在、对人体有着严重危害的有机物质,传统的测量分析方法已经不能或者很难准确测量其含量,但是TOC测量却是目前非常理想的测量手段,可以得到满意的检测结果。
常规的TOC测量方法是根据水体中的碳循环,即碳的各种存在形态而进行的,测量方法基本上是先将水中的有机物质氧化为CO2,然后检测CO2的含量来确定TOC的浓度。然而这些常规的测量方法在应用过程中是有缺陷的,例如测试方法复杂,需要使用化学试剂,容易造成二次污染,测量时间、速度不能满足实时性要求以及需要一定的维护工作等,因此,这些方法不适于大规模环保监测的发展需要。在这种现实条件下,一些新的测量方法和技术应运而生,如电阻法、电导法、臭氧氧化法、超声空化与声致发光法、紫外法等等,这些方法正在得到广泛的关注及应用。
1)电阻法:电阻法是近年来开始应用的技术,其原理是在温度补偿的前提下,测量样品在紫外线氧化前后电阻率的差值来实现的。当水进入仪器后,首先测量最初的温度和电阻率,然后使水会通过一个螺旋石英管,并且暴露在185nm的紫外线下,这时所有的低分子量的有机组分会立即转化成有机酸。生成的酸会使水的电阻率变低,这时我们再测量此时的水的电阻率,根据前后两次测量的电阻率差值和水中TOC的含量成正比这一关系,即可测得待测液体的TOC含量。但该方法对被测量的水体来源要求比较苛刻,只能用相对洁净的工业用水和纯水,应用方向单一。
2)电导法:电导法的主要应用是电导池,它由参比电极、测量电极、气液分离器、离子交换树脂、反应盘管、0.001mol/L NaOH电导液等组成。它的测量原理是:当反应气流通过电导池的反应盘管时,其中的CO2与NaOH电导液会在反应盘管中充分接触,从而发生化学反应生成碳酸钠。因为NaOH的电导率与Na2CO3的电导率是不同的,这就导致测量电极检测到的信号发生变化,而它们的差值又与CO2的浓度成正比,这样就可以实现对CO2的测量。电导池的优点是价格低、易普及,但稳定性较差。
3)臭氧氧化法:臭氧氧化法的主要依据是臭氧的氧化能力在天然元素中仅次于氟,采用臭氧氧化方式来作为TOC检测技术,优点是反应速度快,无二次污染,具有较高的应用价值。测量原理是根据臭氧氧化化学发光探测原理,测量定量化学发光总量,根据大量试验数据验证,测量信号与TOC的线性相关性非常好。此方法的应用前景非常可观。
4)超声空化与声致发光法:声化学已成为一个蓬勃发展的研究领域,声致发光的研究已涉及到环境保护领域,我国的相关学者在基础研究和应用研究方面做了大量的工作,近年来,这一独特的方法已经得到专家的认可,目前在山东省科学院海洋仪器研究所,利用超声空化与声致发光法研制的样机正在进行初步的测试,大量的试验数据表明该方法具明显优势。
5)紫外法:基于紫外可见(UV-Vis)光谱的水体TOC分析由于具有快速、不接触测量、重复性好、维护量少等优点,在目前的发展比较迅速。UV吸收光谱用于TOC的检测分析最早可追溯到1972年,Dobbs等人对于254nm处紫外吸光度值(A)和城市污水处理二级出水及河水的TOC之间线性关系进行了研究,到2001年更多的技术人员分别验证了这一方法对于更广泛污水水样同样具有有效性,与传统的化学测量方法检测的TOC之间具有良好的线性相关性,因此,该方法的应用得到飞速发展。目前国外的一些仪器公司已经开发出基于紫外可见(UV-Vis)光谱的TOC分析仪,图1是现有紫外光谱法测量系统示意图。但是通过单点进行测量,得到的信息不充分,线性回归方程的拟合精度不高。目前很多科技人员正在应用多波段拟合的方法进行测量。
紫外光谱法反演TOC溶液的浓度所依据的原理就是朗伯比尔定律,朗伯比尔定律可表述为:
A=lg(I0/It)=K·l·c
式中,A为吸光度,I0为入射光的强度,It为透射光的强度,K为吸收系数或者摩尔吸收系数,l为吸收介质的厚度,c为吸光介质的浓度,单位可以是g/L或者mol/L。
常规的用于反演TOC溶液浓度的方法就是根据朗伯比尔定律来测定所有各种浓度TOC溶液的吸光度,然后根据各种浓度TOC溶液的平均吸光度拟合出一条直线,然后将未知溶液的吸光度带入该一次函数从而反演出未知溶液浓度。
然而在具体实验过程中,TOC溶液标定的线性并不理想。图2是表1所示10种标准浓度TOC溶液的光谱吸收曲线图;图3是表1所示10种标准浓度溶液吸光度曲线图。如果用30mg/L和70mg/L浓度的计算结果拟合直线,再利用该直线对其余结果进行浓度反演。反演结果和误差如表1所示(单位:mg/L):
表1线性反演结果与误差(%)
单位:mg/L
图4是浓度计算结果线性度示意图。从图4中可以看出,当TOC浓度范围在0mg/L-100mg/L时,计算结果所呈图形虽然基本呈线性,但此时用直线进行反演的时候,个别浓度会出现很大的误差(见表1),而且这些浓度的精度都不能达到要求。鉴于现有方法已不能满足TOC溶液浓度反演的精度要求,因此亟需一种新的高精度的方法来完成TOC溶液的在线检测。
发明内容
针对现有技术存在的上述不足,本发明的目的在于提供一种基于RBM回归的水质TOC浓度分析方法,本方法可以提高TOC浓度反演精度,改善浓度反演算法的重复性和可移植性,尤其能够提高短光程条件下TOC溶液的反演精度,满足在线检测的精度要求。
本发明的技术方案是这样实现的:
基于RBM回归的水质TOC浓度分析方法,步骤如下,
1)训练样本光谱数据采集:通过光谱仪分别采集光源发出的光通过不同已知浓度的TOC溶液时的光谱数据,得到每种浓度TOC溶液对应的吸收光谱数据;每种浓度TOC溶液的吸收光谱数据进行同样次数的多次采集,使每种浓度TOC溶液对应着一组包含着其浓度特征信息的高维数据;
2)吸收光谱数据预处理:将步骤1)采集的所有吸收光谱数据对应减去各自包含的暗光谱,得到预处理后的光谱数据;
3)特征波段选取:将预处理后的光谱数据选择特征比较明显的波段进行分析,得到特征波段;
4)吸光度的计算:根据朗伯比尔定律分别计算出所选特征波段光谱数据的吸光度;
5)RBM参数初始化:初始化限制波尔兹曼机RBM(Restricted Boltzmann Machine)的相关参数,得到初始限制波尔兹曼机RBM网络模型;
6)RBM模型构建:将步骤4)计算得到的所有吸光度值作为训练样本输入初始限制波尔兹曼机RBM网络模型中在某一迭代次数下进行训练,利用对比散度算法,得到该迭代次数对应的训练后的受限波尔兹曼机RBM,同时得到该迭代次数对应的降低了维度的重构后的训练样本;
7)改变迭代次数,重复步骤6),得到不同迭代次数下对应的训练后的受限波尔兹曼机RBM和不同迭代次数对应的降低了维度的重构后的训练样本;
8)将所有迭代次数下对应的降低了维度的重构后的训练样本组合成新的训练样本送入BP神经网络模型中进行训练,得到训练后的BP神经网络模型;
9)测试样本光谱数据采集:通过光谱仪多次采集光源发出的光通过待测浓度TOC溶液时的吸收光谱数据,得到待测浓度TOC溶液对应着的一组包含着其TOC浓度特征信息的高维数据;
10)将测试样本光谱数据依次按步骤2)、步骤3)和步骤4)进行处理,得到每个测试样本光谱数据对应的吸光度值;
11)将步骤10)得到的所有吸光度值作为测试样本分别输入步骤7)得到的所有训练后的受限波尔兹曼机RBM中并分别按训练后的受限波尔兹曼机RBM对应的迭代次数进行训练,得到不同迭代次数对应的降低了维度的重构后的测试样本;
12)将所有迭代次数下对应的降低了维度的重构后的测试样本组合成新的测试样本,再将该新的测试样本送入训练后的BP神经网络模型中进行测试,即可得到待测溶液的TOC浓度值。
第6)步将训练样本输入初始限制波尔兹曼机RBM网络模型中在某一迭代次数下进行训练的具体步骤为,
6a)对于每次迭代,在每小批量数据上,调用CD-k算法,进行k次交替Gibbs采样,本方法只需1次交替Gibbs采样即可保证采集到的样本符合目标分布,具体为:
P ( h j ( 0 ) = 1 | v ( 0 ) ) = 1 1 + exp ( - b j - Σ i = 1 n v w j , i v i ( 0 ) ) - - - ( 1 )
P ( v i ( 1 ) = 1 | h ( 0 ) ) = 1 1 + exp ( - a i - Σ j = 1 n h w j , i h j ( 0 ) ) - - - ( 2 )
其中(1)式表示在已知可见层状态v(0)时采样出隐藏层的第j个单元的状态等于1的概率,v(0)表示可见层的输入状态,即训练样本原始特征向量归一化后的数据,表示可见层第i个单元的状态,表示隐藏层第j个单元的状态,bj表示隐藏层第j个单元的偏置,wj,i表示可见层第i个单元与隐藏层第j个单元的连接权重;
接着,产生[0,1]内的随机数rj,对进行二值化,即若否则,
其中(2)式表示在已知隐藏层状态时采样出可见层各个单元状态以此来代替目标分布,其中,ai表示可见层第i个单元的偏置;
Δw i , j ≈ P ( h i ( 0 ) = 1 | v ( 0 ) ) v j ( 0 ) - P ( h i ( 1 ) = 1 | v ( 1 ) ) v j ( 1 ) - - - ( 3 )
Δa i ≈ v i ( 0 ) - v i ( 1 ) - - - ( 4 )
Δb i ≈ P ( h i ( 0 ) = 1 | v ( 0 ) ) - P ( h i ( 1 ) = 1 | v ( 1 ) ) - - - ( 5 )
利用(3)、(4)、(5)式分别计算每次迭代时目标函数在每小批量数据上关于连接权重W、可见层偏置a、隐藏层偏置b的偏导数;
Δw i , j ( i t e r ) = ρ * Δw i , j ( i t e r - 1 ) + η W * ( Δw i , j ( i t e r ) / n b l o c k - λ * Δw i , j ( i t e r - 1 ) ) - - - ( 6 )
Δa i ( i t e r ) = ρ * Δa i ( i t e r - 1 ) + η v b * ( Δa i ( i t e r ) / n b l o c k ) - - - ( 7 )
Δb i ( i t e r ) = ρ * Δb i ( i t e r - 1 ) + η h b * ( Δb i ( i t e r ) / n b l o c k ) - - - ( 8 )
本方法采用(6)、(7)、(8)式更新当前迭代(iter≥1)每小批量数据上的平均偏导数,其中nblock为小批量数据的数目,ρ为动量学习率,本方法中,当每次迭代次数大于30次时,ρ=ρfinal=0.9,否则,ρ=ρini=0.5;
6b)利用梯度上升法更新RBM参数θ=(W,a,b),具体为:
W(iter)=W(iter-1)+ΔW(iter) (9)
a(iter)=a(iter-1)+Δa(iter) (10)
b(iter)=b(iter-1)+Δb(iter) (11)
按上式更新当前迭代每小批量数据上的连接权重、可见层偏置和隐藏层偏置。
其中,步骤6)中对比散度算法的具体步骤如下:
第1步,将待训练样本输入到受限波尔兹曼机可见层的第一层,得到受限波尔兹曼机可见层的第一层输出;
第2步,按照下式,采样得到受限波尔兹曼机RBM隐藏层的第一层输出:
h 1 n ~ P ( h 1 n = 1 | v 1 ) = 1 1 + e - ( Σ n = 1 N w 1 n × v 1 ) + b 1 n - - - ( 12 )
其中,h1n表示受限波尔兹曼机RBM隐藏层的第一层中第n个节点的输出,n表示限波尔兹曼机RBM隐藏层的第一层中第n个节点,~表示采样操作,P(h1n=1|v1)表示受限波尔兹曼机RBM可见层的第一层输出为v1时受限波尔兹曼机RBM隐藏层的第一层中第n个节点输出为1的几率,v1表示受限波尔兹曼机RBM可见层的第一层输出,e表示欧拉常数,∑表示求和操作,N表示受限波尔兹曼机RBM隐藏层的第一层的节点总数,w1n表示连接受限波尔兹曼机RBM隐藏层的第一层中第n个节点与受限波尔兹曼机RBM可见层的第一层的权值,b1n表示受限波尔兹曼机RBM隐藏层的第一层中第n个节点的偏置向量;
第3步,按照下式,采样得到受限波尔兹曼机RBM可见层的第二层输出:
v 2 m ~ P ( v 2 m = 1 | h 1 ) = 1 1 + e - ( Σ m = 1 M w 2 m × h 1 ) + a 2 m - - - ( 13 )
其中,v2m表示受限波尔兹曼机RBM可见层的第二层中第m个节点的输出,m表示受限波尔兹曼机RBM可见层的第二层中第m个节点,~表示采样操作,P(v2m=1|h1)表示受限波尔兹曼机RBM隐藏层的第一层输出为h1时受限波尔兹曼机RBM可见层的第二层中第m个节点输出为1的几率,h1表示受限波尔兹曼机RBM隐藏层的第一层输出,e表示欧拉常数,∑表示求和操作,M表示受限波尔兹曼机RBM可见层的第二层的节点总数,w2m表示受限波尔兹曼机RBM连接可见层的第二层中第m个节点与受限波尔兹曼机RBM隐藏层的第一层的权值,a2m表示受限波尔兹曼机RBM可见层的第二层中第m个节点的偏置向量;
第4步,按照下式,采样得到受限波尔兹曼机RBM隐藏层的第二层输出:
h 2 n ~ P ( h 2 n = 1 | v 2 ) = 1 1 + e - ( Σ n = 1 N w 2 n × v 2 ) + b 2 n - - - ( 14 )
其中,h2n表示受限波尔兹曼机RBM隐藏层的第二层中第n个节点的输出,n表示受限波尔兹曼机RBM隐藏层的第二层中第n个节点,~表示采样操作,P(h2n=1|v2)表示受限波尔兹曼机RBM可见层的第二层输出为v2时受限波尔兹曼机隐藏层的第二层中第n个节点输出为1的几率,v2表示受限波尔兹曼机RBM可见层的第二层输出,e表示欧拉常数,∑表示求和操作,N表示受限波尔兹曼机RBM隐藏层的第二层的节点总数,w2n表示连接受限波尔兹曼机RBM隐藏层的第二层中第n个节点与受限波尔兹曼机RBM可见层的第二层的权值,b2n表示受限波尔兹曼机RBM隐藏层的第二层中第n个节点的偏置向量;
第5步,按照下式,更新受限波尔兹曼机RBM的权重:
wt+1=wt+(P(h1=1|v1)×v1)-(P(h2=1|v2)×v2) (15)
其中,wt+1表示第t+1次更新后受限波尔兹曼机RBM的权重,wt表示第t次更新后受限波尔兹曼机RBM的权重,P(h1=1|v1)表示受限波尔兹曼机RBM可见层的第一层输出为v1时受限波尔兹曼机隐藏层的第一层输出为1的几率,h1表示受限波尔兹曼机RBM隐藏层的第一层输出,v1表示受限波尔兹曼机RBM可见层的第一层输出,(×)表示内积操作,P(h2=1|v2)表示受限波尔兹曼机RBM可见层的第二层输出为v2时受限波尔兹曼机RBM隐藏层的第二层输出为1的几率,h2表示受限波尔兹曼机RBM隐藏层的第二层输出,v2表示受限波尔兹曼机RBM可见层的第二层输出;
第6步,按照下式,更新受限波尔兹曼机RBM可见层的偏置向量:
at+1=at+v1-v2 (16)
其中,at+1表示第t+1次更新后受限波尔兹曼机RBM可见层的偏置向量,at表示第t次更新后受限波尔兹曼机RBM可见层的偏置向量,v1表示受限波尔兹曼机RBM可见层的第一层输出,v2表示受限波尔兹曼机RBM可见层的第二层输出;
第7步,按照下式,更新受限波尔兹曼机RBM隐藏层的偏置向量:
bt+1=bt+P(h1=1|v1)-P(h2=1|v2) (17)
其中,bt+1表示第t+1次更新后受限波尔兹曼机RBM隐藏层的偏置向量,bt表示第t次更新后受限波尔兹曼机RBM隐藏层的偏置向量,P(h1=1|v1)表示受限波尔兹曼机RBM可见层的第一层输出为v1时受限波尔兹曼机隐藏层的第一层输出为1的几率,h1表示受限波尔兹曼机RBM隐藏层的第一层输出,v1表示受限波尔兹曼机RBM可见层的第一层输出,P(h2=1|v2)表示受限波尔兹曼机可见层的第二层输出为v2时受限波尔兹曼机RBM隐藏层的第二层输出为1的几率,h2表示受限波尔兹曼机RBM隐藏层的第二层输出,v2表示受限波尔兹曼机RBM可见层的第二层输出;
第8步,判断受限波尔兹曼机的训练周期是否达到300秒,若是,停止更新受限波尔兹曼机RBM的权值、可见层的偏置向量和隐藏层的偏置向量,得到训练完成的受限波尔兹曼机,否则,重复执行第2步-第7步,直到受限波尔兹曼机的训练周期达到300秒。
相比现有技术,本发明具有如下有益效果:
本发明采用基于RBM回归的TOC浓度反演方法,相对于直接采用线性拟合的技术,在算法复杂度基本不变的情况下,本方法大幅度提升了反演结果的精度。本方法可以改善浓度反演算法的重复性和可移植性,尤其是提高短光程条件下TOC溶液的反演精度,满足在线检测的精度要求。
附图说明
图1-紫外光谱法测量系统结构示意图。
图2-10种浓度光谱吸收曲线图。
图3-10种浓度的吸光度曲线图。
图4-浓度计算结果线性度示意图。
图5-RBM模型示意图。
图6-反演结果与标液浓度对比示意图。
图7-反演结果与标液浓度误差示意图。
图8-本发明实现流程示意图。
具体实施方式
下面结合附图对本发明作进一步详细说明。
基于现有直接线性拟合方法的不足,本发明提出了一种基于RBM回归的水质TOC浓度反演方法。在所采集的TOC溶液吸收光谱数据中,不同波长点对应不同的光强,相应波段对应着大量的数据。为减小单次采集产生的随机误差,本发明对同一种浓度的光谱数据进行多次采集。这样同一种浓度就相当于对应着一组高维数据,而这组高维数据中就包含着其对应浓度的特征信息。由此可以利用特征提取的方法分别将每种浓度TOC溶液的特征信息提取出来,剔除不必要的信息,即受限玻尔兹曼机RBM法。再利用BP神经网络对训练样本进行建模,最后再将测试样本的特征提取出来,再利用该BP神经网络模型即可得出其对应的浓度。
本方法首先对光谱仪所采得的不同浓度TOC溶液的吸收光谱数据进行预处理,然后对预处理后的数据对应相应标准浓度进行建模,最后用所建模型对新采得的光谱数据进行回归分析,得到反演浓度。
本发明具体步骤如下,同时可以参见图5:
1、基于RBM回归的水质TOC浓度分析方法,其特征在于:步骤如下,
1)训练样本光谱数据采集:通过光谱仪分别采集光源发出的光通过不同已知浓度的TOC溶液时的光谱数据,得到每种浓度TOC溶液对应的吸收光谱数据;每种浓度TOC溶液的吸收光谱数据进行同样次数的多次采集,使每种浓度TOC溶液对应着一组包含着其浓度特征信息的高维数据;
2)吸收光谱数据预处理:将步骤1)采集的所有吸收光谱数据对应减去各自包含的暗光谱,得到预处理后的光谱数据;
3)特征波段选取:将预处理后的光谱数据选择特征比较明显的波段进行分析,得到特征波段;
4)吸光度的计算:根据朗伯比尔定律分别计算出所选特征波段光谱数据的吸光度;
5)RBM参数初始化:初始化限制波尔兹曼机RBM(Restricted Boltzmann Machine)的相关参数,得到初始限制波尔兹曼机RBM网络模型;
6)RBM模型构建:将步骤4)计算得到的所有吸光度值作为训练样本输入初始限制波尔兹曼机RBM网络模型中在某一迭代次数下进行训练,利用对比散度算法,得到该迭代次数对应的训练后的受限波尔兹曼机RBM,同时得到该迭代次数对应的降低了维度的重构后的训练样本;
7)改变迭代次数,重复步骤6),得到不同迭代次数下对应的训练后的受限波尔兹曼机RBM和不同迭代次数对应的降低了维度的重构后的训练样本;
8)将所有迭代次数下对应的降低了维度的重构后的训练样本组合成新的训练样本送入BP神经网络模型中进行训练,得到训练后的BP神经网络模型;
9)测试样本光谱数据采集:通过光谱仪多次采集光源发出的光通过待测浓度TOC溶液时的吸收光谱数据,得到待测浓度TOC溶液对应着的一组包含着其TOC浓度特征信息的高维数据;
10)将测试样本光谱数据依次按步骤2)、步骤3)和步骤4)进行处理,得到每个测试样本光谱数据对应的吸光度值;
11)将步骤10)得到的所有吸光度值作为测试样本分别输入步骤7)得到的所有训练后的受限波尔兹曼机RBM中并分别按训练后的受限波尔兹曼机RBM对应的迭代次数进行训练,得到不同迭代次数对应的降低了维度的重构后的测试样本;
12)将所有迭代次数下对应的降低了维度的重构后的测试样本组合成新的测试样本,再将该新的测试样本送入训练后的BP神经网络模型中进行测试,即可得到待测溶液的TOC浓度值。
其中,第6)步将训练样本输入初始限制波尔兹曼机RBM网络模型中在某一迭代次数下进行训练的具体步骤为,
6a)对于每次迭代,在每小批量数据上,调用CD-k算法,进行k次交替Gibbs采样,本方法只需1次交替Gibbs采样即可保证采集到的样本符合目标分布,具体为:
P ( h j ( 0 ) = 1 | v ( 0 ) ) = 1 1 + exp ( - b j - Σ i = 1 n v w j , i v i ( 0 ) ) - - - ( 1 )
P ( v i ( 1 ) = 1 | h ( 0 ) ) = 1 1 + exp ( - a i - Σ j = 1 n h w j , i h j ( 0 ) ) - - - ( 2 )
其中(1)式表示在已知可见层状态v(0)时采样出隐藏层的第j个单元的状态等于1的概率,v(0)表示可见层的输入状态,即训练样本原始特征向量归一化后的数据,表示可见层第i个单元的状态,表示隐藏层第j个单元的状态,bj表示隐藏层第j个单元的偏置,wj,i表示可见层第i个单元与隐藏层第j个单元的连接权重;
接着,产生[0,1]内的随机数rj,对进行二值化,即若否则,
其中(2)式表示在已知隐藏层状态时采样出可见层各个单元状态以此来代替目标分布,其中,ai表示可见层第i个单元的偏置;
Δw i , j ≈ P ( h i ( 0 ) = 1 | v ( 0 ) ) v j ( 0 ) - P ( h i ( 1 ) = 1 | v ( 1 ) ) v j ( 1 ) - - - ( 3 )
Δa i ≈ v i ( 0 ) - v i ( 1 ) - - - ( 4 )
Δb i ≈ P ( h i ( 0 ) = 1 | v ( 0 ) ) - P ( h i ( 1 ) = 1 | v ( 1 ) ) - - - ( 5 )
利用(3)、(4)、(5)式分别计算每次迭代时目标函数在每小批量数据上关于连接权重W、可见层偏置a、隐藏层偏置b的偏导数;
Δw i , j ( i t e r ) = ρ * Δw i , j ( i t e r - 1 ) + η W * ( Δw i , j ( i t e r ) / n b l o c k - λ * Δw i , j ( i t e r - 1 ) ) - - - ( 6 )
Δa i ( i t e r ) = ρ * Δa i ( i t e r - 1 ) + η v b * ( Δa i ( i t e r ) / n b l o c k ) - - - ( 7 )
Δb i ( i t e r ) = ρ * Δb i ( i t e r - 1 ) + η h b * ( Δb i ( i t e r ) / n b l o c k ) - - - ( 8 )
本方法采用(6)、(7)、(8)式更新当前迭代(iter≥1)每小批量数据上的平均偏导数,其中nblock为小批量数据的数目,ρ为动量学习率,本方法中,当每次迭代次数大于30次时,ρ=ρfinal=0.9,否则,ρ=ρini=0.5;
6b)利用梯度上升法更新RBM参数θ=(W,a,b),具体为:
W(iter)=W(iter-1)+ΔW(iter) (9)
a(iter)=a(iter-1)+Δa(iter) (10)
b(iter)=b(iter-1)+Δb(iter) (11)
按上式更新当前迭代每小批量数据上的连接权重、可见层偏置和隐藏层偏置。
步骤6)中对比散度算法的具体步骤如下:
第1步,将待训练样本输入到受限波尔兹曼机可见层的第一层,得到受限波尔兹曼机可见层的第一层输出;
第2步,按照下式,采样得到受限波尔兹曼机RBM隐藏层的第一层输出:
h 1 n ~ P ( h 1 n = 1 | v 1 ) = 1 1 + e - ( Σ n = 1 N w 1 n × v 1 ) + b 1 n - - - ( 12 )
其中,h1n表示受限波尔兹曼机RBM隐藏层的第一层中第n个节点的输出,n表示限波尔兹曼机RBM隐藏层的第一层中第n个节点,~表示采样操作,P(h1n=1|v1)表示受限波尔兹曼机RBM可见层的第一层输出为v1时受限波尔兹曼机RBM隐藏层的第一层中第n个节点输出为1的几率,v1表示受限波尔兹曼机RBM可见层的第一层输出,e表示欧拉常数,∑表示求和操作,N表示受限波尔兹曼机RBM隐藏层的第一层的节点总数,w1n表示连接受限波尔兹曼机RBM隐藏层的第一层中第n个节点与受限波尔兹曼机RBM可见层的第一层的权值,b1n表示受限波尔兹曼机RBM隐藏层的第一层中第n个节点的偏置向量;
第3步,按照下式,采样得到受限波尔兹曼机RBM可见层的第二层输出:
v 2 m ~ P ( v 2 m = 1 | h 1 ) = 1 1 + e - ( Σ m = 1 M w 2 m × h 1 ) + a 2 m - - - ( 13 )
其中,v2m表示受限波尔兹曼机RBM可见层的第二层中第m个节点的输出,m表示受限波尔兹曼机RBM可见层的第二层中第m个节点,~表示采样操作,P(v2m=1|h1)表示受限波尔兹曼机RBM隐藏层的第一层输出为h1时受限波尔兹曼机RBM可见层的第二层中第m个节点输出为1的几率,h1表示受限波尔兹曼机RBM隐藏层的第一层输出,e表示欧拉常数,∑表示求和操作,M表示受限波尔兹曼机RBM可见层的第二层的节点总数,w2m表示受限波尔兹曼机RBM连接可见层的第二层中第m个节点与受限波尔兹曼机RBM隐藏层的第一层的权值,a2m表示受限波尔兹曼机RBM可见层的第二层中第m个节点的偏置向量;
第4步,按照下式,采样得到受限波尔兹曼机RBM隐藏层的第二层输出:
h 2 n ~ P ( h 2 n = 1 | v 2 ) = 1 1 + e - ( Σ n = 1 N w 2 n × v 2 ) + b 2 n - - - ( 14 )
其中,h2n表示受限波尔兹曼机RBM隐藏层的第二层中第n个节点的输出,n表示受限波尔兹曼机RBM隐藏层的第二层中第n个节点,~表示采样操作,P(h2n=1|v2)表示受限波尔兹曼机RBM可见层的第二层输出为v2时受限波尔兹曼机隐藏层的第二层中第n个节点输出为1的几率,v2表示受限波尔兹曼机RBM可见层的第二层输出,e表示欧拉常数,∑表示求和操作,N表示受限波尔兹曼机RBM隐藏层的第二层的节点总数,w2n表示连接受限波尔兹曼机RBM隐藏层的第二层中第n个节点与受限波尔兹曼机RBM可见层的第二层的权值,b2n表示受限波尔兹曼机RBM隐藏层的第二层中第n个节点的偏置向量;
第5步,按照下式,更新受限波尔兹曼机RBM的权重:
wt+1=wt+(P(h1=1|v1)×v1)-(P(h2=1|v2)×v2) (15)
其中,wt+1表示第t+1次更新后受限波尔兹曼机RBM的权重,wt表示第t次更新后受限波尔兹曼机RBM的权重,P(h1=1|v1)表示受限波尔兹曼机RBM可见层的第一层输出为v1时受限波尔兹曼机隐藏层的第一层输出为1的几率,h1表示受限波尔兹曼机RBM隐藏层的第一层输出,v1表示受限波尔兹曼机RBM可见层的第一层输出,(×)表示内积操作,P(h2=1|v2)表示受限波尔兹曼机RBM可见层的第二层输出为v2时受限波尔兹曼机RBM隐藏层的第二层输出为1的几率,h2表示受限波尔兹曼机RBM隐藏层的第二层输出,v2表示受限波尔兹曼机RBM可见层的第二层输出;
第6步,按照下式,更新受限波尔兹曼机RBM可见层的偏置向量:
at+1=at+v1-v2 (16)
其中,at+1表示第t+1次更新后受限波尔兹曼机RBM可见层的偏置向量,at表示第t次更新后受限波尔兹曼机RBM可见层的偏置向量,v1表示受限波尔兹曼机RBM可见层的第一层输出,v2表示受限波尔兹曼机RBM可见层的第二层输出;
第7步,按照下式,更新受限波尔兹曼机RBM隐藏层的偏置向量:
bt+1=bt+P(h1=1|v1)-P(h2=1|v2) (17)
其中,bt+1表示第t+1次更新后受限波尔兹曼机RBM隐藏层的偏置向量,bt表示第t次更新后受限波尔兹曼机RBM隐藏层的偏置向量,P(h1=1|v1)表示受限波尔兹曼机RBM可见层的第一层输出为v1时受限波尔兹曼机隐藏层的第一层输出为1的几率,h1表示受限波尔兹曼机RBM隐藏层的第一层输出,v1表示受限波尔兹曼机RBM可见层的第一层输出,P(h2=1|v2)表示受限波尔兹曼机可见层的第二层输出为v2时受限波尔兹曼机RBM隐藏层的第二层输出为1的几率,h2表示受限波尔兹曼机RBM隐藏层的第二层输出,v2表示受限波尔兹曼机RBM可见层的第二层输出;
第8步,判断受限波尔兹曼机的训练周期是否达到300秒,若是,停止更新受限波尔兹曼机RBM的权值、可见层的偏置向量和隐藏层的偏置向量,得到训练完成的受限波尔兹曼机,否则,重复执行第2步-第7步,直到受限波尔兹曼机的训练周期达到300秒。
本发明针对数据本身所具有的本质特征进行分析,抛开现有直接线性拟合技术的弊端,直接对预处理后的数据进行受限玻尔兹曼机RBM特征提取,通过BP神经网络构建模型,进而利用待测TOC溶液采得的吸收光谱数据输入数学模型得到TOC溶液的浓度。通过几个实例进行的反演结果如图6所示,其中‘+’代表标液浓度,‘o’代表10种浓度每种浓度90组数据的反演结果(此时标液浓度已被反演出来的浓度覆盖),二者吻合性越好,说明反演结果越好。
图6反演浓度的具体结果与误差百分比见表2所示:
单位:mg/L
与表1对比可知,该反演结果和标准TOC溶液浓度基本一致,且该模型较传统算法而言,在计算精度上有了大幅度地提升,尤其是高浓度TOC溶液结果精度非常高。图7是反演结果与标准TOC浓度误差示意图。
为了更好地说明本发明涉及的基于RBM回归的TOC溶液浓度反演方法,利用紫外光谱仪所采集的吸收光谱数据进行实验,以检测TOC溶液的浓度。本发明的实现流程如图8所示,具体实施方案按以下步骤进行:
1)训练样本数据读入:读入紫外光谱仪采集的不同浓度的吸收光谱数据和暗光谱数据,对吸收光谱数据进行预处理之后,根据朗伯比尔定律计算得出吸光度数据;
2)受限玻尔兹曼机RBM特征提取:利用受限玻尔兹曼机RBM对不同浓度的吸光度数据分别进行特征提取,提取主成分;
3)利用提取的主成分和对应的标准TOC溶液浓度,将数据送入BP神经网络中进行训练,构建反演模型;
4)将测试样本依次经过步骤1)和步骤2)处理后,再送入步骤3)构建的模型中,即可得到待测试TOC溶液浓度反演结果。
最后需要说明的是,本发明的上述实例仅仅是为说明本发明所作的举例,而并非是对本发明的实施方式的限定。尽管申请人参照较佳实施例对本发明进行了详细说明,对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其他不同形式的变化和变动。这里无法对所有的实施方式予以穷举。凡是属于本发明的技术方案所引申出的显而易见的变化或变动仍处于本发明的保护范围之列。

Claims (3)

1.基于RBM回归的水质TOC浓度分析方法,其特征在于:步骤如下,
1)训练样本光谱数据采集:通过光谱仪分别采集光源发出的光通过不同已知浓度的TOC溶液时的光谱数据,得到每种浓度TOC溶液对应的吸收光谱数据;每种浓度TOC溶液的吸收光谱数据进行同样次数的多次采集,使每种浓度TOC溶液对应着一组包含着其浓度特征信息的高维数据;
2)吸收光谱数据预处理:将步骤1)采集的所有吸收光谱数据对应减去各自包含的暗光谱,得到预处理后的光谱数据;
3)特征波段选取:将预处理后的光谱数据选择特征比较明显的波段进行分析,得到特征波段;
4)吸光度的计算:根据朗伯比尔定律分别计算出所选特征波段光谱数据的吸光度;
5)RBM参数初始化:初始化限制波尔兹曼机RBM(Restricted Boltzmann Machine)的相关参数,得到初始限制波尔兹曼机RBM网络模型;
6)RBM模型构建:将步骤4)计算得到的所有吸光度值作为训练样本输入初始限制波尔兹曼机RBM网络模型中在某一迭代次数下进行训练,利用对比散度算法,得到该迭代次数对应的训练后的受限波尔兹曼机RBM,同时得到该迭代次数对应的降低了维度的重构后的训练样本;
7)改变迭代次数,重复步骤6),得到不同迭代次数下对应的训练后的受限波尔兹曼机RBM和不同迭代次数对应的降低了维度的重构后的训练样本;
8)将所有迭代次数下对应的降低了维度的重构后的训练样本组合成新的训练样本送入BP神经网络模型中进行训练,得到训练后的BP神经网络模型;
9)测试样本光谱数据采集:通过光谱仪多次采集光源发出的光通过待测浓度TOC溶液时的吸收光谱数据,得到待测浓度TOC溶液对应着的一组包含着其TOC浓度特征信息的高维数据;
10)将测试样本光谱数据依次按步骤2)、步骤3)和步骤4)进行处理,得到每个测试样本光谱数据对应的吸光度值;
11)将步骤10)得到的所有吸光度值作为测试样本分别输入步骤7)得到的所有训练后的受限波尔兹曼机RBM中并分别按训练后的受限波尔兹曼机RBM对应的迭代次数进行训练,得到不同迭代次数对应的降低了维度的重构后的测试样本;
12)将所有迭代次数下对应的降低了维度的重构后的测试样本组合成新的测试样本,再将该新的测试样本送入训练后的BP神经网络模型中进行测试,即可得到待测溶液的TOC浓度值。
2.根据权利要求1所述的基于RBM回归的水质TOC浓度分析方法,其特征在于:第6)步将训练样本输入初始限制波尔兹曼机RBM网络模型中在某一迭代次数下进行训练的具体步骤为,
6a)对于每次迭代,在每小批量数据上,调用CD-k算法,进行k次交替Gibbs采样,本方法只需1次交替Gibbs采样即可保证采集到的样本符合目标分布,具体为:
P ( h j ( 0 ) = 1 | v ( 0 ) ) = 1 1 + exp ( - b j - Σ i = 1 n v w j , i v i ( 0 ) ) - - - ( 1 )
P ( v i ( 1 ) = 1 | h ( 0 ) ) = 1 1 + exp ( - a i - Σ j = 1 n h w j , i h j ( 0 ) ) - - - ( 2 )
其中(1)式表示在已知可见层状态v(0)时采样出隐藏层的第j个单元的状态等于1的概率,v(0)表示可见层的输入状态,即训练样本原始特征向量归一化后的数据,表示可见层第i个单元的状态,表示隐藏层第j个单元的状态,bj表示隐藏层第j个单元的偏置,wj,i表示可见层第i个单元与隐藏层第j个单元的连接权重;
接着,产生[0,1]内的随机数rj,对进行二值化,即若否则,
其中(2)式表示在已知隐藏层状态时采样出可见层各个单元状态以此来代替目标分布,其中,ai表示可见层第i个单元的偏置;
Δw i , j ≈ P ( h i ( 0 ) = 1 | v ( 0 ) ) v j ( 0 ) - P ( h i ( 1 ) = 1 | v ( 1 ) ) v j ( 1 ) - - - ( 3 )
Δa i ≈ v i ( 0 ) - v i ( 1 ) - - - ( 4 )
Δb i ≈ P ( h i ( 0 ) = 1 | v ( 0 ) ) - P ( h i ( 1 ) = 1 | v ( 1 ) ) - - - ( 5 )
利用(3)、(4)、(5)式分别计算每次迭代时目标函数在每小批量数据上关于连接权重W、可见层偏置a、隐藏层偏置b的偏导数;
Δw i , j ( i t e r ) = ρ * Δw i , j ( i t e r - 1 ) + η W * ( Δw i , j ( i t e r ) / n b l o c k - λ * Δw i , j ( i t e r - 1 ) ) - - - ( 6 )
Δa i ( i t e r ) = ρ * Δa i ( i t e r - 1 ) + η v b * ( Δa i ( i t e r ) / n b l o c k ) - - - ( 7 )
Δb i ( i t e r ) = ρ * Δb i ( i t e r - 1 ) + η h b * ( Δb i ( i t e r ) / n b l o c k ) - - - ( 8 )
本方法采用(6)、(7)、(8)式更新当前迭代(iter≥1)每小批量数据上的平均偏导数,其中nblock为小批量数据的数目,ρ为动量学习率,本方法中,当每次迭代次数大于30次时,ρ=ρfinal=0.9,否则,ρ=ρini=0.5;
6b)利用梯度上升法更新RBM参数θ=(W,a,b),具体为:
W(iter)=W(iter-1)+ΔW(iter) (9)
a(iter)=a(iter-1)+Δa(iter) (10)
b(iter)=b(iter-1)+Δb(iter) (11)
按上式更新当前迭代每小批量数据上的连接权重、可见层偏置和隐藏层偏置。
3.根据权利要求1所述的基于RBM回归的水质TOC浓度分析方法,其特征在于:步骤6)中对比散度算法的具体步骤如下:
第1步,将待训练样本输入到受限波尔兹曼机可见层的第一层,得到受限波尔兹曼机可见层的第一层输出;
第2步,按照下式,采样得到受限波尔兹曼机RBM隐藏层的第一层输出:
h 1 n ~ P ( h 1 n = 1 | v 1 ) = 1 1 + e - ( Σ n = 1 N w 1 n × v 1 ) + b 1 n - - - ( 12 )
其中,h1n表示受限波尔兹曼机RBM隐藏层的第一层中第n个节点的输出,n表示限波尔兹曼机RBM隐藏层的第一层中第n个节点,~表示采样操作,P(h1n=1|v1)表示受限波尔兹曼机RBM可见层的第一层输出为v1时受限波尔兹曼机RBM隐藏层的第一层中第n个节点输出为1的几率,v1表示受限波尔兹曼机RBM可见层的第一层输出,e表示欧拉常数,∑表示求和操作,N表示受限波尔兹曼机RBM隐藏层的第一层的节点总数,w1n表示连接受限波尔兹曼机RBM隐藏层的第一层中第n个节点与受限波尔兹曼机RBM可见层的第一层的权值,b1n表示受限波尔兹曼机RBM隐藏层的第一层中第n个节点的偏置向量;
第3步,按照下式,采样得到受限波尔兹曼机RBM可见层的第二层输出:
v 2 m ~ P ( v 2 m = 1 | h 1 ) = 1 1 + e - ( Σ m = 1 M w 2 m × h 1 ) + a 2 m - - - ( 13 )
其中,v2m表示受限波尔兹曼机RBM可见层的第二层中第m个节点的输出,m表示受限波尔兹曼机RBM可见层的第二层中第m个节点,~表示采样操作,P(v2m=1|h1)表示受限波尔兹曼机RBM隐藏层的第一层输出为h1时受限波尔兹曼机RBM可见层的第二层中第m个节点输出为1的几率,h1表示受限波尔兹曼机RBM隐藏层的第一层输出,e表示欧拉常数,∑表示求和操作,M表示受限波尔兹曼机RBM可见层的第二层的节点总数,w2m表示受限波尔兹曼机RBM连接可见层的第二层中第m个节点与受限波尔兹曼机RBM隐藏层的第一层的权值,a2m表示受限波尔兹曼机RBM可见层的第二层中第m个节点的偏置向量;
第4步,按照下式,采样得到受限波尔兹曼机RBM隐藏层的第二层输出:
h 2 n ~ P ( h 2 n = 1 | v 2 ) = 1 1 + e - ( Σ n = 1 N w 2 n × v 2 ) + b 2 n - - - ( 14 )
其中,h2n表示受限波尔兹曼机RBM隐藏层的第二层中第n个节点的输出,n表示受限波尔兹曼机RBM隐藏层的第二层中第n个节点,~表示采样操作,P(h2n=1|v2)表示受限波尔兹曼机RBM可见层的第二层输出为v2时受限波尔兹曼机隐藏层的第二层中第n个节点输出为1的几率,v2表示受限波尔兹曼机RBM可见层的第二层输出,e表示欧拉常数,∑表示求和操作,N表示受限波尔兹曼机RBM隐藏层的第二层的节点总数,w2n表示连接受限波尔兹曼机RBM隐藏层的第二层中第n个节点与受限波尔兹曼机RBM可见层的第二层的权值,b2n表示受限波尔兹曼机RBM隐藏层的第二层中第n个节点的偏置向量;
第5步,按照下式,更新受限波尔兹曼机RBM的权重:
wt+1=wt+(P(h1=1|v1)×v1)-(P(h2=1|v2)×v2) (15)
其中,wt+1表示第t+1次更新后受限波尔兹曼机RBM的权重,wt表示第t次更新后受限波尔兹曼机RBM的权重,P(h1=1|v1)表示受限波尔兹曼机RBM可见层的第一层输出为v1时受限波尔兹曼机隐藏层的第一层输出为1的几率,h1表示受限波尔兹曼机RBM隐藏层的第一层输出,v1表示受限波尔兹曼机RBM可见层的第一层输出,(×)表示内积操作,P(h2=1|v2)表示受限波尔兹曼机RBM可见层的第二层输出为v2时受限波尔兹曼机RBM隐藏层的第二层输出为1的几率,h2表示受限波尔兹曼机RBM隐藏层的第二层输出,v2表示受限波尔兹曼机RBM可见层的第二层输出;
第6步,按照下式,更新受限波尔兹曼机RBM可见层的偏置向量:
at+1=at+v1-v2 (16)
其中,at+1表示第t+1次更新后受限波尔兹曼机RBM可见层的偏置向量,at表示第t次更新后受限波尔兹曼机RBM可见层的偏置向量,v1表示受限波尔兹曼机RBM可见层的第一层输出,v2表示受限波尔兹曼机RBM可见层的第二层输出;
第7步,按照下式,更新受限波尔兹曼机RBM隐藏层的偏置向量:
bt+1=bt+P(h1=1|v1)-P(h2=1|v2) (17)
其中,bt+1表示第t+1次更新后受限波尔兹曼机RBM隐藏层的偏置向量,bt表示第t次更新后受限波尔兹曼机RBM隐藏层的偏置向量,P(h1=1|v1)表示受限波尔兹曼机RBM可见层的第一层输出为v1时受限波尔兹曼机隐藏层的第一层输出为1的几率,h1表示受限波尔兹曼机RBM隐藏层的第一层输出,v1表示受限波尔兹曼机RBM可见层的第一层输出,P(h2=1|v2)表示受限波尔兹曼机可见层的第二层输出为v2时受限波尔兹曼机RBM隐藏层的第二层输出为1的几率,h2表示受限波尔兹曼机RBM隐藏层的第二层输出,v2表示受限波尔兹曼机RBM可见层的第二层输出;
第8步,判断受限波尔兹曼机的训练周期是否达到300秒,若是,停止更新受限波尔兹曼机RBM的权值、可见层的偏置向量和隐藏层的偏置向量,得到训练完成的受限波尔兹曼机,否则,重复执行第2步-第7步,直到受限波尔兹曼机的训练周期达到300秒。
CN201610228307.6A 2016-04-11 2016-04-11 基于rbm回归的水质toc浓度分析方法 Expired - Fee Related CN105911003B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610228307.6A CN105911003B (zh) 2016-04-11 2016-04-11 基于rbm回归的水质toc浓度分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610228307.6A CN105911003B (zh) 2016-04-11 2016-04-11 基于rbm回归的水质toc浓度分析方法

Publications (2)

Publication Number Publication Date
CN105911003A true CN105911003A (zh) 2016-08-31
CN105911003B CN105911003B (zh) 2018-08-17

Family

ID=56746770

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610228307.6A Expired - Fee Related CN105911003B (zh) 2016-04-11 2016-04-11 基于rbm回归的水质toc浓度分析方法

Country Status (1)

Country Link
CN (1) CN105911003B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107044976A (zh) * 2017-05-10 2017-08-15 中国科学院合肥物质科学研究院 基于libs与堆叠式rbm深度学习技术的土壤重金属含量分析预测方法
CN109596545A (zh) * 2018-12-03 2019-04-09 北京英视睿达科技有限公司 全光谱水质监测设备质控方法
CN110567905A (zh) * 2019-09-04 2019-12-13 湖南匡楚科技有限公司 一种水质检测方法及装置
CN111678869A (zh) * 2020-05-29 2020-09-18 山东省科学院海洋仪器仪表研究所 水质生态参数检测装置及检测方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100228694A1 (en) * 2009-03-09 2010-09-09 Microsoft Corporation Data Processing Using Restricted Boltzmann Machines
CN102047097A (zh) * 2008-06-17 2011-05-04 株式会社岛津制作所 水质分析仪
CN102042963A (zh) * 2010-10-14 2011-05-04 长春理工大学 紫外光谱法污水总有机碳(toc)在线检测仪
CN103792246A (zh) * 2014-02-20 2014-05-14 北京农业质量标准与检测技术研究中心 一种基于lm-bp神经网络的x射线荧光光谱定量分析方法
CN103940767B (zh) * 2014-05-07 2016-01-13 重庆大学 基于多流形学习的气体浓度反演方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102047097A (zh) * 2008-06-17 2011-05-04 株式会社岛津制作所 水质分析仪
US20100228694A1 (en) * 2009-03-09 2010-09-09 Microsoft Corporation Data Processing Using Restricted Boltzmann Machines
CN102042963A (zh) * 2010-10-14 2011-05-04 长春理工大学 紫外光谱法污水总有机碳(toc)在线检测仪
CN103792246A (zh) * 2014-02-20 2014-05-14 北京农业质量标准与检测技术研究中心 一种基于lm-bp神经网络的x射线荧光光谱定量分析方法
CN103940767B (zh) * 2014-05-07 2016-01-13 重庆大学 基于多流形学习的气体浓度反演方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
SOLANKI A,ET.AL: "Predictive Analysis of Water Quality Parameters using Deep Learning", 《INTERNATIONAL JOURNAL OF COMPUTER APPLICATIONS》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107044976A (zh) * 2017-05-10 2017-08-15 中国科学院合肥物质科学研究院 基于libs与堆叠式rbm深度学习技术的土壤重金属含量分析预测方法
CN109596545A (zh) * 2018-12-03 2019-04-09 北京英视睿达科技有限公司 全光谱水质监测设备质控方法
CN109596545B (zh) * 2018-12-03 2023-12-08 北京英视睿达科技股份有限公司 全光谱水质监测设备质控方法
CN110567905A (zh) * 2019-09-04 2019-12-13 湖南匡楚科技有限公司 一种水质检测方法及装置
CN110567905B (zh) * 2019-09-04 2023-12-29 怀化水直达山泉饮用水有限公司 一种水质检测方法及装置
CN111678869A (zh) * 2020-05-29 2020-09-18 山东省科学院海洋仪器仪表研究所 水质生态参数检测装置及检测方法

Also Published As

Publication number Publication date
CN105911003B (zh) 2018-08-17

Similar Documents

Publication Publication Date Title
WO2020133944A1 (zh) 水质指标预测模型构建方法及水质指标监测方法
CN103983595B (zh) 一种基于紫外-可见光谱处理的水质浊度解算方法
CN103712939B (zh) 一种基于紫外可见光谱的污染物浓度拟合方法
CN105911003A (zh) 基于rbm回归的水质toc浓度分析方法
Edwards et al. Determination of nitrate in water containing dissolved organic carbon by ultraviolet spectroscopy
CN112881353B (zh) 一种测定水体中溶解性有机碳浓度的方法和装置
CN100514060C (zh) 水体化学需氧量在线虚拟监测方法
CN111157476B (zh) 一种水质多参数紫外可见吸收光谱定量化反演方法
CN110057761A (zh) 一种全光谱结合快速易测指标的水质在线监测系统与方法
Kwak et al. Estimation of biochemical oxygen demand based on dissolved organic carbon, UV absorption, and fluorescence measurements
CN113916847A (zh) 一种基于光谱技术和线性支持向量算法的水质检测方法
CN113049512A (zh) 基于全波长紫外可见吸收光谱的水质在线监测方法
Li et al. Assessing the potential to use CDOM as an indicator of water quality for the sediment-laden Yellow river, China
CN106918565A (zh) 基于室内标样高光谱特征的土壤重金属Cd含量反演建模及其光谱响应特征波段识别方法
CN106442441A (zh) 基于荧光光谱积分比值判定有色可溶性有机物来源的方法
CN105158175A (zh) 一种采用透射光谱鉴别水中细菌的方法
Li et al. Global calibration model of UV-Vis spectroscopy for COD estimation in the effluent of rural sewage treatment facilities
Zhu et al. Online recognition of drainage type based on UV-vis spectra and derivative neural network algorithm
JP3780646B2 (ja) 下水中の複数成分定量方法とその装置
Kim et al. Determination of organic compounds in water using ultraviolet LED
CN106675555B (zh) 一种硼掺杂碳基荧光纳米材料及其制备方法和应用
Moufid et al. Pollution parameters evaluation of wastewater collected at different treatment stages from wastewater treatment plant based on E-nose and E-tongue systems combined with chemometric techniques
CN108507955A (zh) 多光谱同步检测水体化学需氧量的装置及方法
Liu et al. Tracing sources of oilfield wastewater based on excitation-emission matrix fluorescence spectroscopy coupled with chemical pattern recognition techniques
Kim et al. Recent advances in illicit drug detection sensor technology in water

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20180817

Termination date: 20190411

CF01 Termination of patent right due to non-payment of annual fee