CN115561282A - 一种地下水重金属的检测方法及系统 - Google Patents
一种地下水重金属的检测方法及系统 Download PDFInfo
- Publication number
- CN115561282A CN115561282A CN202211185565.2A CN202211185565A CN115561282A CN 115561282 A CN115561282 A CN 115561282A CN 202211185565 A CN202211185565 A CN 202211185565A CN 115561282 A CN115561282 A CN 115561282A
- Authority
- CN
- China
- Prior art keywords
- data
- underground water
- current
- heavy metal
- candidate solution
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N27/00—Investigating or analysing materials by the use of electric, electrochemical, or magnetic means
- G01N27/02—Investigating or analysing materials by the use of electric, electrochemical, or magnetic means by investigating impedance
- G01N27/04—Investigating or analysing materials by the use of electric, electrochemical, or magnetic means by investigating impedance by investigating resistance
- G01N27/06—Investigating or analysing materials by the use of electric, electrochemical, or magnetic means by investigating impedance by investigating resistance of a liquid
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N27/00—Investigating or analysing materials by the use of electric, electrochemical, or magnetic means
- G01N27/26—Investigating or analysing materials by the use of electric, electrochemical, or magnetic means by investigating electrochemical variables; by using electrolysis or electrophoresis
- G01N27/416—Systems
- G01N27/48—Systems using polarography, i.e. measuring changes in current under a slowly-varying voltage
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/18—Water
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/004—Artificial life, i.e. computing arrangements simulating life
- G06N3/006—Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Analytical Chemistry (AREA)
- Pathology (AREA)
- Immunology (AREA)
- Biochemistry (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Computational Mathematics (AREA)
- Pure & Applied Mathematics (AREA)
- Electrochemistry (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Bioinformatics & Computational Biology (AREA)
- Medicinal Chemistry (AREA)
- Operations Research (AREA)
- Algebra (AREA)
- Evolutionary Biology (AREA)
- Databases & Information Systems (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Probability & Statistics with Applications (AREA)
- Food Science & Technology (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Geophysics And Detection Of Objects (AREA)
Abstract
本发明涉及一种地下水重金属的检测方法及系统,方法包括:对ASV检测装置进行参数设置;采集地下水样品,使用ASV检测装置对地下水样品进行检测,获取地下水样品的环境因子数据,获取地下水样品中待测典型重金属元素的电流溶出峰数据;对电流溶出峰数据进行预处理校正,包括一次基底扣除、平滑降噪和二次基底扣除;以环境因子数据和预处理校正后的电流溶出峰数据作为输入,使用训练好的机器学习模型进行重金属检测数据的校正和补偿,得到校正后的地下水重金属浓度测量结果。与现有技术相比,本发明进行了数据的降噪和基底扣除,并校正环境因子对典型重金属检测结果的影响,保证地下水典型重金属检测结果更加贴近地下水实际情况,保证高精度检测。
Description
技术领域
本发明涉及地下水重金属检测技术领域,尤其是涉及一种地下水重金属的检测方法及系统。
背景技术
当前我国场地地下水重金属污染形势日趋严峻。国家生态环境部在2019年3月出台的《地下水污染防治实施方案》中明确提出“建立地下水环境监测体系”是当下紧迫任务之一。然而,目前国内外市场尚缺乏便携式高精度原位检测地下水重金属的技术装备和方法,这一技术短板严重制约了我国地下水污染防治相关工作的开展。
阳极溶出伏安法(Anodic Stripping Voltametry,ASV)是最有望解决上述难题的技术方法之一。但现有在售ASV地下水重金属检测设备多采用标准比较法进行分析,即首先对空白样和特定浓度标准样品进行分析,用于定标;然后使用已经定标完成的ASV检测设备直接对采集到地面的多个地下水样品进行分析。但上述方法仅能实现地下水中重金属的初步检测,其主要原因为:(1)采用的标准样品与实际地下水样品之间基底不同,特别是地下水环境因子差距过大,而典型重金属离子的溶出峰电流强度不仅受离子强度影响,还受环境因子影响,而在众多环境因子中,pH、电导率、氧化还原电位、温度和浊度是影响的最大;(2)根据地球水文化学研究结果表明,地下水中典型重金属离子在不同的环境因子下其形态会发生转变,从而影响其真实的检测结果。
因此,需要结合智能算法对环境因子的进行校正补偿,进而提高ASV对典型重金属离子检测准确度。
发明内容
本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种地下水重金属的检测方法及系统,进行了数据的降噪和基底扣除,获取纯净的电流溶出峰数据,并通过支持向量机模型校正了环境因子对典型重金属检测结果的影响,可以保证地下水典型重金属检测结果更加贴近地下水实际情况,保证高精度检测,实现原位定量检测。
本发明的目的可以通过以下技术方案来实现:
一种地下水重金属的检测方法,包括以下步骤:
S1、对ASV检测装置进行参数设置;
S2、采集地下水样品,使用ASV检测装置对地下水样品进行检测,获取地下水样品的环境因子数据,获取地下水样品中待测典型重金属元素的电流溶出峰数据;
S3、对电流溶出峰数据进行预处理校正,包括一次基底扣除、平滑降噪和二次基底扣除;
S4、以环境因子数据和预处理校正后的电流溶出峰数据作为输入,使用训练好的机器学习模型进行重金属检测数据的校正和补偿,得到校正后的地下水重金属浓度测量结果。
进一步地,步骤S1中,ASV检测装置采用差分脉冲溶出伏安法进行分析,需要设置的参数包括:富集时间、富集电压、起始电压、终止电压、脉冲周期、振幅、采样频率。
进一步地,步骤S2中,利用ASV检测装置上搭载的传感器测量得到地下水样品的环境因子数据,包括温度、电导率、氧化还原电位、浊度和PH。
进一步地,步骤S3中,一次和二次基底扣除方法采用惩罚最小二乘法,如下:
步骤1、初始化参数,包括最大迭代次数、平滑参数λ和权重系数W,所述权重系数W的基本形式为:W=diag(w1,w2,w3,…,wN0,其中,N为电流溶出峰数据y的长度;
步骤2、将初始权重W和其他参数代入下式,进行惩罚最小二乘拟合基线数据,如下:
z=(W+λDTD)-1Wy
其中,D为二阶差分矩阵,DT表示二阶差分矩阵的转置矩阵,y表示待测典型重金属元素的电流溶出峰数据,z为基线数据;
步骤3、对权重系数中的wi进行更新,i=1、2、…、N,并计算更新前后权重系数的变化量Γ:
其中,上标k用于标识第k次迭代,norm()函数用于求范数;
步骤4、若Γ小于预设置的变化阈值,则迭代结束,输出此次迭代时的基线数据为最优基线,并输出扣除了最优基线的电流溶出峰数据y′,y′=y-z,否则,以更新后的权重系数重复步骤2~4。
进一步地,步骤S3中,平滑降噪采用参数自适应选择的窗口移动多项式拟合法,如下:
步骤a、对于经一次基底扣除的电流溶出峰数据,提取噪声数据、峰宽与峰高,其中,峰宽width为溶出峰宽度,峰高A为溶出峰高度,噪声数据Noisy为:
Noisy=(y′i+1-y′i)/2
y′表示经一次基底扣除的电流溶出峰数据,i=1、2、…、N,B为电流溶出峰数据的长度;
步骤b、根据噪声数据、峰宽与峰高,采用高斯函数生产一组不含噪声的仿真信号,仿真信号如下:
式中,E为电位,Ec为峰电位,Ec可根据峰高位置确定;
步骤c、采用窗口移动多项式拟合迭代算法对仿真信号进行处理,确定窗口宽度和多项式阶次;
步骤d、使用步骤c确定的窗口宽度和多项式阶次对经一次基底扣除的电流溶出峰数据进行窗口移动多项式拟合降噪平滑。
进一步地,步骤c中,采用窗口移动多项式拟合迭代算法对电流数据进行处理具体如下:
step1、初始化窗口宽度和多项式阶次,设置宽度搜索步长和终止宽度,设置阶次搜索步长和终止阶次,建立搜索网格,所述搜索网格中的一格元素为窗口宽度+多项式阶次组合;
step2、选择搜索网格中的一格元素,确定当前的窗口宽度和多项式阶次,采用当前的窗口宽度和多项式阶次对仿真信号电流数据进行处理,在窗口内进行多项式拟合,保留中心点数据,并替代窗口内的原数据,依次遍历整个仿真信号,计算当前的窗口宽度和多项式阶次所对应的信噪比;
step3、重复步骤step2,直至完成所有窗口宽度+多项式阶次组合的信噪比计算,找到使信噪比最大的窗口宽度+多项式阶次组合并输出。
进一步地,步骤S4中,给定训练样本集{(x1,q1),…,(xm,qm),…,xM,qM)},所述机器学习模型为支持向量机模型,支持向量机回归模型的表示如下:
f(x)=ωTx+b
其中,x表示输入支持向量机的数据,即环境因子数据和预处理校正后的电流溶出峰数据,q表示地下水重金属浓度值,M表示训练样本集中的样本数量,f(x)为支持向量机的输出,ω与b为支持向量机模型参数,求解支持向量机回归模型,使得f(xm)尽可能接近qm,问题转化为:
其中,C为惩罚因子,l∈为敏感度损失函数;
将上述问题转化为朗格朗日函数对偶法求解,问题解如下:
K(xm,x)=exp(-||x-xm||2/2p2)
其中,p为核函数。
进一步地,支持向量机模型的惩罚因子和核参数采用爬行动物搜索算法确定,如下:
步骤①:初始化阶段,初始化每个候选解群的初始位置,候选解群包括多个候选解,单个候选解的位置分别对应惩罚因子和核参数,设置最大迭代次数及候选解各个维度位置的上限与下限,初始化公式如下:
Zi,j(0)=rand×(Zj,max-Zj,min)+Zj,min
Zi,j(0)表示第i个候选解第j维的初始位置,rand为介于(0,1)之间的随机数,Zj,max为第j维位置的上限,Zj,min为第j维位置的下限;
步骤②:计算每个候选解的适应度值,更新各个候选解的个体历史极值,若满足预设置的收敛条件,则执行步骤⑤,否则,执行步骤③;
步骤③:对M(Zi(t))、P(i,j)(t)、η(i,j)(t)、R(i,j)(t)和ES(t)进行更新,更新公式如下:
其中,t表示当前迭代次数,M(Zi(t))表示第t次迭代时第i个候选解的平均位置,Zi(t)为第i个候选解的位置,n为候选解位置的维度个数;
其中,P(i,j)(t)表示第t次迭代时最佳解和当前解第j维位置的百分比差异,α为敏感参数,Bestj(t)为候选解群的最佳解的第j维位置,ε为一个较小的常数;
η(i,j)(t)=Bestj(t)×P(i,j)(t)
其中,η(i,j)(t)表示第t次迭代时第i个候选解第j维位置对应的捕猎因子;
其中,R(i,j)(t)表示缩减函数,r2为介于[1,N]的随机整数,N为候选解群中的候选解数目;
ES(t)=2×r3×(1-1/T)
其中,ES(t)表示进化因子,r3为介于(-1,1)之间的随机数,T为设置的最大迭代次数;
步骤④:对候选解群中各个候选解的位置进行更新,重复步骤②,其中。位置更新方式如下:
Zi,j(t+1)=Bestj(t)×η(i,j)×β-R(i,j)(t)×rand′
其中,β为敏感参数,rand′为介于(0,1)的随机数;
Zi,j(t+1)=Bestj(t)×Z(r1,)×ES(t)×rand′
其中r1为介于[1,N]的随机整数,N为候选解群中的候选解数目;
Zi,j(t+1)=Bestj(t)×P(i,j)(t)×rand′
Zi,j(t+1)=Bestj(t)-η(i,j)×ε-R(i,j)(t)×rand′
步骤⑤:将适应度值取得历史极值的候选解作为最优解,该候选解的位置即确定的最优惩罚因子和最优核参数。
进一步地,步骤②中,计算候选解的适应度值具体为:
获取候选解的位置,将对应的惩罚因子和核参数代入支持向量机模型;使用训练样本集对支持向量机模型进行训练;使用预构建的测试集对支持向量机模型进行检测,将均方根误差作为适应度值。
一种地下水重金属的检测系统,包括ASV检测装置、参数设置模块、数据采集模块、数据预处理模块和校正模块;
所述参数设置模块用于对ASV检测装置进行参数设置;
在采集地下水样品,使用ASV检测装置对地下水样品进行检测时,由所述数据采集模块获取地下水样品的环境因子数据和地下水样品中待测典型重金属元素的电流溶出峰数据;
所述数据预处理模块用于对电流溶出峰数据进行预处理校正,包括一次基底扣除、平滑降噪和二次基底扣除;
所述校正模块中搭载有训练好的机器学习模型,所述机器学习模型的输入为环境因子数据和预处理校正后的电流溶出峰数据,输出为校正后的地下水重金属浓度测量结果。
与现有技术相比,本发明具有以下有益效果:
(1)进行了数据的降噪和基底扣除,获取纯净的电流溶出峰数据,并通过支持向量机模型校正了环境因子对典型重金属检测结果的影响,可以保证地下水典型重金属检测结果更加贴近地下水实际情况,保证高精度检测,实现原位定量检测。
(2)采用惩罚最小二乘算法可以有效地对基底即基线进行拟合,形成平滑的基线沿着真实基线底部前进,保证最大程度的扣除基底,获取纯净的特征峰,优于通过拐点进行插值拟合的基底扣除方法。
(3)采用自适应的窗口移动多项式拟合方法进行数据的平滑去噪,该方法可以针对需要处理的数据自适应选择合适的窗口宽度和多项式阶次,保证最大程度的剔除噪声信息,且无需人工参与,智能化程度高。
(4)构建了机器学习算法之一的支持向量机非线性模型对环境因子(pH、温度、电导率、氧化还原电位和浊度)进行校正,有效补偿了环境因子对ASV检测结果的影响,进一步提高了ASV检测的精密度,使得满足现场原位检测同时,获得高精准度的结果,使得检测结果接近真实值,还原真实地下水情况。
(5)支持采用爬行动物搜索算法(RSA算法)对支持向量机惩罚因子和核参数选择进行优化,空间和时间复杂程度低,有效避免了模型训练时时间长,所需要的存储空间大的问题。同时对惩罚因子和核参数的取值进行优化后,可以有效提高模型的预测精度,进而提高ASV检测设备的检测准确度。
(6)应用本申请,使得ASV检测设备无需现场分析空白样与标准样品,简化了ASV分析设备的操作步骤,使得ASV设备可以直接进行未知样品的测定,同时能够有效的消除环境因子对典型重金属离子检测结果的影响。
附图说明
图1为一种地下水重金属的检测方法的流程图。
具体实施方式
下面结合附图和具体实施例对本发明进行详细说明。本实施例以本发明技术方案为前提进行实施,给出了详细的实施方式和具体的操作过程,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例,本发明的保护范围不限于下述的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
此处所称的“一个实施例”或“实施例”是指可包含于本发明至少一个实现方式中的特定特征、结构或特性。在本发明的描述中,需要理解的是,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
本说明书提供了如实施例或流程示意图的方法操作步骤,但基于常规或者无创造性的劳动可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式,不代表唯一的执行顺序。在实际中的系统或服务器产品执行时,可以按照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境)或者调整没有时序限制的步骤的执行顺序。
实施例1:
一种地下水重金属的检测方法,如图1所示,包括以下步骤:
S1、对ASV检测装置进行参数设置;
其中,ASV检测装置采用差分脉冲溶出伏安法进行分析,需要设置的参数包括:富集时间、富集电压、起始电压、终止电压、脉冲周期、振幅、采样频率,ASV检测装置上搭载有传感器。
S2、采集地下水样品,使用ASV检测装置对地下水样品进行检测,获取地下水样品的环境因子数据,获取地下水样品中待测典型重金属元素的电流溶出峰数据;
可以从地下水监测井中采集地下水样本,利用ASV检测装置上搭载的温度传感器、电导率传感器、氧化还原电位传感器、浊度传感器和PH传感器测量得到地下水样品的环境因子数据,包括温度、电导率、氧化还原电位、浊度和PH。
S3、对电流溶出峰数据进行预处理校正,包括一次基底扣除、平滑降噪和二次基底扣除;
当通过ASV检测装置获取了典型重金属的溶出峰电流数据后,使用校正方法对电流数据进行预处理校正,首先进行一次基底扣除,再进行平滑降噪,最后再进行二次基底扣除,最终获得最为纯净的电流强度数据。
(1)一次和二次基底扣除方法采用惩罚最小二乘法,如下:
步骤1、初始化参数,包括最大迭代次数、平滑参数λ和权重系数W,权重系数W的基本形式为:W=diag(w1,w2,w3,…,wN),其中,N为电流溶出峰数据y的长度;本实施例中,最大迭代次数设置为100,平滑参数设置为104,Wk=1=diag(1,1,1,…,1),其中上标k用于标识第k次迭代。
步骤2、将初始权重W和其他参数代入下式,进行惩罚最小二乘拟合基线数据,如下:
z=(W+λDTD)-1Wy
其中,D为二阶差分矩阵,DT表示二阶差分矩阵的转置矩阵,y表示待测典型重金属元素的电流溶出峰数据,z为基线数据;
步骤3、对权重系数中的wi进行更新,i=1、2、…、N,并计算更新前后权重系数的变化量Γ:
其中,上标k用于标识第k次迭代,norm()函数用于求范数;
步骤4、若Γ小于预设置的变化阈值,则迭代结束,输出此次迭代时的基线数据为最优基线,并输出扣除了最优基线的电流溶出峰数据y′,y′=y-z,否则,以更新后的权重系数重复步骤2~4,再次计算基线数据。本实施例中,变化阈值设置为0.001。
(2)平滑降噪采用参数自适应选择的窗口移动多项式拟合法,如下:
步骤a、对于经一次基底扣除的电流溶出峰数据,提取噪声数据、峰宽与峰高,其中,峰宽width为溶出峰宽度,峰高A为溶出峰高度,噪声数据Noisy为:
Noisy=(y′i+1-y′i)/2
y′表示经一次基底扣除的电流溶出峰数据,i=1、2、…、N,B为电流溶出峰数据的长度;
步骤b、根据噪声数据、峰宽与峰高,采用高斯函数生产一组不含噪声的仿真信号,仿真信号如下:
式中,E为电位,Ec为峰电位,Ec可根据峰高位置确定;
步骤c、采用窗口移动多项式拟合迭代算法对仿真信号进行处理,确定窗口宽度和多项式阶次,具体如下:
step1、初始化窗口宽度和多项式阶次,设置宽度搜索步长和终止宽度,设置阶次搜索步长和终止阶次,建立搜索网格,搜索网格中的一格元素为窗口宽度+多项式阶次组合;本实施例中,初始化窗口宽度设置为3,初始化多项式阶次为2,宽度搜索步长设置为2,即窗口宽度以步长2增加,终止宽度设置为21,即窗口宽度最大取值为21,阶次搜索步长设置为1,即阶次以步长1增加,终止阶次的值设置为窗口宽度-1,据此确定的搜索网格中,窗口宽度+多项式阶次的组合有:{3,2};{5,2};{5,3};{5,4};{7,2};{7,3};{7,4};{7,5};{7,6};{9,2};{9,3};…;{21,18};{21,19};{21,20};其他实施方式中,根据根据实际情况调整窗口宽度、多项式阶次的初始值、步长和终止值。
step2、选择搜索网格中的一格元素,确定当前的窗口宽度和多项式阶次,采用当前的窗口宽度和多项式阶次对仿真信号电流数据进行处理,在窗口内进行多项式拟合,保留中心点数据,并替代窗口内的原数据,依次遍历整个仿真信号,计算当前的窗口宽度和多项式阶次所对应的信噪比;
step3、重复步骤step2,直至完成所有窗口宽度+多项式阶次组合的信噪比计算,找到使信噪比最大的窗口宽度+多项式阶次组合;
在算法实现时,可以设置三层循环,第一层按照步长增加窗口宽度,第二层根据当前的窗口宽度确定终止阶次,并按照步长增加多项式阶次,第三层根据窗口宽度和多项式阶次遍历整个仿真信号,得到当前的窗口宽度和多项式阶次所对应的信噪比。循环结束后,找出信噪比最大的窗口宽度+多项式阶次组合即可。
步骤d、使用步骤c确定的窗口宽度和多项式阶次对经一次基底扣除的电流溶出峰数据进行窗口移动多项式拟合降噪平滑。
S4、以环境因子数据和预处理校正后的电流溶出峰数据作为输入,使用训练好的机器学习模型进行重金属检测数据的校正和补偿,得到校正后的地下水重金属浓度测量结果。
步骤S4中,给定训练样本集{(x1,q1),…,(xm,qm),…,(xM,qM)},本申请中使用的机器学习模型为支持向量机模型,支持向量机回归模型的表示如下:
f(x)=ωTx+b
其中,x表示输入支持向量机的数据,即环境因子数据和预处理校正后的电流溶出峰数据,q表示地下水重金属浓度值,M表示训练样本集中的样本数量,f(x)为支持向量机的输出,ω与b为支持向量机模型参数;
希望学到一个回归模型,使得f(xm)尽可能接近qm,ω与b为待确定的参数,问题转化为:
其中,C为惩罚因子,l∈为敏感度损失函数;
将上述问题转化为朗格朗日函数对偶法求解,问题解如下:
K(xm,x)=exp(-||x-xm||2/2p2)
其中,p为RBF函数的核函数。
训练样本集可以通过实验采集,先制备重金属离子浓度已知的样品,确定重金属元素浓度q,然后使用ASV检测装置进行检测,获取地下水样品的环境因子数据和地下水样品中待测典型重金属元素的电流溶出峰数据,将电流溶出峰数据进行预处理校正(一次基底扣除、平滑降噪和二次基底扣除),确定环境因子数据和预处理校正后的电流溶出峰数据x;改变样品的浓度,多次测量和预处理校正,从而得到多组环境因子数据+预处理校正后的电流溶出峰数据+重金属元素浓度值作为训练样本集。
一般,除了训练样本集外,还需要使用测试集、验证集等对支持向量机模型进行测试,验证其准确度。可以同样构建测试集、验证集,先使用训练样本集对支持向量机模型进行训练,再使用测试集、验证集进行评估,直至得到符合要求的支持向量机模型。
可以理解的是,支持向量机的很多参数是根据经验确定或随机设置的,这样迭代更新找到最优的参数组合需要耗费大量的时间和精力,占用大量计算资源。为解决此问题,有人提出,支持向量机参数(惩罚因子和核参数)可以采用网格搜索确定最优参数。但是,网格搜索方法的时间和空间复杂度高,计算量大。因此,本申请中,支持向量机模型的惩罚因子和核参数采用全局寻优算法爬行动物搜索算法(Reptile Search Algorithm,RSA)确定,RSA算法如下:
步骤①:初始化阶段,初始化每个候选解群的初始位置,候选解群包括多个候选解,单个候选解的位置分别对应惩罚因子和核参数,设置最大迭代次数及候选解各个维度位置的上限与下限,初始化公式如下:
Zi,j(0)=rand×(Zj,max-Zj,min)+Zj,min
Zi,j(0)表示第i个候选解第j维的初始位置,本申请中,候选解位置包括2个维度,两个维度的位置分别对应支持向量机模型的惩罚因子和核参数,rand为介于(0,1)之间的随机数,Zj,max为预设置的第j维位置的上限,Zj,min为预设置的第j维位置的下限;
步骤②:计算每个候选解的适应度值,更新各个候选解的个体历史极值,若满足预设置的收敛条件,则执行步骤⑤,否则,执行步骤③;
计算候选解的适应度值具体为:
获取候选解的位置,将对应的惩罚因子和核参数代入支持向量机模型;使用训练样本集对支持向量机模型进行训练;使用预构建的测试集对支持向量机模型进行检测,将总的均方根误差作为适应度值。
收敛条件可以根据需要设置,如达到最大迭代次数,或者出现较优的候选解,即候选解的适应度值低于设定的值,等等。
步骤③:对M(Zi(t))、P(i,j)(t)、η(i,j)(t)、R(i,j)(t)和ES(t)进行更新,更新公式如下:
其中,t表示当前迭代次数,M(Zi(t))表示第t次迭代时第i个候选解的平均位置,Zi(t)为第i个候选解的位置,n为候选解位置的维度个数;
其中,P(i,j)(t)表示第t次迭代时最佳解和当前解第j维位置的百分比差异,α为敏感参数,Bestj(t)为候选解群的最佳解的第j维位置,ε为一个较小的常数;
v(i,j)(t)=Bestj(t)×P(i,j)(t)
其中,η(i,j)(t)表示第t次迭代时第i个候选解第j维位置对应的捕猎因子;
其中,R(i,j)(t)表示缩减函数,r2为介于[1,N]的随机整数,N为候选解群中的候选解数目;
ES(t)=2×r3×(1-1/T)
其中,ES(t)表示进化因子,r3为介于(-1,1)之间的随机数,T为设置的最大迭代次数;
步骤④:对候选解群中各个候选解的位置进行更新,重复步骤②,其中。位置更新方式如下:
Zi,j(t+1)=Bestj(t)×η(i,j)×β-R(i,j0(t0×rand′
其中,β为敏感参数,rand′为介于(0,1)的随机数;
其中r1为介于[1,N]的随机整数,N为候选解群中的候选解数目;
Zi,j(t+1)=Bestj(t0×P(i,j)(t)×rand′
Zi,j(t+1)=Bestj(t)-η(i,j)×ε-R(i,j)(t)×rand′
步骤⑤:将适应度值取得历史极值的候选解作为最优解,该候选解的位置即确定的最优惩罚因子和最优核参数。
本发明对获取的ASV典型重金属溶出峰电流数据进行一次扣除基底、去噪、二次扣除基底后获取典型重金属元素的特征峰,利用建立好的RSA算法优化的支持向量机非线性模型对环境因子(pH、温度、电导率、氧化还原电位和浊度)对ASV检测结果的影响进行校正,有效提高了检测数据的准确度,并且无需现场再次分析标准样品。
本申请还提供一种地下水重金属的检测系统,包括ASV检测装置、参数设置模块、数据采集模块、数据预处理模块和校正模块;
参数设置模块用于对ASV检测装置进行参数设置;
在采集地下水样品,使用ASV检测装置对地下水样品进行检测时,由数据采集模块获取地下水样品的环境因子数据和地下水样品中待测典型重金属元素的电流溶出峰数据;
数据预处理模块用于对电流溶出峰数据进行预处理校正,包括一次基底扣除、平滑降噪和二次基底扣除;
校正模块中搭载有训练好的机器学习模型,机器学习模型的输入为环境因子数据和预处理校正后的电流溶出峰数据,输出为校正后的地下水重金属浓度测量结果。
数据预处理模块中的一次基底扣除、平滑降噪和二次基底扣除已在上文详述,在此不再赘述。校正模块中机器学习模型为支持向量机模型,其训练和参数确定等已在上文详述,在此不再赘述。
本申请可以提供全流程自适应监测,如下:
1)设置好设备检测参数,将ASV监测传感器放入地下水监测井内,启动设备,设备进入工作状态;
2)按照设置好的参数,进行地下水环境因子(pH、电导率、氧化还原电位、温度和浊度)的检测和地下水中典型重金属离子的电流溶出峰数据的检测;
3)采用自适应窗口多项式拟合法和惩罚最小二乘法自动对电流溶出峰数据进行两次基底扣除和平滑降噪,获取纯净数据;
4)以校正处理后的电流溶出峰数据和传感器检测的环境因子(pH、电导率、氧化还原电位、温度和浊度)数据作为输入因素,调入建立好的PSO算法优化的支持向量机非线性模型进行重金属检测数据的校正和补偿,并存储、显示校正后的数据;
5)检测结束后,汇总数据,形成可视化图表,使得用户可以清晰了解项目场地的地下水重金属分布情况。
需要注意的是,本申请可在软件和/或软件与硬件的组合体中被实施,例如,可采用专用集成电路(ASIC)、通用目的计算机或任何其他类似硬件设备来实现。在一个实施例中,本申请的软件程序可以通过处理器执行以实现上文所述的数据预处理校正和机器学习模型训练及应用步骤或功能。同样地,本申请的软件程序(包括相关的数据结构)可以被存储到计算机可读记录介质中,例如,RAM存储器,磁或光驱动器或软磁盘及类似设备。另外,本申请的一些步骤或功能可采用硬件来实现,例如,作为与处理器配合从而执行各个步骤或功能的电路。
另外,本申请的一部分可被应用为计算机程序产品,例如计算机程序指令,当其被计算机执行时,通过该计算机的操作,可以调用或提供根据本申请的方法和/或技术方案。而调用本申请的方法的程序指令,可能被存储在固定的或可移动的记录介质中,和/或通过广播或其他信号承载媒体中的数据流而被传输,和/或被存储在根据所述程序指令运行的计算机设备的工作存储器中。在此,根据本申请的一个实施例包括一个装置,该装置包括用于存储计算机程序指令的存储器和用于执行程序指令的处理器,其中,当该计算机程序指令被该处理器执行时,触发该装置运行基于前述根据本申请的多个实施例的方法和/或技术方案。
以上详细描述了本发明的较佳具体实施例。应当理解,本领域的普通技术人员无需创造性劳动就可以根据本发明的构思做出诸多修改和变化。因此,凡本技术领域中技术人员依本发明的构思在现有技术的基础上通过逻辑分析、推理或者有限的实验可以得到的技术方案,皆应在由权利要求书所确定的保护范围内。
Claims (10)
1.一种地下水重金属的检测方法,其特征在于,包括以下步骤:
S1、对ASV检测装置进行参数设置;
S2、采集地下水样品,使用ASV检测装置对地下水样品进行检测,获取地下水样品的环境因子数据,获取地下水样品中待测典型重金属元素的电流溶出峰数据;
S3、对电流溶出峰数据进行预处理校正,包括一次基底扣除、平滑降噪和二次基底扣除;
S4、以环境因子数据和预处理校正后的电流溶出峰数据作为输入,使用训练好的机器学习模型进行重金属检测数据的校正和补偿,得到校正后的地下水重金属浓度测量结果。
2.根据权利要求1所述的一种地下水重金属的检测方法,其特征在于,步骤S1中,ASV检测装置采用差分脉冲溶出伏安法进行分析,需要设置的参数包括:富集时间、富集电压、起始电压、终止电压、脉冲周期、振幅、采样频率。
3.根据权利要求1所述的一种地下水重金属的检测方法,其特征在于,步骤S2中,利用ASV检测装置上搭载的传感器测量得到地下水样品的环境因子数据,包括温度、电导率、氧化还原电位、浊度和PH。
4.根据权利要求1所述的一种地下水重金属的检测方法,其特征在于,步骤S3中,一次和二次基底扣除方法采用惩罚最小二乘法,如下:
步骤1、初始化参数,包括最大迭代次数、平滑参数λ和权重系数W,所述权重系数W的基本形式为:W=diag(w1,w2,w3,…,wN),其中,N为电流溶出峰数据y的长度;
步骤2、将初始权重W和其他参数代入下式,进行惩罚最小二乘拟合基线数据,如下:
z=(W+λDTD)-1Wy
其中,D为二阶差分矩阵,DT表示二阶差分矩阵的转置矩阵,y表示待测典型重金属元素的电流溶出峰数据,z为基线数据;
步骤3、对权重系数中的wi进行更新,i=1、2、…、N,并计算更新前后权重系数的变化量Γ:
其中,上标k用于标识第k次迭代,norm()函数用于求范数;
步骤4、若Γ小于预设置的变化阈值,则迭代结束,输出此次迭代时的基线数据为最优基线,并输出扣除了最优基线的电流溶出峰数据y′,y′=y-z,否则,以更新后的权重系数重复步骤2~4。
5.根据权利要求1所述的一种地下水重金属的检测方法,其特征在于,步骤S3中,平滑降噪采用参数自适应选择的窗口移动多项式拟合法,如下:
步骤a、对于经一次基底扣除的电流溶出峰数据,提取噪声数据、峰宽与峰高,其中,峰宽width为溶出峰宽度,峰高A为溶出峰高度,噪声数据Noisy为:
Noisy=(y′i+1-y′i)/2
y′表示经一次基底扣除的电流溶出峰数据,i=1、2、…、N,B为电流溶出峰数据的长度;
步骤b、根据噪声数据、峰宽与峰高,采用高斯函数生产一组不含噪声的仿真信号,仿真信号如下:
式中,E为电位,Ec为峰电位,Ec可根据峰高位置确定;
步骤c、采用窗口移动多项式拟合迭代算法对仿真信号进行处理,确定窗口宽度和多项式阶次;
步骤d、使用步骤c确定的窗口宽度和多项式阶次对经一次基底扣除的电流溶出峰数据进行窗口移动多项式拟合降噪平滑。
6.根据权利要求5所述的一种地下水重金属的检测方法,其特征在于,步骤c中,采用窗口移动多项式拟合迭代算法对电流数据进行处理具体如下:
step1、初始化窗口宽度和多项式阶次,设置宽度搜索步长和终止宽度,设置阶次搜索步长和终止阶次,建立搜索网格,所述搜索网格中的一格元素为窗口宽度+多项式阶次组合;
step2、选择搜索网格中的一格元素,确定当前的窗口宽度和多项式阶次,采用当前的窗口宽度和多项式阶次对仿真信号电流数据进行处理,在窗口内进行多项式拟合,保留中心点数据,并替代窗口内的原数据,依次遍历整个仿真信号,计算当前的窗口宽度和多项式阶次所对应的信噪比;
step3、重复步骤step2,直至完成所有窗口宽度+多项式阶次组合的信噪比计算,找到使信噪比最大的窗口宽度+多项式阶次组合并输出。
7.根据权利要求1所述的一种地下水重金属的检测方法,其特征在于,步骤S4中,给定训练样本集{(x1,q1),…,(xm,qm),…,(xM,qM)},所述机器学习模型为支持向量机模型,支持向量机回归模型的表示如下:
f(x)=ωTx+b
其中,x表示输入支持向量机的数据,即环境因子数据和预处理校正后的电流溶出峰数据,q表示地下水重金属浓度值,M表示训练样本集中的样本数量,f(x)为支持向量机的输出,ω与b为支持向量机模型参数,求解支持向量机回归模型,使得f(xm)尽可能接近qm,问题转化为:
其中,C为惩罚因子,l∈为敏感度损失函数;
将上述问题转化为朗格朗日函数对偶法求解,问题解如下:
K(xm,x)=exp(-||x-xm||2/2p2)
其中,p为核函数。
8.根据权利要求7所述的一种地下水重金属的检测方法,其特征在于,支持向量机模型的惩罚因子和核参数采用爬行动物搜索算法确定,如下:
步骤①:初始化阶段,初始化每个候选解群的初始位置,候选解群包括多个候选解,单个候选解的位置分别对应惩罚因子和核参数,设置最大迭代次数及候选解各个维度位置的上限与下限,初始化公式如下:
Zi,j(0)=rand×(Zj,max-Zj,min)+Zj,min
Zi,j(0)表示第i个候选解第j维的初始位置,rand为介于(0,1)之间的随机数,Zj,max为第j维位置的上限,Zj,min为第j维位置的下限;
步骤②:计算每个候选解的适应度值,更新各个候选解的个体历史极值,若满足预设置的收敛条件,则执行步骤⑤,否则,执行步骤③;
步骤③:对M(Zi(t))、P(i,j)(t)、η(i,j)(t)、R(i,j)(t)和ES(t)进行更新,更新公式如下:
其中,t表示当前迭代次数,M(Zi(t))表示第t次迭代时第i个候选解的平均位置,Zi(t)为第i个候选解的位置,n为候选解位置的维度个数;
其中,P(i,j)(t)表示第t次迭代时最佳解和当前解第j维位置的百分比差异,α为敏感参数,Bestj(t)为候选解群的最佳解的第j维位置,ε为一个较小的常数;
v(i,j)(t)=Bestj(t)×P(i,j)(t)
其中,η(i,j)(t)表示第t次迭代时第i个候选解第j维位置对应的捕猎因子;
其中,R(i,j)(t)表示缩减函数,r2为介于[1,N]的随机整数,N为候选解群中的候选解数目;
ES(t)=2×r3×(1-1/T)
其中,ES(t)表示进化因子,r3为介于(-1,1)之间的随机数,T为设置的最大迭代次数;
步骤④:对候选解群中各个候选解的位置进行更新,重复步骤②,其中。位置更新方式如下:
Zi,j(t+1)=Bestj(t)×η(i,j)×β-R(i,j)(t)×rand′
其中,β为敏感参数,rand′为介于(0,1)的随机数;
其中r1为介于[1,N]的随机整数,N为候选解群中的候选解数目;
Zi,j(t+1)=Bestj(t)×P(i,j)(t)×rand′
Zi,j(t+1)=Bestj(t)-η(i,j)×ε-R(i,j)(t)×rand′
步骤⑤:将适应度值取得历史极值的候选解作为最优解,该候选解的位置即确定的最优惩罚因子和最优核参数。
9.根据权利要求8所述的一种地下水重金属的检测方法,其特征在于,步骤②中,计算候选解的适应度值具体为:
获取候选解的位置,将对应的惩罚因子和核参数代入支持向量机模型;使用训练样本集对支持向量机模型进行训练;使用预构建的测试集对支持向量机模型进行检测,将均方根误差作为适应度值。
10.一种地下水重金属的检测系统,其特征在于,包括ASV检测装置、参数设置模块、数据采集模块、数据预处理模块和校正模块;
所述参数设置模块用于对ASV检测装置进行参数设置;
在采集地下水样品,使用ASV检测装置对地下水样品进行检测时,由所述数据采集模块获取地下水样品的环境因子数据和地下水样品中待测典型重金属元素的电流溶出峰数据;
所述数据预处理模块用于对电流溶出峰数据进行预处理校正,包括一次基底扣除、平滑降噪和二次基底扣除;
所述校正模块中搭载有训练好的机器学习模型,所述机器学习模型的输入为环境因子数据和预处理校正后的电流溶出峰数据,输出为校正后的地下水重金属浓度测量结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211185565.2A CN115561282A (zh) | 2022-09-27 | 2022-09-27 | 一种地下水重金属的检测方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211185565.2A CN115561282A (zh) | 2022-09-27 | 2022-09-27 | 一种地下水重金属的检测方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115561282A true CN115561282A (zh) | 2023-01-03 |
Family
ID=84743511
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211185565.2A Pending CN115561282A (zh) | 2022-09-27 | 2022-09-27 | 一种地下水重金属的检测方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115561282A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115952685A (zh) * | 2023-02-02 | 2023-04-11 | 淮阴工学院 | 基于集成深度学习的污水处理过程软测量建模方法 |
-
2022
- 2022-09-27 CN CN202211185565.2A patent/CN115561282A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115952685A (zh) * | 2023-02-02 | 2023-04-11 | 淮阴工学院 | 基于集成深度学习的污水处理过程软测量建模方法 |
CN115952685B (zh) * | 2023-02-02 | 2023-09-29 | 淮阴工学院 | 基于集成深度学习的污水处理过程软测量建模方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Gundry et al. | Recent advances and future perspectives for automated parameterisation, Bayesian inference and machine learning in voltammetry | |
CN115423163A (zh) | 一种流域短期洪水事件预测方法、装置及终端设备 | |
CN106706508A (zh) | 一种基于ahp分析的金属材料海水腐蚀敏感度评价方法 | |
CN105956709B (zh) | 一种基于gui的模块化支持向量机潮汐预测方法 | |
CN110682159A (zh) | 一种刀具磨损状态识别方法及装置 | |
CN115561282A (zh) | 一种地下水重金属的检测方法及系统 | |
CN111125885A (zh) | 一种基于改进克里金插值算法的asf修正表构建方法 | |
CN113687433B (zh) | 一种基于Bi-LSTM的大地电磁信号去噪方法及系统 | |
CN112733386B (zh) | 一种基于深度神经网络的多组分反应性溶质运移参数反演方法 | |
CN114117953A (zh) | 水文模型结构诊断方法、径流预报方法及装置 | |
CN112258495A (zh) | 一种基于卷积神经网络的建筑木材裂缝识别方法 | |
CN114611582B (zh) | 一种基于近红外光谱技术分析物质浓度的方法及系统 | |
CN116562414A (zh) | 一种基于多源水文气象数据的陆地水储量变化预测方法 | |
CN113468799A (zh) | 一种静止气象卫星观测中获取近地面pm2.5浓度的方法及系统 | |
CN116110505A (zh) | 一种基于多目标贝叶斯优化的流动化学工艺优化方法 | |
CN114330815A (zh) | 一种基于改进goa优化lstm的超短期风电功率预测方法与系统 | |
CN109343019A (zh) | 一种地质雷达数据解释方法及装置 | |
CN111177646B (zh) | 一种岩溶含水层渗透场反演优化方法 | |
CN109187898B (zh) | 水产养殖环境中水质氨氮含量的软测量方法及装置 | |
CN115598164B (zh) | 一种集成机器学习的土壤重金属浓度检测方法及系统 | |
CN111141809A (zh) | 一种基于非接触式电导信号的土壤养分离子含量检测方法 | |
CN115660455A (zh) | 一种三水统筹下水质评价体系模型构建系统、设备及终端 | |
CN110503142B (zh) | 基于时空随机效应加法过程模型的多源遥感产品层次贝叶斯融合方法 | |
CN101706439A (zh) | 锌基中微量镉的测定 | |
CN110794469A (zh) | 基于最小地质特征单元约束的重力反演方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |