CN109145873B - 基于遗传算法的光谱高斯峰特征提取算法 - Google Patents

基于遗传算法的光谱高斯峰特征提取算法 Download PDF

Info

Publication number
CN109145873B
CN109145873B CN201811133111.4A CN201811133111A CN109145873B CN 109145873 B CN109145873 B CN 109145873B CN 201811133111 A CN201811133111 A CN 201811133111A CN 109145873 B CN109145873 B CN 109145873B
Authority
CN
China
Prior art keywords
spectral
gaussian peak
curve
peak
subinterval
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811133111.4A
Other languages
English (en)
Other versions
CN109145873A (zh
Inventor
程良伦
何伟健
梁广宇
李学识
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong University of Technology
Original Assignee
Guangdong University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong University of Technology filed Critical Guangdong University of Technology
Priority to CN201811133111.4A priority Critical patent/CN109145873B/zh
Publication of CN109145873A publication Critical patent/CN109145873A/zh
Application granted granted Critical
Publication of CN109145873B publication Critical patent/CN109145873B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/08Feature extraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/12Computing arrangements based on biological models using genetic models
    • G06N3/126Evolutionary algorithms, e.g. genetic algorithms or genetic programming

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Genetics & Genomics (AREA)
  • Physiology (AREA)
  • Signal Processing (AREA)
  • Biomedical Technology (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Complex Calculations (AREA)

Abstract

本发明提出基于遗传算法的光谱高斯峰特征提取算法,主要步骤包括:S1:输入光谱曲线,对光谱曲线进行曲线平滑和基线校正;S2:种群初始化阶段;S3:个体变异阶段;S4:种群交叉阶段;S5:种群基因译码阶段;S6:计算适应度fit;S7:判断适应度fit是否满足预设条件:若是,执行步骤S9;若否,执行步骤S8;S8:自然选择阶段;S9:使用最佳拟合区间进行拟合,得到并输出高斯峰特征。本发明以波谷为分界点将光谱曲线分成若干个子区间,然后将子区间组合起来进行高斯峰拟合,通过遗传算法得到最优拟合区间,减少了拟合误差,提高了高斯峰参数提取的准确度和太赫兹时域光谱物质识别的识别率;通过峰数递增最优化条件得到最佳拟合高斯峰数,增强对光谱混叠峰的分辨能力。

Description

基于遗传算法的光谱高斯峰特征提取算法
技术领域
本发明涉及光谱领域,更具体地,涉及一种基于遗传算法的太赫兹光谱高斯峰特征提取算法。
背景技术
目前,高斯多峰拟合算法是用来拟合光谱曲线最常用的算法,该算法首先通过单调性寻峰算法确定高斯峰的大致位置和数量,再通过非线性迭代优化算法最小化拟合曲线与光谱曲线之间的差值。该算法以单调性寻峰结果为基础确定高斯峰的基本信息,导致高斯峰定位不够准确,而且忽略了吸收峰之间的相互关系,无法有效地分离出光谱中的混叠峰,拟合误差偏大。
太赫兹时域光谱是一种非常有效的物质探测手段,不仅能够迅速地对样品组成的细微变化作出分析和鉴别,而且能够对半导体、电介质薄膜等材料的物理信息进行快速准确的测量。许多物体的太赫兹吸收谱上的一些特定频率会出现吸收峰,通过这些吸收峰的特征可以对物质结构、物性进行分析和鉴定,更准确有效地提取这些吸收峰的参数是提高识别率的关键。
发明内容
本发明为克服现有技术中高斯峰定位不准确,光谱中混叠峰的分辨能力差,拟合误差大的缺点,提供一种基于遗传算法的太赫兹光谱高斯峰特征提取算法。
为解决上述技术问题,本发明的技术方案如下:
基于遗传算法的光谱高斯峰特征提取算法,包括以下步骤:
S1:输入光谱曲线y,将光谱曲线y进行曲线平滑和基线校正,得到光谱曲线z;
S2:种群初始化阶段,所述的初始化包括将光谱曲线z分成r+1个子区间和将遗传算法的基因序列初始化为长度为r的全1二进制序列;
S3:个体变异阶段,即将基因序列中的每一个基因按照一定概率进行取反运算;
S4:种群交叉阶段,即将两段不同的基因序列之间按照一定概率交换范围随机的若干片段;
S5:种群基因译码阶段,即将基因序列转换为子区间组合,设L是组合后的子区间分界点,若基因序列是1,则将对应的分界点加入到L中,若基因序列是0则跳过;
S6:用高斯多峰拟合算法对每一子区间组合进行测试,计算基因序列的适应度fit;
S7:判断适应度fit是否满足预设条件:若是,则执行步骤S9;若否,则执行步骤S8;
S8:自然选择阶段;
S9:根据步骤S6得到每个基因序列的最佳适应度fit得到当前最佳拟合区间,使用最佳拟合区间进行拟合,得到并输出高斯峰特征。
进一步地,步骤S1具体包括以下步骤:
S11:采用离散惩罚最小二乘法对光谱曲线y进行平滑,即求解下式的最小值:
Q1=|y-z′|21|D1z′|2
其中,y是光谱曲线序列,z′是平滑后的光谱曲线序列,λ1是控制光滑程度的常数,λ1越大,曲线越光滑,且λ1>0,D1是微分矩阵,且D1=E”,即D1是单位矩阵E的二阶微分;
令Q1对z′求偏导数,然后使偏导数为0,化简可得:
(E+λ1D1 TD1)z′=y
其中,T表示矩阵的转置;
由上式可以求解得到平滑后的光谱曲线z′;
S12:采用非对称最小二乘法对步骤S11中得到的光谱曲线z′进行基线校正,即求解下式的最小值:
Q2=W|z′-z|22|D2z|2
其中,D2是微分矩阵,且D2=E”,即D2是单位矩阵E的二阶微分,λ2是校正系数,且λ2>0,W为权重矩阵,且W=diag(ω),ω满足下式:
Figure BDA0001814050060000021
其中,zi′、zi分别是一维数组z′、z的第i个元素,i∈[1,n],z(x)=[z1,z2,...,zn],n是一维数组的长度,p是常数,且p∈(0,1);
令Q2对z求偏导数,然后使偏导数为0,化简可得:
(W+λ2D2 TD2)z=Wz′
由于z与W相关,直接求解无法得到z,因此采用迭代优化的方法得到最优z,即首先将z初始化为z′,然后通过z计算W,在将W带入上式计算出z,反复迭代至W的平均值变化小于预设的ε,即W满足以下条件:
Figure BDA0001814050060000031
其中,
Figure BDA0001814050060000032
是第k次迭代的一维数组W各个元素的平均值,
Figure BDA0001814050060000033
是第k+1次迭代的一维数组W各个元素的平均值;
迭代结束,得到光谱曲线z。
进一步地,步骤S2所述的将光谱曲线z分成r+1个子区间,采用的方法是:通过光谱曲线z的波谷将光谱曲线z分成r+1个子区间,其中,r是光谱曲线z的波谷数,r个波谷加上光谱曲线的两端将光谱曲线z分成r+1个子区间。
进一步地,步骤S2所述的将遗传算法的基因序列初始化为长度为r的全1二进制序列,初始化方法如下:二进制数字代表一个子区间的状态,1代表该子区间独立作为拟合区间,0代表该子区间与上一子区间合并作为一个整体拟合区间,全1序列代表初始状态是以波谷划分子区间,无任何组合。
进一步地,步骤S6具体包括以下步骤:
S61:通过峰数递增最优化判断条件确定每个子区间内的最优拟合高斯峰数m,峰数递增最优化判断条件如下:
Figure BDA0001814050060000034
Figure BDA0001814050060000035
Figure BDA0001814050060000036
Figure BDA0001814050060000037
其中,Aj是光谱曲线z的第j个高斯峰的峰高,bj是光谱曲线z的第j个高斯峰的频率位置,error是拟合误差,n是该子区间内的波峰数,m是该子区间内实际拟合的波峰数,fstart,fend分别是该拟合区间的起始频率和结束频率,k1、k2、k3是待定系数,且k1<1、k2<1、k3>1,
Figure BDA0001814050060000041
其中,mq是第q个子区间的最优拟合高斯峰数;
改变拟合高斯峰数m使得P2取最大值,即得到该子区间内最优拟合高斯峰数m;
S62:构建高斯峰函数Gauj(x),求取各子区间内的最佳拟合高斯峰数对应的各个高斯峰函数值,高斯峰函数Gauj(x)如下所示:
Figure BDA0001814050060000042
其中,其中Gauj(x)是光谱曲线z的第j个高斯峰函数,Aj、bj、cj分别是光谱曲线z的第j个高斯峰的峰高、频率位置、峰宽,x是光谱曲线z的太赫兹波频率(太赫兹波频率单位是:THz),且x=0.0019*K+0.3,x∈[0.3,2],K是正整数;
S63:计算每个基因序列的均方根误差RMSE,RMSE计算公式如下:
Figure BDA0001814050060000043
其中,z(x)是一维数组,n是一维数组的长度;
S64:计算每个基因序列的适应度fit,适应度fit值最大时是最佳适应度fit,适应度fit的计算公式如下:
Figure BDA0001814050060000044
其中,RMSE是均方根误差。
进一步地,步骤S7所述的预设条件是:达到迭代最大次数或种群最佳适应度连续三代未改变。
进一步地,步骤S8具体包括以下步骤:
S81:根据每个基因序列的适应度与所有基因序列的适应度之和的比列确定每个基因序列的复制次数;
S82:限制复制最大值、最小值;
S83:当新一代种群个体数不足时,复制当前最好个体至固定数目,跳回执行步骤S3,进行下一代的个体变异。
进一步地,步骤S9所述的最佳拟合区间即最佳适应度fit对应的基因序列。
进一步地,步骤S9所述的高斯峰特征包括高斯峰的频率位置、波高、波宽、面积。
进一步地,本发明对光谱曲线z进行了曲线平滑和基线校正,通过曲线平滑将光谱曲线的波峰波谷数降至一定范围内,减少测量过程的误差,通过基线校正减少因光谱基线漂移的影响。
进一步地,本发明在种群交叉阶段,为保证最优基因序列的存在,每次变异后均加入上一代的最优基因序列,并将上一代最优基因序列初始化为全1序列。
进一步地,本发明以光谱曲线z的波谷为分界点,将光谱曲线z分成r+1个子区间,且将r+1个子区间组合起来进行高斯峰拟合,通过遗传算法得到最优拟合区间,减少了拟合误差,提高了高斯峰参数提取的准确度和太赫兹时域光谱物质识别的识别率。
进一步地,本发明中每个子区间内通过峰数递增最优化条件确定该区间内的最优拟合高斯峰数m,增强了对光谱混叠峰的分辨能力。
与现有技术相比,本发明技术方案的有益效果是:(1)以光谱曲线的波谷为分界点将光谱曲线分成若干个子区间,然后将子区间组合起来进行高斯峰拟合,通过遗传算法得到最优拟合区间,减少了拟合误差,提高了高斯峰参数提取的准确度和太赫兹时域光谱物质识别的识别率;(2)通过峰数递增最优化条件确定每个子区间内的最佳拟合高斯峰数,增强了对光谱混叠峰的分辨能力。
附图说明
图1为本发明一实施例的流程图;
图2为本发明一实施例对幼砂糖压片的吸收系数谱的处理结果。
具体实施方式
附图仅用于示例性说明,不能理解为对本专利的限制;
为了更好说明本实施例,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺寸;
对于本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。
下面结合附图和实施例对本发明的技术方案做进一步的说明。
如图1所示,本实施例使用日本爱德万公司生产的TAS7400太赫兹光谱仪对幼砂糖压片进行测试,主要步骤包括:
S1:得到幼砂糖压片的光谱曲线y,将光谱曲线y进行曲线平滑和基线校正,得到光谱曲线z,具体包括以下步骤:
S11:采用离散惩罚最小二乘法对光谱曲线y进行平滑,即求解下式的最小值:
Q1=|y-z′|21|D1z′|2
其中,y是光谱曲线序列,z′是平滑后的光谱曲线序列,λ1是控制光滑程度的常数,λ1越大,曲线越光滑,且λ1>0,D1是微分矩阵,且D1=E”,即D1是单位矩阵E的二阶微分;
令Q1对z′求偏导数,然后使偏导数为0,化简可得:
(E+λ1D1 TD1)z′=y
其中,T表示矩阵的转置;
由上式可以求解得到平滑后的光谱曲线z′;
S12:采用非对称最小二乘法对步骤S11中得到的光谱曲线z′进行基线校正,即求解下式的最小值:
Q2=W|z′-z|22|D2z|2
其中,D2是微分矩阵,且D2=E”,即D2是单位矩阵E的二阶微分,λ2是校正系数,且λ2>0,W为权重矩阵,且W=diag(ω),ω满足下式:
Figure BDA0001814050060000061
其中,z′i、zi分别是一维数组z′、z的第i个元素,i∈[1,n],z(x)=[z1,z2,...,zn],n是一维数组的长度,p是常数,且p∈(0,1)。
令Q2对z求偏导数,然后使偏导数为0,化简可得:
(W+λ2D2 TD2)z=Wz′
由于z与W相关,直接求解无法得到z,因此采用迭代优化的方法得到最优z,即首先将z初始化为z′,然后通过z计算W,在将W带入上式计算出z,反复迭代至W的平均值变化小于预设的ε,即W满足以下条件:
Figure BDA0001814050060000062
其中,
Figure BDA0001814050060000063
是第k次迭代的一维数组W各个元素的平均值,
Figure BDA0001814050060000064
是第k+1次迭代的一维数组W各个元素的平均值
迭代结束,得到光谱曲线z。
S2:种群初始化阶段,包括以下步骤:
S21:通过光谱曲线z的波谷将光谱曲线z分成r+1个子区间,其中,r是光谱曲线z的波谷数,r个波谷加上光谱曲线的两端将光谱曲线z分成r+1个子区间。
S22:将遗传算法的基因序列初始化为长度为r的全1二进制序列,初始化方法如下:二进制数字代表一个子区间的状态,1代表该子区间独立作为拟合区间,0代表该子区间与上一子区间合并作为一个整体拟合区间,全1序列代表初始状态是以波谷划分子区间,无任何组合。
S3:个体变异阶段,即将基因序列中的每一个基因按照一定概率进行取反运算。
S4:种群交叉阶段,即将两段不同的基因序列之间按照一定概率交换范围随机的若干片段,在此过程中,为保证最优基因序列的存在,每次变异后均加入上一代的最优基因序列,并将上一代的最优基因序列初始化为全1序列。
S5:种群基因译码阶段,即将基因序列转换为子区间组合,设L是组合后的子区间分界点,若基因序列是1,则将对应的分界点加入到L中,若基因序列是0则跳过。
S6:用高斯多峰拟合算法对每一子区间组合进行测试,计算基因序列的适应度,具体步骤如下:
S61:通过峰数递增最优化判断条件确定每个子区间内的最优拟合高斯峰数m,峰数递增最优化判断条件如下:
Figure BDA0001814050060000071
Figure BDA0001814050060000072
Figure BDA0001814050060000081
Figure BDA0001814050060000082
其中,Aj是光谱曲线z的第j个高斯峰的峰高,bj是光谱曲线z的第j个高斯峰的频率位置,error是拟合误差,n是该子区间内的波峰数,m是该子区间内实际拟合的波峰数,fstart,fend分别是该拟合区间的起始频率和结束频率,k1、k2、k3是待定系数,且k1<1、k2<1、k3>1,
Figure BDA0001814050060000083
其中,mq是第q个子区间的最佳拟合高斯峰数;
改变拟合高斯峰数m使得P2取最大值,即得到该子区间内最优拟合高斯峰数m;
S62:构建高斯峰函数Gauj(x),求取各子区间内的最佳拟合高斯峰数对应的各个高斯峰函数值,高斯峰函数Gauj(x)如下所示:
Figure BDA0001814050060000084
其中,其中Gauj(x)是光谱曲线z的第j个高斯峰函数,Aj、bj、cj分别是光谱曲线z的第j个高斯峰的峰高、频率位置、峰宽,x是光谱曲线z的太赫兹波频率(太赫兹波频率单位是:THz),且x=0.0019*K+0.3,x∈[0.3,2],K是正整数;
S63:计算每个基因序列的均方根误差RMSE,RMSE计算公式如下:
Figure BDA0001814050060000085
其中,z(x)是一维数组,n是一维数组的长度;
S64:计算每个基因序列的适应度fit,适应度fit值最大时是最佳适应度fit,适应度fit的计算公式如下:
Figure BDA0001814050060000086
其中,RMSE是均方根误差。
S7:判断适应度fit是否已经达到迭代最大次数或种群最佳适应度连续三代未改变:若是,则执行步骤S9;若否,则执行步骤S8。
S8:自然选择阶段,具体过程包括:
S81:根据每个基因序列的适应度与所有基因序列的适应度之和的比列确定每个基因序列的复制次数;
S82:限制复制最大值、最小值;
S83:当新一代种群个体数不足时,复制当前最好个体至固定数目,跳回执行步骤S3,进行下一代的个体变异。
S9:根据步骤S65得到每个基因序列的最佳适应度fit得到当前最佳拟合区间,使用最佳拟合区间进行拟合,得到并输出高斯峰特征,所述的高斯峰特征包括高斯峰的频率位置、波高、波宽、面积,遗传算法结束。本实施例子中对幼砂糖压片的吸收系数谱的处理结果如图2所示,其中RMSE=0.2406。
具体地,本实施例中,对采集到的幼砂糖压片的光谱曲线进行了曲线平滑和基线校正,通过曲线平滑将光谱曲线的波峰波谷数降至一定范围内,减少测量过程的误差,通过基线校正减少因光谱基线漂移的影响。
具体地,本发明以光谱曲线z的波谷为分界点,将光谱曲线z分成r+1个子区间,且将r+1个子区间组合起来进行高斯峰拟合,通过遗传算法得到最优拟合区间,减少了拟合误差,提高了高斯峰参数提取的准确度和太赫兹时域光谱物质识别的识别率。
具体地,本发明中每个子区间内通过峰数递增最优化条件确定该区间内的最优拟合高斯峰数m,增强了对光谱混叠峰的分辨能力。
相同或相似的标号对应相同或相似的部件;
附图中描述位置关系的用语仅用于示例性说明,不能理解为对本专利的限制;
显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。

Claims (8)

1.基于遗传算法的光谱高斯峰特征提取算法,其特征在于,包括以下步骤:
S1:输入光谱曲线y,将光谱曲线y进行曲线平滑和基线校正,得到光谱曲线z;
S2:种群初始化阶段,所述的初始化包括将光谱曲线z分成r+1个子区间和将遗传算法的基因序列初始化为长度为r的全1二进制序列;
S3:个体变异阶段,即将基因序列中的每一个基因按照一定概率进行取反运算;
S4:种群交叉阶段,即将两段不同的基因序列之间按照一定概率交换范围随机的若干片段;
S5:种群基因译码阶段,即将基因序列转换为子区间组合,设L是组合后的子区间分界点,若基因序列是1,则将对应的分界点加入到L中,若基因序列是0则跳过;
S6:用高斯多峰拟合算法对每一子区间组合进行测试,计算基因序列的适应度fit;
S7:判断适应度fit是否满足预设条件:若是,则执行步骤S9;若否,则执行步骤S8;
S8:自然选择阶段;
S9:根据步骤S6得到每个基因序列的最佳适应度fit得到当前最佳拟合区间,使用最佳拟合区间进行拟合,得到并输出高斯峰特征;
步骤S1具体包括以下步骤:
S11:采用离散惩罚最小二乘法对光谱曲线y进行平滑,即求解下式的最小值:
Q1=|y-z′|21|D1z′|2
其中,y是光谱曲线序列,z′是平滑后的光谱曲线序列,λ1是控制光滑程度的常数,λ1越大,曲线越光滑,且λ1>0,D1是微分矩阵,且D1=E”,即D1是单位矩阵E的二阶微分;
令Q1对z′求偏导数,然后使偏导数为0,化简可得:
Figure FDA0003416667790000012
其中,T表示矩阵的转置;
由上式可以求解得到平滑后的光谱曲线z′;
S12:采用非对称最小二乘法对步骤S11中得到的光谱曲线z′进行基线校正,即求解下式的最小值:
Q2=W|z′-z|22|D2z|2
其中,D2是微分矩阵,且D2=E”,即D2是单位矩阵E的二阶微分,λ2是校正系数,且λ2>0,W为权重矩阵,且W=diag(ω),ω满足下式:
Figure FDA0003416667790000011
其中,zi′、zi分别是一维数组z′、z的第i个元素,i∈[1,n],z(x)=[z1,z2,...,zn],n是一维数组的长度,p是常数,且p∈(0,1);
令Q2对z求偏导数,然后使偏导数为0,化简可得:
Figure FDA0003416667790000021
由于z与W相关,直接求解无法得到z,因此采用迭代优化的方法得到最优z,即首先将z初始化为z′,然后通过z计算W,在将W带入上式计算出z,反复迭代至W的平均值变化小于预设的ε,即W满足以下条件:
Figure FDA0003416667790000022
其中,
Figure FDA0003416667790000023
是第k次迭代的一维数组W各个元素的平均值,
Figure FDA0003416667790000024
是第k+1次迭代的一维数组W各个元素的平均值;
迭代结束,得到光谱曲线z。
2.根据权利要求1所述的基于遗传算法的光谱高斯峰特征提取算法,其特征在于,步骤S2所述的将光谱曲线z分成r+1个子区间,采用的方法是:通过光谱曲线z的波谷将光谱曲线z分成r+1个子区间,其中,r是光谱曲线z的波谷数,r个波谷加上光谱曲线的两端将光谱曲线z分成r+1个子区间。
3.根据权利要求1所述的基于遗传算法的光谱高斯峰特征提取算法,其特征在于,步骤S2所述的将遗传算法的基因序列初始化为长度为r的全1二进制序列,初始化方法如下:二进制数字代表一个子区间的状态,1代表该子区间独立作为拟合区间,0代表该子区间与上一子区间合并作为一个整体拟合区间,全1序列代表初始状态是以波谷划分子区间,无任何组合。
4.根据权利要求1所述的基于遗传算法的光谱高斯峰特征提取算法,其特征在于,步骤S6具体包括以下步骤:
S61:通过峰数递增最优化判断条件确定每个子区间内的最优拟合高斯峰数m,峰数递增最优化判断条件如下:
Figure FDA0003416667790000025
Figure FDA0003416667790000026
Figure FDA0003416667790000027
Figure FDA0003416667790000031
其中,Aj是光谱曲线z的第j个高斯峰的峰高,bj是光谱曲线z的第j个高斯峰的频率位置,error是拟合误差,n是该子区间内的波峰数,m是该子区间内实际拟合的波峰数,fstart,fend分别是该拟合区间的起始频率和结束频率,k1、k2、k3是待定系数,且k1<1、k2<1、k3>1,
Figure FDA0003416667790000032
其中,mq是第q个子区间的最优拟合高斯峰数;
改变拟合高斯峰数m使得P2取最大值,即得到该子区间内最佳拟合高斯峰数m;
S62:构建高斯峰函数Gauj(x),求取各子区间内的最佳拟合高斯峰数对应的各个高斯峰函数值,高斯峰函数Gauj(x)如下所示:
Figure FDA0003416667790000033
其中,其中Gauj(x)是光谱曲线z的第j个高斯峰函数,Aj、bj、cj分别是光谱曲线z的第j个高斯峰的峰高、频率位置、峰宽,x是光谱曲线z的太赫兹波频率,且x=0.0019*K+0.3,x∈[0.3,2],K是正整数;
S63:计算每个基因序列的均方根误差RMSE,RMSE计算公式如下:
Figure FDA0003416667790000034
其中,z(x)是一维数组,n是一维数组的长度;
S64:计算每个基因序列的适应度fit,适应度fit值最大时是最佳适应度fit,适应度fit的计算公式如下:
Figure FDA0003416667790000035
其中,RMSE是均方根误差。
5.根据权利要求1所述的基于遗传算法的光谱高斯峰特征提取算法,其特征在于,步骤S7所述的预设条件是:达到迭代最大次数或种群最佳适应度连续三代未改变。
6.根据权利要求1所述的基于遗传算法的光谱高斯峰特征提取算法,其特征在于,步骤S8具体包括以下步骤:
S81:根据每个基因序列的适应度与所有基因序列的适应度之和的比列确定每个基因序列的复制次数;
S82:限制复制最大值、最小值;
S83:当新一代种群个体数不足时,复制当前最好个体至固定数目,跳回执行步骤S3,进行下一代的个体变异。
7.根据权利要求1所述的基于遗传算法的光谱高斯峰特征提取算法,其特征在于,步骤S9所述的最佳拟合区间即最佳适应度fit对应的基因序列。
8.根据权利要求1所述的基于遗传算法的光谱高斯峰特征提取算法,其特征在于,步骤S9所述的高斯峰特征包括高斯峰的频率位置、波高、波宽、面积。
CN201811133111.4A 2018-09-27 2018-09-27 基于遗传算法的光谱高斯峰特征提取算法 Active CN109145873B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811133111.4A CN109145873B (zh) 2018-09-27 2018-09-27 基于遗传算法的光谱高斯峰特征提取算法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811133111.4A CN109145873B (zh) 2018-09-27 2018-09-27 基于遗传算法的光谱高斯峰特征提取算法

Publications (2)

Publication Number Publication Date
CN109145873A CN109145873A (zh) 2019-01-04
CN109145873B true CN109145873B (zh) 2022-03-22

Family

ID=64813121

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811133111.4A Active CN109145873B (zh) 2018-09-27 2018-09-27 基于遗传算法的光谱高斯峰特征提取算法

Country Status (1)

Country Link
CN (1) CN109145873B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110084212B (zh) * 2019-04-30 2022-09-27 河南师范大学 一种基于改进正弦余弦算法的光谱特征峰识别定位方法
CN111325121B (zh) * 2020-02-10 2024-02-20 浙江迪谱诊断技术有限公司 一种核酸质谱数值处理方法
CN111931118A (zh) * 2020-08-25 2020-11-13 杭州博日科技股份有限公司 荧光定量熔解实验中熔解曲线测量方法
CN112161959B (zh) * 2020-09-25 2022-10-25 山东达峰海洋科技有限公司 一种基于荧光光谱全局重构的叶绿素浓度测量方法
CN112395983B (zh) * 2020-11-18 2022-03-18 深圳市步锐生物科技有限公司 一种质谱数据峰位置对齐方法及装置
CN114487072B (zh) * 2021-12-27 2024-04-12 浙江迪谱诊断技术有限公司 一种飞行时间质谱峰拟合方法
CN115797355B (zh) * 2023-02-09 2023-04-07 江苏惠汕新能源集团有限公司 太阳能光伏发电装置故障检测方法及系统

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030078739A1 (en) * 2001-10-05 2003-04-24 Surromed, Inc. Feature list extraction from data sets such as spectra
CN101832909B (zh) * 2010-03-12 2012-01-18 江苏大学 基于模拟退火-遗传算法近红外光谱特征子区间选择方法
CN103217679B (zh) * 2013-03-22 2014-10-08 北京航空航天大学 一种基于遗传算法的全波形激光雷达回波数据的高斯分解法
CN105447837B (zh) * 2016-02-04 2019-11-12 重庆邮电大学 基于自适应云模型的多模态脑部图像融合方法
CN107462535B (zh) * 2017-08-17 2019-09-06 中国科学院烟台海岸带研究所 一种基于高斯多峰拟合的光谱解析方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
一种混合异构传感网的覆盖洞修补算法;程良伦,等;《控制与决策》;20151130;第30卷(第11期);全文 *

Also Published As

Publication number Publication date
CN109145873A (zh) 2019-01-04

Similar Documents

Publication Publication Date Title
CN109145873B (zh) 基于遗传算法的光谱高斯峰特征提取算法
Tu et al. Hyperspectral image classification via fusing correlation coefficient and joint sparse representation
Deng et al. Field detection and classification of citrus Huanglongbing based on hyperspectral reflectance
Shi et al. Development of a national VNIR soil-spectral library for soil classification and prediction of organic matter concentrations
CN103208011B (zh) 基于均值漂移和组稀疏编码的高光谱图像空谱域分类方法
Sui et al. Unsupervised band selection by integrating the overall accuracy and redundancy
CN105424641A (zh) 一种原油种类的近红外光谱识别方法
Xia et al. Acquisition and analysis of hyperspectral data for surface contamination level of insulating materials
Lei et al. Geographic origin identification of coal using near-infrared spectroscopy combined with improved random forest method
CN112557332A (zh) 一种基于光谱分峰拟合的光谱分段和光谱比对方法
Hsu et al. Hyperspectral image classification via joint sparse representation
CN111795944B (zh) 一种改进团队进步算法的近红外光谱波长筛选方法
CN113076692B (zh) 一种反演叶片氮素含量的方法
CN114216877A (zh) 茶叶近红外光谱分析中谱峰自动检测与重构方法及系统
CN112782115B (zh) 一种基于近红外光谱检验卷烟感官特征一致性的方法
Cheng et al. Arbitrary strain distribution measurement using a genetic algorithm approach and two fiber Bragg grating intensity spectra
CN108827905B (zh) 一种基于局部加权Lasso的近红外模型在线更新方法
CN116735527A (zh) 一种近红外光谱优化方法、装置、系统以及存储介质
CN113959974A (zh) 一种普适性近红外光谱模型的传递方法
CN109145945B (zh) 一种非局部加权联合稀疏表示的高光谱图像分类方法
CN112733775A (zh) 基于深度学习的高光谱影像分类方法
CN112733865A (zh) 一种基于稀疏表示与固定原子迭代的光谱目标检测方法
CN117115553B (zh) 一种基于掩膜谱空特征预测的高光谱遥感图像分类方法
CN113537029B (zh) 基于近红外光谱的模型转移方法及终端设备
CN106546558A (zh) 一种基于特征波段的近红外在线检测模型的更新方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant