CN108133203A - 一种基于稀疏表示的拉曼光谱特征提取方法 - Google Patents

一种基于稀疏表示的拉曼光谱特征提取方法 Download PDF

Info

Publication number
CN108133203A
CN108133203A CN201810047671.1A CN201810047671A CN108133203A CN 108133203 A CN108133203 A CN 108133203A CN 201810047671 A CN201810047671 A CN 201810047671A CN 108133203 A CN108133203 A CN 108133203A
Authority
CN
China
Prior art keywords
raman
spectrum
original
formula
spectral
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810047671.1A
Other languages
English (en)
Other versions
CN108133203B (zh
Inventor
韩彩芹
方政
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangsu Normal University
Original Assignee
Jiangsu Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangsu Normal University filed Critical Jiangsu Normal University
Priority to CN201810047671.1A priority Critical patent/CN108133203B/zh
Publication of CN108133203A publication Critical patent/CN108133203A/zh
Application granted granted Critical
Publication of CN108133203B publication Critical patent/CN108133203B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/08Feature extraction

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Investigating, Analyzing Materials By Fluorescence Or Luminescence (AREA)
  • Spectrometry And Color Measurement (AREA)

Abstract

本发明公开了一种基于稀疏表示的拉曼光谱特征提取方法,包括以下步骤:a.获取原始拉曼光谱信息;b.根据峰的位置将步骤a中的原始拉曼光谱分为N块;c.将步骤b中处理后的拉曼光谱进行变换域变换,得到光谱信息域图像;d.获取步骤c中的光谱信息域图像的最相关分量;e.将步骤d中的最相关分量进行反变换,恢复原光谱;f.将步骤e中的原光谱进行合并,得到重构后的拉曼光谱。本发明采用了拉曼光谱在变换域是稀疏的特性,提取稀疏域中最相关的分量,减小了各种噪声对拉曼光谱信号的影响;同时,对原始光谱进行分段处理,提高了光谱重构的准确性,保证想要特征峰的信息能够从噪声中还原出来。

Description

一种基于稀疏表示的拉曼光谱特征提取方法
技术领域
本发明涉及一种拉曼光谱特征提取方法,具体涉及一种基于稀疏表示的拉曼光谱特征提取方法。
背景技术
拉曼光谱图是利用拉曼光谱对物质进行分析的根据,拉曼光谱图的质量会直接影响对物质的分析。然而,从光谱仪采集到的原始光谱信号存在一定的噪声。其中有杂散光引起的低频背景噪声,有探测器和放大系统自身的噪声,有因为激光光强所引起的漂移,样品放置位置与方向等多方面因素引起的噪声。这些噪声导致不能从拉曼光谱图中准确的提取有用的信息,对于后续的分析造成巨大的影响,导致准确度和精度下降。
现在的拉曼光谱去噪方法主要包括小波去噪、Savitzky-Golay滤波器、经验模态分解、有限冲击响应数字滤波器等方法,这些方法多数是针对特定的一个模拟数据或者实例来验证单一算法的有效性,应用到另一个实例可能并不会有太好的效果。同时,因为算法中各参数对性能的影响不宜,如今只是采用经验的手段获得较佳的性能指标。
发明内容
针对上述现有技术存在的问题,本发明提供一种基于稀疏表示的拉曼光谱特征提取方法,解决了现有技术中噪声干扰特征提取的问题,提高光谱分析检出限。
为了实现上述目的,本发明采用的技术方案是:一种基于稀疏表示的拉曼光谱特征提取方法,包括以下步骤:
a.获取原始拉曼光谱信息;
b.根据峰的位置将步骤a中的原始拉曼光谱分为N块;
c.将步骤b中处理后的拉曼光谱进行变换域变换,得到光谱信息域图像;
d.获取步骤c中的光谱信息域图像的最相关分量;
e.将步骤d中的最相关分量进行反变换,恢复原光谱;
f.将步骤e中的原光谱进行合并,得到重构后的拉曼光谱。
进一步的,所述的步骤d中通过正交匹配追踪算法获取光谱信息域图像的最相关分量;
正交匹配追踪算法以贪婪迭代的方法选择字典原子,使得每次迭代的过程中原子与信号最大相关(内积最大),从信号向量减去相关部分得到残差,残差按照上述方法反复迭代,直到迭代次数达到稀疏度K或者残差小于误差阈值,停止迭代。
进一步的,所述的正交匹配追踪算法具体步骤为:
a.找出残差和字典内积最大的原子索引,即λt=argmaxj=1...N|<rt-1j>|,
式中,r-残差,λ-残差和字典原子的最大内积;
b.更新索引集Λt=Λt-1∪{λt},记录字典的重建原子集合Φt=[Φt-1λt],
式中,Λ-索引集,Φ-重建原子集合,φ-字典原子;
c.有最小二乘法得到
式中,的估计值,y-原始光谱;
d.更新残差t=t+1,式中,t-迭代次数;
e.判断是否满足t>K,若满足,则停止迭代;若不满足,则执行步骤a,式中,K-稀疏度。
与现有技术相比本发明采用了拉曼光谱在变换域是稀疏的特性,提取稀疏域中最相关的分量,减小了各种噪声对拉曼光谱信号的影响;同时,对原始光谱进行分段处理,提高了光谱重构的准确性,保证想要特征峰的信息能够从噪声中还原出来;其次,本发明采用正交追踪匹配算法,结合联合稀疏表示,能够更快的达到收敛,速度明显快于最小二乘法,加上约束项,密合出的数值与原始数据之间的误差很小,能更有效地去除背景噪声的对光谱分析的干扰;同时,本发明对于特征峰去噪的效果能够提高被测物的检出限,对于后续的光谱分析有着重要的意义。
附图说明
图1是本发明的处理流程图。
图2是正交匹配追踪算法的算法流程图。
图3是模拟纯净拉曼光谱图。
图4是模拟带噪拉曼光谱图。
图5是对于模拟光谱本发明提供方法与其他方法的对比图。
图6是对氯苯胺的实际高噪声拉曼光谱图。
图7是不同方法对于对氯苯胺的拉曼光谱图像的对比图。
图8是应用本发明提供的方法前后对于实际样品检出限的对比图。
具体实施方式
下面结合附图对本发明作进一步说明。
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,本发明包括以下步骤:
a.获取原始拉曼光谱信息;
b.根据峰的位置将步骤a中的原始拉曼光谱分为N块;
c.将步骤b中处理后的拉曼光谱进行变换域变换,得到光谱信息域图像;
d.获取步骤c中的光谱信息域图像的最相关分量;
e.将步骤d中的最相关分量进行反变换,恢复原光谱;
f.将步骤e中的原光谱进行合并,得到重构后的拉曼光谱。
进一步的,所述的步骤d中通过正交匹配追踪算法获取光谱信息域图像的最相关分量;
正交匹配追踪算法以贪婪迭代的方法选择字典原子,使得每次迭代的过程中原子与信号最大相关(内积最大),从信号向量减去相关部分得到残差,残差按照上述方法反复迭代,直到迭代次数达到稀疏度K或者残差小于误差阈值,停止迭代。
如图2所示,所述的正交匹配追踪算法具体步骤为:
a.找出残差和字典内积最大的原子索引,即λt=argmaxj=1...N|<rt-1j>|,
式中,r-残差,λ-残差和字典原子的最大内积;
b.更新索引集Λt=Λt-1∪{λt},记录字典的重建原子集合Φt=[Φt-1λt],
式中,Λ-索引集,Φ-重建原子集合,φ-字典原子;
c.有最小二乘法得到
式中,的估计值,y-原始光谱;
d.更新残差t=t+1,式中,t-迭代次数;
e.判断是否满足t>K,若满足,则停止迭代;若不满足,则执行步骤a,式中,K-稀疏度;本发明为了得到最相关的特征峰信息,将原始光谱根据想要还原的特征峰位置,以峰与峰之间距离的二分之一为划分尺度进行划分,稀疏值K选择1,字典为将原始光谱进行信息域变换而得到的过完备字典。
图3为模拟纯净拉曼光谱图,图4为模拟带噪拉曼光谱图,图5为对于模拟光谱本发明提供方法与其他方法的对比图,由图中的S-G平滑去燥法所得拉曼光谱图像,小波去噪法所得拉曼光谱图像和本发明所得拉曼光谱图像效果的对比可知,本发明能更好的获取拉曼光谱信号的有效特征,特征提取效果好于其他方法;图6为对氯苯胺的实际高噪声拉曼光谱图,对于图6的拉曼光谱图分别采用S-G平滑去燥法、小波去噪法和本发明提供的方法去燥所得拉曼光谱图像对比如图7所示,由图7可以明显看出,本发明能够更好的提取实际拉曼光谱信号的特征峰,便于进一步的分析;图8为应用本发明提供的方法前后对于实际样品检出限的对比图,可以计算出处理后的光谱检出限低于未处理的光谱检出限3倍,对于低浓度分析有重要意义。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其它的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。
以上所述,仅为本发明的较佳实施例,并不用以限制本发明,凡是依据本发明的技术实质对以上实施例所作的任何细微修改、等同替换和改进,均应包含在本发明技术方案的保护范围之内。

Claims (3)

1.一种基于稀疏表示的拉曼光谱特征提取方法,其特征在于,包括以下步骤:
a.获取原始拉曼光谱信息;
b.根据峰的位置将步骤a中的原始拉曼光谱分为N块;
c.将步骤b中处理后的拉曼光谱进行变换域变换,得到光谱信息域图像;
d.获取步骤c中的光谱信息域图像的最相关分量;
e.将步骤d中的最相关分量进行反变换,恢复原光谱;
f.将步骤e中的原光谱进行合并,得到重构后的拉曼光谱。
2.根据权利要求1所述的一种基于稀疏表示的拉曼光谱特征提取方法,其特征在于,所述的步骤d中通过正交匹配追踪算法获取光谱信息域图像的最相关分量。
3.根据权利要求2所述的一种基于稀疏表示的拉曼光谱特征提取方法,其特征在于,所述的正交匹配追踪算法具体步骤为:
a.找出残差和字典内积最大的原子索引,即λt=argmaxj=1...N|<rt-1j>|,
式中,r-残差,λ-残差和字典原子的最大内积;
b.更新索引集Λt=Λt-1∪{λt},记录字典的重建原子集合Φt=[Φt-1λt],
式中,Λ-索引集,Φ-重建原子集合,φ-字典原子;
c.有最小二乘法得到
式中,的估计值,y-原始光谱;
d.更新残差t=t+1,式中,t-迭代次数;
e.判断是否满足t>K,若满足,则停止迭代;若不满足,则执行步骤a,式中,
K-稀疏度。
CN201810047671.1A 2018-01-18 2018-01-18 一种基于稀疏表示的拉曼光谱特征提取方法 Active CN108133203B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810047671.1A CN108133203B (zh) 2018-01-18 2018-01-18 一种基于稀疏表示的拉曼光谱特征提取方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810047671.1A CN108133203B (zh) 2018-01-18 2018-01-18 一种基于稀疏表示的拉曼光谱特征提取方法

Publications (2)

Publication Number Publication Date
CN108133203A true CN108133203A (zh) 2018-06-08
CN108133203B CN108133203B (zh) 2021-09-03

Family

ID=62399800

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810047671.1A Active CN108133203B (zh) 2018-01-18 2018-01-18 一种基于稀疏表示的拉曼光谱特征提取方法

Country Status (1)

Country Link
CN (1) CN108133203B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117056671A (zh) * 2023-08-14 2023-11-14 上海如海光电科技有限公司 一种基于emd的拉曼光谱降噪方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011029622A (ja) * 2009-06-26 2011-02-10 Semiconductor Energy Lab Co Ltd 薄膜トランジスタ及びその作製方法
CN103217409A (zh) * 2013-03-22 2013-07-24 重庆绿色智能技术研究院 一种拉曼光谱预处理方法
CN103499560A (zh) * 2013-09-29 2014-01-08 浙江大学 一种结合拉曼光谱技术和谱峰比值法的藻种鉴别方法
CN104408723A (zh) * 2014-11-26 2015-03-11 浙江大学 一种基于非负矩阵临近的拉曼光谱图像解混方法
CN106872442A (zh) * 2017-03-20 2017-06-20 江苏师范大学 一种mems微型拉曼光谱仪
CN107462563A (zh) * 2016-06-02 2017-12-12 潘栋雄 利用拉曼光谱鉴定阿盖尔粉钻的产地的方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011029622A (ja) * 2009-06-26 2011-02-10 Semiconductor Energy Lab Co Ltd 薄膜トランジスタ及びその作製方法
CN103217409A (zh) * 2013-03-22 2013-07-24 重庆绿色智能技术研究院 一种拉曼光谱预处理方法
CN103499560A (zh) * 2013-09-29 2014-01-08 浙江大学 一种结合拉曼光谱技术和谱峰比值法的藻种鉴别方法
CN104408723A (zh) * 2014-11-26 2015-03-11 浙江大学 一种基于非负矩阵临近的拉曼光谱图像解混方法
CN107462563A (zh) * 2016-06-02 2017-12-12 潘栋雄 利用拉曼光谱鉴定阿盖尔粉钻的产地的方法
CN106872442A (zh) * 2017-03-20 2017-06-20 江苏师范大学 一种mems微型拉曼光谱仪

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
范贤光: "基于非均匀B样条的拉曼光谱基线校正算法", 《光谱学与光谱分析》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117056671A (zh) * 2023-08-14 2023-11-14 上海如海光电科技有限公司 一种基于emd的拉曼光谱降噪方法

Also Published As

Publication number Publication date
CN108133203B (zh) 2021-09-03

Similar Documents

Publication Publication Date Title
CN112415078B (zh) 一种质谱数据谱图信号校准方法及装置
CN116701845B (zh) 基于数据处理的水产品品质评价方法及系统
US9812150B2 (en) Methods and systems for improved signal decomposition
CN109883547B (zh) 一种基于小波阈值差分的宽波段光谱信号去噪方法
CN102799892B (zh) 一种mfcc水下目标特征提取和识别方法
JP6334895B2 (ja) 信号処理装置及びその制御方法、プログラム
CN115700544A (zh) 一种联合经验模态分解及小波软阈值的色谱信号去噪方法
CN105572473B (zh) 高分辨率线性时频分析方法
CN105807241A (zh) 一种利用先验信息的指数信号去噪方法
CN108387887A (zh) 一种水声信号的混合降噪方法
CN108287137A (zh) 一种基于分段多项式拟合的基线校正方法
Pham et al. Phonocardiogram signal denoising based on nonnegative matrix factorization and adaptive contour representation computation
CN105429719A (zh) 基于功率谱和多尺度小波变换分析强干扰信号检测方法
CN116698680A (zh) 一种生物气溶胶自动监测方法及系统
Do et al. Speech Separation in the Frequency Domain with Autoencoder.
CN108133203A (zh) 一种基于稀疏表示的拉曼光谱特征提取方法
CN117558288B (zh) 单通道语音增强模型的训练方法、装置、设备及存储介质
CN111292266A (zh) 基于双低秩矩阵分解的gf-5遥感影像混合噪声去除方法
CN106501293A (zh) 一种基于小波变换法扣除x射线荧光能谱背景的方法
CN102880861A (zh) 基于线性预测倒谱系数的高光谱图像分类方法
CN113219042A (zh) 一种用于人体呼出气体中各成分分析检测的装置及其方法
Stamatopoulos et al. On an efficient modification of singular value decomposition using independent component analysis for improved MRS denoising and quantification
NSVN et al. Optimal threshold estimation using cultural algorithm for EMD-DWT based ECG denoising
CN105138826A (zh) 一种强噪声背景下的拉曼信号重构方法
CN114624271B (zh) 一种基于变分模态分解的x射线荧光光谱本底扣除方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant