CN116106289A - 一种基于拉曼信号的复杂体系物质多组分分析方法和系统 - Google Patents

一种基于拉曼信号的复杂体系物质多组分分析方法和系统 Download PDF

Info

Publication number
CN116106289A
CN116106289A CN202211738384.8A CN202211738384A CN116106289A CN 116106289 A CN116106289 A CN 116106289A CN 202211738384 A CN202211738384 A CN 202211738384A CN 116106289 A CN116106289 A CN 116106289A
Authority
CN
China
Prior art keywords
spectrum
peak
raman
data
complex system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211738384.8A
Other languages
English (en)
Inventor
杨良保
李伟
林东岳
董荣录
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Anhui Zhongke Saifeier Technology Co ltd
Original Assignee
Anhui Zhongke Saifeier Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Anhui Zhongke Saifeier Technology Co ltd filed Critical Anhui Zhongke Saifeier Technology Co ltd
Priority to CN202211738384.8A priority Critical patent/CN116106289A/zh
Publication of CN116106289A publication Critical patent/CN116106289A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/62Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
    • G01N21/63Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
    • G01N21/65Raman scattering
    • G01N21/658Raman scattering enhancement Raman, e.g. surface plasmons

Landscapes

  • Health & Medical Sciences (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Investigating, Analyzing Materials By Fluorescence Or Luminescence (AREA)

Abstract

本发明公开了一种基于拉曼信号的复杂体系物质多组分分析方法和系统,所提出的基于拉曼信号的复杂体系物质多组分分析方法,本发明对采集光谱与已知光谱进行统一特征提取,可规避因不同参数设置而导致提取的特征信息不同,通过排列组合形式预判混合体系的物质成分,不同物质的特征峰在高度耦合情况下也可被识别,对于化学结构类似物具有分辨能力,提高物质识别的准确率。

Description

一种基于拉曼信号的复杂体系物质多组分分析方法和系统
技术领域
本发明涉及拉曼信号处理技术领域,尤其涉及一种基于拉曼信号的复杂体系物质多组分分析方法和系统。
背景技术
混合物体系下拉曼光谱信号包含多种物质成分的特征信息,即该光谱由多种物质的特征信息耦合而成,故可依据光谱识别出混合体系的物质成分。常规方法是通过提取待测物光谱的峰位、峰宽等特征信息,将上述特征信息加载入数据库中检索,满足峰位邻近、峰宽与峰个数相等匹配条件,则可认为混合体系下包含该物质成分。该过程存存在三个问题,分别为峰位误差、峰宽范围、识别误差。其中峰位偏差是由特征信息提取的参数设置不同导致的问题,数据库中各谱图的峰位数据与待测物的峰位数据需保持统一方法与参数(如信噪比)。建库谱图为单一物质的拉曼信号,而采集的拉曼信号是在混合体系下,各物质的信号峰相互干扰与叠加,在特征峰的峰形相似计算时需要考虑峰宽问题,峰宽范围直接影响计算系数。常规方法可从数据库中筛选物质,但该物质仍为可能物质,需要进行组合验证。
发明内容
为解决背景技术中存在的技术问题,本发明提出一种基于拉曼信号的复杂体系物质多组分分析方法和系统。
本发明提出的一种基于拉曼信号的复杂体系物质多组分分析方法,包括下列步骤:
S1、对所采集的拉曼光谱数据进行数据处理,得到采集光谱信号和采集光谱峰位;
S2、对已知拉曼光谱数据进行S1所述的数据处理方法,得到已知光谱信号和已知光谱峰位,建立已知光谱数据库;
S3、基于采集光谱峰位在已知光谱数据库中进行峰位匹配,筛选峰位相似的已知光谱信号;
S4、对相似的已知光谱信号进行排列组合,并对每种组合类型的光谱数据进行S1所述的数据处理方法,将S1的采集光谱信号与可能光谱信号进行比对,进行多组分识别。
优选地,在S1中,所述数据处理具体包括:利用S-G滤波器滤除高斯白噪声;利用airPLS对光谱进行基线校正;利用多次样条插值方法将数据补充到需求数据点数。
优选地,在S1中,所述数据处理还包括:对所采集的拉曼光谱数据进行小波变换为WTf(a,τ)和极值求解,得到峰位。
优选地,所述对所采集的拉曼光谱数据进行小波变换为WTf(a,τ)和极值求解,具体为:
对所采集的拉曼光谱数据进行小波变换为WTf(a,τ),并进行极值求解,得到极小值X1和第一极大值X2;对所采集的拉曼光谱数据进行极值求解,得到第二极大值X3;对比X2与X3,若差值绝对值小于预设参数,则峰位准确值X4为X3;峰宽PW=X1(i+1)-X1i,其中X1i为第i个极小值。
优选地,在S2中,所述已知光谱数据库包括已知光谱信号、峰位、峰宽、和峰强。
优选地,在S3中,所述基于采集光谱峰位在已知光谱数据库中进行峰位匹配之后,对各匹配峰进行波形计算,依据波形相似系数筛除可能物质;其中,波形相似系数计算公式如下:
Figure BDA0004031791290000031
其中,f1k为已知光谱的第k个匹配峰数据,f1为已知光谱的匹配峰均值,f2k为采集光谱的第k个匹配峰数据,f2为采集光谱的匹配峰均值。
优选地,在S4中,所述将S2的采集光谱信号与可能光谱信号进行比对,具体为:通过偏差方差法计算二者的误差系数,通过下列公式计算:
Figure BDA0004031791290000032
其中,Ri为第i个匹配峰的波形相似系数,Ri为第i个匹配峰的波形相似系数均值。
本发明中,所提出的基于拉曼信号的复杂体系物质多组分分析方法,本发明对采集光谱与已知光谱进行统一特征提取,可规避因不同参数设置而导致提取的特征信息不同,通过排列组合形式预判混合体系的物质成分,不同物质的特征峰在高度耦合情况下也可被识别,对于化学结构类似物具有分辨能力,提高物质识别的准确率。
本发明还提出一种分析复杂体系物质成分的多组分识别系统,包括:
处理器;
存储器;以及
一个或多个程序,其中所述一个或多个程序被存储在所述存储器中,并且被配置成由所述处理器执行,所述程序包括用于执行上述的基于拉曼信号的复杂体系物质多组分分析方法。
本发明中,所提出的基于拉曼信号的复杂体系物质多组分分析系统,其技术效果与上述方法类似,因此不再赘述。
附图说明
图1为本发明提出的一种基于拉曼信号的复杂体系物质多组分分析方法的一种实施方式中乙醇与乙二醇混合体系的拉曼信号。
图2为本发明提出的一种基于拉曼信号的复杂体系物质多组分分析方法的一种实施方式中固体混合物体系的拉曼信号。
具体实施方式
如图1和2所示,图1为本发明提出的一种基于拉曼信号的复杂体系物质多组分分析方法的一种实施方式中乙醇与乙二醇混合体系的拉曼信号,图2为本发明提出的一种基于拉曼信号的复杂体系物质多组分分析方法的一种实施方式中固体混合物体系的拉曼信号。
本发明提出的一种基于拉曼信号的复杂体系物质多组分分析方法,包括下列步骤:
S1、对所采集的拉曼光谱数据进行数据处理,得到采集光谱信号和采集光谱峰位;
具体地,所述数据处理具体包括:利用S-G滤波器滤除高斯白噪声;利用airPLS对光谱进行基线校正;和,利用多次样条插值方法将数据补充到需求数据点数。在实际处理过程中,为窗口宽度为5的S-G滤噪平滑,基于自适应迭代惩罚加权最小二乘法对拉曼信号进行基线校正,再对数据波数的进行拉曼位移转换,截取数据范围在200cm-1-3000cm-1,最后进行三次样条插值获得数据。
接着,根据上述数据计算采集光谱峰位。具体地,所述数据处理还包括:对所采集的拉曼光谱数据进行小波变换为WTf(a,τ)和极值求解,得到峰位。其中,首先,对所采集的拉曼光谱数据进行小波变换为WTf(a,τ),并进行极值求解,得到极小值X1和第一极大值X2。然后,对所采集的拉曼光谱数据进行极值求解,得到第二极大值X3。对比X2与X3,若差值绝对值小于预设参数,则峰位准确值X4为X3。峰宽判定通过相邻两个极小值之间的差值确定。峰宽PW=X1(i+1)-X1i,其中X1i为第i个极小值。
S2、对已知拉曼光谱数据进行S1所述的数据处理方法,得到已知光谱信号和已知光谱峰位,建立已知光谱数据库;
具体地,所述已知光谱数据库包括已知光谱信号、峰位、峰宽、和峰强等特征。
S3、基于采集光谱峰位在已知光谱数据库中进行峰位匹配,筛选峰位相似的已知光谱信号;
具体地,所述基于采集光谱峰位在已知光谱数据库中进行峰位匹配之后,对各匹配峰进行波形计算,依据波形相似系数筛除可能物质;其中,波形相似系数计算公式如下:
Figure BDA0004031791290000051
其中,f1k为已知光谱的第k个匹配峰数据,f1为已知光谱的匹配峰均值,f2k为采集光谱的第k个匹配峰数据,f2为采集光谱的匹配峰均值。
S4、对相似的已知光谱信号进行排列组合,并对每种组合类型的光谱数据进行S1所述的数据处理方法,将S1的采集光谱信号与可能光谱信号进行比对,进行多组分识别。
具体地,所述将S2的采集光谱信号与可能光谱信号进行比对,具体为:通过偏差方差法计算二者的误差系数,通过下列公式计算:
Figure BDA0004031791290000061
其中,Ri为第i个匹配峰的波形相似系数,Ri为第i个匹配峰的波形相似系数均值。
下面通过两个实例详细说明本实施例的基于拉曼信号的复杂体系物质多组分分析方法。
实例1
以易制毒化学品乙醇与乙二醇混合体系的拉曼信号为例,对本发明的技术方案做进一步说明。
样本制备:取乙醇与乙二醇的标准样进行任意比例混合(比例范围不超过1:5),利用玻璃样品瓶盛载。
检测仪器:便携式拉曼光谱仪(CASA18T1,安徽中科赛飞尔科技有限公司),激光功率250mW,积分时间为5000mS,激光焦距7±0.5cm,拉曼检测方法,信噪比参数设置为800。
本实例方法的步骤包括:
步骤1:将混合体系物置于拉曼仪下采集光谱数据f。
步骤2:利用S-G滤波器滤除高斯白噪声,平滑光谱;利用airPLS对光谱进行基线校正;利用多次样条插值方法将数据补充到需求数据点数f1。
步骤3:对拉曼光谱信号f1进行小波变换为WTf(a,τ),并进行极值求解,极小值记为X1,极大值记为X2。对拉曼光谱信号f1进行极值求解,记为X3。对比两个极大值集X2与X3,其中元素差的绝对值小于参数a,则X3集内元素为拉曼信号峰位准确值X4。峰宽始末位置判别。对于满足条件X1i≤X4j≤X1(i+1),则峰宽记为PW=X1(i+1)-X1i。
步骤4:将所有谱图数据进行步骤2,得到标准光谱数据,加入数据库中,再对标准光谱数据进行步骤3,提取各谱图的峰位、峰宽、峰强等特征并保存至数据库中。
步骤5:依据待测物的峰位X4,在谱图库中进行检索,实现第一次的可能物质的匹配,该过程无法做到精确筛除,需对各匹配峰进行波形计算,依据波形相似系数进一步筛除可能物质。
步骤6:对可能物质进行排列组合,对每种组合形式进行比对,再对组合光谱先后进行步骤2、3、4、5,通过偏差方差法计算与原始光谱的误差系数。
实验结果见图1,该方法可分析出醇类混合样本的物质成分,并列出对应物质的拉曼信号,分别为乙醇与乙二醇的拉曼信号。图中混合样与标准样的特征峰峰位相匹配,表明该方法可准确识别物质成分,并且信号分辨率达到5个拉曼位移。
实例2
以易制毒化学品丙二酸与丁二酸混合体系的SERS信号为例,对本发明的技术方案做进一步说明。
样本制备:取丙二酸与丁二酸标准样的任意比例于研钵中,充分研磨混合,保证混合物的均匀混合(比例范围不超过1:5),利用玻璃样品瓶盛载样本。
检测仪器:便携式拉曼光谱仪(CASA18T1,安徽中科赛飞尔科技有限公司),激光功率250mW,积分时间为5000mS,激光焦距7±0.5cm,选择拉曼检测方法,信噪比参数设置为800。
本实例方法的步骤包括:
步骤1:将混合体系物置于拉曼仪下,不同位点采集10次拉曼光谱,选取特征峰峰强最大的拉曼光谱作为算法处理数据f。
步骤2:利用S-G滤波器滤除高斯白噪声,平滑光谱;利用airPLS对光谱进行基线校正;利用多次样条插值方法将数据补充到需求数据点数f1。
步骤3:对拉曼光谱信号f1进行小波变换为WTf(a,τ),并进行极值求解,极小值记为X1,极大值记为X2。对拉曼光谱信号f1进行极值求解,记为X3。对比两个极大值集X2与X3,其中元素差的绝对值小于参数a,则X3集内元素为拉曼信号峰位准确值X4。峰宽始末位置判别。对于满足条件X1i≤X4j≤X1(i+1),则峰宽记为PW=X1(i+1)-X1i。
步骤4:将所有谱图数据进行步骤2,得到标准光谱数据,加入数据库中,再对标准光谱数据进行步骤3,提取各谱图的峰位、峰宽、峰强等特征并保存至数据库中。
步骤5:依据待测物的峰位X4,在谱图库中进行检索,实现第一次的可能物质的匹配,该过程无法做到精确筛除,需对各匹配峰进行波形计算,依据波形相似系数进一步筛除可能物质。
步骤6:对可能物质进行排列组合,对每种组合形式进行比对,再对组合光谱先后进行步骤2、3、4、5,通过偏差方差法计算与原始光谱的误差系数。
实验结果见图2,该方法可分析出固体混合样本的物质成分,并列出对应物质的拉曼信号,分别为丙二酸与丁二酸的拉曼信号。图中固体混合样与标准样的特征峰峰位相匹配,表明该方法可准确识别物质成分,且直接展示了混合样本中重叠峰由多个峰的叠加过程,各拉曼光谱在峰位与峰个数上完全匹配,物质分析准确。
本实施例还提出一种分析复杂体系物质成分的多组分识别系统,包括:
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。

Claims (8)

1.一种基于拉曼信号的复杂体系物质多组分分析方法,其特征在于,包括下列步骤:
S1、对所采集的拉曼光谱数据进行数据处理,得到采集光谱信号和采集光谱峰位;
S2、对已知拉曼光谱数据进行S1所述的数据处理方法,得到已知光谱信号和已知光谱峰位,建立已知光谱数据库;
S3、基于采集光谱峰位在已知光谱数据库中进行峰位匹配,筛选峰位相似的已知光谱信号;
S4、对相似的已知光谱信号进行排列组合,并对每种组合类型的光谱数据进行S1所述的数据处理方法,将S1的采集光谱信号与可能光谱信号进行比对,进行多组分识别。
2.根据权利要求1所述的基于拉曼信号的复杂体系物质多组分分析方法,其特征在于,在S1中,所述数据处理具体包括:利用S-G滤波器滤除高斯白噪声;利用airPLS对光谱进行基线校正;利用多次样条插值方法将数据补充到需求数据点数。
3.根据权利要求1或2所述的基于拉曼信号的复杂体系物质多组分分析方法,其特征在于,在S1中,所述数据处理还包括:对所采集的拉曼光谱数据进行小波变换为WTf(a,τ)和极值求解,得到峰位。
4.根据权利要求3所述的基于拉曼信号的复杂体系物质多组分分析方法,其特征在于,所述对所采集的拉曼光谱数据进行小波变换为WTf(a,τ)和极值求解,具体为:
对所采集的拉曼光谱数据进行小波变换为WTf(a,τ),并进行极值求解,得到极小值X1和第一极大值X2;对所采集的拉曼光谱数据进行极值求解,得到第二极大值X3;对比X2与X3,若差值的绝对值小于预设参数,则峰位准确值X4为X3;峰宽PW=X1(i+1)-X1i,其中X1i为第i个极小值。
5.根据权利要求1所述的基于拉曼信号的复杂体系物质多组分分析方法,其特征在于,在S2中,所述已知光谱数据库包括已知光谱信号、峰位、峰宽、和峰强。
6.根据权利要求1所述的基于拉曼信号的复杂体系物质多组分分析方法,其特征在于,在S3中,所述基于采集光谱峰位在已知光谱数据库中进行峰位匹配之后,对各匹配峰进行波形计算,依据波形相似系数筛除可能物质;其中,波形相似系数计算公式如下:
Figure FDA0004031791280000021
其中,f1k为已知光谱的第k个匹配峰数据,f1为已知光谱的匹配峰均值,f2k为采集光谱的第k个匹配峰数据,f2为采集光谱的匹配峰均值。
7.根据权利要求6所述的基于拉曼信号的复杂体系物质多组分分析方法,其特征在于,在S4中,所述将S2的采集光谱信号与可能光谱信号进行比对,具体为:通过偏差方差法计算二者的误差系数,通过下列公式计算:
Figure FDA0004031791280000022
其中,Ri为第i个匹配峰的波形相似系数,Ri为第i个匹配峰的波形相似系数均值。
8.一种分析复杂体系物质成分的多组分识别系统,其特征在于,包括:
处理器;
存储器;以及
一个或多个程序,其中所述一个或多个程序被存储在所述存储器中,并且被配置成由所述处理器执行,所述程序包括用于执行根据权利要求1-8任一项所述的基于拉曼信号的复杂体系物质多组分分析方法。
CN202211738384.8A 2022-12-30 2022-12-30 一种基于拉曼信号的复杂体系物质多组分分析方法和系统 Pending CN116106289A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211738384.8A CN116106289A (zh) 2022-12-30 2022-12-30 一种基于拉曼信号的复杂体系物质多组分分析方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211738384.8A CN116106289A (zh) 2022-12-30 2022-12-30 一种基于拉曼信号的复杂体系物质多组分分析方法和系统

Publications (1)

Publication Number Publication Date
CN116106289A true CN116106289A (zh) 2023-05-12

Family

ID=86259186

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211738384.8A Pending CN116106289A (zh) 2022-12-30 2022-12-30 一种基于拉曼信号的复杂体系物质多组分分析方法和系统

Country Status (1)

Country Link
CN (1) CN116106289A (zh)

Similar Documents

Publication Publication Date Title
Norris et al. Processing MALDI mass spectra to improve mass spectral direct tissue analysis
CN107219188B (zh) 一种基于改进dbn的近红外光谱分析纺织品棉含量的方法
US11614408B2 (en) Method for improving identification accuracy of mixture components by using known mixture Raman spectrum
CN110879980B (zh) 基于神经网络算法的核磁共振波谱去噪方法
US20140085630A1 (en) Spectroscopic apparatus and methods for determining components present in a sample
CN111504979B (zh) 利用已知混合物拉曼光谱改善混合物成分识别精度的方法
CN109738413B (zh) 基于稀疏非负最小二乘的混合物拉曼光谱定性分析方法
JP5327388B2 (ja) 分析データ処理方法及び装置
US10718713B2 (en) Unknown sample determining method, unknown sample determining instrument, and unknown sample determining program
CN109472287A (zh) 基于二维Gabor小波的三维荧光光谱特征提取方法
Salvatore et al. Classification methods of multiway arrays as a basic tool for food PDO authentication
CN107209151B (zh) 干扰检测及所关注峰值解卷积
JP2008500537A (ja) 分光計によって生成されたデータからスペクトルを抽出するためのシステム及び方法
CN112418072A (zh) 数据处理方法、装置、计算机设备和存储介质
CN107966420B (zh) 一种由近红外光谱预测原油性质的方法
CN113514446B (zh) 一种用于快速匹配识别sers谱图的方法
CN107209156A (zh) 经由曲线减法检测基于质谱的相似性
CN116106289A (zh) 一种基于拉曼信号的复杂体系物质多组分分析方法和系统
CN113109318A (zh) 基于光谱峰高直接提取的拉曼光谱定量分析方法及系统
WO2023123329A1 (zh) 近红外光谱的净信号提取方法及其系统
CN100445959C (zh) 用于从光谱仪产生的数据提取光谱的系统和方法
CN109632761B (zh) 一种拉曼光谱数据的处理方法及系统
CN112396066A (zh) 一种适用于高光谱影像的特征提取方法
CN111650142A (zh) 含铀有机相中亚硝酸浓度分析方法
US7064543B2 (en) Method of verifying the synthesis of organic molecules using nuclear magnetic resonance spectroscopy

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination