CN114878543A - 一种痕量物质的拉曼光谱探测识别方法及系统 - Google Patents
一种痕量物质的拉曼光谱探测识别方法及系统 Download PDFInfo
- Publication number
- CN114878543A CN114878543A CN202210586909.4A CN202210586909A CN114878543A CN 114878543 A CN114878543 A CN 114878543A CN 202210586909 A CN202210586909 A CN 202210586909A CN 114878543 A CN114878543 A CN 114878543A
- Authority
- CN
- China
- Prior art keywords
- raman
- raman spectrum
- layer
- data
- expansion convolution
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001237 Raman spectrum Methods 0.000 title claims abstract description 72
- 239000000126 substance Substances 0.000 title claims abstract description 46
- 238000001514 detection method Methods 0.000 title claims abstract description 45
- 238000000034 method Methods 0.000 title claims abstract description 41
- 238000001069 Raman spectroscopy Methods 0.000 claims abstract description 52
- 238000004416 surface enhanced Raman spectroscopy Methods 0.000 claims abstract description 42
- 239000000758 substrate Substances 0.000 claims abstract description 39
- 230000008878 coupling Effects 0.000 claims abstract description 20
- 238000010168 coupling process Methods 0.000 claims abstract description 20
- 238000005859 coupling reaction Methods 0.000 claims abstract description 20
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 17
- 230000005684 electric field Effects 0.000 claims abstract description 15
- 230000005672 electromagnetic field Effects 0.000 claims abstract description 13
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 claims abstract description 13
- 239000010931 gold Substances 0.000 claims abstract description 13
- 229910052737 gold Inorganic materials 0.000 claims abstract description 13
- 238000002198 surface plasmon resonance spectroscopy Methods 0.000 claims abstract description 5
- 239000000523 sample Substances 0.000 claims description 50
- 238000012549 training Methods 0.000 claims description 33
- 230000006870 function Effects 0.000 claims description 23
- 238000001228 spectrum Methods 0.000 claims description 19
- 238000000605 extraction Methods 0.000 claims description 18
- 238000011176 pooling Methods 0.000 claims description 13
- 230000003595 spectral effect Effects 0.000 claims description 10
- 238000012937 correction Methods 0.000 claims description 9
- 238000010606 normalization Methods 0.000 claims description 9
- 230000004913 activation Effects 0.000 claims description 7
- 238000007781 pre-processing Methods 0.000 claims description 6
- 230000009466 transformation Effects 0.000 claims description 6
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 claims description 4
- 238000003062 neural network model Methods 0.000 claims description 4
- 238000010187 selection method Methods 0.000 claims description 4
- 238000012795 verification Methods 0.000 claims description 4
- 230000003213 activating effect Effects 0.000 claims description 3
- 238000010276 construction Methods 0.000 claims description 3
- 238000005192 partition Methods 0.000 claims description 3
- 230000008569 process Effects 0.000 claims description 3
- 238000001914 filtration Methods 0.000 claims description 2
- 229910000510 noble metal Inorganic materials 0.000 claims 3
- 239000002082 metal nanoparticle Substances 0.000 claims 2
- 235000009413 Ratibida columnifera Nutrition 0.000 claims 1
- 241000510442 Ratibida peduncularis Species 0.000 claims 1
- 235000013619 trace mineral Nutrition 0.000 claims 1
- 239000011573 trace mineral Substances 0.000 claims 1
- 239000010970 precious metal Substances 0.000 abstract description 11
- 239000002105 nanoparticle Substances 0.000 abstract description 8
- 239000002131 composite material Substances 0.000 abstract description 5
- WEVYAHXRMPXWCK-UHFFFAOYSA-N Acetonitrile Chemical compound CC#N WEVYAHXRMPXWCK-UHFFFAOYSA-N 0.000 description 12
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical group CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 8
- 238000012360 testing method Methods 0.000 description 7
- 230000004927 fusion Effects 0.000 description 4
- 238000007637 random forest analysis Methods 0.000 description 4
- 230000035945 sensitivity Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000003066 decision tree Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000007477 logistic regression Methods 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- FOIXSVOLVBLSDH-UHFFFAOYSA-N Silver ion Chemical compound [Ag+] FOIXSVOLVBLSDH-UHFFFAOYSA-N 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000010339 dilation Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 230000010287 polarization Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- XFKVYXCRNATCOO-UHFFFAOYSA-M rhodamine 6G Chemical compound [Cl-].C=12C=C(C)C(NCC)=CC2=[O+]C=2C=C(NCC)C(C)=CC=2C=1C1=CC=CC=C1C(=O)OCC XFKVYXCRNATCOO-UHFFFAOYSA-M 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/62—Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
- G01N21/63—Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
- G01N21/65—Raman scattering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/086—Learning methods using evolutionary algorithms, e.g. genetic algorithms or genetic programming
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
- G06N7/02—Computing arrangements based on specific mathematical models using fuzzy logic
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- General Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Biomedical Technology (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Biochemistry (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Automation & Control Theory (AREA)
- Fuzzy Systems (AREA)
- Algebra (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Physiology (AREA)
- Investigating, Analyzing Materials By Fluorescence Or Luminescence (AREA)
Abstract
本发明涉及一种痕量物质的拉曼光谱探测识别方法及系统,该识别方法利用便携式拉曼光谱仪,采集电场耦合增强SERS基底上探测物光谱信号,再将光谱信号传输给集成在工控机中的拉曼光谱识别算法,对物质种类进行分别判断。通过将金纳米阵列结构的SERS基底与贵金属纳米溶胶相结合,贵金属纳米颗粒激发局域表面等离子共振(LSP),导致贵金属纳米颗粒表面局域电磁场增强,同时金纳米阵列结构的SERS基底激发表面传播等离激元(SPP),导致阵列表面电磁场增强,SPP近场与LSP近场相互耦合,形成电场耦合增强的复合SERS基底,由此显著提高了拉曼光谱探测精度。本发明通过工控机中的拉曼光谱识别算法,可实现对微弱拉曼信号的准确识别。
Description
技术领域
本发明涉及一种痕量物质的探测与识别,具体地说是一种痕量物质的拉曼光谱探测识别方法及系统。
背景技术
表面增强拉曼散射(SERS)技术是一种无损、无标记的检测技术,对特定的物质有独特的光量子指纹,是目前研究痕量物质探测的重要技术手段。拉曼光谱检测技术具有测量周期短、灵敏度高等优点,可用于在线检测。目前,利用SERS探测痕量物质,主要面临两个方面的难点:一是探测精度不够高,对SERS基底的增强性能提出了更高需求;二光谱识别准确度不够高,这对拉曼光谱的快速识别判断提出了挑战。
由于金纳米颗粒(AuNPs)和银纳米颗粒(AgNPs)制作成本低且易于合成,成为最常用SERS基底之一,其中AgNPs易氧化而不稳定,而AuNPs相对稳定,在实际应用中更具潜力。二维阵列是一种有序可控且能大面积制备的SERS基底,具有偏振无关性和极高灵敏度,制备过程相对简单,有利于形成均匀稳定的“热点”。目前,对于提高SERS基底探测性能的研究,大多集中在基底结构设计与新材料研究,而利用电场耦合增强原理提高SERS基底探测性能的方法,还较少。
拉曼光谱识别大多是通过对探测物质拉曼光谱特征峰拟合,然后通过与数据库中物质光谱的峰形状、峰位等特征逐一对比,实现判别。这些方法匹配的好坏取决于标准拉曼数据库,同时受信号强度的影响较大,尤其是对于弱信号光谱识别效果不好。当前采集的痕量物质拉曼信号,其信号强度有时较微弱,特征峰不明显甚至很难辨别,而目前对这类弱拉曼信号的识别研究还较少。
发明内容
本发明的目的就是提供一种痕量物质的拉曼光谱探测识别方法及系统,以解决现有SERS探测精度不高以及对弱信号识别不准确的问题。
本发明痕量物质的拉曼光谱探测识别方法,是利用拉曼光谱探测仪,采集放置在电场耦合增强SERS基底上的探测物的光谱信号,所采集的光谱信号经过拉曼光谱识别算法处理后得到对探测物的物质种类的判断结果;所述拉曼光谱识别算法包括:拉曼光谱预处理,一维膨胀卷积网络与二维膨胀卷积网络融合的识别模型的构建,以及模型训练与光谱识别。
进一步地,拉曼光谱预处理包括以下步骤:
设定原始样本的拉曼数据格式为:
Wraw=[W1,W2,...,Wn]、Xraw=[X1,X2,...,Xn]和yraw=[y1,y2,...,yn];
其中,Wraw表示所有样本的拉曼频移空间,Wi表示第i个样本的拉曼频移向量,n表示样本数据量,Xraw表示样本的信号强度空间,Xi表示第i个样本的信号强度向量,yraw表示样本类别空间,yi表示第i个样本的种类;
S1.1,插值运算:通过分段线性插值运算,基于原始拉曼数据创建函数,统一样本的频移范围为:[201,2200cm-1],间隔为:1cm-1,每个样本共生成2048个拉曼数据;
S1.2,基线矫正:采用自适应迭代加权惩罚最小二乘法,对S1.1插值运算所获得的数据进行基线矫正,以消除拉曼光谱的荧光影响;
S1.3,光滑去噪:采用Savitzky-Golay滤波器,对S1.2基线矫正所产生的数据进行光滑滤波;
S1.4,归一化:对S1.3光滑去噪所得到的数据集按下式进行归一化处理,以将每个样本的拉曼信号强度统一到[0,1]区间:
其中,xi,j为第i个样本第j个频移位置信号强度,min(xi,)为第i个样本信号强度最小值,max(xi,)为第i个样本信号强度最大值;
S1.5,连续小波变换:对S1.4归一化所得到的数据集,采用墨西哥帽小波为母小波函数,进行小波变换,生成的小波系数图作为二维膨胀卷积网络的输入。
进一步地,一维膨胀卷积网络与二维膨胀卷积网络融合的识别模型包括特征输入层、特征提取层、特征分类预测层和输出层;
S2.1,特征输入层包括:将S1.4归一化所得到的数据作为一维膨胀卷积网络的输入,将S1.5连续小波变换所得到的小波系数图作为二维膨胀卷积网络的输入;
S2.2,特征提取层包括一维膨胀卷积网络特征提取层和二维膨胀卷积网络特征提取层两部分:
一维膨胀卷积网络特征提取层采用四个一维block和一个平展层,每个block包括一个膨胀卷积模块和一个一维最大池化模块;
二维膨胀卷积网络特征提取层采用四个二维block和一个展平层,每个block包括一个二维膨胀卷积模块和一个二维最大池化模块;
每个膨胀卷积操作后的数据均采用ReLU函数激活,膨胀卷积后的数据变化为:
xconv_out=floor((xcon_in+2×padding-dilation×(kernel_size-1)-1)/stride+1)
其中,xcon_in为膨胀卷积层的输入数据,xconv_out为膨胀卷积层的输出数据,kernel_size为卷积核大小,dilation为膨胀系数,padding为填充大小,stride为卷积核移动步长;
S2.3,分类预测层包括拼接层和全连接层,拼接层用于拼接一维膨胀卷积网络和二维膨胀卷积网络的展平层,全连接层采用激活函数tanh实行非线性化,通过采用dropout策略提高泛化能力;
S2.4,输出层采用激活函数softmax,激活函数softmax的输出即为整个识别算法的预测结果。
进一步地,模型训练与光谱识别包括以下步骤:
S3.1,模型训练:对输入的光谱样本数据采用按层随机挑选的方法,按照8︰2分为训练集与验证集,以确保训练集中包含每种物质的样本;模型训练中采用Adam优化器,以交叉熵损失函数(Cross Entropy Loss)为训练指标进行迭代训练,得到神经网络模型,保存该模型;
S3.1,模型训练:对输入的光谱样本数据采用按层随机挑选的方法,按照8︰2分为训练集与验证集,以确保训练集中包含每种物质的样本;模型训练中采用Adam优化器,以交叉熵损失函数(Cross Entropy Loss)为训练指标进行迭代训练,得到神经网络模型,保存该模型。
本发明痕量物质拉曼光谱探测识别方法利用便携式拉曼光谱仪,采集电场耦合增强SERS基底上探测物光谱信号,而后将光谱信号传输给拉曼光谱识别算法,对物质种类进行分别判断。通过将金纳米阵列结构的SERS基底与贵金属纳米溶胶结合,贵金属纳米颗粒激发局域表面等离子共振(LSP),导致颗粒表面局域电磁场增强,同时金纳米阵列结构激发表面传播等离激元(SPP),导致阵列表面电磁场增强,SPP近场与LSP近场相互耦合,形成电场耦合增强的复合SERS基底,极大地提高了拉曼光谱探测的精度,从而提高探测灵敏度。
本发明构建了基于一维膨胀卷积网络和二维膨胀卷积网络融合的识别模型,实现了拉曼光谱自动识别。一维的拉曼光谱序列,其实就是光谱强度相对于拉曼频率的一个函数图像,且具有局部相关性,利用一维膨胀卷积网络可以挖掘拉曼光谱曲线中特征峰等信息;同样连续小波变换后生成的二维小波系数图包含了光谱特征峰的空间信息,两种特征融合提高了识别准确度。相较于传统的拉曼光谱匹配方法,该识别方法具有较强的泛化能力,尤其是对弱信号或者特征峰不明显的拉曼光谱,识别准确度提升显著。
本发明中的识别算法结合一维膨胀卷积网络和二维膨胀卷积网络构建了识别模型,通过融合一维膨胀卷积网络提取的光谱曲线局部特征信息和二维膨胀卷积网络提取的光谱小波系数图特征,实现了拉曼光谱数据的一维和二维特征自动提取,由此提高了识别准确性。
本发明痕量物质的拉曼光谱探测识别系统,包括拉曼光谱仪、拉曼探头、工控机、785nm激光器、CCD、电场耦合增强SERS基底。
所述电场耦合增强SERS基底是通过将金纳米阵列结构的SERS基底与贵金属纳米溶胶相结合,贵金属纳米颗粒激发局域表面等离子共振(LSP),导致贵金属纳米颗粒表面局域电磁场增强,同时金纳米阵列结构的SERS基底激发表面传播等离激元(SPP),导致阵列表面电磁场增强,表面传播等离激元的近场与阵列表面电磁场的近场相互耦合,形成电场耦合增强的复合SERS基底。
所述工控机执行本发明痕量物质的拉曼光谱探测识别方法中的拉曼光谱识别算法,对痕量物质的拉曼光谱进行处理,以对痕量物质进行识别。
本发明拉曼光谱探测识别系统采用便携式拉曼光谱仪,便于携带,使用方便,识别算法可部署在云端服务器,提高了操作的灵敏性。
附图说明
图1是本发明探测识别系统的系统构成框图。
图中:1、拉曼测试仪及主机;2、样品采集装置;3、785nm激光器;4、拉曼光谱仪;5、CCD;6、工控机;7、拉曼探头;8、电场耦合增强SERS基底。
图2是利用本发明耦合增强SERS基底测试R6G试剂的拉曼光谱图。
图中,1、利用耦合增强SERS基底,探测10-6Mol/L的R6G拉曼光谱图;2、利用耦合增强SERS基底,探测10-8Mol/L的R6G拉曼光谱图;3、利用耦合增强SERS基底,探测10-9Mol/L的R6G拉曼光谱图;4、利用纳米阵列结构SERS基底,探测10-6Mol/L的R6G拉曼光谱图;5、利用纳米阵列结构SERS基底,探测10-7Mol/L的R6G拉曼光谱图。
图3是基于一维膨胀卷积网络和二维膨胀卷积网络融合的拉曼光谱识别算法流程图。
图4是基于一维膨胀卷积网络和二维膨胀卷积网络融合的识别模型结构图。
图中:1、小波系数图;2、归一化后的拉曼光谱曲线;3、二维卷积和二维池化模块;4、一维膨胀卷积和最大池化模块;5、二维膨胀卷积网络的展平层;6、一维膨胀卷积网络的展平层;7、拼接层;8、全连接层;9、输出层。
图5是本发明与常用拉曼光谱识别方法在公开拉曼数据部分数据集A上的测试准确率对比图。
图6是本发明与常用拉曼光谱识别方法在公开拉曼数据部分数据集B上的测试准确率对比图。
图7是本发明与常用拉曼光谱识别方法在公开拉曼数据部分数据集B上的测试准确率对比、精确率、召回率和F1-score指标的对比图。
图中:1、准确率(Accuracy);2、精确率(Precision);3、召回率(Recall);4、F1-score。
具体实施方式
下面结合附图和实施例对本发明的技术方案作进一步的说明。
如图1所示,本发明痕量物质的拉曼光谱探测识别系统,包括拉曼测试仪及主机1和样品采集装置两大部分,具体包括有:拉曼光谱仪4、拉曼探头7、CCD5、工控机6、785nm激光器3和电场耦合增强SERS基底8等部分。
其中,电场耦合增强SERS基底8是通过将金纳米阵列结构的SERS基底与贵金属纳米溶胶相结合,贵金属纳米颗粒激发局域表面等离子共振(LSP),导致贵金属纳米颗粒表面局域电磁场增强,同时金纳米阵列结构的SERS基底激发表面传播等离激元(SPP),导致阵列表面电磁场增强,表面传播等离激元的近场与阵列表面电磁场的近场相互耦合,形成电场耦合增强的复合SERS基底。
工控机6执行本发明痕量物质的拉曼光谱探测识别方法中的拉曼光谱识别算法,对痕量物质的拉曼光谱进行处理,以对痕量物质进行识别。
本发明痕量物质的拉曼光谱探测识别方法参考图1、图3和图4所示,取2μl的半径40~50nm的金颗粒,滴入金纳米阵列的增强芯片上,在60℃恒温箱中烘干2分钟,制备成电场耦合增强的复合SERS基底。再准备4种待测物质:A为R6G,B为乙醇,C为乙腈,D为纯水;配置10-6Mol/L、10-7Mol/L、10-8Mol/L、10-9Mol/L的R6G溶液,配置体积比为1:100、1:1000的乙醇溶液和乙腈溶液。将配置好的溶液,分别滴在复合SERS基底上,利用785nm激光的便携式拉曼光谱仪进行探测。作为对比,同时探测只有纳米阵列增强芯片的R6G拉曼光谱信号,对两种增强基底的探测结果如图2所示。
变换探测点和探测时间,对每种溶液进行多次探测,并保存拉曼数据。其中,乙醇和乙腈具有挥发性,其拉曼信号强度随探测时间增加而变弱。将测试的拉曼数据作为样本数据,进行整理,如表1所示。
表1:本发明对不同浓度的R6G、乙醇和乙腈的探测结果。
对所采集的光谱信号进行拉曼光谱识别算法处理,具体包括拉曼光谱预处理、基于一维膨胀卷积网络和二维膨胀卷积网络融合的识别模型构建、模型训练与光谱识别三个步骤。
S1,拉曼光谱预处理:
设定原始样本的拉曼数据格式为:
Wraw=[W1,W2,...,Wn]、Xraw=[X1,X2,...,Xn]和yraw=[y1,y2,...,yn]
其中,Wraw表示所有样本的拉曼位移空间,Wi表示第i个样本的拉曼位移,n表示样本数据量(在本实施例中n=1042),Xraw表示样本的信号强度空间,Xi表示第i个样本的信号强度,yraw表示样本类别空间,yi表示第i个样本的种类。
S1.1,插值运算:通过分段线性插值运算,基于原始拉曼数据创建函数,统一样本的频移范围为:[201,2248cm-1],间隔为:1cm-1,每个样本共生成2048个拉曼数据,即m=2048。
S1.2,基线矫正:采用自适应迭代加权惩罚最小二乘法,对S1.1插值运算所获得的数据进行基线矫正,以消除拉曼光谱的荧光影响。
S1.3,光滑去噪:采用Savitzky-Golay滤波器,对S1.2基线矫正所产生的数据进行光滑滤波。
S1.4,归一化:对S1.3光滑去噪所得到的数据集按下式进行归一化处理,以将每个样本的拉曼信号强度统一到[0,1]区间:
其中,xi,j为第i个样本第j个频移位置信号强度,min(xi,)为第i个样本信号强度最小值,max(xi,)为第i个样本信号强度最大值。
S1.5连续小波变换:对S1.4归一化得到的数据集,采用墨西哥帽小波为母小波函数进行小波变换,小波函数的尺度范围设为(1,31),生成的小波系数图作为二维膨胀卷积网络的输入:
其中,ν为拉曼位移,δ为尺度。
S2,构建一维膨胀卷积网络和二维膨胀卷积网络融合的识别模型,识别模型包括输入层、特征提取层、特征分类预测层和输出层,具体的识别模型如图3所示。
S2.1,将S1.4归一化得到的数据作为一维膨胀卷积网络的输入,将S1.5连续小波变换得到的小波系数图作为二维膨胀卷积网络的输入。
2.2,特征提取层包括一维膨胀卷积网络特征提取层和二维膨胀卷积网络特征提取层两部分:
一维膨胀卷积网络特征提取层由四个一维block和一个展平层构成,每个block包括一个膨胀卷积模块和一个一维最大池化模块,四个膨胀卷积模块参数(in_channels,filters,kernel_size,dilation,stride)分别为(1,6,3,2,1)、(6,16,3,2,1)、(16,32,3,2,1)和(32,64,3,2,1),所有padding为1;
二维膨胀卷积网络特征提取层由四个二维block和一个展平层构成,每个block包括一个二维膨胀卷积模块和一个二维最大池化模块;四个二维膨胀卷积模块参数(in_channels,filters,kernel_size,dilation,stride)分别为(3,8,3,2,1)、(8,16,3,2,1)、(16,32,3,2,1)和(32,64,3,2,1),所有padding为1,每个膨胀卷积操作后的数据均采用ReLU函数激活:
膨胀卷积操作后的数据,采用ReLU函数激活;
xconv_out=floor((xcon_in+2×padding-dilation×(kernel_size-1)-1)/stride+1)
其中,xcon_in为膨胀卷积层的输入数据,xconv_out为膨胀卷积层的输出数据,kernel_size为卷积核大小,dilation为膨胀系数,padding为填充大小,stride为卷积核移动步长。
最大池化模块的参数(pool_size,stride)均为(2,2),池化后输出结果为:
xpooling_out=floor((xconv_out-pool_size+2×padding)/stride+1)
其中,xconv_out为池化模块的输入数据,xpooling_out为池化模块的输出数据,pool_size为池化模块大小,padding为填充大小,stride为步长大小。
S2.3分类预测层包括1个拼接层和全连接层,拼接层由一维膨胀卷积网络和二维膨胀卷积网络的展平层组合,全连接层的神经元个数为1024,采用激活函数tanh实行非线性化,并设置dropout=0.5的策略提高泛化能力。
S3,模型训练与光谱识别,具体步骤如下:
S3.1,模型训练:对输入的光谱数据采用按层随机挑选的方法,按照8︰2分为训练集与验证集,确保训练集中包含了每种物质的样本。模型训练中采用Adam优化器,学习率(Learning_rate)为0.0001,以交叉熵损失函数(Cross Entropy Loss)为训练指标,迭代次数(Epoch)为50;经过迭代训练后的识别模型,模型稳定,保存该模型。
S3.2,光谱识别:对于待测物质,利用耦合增强SERS基底,探测物质的拉曼光谱信号,再经过光谱预处理,输入S3.1模型训练得到的识别模型,进行预测判断,并对模型进行评估。
利用测试集对模型进行评估,模型识别准确率如表1所示。为了对比光谱预处理的影响,利用模型进一步对原始拉曼数据进行训练和预测,结果如表1所示。
通过图2可知,本发明拉曼光谱探测识别方法相较于SERS增强芯片,探测精度提升了2个数量级。通过表1的结论可见,本发明拉曼光谱探测识别方法即使对于较弱的拉曼光谱信号,也能够准确识别,因而具有较高的识别准确度。
为了进一步验证本发明拉曼光谱探测识别方法(DiCNN)的性能,利用公开拉曼光谱数据集(Rruff)进行测试,并与其他常用的拉曼光谱识别方法进行对比,如支持向量机(SVM)、决策树(DT)、随机森林(RF)、偏最小二乘法(PLS)、K近邻算法(KNN)、线性判别分析法(LDA)、逻辑回归(LG)、Xgboost等。
Rruff数据,由于其数据量分别不平衡,有些样本的数据量大于20个,而有些样本的数据量只有1个。本实施例中选取了2个数据集,具体如下:
数据集A,选择了Rruff数据中样本量>10的数据,收集66类物质共1045个样本;
数据集B,选择了Rruff数据中样本量>3的数据,共收集578类物质,3394个样本;
按照本发明拉曼光谱探测识别方法的步骤,对两个数据集(A,B)中的各物质的拉曼光谱进行识别。
同样的数据划分,采用其他方法在两个数据集(A,B)上也进行了拉曼光谱的识别。
识别结果具体如下:不同方法在数据集A的准确率对比如图5所示;不同方法在数据集B的准确率对比如图6所示。不同方法在数据集B的准确率、精确率、召回率和F1-score如图7所示;不同方法在数据集B的准确率,30次的结果如表2所示。
表2:不同识别算在Rruff数据集上多次识别结果
对比发现,本发明探测方法不论是针对数据集A还是数据集B,其准确率和其他指标,比常用的LR、RF和Xgboost等识别方法性能要好,且泛化能力强。由于数据集B中很多物质的样本数较少,导致使用RF和Xgboost等识别方法的泛化能力下降明显,虽然训练准确率较高。
本发明探测方法具有探测精度高、判别准确等优点,特别适合用于便携识别痕量物的类型、品种及其“拉曼指纹”的识别。
Claims (5)
1.一种痕量物质的拉曼光谱探测识别方法,其特征是,利用拉曼光谱探测仪,采集放置在电场耦合增强SERS基底上的探测物的光谱信号,所采集的光谱信号经过拉曼光谱识别算法处理后得到对探测物的物质种类的判断结果;所述拉曼光谱识别算法包括:拉曼光谱预处理,一维膨胀卷积网络与二维膨胀卷积网络融合的识别模型的构建,以及模型训练与光谱识别。
2.根据权利要求1所述的痕量物质的拉曼光谱探测识别方法,其特征是,拉曼光谱预处理包括以下步骤:
设定原始样本的拉曼数据格式为:
Wraw=[W1,W2,...,Wn]、Xraw=[X1,X2,...,Xn]和yraw=[y1,y2,...,yn];
其中,Wraw表示所有样本的拉曼频移空间,Wi表示第i个样本的拉曼频移向量,n表示样本数据量,Xraw表示样本的信号强度空间,Xi表示第i个样本的信号强度向量,yraw表示样本类别空间,yi表示第i个样本的种类;
S1.1,插值运算:通过分段线性插值运算,基于原始拉曼数据创建函数,统一样本的频移范围为:[201,2200cm-1],间隔为:1cm-1,每个样本共生成2048个拉曼数据;
S1.2,基线矫正:采用自适应迭代加权惩罚最小二乘法,对S1.1插值运算所获得的数据进行基线矫正,以消除拉曼光谱的荧光影响;
S1.3,光滑去噪:采用Savitzky-Golay滤波器,对S1.2基线矫正所产生的数据进行光滑滤波;
S1.4,归一化:对S1.3光滑去噪所得到的数据集按下式进行归一化处理,以将每个样本的拉曼信号强度统一到[0,1]区间:
其中,xi,j为第i个样本第j个频移位置信号强度,min(xi,)为第i个样本信号强度最小值,max(xi,)为第i个样本信号强度最大值;
S1.5,连续小波变换:对S1.4归一化所得到的数据集,采用墨西哥帽小波为母小波函数,进行小波变换,生成的小波系数图作为二维膨胀卷积网络的输入。
3.根据权利要求2所述的痕量物质的拉曼光谱探测识别方法,其特征是,一维膨胀卷积网络与二维膨胀卷积网络融合的识别模型包括特征输入层、特征提取层、特征分类预测层和输出层;
S2.1,特征输入层包括:将S1.4归一化所得到的数据作为一维膨胀卷积网络的输入,将S1.5连续小波变换所得到的小波系数图作为二维膨胀卷积网络的输入;
S2.2,特征提取层包括一维膨胀卷积网络特征提取层和二维膨胀卷积网络特征提取层两部分:
一维膨胀卷积网络特征提取层采用四个一维block和一个平展层,每个block包括一个膨胀卷积模块和一个一维最大池化模块;
二维膨胀卷积网络特征提取层采用四个二维block和一个展平层,每个block包括一个二维膨胀卷积模块和一个二维最大池化模块;
每个膨胀卷积操作后的数据均采用ReLU函数激活,膨胀卷积后的数据变化为:
xconv_out=floor((xcon_in+2×padding-dilation×(kernel_size-1)-1)/stride+1)
其中,xcon_in为膨胀卷积层的输入数据,xconv_out为膨胀卷积层的输出数据,kernel_size为卷积核大小,dilation为膨胀系数,padding为填充大小,stride为卷积核移动步长;
S2.3,分类预测层包括拼接层和全连接层,拼接层用于拼接一维膨胀卷积网络和二维膨胀卷积网络的展平层,全连接层采用激活函数tanh实行非线性化,通过采用dropout策略提高泛化能力;
S2.4,输出层采用激活函数softmax,激活函数softmax的输出即为整个识别算法的预测结果。
4.根据权利要求3所述的痕量物质的拉曼光谱探测识别方法,其特征是,模型训练与光谱识别包括以下步骤:
S3.1,模型训练:对输入的光谱样本数据采用按层随机挑选的方法,按照8︰2分为训练集与验证集,以确保训练集中包含每种物质的样本;模型训练中采用Adam优化器,以交叉熵损失函数(Cross Entropy Loss)为训练指标进行迭代训练,得到神经网络模型,保存该模型;
S3.2,光谱识别:对于待测物质,利用耦合增强SERS基底,探测物质的拉曼光谱信号,再经过光谱预处理,输入S3.1模型训练得到的神经网络模型,进行预测判断,并对模型进行评估。
5.一种痕量物质的拉曼光谱探测识别系统,其特征是,包括拉曼光谱仪、拉曼探头、工控机、785nm激光器、CCD、电场耦合增强SERS基底;
所述电场耦合增强SERS基底是通过将金纳米阵列结构的SERS基底与贵金属纳米溶胶相结合,贵金属纳米颗粒激发局域表面等离子共振(LSP),导致贵金属纳米颗粒表面局域电磁场增强,同时金纳米阵列结构的SERS基底激发表面传播等离激元(SPP),导致阵列表面电磁场增强,表面传播等离激元的近场与阵列表面电磁场的近场相互耦合,形成电场耦合增强的复合SERS基底;
所述工控机执行权利要求1~4任一权利要求所述的痕量物质的拉曼光谱探测识别方法中的拉曼光谱识别算法,对痕量物质的拉曼光谱进行处理,以对痕量物质进行识别。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210586909.4A CN114878543A (zh) | 2022-05-27 | 2022-05-27 | 一种痕量物质的拉曼光谱探测识别方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210586909.4A CN114878543A (zh) | 2022-05-27 | 2022-05-27 | 一种痕量物质的拉曼光谱探测识别方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114878543A true CN114878543A (zh) | 2022-08-09 |
Family
ID=82677528
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210586909.4A Pending CN114878543A (zh) | 2022-05-27 | 2022-05-27 | 一种痕量物质的拉曼光谱探测识别方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114878543A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116030032A (zh) * | 2023-02-16 | 2023-04-28 | 四川省肿瘤医院 | 基于拉曼光谱数据的乳腺癌分析设备、系统及存储介质 |
-
2022
- 2022-05-27 CN CN202210586909.4A patent/CN114878543A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116030032A (zh) * | 2023-02-16 | 2023-04-28 | 四川省肿瘤医院 | 基于拉曼光谱数据的乳腺癌分析设备、系统及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Zhang et al. | Classification modeling method for near‐infrared spectroscopy of tobacco based on multimodal convolution neural networks | |
CN110717368A (zh) | 一种纺织品定性分类方法 | |
CN109211803B (zh) | 一种基于显微多光谱技术对微塑料进行快速识别的装置 | |
Zhou et al. | Machine learning-augmented surface-enhanced spectroscopy toward next-generation molecular diagnostics | |
CN109858477A (zh) | 用深度森林在复杂环境中识别目标物的拉曼光谱分析方法 | |
CN110346312B (zh) | 基于费氏线性判别和支持向量机技术的冬小麦穗赤霉病识别方法 | |
CN112712108B (zh) | 一种拉曼光谱多元数据分析方法 | |
CN102841070B (zh) | 由二维相关红外同步光谱识别原油种类的方法 | |
CN112098358B (zh) | 基于四元数卷积神经网络的近红外光谱并行融合定量检测方法 | |
Cai et al. | Rapid identification of ore minerals using multi-scale dilated convolutional attention network associated with portable Raman spectroscopy | |
Zhao et al. | Deep learning assisted continuous wavelet transform-based spectrogram for the detection of chlorophyll content in potato leaves | |
CN114878543A (zh) | 一种痕量物质的拉曼光谱探测识别方法及系统 | |
CN110110789A (zh) | 一种基于多谱图信息融合技术的中草药品质鉴别方法 | |
CN115905881A (zh) | 黄珍珠分类的方法以及装置、电子设备、存储介质 | |
Hu et al. | Intelligent spectral algorithm for pigments visualization, classification and identification based on Raman spectra | |
Wongravee et al. | Chemometrics as a green analytical tool | |
Chen et al. | Coupling enhanced SERS substrates and 1D dilated convolutional neural network: A new model to improve trace detection and identification | |
CN113514446A (zh) | 一种用于快速匹配识别sers谱图的方法 | |
CN110378374B (zh) | 一种模糊鉴别信息提取的茶叶近红外光谱分类方法 | |
CN114280000B (zh) | 一种原油产地的溯源方法和系统 | |
Coic et al. | Assessment of essential information in the fourier domain to accelerate raman hyperspectral microimaging | |
CN115420726A (zh) | 一种利用重构sers光谱快速识别目标物的方法 | |
Craig et al. | Pattern recognition applied to spectroscopy: Conventional methods and future directions | |
Teng et al. | Identification of antibiotic residues in aquatic products with surface-enhanced Raman scattering powered by 1-D convolutional neural networks | |
CN111007051B (zh) | 基于激光诱导荧光光谱的蜂蜜检测方法及其检测装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |