CN115389482A - 一种基于拉曼光谱和图像算法的物质检测方法 - Google Patents
一种基于拉曼光谱和图像算法的物质检测方法 Download PDFInfo
- Publication number
- CN115389482A CN115389482A CN202211041783.9A CN202211041783A CN115389482A CN 115389482 A CN115389482 A CN 115389482A CN 202211041783 A CN202211041783 A CN 202211041783A CN 115389482 A CN115389482 A CN 115389482A
- Authority
- CN
- China
- Prior art keywords
- raman spectrum
- time
- frequency domain
- data
- raman
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000001237 Raman spectrum Methods 0.000 title claims abstract description 73
- 238000004422 calculation algorithm Methods 0.000 title claims abstract description 20
- 238000001514 detection method Methods 0.000 title claims abstract description 16
- 239000000126 substance Substances 0.000 title claims description 20
- 238000012549 training Methods 0.000 claims abstract description 23
- 238000013526 transfer learning Methods 0.000 claims abstract description 15
- 239000000203 mixture Substances 0.000 claims abstract description 13
- 230000003595 spectral effect Effects 0.000 claims abstract description 11
- 238000010606 normalization Methods 0.000 claims abstract description 10
- 239000007788 liquid Substances 0.000 claims abstract description 5
- 238000013508 migration Methods 0.000 claims abstract description 5
- 230000005012 migration Effects 0.000 claims abstract description 5
- 239000007787 solid Substances 0.000 claims abstract description 5
- 239000007789 gas Substances 0.000 claims abstract description 4
- 238000002156 mixing Methods 0.000 claims abstract description 4
- 238000000034 method Methods 0.000 claims description 40
- 230000004927 fusion Effects 0.000 claims description 22
- 230000006870 function Effects 0.000 claims description 20
- 238000013528 artificial neural network Methods 0.000 claims description 17
- 238000013135 deep learning Methods 0.000 claims description 17
- 238000001069 Raman spectroscopy Methods 0.000 claims description 16
- 238000012795 verification Methods 0.000 claims description 14
- 230000009466 transformation Effects 0.000 claims description 12
- 230000008859 change Effects 0.000 claims description 10
- 238000007500 overflow downdraw method Methods 0.000 claims description 9
- 238000001228 spectrum Methods 0.000 claims description 7
- 238000005457 optimization Methods 0.000 claims description 6
- 238000005070 sampling Methods 0.000 claims description 6
- 239000013598 vector Substances 0.000 claims description 6
- 230000008569 process Effects 0.000 claims description 4
- 238000013459 approach Methods 0.000 claims description 3
- 238000007405 data analysis Methods 0.000 claims description 3
- 238000011156 evaluation Methods 0.000 claims description 3
- 238000009499 grossing Methods 0.000 claims description 3
- 238000000265 homogenisation Methods 0.000 claims description 3
- 238000004806 packaging method and process Methods 0.000 claims description 3
- 238000007781 pre-processing Methods 0.000 claims description 3
- 230000002194 synthesizing effect Effects 0.000 claims description 3
- 230000035945 sensitivity Effects 0.000 abstract description 6
- 239000000463 material Substances 0.000 abstract description 4
- 238000004458 analytical method Methods 0.000 description 11
- 150000001298 alcohols Chemical class 0.000 description 7
- 238000012545 processing Methods 0.000 description 6
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 4
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- KBPLFHHGFOOTCA-UHFFFAOYSA-N 1-Octanol Chemical compound CCCCCCCCO KBPLFHHGFOOTCA-UHFFFAOYSA-N 0.000 description 2
- BBMCTIGTTCKYKF-UHFFFAOYSA-N 1-heptanol Chemical compound CCCCCCCO BBMCTIGTTCKYKF-UHFFFAOYSA-N 0.000 description 2
- LRHPLDYGYMQRHN-UHFFFAOYSA-N N-Butanol Chemical compound CCCCO LRHPLDYGYMQRHN-UHFFFAOYSA-N 0.000 description 2
- AMQJEAYHLZJPGS-UHFFFAOYSA-N N-Pentanol Chemical compound CCCCCO AMQJEAYHLZJPGS-UHFFFAOYSA-N 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- ZSIAUFGUXNUGDI-UHFFFAOYSA-N hexan-1-ol Chemical compound CCCCCCO ZSIAUFGUXNUGDI-UHFFFAOYSA-N 0.000 description 2
- 238000000513 principal component analysis Methods 0.000 description 2
- 230000001131 transforming effect Effects 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000007635 classification algorithm Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- BDERNNFJNOPAEC-UHFFFAOYSA-N propan-1-ol Chemical compound CCCO BDERNNFJNOPAEC-UHFFFAOYSA-N 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/62—Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
- G01N21/63—Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
- G01N21/65—Raman scattering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/80—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
- G06V10/803—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of input or preprocessed data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Databases & Information Systems (AREA)
- Multimedia (AREA)
- Investigating, Analyzing Materials By Fluorescence Or Luminescence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Biochemistry (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
Abstract
本发明公开了一种基于拉曼光谱和图像算法的物质检测方法,包括以下步骤:S1.采集各种不同形态样品包括固体、液体、气体及各个形态不同混合比例的混合物拉曼光谱数据;S2.对样品的拉曼光谱数据进行归一化预处理;S3.将所有归一化后的拉曼光谱数据分别经过连续小波变换CWT和短时傅里叶变换STFT后得到CWT时频域二维数据尺度图和STFT时频域二维数据尺度图;S4.融合CWT时频域二维数据尺度图分别与对应的STFT时频域二维数据尺度图,构建融合光谱图象数据库;S5.对迁移学习网络模型进行训练;S6.采集待测物不同浓度时的拉曼光谱数据,通过训练好的迁移学习网络模型对待测物进行分类。本发明有效提高检测准确率和灵敏度。
Description
技术领域
本发明涉及生物化学技术领域,更具体的说是涉及一种基于拉曼光谱和图像算法的物质检测方法。
背景技术
拉曼光谱分析法是印度科学家C.V.拉曼所发现的拉曼散射效应,对所产生的与入射光频率不同的散射光谱进行分析,可以得到不同结构分子的独特振动、转动等方面的信息,可以应用于对物质的定性和定量检测分析研究。
现有的拉曼光谱处理技术大多基于一维序列信号对光谱的一维图像的谱峰强度、谱带宽度等特征信号进行分析,通常情况下使用的是传统的化学计量学方法如多元线性回归(MLR)、主成分分析(PCA)、线性判别分析(LDA)、偏最小偏二乘(PLS)等。这类方法拟合性和鲁棒性较差,不能很好地对光谱特征进行提取和分析,人工智能算法的出现有效地优化和改善了这一问题。
人工智能算法中的深度学习方法由于独特的局部感知以及能自动从各类数据中快速地提取特征的能力,能够应用于化学计量学和拉曼光谱技术,但是对于一维信号的处理,一维深度神经网络跟二维深度神经网络相比还不够成熟,其特征提取和特征学习计算能力还达不到二维卷积神经网络的水平,而且需要大量数据进行训练学习。其次,一维的深度神经网络比起种类偏少,泛化能力不强,这限制了人工智能算法在光谱信号处理上的高效快速应用。
连续小波变换(CWT)和短时傅里叶变换(STFT)是两种能过够将一维信号转换为二维图像的一种在时频分析领域广泛应用的技术方法,它们继承和发展了傅立叶变换的思想,同时又克服了不能根据频率变化等缺点,能够将时域信号变为频域信号,是进行信号时频分析和处理的理想工具。它的主要特点是通过变换能够充分突出问题某些方面的特征,能对时间(空间)频率的局部化分析,能自动适应时频信号分析的要求。而基于深度学习的图像融合技术能够把两种变换所得到的图像进行特征提取和特征融合,最终得到包含两种变换特征的融合图像,跟一维数据或者只通过CWT或STFT单一变换的图像数据相比,融合图像极大降低了后续的特征分析的难度,提高了分析准确率和灵敏度。
针对拉曼光谱的检测分析而言,传统的机器学习方法如SVM、KNN等在处理一维信号时其特征提取和特征学习计算能力还达不到二维深度神经网络针对图像处理的水平,其次设计网络时需要大量数据进行训练学习,浪费时间、人力成本。
传统的拉曼光谱识别技术,在分析复杂混合物的场景中,表现较差。
因此,如何提供一种快速且准确的基于拉曼光谱和图像算法的物质检测方法是本领域技术人员亟需解决的问题。
发明内容
有鉴于此,本发明提供了一种基于拉曼光谱和图像算法的物质检测方法,目的在于提高检测方法的灵敏度,能够更加快速、准确的识别出待测物质及其混合物。
为了实现上述目的,本发明采用如下技术方案:
一种基于拉曼光谱和图像算法的物质检测方法,包括以下步骤:
S1.通过不同波长的拉曼光谱仪采集各种不同形态样品的拉曼光谱数据,并建立各类样品的一维拉曼光谱数据库;其中样品包括:固体、液体、气体及各个形态不同混合比例的混合物;
S2.对样品的所述拉曼光谱数据进行归一化预处理,使得预处理的数据被限定在[0,1]范围内;
S3.将所有归一化后的所述拉曼光谱数据分别经过连续小波变换CWT和短时傅里叶变换STFT后得到CWT时频域二维数据尺度图和STFT时频域二维数据尺度图;
S4.通过深度学习图像融合方法将每个所述CWT时频域二维数据尺度图分别与对应的所述STFT时频域二维数据尺度图进行融合,生成的融合图像构成拉曼光谱融合图像数据库;
S5.将所述拉曼光谱数据库分为训练集和验证集,通过训练集对迁移学习网络模型进行训练,并通过验证集完成训练后模型的验证,得到训练好的迁移学习网络模型;
S6.采集待测物不同浓度时的拉曼光谱数据,通过训练好的迁移学习网络模型对所述待测物进行分类。
优选的,S2的具体内容包括:
设原始拉曼光谱信号为Y={yi|i=1,2,...N},其中N表示原始拉曼光谱的数目,每个拉曼光谱信号表示为yi(t),t=[t1,t2...,tn],n表示每个拉曼位移序列的长度,yi(tj)表示在tj位置拉曼光谱信号强度;所述归一化过程具体为将拉曼光谱的所有的谱峰强度数据除以谱峰强度最大值yi(tj)max。
优选的,S2中预处理还包括去噪声和平滑。
优选的,所述连续小波变换CWT的过程中的母小波包括Morse小波、Morlet小波和/或bump小波。
优选的,将归一化后的所述拉曼光谱数据经过连续小波变换CWT得到CWT时频域二维数据尺度图的具体内容包括:
1)采用所述Morse小波作为所述母小波将拉曼光谱信号变为时频域二维信号,其中所述Morse小波为:
其中,ω为数字域频率,表示序列变化的速率,其表达式为ω=2πf*Ts,其中Ts是采样周期,为Morse小波,U(ω)是单位步长,a是归一化常数,β是时间带宽积,γ为对称参数表征Morse小波的对称性;
2)根据光谱分辨率,设置时间带宽积β和对称参数γ,计算出ω,并将拉曼光谱数据作为输入,通过Morse小波进行特征变换:
其中,b为长度固定的缩放因子;
优选的,将归一化后的所述拉曼光谱数据经过短时傅里叶变换STFT得到STFT时频域二维数据尺度图的具体内容包括:
采用短时傅里叶变换将拉曼光谱信号变为时频域二维信号,短时傅里叶变换为:
其中,yi(t)是为输入信号,ω为数字域频率,表示序列变化的速率,其表达式为ω=2πf*Ts,其中Ts是采样周期,ω*(t-t′)为Kaiser窗函数:
其中k,λ是一个可调整常数参数,I0为第一类贝瑟尔函数:
设置长度k、形状参数β,同时指定最终输出序列长度为拉曼光谱的个数的一半左右进行STFT变换,得到STFT时频域二维数据;
优选的,窗函数还包括矩形窗Rectangular、海明窗Hamming、汉宁窗Hanning和布莱克曼窗Blackman。
优选的,S4中通过深度学习图像融合方法生成的融合图像的内容包括:
将所述CWT时频域二维数据尺度图和所述STFT时频域二维数据尺度图分别转换成向量z和x;
根据深度学习图像融合网络初始参数进行数据解析,将多源信道所采集到的关于目标的图像数据经过深度卷积神经网络层,提取z和x中的特征;
通过loss函数sigmoid_cross_entropy进行评估判别,经过重复评估和参数调整,将损失函数降低到趋近于0得到综合成高质量的向量,并生成融合图像。
优选的,S5的具体内容包括:
将处理好的图片数据库进行训练集和验证集的划分,通过数字编码方法对图片数据进行标记,运用pytorch框架,选择MobileNet模型作为迁移学习网络模型,训练网络模型:
1)导入预训练的MobileNet模型结构;
2)修改所述MobileNet模型分类器部分的结构,修改最后一个线性层的输出数值;
3)将所述融合图片数据经过均一化处理后输入到所述MobileNet模型中;
4)封装所述MobileNet模型的神经网络卷积层,准备进行第一次迭代,选择优化器对网络进行优化,设置初始学习率,根据数据量,设置迭代次数;主要优化参数为网络的分类器部分,并通过add_param_group方法和sparse_categorical_crossentropy损失函数将其他部分随着训练的进行添加到优化器中;
5)将所述MobileNet模型的部分神经网络卷积层进行解封,学习率设置为小于或等于初始学习率的十分之一,同时减少迭代次数,根据步骤4)对所述MobileNet模型参数进行进一步迭代优化;并保存网络参数。
优选的,所述迁移学习网络模型还包括GoogleNet和ResNet,所述深度学习图像融合方法采用VGG19网络。
经由上述的技术方案可知,与现有技术相比,本发明公开提供了一种基于拉曼光谱和图像算法的物质检测方法,区别于传统的光谱识别算法,本发明通过用两种不同的时频分析技术(CWT,STFT)将拉曼光谱数据变为更加有利于分析的二维图像数据,并根据深度学习算法进行图像融合,得到具有更多物质特征的拉曼光谱图像,并建立了融合光谱图像数据库,最后通过迁移学习的方式对其进行分析。对比传统的化学计量学和深度学习分析方法,该方法灵敏度更高,能够更加快速、准确的识别出待测物质及其混合物。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明提供的一种基于拉曼光谱和图像算法的物质检测方法流程示意图;
图2为本发明实施例中提供的各种醇类的拉曼光谱图;
图3为本发明实施例中提供的乙醇经过的CWT和STFT变换以及融合后的二维图像;
图4为本发明实施例中提供的迁移学习和图像融合网络结构示意图;
图5为本发明实施例中提供的基于MobileNet模型进行迁移学习的物质识别结果。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例公开了一种基于拉曼光谱和图像算法的物质检测方法,包括以下步骤:
S1.通过不同波长的拉曼光谱仪采集各种不同形态样品的拉曼光谱数据,并建立各类样品的一维拉曼光谱数据库;其中样品包括:固体、液体、气体及各个形态不同混合比例的混合物;
S2.对样品的拉曼光谱数据进行归一化预处理,使得预处理的数据被限定在[0,1]范围内,从而消除奇异样本数据导致的不良影响,提高分析精度和速率;
S3.将所有归一化后的拉曼光谱数据分别经过连续小波变换CWT和短时傅里叶变换STFT后得到CWT时频域二维数据尺度图和STFT时频域二维数据尺度图;
S4.通过深度学习图像融合方法将每个CWT时频域二维数据尺度图分别与对应的STFT时频域二维数据尺度图进行融合,生成的融合图像构成拉曼光谱融合图像数据库;
S5.将拉曼光谱数据库分为训练集和验证集,通过训练集对迁移学习网络模型进行训练,并通过验证集完成训练后模型的验证,得到训练好的迁移学习网络模型;
S6.采集待测物不同浓度时的拉曼光谱数据,通过训练好的迁移学习网络模型对待测物进行分类。
在本实施例中,用不同波长(532nm,785nm,1064nm)的拉曼光谱仪器采集不同醇类物质及其混合物的拉曼光谱数据。本次验证实验,测试了八种醇类(甲醇、乙醇、丙醇、丁醇、戊醇、己醇、庚醇、辛醇)数据,其中包括八种醇类的纯净物、两种醇类按照同等比例和不同比例的混合物、四种醇类同等比例和不同比例的混合物、八种醇类同等比例混合物,并建立相应物质的一维拉曼光谱数据库。
为了进一步实施上述技术方案,S2的具体内容包括:
设原始拉曼光谱信号为Y={yi|i=1,2,...N},其中N表示原始拉曼光谱的数目,每个拉曼光谱信号表示为yi(t),t=[t1,t2...,tn],n表示每个拉曼位移序列的长度,yi(tj)表示在tj位置拉曼光谱信号强度;归一化过程具体为将拉曼光谱的所有的谱峰强度数据除以谱峰强度最大值yi(tj)max。
为了进一步实施上述技术方案,S2中预处理还包括去噪声和平滑。
为了进一步实施上述技术方案,连续小波变换CWT的过程中的母小波包括Morse小波、Morlet小波和/或bump小波。
为了进一步实施上述技术方案,将归一化后的拉曼光谱数据经过连续小波变换CWT得到CWT时频域二维数据尺度图的具体内容包括:
1)采用Morse小波作为母小波将拉曼光谱信号变为时频域二维信号,其中Morse小波为:
其中,ω为数字域频率,表示序列变化的速率,其表达式为ω=2πf*Ts,其中Ts是采样周期,为Morse小波,U(ω)是单位步长,a是归一化常数,β是时间带宽积,γ为对称参数表征Morse小波的对称性;
2)根据光谱分辨率,设置时间带宽积β和对称参数γ,计算出ω,并将拉曼光谱数据作为输入,通过Morse小波进行特征变换:
其中,b为长度固定的缩放因子;
在本实施例中,设置时间带宽积β=60,对称参数γ=3,b设置为长度固定的缩放因子1。
为了进一步实施上述技术方案,将归一化后的拉曼光谱数据经过短时傅里叶变换STFT得到STFT时频域二维数据尺度图的具体内容包括:
采用短时傅里叶变换将拉曼光谱信号变为时频域二维信号,短时傅里叶变换为:
其中,yi(t)是为输入信号,ω为数字域频率,表示序列变化的速率,其表达式为ω=2πf*Ts,其中Ts是采样周期,ω*(t-t′)为Kaiser窗函数:
其中k,λ是一个可调整常数参数,I0为第一类贝瑟尔函数:
设置长度k、形状参数λ,同时指定最终输出序列长度为拉曼光谱的个数的一半左右进行STFT变换,得到STFT时频域二维数据;
为了进一步实施上述技术方案,窗函数还包括Kaiser窗函数、矩形窗Rectangular、海明窗Hamming、汉宁窗Hanning和布莱克曼窗Blackman。
在本实施例中,设置长度为N=256,形状参数β=5,将重叠长度指定为500个左右的样本,同时将输出序列信号长度指定为1000个左右的点。
与其他窗相比,Kaiser窗最大的特点是可以同时调整主瓣和旁瓣宽度,将更有利于不同谱峰信号变换的拉曼光谱的特征变换。
为了进一步实施上述技术方案,S4中通过深度学习图像融合方法生成的融合图像的内容包括:
将CWT时频域二维数据尺度图和STFT时频域二维数据尺度图分别转换成向量z和x;
根据深度学习图像融合网络初始参数进行数据解析,将多源信道所采集到的关于目标的图像数据经过深度卷积神经网络层,提取z和x中的特征;
通过loss函数sigmoid_cross_entropy进行评估判别,经过重复评估和参数调整,将损失函数降低到趋近于0得到综合成高质量的向量,并生成融合图像。
为了进一步实施上述技术方案,S5的具体内容包括:
将处理好的图片数据库进行训练集和验证集的划分,通过数字编码方法对图片数据进行标记,运用pytorch框架,选择MobileNet模型进行迁移学习,训练网络模型:
1)导入预训练的MobileNet模型结构;
2)修改MobileNet模型分类器部分的结构,修改最后一个线性层的输出数值;
3)将融合图片数据经过均一化处理后输入到MobileNet模型中;
4)封装MobileNet模型的神经网络卷积层,准备进行第一次迭代,选择优化器对网络进行优化,设置初始学习率,根据数据量,设置迭代次数;主要优化参数为网络的分类器部分,并通过add_param_group方法和sparse_categorical_crossentropy损失函数将其他部分随着训练的进行添加到优化器中;
5)将MobileNet模型的部分神经网络卷积层进行解封,学习率设置为小于或等于初始学习率的十分之一,同时减少迭代次数,根据步骤4)对MobileNet模型参数进行进一步迭代优化;并保存网络参数。
在本实施例中,训练集80%,验证集20%,运用pytorch框架,选择MobileNet模型进行迁移学习,训练网络模型。1)中导入torchvion中经过ImageNet数据集预训练的MobileNet深度神经网络结构。2)中将最后一个linear层的输出改为22;4)中选择Adam优化器对网络进行优化,初始学习率为0.0001,根据数据量,将迭代次数设置为50次左右。识别结果如图5所述。
为了进一步实施上述技术方案,迁移学习网络模型还包括GoogleNet和ResNet,深度学习图像融合方法采用VGG19网络。
本发明在应用方面具备以下有益效果:
1.神经网络收敛速度快,可以凭借少量的样本和极短的训练时间,达到非常高的识别准确率。
2.一维数据转换成两种二维图像并进行图像合成,能够使得不同图像中的有用信息互补,提高检测准确率和灵敏度,还能更充分利用丰富的图像分类算法。
3.提出了将一维信号用于深度学习图像融合的新方法,能够用图像融合的方式找到更多的可用信息和有用特征。
4.能以更高灵敏度、准确率和速度同时分辨纯净物、混合物及其所包含物质种类。
5.拉曼光谱数据采样方便快捷,能够检测液体、固体等多种类型样品,针对各个场景如火车站、机场、医院等有安全隐患的公共场所的快速检测具有实际意义。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (10)
1.一种基于拉曼光谱和图像算法的物质检测方法,其特征在于,包括以下步骤:
S1.通过不同波长的拉曼光谱仪采集各种不同形态样品的拉曼光谱数据,并建立各类样品的一维拉曼光谱数据库;其中样品包括:固体、液体、气体及各个形态不同混合比例的混合物;
S2.对样品的所述拉曼光谱数据进行归一化预处理,使得预处理的数据被限定在[0,1]范围内;
S3.将所有归一化后的所述拉曼光谱数据分别经过连续小波变换CWT和短时傅里叶变换STFT后得到CWT时频域二维数据尺度图和STFT时频域二维数据尺度图;
S4.通过深度学习图像融合方法将每个所述CWT时频域二维数据尺度图分别与对应的所述STFT时频域二维数据尺度图进行融合,生成的融合图像构成拉曼光谱融合图像数据库;
S5.将所述拉曼光谱数据库分为训练集和验证集,通过训练集对迁移学习网络模型进行训练,并通过验证集完成训练后模型的验证,得到训练好的迁移学习网络模型;
S6.采集待测物不同浓度时的拉曼光谱数据,通过训练好的迁移学习网络模型对所述待测物进行分类。
2.根据权利要求1所述的一种基于拉曼光谱和图像算法的物质检测方法,其特征在于,S2的具体内容包括:
设原始拉曼光谱信号为Y={yi|i=1,2,…N},其中N表示原始拉曼光谱的数目,每个拉曼光谱信号表示为yi(t),t=[t1,t2…,tn],n表示每个拉曼位移序列的长度,yi(tj)表示在tj位置拉曼光谱信号强度;所述归一化过程具体为将拉曼光谱的所有的谱峰强度数据除以谱峰强度最大值yi(tj)max。
3.根据权利要求1所述的一种基于拉曼光谱和图像算法的物质检测方法,其特征在于,S2中预处理还包括去噪声和平滑。
4.根据权利要求1所述的一种基于拉曼光谱和图像算法的物质检测方法,其特征在于,所述连续小波变换CWT的过程中的母小波包括Morse小波、Morlet小波和/或bump小波。
5.根据权利要求4所述的一种基于拉曼光谱和图像算法的物质检测方法,其特征在于,将归一化后的所述拉曼光谱数据经过连续小波变换CWT得到CWT时频域二维数据尺度图的具体内容包括:
1)采用所述Morse小波作为所述母小波将拉曼光谱信号变为时频域二维信号,其中所述Morse小波为:
其中,ω为数字域频率,表示序列变化的速率,其表达式为ω=2πf*Ts,其中Ts是采样周期,为Morse小波,U(ω)是单位步长,a是归一化常数,β是时间带宽积,γ为对称参数表征Morse小波的对称性;
2)根据光谱分辨率,设置时间带宽积β和对称参数γ,计算出ω,并将拉曼光谱数据作为输入,通过Morse小波进行特征变换:
其中,b为长度固定的缩放因子;
6.根据权利要求1所述的一种基于拉曼光谱和图像算法的物质检测方法,其特征在于,将归一化后的所述拉曼光谱数据经过短时傅里叶变换STFT得到STFT时频域二维数据尺度图的具体内容包括:
采用短时傅里叶变换将拉曼光谱信号变为时频域二维信号,短时傅里叶变换为:
其中,yi(t)是为输入信号,该公式ω与前文中ω含义相同,都为数字域频率,表示序列变化的速率,ω*(t-t')为Kaiser窗函数:
其中k,λ是一个可调整常数参数,I0为第一类贝瑟尔函数:
设置长度k、形状参数λ,同时指定最终输出序列长度为拉曼光谱的个数的一半左右进行STFT变换,得到STFT时频域二维数据;
7.根据权利要求6所述的一种基于拉曼光谱和图像算法的物质检测方法,其特征在于,窗函数还包括矩形窗Rectangular、海明窗Hamming、汉宁窗Hanning和布莱克曼窗Blackman。
8.根据权利要求1所述的一种基于拉曼光谱和图像算法的物质检测方法,其特征在于,S4中通过深度学习图像融合方法生成的融合图像的内容包括:
将所述CWT时频域二维数据尺度图和所述STFT时频域二维数据尺度图分别转换成向量z和x;
根据深度学习图像融合网络初始参数进行数据解析,将多源信道所采集到的关于目标的图像数据经过深度卷积神经网络层,提取z和x中的特征;
通过loss函数sigmoid_cross_entropy进行评估判别,经过重复评估和参数调整,将损失函数降低到趋近于0得到综合成高质量的向量,并生成融合图像。
9.根据权利要求1所述的一种基于拉曼光谱和图像算法的物质检测方法,其特征在于,S5的具体内容包括:
将处理好的图片数据库进行训练集和验证集的划分,通过数字编码方法对图片数据进行标记,运用pytorch框架,选择MobileNet模型作为迁移学习网络模型,训练网络模型:
1)导入预训练的MobileNet模型结构;
2)修改所述MobileNet模型分类器部分的结构,修改最后一个线性层的输出数值;
3)将所述融合图片数据经过均一化处理后输入到所述MobileNet模型中;
4)封装所述MobileNet模型的神经网络卷积层,准备进行第一次迭代,选择优化器对网络进行优化,设置初始学习率,根据数据量,设置迭代次数;主要优化参数为网络的分类器部分,并通过add_param_group方法和sparse_categorical_crossentropy损失函数将其他部分随着训练的进行添加到优化器中;
5)将所述MobileNet模型的部分神经网络卷积层进行解封,学习率设置为小于或等于初始学习率的十分之一,同时减少迭代次数,根据步骤4)对所述MobileNet模型参数进行进一步迭代优化;并保存网络参数。
10.根据权利要求1所述的一种基于拉曼光谱和图像算法的物质检测方法,其特征在于,所述迁移学习网络模型还包括GoogleNet和ResNet,所述深度学习图像融合方法采用VGG19网络。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211041783.9A CN115389482A (zh) | 2022-08-29 | 2022-08-29 | 一种基于拉曼光谱和图像算法的物质检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211041783.9A CN115389482A (zh) | 2022-08-29 | 2022-08-29 | 一种基于拉曼光谱和图像算法的物质检测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115389482A true CN115389482A (zh) | 2022-11-25 |
Family
ID=84122116
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211041783.9A Withdrawn CN115389482A (zh) | 2022-08-29 | 2022-08-29 | 一种基于拉曼光谱和图像算法的物质检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115389482A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116363440A (zh) * | 2023-05-05 | 2023-06-30 | 北京建工环境修复股份有限公司 | 基于深度学习的土壤中有色微塑料的识别检测方法及系统 |
-
2022
- 2022-08-29 CN CN202211041783.9A patent/CN115389482A/zh not_active Withdrawn
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116363440A (zh) * | 2023-05-05 | 2023-06-30 | 北京建工环境修复股份有限公司 | 基于深度学习的土壤中有色微塑料的识别检测方法及系统 |
CN116363440B (zh) * | 2023-05-05 | 2023-12-19 | 北京建工环境修复股份有限公司 | 基于深度学习的土壤中有色微塑料的识别检测方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107219188B (zh) | 一种基于改进dbn的近红外光谱分析纺织品棉含量的方法 | |
CN110068544B (zh) | 物质识别网络模型训练方法及太赫兹光谱物质识别方法 | |
CN101915744A (zh) | 物质成分含量的近红外光谱无损检测方法及装置 | |
CN109163997B (zh) | 一种基于声谱图深度学习的岩石表面强度测定方法 | |
CN115326783B (zh) | 拉曼光谱预处理模型生成方法、系统、终端及存储介质 | |
CN102799892B (zh) | 一种mfcc水下目标特征提取和识别方法 | |
CN107121407B (zh) | 基于pso-ricaelm的近红外光谱分析鉴别翠冠梨成熟度的方法 | |
CN110243806A (zh) | 拉曼光谱下基于相似度的混合物组分识别方法 | |
CN107247033B (zh) | 基于快速衰减式淘汰算法和plsda鉴别黄花梨成熟度的方法 | |
CN106408012A (zh) | 一种模糊鉴别聚类的茶叶红外光谱分类方法 | |
CN115389482A (zh) | 一种基于拉曼光谱和图像算法的物质检测方法 | |
CN113008805A (zh) | 基于高光谱成像深度分析的白芷饮片质量预测方法 | |
CN113378680B (zh) | 一种拉曼光谱数据的智能建库方法 | |
CN110110789A (zh) | 一种基于多谱图信息融合技术的中草药品质鉴别方法 | |
CN103411906A (zh) | 珍珠粉和贝壳粉的近红外光谱定性鉴别方法 | |
Xia et al. | Non-destructive analysis the dating of paper based on convolutional neural network | |
Fu et al. | Application of wavelet transforms to improve prediction precision of near infrared spectra | |
CN115770044A (zh) | 基于脑电相位幅值耦合网络的情绪识别方法及装置 | |
Chen et al. | Underwater acoustic target classification with joint learning framework and data augmentation | |
CN113947117A (zh) | 一种用于拉曼光谱学的基于多项式重建算法的cnn迁移学习方法 | |
CN114112983A (zh) | 一种基于Python数据融合的藏药全缘叶绿绒蒿产地判别方法 | |
CN113310943A (zh) | 一种基于机器学习的藕粉掺假鉴别方法 | |
Wang et al. | Raman spectrum model transfer method based on Cycle-GAN | |
CN104764734A (zh) | 基于拉曼光谱和svm算法的果汁香精香料的鉴别方法 | |
Qin et al. | Characterization of unplasticized polyvinyl chloride windows by confocal raman microspectroscopy and chemometrics |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20221125 |
|
WW01 | Invention patent application withdrawn after publication |