CN113030060A - 基于卷积神经网络的毒品拉曼光谱识别方法 - Google Patents
基于卷积神经网络的毒品拉曼光谱识别方法 Download PDFInfo
- Publication number
- CN113030060A CN113030060A CN201911354748.0A CN201911354748A CN113030060A CN 113030060 A CN113030060 A CN 113030060A CN 201911354748 A CN201911354748 A CN 201911354748A CN 113030060 A CN113030060 A CN 113030060A
- Authority
- CN
- China
- Prior art keywords
- layer
- classifier
- raman spectra
- pooling
- drug
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001237 Raman spectrum Methods 0.000 title claims abstract description 150
- 238000000034 method Methods 0.000 title claims abstract description 41
- 238000013527 convolutional neural network Methods 0.000 title claims abstract description 33
- 239000003814 drug Substances 0.000 title claims description 121
- 229940079593 drug Drugs 0.000 title claims description 121
- 238000012549 training Methods 0.000 claims abstract description 45
- 238000011176 pooling Methods 0.000 claims description 79
- 238000001514 detection method Methods 0.000 claims description 15
- 230000005284 excitation Effects 0.000 claims description 12
- 238000007781 pre-processing Methods 0.000 claims description 12
- 230000008569 process Effects 0.000 claims description 7
- 230000003044 adaptive effect Effects 0.000 claims description 6
- 238000004590 computer program Methods 0.000 claims description 6
- 238000012937 correction Methods 0.000 claims description 6
- 238000007477 logistic regression Methods 0.000 claims description 6
- 238000001914 filtration Methods 0.000 claims description 3
- 230000006870 function Effects 0.000 description 13
- 239000000380 hallucinogen Substances 0.000 description 12
- 238000001069 Raman spectroscopy Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 9
- 230000004913 activation Effects 0.000 description 8
- 238000012360 testing method Methods 0.000 description 7
- 239000000021 stimulant Substances 0.000 description 6
- 239000000126 substance Substances 0.000 description 6
- 229920002472 Starch Polymers 0.000 description 4
- 239000003795 chemical substances by application Substances 0.000 description 4
- 150000003839 salts Chemical class 0.000 description 4
- 235000019698 starch Nutrition 0.000 description 4
- 239000008107 starch Substances 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 238000010276 construction Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 230000000873 masking effect Effects 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 230000001678 irradiating effect Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000010183 spectrum analysis Methods 0.000 description 1
- 238000001845 vibrational spectrum Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/62—Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
- G01N21/63—Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
- G01N21/65—Raman scattering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2201/00—Features of devices classified in G01N21/00
- G01N2201/12—Circuits of general importance; Signal processing
- G01N2201/129—Using chemometrical methods
- G01N2201/1296—Using chemometrical methods using neural networks
Abstract
公开了一种基于卷积神经网络(CNN)的拉曼光谱识别方法,包括:构建基于卷积神经网络的分类器;使用包含拉曼光谱的训练数据集对所述分类器进行训练,以得到经训练的分类器;获取待测样品的拉曼光谱;以及使用所述经训练的分类器对所获取的拉曼光谱进行检测。
Description
技术领域
本发明涉及安全检测的技术领域,并且更具体地涉及基于毒品的拉曼光谱的识别。
背景技术
拉曼光谱是一种分子振动光谱,它可以反映分子的指纹特征。拉满光谱被广泛地用于对物质的检测。拉曼光谱检测是一种通过检测待测样品针对激发光的拉曼散射效应所产生的拉曼光谱来检测和识别物质的一种技术。
物质由于拉曼散射效应而产生的拉曼光谱谱带的数目、频率位移、谱带强度及形状等与分子的振动及转动直接相关联。拉曼散射效应普遍存在于一切分子中。不同类型的物质都有对应的“指纹”拉曼光谱,并且在一定条件下,其强度与物质浓度成线性关系。据此可以实现对物质结构、成分、浓度的检测。与红外、近红外、紫外荧光等光谱分析手段相比,拉曼光谱具有突出优势,包括:广泛的检测范围;无损、快速、无污染;远距离测试技术;检测灵敏度高等。由于上述优点,拉曼光谱目前被普遍用于对毒品的检测。
现有的用于毒品的拉曼光谱检测方法主要包括以下步骤:测量待测样品的原始拉曼光谱;以及将所得的拉曼光谱与数据库中的毒品拉曼光谱进行较,以确定待测样品是否包含毒品。该方法严重依赖于所测量的拉曼光谱的准确度。在所获得的拉曼光谱的准确度不高的情况下,该方法的识别精度可能会降低。
发明内容
基于上述问题,本发明的目的是提供一种以提高的精度来识别毒品拉曼光谱的备选方案。
在本申请的第一方面,上述目的是通过一种基于卷积神经网络(ConvolutionalNeural Network,CNN)的拉曼光谱识别方法来实现的。该方法可以包括:构建基于CNN的分类器;使用包含拉曼光谱的训练数据集对所述分类器进行训练,以得到经训练的分类器;获取待测样品的拉曼光谱;以及使用所述经训练的分类器对所获取的拉曼光谱进行检测。
在一个实施例中,所述方法还可以包括:在所述检测之前,对所述所获取的拉曼光谱进行预处理,其中所述预处理包括基线校正和/或自适应滤波。
在一个实施例中,所述方法还可以包括:在所述检测之前,对经预处理的拉曼光谱进行小波变换,以得到近似拉曼光谱。
在一个实施例中,构建基于CNN的所述分类器可以包括构建分类器的输入层、第一卷积层、第一池化层、第二卷积层、第二池化层、激励层和全连接层。所述输入层用于接收输入数据。所述第一卷积层可以采用6种特征尺寸为13*1的卷积核对所述输入数据进行卷积运算,从而得到6个特征图。所述第一池化层可以采用特征尺寸为3*1的一个滤波器来对所述第一卷积层输出的6个特征图进行池化运算,从而得到经池化的6个特征图。所述第二卷积层可以采用16种特征尺寸为13*1的6通道卷积核来对所述第一池化层输出的6个特征图进行卷积运算,从而得到16个特征图。所述第二池化层可以采用特征尺寸为3*1的一个滤波器来对所述第二卷积层输出的16个特征图进行池化运算,从而得到经池化的16个特征图。所述激励层可以使用逻辑回归模型对所述第二池化层输出的16个特征图进行判定。所述全连接层中的节点的数量可以取决于要由所述分类器进行分类的类别的数量。
在一个实施例中,所述分类器的所述全连接层可以包括两个节点。在该实施例中,所述训练数据集可以包括各种毒品的拉曼光谱和各种毒品掩盖剂的拉曼光谱,其中所述各种毒品的拉曼光谱均对应于第一标记,而所述各种毒品掩盖剂的拉曼光谱均对应于与第一标记不同的第二标记。
在一个实施例中,所述全连接层可以包括N+1个节点,其中N表示要由所述分类器检测的毒品类型的数量。在该实施例中,所述训练数据集可以包括N种毒品的拉曼光谱和各种毒品掩盖剂的拉曼光谱,并且N种毒品的拉曼光谱分别对应于彼此不同的N个标记,而各种毒品掩盖剂的拉曼光谱均对应于与N个标记不同的另一标记。
在一个实施例中,所述全连接层可以包括N个节点,其中N表示要由所述分类器检测的毒品类型的数量。在该实施例中,所述训练数据集包括N种毒品的拉曼光谱,并且N种毒品的拉曼光谱可以分别对应于彼此不同的N个标记。
在一个实施例中,构建所述分类器还可以包括构建所述分类器的第三卷积层和第三池化层。所述第三卷积层可以采用M种特征尺寸为13*1的16通道卷积核来对所述第二池化层输出的16个特征图进行卷积运算,从而得到M个特征图,M大于或等于16。所述第三池化层采用特征尺寸为3*1的一个滤波器来对所述第三卷积层输出的M个特征图进行池化运算,从而得到经池化的M个特征图。
在本申请的第二方面,上述目的是通过一种基于CNN的毒品拉曼光谱识别设备来实现的。该设备可以包括:分类器构建模块,被配置为构建基于CNN的分类器;分类器训练模块,被配置为使用包含拉曼光谱的训练数据集对所述分类器进行训练,以得到经训练的分类器;拉曼光谱获取模块,被配置为获取待测样品的拉曼光谱;以及毒品检测模块,被配置为使用所述经训练的分类器对所获取的拉曼光谱进行检测。
在一个实施例中,所述设备还可以包括预处理模块,被配置为对所述所获取的拉曼光谱进行预处理,其中所述预处理模块可以包括基线校正模块、自适应滤波器。
在一个实施例中,所述设备还可以包括小波变换模块,被配置为对经预处理的拉曼光谱进行小波变换,以产生近似拉曼光谱。
在一个实施例中,所述分类器构建模块还可以被配置为构建所述分类器的输入层、第一卷积层、第一池化层、第二卷积层、第二池化层、激励层和全连接层。所述输入层用于接收输入数据。所述第一卷积层可以采用6种特征尺寸为13*1的卷积核对所述输入数据进行卷积运算,从而得到6个特征图。所述第一池化层可以采用特征尺寸为3*1的一个滤波器来对所述第一卷积层输出的6个特征图进行池化运算,从而得到经池化的6个特征图。所述第二卷积层可以采用16种特征尺寸为13*1的6通道卷积核来对所述第一池化层输出的6个特征图进行卷积运算,从而得到16个特征图。所述第二池化层可以采用特征尺寸为3*1的一个滤波器来对所述第二卷积层输出的16个特征图进行池化运算,从而得到经池化的16个特征图。所述激励层可以使用逻辑回归模型对所述第二池化层输出的16个特征图进行判定。所述全连接层中的节点的数量可以取决于要由所述分类器进行分类的类别的数量。
在一个实施例中,所构建的分类器的所述全连接层可以包括两个节点。在该实施例中,所述分类器训练模块可以被配置为使用包括各种毒品的拉曼光谱和各种毒品掩盖剂的拉曼光谱的训练数据集来训练所构建的分类器,其中所述各种毒品的拉曼光谱均对应于第一标记,而所述各种毒品掩盖剂的拉曼光谱均对应于与第一标记不同的第二标记。
在一个实施例中,所构建的全连接层可以包括N+1个节点,其中N表示要由所述分类器检测的毒品类型的数量。在该实施例中,所述分类器训练模块可以被配置为使用包括N种毒品的拉曼光谱和各种毒品掩盖剂的拉曼光谱的训练数据集来训练所构建的分类器,其中N种毒品的拉曼光谱分别对应于彼此不同的N个标记,而各种毒品掩盖剂的拉曼光谱均对应于与N个标记不同的另一标记。
在一个实施例中,所构建的全连接层可以包括N个节点,其中N表示要由所述分类器检测的毒品类型的数量。在该实施例中,所述分类器训练模块可以被配置为使用包括N种毒品的拉曼光谱的训练数据集来训练所构建的分类器,其中N种毒品的拉曼光谱可以分别对应于彼此不同的N个标记。
在一个实施例中,所述分类器构建模块还可以被配置为构建所述分类器的第三卷积层和第三池化层。所述第三卷积层可以采用M种特征尺寸为13*1的16通道卷积核来对所述第二池化层输出的16个特征图进行卷积运算,从而得到M个特征图,M大于或等于16。所述第三池化层采用特征尺寸为3*1的一个滤波器来对所述第三卷积层输出的M个特征图进行池化运算,从而得到经池化的M个特征图。
在本申请的第三方面,上述目的是通过一种存储有计算机程序的计算机可读存储介质来实现的。所述计算机程序当被机器执行时,使得所述机器执行根据本申请的第一方面的方法。
在本申请的第四方面,上述目的是通过一种计算机设备来实现的。所述计算机设备可以包括处理器、存储器以及接口。所述接口被配置用于从外部设备接收数据和/或向外部设备输出数据。所述存储器中存储计算机程序,所述计算机程序当被所述处理器执行时,使得所述处理器执行根据本申请的第一方面的方法。
根据本公开的各种实施例,提出了一种基于CNN的毒品拉曼光谱识别方法和设备以及相关联的计算机设备和计算机可读存储介质,从而提高了毒品拉曼光谱识别的精度。
附图说明
根据结合附图的以下描述,本公开的特定实施例的上述和其它方面、特征以及优点将更清楚,在附图中:
图1是示出了根据本公开实施例的基于CNN的毒品拉曼光谱识别方法的流程图;
图2是示出了基于CNN的分类器的典型结构的示意图;
图3是示出了根据本公开实施例的用于毒品检测的分类器的结构示意图;
图4是示出了根据本公开实施例的基于CNN的毒品拉曼光谱识别设备的框图;
图5是示出了根据本公开实施例的用于识别毒品拉曼光谱的计算机设备的框图。
具体实施方式
下面将详细描述本公开的具体实施例,应当注意,本文描述的实施例只用于举例说明,并不用于限制本公开。在以下描述中,为了提供对本公开的透彻理解,阐述了大量特定细节。然而,对于本领域普通技术人员显而易见的是:不必采用这些特定细节来实行本公开。在其他实例中,为了避免混淆本公开,未具体描述公知的结构或方法。
在整个说明书中,对“一个实施例”、“实施例”、“一个示例”或“示例”的提及意味着:结合该实施例或示例描述的特定特征、结构或特性被包含在本公开至少一个实施例中。因此,在整个说明书的各个地方出现的短语“在一个实施例中”、“在实施例中”、“一个示例”或“示例”不一定都指同一实施例或示例。此外,可以以任何适当的组合和/或子组合将特定的特征、结构或特性组合在一个或多个实施例或示例中。此外,本领域普通技术人员应当理解,在此提供的附图都是为了说明的目的,并且附图不一定是按比例绘制的。这里使用的术语“和/或”包括一个或多个相关列出的项目的任何和所有组合。
如在前文所描述的,现有的毒品拉曼光谱识别方法存在一些问题,因此有必要研究其他备选方案来以提高的精度识别待测样品中包含的毒品。
目前,基于神经网络的识别模型已经在光谱数据处理中得到了广泛的应用。在众多类型的神经网络中,CNN由于更深的网络结构以及权值共享等特性而拥有更强大的特征提取和表达能力,同时还显著地降低了网络复杂度。基于CNN的上述优点,本发明提出使用基于CNN的分类器来进行毒品拉曼光谱的检测。
现在参考图1,其示出了根据本公开实施例的基于CNN的拉曼光谱识别方法10的流程图。如图所示,该方法包括,在框101处,构建基于CNN的分类器。图2中示出了典型的CNN的结构。CNN是一种多层神经网络,其通常包括输入层、卷积层、降采样层(池化层)、全连接层。其中,卷积层和池化层是CNN的核心,其主要完成对输入的特征提取。每个卷积层通常包含卷积和激活两种操作。池化层通常包括池化运算。卷积操作主要用于从输入中提取特征。卷积核的尺寸太小可能导致无法有效地提取特征,而卷积核的尺寸太大通常会导致计算复杂度提高。因此,卷积核的尺寸通常由相关人员根据经验或试验来设置。卷积核的数量决定了卷积层输出的特征图的数量。使用激活函数对通过卷积操作得到的特征图进行激活操作,然后对特征数据进行非线性映射。为了减小特征图的大小,对激活后的特征图进行池化操作,从而减少输出特征图的数量。常用的池化方式包括均值池化和最大值池化。CNN通常可以嵌套多个这样的卷积层、池化层。卷积层和池化层的数量越多,所提取的特征越可靠,但是计算复杂度也会随之增加。通常根据所要的解决的问题的复杂度来构建合适的卷积神经网络。
返回参考图1,方法10还可以包括:在框102处,对构建的分类器进行训练。
方法10还可以包括:在框103处,获取待测样品的拉曼光谱。可以通过利用激光器发出的激光照射待测样品,并且对所产生的拉曼散射光进行提取和光谱分析来获取待测样品的拉曼光谱。
该方法还可以包括:在框104处,使用经训练的分类器对所获取的拉曼光谱进行检测,以确定待测样品中是否包含毒品。
由于所获取的拉曼光谱通常可能包含荧光背景、检测器噪声、激光器功率波动等干扰信息,因此在利用拉曼光谱数据进行定性分析前(即,在框104中的处理之前),可以可选地对所获取的拉曼光谱进行有效的预处理。在一些实施例中,对所获取的拉曼光谱进行预处理可以包括对所获取的拉曼光谱进行基线校正,以消除因荧光等因素造成的基线漂移。此外,预处理还可以包括自适应滤波,以消除拉曼光谱中的噪声。
方法10还可以可选地包括:在框104中的处理之前,对经预处理的的拉曼光谱进行小波变换。根据需要,可以使用小波变换来对拉曼光谱进行平滑化处理,或者对拉曼光谱进行小波分解和重构,从而得到近似拉曼光谱。可以使用任何合适的小波变换函数。在一个实施例中,可以使用Daubechies(简称Db)小波作为小波变换函数来对拉曼光谱进行分解和重构。通常,将小波的分解层数选择为3。
图3示出了根据本公开实施例的用于毒品检测的分类器30的结构示意图。如图3所示,根据本公开的实施例构造的分类器30可以包括输入层300、第一卷积层301、第一池化层302、第二卷积层303、第二池化层304、激励层305以及全连接层306。
输入层300用于接收输入数据,即待测样品的拉曼光谱。
第一卷积层301采用6种特征尺寸为13*1的卷积核对输入数据进行卷积运算,从而得到6个特征图C1-1至C1-6。在第一卷积层301的卷积运算过程中,滑动窗口的大小可以为1,但是本公开不限于此,并且其他滑动窗口大小(例如,2、3、4等)也是可能的。在一个实施例中,可以使用合适的激活函数(例如,sigmoid函数)对卷积运算得到的特征图进行非线性映射。
第一池化层302采用特征尺寸为3*1的一个滤波器来对第一卷积层301输出的6个特征图C1-1至C1-6进行池化运算,从而得到经池化的6个特征图P1-1至P1-6。在此过程中,可以使用均值池化或最大值池化中的任何一种。
第二卷积层303采用16种特征尺寸为13*1的6通道卷积核来对第一池化层302输出的6个特征图进行卷积运算,从而得到16个特征图C2-1至C2-16。与第一卷积层类似,在该卷积运算过程中,滑动窗口的大小可以是1或任何其他合适的数值,并且可以使用任何合适的激活函数。
第二池化层304采用特征尺寸为3*1的一个滤波器来对第二卷积层303输出的16个特征图C2-1至C2-16进行池化运算,从而得到经池化的16个特征图P2-1至P2-16。在此过程中,类似地,可以使用均值池化或最大值池化中的任何一种。
激励层305使用逻辑回归模型对第二池化层304输出的16个特征图P2-1至P2-16进行判定,以确定其类别。
全连接层306可以根据要进行分类的类别的数量而包含不同数量的节点。为了简化,图3的示例中仅示出了两个节点n1和n2。
如本领域技术人员理解的,在构造上述分类器之后,首先需要用相关的数据集来训练该分类器。根据分类器的不同用途,所使用的训练数据集以及全连接层中的节点的数量也是不相同的。具体地,对于毒品检测,可能存在以下几种情况。
情况1.仅需要使用分类器来检测待测样本中是否包含毒品,而无需确定毒品的具
体类型
在这种情况下,图3所示的分类器的全连接层306被构建为仅包含两个节点。可以使用包括各种毒品(例如,兴奋剂、致幻剂等)的拉曼光谱和各种毒品掩盖剂(例如,淀粉、盐、糖等)的拉曼光谱的训练数据集来训练上述构造的分类器。其中,各种毒品的拉曼光谱均为正样本,被标记为1(即,对应于输出结果1),各种毒品掩盖剂的拉曼光谱均为负样本,被标记为0(即,对应于输出结果0)。
经过用上述训练数据集训练之后,该分类器可以用于检测待测样品中是否包含毒品。例如,在将待测样品的拉曼光谱输入经训练的分类器之后,如果该经训练的分类器输出“1”,则指示待测样品中包含毒品;输出“0”,则指示待测样品中不含毒品。
情况2.使用分类器来检测待测样本中是否包含毒品并且检测毒品的具体类型
在这种情况下,图3所示的分类器的全连接层306被构建为包含N+1个节点,其中N对应于要检测的毒品类型的数量。可以使用包括N种毒品(例如,兴奋剂、致幻剂等)的拉曼光谱和各种毒品掩盖剂(例如,淀粉、盐等)的拉曼光谱的训练数据集。但是,每种毒品的拉曼光谱被不同地标记,即N种毒品可以被标记为N个不同的标记。例如,兴奋剂的拉曼光谱可以被标记为1,致幻剂的拉曼光谱可以被标记为2等,以此类推。而各种毒品掩盖剂的拉曼光谱可以均被标记为0。
经过用上述训练数据集训练之后,该分类器可以用于检测待测样品中是否包含毒品并且检测毒品的具体类型。例如,在将待测样品的拉曼光谱输入经训练的分类器之后,如果该经训练的分类器输出“0”,则指示待测样品中不含毒品;输出“1”,则指示待测样品中包含兴奋剂;输出“2”,则指示待测样品中包含致幻剂。
情况3.使用分类器来检测毒品的类型
在一些情况下,可能只需要使用分类器来检测毒品的具体类型。在这种情况下,图3所示的分类器的全连接层306包含N个节点,其中N对应于要检测的毒品类型的数量。可以使用包括N种毒品(例如,兴奋剂、致幻剂等)的拉曼光谱的训练数据集。其中,每种毒品的拉曼光谱被不同地标记。例如,兴奋剂的拉曼光谱可以被标记为1,致幻剂的拉曼光谱可以被标记为2等,以此类推。
经过用上述训练数据集训练之后,该分类器可以用于检测毒品的具体类型。例如,在将待测样品的拉曼光谱输入经训练的分类器之后,如果该经训练的分类器输出“1”,则指示待测样品中包含兴奋剂;输出“2”,则指示待测样品中包含致幻剂。
以上仅给出了分类器在毒品检测领域可能应用的几种示例情况。可以根据分类器的其他应用情况来适应性地修改训练数据集以及全连接层中包含的节点的数量,而不脱离本公开的精神和范围。
在一些实施例中,对于情况2和情况3,可以进一步在图3所示的分类器中嵌套更多的卷积层、池化层等,以实现更精确的分类结果。例如,图3的分类器还可以包括第三卷积层、第三池化层(未示出)。其中第三卷积层例如可以使用16种特征尺寸为13*1的16通道卷积核、滑动步长1以及激活函数sigmoid,第三池化层可以例如使用大小为3*1的滤波器来进行均值池化或最大值池化等。通常,后一个卷积层使用的卷积核的数量应大于或等于前一个卷积层使用的卷积核的数量。
图4是示出了根据本公开的实施例用于毒品拉曼光谱识别设备40的框图。如图所示,设备40可以包括:分类器构建模块401,被配置为构建基于CNN的分类器(例如,图3所示的分类器);分类器训练模块402,被配置为使用包括拉曼光谱的数据集对所述分类器进行训练,以得到经训练的分类器;拉曼光谱获取模块403,被配置为获取待测样品的拉曼光谱;以及毒品检测模块404,被配置为使用所述经训练的分类器对所获取的拉曼光谱进行检测,以确定所述待测样品中是否包含毒品。
所述设备40还可以包括预处理模块(未示出),被配置为对所获取的拉曼光谱进行预处理,以去除拉曼光谱中的噪声。预处理模块通常可以包括基线校正模块和/或自适应滤波器。
所述设备40还可以包括小波变换模块,用于对经预处理的经预处理的拉曼光谱进行平滑,和/或对经预处理的拉曼光谱进行小波分解和重构。
分类器构建模块401还可以被配置为构建所述分类器的输入层300、第一卷积层301、第一池化层302、第二卷积层303、第二池化层304、激励层305以及全连接层306。输入层300用于接收输入数据,即待测样品的拉曼光谱。第一卷积层310采用6种特征尺寸为13*1的卷积核对输入数据进行卷积运算,从而得到6个特征图C1-1至C1-6。在第一卷积层301的卷积运算过程中,滑动窗口的大小可以为1,但是本公开不限于此,并且其他滑动窗口大小(例如,2、3、4等)也是可能的。在一个实施例中,可以使用合适的激活函数(例如,sigmoid函数)对卷积运算得到的特征图进行非线性映射。第一池化层302采用特征尺寸为3*1的一个滤波器来对第一卷积层301输出的6个特征图C1-1至C1-6进行池化运算,从而得到经池化的6个特征图P1-1至P1-6。在此过程中,可以使用均值池化或最大值池化中的任何一种。第二卷积层303采用16种特征尺寸为13*1的6通道卷积核来对第一池化层302输出的6个特征图进行卷积运算,从而得到16个特征图C2-1至C2-16。与第一卷积层类似,在该卷积过程中,滑动窗口的大小可以是1或任何其他合适的数值,并且可以使用任何合适的激活函数。第二池化层304采用特征尺寸为3*1的一个滤波器来对第二卷积层303输出的16个特征图C2-1至C2-16进行池化运算,从而得到经池化的16个特征图P2-1至P2-16。在此过程中,类似地,可以使用均值池化或最大值池化中的任何一种。激励层305使用逻辑回归模型对第二池化层304输出的16个特征图P2-1至P2-16进行判定,以确定其类别。全连接层306可以根据要进行分类的类别的数量而包含不同数量的节点。
由分类器构建模块401构建的分类器的全连接层可以包括两个节点。在这种情况下,分类器训练模块402可以被配置为可以使用包括各种毒品(例如,兴奋剂、致幻剂等)的拉曼光谱和各种毒品掩盖剂(例如,淀粉、盐、糖等)的拉曼光谱的训练数据集来训练分类器。其中,各种毒品的拉曼光谱均为正样本,可以被标记为1(即,对应于输出结果1),各种毒品掩盖剂的拉曼光谱均为负样本,可以被标记为0(即,对应于输出结果0)。
由分类器构建模块401构建的分类器的全连接层可以包括N+1个节点,其中N表示要由分类器检测的毒品类型的数量。在这种情况下,分类器训练模块402可以被配置为可以使用包括N种毒品(例如,兴奋剂、致幻剂等)的拉曼光谱和各种毒品掩盖剂(例如,淀粉、盐等)的拉曼光谱的训练数据集。但是,每种毒品的拉曼光谱被不同地标记。即N种毒品的拉曼光谱分别被标记为N个不同的标记。例如,兴奋剂的拉曼光谱可以被标记为1,致幻剂的拉曼光谱可以被标记为2等,以此类推。而各种毒品掩盖剂的拉曼光谱可以均被标记为0。
由分类器构建模块401构建的分类器的全连接层可以包括N个节点,其中N表示要由分类器检测的毒品类型的数量。在这种情况下,分类器训练模块402可以被配置为可以使用包括N种毒品(例如,兴奋剂、致幻剂等)的拉曼光谱的训练数据集。其中,每种毒品的拉曼光谱被不同地标记。例如,兴奋剂的拉曼光谱可以被标记为1,致幻剂的拉曼光谱可以被标记为2等,以此类推。
分类器构建模块401还可以被配置为构建分类器的第三卷积层和第三池化层。第三卷积层例如可以使用16种特征尺寸为13*1的16通道卷积核、滑动步长1以及激活函数sigmoid,第三池化层可以例如使用大小为3*1的滤波器来进行均值池化或最大值池化等。通常,分类器中的后一个卷积层使用的卷积核的数量应大于或等于前一个卷积层使用的卷积核的数量。
图5是示出了根据本公开实施例的用于毒品拉曼光谱识别的计算机设备50的框图。计算机设备50通常可以包括处理器501、存储器502以及接口503。接口503可以被配置为从外部设备接收数据和/或向外部设备发送数据。存储器502中存储有可由处理器501执行的计算机程序,该程序当被执行时,使得处理器501执行本文中所述的方法步骤。该计算机设备50还可以可选地包括显示器504(以虚线示出)。
本申请的上述实施例提供了可用于不同场景(例如,仅需要检测毒品的存在的场景,需要同时检测毒品的存在和类型的场景、以及在确定毒品存在时才进一步检测毒品类型的场景)的毒品拉曼光谱识别方法和设备。由于CNN自身的优势,该方法能在不同场景中以提高的速度和精度来识别待测样品中的毒品。
以上的详细描述通过使用示意图、流程图和/或示例,已经阐述了众多实施例。在这种示意图、流程图和/或示例包含一个或多个功能和/或操作的情况下,本领域技术人员应理解,这种示意图、流程图或示例中的每一功能和/或操作可以通过各种结构、硬件、软件、固件或实质上它们的任意组合来单独和/或共同实现。在一个实施例中,本公开的实施例所述主题的若干部分可以通过专用集成电路(ASIC)、现场可编程门阵列(FPGA)、数字信号处理器(DSP)等来实现。然而,本领域技术人员应认识到,这里所公开的实施例的一些方面在整体上或部分地可以等同地实现在集成电路中,实现为在一台或多台计算机上运行的一个或多个计算机程序(例如,实现为在一台或多台计算机系统上运行的一个或多个程序),实现为在一个或多个处理器上运行的一个或多个程序(例如,实现为在一个或多个微处理器上运行的一个或多个程序),实现为固件,或者实质上实现为上述方式的任意组合,并且本领域技术人员根据本公开,将具备设计电路和/或写入软件和/或固件代码的能力。此外,本领域技术人员将认识到,本公开所述主题的机制能够作为多种形式的程序产品进行分发,并且无论实际用来执行分发的信号承载介质的具体类型如何,本公开所述主题的示例性实施例均适用。信号承载介质的示例包括但不限于:可记录型介质,如软盘、硬盘驱动器、紧致盘(CD)、数字通用盘(DVD)、数字磁带、计算机存储器等;以及传输型介质,如数字和/或模拟通信介质(例如,光纤光缆、波导、有线通信链路、无线通信链路等)。
虽然已经参照几个典型实施例描述了本公开,但应当理解,所用的术语是说明和示例性、而非限制性的术语。由于本公开能够以多种形式具体实施而不脱离公开的精神或实质,所以应当理解,上述实施例不限于任何前述的细节,而应在随附权利要求所限定的精神和范围内广泛地解释,因此落入权利要求或其等效范围内的全部变化和改型都应为随附权利要求所涵盖。
Claims (17)
1.一种基于卷积神经网络CNN的拉曼光谱识别方法,包括:
构建基于CNN的分类器(101);
使用包含拉曼光谱的训练数据集对所述分类器进行训练(102),以得到经训练的分类器;
获取待测样品的拉曼光谱(103);以及
使用所述经训练的分类器对所获取的拉曼光谱进行检测(104)。
2.根据权利要求1所述的方法,还包括:
在所述检测之前,对所述所获取的拉曼光谱进行预处理,其中所述预处理包括基线校正和/或自适应滤波。
3.根据权利要求2所述的方法,还包括:
在所述检测之前,对经预处理的拉曼光谱进行小波变换,以得到近似拉曼光谱。
4.根据权利要求1-3中的任一项所述的方法,其中,构建基于CNN的所述分类器包括构建所述分类器的输入层(300)、第一卷积层(301)、第一池化层(302)、第二卷积层(303)、第二池化层(304)、激励层(305)和全连接层(306)。
5.根据权利要求4所述的方法,其中:
所述输入层(300)用于接收输入数据,
所述第一卷积层(301)采用6种特征尺寸为13*1的卷积核对所述输入数据进行卷积运算,从而得到6个特征图(C1-1至C1-6);
所述第一池化层(302)采用特征尺寸为3*1的一个滤波器来对所述第一卷积层(301)输出的6个特征图(C1-1至C1-6)进行池化运算,从而得到经池化的6个特征图(P1-1至P1-6);
所述第二卷积层(303)采用16种特征尺寸为13*1的6通道卷积核来对所述第一池化层(302)输出的6个特征图(P1-1至P1-6)进行卷积运算,从而得到16个特征图(C2-1至C2-16);
所述第二池化层(304)采用特征尺寸为3*1的一个滤波器来对所述第二卷积层(303)输出的16个特征图(C2-1至C2-16)进行池化运算,从而得到经池化的16个特征图(P2-1至P2-16);
所述激励层(305)使用逻辑回归模型对所述第二池化层(304)输出的16个特征图(P2-1至P2-16)进行判定;以及
其中,所述全连接层(306)中的节点的数量取决于要由所述分类器进行分类的类别的数量。
6.根据权利要求4或5所述的方法,其中,所述分类器的所述全连接层(306)包括两个节点,并且其中,所述训练数据集包括各种毒品的拉曼光谱和各种毒品掩盖剂的拉曼光谱,并且所述各种毒品的拉曼光谱均对应于第一标记,而所述各种毒品掩盖剂的拉曼光谱均对应于与第一标记不同的第二标记。
7.根据权利要求4或5所述的方法,其中,所述分类器的所述全连接层(306)包括N+1个节点,N表示要由所述分类器检测的毒品类型的数量,并且其中,所述训练数据集包括N种毒品的拉曼光谱和各种毒品掩盖剂的拉曼光谱,并且N种毒品的拉曼光谱分别对应于彼此不同的N个标记,而各种毒品掩盖剂的拉曼光谱均对应于与N个标记不同的另一标记;或者
所述分类器的所述全连接层(306)包括N个节点,N表示要由所述分类器检测的毒品类型的数量,并且其中,所述训练数据集包括N种毒品的拉曼光谱,并且N种毒品的拉曼光谱分别对应于彼此不同的N个标记。
8.根据权利要求7所述的方法,其中,构建所述分类器还包括构建第三卷积层和第三池化层,其中:
所述第三卷积层采用M种特征尺寸为13*1的16通道卷积核来对所述第二池化层(304)输出的16个特征图(P2-1至P2-16)进行卷积运算,从而得到M个特征图,M大于或等于16;
所述第三池化层采用特征尺寸为3*1的一个滤波器来对所述第三卷积层输出的M个特征图进行池化运算,从而得到经池化的M个特征图。
9.一种基于CNN的毒品拉曼光谱识别设备,包括:
分类器构建模块(401),被配置为构建基于CNN的分类器;
分类器训练模块(402),被配置为使用包含拉曼光谱的训练数据集对所述分类器进行训练,以得到经训练的分类器;
拉曼光谱获取模块(403),被配置为获取待测样品的拉曼光谱;以及
毒品检测模块(404),被配置为使用所述经训练的分类器对所获取的拉曼光谱进行检测。
10.根据权利要求9所述的设备,还包括预处理模块,被配置为对所述所获取的拉曼光谱进行预处理,其中所述预处理模块包括基线校正模块和/或自适应滤波器。
11.根据权利要求10所述的设备,还包括小波变换模块,被配置为对经预处理的拉曼光谱进行小波变换,以产生近似拉曼光谱。
12.根据权利要求8-11中的任一项所述的设备,所述分类器构建模块(401)被配置为构建所述分类器的输入层(300)、第一卷积层(301)、第一池化层(302)、第二卷积层(303)、第二池化层(304)、激励层(305)和全连接层(306)。
13.根据权利要求12所述的设备,其中:
所述输入层(300)用于接收输入数据,
所述第一卷积层(301)采用6种特征尺寸为13*1的卷积核对所述输入数据进行卷积运算,从而得到6个特征图(C1-1至C1-6);
所述第一池化层(302)采用特征尺寸为3*1的一个滤波器来对所述第一卷积层(301)输出的6个特征图(C1-1至C1-6)进行池化运算,从而得到经池化的6个特征图(P1-1至P1-6);
所述第二卷积层(303)采用16种特征尺寸为13*1的6通道卷积核来对所述第一池化层(302)输出的6个特征图(P1-1至P1-6)进行卷积运算,从而得到16个特征图(C2-1至C2-16);
所述第二池化层(304)采用特征尺寸为3*1的一个滤波器来对所述第二卷积层(303)输出的16个特征图(C2-1至C2-16)进行池化运算,从而得到经池化的16个特征图(P2-1至P2-16);
所述激励层(305)使用逻辑回归模型对所述第二池化层(304)输出的16个特征图(P2-1至P2-16)进行判定;以及
其中,所述全连接层(306)中的节点的数量取决于要由所述分类器进行分类的类别的数量。
14.根据权利要求12或13所述的设备,其中,所述分类器的所述全连接层(306)包括两个节点,并且其中,所述分类器训练模块(402)被配置为使用包括各种毒品的拉曼光谱和各种毒品掩盖剂的拉曼光谱的训练数据集来训练所述分类器,并且所述各种毒品的拉曼光谱均对应于第一标记,而所述各种毒品掩盖剂的拉曼光谱均对应于与第一标记不同的第二标记。
15.根据权利要求12或13所述的设备,其中,所述分类器的所述全连接层(306)包括N+1个节点,N表示要由所述分类器检测的毒品类型的数量,并且其中,所述分类器训练模块(402)被配置为使用包括N种毒品的拉曼光谱和各种毒品掩盖剂的拉曼光谱的训练数据集来训练所述分类器,并且N种毒品的拉曼光谱分别对应于彼此不同的N个标记,而各种毒品掩盖剂的拉曼光谱均对应于与N个标记不同的另一标记;或者
所述分类器的所述全连接层(306)包括N个节点,N表示要由所述分类器检测的毒品类型的数量,并且其中,所述分类器训练模块(402)被配置为使用包括N种毒品的拉曼光谱的训练数据集来训练所述分类器,并且N种毒品的拉曼光谱分别对应于彼此不同的N个标记。
16.根据权利要求15所述的设备,其中,所述分类器构建模块(401)被配置为构建所述分类器的第三卷积层和第三池化层,其中:
所述第三卷积层采用M种特征尺寸为13*1的16通道卷积核来对所述第二池化层(304)输出的16个特征图(P2-1至P2-16)进行卷积运算,从而得到M个特征图,M大于或等于16;
所述第三池化层采用特征尺寸为3*1的一个滤波器来对所述第三卷积层输出的M个特征图进行池化运算,从而得到经池化的M个特征图。
17.一种用于毒品拉曼光谱识别的计算机设备,包括:
处理器;
接口;被配置用于从外部设备接收数据和/或向外部设备发送数据;以及
存储器,被配置为存储计算机程序,所述计算机程序当被所述处理器执行时,使得所述处理器执行根据权利要求1-8中的任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911354748.0A CN113030060A (zh) | 2019-12-25 | 2019-12-25 | 基于卷积神经网络的毒品拉曼光谱识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911354748.0A CN113030060A (zh) | 2019-12-25 | 2019-12-25 | 基于卷积神经网络的毒品拉曼光谱识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113030060A true CN113030060A (zh) | 2021-06-25 |
Family
ID=76458112
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911354748.0A Pending CN113030060A (zh) | 2019-12-25 | 2019-12-25 | 基于卷积神经网络的毒品拉曼光谱识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113030060A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113960152A (zh) * | 2021-10-18 | 2022-01-21 | 北方工业大学 | 一种基于离子迁移谱的痕量爆炸物识别方法及系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103217409A (zh) * | 2013-03-22 | 2013-07-24 | 重庆绿色智能技术研究院 | 一种拉曼光谱预处理方法 |
CN106980811A (zh) * | 2016-10-21 | 2017-07-25 | 商汤集团有限公司 | 人脸表情识别方法和人脸表情识别装置 |
CN107292343A (zh) * | 2017-06-23 | 2017-10-24 | 中南大学 | 一种基于六层卷积神经网络和光谱‑空间信息联合的高光谱遥感图像分类方法 |
CN109001180A (zh) * | 2018-08-10 | 2018-12-14 | 青岛启明生物科技有限公司 | 一种拉曼光谱结合人工智能高通量单细胞分析鉴定方法 |
CN109543763A (zh) * | 2018-11-28 | 2019-03-29 | 重庆大学 | 一种基于卷积神经网络的拉曼光谱分析方法 |
-
2019
- 2019-12-25 CN CN201911354748.0A patent/CN113030060A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103217409A (zh) * | 2013-03-22 | 2013-07-24 | 重庆绿色智能技术研究院 | 一种拉曼光谱预处理方法 |
CN106980811A (zh) * | 2016-10-21 | 2017-07-25 | 商汤集团有限公司 | 人脸表情识别方法和人脸表情识别装置 |
CN107292343A (zh) * | 2017-06-23 | 2017-10-24 | 中南大学 | 一种基于六层卷积神经网络和光谱‑空间信息联合的高光谱遥感图像分类方法 |
CN109001180A (zh) * | 2018-08-10 | 2018-12-14 | 青岛启明生物科技有限公司 | 一种拉曼光谱结合人工智能高通量单细胞分析鉴定方法 |
CN109543763A (zh) * | 2018-11-28 | 2019-03-29 | 重庆大学 | 一种基于卷积神经网络的拉曼光谱分析方法 |
Non-Patent Citations (7)
Title |
---|
YU XIAO 等: "Raman spectroscopy de-noising based on EEMD com-", 《OPTOELECTRONICS LETTERS》 * |
俞勇: "《人工智能技术入门 让你也看懂的AI"内幕"》", 30 September 2019, 上海科技教育出版社 * |
尚延义 等, 哈尔滨工业大学出版社 * |
李志刚: "《光谱数据处理与定量分析技术》", 31 July 2017, 北京邮电大学出版社 * |
范广强 等: "自适应滤波在拉曼激光雷达数据处理中的应用", 《中国激光》 * |
荣康: "基于深度学习的拉曼光谱定性与定量分析方", 《万方数据库》 * |
赵肖宇 等: "EEMD自适应去噪在拉曼光谱中的应", 《光谱学与光谱分析》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113960152A (zh) * | 2021-10-18 | 2022-01-21 | 北方工业大学 | 一种基于离子迁移谱的痕量爆炸物识别方法及系统 |
CN113960152B (zh) * | 2021-10-18 | 2023-06-06 | 北方工业大学 | 一种基于离子迁移谱的痕量爆炸物识别方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Priyadarshani et al. | Automated birdsong recognition in complex acoustic environments: a review | |
Ulloa et al. | scikit‐maad: An open‐source and modular toolbox for quantitative soundscape analysis in Python | |
US20180144182A1 (en) | Analyzing digital holographic microscopy data for hematology applications | |
Knight et al. | Pre-processing spectrogram parameters improve the accuracy of bioacoustic classification using convolutional neural networks | |
CN109492395A (zh) | 一种检测恶意程序的方法、装置及存储介质 | |
CN107909088A (zh) | 获取训练样本的方法、装置、设备和计算机存储介质 | |
Yang et al. | A fault diagnosis approach for roller bearing based on improved intrinsic timescale decomposition de-noising and kriging-variable predictive model-based class discriminate | |
Zhang et al. | Explainability for regression CNN in fetal head circumference estimation from ultrasound images | |
CN111398233A (zh) | 一种红酒品质的激光光谱检测方法 | |
Scarpelli et al. | Multi-index ecoacoustics analysis for terrestrial soundscapes: a new semi-automated approach using time-series motif discovery and random forest classification | |
CN115273904A (zh) | 一种基于多特征融合的愤怒情绪识别方法及装置 | |
CN111982271A (zh) | 一种基于Wavenet的φ-OTDR模式识别系统及方法 | |
CN113030060A (zh) | 基于卷积神经网络的毒品拉曼光谱识别方法 | |
Xiao et al. | AMResNet: An automatic recognition model of bird sounds in real environment | |
Tseng et al. | Automatic bird sound detection: logistic regression based acoustic occupancy model | |
Pan et al. | Identification of softwood species using convolutional neural networks and raw near-infrared spectroscopy | |
Wang et al. | End‐to‐end analysis modeling of vibrational spectroscopy based on deep learning approach | |
CN116858822A (zh) | 一种基于机器学习和拉曼光谱的水体中磺胺嘧啶定量分析方法 | |
CN112834481A (zh) | 一种拉曼光谱增强测量系统及测量方法 | |
CN116824252A (zh) | 高光谱舌象图像的中医舌色分类量化方法 | |
CN113449804B (zh) | 血液类别的确定方法及相关设备 | |
CN116026808A (zh) | 一种拉曼光谱判别方法和系统 | |
CN109584861A (zh) | 基于深度学习的阿尔茨海默症语音信号的筛查方法 | |
Esfahanian et al. | Sparse representation for classification of dolphin whistles by type | |
CN114974302A (zh) | 环境声音事件检测方法、装置和介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210625 |
|
RJ01 | Rejection of invention patent application after publication |