CN114660040A - 微生物单细胞种类鉴定方法、装置、介质及设备 - Google Patents
微生物单细胞种类鉴定方法、装置、介质及设备 Download PDFInfo
- Publication number
- CN114660040A CN114660040A CN202210240203.2A CN202210240203A CN114660040A CN 114660040 A CN114660040 A CN 114660040A CN 202210240203 A CN202210240203 A CN 202210240203A CN 114660040 A CN114660040 A CN 114660040A
- Authority
- CN
- China
- Prior art keywords
- data
- spectrum
- single cell
- database
- raman spectrum
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 41
- 230000000813 microbial effect Effects 0.000 title description 9
- 238000001228 spectrum Methods 0.000 claims abstract description 130
- 230000003595 spectral effect Effects 0.000 claims abstract description 60
- 238000001237 Raman spectrum Methods 0.000 claims abstract description 55
- 241000894007 species Species 0.000 claims abstract description 33
- 238000001514 detection method Methods 0.000 claims abstract description 29
- 230000004927 fusion Effects 0.000 claims abstract description 22
- 244000005700 microbiome Species 0.000 claims abstract description 21
- 238000012216 screening Methods 0.000 claims abstract description 17
- 238000012546 transfer Methods 0.000 claims abstract description 12
- 230000006870 function Effects 0.000 claims description 27
- 238000004590 computer program Methods 0.000 claims description 16
- 239000011159 matrix material Substances 0.000 claims description 14
- 238000012360 testing method Methods 0.000 claims description 12
- 238000004422 calculation algorithm Methods 0.000 claims description 11
- 238000004458 analytical method Methods 0.000 claims description 9
- 230000009466 transformation Effects 0.000 claims description 8
- 238000004364 calculation method Methods 0.000 claims description 5
- 230000001413 cellular effect Effects 0.000 claims description 3
- 238000013507 mapping Methods 0.000 claims description 3
- 238000003860 storage Methods 0.000 claims description 3
- 238000006243 chemical reaction Methods 0.000 claims description 2
- 210000004027 cell Anatomy 0.000 description 50
- 238000001069 Raman spectroscopy Methods 0.000 description 12
- 238000013527 convolutional neural network Methods 0.000 description 12
- 230000008859 change Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 8
- 150000001875 compounds Chemical class 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 4
- 238000005286 illumination Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000004913 activation Effects 0.000 description 3
- 244000052616 bacterial pathogen Species 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 3
- 238000003384 imaging method Methods 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- 241000894006 Bacteria Species 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000006073 displacement reaction Methods 0.000 description 2
- 230000005284 excitation Effects 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000010238 partial least squares regression Methods 0.000 description 2
- 230000004544 DNA amplification Effects 0.000 description 1
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 description 1
- 241000590002 Helicobacter pylori Species 0.000 description 1
- 239000000427 antigen Substances 0.000 description 1
- 102000036639 antigens Human genes 0.000 description 1
- 108091007433 antigens Proteins 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000012136 culture method Methods 0.000 description 1
- 238000012258 culturing Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 229940037467 helicobacter pylori Drugs 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000001819 mass spectrum Methods 0.000 description 1
- 230000004060 metabolic process Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 230000007918 pathogenicity Effects 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 230000035755 proliferation Effects 0.000 description 1
- 238000003908 quality control method Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 210000002966 serum Anatomy 0.000 description 1
- 238000004611 spectroscopical analysis Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/62—Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
- G01N21/63—Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
- G01N21/65—Raman scattering
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/01—Arrangements or apparatus for facilitating the optical investigation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0463—Neocognitrons
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2201/00—Features of devices classified in G01N21/00
- G01N2201/12—Circuits of general importance; Signal processing
- G01N2201/129—Using chemometrical methods
- G01N2201/1296—Using chemometrical methods using neural networks
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Pathology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Biochemistry (AREA)
- Immunology (AREA)
- Analytical Chemistry (AREA)
- Artificial Intelligence (AREA)
- Chemical & Material Sciences (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Investigating, Analyzing Materials By Fluorescence Or Luminescence (AREA)
Abstract
本发明涉及一种微生物单细胞种类鉴定方法、装置、介质及设备,方法包括将采集的单细胞拉曼光谱数据和参考图谱数据库中的拉曼图谱数据进行比较分析,筛选出符合条件的拉曼光谱数据;将筛选出的拉曼光谱数据作为样本,根据光谱数据样本中特定的光谱特征值进行计算,得到样本的最小样本光谱检测数量;采集光谱检测数量对应的光谱数据,将光谱数据经校准转移模型进行光谱数据标准化;将标准化光谱数据以及实时采集的单细胞图像数据,存储到组学数据库中;基于单细胞表型组学数据库中的细胞图像和光谱数据对图像和光谱的特征值进行多模态特征融合,实现单细胞表型数据的种类鉴定,增加了数据的完整性,从而提高单细胞种类鉴定准确性。
Description
技术领域
本发明涉及微生物检测技术领域,尤其涉及一种微生物单细胞种类鉴定方法、装置、介质及设备。
背景技术
临床上传统的致病菌的鉴定主要是通过培养法,该方法存在检测时间长、必须达到不含有其他微生物的纯培养程度,才能进行系统鉴定。系统鉴定就是通过病原菌的形态结构、生长特性、抗原性和病原性等检测,并用已知标准免疫血清确定分离细菌的属、种和型。微生物鉴定的程序通常是根据其形态,生长、生化特性等定种,最后根据抗原的免疫血清学检查定型。一般需要14-40小时才能到鉴定,对于难培养的更长。另外,纯培养株可以直接采用质谱的方式鉴定微生物的种类,或者采用DNA扩增测序手段进行鉴定。这些方法采用先培养再鉴定的方式通常需要一到两天时间拿到鉴定结果,虽然结果可控,但是存在耗时长或成本高或对操作人员要求高等缺点。
目前现有的“单细胞拉曼”检测技术,即跳过细胞培养增殖,直接针对样品中原有单细胞的“生长”或“代谢”表型、进行单细胞精度的表征,从原理上实现快速、基于表型、适用范围广的目标。拉曼光谱是一种高效的信息识别技术,通过对特定入射光线对化合物的非弹性散射谱线分析,拉曼显微光谱可以直接检测化合物分子振动或转动能级,通过对拉曼特征谱线的分析,可以获得化合物分子构成和结构的信息。但病原菌的种类鉴定,特别是难培养的病原菌如幽门螺旋杆菌等,其培养时间长、菌量少,因此需要在单细胞尺度下进行种类快速检测。
拉曼光谱是一种高效的信息识别技术,通过特定入射光线对化合物的非弹性散射谱线分析,拉曼显微光谱可以直接检测化合物分子振动或转动能级,通过对拉曼特征谱线的分析,可以获得化合物分子构成和结构的信息。而现有采用拉曼技术对单细胞样品检测方法,存在无法将单一细胞图像和光谱数据相结合,数据完整性差、鉴定准确性低的问题。
发明内容
针对上述问题,本发明的目的是提供一种微生物单细胞种类鉴定方法、装置、介质及设备,能够将单一细胞图像和光谱数据相结合,构成多模态特征,增加了数据的完整性,从而提高单细胞种类鉴定鉴定准确性。
为实现上述目的,本发明采取以下技术方案:
一种微生物单细胞种类鉴定方法,所述方法包括:
将采集的单细胞拉曼光谱数据和参考图谱数据库中的拉曼图谱数据进行比较分析,筛选出符合条件的拉曼光谱数据;
将筛选出的所述拉曼光谱数据作为样本,根据样本中特定的光谱特征值进行计算,得到样本在特定的光谱特征值下稳定的最小样本光谱检测数量;
采集光谱检测数量对应的光谱数据,将所述光谱数据经校准转移模型进行光谱数据标准化,得到标准化光谱数据;
基于标准化光谱数据以及实时采集的单细胞图像数据构建单细胞表型组学数据库;
基于单细胞表型组学数据库中的细胞图像和光谱数据对图像和光谱的特征值进行多模态特征融合;
将多模态特征融合以后的数据进行分类获得细胞种类,实现单细胞表型数据的种类鉴定。
优选地,将采集的单细胞拉曼光谱数据和参考图谱数据库中的拉曼图谱数据进行比较分析,筛选出符合条件的拉曼光谱数据,包括:
构建参考图谱数据库,将筛选的图谱存入参考数据库中;
利用CNN算法对采集的光谱数据和参考图谱数据库中数据进行比较分析,筛选出相似度高的图谱筛选。
优选地,利用CNN算法对采集的光谱数据和考图谱数据库中数据进行比较分析,筛选出相似度高的图谱筛选,包括:
将采集的拉曼光谱数据作为测试数据,输入到所述参考图谱数据库,经过计算输出一个对应N个物种的N维输出向量,N为自然数;
将向量作为输入映射到Softmax函数,对一特定测试数据Softmax输出的最大概率值为P,所述测试数据中同一类别的所有数据的Softmax函数最大值的均值为M,方差S,若M-S/2≤P≤M+S/2,则所述拉曼光谱数据为筛选出符合条件的拉曼光谱数据。
优选地,采集光谱检测数量对应的光谱数据,将所述光谱数据经校准转移模型进行光谱数据标准化,得到标准化光谱数据,采用分段直接标准化PDS算法,包括:
将光谱数据分为目标集光谱和待调整集光谱;
选择以某个波数为中心,根据设定的范围左右扩展作为窗口,将目标集光谱第i个波数的强度值与待调整集光谱以i为中心的窗口矩阵构建多元回归模型,i为自然数;通过偏最小二乘回归进行求解,将回归模型中的回归系数置于变换矩阵的主对角线上,并将其他元素置为0,得到转换矩阵;
将采集光谱数据通过转换矩阵变换成标准化光谱数据。
优选地,将多模态特征融合以后的数据进采用CNN分类器进行分类获得细胞种类。
优选地,利用ReliefF算法对图像和光谱的特征值进行权重确定以进行融合操作,构成多模态特征。
一种微生物单细胞种类鉴定装置,包括:
筛选拉曼光谱图谱模块,被配置为将采集的单细胞拉曼光谱数据和参考图谱数据库中的拉曼图谱数据进行比较分析,筛选出符合条件的所述拉曼光谱数据;
分析光谱检测数量模块,被配置为将筛选出的所述拉曼光谱数据作为样本,根据光谱数据样本中特定的光谱特征值进行计算,得到样本在特定的光谱特征值下稳定的最小样本光谱检测数量;
光谱数据标准化模块,被配置为采集光谱检测数量对应的光谱数据,将所述光谱数据经校准转移模型进行光谱数据标准化,得到标准化光谱数据;
构建通用性单细胞表型组学数据库模块,被配置为将标准化光谱数据以及实时采集的单细胞图像数据,构建单细胞表型组学数据库;
多模态特征融合模块,被配置为基于单细胞表型组学数据库中的细胞图像和光谱数据对图像和光谱的特征值进行多模态特征融合;
分类模块,被配置为将多模态特征融合通过CNN分类器进行分类获得细胞种类,实现单细胞表型数据的种类鉴定。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现所述微生物单细胞种类鉴定方法的步骤。
一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现权所述微生物单细胞种类鉴定方法的步骤。
本发明由于采取以上技术方案,其具有以下优点:
本发明方法通过采用将单一细胞图像和光谱数据相结合,构成多模态特征,增加了数据的完整性,从而提高单细胞种类鉴定鉴定准确性。
附图说明
图1为本发明一实施例提供的鉴定方法流程图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明的技术方案进行清楚、完整地描述。显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明的描述中,需要说明的是,术语“上”、“下”、“前”、“后”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的系统或组件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“装配”、“设置”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个组件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
本发明提供的微生物单细胞种类鉴定方法、装置、介质及设备,通过将单一细胞图像和光谱数据相结合,构成多模态特征,提高了数据的完整性和鉴定准确性。
下面,结合附图对本发明实施例提供的微生物单细胞种类鉴定方法、装置、介质及设备进行详细的说明。
如图1所示,本实施例提供的微生物单细胞种类鉴定方法,包括以下步骤:
步骤101,筛选单细胞拉曼光谱图谱。
将挑选的拉曼光谱图谱存入参考图谱数据库中,将采集的微生物单细胞的拉曼光谱数据和参考图谱数据库中的拉曼图谱数据进行比较分析,筛选出符合条件的拉曼光谱数据;
具体地,在拉曼光谱图谱采集过程中,利用卷积神经网络CNN(Convolutionalneural network)来对图谱进行智能筛选,步骤包括:
构建参考图谱数据库,将经过筛选的图谱存入参考数据库中,
利用CNN算法对采集的光谱数据和参考图谱数据库中数据进行比较,分析筛选出相似度高的图谱;
具体地,将原始采集到的未经过预处理的光谱数据作为网络输入,经过卷积层、池化层、全连接层的计算,在全连接层会输出一个对应N个物种的N维输出向量,将向量作为输入映射到Softmax函数,可以得到光谱属于N个不同类别的N个概率,概率最大的值为光谱预测类别,光谱质量越高分类效果越好,对应的概率值P越大;当为最大概率设置阈值T,若光谱数据经Softmax计算的概率的最大值大于阈值,就认为此光谱的质量符合质量控制要求。
具体地,将采集的微生物单细胞的拉曼光谱数据作为测试数据,输入到参考图谱数据库,经过计算输出一个对应N个物种的N维输出向量,N为自然数;
将向量作为输入映射到Softmax函数,对一特定测试数据Softmax输出第i个类别的概率,i为自然数,并在输出的概率中筛选出最大概率,最大概率值为P,测试数据中同一类别的所有数据的Softmax函数最大值的均值为M,方差S,若M-S/2≤P≤M+S/2,则拉曼光谱数据为筛选出的符合条件的拉曼光谱数据。
Softmax函数如公式(1)所示:
其中,i为第i个类别,C表示为类别总数,zi为第i个类别的全连接层输出,Softmax(zi)为测试数据在第i个类别的概率值,e为自然底数。
步骤102,分析光谱检测数量。
将筛选出的拉曼光谱数据作为样本,根据光谱数据样本中特定的光谱特征值进行计算,得到样本在特定的光谱特征值下稳定的最小样本光谱检测数量;
具体地,光谱检测数量根据光谱数据样本中特定的光谱特征值进行计算,为了实时反馈光谱采集过程中特征值随采样体积的变化,设计并构建了实时样本量分析方法,样本量仅针对某一特定的光谱特征值进行计算,代表了该样本在某一特征值下稳定的最小样本数。实时样本量分析就是在光谱采集过程中,根据现有的光谱实时计算并更新样本量。
具体地,以CDR(CD-Ratio)计算为例,单细胞拉曼光谱的测量,以1000次中30个测量光谱随机获得初始数据集Xn,然后计算平均CDR和CDRn的差异。在1000次统计中,第n个CDR为CDRn,n为整数,取值范围为1到1000,CDRn与CDR群体的相对误差小于5%的概率P。P为样本数为30时,样本特征值趋于稳定的概率,当P>95%是可靠的;当P小于95%时,继续对样本进行P重新计算,直到P大于95%。
步骤103,光谱数据标准化。
采集光谱检测数量对应的光谱数据,将光谱数据经校准转移模型进行光谱数据标准化,得到标准化光谱数据,用于消除因检测条件或样品环境变化引起的信号差异性变化;
具体地,在检测条件或样品环境发生变化的情况下,如样品检测环境变化、样品形态改变、检测参数改变和仪器更换等,拉曼光谱通常会发生强度差异和波长偏移,传统的定量或定性模型直接对这些光谱进行预测,就会造成预测结果出现偏差。
本实施例通过分段直接标准化PDS(Piecewise Direct Standardization)算法解决预测结果出现偏差的问题,由于光谱数据的波数和强度变化都是区域性的,其局限在一定的范围之内。将光谱数据分为目标集光谱和待调整集光谱,由此,目标集光谱某个波数的值只与待调整集光谱相对应的波数附近的几个点有较大关联,与相隔较远的波数无关联。选择以某个波数为中心,根据设定的范围左右扩展作为窗口,将目标集光谱第i个波数的强度值与待调整集光谱以i为中心的窗口矩阵构建多元回归模型,如公式(2)所示,i为自然数:
bi通过偏最小二乘回归进行求解,将回归模型中的回归系数bi置于变换矩阵F的主对角线上,并将其他元素置为0,这样就得到了转换矩阵F,如公式(3)所示。
新的临床样品XS′就可以通过转换矩阵F变换成标准化的,与纯培养空间相同的标准化光谱X′ s,std,如公式(4)所示:
X′ s,std=X′S·F (4)
用来建立光谱转移模型的光谱称为标准光谱,采集标准光谱所用的样品为临床和纯培养状态两种状态条件下通用的单细胞样品,当样本容量为150-200个时,即可覆盖目标集范围内的样品光谱特征。
步骤104,构建通用性单细胞表型组学数据库。
将经过模型转移后的标准化光谱数据,结合在光谱实时采集过程中实时采集的单细胞图像数据,存储到组学数据库中,从而构建单细胞表型组学数据库;
具体地,在单细胞光谱实时采集过程中,将获取的单细胞图像数据进行存储。结合经校准转移模型进行光谱数据标准化的光谱数据,构建通用性单细胞表型组学数据库,为后续鉴定比对提供数据支撑。
步骤105,多模态特征融合。
将基于构建的单细胞表型组学数据库中的细胞图像和光谱数据相结合,利用ReliefF算法对图像和光谱的特征值进行权重确定以进行融合操作,构成多模态特征,并将多模态特征叠加形成更长的矢量作为单细胞表型的一个描述,用于表征单细胞对象,达到多模态特征融合。
步骤106,构建CNN分类器。
将实时采集的要分类的单细胞表型数据,经过多模态特征融合后,用特征值进行分类比对,以获得细胞种类,实现对实时采集的单细胞表型数据进行种类鉴定。
具体地,CNN分类器架构由初始卷积层、六个残差层和最终的全连接层组成,残差层包含了每个残差块的输入和输出之间的快捷连接,使得梯度更好的传播且训练更稳定。每个残差层包含四个卷积层,因此网络的总深度为二十六层。初始卷积层有六十四个卷积滤波器,每个卷积层有100个滤波器。初始卷积层、六个残差层和最终的全连接层的体系结构参数通过网格搜索选择,并在物种的分类任务上进行分离的一次训练和验证。
具体地,CNN分类器的激活函数选用Sigmoid函数,Φ(z)为经过激活函数非线性化后的输出,作为下一层的输入,目的是引入非线性因素,解决线性模型表达能力不足的问题,如公式(5)所示:
其中,z为本层网络的输入与权值相乘且叠加偏移量的输出,作为激活函数的输入,公式(5)等式右侧即为Sigmoid函数。
CNN分类器的损失函数是交叉熵损失函数,损失函数的作用是反映预测数据和实际数据的差距大小,函数如公式(6)所示:
全连接层后连接Softmax函数将多个神经元的输出,映射到(0,1)区间内,对输出向量进行归一化,凸显其中最大的值并抑制远低于最大值的其他分量,从而实现多分类。
本实施中拉曼光谱数据可以通过微生物单细胞种类快速鉴定仪进行拉曼光谱数据的采集,鉴定仪包括激发光模块、显微聚焦模块、拉曼主光路及传输模块、同轴照明模块、成像模块、电动位移平台、采集控制模块;
激发光模块,用于发射激光;显微聚焦模块,用于将激光聚焦到样品上,从而产生拉曼信号;
拉曼主光路及传输模块,用于获取样品上细胞的拉曼光谱,并向软件自动采集控制模块传输细胞的拉曼光谱信息;
同轴照明模块,用于为显微聚焦模块提供同轴照明光;成像模块,用于拍摄细胞,获得各细胞的位置信息,形成每个细胞与预设细胞对比所得的位置矫正信息;同时用于拍摄确定细胞的采集位置;
采集控制模块,用于对激发光模块、拉曼主光路及传输模块、显微聚焦模块、同轴照明模块、成像模块和电动位移平台和进行控制,实现拉曼光谱数据的采集。
本发明还提供一种微生物单细胞种类鉴定装置,包括:
筛选拉曼光谱图谱模块,被配置为将采集的单细胞拉曼光谱数据和参考图谱数据库中的拉曼图谱数据进行比较分析,筛选出符合条件的所述拉曼光谱数据;
分析光谱检测数量模块,被配置为将筛选出的所述拉曼光谱数据作为样本,根据光谱数据样本中特定的光谱特征值进行计算,得到样本在特定的光谱特征值下稳定的最小样本光谱检测数量;
光谱数据标准化模块,被配置为采集光谱检测数量对应的光谱数据,将所述光谱数据经校准转移模型进行光谱数据标准化,得到标准化光谱数据;
构建通用性单细胞表型组学数据库模块,被配置为将标准化光谱数据以及实时采集的单细胞图像数据,存储到组学数据库中,构建单细胞表型组学数据库;
多模态特征融合模块,被配置为基于单细胞表型组学数据库中的细胞图像和光谱数据对图像和光谱的特征值进行多模态特征融合;
分类模块,被配置为将多模态特征融合通过CNN分类器进行分类获得细胞种类,实现单细胞表型数据的种类鉴定。
本发明还提供一种计算机可读存储介质,其上存储有计算机程序,其特征在于,计算机程序被处理器执行时实现微生物单细胞种类鉴定方法的步骤。
本发明还提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,处理器执行计算机程序时实现微生物单细胞种类鉴定方法的步骤。
本发明是根据具体实施方式的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解为可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (9)
1.一种微生物单细胞种类鉴定方法,其特征在于,所述方法包括:
将采集的单细胞拉曼光谱数据和参考图谱数据库中的拉曼图谱数据进行比较分析,筛选出符合条件的拉曼光谱数据;
将筛选出的所述拉曼光谱数据作为样本,根据样本中特定的光谱特征值进行计算,得到样本在特定的光谱特征值下稳定的最小样本光谱检测数量;
采集光谱检测数量对应的光谱数据,将所述光谱数据经校准转移模型进行光谱数据标准化,得到标准化光谱数据;
基于标准化光谱数据以及实时采集的单细胞图像数据构建单细胞表型组学数据库;
基于单细胞表型组学数据库中的细胞图像和光谱数据对图像和光谱的特征值进行多模态特征融合;
将多模态特征融合以后的数据进行分类获得细胞种类,实现单细胞表型数据的种类鉴定。
2.如权利要求1所述的微生物单细胞种类鉴定方法,其特征在于,将采集的单细胞拉曼光谱数据和参考图谱数据库中的拉曼图谱数据进行比较分析,筛选出符合条件的拉曼光谱数据,包括:
构建参考图谱数据库,将筛选的图谱存入参考数据库中;
利用CNN算法对采集的光谱数据和参考图谱数据库中数据进行比较分析,筛选出相似度高的图谱筛选。
3.如权利要求2所述的微生物单细胞种类鉴定方法,其特征在于,利用CNN算法对采集的光谱数据和考图谱数据库中数据进行比较分析,筛选出相似度高的图谱筛选,包括:
将采集的拉曼光谱数据作为测试数据,输入到所述参考图谱数据库,经过计算输出一个对应N个物种的N维输出向量,N为自然数;
将向量作为输入映射到Softmax函数,对一特定测试数据Softmax输出的最大概率值为P,所述测试数据中同一类别的所有数据的Softmax函数最大值的均值为M,方差S,若M-S/2≤P≤M+S/2,则所述拉曼光谱数据为筛选出符合条件的拉曼光谱数据。
4.如权利要求1所述的微生物单细胞种类鉴定方法,其特征在于,采集光谱检测数量对应的光谱数据,将所述光谱数据经校准转移模型进行光谱数据标准化,得到标准化光谱数据,采用分段直接标准化PDS算法,包括:
将光谱数据分为目标集光谱和待调整集光谱;
选择以某个波数为中心,根据设定的范围左右扩展作为窗口,将目标集光谱第i个波数的强度值与待调整集光谱以i为中心的窗口矩阵构建多元回归模型,i为自然数;通过偏最小二乘回归进行求解,将回归模型中的回归系数置于变换矩阵的主对角线上,并将其他元素置为0,得到转换矩阵;
将采集光谱数据通过转换矩阵变换成标准化光谱数据。
5.如权利要求1所述的微生物单细胞种类鉴定方法,其特征在于,将多模态特征融合以后的数据进采用CNN分类器进行分类获得细胞种类。
6.如权利要求1所述的微生物单细胞种类鉴定方法,其特征在于,利用ReliefF算法对图像和光谱的特征值进行权重确定以进行融合操作,构成多模态特征。
7.一种微生物单细胞种类鉴定装置,其特征在于,包括:
筛选拉曼光谱图谱模块,被配置为将采集的单细胞拉曼光谱数据和参考图谱数据库中的拉曼图谱数据进行比较分析,筛选出符合条件的所述拉曼光谱数据;
分析光谱检测数量模块,被配置为将筛选出的所述拉曼光谱数据作为样本,根据光谱数据样本中特定的光谱特征值进行计算,得到样本在特定的光谱特征值下稳定的最小样本光谱检测数量;
光谱数据标准化模块,被配置为采集光谱检测数量对应的光谱数据,将所述光谱数据经校准转移模型进行光谱数据标准化,得到标准化光谱数据;
构建通用性单细胞表型组学数据库模块,被配置为将标准化光谱数据以及实时采集的单细胞图像数据,构建单细胞表型组学数据库;
多模态特征融合模块,被配置为基于单细胞表型组学数据库中的细胞图像和光谱数据对图像和光谱的特征值进行多模态特征融合;
分类模块,被配置为将多模态特征融合通过CNN分类器进行分类获得细胞种类,实现单细胞表型数据的种类鉴定。
8.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-6任一项所述微生物单细胞种类鉴定方法的步骤。
9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1-6任一项所述微生物单细胞种类鉴定方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210240203.2A CN114660040A (zh) | 2022-03-10 | 2022-03-10 | 微生物单细胞种类鉴定方法、装置、介质及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210240203.2A CN114660040A (zh) | 2022-03-10 | 2022-03-10 | 微生物单细胞种类鉴定方法、装置、介质及设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114660040A true CN114660040A (zh) | 2022-06-24 |
Family
ID=82028510
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210240203.2A Pending CN114660040A (zh) | 2022-03-10 | 2022-03-10 | 微生物单细胞种类鉴定方法、装置、介质及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114660040A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116363440A (zh) * | 2023-05-05 | 2023-06-30 | 北京建工环境修复股份有限公司 | 基于深度学习的土壤中有色微塑料的识别检测方法及系统 |
CN116400244A (zh) * | 2023-04-04 | 2023-07-07 | 华能澜沧江水电股份有限公司 | 储能电池的异常检测方法及装置 |
CN118051808A (zh) * | 2024-04-15 | 2024-05-17 | 应然优储生物科技(天津)有限公司 | 一种基于ai的细胞识别方法和系统 |
CN118468142A (zh) * | 2024-07-10 | 2024-08-09 | 清华大学 | 基于交叉关联注意力的少样本拉曼光谱识别方法和装置 |
-
2022
- 2022-03-10 CN CN202210240203.2A patent/CN114660040A/zh active Pending
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116400244A (zh) * | 2023-04-04 | 2023-07-07 | 华能澜沧江水电股份有限公司 | 储能电池的异常检测方法及装置 |
CN116400244B (zh) * | 2023-04-04 | 2023-11-21 | 华能澜沧江水电股份有限公司 | 储能电池的异常检测方法及装置 |
CN116363440A (zh) * | 2023-05-05 | 2023-06-30 | 北京建工环境修复股份有限公司 | 基于深度学习的土壤中有色微塑料的识别检测方法及系统 |
CN116363440B (zh) * | 2023-05-05 | 2023-12-19 | 北京建工环境修复股份有限公司 | 基于深度学习的土壤中有色微塑料的识别检测方法及系统 |
CN118051808A (zh) * | 2024-04-15 | 2024-05-17 | 应然优储生物科技(天津)有限公司 | 一种基于ai的细胞识别方法和系统 |
CN118051808B (zh) * | 2024-04-15 | 2024-07-09 | 应然优储生物科技(天津)有限公司 | 一种基于ai的细胞识别方法和系统 |
CN118468142A (zh) * | 2024-07-10 | 2024-08-09 | 清华大学 | 基于交叉关联注意力的少样本拉曼光谱识别方法和装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114660040A (zh) | 微生物单细胞种类鉴定方法、装置、介质及设备 | |
US20240062377A1 (en) | Image analysis method, apparatus, non-transitory computer readable medium, and deep learning algorithm generation method | |
CN110516596B (zh) | 基于Octave卷积的空谱注意力高光谱图像分类方法 | |
CN111310756B (zh) | 一种基于深度学习的损伤玉米颗粒检测和分类方法 | |
US20130026391A1 (en) | Information processing apparatus, information processing method, program, and method of correcting intensity of fluorescence spectrum | |
CN111126511B (zh) | 一种基于植被指数融合的lai定量模型建立的方法 | |
CN107895136B (zh) | 一种煤矿区域识别方法及系统 | |
US20240116083A1 (en) | Methods of sorting matthiola seeds | |
CN115424006A (zh) | 应用于作物表型参数反演的多源多层次数据融合方法 | |
CN117576195A (zh) | 一种植物叶片形态识别方法 | |
CN103278467A (zh) | 一种植物叶片氮素丰缺快速无损高准确率的鉴别方法 | |
CN114299324A (zh) | 一种基于多尺度域对抗网络的病理图像分类方法及系统 | |
CN114627467A (zh) | 基于改进神经网络的水稻生育期识别方法及系统 | |
CN116559111A (zh) | 一种基于高光谱成像技术的高粱品种识别方法 | |
CN115359264A (zh) | 一种密集型分布的粘连细胞深度学习识别方法 | |
CN114973024A (zh) | 一种机采棉脱叶效果综合评价指标监测与评价方法及系统 | |
CN114580501A (zh) | 骨髓细胞分类方法、系统、计算机设备及存储介质 | |
CN117589767A (zh) | 一种烟叶采收时间确定方法、电子设备和存储介质 | |
CN116612811A (zh) | 一种基于神经架构搜索的作物表型组学分析模型构建方法、电子设备及存储介质 | |
CN116258844A (zh) | 一种棉花叶片表型性状快速精准鉴定方法 | |
CN116310788A (zh) | 基于图谱融合的植株叶片氮含量高光谱建模方法 | |
CN115830318A (zh) | 基于改进Mask-RCNN网络的重叠烟丝图像分割方法及装置 | |
Li et al. | Early drought plant stress detection with bi-directional long-term memory networks | |
CN112466389A (zh) | 一种基于机器学习算法获取肿瘤标记物的方法和系统 | |
CN117274236B (zh) | 基于高光谱图像的尿液成分异常检测方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |