CN109813683A - 一种病原体快速检测器及其检测方法 - Google Patents
一种病原体快速检测器及其检测方法 Download PDFInfo
- Publication number
- CN109813683A CN109813683A CN201910096728.1A CN201910096728A CN109813683A CN 109813683 A CN109813683 A CN 109813683A CN 201910096728 A CN201910096728 A CN 201910096728A CN 109813683 A CN109813683 A CN 109813683A
- Authority
- CN
- China
- Prior art keywords
- feature
- data
- pathogen
- signal
- scattering
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Investigating Or Analysing Materials By Optical Means (AREA)
- Investigating Or Analysing Biological Materials (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明公开了一种病原体快速检测器及其检测方法,包括:将制备的未知细菌样品置于系统内,当细菌颗粒通过聚焦的激光束,光被样品吸收,同时也会产生折射和散射。通过光传感器获取散射光强度信号,并基于时域功率谱提取特征。不同的病原体根据其大小、形状和形态呈现出不同的特征分布。使用提取的特征进行支持向量机(SVM)分类器建模,对粪肠球菌,大肠杆菌和金黄色葡萄球菌三种细菌进行分类训练,平均检测准确率分别为98.8%,79.65%和82.3%。结果表明,本发明方法在病原体检测中有着显著的效果,具有对病原体进行快速和无标记检测的潜力。
Description
技术领域
本发明涉及一种病原体检测器及其检测方法,尤其是一种基于MIE光散射和机器学习的病原体检测器及其检测方法。
背景技术
提供卫生食品和饮用水是健康生命的必需品和基础,然而目前,这仍是具有挑战性的。在美国每年有超过200种已知的疾病通过食物传播,在7500多万已报道的病例中更是包含8000多死亡案例[1]。食物中毒是由于不卫生的食物引起的,而细菌是引起食物不卫生的原因之一。食源性病原体已成为对公众健康构成威胁的常见原因。
类肠球菌是低等病原体,但它们对用于绝大多数抗生素具有固有耐药性,仅有少数抗生素对它们有效,可用于临床治疗[2,3]。大肠杆菌可导致腹泻和溶血性尿毒综合症,其特殊特性还会导致肠道外感染,这不是引起人类疾病常见的原因。金黄色葡萄球菌可引起轻微的皮肤感染乃至威胁生命的疾病,一些菌株会产生诱发食物中毒的肠毒素[6]。由于病原体的不良影响和较强的抗药性,早期发现病原体可降低其在环境中的存在和污染。因此,病原体检测在医疗和食品安全领域发挥着重要的作用。[7]
传统的病原体检测方法是利用显微镜对在培养基里的病原体进行原位或离体目测。传统方法比较繁琐,耗时较长,在种和株水平上的特异性和鉴别性较差。现代检测病原体和诊断疾病的技术有多种,例如聚合酶链反应(PCR),酶联免疫吸附试验(ELISA),聚丙烯酰胺凝胶电泳(PAGE),荧光原位杂交(FISH),限制性片段长度多态性分析 (RFLP),气相色谱-质谱(GC-MS)和基质辅助激光解吸电离飞行时间质谱 (MALDI-TOF)。
PCR不允许核酸定位,并且需要设计引物,这限制了快速检测。ELISA具有较低的灵敏度并且涉及一些费力的步骤。PAGE仅适用于检测中型到大型微生物。FISH依赖于荧光显微镜和图像分析系统[8]。RFLP缓慢而繁琐,它需要大量的样本DNA。 GC-MS具有生物降解和hopane分布的局限性。MALDI-TOF具有低分析灵敏度并且对种相关的细菌如志贺氏菌、大肠杆菌鉴别能力低。目前用于病原体检测的主要技术费力、耗时、昂贵,需要训练有素的人员遵循实验方法并且需要标记的天然产物[9]。因此,使用上述标准技术无法适用于病原体的快速检测,也无法作为预防人类感染的筛选机制。
对快速,经济,无标记和便携式系统的需求为研究人员寻找微生物检测的新方法提供了方向。因此,为了能找到实现简单化的方法,包括减少总体识别时间,无人工参与的自动化,已经进行了广泛的研究。许多光学方法可以实现对微生物颗粒的非侵入式和无标记检测。许多生物医学设备使用来自微生物颗粒的激光散射信号来发现物理和化学特征,例如荧光和共聚焦显微镜,扫描和成像细胞术以及流式细胞术[10]。静态激光散射和动态激光散射是激光散射中公认的两种结构,通常用于粒子分析[11]。
参考文献:
[1]K.S.Gracias and J.L.McKillip,″A review of conventional detectionand enumeration methods for pathogenic bacteria in food,″Canadian Journal ofMicrobiology,vol.50,no.11,pp.883-890,2004/11/01 2004.
[2]F.Adzitey,N.Huda,and G.R.R.J.B.Ali,″Molecular techniques fordetecting andtyping ofbacteria, advantages and application to foodbomepathogens isolated from ducks,″vol.3,no.2,pp.97-107,2013.
[3]G.Giraffa,″Enterococci from foods,″vol.26,no.2,pp.163-171,2002.
[4]D.L.Smith,J.A.Johnson,A.D.Harris,J.P.Furuno,E.N.Perencevich,andJ.G.Morris Jr,″Assessing risks for a pre-emergent pathogen:virginiamycin useand the emergence of streptogramin resistance in Enterococcus faecium,″TheLancet Infectious Diseases,vol.3,no.4,pp.241-249,2003/04/01/2003.
[5]C.Vincent et al,″Food reservoir for Escherichia coli causingurinary tract infections,″Emerging infectious diseases,vol.16,no.1,pp.88-95,2010.
[6]J.R.Johnson and T.A.Russo,″Extraintestinal pathogenic Escherichiacoli:“The other bad E coli”,″ Journal of Laboratory and Clinical Medicine,vol.139,no.3,pp.155-162,2002/03/01/2002.
[7]J.B.Kaper,J.P.Nataro,and H.L.T.Mobley,″Pathogenic Escherichiacoli,″Nature Reviews Microbiology,Review Article vol.2,p.123,02/01/online2004.
[8]J.J.N.N.Bowersox,″Experimental staph vaccine broadly protective inanimal studies,″vol.27,1999.
[9]L.M.Schlecht et al,″Systemic Staphylococcus aureus infectionmediated by Candida albicans hyphal invasion of mucosal tissue,″vol.161,no.1,pp.168-181,2015.
[10]S.Y.C.Tong,J.S.Davis,E.Eichenberger,T.L.Holland,and V.G.Fowler,Jr.,″Staphylococcus aureus infections:epidemiology,pathophysiology,clinicalmanifestations,and management,″Clinical microbiology reviews,vol.28,no.3,pp.603-661,2015.
[11]L.Váradi et al,″Methods for the detection and identification ofpathogenic bacteria:past,present,and future,″Chemical Society Reviews,10.1039/C6CS00693K vol.46,no.16,pp.4818-4832,2017.
发明内容
针对现有技术的不足,本发明提供了一种基于MIE光散射和机器学习的病原体检测器及其检测方法,其中,所述检测器通过如下步骤构建:
步骤1,将激光束入射到细菌样品上,用光传感器组件收集前向散射光;
步骤2,对采集的散射光数据进行预处理;
步骤3,基于散射光数据,进行特征提取,得到数据集;
步骤4,创建SVM病原体检测器,并基于数据集训练SVM病原体检测器。
步骤1中,使用635nm的激光束入射到细菌样品上,当细菌颗粒通过激光束时,光会被散射,细菌样品周围的n个光传感器均匀分布在激光光束的0-60度和330-360 度的空间内,且以1KHz采样频率采样散射光强度。
步骤1中,将10ml蒸馏水与细菌溶液混合得到细菌样品。
步骤2中,使用低通滤波器去除采集的散射光数据中的噪声,并进行加窗分割[参考文献:D.Lehmann,H.Ozaki and I.Pal,“EEG alpha map series:brain micro-statesby space-oriented adaptive segmentation,”Electroencephalography and clinicalneurophysiology,vol.67,no.3,pp.271-288,1987/9 1987.]。
步骤3包括:
步骤3-1,设定一个光传感器的时域信号表示为x[j],其中j=1,2,...N,N为长度,即步骤2加窗分割截取的信号长度,x[j]是一种离散信号的表示方式,j代表第j个采样点,x[j]代表第j个采样点的信号幅值,采样频率为fs,离散傅立叶变换后的信号表示为X[k],公式如下:
公式(1)中,X[k]乘以其共轭X*[k]除以N能够得到无相位的功率谱密度P[k],k 是频率序列标号;
步骤3-2,使用统计方法进行频率分布[参考文献Hjorth B,EEG analysis basedon time domain properties,Electroencephalography&ClinicalNeurophysiology.1970.],令所有奇数矩阵变为零,即m1=m3=m5.....=0,m5表示一个5阶矩阵m,则功率谱密度P[k] 的n*1阶矩阵m的定义为mn×1,如公式(2)所示:
当n=0时,得到帕塞瓦尔Parseval定理,如公式(1)所示;当n不为0时,根据傅立叶变换的微分性质,离散信号x[j]的n阶导数,等于频谱X[k]乘以k的n次方,即:
F[Δnx[j]]=knX[k] (3)
F[Δnx[j]]表示x[j]的n阶导数的傅里叶变换;
步骤3-3,使用零阶矩阵描述信号x[j]在频域的总功率:
二阶矩阵的修正谱k2P[k]与频率函数kX[k]有关,公式如下:
其中,Δ表示求导;
四阶矩阵的平方根式如下:
其中,k4P[k]表示四阶矩阵的修正谱,Δ2表示求导的平方;
步骤3-4,特征归一化:对和进行幂变换,幂变换结果分别为m0、m2、 m4:
步骤3-5,前三个提取的特征分别定义为f1、f2和f3,计算公式如下:
f1=log(m0) (7)
f2=log(m0-m2) (8)
f3=log(m0-m4) (9)
步骤3-6,计算稀疏性特征f4,稀疏性特征定义了矢量信号的能量仅用少数个分量来表示,即f4仅用m0,m2,m4三个分量来表示,具体计算公式如下:
步骤3-7,计算波形长度比f5:
步骤3-8,从单个光传感器的通道提取的整体特征包括五个不同的特征,分别为f1、f2、f3、f4和f5,从每个光传感器的通道提取这五个特征,总共n个通道得到5n个特征,这5n个特征组成数据集。(还可以在提取完该细菌样品的特征后,再次更换另一种细菌样品,再次进行提取特征;不断重复以上步骤,可以构建包含两种以上的细菌样本的特征的数据集)。
步骤4包括:将数据集随机划分出一定比例(例如70%)的数据作为训练SVM分类器的训练数据,对SVM分类器进行训练,剩余的数据作为测试数据。
本发明还提供了一种使用基于MIE光散射和机器学习的病原体检测器检测病原体的方法,包括如下步骤:
步骤a1,将蒸馏水与待检测细菌溶液混合得到待检测细菌样品;
步骤a2,将激光束入射到检测细菌样品上,用光传感器组件收集前向散射光;
步骤a3,基于散射光数据,进行特征提取;
步骤a4,将提取的特征输入到SVM病原体检测器中,得到结果。
步骤a1~步骤a3涉及的方法,可以参考步骤1~步骤3的具体内容。
本发明所提出的方法是快速的,无标记的并且操作非常简单。它不需要任何样品制备和化学分析。病原体检测通过检测样品的激光散射实现。不同的病原体根据其大小、形状和形态显示出不同的散射光特征。利用信号功率谱,从采集的散射光中提取特征,并使用机器学习方法进行分类。结果使用交叉验证分类和SVM训练模型验证。
附图说明
下面结合附图和具体实施方式对本发明做更进一步的具体说明,本发明的上述或其他方面的优点将会变得更加清楚。
图1为快速检测病原体系统的组成和示意图。
图2是1μm半径球的Mie光散射预测示意图。
图3是当没有使用细菌样品时,信号显示零的示意图。
图4是基于SVM机器学习方法的细菌检测流程图。
图5a是基于粪肠球菌(Enterococcus faecalis),激光散射测量,测量信号(y轴)与时间(x轴)的关系。
图5b是基于大肠杆菌(Escherichia coli),激光散射测量,测量信号(y轴)与时间(x 轴)的关系。
图5c是基于金黄色葡萄球菌(Staphylococcus aureus),激光散射测量,测量信号(y轴) 与时间(x轴)的关系。
图6.是使用SVM训练的分类器的混淆矩阵描绘的结果。
具体实施方式
下面结合附图及实施例对本发明做进一步说明。
本发明提供了一种基于MIE光散射和机器学习的病原体检测器及其检测方法,其中,所述检测器通过如下步骤构建:
步骤1,将激光束入射到细菌样品上,用光传感器组件收集前向散射光;
步骤2,对采集的散射光数据进行预处理;
步骤3,基于散射光数据,进行特征提取,得到数据集;
步骤4,创建SVM病原体检测器,并基于数据集训练SVM病原体检测器。
步骤1中,使用635nm的激光束入射到细菌样品上,当细菌颗粒通过激光束时,光会被散射,细菌样品周围的n个光传感器均匀分布在激光光束的0-60度和330-360 度的空间内,且以1KHz采样频率采样散射光强度。
步骤1中,将10ml蒸馏水与细菌溶液混合得到细菌样品。
步骤2中,使用低通滤波器去除采集的散射光数据中的噪声,并进行加窗分割[参考文献:D.Lehmann,H.Ozaki and I.Pal,“EEG alpha map series:brain micro-statesby space-oriented adaptive segmentation,”Electroencephalography and clinicalneurophysiology,vol.67,no.3,pp.271-288,1987/9 1987.]。
步骤3包括:
步骤3-1,设定一个光传感器的时域信号表示为x[j],其中j=1,2,...N,N为长度,即步骤2加窗分割截取的信号长度,x[j]是一种离散信号的表示方式,j代表第j个采样点,x[j]代表第j个采样点的信号幅值,采样频率为fs,离散傅立叶变换后的信号表示为X[k],公式如下:
公式(1)中,X[k]乘以其共轭X*[k]除以N能够得到无相位的功率谱密度P[k],k 是频率序列标号;
步骤3-2,使用统计方法进行频率分布[参考文献Hjorth B,EEG analysis basedon time domain properties,Electroencephalography&ClinicalNeurophysiology.1970.],令所有奇数矩阵变为零,即m1=m3=m5......=0,m5表示一个5阶矩阵m,则功率谱密度P[k] 的n*1阶矩阵m的定义为mn×1,如公式(2)所示:
当n=0时,得到帕塞瓦尔Parseval定理,如公式(1)所示;当n不为0时,根据傅立叶变换的微分性质,离散信号x[j]的n阶导数,等于频谱X[k]乘以k的n次方,即:
F[Δnx[j]]=knX[k] (3)
F[Δnx[j]]表示x[j]的n阶导数的傅里叶变换;
步骤3-3,使用零阶矩阵描述信号x[j]在频域的总功率:
二阶矩阵的修正谱k2P[k]与频率函数kX[k]有关,公式如下:
其中,Δ表示求导;
四阶矩阵的平方根式如下:
其中,k4P[k]表示四阶矩阵的修正谱,Δ2表示求导的平方;
步骤3-4,特征归一化:对和进行幂变换,幂变换结果分别为m0、m2、 m4:
步骤3-5,前三个提取的特征分别定义为f1、f2和f3,计算公式如下:
f1=log(m0) (7)
f2=log(m0-m2) (8)
f3=log(m0-m4) (9)
步骤3-6,计算稀疏性特征f4,稀疏性特征定义了矢量信号的能量仅用少数个分量来表示,即f4仅用m0,m2,m4三个分量来表示,具体计算公式如下:
步骤3-7,计算波形长度比f5:
步骤3-8,从单个光传感器的通道提取的整体特征包括五个不同的特征,分别为f1、f2、f3、f4和f5,从每个光传感器的通道提取这五个特征,总共n个通道得到5n个特征,这5n个特征组成数据集。(还可以在提取完该细菌样品的特征后,再次更换另一种细菌样品,再次进行提取特征;不断重复以上步骤,可以构建包含两种以上的细菌样本的特征的数据集)。
步骤4包括:将数据集随机划分出一定比例(例如70%)的数据作为训练SVM分类器的训练数据,对SVM分类器进行训练,剩余的数据作为测试数据。
本发明还提供了一种使用基于MIE光散射和机器学习的病原体检测器检测病原体的方法,包括如下步骤:
步骤a1,将蒸馏水与待检测细菌溶液混合得到待检测细菌样品;
步骤a2,将激光束入射到检测细菌样品上,用光传感器组件收集前向散射光;
步骤a3,基于散射光数据,进行特征提取;
步骤a4,将提取的特征输入到SVM病原体检测器中,得到结果。
步骤a1~步骤a3涉及的方法,可以参考步骤1~步骤3的具体内容。
实施例1
本实施例中涉及的硬件主要由三部分组成:a)激光束,b)光传感器组件,c)数据采集系统。特殊设计的激光束波长为660纳米。将12个光电传感器组装在样品架旁边,用于获取前向散射光。图1显示了该系统的总体示意图:尺寸为50cm×30cm×30cm,激光束(635nm)入射到细菌样品上,使用光传感器组件收集前向散射光。
MIE散射图给出了来自单个球形粒子的光散射的完整数学解和使用MIE散射分析调整的光传感器的位置。MIE图显示了散射光的强度和角度,这取决于粒子的大小和性质。图2显示了半径为1μm的球形颗粒的MIE预测计算。细菌样品周围的n个光传感器均匀分布在激光光束的0-60度和330-360度的空间内,且以1KHz采样频率采样散射光强度。该图显示了前向散射光强度最大。虽然细菌颗粒通常不是球形的,并且在特定的研究方面,它们的形状和大小从1微米到4微米不等。与侧向散射相比,前向散射更加突出。因此,十二个光电传感器布置在系统的不同位置。使用PCI 6225(National instruments)和Matlab 2017a这一平台进行数据采集和算法开发。完成一系列实验以找到用于创建分类模型的最佳波形和数据。
数据采集系统:
16位多功能I/O设备PCI-6225(National Instruments)数据采集系统从传感器采集数据并传输至MATLAB。为了鉴定细菌微生物,通过将10ml蒸馏水与细菌溶液混合制备样品。制备好的样品放在样机内,当激光束通过样品时,光会散射。周围传感器以 1Khz采样频率采样散射光,散射光强度以波形峰值的形式显示。12个位置不同的传感器同步采集信号,使用低通滤波器去除信号中的噪声。从获取的数据中,基于信号的功率谱提取特征。为了判断数据采集系统的效率,在没有放置任何微生物的空样品,激光通过而不发生光散射,显示零电平信号,如图3所示。
为了获得数据,首先对给定的病原体单独制备样品。每个样品用10ml蒸馏水离心稀释细菌溶液制备。在对所有数据集进行梳理以提取每种细菌的各种描述之后,分别对来自每种细菌物种的数据收集,进行若干单独测试并保存为单个文件。
特征提取:
许多时域特征提取方法已经用于信号分类,例如,脑电图,肌电图等。Rami[参考文献:R.N.Khushaba,M.Takruri,J.V.Miro,and S.Kodagoda,″Towards limb positioninvariant myoelectric pattern recognition using time-dependent spectralfeatures,″Neural Networks,vol.55,pp. 42-58,2014/07/01/2014.]等提出了基于功率谱特征的特征提取方法用于肌电信号模式识别,并在给定系统中采用了修改后的技术进行特征提取。细菌散射光数据的谱功率特性类似于肌电信号,并且不同的细菌显示出不同的信号转变。因此,将此特征提取技术应用于细菌的检测是有可能实现的。
为了从采集的信号中提取特征,通过窗口技术和称为分析窗口的单个窗口对信号进行分割。时域采集信号表示为x[j],其中j=1,2,...N,长度为N,采样频率为fs。可以使用离散傅立叶变换(DFT)在频域将时域信号描述为X[k]。Parseval定理表明序列在时域的能量等于其变换域的能量,给出了利用功率谱进行特征提取的推导定理:
X[k]乘以其共轭X*[k]除以N得到无相位的功率谱P[k],并且k是频率序列标号。众所周知,信号的傅里叶变换关于零频率是对称的,在正负频率中都给出相同的曲线。由于傅立叶变换的对称特性,在处理整个频谱中包含了所有的正负频率,因为没有其他方法可以从时域信号得到功率谱。因此,使用统计方法进行频率分布,所有奇数矩变为零,根据功率谱密度P[k]的n阶矩m的定义由下式给出。
当等式(2)n=0时,得到Parseval定理,如(1)所示,当n为其他值时,得到傅立叶变换的时间微分性质。离散时间信号的n阶导数,等于频谱乘以k的n次方。
F[Δnx[j]]=knX[k] (3)
零阶矩:描述频域总功率。
二阶和四阶矩:Hjorth认为,二阶矩可以被认为是一个幂,其修正谱k2P[k]与频率函数kX[k]有关。
同样,四阶矩的平方根式如下:
特征归一化可以降低噪声,对和进行幂变换。幂变换结果如下,其中λ根据经验设定为0.1。
前三个提取的特征定义为:
f1=log(m0) (7)
f2=log(m0-m2) (8)
f3=log(m0-m4) (9)
计算稀疏性特征f4,稀疏性特征定义了矢量信号的能量仅用少数个分量来表示,即 f4仅用m0,m2,m4三个分量来表示,计算公式如下:
波形长度比(WL):WL定义为波形长度特征,是信号导数绝对值之和,数学上是一阶导数的波形长度与二阶导数的波形长度之比。
从单个通道提取的整体特征包括五个不同的特征,如f=[f1,f2,f3,f4,f5]。细菌检测数据集包括来自12通道的数据,采样频率为1000Hz。从每个通道提取五个不同的特征,总共12个通道生成60个特征。
使用支持向量机的分类:
用于特征分类的各种机器学习工具中,基于SVM的算法特别有前景。为了量化本发明的检测性能,使用SVM进行分类。支持向量机算法可以构造参数空间中的非线性决策边界,能够在分类不同标签的多维空间中构造决策超平面。使用SVM分类病原体的总体流程图如图4所示。使用交叉验证判断分类器的分类质量和结果,并建立混淆矩阵用于总结分类器的灵敏度和精确度。
结果:
本实施例进行了一系列实验,从粪肠球菌中获取数据。同一种类的不同样本获取的一系列数据用于建立分类器模型和测试分类器准确性。图5a~图5c显示了不同种类样本数据的一部分,每个种类由于其形状和大小的不同而显示出不同的信号分布,它显示了预期结果的定性近似。图5a是基于粪肠球菌(Enterococcus faecalis),激光散射测量,测量信号(y轴)与时间(x轴)的关系。
从采集的信号中提取的特征,窗口大小为250ms,增量为150ms。总体而言,最终数据包含来自三种细菌的4583个数据点,每个数据点由60个特征表示。细菌病原体的分类分为两步:训练数据和测试数据。70%的数据用于训练,其余30%用于测试。基于训练数据,使用MATLAB 2017a训练SVM分类器。
为了预测可行的分类,散射信号的可变性描绘了光散射测量中每种细菌物种的独特特征。为了创建SVM分类器,数据集分为两个子集,70%用于训练数据,30%用于测试数据。在训练完模型之后,图6显示了混淆矩阵的值。总体上,分类器模型准确率为 79.2%,使用SVM分类器对粪肠球菌进行分类,准确率为98.8%,实验结果进一步验证了所提出的细菌分类方法的有效性,并取得了良好的效果。
实施例2
本实施例中,从大肠杆菌中获取数据。同一种类的不同样本获取的一系列数据用于建立分类器模型和测试分类器准确性。图5a~图5c显示了不同种类样本数据的一部分,每个种类由于其形状和大小的不同而显示出不同的信号分布,它显示了预期结果的定性近似。图5b是基于大肠杆菌(Escherichia coli),激光散射测量,测量信号(y轴)与时间(x轴)的关系。
从采集的信号中提取的特征,窗口大小为250ms,增量为150ms。总体而言,最终数据包含来自三种细菌的4583个数据点,每个数据点由60个特征表示。细菌病原体的分类分为两步:训练数据和测试数据。70%的数据用于训练,其余30%用于测试。基于训练数据,使用MATLAB 2017a训练SVM分类器。
为了预测可行的分类,散射信号的可变性描绘了光散射测量中每种细菌物种的独特特征。为了创建SVM分类器,数据集分为两个子集,70%用于训练数据,30%用于测试数据。在训练完模型之后,图6显示了混淆矩阵的值。总体上,分类器模型准确率为 79.2%,使用SVM分类器对大肠杆菌进行分类,准确率为79.65%。结果显示大肠杆菌分类准确度较低,训练误差为12.4%,检测误差为15.04%,其它细菌分类准确度较高。此外,实验结果进一步验证了所提出的细菌分类方法的有效性,并取得了良好的效果。
实施例3
本实施例中,从金黄色葡萄球菌中获取数据。同一种类的不同样本获取的一系列数据用于建立分类器模型和测试分类器准确性。图5a~图5c显示了不同种类样本数据的一部分,每个种类由于其形状和大小的不同而显示出不同的信号分布,它显示了预期结果的定性近似。图5c是基于金黄色葡萄球菌(Staphylococcus aureus),激光散射测量,测量信号(y轴)与时间(x轴)的关系。
从采集的信号中提取的特征,窗口大小为250ms,增量为150ms。总体而言,最终数据包含来自三种细菌的4583个数据点,每个数据点由60个特征表示。细菌病原体的分类分为两步:训练数据和测试数据。70%的数据用于训练,其余30%用于测试。基于训练数据,使用MATLAB 2017a训练SVM分类器。
为了预测可行的分类,散射信号的可变性描绘了光散射测量中每种细菌物种的独特特征。为了创建SVM分类器,数据集分为两个子集,70%用于训练数据,30%用于测试数据。在训练完模型之后,图6显示了混淆矩阵的值。总体上,分类器模型准确率为79.2%,使用SVM分类器对金黄色葡萄球菌进行分类,准确率为82.3%。此外,实验结果进一步验证了所提出的细菌分类方法的有效性,并取得了良好的效果。
本发明提出了一种基于时域信号的激光散射分类方法来快速检测病原体。不同病原体获得的波形不同,因此可以提取特征进行分类。结果表明,通过提取信号的功率谱特征并使用SVM训练分类器,分类器可以对三种类型的细菌进行分类。粪肠球菌和金黄色葡萄球菌的分类准确度较高,而大肠杆菌的分类准确度较低,可能是由于获得的数据与其他物种的相关性,这个问题需要进一步研究和实验,并且使用维数更高的数据集来对分类器建模可以提高分类效率。
此外,给定方法中的许多特征数量为60,这增加了计算强度。使用特征简化法可能对提高算法的效率和降低计算强度有用。给出的方法和结论需要进一步的实验结果来验证。
本发明提供了一种病原体检测器及其检测方法,具体实现该技术方案的方法和途径很多,以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。本实施例中未明确的各组成部分均可用现有技术加以实现。
Claims (7)
1.一种基于光散射和机器学习的病原体检测器,其特征在于,所述检测器通过如下步骤构建:
步骤1,将激光束入射到细菌样品上,用光传感器组件收集前向散射光;
步骤2,对采集的散射光数据进行预处理;
步骤3,基于散射光数据,进行特征提取,得到数据集;
步骤4,创建SVM病原体检测器,并基于数据集训练SVM病原体检测器。
2.根据权利要求1所述的方法,其特征在于,步骤1中,使用激光束入射到细菌样品上,当细菌颗粒通过激光束时,光会被散射,细菌样品周围的n个光传感器以1KHz采样频率采样散射光强度。
3.根据权利要求2所述的方法,其特征在于,步骤1中,将蒸馏水与细菌溶液混合得到细菌样品。
4.根据权利要求3所述的方法,其特征在于,步骤2中,使用低通滤波器去除采集的散射光数据中的噪声,并进行加窗分割。
5.根据权利要求4所述的方法,其特征在于,步骤3包括:
步骤3-1,设定一个光传感器的时域信号表示为x[j],其中j=1,2,...N,N为长度,即步骤2加窗分割截取的信号长度,x[j]是一种离散信号的表示方式,j代表第j个采样点,x[j]代表第j个采样点的信号幅值,采样频率为fs,离散傅立叶变换后的信号表示为X[k],公式如下:
公式(1)中,X[k]乘以其共轭X*[k]除以N能够得到无相位的功率谱密度P[k],k是频率序列标号;
步骤3-2,使用统计方法进行频率分布,令所有奇数矩阵变为零,即m1=m3=m5......=0,m5表示一个5阶矩阵m,则功率谱密度P[k]的n*1阶矩阵m的定义为mn×1,如公式(2)所示:
当n=0时,得到帕塞瓦尔Parseval定理,如公式(1)所示;当n不为0时,根据傅立叶变换的微分性质,离散信号x[j]的n阶导数,等于频谱X[k]乘以k的n次方,即:
F[Δnx[j]]=knX[k] (3)
F[Δnx[j]]表示x[j]的n阶导数的傅里叶变换;
步骤3-3,使用零阶矩阵描述信号x[j]在频域的总功率:
二阶矩阵的修正谱k2P[k]与频率函数kX[k]有关,公式如下:
其中,Δ表示求导;
四阶矩阵的平方根式如下:
其中,k4P[k]表示四阶矩阵的修正谱,Δ2表示求导的平方;
步骤3-4,特征归一化:对和进行幂变换,幂变换结果分别为mo、m2、m4:
步骤3-5,前三个提取的特征分别定义为f1、f2和f3,计算公式如下:
f1=log(m0) (7)
f2=log(m0-m2) (8)
f3=log(m0-m4) (9)
步骤3-6,计算稀疏性特征f4,稀疏性特征定义了矢量信号的能量仅用少数个分量来表示,即f4仅用m0,m2,m4三个分量来表示,具体计算公式如下:
步骤3-7,计算波形长度比f5:
步骤3-8,从单个光传感器的通道提取的整体特征包括五个不同的特征,分别为f1、f2、f3、f4和f5,从每个光传感器的通道提取这五个特征,总共n个通道得到5n个特征,这5n个特征组成数据集。
6.根据权利要求5所述的方法,其特征在于,步骤4包括:将数据集随机划分出一定比例的数据作为训练SVM病原体检测器的训练数据,对SVM病原体检测器进行训练。
7.一种使用基于MIE光散射和机器学习的病原体检测器检测病原体的方法,其特征在于,包括如下步骤:
步骤a1,将蒸馏水与待检测细菌溶液混合得到待检测细菌样品;
步骤a2,将激光束入射到检测细菌样品上,用光传感器组件收集前向散射光;
步骤a3,基于散射光数据,进行特征提取;
步骤a4,将提取的特征输入到SVM病原体检测器中,得到结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910096728.1A CN109813683B (zh) | 2019-01-31 | 2019-01-31 | 一种病原体快速检测器及其检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910096728.1A CN109813683B (zh) | 2019-01-31 | 2019-01-31 | 一种病原体快速检测器及其检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109813683A true CN109813683A (zh) | 2019-05-28 |
CN109813683B CN109813683B (zh) | 2021-07-30 |
Family
ID=66606139
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910096728.1A Active CN109813683B (zh) | 2019-01-31 | 2019-01-31 | 一种病原体快速检测器及其检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109813683B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080310692A1 (en) * | 2007-01-16 | 2008-12-18 | Robinson J Paul | System and method of organism identification |
WO2012143901A1 (en) * | 2011-04-21 | 2012-10-26 | North-West University | Method of distinguishing between different pathogens |
CN102998241A (zh) * | 2012-10-19 | 2013-03-27 | 南京医科大学第一附属医院 | 一种利用流式细胞仪检测抗原表达水平的方法 |
CN104136908A (zh) * | 2011-12-19 | 2014-11-05 | 奥普蒂库尔诊断有限公司 | 用于鉴定培养物中微生物的光谱手段和方法 |
CN105136745A (zh) * | 2015-10-21 | 2015-12-09 | 南京先进激光技术研究院 | 一种基于米氏散射的微生物快速检测装置 |
CN105158175A (zh) * | 2015-09-01 | 2015-12-16 | 中国科学院合肥物质科学研究院 | 一种采用透射光谱鉴别水中细菌的方法 |
-
2019
- 2019-01-31 CN CN201910096728.1A patent/CN109813683B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080310692A1 (en) * | 2007-01-16 | 2008-12-18 | Robinson J Paul | System and method of organism identification |
WO2012143901A1 (en) * | 2011-04-21 | 2012-10-26 | North-West University | Method of distinguishing between different pathogens |
CN104136908A (zh) * | 2011-12-19 | 2014-11-05 | 奥普蒂库尔诊断有限公司 | 用于鉴定培养物中微生物的光谱手段和方法 |
CN102998241A (zh) * | 2012-10-19 | 2013-03-27 | 南京医科大学第一附属医院 | 一种利用流式细胞仪检测抗原表达水平的方法 |
CN105158175A (zh) * | 2015-09-01 | 2015-12-16 | 中国科学院合肥物质科学研究院 | 一种采用透射光谱鉴别水中细菌的方法 |
CN105136745A (zh) * | 2015-10-21 | 2015-12-09 | 南京先进激光技术研究院 | 一种基于米氏散射的微生物快速检测装置 |
Non-Patent Citations (1)
Title |
---|
BARTEK RAJWA等: "Automated Classification of Bacterial Particles in Flow by Multiangle Scatter Measurement and Support Vector Machine Classifier", 《CYTOMETRY PART A》 * |
Also Published As
Publication number | Publication date |
---|---|
CN109813683B (zh) | 2021-07-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Mhuireach et al. | Urban greenness influences airborne bacterial community composition | |
Neugebauer et al. | Raman spectroscopy towards clinical application: drug monitoring and pathogen identification | |
Rho et al. | Separation-free bacterial identification in arbitrary media via deep neural network-based SERS analysis | |
King et al. | The hierarchy of root branching order determines bacterial composition, microbial carrying capacity and microbial filtering | |
Yusuf et al. | In-vitro diagnosis of single and poly microbial species targeted for diabetic foot infection using e-nose technology | |
Simon-Soro et al. | Polymicrobial aggregates in human saliva build the oral biofilm | |
DE102013022016B4 (de) | Mikroben-Identifizierung durch Massenspektrometrie und Infrarot-Spektrometrie | |
García‐Timermans et al. | Discriminating bacterial phenotypes at the population and single‐cell level: a comparison of flow cytometry and Raman spectroscopy fingerprinting | |
D'Orazio et al. | Electro-optical classification of pollen grains via microfluidics and machine learning | |
Malainine et al. | Rapid identification of Vibrio parahaemolyticus isolated from shellfish, sea water and sediments of the Khnifiss lagoon, Morocco, by MALDI‐TOF mass spectrometry | |
Gan et al. | Culture‐Free Detection of Crop Pathogens at the Single‐Cell Level by Micro‐Raman Spectroscopy | |
Hussain et al. | Rapid detection of Pseudomonas aeruginosa based on lab-on-a-chip platform using immunomagnetic separation, light scattering, and machine learning | |
US12077806B2 (en) | Method for the spectrometric characterization of microorganisms | |
Preisner et al. | Discrimination of Salmonella enterica serotypes by Fourier transform infrared spectroscopy | |
Sisk-Hackworth et al. | Compositional data analysis of periodontal disease microbial communities | |
Nitrosetein et al. | Attenuated Total Reflection Fourier Transform Infrared Spectroscopy combined with chemometric modelling for the classification of clinically relevant Enterococci | |
Crawford et al. | Detection of airborne biological particles in indoor air using a real-time advanced morphological parameter uv-lif spectrometer and gradient boosting ensemble decision tree classifiers | |
Duygan et al. | Recent advances in microbial community analysis from machine learning of multiparametric flow cytometry data | |
Hussain et al. | Rapid identification of pathogens based on MIE light scattering and machine learning approach | |
CN109813683A (zh) | 一种病原体快速检测器及其检测方法 | |
McDonald et al. | From molecules to dynamic biological communities | |
Haavig et al. | Cellular light scattering for the identification of bacteria and its application to the identification of staphylococcus | |
Song et al. | Airborne Bacterial and Eukaryotic Community Structure across the United Kingdom Revealed by High-Throughput Sequencing | |
Crawford et al. | Towards a UK Airborne Bioaerosol Climatology: Real-Time Monitoring Strategies for High Time Resolution Bioaerosol Classification and Quantification | |
Mahabob et al. | A Study on ANN Performance Towards Three Significant Compounds of High Quality Agarwood Oil |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |