CN105158175A - 一种采用透射光谱鉴别水中细菌的方法 - Google Patents

一种采用透射光谱鉴别水中细菌的方法 Download PDF

Info

Publication number
CN105158175A
CN105158175A CN201510551898.6A CN201510551898A CN105158175A CN 105158175 A CN105158175 A CN 105158175A CN 201510551898 A CN201510551898 A CN 201510551898A CN 105158175 A CN105158175 A CN 105158175A
Authority
CN
China
Prior art keywords
rightarrow
bacteria
bacterium
sample
transmitted spectrum
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510551898.6A
Other languages
English (en)
Inventor
段静波
赵南京
王久悦
方丽
马明俊
孟德硕
肖雪
杨瑞芳
刘文清
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hefei Institutes of Physical Science of CAS
Original Assignee
Hefei Institutes of Physical Science of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hefei Institutes of Physical Science of CAS filed Critical Hefei Institutes of Physical Science of CAS
Priority to CN201510551898.6A priority Critical patent/CN105158175A/zh
Publication of CN105158175A publication Critical patent/CN105158175A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Abstract

本发明公开了一种采用透射光谱鉴别水中细菌的方法,适用于水体常见致病菌分类鉴别,在实验室内对待鉴别细菌进行24h纯种活化培养,测量获得致病菌的紫外可见多波长透射光谱,以此作为训练集,利用基于网格搜索法的内部交叉验证获取建模所需最佳惩罚因子C和核函数参数g,根据最优参数和一对一多分类的支持向量机法建立细菌快速分类鉴别模型。测量不同批次培养的同种细菌的透射光谱作为测试集,带入模型以实现细菌种类鉴别。该方法具有较高的准确性、稳定性和泛化能力,是饮用水源、食品、药品等领域细菌快速鉴别的一种简便、快速、准确的方法。

Description

一种采用透射光谱鉴别水中细菌的方法
技术领域
本发明涉及水体微生物检测方法领域,具体是一种采用透射光谱鉴别水中细菌的方法。
背景技术
致病菌污染水体严重威胁饮用水安全和人类健康。当前饮用水中的病原微生物污染,是危害人们健康的最大问题之一。联合国卫生组织调查数据显示:人类80%的疾病与饮用水受到生物污染相关,远远高于化学污染致病的比例;每年88%的死亡病例与不洁饮水和水卫生状况有关。流行病学调查和细菌学检验证明显示,沙门氏菌、大肠杆菌0157:H7弯曲杆菌、霍乱弧菌和耶尔森氏菌等肠道致病菌,小球隐孢子虫、表吮贾第虫和痢疾变形虫等病原微生物的暴发和流行是威胁饮用水安全和造成人类疾病的主要原因。我国自1986年至2005年发生了152起饮用水污染事故,污染类型以生物污染为主,远远高于化学污染的比例,占69.1%。
目前,对水中病原菌的检测仍主要基于选择性培养法和分子生物学、免疫学等标准的生物化学法,这些方法鉴定程序繁琐、鉴别周期长(需3-7天或更长),需专业人员完成,且生化方法特异性强,不具有普遍推广意义,难以实现快速、在线、实时检测,更不能达到全面、连续的水质监测预警。随着光电检测技术的迅速发展,光谱学方法成为细菌鉴别检测的主要技术手段。目前,国内外研究机构已开展多种光谱技术的细菌鉴别检测方法研究,其中,研究最广泛的是将傅立叶红外光谱技术与化学计量学方法相结合用于鉴别细菌,但是红外光谱为振动光谱,包含的是菌体化学组分对红外光吸收的倍频和组合频信息,光谱信息有严重重叠,直接用于分类鉴别时数据量庞大,需依据不同种细菌选择不同波段光谱分层建立鉴别模型,建模过程较复杂,且红外光谱的方法不适合分析含水样品,水中的羟基峰对红外测定结果有较强干扰,因此,限制该鉴别方法的应用领域,不适合用于水体细菌种类鉴别。为更好的保障饮用水及生活用水的安全,亟需发展一种快速、高效、操作简便的水体细菌分类鉴别方法。
发明内容
本发明的目的是提供一种采用透射光谱鉴别水中细菌的方法,以解决现有技术存在的建模过程复杂、不适用于水中细菌分类鉴别的缺陷,提供一种快速、高效、操作简便的细菌鉴别方法。。
为了达到上述目的,本发明所采用的技术方案为:
一种采用透射光谱鉴别水中细菌的方法,其特征在于:包括以下步骤:
(1)、受试细菌培养及悬浮液制备:
选取水体常见致病菌为研究对象并选取合适的培养基进行培养,对培养基及相关器皿进行高温高压灭菌,将研究对象的标准菌样放入光照培养箱中进行24h~48h静置活化培养,培养条件设置如下:光照2000-3000lux、光暗比14h:10h、培养温度依据菌种的最适宜生长温度选择;
对培养的细菌菌液进行离心洗涤处理,制备每种细菌悬浮液,通过加入去离子水调节细菌悬浮液浓度,选取悬浮液浓度对应200nm处的光密度值在0.2-0.8之间的悬浮液作为训练集或测试集样本,每种细菌悬浮液配置至少10个不同浓度的样本,训练集细菌和测试集细菌为不同时间批次培养的同种细菌,二者应在相同的环境条件下培养,并使用与测试集样本相同的条件和方法制备训练集细菌悬浮液,训练集和测试集样本浓度无须完全相同,选取悬浮液浓度对应200nm处的光密度值在0.2-0.8之间的悬浮液样本作为测试集均可;
(2)、透射光谱采集:
以去离子水为参比,将细菌悬浮液放入紫外可见分光光度计中进行透射光谱测定,光谱测量范围为200-900nm,取样间隔为1nm,扫描速度为中速,每次测量重复三次取平均值;
(3)、细菌透射光谱分类鉴别模型的建立,包括如下步骤:
(3.1)、细菌透射光谱信息提取:
对步骤(2)测量得到的透射光谱进行均值归一化处理,利用归一化的训练集光谱数据建立细菌种类鉴别模型,建模过程充分利用整个测量波段200-900nm中每个波长处的光密度值;
将细菌均值归一化后的透射光谱训练样本集数据记为:
( x → 1 , l 1 ) , ( x → 2 , l 2 ) , ... , ( x → n , l n ) ,
X = [ x → 1 ; x → 2 ; ... ; x → n ] ,
其中,X是n×m维的数据矩阵,是第i个细菌样本归一化后的m维光密度数据组成的矢量,m为扫描波长总数且m=701,n为细菌悬浮液样本总数;是n维类别矢量,li是细菌第i个样本的类别标签,即第i种细菌样本对应的等级;
(3.2)、内部交叉验证:
选取基于网格搜索的3折交叉验证方法进行内部交叉验证,过程如下:
将细菌训练集样本数据和类别矢量代入基于网格寻优的接口函数SVMcgForclass,接口函数SVMcgForclass默认进行3折交叉验证过程,设置支持向量机惩罚因子C和核函数参数g各自的取值范围,并设定各自的进步步长,进行基于网格搜索的内部交叉验证,获得支持向量机惩罚因子C和核函数参数g的最优参数组合,使模型达到最佳分类结果并具有最优的泛化能力;
(3.3)、基于支持向量机细菌分类鉴别模型的构建:
支持向量机的核心是在原始数据线性不可分的情况下,利用核函数变换到高维空间,对数据集进行线性可分,采用一对一多分类的支持向量机方法构建细菌种类鉴别模型,过程如下:
第1步、获取训练集 X = [ x → 1 ; x → 2 ; ... ; x → n ] 为模型建立的训练集特征矢量,包括细菌分类所需的全部信息,获得的是线性不可分的,在支持向量机建模时需先选取合适的核函数进行高维变换;
第2步、构造并求解最优化问题:
m a x α → Q ( α → ) = Σ i = 1 n α i - 1 2 Σ i , j = 1 n α i α j y i y j K ( x → i , x → j ) ,
s . t . , Σ i = 1 n α i y i = 0 ,
0≤αi≤Ci=1,2,...,n,
分别是第i,j个细菌样本归一化后的m维光密度数据组成的矢量,yi,yj是结果标签yi,yj∈Y={1,-1},是核函数,是拉格朗日对偶变量, α i , α j ∈ α → = ( α 1 , α 2 , ... , α n ) T , αij是不同的拉格朗日乘子,
αi,i=1,…,n,αj,j=1,…,n,C是一个参数,用于控制目标函数中两项之间的权重,即惩罚因子;
第3步、计算选择的一个正分量αj,并据此计算:
b = y j - Σ i = 1 n y i α i ( x → i · x → j ) ;
其中b分别是线性超平面的法向量和截距;
第4步、把带入超平面方程得到判别函数:
f ( x ) = sgn ( ω → · x → + b ) = sgn ( Σ i = 1 n α i y i ( x → i · x → ) + b ) ,
通过以上支持向量机分类模型鉴定待测细菌种类。
本发明采用一种基于光与细胞体结构、蛋白质、核酸等生物大分子直接作用的200-900nm多波长紫外可见透射光谱进行细菌分类鉴别,可以实现实验室内单一菌种的分类鉴别,为研发实际水体细菌分类鉴别技术提供方法依据。
本发明优点为:
(1)本发明的方法不仅可用于饮用水源细菌的快速识别鉴定,而且可用于食品检测等其他领域的细菌鉴定。
(2)本发明的方法将包含细胞散射、吸收特征的波长范围200-900nm的透射光谱与支持向量机方法结合起来,能够实现快速鉴别,无需对待鉴别细菌进行其他分类学方法的预选择,无需专业人员完成,无需依据细菌种类选择不同波段建立鉴别模型,是一种简便、快速、准确的细菌分类鉴别方法。
附图说明
图1为本发明方法流程图。
图2为具体实施方式中五种不同光密度的四种细菌透射光谱图,其中:
图2a为大肠埃希氏菌菌、肺炎克雷伯菌、金黄色葡萄球菌、鼠伤寒沙门氏菌200nm处的光密度值分别为:0.632、0.375、0.706、0.291的透射光谱图,
图2b为大肠埃希氏菌菌、肺炎克雷伯菌、金黄色葡萄球菌、鼠伤寒沙门氏菌200nm处的光密度值分别为:0.522、0.644、0.708、0.457的透射光谱图,
图2c为大肠埃希氏菌菌、肺炎克雷伯菌、金黄色葡萄球菌、鼠伤寒沙门氏菌200nm处的光密度值分别为:0.614、0.538、0.582、0.654的透射光谱图,
图2d为大肠埃希氏菌菌、肺炎克雷伯菌、金黄色葡萄球菌、鼠伤寒沙门氏菌200nm处的光密度值分别为:0.686、0.552、0.443、0.507的透射光谱图,
图2e为大肠埃希氏菌菌、肺炎克雷伯菌、金黄色葡萄球菌、鼠伤寒沙门氏菌200nm处的光密度值分别为:0.626、0.589、0.474、0.699的透射光谱图。
图3为具体实施方式中四种细菌预测集样本种类标记结果图。
图4为为具体实施方式中支持向量机内部交叉验证等高图。
图5为具体实施方式中细菌分类鉴别模型预测结果和真实结果对比图。
具体实施方式
一种采用透射光谱鉴别水中细菌的方法,包括以下步骤:
(1)、受试细菌培养及悬浮液制备
选取水体常见致病菌为研究对象,如:沙门氏菌、志贺氏菌、大肠杆菌、霍乱弧菌、炭疽菌、军团菌等。选取合适的培养基:营养肉汁琼脂培养基、胰酪大豆琼脂培养基、哥伦比亚琼脂培养基、蛋白胨酵母粉琼脂培养基等进行培养。对培养基及相关器皿进行高温高压灭菌,将从中国工业微生物菌种保藏中心购置的标准菌样放入光照培养箱中进行24h~48h静置活化培养,培养条件设置如下:光照2000-3000lux、光暗比14h:10h、培养温度依据菌种的最适宜生长温度选择。
对培养的细菌菌液进行离心洗涤处理,制备每种细菌悬浮液,通过加入去离子水调节细菌悬浮液浓度,选取悬浮液浓度对应200nm处的光密度值在0.2-0.8之间的悬浮液作为训练集或测试集样本(该范围可以保证仪器具有较好的灵敏度和线性范围),每种细菌悬浮液配置至少10个不同浓度的样本。训练集细菌和测试集细菌为不同时间批次培养的同种细菌,二者应在相同的环境条件下培养,并使用与测试集样本相同的条件和方法制备训练集细菌悬浮液,训练集和测试集样本浓度无须完全相同,选取悬浮液浓度对应200nm处的光密度值在0.2-0.8之间的悬浮液样本作为测试集均可。
(2)透射光谱采集
200-900nm紫外可见多波长透射光谱包含了细菌对光的吸收和前向散射等信息,能反映细菌细胞的组分、大小以及形态等特征,具有细菌种属的特异性,可依据该特异性进行细菌的快速种类鉴别。
以去离子水为参比,将细菌悬浮液放入紫外可见分光光度计(日本岛津:UV2550)中进行光谱测定。光谱测量范围为200-900nm,取样间隔为1nm,扫描速度为中速。每次测量重复三次取平均值。
(3)细菌透射光谱分类鉴别模型的建立
(3.1)细菌透射光谱信息提取
为了消除细菌悬浮液浓度不同的影响,对测量得到的透射光谱进行均值归一化处理。利用归一化的训练集光谱数据建立细菌种类鉴别模型,建模过程充分利用整个测量波段(200-900nm)中每个波长处的光密度值。
将细菌均值归一化后的透射光谱训练样本集数据记为: X = [ x → 1 ; x → 2 ; ... ; x → n ] 是n×m维的数据矩阵,其中,是第i个细菌样本归一化后的m维光密度数据组成的矢量;m为扫描波长总数(m=701),n为细菌悬浮液样本总数;是n维类别矢量,li是细菌第i个样本的类别标签,即第i种细菌样本对应的等级;
(3.2)内部交叉验证
内部交叉验证选取基于网格搜索的3折交叉验证方法:
将细菌训练集样本数据和类别矢量代入基于网格寻优的接口函数SVMcgForclass,函数默认进行3折交叉验证过程,设置C和g各自的取值范围,并设定各自的进步步长,进行基于网格搜索的内部交叉验证,获得支持向量机惩罚因子C和核函数参数g的最优参数组合,使模型达到最佳分类结果并具有最优的泛化能力。
(3.3)基于支持向量机细菌分类鉴别模型的构建
对于线性不可分情况,支持向量机通过满足Mercer条件的核函数代替原模式空间的向量数积运算以实现非线性变换,而不是显式地使用非线性变换的具体形式,其实质是通过核函数(非线性映射),把输入的样本空间映射到一个高维乃至无穷维的特征空间(Hilbert空间)中,将原输入样本空间中非线性可分的问题转化为在高维特征空间中的线性可分的问题。如果对数据点x进行非线性变换,记新特征为可以证明,无论变换的具体形式如何,变换对支持向量机的影响是把两个在元特征空间中的内积变成了在新空间中的内积称之为核函数,支持向量机的核心是在原始数据线性不可分的情况下,利用核函数变换到高维空间,对数据集进行线性可分。
采用一对一多分类的支持向量机方法构建细菌种类鉴别模型:
第1步获取训练集 X = [ x → 1 ; x → 2 ; ... ; x → n ] 为模型建立的训练集特征矢量,包括细菌分类所需的全部信息,获得的是线性不可分的,在支持向量机建模时需先选取合适的核函数进行高维变换;
第2步构造并求解最优化问题
m a x α → Q ( α → ) = Σ i = 1 n α i - 1 2 Σ i , j = 1 n α i α j y i y j K ( x → i , x → j )
s . t . , Σ i = 1 n α i · y i = 0
0≤αi≤Ci=1,2,...,n
分别是第i,j个细菌样本归一化后的m维光密度数据组成的矢量,yi,yj是结果标签yi,yj∈Y={1,-1},是核函数,是拉格朗日对偶变量αij是不同的拉格朗日乘子,αi,i=1,…,n,αj,j=1,…,n,C是一个参数,用于控制目标函数中两项(“寻找margin最大的超平面”和“保证数据点偏差量最小”)之间的权重,即惩罚因子。
第3步计算选择的一个正分量αj,并据此计算
b = y j - Σ i = 1 n y i α i ( x → i · x → j ) ;
其中b分别是线性超平面的法向量和截距。
第4步把带入超平面方程得到判别函数:
f ( x ) = sgn ( ω → · x → + b ) = sgn ( Σ i = 1 n α i y i ( x → i · x → ) + b )
通过以上支持向量机分类模型鉴定待测细菌种类。
本发明是基于MATLAB平台下的LibSVM进行细菌快速分类鉴别的研究。LibSVM(alibraryofSupportVectorMachine)是台湾大学林智仁(LinChih-Jen)团队开发设计的支持向量机工具包。包含可以在MATLAB和C++等环境下运行的模式识别与回归的支持向量机程序;且给出交叉验证(CrossValidation)的程序功能。可以解决包括基于一对一算法的多类模式识别问题。
具体实施例子:
(1)受试细菌培养
选取水体常见致病菌:大肠杆菌、金黄色葡萄球菌、肺炎克雷伯菌、鼠伤寒沙门氏菌为研究对象,标准菌种购自中国工业微生物菌种保藏中心。高温高压灭菌培养基及相关器皿,用微量进样器吸取0.5ml菌液,接种到装有50ml牛肉膏蛋白胨培养基的250ml三角瓶中(牛肉膏蛋白胨培养基配置说明:蛋白胨5.0g,牛肉浸取物3.0g,NaCl5.0g,琼脂15.0g,蒸馏水1.0L,pH7.0),放入光照培养箱中进行24h静置活化培养,培养条件设置如下:光照2000-3000lux、光暗比14h:10h、大肠埃希氏菌、金黄色葡萄球菌、肺炎克雷伯菌、鼠伤寒沙门氏菌培养温度分别为:37℃、37℃、32℃、30℃。
(2)细菌悬浮液的制备
分别吸取3ml细菌培养液于50ml离心管中,10000r/min,离心10min,得到细菌沉淀,吸弃上清液,加入3ml去离子水洗涤再次离心,清洗过程至少需要三次,以消除培养基对细菌光谱测量的影响。最后一次清洗之后,加入去离子水配制不同浓度细菌悬浮液,每种细菌配置20个浓度悬浮液(通过加入去离子水调节细菌悬浮液浓度,使得悬浮液200nm处光密度值在0.2-0.8之间,所得悬浮液均可作为训练集初始样本),测量200-900nm波段的透射光谱,以归一化之后的光谱数据作为模型训练集样本,共有80个训练集样本。
重新培养四种细菌,每种细菌配置12个浓度悬浮液,训练集细菌和测试集细菌为不同时间批次培养的同种细菌,二者应在相同的环境条件下培养,并使用与测试集样本相同的条件和方法制备训练集细菌悬浮液,训练集和测试集样本浓度无须完全相同,选取200nm处的光密度值在0.2-0.8之间的悬浮液样本作为测试集均可。获得相应细菌的紫外可见透射光谱作为测试集,共48个测试集样本,以验证细菌种类鉴别模型的正确性;另取一种与测试集大肠杆菌不同的亚种(DH5α)作为测试集,同样方法获得相应细菌悬浮液的透射光谱,以验证细菌鉴别模型的属间鉴别稳定性,共12个测试样本;为验证模型的泛化能力,选取经过0.45μm玻璃纤维滤膜过滤后的董铺水库自然湖水为悬浮介质,配置大肠杆菌悬浮液,同样以过滤处理的湖水为参比介质,测量大肠杆菌悬浮液的透射光谱,共10个测试样本。具体菌种及数量见表1。
表1细菌训练集和测试集样本种类及数量
(3)透射光谱采集
以去离子水为参比,将制备的细菌悬浮液放入紫外可见分光光度计(日本岛津:UV2550)中进行光谱测定。光谱测量范围为200-900nm,取样间隔为1nm,扫描速度为中速。每次测量重复三次取平均值。
大肠杆菌、金黄色葡萄球菌、肺炎克雷伯菌、鼠伤寒沙门氏菌四种细菌波长范围200~900nm的透射光谱如图2所示,测量得到的光密度值反映了细菌对入射光的消光信息,包含了细菌前向散射和吸收的全部信息。通过分析四种细菌的透射光谱可知:在400~900nm范围内,四种细菌透射光谱的光密度值较低,说明在该段光谱范围内细菌的吸收很弱,光谱主要表现为细菌的整体粒径和内部所含细胞器的散射贡献,反映了细菌数目、细菌的粒径分布以及细菌形状等相关信息;在200~400nm范围内,四种细菌的光密度值显著高于前者,因为此时的光谱不仅包含细菌结构的散射成分,更主要为细菌内部化学组分的吸收信息,细胞内可能产生吸收的化学组分有:核酸、蛋白质、吡啶二羧酸、色素等;由图2可知,四种细菌在260nm处的透射光谱相差较大,且均有明显峰值,这主要为核酸吸收的贡献,四种细菌细胞内核酸等物质含量不同,光谱相差较大;不同细菌包含的显色团种类不同,相同显色团的含量也不尽相同,这就为利用紫外可见透射光谱进行不同细菌种类鉴别提供特征信息,为利用该光谱技术进行细菌分类提供理论依据。
(4)细菌透射光谱分类鉴别模型的建立
(4.1)细菌透射光谱信息提取
为了消除细菌悬浮液浓度不同的影响,对测量得到的透射光谱进行均值归一化处理。利用归一化的训练集光谱数据建立细菌种类鉴别模型,建模过程充分利用整个测量波段(200-900nm)中每个波长处的光密度值。
将细菌均值归一化后的透射光谱训练样本集数据记为: X = [ x → 1 ; x → 2 ; ... ; x → 80 ] 是n×m维的数据矩阵,其中,是第i个细菌样本归一化后的m维光密度数据组成的矢量,m为扫描波长总数(m=701),n为细菌悬浮液样本总数80;是n维类别矢量,li是细菌第i个样本的类别标签,即第i种细菌样本对应的等级,训练集为大肠埃希氏菌菌、肺炎克雷伯菌、金黄色葡萄球菌、鼠伤寒沙门氏菌四种细菌,所以li∈{1,2,3,4};
对测试集样本进行种类标记,肺炎克雷伯菌种类记为1,金黄色葡萄球菌种类记为2,鼠伤寒沙门氏菌种类记为3,大肠杆菌种类记为4。测试集样本的种类标记结果如图3所示。
(4.2)内部交叉验证
本发明的多种细菌分类鉴别模型属于多类分类问题,首先需进行内部交叉验证,防止过学习现象,使建立的模型具有一定的训练精度和良好的泛化性能。整个模型的建立基于MATLAB2012b平台,支持向量机选自支持向量机工具包(LibSVM)。LibSVM(alibraryofSupportVectorMachine)是台湾大学林智仁(LinChih-Jen)团队开发设计的支持向量机工具包。包含可以在MATLAB和C++等环境下运行的模式识别与回归的支持向量机程序;且给出交叉验证(CrossValidation)的程序功能。可以解决包括基于一对一算法的多类模式识别问题。
内部交叉验证选取基于网格搜索的3折交叉验证方法:
将细菌训练集样本数据和类别矢量li∈{1,2,3,4}代入基于网格寻优的接口函数SVMcgForclass,[bestCVaccuracy,bestC,bestg]=SVMcgForClass(train_lable,train_data,cmin,cmax,gmain,gmax,v,cstep,gstep,accstep)
bestCVaccuracy,bestc,bestg分别表示交叉验证的最优正确率,最优惩罚因子以及最优核函数参数;train_lable,train_data分别表示细菌训练集类别矢量和细菌训练集样本数据设定惩罚参数C的变化范围cmin,cmax:cmin=-5,cmax=5;设定RBF核参数g的变化范围gmin,gmax:gmin=-5,gmax=8;函数默认进行3折交叉验证过程,v=3;设定C、g参数的搜索步长cstep,gstep:cstep=1,gstep=0.1。设定参数选择结果图中准确率离散化显示的步进间隔大小accstep:为默认值4.5,进行基于网格搜索的内部交叉验证,获得支持向量机惩罚因子C和核函数参数g的最优参数组合为:c=16,g=0.2872,使模型达到最佳分类结果并具有最优的泛化能力。
网格法参数寻优结果如图4所示。
(4.3)基于支持向量机细菌分类鉴别模型的构建
为模型建立的训练集特征矢量,包括细菌分类所需的全部信息。获得的是线性不可分的。
支持向量机的核心是在原始数据线性不可分的情况下,利用核函数变换到高维空间,对数据集进行线性可分。本发明通过对比多种核函数,最终选择多项式核函数
K ( x → i , x → j ) = [ ( g x → i T x → j ) + c o e f ] d , g > 0
作为支持向量机用于细菌分类鉴别的核函数K,其中coef为偏置系数,d为多项式的阶,g是核函数参数,T表示转置。
在线性可分情况下,支持向量机的求解方法如下:
第1步获取训练集 X = [ x → 1 ; x → 2 ; ... ; x → 80 ] 为模型建立的训练集特征矢量,包括细菌分类所需的全部信息,获得的是线性不可分的,在支持向量机建模时应用多项式核函数进行高维变换;
第2步构造并求解最优化问题
m a x α → Q ( α → ) = Σ i = 1 n α i - 1 2 Σ i , j = 1 n α i α j y i y j K ( x → i , x → j )
s . t . , Σ i = 1 n α i y i = 0
0≤αi≤Ci=1,2,...,n
分别是第i,j个细菌样本归一化后的701维光密度数据组成的矢量,yi,yj是结果标签yi,yj∈Y={1,-1},是核函数,是拉格朗日对偶变量αij是不同的拉格朗日乘子,αi,i=1,…,n,αj,j=1,…,n,C是一个参数,用于控制目标函数中两项(“寻找margin最大的超平面”和“保证数据点偏差量最小”)之间的权重,即惩罚因子。
第3步计算选择的一个正分量αj,并据此计算
b = y j - Σ i = 1 n y i α i ( x → i · x → j ) ;
其中b分别是线性超平面的法向量和截距
第4步把带入超平面方程得到判别函数:
f ( x ) = sgn ( ω → · x → + b ) = sgn ( Σ i = 1 n α i y i ( x → i · x → ) + b )
通过以上透射光谱的采集、提取、支持向量机分类模型鉴定待测细菌种类。
支持向量机模型具体建立方法:
将细菌训练集样本数据和类别矢量li∈{1,2,3,4}带入matlabSVM工具箱的函数svmtrain中,建立模型model=svmtrain(train_label,train_data,'-s-t-c-g'),
其中train_lable是训练集数据类别矢量train_data是训练集数据-s是建模选择的svm类型,-t是建模选择的核函数类型,-C是惩罚因子,-g是核函数参数,分别设定为0,1,16,0.28717,用于建立支持向量机分类模型。
支持向量机模型验证方法:
将细菌测试集样本数据和类别矢量li∈{1,2,3,4}带入matlabSVM工具箱的函数svmpredict中,验证模型[predict_lable,accuracy,dec_values]=svmpredict(test_label,test_data,model),其中test_lable是测试集数据类别矢量test_data是测试集数据model是训练集建立的模型,predict_lable是预测的细菌种类,accuracy是一个3*1的列向量,其中第1个数字用于分类问题,表示分类准确率,后两个数字用于回归问题;第三个数字表示平方相关系数dec_values表示决策值。由计算得到的准确率判别模型鉴别细菌类别的准确性。
本发明中,模型正确性及稳定性检验结果如图5显示,图3纵坐标为标记的细菌种类:肺炎克雷伯菌种类记为1,金黄色葡萄球菌种类记为2,鼠伤寒沙门氏菌种类记为3,大肠杆菌种类记为4。模型对选取的大肠杆菌、金黄色葡萄球菌、肺炎克雷伯菌、鼠伤寒沙门氏菌四种细菌测试集种类的鉴别正确率均为100%,证明基于支持向量机建立的细菌分类鉴别模型具有很高的正确性;模型对大肠杆菌(DH5α)进行分类鉴别时,100%将大肠杆菌(DH5α)测试集的12个样本自动归到大肠杆菌属下,证明模型具有一定的属间识别稳定性,可以识别训练集以外同属的细菌;模型对以湖水为悬浮介质的大肠杆菌进行分类鉴别时,也100%将大肠杆菌测试集自动归到大肠杆菌属下,说明实际湖水中腐植酸等溶解有机物及粒径<0.45μm的颗粒物对模型种类鉴别的效果几乎不产生影响,本发明建立的细菌分类鉴别模型具有较好的泛化能力。

Claims (1)

1.一种采用透射光谱鉴别水中细菌的方法,其特征在于:包括以下步骤:
(1)、受试细菌培养及悬浮液制备:
选取水体常见致病菌为研究对象,并选取合适的培养基进行培养,对培养基及相关器皿进行高温高压灭菌,将研究对象的标准菌样放入光照培养箱中进行24h~48h静置活化培养,培养条件设置如下:光照2000-3000lux、光暗比14h:10h、培养温度依据菌种的最适宜生长温度选择;
对培养的细菌菌液进行离心洗涤处理,制备每种细菌悬浮液,通过加入去离子水调节细菌悬浮液浓度,选取悬浮液浓度对应200nm处的光密度值在0.2-0.8之间的悬浮液作为训练集或测试集样本,每种细菌悬浮液配置至少10个不同浓度的样本,训练集细菌和测试集细菌为不同时间批次培养的同种细菌,二者应在相同的环境条件下培养,并使用与测试集样本相同的条件和方法制备训练集细菌悬浮液,训练集和测试集样本浓度无须完全相同,选取悬浮液浓度对应200nm处的光密度值在0.2-0.8之间的悬浮液样本作为测试集均可;
(2)、透射光谱采集:
以去离子水为参比,将细菌悬浮液放入紫外可见分光光度计中进行透射光谱测定,光谱测量范围为200-900nm,取样间隔为1nm,扫描速度为中速,每次测量重复三次取平均值;
(3)、细菌透射光谱分类鉴别模型的建立,包括如下步骤:
(3.1)、细菌透射光谱信息提取:
对步骤(2)测量得到的透射光谱进行均值归一化处理,利用归一化的训练集光谱数据建立细菌种类鉴别模型,建模过程充分利用整个测量波段200-900nm中每个波长处的光密度值;
将细菌均值归一化后的透射光谱训练样本集数据记为:
( x &RightArrow; 1 , l 1 ) , ( x &RightArrow; 2 , l 2 ) , ... , ( x &RightArrow; n , l n ) ,
X = &lsqb; x &RightArrow; 1 ; x &RightArrow; 2 ; ... ; x &RightArrow; n &rsqb; ,
其中,X是n×m维的数据矩阵,是第i个细菌样本归一化后的m维光密度数据组成的矢量,m为扫描波长总数且m=701,n为细菌悬浮液样本总数;是n维类别矢量,li是细菌第i个样本的类别标签,即第i种细菌样本对应的等级;
(3.2)、内部交叉验证:
选取基于网格搜索的3折交叉验证方法进行内部交叉验证,过程如下:
将细菌训练集样本数据和类别矢量代入基于网格寻优的接口函数SVMcgForclass,接口函数SVMcgForclass默认进行3折交叉验证过程,设置支持向量机惩罚因子C和核函数参数g各自的取值范围,并设定各自的进步步长,进行基于网格搜索的内部交叉验证,获得支持向量机惩罚因子C和核函数参数g的最优参数组合,使模型达到最佳分类结果并具有最优的泛化能力;
(3.3)、基于支持向量机细菌分类鉴别模型的构建:
支持向量机的核心是在原始数据线性不可分的情况下,利用核函数变换到高维空间,对数据集进行线性可分,采用一对一多分类的支持向量机方法构建细菌种类鉴别模型,过程如下:
第1步、获取训练集 X = &lsqb; x &RightArrow; 1 ; x &RightArrow; 2 ; ... ; x &RightArrow; n &rsqb; 为模型建立的训练集特征矢量,包括细菌分类所需的全部信息,获得的是线性不可分的,在支持向量机建模时需先选取合适的核函数进行高维变换;
第2步、构造并求解最优化问题:
m a x &alpha; &RightArrow; Q ( &alpha; &RightArrow; ) = &Sigma; i = 1 n &alpha; i - 1 2 &Sigma; i , j = 1 n &alpha; i &alpha; j y i y j K ( x &RightArrow; i , x &RightArrow; j ) ,
s . t . , &Sigma; i = 1 n &alpha; i y i = 0 ,
0≤αi≤Ci=1,2,...,n,
分别是第i,j个细菌样本归一化后的m维光密度数据组成的矢量,yi,yj是结果标签,yi,yj∈Y={1,-1},是核函数,是拉格朗日对偶变量,
αiαij是不同的拉格朗日乘子,
αi,i=1,…,n,αj,j=1,…,n,C是一个参数,用于控制目标函数中两项之间的权重,即惩罚因子;
第3步、计算选择的一个正分量αj,并据此计算:
b = y j - &Sigma; i = 1 n y i &alpha; i ( x &RightArrow; i &CenterDot; x &RightArrow; j ) ;
其中b分别是线性超平面的法向量和截距;
第4步、把带入超平面方程得到判别函数:
f ( x ) = sgn ( &omega; &RightArrow; &CenterDot; x &RightArrow; + b ) = sgn ( &Sigma; i = 1 n &alpha; i y i ( x &RightArrow; i &CenterDot; x &RightArrow; ) + b ) ,
通过以上支持向量机分类模型鉴定待测细菌种类。
CN201510551898.6A 2015-09-01 2015-09-01 一种采用透射光谱鉴别水中细菌的方法 Pending CN105158175A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510551898.6A CN105158175A (zh) 2015-09-01 2015-09-01 一种采用透射光谱鉴别水中细菌的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510551898.6A CN105158175A (zh) 2015-09-01 2015-09-01 一种采用透射光谱鉴别水中细菌的方法

Publications (1)

Publication Number Publication Date
CN105158175A true CN105158175A (zh) 2015-12-16

Family

ID=54799110

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510551898.6A Pending CN105158175A (zh) 2015-09-01 2015-09-01 一种采用透射光谱鉴别水中细菌的方法

Country Status (1)

Country Link
CN (1) CN105158175A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105651679A (zh) * 2016-02-04 2016-06-08 华中农业大学 一种基于高光谱成像技术对培养基上的细菌菌落进行快速分类的方法
CN108645821A (zh) * 2018-05-09 2018-10-12 北京六角体科技发展有限公司 一种微生物浓度测量方法
CN109811032A (zh) * 2019-01-04 2019-05-28 山东省科学院海洋仪器仪表研究所 一种海水微生物量光谱检测方法
CN109813683A (zh) * 2019-01-31 2019-05-28 南京医科大学 一种病原体快速检测器及其检测方法
CN111122484A (zh) * 2019-12-30 2020-05-08 中国科学院合肥物质科学研究院 一种水体细菌的定性与定量方法
CN111948155A (zh) * 2020-07-30 2020-11-17 中国科学院西安光学精密机械研究所 精细全光谱结合改进gs-svr的复杂水体硝酸盐定量分析方法
CN112116006A (zh) * 2020-09-18 2020-12-22 青海师范大学 一种基于对偶空间最优的水声目标分类方法
CN112668405A (zh) * 2020-12-10 2021-04-16 哈尔滨师范大学 一种土壤细菌数量的精确提取方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101713731A (zh) * 2009-11-09 2010-05-26 北京中医药大学 一种药物制剂包衣质量的鉴别方法
CN101807254A (zh) * 2009-02-13 2010-08-18 烟台海岸带可持续发展研究所 面向数据特点的合成核支持向量机的实现方法
CN103020642A (zh) * 2012-10-08 2013-04-03 江苏省环境监测中心 水环境监测质控数据分析方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101807254A (zh) * 2009-02-13 2010-08-18 烟台海岸带可持续发展研究所 面向数据特点的合成核支持向量机的实现方法
CN101713731A (zh) * 2009-11-09 2010-05-26 北京中医药大学 一种药物制剂包衣质量的鉴别方法
CN103020642A (zh) * 2012-10-08 2013-04-03 江苏省环境监测中心 水环境监测质控数据分析方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
JENNIFER M. SMITH 等: "Reagent-free bacterial identification using multivariate analysis of transmission spectra", 《JOURNAL OF BIOMEDICAL OPTICS》 *
杨国鹏: "基于核方法的高光谱影像分类与特征提取", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105651679A (zh) * 2016-02-04 2016-06-08 华中农业大学 一种基于高光谱成像技术对培养基上的细菌菌落进行快速分类的方法
CN108645821A (zh) * 2018-05-09 2018-10-12 北京六角体科技发展有限公司 一种微生物浓度测量方法
CN109811032A (zh) * 2019-01-04 2019-05-28 山东省科学院海洋仪器仪表研究所 一种海水微生物量光谱检测方法
CN109811032B (zh) * 2019-01-04 2022-03-08 山东省科学院海洋仪器仪表研究所 一种海水微生物量光谱检测方法
CN109813683A (zh) * 2019-01-31 2019-05-28 南京医科大学 一种病原体快速检测器及其检测方法
CN109813683B (zh) * 2019-01-31 2021-07-30 南京医科大学 一种病原体快速检测器及其检测方法
CN111122484A (zh) * 2019-12-30 2020-05-08 中国科学院合肥物质科学研究院 一种水体细菌的定性与定量方法
CN111948155A (zh) * 2020-07-30 2020-11-17 中国科学院西安光学精密机械研究所 精细全光谱结合改进gs-svr的复杂水体硝酸盐定量分析方法
CN111948155B (zh) * 2020-07-30 2022-05-10 中国科学院西安光学精密机械研究所 精细全光谱结合改进gs-svr的复杂水体硝酸盐定量分析方法
CN112116006A (zh) * 2020-09-18 2020-12-22 青海师范大学 一种基于对偶空间最优的水声目标分类方法
CN112668405A (zh) * 2020-12-10 2021-04-16 哈尔滨师范大学 一种土壤细菌数量的精确提取方法
CN112668405B (zh) * 2020-12-10 2022-12-02 哈尔滨师范大学 一种土壤细菌数量的精确提取方法

Similar Documents

Publication Publication Date Title
CN105158175A (zh) 一种采用透射光谱鉴别水中细菌的方法
Almomani et al. Monitoring and measurement of microalgae using the first derivative of absorbance and comparison with chlorophyll extraction method
Liu et al. Recent application of spectroscopy for the detection of microalgae life information: A review
Zamyadi et al. Cyanobacterial detection using in vivo fluorescence probes: Managing interferences for improved decision‐making
CN108875913A (zh) 一种基于卷积神经网络的松茸快速无损检测系统及方法
CN113916847A (zh) 一种基于光谱技术和线性支持向量算法的水质检测方法
Li et al. Spatiotemporal characterization of chromophoric dissolved organic matter (CDOM) and CDOM-DOC relationships for highly polluted rivers
Liu et al. The application of spectroscopy technology in the monitoring of microalgae cells concentration
CN101220389B (zh) 有毒有害物急性毒性响应的敏感藻确定方法
CN104535479A (zh) 用于单个或少量细胞检测的亚太赫兹纳米生物传感器
Wang et al. Application of hyperspectral technology combined with genetic algorithm to optimize convolution long-and short-memory hybrid neural network model in soil moisture and organic matter
Oliva-Teles et al. Environmental diagnosis with Raman Spectroscopy applied to diatoms
CN103674929A (zh) 光谱分析用于植物幼苗的体检方法
CN102967557B (zh) 基于近红外光谱的生物气溶胶含水量测定及其分类方法
CN105911003A (zh) 基于rbm回归的水质toc浓度分析方法
CN103940812A (zh) 一种分光光度法快速检测大肠菌群的方法及应用
Li et al. Method for detecting soil total nitrogen contents based on pyrolysis and artificial olfaction
CN106872341A (zh) 一种基于智能手机的移动即时微生物诊断仪
Mao et al. Permanganate index detection using multi-spectral images combined with BP neural network algorithm
Wang et al. Characteristics of Fluorescence Spectra, UV Spectra, and Specific Growth Rates during the Outbreak of Toxic Microcystis aeruginosa FACHB-905 and Non-Toxic FACHB-469 under Different Nutrient Conditions in a Eutrophic Microcosmic Simulation Device
CN104198409A (zh) 一种基于可见近红外光谱技术的浸入式藻种鉴别方法
Protopapadakis et al. Requirements collection for the design and development of a pervasive water quality monitoring photonic device
McConico et al. Assessing impacts of nutrient competition on the chemical composition of individual microalgae species
Jin et al. Biospectroscopic fingerprinting phytotoxicity towards environmental monitoring for food security and contaminated site remediation
Shan et al. Rapid Algae Identification and concentration prediction based on discrete excitation fluorescence spectra

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20151216