CN107271533B - 基于maldi-tof质谱数据鉴定细菌混合样品的算法 - Google Patents

基于maldi-tof质谱数据鉴定细菌混合样品的算法 Download PDF

Info

Publication number
CN107271533B
CN107271533B CN201710517246.XA CN201710517246A CN107271533B CN 107271533 B CN107271533 B CN 107271533B CN 201710517246 A CN201710517246 A CN 201710517246A CN 107271533 B CN107271533 B CN 107271533B
Authority
CN
China
Prior art keywords
map
peak
maldi
random
matching result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710517246.XA
Other languages
English (en)
Other versions
CN107271533A (zh
Inventor
余绍宁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chuanming (Ningbo) Chemical Technology Co., Ltd
Original Assignee
Zhejiang Spectrum Biological Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Spectrum Biological Technology Co Ltd filed Critical Zhejiang Spectrum Biological Technology Co Ltd
Priority to CN201710517246.XA priority Critical patent/CN107271533B/zh
Publication of CN107271533A publication Critical patent/CN107271533A/zh
Application granted granted Critical
Publication of CN107271533B publication Critical patent/CN107271533B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N27/00Investigating or analysing materials by the use of electric, electrochemical, or magnetic means
    • G01N27/62Investigating or analysing materials by the use of electric, electrochemical, or magnetic means by investigating the ionisation of gases, e.g. aerosols; by investigating electric discharges, e.g. emission of cathode
    • G01N27/626Investigating or analysing materials by the use of electric, electrochemical, or magnetic means by investigating the ionisation of gases, e.g. aerosols; by investigating electric discharges, e.g. emission of cathode using heat to ionise a gas

Landscapes

  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Electrochemistry (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)

Abstract

本发明提供基于MALDI‑TOF质谱数据鉴定细菌混合样品的算法,包括以下步骤:(1)利用参考数据库中的候选图谱合成模拟混合图谱;(2)评价实验图谱与模拟混合图谱的相似度,选出最可能匹配结果;(3)利用“随机图谱模型法”计算错误检出率。本发明构建的细菌混合样品鉴定算法,实现混合细菌样本的直接鉴定,避免了传统方法步骤繁琐、耗时较长的问题;引入了综合评价样品谱图搜库匹配结果的假设验证方法,以FDR值作为鉴定的阈值,提高了基于谱图相似度计算的搜库匹配结果的可靠性;具有较好的综合评价能力,具有较强的可操作性和实用性。

Description

基于MALDI-TOF质谱数据鉴定细菌混合样品的算法
技术领域
本发明涉及一种用于鉴定细菌混合样品的MALDI-TOF质谱数据分析方法。
背景技术
目前,临床主要通过观察菌落形态、革兰氏染色、显微镜检查,以及各种生化试验等方法对细菌进行检测和鉴定,这些方法主要依赖细菌的生长代谢,周期较长,不能满足临床上对细菌进行快速诊断的需要。基因型和分子生物学方法则因其技术复杂、耗费高的局限性,不适用于临床微生物实验室的检测工作。寻求和建立满足临床要求的新的细菌快速诊断的方法的需求迫切。
从1990年代起,基质辅助激光解析电离源飞行时间质谱(MALDI-TOF-MS)被用于细菌鉴定[R.D.Holland,J.G.Wilkes,F.Rafii,J.B.Sutherland,C.C.Persons,K.J.Voorhees,J.O.Lay,Rapid Communications in MassSpectrometry 1996,10,1227-1232;M.A.Claydon,S.N.Davey,V.EdwardsJones,D.B.Gordon,Nature Biotechnology1996,14,1584-1586.]。通过分析不同的细菌,科学家发现从完整的细菌细胞中可以得到具有指纹特征性的质谱图。通过记录多种单一纯细菌的指纹质谱图可以构建细菌鉴定所需的生物特征数据库。之后通过比对临床样本中采集的细菌的MALDI-TOF-MS指纹质谱图,可以实现细菌种类的鉴定[A.Croxatto,G.Prod'hom,G.Greub,FemsMicrobiology Reviews2012,36,380-407;T.R.Sandrin,J.E.Goldstein,S.Schumaker,Mass SpectrometryReviews2013,32,188-217.]
然而目前的方法大都针对单一种类细菌的鉴定,关于混合细菌样本的鉴定的工作较少。与细菌纯培养物相比,多种细菌混合物的鉴定复杂程度明显增加。传统鉴别方法须对细菌进行培养,将菌液进行平板划线分离或涂布分离,获得单菌落再进行分析,培养和分离步骤繁琐,耗时较长,培养、分离过程还易引入杂菌污染。
发明内容
本发明针对传统方法步骤繁琐、耗时较长的问题,提出一种新的鉴定计算方法,将MALDI-TOF MS方法应用于更复杂的细菌混合物。
本发明的技术方案是:
本发明提供一种基于MALDI-TOF质谱数据鉴定细菌混合样品的算法,该算法包括以下步骤:(1)利用参考数据库中的候选图谱合成模拟混合图谱;(2)评价实验图谱与模拟混合图谱的相似度,选出最可能匹配结果;(3)利用随机图谱模型法计算错误检出率。
进一步,利用参考数据库中的候选图谱合成模拟混合图谱包括以下步骤:
(1)将实验图谱与候选参考图谱进行峰对齐,得到峰强度矩阵;
(2)将实验图谱sm的峰强度视为候选参考图谱si对应的峰强度的非负线性组合
应用非负线性最小二乘法求解各组分的系数ci
(3)根据最小二乘法结果合成模拟混合图谱。
进一步,所述随机图谱模型法包括以下步骤:
(1)将参考数据库中全部图谱的所有谱峰混合在一起,随机选取特定数量的谱峰,构成模拟随机图谱sr
(2)将匹配结果中的一种组分j替换为sr,得到随机混合图谱
(3)计算大量随机混合图谱与真实实验图谱间的相似度及其分布,将该匹配结果中的组分j的错误检出率值定义为:在该分布中相似度得分高于实验图谱搜库匹配结果的相似度得分的模拟随机图谱占全部模拟随机图谱的比例,如果错误检出率低于给定的显著性水平,则称该实验图谱的搜库匹配结果中的组分j可通过随机图谱模型检验。
可选的,所述的图谱相似度评价方法可为夹角余弦、皮尔森和斯皮尔曼相关系数中的一种。
进一步,所述的候选参考图谱选取方法包括以下步骤:
(1)将实验图谱与数据库中的参考图谱进行峰对齐;
(2)利用杰卡德相似系数评价实验图谱与参考图谱的共有峰比例
(3)选取与实验图谱共有峰比例最高的一定数量的参考图谱,作为候选图谱。
进一步,所述的峰对齐方法包括以下步骤:
(1)计算两个峰之间的距离,对于不同图谱中的峰,其距离为
对于相同图谱中的峰,其距离为1;
(2)利用凝聚层次聚类将峰合并为簇,聚类停止条件为任意两簇间距离大于指定的容差值,同一簇中的峰视为对齐的峰。
进一步,所用的实验谱图可为多张重复性实验图谱的合并图谱,合并图谱由峰对齐方法得到。
与现有技术相比,本发明的有益效果:
本发明针对传统方法步骤繁琐、耗时较长的问题,将非负线性最小二乘法应用于多组分样品的质谱分析,实现混合细菌样本的直接鉴定。
本发明引入了综合评价样品谱图搜库匹配结果的假设验证方法,以FDR值作为鉴定的阈值,提高了基于谱图相似度计算的搜库匹配结果的可靠性。
本发明中,通过FDR值大小表征待评价样品搜库匹配结果的可靠性;FDR值越小,表示搜库结果的可靠性越好;FDR值越大,表示搜库结果可靠性可能得不到保证。应用时,可通过显著性试验确定FDR值的显著性水平,凡待评价样品FDR值小于其相应的显著性水平的表示搜库结果可靠性得到保证。
具体实施方式
为了使本领域的技术人员更好地理解本发明的技术方案,下面结合实施例对本发明作进一步的说明,但并不因此对本发明限制在所述的实例范围之内。
本发明公开的基于MALDI-TOF质谱数据鉴定细菌混合样品的算法,包括以下步骤:
(1)利用参考数据库中的候选图谱合成模拟混合图谱。
将实验图谱与候选参考图谱进行峰对齐,得到峰强度矩阵。将实验图谱的峰强度视为候选参考图谱对应的峰强度的非负线性组合,应用非负线性最小二乘法求解各组分的系数,根据最小二乘法结果合成模拟混合图谱。
峰对齐方法利用凝聚层次聚类,将峰合并为簇,聚类停止条件为任意两簇间距离大于指定的容差值,同一簇中的峰视为对齐的峰。聚类算法中两个峰之间的距离为:对于不同图谱中的峰,其距离为两峰质荷比的绝对差值与质荷比的较大值之比;对于相同图谱中的峰,其距离为1。
候选参考图谱选取方法利用杰卡德相似系数评价实验图谱与参考图谱的共有峰比例,选取与实验图谱共有峰比例最高的一定数量的参考图谱,作为候选图谱。
(2)评价实验图谱与模拟混合图谱的相似度,选出最可能匹配结果。
相似度评价方法可为夹角余弦、皮尔森和斯皮尔曼相关系数等。
(3)利用“随机图谱模型法”计算错误检出率(FDR)。
将参考数据库中全部图谱的所有谱峰混合在一起,随机选取特定数量的谱峰,构成模拟随机图谱。将匹配结果中的一种组分替换为模拟随机图谱,得到随机混合图谱。计算大量随机混合图谱与真实实验图谱间的相似度及其分布,将该匹配结果中的该组分的错误检出率(FDR)值定义为在该分布中相似度得分高于实验图谱搜库匹配结果的相似度得分的模拟随机图谱占全部模拟随机图谱的比例,如果FDR值低于给定的显著性水平则称该实验图谱的搜库匹配结果中的组分可通过随机图谱模型检验。
应用实施例:
以Staphylococcus aureus ATCC 25923、Pseudomonas aeruginosa ATCC27853和Enterobacter cloacae ATCC 23373细菌(浓度分别为12、3.4和1.6,单位108CFU/mL)的实验谱图为例,上传6张重复性实验谱图后算法程序会利用[0008]-[0016]所述的方法给出数据库检索结果。表1是该样品的数据库检索结果。三个组分的FDR值均为0,表示搜库匹配结果可靠。
表1混合细菌的实验谱图的数据库检索结果

Claims (6)

1.一种基于MALDI-TOF质谱数据鉴定细菌混合样品的算法,其特征在于,该算法包括以下步骤:(1)利用参考数据库中的候选图谱合成模拟混合图谱;(2)评价实验图谱与模拟混合图谱的相似度,选出最可能匹配结果;(3)利用随机图谱模型法计算错误检出率;
利用参考数据库中的候选图谱合成模拟混合图谱包括以下步骤:
(1)将实验图谱与候选参考图谱进行峰对齐,得到峰强度矩阵;
(2)将实验图谱sm的峰强度视为候选参考图谱si对应的峰强度的非负线性组合
应用非负线性最小二乘法求解各组分的系数ci
(3)根据最小二乘法结果合成模拟混合图谱。
2.根据权利要求1所述的基于MALDI-TOF质谱数据鉴定细菌混合样品的算法,其特征在于,所述随机图谱模型法包括以下步骤:
(1)将参考数据库中全部图谱的所有谱峰混合在一起,随机选取特定数量的谱峰,构成模拟随机图谱sr
(2)将匹配结果中的一种组分j替换为sr,得到随机混合图谱sj m
(3)计算大量随机混合图谱与真实实验图谱间的相似度及其分布,将该匹配结果中的组分j的错误检出率值定义为:在该分布中相似度得分高于实验图谱搜库匹配结果的相似度得分的模拟随机图谱占全部模拟随机图谱的比例,如果错误检出率低于给定的显著性水平,则称该实验图谱的搜库匹配结果中的组分j可通过随机图谱模型检验。
3.根据权利要求1所述的基于MALDI-TOF质谱数据鉴定细菌混合样品的算法,其特征在于,所述的图谱相似度评价方法可为夹角余弦、皮尔森和斯皮尔曼相关系数中的一种。
4.根据权利要求1所述的基于MALDI-TOF质谱数据鉴定细菌混合样品的算法,其特征在于,所述候选参考图谱的选取方法包括以下步骤:
(1)将实验图谱与数据库中的参考图谱进行峰对齐;
(2)利用杰卡德相似系数评价实验图谱与参考图谱的共有峰比例
(3)选取与实验图谱共有峰比例最高的一定数量的参考图谱,作为候选图谱。
5.根据权利要求1所述的基于MALDI-TOF质谱数据鉴定细菌混合样品的算法,其特征在于,所述峰对齐的方法包括以下步骤:
(1)计算两个峰之间的距离,对于不同图谱中的峰,其距离为
对于相同图谱中的峰,其距离为1;
(2)利用凝聚层次聚类将峰合并为簇,聚类停止条件为任意两簇间距离大于指定的容差值,同一簇中的峰视为对齐的峰。
6.根据权利要求5所述的基于MALDI-TOF质谱数据鉴定细菌混合样品的算法,其特征在于,所用的实验谱图可为多张重复性实验图谱的合并图谱,合并图谱由峰对齐方法得到。
CN201710517246.XA 2017-06-29 2017-06-29 基于maldi-tof质谱数据鉴定细菌混合样品的算法 Active CN107271533B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710517246.XA CN107271533B (zh) 2017-06-29 2017-06-29 基于maldi-tof质谱数据鉴定细菌混合样品的算法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710517246.XA CN107271533B (zh) 2017-06-29 2017-06-29 基于maldi-tof质谱数据鉴定细菌混合样品的算法

Publications (2)

Publication Number Publication Date
CN107271533A CN107271533A (zh) 2017-10-20
CN107271533B true CN107271533B (zh) 2019-09-13

Family

ID=60070771

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710517246.XA Active CN107271533B (zh) 2017-06-29 2017-06-29 基于maldi-tof质谱数据鉴定细菌混合样品的算法

Country Status (1)

Country Link
CN (1) CN107271533B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110687191A (zh) * 2019-10-22 2020-01-14 宁波大学 基于基质辅助激光解吸电离飞行时间质谱与ftir光谱联用的微生物鉴定和分型方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1253622B1 (de) * 2000-07-28 2007-12-12 AnagnosTec Gesellschaft für Analytische Biochemie und Diagnostik mbH Verfahren zur Identifizierung von Mikroorganismen mittels MALDI-TOF-MS
CN101871945A (zh) * 2010-06-13 2010-10-27 中国科学院计算技术研究所 谱库的生成方法和串联质谱谱图鉴定方法
CN104380430A (zh) * 2012-05-29 2015-02-25 佰欧迪塞克斯公司 复杂生物样品如血清的深度maldi tof质谱及其用途
CN106199003A (zh) * 2016-07-21 2016-12-07 郑州安图生物工程股份有限公司 基于飞行时间质谱原理的微生物肽质量指纹图谱库的构建方法
CN106570351A (zh) * 2016-10-17 2017-04-19 浙江和谱生物科技有限公司 基于谱图相似度计算的搜库匹配结果的计算机模拟统计验证方法
CN106650779A (zh) * 2016-10-17 2017-05-10 浙江和谱生物科技有限公司 谱图相似度的计算方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1253622B1 (de) * 2000-07-28 2007-12-12 AnagnosTec Gesellschaft für Analytische Biochemie und Diagnostik mbH Verfahren zur Identifizierung von Mikroorganismen mittels MALDI-TOF-MS
CN101871945A (zh) * 2010-06-13 2010-10-27 中国科学院计算技术研究所 谱库的生成方法和串联质谱谱图鉴定方法
CN104380430A (zh) * 2012-05-29 2015-02-25 佰欧迪塞克斯公司 复杂生物样品如血清的深度maldi tof质谱及其用途
CN106199003A (zh) * 2016-07-21 2016-12-07 郑州安图生物工程股份有限公司 基于飞行时间质谱原理的微生物肽质量指纹图谱库的构建方法
CN106570351A (zh) * 2016-10-17 2017-04-19 浙江和谱生物科技有限公司 基于谱图相似度计算的搜库匹配结果的计算机模拟统计验证方法
CN106650779A (zh) * 2016-10-17 2017-05-10 浙江和谱生物科技有限公司 谱图相似度的计算方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Rapid species identification of seafood;Karola Bo¨ hme等;《Electrophoresis》;20111118;第2951-2965页 *
目标-诱饵库搜索策略在蛋白质组质谱鉴定;冯晓东等;《生物化学与生物物理进展》;20160730;第331-372页 *

Also Published As

Publication number Publication date
CN107271533A (zh) 2017-10-20

Similar Documents

Publication Publication Date Title
Diggins et al. Methods for discovery and characterization of cell subsets in high dimensional mass cytometry data
Merwin et al. DeepRiPP integrates multiomics data to automate discovery of novel ribosomally synthesized natural products
Spitzer et al. Mass cytometry: single cells, many features
Larsen et al. Stable isotope fingerprinting: a novel method for identifying plant, fungal, or bacterial origins of amino acids
Fiore et al. Release of ecologically relevant metabolites by the cyanobacterium S ynechococcus elongatus CCMP 1631
Bean et al. Comparative analysis of the volatile metabolomes of Pseudomonas aeruginosa clinical isolates
Walker et al. Functional Traits 2.0: The power of the metabolome for ecology
CN106570351B (zh) 基于谱图相似度计算的搜库匹配结果的计算机模拟统计验证方法
WO2015037003A1 (en) Method and electronic nose for comparing odors
Will et al. Comparative analysis of Middle Stone Age artifacts in Africa (CoMSAfrica).
O'Bryon et al. Flying blind, or just flying under the radar? The underappreciated power of de novo methods of mass spectrometric peptide identification
DE10038694C2 (de) Verfahren zur Identifizierung von Mikroorganismen mittels MALDI-TOF-MS
Mehta et al. MALDI-TOF MS profiling approach: how much can we get from it?
Kurtuluş et al. An Analysis of Scientific Articles on Science Misconceptions: A Bibliometric Research.
Dekio et al. Correlation between phylogroups and intracellular proteomes of Propionibacterium acnes and differences in the protein expression profiles between anaerobically and aerobically grown cells
CN107271533B (zh) 基于maldi-tof质谱数据鉴定细菌混合样品的算法
CN106650779B (zh) 谱图相似度的计算方法
Lian et al. Artificial-cell-type aware cell-type classification in CITE-seq
CN109870533A (zh) 一种基于分子地图的生物样本快速智能识别方法
CN112415208A (zh) 一种评价蛋白组学质谱数据质量的方法
Gokul et al. Icescape‐scale metabolomics reveals cyanobacterial and topographic control of the core metabolism of the cryoconite ecosystem of an Arctic ice cap
Cattell et al. Behavioral types in purebred dogs objectively determined by taxonome
EP3304374B1 (en) Sample mass spectrum analysis
Phipson et al. missMethyl: Analysing Illumina HumanMethylation BeadChip Data
Vaidyanathan et al. Explanatory multivariate analysis of ToF-SIMS spectra for the discrimination of bacterial isolates

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20200706

Address after: Building 2, No. 189 Guangming Road, Zhuangshi street, Zhenhai District, Ningbo City, Zhejiang Province, 315000

Patentee after: Chuanming (Ningbo) Chemical Technology Co., Ltd

Address before: Hangzhou City, Zhejiang province 310000 Binjiang District River Street foreshore road 688 5 building 15 room 1512

Patentee before: ZHEJIANG BIOHARMONIOUS TECHNOLOGY Co.,Ltd.