CN107271533B - 基于maldi-tof质谱数据鉴定细菌混合样品的算法 - Google Patents
基于maldi-tof质谱数据鉴定细菌混合样品的算法 Download PDFInfo
- Publication number
- CN107271533B CN107271533B CN201710517246.XA CN201710517246A CN107271533B CN 107271533 B CN107271533 B CN 107271533B CN 201710517246 A CN201710517246 A CN 201710517246A CN 107271533 B CN107271533 B CN 107271533B
- Authority
- CN
- China
- Prior art keywords
- map
- peak
- maldi
- random
- matching result
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N27/00—Investigating or analysing materials by the use of electric, electrochemical, or magnetic means
- G01N27/62—Investigating or analysing materials by the use of electric, electrochemical, or magnetic means by investigating the ionisation of gases, e.g. aerosols; by investigating electric discharges, e.g. emission of cathode
- G01N27/626—Investigating or analysing materials by the use of electric, electrochemical, or magnetic means by investigating the ionisation of gases, e.g. aerosols; by investigating electric discharges, e.g. emission of cathode using heat to ionise a gas
Landscapes
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Electrochemistry (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
Abstract
本发明提供基于MALDI‑TOF质谱数据鉴定细菌混合样品的算法,包括以下步骤:(1)利用参考数据库中的候选图谱合成模拟混合图谱;(2)评价实验图谱与模拟混合图谱的相似度,选出最可能匹配结果;(3)利用“随机图谱模型法”计算错误检出率。本发明构建的细菌混合样品鉴定算法,实现混合细菌样本的直接鉴定,避免了传统方法步骤繁琐、耗时较长的问题;引入了综合评价样品谱图搜库匹配结果的假设验证方法,以FDR值作为鉴定的阈值,提高了基于谱图相似度计算的搜库匹配结果的可靠性;具有较好的综合评价能力,具有较强的可操作性和实用性。
Description
技术领域
本发明涉及一种用于鉴定细菌混合样品的MALDI-TOF质谱数据分析方法。
背景技术
目前,临床主要通过观察菌落形态、革兰氏染色、显微镜检查,以及各种生化试验等方法对细菌进行检测和鉴定,这些方法主要依赖细菌的生长代谢,周期较长,不能满足临床上对细菌进行快速诊断的需要。基因型和分子生物学方法则因其技术复杂、耗费高的局限性,不适用于临床微生物实验室的检测工作。寻求和建立满足临床要求的新的细菌快速诊断的方法的需求迫切。
从1990年代起,基质辅助激光解析电离源飞行时间质谱(MALDI-TOF-MS)被用于细菌鉴定[R.D.Holland,J.G.Wilkes,F.Rafii,J.B.Sutherland,C.C.Persons,K.J.Voorhees,J.O.Lay,Rapid Communications in MassSpectrometry 1996,10,1227-1232;M.A.Claydon,S.N.Davey,V.EdwardsJones,D.B.Gordon,Nature Biotechnology1996,14,1584-1586.]。通过分析不同的细菌,科学家发现从完整的细菌细胞中可以得到具有指纹特征性的质谱图。通过记录多种单一纯细菌的指纹质谱图可以构建细菌鉴定所需的生物特征数据库。之后通过比对临床样本中采集的细菌的MALDI-TOF-MS指纹质谱图,可以实现细菌种类的鉴定[A.Croxatto,G.Prod'hom,G.Greub,FemsMicrobiology Reviews2012,36,380-407;T.R.Sandrin,J.E.Goldstein,S.Schumaker,Mass SpectrometryReviews2013,32,188-217.]
然而目前的方法大都针对单一种类细菌的鉴定,关于混合细菌样本的鉴定的工作较少。与细菌纯培养物相比,多种细菌混合物的鉴定复杂程度明显增加。传统鉴别方法须对细菌进行培养,将菌液进行平板划线分离或涂布分离,获得单菌落再进行分析,培养和分离步骤繁琐,耗时较长,培养、分离过程还易引入杂菌污染。
发明内容
本发明针对传统方法步骤繁琐、耗时较长的问题,提出一种新的鉴定计算方法,将MALDI-TOF MS方法应用于更复杂的细菌混合物。
本发明的技术方案是:
本发明提供一种基于MALDI-TOF质谱数据鉴定细菌混合样品的算法,该算法包括以下步骤:(1)利用参考数据库中的候选图谱合成模拟混合图谱;(2)评价实验图谱与模拟混合图谱的相似度,选出最可能匹配结果;(3)利用随机图谱模型法计算错误检出率。
进一步,利用参考数据库中的候选图谱合成模拟混合图谱包括以下步骤:
(1)将实验图谱与候选参考图谱进行峰对齐,得到峰强度矩阵;
(2)将实验图谱sm的峰强度视为候选参考图谱si对应的峰强度的非负线性组合
应用非负线性最小二乘法求解各组分的系数ci;
(3)根据最小二乘法结果合成模拟混合图谱。
进一步,所述随机图谱模型法包括以下步骤:
(1)将参考数据库中全部图谱的所有谱峰混合在一起,随机选取特定数量的谱峰,构成模拟随机图谱sr;
(2)将匹配结果中的一种组分j替换为sr,得到随机混合图谱
(3)计算大量随机混合图谱与真实实验图谱间的相似度及其分布,将该匹配结果中的组分j的错误检出率值定义为:在该分布中相似度得分高于实验图谱搜库匹配结果的相似度得分的模拟随机图谱占全部模拟随机图谱的比例,如果错误检出率低于给定的显著性水平,则称该实验图谱的搜库匹配结果中的组分j可通过随机图谱模型检验。
可选的,所述的图谱相似度评价方法可为夹角余弦、皮尔森和斯皮尔曼相关系数中的一种。
进一步,所述的候选参考图谱选取方法包括以下步骤:
(1)将实验图谱与数据库中的参考图谱进行峰对齐;
(2)利用杰卡德相似系数评价实验图谱与参考图谱的共有峰比例
(3)选取与实验图谱共有峰比例最高的一定数量的参考图谱,作为候选图谱。
进一步,所述的峰对齐方法包括以下步骤:
(1)计算两个峰之间的距离,对于不同图谱中的峰,其距离为
对于相同图谱中的峰,其距离为1;
(2)利用凝聚层次聚类将峰合并为簇,聚类停止条件为任意两簇间距离大于指定的容差值,同一簇中的峰视为对齐的峰。
进一步,所用的实验谱图可为多张重复性实验图谱的合并图谱,合并图谱由峰对齐方法得到。
与现有技术相比,本发明的有益效果:
本发明针对传统方法步骤繁琐、耗时较长的问题,将非负线性最小二乘法应用于多组分样品的质谱分析,实现混合细菌样本的直接鉴定。
本发明引入了综合评价样品谱图搜库匹配结果的假设验证方法,以FDR值作为鉴定的阈值,提高了基于谱图相似度计算的搜库匹配结果的可靠性。
本发明中,通过FDR值大小表征待评价样品搜库匹配结果的可靠性;FDR值越小,表示搜库结果的可靠性越好;FDR值越大,表示搜库结果可靠性可能得不到保证。应用时,可通过显著性试验确定FDR值的显著性水平,凡待评价样品FDR值小于其相应的显著性水平的表示搜库结果可靠性得到保证。
具体实施方式
为了使本领域的技术人员更好地理解本发明的技术方案,下面结合实施例对本发明作进一步的说明,但并不因此对本发明限制在所述的实例范围之内。
本发明公开的基于MALDI-TOF质谱数据鉴定细菌混合样品的算法,包括以下步骤:
(1)利用参考数据库中的候选图谱合成模拟混合图谱。
将实验图谱与候选参考图谱进行峰对齐,得到峰强度矩阵。将实验图谱的峰强度视为候选参考图谱对应的峰强度的非负线性组合,应用非负线性最小二乘法求解各组分的系数,根据最小二乘法结果合成模拟混合图谱。
峰对齐方法利用凝聚层次聚类,将峰合并为簇,聚类停止条件为任意两簇间距离大于指定的容差值,同一簇中的峰视为对齐的峰。聚类算法中两个峰之间的距离为:对于不同图谱中的峰,其距离为两峰质荷比的绝对差值与质荷比的较大值之比;对于相同图谱中的峰,其距离为1。
候选参考图谱选取方法利用杰卡德相似系数评价实验图谱与参考图谱的共有峰比例,选取与实验图谱共有峰比例最高的一定数量的参考图谱,作为候选图谱。
(2)评价实验图谱与模拟混合图谱的相似度,选出最可能匹配结果。
相似度评价方法可为夹角余弦、皮尔森和斯皮尔曼相关系数等。
(3)利用“随机图谱模型法”计算错误检出率(FDR)。
将参考数据库中全部图谱的所有谱峰混合在一起,随机选取特定数量的谱峰,构成模拟随机图谱。将匹配结果中的一种组分替换为模拟随机图谱,得到随机混合图谱。计算大量随机混合图谱与真实实验图谱间的相似度及其分布,将该匹配结果中的该组分的错误检出率(FDR)值定义为在该分布中相似度得分高于实验图谱搜库匹配结果的相似度得分的模拟随机图谱占全部模拟随机图谱的比例,如果FDR值低于给定的显著性水平则称该实验图谱的搜库匹配结果中的组分可通过随机图谱模型检验。
应用实施例:
以Staphylococcus aureus ATCC 25923、Pseudomonas aeruginosa ATCC27853和Enterobacter cloacae ATCC 23373细菌(浓度分别为12、3.4和1.6,单位108CFU/mL)的实验谱图为例,上传6张重复性实验谱图后算法程序会利用[0008]-[0016]所述的方法给出数据库检索结果。表1是该样品的数据库检索结果。三个组分的FDR值均为0,表示搜库匹配结果可靠。
表1混合细菌的实验谱图的数据库检索结果
Claims (6)
1.一种基于MALDI-TOF质谱数据鉴定细菌混合样品的算法,其特征在于,该算法包括以下步骤:(1)利用参考数据库中的候选图谱合成模拟混合图谱;(2)评价实验图谱与模拟混合图谱的相似度,选出最可能匹配结果;(3)利用随机图谱模型法计算错误检出率;
利用参考数据库中的候选图谱合成模拟混合图谱包括以下步骤:
(1)将实验图谱与候选参考图谱进行峰对齐,得到峰强度矩阵;
(2)将实验图谱sm的峰强度视为候选参考图谱si对应的峰强度的非负线性组合
应用非负线性最小二乘法求解各组分的系数ci;
(3)根据最小二乘法结果合成模拟混合图谱。
2.根据权利要求1所述的基于MALDI-TOF质谱数据鉴定细菌混合样品的算法,其特征在于,所述随机图谱模型法包括以下步骤:
(1)将参考数据库中全部图谱的所有谱峰混合在一起,随机选取特定数量的谱峰,构成模拟随机图谱sr;
(2)将匹配结果中的一种组分j替换为sr,得到随机混合图谱sj m
(3)计算大量随机混合图谱与真实实验图谱间的相似度及其分布,将该匹配结果中的组分j的错误检出率值定义为:在该分布中相似度得分高于实验图谱搜库匹配结果的相似度得分的模拟随机图谱占全部模拟随机图谱的比例,如果错误检出率低于给定的显著性水平,则称该实验图谱的搜库匹配结果中的组分j可通过随机图谱模型检验。
3.根据权利要求1所述的基于MALDI-TOF质谱数据鉴定细菌混合样品的算法,其特征在于,所述的图谱相似度评价方法可为夹角余弦、皮尔森和斯皮尔曼相关系数中的一种。
4.根据权利要求1所述的基于MALDI-TOF质谱数据鉴定细菌混合样品的算法,其特征在于,所述候选参考图谱的选取方法包括以下步骤:
(1)将实验图谱与数据库中的参考图谱进行峰对齐;
(2)利用杰卡德相似系数评价实验图谱与参考图谱的共有峰比例
(3)选取与实验图谱共有峰比例最高的一定数量的参考图谱,作为候选图谱。
5.根据权利要求1所述的基于MALDI-TOF质谱数据鉴定细菌混合样品的算法,其特征在于,所述峰对齐的方法包括以下步骤:
(1)计算两个峰之间的距离,对于不同图谱中的峰,其距离为
对于相同图谱中的峰,其距离为1;
(2)利用凝聚层次聚类将峰合并为簇,聚类停止条件为任意两簇间距离大于指定的容差值,同一簇中的峰视为对齐的峰。
6.根据权利要求5所述的基于MALDI-TOF质谱数据鉴定细菌混合样品的算法,其特征在于,所用的实验谱图可为多张重复性实验图谱的合并图谱,合并图谱由峰对齐方法得到。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710517246.XA CN107271533B (zh) | 2017-06-29 | 2017-06-29 | 基于maldi-tof质谱数据鉴定细菌混合样品的算法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710517246.XA CN107271533B (zh) | 2017-06-29 | 2017-06-29 | 基于maldi-tof质谱数据鉴定细菌混合样品的算法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107271533A CN107271533A (zh) | 2017-10-20 |
CN107271533B true CN107271533B (zh) | 2019-09-13 |
Family
ID=60070771
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710517246.XA Active CN107271533B (zh) | 2017-06-29 | 2017-06-29 | 基于maldi-tof质谱数据鉴定细菌混合样品的算法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107271533B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110687191A (zh) * | 2019-10-22 | 2020-01-14 | 宁波大学 | 基于基质辅助激光解吸电离飞行时间质谱与ftir光谱联用的微生物鉴定和分型方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1253622B1 (de) * | 2000-07-28 | 2007-12-12 | AnagnosTec Gesellschaft für Analytische Biochemie und Diagnostik mbH | Verfahren zur Identifizierung von Mikroorganismen mittels MALDI-TOF-MS |
CN101871945A (zh) * | 2010-06-13 | 2010-10-27 | 中国科学院计算技术研究所 | 谱库的生成方法和串联质谱谱图鉴定方法 |
CN104380430A (zh) * | 2012-05-29 | 2015-02-25 | 佰欧迪塞克斯公司 | 复杂生物样品如血清的深度maldi tof质谱及其用途 |
CN106199003A (zh) * | 2016-07-21 | 2016-12-07 | 郑州安图生物工程股份有限公司 | 基于飞行时间质谱原理的微生物肽质量指纹图谱库的构建方法 |
CN106570351A (zh) * | 2016-10-17 | 2017-04-19 | 浙江和谱生物科技有限公司 | 基于谱图相似度计算的搜库匹配结果的计算机模拟统计验证方法 |
CN106650779A (zh) * | 2016-10-17 | 2017-05-10 | 浙江和谱生物科技有限公司 | 谱图相似度的计算方法 |
-
2017
- 2017-06-29 CN CN201710517246.XA patent/CN107271533B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1253622B1 (de) * | 2000-07-28 | 2007-12-12 | AnagnosTec Gesellschaft für Analytische Biochemie und Diagnostik mbH | Verfahren zur Identifizierung von Mikroorganismen mittels MALDI-TOF-MS |
CN101871945A (zh) * | 2010-06-13 | 2010-10-27 | 中国科学院计算技术研究所 | 谱库的生成方法和串联质谱谱图鉴定方法 |
CN104380430A (zh) * | 2012-05-29 | 2015-02-25 | 佰欧迪塞克斯公司 | 复杂生物样品如血清的深度maldi tof质谱及其用途 |
CN106199003A (zh) * | 2016-07-21 | 2016-12-07 | 郑州安图生物工程股份有限公司 | 基于飞行时间质谱原理的微生物肽质量指纹图谱库的构建方法 |
CN106570351A (zh) * | 2016-10-17 | 2017-04-19 | 浙江和谱生物科技有限公司 | 基于谱图相似度计算的搜库匹配结果的计算机模拟统计验证方法 |
CN106650779A (zh) * | 2016-10-17 | 2017-05-10 | 浙江和谱生物科技有限公司 | 谱图相似度的计算方法 |
Non-Patent Citations (2)
Title |
---|
Rapid species identification of seafood;Karola Bo¨ hme等;《Electrophoresis》;20111118;第2951-2965页 * |
目标-诱饵库搜索策略在蛋白质组质谱鉴定;冯晓东等;《生物化学与生物物理进展》;20160730;第331-372页 * |
Also Published As
Publication number | Publication date |
---|---|
CN107271533A (zh) | 2017-10-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Diggins et al. | Methods for discovery and characterization of cell subsets in high dimensional mass cytometry data | |
Merwin et al. | DeepRiPP integrates multiomics data to automate discovery of novel ribosomally synthesized natural products | |
Spitzer et al. | Mass cytometry: single cells, many features | |
Larsen et al. | Stable isotope fingerprinting: a novel method for identifying plant, fungal, or bacterial origins of amino acids | |
Fiore et al. | Release of ecologically relevant metabolites by the cyanobacterium S ynechococcus elongatus CCMP 1631 | |
Bean et al. | Comparative analysis of the volatile metabolomes of Pseudomonas aeruginosa clinical isolates | |
Walker et al. | Functional Traits 2.0: The power of the metabolome for ecology | |
CN106570351B (zh) | 基于谱图相似度计算的搜库匹配结果的计算机模拟统计验证方法 | |
WO2015037003A1 (en) | Method and electronic nose for comparing odors | |
Will et al. | Comparative analysis of Middle Stone Age artifacts in Africa (CoMSAfrica). | |
O'Bryon et al. | Flying blind, or just flying under the radar? The underappreciated power of de novo methods of mass spectrometric peptide identification | |
DE10038694C2 (de) | Verfahren zur Identifizierung von Mikroorganismen mittels MALDI-TOF-MS | |
Mehta et al. | MALDI-TOF MS profiling approach: how much can we get from it? | |
Kurtuluş et al. | An Analysis of Scientific Articles on Science Misconceptions: A Bibliometric Research. | |
Dekio et al. | Correlation between phylogroups and intracellular proteomes of Propionibacterium acnes and differences in the protein expression profiles between anaerobically and aerobically grown cells | |
CN107271533B (zh) | 基于maldi-tof质谱数据鉴定细菌混合样品的算法 | |
CN106650779B (zh) | 谱图相似度的计算方法 | |
Lian et al. | Artificial-cell-type aware cell-type classification in CITE-seq | |
CN109870533A (zh) | 一种基于分子地图的生物样本快速智能识别方法 | |
CN112415208A (zh) | 一种评价蛋白组学质谱数据质量的方法 | |
Gokul et al. | Icescape‐scale metabolomics reveals cyanobacterial and topographic control of the core metabolism of the cryoconite ecosystem of an Arctic ice cap | |
Cattell et al. | Behavioral types in purebred dogs objectively determined by taxonome | |
EP3304374B1 (en) | Sample mass spectrum analysis | |
Phipson et al. | missMethyl: Analysing Illumina HumanMethylation BeadChip Data | |
Vaidyanathan et al. | Explanatory multivariate analysis of ToF-SIMS spectra for the discrimination of bacterial isolates |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20200706 Address after: Building 2, No. 189 Guangming Road, Zhuangshi street, Zhenhai District, Ningbo City, Zhejiang Province, 315000 Patentee after: Chuanming (Ningbo) Chemical Technology Co., Ltd Address before: Hangzhou City, Zhejiang province 310000 Binjiang District River Street foreshore road 688 5 building 15 room 1512 Patentee before: ZHEJIANG BIOHARMONIOUS TECHNOLOGY Co.,Ltd. |