CN106570351A - 基于谱图相似度计算的搜库匹配结果的计算机模拟统计验证方法 - Google Patents
基于谱图相似度计算的搜库匹配结果的计算机模拟统计验证方法 Download PDFInfo
- Publication number
- CN106570351A CN106570351A CN201610905439.8A CN201610905439A CN106570351A CN 106570351 A CN106570351 A CN 106570351A CN 201610905439 A CN201610905439 A CN 201610905439A CN 106570351 A CN106570351 A CN 106570351A
- Authority
- CN
- China
- Prior art keywords
- spectrogram
- computer simulation
- matching result
- experiment
- peak
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
Landscapes
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Biophysics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biotechnology (AREA)
- Evolutionary Biology (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供一种基于谱图相似度计算的搜库匹配结果的计算机模拟统计验证方法,所述方法包括以下步骤:利用“相似谱图模型法”计算P值;利用“随机谱图模型法”计算错误检出率FDR值。本发明的基于谱图相似度计算的搜库匹配结果的计算机模拟统计验证方法通过P值和FDR值大小表征待评价样品搜库匹配结果的可靠性;P值越大,FDR值越小,表示搜库结果的可靠性越好;P值越小,FDR值越大,表示搜库结果的可靠性得不到保证。应用时,可通过显著性试验确定P值和FDR值的显著性水平,凡待评价样品P值大于其相应的显著性水平,FDR值小于其相应的显著性水平的表示搜库结果可靠性能得到保证。
Description
技术领域
本发明涉及谱图,特别涉及基于谱图相似度计算的搜库匹配结果的计算机模拟统计验证方法。
背景技术
谱图的匹配比对在生物医学、化学、物理学等领域中有着广泛的应用。
在血液细菌感染(菌血症)的细菌鉴定工作中,由于患者的临床表现不典型,给感染的诊断带来困难。目前,临床上菌血症诊断的金标准是血液细菌培养法,但血液培养的阳性率极低从而导致延误治疗。相比之下,质谱谱图法准确度高、稳定性好、操作简单,易于临床推广。从1990年代起,基质辅助激光解析电离源飞行时间质谱(MALDI-TOF-MS)被用于细菌鉴定[R.D.Holland,J.G.Wilkes,F.Rafii,J.B.Sutherland,C.C.Persons,K.J.Voorhees,J.O.Lay,Rapid Communications in Mass Spectrometry 1996,10,1227-1232;M.A.Claydon,S.N.Davey,V.EdwardsJones,D.B.Gordon,Nature Biotechnology1996,14,1584-1586.]。通过分析不同的细菌,科学家发现从完整的细菌细胞中可以得到具有指纹特征性的质谱图。通过记录多种单一纯细菌的指纹质谱图可以构建细菌鉴定所需的生物特征数据库。之后通过比对临床样本中采集的细菌的MALDI-TOF-MS指纹质谱图,可以实现细菌种类的鉴定[A.Croxatto,G.Prod'hom,G.Greub,Fems Microbiology Reviews2012,36,380-407;T.R.Sandrin,J.E.Goldstein,S.Schumaker,Mass SpectrometryReviews 2013,32,188-217.]
谱图匹配也广泛用于蛋白质测序工作。肽段质量指纹谱图(peptide massfingerprint)匹配法用于蛋白酶解产物的质谱分析,根据数据库中已有蛋白的序列及酶解反应特征可以生成单个蛋白的理论肽段列表暨理论标准谱图,通过比对实验谱图可以实现未知蛋白的鉴定。[Webster J,Oxley D,Methods Mol Biol2005,310,227-240.]蛋白质组学中常使用的“鸟枪法”(shotgun)也是依赖于质谱图的匹配完成的,如基于二级碎片质谱图的肽谱匹配打分和蛋白质鉴定。[Fernández-Puente P,Mateos J,Blanco FJ,Ruiz-Romero C,Methods Mol Biol 2014,1156,27-38.]质谱匹配已经成为当今蛋白质鉴定中至关重要的技术手段。
基于谱学方法的检测、鉴定中最为关键的一步是实验样本和参考样本的谱图匹配。近年来发展了多种用于谱图匹配的打分方法。Seongho Kim和Xiang Zhang研究了质谱图相似性打分的夹角余弦法、皮尔森和斯皮尔曼相关系数法、 偏相关与部分相关系数法。[S.Kim,X.Zhang,Computational&Mathematical Methods in Medicine 2013,9,399-412]
然而传统的谱图匹配方法往往基于最优的谱图相似性计算结果及一个给定的分值阈值,缺乏假设验证。譬如,在临床微生物鉴定普遍使用的质谱法中,Bruker公司提供的商业解决方案Biotyper软件以2.0的相似度分值为鉴定阈值,然而该阈值的合理性有待考量。针对这一问题,本发明旨在建立一种谱图相似性匹配的假设验证方法,以P值和错误检出率(FDR)值替代相似度分值作为准确鉴定的标准。
发明内容
本发明为了克服现有技术的至少一个不足,提供一种基于谱图相似度计算的搜库匹配结果的计算机模拟统计验证方法,以实现鉴定可靠性高的目的。
为了实现上述目的,本发明采用以下技术方案:
一种基于谱图相似度计算的搜库匹配结果的计算机模拟统计验证方法,所述方法包括以下步骤:
利用“相似谱图模型法”计算P值;利用“随机谱图模型法”计算错误检出率FDR值。
(一)其中“相似谱图模型法”包括以下步骤:(1)提取数次重复性实验产生的谱图间的差异信息;(2)根据上述信息及已有实验谱图利用计算机模拟的方式生成模拟重复性实验谱图;(3)计算大量模拟重复性实验谱图与真实实验谱图间的相似度及其分布,将P值定义为在该分布中相似度得分低于实验谱图搜库匹配结果的相似度得分的模拟重复性实验谱图占全部模拟重复性实验谱图的比例,如果P值高于给定的显著性水平则称该实验谱图的搜库匹配结果可通过相似谱图模型检验。
具体的,根据若干次重复性实验的实验谱图形成一张合并谱图,该合并谱图的特征在于对基线校正后的实验谱图进行纵向加总,并进行强度归一化。将重复性实验的实验谱图中的谱峰与合并谱图的谱峰列表比对筛选,所有包含在合并谱图每个谱峰的半峰宽范围内的实验谱图的峰被归为一组,这样的谱峰被称为组内峰,其余的未被包含在任何组中的谱峰被称为组外峰。计算每个组内的所有谱峰的质荷比(m/z)g的均值及其相对标准差(RSD)。计算每个组内的所有峰的强度Ig的均值及其相对标准差。对每张实验谱图,计算组内峰的个数(Ng),组内峰占所有谱峰的比例(pg),得到所有重复性实验的实验谱图的Ng值和pg的均值及其标准差(SD)。
利用计算机生成一个模拟谱图,该谱图的组内峰个数(N’g)从Ng的正态分布中随机获取
N′g=Normal(Ng,SD(Ng))
该模拟谱图的组内峰数量与总峰数量的比值(p’g)从pg的正态分布中随机获取
从所有的组中随机抽取N’g个组,对于每个抽取的组得到一个计算机模拟的峰,该峰的质荷比(m/z)’g从(m/z)g的正态分布中随机获取
该峰的强度I’g从I g的正态分布中随机获取
式中,kmz和kI为调整系数。
从所有实验谱图的组外峰中随机抽取N’g×(1/p’g-1)个峰,对每一个峰形成一个计算机模拟的峰,该峰的质荷比满足
(m/z)′og=Normal((m/z)og,kmz·(fwhm)og/6)
式中,(m/z)og是该组外峰的质荷比,(fwhm)og是该组外峰的半峰宽。该模拟峰的强度满足
I′og=Normal(Iog,kI·ε·Iog)
式中,(I)og是该组外峰的强度,ε是一个很小的正数,0.001。
根据上述组内峰和组外峰可以完成计算机模拟谱图的构建,重复上述过程可以完成若干个计算机模拟谱图的构建。
利用“相似谱图模型”产生实验谱图的计算机模拟重复性谱图,得到大量计算机模拟谱图与实验谱图的合并谱图的相似度得分分布结果。判断合并谱图的搜库匹配结果的P值,也即在该分布中比搜库匹配结果得分还低的得分占全部得分的比例。如果该P值高于显著性水平则称该结果可通过相似谱图模型检验。
(二)“随机谱图模型法”包括以下步骤:a.将参考数据库中全部谱图的所有谱峰混合在一起,随机选取特定数量的谱峰,构成模拟随机谱图,该模拟随机谱图的峰数量与待分析的实验谱图的峰数量保持一致;b.计算大量模拟随机谱图与实验谱图间的相似度及其分布,将错误检出率FDR值定义为在该分布中相似度得分高于实验谱图搜库匹配结果的相似度得分的模拟随机谱图占全部模拟随机谱图的比例,如果FDR值低于给定的显著性水平则称该实验谱图的搜库匹配结果可通过随机谱图模型检验。
利用相似谱图模型的P值和随机谱图模型的FDR值对谱图相似性匹配的结果进行假设验证,得出谱图分析结论。
进一步,所述步骤(1)中提取的重复性实验产生的谱图间的差异信息包括:一对共峰中谱峰对应横坐标的差异、一对共峰中谱峰对应纵坐标的差异和重复性实验谱图间的共峰比例的差异。
进一步,所述共峰为来自实验谱图A中的谱峰a的峰值的横坐标值包含在实验谱图B中的谱峰b的半峰宽横坐标范围内。
进一步,所述计算机模拟统计验证方法可应用于各种谱图相似度的计算方法,包括夹角余弦法、皮尔森和斯皮尔曼相关系数法、偏相关与部分相关系数法、相对欧式距离法、加权相对欧氏距离法中的一种或多种。
进一步,所述计算机模拟统计验证方法应用于含有二维数据量的谱图。
进一步,所述计算机模拟统计验证方法应用于质谱图、核磁共振谱图、光谱图中的一种或多种。
进一步,所述计算机模拟统计验证方法应用于各种样品,包括蛋白质、基因、化学成分、微生物中的一种或多种。
与现有技术相比,本发明具有以下优点:
本发明是一种综合评价样品谱图搜库匹配结果的假设验证方法,以P值和FDR值作为鉴定的阈值,提高了基于谱图相似度计算的搜库匹配结果的可靠性。
本发明中,通过P值和FDR值大小表征待评价样品搜库匹配结果的可靠性;P值越大,FDR值越小,表示搜库结果的可靠性越好;P值越小,FDR值越大,表示搜库结果可靠性得不到保证。应用时,可通过显著性试验确定P值和FDR值的显著性水平,凡待评价样品P值大于其相应的显著性水平,FDR值小于其相应的显著性水平的表示搜库结果可靠性得到保证。
为让本发明的上述和其它目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合附图,作详细说明如下。
附图说明
图1为相似谱图模型中计算机模拟谱图的生成方式以及P值的计算方式的示意图。
图2为随机谱图模型中计算机模拟谱图的生成方式以及FDR值的计算方式的示意图。
具体实施方式
以Basillus subtilis ATCC 6633细菌的5个重复实验谱图为例,我们根据上述公式利用R语言和C语言构建了细菌质谱图分析程序,上传五张实验谱图后算法程序会将之合并为一张合并谱图,将该合并谱图与数据库中的若干参考谱图进行对比,利用余弦夹角法计算谱图相似度,根据相似度得分的高低进行排序。
(1)利用“相似谱图模型法”计算P值。
关于调整系数kmz和kI的拟合:针对Bacillus subtilis ATCC 6633、Bacillussubtilis 168M、Escherichia coli XL1、Escherichia coli DH5 Alpha、Escherichiacoli wild type、Escherichia coli ATCC 35218、Erwinia carotovora carotovora 15nature strain、Vibrio parahaemolyticus VP-18、Vibrio parahaemolyticus VP-61、Vibrio parahaemolyticus VP-C2、Vibrio parahaemolyticus VP-C16、Vibrioparahaemolyticus VP-C35和Vibrio parahaemolyticus VP-C36共计13种细菌的重复性实验谱图进行分析,R(m/z)为每个组中包含的谱峰的质荷比的极差。对每一种细菌的重复性实验谱图的所有组的R(m/z)取平均得到选取不同的kmz和kI生成计算机模拟谱图,通过对实验谱图与实验谱图的合并谱图之间的相似度得分分布和共峰率分布以及计算机模拟谱图与计算机模拟谱图的合并谱图之间的相似度得分分布和共峰率分布做多次t检验,得到使得共峰率t检验通过次数最多且相似度得分分布t检验通过率大于或等于60%的kmz和kI,这里kI最终确定为0.5。对kmz与的乘积与进行线性拟合,得到关系式
因此,根据Basillus subtilis ATCC 6633细菌的5个重复实验谱图,可以计算其进而根据线性拟合方程得到其kmz。
利用“相似谱图模型”产生1000张实验谱图的计算机模拟谱图,得到1000张计算机模拟谱图与Basillus subtilis ATCC 6633细菌的5个重复实验谱图的合并谱图的相似度得分分布。判断合并谱图的搜库匹配结果的P值,也即在该分布中比搜库匹配结果的得分还低的得分个数占全部分值个数的比例。
(2)利用“随机谱图模型法”计算FDR值。
将参考数据库中全部谱图的所有谱峰混合在一起,随机选取特定数量的谱峰,构成模拟随机谱图,该峰数量与Basillus subtilis ATCC 6633细菌的5个重复实验谱图的合并谱图的峰数量保持一致。重复如上步骤1000次得到1000张随机谱图。计算模拟随机谱图与Basillus subtilis ATCC 6633细菌的5个重复实验谱图的合并谱图间的相似度及其分布,判断合并谱图的搜库匹配结果的FDR值,也即在该分布中比搜库匹配结果的得分还高的得分个数占全部分值个数的比 例。具体结果如表1所示,按照相似性得分从高到低列出数据库中与实验谱图相似性最高的五张参考谱图对应的菌株名称、相应的相似性得分、P值和FDR值。
表1:Basillus subtilis ATCC 6633细菌的5个重复实验谱图基于余弦夹角法的数据库检索结果及假设验证结果。
虽然本发明已由较佳实施例揭露如上,然而并非用以限定本发明,任何熟知此技艺者,在不脱离本发明的精神和范围内,可作些许的更动与润饰,因此本发明的保护范围当视权利要求书所要求保护的范围为准。
Claims (9)
1.一种基于谱图相似度计算的搜库匹配结果的计算机模拟统计验证方法,其特征在于,所述方法如下:利用“相似谱图模型法”计算P值;利用“随机谱图模型法”计算错误检出率FDR值。
2.根据权利要求1所述的基于谱图相似度计算的搜库匹配结果的计算机模拟统计验证方法,其特征在于,其中“相似谱图模型法”包括以下步骤:(1)提取数次重复性实验产生的谱图间的差异信息;(2)根据上述信息及已有实验谱图利用计算机模拟的方式生成模拟重复性实验谱图;(3)计算大量模拟重复性实验谱图与真实实验谱图间的相似度及其分布,将P值定义为在该分布中相似度得分低于实验谱图搜库匹配结果的相似度得分的模拟重复性实验谱图占全部模拟重复性实验谱图的比例,如果P值高于给定的显著性水平则称该实验谱图的搜库匹配结果可通过相似谱图模型检验。
3.根据权利要求1所述的基于谱图相似度计算的搜库匹配结果的计算机模拟统计验证方法,其特征在于,“随机谱图模型法”包括以下步骤:a.将参考数据库中全部谱图的所有谱峰混合在一起,随机选取特定数量的谱峰,构成模拟随机谱图;b.计算大量模拟随机谱图与真实实验谱图间的相似度及其分布,将错误检出率值定义为在该分布中相似度得分高于实验谱图搜库匹配结果的相似度得分的模拟随机谱图占全部模拟随机谱图的比例,如果FDR值低于给定的显著性水平则称该实验谱图的搜库匹配结果可通过随机谱图模型检验。
4.根据权利要求2所述的基于谱图相似度计算的搜库匹配结果的计算机模拟统计验证方法,其特征在于,所述(1)中提取的重复性实验产生的谱图间的差异信息包括:谱峰对应横坐标的差异、谱峰对应纵坐标的差异和重复性实验谱图间的共峰比例的差异。
5.根据权利要求4所述的基于谱图相似度计算的搜库匹配结果的计算机模拟统计验证方法,其特征在于,所述共峰为来自实验谱图A中的谱峰a的峰值的横坐标值包含在实验谱图B中的谱峰b的半峰宽横坐标范围内。
6.根据权利要求1所述的基于谱图相似度计算的搜库匹配结果的计算机模拟统计验证方法,其特征在于,所述计算机模拟统计验证方法可应用于各种谱图相似度的计算方法,包括夹角余弦法、皮尔森和斯皮尔曼相关系数法、偏相关与部分相关系数法、相对欧式距离法、加权相对欧氏距离法中的一种或多种。
7.根据权利要求1所述的基于谱图相似度计算的搜库匹配结果的计算机模拟统计验证方法,其特征在于,所述计算机模拟统计验证方法应用于含有二维数据量的谱图。
8.根据权利要求7所述的基于谱图相似度计算的搜库匹配结果的计算机模拟统计验证方法,其特征在于,所述计算机模拟统计验证方法应用于质谱图、核磁共振谱图、光谱图中的一种或多种。
9.根据权利要求1所述的基于谱图相似度计算的搜库匹配结果的计算机模拟统计验证方法,其特征在于,所述计算机模拟统计验证方法应用于各种样品,包括蛋白质、基因、化学成分、微生物中的一种或多种。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610905439.8A CN106570351B (zh) | 2016-10-17 | 2016-10-17 | 基于谱图相似度计算的搜库匹配结果的计算机模拟统计验证方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610905439.8A CN106570351B (zh) | 2016-10-17 | 2016-10-17 | 基于谱图相似度计算的搜库匹配结果的计算机模拟统计验证方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106570351A true CN106570351A (zh) | 2017-04-19 |
CN106570351B CN106570351B (zh) | 2019-02-05 |
Family
ID=58533085
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610905439.8A Active CN106570351B (zh) | 2016-10-17 | 2016-10-17 | 基于谱图相似度计算的搜库匹配结果的计算机模拟统计验证方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106570351B (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107271533A (zh) * | 2017-06-29 | 2017-10-20 | 浙江和谱生物科技有限公司 | 基于maldi‑tof质谱数据鉴定细菌混合样品的算法 |
CN107798342A (zh) * | 2017-10-16 | 2018-03-13 | 浙江和谱生物科技有限公司 | 基于自助抽样法的谱图搜库结果统计验证方法 |
CN109696506A (zh) * | 2017-10-23 | 2019-04-30 | 中国石油化工股份有限公司 | 一种用于对样品进行分子识别的方法 |
CN109859799A (zh) * | 2019-01-29 | 2019-06-07 | 安图实验仪器(郑州)有限公司 | 基于微生物质谱仪的加权微生物聚类分析法 |
CN111401191A (zh) * | 2020-03-10 | 2020-07-10 | 浙江中科锐晨智能科技有限公司 | 一种判断能谱图数据相似性的方法 |
US20200265925A1 (en) * | 2017-10-18 | 2020-08-20 | The Regents Of The University Of California | Source identification for unknown molecules using mass spectral matching |
CN116010663A (zh) * | 2023-03-21 | 2023-04-25 | 上海美吉生物医药科技有限公司 | 一种tmt项目图谱解析和数据分析的方法及系统 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102879486A (zh) * | 2012-09-05 | 2013-01-16 | 山东大学 | 一种筛选中药药效相关成分的方法及模型建立方法 |
-
2016
- 2016-10-17 CN CN201610905439.8A patent/CN106570351B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102879486A (zh) * | 2012-09-05 | 2013-01-16 | 山东大学 | 一种筛选中药药效相关成分的方法及模型建立方法 |
Non-Patent Citations (2)
Title |
---|
张扬.: "基于生物质谱的糖蛋白质组学研究", 《中国博士学位论文全文数据库 基础科学辑》 * |
王超.: "指纹图谱质量评价系统", 《中国优秀博硕士学位论文全文数据库(硕士)信息科技辑》 * |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107271533A (zh) * | 2017-06-29 | 2017-10-20 | 浙江和谱生物科技有限公司 | 基于maldi‑tof质谱数据鉴定细菌混合样品的算法 |
CN107271533B (zh) * | 2017-06-29 | 2019-09-13 | 浙江和谱生物科技有限公司 | 基于maldi-tof质谱数据鉴定细菌混合样品的算法 |
CN107798342A (zh) * | 2017-10-16 | 2018-03-13 | 浙江和谱生物科技有限公司 | 基于自助抽样法的谱图搜库结果统计验证方法 |
US20200265925A1 (en) * | 2017-10-18 | 2020-08-20 | The Regents Of The University Of California | Source identification for unknown molecules using mass spectral matching |
CN109696506A (zh) * | 2017-10-23 | 2019-04-30 | 中国石油化工股份有限公司 | 一种用于对样品进行分子识别的方法 |
CN109696506B (zh) * | 2017-10-23 | 2021-04-06 | 中国石油化工股份有限公司 | 一种用于对样品进行分子识别的方法 |
CN109859799A (zh) * | 2019-01-29 | 2019-06-07 | 安图实验仪器(郑州)有限公司 | 基于微生物质谱仪的加权微生物聚类分析法 |
CN109859799B (zh) * | 2019-01-29 | 2022-04-12 | 安图实验仪器(郑州)有限公司 | 基于微生物质谱仪的加权微生物聚类分析法 |
CN111401191A (zh) * | 2020-03-10 | 2020-07-10 | 浙江中科锐晨智能科技有限公司 | 一种判断能谱图数据相似性的方法 |
CN111401191B (zh) * | 2020-03-10 | 2022-06-07 | 浙江中科锐晨智能科技有限公司 | 一种判断能谱图数据相似性的方法 |
CN116010663A (zh) * | 2023-03-21 | 2023-04-25 | 上海美吉生物医药科技有限公司 | 一种tmt项目图谱解析和数据分析的方法及系统 |
CN116010663B (zh) * | 2023-03-21 | 2023-06-30 | 上海美吉生物医药科技有限公司 | 一种tmt项目图谱解析和数据分析的方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN106570351B (zh) | 2019-02-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106570351B (zh) | 基于谱图相似度计算的搜库匹配结果的计算机模拟统计验证方法 | |
Karpievitch et al. | Normalization and missing value imputation for label-free LC-MS analysis | |
Gonzalez-Dias et al. | Methods for predicting vaccine immunogenicity and reactogenicity | |
EP3044582A1 (en) | Method and electronic nose for comparing odors | |
Keich et al. | Averaging strategy to reduce variability in target-decoy estimates of false discovery rate | |
Weis et al. | Topological and kernel-based microbial phenotype prediction from MALDI-TOF mass spectra | |
CN111748632A (zh) | 一种特征lincRNA表达谱组合及肝癌早期预测方法 | |
Kilinc et al. | Improved global protein homolog detection with major gains in function identification | |
Avino et al. | Tree shape‐based approaches for the comparative study of cophylogeny | |
CN106650779B (zh) | 谱图相似度的计算方法 | |
Feng et al. | Probability-based pattern recognition and statistical framework for randomization: modeling tandem mass spectrum/peptide sequence false match frequencies | |
Liu et al. | A semiparametric model for between‐subject attributes: Applications to beta‐diversity of microbiome data | |
US20160350475A1 (en) | Method for Developing and Applying Databases for Idenfication of Microorganisms by MALDI-TOF Mass Spectrometry | |
Hediyeh-zadeh et al. | MSImpute: Imputation of label-free mass spectrometry peptides by low-rank approximation | |
Nguyen et al. | Interpretable time series classification using all-subsequence learning and symbolic representations in time and frequency domains | |
Dotan et al. | Effect of tokenization on transformers for biological sequences | |
Park et al. | Machine Learning-Based Species Classification Methods Using DART-TOF-MS Data for Five Coniferous Wood Species | |
CN115620818A (zh) | 一种基于自然语言处理的蛋白质质谱肽段验证方法 | |
Ferenc | Clustering methods for ordinal variables | |
Roberts et al. | Using deep Siamese neural networks to speed up natural products research | |
Lee et al. | Svm classification model of similar bacteria species using negative marker: Based on matrix-assisted laser desorption/ionization time-of-flight mass spectrometry | |
Feng et al. | Effective discrimination of Yersinia pestis and Yersinia pseudotuberculosis by MALDI-TOF MS using multivariate analysis | |
CN107798342A (zh) | 基于自助抽样法的谱图搜库结果统计验证方法 | |
Bocker et al. | Combinatorial approaches for mass spectra recalibration | |
Du et al. | An Empirical Bayes Method for Chi-Squared Data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20200706 Address after: Building 2, No. 189 Guangming Road, Zhuangshi street, Zhenhai District, Ningbo City, Zhejiang Province, 315000 Patentee after: Chuanming (Ningbo) Chemical Technology Co., Ltd Address before: Hangzhou City, Zhejiang province Binjiang District 310000 shore road 688 Building 5 room 1512 Patentee before: ZHEJIANG BIOHARMONIOUS TECHNOLOGY Co.,Ltd. |