CN110198659A - 用于数据库比较的呼吸样本数据的对齐 - Google Patents

用于数据库比较的呼吸样本数据的对齐 Download PDF

Info

Publication number
CN110198659A
CN110198659A CN201880008072.7A CN201880008072A CN110198659A CN 110198659 A CN110198659 A CN 110198659A CN 201880008072 A CN201880008072 A CN 201880008072A CN 110198659 A CN110198659 A CN 110198659A
Authority
CN
China
Prior art keywords
data
gas sample
molecule
retention time
multiple gas
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201880008072.7A
Other languages
English (en)
Other versions
CN110198659B (zh
Inventor
J·韦达
T·J·温克
H·H·克诺贝尔
T·M·E·尼杰森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Publication of CN110198659A publication Critical patent/CN110198659A/zh
Application granted granted Critical
Publication of CN110198659B publication Critical patent/CN110198659B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/483Physical analysis of biological material
    • G01N33/497Physical analysis of biological material of gaseous biological material, e.g. breath
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/08Detecting, measuring or recording devices for evaluating the respiratory organs
    • A61B5/082Evaluation by breath analysis, e.g. determination of the chemical composition of exhaled breath
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/0002Remote monitoring of patients using telemetry, e.g. transmission of vital signals via a communication network
    • A61B5/0004Remote monitoring of patients using telemetry, e.g. transmission of vital signals via a communication network characterised by the type of physiological signal transmitted
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7271Specific aspects of physiological measurement analysis
    • A61B5/7285Specific aspects of physiological measurement analysis for synchronising or triggering a physiological measurement or image acquisition with a physiological event or waveform, e.g. an ECG signal
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/62Detectors specially adapted therefor
    • G01N30/72Mass spectrometers
    • G01N30/7206Mass spectrometers interfaced to gas chromatograph
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/86Signal analysis
    • G01N30/8624Detection of slopes or peaks; baseline correction
    • G01N30/8631Peaks
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/86Signal analysis
    • G01N30/8675Evaluation, i.e. decoding of the signal into analytical information
    • G01N30/8686Fingerprinting, e.g. without prior knowledge of the sample components
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/483Physical analysis of biological material
    • G01N33/497Physical analysis of biological material of gaseous biological material, e.g. breath
    • G01N33/4975Physical analysis of biological material of gaseous biological material, e.g. breath other than oxygen, carbon dioxide or alcohol, e.g. organic vapours
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B10/00Other methods or instruments for diagnosis, e.g. instruments for taking a cell sample, for biopsy, for vaccination diagnosis; Sex determination; Ovulation-period determination; Throat striking implements
    • A61B2010/0083Other methods or instruments for diagnosis, e.g. instruments for taking a cell sample, for biopsy, for vaccination diagnosis; Sex determination; Ovulation-period determination; Throat striking implements for taking gas samples
    • A61B2010/0087Breath samples
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N2030/022Column chromatography characterised by the kind of separation mechanism
    • G01N2030/025Gas chromatography

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • General Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Analytical Chemistry (AREA)
  • Biophysics (AREA)
  • Medical Informatics (AREA)
  • Veterinary Medicine (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Physiology (AREA)
  • Surgery (AREA)
  • Animal Behavior & Ethology (AREA)
  • Public Health (AREA)
  • Urology & Nephrology (AREA)
  • Hematology (AREA)
  • Food Science & Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Library & Information Science (AREA)
  • Pulmonology (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Psychiatry (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)

Abstract

一种用于将针对多个气体样本(例如呼吸样本)的数据与挥发性有机化合物同步的方法(RT_A)。所述数据包括指示分子洗脱时间的色谱数据,并且优选地还包括质谱数据。所述方法包括识别或者选择(I_MM)标记分子,例如5‑20个分子,优选地针对所述多个气体样本中的每个的容易可识别分子,并且根据聚类准则将所述多个气体样本聚类(CL)为多个聚类,所述聚类准则例如包括额外的信息,诸如获得所述数据的时间和/或使用的分析装备。接下来,通过使用所述标记分子作为锚定点在针对聚类之间的气体样本的数据上执行保留时间偏差的第一校正(P_C1),从而提供针对所述气体样本的数据之间的保留时间偏差(d)的粗略减小。最后,针对气体样本的数据上的保留时间偏差的第二校正(P_C2),从而进一步减小针对气体样本的数据之间的保留时间偏差(d),例如通过使用标准软件包。所述方法可以减小显著的保留时间偏差,从而允许例如在不同的时间段处由不同的装备获得的呼吸样本指纹在用于诸如HSDP的数字平台(DP)上的一个数据库中被比较。

Description

用于数据库比较的呼吸样本数据的对齐
技术领域
本发明总体上涉及气体的分析。具体地,本发明涉及适于气体(例如,从人呼出的呼吸或者基于来自皮肤、尿液或者粪便的样本的气体)的医学分析的方法和设备。更具体地,本发明涉及用于基于光谱学数据(例如来自GC-MS或微GC系统)进行保留时间同步或者对齐呼吸指纹以允许跨时间和跨不同的装备的数据库比较的方法和系统。
背景技术
健康和疾病中的呼出气分析是日益增长的临床兴趣的领域。使用呼吸作为生物样本是有吸引力的,因为呼吸收集是便宜、易于执行和非侵入性的。挥发性有机化合物(VOC)从皮肤、尿液、粪便排出,并且最为显著地经由呼出气排出。除了肺根源之外,VOC还可以源自于血液,从而反映贯穿身体的生理、病理或病原体相关生化过程。这样一来,呼出气分析可以允许对身体内部的任何地方的疾病过程进行代谢指纹分析。
若干研究已经示出这些技术在清楚定义的具有各种疾病的患者的子集中的诊断潜力。当疾病存在时呼出气中的挥发物变化,并且特定标记可以被链接到特定疾病。呼出气中存在的其他挥发性化合物的复合基质中的非常低的量的这些特定标记的检测甚至对现有技术分析技术而言也是一个挑战。
VOC的黄金标准分析基于化学分析技术,诸如气相色谱质谱测定(GC-MS)。该技术提供关于个体分子化合物的知识并且从而扩展我们对疾病病理学的理解。小型化GC系统或其他分离方法还可以被用于将挥发物分离。若干研究已经示出具有各种疾病的患者的清楚定义的子集中的这些技术的诊断潜力。
然而,将这些技术实施到临床设置中当前受设备间和设备内差异限制。尽管诸如由GC系统中的柱提供的分离技术对于具体地测量感兴趣化合物并且因此产生呼吸指纹是重要的,但是柱的磨损和老化引起使随时间的比较复杂的保留时间移位。为了同步GC-MS数据,使用不同的方案。一个方案是预处理软件的使用,其中,例如XCMS包中的保留时间对齐对于相对小的保留时间移位非常好。该软件包当前是代谢组学文献中的最多引用的预处理工具。另一方案是使用来自所测量的色谱图的分子作为锚定点来将所有色谱图彼此对齐。使用的分子可以要么已经存在于原始测量的样本中,要么稍后添加以允许标准化、识别和对齐目的。
为了跨健康护理连续区的呼吸分析的使用,能够准确地比较在不同的时刻处和在不同的平台或机器上测量的样本是重要的。实际上,为了将呼吸分析结果集成在数据库系统中,例如基于云的存储和分析,诸如健康套件数字平台(HSDP),测量结果的标准化将提供大的优点。这样的系统仅允许当数据以统一的方式添加时该大数据的分析。
发明内容
根据上文,本发明的发明人已经意识到,能够准确地随时间比较呼吸指纹并且允许将这样的数据集成到数字平台中是一个问题,并且具体地保留时间偏差的准确校正是针对这样的集成的重要参数。
具体地,提供一种解决现有技术的上文所提到的问题或其他问题的设备和方法可以看作本发明的目的。
在第一方面中,本发明提供一种用于将针对多个气体样本的数据与挥发性有机化合物(诸如被获得为从对象呼出的呼吸的气体样本)同步的计算机实施的方法,所述方法包括:
-针对所述多个气体样本中的每个接收指示分子洗脱时间的色谱数据,
-识别针对所述多个气体样本中的每个的色谱数据中的至少一个标记分子(优选地呈现不同的峰),
-根据聚类准则将所述多个气体样本聚类为多个聚类,
-通过使用所述标记分子作为锚定点来执行针对聚类之间的所述多个气体样本的所述数据上的保留时间偏差的第一校正,从而减小针对所述多个气体样本的所述数据之间的保留时间偏差,诸如在所述标记分子的保留时间上使用多项式拟合函数,并且
-在所述第一校正之后,执行针对所述多个气体样本的所述数据上的保留时间偏差的第二校正,从而进一步减小针对所述多个气体样本的所述数据之间的保留时间偏差。
这样的方法是有利的,因为发明人已经认识到,时间同步或者时间对齐在长时间段内从气体样本获得的均匀数据是可能的,从而允许将例如呼吸指纹数据集成在数字平台上。由此,在不同的时间段处在不同的装置处获得和分析的呼吸样本可以集成在所述数字平台上以形成有价值的临床信息数据库。
尤其是,所述方法适于,基于通过气体色谱分析-质谱测定(GC-MS)或者在所述气体样本被转换为液体的情况下的液体色谱分析-质谱测定(LC-MS)分析过程对所述气体样本的分析对数据进行同步或者时间对齐。针对气体样本的额外的质谱数据还可以有利地应用在方法中以改进分子的识别。尤其是,所述方法可以被布置为在由这样的GC-MS或LC-MS设备提供的数据或者来自这样的设备的数据的预处理版本上操作。用于获得GC-MS或者LC-MS数据以及关于这些数据自身的细节的设备和方法脱离本发明的范围,但是由技术人员已知。
所述方法是有利的,因为其在不需要将分子添加到所述气体样本以之后允许对齐的情况下工作,其可能干扰和/或混淆原始气体样本。
在第一时间校正中,校正超过利用现有处理工具箱可能的事物的较大保留时间偏差是可能的。可以通过应用现有处理工具箱执行进一步减小保留时间偏差的第二时间校正步骤。
方法可以被实施为独立软件或者被集成在现有数字平台软件包中。
在以下中,将描述第一方面的优选的实施例或者特征。
识别一个或多个标记分子的步骤可以包括检测指示分子洗脱时间的色谱数据中的强度峰。(一个或多个)标记分子优选地是所谓的容易可识别分子(EIM)。例如,在这样的质谱数据也可用于所述多个气体样本的情况下,(一个或多个)标记分子的识别可以由质谱以及与数据库或者查找表数据的比较支持。识别至少一个标记分子的步骤优选地包括识别多个标记分子。尤其是,诸如5-20标记分子(例如8-12标记分子)可以被选择用于以下步骤。此外,优选的是,识别(一个或多个)标记分子的步骤包括选择具有相差超过200秒(例如超过300秒)的保留时间的至少两个标记分子,然而这被理解为取决于实际色谱数据和被用于提供数据的装备。最优选地,选择多个标记分子,使得标记分子表示具有至少覆盖大多数感兴趣的保留时间范围的保留时间的分子,从而获得感兴趣保留时间范围上的最好时间同步。例如,可以优选的是,标记分子被选择为覆盖感兴趣保留时间的均匀扩散。所述多个标记分子优选地包括选自以下分子的至少一个分子(诸如至少两个分子):丙酮、异戊二烯、乙酸乙酯、苯、戊醛、甲基环己烷、甲苯、辛烷、苯乙烯、α-蒎烯、丙基苯、苯酚、α-甲基苯乙烯和d-柠檬烯。所述多个标记分子可以尤其包括以下分子中的至少一种:苯和甲苯,诸如苯和甲苯两者。这些分子作为标记分子是优选的,因为其常常存在于呼出气中,并且其由于大量存在或者独特的质谱图而易于识别。应理解,在其他类型的气体分子要被分析的情况下,其他分子可以被选择为标记分子。识别(一个或多个)标记分子的步骤可以包括识别仅存在于所述多个气体样本的子集中的至少一个标记分子,然而选择存在于所有所述多个气体样本中的分子也可以是优选的。
聚类的步骤优选地根据涉及针对所述多个气体样本中的(一个或多个)标记分子的保留时间的聚类准则(诸如用于使聚类内的(一个或多个)标记分子的保留时间差异最小化的聚类准则)执行。聚类的步骤优选地根据涉及关于所述多个气体样本的信息的聚类准则执行,诸如已经获得关于用于获得所述多个气体样本中的每个的时间和日期的信息,从而允许具有利用相同设备或者在相同时间段处获得的气体样本的聚类被聚类在一起。
执行第一校正的步骤可以包括在(一个或多个)标记分子的保留时间上计算多项式拟合函数,诸如线性或高阶多项式拟合函数。执行所述第一校正的步骤优选地包括迭代地识别(一个或多个)标记分子并且随后地执行保留时间校正,直到满足预定停止准则。
所述方法优选地包括针对所述多个气体样本中的每个接收质谱数据,其中,所述方法包括分析所述质谱数据以识别所述气体样本中的分子。优选地,所述方法包括接收针对所述多个气体样本中的每个的GC-MS数据。尤其是,所述方法可以包括将所述质谱数据与数据库质谱比较以识别所述气体样本中的分子。
保留时间偏差的第二校正优选地通过应用已知处理工具箱中的一个或多个来执行,例如从工具箱XCMS已知的时间对齐算法,其在本领域中已知并且还在Smith,C.A.等人的XCMS:Processing mass spectrometry data for metabolite profiling usingNonlinear peak alignment,matching,and identification.(Analytical Chemistry,2006.78(3):第779-787页)中被描述。
在第二方面中,本发明提供一种包括计算机可执行程序代码的计算机程序产品,所述计算机可执行程序代码当在处理器上运行时,使所述处理器执行根据第一方面的方法。尤其是,所述程序代码可以存在于有形存储介质上和/或以可下载的形式可用。
在第三方面中,本发明提供一种呼吸分析系统,包括:设备,其被布置为针对被获得为从对象呼出的呼吸的多个气体样本中的每个接收指示分子洗脱时间的色谱数据;以及处理器,其被编程为根据第一方面执行所述方法,并且随后地根据分析算法分析针对所述多个气体样本的所述色谱数据,并且相应地提供输出。
尤其是,所述系统可以包括计算机或者服务器。
尤其是,所述呼吸分析系统可以包括气体进口,其包括被布置在其外壳的外部部分上的管嘴,从而允许对象、人或动物直接地呼吸到管嘴中并且因此提供要分析的气体样本。其他管配件可以被用于连接以从所述对象连接到的机械通气机(例如在重症监护室中)接收呼吸气。还另外,所述设备的所述气体进口可以被布置用于安装具有要分析的气体样本的气袋。
所述系统还可以包括:色谱分析器,其被布置为接收被获得为从所述对象呼出的呼吸的多个气体样本,并且因此针对所述多个气体样本中的每个提供指示分子洗脱时间的色谱数据。尤其是,所述系统可以包括GC-MS分析器,其被布置为响应于所述多个气体样本,除所述色谱数据之外,提供相应的质谱分析数据。
通常,应意识到,本发明的各个方面可以在本发明的范围内以任何可能的方式组合和耦合。参考下文描述的实施例,本发明的这些和其他方面、特征和/或优点将显而易见并且得到阐述。
附图说明
将参考附图仅通过范例来描述本发明的实施例,其中,
图1图示了呼吸分析系统实施例的框图;
图2图示了保留时间对齐方法实施例的步骤;
图3图示了用于甲苯的质谱的范例;
图4图示了具有作为针对来自在不同的时段处获得的不同的批次的气体样本中检测到的选定的分子的保留时间的函数的范例保留时间移位的图形;
图5图示了具有作为针对与图4中相同的分子和批次的保留时间的函数但是根据本发明的第一时间校正所校正的保留时间移位的图形;
图6图示了具有作为针对与图5中相同的分子和批次的保留时间的函数但是现在还根据本发明的第二时间校正所校正的保留时间移位的图形;
图7a-7c图示了示出作为针对气体样本的不同的批次的保留时间的函数的甲苯的签名碎片的图形。图7a示出了在时间对齐之前,图7b示出了在第一时间校正之后,并且图7c示出了在第二时间校正之后的最终结果。
具体实施方式
图1图示了具有包括计算机或者服务器的数字平台DP的呼吸分析系统实施例的框图,例如基于云的呼吸套件数字平台HSDP,其并入用于临床信息CL_I的呼吸样本B_S分析数据,例如以帮助基于气体样本B_S中的挥发性有机化合物来诊断疾病。DP涉及实施根据本发明的第一方面的用于保留时间对齐的同步方法RT_A的处理软件。DP系统可以组合并且比较随时间收集并且在不同的机器上测量的呼吸指纹。方法可以覆盖使用MS或者选择性检测(诸如LC-MS数据)的其他代谢组学方法。
基于被获得为从对象收集的呼吸的样本的气体样本B_S,在优选地包括GC柱设备GCC的分析器中分析气体样本B_S。GC柱设备GCC可以是GC-MS分析器,如本领域中已知的,并且除色谱数据之外,输出数据GCD优选地包括质谱数据。备选地,分析器可以是LC-MS分析器,还如本领域中已知的。
来自分析器GCC的输出是色谱数据GCD,所述色谱数据GCD被应用到DP,所述DP被布置为针对多个气体样本B_S中的每个接收指示分子洗脱时间的色谱数据GCD,并且DP中的处理器被编程为执行根据本发明的保留时间同步或者对齐方法RT_A,并且随后根据另外的分析算法F_A分析针对多个气体样本B_S的色谱数据,并且相应地提供临床信息输出CL_I。这样的另外的分析F_A在本领域中已知并且将不进一步描述,因为其不是本发明的范围。然而,根据本发明的保留时间校正算法RT_A允许针对这样的另外的分析算法F_A的较高质量的数据并且从而允许具有用于疾病的检测的较高质量的临床信息CL_I以及例如医学感兴趣的其他信息。
图2图示了保留时间同步方法实施例的步骤,即,要被实施为图1中所示的系统中的DP中的软件中的保留时间对齐算法RT_A的方法的实施例。方法包括针对多个气体样本中的每个接收R_GCD指示分子洗脱时间的色谱数据,优选地针对每个气体样本的输入数据还包括质谱数据。如所提到的,例如,数据可以采取如从现有GC-MS分析设装备出的已知的形式。
作为处理算法中的第一步,方法包括识别I_MM针对多个气体样本中的每个的色谱数据中的多个标记分子。优选地,标记分子被识别为合称的容易可识别分子(EIM)。在GC-MS数据中检测到峰之后应用该步骤,使用例如匹配的滤波和峰识别,例如,可以在已知XCMS软件包中找到的算法。然后,通常存在于大多数样本中并且具有清楚地可识别质谱的分子被选择为标记分子。这些选定的标记分子然后用作标记分子或者锚定点。优选地,选择呈现具有其质谱中的不同的峰的不同的质谱的标记分子。包含碳环(芳烃)的分子通常具有这样的谱,而线型烃不具有这样的谱。范例是苯(低丰度)和甲苯(而不是通过碎片m/z=91,92由于苯环丰富存在并且清楚地可识别的)。此外,保留时间窗口的每个部分需要由EIM表示,使得可以校正整个时间窗口的每个部分中的时间移位。对于好的结果,5-20(诸如大约10)的这样的EIM需要基于可用气体样本中的数据并且进一步基于根据操作者的经验的来自操作者的输入来选择。标记分子优选地被识别如下。每个EIM预期在某个时间窗口(针对该分子的特性)中洗脱。例如,甲苯通常洗脱大约10分钟。对于每个标记分子,根据已知数据库已知预期的质谱。备选地,还可以使用包含来自已知化合物或者标准的质谱的用户库,或者其他大型数据库。图3示出了用于甲苯的质谱作为范例。在与标记分子相关联的时间窗口内,所有质谱与标记分子的已知质谱进行比较。为了计算质谱之间的相似性,谱被表示为向量。因子之间的角的余弦可以使用点积函数计算,并且被用作相似性量度。这样的算法提供质谱之间的适合的相似性估计。
在下表中给出要使用在对齐流程中的EIM的优选的候选,尤其是在气体样本是由人类呼出的呼吸的情况下。使用至少苯和甲苯能够是优选的,但是还包括来自具有较高保留时间的表的一个或多个能够是优选的。
分子 分子式 分子质量 签名质量碎片
丙酮 C3H6O 58 58
异戊二烯 C5H5 68 67
乙酸乙酯 C4H8O2 88 88
C6H6 78 78
戊醛 C5H10O 86 58
甲基环己烷 C7H14 98 70
甲苯 C7H8 92 92
辛烷 C8H18 114 114
苯乙烯 C8H8 104 104
α-蒎稀 C10H16 136 136
丙基苯 C9H12 120 120
苯酚 C6H6O 94 94
α-甲基苯乙烯 C9H10 118 118
d-柠檬烯 C10H16 136 121
然后,方法包括根据聚类准则将多个气体样本聚类CL为多个聚类。优选地,根据EIM的保留时间执行聚类。额外地或者备选地,关于样本的其他信息也可以被用于聚类,诸如样本是否在相同的分析器机器上在时间方面接近地测量。例如,可以分批测量气体样本,结果是每个批次内的样本之间的很少保留时间偏差,以及不同的批次中的样本之间的较大偏差。
图4示出了具有指示作为针对来自上表的分子的保留时间Rt的函数的保留时间移位d中的初始扩展的范例数据的图形。实线指示通过数据点的二次拟合。范例基于在不同的时间段处的不同的批次中所获得的气体样本。一个批次(标记20120314的一个)被当作参考,因为其包含许多样本并且在由批次覆盖的总时间中中途被测量。保留时间移位d被看到是相当大的,其在从低保留时间Rt处的20秒到大保留时间Rt处的60秒范围内。还注意,四个最高曲线与所有其他曲线之间的保留时间移位d中的大的差异。测量上曲线直到特定日期,其中,分析GC柱由新一个替换,从而引起测量结果的剩余部分中的完全不同的保留时间Rt图案。
下一步是通过使用标记分子作为锚定点在针对聚类之间的多个气体样本的数据上执行P_C1保留时间偏差的第一校正,从而减小针对多个气体样本的数据之间的保留时间偏差d。这可以通过使用线性或者高阶多项式函数拟合标记分子(EIM)来执行。基于拟合,在整个保留时间范围上执行第一原始保留时间收集。可以迭代地执行标记分子的识别和后续的保留时间校正,直到没有改进或者仅低于设置阈值的改进被获得。
图5针对来自图5的相同范例数据图示第一保留时间校正的结果。保留时间移位d低得多,针对完整保留时间范围Rt仅为大约10秒。实线指示通过数据点的线性拟合。
作为最后的步骤,在保留时间偏差的第一粗略校正P_C1之后,方法包括执行针对多个气体样本的数据上的保留时间偏差的第二时间校正P_C2,从而进一步减小针对多个气体样本的数据之间的保留时间偏差d。线性拟合或者其他拟合函数可以通过数据点每批次完成,并且用作用于执行第二保留时间校正P_C2的基础。第二保留时间校正P_C2可以通过从XCMS工具箱或其他标准软件包已知的时间对齐算法或者类似算法执行。具体地,可以优选的是,第二保留时间校正P_C2包括跨样本的第一匹配峰并且将其一起分组,然后识别“行为良好的”组。这些峰组包含不使峰被分配的非常少的样本和使超过一个峰被分配的非常少的样本。由于这些条件,因此行为良好的组具有包含适当匹配的峰的高概率。对齐通过计算那些峰组中的每个中的中值保留时间并且相应地校正所有保留时间来执行。由于行为良好的峰组通常均匀分布在保留时间范围的显著部分上,因此可以针对该范围计算详细校正。优选地迭代地应用所述方法。在每个迭代周期处,峰分组参数变窄,直到获得满意的对齐。
图6示出了在第二保留时间校正P_C2已经应用之后的范例数据的图形。如所见,现在进一步减小保留时间偏差d。
图7a-7c图示了对齐的最后质量可以通过查看标记分子的签名质量碎片的行为检查。对着用于对齐流程中的三个步骤的保留时间绘制甲苯的签名碎片92的强度:图7a:原始的、无已经执行的对齐;图6b:在第一保留时间校正之后,以及图7c:在第二保留时间校正之后。不同的曲线表示不同的气体样本。可以看到,碎片的峰在对齐流程期间对齐。在图7c中,峰全部对齐,从而示出流程已经成功工作。
以上所有步骤优选地导致离子碎片峰表。这样的表中的每行与样本对应。前几列包含样本和患者数据,诸如样本数据、年龄、性别和疾病。剩余列可以包含峰或离子碎片的丰度。通常,存在几千个那些列。该表用作用于进一步的统计分析的输入。
应理解,方法可以包括数据的进一步的分析或者结合数据的进一步的分析使用,例如根据气体样本同步方法基于分析来自对象的呼出气的结果诊断疾病。方法还可以包括发起特定治疗,例如肺结核的医学处置。此外,呼吸VOC分析可以被用于监测/分析肺癌、乳腺癌、其他类型的癌症或者呼吸感染。而且,呼吸分析可以适用于监测疾病(诸如哮喘和慢性阻塞性肺病(COPD)),例如响应于处置、恶化监测。此外,呼吸分析还可以被用于监测糖尿病中的血糖水平。还另外,应用范例可以是根据基于新生儿中的粪便的基于气体分析的VOC分析来监测败血症和坏死性小肠结肠炎(NEC)。
总之,本发明提供一种用于将用于多个气体样本(例如呼吸样本)的数据与挥发性有机化合物同步的方法(RT_A)。数据包括指示分子洗脱时间的色谱数据,并且优选地还包括质谱数据。方法包括识别或者选择I_MM标记分子,例如5-20个分子,优选地用于多个气体样本中的每个的容易可识别分子,并且根据聚类准则将多个气体样本聚类CL为多个聚类,例如包括额外的信息,诸如获得数据的时间和/或所使用的分析装备。接下来,通过使用标记分子作为锚定点在针对聚类之间的气体样本的数据上执行保留时间偏差的第一校正P_C1,从而提供针对气体样本的数据之间的保留时间偏差d的粗略减小。最后,针对气体样本的数据上的保留时间偏差的第二校正P_C2,从而进一步减小针对气体样本的数据之间的保留时间偏差d,例如通过使用标准软件包。方法可以减小显著的保留时间偏差从而允许例如在不同的时间段处由不同的装备获得的呼吸样本指纹在用于数字平台DP(诸如HSDP)上的一个数据库中比较。
尽管已经在附图和前面的描述中详细图示和描述了本发明,但是这样的图示和描述应被认为是说明性或示范性的而非限制性的;本发明不限于所公开的实施例。通过研究附图、公开内容和权利要求书,本领域技术人员在实践所要求保护的发明时可以理解和实现对所公开实施例的其他变型。在权利要求中,词语“包括”不排除其他元件或步骤,并且词语“一”或“一个”不排除多个。单个处理器或其他单元可以履行权利要求中记载的若干项目的功能。尽管在互不相同的从属权利要求中记载了特定措施,但是这并不指示不能有利地使用这些措施的组合。计算机程序可以存储/分布在合适的介质上,例如与其他硬件一起提供或作为其他硬件的部分提供的光学存储介质或固态介质,但是计算机程序也可以以其他形式分布,例如经由因特网或其他有线或无线电信系统分布。权利要求中的任何附图标记不应被解释为对范围的限制。

Claims (15)

1.一种用于将针对多个气体样本的数据与挥发性有机化合物进行同步的计算机实施的方法(RT_A),所述方法包括:
-针对所述多个气体样本中的每个气体样本接收(R_GCD)指示分子洗脱时间的色谱数据,
-识别(I_MM)针对所述多个气体样本中的每个气体样本的所述色谱数据中的至少一个标记分子,
-根据聚类准则将所述多个气体样本聚类(CL)为多个聚类,
-通过使用所述标记分子作为锚定点来执行(P_C1)针对聚类之间的所述多个气体样本的所述数据上的保留时间偏差的第一校正,从而减小针对所述多个气体样本的所述数据之间的保留时间偏差(d),并且
-在所述第一校正之后执行(P_C2)对针对所述多个气体样本的所述数据上的保留时间偏差的第二校正,从而进一步减小针对所述多个气体样本的所述数据之间的保留时间偏差(d)。
2.根据权利要求1所述的方法,其中,识别(I_MM)至少一个标记分子的步骤包括检测指示分子洗脱时间的所述色谱数据中的强度峰。
3.根据权利要求1所述的方法,其中,识别(I_MM)至少一个标记分子的步骤包括识别5-20个标记分子。
4.根据权利要求1所述的方法,其中,识别(I_MM)至少一个标记分子的步骤包括选择具有相差超过200秒的保留时间的至少两个标记分子。
5.根据权利要求1所述的方法,其中,所述至少一个标记分子包括从以下项选择的至少一个分子:丙酮、异戊二烯、乙酸乙酯、苯、戊醛、甲基环己烷、甲苯、辛烷、苯乙烯、α-蒎烯、丙基苯、苯酚、α-甲基苯乙烯和d-柠檬烯。
6.根据权利要求5所述的方法,其中,所述至少一个标记分子至少包括被选定为标记分子的苯和甲苯。
7.根据权利要求1所述的方法,其中,识别(I_MM)至少一个标记分子的步骤包括识别仅存在于所述多个气体样本的子集中的至少一个标记分子。
8.根据权利要求1所述的方法,其中,聚类(CL)的步骤是根据涉及针对所述多个气体样本中的所述标记分子的保留时间的聚类准则来执行的。
9.根据权利要求1所述的方法,其中,聚类(CL)的步骤是根据涉及关于所述多个气体样本的信息的聚类准则来执行的。
10.根据权利要求1所述的方法,其中,执行(P_C1)所述第一校正的步骤包括计算关于所述标记分子的保留时间的多项式拟合函数。
11.根据权利要求1所述的方法,其中,执行(P_C1)所述第一校正的步骤包括迭代地识别所述至少一个标记分子并且随后执行保留时间校正,直到满足预定停止准则。
12.根据权利要求1所述的方法,针对所述多个气体样本中的每个气体样本接收(R_GCD)质谱数据,所述方法包括分析所述质谱数据以识别所述气体样本中的分子。
13.一种包括计算机可执行程序代码的计算机程序产品,所述计算机可执行程序代码当在处理器上运行时使所述处理器执行根据权利要求1所述的方法。
14.一种呼吸分析系统,包括:
-设备(DP),其被布置为针对被获得为从对象呼出的呼吸的多个气体样本(B_S)中的每个气体样本接收指示分子洗脱时间的色谱数据(GCD),以及
-处理器,其被编程为:
-执行根据权利要求1所述的方法(RT_A),并且
-随后根据分析算法(F_A)来分析针对所述多个气体样本(B_S)的所述色谱数据,并且相应地提供输出(CL_I)。
15.根据权利要求13所述的系统,还包括色谱分析器(GC),所述色谱分析器被布置为接收被获得为从所述对象呼出的呼吸的所述多个气体样本(B_S),并且针对所述多个气体样本(B_S)中的每个气体样本相应地提供指示分子洗脱时间的色谱数据(GCD)。
CN201880008072.7A 2017-01-23 2018-01-17 用于数据库比较的呼吸样本数据的对齐 Active CN110198659B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201762449146P 2017-01-23 2017-01-23
US62/449,146 2017-01-23
PCT/EP2018/051039 WO2018134214A1 (en) 2017-01-23 2018-01-17 Alignment of breath sample data for database comparisons

Publications (2)

Publication Number Publication Date
CN110198659A true CN110198659A (zh) 2019-09-03
CN110198659B CN110198659B (zh) 2023-05-26

Family

ID=61024757

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201880008072.7A Active CN110198659B (zh) 2017-01-23 2018-01-17 用于数据库比较的呼吸样本数据的对齐

Country Status (4)

Country Link
US (1) US11519900B2 (zh)
EP (1) EP3570728A1 (zh)
CN (1) CN110198659B (zh)
WO (1) WO2018134214A1 (zh)

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040096982A1 (en) * 2002-11-19 2004-05-20 International Business Machines Corporation Methods and apparatus for analysis of mass spectra
WO2004090534A1 (en) * 2003-04-01 2004-10-21 The Charles Stark Draper Laboratory, Inc. Non-invasive breath analysis using field asymmetric ion mobility spectrometry
WO2006110848A2 (en) * 2005-04-11 2006-10-19 Cerno Bioscience Llc Chromatographic and mass spectral data analysis
US20060269945A1 (en) * 2002-11-22 2006-11-30 Caprion Pharmaceuticals Constellation mapping and uses thereof
US20070176088A1 (en) * 2006-02-02 2007-08-02 Xiangdong Don Li Feature selection in mass spectral data
CN101237910A (zh) * 2005-08-02 2008-08-06 Wm.雷格利Jr.公司 用于鉴别适合处理与吸用烟草制品相关的口腔臭味的组合物的筛选方法
WO2009076679A2 (en) * 2007-12-13 2009-06-18 Alnylam Pharmaceuticals Inc. Methods and compositions for prevention or treatment of rsv infection
WO2009147576A2 (en) * 2008-06-02 2009-12-10 Koninklijke Philips Electronics N. V. Breath collection device and method
CN104937395A (zh) * 2013-01-17 2015-09-23 皇家飞利浦有限公司 用于监测感兴趣的气体种类的水平的方法和装置
CN104939831A (zh) * 2010-09-09 2015-09-30 森撒部伊斯公司 从受试者的呼出气中收集样本的系统和方法及其用途
CN105738434A (zh) * 2016-02-01 2016-07-06 清华大学深圳研究生院 一种基于电子鼻检测呼吸气体的糖尿病诊断系统
CN205517135U (zh) * 2015-12-22 2016-08-31 北京林业大学 一种挥发性有机化合物收集装置

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1766394B1 (en) * 2004-05-20 2020-09-09 Waters Technologies Corporation System and method for grouping precursor and fragment ions using selected ion chromatograms
US8259299B2 (en) * 2007-06-21 2012-09-04 Rf Science & Technology Inc. Gas scanning and analysis
EP2322922B1 (en) * 2009-08-26 2015-02-25 Thermo Fisher Scientific (Bremen) GmbH Method of improving the resolution of compounds eluted from a chromatography device
GB201220651D0 (en) * 2012-11-16 2013-01-02 Oxford Medical Diagnostics Ltd Portable breath VOC analyser and method
WO2014180974A1 (en) * 2013-05-09 2014-11-13 Ramem, S.A. Voc-based narcolepsy diagnostic method
JP2016532881A (ja) * 2013-10-09 2016-10-20 スペクトロセンス リミテッド 改変されたガスクロマトグラフィーのデータ分析のための方法およびシステム
AU2015231494A1 (en) * 2014-03-17 2016-09-01 MLS ACQ, Inc. D/B/A MAX Analyical Technologies Process and system for rapid sample analysis
US20180153439A1 (en) * 2015-06-08 2018-06-07 The Board Of Trustees Of The Leland Stanford Junior University Time-Resolved Single-breath Analysis Using Spectroscopic Methods

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040096982A1 (en) * 2002-11-19 2004-05-20 International Business Machines Corporation Methods and apparatus for analysis of mass spectra
US20060269945A1 (en) * 2002-11-22 2006-11-30 Caprion Pharmaceuticals Constellation mapping and uses thereof
WO2004090534A1 (en) * 2003-04-01 2004-10-21 The Charles Stark Draper Laboratory, Inc. Non-invasive breath analysis using field asymmetric ion mobility spectrometry
WO2006110848A2 (en) * 2005-04-11 2006-10-19 Cerno Bioscience Llc Chromatographic and mass spectral data analysis
CN101237910A (zh) * 2005-08-02 2008-08-06 Wm.雷格利Jr.公司 用于鉴别适合处理与吸用烟草制品相关的口腔臭味的组合物的筛选方法
US20070176088A1 (en) * 2006-02-02 2007-08-02 Xiangdong Don Li Feature selection in mass spectral data
WO2009076679A2 (en) * 2007-12-13 2009-06-18 Alnylam Pharmaceuticals Inc. Methods and compositions for prevention or treatment of rsv infection
WO2009147576A2 (en) * 2008-06-02 2009-12-10 Koninklijke Philips Electronics N. V. Breath collection device and method
CN104939831A (zh) * 2010-09-09 2015-09-30 森撒部伊斯公司 从受试者的呼出气中收集样本的系统和方法及其用途
CN104937395A (zh) * 2013-01-17 2015-09-23 皇家飞利浦有限公司 用于监测感兴趣的气体种类的水平的方法和装置
CN205517135U (zh) * 2015-12-22 2016-08-31 北京林业大学 一种挥发性有机化合物收集装置
CN105738434A (zh) * 2016-02-01 2016-07-06 清华大学深圳研究生院 一种基于电子鼻检测呼吸气体的糖尿病诊断系统

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
AGNIESZKA SMOLINSKA等: "Profiling of Volatile Organic Compounds in Exhaled Breath As a Strategy to Find Early Predictive Signatures of Asthma in Children", 《PLOS ONE》 *
JAN E.SZULEJKO等: "Evidence for Cancer Biomaker in Exhaled Breath" *
傅若农: "国内气象色谱近年的进展" *
王丽丽等: "铁皮的裂解气相色谱指纹图谱及其系统聚类分析" *

Also Published As

Publication number Publication date
EP3570728A1 (en) 2019-11-27
WO2018134214A1 (en) 2018-07-26
US11519900B2 (en) 2022-12-06
US20210356453A1 (en) 2021-11-18
CN110198659B (zh) 2023-05-26

Similar Documents

Publication Publication Date Title
Martinez-Lozano Sinues et al. Human breath analysis may support the existence of individual metabolic phenotypes
US7949475B2 (en) System and method for analyzing metabolomic data
Singh et al. Translating secondary electrospray ionization–high-resolution mass spectrometry to the clinical environment
US20120179389A1 (en) Gas Chromatographic Analysis Method and System
CN106415558B (zh) 数据处理装置、质谱法装备和用于质谱法数据的评估的方法
CN111781292B (zh) 一种基于深度学习模型的尿液蛋白质组学谱图数据分析系统
JP6779500B2 (ja) クロマトグラフ質量分析方法及び装置
JP2016180599A (ja) データ解析装置
Dallinga et al. Analysis of volatile organic compounds in exhaled breath by gas chromatography-mass spectrometry combined with chemometric analysis
Fan et al. Fully automatic resolution of untargeted GC-MS data with deep learning assistance
Pais et al. MALDI-ToF mass spectra phenomic analysis for human disease diagnosis enabled by cutting-edge data processing pipelines and bioinformatics tools
CN110198659A (zh) 用于数据库比较的呼吸样本数据的对齐
Xu et al. Chemometrics models for overcoming high between subject variability: applications in clinical metabolic profiling studies
JP5866287B2 (ja) 複雑な混合物における小分子成分分析のための装置及び関連する方法
US11016066B2 (en) Compact gas analysis device and method
Szymańska et al. Comprehensive data scientific procedure for enhanced analysis and interpretation of real-time breath measurements in in vivo aroma-release studies
JP2013506843A5 (zh)
EP1923806A1 (en) Fast metabolomic analysis and system therefor
US20150032383A1 (en) Method and system for filtering gas chromatography-mass spectrometry data
Akbari Lakeh et al. Discriminating normal regions within cancerous hen ovarian tissue using multivariate hyperspectral image analysis
US10815518B2 (en) Sampler and method of parameterizing of digital circuits and of non-invasive determination of the concentration of several biomarkers simultaneously and in real time
Xu et al. Improve accuracy and sensibility in glycan structure prediction by matching glycan isotope abundance
JP6538083B2 (ja) 複数のサンプル処理における複雑な混合物の小分子成分を分析するための方法、並びに関連する装置及びコンピュータプログラム製品
Bader Identification and quantification of peaks in spectrometric data
JP2001330599A (ja) Gc/msによる代謝異常スクリーニング診断装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant