CN1500000A - 质谱分析方法 - Google Patents

质谱分析方法 Download PDF

Info

Publication number
CN1500000A
CN1500000A CNA018220487A CN01822048A CN1500000A CN 1500000 A CN1500000 A CN 1500000A CN A018220487 A CNA018220487 A CN A018220487A CN 01822048 A CN01822048 A CN 01822048A CN 1500000 A CN1500000 A CN 1500000A
Authority
CN
China
Prior art keywords
data
class
classification
mass spectrum
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA018220487A
Other languages
English (en)
Other versions
CN1262337C (zh
Inventor
Ej
E·J·加文
L·布拉金斯基
W·E·里奇
С
冯哲力
G·L·小赖特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Eastern Virginia Medical School
Aspira Womens Health Inc
Original Assignee
Eastern Virginia Medical School
Ciphergen Biosystems Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Eastern Virginia Medical School, Ciphergen Biosystems Inc filed Critical Eastern Virginia Medical School
Publication of CN1500000A publication Critical patent/CN1500000A/zh
Application granted granted Critical
Publication of CN1262337C publication Critical patent/CN1262337C/zh
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01JELECTRIC DISCHARGE TUBES OR DISCHARGE LAMPS
    • H01J49/00Particle spectrometers or separator tubes
    • H01J49/0027Methods for using particle spectrometers
    • H01J49/0036Step by step routines describing the handling of the data generated during a measurement
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/10Signal processing, e.g. from mass spectrometry [MS] or from PCR
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/20Supervised data analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Public Health (AREA)
  • Epidemiology (AREA)
  • Artificial Intelligence (AREA)
  • Bioethics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Chemical & Material Sciences (AREA)
  • Molecular Biology (AREA)
  • Analytical Chemistry (AREA)
  • Signal Processing (AREA)
  • Genetics & Genomics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
  • Analysing Materials By The Use Of Radiation (AREA)

Abstract

本文提出了一种用数字计算机分析质谱的方法。此方法包括将从大量样本中得到的质谱数据集(27)输入数字计算机的方法。每个样本都代表了一个包含两个以上类(30)的类集中的一个类,每个类都对应于一种不同的生物状态。本文接着提出了一个分类模型(54)。此模型可以区分类集中的各个类。

Description

质谱分析方法
相关申请
本申请声明享有美国临时专利申请2000年11月16日归档的Nos.60/249,835及2000年12月11日归档的Nos.60/254,746的权利。这些U.S.临时专利申请也包含在此处,以供各种参考。
技术领域
本发明是关于质谱分析方法的。
背景技术
最近关于基因组的研究已经可以识别与不同疾病相关的许多种基因。但是,尽管基因组研究可以识别出与遗传性的对一种疾病有易患体质的基因,仍然需要对诸如蛋白质等标记物进行表征和识别。“标记物”通常是指一种多肽或其它一些可以区分不同生物状态的分子。在病理状态下,蛋白质和其它标志物是重要的因素。例如,蛋白质可随生物状态的改变(例如生病)而改变。它们也可以传达疾病、中毒或其它刺激的信息。在生病时,某些蛋白质进入休眠状态,而另一些蛋白质则激活。例如,前列腺特异性抗原(PSA)是一种循环性的血清蛋白,其含量增加与前列腺癌有关。如果蛋白质含量的增加能被快速检测到,医生就可以及早诊断疾病并提高疗效。
识别出新的标志物是诊断学药物研发过程中最早最难的步骤之一。辨别一种物质是否是某种疾病的一种方法是,判别相对于没有这种疾病的病人样本,它们在表现出这种疾病的病人的生物样本中,是否被“差别表达”。例如,图1(a)显示了来自一组18个有病患者的样本的大量互相重叠的质谱中的曲线图100。此患者可能患有例如前列腺癌。图1(b)所示的另一幅曲线图102显示了来自一组18个一般病人的样本的互相重叠的质谱。曲线图100、102的信号强度都绘成由质量-电荷比的函数。曲线图100、102中的信号强度与分子量的标记物浓度成正比,这些标记物与样本中的质量-电荷比A相关。如曲线图100、102所示,在质量-电荷比A处,两幅质谱中都有若干信号存在。这些信号中的峰值代表了可能的其分子量与质量-电荷比A相关的标记物。
将曲线图100、102中的信号结合起来看,很明显有病的患者在质量-电荷比A处的平均信号强度比一般患者高。称质量-电荷比A处的标记物对有病患者“差别表达”,因为平均起来,此标记物的浓度在有病患者样本中高于一般患者样本。
观察图1(a)、1(b)中的数据,一般可以得出结论,有病患者样本中质量-电荷比A的标记物浓度大于一般患者。由于这种标记物在有病患者样本中的浓度高于一般患者,这种标记物可对这种疾病表征为“正相关”。如果有病患者样本中标记物的浓度低于一般患者,此蛋白质可称为“负相关”。
标记物一旦发现,就可以用作诊断工具。例如,关于上述例子,一个测试病人的未知样本可以用质谱仪分析并得到一个质谱。可对质谱进行分析并得到测试病人质谱中质量-电荷比A处的信号强度。此信号强度可与有病患者和一般患者在质量-电荷比A处的平均信号强度相比较。据此可推断此测试病人是否已患或将要患上癌症。例如,如果此未知样本在质量-电荷比A处的信号强度更接近有病患者在此处的平均信号强度,则可以推断此患者更可能已经或将要患癌症。
虽然所述差别表达分析有效,但是有许多方面可作改进。例如,分析患者生物样本中的一个标记物如PSA的量,对监护病症的发展常常不够可靠。PSA被认为是目前可用的最好的前列腺癌标记物之一。但是,它并不总是能正确区分良性和恶性前列腺疾病。尽管生物样本中的一种标记物(如PSA)的浓度分析能在一定程度上判断一个测试病人是否有病,还是需要一个有更大可信度的方法。
而且,当分析大量生物样本的大量质谱时,难以分清究竟哪个信号代表可能区分有病和无病状态的标记物。典型的生物样本质谱包含有大量潜在的标记物信号(例如,大于200)以及大量噪声,这会使得潜在的重要信号以及平均信号差的识别很困难,因此也就使得识别和量化潜在的标记物很困难。除非潜在的标记物表现出强正相关或强负相关,否则,有病和无病患者的样本的平均信号差将不易区分。例如,通常难以直观看出一组质谱中给定质量处的一簇信号的平均信号强度比另一组质谱中的一簇信号高还是低。另外,很多潜在的重要信号可能强度值较低。谱中的噪声可能会模糊这些潜在的重要信号。这些信号可能无法被发现并被无意中从差别表达分析中忽略掉了。
能有更好的分析质谱的方法将是很好的事。例如,它可以提供一个更准确地发现潜在有用标记物的方法。它也可以提供一个改进的分类模型,可以用来判断一个未知样本是否与一种特定生物状态有关。
本发明本身就是用于解决这些以及其它一些问题的。
发明内容
本发明是关于质谱分析的方法。在本发明中,利用数字计算机形成一个分类模型,可用于将与不同生物状态关联的样本分类开。此分类模型可用做预诊断工具。也可以用来识别相关于某种生物状态的潜在标记物。进一步,此分类模型可通过诸如神经网络分析这样的处理形成。
本发明的一实施例是关于使用数字计算机进行质谱分析的方法。这个方法包括:a)将从大量样本中得到的质谱数据集输入计算机,其中每个样本都会或将会归于一组包含两个或两个以上类的类集中的一个类,每一类代表一种不同生物状态的特性,其中每个质谱包含代表信号强度的数据,此强度是质量-电荷比或由质量-电荷比得到的一个数值的函数,并由激光解吸附电离处理形成;并且b)形成了一个分类模型,可以用来区分类集中的不同类,模型的形成包括通过执行代码来分析数据集。
本发明另一实施例包括使用数字计算机进行质谱分析的方法。这个方法包括:a)将从大量样本中得到的质谱数据集输入数字计算机,其中每个样本都会或将会归于一组包含两个或两个以上类的类集中的一个类,每一类代表一种不同生物状态的特性,其中每个质谱包含代表信号强度的数据,此强度是飞行时间或由飞行时间得到的一个数值的函数,并由激光解吸附电离处理形成;并且b)形成了一个分类模型,可以用来区分类集中的不同类,模型的形成包括通过执行代码来分析数据集,此段代码实施分类处理。
本发明还包括一个计算机可读的媒介。此媒介包括:a)将从大量样本中得到的质谱数据输入计算机的代码,其中每个样本都会或将会归于一组包含两个或两个以上类的类集中的一个类,每一类代表一种不同生物状态的特性,其中每个质谱包含代表信号强度的数据,此强度是飞行时间或由飞行时间得到的一个数值的函数,或质量-电荷比或由质量-电荷比得到的一个数值的函数,并由激光解吸附电离处理形成;以及b)通过回归分离程序生成分类模型的代码,此分类模型可以区分类集中的类。
本发明还包括使用数字计算机将一个未知样本分类为代表一类生物状态特性的方法。此方法包括:a)将从未知样本得到的质谱数据输入计算机;以及b)用分类模型处理质谱数据,从而将未知样本划分为对应于某种生物状态特性的类。分类模型可通过神经网络分析生成。
本发明还包括估计使用计算机将未知样本准确划分为对应于某种生物状态特性的类的可能性的方法。此方法包括:a)将从未知样本得到的质谱数据输入计算机;以及b)使用分类模型处理质谱,以估计未知样本准确划分为对应于某种生物状态特性的类的可能性。分类模型可通过分类处理生成,且由来自归应于两个或更多个不同生物状态的类的样本的质谱数据集生成。
本发明中,所分析的质谱可能是预先存在的,例如,可能在分类模型生成之前早就存在了。或者,质谱数据也可能在分类模型生成的同时产生。
本发明的这些以及其它一些实施例参照图和详细说明来描述。
附图说明
图1(A)所示为有病患者样本的重叠的质谱。
图1(B)所示为一般患者样本的重叠的质谱。
图2所示为本发明实施例生成质谱的方法的流程图。
图3所示为对数归一的强度与识别出的峰值簇的函数图。图中显示了两组不同样本的质谱的信号强度。
图4所示为根据本发明实施例质谱预处理的首选的流程图。
图5所示为根据本发明实施例质谱预处理及生成分类模型的首选的流程图。
图6所示为本发明实施例的一个系统框图。
图7所示为本发明实施例的分类和回归树。
图8所示为不同预测变量可变重要性的表格。
图9所示为癌症患者和一般患者不同样本的凝胶体视图。
图10所示为癌症患者和一般患者不同样本的谱图。
具体实施方式
本发明中,从质谱图得到的数据集输入数字计算机并生成分类模型。质谱图则来自已知特性的生物样本。本发明中,用于生成分类模型的数据集被表征为“已知”数据集,因为在这些数据集被用来生成分类模型之前,与这些生物样本有关的生物状态是已知的。作为比较,“未知”数据集包含的数据来自如下样本的质谱,这些样本若与质谱生成时由分类模型所辨别出的生物状态相关,则是不确定的。未知数据可从要用这个分类模型进行诊断的测试病人的生物样本得出。有时,已知数据集也称为“训练数据”。
作为演示,下述很多例子中都使用已知数据集来生成分类模型。但是,在本发明的某些实施例,用来生成分类模型的数据集可能是未知数据集。例如,在簇分析中,未知生物样本的质谱如果模式相似,则可能被分到一组。对每组样本进行分析以找出它们是否有共同的生物状态。如果有,那么这组样本就可以划分为与这种生物状态相关的一类。例如,生成一组有共同模式的质谱后,可以确定组内的所有谱都来自受辐射的生物样本。则这组样本就可以指定为“受辐射”状态类。其它组的样本同样可以定为具备各组共同生物状态特征的类。这样就可以生成一个分类模型,而未知谱就可以用这个生成好的分类模型进行分类。
本发明中,每个所用样本都被或将被分到含有两个或更多个类的类集中的一个类,每个类对应于一种不同的生物状态特性。例如,第一类样本可能与诸如疾病状态的生物状态有关。第二类样本的质谱可能与无病状态的生物状态有关。第一类和第二类样本就可以形成类集。每一类各自的质谱都含有可以区分开这两类的数据。
在本发明中,所分析的每一个质谱都可以包含信号强度数据,此数据可以是飞行时间,由飞行时间得到的值(例如,质量-电荷比,分子量,等等),质量-电荷比,或由质量-电荷比得到的值(例如,分子量)。如本领域所周知的技术,从飞行时间质谱仪得到的质量-电荷比值由飞行时间值导出。质量-电荷比也可以通过其它方式得到。例如,不用飞行时间谱仪来确定质量-电荷比,使用四极分析器和磁质量分析器的质谱仪也可以用来确定质量-电荷比。
在较佳实施例中,每个质谱都含有信号强度数据,此数据是质量-电荷比的函数。在典型的谱视图型的质谱中,信号强度数据作为质量-电荷比的函数在信号强度图上可能以“峰”的形式存在。每个峰有底部和顶部,峰宽从底部向顶部逐渐变窄。通常与峰相关的质量-电荷比对应于峰的顶部。峰的强度通常也与峰的顶部相关。
通常,质量-电荷比与潜在标记物的分子量相关。例如,如果一个潜在标记物电荷为+1,则其质量-电荷比就等于此信号所代表的潜在标记物的分子量。这样,一些质谱图可能会显示信号强度为分子量的函数,实际上这里的分子量是由质量-电荷比衍生出来的。
由于这里讨论的本发明的许多特定实施例都是关于质量-电荷比的应用,可以理解,在所特别讨论的作为示例的实施例中的质量-电荷比值,可以用飞行时间值或其它衍生自飞行时间值的值代替。
尽管所分析的质谱中的每一个质谱所包含的信号强度数据都可以作为飞行时间,但是这里使用的质谱的信号强度数据通常是质量-电荷比的函数。离子的飞行时间值会受到仪器的影响,但是质量-电荷比值不会受到影响。例如,在飞行时间质谱测量过程中,对离子得到的飞行时间值会依赖于此特定质谱仪的自由程管道长度。自由程管道长度不同的质谱可能会对同一个离子得到不同的飞行时间值。质量-电荷比就不会这样,因为它只是离子的质量与电荷之比。用质量-电荷比值生成的分类模型也可以不受所使用的特定质谱仪的影响。
数据集可以包含任何适合的数据并可以自动或手动输入计算机。在计算机上运行的分类程序所处理前的数据可能是原始数据也可能是预处理过的数据。例如,质谱中预定质量-电荷比处的信号原始强度可以用作数据集。或者,这些数据在分类模型生成之前也可以先进行处理。例如,有些实施例中,会使用质谱信号强度的对数值(如行为2)生成数据集。
数据集输入计算机。实施分类处理的计算机代码用数据集生成分类模型。示例的分类处理包括分级分类处理,如分类和回归树处理,多参量统计分析,如簇分析,非线性处理,如神经网络分析。在本实施例中,数据集使用分类和回归树处理进行处理,从而生成分类模型,如分类和回归树。下面将对这些以及其它一些分类处理和分类模型进行更详细的阐述。
生成的分类模型可以是预测性的或描述性的。例如,模型可用来预测一个未知测试生物样本是否与一个特定生物状态相关。或者进一步,分类模型可用来验证那些用于区分所分析的生物状态的数据的特性。一个特性包括可以区分所分析的特定类的质谱数据的任何方面。可识别的适合的特性包括,但并不仅限于,一个或多个质量-电荷比下的信号强度或信号强度范围、信号形状(例如,峰的形状)、信号区域(例如,峰的区域)、信号宽度(例如,诸如峰底部的宽度)、每个质谱中的信号数目,等等。典型的情况下,分类模型可指明一个特性,如给定质量-电荷比下的特定信号强度,可以区分有病和无病样本。而在另一种情况,分类模型可指明几个不同特性的组合可以将有病样本和无病样本区分开来。例如,不同质量-电荷比下的两个或更多信号的信号强度范围可用来区分有病样本和无病样本。
还有的情况下,可确定为区分不同样本类型的合适特性可能是一类里特定质量-电荷比下的信号发生频率。例如,对有100个样本的有病类和有100个样本的正常类,一个在质量-电荷比为X处强度为Y的信号可能在90个有病类样本的质谱中出现,而只在10个正常类样本中出现。即使此信号在有病和无病样本中的平均强度相同(也就是说,平均强度为Y),由于此信号在癌症病人类中出现较多,因而此特性可以区分有病类和无病类。诸如这样的频度特性可用此分类模型确定。
任何合适的生物样本都可以用于本发明的实施例。生物样本包括组织(如,活组织切片)、血液、血清、血浆、乳汁、尿、泪、唾液、细胞、软硬组织、器官、精液、粪便、尿等等。生物样本可来自任何适合的有机体,包括真核原核或病毒有机体。
生物样本可含有生物分子,包括大分子,如多肽、蛋白质、核酸、酶、DNA、RNA、多核苷酸、低核苷酸、核酸、碳水化合物、低聚糖、多糖;上述生物大分子片段,如核酸片段、肽片段及蛋白质片段;上述生物大分子的聚合物,如核酸聚合物、蛋白质-DNA聚合物、受体-配合基聚合物、酶-酶作用物、酶抑制剂、肽聚合物、蛋白质聚合物、碳水聚合物及多糖聚合物;小生物分子,如氨基酸、核苷、核苷、糖、类固醇、脂质、金属离子、药、荷尔蒙、氨基化合物、胺、羧酸、维生素和辅酶、酒精、醛、酮、脂肪酸、卟啉,类胡萝卜素、植物生长调节素、磷酸盐酯及二磷酸核苷糖,合成小分子,如例如药物或疗法有效剂、单体、肽类体、类固醇类体、抑制剂、诱导剂、抗有丝分裂药物、抗生素、离子载体、抗代谢物、氨基酸类体、抗菌素、输运抑制剂、表面激活剂(表面活性剂)、线粒体和叶绿体功能抑制剂、电子释放物、携带物和接收物、合成蛋白酶培养基、磷酸酶培养基、酯酶和脂肪酶和蛋白质修正试剂培养基;以及人工聚合体、低聚体和共聚物。上述物质任何适当的混合或化合也可以包含在生物样本中。
如上面指出的,用于产生数据集的生物样本会分到有两个或更多类的类集中的一个类。每个类表征了一种不同的生物状态。更适宜的情况下,只有两个类和两个生物状态;每类一个生物状态。例如,一类具有病态的生物状态,而另一生物状态具有无病状态。
如此处所用的,样本的“生物状态”是指样本或从中导出样本的有机体或其它来源的生物状态的表征特征。此特征可以是像遗传特性或显性特性这样的生物特性。此特征可以是生理或疾病特性,比如有没有某种特定疾病,包括传染性疾病。此特征也可以是样本所暴露的条件(环境,社会,生理,时间相关,等等)。
遗传性特性包括一种特定基因是否存在,一种基因的多种形态,或基因的组合。基因特性可以表现为显性,或以对其表现易感的形式存在,例如对特定疾病易感(如,对某种癌症或心脏病的倾向)。
显性特性包括,诸如外观,生理特性,物理特性,神经状态,心理状态、反应特性等等,或者对特定药物有无反应。显性特性可包括所谓“正常”和“病理”特性的存在与否,包括疾病特性。另一种状态是一种特定疾病的存在与否。状态也可以是特定人或组所具有的状态,如不同个人、不同家庭、不同年龄状态、不同种族以及不同组织类型。
在本发明的有些实施例中,生理状态可以是,比如下面的一个或更多个的组合形式:疾病状态,正常状态,病理状态,服药状态,未服药状态,药物反应状态,无药物反应状态,以及良性状态。服药状态可包括病人吃过药的状态,而未服药状态可包括病人未吃过药的状态。药物反应状态是生物样本对用药的反应的状态。疾病状态的一些特例包括,如,癌症、心脏病,自身免疫性疾病、毒感染、Alzheimer病,以及糖尿病。更特殊的癌症状态包括,例如,前列腺癌、膀胱癌、乳癌、结肠癌以及卵巢癌。生物状态还可以包括早期、中期和晚期。例如,不同生物状态可包括某种疾病,例如癌症的早期,中期和晚期。
其它状态可能与样本类所属于的不同环境有关。例如热疗、电磁辐射、锻炼、食谱地理位置等等中的一个或多个。例如一类生物样本(如所有的血液样本)可来自一组受到辐射的病人,而另一类样本可来自一组未受辐射的病人。辐射源可以是预期辐射源,如X光机,也可以是未预期辐射源,如手机。又例,一组人可能使用一种特定食谱,而另一组则用不同的食谱。
在本发明的另一些实施例中,不同的生物状态可能对应于与各自不同药物或药物类型相关的样本。例如,生成一幅来自使用已知疗效药物的病人的样本的质谱图。这种已知疗效药物的质谱图就可以代表与之同类的药物。例如,这种已知疗效药物的质谱图可以代表与其相同或相近的特性,结构或同样的基本效果的药物。例如,许多不同的止痛化合物都可以缓解病人的疼痛。这种已知疗效的药物以及与之相同或类似的药物可能在人体内控制同样的生化通道,从而对人体产生同样的效果。这种生物通道(如上下调节蛋白质)的特性可在质谱图中反映出来。
分类模型可通过与已知疗效药物和几种不同药物,或完全不用药的相关质谱生成。一旦分类模型生成,就可以产生与效用未知的候选药物相关的候选样本的质谱。利用此分类模型,就可以对与候选样本相关的质谱进行分类。分类模型可以确定候选样本是与一种已知效用的药物相关还是与另一种不同药物相关。如果,比方说,分类模型认为候选样本与已知效用的药物相关,则候选药物对人体的作用就可能与这种已知效用的药物相同。因此,除了其它应用,本发明可用于发现和/或表征药物。
I.获得质谱
质谱可通过任何适当的处理获得。例如,质谱可通过可访问一个或多个质谱数据库的本地或远端服务器计算机取到(如下载)。这些数据库会包括与不同生物状态相关的不同生理样本的质谱库。另外,质谱可从生物样本生成。不管如何得到,用于生成分类模型的质谱和样本更适于在同样的条件下处理,以确保质谱的任何改变都是由于样本本身,而不是由于处理的差异造成的。质谱可通过特定分类处理生成,也可以不通过特定的数据分类处理产生。
本发明实施例中,应用气相离子分光计生成质谱。气相离子分光计是一种仪器,测量可以转化为样本离子化为气态时形成的离子的质量-电荷比的参量。这包括,例如,质谱仪,离子活性分光计,或总离子流测量设备。
质谱仪可使用任何适当的电离技术。电离技术包括如电子电离,高速原子/离子轰击,阵列辅助激光解吸附/电离(MALDI),表面增强激光解吸附/电离(SELDI),或电雾电离。
在一些实施例中,离子活性分光计可用于探测和表征一个标记物。离子活性分光计的原理是基于不同离子不同的活动性。特别,电离产生的样本离子因质量、电量或形状的不同而以不同的速率运动,并在电场的作用下通过一个管道。离子(典型地是以电流的形式)在探测器处记录下来,探测器的输出就用来辨别样本里的标记物或其它物质。离子活性分光计的优点在于,它可以在大气压下操作。
在较佳实施例中,使用激光解吸附飞行时间质谱仪产生质谱。激光解吸附分光计特别适用于分析像蛋白质这样的大分子量的物质。例如,MALDI或表面增强激光解吸附/电离处理的实用质量量程可达300,000道尔顿或更多。而且,激光解吸附处理可用于分析复杂混合物且灵敏度高。进一步,在像MALDI或表面增强激光解吸附/电离处理这样的激光解吸附处理中,蛋白质破碎的概率要比在其它质谱仪处理低。因此,激光解吸附处理可用于精确表征和量化蛋白质这样的大分子量的物质。
在典型的产生质谱的处理中,对质谱仪的入口系统引入了一个带有标记物的探头。然后将标记物电离。标记物离子产生后,产生的离子被一个离子光学部件收集,然后质量分析器使经过的离子分散并加以分析。离开质量分析器的离子被探测器探测到。在飞行时间质量分析器中,离子在一个短的高压电场中加速并漂移进入一个高度真空室。在高度真空室的远端,加速过的离子在不同时刻撞击一个敏感的探测器表面。由于离子的飞行时间是其质量-电荷比的函数,电离和冲击之间消逝的时间可用于识别特定质量-电荷比的分子存在与否。
然后飞行时间数据就可以转化为质量-电荷比来产生一个谱,表示标记物的信号强度作为质量-电荷比的函数的情况。图2显示了将基于飞行时间数据的质谱转化为质量-电荷比数据的一种示例方法的流程图。首先,采集飞行时间谱(第16步)。然后,对飞行时间谱进行平滑滤波(第18步)。典型地,在最初产生的谱中含有大量高频噪声。应用不同的滤波器以降低噪声而不损坏其中包含的信号。然后,计算一条基线(第20步)。这样可以去除特有的向上的漂移,例如MALDI或表面增强激光解吸附/电离处理的特征。
“表面增强”解吸附/电离处理是指一种在其上把样本暴露于能源的基底在解吸附/电离处理中起积极作用的处理。在这类方法中,基底例如探针,并不仅仅是样本表达的一个被动场所。有几种表面增强基底可应用于表面增强解吸附/电离处理。一个例子是,表面含有亲和材料,例如阴离子交换组或亲水组(例如,二氧化硅),它们会优先绑定某类分子。此类亲和材料包括如硅烷醇(亲水)C8或C16烷基(憎水)、固定金属螯化物(并列同价物)、阴离子或阳离子交换(离子的)或抗体(生物特效)。样本暴露于基底绑定吸附物,以根据特定的吸引力基础绑定分析物分子。典型的不绑定分子则被冲洗掉。当分析物是生物分子时,能量吸收材料例如基质,会与绑定样本相关。然后用激光对探测器探测到的分析物进行解吸附和电离。
另一种型式中,基底表面包含有一个能量吸收分子的绑定层,可以避免将样本和基质材料混合,例如在MALDI中。表面增强解吸附/电离方法在诸如U.S.专利5,719,060(Hutchens and Yip)和WO 98/59360(Hutchens and Yip)(U.S.专利6,255,047)中有描述。当激光将含有能量吸收材料的基质解吸附时,一些基质材料会随所分析的样本材料一道被解吸附。基线计算调整谱图,以补偿解吸附的基质材料呈现的信号。一旦基线计算出来,飞行时间/质量转化就会发生(第22步)。此步骤中,飞行时间数据被转化为质量-电荷比。然后计算本地噪声值(第24步)。在低质量-电荷比情况下,由于解吸附的基质材料而产生了大量噪声。在电离解吸附处理中,基质材料在高质量-电荷比时比时比低质量-电荷比时更不易解吸附,因此噪声在低质量-电荷比时比高质量-电荷比时更可能存在。可对谱进行调整以修正这个效应。修正之后,谱更新就完成了(第26步)。通过图2所示方法处理质谱后,质谱的信噪比提高了,能更好地量化和比较潜在的标记物。
通过标记物的解吸附和探测所生成的质谱可在生成质谱图前后用数字计算机进行预处理。数据分析可包括确定探测到的标记物的信号强度(例如,信号的高度)和去除“逸出值”(偏离预设的统计分布的数据)的步骤。例如,观察信号可进行归一化。归一化就是计算每个信号相对于某个参考的高度的处理。例如,参考可以是由仪器和化学物品(如,能量吸收分子)所产生的背景噪声,它们在标尺中设为零值。然后,探测到的每个标记物或其它物质的信号强度可以按需要的尺度(如100)以相对强度的形式显示出。或者,可对样本提出一个标准,从而符合此标准的信号可以用来作为计算观察到的每个标记物或探测到的其它标记物的相对信号强度的参考。
数字计算机可以将结果数据转化为各种格式显示。一种格式称为“谱图或滞留物图”,可以显示标准谱图。谱图描述了在不同分子量下到达探测器的标记物的量。另一种格式称为“峰值图”,只保留了谱图中的峰值高度和质量信息,使图更清晰,使代表具有相近分子量的标记物的信号更易于观察。还有一种格式称为“凝胶体视图”,将峰值图中的每个质量转化为基于每个峰值高度的灰度图像,得到的图看起来很像电泳凝胶体中的条带。还有一种格式称为“3-D覆盖图”,将几个谱重叠,以研究相对峰值高度的微小变化。还有一种格式称为“差别视图”,比较两个或多个谱,便于高亮显示代表标记物的信号和代表样本间上下调节的标记物的信号。任何两个样本的标记物形状(谱)可在一幅图上可视地比较。用于生成数据集的数据可从这些及其它一些质谱显示格式中得到。
II.生成数据集
一旦得到质谱,就可以生成一个数据集,如已知数据集。数据集包含从生物样本类集的质谱中得到的数据。生成数据集的质谱数据可以是原始的,未处理过的数据。例如,质谱中已识别质量值处的原始信号强度值可用来生成数据集。又例如,质谱中的原始信号模式也可以用来生成数据集。
在另一些实施例中,数据在用来生成分类模型之前可以先进行预处理。于是质谱可用任何适当的方法进行处理,然后再生成分类模型。例如,质谱中的数据可作如下处理:取信号强度的对数值,去除逸出值,去除较不可能与潜在标记物有联系的信号,去除低强度信号,等等。
在有些实施例中,数据集可包含原始数据或与每个质谱的特定模式相关的预处理过的模式数据。例如,对一个包含许多信号峰的质谱,信号峰的模式可以包含用来生成此质谱的生物样本的独特特征。分类处理可以根据模式或模式段区分不同的谱,这些模式或模式段在分类模型进行区分的各个不同类内部对谱是一致的。电脑程序例如神经网络程序,可以接收与已知生物状态关联的已知样本的多个质谱。神经网络可用质谱数据进行训练,然后就可以区分属于各自不同类的质谱模式。然后,训练过的神经网络就可以根据质谱模式对与未知样本关联的质谱进行分类。
在其它实施例中,数据集包含关于质谱中信号强度的数据。在这些实施例中,每个质谱中的一些或全部信号都可以用来生成数据集。例如,低于谱图类质谱图中所有信号(如,峰值)的强度可用来生成数据集。在优选实施例中,先确定质量-电荷比,然后用确定的质量-电荷比从质谱中选择信号。所选信号的强度可用来生成数据集。通过只用每个质谱中的部分信号的数据来生成数据集,所需要处理的数据点减少了,因而数据处理进行得更快。代表可接受的标记物的概率低的信号数据可从数据集中排除出去。
质量-电荷比可以通过任何方式确定。例如,可通过比较不同生理状态的不同类的质谱确定。选择可能可以区分这些类的信号的质量-电荷比。比较可以手工进行(如视觉比较)或由数字计算机自动进行。例如,与样本中不同类关联的质谱可以直观地互相比较,以确定一个样本类里-质谱中一个质量-电荷比处的信号强度是否明显大于或小于另一个样本类里同一个质量-电荷比处的信号强度,由此指出潜在的区分表达。信号有差别处的质量-电荷比就可以选择出来。
例如,图3显示了log(2)归一化的强度对确定的峰簇的曲线。这张图显示了以2为底的对数归一的强度值。峰簇里的每个强度值都已经减去了平均强度值,因此零值代表与均值无差别。Y轴上每单位表示与均值相差两倍。使用图3所示这样的图可以确定强上下调节的蛋白质。图3显示了对数归一化的强度作为不同信号簇函数的图。图中显示了来自两组不同样本的质谱的信号强度。例如,图3中的峰簇22(x轴上)表示组A和组B的数据点之间大范围的变化。这表明与峰簇22关联的这个质量-电荷比可确定为一个候选的标记物位置。
另外,或进一步,某些预先定义的标准可用来初步选择某些信号或信号簇。选到的信号簇再用来确定特定的质量-电荷比。例如,可自动选择信号强度或信号强度均值高于或低于信号强度阈值的信号或信号簇。然后就可以确定与所选信号或信号簇关联的质量-电荷比。
包括收集质谱数据、数据预处理以及处理预处理过的数据以生成分类模型的优选方法可参考图4和5描述。参照图4,收集与不同生理状态关联的样本质谱(步骤27)。采集的样本数尽量大。例如,在本发明中,采集的样本数在100左右到1000左右(或者大于或小于这些值)。较佳地,所有用来生成谱的样本都在同一条件下生成,从而样本间的差别可以在谱中反映出来。
每个谱中相应于潜在标记物存在的信号都确定出来。每个这样的信号都指定了一个质量值。然后,第一组质谱的每个质谱中信噪比大于预设值的信号都被检测出来(步骤28)。在典型的例子中,信噪比大于值S的信号都被检测出来。值S可以是绝对或相对值。质谱中这些质量-电荷比下的信号聚到一个簇里(步骤30)。然后选出符合预设标准的信号簇。例如,在一实施例中,有预设数量信号的信号簇可被选出(步骤32)。少于预设值的簇则被丢弃。在典型的例子中,如果一个簇里的信号数少于质谱数的50%,此信号簇就可以丢弃。在有些实施例中,选择处理得到从少达20个到多于200个选出的信号簇。一旦信号簇被选出,这些信号簇的质量-电荷比就可以确定(步骤34)。
一旦质量-电荷比确定下来,此质量-电荷比的“丢失信号”就可以确定。一些质谱可能在所确定的质量-电荷比处不显示信号。这组质谱或与这组质谱关联的样本可进行再分析,以确定在确定的质量-电荷比处信号是否确实存在(步骤36)。对丢失信号添加估计值(步骤38)。对于一个簇中找不到任何信号的谱,根据迹线高度或噪声值估计一个强度值。这个估计的强度值是使用者可选的。
参照图5,一旦质量-电荷比确定下来,所有质谱在确定质量值处对每个信号的强度值也确定(步骤46)。每个信号的强度值都归一化为0到100,以消除绝对幅度的影响(步骤48)。然后,对每个归一化的信号强度取对数(如以2为底的)(步骤50)。取信号强度的对数可以去除测量中的歪斜。
对数归一化的数据集接着用分类过程处理(步骤52),实施该过程的代码由数字计算机执行。代码执行后,分类模型就形成了(步骤54)。生成分类模型的进一步描述如下。
III.生成分类模型
由数字计算机执行的代码实施的分类过程可处理数据集。代码可由数字计算机执行以产生分类模型。代码可存储于任何适合的计算机可读介质。计算机可读介质的实例如磁,电,或光盘,磁带,记忆棒,芯片,等等。代码可用任何合适的计算机编程语言书写,包括C,C++,等等。
数字计算机可以是微机,小型机或大型机,使用标准或专门的操作系统,比如WindowsTM系列操作系统。另一部分实施例中,数字计算机可以只是一个或多个微处理器。数字计算机与用来生成质谱的质谱仪可以是分离的。或者,数字计算机可以耦合或物理集成到质谱仪中。质谱数据可手工或自动从质谱仪传送到数字计算机。例如,在一实施例中,可先从大量质谱得到一个已知数据集。这个已知数据集然后被手工输入执行分类过程代码的数字计算机中。另一种实施例中,质谱数据的生成和采集、数据预处理,以及用分类过程处理预处理过的数据,都可以用同一个物理计算设备进行。
有些实施例中,已知数据集可被定为训练集,可为分类模型或提前形成的分类模型“训练”一个前体。分类模型可像生成那样被训练并进行学习。例如,在神经网络中,已知数据集可用来训练神经网络,使之识别输入神经网络的数据类间的差别。初始分类模型生成后,可用更大数量的样本来进一步训练和提炼分类模型,以使它能更准确地区分用来生成分类模型的类。
本发明中,附加的数据可用于生成分类模型。附加数据可以相关于质谱也可以不相关。例如,在有些实施例中,预存在的标记物数据可附加用于已知数据集来形成分类模型。例如,得到一类前列腺癌病人样本的质谱和一类没有前列腺癌病人样本的质谱。这些质谱可形成一组已知数据集。用这组已知数据集和预存在的标记物数据,例如预存在的PSA诊断数据(如,PSA临床化验数据),可生成分类模型。附加的预存在的PSA诊断数据可用来协助区分质谱以形成分类模型。例如,可估计每个质谱来观察相应于PSA的质量-电荷比处的信号是否与前列腺癌病人的信号强度特性更接近,还是与非前列腺癌病人的特性更接近。该信息有助于对前列腺癌病人或非前列腺癌类指定质谱及其相应的样本。在其它实施例中,被取生物样本的人的非质谱数据,如性别、年龄、等等,也可以用来形成分类模型。例如,如果男性比女性更容易患某种特定疾病,则此信息也可以用来帮助区分样本并形成分类模型。
任何适合的分类处理都可用于本发明。例如,分类处理可以是分级分类处理,如分类和回归树处理或多变量统计分析。多变量统计分析同时观察几个变量间关系的模式。多变量统计分析的例子包括辨别函数分析和簇分析等已知处理。辨别函数分析是基于每组前面的观察指定组的观察的分析方法。簇分析是把数据间的变化用一系列集合表示的统计方法。例如,生物上,这些集通常以分级形式组织并用一个树状图表示,称为系统树图。一些簇分析类型及其它分类处理在Jain等人的下面文章里有叙述,“Statistical PatternRecognition:A Review”,IEEE Transactions on Pattern Analysis andMachine Intelligence,Vol.22,No.1,January 2000.这篇文章在此处完整引用。
或者,分类处理可以使用非线性分类处理,如人工神经网络分析。人工神经网络分析可用已知数据集进行训练。一般来说,人工神经网络可以根据几个可能影响它的其它输入变量预测一个输出变量的值。此预测通过从一个已知模式集中选择一个看起来与一种特定情况最相关的模式得到。顾名思义,人工神经网络有几个神经元(单元)和它们之间的联系。这些单元根据功能分类到不同的三个层或组。第一组形成输入层,接收输入到系统里的数据。第二组形成输出层,输出代表输出模式的输出数据。第三组包括很多中间层,也称为隐含层,把输入模式转化为输出。
作为例子,神经网络可被训练为区分与有病状态和无病状态关联的激光解吸附质谱。然后,用激光解吸附处理生成待测生物样本的质谱并把相关于此质谱的数据输入训练过的神经网络。训练过的神经网络就可以确定测试生物样本与有病状态还是无病状态有关。
本发明中,分类处理较佳地包括分级、回归分类处理,例如分类和回归树处理。在本发明中,分类和回归树处理由数字计算机执行。一个可作为例子的分类和回归树程序是CART4.0,可从Salford Systems,Inc.购买(www.salford-systems.com)。
二进递归分类处理是一个特别有效的分类和回归树处理。此处理是二进的,因为每个父节点总是恰巧分为两个子节点,它是递归的,因为此处理可循环将每个子节点作为下一个父节点。为了给一个已知数据集分类,对已知数据集提问。在本发明中,待分类的数据是相应于生物样本类集的质谱。每个质谱可当作一个待分类的“实例”。可用来对实例进行分类的问题可以是“质量-电荷比X处的信号强度比Y处大吗?”每个问题将已知数据集分为有更多共性的两组。一旦找到一个最佳划分,分类和回归树处理对每个子节点重复搜索处理,继续递归,直到无法再进行划分或终止。划分只有当一个特定节点只有一例或此节点中所有实例都是同一类型时才会停止。
对数据集提出的问题可由使用者决定或由数字计算机自动决定。在有些实施例中,问题可由数字计算机任意产生,数据划分质量确定此问题是否可接受。例如,可对数据提出一个问题。如果分类结果对此例有统计显著性,此问题就可以保留并用于生成分类和回归树。分类和回归树处理找出分类数据所需问题的最佳数目,补偿每次样本观察时的随机误差影响。
分类和回归树处理观察分析中包含的所有预测变量的所有可能的划分。例如,对有215个实例和19个预测变量的数据集,处理考虑215乘以19一共是4085种可能的划分。典型地,在形成分类和回归树时,所有这样的划分都要考虑。因此,形成的分类和回归树处理在生成分类模型时考虑许多不同的预测参量。例如,在典型实施例中,形成分类模型时,类集的所有质谱中超过100个质量-电荷比处的信号数据都进行了考虑。作为比较,前面提到过的微分表达分析只考虑一个预测参量。因此,由于在形成分类模型时使用了每个质谱中更多的数据,分类和回归树实施例比其它分类方法准确性更高。
为检查此模型的准确性,分类和回归树处理可以使用计算机增强技术,称为交叉确认。在典型的交叉确认处理中,先生成一棵大树,然后剪除回去。数据集分成10个大致相等的部分,每个部分包含所分析的生物状态的相近的分布。数据的前9个部分用来建立最大可能树。剩下的一部分用来获得所选子树错误率的初始估计。对数据的其它9/10重复同样的过程(生成最大可能树),而用另外1/10部分作为测试样本。此过程一直持续到数据的每一部分都作为测试样本保留过一次。10个最小测试样本的结果接着合起来形成每个可能大小的树的错误率。这些错误率应用于基于整个数据集的树。交叉确认提供了树的独立预测准确性的可靠估计。即使无法得到独立测试样本,也可以预测树分类全新数据(例如,来自大量未知样本的数据)的准确度。
生成的分类和回归树表示了那些预测参量(如果有的话)对样本组间的差异有作用。分类和回归树可用来分类(预测一个实例属于那一组),也可以用来回归(预测一个特定值)。也可以用来识别对区分所分析的类有重要作用的特性。例如,分类模型可能指明特定质量-电荷比下一个或多个信号强度值分别或其组合是区分所分析的类的重要特性。
分类和回归树图示地显示了数据间发现的关系。分类和回归树处理的一个基本输出就是树本身。树可以作为分类模型的一方面,可由用户可视地进行分析。与神经网络分析这样的非线性技术不同,树提供的可视表达使分类分析很易于理解和接受。因此,与训练过的神经网络特性这样的“黑箱”分类模型相比,用户更倾向于相信决定树的结果。这使得分类和回归树成为更愿意接受的分类模型,无论是对不同的健康监护和常规人员(如,食品和药物管理),以及希望对生成分类模型的分析有详细理解的病人,都是如此。树也可以用来发现所分析的数据和生物状态间从前不知道的联系。
分类和回归树处理与神经网络这样的分类处理相比还有其它优点。例如,分类和回归树程序比神经网络更有效率,因为后者常常需要传递大量训练集数据,有时甚至数以千计。而建立决定树所需要的传递量不会多于树的层数。对树的层数没有预定限制,虽然由树的深度和宽度衡量的树的复杂性随预测参量的数目增加而增加。
应用分类和回归树模型,还可识别区分类的特性。数据中识别出的特性可以是所分析的生物状态的特性。例如,分类模型可指出特性的一种组合会与特定的生理状态相联系。例如,模型指明不同质量-电荷比下特定的信号强度将有病状态和无病状态区分开来。与传统的差别分析处理相比,本发明中分析了许多不同的参量。分类模型可以确定用来区分所分析的生物状态一个或多个预测参量。
IV.使用分类模型
分类模型可用来将未知样本分到一个生物状态中。用这种方法,待测样本的质谱与关联于某种特定生理状态的分类模型进行比较,以确定此样本是否适合分到此生物状态。可得到未知样本的质谱,从此未知样本的质谱得到的数据可输入数字计算机。输入的数据可用分类模型处理。然后分类模型可以将未知样本分为某一特定类。此类可能与某一特定生物状态相关联,而患者就可以诊断为具有那种特定生物状态。
此方法特别有临床应用价值。例如,在药物发现过程中,人们希望能确定一个候选分子在生物体系统中是否与一种特定药品或一类药品(例如,一类seratonin再起抑制剂)产生的生物效果相同。首先产生分类模型,它可区分暴露于感兴趣的药品或一类药品的生物系统(如,人或实验动物)。然后,生物系统置于实验分子中,产生系统样本的质谱。然后质谱分类为属于或不属于测试的已知药品或一类药品的类。如果候选分子被划为这一类,此信息对决定是否对此药物进行进一步研究很有用。
在其它应用中,开发的分类模型可以区分不同的毒性和无毒生物状态。毒性状态可能由于例如暴露于药物或一类药物引起。也就是说,可以开发分类模型来指明一种药或一类药是否会在生物系统(如,体内或试管内模型系统,包括肝中毒)中引起中毒反应。然后,可对此系统测试研发中或临床试验中的药物是否有毒。此信息在药物开发的毒性研究中有用。
在其它应用中,开发的分类模型可以区分对某种药物是否有反应的人群。然后,在给不知道是否对药物有反应的人服药之前,可以用质谱仪测试此人的样本,并且划分此人为对此药有反应或无反应类。
在其它应用中,开发的分类模型可以区分有没有某种疾病的人。然后一个接受诊断的人可以提交一个样本,用于分类此人为有病还是没病。这样,此方法在临床诊断中也有用。
一实施例用来分析癌症。病理学家根据组织表现给癌症分级。低级癌症特性有增大的细胞核,其细胞核/细胞质比有不太大的增大,有丝分裂数目少,不太大的细胞异质,以及一般正常结构的保持。高级癌症特性有增大的形状怪异的细胞核,其细胞核/细胞质比很高;有丝分裂数目增加,其中有些看起来非典型;与正常结构类似很少或没有。发展一个分类模型可以区分一个生物样本是没病、低级癌症,还是高级癌症是很有用的,因为这种诊断能确定疗法,还可以预测预后情况。样本可以是怀疑区域的固体组织切片或好的针吸样本。不过,在另一实施例中,样本可从被测个体组的更简单的采集源得到,比如尿、血液或其它体液。这对于会分泌细胞或蛋白质到这些液体中的癌症特别有效,如膀胱癌、前列腺癌和肺癌。当这些状态的分类模型建立后,就可以用于分类待测病人的样本作诊断。在其它应用中,开发的分类模型用于区分个体类别是否有一种非病理的特定物理或生理特性。然后,对此特性未知的样本可通过测试此个体的一个样本并将其谱分为在或不在有此特性的类里而进行分类。
分类模型也可以用来估计一个未知样本准确地分类为属于对应于一个生理状态的类别的概率。例如,在分类和回归树中,可以确定可能的误分类的概率。作为例子,用分类和回归树模型区分一个患者的未知样本是属于有病态还是无病态。此模型可以估计误分类的概率。例如,如果误分类概率低于10%,则可以通知患者有90%的概率患有此病。
V.包含计算机可读介质的系统
本发明的一些实施例是关于包含计算机可读介质的系统。一个包含计算机可读介质和数字计算机的示例系统的方框图在图6中显示。系统70包括耦合到数字计算机74的质谱仪72。显示器76如视频显示器和计算机可读介质78可操作性地耦合到数字计算机74。显示器76可用来显示数字计算机74产生的输出。计算机可读介质78可用来存储数字计算机74所执行的指令。
质谱仪可操作性地耦合到数字计算机74,而不需要物理上或电耦合。例如,可从质谱仪得到数据(如上所述),然后数据可由操作员手工或自动输入数字计算机74。在其它实施例中,质谱仪72可自动把数据传送到可被处理的数字计算机74中。例如,质谱仪72可从一个或多个生物样本产生原始数据(如数据飞行时间)。然后数据传送到数字计算机74,在那里进行预处理或处理。处理数据的指令可从计算机可读介质78中得到。来自质谱仪的数据处理过后,输出在显示器76上显示。
计算机可读介质78可以包含任何适于处理来自质谱仪72的数据的指令。例如,计算机可读介质78可以包含将来自未知生物样本质谱的数据输入数字计算机74的计算机代码。然后数据可以用分类模型处理。分类模型可以估计此未知样本被准确划分为某一生物状态表征的类的概率。
尽管方框图将质谱仪72、数字计算机74、显示器76和计算机可读介质78用分开的框图表示,但可以理解,这些部件中一个或多个可以在同一个或不同的框里表示。例如,在有些实施例里,数字计算机74和计算机可读介质76可在同一个框里,而质谱仪72和显示器76在另外的框里。还有的实施例中,所有的部件72、74、76、78都可以放在同一个单元里。
例子
从一个生物样本集的一些生物样本中生成大量质谱。此样本集包括来自一般病人的第一类血清样本和来自前列腺癌病人的第二类血清样本。每个病人的血清样本都通过一个表面增强激光解吸附/电离系统,此系统可从Ciphergen Biosystems,Inc.of Fremont,California购得。CiphergenBiosystem的ProtienChip技术也用于本例。关于ProtienChip技术的进一步介绍在网站 www.ciphergen.com上找到。每个样本的输出结果是信号强度与质量-电荷比的质谱图。离散的峰代表了质谱中的信号。
特定质量-电荷比处的信号强度对应于带有此质量-电荷比的蛋白质数量。例如,高信号强度表明高的蛋白质浓度。每个质谱里的信号都进行了定位、定量和选择。在此例中,如果质谱段的强度值至少是背景噪声的两倍,则认为是可接受的。所有质谱中大约在同样的质量-电荷比下的信号被簇集起来。分簇以后,大约共确定了250个信号簇,并标记为P1到P250。P1到P250中的每个信号簇都对应于一个特定的质量-电荷比并被定性为“预测参量”。
每个质谱在确定质量-电荷比下的信号强度组成了已知数据集。这些信号强度被输入分类和回归树程序CART4.0,可从Salford Systems,Inc.(www.salford-systems.com)购得。程序由数字计算机执行。数字计算机生成一个分类和回归树。利用这些数据,每个样本都分类为正常或癌症。
质谱数据输入后,数字计算机产生一个图6那样的树。此例中,类0是正常类而类1是癌症类。每个质谱都可以定性为一个“实例”,在树中进行分类。
树中的每个方框代表一个“节点”。最顶部的节点1称为根节点。决定树从根节点开始生长,每层将数据分开以形成新的节点。树枝连接新节点。不再分裂的节点称为终端节点。图6的树中的终端节点标记为终端节点1到7。如下面将详细解释的,终端节点1到7可用来对未知样本分类并因此用于预测。
在每个节点中,大部分设定了整个节点的分类。例如,终端节点1有四个患者。这四个患者都有癌症。因此终端节点1就定性为一个癌症节点。由于所有的实例都有同样的值(癌症),此节点就定性为“纯的”并不再分裂。如果终端节点1含有三个癌症患者和一个一般患者,由于其中大部分患者是癌症患者,此节点仍会被定性为癌症节点。此时,这一个一般患者就认为是被误分类了。
图6中,每个节点都含有关于此节点的实例数和生物状态癌症的分布的信息。根结点(节点1)的实例是质谱数据集中所有的实例。节点1含有194个实例,其中96个正常,98个癌症。节点1分裂为两个新节点,节点2和节点5。数据分裂通过确定簇P127的平均信号强度是否小于或等于3.2946确定。平均信号强度以及值3.2946都是相对尺度。如果此问题的答案是对,则相应的实例就放到节点2。如果答案是不,则相应的实例就放到节点5。此例中,85个癌症患者和11个一般患者的质谱在与预测参量P127关联的质量-电荷比处的信号强度小于或等于3.2946,因此被置于节点2。85个一般患者和13个癌症患者的质谱在与预测参量P127关联的质量-电荷比处的信号强度大于3.2946,置于节点5。其它节点处类似地使用不同的分类规则进行操作,从而形成树。
分类和回归树的预测效果可以参看表1和表2。
             表1-学习数据误分类
分类 N样本 N误分类 差错百分比
0(正常) 96 0 0
1(癌症) 98 0 0
             表2-测试数据误分类
分类 N样本 N误分类 差错百分比
0(正常) 96 9 9.38
1(癌症) 98 11 11.22
分类和回归树程序将已知数据集分成两组。大约90%的数据用作学习集,大约10%的数据用作测试集。分类和回归树先用学习集数据生成。树生成后,用剩下的10%数据进行测试,以观察分类和回归树分类数据的准确性。参看表1,用生成的分类和回归树,所有的学习集数据都被正确分类。参看表2,正常情况和癌症情况测试数据的百分数分类错误率分别为9.38%和11.22%。反过来,正常情况和癌症情况的分类成功率分别为90.62%和88.78%。
像这样的分类成功率表明分类和回归树对分类未知生物样本是高度准确的模型。在分类处理中,分类机制里考虑了多个预测参量。质谱里可以用比前述差别分析法多得多的数据来对与质谱关联的样本进行分类,前述方法只使用了单一质量-电荷比处的平均信号强度来分类一个测试患者。因而,此分类模型在分类测试患者时比许多传统模型更为准确。
树一旦生成,就可以对未知样本进行分类,从树根(顶)开始,沿树枝路径前进,直到遇到终端节点。路径通过对未知样本质谱中的预测参量值应用分裂规则确定。例如,如果一个测试病人未知血清样本的质谱在预测参量P127、P193和P187的质量-电荷比处的信号强度分别为1.0、0.05、0.9,则测试病人将被分类到节点1、节点2、节点3,然后最终达到终端节点1。终端节点1是癌症节点,于是病人将被分类到癌症病人。
图7显示了一些预测参量(如信号簇)中每个变量重要性的表格。变量重要性表格通过预测参量在建构分类和回归树中的重要性对它们分级。如果一个特定预测参量可以强烈区分质谱数据,则它在构建分类树中是重要的。为了计算一个参量的重要性分值,CART观察了每个参量作为初级分类代替物的改进测量属性。这些改进的值在每个节点处加起来,然后汇总,然后相对于效果最佳的参量标定。改进最大的参量得分100,所有其它参量都得到一个较低的分数,直到0分。
图7中,分类模型表明在生成分类和回归树时,预测参量P36,P127和P90比其它参量更重要。因此它们在区分癌症和无癌症类时也比其它参量更重要。与这些预测参量相关联的质量-电荷比也与可以将患有前列腺癌和没有前列腺癌的样本区分开的潜在标记物相关。因此,分类模型可用来确定一个或多个可以用来区分所分析的类的标记物。
树模型的有效性可由图8和图9得到确定。图8中的视图是凝胶视图,而图9中的视图是轨迹视图。谱放缩到P127在质量-电荷比为5075道尔顿(电量为+1)处代表的信号。图8和9表明六个前列腺癌患者和六个无前列腺癌的患者样本中的标记物在相应于预测参量P127的质量值为5075道尔顿处区分表达了。如图6所示,预测参量P127是树中的第一个节点。又如图7所示,预测参量P127能比其它预测参量更有效地区分前列腺癌患者和无前列腺癌的患者。
前述都是关于本发明的某些优选实施例,本发明的其它及进一步的实施例仍可从本发明的基本范围中作出。这些改动的实施例也应归于本发明的范围内。本发明一个或多个实施例的特性可与本发明其它实施例的一个或多个特性组合,但仍不离开本发明的范围。
本申请中引用的所有出版物(如网站)和专利文件都作为参考整个合并进来,以期达到每个出版物或专利文件都分别引用至同等程度。通过将它们引用到此申请里并不表示任何特定参考是他们发明的“原有技术”。

Claims (39)

1.一个用数字计算机分析质谱的方法,其特征在于,此方法包括:
a)将从来自大量样本的质谱中得到的数据集输入数字计算机,其中每个样本被或将被指定为一个包含两个或更多类的类集中的一个类,每类由一个不同的生物状态表征,而其中每个质谱包含的数据代表信号强度作为飞行时间,质量-电荷比或由飞行时间或质量-电荷比衍生出的值的函数;且
b)形成一个分类模型,区分类集中的类,其中形成包括通过执行代码分析数据,这些代码实施含有递归划分处理的分类处理。
2.如权利要求1所述的方法,其特征在于,所述质谱选自一组包括MALDI谱,表面增强激光解吸附/电离谱和电雾电离谱。
3.如权利要求1所述的方法,其特征在于,所述的类集恰由两个类组成。
4.如权利要求1所述的方法,其特征在于,所述样本包括选自多肽和核酸的生物分子。
5.如权利要求1所述的方法,其特征在于,所述的样本来自真核细胞,原核细胞或病毒。
6.如权利要求1所述的方法,其特征在于,所述的不同生物状态包括正常状态和病理状态。
7.如权利要求1所述的方法,其特征在于,所述的不同生物状态包括无病,低级癌症和高级癌症。
8.如权利要求1所述的方法,其特征在于,所述的不同生物状态包括给药状态和未给药状态。
9.如权利要求1所述的方法,其特征在于,所述的不同生物状态包括药物有反应状态和药物无反应状态。
10.如权利要求1所述的方法,其特征在于,所述的不同生物状态包括中毒状态和无毒状态。
11.如权利要求10所述的方法,其特征在于,所述的中毒状态由于暴露于一种药物而发生。
12.如权利要求1所述的方法,其特征在于,所述的数据集是已知数据集,数据集输入数字计算机前,每个样本都指定到一类中。
13.如权利要求1所述的方法,其特征在于,所述的生成分类模型包括使用预先存在的标记物数据生成分类模型。
14.如权利要求1所述的方法,其特征在于,所述的数据集通过以下方法生成:
探测质谱中的信号,每个质谱含有的数据代表信号强度作为质量-电荷比的函数;
把质量-电荷比相近的信号集簇为信号簇;
选择带有至少一个预定信号数的信号簇,其信号强度大于一个预定值;
确定对应于选定信号簇的质量-电荷比;并
用确定的质量-电荷比处的信号强度生成数据集。
15.如权利要求1所述的方法,其特征在于,所述的形成分类模型包括至少一个可以区分不同的生物状态并学习的识别特性。
16.如权利要求1所述的方法,其特征在于,所述的分类处理是神经网络分析处理。
17.如权利要求1所述的方法,其特征在于,进一步包括:
c)询问分类模型以确定一个或多个特性能否区分不同的生物状态。
18.如权利要求1所述的方法,其特征在于,进一步包括:
c)用大量样本重复a)和b)。
19.如权利要求1所述的方法,其特征在于,所述的分类处理是群处理。
20.如权利要求1所述的方法,其特征在于,进一步包括形成数据集,其中形成数据集包括从质谱中获得原始数据,然后处理原始数据形成数据集。
21.如权利要求1所述的方法,其特征在于,所述不同类选自暴露于药物、暴露于一类药物中的一种,和没有暴露于药物或一类药物中的一种。
22.如权利要求1所述的方法,其特征在于,所述的每个质谱包括的数据代表信号强度作为质量-电荷比或由质量-电荷比衍生出的值的函数。
23.使用数字计算机将一个未知样本分为由一种生物状态表征的类别的方法,其特征在于,此方法包括:
a)将从未知样本质谱得到的数据输入数字计算机;并
b)用权利要求1所述的方法所形成的分类模型处理质谱数据,将此未知样本分为由一种生物状态表征的类别。
23.如权利要求23所述的方法,其特征在于,所述的类别由疾病状态表征。
24.如权利要求23所述的方法,其特征在于,所述的不同生物状态包括无病、低级癌症和高级癌症。
25.如权利要求23所述的方法,其特征在于,所述类别由暴露于一类药物中的一种药物表征。
26.如权利要求23所述的方法,其特征在于,类别由对一种药的反应表征。
27.如权利要求23所述的方法,其特征在于,所述类别由毒性状态表征。
28.用数字计算机估计一个未知样本被准确分类为属于一种生物状态表征的类别的概率的方法,其特征在于,此方法包括:
a)将从未知样本质谱得到的数据输入数字计算机;并
b)用权利要求1所述的方法,所形成的分类模型处理质谱数据,估计该未知样本被准确分类为由一种生物状态表征的类别的概率。
29.计算机可读介质,其特征在于,包括:
a)将从未知样本质谱得到的数据输入数字计算机的代码;及
b)用权利要求1所述的方法,所形成的分类模型处理质谱数据,将未知样本分为一种生物状态表征的类别的代码。
30.一个系统,其特征在于,包括:
气相离子分光计;
适于处理来自气相离子分光计的数据的数字计算机;以及
权利要求29所述的与数字计算机协同运作的计算机可读介质。
31.如权利要求30所述的系统,其特征在于,所述的气相离子分光计适于执行激光解吸附电离处理。
32.计算机可读介质,其特征在于,包括:
a)将从未知样本质谱得到的数据输入数字计算机的代码;及
b)用权利要求1所述的方法所形成的分类模型处理质谱数据,估计未知样本被准确划分为由一种生物状态表征的类别的概率的代码。
33.一种系统,其特征在于,包括:
气相离子分光计;
适于处理来自气相离子分光计的数据的数字计算机;以及
权利要求32所述的与数字计算机协同运作的计算机可读介质。
34.如权利要求33所述的系统,其特征在于,所述的气相离子分光计适于执行激光解吸附电离处理。
35.计算机可读介质,其特征在于,包括:
a)输入从大量样本质谱得到的数据的代码,其中每个样本被或将被指定为一个包含两个或更多类的类集中的一个类,每类由一个不同的生物状态表征,而其中每个质谱包含的数据代表信号强度作为飞行时间、质量-电荷比,或由飞行时间或质量-电荷比衍生出的值的函数,且使用激光解吸附电离处理形成;且
b)用分类处理形成分类模型的代码,其中分类模型区分类集中的类。
36.如权利要求35所述的计算机可读介质,其特征在于,所述的分类处理是神经网络分析处理。
37.一个系统,其特征在于,包括:
气相离子分光计;
适于处理来自气相离子分光计的数据的数字计算机;以及
权利要求35所述的与数字计算机协同运作的计算机可读介质。
38.如权利要求37所述系统,其特征在于,所述的气相离子分光计适于执行激光解吸附电离处理。
CNB018220487A 2000-11-16 2001-11-15 质谱分析方法 Expired - Lifetime CN1262337C (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US24983500P 2000-11-16 2000-11-16
US60/249,835 2000-11-16
US25474600P 2000-12-11 2000-12-11
US60/254,746 2000-12-11

Publications (2)

Publication Number Publication Date
CN1500000A true CN1500000A (zh) 2004-05-26
CN1262337C CN1262337C (zh) 2006-07-05

Family

ID=26940382

Family Applications (2)

Application Number Title Priority Date Filing Date
CNB018220487A Expired - Lifetime CN1262337C (zh) 2000-11-16 2001-11-15 质谱分析方法
CNA018220509A Pending CN1623091A (zh) 2000-11-16 2001-11-15 质谱分析方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
CNA018220509A Pending CN1623091A (zh) 2000-11-16 2001-11-15 质谱分析方法

Country Status (8)

Country Link
US (2) US6675104B2 (zh)
EP (2) EP1355727A4 (zh)
JP (2) JP2004522980A (zh)
CN (2) CN1262337C (zh)
AT (1) ATE540421T1 (zh)
AU (3) AU2002241535B2 (zh)
CA (2) CA2429327A1 (zh)
WO (2) WO2003031031A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104380311A (zh) * 2012-04-10 2015-02-25 拜斯帕尔有限公司 依据谱数据的样本分类方法、创建数据库的方法和使用该数据库的方法、以及相应的计算机程序、数据存储介质和系统
CN113567605A (zh) * 2021-08-16 2021-10-29 苏恺明 质量色谱图的自动化解释模型构建方法、装置和电子设备

Families Citing this family (212)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7617163B2 (en) * 1998-05-01 2009-11-10 Health Discovery Corporation Kernels and kernel methods for spectral data
US11026768B2 (en) 1998-10-08 2021-06-08 Align Technology, Inc. Dental appliance reinforcement
CN1741036A (zh) 2000-06-19 2006-03-01 科雷洛吉克系统公司 构造分类属于不同状态的生物样本的模型的方法
US6925389B2 (en) 2000-07-18 2005-08-02 Correlogic Systems, Inc., Process for discriminating between biological states based on hidden patterns from biological data
US8463718B2 (en) * 2000-08-07 2013-06-11 Health Discovery Corporation Support vector machine-based method for analysis of spectral data
US6539102B1 (en) * 2000-09-01 2003-03-25 Large Scale Proteomics Reference database
US6980674B2 (en) * 2000-09-01 2005-12-27 Large Scale Proteomics Corp. Reference database
US6846642B2 (en) * 2000-09-07 2005-01-25 The Brigham And Women's Hospital, Inc. Methods of detecting cancer based on prostasin
US20050009120A1 (en) * 2000-09-07 2005-01-13 The Brigham And Women's Hospital, Inc. Methods of detecting ovarian cancer based on osteopontin
WO2002066952A2 (en) 2000-10-19 2002-08-29 Target Discovery, Inc Mass defect labeling for the determination of oligomer sequences
AU2002241535B2 (en) * 2000-11-16 2006-05-18 Ciphergen Biosystems, Inc. Method for analyzing mass spectra
US20020115056A1 (en) * 2000-12-26 2002-08-22 Goodlett David R. Rapid and quantitative proteome analysis and related methods
US20030009293A1 (en) * 2001-01-09 2003-01-09 Anderson Norman G. Reference database
US20020155587A1 (en) * 2001-04-20 2002-10-24 Sequenom, Inc. System and method for testing a biological sample
US20020184569A1 (en) * 2001-04-25 2002-12-05 O'neill Michael System and method for using neural nets for analyzing micro-arrays
US20040198950A1 (en) * 2001-04-30 2004-10-07 George Jackowski Biopolymer marker indicative of disease state having a molecular weight of 1518 daltons
EP1425695A2 (en) * 2001-08-13 2004-06-09 Beyong Genomics, Inc. Method and system for profiling biological systems
JP4424988B2 (ja) 2001-09-25 2010-03-03 国立がんセンター総長 新規なスクリーニング法によるがんマーカーの探索
US20020193950A1 (en) * 2002-02-25 2002-12-19 Gavin Edward J. Method for analyzing mass spectra
JP2005527813A (ja) * 2002-04-19 2005-09-15 リージェン バイオテック インコーポレーテッド βig−h3蛋白質の定量方法及びこれを利用した診断キット
US20030204507A1 (en) * 2002-04-25 2003-10-30 Li Jonathan Qiang Classification of rare events with high reliability
EP1508042A4 (en) * 2002-05-02 2008-04-02 Bio Rad Laboratories BIOCHIPS WITH HYDROGELS POLYSACCHARIDBASIS COATED SURFACES
US20040052412A1 (en) * 2002-05-10 2004-03-18 Large Scale Biology Corporation Satellite image enhancement and feature identification using information theory radial-basis bio-marker filter
GB0305796D0 (en) 2002-07-24 2003-04-16 Micromass Ltd Method of mass spectrometry and a mass spectrometer
TW200403434A (en) * 2002-07-29 2004-03-01 Correlogic Systems Inc Quality assurance/quality control for electrospray ionization processes
NZ562192A (en) 2002-08-06 2009-07-31 Ciphergen Biosystems Inc Use of biomarkers for detecting ovarian cancer
EP1565570A4 (en) * 2002-11-12 2005-12-28 Becton Dickinson Co DIAGNOSIS OF SEPTICEMIA OR SIRS USING BIOMARKER PROFILES
BR0316231A (pt) * 2002-11-12 2005-10-04 Becton Dickinson Co Métodos para determinar o estado de sepsia para prognosticar o começo de sepsia e para diagnosticar a sìndrome de resposta inflamatória sistêmica em um indivìduo e para isolar um biomarcador, perfil biomarcador r kit
AU2003291484A1 (en) * 2002-11-12 2004-06-03 Becton, Dickinson And Company Diagnosis of sepsis or sirs using biomarker profiles
EP1739185A1 (en) 2002-12-18 2007-01-03 Ciphergen Biosystems, Inc. Serum biomarkers in lung cancer
WO2004057524A1 (en) * 2002-12-19 2004-07-08 Drexel University Apparatus and method for removing non-discriminatory indices of an indexed dataset
US7288383B2 (en) * 2003-01-15 2007-10-30 The Brigham And Women's Hospital, Inc. Eosinophil-derived neurotoxin as a marker for ovarian cancer
US20040162712A1 (en) * 2003-01-24 2004-08-19 Icagen, Inc. Method for screening compounds using consensus selection
US6909981B2 (en) * 2003-01-27 2005-06-21 Ciphergen Biosystems, Inc. Data management system and method for processing signals from sample spots
DE10304106A1 (de) * 2003-01-31 2004-08-26 Mosaiques Diagnostics And Therapeutics Ag Verfahren und Vorrichtung zur qualitativen und/oder quantitativen Bestimmung eines Protein- und/oder Peptidmusters einer Flüssigkeitsprobe, die dem menschlichen oder tierischen Körper entnommen wird
US20050085740A1 (en) * 2003-04-01 2005-04-21 Davis Cristina E. Non-invasive breath analysis using field asymmetric ion mobility spectrometry
US7470898B2 (en) * 2003-04-01 2008-12-30 The Charles Stark Draper Laboratory, Inc. Monitoring drinking water quality using differential mobility spectrometry
US6906320B2 (en) * 2003-04-02 2005-06-14 Merck & Co., Inc. Mass spectrometry data analysis techniques
US6977370B1 (en) 2003-04-07 2005-12-20 Ciphergen Biosystems, Inc. Off-resonance mid-IR laser desorption ionization
US7425700B2 (en) * 2003-05-22 2008-09-16 Stults John T Systems and methods for discovery and analysis of markers
US20040236603A1 (en) * 2003-05-22 2004-11-25 Biospect, Inc. System of analyzing complex mixtures of biological and other fluids to identify biological state information
US20050255606A1 (en) * 2004-05-13 2005-11-17 Biospect, Inc., A California Corporation Methods for accurate component intensity extraction from separations-mass spectrometry data
US7072772B2 (en) * 2003-06-12 2006-07-04 Predicant Bioscience, Inc. Method and apparatus for modeling mass spectrometer lineshapes
WO2004111609A2 (en) * 2003-06-12 2004-12-23 Predicant Biosciences, Inc. Methods for accurate component intensity extraction from separations-mass spectrometry data
CN1304843C (zh) * 2003-07-02 2007-03-14 许洋 用于生物样品分析的蛋白指纹法
US20050100967A1 (en) * 2003-07-11 2005-05-12 Science & Technology Corporation @ Unm Detection of endometrial pathology
WO2005010492A2 (en) * 2003-07-17 2005-02-03 Yale University Classification of disease states using mass spectrometry data
WO2005011474A2 (en) * 2003-08-01 2005-02-10 Correlogic Systems, Inc. Multiple high-resolution serum proteomic features for ovarian cancer detection
AU2004267806A1 (en) * 2003-08-20 2005-03-03 Bg Medicine, Inc. Methods and systems for profiling biological systems
EP1685259A4 (en) * 2003-10-23 2007-12-12 Univ Pittsburgh BIOMARKERS OF AMYOTROPHIC LATERAL SCLEROSIS
EP1694816B1 (en) 2003-11-07 2013-08-28 Ciphergen Biosystems, Inc. Biomarkers for alzheimer's disease
WO2005048165A2 (en) * 2003-11-12 2005-05-26 Li Mao Method to predict upper aerodigestive tract cancer
US8043825B2 (en) * 2003-12-05 2011-10-25 Mcgill University Serum biomarkers for Chagas disease
CA2548842A1 (en) * 2003-12-11 2005-07-07 Correlogic Systems, Inc. Method of diagnosing biological states through the use of a centralized, adaptive model, and remote sample processing
US8012693B2 (en) 2003-12-16 2011-09-06 3M Innovative Properties Company Analysis of chemically crosslinked cellular samples
JP4069867B2 (ja) * 2004-01-05 2008-04-02 セイコーエプソン株式会社 部材の接合方法
WO2005074481A2 (en) 2004-01-30 2005-08-18 Ciphergen Biosystems, Inc. Method for clustering signals in spectra
US20070087448A1 (en) * 2004-02-16 2007-04-19 Nelsestuen Gary L Biological profiles and methods of use
US7987099B2 (en) * 2004-02-27 2011-07-26 Align Technology, Inc. Dental data mining
US8874452B2 (en) 2004-02-27 2014-10-28 Align Technology, Inc. Method and system for providing dynamic orthodontic assessment and treatment profiles
US7904308B2 (en) 2006-04-18 2011-03-08 Align Technology, Inc. Method and system for providing indexing and cataloguing of orthodontic related treatment profiles and options
US9492245B2 (en) 2004-02-27 2016-11-15 Align Technology, Inc. Method and system for providing dynamic orthodontic assessment and treatment profiles
US11298209B2 (en) 2004-02-27 2022-04-12 Align Technology, Inc. Method and system for providing dynamic orthodontic assessment and treatment profiles
WO2005098446A2 (en) 2004-03-31 2005-10-20 The Johns Hopkins University Biomarkers for ovarian cancer
JP5248854B2 (ja) 2004-04-01 2013-07-31 リポサイエンス,インコーポレイテッド 臨床nmr体外診断解析器の作動方法及び臨床nmr体外診断解析器
CA2564396A1 (en) 2004-04-26 2005-11-03 Children's Medical Center Corporation Platelet biomarkers for the detection of disease
US20050244973A1 (en) * 2004-04-29 2005-11-03 Predicant Biosciences, Inc. Biological patterns for diagnosis and treatment of cancer
US20050269508A1 (en) * 2004-06-03 2005-12-08 Lippa Timothy P Apparatus and methods for detecting compounds using mass spectra
US20060003204A1 (en) * 2004-07-01 2006-01-05 Callahan Christopher W Controlling fuel cell fuel purge in response to recycle fuel blower operating conditions
US7430479B1 (en) * 2004-08-17 2008-09-30 Science Applications International Corporation System and method for analyzing content data
WO2006027321A1 (en) * 2004-09-09 2006-03-16 Universite De Liege Identification and use of biomarkers for the diagnosis and the prognosis of inflammatory diseases.
US7197402B2 (en) * 2004-10-14 2007-03-27 Highchem, Ltd. Determination of molecular structures using tandem mass spectrometry
WO2006060799A2 (en) * 2004-12-02 2006-06-08 University Of Pittsburgh - Of The Commonwealth System Of Higher Education Protein biomarkers and therapeutic targets in an animal model for amyotrophic lateral sclerosis
WO2006071469A2 (en) * 2004-12-02 2006-07-06 University Of Pittsburgh-Of The Commonwealth System Of Higher Education Modulation of the neuroendocrine system as a therapy for amyotrophic lateral sclerosis
JP2008527351A (ja) 2005-01-06 2008-07-24 イースタン バージニア メディカル スクール 前立腺癌のバイオマーカーとしてのアポリポタンパク質a−iiアイソフォーム
US7356521B2 (en) * 2005-01-14 2008-04-08 Siemens Medical Solutions Usa, Inc. System and method for automatic molecular diagnosis of ALS based on boosting classification
US20060157647A1 (en) * 2005-01-18 2006-07-20 Becton, Dickinson And Company Multidimensional liquid chromatography/spectrometry
EP1844322A4 (en) * 2005-01-31 2009-06-10 Insilicos Llc METHOD FOR IDENTIFICATION OF BIOMARKERS BY MEANS OF MASS SPECTROMETRY TECHNIQUES
US20070003996A1 (en) * 2005-02-09 2007-01-04 Hitt Ben A Identification of bacteria and spores
KR20080006617A (ko) * 2005-04-15 2008-01-16 백톤 디킨슨 앤드 컴퍼니 패혈증의 진단
WO2006124628A2 (en) * 2005-05-12 2006-11-23 Correlogic Systems, Inc. A model for classifying a biological sample in relation to breast cancer based on mass spectral data
US7161147B1 (en) * 2005-05-20 2007-01-09 Academia Sinica Biological whole cell mass spectrometer
JP2008542767A (ja) * 2005-06-08 2008-11-27 エムディーエス インコーポレイテッド ドゥーイング ビジネス スルー イッツ エムディーエス サイエックス ディヴィジョン クロマトグラフィ/質量分析のデータ依存データ収集における動的なバックグラウンド信号の排除
WO2006138629A2 (en) * 2005-06-16 2006-12-28 3M Innovative Properties Company Method of classifying chemically crosslinked cellular samples using mass spectra
EP1896493A1 (en) 2005-06-17 2008-03-12 North Carolina A & T State University A device including a proteinaceous factor, a recombinant proteinaceous factor, and a nucleotide sequence encoding the proteinaceous factor
AU2006261904B2 (en) 2005-06-24 2012-05-31 Aspira Women’s Health Inc. Biomarkers for ovarian cancer: beta-2 microglobulin
GB0514553D0 (en) * 2005-07-15 2005-08-24 Nonlinear Dynamics Ltd A method of analysing a representation of a separation pattern
GB0514555D0 (en) 2005-07-15 2005-08-24 Nonlinear Dynamics Ltd A method of analysing separation patterns
US20090215086A1 (en) * 2005-12-12 2009-08-27 Momar Ndao Biomarkers for Babesia
EP2469279A1 (en) 2006-03-11 2012-06-27 The Board Of Trustees Of The Leland Stanford Junior University Cystatin C, lysozyme and beta-2-microglobulin as biomarker for peripheral artery disease
US7756646B2 (en) * 2006-03-31 2010-07-13 Battelle Memorial Institute Method for predicting peptide detection in mass spectrometry
US7736905B2 (en) * 2006-03-31 2010-06-15 Biodesix, Inc. Method and system for determining whether a drug will be effective on a patient with a disease
US8518926B2 (en) * 2006-04-10 2013-08-27 Knopp Neurosciences, Inc. Compositions and methods of using (R)-pramipexole
ATE537826T1 (de) 2006-05-16 2012-01-15 Knopp Neurosciences Inc Zusammensetzungen aus r(+)- und s(-)-pramipexol sowie verfahren zu ihrer anwendung
CN101534933B (zh) 2006-05-26 2013-03-27 沃特世科技公司 关于n维数据的离子检测和参数估计
US7702689B2 (en) * 2006-07-13 2010-04-20 Sap Ag Systems and methods for querying metamodel data
US8524695B2 (en) * 2006-12-14 2013-09-03 Knopp Neurosciences, Inc. Modified release formulations of (6R)-4,5,6,7-tetrahydro-N6-propyl-2,6-benzothiazole-diamine and methods of using the same
WO2008100941A2 (en) * 2007-02-12 2008-08-21 Correlogic Systems Inc. A method for calibrating an analytical instrument
EP2137171A4 (en) 2007-03-14 2010-05-19 Knopp Neurosciences Inc SYNTHESIS OF BENZOTHIAZOLE DIAMINES SUBSTITUTED AND PURIFIED FROM THE CHIRAL PERSPECTIVE
US8221984B2 (en) 2007-03-27 2012-07-17 Vermillion, Inc. Biomarkers for ovarian cancer
WO2008141275A1 (en) 2007-05-11 2008-11-20 The Johns Hopkins University Biomarkers for melanoma
US7878805B2 (en) 2007-05-25 2011-02-01 Align Technology, Inc. Tabbed dental appliance
MY150234A (en) 2007-06-29 2013-12-31 Ahn Gook Pharmaceutical Company Ltd Predictive markers for ovarian cancer
EP2220506B1 (en) 2007-10-29 2013-10-02 Vermillion, Inc. Biomarkers for the detection of early stage ovarian cancer
US8738394B2 (en) 2007-11-08 2014-05-27 Eric E. Kuo Clinical data file
US8108189B2 (en) 2008-03-25 2012-01-31 Align Technologies, Inc. Reconstruction of non-visible part of tooth
JP5072682B2 (ja) * 2008-03-28 2012-11-14 富士フイルム株式会社 質量分析用デバイス、これを用いる質量分析装置および質量分析方法
US8669113B2 (en) 2008-04-03 2014-03-11 Becton, Dickinson And Company Advanced detection of sepsis
US7776522B2 (en) 2008-04-24 2010-08-17 Becton, Dickinson And Company Methods for diagnosing oncogenic human papillomavirus (HPV)
US9492243B2 (en) 2008-05-23 2016-11-15 Align Technology, Inc. Dental implant positioning
US8092215B2 (en) 2008-05-23 2012-01-10 Align Technology, Inc. Smile designer
US8172569B2 (en) 2008-06-12 2012-05-08 Align Technology, Inc. Dental appliance
US20110190356A1 (en) * 2008-08-19 2011-08-04 Knopp Neurosciences Inc. Compositions and Methods of Using (R)- Pramipexole
US8152518B2 (en) 2008-10-08 2012-04-10 Align Technology, Inc. Dental positioning appliance having metallic portion
KR20110110247A (ko) 2008-12-30 2011-10-06 센토코 오르토 바이오테크 인코포레이티드 강직성 척추염 환자에서 항-TNFα 항체에 대한 임상적 반응을 예측하는 혈청 마커
US8292617B2 (en) 2009-03-19 2012-10-23 Align Technology, Inc. Dental wire attachment
US8765031B2 (en) 2009-08-13 2014-07-01 Align Technology, Inc. Method of forming a dental appliance
KR101556726B1 (ko) * 2010-02-24 2015-10-02 바이오디식스, 인크. 질량스펙트럼 분석을 이용한 치료제 투여를 위한 암 환자 선별
US9241774B2 (en) 2010-04-30 2016-01-26 Align Technology, Inc. Patterned dental positioning appliance
US9211166B2 (en) 2010-04-30 2015-12-15 Align Technology, Inc. Individualized orthodontic treatment index
EP2628013B1 (en) 2010-10-14 2019-06-12 The Johns Hopkins University Biomarkers of brain injury
CN102103079B (zh) * 2010-12-31 2013-12-11 聚光科技(杭州)股份有限公司 一种光谱分析方法
JP5673348B2 (ja) * 2011-05-25 2015-02-18 株式会社島津製作所 質量分析データ解析方法及び解析装置
US9403238B2 (en) 2011-09-21 2016-08-02 Align Technology, Inc. Laser cutting
RU2475766C1 (ru) * 2011-11-07 2013-02-20 Марина Витальевна Самойленко Способ определения передаточной функции линейной радиоэлектронной системы
US9512096B2 (en) 2011-12-22 2016-12-06 Knopp Biosciences, LLP Synthesis of amine substituted 4,5,6,7-tetrahydrobenzothiazole compounds
US9375300B2 (en) 2012-02-02 2016-06-28 Align Technology, Inc. Identifying forces on a tooth
US9220580B2 (en) 2012-03-01 2015-12-29 Align Technology, Inc. Determining a dental treatment difficulty
WO2013134771A1 (en) * 2012-03-09 2013-09-12 Torion Technologies, Inc. Deconvolution and identification algorithms for use on spectroscopic data
AU2013259294B2 (en) 2012-05-11 2017-04-06 Synchronicity Pharma, Inc. Carbazole-containing sulfonamides as cryptochrome modulators
US9414897B2 (en) 2012-05-22 2016-08-16 Align Technology, Inc. Adjustment of tooth position in a virtual dental model
US10288626B2 (en) 2012-09-14 2019-05-14 University Of Kentucky Research Foundation Secreted tumor-associated cytochrome as a blood-based biomarker for cancer
EP2914752B1 (en) 2012-11-02 2022-03-09 The Johns Hopkins University Dna methylation biomarkers of post-partum depression risk
US9662313B2 (en) 2013-02-28 2017-05-30 Knopp Biosciences Llc Compositions and methods for treating amyotrophic lateral sclerosis in responders
US10615017B2 (en) * 2013-03-26 2020-04-07 Shimadzu Corporation Mass spectrometer
WO2014182896A1 (en) 2013-05-10 2014-11-13 Johns Hopkins University Compositions for ovarian cancer assessment having improved specificity
CA2918054C (en) 2013-07-11 2022-12-13 The Johns Hopkins University A dna methylation and genotype specific biomarker of suicide attempt and/or suicide ideation
RS61539B1 (sr) 2013-07-12 2021-04-29 Knopp Biosciences Llc Lečenje povišenih nivoa eozinofila i/ili bazofila
US9468630B2 (en) 2013-07-12 2016-10-18 Knopp Biosciences Llc Compositions and methods for treating conditions related to increased eosinophils
EP3022322A4 (en) 2013-07-17 2017-05-17 The Johns Hopkins University A multi-protein biomarker assay for brain injury detection and outcome
ES2813674T3 (es) 2013-08-13 2021-03-24 Knopp Biosciences Llc Composiciones y métodos para el tratamiento de trastornos de células plasmáticas y trastornos prolinfocíticos de células b
CA2921381A1 (en) 2013-08-13 2015-02-19 Knopp Biosciences Llc Compositions and methods for treating chronic urticaria
WO2015120382A1 (en) 2014-02-07 2015-08-13 The Johns Hopkins University Predicting response to epigenetic drug therapy
CN103995042B (zh) * 2014-03-28 2016-09-28 深圳华大基因研究院 一种建立蛋白样品swath离子库的方法
TWI690521B (zh) 2014-04-07 2020-04-11 美商同步製藥公司 作為隱花色素調節劑之含有咔唑之醯胺類、胺基甲酸酯類及脲類
US9570277B2 (en) * 2014-05-13 2017-02-14 University Of Houston System System and method for MALDI-TOF mass spectrometry
US10222386B2 (en) 2014-09-19 2019-03-05 The Johns Hopkins University Biomarkers of congnitive dysfunction
US10449016B2 (en) 2014-09-19 2019-10-22 Align Technology, Inc. Arch adjustment appliance
US9610141B2 (en) 2014-09-19 2017-04-04 Align Technology, Inc. Arch expanding appliance
US11072828B2 (en) 2014-10-06 2021-07-27 The Johns Hopkins University DNA methylation and genotype specific biomarker for predicting post-traumatic stress disorder
DK3210142T3 (da) 2014-10-24 2020-11-16 Koninklijke Philips Nv Vurdering af tgf-cellulær signaleringsvejaktivitet under anvendelse af matematisk modellering af målgenekspression
CN108064311B (zh) 2014-10-24 2022-10-28 皇家飞利浦有限公司 使用多种细胞信号传导途径活性的治疗反应的医学预后和预测
ES2838923T3 (es) 2014-10-24 2021-07-02 Koninklijke Philips Nv Pronóstico médico y predicción de la respuesta a tratamiento usando múltiples actividades de la ruta de señalización celular
US9744001B2 (en) 2014-11-13 2017-08-29 Align Technology, Inc. Dental appliance with cavity for an unerupted or erupting tooth
US10504386B2 (en) 2015-01-27 2019-12-10 Align Technology, Inc. Training method and system for oral-cavity-imaging-and-modeling equipment
WO2016134365A1 (en) 2015-02-20 2016-08-25 The Johns Hopkins University Biomarkers of myocardial injury
US10094713B2 (en) * 2015-04-22 2018-10-09 The Boeing Company Hyperspectral demixing using foveated compressive projections
WO2017029215A1 (en) 2015-08-14 2017-02-23 Koninklijke Philips N.V. Assessment of nfkb cellular signaling pathway activity using mathematical modelling of target gene expression
US11931222B2 (en) 2015-11-12 2024-03-19 Align Technology, Inc. Dental attachment formation structures
US11554000B2 (en) 2015-11-12 2023-01-17 Align Technology, Inc. Dental attachment formation structure
US11596502B2 (en) 2015-12-09 2023-03-07 Align Technology, Inc. Dental attachment placement structure
US11103330B2 (en) 2015-12-09 2021-08-31 Align Technology, Inc. Dental attachment placement structure
JP7057913B2 (ja) * 2016-06-09 2022-04-21 株式会社島津製作所 ビッグデータ解析方法及び該解析方法を利用した質量分析システム
US10470847B2 (en) 2016-06-17 2019-11-12 Align Technology, Inc. Intraoral appliances with sensing
EP3988048B1 (en) 2016-06-17 2024-01-17 Align Technology, Inc. Orthodontic appliance performance monitor
JP2019523064A (ja) 2016-07-27 2019-08-22 アライン テクノロジー, インコーポレイテッド 歯科診断機能を有する口腔内スキャナ
WO2018045208A1 (en) * 2016-09-02 2018-03-08 Board Of Regents, The University Of Texas System Collection probe and methods for the use thereof
CN113834869A (zh) * 2016-09-02 2021-12-24 得克萨斯大学体系董事会 收集探针及其使用方法
CN117257492A (zh) 2016-11-04 2023-12-22 阿莱恩技术有限公司 用于牙齿图像的方法和装置
CN113440273A (zh) 2016-12-02 2021-09-28 阿莱恩技术有限公司 一系列腭扩张器及其形成方法和形成设备
EP3547952B1 (en) 2016-12-02 2020-11-04 Align Technology, Inc. Palatal expander
US11026831B2 (en) 2016-12-02 2021-06-08 Align Technology, Inc. Dental appliance features for speech enhancement
WO2018102770A1 (en) 2016-12-02 2018-06-07 Align Technology, Inc. Force control, stop mechanism, regulating structure of removable arch adjustment appliance
US10548700B2 (en) 2016-12-16 2020-02-04 Align Technology, Inc. Dental appliance etch template
US10779718B2 (en) 2017-02-13 2020-09-22 Align Technology, Inc. Cheek retractor and mobile device holder
US12090020B2 (en) 2017-03-27 2024-09-17 Align Technology, Inc. Apparatuses and methods assisting in dental therapies
US10613515B2 (en) 2017-03-31 2020-04-07 Align Technology, Inc. Orthodontic appliances including at least partially un-erupted teeth and method of forming them
US11045283B2 (en) 2017-06-09 2021-06-29 Align Technology, Inc. Palatal expander with skeletal anchorage devices
WO2018232299A1 (en) 2017-06-16 2018-12-20 Align Technology, Inc. Automatic detection of tooth type and eruption status
WO2018236120A1 (ko) * 2017-06-23 2018-12-27 주식회사 에이엠아이티 네거티브 마커를 이용한 유사 종 식별 방법 및 장치
US10639134B2 (en) 2017-06-26 2020-05-05 Align Technology, Inc. Biosensor performance indicator for intraoral appliances
US10885521B2 (en) 2017-07-17 2021-01-05 Align Technology, Inc. Method and apparatuses for interactive ordering of dental aligners
WO2019018784A1 (en) 2017-07-21 2019-01-24 Align Technology, Inc. ANCHOR OF CONTOUR PALATIN
EP3658067B1 (en) 2017-07-27 2023-10-25 Align Technology, Inc. System and methods for processing an orthodontic aligner by means of an optical coherence tomography
CN110996842B (zh) 2017-07-27 2022-10-14 阿莱恩技术有限公司 牙齿着色、透明度和上釉
US11116605B2 (en) 2017-08-15 2021-09-14 Align Technology, Inc. Buccal corridor assessment and computation
WO2019036677A1 (en) 2017-08-17 2019-02-21 Align Technology, Inc. SURVEILLANCE OF CONFORMITY OF DENTAL DEVICE
EP3461915A1 (en) 2017-10-02 2019-04-03 Koninklijke Philips N.V. Assessment of jak-stat1/2 cellular signaling pathway activity using mathematical modelling of target gene expression
US10813720B2 (en) 2017-10-05 2020-10-27 Align Technology, Inc. Interproximal reduction templates
WO2019084326A1 (en) 2017-10-27 2019-05-02 Align Technology, Inc. OTHER BORE ADJUSTMENT STRUCTURES
CN111295153B (zh) 2017-10-31 2023-06-16 阿莱恩技术有限公司 具有选择性牙合负荷和受控牙尖交错的牙科器具
EP3703607A2 (en) 2017-11-01 2020-09-09 Align Technology, Inc. Automatic treatment planning
WO2019094507A1 (en) * 2017-11-10 2019-05-16 Pataigin, Llc Method for data analysis
US11534974B2 (en) 2017-11-17 2022-12-27 Align Technology, Inc. Customized fabrication of orthodontic retainers based on patient anatomy
CA3083260A1 (en) 2017-11-27 2019-05-31 Board Of Regents, The University Of Texas System Minimally invasive collection probe and methods for the use thereof
US11219506B2 (en) 2017-11-30 2022-01-11 Align Technology, Inc. Sensors for monitoring oral appliances
WO2019118876A1 (en) 2017-12-15 2019-06-20 Align Technology, Inc. Closed loop adaptive orthodontic treatment methods and apparatuses
EP3502279A1 (en) 2017-12-20 2019-06-26 Koninklijke Philips N.V. Assessment of mapk-ap 1 cellular signaling pathway activity using mathematical modelling of target gene expression
WO2019133717A1 (en) 2017-12-29 2019-07-04 Abbott Laboratories Novel biomarkers and methods for diagnosing and evaluating traumatic brain injury
US10980613B2 (en) 2017-12-29 2021-04-20 Align Technology, Inc. Augmented reality enhancements for dental practitioners
KR20200115580A (ko) 2018-01-26 2020-10-07 얼라인 테크널러지, 인크. 구강 내 진단 스캔 및 추적
US11937991B2 (en) 2018-03-27 2024-03-26 Align Technology, Inc. Dental attachment placement structure
EP3773320B1 (en) 2018-04-11 2024-05-15 Align Technology, Inc. Releasable palatal expanders
EP3788377A1 (en) 2018-05-04 2021-03-10 Abbott Laboratories Hbv diagnostic, prognostic, and therapeutic methods and products
US10957523B2 (en) 2018-06-08 2021-03-23 Thermo Finnigan Llc 3D mass spectrometry predictive classification
CN110895799B (zh) * 2018-09-13 2023-05-09 岛津分析技术研发(上海)有限公司 提高质谱谱图质量的方法、计算机存储介质、以及电子终端
US20220146495A1 (en) 2019-02-27 2022-05-12 Epiaxis Therapeutics Pty Ltd Methods and agents for assessing t-cell function and predicting response to therapy
CA3146525A1 (en) 2019-08-05 2021-02-11 William Manning Systems and methods for sample preparation, data generation, and protein corona analysis
CN111292291B (zh) * 2020-01-15 2024-02-02 李东航 一种基于pca或m波段小波域的癌症ct图像判断装置
CN113484400B (zh) * 2021-07-01 2022-11-22 上海交通大学 基于机器学习的质谱图分子式计算方法
WO2023122723A1 (en) 2021-12-23 2023-06-29 The Broad Institute, Inc. Panels and methods for diagnosing and treating lung cancer
WO2024044578A1 (en) 2022-08-22 2024-02-29 University Of Virginia Dna methylation biomarkers of premenstrual dysphoric disorder and perimenopausal depression

Family Cites Families (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4075475A (en) * 1976-05-03 1978-02-21 Chemetron Corporation Programmed thermal degradation-mass spectrometry analysis method facilitating identification of a biological specimen
US5697369A (en) 1988-12-22 1997-12-16 Biofield Corp. Method and apparatus for disease, injury and bodily condition screening or sensing
AU7563191A (en) 1990-03-28 1991-10-21 John R. Koza Non-linear genetic algorithms for solving problems by finding a fit composition of functions
US5790761A (en) 1992-12-11 1998-08-04 Heseltine; Gary L. Method and apparatus for the diagnosis of colorectal cancer
US6025128A (en) 1994-09-29 2000-02-15 The University Of Tulsa Prediction of prostate cancer progression by analysis of selected predictive parameters
WO1996037777A1 (en) * 1995-05-23 1996-11-28 Nelson Randall W Mass spectrometric immunoassay
GB2301897B (en) 1995-06-08 1999-05-26 Univ Wales Aberystwyth The Composition analysis
US5716825A (en) * 1995-11-01 1998-02-10 Hewlett Packard Company Integrated nucleic acid analysis system for MALDI-TOF MS
US5687716A (en) 1995-11-15 1997-11-18 Kaufmann; Peter Selective differentiating diagnostic process based on broad data bases
US5839438A (en) 1996-09-10 1998-11-24 Neuralmed, Inc. Computer-based neural network system and method for medical diagnosis and interpretation
US6157921A (en) 1998-05-01 2000-12-05 Barnhill Technologies, Llc Enhancing knowledge discovery using support vector machines in a distributed network environment
WO1998047087A1 (en) * 1997-04-17 1998-10-22 Glaxo Group Ltd. Statistical deconvoluting of mixtures
US6674070B2 (en) * 1997-05-23 2004-01-06 Northeastern University On-line and off-line deposition of liquid samples for matrix assisted laser desorption ionization-time of flight (MALDI-TOF) mass spectroscopy
US6825463B2 (en) * 1997-05-23 2004-11-30 Northeastern University On-line and off-line deposition of liquid samples for matrix assisted laser desorption ionization-time of flight (MALDI-TOF) mass spectroscopy
JP2002502543A (ja) * 1997-05-23 2002-01-22 ノースイースタン ユニバーシティ マトリクス支援レーザ離脱イオン化−飛翔時間(maldi−tof)質量分光用のオンライン液体試料析出インターフェース
US5905258A (en) 1997-06-02 1999-05-18 Advanced Research & Techology Institute Hybrid ion mobility and mass spectrometer
US6723564B2 (en) * 1998-05-07 2004-04-20 Sequenom, Inc. IR MALDI mass spectrometry of nucleic acids using liquid matrices
US6289287B1 (en) * 1999-01-29 2001-09-11 Agilent Technologies, Inc. Identification of sample component using a mass sensor system
US20020009394A1 (en) * 1999-04-02 2002-01-24 Hubert Koster Automated process line
US6647343B1 (en) * 1999-04-29 2003-11-11 Agilent Technologies, Inc. Temporal profile analysis of mass data in a mass sensor system
US6391649B1 (en) * 1999-05-04 2002-05-21 The Rockefeller University Method for the comparative quantitative analysis of proteins and other biological material by isotopic labeling and mass spectroscopy
US6329652B1 (en) * 1999-07-28 2001-12-11 Eastman Kodak Company Method for comparison of similar samples in liquid chromatography/mass spectrometry
AU7586100A (en) 1999-09-17 2001-04-17 Affymetrix, Inc. Method of cluster analysis of gene expression profiles
EP2357582A1 (en) 1999-10-27 2011-08-17 Health Discovery Corporation Methods and devices for identifying patterns in biological systems
AU1350501A (en) 1999-10-27 2001-05-08 Barnhill Technologies, Llc Methods and devices for identifying patterns in biological systems and methods for uses thereof
DE10021737C2 (de) * 2000-05-04 2002-10-17 Hermann Haller Verfahren und Vorrichtung zur qualitativen und/oder quantitativen Bestimmung eines Protein- und/oder Peptidmusters einer Flüssigkeitsprobe, die dem menschlichen oder tierischen Körper entnommen wird
US7158862B2 (en) * 2000-06-12 2007-01-02 The Arizona Board Of Regents On Behalf Of The University Of Arizona Method and system for mining mass spectral data
CN1741036A (zh) 2000-06-19 2006-03-01 科雷洛吉克系统公司 构造分类属于不同状态的生物样本的模型的方法
US6925389B2 (en) 2000-07-18 2005-08-02 Correlogic Systems, Inc., Process for discriminating between biological states based on hidden patterns from biological data
AU2002241535B2 (en) * 2000-11-16 2006-05-18 Ciphergen Biosystems, Inc. Method for analyzing mass spectra
EP1459235B1 (en) 2001-01-24 2011-01-19 Health Discovery Corporation Methods of identifying patterns in biological systems and uses thereof
US20020160420A1 (en) 2001-04-30 2002-10-31 George Jackowski Process for diagnosis of physiological conditions by characterization of proteomic materials
US20020193950A1 (en) 2002-02-25 2002-12-19 Gavin Edward J. Method for analyzing mass spectra

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104380311A (zh) * 2012-04-10 2015-02-25 拜斯帕尔有限公司 依据谱数据的样本分类方法、创建数据库的方法和使用该数据库的方法、以及相应的计算机程序、数据存储介质和系统
CN104380311B (zh) * 2012-04-10 2018-06-26 拜斯帕尔有限公司 依据谱数据的样本分类方法、创建数据库的方法和使用该数据库的方法、以及相应的系统
CN113567605A (zh) * 2021-08-16 2021-10-29 苏恺明 质量色谱图的自动化解释模型构建方法、装置和电子设备

Also Published As

Publication number Publication date
CA2429633A1 (en) 2002-05-30
WO2002042733A9 (en) 2003-04-24
US20040059530A1 (en) 2004-03-25
AU2002245043B2 (en) 2006-10-26
US6675104B2 (en) 2004-01-06
WO2003031031A1 (en) 2003-04-17
EP1355727A1 (en) 2003-10-29
WO2002042733A2 (en) 2002-05-30
EP1337845A4 (en) 2007-04-11
EP1337845A2 (en) 2003-08-27
CN1623091A (zh) 2005-06-01
JP2004536276A (ja) 2004-12-02
US20020138208A1 (en) 2002-09-26
EP1355727A4 (en) 2007-04-11
CN1262337C (zh) 2006-07-05
ATE540421T1 (de) 2012-01-15
AU2002241535B2 (en) 2006-05-18
JP2004522980A (ja) 2004-07-29
AU4153502A (en) 2002-06-03
EP1337845B1 (en) 2012-01-04
US7027933B2 (en) 2006-04-11
WO2002042733A3 (en) 2003-02-27
AU2002241535C1 (en) 2002-06-03
AU2002245043A1 (en) 2003-04-22
CA2429327A1 (en) 2003-04-17

Similar Documents

Publication Publication Date Title
CN1262337C (zh) 质谱分析方法
US20020193950A1 (en) Method for analyzing mass spectra
JP7057913B2 (ja) ビッグデータ解析方法及び該解析方法を利用した質量分析システム
AU2002241535A1 (en) Method for analyzing mass spectra
US6909981B2 (en) Data management system and method for processing signals from sample spots
US6925389B2 (en) Process for discriminating between biological states based on hidden patterns from biological data
Conrads et al. High-resolution serum proteomic features for ovarian cancer detection.
KR101068732B1 (ko) 약물이 질환에 걸린 환자에 효과적일지의 여부를 결정하기 위한 방법 및 시스템
CN110139702A (zh) 利用基质辅助激光解吸/离子化飞行时间质谱仪进行分类数据操控
CN115424666A (zh) 一种基于全基因组重亚硫酸盐测序数据筛选泛癌早筛分子标志物的方法及系统
CN101354734A (zh) 质谱分析方法
US20240321448A1 (en) Artificial intelligence for identifying one or more predictive biomarkers

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
AV01 Patent right actively abandoned
AV01 Patent right actively abandoned
C20 Patent right or utility model deemed to be abandoned or is abandoned