CN1636068A - 将基因表达谱与蛋白质表达谱相关联的方法 - Google Patents

将基因表达谱与蛋白质表达谱相关联的方法 Download PDF

Info

Publication number
CN1636068A
CN1636068A CNA028064798A CN02806479A CN1636068A CN 1636068 A CN1636068 A CN 1636068A CN A028064798 A CNA028064798 A CN A028064798A CN 02806479 A CN02806479 A CN 02806479A CN 1636068 A CN1636068 A CN 1636068A
Authority
CN
China
Prior art keywords
sample
polypeptide
sorbent material
analyte
mrna
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA028064798A
Other languages
English (en)
Inventor
W·E·里奇
T·W·赫琴斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Aspira Womens Health Inc
Original Assignee
Ciphergen Biosystems Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ciphergen Biosystems Inc filed Critical Ciphergen Biosystems Inc
Publication of CN1636068A publication Critical patent/CN1636068A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6809Methods for determination or identification of nucleic acids involving differential detection
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10TTECHNICAL SUBJECTS COVERED BY FORMER US CLASSIFICATION
    • Y10T436/00Chemistry: analytical and immunological testing
    • Y10T436/24Nuclear magnetic resonance, electron spin resonance or other spin effects or mass spectrometry

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Zoology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Analytical Chemistry (AREA)
  • Microbiology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Immunology (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)

Abstract

本发明涉及将细胞中基因和蛋白表达相关联的方法。

Description

将基因表达谱与蛋白质 表达谱相关联的方法
                 相关申请的交叉引用
本申请要求于2001年2月16日申请的USSN 60/269,772的优先权,将其全文并入此处作为参考。
关于在联邦政府资助研发下做出的发明的权利的声明
不适用。
                      发明背景
基因组学是对一种物种全部的基因(基因组)进行的研究,以及对那些基因在不同和相同细胞中,随时间及发育的各个阶段,在各种环境条件下的功能和活性进行的研究。不同的基因功能和活性对细胞在体内发展出专门的活性、以及健康细胞向病理细胞的转变起着重要的作用。
在细胞中遗传信息的表达是通过转录中间体分子mRNA而进行的。细胞将表达的mRNA翻译成多肽或蛋白质。蛋白质会实现基因编码的大多数功能。对一种物种的全部蛋白质(蛋白组),以及那些蛋白质在细胞中的活性和功能进行的研究是一个新的生物学领域的主题,叫做“蛋白质组学(proteomics)”。
因为细胞的特性取决于该细胞表达的基因,因此制作基因表达谱已成为基因组学中的重要手段。制作基因表达谱设法测定在细胞中哪些基因被表达以及其表达水平。因此,细胞的基因表达谱(expression profile)就可提供细胞特征性的″指纹″,指示着该细胞的身份及其活性。比较不同细胞的基因表达谱的方法叫做“差异基因表达”。该方法可提供基因的信息,所述基因负责细胞的不同表型。在健康及病理性细胞中差异表达的基因可作为诊断标记和候选靶物质用于治疗性干预。因此,获得不同细胞类型的准确基因表达谱是一个重要的目标。
目前有许多方法用于制备细胞基因表达谱。这些方法包括传统方法,如Northern印记,RT-PCR,核酸酶保护,差异显示,cDNA指纹图谱,及减法杂交,以及更新的方法,如产生已表达序列标志,或“EST”文库和阵列,cDNA阵列,mRNA阵列,寡核苷酸阵列,和基因表达系列分析(serial analysis)或“SAGE”(通常参见Lockhar& Winzeler,Nature 405:827-836(2000);还可参见Velculeseu等,Science 270:484-487(1995))。
在一个实例中,使用核酸阵列,如寡核苷酸阵列用于绘制表达谱。这些阵列是特别选择的寡核苷酸的集合,这些寡核苷酸与固体支持物在预先确定的可寻址位置结合。在一些实施方式中,这些阵列包含寡核苷酸,其能够特异地识别一个基因组中每一个已知的基因。来自细胞的信使RNA或cDNA被应用于该阵列。每个mRNA或cDNA都可与相应于特定基因的寡核苷酸杂交,该mRNA或cDNA是由所述基因转录而形成。由于每个固定的寡核苷酸的身份(identity)和位置是预先确定的,因此每个杂交事件都表明:该细胞已经表达了特定的基因。一个商品化的寡核苷酸阵列是来自Affymetrix的GeneChipTM。还有另一个商品化阵列方法范例:用阵列或细胞包被珠子,每个珠子都与一个光学传感分子相连。将珠子吸入光导纤维束纤维的末端孔内以提供地址(例如参见Bead arrayTM(Illumina))。在另一实例中,可从EST文库产生阵列。EST文库通过反向转录在细胞中被表达的一套mRNA而产生。经常并不用反向转录整个的mRNA,而是转录其中的一部分,该部分足以专一性地标识出表达该mRNA的基因。测序并在基因组数据库中鉴定EST。
尽管现有基因表达技术的有力的,但仍应承认mRNA转录的水平并不总是直接与蛋白质表达的水平相关,这有许多理由:(1)不同的mRNA可能以不同的效率被翻译成多肽;(2)在不同细胞中一个mRNA可能被差别性地拼接而产生不同的蛋白质;(3)表达的多肽可能以不同的速率降解;以及(4)多肽可经受翻译后修饰,所以同一个多肽可能在相同和不同的细胞中呈现不同的形式或功能。因此,有必要将mRNA的表达与蛋白质表达相互关联起来(例如参见,Hancock等,Anal.Chem.News & Features,1999年11月1日,742A-748A页;Nelson等,Electrophoresis 21:1823-1831(2000))。
同时,当前的蛋白质表达谱绘制(expression profiling)方法,如质谱分析法,2D凝胶电泳和层析法在灵敏度和分辨率上都有一些限制(例如参见,Pandey & Mann,Nature 405:837-846(2000))。所以本发明通过将绘制基因表达谱和蛋白质图谱相结合来解决这个问题,以在特殊的细胞类型中更快速精确地鉴定目的蛋白质。基因表达谱被用于选择在细胞中表达的候选的转录本。该转录本典型地被测序并用于推断该编码蛋白质的氨基酸序列。然后将氨基酸序列用于预测及鉴定该转录本所编码的蛋白质的理化特征,例如分子量,等电点,疏水性,亲水性,糖基化作用,磷酸化作用,表位序列,配体结合序列,指定pH下的电荷,或金属螯合物结合。然后利用这些理化特征来改进蛋白质图谱绘制的灵敏度及分辨率,从而更好地提供在特定细胞类型中表达的mRNA所编码的蛋白质的相关信息。本发明提供用于形成这种相互关系的方法,并同时具有其它优点。
                      发明概述
因此,本发明提供将基因表达与蛋白质表达相互关联的方法。该方法包括制备样品的基因表达谱,选择一个或多个表达的基因用于进一步的研究,测定这些基因所编码的蛋白质的特征性理化特性,并在样品的蛋白质表达谱中将这些理化特性作为标识,确定这些蛋白质在样品中是否表达。在某些实施方式中,选择的基因在两个目的细胞或样品中,例如,在一个健康细胞和一个病理性细胞,或者处于细胞周期、成熟或分化途径的不同阶段的两个细胞,或处于不同环境条件下的两个细胞中被差异表达。在一个优选实施方式中,使用质谱法分级分离蛋白质。在另一个优选实施方式中,使用SELDI(表面增强的激光解吸电离)(surface enhanced laser desorptionionization)分级分离蛋白质。
因此,本发明的方法可用于鉴定靶蛋白质以进行药物开发,以及用于鉴定诊断标记和疾病的状态,所述疾病如癌症如前列腺,乳腺,肺,膀胱,卵巢,结肠,脑和肾的癌症;癌转移;糖尿病(包括幼年型和成年型(late-onset));自身免疫疾病,如类风湿性关节炎和多发性硬化症;心脏病,例如心肌梗死,动脉粥样硬化,和心肌病;脑血管疾病,例如中风;肾病;肺病,例如肺气肿;病毒性感染,例如HIV,HCV,CMV,HPV,HBV;细菌性感染,例如结核分枝杆菌(M.tuberculosis),产毒性大肠杆菌(E.coli),链球菌属(Streptococcus sp.),葡萄球菌属(Staphylococcus sp.);真菌性感染;原生动物感染,例如疟疾,血吸虫病,查加斯病。本发明的方法还可用于研究不同等位基因的表达产物,例如用于药物遗传学应用。本发明的方法还可用于毒理学研究,以及用于研究细胞暴露在变化的环境条件,例如辐射,紫外辐射,热,以及冷中的影响。
                      附图说明
不适用。
                      发明详述
引言
本发明提供将RNA和蛋白质表达谱制备相结合的方法,用于鉴定不同条件下细胞所表达的基因和蛋白质,所述不同条件为例如细胞周期的不同时期,变化的环境条件(例如离子流入或者流出;暴露于以下物质:毒素;药物;配体;例如激素,细胞因子,或趋化因子;或者病原体,例如病毒,细菌,原生动物,或者真菌),变化的病理学条件例如癌症,成熟和分化过程中的不同时期,生物体发育的不同时期,应答的过程(例如炎症)中,不同的组织类型或器官,不同的病理学条件如癌症或自体免疫疾病,不同表型性状的个体之间,例如对特定药物有反应的个体和没有反应的个体之间,等等。例如,本发明的方法可允许本领域技术人员鉴定在细胞或生物样品中表达的一系列候选基因,然后使用本发明方法进一步鉴定目的基因所编码的目的蛋白子集。本发明的方法还可将涉及mRNA表达的信息与该mRNA所编码的蛋白的表达和功能相结合。
因此本发明提供一种使细胞中基因和蛋白的表达相互关联的方法,包括以下步骤:获取生物样品;产生样品的基因表达谱,从而鉴定样品中表达的一个或多个mRNA;预测并鉴定该RNA所编码的多肽的一个或多个理化特性;并通过分级分离样品中的多肽,鉴定该mRNA所编码的一个或多个多肽,即样品中具备所述的理化特性的多肽,从而使样品中基因和蛋白的表达相互关联。
在一个实施方式中,产生基因表达谱的步骤包括用EST阵列、mRNA阵列或寡核苷酸阵列鉴定表达的mRNA。
在另一个实施方式中,鉴定多肽的步骤包括使用2-D电泳,层析法,质谱法或SELDI分级分离样品中的多肽。
在另一个实施方式中,理化的特征选自:氨基酸序列,分子量,等电点,疏水性,亲水性,电荷(例如等电点),糖基化作用,磷酸化作用,表位序列或抗体结合,配体结合,染料结合,以及金属螯合物结合。在另一个实施方式中,鉴定理化特征的步骤包括预测在利用选定的蛋白水解试剂降解该编码多肽后所产生的蛋白水解片段的质量,且鉴定多肽的步骤包括用该试剂降解样品中的多肽,并鉴定样品中质量对应于预测片段的质量的实际蛋白水解片段。
在另一个实施方式中,样品包括人类细胞。在另一个实施方式中,样品包括来自正常或健康细胞的细胞溶解物。在另一个实施方式中,样品包括来自病理性细胞的细胞溶解物。在另一个实施方式中,样品包括与有毒化合物接触过的细胞的细胞溶解物。在另一个实施方式中,生物样品包括受检者细胞的细胞溶解物,所述受检者对药物处理有反应或对药物处理没有反应。
在一个实施方式中,样品是人体的组织。在另一个实施方式中,mRNA在两个生物样品中差异表达。在另一个实施方式中,两个生物样品是正常或健康细胞以及病理性细胞,例如癌细胞。在另一个实施方式中,两个生物样品来源于健康细胞和毒性化合物接触过的细胞。在另一个具体实施方式中,样品包括活检组织;培养的细胞,例如转化细胞,来自细胞系的细胞,外植块,或原代培养物;血液,血清,痰,粪便,或尿液。
在本发明的优选方面,该方法包括以下步骤:获取生物样品;使用核酸阵列制备细胞的基因表达谱,从而鉴定该细胞中表达的一个或多个mRNA;鉴定此mRNA所编码多肽的一种或多种理化特性;并用质谱法分级分离样品中的多肽,鉴定出具备所述理化特性的多肽;从而使该细胞中基因和蛋白的表达相互关联。
在本发明的一优选方面,本方法包括以下步骤:
获取含有细胞的生物样品;使用寡核苷酸阵列产生细胞的基因表达谱,从而鉴定该细胞中表达的一个或多个mRNA;鉴定此mRNA所编码多肽的一种或多种理化特性;并用SELDI法分级分离样品中的多肽,鉴定具备此理化特性的多肽,其中的SELDI包括利用亲合力在固相结合的吸附剂上滞留从而达到分级分离,然后用气相离子光谱法(gas phase ion spectrometry)从固相上分级分离滞留的蛋白;从而使该细胞中基因和蛋白的表达相互关联。
在一个实施方式中,该方法包括使用一种以上的方法来鉴定样品中表达的mRNA或蛋白。
在一个实施方式中,利用基因组阵列(genomics arrays)比较管家基因与其它的组织特异性基因的表达。在一个实施方式中,基因组阵列可比较差异水平的基因表达。在一个实施方式中,基因组阵列可比较类似水平的基因表达。
定义
除非另有说明,否则,本文使用的所有专业和科学术语具有本发明所属领域技术人员通常理解的含义。以下参考文献为本领域技术人员提供了本发明所用许多术语的一般定义:Singleton等,Dictionary of Microbiology and Molecular Biology(2nd ed.1994);The Cambridge Dictionary of Science and Technology(Walker ed.,1988);The Glossary of Gehetics,5th Ed.R.Rieger等,(eds.),Springer Verlag(1991);和Hale &Marham,The Harper Collins Dictionary of Biology(1991)。除非另有说明,在本文中使用的以下术语定义为:
“生物样品”指来自病毒,细胞,组织,器官或生物体(真核或原核生物)的样品,包括但不限于细胞,组织或器官溶解物或匀浆物,或体液样品,例如,血液,尿液,痰或脑脊髓液。这种样品包括,但不限于:从人体分离的组织,或源于它们的外植块、原代和转化了的细胞培养物。生物样品还可包括组织的切片,如为组织学目的采取的冰冻切片。生物样品可从真核生物体获得,如真菌,植物,昆虫,原生动物,鸟类,鱼类,爬行动物,优选哺乳动物,如大鼠,小鼠,母牛,狗,豚鼠,或兔,最优选灵长目动物,如黑猩猩或人类。
“生物聚合物”指生物来源的聚合物,例如多肽,多核苷酸,多糖或甘油多酯(polyglycerides)(例如甘油二或三酯)。
“多肽”指由氨基酸残基、其相关天然结构变体及非天然合成类似物通过肽键连接而成的聚合物,及其天然变体和非天然合成类似物。可以用自动多肽合成仪来制备合成多肽。“蛋白质”一般指大的多肽。“肽”一般指短多肽。
“多核苷酸”或“核酸”指由核苷酸单元构成的聚合物。多核苷酸包括诸如脱氧核糖核酸(“DNA”)和核糖核酸(“RNA”)的天然核酸和核酸类似物。核酸类似物包括:含有非天然碱基、或含有以非天然磷酸二酯键(而不是天然磷酸二酯键)与其它核苷酸连接的核苷酸,或含有以非天然磷酸二酯键连接的碱基的核酸类似物。这样,核苷酸类似物包括但不限于:硫代磷酸酯,二硫代磷酸酯,磷酸三酯,氨基磷酸酯,硼烷磷酸酯(boranophosphates),甲基磷酸酯(methylphosphonates),手性-甲基磷酸酯,2-O-甲基核糖核苷酸,肽-核酸(PNA)等等。这些多核苷酸可用例如自动DNA合成仪来合成。“核酸”一般指大的多核苷酸。“寡核苷酸”一般指短的多核苷酸,一般不超过50个核苷酸。应当理解,当用DNA序列(即,A,T,G,C)表示核苷酸序列时,也包括以“U”代替“T”的RNA序列(即,A,U,G,C)。
“可测部分”或“标记”指可以用分光术,光化学,生物化学,免疫化学或化学方法测定的组分。有用的“标记”包括例如,32P,35S,荧光染料,电子密(electron-dense)试剂,酶(例如ELISA中常用的那些),生物素-链霉亲合素,dioxigenin,可以得到其抗血清或单克隆抗体的半抗原和蛋白质,或者序列与靶分子互补的核苷酸分子。这些可测部分通常产生一个可测信号,如放射性,生色性或荧光信号,这些信号可用于确定样品中结合的可测部分的量。  可测部分可通过共价键、离子键,范德华力或氢键掺入或结合引物或探针,例如,掺入放射性核苷酸或可被链霉亲合素识别的生物素化核苷酸。可直接或间接测定可测部分。间接测定可涉及将第二直接可测或间接可测部分与所述可测部分结合。例如,所述可测部分可以是与结合伴侣(partner)的配体,所述结合伴侣为例如作为链霉亲合素的结合伴侣的生物素,或作为能与其特异杂交的互补序列的结合伴侣的一段核苷酸序列。结合伴侣本身可能是直接可测的,例如,抗体本身可被荧光分子标记。结合伴侣也可能是间接可测的,例如,具有互补核苷酸序列的核酸可能是分支DNA分子的一部分,而后者可通过与其它经标记的核酸分子杂交而被检测。(例如参见,Fahrlander &Klausner,BioTechnology 6:1165(1988))。信号定量可通过例如,闪烁计数,密度测定法,或流式细胞计量术来进行。
“分离的”、“纯化的”或“生物纯的”指一种材料,该材料实质上或本质上不含有在其天然状态下通常伴随其的各组分。通常使用分析化学方法测定纯度和均一性,如聚丙烯酰胺凝胶电泳或高效液相色谱法。在制品中占主导地位的蛋白质或核酸实质上是纯化的。特别地,一个分离的核酸是从该基因侧翼的开放阅读框分离出来的核酸,其中所述开放阅读框编码的蛋白质不同于该基因编码的蛋白质。“纯化的”表示核酸或蛋白质在电泳凝胶中基本上只产生一条带。特别地,这指的是该核酸或蛋白质的纯度不低于85%,更优选不低于95%,最优选不低于99%。
“纯化”或“提纯”指去除待纯化组合物中的至少一种杂质。纯化并不要求纯化后的化合物纯度达到100%。
“重组”当用于描述,例如,细胞,核酸,蛋白质,或载体时,指该细胞,核酸,蛋白质或载体通过导入异源核酸或蛋白质或者改变天然核酸或蛋白质而被修饰,或者指来源于如此修饰的细胞的细胞。因此,例如,重组细胞可以表达该细胞的天然(非重组细胞)形式中不存在的基因,或者表达那些原本异常表达、下调表达或根本不表达的天然基因。
“重组多核苷酸”指包含的序列在天然条件下并不连接在一起的多核苷酸。可将扩增或组装而成的重组多核苷酸包含在合适的载体内,再用该载体转化合适的宿主细胞。含有重组多核苷酸的宿主细胞被称为“重组宿主细胞”。然后在重组宿主细胞内表达此基因,产生例如“重组多肽”。重组多核苷酸也可以行使非编码功能(例如启动子,复制起点,核糖体结合位点等)。合适的单细胞宿主包括常用于表达真核或哺乳动物多核苷酸的宿主,包括例如原核细胞如大肠杆菌;以及真核细胞,包括例如真菌,如酵母;还有哺乳动物细胞,包括昆虫细胞(例如Sf9)和动物细胞,如CHO,R1.1,B-W,L-M,非洲绿猴肾细胞(例如COS 1 COS 7,BSC 1,BSC 40和BMT 10)以及培养的人细胞。
“异源”当用于描述核酸的部分时,表明该核酸含有两个或更多子序列,这些子序列在自然界中彼此并不具有相同的亲缘关系。例如,该核酸通常由重组产生,具有两个或更多来自不相关基因的序列,如来自某个来源的启动子和来自另一来源的编码区域,这些序列经排列形成新的功能性核酸。类似地,异源蛋白质指含有两个或更多子序列的蛋白质,这些子序列在自然界中并没有相同的亲缘关系(例如融合蛋白)。
“选择性(或特异性)杂交”指当序列存在于复杂混合物(如细胞的总DNA或RNA,或文库DNA或RNA)中时,分子仅仅与特定核苷酸序列在严格杂交条件下结合,形成双链体,或杂交。
“严格杂交条件”指在该条件下探针可以与其目的子序列杂交但不与其它序列杂交,所述子序列通常在复杂的核酸混合物中。严格条件要视序列而定,并且在不同的环境中可以改变。较长的序列在较高的温度下特异杂交。Tijssen,Techniques in Biochemistry andMolecular Biology--Hybridization with Nucleic Probes,″杂交原理和核酸测定策略的综述″(1993)提供了核酸杂交的广义指导。通常,对于特定的序列的严格条件被选择为:在定义的离子强度pH下,比热熔点(Tm)低大约5-10℃的温度。Tm温度是指在该温度下(在指定离子强度,pH,以及核酸浓度下),达平衡时,有50%与靶物质互补的探针与该靶序列杂交(因为靶序列过量存在,故在Tm下达平衡时有50%的探针被占用)。严格条件是指在该条件下,在pH7.0到8.3时,盐浓度低于约1.0M钠离子,通常约为0.01-1.0M钠离子浓度(或其它盐类),对于短探针(如10-50个核苷酸)而言,该温度至少约为30℃,而对长探针(大于50个核苷酸)而言,该温度至少约为60℃。严格条件还可通过加入去稳定剂如甲酰胺而实现。对于高度严格的杂交而言,阳性信号应该不低于背景的两倍,优选为杂交背景的10倍。示范性的高度严格或严格杂交条件包括:50%甲酰胺、5x SSC以及1%SDS在42℃孵育,或5x SSC和1%SDS在65℃孵育,及用0.2x SSC和0.1%SDS在65℃洗涤。对于PCR,大约36℃的温度一般用于低严格扩增,不过退火温度可根据引物长度,在大约32℃-48℃之间变化。对于高度严格的PCR而言,一般是大约62℃的温度,不过高度严格退火温度可根据引物长度和特异性,在大约50℃到大约65℃的范围内变化。高度和低度严格扩增的典型循环条件包括90℃-95℃持续30秒-2min的变性期,退火期维持30秒-2min,延长期大约为72℃持续1-2min。
“多”表示不低于2。
“配体”指与靶分子特异性结合的化合物。
“受体”指与配体特异性结合的化合物。
“抗体”指含有来自免疫球蛋白基因或其片段的框架区域的多肽,其特异性地结合并识别抗原。已知的免疫球蛋白基因包括κ,λ,α,γ,δ,ε和μ恒定区域基因,以及相当多的免疫球蛋白可变区基因。轻链可分成κ或λ类。重链可分成γ,μ,α,δ或者ε类,反过来这些分类又定义了免疫球蛋白类,分别为IgG,IgM,IgA,IgD和IgE。该术语还包括,例如,多克隆、单克隆、单链、人源化的、嵌合的抗体,及其片段。
一个示范性的免疫球蛋白(抗体)结构单位包括一个四聚物。每个四聚物由两对相同的多肽链组成,每对都具有一个“轻”链(大约25kD)和一个“重”链(大约50-70kD)。每条链的N末端都定义了一个大约100-110或更多个氨基酸的可变区,其主要负责识别抗原。术语可变轻链(VL)和可变重链(VH)分别指这些轻链和重链。
抗体能够以例如完整的免疫球蛋白形式存在,或以多种已充分表征的片段形式存在,这些片段是通过用各种肽酶酶切产生的。因此,例如胃蛋白酶消化抗体,作用在绞链区的二硫键下方产生了F(ab)’2,即Fab的二聚物,Fab本身是通过二硫键与VH-CH1相连的一条轻链。这个F(ab)’2在温和条件下可被还原,断裂绞链区的二硫键,从而由F(ab)’2二聚物转换为Fab’单体。Fab’单体实质上是带有部分绞链区的Fab(参见Fundamental Immunology(Paul等,3d ed.1993))。当以完整抗体的消化来定义各种抗体片段时,本领域技术人员可以理解:这种片段可通过化学方法或利用重组DNA方法从头合成。因此,本文所用的术语抗体还包括修饰完整抗体而产生的或用重组DNA方法从头合成的抗体片段(如单链Fv),或者使用噬菌体展示文库鉴定的那些(例如参见McCafferty等,Nature348:552-554(1990))。
可使用本领域已知的任何技术制备单克隆或多克隆抗体(参见,例如Kohler & Milstein,Nature 256:495-497(1975);Kozbor等,Immunology Today 4:72(1983);Cole等,pp.77-96《Monoclonal Antibodies and Cancer Theraputy》,Alan R.Liss,Inc.(1985))。生产单链抗体的方法(U.S.专利4,946,778)可适应性修改用于产生本发明多肽的抗体。同样,转基因小鼠或其它生物体如其它哺乳动物,也可用于表达人源化的抗体。或者可使用噬菌体展示技术鉴定能够特异性地结合选定抗原的抗体和异聚体Fab片段(参见例如McCafferty等,Nature 348:552-554(1990);Marks等,Biotechnology 10:779-783(1992))。
当一个配体或受体(例如一个抗体)可与某种化合分析物“特异性地结合”或“特异性地发生免疫反应”时,此配体或受体将在结合反应中起作用以确定异源化合物样品中是否存在该分析物。因此,在指定的试验(例如免疫测定)条件下,这个配体或受体会优先与特定分析物结合,而不与存在于样品中的其它化合物发生显著量的结合。例如,在杂交条件下,一种多核苷酸会特异地结合含有互补序列的分析物多核苷酸;在免疫测定条件下,一种抗体会特异地结合具有导致生成该抗体的表位的抗原分析物;而一种吸附剂在适当的洗脱条件下会特异地与一种分析物结合。
“试剂”指一种化合物,化合物的混合物,组成尚不确定的样品,小分子组合阵列,生物大分子,噬菌体肽展示文库,噬菌体抗体(例如scFv)展示文库,多核糖体肽展示文库,或由细菌,植物,真菌,或动物细胞或组织等生物材料制备的提取物。合适的技术包括筛选在噬菌体或类似载体中的重组抗体文库(参见例如Huse等,Science 246:1275-1281(1989);和Ward等,Nature 341:544-546(1989))。Huse描述的方案结合噬菌体展示技术会更加有效(参见WO 91/17271和WO 92/01047)。
“表达控制序列”指多核苷酸内的一段调节与其可操作连接的核苷酸序列的表达(转录和/或翻译)的核苷酸序列。“可操作连接″指两个部分之间的一种功能性关系,在这种关系中,一部分的活性(例如,调节转录的能力)对另一部分产生作用(例如序列的转录)。表达调控序列包括但不限于:启动子序列(例如诱导型,抑制型或组成型),增强子,转录终止子,起始密码子(即ATG),内含子的剪接信号和终止密码子。
“表达载体”指包含重组多核苷酸的载体,该多核苷酸又包含与待表达核苷酸序列可操作连接的表达调控序列。表达载体含有充足的表达顺式作用元件;其它表达元件可由宿主细胞或体外表达系统提供。表达载体包括掺入了重组多核苷酸的所有本领域已知的那些,如粘粒,质粒(例如裸露的或被脂质体包被的)和病毒。
“编码”指多核苷酸内特定的核苷酸序列,例如基因,cDNA,或mRNA的固有性质,即其可作为模板在生物过程中合成具有确定核苷酸序列(即rRNA,tRNA和mRNA)或确定氨基酸顺序以及由此带来的生物特性的其它聚合物或大分子。因此,如果在细胞或其它生物系统内由基因产生的mRNA经转录和翻译产生了蛋白质,则称该基因编码该蛋白质。基因或cDNA的编码链(即核苷酸序列与mRNA的序列一致且通常显示在序列表中的链)与非编码链(用作转录模板的链)都可以被认为其编码着该基因或cDNA的蛋白质或其它产物。除非另有说明,“编码氨基酸序列的核苷酸序列”包括编码相同氨基酸序列的所有简并核苷酸序列。编码蛋白质和RNA的核苷酸序列可含有内含子。
“能量吸收分子”指在解吸分光光谱仪(desorptionspectrometer)中从能源吸收能量使得分析物从探头(probe)表面解吸(desorption)的分子。MALDI中所用的能量吸收分子通常称为“基质(matrix)”。在生物有机分子的激光解吸中常用肉桂酸衍生物(如α-4-氰基-羟基-内桂酸),cinnapinic酸和二羟基苯甲酸作为能量吸收分子。
“探头(Probe)”指能够可移动地插入气相离子光谱仪(例如质谱仪)中且包含一个基体(substrate)的装置,所述基体具有一个能够呈递分析物用于进行检测的表面。探头可随分析不同进行修改,并可是一次性的。
“气相离子光谱仪”指一种设备,它测量的参数可以转换成样品挥发及电离时形成的离子的荷质比。通常,由激光解吸/电离生成的离子带有单一电荷,通常简单地将荷质比称作质量。气相离子光谱仪包括例如质谱仪,离子迁移率光谱仪和总离子流测量装置。
“质谱仪”指包括入口系统,电离源,离子光学组件,质量分析仪和检测器的气相离子光谱仪。质谱仪的实例是飞行时间,扇形磁场,四极过滤器(quadrapole filter),离子阱,离子回旋共振质谱仪及其组合。
“激光解吸质谱仪”指用激光作为分析物解吸、挥发和电离的手段的质谱仪。
“质谱法”指通过质谱仪分析样品。
“四极飞行时间质谱仪”指含有碰撞阻尼界面(collisionaldamping interface)的质谱仪,此界面能够在由能量源形成的离子进入四极Q(quadrupole Q)之前对其进行冷却。四极飞行时间质谱仪还可含有碰撞室。
“分析物”指样品中可能需要滞留和检测的组分。它可以表示样品中单一一种组分或一组组分。
“吸附剂”指任何能够吸附分析物的材料。“吸附剂”在此既表示分析物所接触的单独一种物质(“单吸附剂(monoplexadsorbent)”)(如一种化合物或官能团),又表示样品所接触的多种不同物质(“多重吸附剂”(multiplex adsorbent))。多重吸附剂中的吸附性物质称为“吸附剂种类(species)”,例如,基体上的可寻址位置可包含以多种具有不同结合特征的不同吸附剂种类(如阴离子交换材料,金属螯合物或抗体)为特征的多重吸附剂。
“吸附”指用洗脱剂(选择性阈值调节剂)洗涤前或后,吸附剂与分析物之间的可被检测到的结合。
“基体”指吸附剂附着或沉积于之上的固相。
“结合特征”指支配吸附剂吸引分析物的化学和物理特征。如果在相同的洗脱条件下,两种吸附剂结合相同分析物的亲合性程度不同,则这两种吸附剂具有不同的结合特征。结合特征包括,例如:盐促相互作用程度,疏水性相互作用程度,亲水性相互作用程度,静电相互作用程度,以及本文描述的其它特征。
“结合条件”指分析物所接触到的结合特征。
“洗脱剂”指用来介导分析物被吸附剂吸附的物质,一般为溶液。洗脱剂又称“选择性阈值调节剂”。
“洗脱特征”指规定特定洗脱剂(选择性阈值调节剂)介导分析物与吸附剂之间吸附的能力的特征。如果两种洗脱剂与分析物和吸附剂接触时,分析物与吸附剂之间的亲合性程度不同,那么这两种洗脱剂具有不同的洗脱特征。洗脱特征包括,例如:pH,离子强度,水结构的修饰,去污剂强度,疏水性相互作用的修饰及本文描述的其它特征。
“洗脱条件”指分析物所接触到的洗脱特征。
“选择性特征”指具有特定结合特征的吸附剂与具有特定洗脱特征的洗脱剂相结合的特征,它规定了在用洗脱剂洗涤后分析物被吸附剂滞留的特异性。
“选择性条件”指分析物所接触到的选择性特征。
“吸引基础”指使得分子彼此吸引的化学和/或理化特性。
“吸引强度”指分子彼此吸引的强度(又称亲合力)。
“解析”“解析作用”或“分析物的解析”指对样品中至少一种分析物的检测。解析包括通过先分离然后差异性检测来检测样品中的多种分析物。解析不要求将一种分析物与混合物中的其它所有分析物完全分离。而是,任何分离只要能够区分至少两种分析物就足够了。
“高信息量解析”指解析分析物的方式不仅能检测出分析物,还可检测出待评价的分析物的至少一种理化性质,例如分子量。
“解吸光谱法”是一种检测分析物的方法,其中,分析物接触能量后从固定相解吸到气相中,解吸的分析物或其可辩别部分直接被检测器检测,不需要将分析物捕捉到第二固定相上的中间步骤。
“检测”指鉴定待测目标是否存在或其存在量。
“滞留”指经洗脱剂洗涤后分析物被吸附剂所吸附。
“滞留数据”是指示在特定选择性条件下对滞留分析物的检测结果(任选地包括检测质量)的数据。
“滞留图谱”指反映多种选择性条件下滞留分析物的滞留数据的一组值。
“识别图谱”指反映分析物在多种选择性条件下的相对滞留作用的一组值。
“复合体”指两种或更多分析物联合而成的分析物。
“片段”指分析物的化学,酶学或物理降解产物。片段可能是中性的,也可以带有离子。
“差异表达”指分析物的存在在质或量上的可检测差异。
“基因表达谱(gene expression profile)”指对生物样品中表达的至少一种mRNA所进行的鉴定。
“理化特性”指能够表征分子的该分子的物理或化学特性。蛋白质的理化特性包括,但不限于:氨基酸序列,分子量,等电点,疏水性,亲水性,糖基化作用,磷酸化作用,表位序列,配体结合序列,指定pH下的电荷(等电点),染料结合,以及金属螯合物结合。理化特性可用作例如在蛋白质图谱中进行分级或分离的标识或手段。例如:特征氨基酸序列可用于分级、分离或鉴定含有这种序列的多肽,这些序列如六组氨酸序列,配体结合基序或序列,结构域,蛋白酶裂解位点,金属螯合物结合部位,或表位。在另一个实例中,可通过与相应的激酶或磷酸化酶相互作用,或通过比色酶反应,或通过能与多肽的磷酸化部分结合的抗体而分级,分离或鉴定磷酸化多肽。类似地,可通过与结合伴侣的相互作用,或通过能与多肽的糖基化部分结合的抗体,或通过能够识别该碳水化合物的抗体,或通过凝集素或酶学方法而分级、分离或鉴定糖基化多肽。在另一个实例中,根据多肽在指定pH的电荷或其pI或等电点,可以利用具变化pH的缓冲液和溶液或阴离子或阳离子树脂,分级、分离或鉴定多肽。在另一实例中,具变化疏水性的缓冲液、溶液和树脂可根据多肽的疏水性或亲水性用于分级、分离或鉴定多肽。在另一个实例中,多肽或其蛋白水解片段的质量或分子量可用于分离、鉴定或分级该多肽。
“核酸阵列”指具可寻址位置(即以区别性的、可访问(interrogatable)的地址为特征的位置)的阵列,每个可寻址位置均含有一个与其相连的特征性核酸。核酸可以是本文定义的任何核酸,例如天然存在的或合成的核酸,如寡核苷酸或多核苷酸。在寡核苷酸阵列中,该核酸是寡核苷酸(如对应于外显子,EST,或基因的一部分,转录本,或cDNA);在EST阵列中,该核酸是EST或其部分;在mRNA阵列中,该核酸是mRNA或其部分,或相应的cDNA。寡核苷酸的长度可为4,6,8,10或12个核苷酸,或更长,通常为10,30,40或50个核苷酸,甚至长至约100个核苷酸。
基因表达谱绘制
本发明方法的第一个步骤是进行目的样品的基因表达谱绘制。基因表达谱绘制指检测细胞中的一种或多种RNA,优选mRNA的表达。通常在一个单一试验中要检测至少或多达10、100、100、10000或更多种不同的mRNA。在一个具体实施方式中,差异图谱(与另一细胞进行的比较,如具有不同表型的细胞,或处于不同时间或发育阶段的细胞,或暴露于不同环境条件,如物理或化学条件等等下的细胞)可提供关于目的细胞的有价值信息,例如在指定细胞类型中优先地或选择性地表达的基因。目的基因经常在一种细胞中高度表达,而在另一种细胞中却不是。在其它具体实施方式中,在不同的细胞中,目的基因具有类似的表达。在其它具体实施方式中,目的基因在一个细胞中的表达低于在另一个细胞中的表达。
用于检测基因表达的方法(经常但不总是以杂交为基础)包括,例如northern印迹;点印迹;引物延伸;核酸酶保护;减法杂交和使用如羟基磷灰石进行的非双链体分子的分离;溶液杂交;滤膜杂交;扩增技术如RT-PCR及其他PCR相关技术,如差异显示,LCR,AFLP,RAP,等等(例如参见U.S.专利4,683,195和4,683,202;PCR Protocols:A Guide to Methods and Applications(Innis等,编,1990);Liang & Pardee,Science 257:967-971(1992)Hubank & Schatz,Nuc.Acids Res.22:5640-5648(1994);Perucho等,Methods EnzymoL 254:275-290(1995));指纹图谱,例如用限制性核酸内切酶(Ivanova等,Nuc.Acids.Res.23:2954-2958(1995);Kato,Nuc.AcidsRes.23:3685-3690(1995);和Shimkets等,NatureBiotechnology 17:798-803,还可参见US专利No.5,871,697));以及利用结构特异性核酸内切酶(参见,例如Dc Francesco,The Scientist 12:16(1998))。还可以使用质谱法(例如MALDI或SELDI),液相色谱以及毛细管凝胶电泳分析mRNA的表达,如下所述。
关于这些技术的一般性说明,还可参见Sambrook等,MolecularCloning,A Laboratory Manual(2nd ed.1989),参见,例如7.37-7.39,7.53-7.54,7.58-7.66,以及7.71-7.79;Kriegler,Gene Transfer and Expression:A LaboratoryManual(1990);以及Current Protocols in Molecular Biology(Ausubel等,eds.,1994)。
已经发展了可以对大量的核酸样品进行快速表达分析和测序的技术。例如:已经发展了用于高密度且高处理量地进行表达分析的核酸阵列(参见,例如Granjeuad等,BioEssays 21:781-790(1999);Lockhart & Winzeler,Nature 405:827-836(2000))。核酸阵列指大量的(例如成百,成千,上万或更多)核酸探针与固体基质,如尼龙,玻璃,或硅片相连(参见,Fodor等,Science 251:767-773(1991);Brown & Botstein,NatureGenet.21:33-37(1999);Eberwine,Biotechniques 20:584-591(1996))。单个阵列可含有,例如相应于一个完整基因组、或该基因组所表达的所有基因的探针。阵列中的探针可以是DNA寡核苷酸阵列(例如GenChipTM,参见Lipshutz等,Nat.Genet.21:20-24(1999)),mRNA阵列,cDNA阵列,EST阵列,或光导纤维束上的光学编码阵列(例如BeadArrayTM)。应用于该阵列进行表达分析的样品可以是,例如PCR产物,cDNA,mRNA等等。
其它用于快速基因测序和基因表达分析的技术包括,例如SAGE(基因表达的系列分析(serial analysis))。对于SAGE而言,短序列标志(通常约10-14bp)含有的信息即足以专一地鉴定转录本。这些序列标志可以彼此连接以形成较长的连续分子,这些连续分子可被克隆和测序。计数某种特定标记被观察到的次数就可以证实相应转录本的表达水平(参见Velculescu等,Science 270:484-487(1995);Velculescu等,Cell 88(1997);和de Waard等,Gene 226:1-8(1999))。
理化特性
如同本文的描述,这些技术中的每一个都可单独,或相互结合用于鉴定细胞中表达的目的候选基因或候选基因群。使用本领域已知的技术鉴定和分离目的转录本。如此鉴定的转录本被测序,并使用编码的氨基酸序列信息分析其理化特征,例如分子量,等电点,疏水性,亲水性,糖基化作用,磷酸化作用,表位序列,蛋白酶片段化,配体结合序列,指定pH的电荷,以及金属螯合物结合。通常,生物信息学和序列数据库可用于鉴定该转录本所编码的蛋白质的功能。目的基因包括,例如离子通道,受体,例如G蛋白偶联受体,细胞因子,趋化因子,信号转导蛋白质,管家蛋白质,细胞周期调控蛋白质,转录因子,锌指蛋白质,染色质重构蛋白质等等。
如此鉴定的理化特性是将转录本的表达水平与该转录本所编码的蛋白质的表达水平相互关联的工具。使用如下所述的蛋白质分析工具,蛋白质的一种或多种理化特性可用于分级该目的蛋白质,同时减少背景并提高蛋白质检测的灵敏度。如此,可以将细胞中目的候选转录本与细胞中被编码蛋白的表达水平进一步相互关联。这些信息可用于选择小群转录本和蛋白质,以用于例如诊断和治疗性应用。
样品的蛋白质分级分析
然后根据被鉴定的表达mRNA所编码多肽的至少一种理化特性,将样品中的多肽分级分离。例如,多肽的同一性可以指示该多肽预测的物理化学特性。氨基酸序列可以提供该蛋白质预测的分子量。氨基酸序列还可用于预测该多肽的等电点,该多肽是亲水性的还是疏水性的,以及该多肽是否具有金属螯合物结合性能。氨基酸序列同样可以指示该多肽是否含有糖基化作用或磷酸化作用位点。该多肽的翻译后修饰将反映在分子量的改变上。氨基酸序列还可以鉴定表位,表位反过来可以是抗体结合的靶物质。没必要确切测量理化特性;获取一些信息以便在根据该特性将样品分级成多个部分时可预期该多肽将在这些部份中优先分级就可足够了。
然后根据该多肽的理化特性分级分离样品中的多肽。最有用的分离方法是根据分子量分离,因为有很多分离蛋白的方法是根据这个特点进行的,包括例如SDS凝胶电泳和气相离子光谱法,例如质谱法。另一个有用的理化特征是等电点。等电聚焦,亲合层析和在离子交换树脂上固相提取都是根据该特性分级样品中的蛋白。
分级蛋白质的方法可用于检测细胞中选定蛋白质的表达水平。如上所述,通过一种或多种选择的理化特性可以提高分级的灵敏度,降低背景。本文描述的技术可用于检验细胞中表达的一种或多种,以至几十,几百或成千上万种蛋白质。可根据一种或多种理化特性,利用任何一种技术或其组合分级蛋白质。分级的方法包括,例如双向凝胶;毛细管凝胶电泳;质谱法,例如MALDI,SELDI;ICAT(同位素编码的亲合标记,参见Mann,Nature Biotechnology 17:954-955(1999);Gygi等,Nature Biotechnology 17:994-999(1999));层析法,例如凝胶过滤、离子交换、亲合、免疫亲合、以及金属螯合物层析法,HPLC,例如反相、离子交换和分子大小排阻HPLC;western印记;免疫组织化学技术,如ELISA和利用抗体原位筛选等等(参见,Blackstock & Weir,Trends in Biotech.17:121-127(1999);Dutt & Lee,Biochemical Engineering,176-179(April 2000);Page等,Drug Discovery Today,4:55-62(1999);Wang & Hewick,Drug Discovery Today 4:129-133(1999);Regnier等,Trends in Biotech.17:101-106(1999);和Pandey & Mann,Nature 405:837-846(2000))。可使用本领域已知的技术鉴定和分离目的蛋白质。
关于这些技术的一般性说明,还可参见Sambrook等,MolecularCloning,A Laboratoiy Manual(2nd ed.1989);和CunentProtocols in Molecular Biology(Ausubel等,eds.,1994)。
在一个具体实施方式中,双向电泳可用于分级本发明的蛋白质。此技术根据pI和分子量理化特性分级蛋白质。2d(双向)凝胶电泳和本文所述的技术可单独使用,或与其它技术结合使用,如质谱分析法,例如MALDI和SELDI,本文将在以下描述。
在另一个具体实施方式中,如下所述,MALDI是一种根据质量分级蛋白质的质谱分析技术,经常与分子大小和/或亲合层析技术结合以提高分辨率。
在另一个具体实施方式中,如下所述,SELDI是一种将亲合分级和质谱分析偶联在一起的质谱分析技术。根据,例如pI(离子交换树脂和洗涤),抗体结合,糖基化作用,磷酸化作用,组氨酸残基等等的亲合基质或探针可用于SELDI中,与质谱分析相结合,以高分辨率、准确度和灵敏度鉴定蛋白质。当使用此技术时,可以根据转录本所编码蛋白质的理化特性确定可富集候选多肽的亲合基质。
样品的质谱分析
引言
本发明的多肽或其片段可以使用质谱分析方法进行分析。这些方法根据质量分级多肽。在某些具体实施方式中使用了气相离子光谱仪。在其它具体实施方式中,使用了激光解吸/电离质谱法来分析基体结合的吸收剂上的样品。
现代的激光解吸/电离质谱分析(″LDI-MS″)可通过两种主要的变型方式进行:基质辅助的激光解吸/电离(″MALDI″)质谱分析法和表面增强的激光解吸/电离(″SELDI″)。利用激光解吸质谱分析法的质谱仪可进一步与一个四极飞行时间质谱仪相连。在MALDI中,可含有生物分子的分析物与含有基质的溶液混合,然后将一滴该混合液体滴到基体表面上。然后使该基质溶液与生物分子共结晶。将基体插入质谱仪。将激光能量导向基体表面,在该表面上造成生物分子解吸附并离子化,但不会明显地将其碎裂。但是作为一种分析工具,MALDI也有缺陷。它不能提供分级样品的装置,并且基质材料可能会影响检测,特别是对低分子量的分析物而言。例如参见U.S.专利5,118,937(Hillenkamp等),和U.S.专利5,045,694(Beavis & Chait)。
在SELDI中,基体表面被修饰过,因此在解吸过程中该表面是一个活跃参与者。在一个变体方案中,该表面用能和分析物选择性结合的亲合剂衍生化。在另一个变体方案中,该表面用能量吸收分子衍生化,所述能量吸收分子当被激光冲击后并不发生解吸附。在另一个变体方案中,该表面用能够结合分析物并含有光解键的分子衍生化,所述光解键经激光处理会断裂。在每种方法中,衍生化试剂通常定位于应用样品的基体表面特定位点。参见,例如U.S.专利5,719,060和5,6020208(Hutchens & Yip)和WO 98/59360,WO 98/59361,和WO 98/59362(Hutchens & Yip)。可通过,例如使用SELDI亲合表面以捕获分析物,以及向捕获的分析物中加入含有基质的液体来提供能量吸收材料,从而使两种方法相结合。
在某些具体实施方式中,激光解吸/电离质谱仪进一步与一个四极飞行时间质谱仪QqTOF MS相连(参见,例如Krutchinsky等,WO99/38185)。诸如MALDI-QqTOFMS(Knitchiusky等,WO 99/38185;Shevchenko等(2000)AnaL Chem.72:2132-2141),ESI-QqTOF MS(Figeys等,(1998)Rapid Comm’ns.Mass Spec.12-1435-144)以及芯片毛细管电泳(chip-CE)-QqTOF MS(Li等,(2000)Anal.Chem.72:599-609)等方法先前已有描述。
在一个具体实施方式中,使用质谱仪分级本发明的蛋白质样品。在一般的质谱仪中,含有多肽分析物的基体被引入质谱仪的入口系统中。然后通过诸如激光,快速原子轰击,高能等离子体,电喷雾电离,热喷雾电离,液体二次离子MS,场解吸等解吸源,使该分析物解吸附。所产生的解吸附挥发物由直接因该解吸事件而被离子化的预先形成的离子或中性物构成。通过离子光学组件收集所形成的离子,然后使用质量分析仪分散并分析通过的离子。用检测器检测离开质谱分析仪的离子。
然后检测器将检测到的离子信息转化为荷质比。检测标记或其它物质的存在时通常涉及信号强度的检测。这反过来可以反映与基体结合的多肽的数量和特性。质谱分析仪及其技术是本领域技术人员公知的。任何所属技术领域的专业人员都可以理解,质谱仪的任何组分(如解吸源,质量分析仪,检测器等)  均可与本文描述的或本领域已知的其它适当组分结合使用。关于质谱仪的其它信息,参见例如Principles of Instrumental Analysis,3rd ed.,Skoog,Saunders College Publishing,Philadelphia,1985;以及Kirk-Othmer Encyclopedia of Chemical Technology,4th ed.Vol.15(John Wiley & Sons,New York 1995),pp.1071-1094。
在一个具体实施方式中,激光解吸飞行时间质谱仪与本发明的基体共同使用。在激光解吸质谱分析法中,带有结合标记的基体被引入入口系统中。该标记被来自电离源的激光解除吸附并电离为气相。用离子光学组件收集形成的离子,然后在飞行时间质谱分析仪中,离子被加速通过一个短的高压电场然后进入高真空室。在高真空室的远端,被加速的各离子将以不同的时间撞击灵敏检测器的表面。由于飞行时间是离子质量的函数,所以在离子形成和离子检测器撞击之间所经过的时间可用于鉴定是否存在具有特定荷质比的分子。
滞留层析(retentate chromatography)是一种多维度解析样品中分析物的方法。该方法包括(1)在多种不同的吸附剂/洗脱剂组合(“选择性条件”)下将样品中的分析物吸附到基体上和(2)用解吸光谱法检测吸附的分析物的滞留情况。各选择性条件提供分离的第一维度,将吸附分析物与未吸附的那些分离。解吸质谱提供分离的第二维度,根据质量将吸附分析物彼此分离。因为滞留层析涉及使用多种不同的选择性条件,所以可以获得多维度的分离。还可以确定一种或多种分析物在两种选择性条件下的相对吸附。这种多维度分离不仅对分析物且对它们的特征都作了解析。
而且,由此分离的分析物仍然停留在滞留图谱中,易于进一步接受操作以检测例如分析物的结构和/或功能。而且,停留的分析物本身可以用作吸附剂来截留接触基体的其它分析物。总之,本发明提供了一种快速、多维度而且高信息量解析分析物的方法。
本发明方法可采用多种形式。在一个实施方案中,分析物在两个物理上不同的位置被两种不同的吸附剂吸附,每种吸附剂用相同的洗脱剂(选择性阙值调节剂)洗涤。另一实施方案中,分析物在两个不同的物理位置被相同的吸附剂吸附,然后用不同的洗脱剂洗涤。另一实施方案中,分析物在不同的物理位置被两种不同的吸附剂吸附,然后用两种不同的洗脱剂洗涤。另一实施方案中,分析物先用一种吸附剂吸附,用第一洗脱剂洗涤,检测滞留情况:然后用不同的第二洗脱剂洗涤,再检测滞留情况。
进行滞留层析的方法
滞留层析特别适用于分级样品中的多肽。根据该方法,多肽在固相吸附剂上被分级,该吸附剂能够根据特定的理化性质结合多肽。未结合的多肽被洗涤去除。然后通过质谱法进一步分级该滞留的多肽,从而实现了根据至少两种理化特性进行分级。
分新物与选择性条件接触
基体的制备:在滞留层析过程中,被吸附剂滞留的分析物在基体上被呈递给能源。含分析物的样品可以在吸附剂固定于用于向解吸机制呈递分析物的基体上之前或之后与吸附剂接触。为了接触,吸附剂可以是液态或固态(即位于基体上或呈固相)。具体地说,吸附剂的形式可以是溶液,悬浮液,分散体,油包水乳液,水包油乳液,或微乳液(microemulsion)。当吸附剂的形式是悬浮液,分散体,乳液或微乳液时,可以有合适的表面活性剂存在。在这样的实施方案中,可以通过将液态样品与液态吸附剂相互混合来使样品与吸附剂接触。或者,样品可以位于固体支持物上,则可通过含样品的支持物在液体吸附剂中的浸浴、浸泡或浸渍来完成接触。此外,可用液体吸附剂喷洒或洗涤固体支持物上的样品来进行接触。在这种实施方案中,不同吸附剂可用不同容器提供。
在一个实施方案中,吸附剂位于基体上。基体可以是能够结合或固着吸附剂的任何材料。通常,基体由玻璃;陶瓷;导电聚合物(例如炭化PEEK);TEFLON包被的材料;有机聚合物;天然生物聚合物;金属(例如镍,黄铜,钢或铝);薄膜;多孔和无孔交联聚合物珠粒(例如琼脂糖,纤维素或葡聚糖);其它不溶性聚合物;或以上的组合构成。
在一个实施方案中,基体采取可插在解吸检测器内的探头或样品呈递装置的形式。例如,参见图1,基体是条形的。固定在基体上的吸附剂可以呈线形阵列的点形式,每个点各自能与分析物接触。数条基体可连在一起,这样许多吸附剂可形成在限定的各行上具有离散的点的阵列30。基体还可以是板形的,具有水平和垂直行的吸附剂阵列,形成诸如正方形、矩形或圆形等规则的几何图案。
可如下生产探头。基体可以是任何固体材料,例如不锈钢、铝或硅片。然后,可以使用那些允许表面衍生化的材料来包被金属基体。例如,可用二氧化硅、二氧化铁或金包被金属表面。
然后用双官能接头修饰表面。双官能接头一端具有的官能团能够共价结合该表面上的官能团。因此,对于金,该官能团可以是无机氧化物或巯基。接头的另一端通常具有一个氨基官能团。有用的双官能接头包括氨基丙基三乙氧基硅烷或氨基乙基二硫化物。
一旦与表面结合,用作为吸附剂的基团进一步衍生化接头。通常,吸附剂被加在探头上的可寻址位置。在一种探头中,直径约3mm的点排列成正交阵列。吸附剂本身可以是双官能分子的一部分,该双官能分子包含一个与可得氨基反应的基团和另一个作为吸附剂的官能团。官能团包括如正常相(氧化硅),反相(C18脂肪烃),季胺和磺酸酯。还可以用其它双官能分子,例如碳二亚胺和N-羟基琥珀酰亚胺进一步衍生化表面形成预活化坯(blank)。可用生物有机吸附剂(例如核酸,抗体和其它蛋白质配体)将这类坯(blank)官能化。生物聚合物能够通过胺残基或巯基残基结合坯上的官能团。在一个实施方案中,吸附剂与交联聚合物(例如薄膜)结合,交联聚合物本身则通过可得官能团与探头表面结合。这类聚合物包括纤维素,葡聚糖,羧甲基葡聚糖,聚丙烯酰胺和以上的混合物。固定有吸附剂的探头就可供使用了。
在另一实施方案中,吸附剂固定在提供固相的第一基体(例如聚合物或玻璃珠)上,第一基体再位于用于向解吸检测器的解吸能呈递样品的第二基体上。例如,第二基体可以呈板式,在预定的可寻址位置具有一系列孔。这些孔可以作为经吸附剂衍生的第一基体(例如用吸附剂衍生的聚合物珠)的容器。这种实施方案的一个优点是分析物可以在一种物理环境中吸附于第一基体上,再转移到样品呈递基体上进行解吸光谱分析。
通常,将基体改变成适于和本发明方法中的检测器一起用来检测与吸附剂结合并被滞留的分析物。在一个实施方案中,基体以可移动方式插在解吸检测器内,能量源在此击中所述点并解吸分析物。可使基体适当地安装在可水平和/或垂直转移的架子内,从而能水平和/或垂直移动基体以相继使每个预定的吸附剂的可寻址位置位于可接受能量源的访问并检测结合在位置上的分析物的路径中。基体的形式可以是常规的质谱探头。
条、板或探头形式的基体可用常规技术来制造。然后,在与含分析物的样品接触前,吸附剂可直接或间接偶联、装配或沉积在基体上。可用各种合适的固着或固定化方法将吸附剂与基体直接或间接偶联。例如,可用吸附剂衍生基体使得吸附剂通过共价或非共价键与基体直接结合来将吸附剂与基体直接偶联。
吸附剂在基体上的固着可通过多种机制实现。可用制备完全的吸附剂来衍生基体,即将预先制备好的吸附剂与基体连接。或者,可将前体分子固定在基体上,然后再向通过第一前体分子结合在基体上的延长链添加其它前体分子,由此在基体上形成吸附剂。这种在基体上构建吸附剂的方法尤其适用于聚合物,特别是诸如DNA或RNA分子等生物聚合物的吸附剂。可用寡核苷酸芯片技术领域已知的方法,通过向固着于基体上的第一碱基连续添加碱基来制成生物聚合物吸附剂。参见,美国专利5,445,934(Fodor等)。
如图2所示,可在一个基体上偶联少到2种、多达10种,100种,1000种,10000种或更多种吸附剂。吸附剂位点的大小可根据实验设计和实验目的而不同。但是不能超过冲击能源的直径(例如激光点的直径)。连续的位点上可以是相同或不同的吸附剂。有时,宜使同一吸附剂位于基体的多个不同位置,以允许对多种不同的洗脱剂进行评价或保存被吸附的分析物以备待用或参考(或许是在第二处理中)。提供带有多种不同吸附剂的基体就能利用由不同吸附剂与一种样品组合而产生的多种结合特征结合及检测更多种不同的分析物。在基体上用多种不同的吸附剂评价一种样品基本上等同于用不同的层析柱同时进行的多个层析,但是本方法的优点在于只需要一个系统。
当基体包含多种吸附剂时,特别有用的是使吸附剂位于预定的可寻址位置。吸附剂在预定的可定址位置上就能够在预定第一可定址位置用第一洗脱剂洗涤吸附剂,在预定第二可定址位置用第二洗脱剂洗涤吸附剂。由此可在每种洗脱剂以不同方式选择性改变吸附剂结合特征的不同洗脱剂存在下评价一种吸附剂对分析物的结合特征。可寻址位置可排列成各种样式,但以规则图案为宜,例如线形、正交阵列或如圆等规则曲线。同样,当基体包含多种吸附剂时,可就各种不同吸附剂评价一种洗脱剂以评价某给定吸附剂在此洗脱剂存在下的结合特征。还可以在不同洗脱剂存在下评价不同吸附剂的结合特征。
递增或梯度吸附剂表面:通过在基体上合成多个不同的聚合吸附剂,可提供一系列具有不同结合特征的吸附剂。将前体分子固定在基体上,引发聚合反应,然后对各吸附剂在不同完成程度时终止反应,如此可提供不同的聚合吸附剂。还可以与聚合物的末端官能团反应以便用不同的亲合性试剂(例如-NH3或coo-)对其进行不同程度的化学衍生。通过终止聚合或衍生反应产生出聚合或衍生程度不同的吸附剂。不同的聚合或衍生程度使各种不同的聚合吸附剂具有不同的结合特征。该实施方案尤其适合在基体上提供多种不同的生物聚合物吸附剂。
如果需要,可以在反应容器中而不是在基体本身上进行聚合反应。例如,可以在聚合/衍生反应进行过程中从反应器中抽取等份的产物,得到具有不同结合特征的聚合吸附剂。在聚合/衍生反应过程中不同时刻抽取的各等份将表现出不同的聚合/衍生程度,由此得到多种不同的吸附剂。然后,可将不同等份的产物用作具有不同结合特征的吸附剂。或者,可以相继地重复终止反应的步骤,抽取等份的产物,然后重新启动聚合/衍生反应,由此产生多种不同的吸附剂。在不同终止点抽取的产物将具有不同的聚合/衍生程度,由此产生多种具有不同结合特征的吸附剂。
在一个实施方案中,基质是被吸附剂所包被的条形或板形,在其中一种或多种结合特征呈单向或双向梯度改变。例如这样的含吸附剂的条形:其一端为弱疏水性吸附剂,另一端为强疏水性吸附剂。或者这样的板形:其一角为弱疏水性阴离子性,对角为强疏水性阴离子性。这种吸附梯度可用于定性分析分析物。可通过有控喷涂或令材料按时间流经表面从而在梯度方向上逐步完成反应来形成这样的吸附梯度。可以在垂直方向上重复这一过程,从而形成具有不同结合特征的类似或不同吸附剂的正交梯度。
可在吸附剂定位在基体上之前或之后,用能令分析物与吸附剂结合的合适方法让含分析物的样品接触吸附剂。可简单地将吸附剂与样品混合或合并。样品与吸附剂接触可以通过将基体浸浴或浸泡在样品中,或在样品中浸渍基体,或将样品喷涂在基体上,用样品淋洗基体,或使吸附剂接触样品或分析物实现。此外,样品与吸附剂的接触还可以通过将样品溶于某种洗脱剂或与其混合,然后用上述技术(即浸浴,浸泡,浸渍,喷涂或淋洗)使洗脱剂和样品的溶液与吸附剂接触。
分析物与吸附剂接触:在分析物结合吸附剂前先让样品接触洗脱剂,这具有在样品接触吸附剂的同时改变吸附剂选择性的作用。结合吸附剂并因此滞留的样品组分将只包括能够在与样品混合的特定洗脱剂存在下结合吸附剂的那些,而不是在没有改变吸附剂选择性的洗脱特征时能结合吸附剂的所有组分。
样品必须与吸附剂接触足够长的时间以令分析物与吸附剂结合。通常,样品与吸附剂接触约30秒至12小时。较好的是样品与吸附剂接触约30秒至15分钟。
样品接触吸附剂时的温度与具体样品和选用的吸附剂有关。通常,样品在常温常压条件下接触吸附剂,但是有些样品可能需要改变温度(通常在4℃至37℃之间)和压力条件,这可由本领域熟练技术人员方便地加以确定。
本发明方法与常规检测技术相比的另一优点在于本发明能够在非常少量样品上进行许多不同的实验。通常,含数埃摩尔至100皮摩尔分析物的1微升至500微升样品就足以与吸附剂结合了。分析物可在与吸附剂结合后被保存以用于以后的实验,因为没有经历解吸和检测滞留分析物的所有吸附剂位置将仍然保留分析物。所以,如果只有非常小部分样品可供分析,本发明就提供了能够在不同时间用不同吸附剂和/洗脱剂进行多个实验而不浪费样品的优点。
用洗脱剂洗涤吸附剂:在样品与吸附剂接触使得分析物与吸附剂结合后,用洗脱剂洗涤吸附剂。通常,为了进行多维度分析,每个吸附剂位置至少用不同的第一和第二洗脱剂洗涤。洗脱剂洗涤改变了滞留在特定吸附剂上的分析物群。吸附剂的结合特征与洗脱剂的洗脱特性结合形成了选择性条件,控制着洗涤后被吸附剂保留的分析物。所以,洗涤步骤从吸附剂上选择性地去除样品组分。
可用多种技术进行洗涤步骤。例如前文所述,样品可在接触吸附剂前溶于第一洗脱剂或与其混合。样品在接触吸附剂之前或同时接触第一洗脱剂大致上与先让分析物结合吸附剂再用第一洗脱剂洗涤吸附剂的净效果相同。合并后的溶液与吸附剂接触后,可用第二洗脱剂或后继洗脱剂洗涤吸附剂。
洗涤结合有分析物的吸附剂可通过在洗脱剂中浸浴、浸泡、或浸渍带此吸附剂的基体实现;或用洗脱剂淋洗、喷涂或洗涤基体来完成。最好用微流控技术将洗脱剂引入小直径的亲合性试剂位点。
当分析物仅在一个位置上与吸附剂结合,并在洗涤步骤中使用了多种不同的洗脱剂时,可获得有关吸附剂在各种洗脱剂存在下的选择性的信息。用第一洗脱剂洗涤,解吸并检测滞留分析物,然后用第二洗脱剂洗涤,解吸并检测滞留分析物,可通过如此重复在每次用洗脱剂洗涤后测定与一个位置上的吸附剂结合的分析物。可用相同的吸附剂以多种不同的洗脱剂重复洗涤,然后解吸和检测的步骤。如此,可用多种不同的洗脱剂重复检测一个位置上滞留有分析物的吸附剂,由此得出一系列有关各次洗涤后滞留的分析物的信息。
以上方法当吸附剂位于多个预定可定址位置时也有用,而不论这些吸附剂是否相同。但是,当分析物与多个不同位置上相同或不同的吸附剂结合时,洗涤步骤可改用包括并行操作的更系统化、更有效的方法进行。即,洗涤步骤可以通过用洗脱剂洗涤第一位置上的吸附剂,再用洗脱剂洗涤第二吸附剂进行,然后解吸并检测被第一吸附剂保留的分析物,再解吸和检测被第二吸附剂保留的分析物。换言之,所有的吸附剂都用洗脱剂洗涤,然后对各吸附剂位置解吸被各吸附剂保留的分析物并进行检测。如有必要,在检测了各吸附剂位置后,可对各吸附剂位置进行第二阶段的洗涤,然后是第二阶段的解吸和检测。洗涤所有的吸附剂位置,然后在各个吸附剂位置解吸和检测,这些步骤可对多种不同的洗脱剂重复进行。用这种方法,可用整个阵列有效地鉴定样品中分析物的特性。不论在第一阶段洗涤中是用同一种洗脱剂洗涤所有的吸附剂位置还是用多种不同洗脱剂洗涤多个吸附剂,该方法都有用。
检测:
洗涤后仍被吸附剂保留的分析物吸附在基体上。用解吸光谱法来检测滞留在基体上的分析物:从吸附剂上解吸分析物,然后直接检测解吸下来的分析物。
解吸方法:从吸附剂上解吸分析物包括令分析物接触合适的能源。这通常意味着用放射能或能量粒子撞击分析物。例如,能量可以是激光能(例如UV激光)或闪光灯能形式的光能。或者,能量可以是一股快速原子流。也可以用热能来诱导/协助解吸。
解吸和/或离子化分析物以便直接分析的方法在本领域是众所周知的。其中之一称为基质辅助激光解吸/离子化或MALDL。在MALDI中,分析物溶液与基质溶液混合,混合物沉积在惰性探头表面,然后结晶,通过将分析物捕获在晶体中可实现解吸。选用的基质吸收激光能并传递给分析物,导致解吸和离子化。通常,基质吸收UV范围内的光。有关大蛋白的MALDI可参见美国专利5,118,937(Hillenkamp等)和美国专利5,045,694(Beavis和chait)。
表面增强的激光解吸/离子化或SELDI比MALDI在特异性,选择性和灵敏度方面有一大进步。有关SELDI参见美国专利5,719,060(Hutchens和Yip)。SELDI是一种固相解吸法,在其中,分析物在表面上被呈递给能量流,该表面能够强化分析物的捕获和/或解吸。相比之下,MALDI是一种液相方法,在其中,分析物与液体物质混合,液体物质包围着分析物形成结晶。
SELDI的一种形式称SEAC(表面增强的亲合性捕获),包括将与亲合性捕获装置(即吸附剂)偶联的分析物呈递给解吸能。已发现,用这种方法将被吸附的分析物呈递给解吸能源时,实现目标分析物解吸的机会更大。可向探头添加吸能物质协助解吸。然后可向能源呈递探头以解吸分析物。
另一种SELDI称SEND(表面增强的净解吸),包括使用一吸能物质层,上面放以分析物。基体表面有一层与之化学结合的而且/或者基本无晶体的吸能分子。然后将单独(即净)分析物加在此层的表面,不与其发生实质性混合。吸能分子象基质那样吸收解吸能并使分析物被解吸。这一进步是实质性的,因为:由于消除了溶液混合物和随机结晶的特性,现在可以以更简单更均一的方式将分析物呈递给能源。这使得结果更统一更可预计,因此可能实现过程的自动化。吸能物质可以是经典基质材料或者是pH被调至中性或碱性的基质材料。吸能分子可通过共价键或非共价键与探头结合。
另一种SELDI称SEPAR(表面增强的光不稳定附着与释放),包括使用光不稳定附着分子。光不稳定附着分子是一种二价分子,具有一个与可作为探头一部分的固相(例如探头平表面或珠体等其它固相)共价结合的位点,和可与亲合性试剂或分析物共价结合的第二位点。当光不稳定附着分子与表面和分析物结合时另含一个可在光照后释放亲合性试剂或分析物的光不稳定键。光不稳定键可在附着分子内,或者在与分析物(或亲合性试剂)或探头表面附着的位置。
直接检测分析物的方法:有数种方法可检测解吸下的分析物。当分析物在解吸过程(例如激光解吸/离子化质谱法)中被离子化时,检测器可以是离子检测器。质谱仪一般包括测定解吸离子飞行时间的手段。这一信息被转化为质量。但是,没有必要测定解吸离子的质量来解析和检测它们:离子化的分析物在不同时刻撞击检测器这一事实实现了它们的检测和解析。
或者,可用例如荧光部分或放射性部分可测性地标记分析物。此时,检测器可以是荧光或放射性检测器。
可相继使用多种检测方法来充分获得与阵列中各位置上滞留物相关的分析物组分和功能信息。
解吸检测器:解吸检测器包含将分析物从吸附剂上解吸的装置和直接检测解吸下的分析物的装置。即,解吸检测器无需将分析物捕捉到另一固相内然后进行分析的中间步骤就可检测解吸分析物。检测分析物一般涉及检测信号强度。后者反过来可以反映与吸附剂吸附的分析物的量。
解吸检测器还可具有除上述两元件外的其它元件。其中之一是加速解吸分析物向检测器移动的装置。另一元件是测定分析物从解吸到被检测器测得之间的飞行时间的装置。
优选的解吸检测器是本领域熟知的激光解吸/离子化质谱仪。此质谱仪具有一个供插入携带被吸附分析物的基体(例如探头)的端口。解吸通过用能量例如激光能撞击分析物来进行。该设备可具有使表面平移的装置,这使得阵列上的任一点都可与激光束共线。激光撞击分析物使完整的分析物解吸进入飞行管并被离子化。飞行管一般是一个真空。真空管一段内的带电板产生一个电势能,加速离子化的分析物向检测器移动。由时钟测定飞行时间,由系统电子设备测定分析物的速度并转化为质量。本领域技术人员都知道,以上各元件中任何一个都可以与本发明所述的其它元件组合,组装成利用各种解吸、加速、检测、时间测定等手段的解吸检测器。
选择性条件
本发明优点之一是能够令分析物处于多种不同的结合和洗脱条件下,由此既提高了分析物解析度,又增加了有关它们识别谱形式的信息。和常规层析法一样,吸附剂保留分析物的能力直接与相比于分析物与洗脱剂之间或洗脱剂与吸附剂之间的引力或亲合性,分析物对吸附剂的引力或亲合性相关。当样品与吸附剂接触时,样品中的某些组分可能因不具有与吸附剂的亲合性而不与之结合。因为不能结合吸附剂,它们可立即与待解析的分析物分离。但是,根据样品的性质和所用的具体吸附剂,许多不同组分在一开始能够与吸附剂结合。
吸附剂
吸附剂即为结合分析物的物质。滞留层析可使用多种吸附剂。不同的吸附剂可表现出大不相同的结合特征,有些不同的结合特征,或略有不同的结合特征。结合特征大不相同的吸附剂一般在吸引基础或相互作用模式上有差异。吸引基础一般是一种化学或生物学分子的识别功能。吸附剂与分析物之间的吸引基础包括,例如:(1)盐促相互作用,例如疏水性相互作用,亲硫性相互作用和固定化染料相互作用:(2)氢键和/或范德华力相互作用和电荷转移相互作用,例如在亲水性相互作用中:(3)静电相互作用,例如离子电荷相互作用,尤其是正负离子电荷相互作用;(4)分析物与吸附剂中的金属离子形成配位共价键(即形成配位复合物)的能力:(5)酶活性位点的结合;(6)可逆共价相互作用,例如二硫键互换作用:(7)糖蛋白相互作用;(8)生物特异性相互作用:或(9)上述两种或两种以上相互作用方式的组合。即,吸附剂可以表现出两种或两种以上吸引基础,由此称作“混合功能”吸附剂。
盐促相互作用吸附剂:用于评定盐促相互作用的吸附剂包括疏水性相互作用吸附剂。疏水性相互作用吸附剂包括例如具有脂肪烃,尤其是C1-C18脂肪烃的基质;和具有芳香烃官能团例如苯基的基质。疏水性相互作用吸附剂所结合的分析物包括暴露于溶剂中的不带电氨基酸残基,特别是常说的非极性、芳香族疏水性氨基酸残基,例如苯丙氨酸和色氨酸。与疏水性相互作用吸附剂结合的分析物的具体例子包括溶菌酶和DNA。不希望受特定理论束缚,DNA被认为是因为其中的芳族核苷酸,具体地说即嘌呤和嘧啶基团而与疏水性相互作用吸附剂结合的。
用于评定盐促相互作用的其他吸附剂包括亲硫性相互作用吸附剂,例如T-GEL,这是Pierce Rockford,Illinois出售的一种亲硫性吸附剂。亲硫性相互作用吸附剂能够结合例如IgG等免疫球蛋白。IgG与T-GEL之间相互作用的机制尚不完全清楚,但暴露于溶剂中的trp基团被怀疑可能起着一定的作用。
涉及盐促离子相互作用和疏水性相互作用的第三种吸附剂包括固定化染料相互作用吸附剂。固定化染料相互作用吸附剂包括固定化染料的基质,例如Pharmacia Biotech,Piscataway,New Jersey的CIBACHRONTM蓝。固定化染料相互作用吸附剂通常结合蛋白质和DNA。与固定化染料相互作用吸附剂结合的蛋白质的一个具体例子是牛血清白蛋白(BSA)。
亲水性相互作用吸附剂:用于评定基于亲水性相互作用的氢键和/或范德华力的吸附剂包括诸如氧化硅(即玻璃)等具有表面的常态吸附剂的。常态或氧化硅表面起着官能团的作用。此外,包含亲水性聚合物(例如聚乙二醇,葡聚糖,琼脂糖或纤维素)修饰的表面的吸附剂也可以作为亲水性相互作用吸附剂。大多数蛋白质可结合亲水性相互作用吸附剂,因为许多氨基酸残基(即亲水性氨基酸残基)可通过涉及氢键或范德华力的亲水性相互作用结合。结合亲水性相互作用吸附剂的蛋白质的例子包括肌红蛋白,胰岛素和细胞色素C。
通常,极性或带电氨基酸比例较高的蛋白质将滞留在亲水性表面上。或者,亲水性糖基暴露于表面的糖蛋白对亲水性吸附剂的亲合性也很高。
静电相互作用吸附剂:用于评定静电或离子相互作用的吸附剂包括阴离子吸附剂,例如硫酸根阴离子基质(即SO3 -)和羧酸根阴离子(即COO-)或磷酸根阴离子(即OPO3 -)基质。带有硫酸根阴离子的基质始终带负电。但是,带羧酸根阴离子的基质只有当pH高于其pka时才带负电。当pH低于pka时,基质基本上呈电中性。合适的阴离子吸附剂还包括带有硫酸根和羧酸根阴离子和磷酸根阴离子的组合的基质吸附剂。这种组合可令负电荷强度随pH连续变化。这类吸附剂吸引并结合带正电的蛋白质或大分子,例如核糖核酸酶和乳铁蛋白。不希望受特定理论束缚,据信是吸附剂与带正电荷氨基酸残基(包括赖氨酸残基,精氨酸残基和组氨酸残基)之间的静电相互作用造成了结合。
用于评定静电或离子电荷相互作用的吸附剂还包括阳离子吸附剂。具体例子包括仲胺,叔胺或季胺基质。季胺总是带正电。但是仲胺和叔胺所带电荷具有pH依赖性。当pH低于pka时,仲胺和叔胺带正电,当pH高于pka时,仲胺和叔胺带负电。合适的阳离子吸附剂还有包含仲胺,叔胺和季胺的组合的基质。这种组合使得正电荷强度随pH连续变化。阳离子相互作用吸附剂与分子上的阴离子位置结合,所述的分子包括氨基酸残基(例如天冬氨酸和谷氨酸残基)暴露于溶剂中的蛋白质。
如果是离子(既包括阴离子也包括阳离子)相互作用吸附剂,常期望使用既包含阴离子又包含阳离子的混合型离子吸附剂。这样的吸附剂具有与pH相关的连续缓冲能力。这种连续缓冲能力使得分析物组合能够与含有不同缓冲组分(尤其是pH在2至11之间)的洗脱剂接触。由此在吸附剂上形成由固定化可滴定质子交换基团决定的局部pH环境。这样的系统等同于称为色谱聚焦的固相分离技术。区别主要在于带电糖组分的促卵泡激素异构体可在色谱聚焦吸附剂上分离。
用于评定静电相互作用的其它吸附剂包括偶极-偶极相互作用吸附剂,其中的相互作用是静电力,但是不涉及正规的电荷或可滴定蛋白供体或受体。
配位共价键相互作用吸附剂:用于评定与金属离子形成配位共价键的能力的吸附剂包括带有(例如)二价或三价金属离子的基质。固定化金属离子螯合物基质提供的固定化合成有机分子具有一个或多个供电子基团,这些基团形成与过渡金属离子之间配位共价相互作用的基础。作为固定化金属离子螯合物的基本供电子基团包括氧,氮和硫。金属离子与固定化金属离子螯合物结合,形成留有数个位置可与分析物上供电子基团反应的金属离子配合物。合适的金属离子一般包括例如铜、镍、钴、锌、铁等过渡金属离子,以及诸如铝和钙等其它金属离子。不希望受特定的理论束缚,金属离子被认为与肽、蛋白质中的特定氨基酸残基或核酸选择性反应。通常,参与这类相互作用的氨基酸残基有组氨酸残基,酪氨酸残基,色氨酸残基,半胱氨酸残基,以及具有氧基团的氨基酸例如天冬氨酸和谷氨酸。例如,固定化三价铁离子与蛋白质上的磷酸丝氨酸,磷酸酪氨酸和磷酸苏氨酸残基反应。根据固定化的金属离子,只有那些上述氨基酸残基的局部密度足够大的蛋白质才被吸附剂滞留。某些金属离子与蛋白质之间的相互作用如此之强以致于无法用常规方法从配合物中切取蛋白质。高度磷酸化的人β酪蛋白与固定化Fe(III)的结合非常强。表达时带有6-组氨酸标记的重组蛋白与固定化Cu(II)和Ni(II)的结合非常强。
酶活性位点相互作用吸附剂:用于评定酶活性位点结合相互作用的吸附剂包括蛋白酶(例如胰蛋白酶),磷酸酯酶,激酶和核酸酶。这种相互作用是分析物(通常是一种生物聚合物)上酶结合位点与酶上催化性结合位点之间的一种序列特异性相互作用。这类酶结合位点包括例如胰蛋白酶上与序列中具有赖氨酸-赖氨酸或赖氨酸-精氨酸的蛋白质和肽相互作用的活性位点。更具体地说,大豆胰蛋白酶抑制剂与固定化胰蛋白酶吸附剂作用并结合。或者,丝氨酸蛋白酶选择性滞留在固定化L-精氨酸吸附剂上。
可逆共价相互作用吸附剂:用于评定可逆共价相互作用的吸附剂包括二硫键互换作用吸附剂。二硫键互换作用吸附剂包括具有固定化疏基的吸附剂(例如固定化硫基乙醇或固定化二硫苏糖醇)。此相互作用的基础是在吸附剂与分析物上暴露于溶剂中的半胱氨酸残基之间形成二硫键。这类吸附剂结合具有半胱氨酸残基的蛋白质或肽以及碱基被修饰成包含还原硫化合物的核酸。
糖蛋白相互作用吸附剂:用于评定糖蛋白相互作用的吸附剂包括例如内有固定化凝集素(即带有寡糖的蛋白质)的吸附剂,例如Pharmacia Biotech of Piscataway,New Jersey出售的CONCONAVALINTM。这类吸附剂的作用基础是涉及对大分子糖部分的分子识别的相互作用。与糖蛋白相互作用吸附剂反应并与之结合的分析物包括例如糖蛋白,特别是富含组氨酸的糖蛋白,全细胞和分离的亚细胞级分。
生物特异性相互作用吸附剂:用于评定生物特异性相互作用的吸附剂通常称为“生物特异性亲合吸附剂”。如果吸附作用有选择性,而且亲合力(平衡解离常数,kd)至少为10-3M至例如10-5M、10-7M,10-9M,则认为是生物特异性的。生物特异性亲合吸附剂的例子包括任何能与特定生物分子特异性相互作用并与之结合的吸附剂。生物特异性亲合吸附剂包括例如结合抗原的固定化抗体:结合DNA结合蛋白、DNA和RNA的固定化DNA:结合蛋白质或酶的固定化底物或抑制剂:结合药物结合蛋白的固定化药物:结合受体的固定化配体;结合配体的固定化受体:结合DNA和RNA结合蛋白的固定化RNA:结合生物素和生物素化分子的固定化亲合素或链霉亲合素:结合脂质结合蛋白的固定化磷脂膜和小泡。酶是可修饰与之结合的分析物的有用吸附剂。细胞是有用的吸附剂。它们的表面具有复杂的结合特征。与细胞的吸附可用来鉴定例如结合表面受体的配体或信号分子。病毒和噬菌体也可用作吸附剂。病毒常具有细胞表面受体的配体(例如针对CD4的gp120)。而且,在噬菌体展示文库形式中,噬菌体外壳蛋白起着与靶分子结合的检测剂的作用。生物特异性相互作用吸附剂依赖于上述公知的特异性反应。吸附剂可利用的其它生物特异性相互作用的例子对本领域熟练技术人员来说是显而易见的,而且包括在本发明构思中。
在一个实施方案中,生物特异性吸附剂还可包含某种助剂,或“辅助者”,即不直接参与与靶分析物结合的分子。
结合特异性程度:通过接触具有不同相互作用模式的吸附剂,样品中的组分根据其与不同吸附剂的相互作用可被大致区分。这样,分析物与具有不同相互作用模式的吸附剂之间的引力提供了第一分离参数。例如,通过含分析物的样品与以疏水性为吸引基础的第一吸附剂和以离子电荷为吸引基础的第二吸附剂接触,可从样品中分离出结合疏水性吸附剂的分析物,和分离出结合带有特定离子电荷的吸附剂的分析物。
具有不同吸引基础的吸附剂以低特异性解析分析物,因为吸附剂不仅结合分析物,而且结合样品中借助同一吸引基础吸引吸附剂的其它成分。例如,疏水性吸附剂不仅结合疏水性分析物,还结合样品中任何其它疏水性成分;带负电吸附剂不仅结合带正电分析物,还结合样品中任何其它带正电成分;等等。
通过采用相对中等特异性的结合特征或改变引力强度可以进一步提高以分析物与吸附剂之间的引力为基础的分析物解析度。基于中等特异性结合特征的分析物解析可用混合功能吸附剂来实现。当以较低特异性完成分析物的解析后,可将发现的吸引目的分析物的结合特征与多种其它结合和洗脱特性结合用以去除仍为不需要的组分,由此解析分析物。
例如,如果分析物结合疏水性吸附剂,可通过提供以疏水性相互作用为吸引基础之一且另含第二种不同的吸引基础的混合功能吸附剂将分析物进一步与其它疏水性样品组分分开。混合功能吸附剂可以表现出疏水性相互作用和负电离子相互作用,由此结合带正电的疏水性分析物。或者,混合功能吸附剂可以表现出疏水性相互作用和与金属离子形成配位共价键的能力,由此结合能与吸附剂上金属离子形成配位复合物的疏水性分析物。基于以上公开内容和举例,表现出中等特异性结合特征的其它吸附剂例子对本领域熟练技术人员来说是显而易见的。
基于中等特异性结合特征解析分析物可以通过利用较高特异性的结合特征来进一步精细化。利用较高特异性的结合特征可以通过使用吸引基础相同但引力强度不同的多种吸附剂来实现。换言之,虽然吸引基础相同,但是用对分析物亲合性程度不同的吸附剂可以进一步将分析物与其它样品组分区分开来。
例如,基于自身酸性结合吸附剂的某分析物可用在特定酸性pH范围内对分析物具有亲合性的吸附剂将其与其它酸性样品组分进一步区分。这样,分析物可以用一种吸引pH1-2的样品组分的吸附剂,另一种吸引pH3-4的样品组分的吸附剂,及第三种吸引pH5-6的样品组分的吸附剂来解析。以这种方式,可以将对结合pH5-6分析物的吸附剂具有亲合性的分析物与pH1-4的样品组分分离开来。通过降低引力间隔,即表现出相同吸引基础的吸附剂的结合特征间的差异,可以使用更高特异性的吸附剂。
吸附于原初吸附剂上的原初分析物本身可能具有吸附剂性能。此时,吸附于基体上的原初分析物可变成第二吸附剂用于分离第二分析物。以此类推,滞留的第二分析物可以作为第三吸附剂从样品中分离第三分析物。以上过程可重复数次。
洗脱剂
洗脱剂或称洗涤溶液选择性地改变分析物与吸附剂之间的吸附阈值。洗脱剂解吸和洗脱已结合分析物的能力与其洗脱特性有关。不同的洗脱剂可能表现出大不相同的洗脱特性,有些不同的洗脱特性或略有不同的洗脱特性。
洗脱剂与吸附剂的接触温度与具体的样品和选用的吸附剂有关。通常,洗脱剂在0℃至100℃间的某温度接触吸附剂,以4℃至37℃为优选。但是,对于某些洗脱剂来说,其它温度更合适,这些,本领域熟练技术人员很容易确定。
和吸附剂一样,洗脱特性大不相同的洗脱剂通常其吸引基础不同。例如,洗脱剂与分析物之间各种吸引基础包括电荷或pH,离子强度,水结构,特定竞争性试剂的浓度,表面张力,介电常数以及上述两者或数者的联合。
基于pH的洗脱剂:基于pH(即电荷)改变吸附剂选择性的洗脱剂包括已知的pH缓冲剂,酸性溶液和碱性溶液。通过用特定pH的缓冲剂洗涤与给定吸附剂结合的分析物,可以改变电荷,由此可能削弱特定pH缓冲剂中吸附剂与分析物之间的结合强度。在洗脱剂的pH下竞争性较低的分析物将从吸附剂上解吸而洗脱,仅留下在洗脱剂的pH下与吸附剂结合更牢固的分析物。
基于离子强度的洗脱剂:在离子强度上改变吸附剂选择性的洗脱剂包括各种类型和浓度的盐溶液。溶于洗脱剂溶液的盐量影响着洗脱剂的离子强度,相应改变吸附剂的结合能力。低盐浓度的洗脱剂在离子强度上对吸附剂结合能力的改变较小。高盐浓度的洗脱剂在离子强度上对吸附剂结合能力的改变较大。
基于水结构的洗脱剂:通过改变水结构或浓度来改变吸附剂选择性的洗脱剂包括尿素和离液盐溶液。通常,尿素溶液包括例如浓度在0.1至8M的溶液。可用来提供洗脱剂的离液盐包括硫氰酸纳,基于水结构的洗脱剂因对水合作用或结合水结构的改变而改变吸附剂结合分析物的能力。这类洗脱剂包括例如甘油,乙二醇和有机溶剂。离液阴离子提高非极性部分的水溶性因而降低分析物与吸附剂之间的疏水作用。
基于去污剂的洗脱剂:在表面张力和分析物结构上改变吸附剂选择性的洗脱剂包括去污剂和表面活性剂。适合用作洗脱剂的去污剂包括离子型和非离子型去污剂,例如CHAPS,TWEEN和NP-40。基于去污剂的洗脱剂改变吸附剂结合分析物的能力是因为当引入了去污剂的疏水性和亲水性基团时疏水相互作用被改变。分析物和吸附剂之间以及分析物内部的疏水相互作用被改变并且引入了带电基团,例如,离子型去污剂如SDS引起蛋白质变性。
基于疏水性的洗脱剂:在介电常数上改变吸附剂选择性的洗脱剂是在疏水相互作用方面改变吸附剂选择性的洗脱剂。具有此种能力的洗脱剂的合适实例有尿素(0.1-8M)有机溶剂,例如丙醇,乙腈,乙二醇和甘油,还有前文所述的去污剂。乙腈常在反相层析中用作洗脱剂。在洗脱剂中包含乙二醇能够从用亲硫型吸附剂进行的盐促相互作用中洗脱免疫球蛋白。
组合洗脱剂:合适的洗脱剂可以是选自以上的任何一种,也可以由以上两种或多种洗脱剂组合而成。包含两种或两种以上上述洗脱剂的洗脱剂能够基于多种洗脱特性改变吸附剂对分析物的选择性。
两参数的可变性
通过选用不同吸附剂来提供不同吸附特性的能力和通过用不同洗脱剂洗涤来提供不同洗脱特性的能力允许两参数各自改变,各自都能影响分析物结合吸附剂的选择性。这两个参数能够作大范围的改变从而提供了一个大范围的结合引力和洗脱条件,使得本发明方法能够用于结合并由此检测多种不同类型的分析物。
即使尚不知道分析物的性质,在分析特定样品时吸附剂和洗脱剂的选择仍取决于样品的性质和有待表征的具体分析物或分析物所属类别。通常,适宜的是提供一个表现出多种结合特征和多种洗脱特性的系统,尤其是在样品组成未知时。通过提供选择特性范围较宽的系统,目标分析物被一种或多种吸附剂滞留的可能性将显著提高。
通过提供具有大范围的结合和洗脱特性的系统,并评定出提供最佳分析物解析度的结合和洗脱特性,化学或生物化学分析领域的技术人员都能够确定用于滞留特定分析物的选择性条件。因为本发明提供了包括大范围的选择性条件的系统,无需过多的实验,本领域熟练技术人员就能够方便地确定用于给定分析物的最适结合和洗脱特性。
分析物
本发明能够基于分析物的多种生物、化学、或理化特性通过合适的选择性条件利用这些特性来解析分析物。众多通过合适的选择性条件可加以利用的分析物特性包括疏水性指数(或分析物中疏水性残基的量度),等电点(即分析物不带电时的pH),疏水性力矩(hydrophobic moment)(分析物的两性量度或极性与非极性残基分布的不对称程度),侧向偶极矩(lateral dipole moment)(或分析物内电荷分布不对称性的量度),分子结构因子(引起分析物分子表面轮廓改变的因素,例如大侧链沿分子骨架的分布),二级结构组成(例如螺旋、平行和反平行片),二硫键,暴露于溶剂的供电子基团(例如His),芳香性(或分析物内芳香残基之间π-π相互作用的量度)和带电原子间的线性距离。
以上是可用本发明方法通过选择合适的选择性特性从样品中解析给定分析物的特性种类的代表性举例。可作为解析样品中特定分析物的基础的其它合适的分析物特性是本领域熟练技术人员熟知的,并且包括在本发明构思中。
本发明在可分析的样品类型上没有限制。样品可以是固态、液态或气态,但通常,样品是液态的。固态或气态样品最好用本领域熟知的技术溶于合适的溶剂中成为液态样品。样品可以是生物组合物,非生物有机组合物或无机组合物。本发明特别适用于解析生物样品,尤其是生物液体和提取物中的分析物:还特别适用于解析非生物有机组合物中的分析物,尤其是有机小分子和无机分子组合物中的分析物。
分析物可以是分子,多聚分子复合物,大分子部件,细胞,亚细胞器,病毒,分子片段,离子或原子。分析物可以是样品中的单独一种组分,也可以是具有一个或多个相同特征(例如分子量、等电点、离子电荷、疏水/亲水相互作用等)并且具有结构、化学、生物或功能关联的一类组分。
可用本发明滞留层析法解析的分析物的具体实例包括生物大分子,例如肽、蛋白质、酶、多核苷酸、寡核苷酸、核酸、糖、寡糖、多糖;上述生物大分子的片段,例如核酸片段、肽片段和蛋白质片段;上述生物大分子的复合物,例如核酸复合物,蛋白质-DNA复合物,受体-配体复合物,酶-底物、酶抑制剂,肽复合物,蛋白复合物,糖复合物和多糖复合物;生物小分子,例如氨基酸、核苷酸、核苷、糖(sugar)、甾类、脂、金属离子、药物、激素、酰胺、胺、羧酸、维生素和辅酶、醇、醛、酮、脂肪酸、卟啉、类胡萝卜素、植物生长调节素、磷酸酯和核苷二磷酸糖、合成小分子,例如药学或治疗上的有效药剂、单体、肽类似物、甾类类似物、抑制剂、诱变剂、致癌物、抗有丝分裂药、抗生素、离子载体、抗代谢药、氨基酸类似物、抗细菌剂、转运抑制剂、表面活性剂、线粒体和叶绿体功能抑制剂、电子供体、载体和受体,合成的蛋白酶底物,磷酸酶底物,酯酶和脂酶的底物,和蛋白质修饰剂;以及合成的聚合物、寡聚物和共聚物,例如聚烷撑、聚酰胺、聚(甲基)丙烯酸、聚砜、聚苯乙烯、聚醚、聚乙烯醚、聚乙烯酯、聚碳酸酯、聚卤乙烯、聚硅氧烷、POMA、PEG和以上两者或两者以上的共聚物。
鉴定mRNA编码的多肽
各多肽被分级后,下一个步骤就是鉴定分级多肽中哪个多肽相应于由选定mRNA所编码的多肽。存在于样品中的该多肽已经根据该编码多肽已知的理化特性而被分级。该信息对于从分级的各个多肽中找到这个肽十分有用。例如,技术人员可能知道编码的多肽在pH7时带有负电荷,其质量大约为18kD。可以使用含有阴离子吸附剂点的蛋白生物芯片,捕获pH7时带负电的蛋白质。然后,使用质谱仪根据分子量分级被捕获的蛋白,得到质谱图。在大约18kD处检查该图谱,就可以得到一个或多个具有选定理化特性的候选蛋白。可以通过本文所述的各种方法来进一步检测这些候选蛋白,以确定其身份,并将其与表达的多肽相关联。
类似地,双向凝胶电泳可以根据pI和分子量分离各蛋白。知道了表达蛋白的预测质量和pI就能够指引实验人员到预期含有该蛋白的特定凝胶区域。然后检测该位点上的蛋白,使用例如串联质谱分析并结合访问蛋白数据库,将其与表达的蛋白相联系。
鉴定由质谱法分级的蛋白质
通过程序化数字计算机执行算法(所述算法能够将MS数据与数据库中的记录相比较),就能够利用质谱数据鉴定样品中的蛋白质。当利用MS方法分析时,每种分子都具有特征性的质谱(MS)数据(也称为质谱“特征”或“指纹”)。可将这个数据与数据库(该数据库中含有实际的或理论上的MS数据,或生物聚合物序列信息等等)相比较,从而分析该数据。另外,一个分子可以分裂为片段用于MS分析。从各片段的MS分析所获的信息还可以与数据库相比较,以鉴定分析物中的多肽(Yates,J.Mass Spec.33:1-19(1988);Yates等,U.S.专利No.5,538,897;Yates等,U.S.专利No.6,017,693)。
其它鉴定SELDI所检测到的蛋白的方法在U.S.专利6,225,047;国际专利申请PCT/US00/28163,和USSN60/277,677(2001年3月20日申请)中描述。
由多肽解吸和检测产生的数据可使用任何合适的方法进行分析。在一个实施方案中,使用程序化数字计算机来分析数据。计算机程序通常含有储存代码的可读介质。可将某个代码放入存储器,这包括基体上每个特性的位置,在该特性处吸附剂的身份,以及用于洗涤该吸附剂的洗脱条件。使用该信息,该程序就可以鉴定出规定某些选择性特征(如所用吸附剂和洗脱剂的类型)的基体上的一系列特性。该计算机还可包括这样的代码,其作为输入而接收从基体上特定可定址位置获得的有关在各种分子质量下信号强度的数据。该数据可以指示检测的多肽的数目,任选地包括每种被检测多肽的信号强度以及测定分子量。
数据分析可包括确定被检测多肽的信号强度(如峰高)以及去除“界外值”(偏离了预先确定的统计学分布的数据)的步骤。观察到的峰可进行标化,在该过程中计算每个峰相对于某个对照的高度。例如,对照可以是仪器或化学物质(如能量吸收分子)所产生的背景噪音,该对照在比例尺中被设为零。然后从每种多肽或其它物质所检测到的信号强度可以显示为期望比例尺(如100)的相对强度。或者,可以为该样品导入一个标准,这样,这个标准的峰可作为对照来计算检测到的每种多肽或其它物质的相对信号强度。
在某些实施方案中,MS数据和由该数据所获的信息可以与由生物多聚物的相关数据和信息组成的数据库相比较。例如,该数据库可由核苷酸或氨基酸的序列构成。该数据库可由已表达序列标志(EST)的核苷酸或氨基酸序列构成。或者,该数据库可由核苷酸或氨基酸水平的基因序列构成。该数据库可包括,但不限于以下物质的集合:任何物种基因组所包含的核苷酸序列、氨基酸序列或核苷酸序列的翻译物。
生物多聚物相关信息数据库,如核苷酸或氨基酸序列数据库,通常通过计算机程序或任选地由计算机运行的检索算法进行分析。检索序列数据库中的信息,以得到与本发明方法所获的数据及信息最佳的匹配(参见,例如Yates(1998),J.Mass Spec.33:1-19;Yates等,U.S.专利No.5,538,897;Yates等,U.S.专利No.6,017,693)。
可用于检索数据库的任何适当算法或计算机程序都可使用。检索算法和数据库都在经常更新,本发明将使用这种更新后的版本。程序或数据库的范例可在Word Wide Web(WWW)上找到:http://base-peak.wiley.com/,http://mac-mann6.embl-heidelberg.de/MassSpec/Software.html, http://www.mann.embl-heidelherg.de/Services/PeptideSearch/PeptideSearchlntro.html, ftp://ftp.ebi.ac.uk/pub/databases/.和 http://donatello.ucsf.edu.。U.S.专利Nos.5,632,041;5,964,860;5,706,498;和5,701,256也描述了进行序列对比的算法或方法。
在一个实施方案中,蛋白,肽或核苷酸序列的数据库是组合数据库。数据库的实例包括,但不限于:UCSF网址(prospector.ucsfedu)的ProteinProspector,Genpept数据库,GenBank数据库(Burks等描述,(1990)Methods in.Enzymology 183:3-22),EMBL数据库(Kahn等描述,(1990)Methods inElizymology183:23-31),Protein Sequence Database(Barker等人描述,(1990)Methods in Enzymology 183:31-49),SWISS-PROT(Bairoch等人描述,(1993)Nucleic Acids Res.,21:3093-3096),以及 PIR-International((1993)Protein Seg.DataAnaL 5:67-192中描述)。
在另一实施方案中,产生新的数据库用于比较质谱测定的MS数据,如分裂的蛋白和肽片段的质量或质谱。例如,产生被表征的肽质量的所有可能氨基酸序列组合的理论数据库(Parekh等,WO98/53323)。然后,与使用质谱分析测定到的实际质量相比较,以确定样品中多肽的氨基酸序列。
在一些实施方案中,用质谱获得的多肽质量来检索数据库中与此质量最接近的蛋白或由核酸序列预测的蛋白的质量。以这种方式,可以无需测定氨基酸序列而快速地鉴定未知蛋白。在本发明的其它实施方案中,可以将由其设想出的(chimeric)多肽片段所提供的质量与数据库的预测质谱相比较,所述数据库为最匹配的蛋白或由核酸序列预测的蛋白的数据库。算法或计算机程序在数据库中产生序列的理论裂解,所用裂解剂与用于分裂MS方法分析的生物多聚物所用的裂解剂相同。
使用SELDI检测多肽
在特定洗脱条件下检测被吸附剂结合的分析物提供了有关样品中分析物及其化学特征的信息。吸附作用在一定程度上取决于吸附剂的结合特征。与吸附剂结合的分析物具有使得结合成为可能的特性。例如,在特定pH下是阳离子的分子在包括该pH的洗脱条件下将与阴离子吸附剂结合。强阳离子分子只有在很强的洗脱条件下才从吸附剂上洗脱。具有疏水区的分子将结合疏水性吸附剂,而具有亲水区的分子将结合亲水性吸附剂。同样,相互作用的强度在一定程度上取决于分析物包含疏水区或亲水区的程度。所以,对样品中特定分析物在特定洗脱条件下结合某种吸附剂的确定不仅通过分析物的彼此分离和与不具有结合所需的相应化学特性的分析物的分离而解析混合物中的分析物,而且鉴定出了具有特定化学特性的一类或单个分析物。采集有关分析物在多种洗脱条件下在一种或多种吸附剂上的滞留信息不仅可详细解析混合物中的分析物,而且提供了有关分析物的化学信息,从这些信息本身就可以完成对他们的鉴定。这种数据被称为“滞留数据”。
用可编程数字计算机分析滞留试验得出的数据是十分简便的。计算机程序一般包括储存代码的可读介质。可将某代码放入存储器,其中包括基体阵列上各特性的位置,该特性处的吸附剂身份和用来洗涤吸附剂的洗脱条件。程序于是可用这些信息鉴定出阵列上确定某特定选择性特征的一组特性。计算机还可包括这样的代码,它们接收有关探头上特定可寻址位置在不同分子量下产生的信号强度的输入数据。这些数据可指示检测到的分析物的数量,任选地包括所测各分析物的信号强度和测得的分子量。
计算机还具有处理数据的代码。本发明构思包含了多种处理数据的方法。在一个实施方案中,处理方法涉及形成一个分析物识别谱。例如,可将据分子量测得的特定分析物的滞留数据根据特定的结合特征(例如与阴离子吸附剂或疏水性吸附剂结合)分类。收集到的数据可提供此特定分析物的化学特征概况。滞留特征反映分析物功能,后者继而反映结构。例如,在配位共价金属螯合物上滞留可能说明多肽分析物内存在组氨酸残基。根据不同pH洗脱条件下在多种阳离子和阴离子吸附剂上的滞留水平数据所揭示的信息可以得出某蛋白质的等电点。这进而反映出该蛋白质内离子氨基酸的大致数量。所以,计算机可以包含将结合信息转化为结构信息的代码。而且,对分析物的二次处理(例如翻译后修饰)将改变识别谱,这可以由结合或质量差异反映出来。
在另一实施方案中,在同一组选择性阈值下对两种不同的细胞进行滞留试验,并将两次试验的滞留数据进行比较。滞留图(即任一特性点上信号的存在或强度)内的差异显示出被两种细胞差异表达的分析物。这可以包括,例如,形成一个显示两次滞留试验之间信号强度差异的差异图,由该图显示:在两试验中,哪些分析物被吸附剂增加或减少地滞留。
计算机还可以包含接受程序员输入的指令的代码。可对阵列内特定预定位置上分析物的选择性解吸提前预计并编程出渐进性和逻辑性途径。
计算机能够将数据转化成另一种格式供显示。数据分析可以包括:由收集到的数据以特性位置的函数确定(例如)信号强度,去除“界外值”(偏离预定统计分布的数据),和由留下的数据计算分析物的相对结合亲合力。
得出的数据可以以各种格式显示。一种格式中,信号强度显示成分子量的函数图。另一种格式又称为“凝胶格式”,其中,信号强度沿着线性轴以暗度强度值显示,得出的外观类似于凝胶上的条带。另一格式中,达到一定阈值的信号显示为分子量横轴上的垂直线或条柱。于是,各条柱代表一种所测分析物。数据还可以显示成根据结合特征和/或洗脱特性归类的分析物的信号强度图。
可以理解,本文所述的实例和实施方式仅为举例说明目的,根据这些说明,许多修改对于本领域技术人员而言是显而易见的,也属于本发明权利要求的精神和范围之内。本申请所引用的全部出版物,专利和专利申请都全文并入作为参考。

Claims (30)

1.将生物样品中基因和表达蛋白相关联的方法,该方法包括以下步骤:
a)获取生物样品;
b)产生样品的基因表达谱,从而鉴定样品中表达的mRNA;
c)鉴定该mRNA编码的多肽的理化特性;
d)根据该理化特性分级样品中的多肽;以及
e)从被分级的蛋白中鉴定该mRNA编码的多肽,其中所述被鉴定的多肽具备该理化特性;
从而将样品中基因和蛋白表达相关联。
2.权利要求1的方法,其中生物样品包含健康细胞的细胞溶解物。
3.权利要求1的方法,其中生物样品包含病理性细胞的细胞溶解物。
4.权利要求1的方法,其中生物样品包含与毒性化合物接触过的细胞的细胞溶解物。
5.权利要求1的方法,其中生物样品包含受检者细胞的细胞溶解物,所述受检者对药物处理有反应或者没有反应。
6.权利要求1的方法,其中生物样品包含经受过热、冷或辐射处理的细胞的细胞溶解物。
7.权利要求1的方法,其中生物样品包含人类细胞。
8.权利要求1的方法,其中产生基因表达谱的步骤包括用EST阵列鉴定表达的mRNA。
9.权利要求1的方法,其中产生基因表达谱的步骤包括用寡核苷酸阵列鉴定表达的mRNA。
10.权利要求1的方法,其中产生基因表达谱的步骤包括用mRNA阵列鉴定表达的mRNA。
11.权利要求1的方法,其中mRNA在两个生物样品中被差异表达。
12.权利要求11的方法,其中两个生物样品来自正常细胞和病理性细胞。
13.权利要求12的方法,其中病理性细胞是癌细胞。
14.权利要求11的方法,其中两个生物样品来自健康细胞和经毒性化合物处理的细胞。
15.权利要求1的方法,其中鉴定mRNA编码的多肽的理化特性的步骤进一步包括鉴定多个理化特性。
16.权利要求1的方法,其中鉴定理化特性的步骤包括预测在选定的蛋白裂解试剂对该多肽降解后该mRNA编码的多肽所产生的蛋白裂解片段的质量,鉴定该mRNA编码的多肽的步骤包括用该试剂降解样品中的多肽,并鉴定样品中具有与预测片段质量对应的质量的实际蛋白裂解片段。
17.权利要求1的方法,其中理化特性选自:氨基酸序列,分子量,等电点,疏水性,亲水性,糖基化,磷酸化,表位序列,配体结合序列,特定pH下的荷电,以及金属螯合物结合。
18.权利要求1的方法,其中分级样品中多肽的步骤包括2D凝胶电泳。
19.权利要求1的方法,其中分级样品中多肽的步骤包括质谱分析。
20.权利要求1的方法,其中分级样品中多肽的步骤包括表面增强的激光解吸电离,其中该表面增强的激光解吸电离包括通过在固相结合的吸附剂上亲合性滞留而达到分级,再通过气相离子光谱测定法从固相上分级滞留的多肽。
21.权利要求20的方法,其中选择吸附剂使其对具备至少一种下述理化特性的多肽具有亲和性:氨基酸序列,分子量,等电点,疏水性,亲水性,糖基化,磷酸化,表位序列,配体结合序列,特定pH下的荷电,以及金属螯合物结合。
22.权利要求1的方法,其中鉴定多肽的步骤包括从分级的多肽中选出多肽,该选出的多肽包含该理化特性;鉴定该选出的多肽;并将该选出多肽的身份与mRNA编码的多肽相关联。
23.将生物样品中基因和蛋白表达相关联的方法,该方法包括以下步骤:
a)获取生物样品;
b)使用核酸阵列产生样品的基因表达谱,从而鉴定样品中表达的mRNA;
c)鉴定该mRNA编码多肽的理化特性;
d)使用质谱分析法,根据该理化特性分级样品中的多肽;以及
e)从被分级的蛋白中鉴定该mRNA编码的多肽,其中所述被鉴定的多肽具备该理化特性;
从而将细胞中基因和蛋白表达相关联。
24.权利要求23的方法,其中产生基因表达谱的步骤包括用EST阵列鉴定表达的mRNA。
25.权利要求23的方法,其中产生基因表达谱的步骤包括用寡核苷酸阵列鉴定表达的mRNA。
26.权利要求23的方法,其中产生基因表达谱的步骤包括用mRNA阵列鉴定表达的mRNA。
27.权利要求23的方法,其中鉴定mRNA编码的多肽的步骤包括用表面增强的激光解吸电离来分级样品中的多肽,其中该表面增强的激光解吸电离包括通过在固相结合的吸附剂上亲合性滞留而达到分级,再通过气相离子光谱测定法从固相上分级滞留的多肽。
28.将生物样品中基因和蛋白表达相关联的方法,该方法包括以下步骤:
a)获取生物样品;
b)使用寡核苷酸阵列产生样品的基因表达谱,从而鉴定样品中表达的mRNA;
c)鉴定该mRNA编码的多肽的理化特性;
d)根据该理化特性,使用表面增强的激光解吸电离来分级样品中的多肽,其中该表面增强的激光解吸电离包括通过在固相结合的吸附剂上亲合性滞留而达到分级,再通过气相离子光谱测定法从固相上分级滞留的多肽;以及
e)从被分级的蛋白中鉴定该mRNA编码的多肽,其中所述被鉴定的多肽包含该理化特性;
从而将细胞中基因和蛋白表达相关联。
29.权利要求28的方法,其中选择吸附剂以使其对具备至少一种下述理化特性的多肽具有亲和性:氨基酸序列,分子量,等电点,疏水性,亲水性,糖基化,磷酸化,表位序列,配体结合序列,特定pH下的荷电,以及金属螯合物结合。
30.权利要求28的方法,其中鉴定理化特性的步骤包括预测在选定的蛋白裂解试剂对多肽降解后该mRNA编码的多肽所产生的蛋白裂解片段的质量,而鉴定该mRNA编码的多肽的步骤包括用该试剂降解样品中的多肽,并鉴定样品中具有与预测片段质量对应的质量的实际蛋白裂解片段。
CNA028064798A 2001-02-16 2002-02-15 将基因表达谱与蛋白质表达谱相关联的方法 Pending CN1636068A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US26977201P 2001-02-16 2001-02-16
US60/269,772 2001-02-16

Publications (1)

Publication Number Publication Date
CN1636068A true CN1636068A (zh) 2005-07-06

Family

ID=23028598

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA028064798A Pending CN1636068A (zh) 2001-02-16 2002-02-15 将基因表达谱与蛋白质表达谱相关联的方法

Country Status (7)

Country Link
US (1) US7299134B2 (zh)
JP (1) JP2005507235A (zh)
KR (1) KR20040054609A (zh)
CN (1) CN1636068A (zh)
AU (1) AU2002314715B2 (zh)
CA (1) CA2438391A1 (zh)
WO (1) WO2002079491A2 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110609078A (zh) * 2019-09-20 2019-12-24 南京谱利健生物技术有限公司 一种检测蛋白磷酸化和乙酰氨基葡萄糖化关联作用的方法

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NZ516848A (en) * 1997-06-20 2004-03-26 Ciphergen Biosystems Inc Retentate chromatography apparatus with applications in biology and medicine
CN1741036A (zh) 2000-06-19 2006-03-01 科雷洛吉克系统公司 构造分类属于不同状态的生物样本的模型的方法
US6925389B2 (en) 2000-07-18 2005-08-02 Correlogic Systems, Inc., Process for discriminating between biological states based on hidden patterns from biological data
TW200403434A (en) 2002-07-29 2004-03-01 Correlogic Systems Inc Quality assurance/quality control for electrospray ionization processes
WO2005011474A2 (en) * 2003-08-01 2005-02-10 Correlogic Systems, Inc. Multiple high-resolution serum proteomic features for ovarian cancer detection
US8043825B2 (en) * 2003-12-05 2011-10-25 Mcgill University Serum biomarkers for Chagas disease
CA2548842A1 (en) * 2003-12-11 2005-07-07 Correlogic Systems, Inc. Method of diagnosing biological states through the use of a centralized, adaptive model, and remote sample processing
US7749716B2 (en) * 2004-05-18 2010-07-06 Vermilllion, Inc. Methods of detecting a fragment of neurosecretory protein VGF for diagnosing alzheimer's disease
US20060063161A1 (en) * 2004-09-22 2006-03-23 Ciphergen Biosystems, Inc. Detecting RNAi using SELDI mass spectrometry
US20070003996A1 (en) * 2005-02-09 2007-01-04 Hitt Ben A Identification of bacteria and spores
WO2006124628A2 (en) * 2005-05-12 2006-11-23 Correlogic Systems, Inc. A model for classifying a biological sample in relation to breast cancer based on mass spectral data
WO2008100941A2 (en) * 2007-02-12 2008-08-21 Correlogic Systems Inc. A method for calibrating an analytical instrument
MY150234A (en) * 2007-06-29 2013-12-31 Ahn Gook Pharmaceutical Company Ltd Predictive markers for ovarian cancer
WO2009123756A1 (en) * 2008-04-05 2009-10-08 Single Cell Technology, Inc. Multi-well system
US8975019B2 (en) * 2009-10-19 2015-03-10 University Of Massachusetts Deducing exon connectivity by RNA-templated DNA ligation/sequencing
ES2838923T3 (es) 2014-10-24 2021-07-02 Koninklijke Philips Nv Pronóstico médico y predicción de la respuesta a tratamiento usando múltiples actividades de la ruta de señalización celular
DK3210142T3 (da) 2014-10-24 2020-11-16 Koninklijke Philips Nv Vurdering af tgf-cellulær signaleringsvejaktivitet under anvendelse af matematisk modellering af målgenekspression
CN108064311B (zh) 2014-10-24 2022-10-28 皇家飞利浦有限公司 使用多种细胞信号传导途径活性的治疗反应的医学预后和预测
WO2017029215A1 (en) 2015-08-14 2017-02-23 Koninklijke Philips N.V. Assessment of nfkb cellular signaling pathway activity using mathematical modelling of target gene expression
EP3461915A1 (en) 2017-10-02 2019-04-03 Koninklijke Philips N.V. Assessment of jak-stat1/2 cellular signaling pathway activity using mathematical modelling of target gene expression
EP3502279A1 (en) 2017-12-20 2019-06-26 Koninklijke Philips N.V. Assessment of mapk-ap 1 cellular signaling pathway activity using mathematical modelling of target gene expression

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6593084B2 (en) 1998-10-13 2003-07-15 Robert E. Bird Carcinogen assay
WO2000029848A1 (en) 1998-11-17 2000-05-25 Proteo Tools Separation, screening, and identification of biological targets
US9335328B2 (en) 2000-02-03 2016-05-10 Instant Medical Diagnostics, Llc Method and apparatus for signal transduction pathway profiling

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110609078A (zh) * 2019-09-20 2019-12-24 南京谱利健生物技术有限公司 一种检测蛋白磷酸化和乙酰氨基葡萄糖化关联作用的方法

Also Published As

Publication number Publication date
CA2438391A1 (en) 2002-10-10
EP1576183A4 (en) 2005-09-21
WO2002079491A2 (en) 2002-10-10
KR20040054609A (ko) 2004-06-25
JP2005507235A (ja) 2005-03-17
EP1576183A2 (en) 2005-09-21
US20030054367A1 (en) 2003-03-20
US7299134B2 (en) 2007-11-20
WO2002079491A3 (en) 2005-09-29
AU2002314715B2 (en) 2006-07-27

Similar Documents

Publication Publication Date Title
CN1636068A (zh) 将基因表达谱与蛋白质表达谱相关联的方法
James Protein identification in the post-genome era: the rapid rise of proteomics
Guerrera et al. Application of mass spectrometry in proteomics
Yates et al. Tutorial review. Future prospects for the analysis of complex biological systems using micro-column liquid chromatography–electrospray tandem mass spectrometry
US20100021881A1 (en) Peptide combos and their uses
CN1649613A (zh) 肝细胞癌血清生物标记
CN1675372A (zh) 用于检测卵巢癌的生物标记的用途
CN1266538A (zh) 滞留层析和蛋白质芯片排列在生物学和医药上的应用
Gulcicek et al. Proteomics and the analysis of proteomic data: an overview of current protein‐profiling technologies
CN1537170A (zh) 定量检测前列腺特异性膜抗原和其它前列腺标记的方法和装置
CN1426536A (zh) 前列腺癌标记
AU2002314715A1 (en) Method for correlating gene expression profiles with protein expression profiles
Lazar et al. Exploring the glycoproteomics landscape with advanced MS technologies
US20140051586A1 (en) High-throughput methods to produce, validate and characterize mmabs
CN104160278A (zh) 基于选择剂的识别和量化系统及用于在单次分析中识别和量化多种分析物的方法
US20050230315A1 (en) Protein microarray system
US7955810B2 (en) Positive selection of serum proteins for proteomic analysis
McCulloch Proteomics for the periodontium: current strategies and future promise.
CA2584223A1 (en) Expression profiling platform technology
US10578625B2 (en) Method for analyzing posttranslational modifications using GEL IEF and mass spectrometry
US20080280771A1 (en) Protein MicroarraySystem
Weissinger et al. Immunogenomics and proteomics in hematopoietic stem cell transplantation: predicting post-hematopoietic stem cell transplant complications
Saftig et al. Lysosomal proteome and transcriptome
US20080153711A1 (en) Protein microarray system
Patwa et al. 11.1 Challenges in Biomarker Discovery: The Emerging Role of Posttranslational Modifications Disease onset and progression is often accompanied by key physiological changes in

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication