靶特异性复合体以及使用方法
技术领域
本发明总体上涉及化学分析领域,并涉及用于检测特定靶生物分子(包括核酸分子)的组合物及方法。特别的,本发明涉及通过例如质谱分析而能够间接检测并分析特定生物分子的组合物以及方法。
背景技术
1.引言
以下说明包括可能对于理解本发明比较有用的信息。但并不认可任何这种信息是现有技术或要求保护的本发明的相关技术,或者认可明确或隐含引用的任何出版物是现有技术。
2.背景
在生物学中,有效而高度保真地检测及分析生物分子(如,核酸、蛋白质、糖类、和脂质)是一个巨大挑战。在分析生物样品时这些挑战尤其尖锐,因为生物分子的性质是极其复杂的,表现在无论存在的不同分子种类(species)的数量方面还是在所述不同的特定种类的分子的数量方面。由于这种复杂性,为了得到有效且可重复的结果,则需要极其灵敏的和选择性的方法。使事情进一步复杂化的是,需要利用商品化的可行方式(例如,在费用、时间等方面)来获得这样的结果。
在大规模检测和分析储存所有活生物体(例如:动物、植物和微生物)的遗传信息的核酸时,恰当解决这些挑战的重要性可能考虑得最多。简单的说,遗传信息通常在脱氧核糖核酸(DNA)中编码,尽管一些病毒含有由核糖核酸(RNA)组成的基因组。在人类,完整的单倍体基因组包括约三十亿个核苷酸,含有分布在24条染色体(22条常染色体和2条性染色体)上的约35,000个基因。天然存在的DNA和RNA分子由酶促合成为核苷酸的线性聚合物,彼此之间仅根据特定核苷酸所含有的碱基而区分。在DNA中,存在4种不同的脱氧核糖核苷酸,由于所述特定脱氧核糖核苷酸中含有腺嘌呤、鸟嘌呤、胞嘧啶或胸腺嘧啶碱基而命名为“A”、“G”、“C”、和“T”。类似地,RNA由4种不同的核糖核苷酸组成,由于所述核苷酸中含有腺嘌呤、鸟嘌呤、胞嘧啶或尿嘧啶碱基而命名为“A”、“G”、“C”、和“U”。本质上,基因组DNA通常是双链,根据经典的Watson-Crick碱基配对规则,其中一条DNA链以反向平行的方式与另一条链杂交,其中一条链上的A始终与另一条链上的T形成氢键,而G始终与C配对。同样的碱基配对法则适用于RNA,只是在RNA中,U代替了T而与A配对(在DNA或RNA中)。
本质上,特定核酸的核苷酸序列是非随机的,且正是所述核苷酸的特定序列将种类中的一个成员与同一种类的其它成员区分开,并将一个基因与其它基因区分开。通常,每一种基因编码一种特定的蛋白,尽管由于从同一基因转录的信使RNA采用不同的剪接方式,一些基因最终编码了若干种蛋白。任何情况下,当编码蛋白的基因通过转录和翻译而表达后,所述编码的蛋白在活细胞内执行特定功能。
已知对于特定基因或遗传位点,可能存在一个或多个不同的等位基因。特定基因的等位基因通过每一种等位基因核苷酸序列中的差异而彼此区分。特定基因的等位基因可能起源于一个核苷酸在特定的核苷酸位点替换另一个核苷酸。可选地,等位基因差异可能由于在不同等位基因中插入或缺失一个或多个核苷酸而形成。由于这些基因的蛋白编码区的差异,由不同等位基因编码的蛋白或许在大小和/或氨基酸序列方面不同。对于作为酶的蛋白,氨基酸序列的差异可以引起催化速率、底物专一性、对协同因子(co-factor)的需要、细胞定位、稳定性、最佳pH等产生不同,这些因素中的部分或全部可能与例如疾病检测、预防和治疗相关(例如,将特定药物给予特定患者的合适性,药物/蛋白相互作用)。另一方面,如果所述等位基因之间的差异是由于所述基因调节区的变化,则由所述特定等位基因所编码蛋白的表达水平可能不同,甚至产生显著差异。
基因组核酸分子的核苷酸序列变化作为突变的结果而发生,其中,在复制过程中模板核酸的复制拷贝未得到所述模板核酸的精确复制(duplication)。突变还可以在DNA修复过程中发生,因此DNA双链体的一条或两条链与修复反应前或修复反应后相比核苷酸序列不同。如上提到的,复制或修复过程中的突变包括双链DNA一条或两条链中一个或多个核苷酸的缺失、插入和/或替换。涉及到一个核苷酸替换另一个核苷酸的突变(例如:A替换G)命名为“点突变”,因其发生在特定的核苷酸位置。在蛋白编码区,点突变可以为“错义”突变,引起由发生所述突变的特定密码子所编码的氨基酸的变化;“无义”突变,其中所述变化引起所述密码子从编码氨基酸变为编码终止密码子,因此得到截短型蛋白;或同义突变,得到的密码子编码跟先前相同的氨基酸。另外,突变也可以发生在非编码区。尽管这种突变不改变由所述基因编码的蛋白的氨基酸序列,但可能影响所述基因的表达调节、所述DNA或RNA分子的稳定性等。
特定突变是否在所述基因库中持续一段时间(over time),是由自然选择的过程决定的,其中能一段时间改善繁殖适应性的变化能存留,否则就会消失。无论进化效应是什么,如上指出的,突变可导致改变的或者在一些情况下甚至丢失生化活性的蛋白,因而引起疾病、对特定药物的不良反应等。类似地,突变可以引起基因表达的异常调节,其可由于一种或多种特定基因产物的高丰度或低丰度,而引起疾病、药物敏感性改变等。
由突变引起的疾病,无论是遗传的还是起源于特定受试者的DNA,都称为“遗传性疾病”或相似说法。现在已知有4000多种遗传性疾病起因于等位基因差异,包括血友病、地中海贫血、Duchenne型肌营养不良(DMD)、亨廷顿症(HD)、阿尔茨海默病(Alzheimer’s Disease)、囊性纤维化(CF)以及镰刀形细胞贫血。除了由引起疾病相关等位基因的突变导致的疾病,遗传性疾病还可以由较大的遗传异常引起,例如特定染色体的部分或全部易位、重复和缺失。这种异常的实例包括21三体(Down’s综合征的病因)、13三体(引起Patau综合征)、18三体(引起Edward’s综合征)、X单体(Turner’s综合征的原因)以及其它性染色体的非整倍体例如XXY(引起Klinefelter’s综合征)。另外已知某些DNA序列使个体对多种疾病中的任何一种易感,例如糖尿病、动脉硬化症、肥胖、多种自身免疫疾病以及癌症(例如:结直肠癌、乳腺癌、卵巢癌、肺癌和前列腺癌),还可以预测患者如何对特定药物发生反应(即:她/他是否发生反应,以及如果发生反应,该反应为肯定的反应还是不良反应?)。遗传差异在器官和组织移植领域也具有相关性,如不能“匹配”HLA(人体白细胞抗原)型可以引起器官或组织排斥。由于特定物种内个体之间的遗传变异,DNA序列也可以作为“指纹”来检测或鉴定不同的个体、评估物种的成员之间的亲子关系或其它方面的相关性等。
随着核酸分析在多个领域内的重要性增加,已经开发了几种用于检测和表征化DNA的方法。例如,核酸序列可以通过利用凝胶电泳将扩增核酸片段的迁移率与已知的标准进行比较或者通过与互补于待鉴定序列的探针寡核苷酸杂交而加以鉴定。然而,只有所述核酸片段标记上灵敏的报道子功能(reporter function)(例如,包含放射性同位素(例如3H、32P或35S)的分子或荧光性或化学发光性分子),才可实现检测。然而,放射性标记可能比较危险,其产生的信号随时间而消退,而且需要特殊的处理步骤。非同位素标记(例如:荧光标记)通常灵敏度很差,特别是当使用高强度激光时会消退。另外,标记、电泳以及随后的检测涉及的步骤费力、耗时且易于出错。
另一方面,质谱分析通过真空电离所述分子并通过挥发作用使其“飞行移动”而“称量”单个分子(例如核酸、肽和蛋白)。在电场和磁场的联合影响下,所述离子根据其各自的质量(m)和电荷(z)遵循一定轨迹。很久以来,质谱分析一直作为分析和表征化低分子量有机分子的常规物理-有机方法的一部分。由于质谱分析的分析方面的优势,如提供高检测灵敏度、质量测定准确性、详细的结构信息和速度以及将数据在线转移到电脑上,人们已经付出相当大的努力以将质谱分析应用于核酸的结构分析。参见,例如第6,706,530、6,635,452、6,602,662、6,589,485、6,569,385、6,566,055、6,558,902、6,468,748、6,436,635、6,428,955、6,300,076、6,277,573、6,268,144、6,268,131、6,258,538、6,235,478以及6,225,450号美国专利。现在已经开发了先进的技术用于含有诸如多核甘酸的较大生物分子的样品的电离/解吸,包括电喷雾/离子喷雾以及特别是基质辅助激光解吸/电离(MALDI)。典型的MALDI质谱分析通常利用飞行时间(TOF)结构(a time-of-flight configuration)以分析质量。
质谱分析提供的另一个关键优势是其提供了巨大的多重化(multiplex)能力,即在单个分析中特异灵敏的区分大量不同的分子。最近,已经阐述了利用非挥发性可释放标记分子的系统,其中所述标记分子含有可释放的质量标记(mass label)。参见例如第6,635,452号美国专利。在这种系统中,一个或多个可检测的非挥发性质量标记(每个对于特定靶核酸是特异性的)从探针分子上释放,所述探针分子特异性杂交于特定的核苷酸序列。因此,基于质谱分析而检测特定质量标记可提供对与所述特定质量标记相关的靶分子的间接检测。由于质谱分析提供的灵敏度,数十、数百甚至数千个不同的探针种类(每个均具有不同的可释放质量标记)可以应用于单个多重化反应中。然而,这种系统要求可检测的非挥发性质量标记从所述探针释放。因此,尚有机会开发其它可能更有效的系统,适用于同时检测生物样品中大量不同的靶生物分子(例如:核酸分子和/或蛋白)。这将可以系统性大规模地分析多个具有预先确定的性能和/或功能的靶分子。
3.定义
在详细描述本发明之前,先定义几个在本发明中应用的术语。除了这些术语,如有必要,其它术语在说明书的其它地方加以定义。除非在本文中清楚的定义,在本发明书中应用的技术术语将具有其领域公认的意义。
术语“等位基因”或“等位基因变异体(variant)”指的是特定基因的可替代形式,且因此占据同源染色体或染色体外DNA上的相同位点或位置。当具有二倍体基因组的受试者具有基因的两个相同等位基因时,所述受试者称为对所述基因或等位基因纯合。当受试者具有基因的两个不同等位基因时,所述受试者称为对所述基因杂合。特定基因的等位基因可以通过一个或多个核苷酸而彼此区分,根据核苷酸数量和/或由于例如核苷酸替换、缺失和/或插入而形成特定核苷酸位置的核苷酸身份(identity)的任意一个或两者。因此,等位基因也可以为基因的突变形式。
术语“氨基酸”指的是天然存在和非天然存在的氨基酸,以及任何可以合成或可选的从天然来源获得的修饰氨基酸。
“扩增子”是在核酸扩增反应中产生的核酸分子,且衍生于靶核酸。扩增子含有的靶核酸序列可能与所述靶核酸同义或反义。扩增子还可以含有其衍生的核酸中不存在的序列。
“扩增引物”或“引物”意指能够杂交于引物结合位点(即,互补于所述引物的碱基序列的核酸碱基序列)的寡核苷酸,并作为核酸合成起始的引物和/或启动子模板(例如,用于互补链的合成,因此形成功能性启动子序列)。如果所述引物经设计也可以编码启动RNA合成的序列(例如启动子),则命名为“启动子引物”,而且它优选除了含有杂交于引物结合位点的区域,还含有非互补于所述靶核酸但可被RNA聚合酶例如T7、T3、SP6RNA聚合酶识别的碱基序列。扩增引物含有的3’末端可能被修饰为防止或减小引物延伸的速率或数量(见:例如第5,766,849号美国专利)。优选扩增过程中采用两种或多种不同引物。“通用”引物指的是经设计杂交于不依赖于待扩增序列的引物结合位点的引物。因此,通用引物在多重扩增反应中特别有用,其中大量不同的靶序列可以使用单对通用引物而扩增。
术语“生物样品”指的是从任何活的(或以前活的)来源(例如人类、动物(例如哺乳动物如牛、犬、马、猫、羊和猪等家畜、鱼类、鸟类等)、植物、细菌、真菌、原生生物或病毒)获得的材料,其含有一种或多种核酸和/或一个或多个种群的其它靶生物分子。生物样品可由固态材料(例如组织、细胞团、活检等)、生物流体(例如尿、血液、唾液、羊水、漱口液、淋巴液、汗液、精液、粘液、泪液等)组成。生物样品代表一个亚类的样品,可以是任何材料的样品,所述材料含有可利用根据本发明的一种或多种靶检测试剂进行检测和/或分析的一种或多种靶分子。
“生物分子”指的是生物系统(例如生物体)中天然存在的分子。代表性的生物分子种类包括核酸、蛋白、肽、抗体、酶、糖类、脂类、金属以及毒素。“靶”生物分子是由本发明中的靶检测试剂而靶向定位的分子。
术语复合体模板“编码区”指的是对复合体或切割底物进行编码的区域,根据具体情况而定。
当两个单链核酸分子各自长度的至少一部分存在足够大小(即,多个核酸碱基亚单位例如核苷酸)的区域允许在所述两个核酸之间形成足够的氢键键合而稳定通过所述两个核酸杂交形成的双链体时,则这两个单链核酸分子为“互补的”。因此,为了本发明的目的,当一个多肽中的每一个碱基在预期的互补区域上均与另一个多肽中的互补碱基配对时,则所述一个核酸完全互补于所述另一个核酸,其中所述预期互补区域可以包括所述两个核酸分子中一个或两个的全部或仅一部分。如人们所理解的,两个单链核酸分子还可以在预期互补区域上未达到完全互补,仍然表现出足够的互补性以允许在严格的杂交条件下于所述核酸之间进行杂交。
“互补物”是互补于另一个核酸的核酸的同义词。
“复合体”是在靶检测分析中从复合体模板合成的分子,以间接表明所分析的样品中存在特定的靶分子。复合体含有一个或多个亚单位。特别优选用于复合体聚合的亚单位是碱基亚单位。
“复合体模板”指的是本发明的靶检测试剂中进行复合体编码的部分。
如果预先已知特定复合体种类的检测表示相应的靶分子存在于所分析的样品中,则称复合体与靶分子“相关”。这种相关归因于所述靶检测试剂的设计,因为已知所述靶检测基团是与所述特定靶进行专一性反应。因此,该专一性的相互作用允许随后生成由所述靶检测试剂编码的复合体。同样的,靶分子的相应复合体称为与所述特定靶分子“相关”,因此检测特定复合体间接表明所分析的样品中存在所述相应的靶分子。
分子的连续跨距(Contiguous span)指的是线性聚合体中的一个区域,其中由所述聚合体合成的分子是同种类型的聚合物。例如,核糖核苷酸的连续跨距指的是多肽(或其一部分),其中所述跨距内的核苷酸均为核糖核苷酸。其它核苷酸,例如脱氧核糖核苷酸,不包括在所述连续跨距之内,尽管其可能包括在所述多肽的其它位置,如果所述聚合体包括的核苷酸多于所述核糖核苷酸的连续跨距。
“确定的特征”指的是允许一个复合体种类被检测并与其它复合体区分的已知特征。确定的特征包括确定的化学组成、确定的质量、确定的长度、确定的大小、确定的序列以及确定的结构。具有“确定的化学组成”意指所述复合体中每一个碱基的身份(标志,identity)是已知的。具有“确定的分子结构式”意指组成所述分子的每一个原子的数量和身份已知。因此,所述分子的质量或质量范围(由于同位素变异)也可被确定,即所述分子含有“确定的质量”。例如,一个确定的分子质量可以通过将所述分子的化学式中(例如C6H12O6)表示的原子的质量进行求和而确定。“质量范围”反映由于包含不同的同位素而导致具有相同化学式的分子可能具有的质量范围。具有“确定的长度”或“确定的大小”意指已知多少个亚单位构成一个特定复合体。例如,含有十个核苷酸的复合体称为具有10个核苷酸的长度。“特定序列”意指所述复合体具有特定的碱基序列,该序列可以由任何恰当技术确定(例如,通过杂交、测序等)。“确定的结构”意指复合体具有的三维结构(例如抗原决定簇)可被与所述结构特异性反应的试剂(例如抗体)识别。如人们所理解的,某些情况下复合体可以被分类,因此通过一种或多种方法进行检测,其中每种检测方法都是根据特定的特征分析而实施的。例如,由碱基亚单位组成的复合体将具有确定的组成、质量(或质量范围)、序列以及长度,因此可以通过多种基于元素、质量、序列和长度的检测方法进行检测。当采用恰当的检测方法时,具有唯一的确定特征(例如唯一确定的质量、化学组成等)的复合体可能很容易与其它复合体种类区分开。
“基因”指的是对基因产物(即多肽或RNA分子)编码的特定遗传位点或DNA分子中的区域。除了所述结构编码区,基因可能还包括非编码区,包括内含子、转录但不翻译的区域以及所述编码区上游和下游调节元件。根据上下文,“基因”可能任选包括表达所述基因必需的核苷酸序列(例如,启动子、增强子等)。
术语“基因型”指的是受试者基因组中至少部分基因的等位基因身份。样品“基因分型”指的是确定在特定位置由受试者(在其全部或仅部分细胞中)携带的所述特定等位基因或所述特定核苷酸。因此,基因型可能指的是一个或多个特定等位基因。
“杂交体”或“双链体(二倍体,duplex)”指的是由两个线性聚合体构成的分子,所述两个线性聚合物在各自长度的至少一部分上杂交而形成稳定的杂交体或双链体分子。在杂交体中,每个线性聚合物均由碱基亚单位构成。这种聚合物的实例包括含有天然存在的和/或修饰的碱基和/或主干化学的单链RNA和DNA分子。所述杂交体的双链区足够稳定,因此可以维持用于预期的目的或操作,例如作为可被催化延伸的引物;因此,如果需要,双链体可以从单链分子上分离,等等。
“杂交”指的是在指定的杂交分析条件下以平行或优选的反向平行的方向两条完全或部分互补的核酸链聚合到一起而形成具有双链区的稳定结构的能力。这种双链结构(有时称为杂交体或双链体)的两条组成链,由氢键束缚在一起。尽管这种氢键通常在单核酸链上含有所述碱基腺嘌呤与胸腺嘧啶或尿嘧啶(A与T或U)或者胞嘧啶与鸟嘌呤(C与G)的核苷酸之间形成,但也可以在非“规范”配对成员的碱基之间形成,如本领域中已知的。
术语“同位素确定的”指的是具有相同化学式的分子群,其中构成所述分子的一种或多种原子种类具有比天然存在更严格的同位素分布(由于同位素富集或损耗)。例如,典型的碳原子具有几种天然存在的同位素(例如:12C6、13C6和14C6),其中每一种具有不同数量的中子(分别为6、7和8)。提到特定元素的同位素时,使用分子式“AXZ”,其中“X”是所述原子的化学符号,“Z”是原子数量(等于所述元素的原子中质子的数量),而“A”是所述特定同位素中质子和中子总和的数量。已经有研究报道了一部分天然存在的C、H、N以及O的同位素的相对丰度(见例如Bievre and Taylor(1993),Int.J.Mass.Spectrom.Ion Phys.,vol.123:149)。对于碳,所述12C6和13C6同位素的相对丰度(以百分比表示)分别为98.90和1.10。对于氢,所述1H1和2H1同位素的相对丰度分别为99.985和0.015。氮的14N7和15N7同位素的相对丰度分别为99.634和0.366,而所述氧同位素16O8、17O8和18O8同位素的相对丰度分别为99.762、0.038和0.200。如前述,如果所述碳原子同位素12C6和13C6在所述种群中的相对丰度分别是99.90和0.10,则特定种类(物种,species)(例如:核苷如腺苷)的分子群将关于碳进行同位素确定。因此,对于由几种原子种类构成的分子,其中一种或多种具有一种以上天然存在的同位素,则分子的合成利用其中富集的最普遍的同位素原子,即其中相对而言相比于所述该元素丰度低的同位素而存在的丰度大的同位素,或者较少(最少)丰度的同位素被损耗。用于同位素富集和损耗的方法在本领域中已知。
“标记”指的是通过直接或间接方法将分子连接到所述标记上的分子。此处,“直接”检测指的是不需要另一个分子与用于检测的标记基团相互作用。可以直接检测到的标记包括放射性同位素、发光性分子、荧光分子以及其它可以直接检测其存在的分子。“间接”检测指的是为了检测需要一个或多个其它分子与所述标记基团相互作用的方法。可以间接检测的标记包括高亲和性结合配对的一个成员(例如:生物素和抗生物素蛋白链菌素中的一个,以及抗体及其一个或多个特异抗体(或抗体片段)中的一个,等等)。
“文库”(库,library)指的是两个或多个不同分子种类的集合。在复合体的上下文中,文库包括多个不同的复合体种类。典型的,每种复合体种类与不同的靶分子相关,可理解为:“不同的靶分子”意思可以为相同分子(例如:基因或多肽)遗传性或结构性变异体,也可以为由不同基因编码的不同基因或多肽靶分子。在靶检测试剂的上下文中,文库包括两种或多种不同的靶试剂种类。在任何情况下,文库的成员可由于靶结合基团(部分,moiety)和/或复合体模板的差异而与其它成员区分开。
在本发明的上下文中,术语“多重”、“多重化”以及相似术语指的是在单个分析中检测和/或分析多个靶生物分子种类的能力。例如,多个不同的靶检测试剂,每个均特异于不同种类的靶生物分子,可以用来在单个分析中分析生物样品。如果样品中存在部分或全部被靶向的生物分子,所述分析结果将如之表明。因此,多重化显著增加了分析效率,典型的,多重化允许在单个分析中分析多于10种、优选多于50、100、250、500或1,000种、较优选多于1,000种不同种类的靶生物分子。当然,可以在特定多重化分析中检测的靶分子种类数量将依赖于某些因素如由所采用的多种靶检测试剂编码的复合体的化学组成、使用的检测剂类型以及所述检测剂的敏感性,等等。
术语“突变的基因”指的是相对于不含有突变基因的受试者,能够改变具有所述突变的受试者表型的基因等位形式。如果受试者必须对这种突变纯合才能具有改变的表型,所述突变称为“隐性”。如果一个拷贝的所述突变基因足以改变所述受试者的表型,所述突变称为显性。如果受试者具有一个拷贝的所述突变基因且其具有的表型介于纯合受试者和杂合受试者(对该基因)的表型之间,所述突变称为共显性。如在本文中应用的术语“突变”指的是不同基因组之间或者具有的频率低于1%的个体之间,在特定遗传位点(例如基因中的核苷酸位置)核苷酸序列的差异。
本文中,术语“核酸”指的是由天然存在的核糖-或脱氧核糖核苷酸组成的双链或单链聚合物分子(例如:RNA、mRNA、rRNA、tRNA、小核RNA、DNA、cDNA以及RNA/DNA共聚物),以及修饰的/非天然核酸,常称为核酸模拟物。核酸模拟物的实例包括具有磷酸二酯的修饰物或取代物,包括硫代磷酸酯、磷酸甲酯、苷硼烷磷酸酯、酰胺、酯和醚的亚单位间键接,以及用分子完全取代亚单位,所述分子如除了核苷和核苷酸以外切割连接(例如可光切割的硝基苯基)以及碱基亚单位。“靶”核酸是含有靶核酸序列的核酸。
“核苷酸序列”通常指的是构成特定核酸分子的碱基的线性序列。除非另有指明,核苷酸序列写为5’到3’。“靶”核苷酸序列指的是样品中存在的核酸分子的核苷酸序列被靶向的特定部分,因此与所述相应靶检测试剂的寡核苷酸部分基本互补。
“核酸扩增”指的是用于增加特定核酸分子数量的方法。根据本发明的核酸扩增可能为线性的或指数的,尽管优选指数扩增。
“核酸碱基(碱基,nucleobase)”指的是能够与互补碱基形成氢键而形成碱基对的碱基。碱基包括腺嘌呤(“A”)、胞嘧啶(“C”)、鸟嘌呤(“G”)、次黄嘌呤、乳清酸、胸腺嘧啶(“T”)、尿嘧啶(“U”)以及黄嘌呤。碱基对包括所述标准的Watson-Crick DNA碱基对A:T、T:A、G:C、C:G,而在RNA中,U代替T。“碱基亚单位”指的是线性聚合物的特定单体亚单位,其中所述亚单位包括与允许亚单位聚合的骨架(scaffold)连接的碱基,因此得到的单链聚合物表现出其起源的碱基,因此所述聚合物可以与互补的核酸分子(例如:生物样品中天然存在的靶核酸分子)形成稳定的双链杂交体。核苷和核苷酸代表实施本发明时比较有用的碱基亚单位的优选实例。碱基还可以修饰为包括一个或多个已知化学组成的分子,以进行质量修饰。这种质量修饰基团命名为“质量标签”,得到的质量修饰核苷或碱基亚单位分别命名为“质量标记的核苷”和“质量标记的碱基亚单位”。
“核苷”是通过糖的C-1与N-9(在嘧啶碱基的情况)或N-1(在嘌呤碱基的情况)之间的N-糖苷键而将嘌呤或嘧啶碱连接到糖基(例如:β-D-核糖或β-D-2-脱氧核糖)的分子。所述糖基在脱氧核糖核苷酸中为2’-脱氧核糖,在核糖核苷酸中为核糖基团。脱氧核糖和核糖的类似物也可以应用,包括2’、3’-脱氧以及大量本领域中已知的其它核苷酸模拟物。模拟物包括链终止核苷酸,例如3’-O-甲基、卤化碱基或糖取代基;替代性的糖结构包括非糖、烷基环状结构。核苷的代表性实例包括腺苷、胞苷、鸟苷、肌苷、乳清酸核苷、胸苷、尿苷以及黄苷。“核苷亚单位”指的是多聚核苷酸的特定核苷。
“核苷酸”指的是具有一个或多个酯化于其糖基5’-碳原子的磷酸酯基团的核苷。核苷酸可以为天然存在的或者合成的。在实施本发明时非常有用的核苷酸的代表性实例包括腺苷单-、双-以及三-磷酸(phosphate);胞苷单-、双-以及三-磷酸;鸟苷单-、双-以及三-磷酸;肌苷;乳清酸核苷;胸苷单-、双-以及三-磷酸;尿苷单-、双-以及三-磷酸;以及黄苷。
“寡核苷酸”是由两个或多个核苷和/或碱基亚单位偶联在一起而构成,例如通过核苷酸的聚合。寡核苷酸可能由包括例如在DNA和/或RNA及其类似物中存在的碱基组成。当所述碱基亚单位是核苷时,所述碱基亚单位的糖基可能为核糖、脱氧核糖或其类似物,包括例如用2’-O-甲基取代呋喃核糖(ribofuranosyl)基的核糖核苷。所述碱基亚单位可能由某些诸如磷酸二酯键接基、修饰的键接基,或通过不阻止所述寡核苷酸杂交于其互补的靶核酸序列的非核苷酸基团之间的键连接。修饰的键包括那些标准磷酸二酯键接基由不同的键取代,例如硫代磷酸酯键键接基或磷酸甲酯键键接基。碱基亚单位可能通过例如天然DNA的脱氧核糖磷酸主干由假肽主干取代,例如2-氨乙基甘氨酸(2-aminoethylglycine)主干,其通过羧甲基连接子连接到中心的仲胺而与核酸碱基亚单位偶联。具有假肽主干的DNA类似物通常称为“肽核酸”或“PNAs”(见例如第5,539,082号美国专利)。本发明设想的寡核苷酸或低聚物的其它非限定性示例包括含有双环或三环核苷的核酸类似物以及称为“锁核酸”“锁核苷酸类似物”或“LNAs”的核苷酸类似物(见例如第6,083,482号美国专利)。只要所述修饰的寡核苷酸在严严格的杂交分析条件或扩增条件下可以杂交于靶核酸,任何核酸类似物均属本发明所设想使用的。具有特定碱基亚单位序列的寡核苷酸可以通过本领域中的普通技术人员已知的技术生产,例如通过化学分析或其它恰当方法。
当寡核苷酸含有至少6个,优选8、9、10、11、12、13、14、15或更多连续碱基,且其中至少80%,优选至少90%,最优选100%,互补于相应靶核酸中核苷酸连续跨距时,则其“基本互补”于其相应的靶核酸分子。本领域的熟练技术人员很容易理解,以各种互补性百分比,对杂交分析条件所作的调整,以允许所述寡核苷酸杂交到所述靶序列上而同时防止不可接受水平的非特异性杂交。互补性的程度通过比较构成待比较其互补性的两个区域的碱基顺序而确定,并不将所述两个核酸之间存在的其它结构差异考虑在内,只要所述结构差异不阻碍互补碱基之间的氢键键合。两个核酸之间互补性程度还可以根据待比较区域中存在的碱基错配的数量而表示,错配范围可能为0到4,优选0到2个碱基。
根据本发明的“可取得专利的”组合物、过程、机器或生产的制品(article of manufacture)意思为所述主体物质符合实施分析时所有的法定专利性要求。例如,关于新颖性、非显著性等,如果后来的研究表明一个或多个权利要求包括一个或多个不具有新颖性、非明显性等的具体实施方式,则所述由“可取得专利的”具体实施方式限定的权利要求则明确排除非可取得专利的具体实施方式。对本文中所附的权利要求加以解释,就提供了最宽泛的合理范围并保持其有效性。另外,如果一个或多个所述法定专利性条件被修订,或如果从该申请提交或公开(issue)作为专利的时间开始至再次分析所述附加的权利要求的有效性为止,用于所述评估特定法定专利性条件的标准发生改变,则所述权利要求将以以下方式解释:(1)保持其有效性(2)在所述情况下提供最宽泛的合理解释。
“多个”指多于一个。
术语“多态性”指的是在不同基因组或个体之间存在两个或多个可替代性基因组序列或等位基因。因此,“多态的”指的是一个以上基因或其部分(例如,等位基因变异体)共同存在。如果基因的一部分存在至少两种不同形式,即两种不同的核苷酸序列,则称为基因的“多态区”。多态区可以包括少至只有单个核苷酸,其身份在不同等位基因中不同。“单核苷酸多态性”或“SNP”是单个碱基对的改变。典型地,单核苷酸多态性在所述多态位点由于一个核苷酸被另一个核苷酸替换而发生。单个核苷酸的缺失或插入也可以引起单核苷酸多态性。多态区可以涉及多个连续的核苷酸,如几个核苷酸的替换、重排、插入和缺失,尽管这些多态性比较少见。
“多核苷酸”通常指核苷酸的线性聚合物,尽管如果所述聚合物除了核苷酸或核苷之外还含有一个或多个碱基亚单位,为了本发明的目的,其仍然被称为多核苷酸。优选的多核苷酸是其中多个亚单位通过核苷酸之间的5’-3’磷酸二酯键连接的多核苷酸。多核苷酸包括单链和双链DNA和RNA分子,包括其中一条链或两条链通过重组或合成而生成的多核苷酸。
“多肽”指的是包括氨基酸残基(其包括天然和非天然氨基酸残基)聚合物的分子。因此,多肽包括肽和蛋白,包括天然和改造的(engineered)蛋白、酶、抗体、抗体片段以及蛋白共轭体。在优选的具体实施方式中,多肽为抗体、抗体片段、酶、受体、受体配体、调节性蛋白、核酸结合蛋白、激素或展示方法的蛋白产物例如噬菌体展示方法或细菌展示方法。
术语“优先杂交”意指在严格的杂交分析条件下,互补性核酸(或还含有非互补区的核酸互补区)杂交形成稳定的杂交体。优先杂交可以利用标准技术加以测定。与非互补性核酸杂交相比,优选核酸种类与其互补性核酸的杂交存在至少约10倍的差异,更优选至少约100倍的差异,最优选至少约1,000倍的差异。优选所述反应条件使得检测样品中非互补性核酸之间的杂交不高于所述背景信号水平。
“探针”指的是最低地含有至少一个靶结合基团的分子。因此,探针可能包括两个或多个靶结合基团,其可能被连接形成所述探针。例如,特定探针可能包括两个寡核苷酸,当所述两个寡核苷酸杂交于其各自的靶分子时,则变为邻近的,使得其可以相连(例如连接)而形成完整的探针分子。探针(或其组成部分)可能还含有其它组分包括标记和标签,标签作为可允许其所连接的分子与混合物(例如:溶液)中存在的其它分子分离的基团。
“启动子”意指足以指导由所述启动子可操作地(有效,operably)连接的DNA分子编码的多肽进行直接转录的最小DNA序列,即在所述启动子和所述编码序列(例如复合体编码区)之间存在功能键接,使得所述编码序列可以被RNA聚合酶转录。通常“启动子”指的是多个可以指导核酸转录的核酸控制序列。如在本文中使用的,启动子包括必要的核酸序列用于RNA聚合酶结合、转录起始以及延伸。启动子的起源可以为原核或真核的,优选噬菌体启动子例如T7、T3和SP6启动子。在其它的启动子中,真核启动子还包括来自于CMV、SV40、逆转录病毒以及腺病毒的启动子。任选启动子还包括位于从转录起始位点开始的多至几千个碱基对的远端增强子或抑制子元件。启动子还包括“通用”启动子(consensus promoter),并不是天然存在的,但可以设计,例如通过比较高水平转录基因的启动子序列而开发反映“通用”碱基(典型的,在所述待比较的序列中特定核苷酸位置被最频繁地代表的核苷酸)的启动子序列,构成所述启动子的碱基亚单位中的至少一个、优选一些、最优选全部。
术语“反应条件”意指允许彼此间特异性相互作用的分子优先相互作用的反应条件。反应条件包括温度、溶质浓度、pH、离子浓度等。严格的杂交条件是在核酸杂交时代表性的反应条件。
术语“反应基团(反应活性基团)”指的是利用特异性化学性质,在较大分子中能够与另一个分子的反应基团发生反应的化学基团。
术语“单独的”、“纯化的”、“分离的”以及相似术语意指装有样品的容器中含有的样品的一个或多个组分已经与从所述容器中存在的一个或多个其它样品组分物理地被移除,或者在其存在时进行稀释。在分离或纯化步骤中可被移除或稀释的样品组分包括蛋白、糖类、脂类、抑制剂、非靶核酸以及未结合的探针分子。通过靶捕获步骤,结合于固定的捕获探针上的靶核酸优选在所述分离或纯化步骤过程中保留于样品中。
本文中,术语“种类”在多个环境中应用,例如:复合体种类、靶分子种类、核苷酸种类,等等。每个环境中,所述术语指的是在特定环境中提到的种类中一群化学上没有差别的分子。例如,“复合体种类”是一群复合体,具有相同的化学组成并因此具有相同质量。当然,由于具有相同化学结构的分子中存在等位基因变异,特定种类内的分子可能质量稍有差别,因此实际上所述特定分子种类(例如复合体)的“质量”代表一个小的质量范围。根据某些因素,例如在特定分析中的多重化水平、所采用分析系统的敏感性等,需要从同位素确定的亚单位(例如:三磷酸核糖核苷酸)合成复合体以更加严格地确定所述特定复合体小的质量范围,因此增强从所述样品分析中得到的质谱中出现质量峰值的分辨率。
本文中,“稳定的”指的是两个分子(例如:在其互补区上核酸二聚体的链)之间的相互作用足够稳定因此所述分子可以保存用于预期目的或操作。例如,引物与其同源引物结合位点之间的“稳定”相互作用指的是该相互作用允许所述引物在适合引物延伸反应的反应条件下进行延伸。
短语“严格的杂交分析条件”、“杂交分析条件”、“严格的杂交条件”、“严格的条件”以及相似语意指允许互补性核酸(例如:寡核苷酸或还含有其它区域的寡核苷酸的靶序列结合区以及具有与其互补碱基序列的核酸)优先杂交的反应条件。严格的杂交分析条件可能根据多种因素而变动,包括所述核酸之间互补区的GC含量以及长度、所述互补性序列与所述样品中可能存在的其它序列之间的相似性程度。杂交条件包括温度以及所述杂交试剂或溶液的组成。
“亚单位”指的是较大分子的一部分。因此,聚合体由两个或多个亚单位组成。示例性亚单位包括单个氨基酸、碱基亚单位、DNA或RNA中的核苷和用来合成核酸或寡核苷酸的单个核苷酸,以及可以用作例如寡核苷酸或肽合成中间产物的亚单位多聚体(例如,包括两个、三个、四个或更多亚单位例如核苷酸的分子)。在其它环境下,如果寡核苷酸含有两个不同区域例如靶结合基团和复合体模板,所述不同区域中每一种均可以称为所述寡核苷酸的亚单位。
“标签”是可被连接到另一分子或被包括为其一部分的基团,以促进分析中的标签分子从未标签的分子分离。可标签分子的代表性示例包括靶检测试剂、切割底物以及复合体。
“靶结合部分(基团,moiety)”指的是能特异性识别分子的分子。能特异性识别分子的分子能够与其它分子特异结合性相互作用。具体而言,靶结合基团是根据本发明的靶检测试剂中能够与靶分子特异性相互作用并与其结合的部分。优选的靶结合基团由多核苷酸(例如寡核苷酸)和多肽(例如抗体和抗体片段)以及核酸适体(适配体,aptamer)(即:特异性结合于其它分子或以其它方式与其相互作用的合成核酸分子,所述其它分子包括蛋白和小分子),以及小分子(即天然存在或合成的有机分子,分子质量小于约10,000Da,且特异性结合于感兴趣生物分子种类(例如靶蛋白)或以其它方式与其相互作用)。
术语“靶分子”或“靶”指的是其存在、缺乏或其丰度待确定的分子。优选的靶是生物分子包括多肽和核酸分子。
“靶核酸”指的是含有靶核酸序列的核酸分子,典型地,其序列由核苷酸构成。靶核酸可能为单链或双链。在双链分子中,所述链优选在至少包括所述靶核苷酸序列的部分是分离的,以促进特异于所述特定靶核苷酸序列的靶检测试剂的靶结合基团杂交。
利用“靶核酸序列”、“靶核苷酸序列”、“靶序列”或“靶区域”表示构成全部或部分靶核酸分子核苷酸序列的特异性脱氧核糖核苷酸或核糖核苷酸序列。
“靶序列结合区”指的是核酸分子例如寡核苷酸,其具有的碱基序列足够互补于其靶核酸序列以形成例如寡核苷酸:靶杂交体,可在严格的杂交分析条件下用于检测。典型地,靶序列结合区包括至少6个碱基亚单位,优选6到500或1000个碱基亚单位。
“转录单位”指的是编码根据本发明的复合体或切割底物的分子。转录单位在所述模板中用于合成根据本发明的复合体。优选复合体的合成通过转录所述转录单位的复合体编码区而实现。因此,优选的,转录单位至少包括一个功能性启动子和一个复合体编码区。
在本发明中,“唯一的”指的是以一种或多种可区分方式与所述存在的其它分子种类不同的分子种类。就复合体而言,特定反应中产生的每个复合体种类与所述反应中产生的其它复合体种类中每一种相比优选均是唯一的。因此,即使在一个特定反应中存在的全部复合体种类将要根据单个确定的特征(例如质量)而加以分析,每个复合体种类的质量(或质量范围)将与存在的其它复合体种类足够不同,而使其可以在所述特定分析环境中被检测和分辨。在靶分子,“唯一的靶分子”指的是可以与特定反应中所述其它分子种类的每一种区分开的靶分子种类。如人们所理解的,单个基因(或包括核苷酸连续跨距(优选约10到约一百万或更多核苷酸)的其它遗传位点)可能含有多个位点可被不同的靶检测试剂种类(所述种类由于不同的靶检测基团而彼此区分,且优选还由于编码可区分复合体种类的不同复合体模板种类)所独立靶向。
发明内容
本发明提供用于有效分析样品的试剂和方法,以确定其是否含有一种或多种不同种类的靶分子。按照本发明,样品中一种或多种特定靶分子种类的检测是间接发生的,因为所述检测步骤不涉及直接检测所述靶分子,相反,特定靶是通过检测与之相关的复合体而进行检测。在本发明中,间接检测特定种类的靶分子通过在分析过程中产生相应的复合体种类而实现。因此,只要所述样品中存在与之相关的所述靶分子,复合体种类(species)即可用于检测。
每个复合体种类均被设计成包括聚合的亚单位,可以产生具有确定特征的分子,例如一种或多种确定的化学组成、确定的分子式或确定的质量、序列、长度或结构,可以使其在复杂混合物中被检测到,因此检测到所述复合体表明所述靶分子存在于样品中。为了在分析过程中产生与靶分子相关的复合体,编码所述预期复合体的复合体模板(或其互补物)作为特异于所述特定种类靶分子的靶检测试剂的一部分而提供。通过包括一种或多种与所述复合体模板相关的靶结合基团可将靶特异性传递至靶检测试剂。因此,样品中是否存在靶分子可通过利用特异于所述靶分子的靶检测试剂接触所述样品而形成试剂:靶复合体来确定。在某些具体实施方式中,在产生复合体之前,去除那些尚未与其同源的靶分子(例如,因为所述靶不存在于所述样品中、所述靶分子存在但其浓度由于靶检测分子过量而造成结合的饱和,等等)发生相互作用的靶检测分子是比较有益的。在其它具体实施方式中,特异于特定靶的完整靶检测试剂可能仅在存在特定靶分子种类时形成,因此限制了任何可能通过中间纯化、提取或分离步骤而获得的优势。
如果所述样品中存在靶分子,所述靶检测试剂的靶结合基团将与之结合。其后,使用所述包括复合体编码区的复合体模板引导所述被编码的复合体(或包括所述复合体的较大前体)的生成。由于特定复合体相关于特定靶分子,并因此表明其在样品中存在,所以检测到所述复合体间接表明相应的靶分子存在于所述样品中。另外,因为特定复合体种类具有确定的特征,可使其与分析中还可能产生的其它复合体种类区分开,可以在单个分析中检测到多个不同复合体种类,因此对于多种不同的靶分子种类(例如:核酸分子、多肽、脂类和糖类)特别是靶生物分子,可进行复杂样品(例如生物样品)的多重分析
因此,本发明的一个方面涉及可取得专利的靶检测试剂,其中每一种均包括靶结合基团和编码复合体的复合体模板或其互补物,检测到复合体间接表明存在与所述特定复合体相关的特定靶分子。通常,靶检测基团包括特异于靶分子的分子,因此在分析中,所述靶检测试剂可以特异性结合于或以其它方式与所述靶分子反应。在某些实施例中,所述靶结合基团包括多肽,优选特异于所述靶分子的抗体、抗体片段、受体、或受体的配体。在其它实施例中,所述靶结合基团包括特异性靶向于靶核酸分子中靶核苷酸序列的核酸分子(例如寡核苷酸)。在另外的实施例中,所述靶结合基团包括适配体或小分子。
本发明的靶检测试剂中除了包括靶结合基团,所述靶检测试剂还包括至少一种复合体模板或其互补物,其可与所述靶结合基团直接或间接(例如通过连接子)相键接。如人们所理解的,复合体模板至少编码一个复合体,而检测到复合体则间接表明所研究的样品中存在特定靶分子种类。在某些具体实施方式中,复合体模板编码的切割底物是包括复合体以及至少一个其它亚单位的分子,所述亚单位可以从所述切割底物上释放以得到复合体。在优选的具体实施方式中,复合体模板为核酸分子,特别是寡核苷酸。
复合体可以通过任何恰当的过程从复合体模板产生,所述过程允许利用所述复合体模板使亚单位聚合,以引导复合体(或切割底物)的产生。在优选的具体实施方式中,复合体模板(或其互补物)编码转录单位。功能性转录单位包括的启动子区与复合体编码区可操作地连接。从所述转录单位的转录可产生复合体,或者如果所述复合体编码区编码其它核苷酸,则可产生切割底物,而随后释放复合体。在其它具体实施方式中,复合体(或切割底物)通过另外的过程从所述复合体模板产生,例如通过延伸反应(例如引物延伸),其可由酶促催化或不需要酶促催化。
因此,本发明的另一个方面涉及一类可取得专利的分子,命名为复合体,在各种化学分析中非常有用。具体而言,检测到复合体间接表明所述与其相关的靶分子(包括生物靶分子)存在于样品中。与以前报道的质量标签及其相似物不同,在特定化学分析过程中,所述靶检测试剂的靶检测基团与所述靶分子反应或与其结合之后,复合体被合成。其后,复合体被合成,并根据其确定的特征例如化学组成、分子式、质量(例如通过质谱分析)、长度(例如通过电泳迁移率)、大小(例如通过层析)、亚单位序列(例如通过与寡核苷酸探针的杂交)等利用恰当的检测系统进行检测。所述复合体的确定特征可将其与其它复合体种类区分开。当然,因为用来合成复合体的亚单位的序列和身份(identity)可能不依赖于与其相关的靶分子,因此亚单位可以通过其它标准选择,例如聚合的难易程度、费用、稳定性、检测模式等。为了这个原因,复合体种类可以进行设计,以优化种类之间的差异,有利于例如分辨具体的多重分析过程中可能同时产生的多个复合体种类。
如人们所理解的,采用复合体指示样品中存在特定靶分子的分析,大大简化了分析样品所需要的生化步骤。而且,因为所述复合体的确定特征可以加以设计而用于特异性检测系统,多个不同的复合体种类可以在单个分析中产生并分辨,促进复杂样品(例如生物样品)的多重分析。
利用靶检测试剂的复合体模板部分作为引导,可从亚单位合成复合体(以及切割底物)。如果需要,在包括入任何分析前,用于产生复合体的单体亚单位可以组装成二聚体、三聚体以及其它中间亚单位聚合体。任何情况下,复合体模板引导亚单位种类依次加成到所述正形成的分子上。在优选的具体实施方式中,复合体模板包括具有确定核苷序列的碱基亚单位聚合体。因此,从这种模板分子产生的复合体将具有亚单位(例如,核苷)的相应序列,其根据所述复合体模板进行排列。核苷和核苷酸代表用于复合体合成的特别优选的亚单位种类,所述复合体由含有核酸碱基的亚单位构成。实际上,当复合体从三磷酸核苷酸(即:具有三磷酸基团的核苷酸通过酯键连接到糖基的C-5’位置)合成时,优选利用恰当的酶催化其合成。对该目的特别优选的有用酶是DNA确定的RNA聚合酶,例如T7、T3以及SP6RNA聚合酶。例如,对于通过引物延伸从引物产生的复合体,优选的酶包括所述DNA聚合酶Taq、Klenow片段、T4、T7以及E.coli DNA聚合酶I以及逆转录病毒的逆转录酶。
在其它具体实施方式中,复合体可能由氨基酸或糖类亚单位构成。在采用氨基酸的具体实施方式中,其序列一般由从复合体模板(或从之衍生的核酸产物)转录的RNA分子指导。因此,在这些具体实施方式中,从所述复合体模板(或以其它方式产生)转录的RNA作为随后生成所述复合体的中间体(即“复合体中间体”)。例如,转录后,mRNA可以被翻译而产生基于肽的复合体或较大前体,复合体可以随后从该较大前体释放(例如,通过恰当的物理、化学或酶促技术)并利用适宜的检测系统进行检测。在某些具体实施方式中,所述复合体中间体是从从复合体模板转录而来的mRNA翻译出来的肽,优选所述肽在体外翻译反应中从mRNA模板合成。
在还有的其它具体实施方式中,复合体从复合体模板非酶促地合成。例如,可以采用设计用于通过恰当的聚合化学进行聚合的碱基亚单位。在这种具体实施方式中,复合体一般通过初始聚合物的依次延伸而合成,据此,每一步中,一个新的亚单位被聚合到正形成的聚合物的末端残基的反应基团上。通常,这种合成通过多轮去保护及偶联而进行,以确保全部亚单位整合入分析中采用的靶检测试剂所编码的最大的可能复合体中。
根据特定靶检测试剂中包括的复合体模板,某些复合体可能最初作为较大前体的一部分而产生,所述前体在复合体检测前需要进一步加工。因此,本发明的另一个方面涉及这种前体。这种前体,命名为“切割底物”,包括至少两种不同的单体亚单位种类并含有至少两个区域:复合体和检测前可从所述复合体分离的另一个区域。当采用切割底物时,优选所述复合体部分缺乏至少一个存在于较大前体分子中的单体亚单位种类。可替代的,切割底物或多个切割底物,可能包括一个元件例如肽链内切酶的切割位点。无论哪种情况,优选所述切割底物的末端部分被切割以释放所述复合体,随后就可以检测其存在。复合体可以从切割底物释放,例如通过化学、物理或酶促切割。优选的,所述切割是亚单位特异的,且靶向于所述切割底物的复合体部分所缺乏的一种或多种亚单位种类。复合体从较大前体的分离确保在特定分析中产生的复合体表现出所述确定特征,使其随后被检测并与相应靶分子发生相关作用。从切割底物切割以产生复合体的区域包括单体亚单位的至少一部分。当所述切割区域包括多于一个单体亚单位时,所述亚单位可能例如为同种或异种,其中至少一个其种类不同于所述复合体中存在的单体亚单位种类。在其它实施例中,所述切割区域可能含有一个或多个亚单位,其种类与构成所述复合体的种类相同。在其它具体实施方式中,所述复合体不作为较大前体的一部分而生成。反之,从所述复合体模板(或复合体中间体)合成可直接得到所述特定复合体,不存在任何在检测前必须去除的部分。
典型的,复合体包括1到约1,000个单体亚单位(例如:单个碱基亚单位(特别是核糖核苷酸)、氨基酸等),尽管由几种单体亚单位构成的较大亚单位也可以采用,特别是当采用非酶促的聚合化学方法时。特别优选包括约3至约10、20、50及100个单体亚单位的复合体。在许多具体实施方式中,特别是那些其中多个复合体种类将于检测前从相应切割底物释放的实施例,优选所述复合体区域设计成包含少于可能用于特定反应的全部亚单位种类。例如,当切割底物从核糖核苷酸酶促合成时,优选所述复合体部分包括仅一个、两个或三个亚单位(这里为核糖核苷酸)种类,而所述切割底物的其它部分含有一个或多个亚单位,其中至少一种不存在于所述复合体中且因此可以用来将所述复合体从所述切割底物释放。当然,在某些采用切割底物的具体实施方式中,所述复合体不必含有少于所述前体所包含的特定亚单位,因为也可以采用依赖于两种或更多特定亚单位的存在以实现释放的技术。例如,基于肽的切割底物可以被设计成包含被蛋白酶特异切割的氨基酸序列。在这种具体实施方式中,蛋白水解性切割将所述复合体从所述切割底物的其余部分分离。
由于单个复合体种类被改造成具有至少一个确定特征(例如确定的化学组成、分子式、质量或质量范围、长度、大小、结构等)以允许一种复合体种类与分析中可能产生的其它所有复合体种类区分开,因此,优选所述特定复合体种类的确定特征可以被精确定义。例如,在某些具体实施方式中所述确定特征是质量,则质量的精确定义指所述种类的质量,更可能是质量范围(由于构成所述特定复合体种类分子的原子之间同位素的差异)较窄。为了将所述复合体种类的质量范围降到最小,如在采用基于质量检测系统(例如质谱分析)的高度多重化分析中所特别优选的,所述复合体(或切割底物)可以利用同位素确定的亚单位而产生。当然,为了获得相当的试剂,同位素确定的亚单位可能花费较高,其中所述试剂由还未富集或损耗的特定同位素原子构成,因此在这种具体实施方式中,优选所述切割底物包括除所述复合体区域之外尽量少的亚单位(优选不多于约100个,优选少于约25个并优选10、9、8、7、6、5、4、3、2或1个)。
因为复合体根据亚单位序列和/或组成进行设计,以提供一种或多种确定特征(例如:确定的质量、化学组成、分子式或质量范围、长度、序列和/或结构),如果需要,可以在一个特定分析中产生多种不同的复合体种类。可以用于一个特定分析中的复合体最大数量将依赖于多个因素,包括所述复合体的亚单位组成、所述复合体的部分或全部是否为同位素确定的(把质量作为所述确定特征的具体实施方式)、所采用的检测系统、可通过例如所采用的检测系统精确检测的质量范围(把质量作为所述确定特征的具体实施方式)、所采用检测剂的灵敏度、用来分析所得数据的软件、所分析的靶分子种类的数量,等等。
在某些优选的具体实施方式中,质量是用来区分复合体种类的确定特征。因此在这些具体实施方式中,复合体一般利用基于质量的检测技术进行检测,其中优选质谱分析。尽管设想任何已知的质谱分析法均可用来检测复合体,优选的方法是直接激光解吸电离质谱分析(无基质)、电喷雾离子化质谱分析、二次中性粒子质谱分析,其中优选二次离子质谱分析。特别优选的方法是基质辅助激光解吸电离质谱分析。在其它优选的具体实施方式中,所述确定特征是复合体长度。因此,复合体种类可以通过尺寸分离(sizeseparation)技术而区分,其优选的实例包括电泳和色谱分析法。在其它具体实施方式中,所述确定特征是化学组成。
如人们所理解的,可设计多个不同的复合体种类并在复合体模板库中编码,根据某些因素例如将在特定分析中采用的检测系统、在一个特定分析中可被检测的靶分子数量(以及因此的多重化水平)、同位素确定的亚单位是否可用以合成复合体(在采用质量检测以检测复合体的分析中)等,在特定反应中的复合体模板数量是不同。在特定的文库中,优选所述不同复合体模板种类被设计用来引导产生复合体种类,其很容易由所采用的特定检测系统进行分辨。在许多具体实施方式中,所述复合体模板将编码切割底物。因为包括特定复合体的亚单位序列不依赖于靶身份,因此由于所述特定靶检测试剂的靶结合基团决定靶特异性,同一组复合体可以用来检测不同组的靶分子。因此,不同的靶检测试剂文库可以利用单个连接于不同靶结合基团文库的复合体模板文库或其部分进行组装。如人们所理解的,对于特定的靶检测试剂文库,只要每种靶检测试剂种类的组分已知,就能使复合体种类与靶相关,因此检测由特定靶检测试剂编码的复合体间接表示样品中存在可被所述靶检测试剂识别的靶。复合体模板,单独或装配成靶检测试剂,均可进行包装并作为试剂盒出售。这种试剂盒可能包括多个复合体模板或靶检测试剂种类。当包装多个不同种类时,在某些具体实施方式中可以将其单个独立包装,而在其它具体实施方式中可将其部分或全部分开包装。而且,优选将复合体模板以及靶检测试剂制备成独立、纯化的试剂,且其可以液体或固态形式储存。
本发明的另外一个方面涉及利用本发明的复合体模板生成复合体的方法。在某些方法中,靶检测试剂的靶结合基团结合于其相应的靶分子而形成试剂:靶复合物后,所述复合体模板用来生成由其复合体编码区编码的复合体(或切割底物)。在某些具体实施方式中,所述靶检测试剂还可以包括一个或多个标签基团,所述基团可用来从该分析中其它组分纯化、提取或分离试剂:靶复合物(以及未反应的靶检测试剂分子)包括还未与靶分子反应的靶检测试剂。
在某些具体实施方式中,所述靶检测试剂包括复合体模板的互补物,所述复合体模板在复合体生成之前产生。在某些优选的实施例中,所述复合体模板包括转录单位,而且由此编码的复合体通过利用RNA聚合酶(优选DNA依赖的RNA聚合酶)转录所述复合体编码区而生成,其中所述RNA聚合酶可以指导与所述转录单位中包括的特定启动子功能性相关的核酸转录。在不涉及转录的其它具体实施方案中,例如引物延伸或利用所述复合体模板指导的亚单位聚合,提供恰当的反应条件以生成复合体(或切割底物)。在复合体模板编码切割底物的具体实施方式中,所述切割底物产生后,所述复合体优选与包含于切割底物中但不构成复合体一部分的其它亚单位发生分离。
如本领域技术人员很容易理解的,本发明提高了方法精确度、效率以及可信度,所述方法设计用来间接检测样品中存在的一种或多种类靶分子,特别是在复杂样品中,例如为了诊断或预后筛查的目的而从病人获得的生物样品。优选根据本发明实施的分析采用一个或多个对照分析,以降低假阴性或假阳性结果的可能性。本发明的方法还可以快速实施(例如,在短至2到3个小时内)且为经济有效的,因为不需要专业化试剂(除了根据本发明的靶检测试剂之外)。同样的,其可以在生物科学中得到广泛应用。因此,本发明的其它方面涉及本发明方法的应用。如人们所理解的,所述方法可以用于多种目的,包括诊断(例如:出生前或出生后)遗传疾病、对疾患或病症(例如肥胖、动脉硬化症或癌症)的遗传易感性、病原体(例如病毒、细菌、寄生虫或真菌)感染,或者提供关于身份、遗传性(例如亲子关系)、相容性(例如为了组织移植目的进行HLA表型分型)或对推荐药物或治疗方案的反应等方面的信息。
上述本发明的概述是非限定性的,而且本发明的其它特征和优势将在下面的图形、本发明的详细描述以及权利要求中变得显而易见。
附图说明
下面的图形构成了本说明书的一部分,将其包括在内是为了进一步阐述本发明的某些方面以及具体实施方式。通过参考这些图形中的一个或多个以及对本文中给出的具体实施方式的详细描述,可以更好的理解本发明。
图1以图解方式阐释了根据本发明的靶检测试剂的一般结构。如所示出的,靶检测试剂包括连接于靶结合基团(TBM)的复合体模板(CT)。CT-TBM连接基团(X)可能直接位于每个复合体模板与靶结合基团部分之间或通过位于所述复合体与靶结合基团之间的连接分子(或一组分子)的方式构成。优选位于不同组分之间的键是共价的。
图2以图解方式阐释了本发明中靶检测试剂的复合体模板的一般结构。在这个代表性的图解中,所述复合体模板包括一个复合体编码区以及一个终止子,然而可以理解终止子区是可选元件。当所述终止子包括在内时,就可以严格限制被编码的复合体的终端。终止子区的实例包括那些包含链终止亚单位(以致其它亚单位不能加成到初始复合体、切割底物或除了链终止亚单位以外的其它中间体,例如双脱氧核苷酸)、切割碱基等。优选的,包括终止子区的复合体模板文库的每一个成员将编码相同的终止子,从而促进通过例如切割碱基的切割而将所述终止子区去除。复合体模板由可利用恰当化学方法聚合的亚单位构成,包括酶促过程。所述复合体模板的亚单位作为模板,用于产生具有确定特征的复合体。
图3以图解方式阐释了根据本发明某些优选具体实施方式的复合体模板。在这些具体实施方式中,任选所述复合体模板可能包括一个终止子以及一个位于所述复合体编码区之前的区域,在图中标明为“Y”。当所述Y区包括在内时,其也包括一个或多个亚单位,例如碱基亚单位。如果存在Y区,优选的,这些额外的亚单位属于与所述复合体编码区亚单位相同的种类(例如,当所述复合体编码区包括碱基亚单位时,则为碱基亚单位)。如人们所理解的,在不同复合体模板中,复合体界定区之间的差异将彼此区分开,最终将所述由此编码的不同复合体种类彼此区分开。
图4以图解方式展示了根据本发明建立在图3举例说明基础上的一类优选复合体模板。这里,描述了其它元件,启动子-或引物结合位点编码区(或既包括引物结合位点又包括启动子的区域)。在那些所述复合体模板编码复合体的具体实施方式中,如有必要所述模板还编码转录开始时最终所需的其它序列(这里,标明为“Y”区)。
图5阐述了用于根据本发明的复合体模板的分子式优选的具体实施方式,与图3中示出的那些类似,区别在于在本图中所述复合体界定区限定为1到5个由分子式AxCyGz确定的碱基亚单位序列实例,其中x为0到5,而y和z每一种均独立地为0到10。
图6阐释了一个代表性的实例,说明来自于已经存在的组分库中成员的多个不同靶检测试剂种类的组装。如在本图中图示的,单个复合体模板文库包含复合体模板种类1、2、3直到n(CT1、CT2、CT3直到CTn),靶结合基团文库1包含x个种类的靶结合基团(编号为TBM-1、TBM-2、TBM-3直到TBM-x),其中每一种靶向于不同的靶核酸(例如不同的遗传变异),靶结合基团文库2包含y个种类的靶结合基团(编号为TBM-1、TBM-2、TBM-3直到TBM-y),其中每一种靶向于不同的多肽种类例如疾病相关蛋白。至于哪个靶结合基团包括在示出的5个靶检测试剂种类中,依赖于特定分析中带检测的靶分子。这里,所述靶分子种类中四种是核酸,第5种则是多肽。在决定哪种靶结合基团将被采用(根据待分析的特定靶)之后,则决定使用哪种复合体模板,并决定是否采用连接子(L)将特定复合体模板连接到其所归属的靶结合基团上。然后,所述5种检测试剂(TDR1-5)被组合。由于单个复合体物种的确定特征不依赖于特定靶的特性,复合体模板可以与靶结合基团组合,而不考虑靶序列、结构等。然而,将特定复合体模板以及特定靶结合基团装入所述靶检测试剂,得到的复合体则与特定靶相关,反之亦然。
图7以图解方式阐释了根据本发明复合体模板的几种特别优选具体实施方式。在这些具体实施方式的每一种中,所述复合体模板编码启动子(在三种复合体模板中为T7启动子,而在其它三种复合体模板中为SP6启动子)、转录起始密码子、复合体特异区(即:多个复合体种类中,经改造可使所述复合体种类在所述特定分析的检测阶段被区分开的区域)以及切割碱基。这种复合体模板及其编码的复合体,适用于极高水平的多重化、特别是与MALDI检测系统偶联时。本图阐释的具体实施方式中,每种复合体包括1到3种不同的,其中所述切割碱基包含核苷酸亚单位并未出现在所述复合体区中。在每种复合体,k、x、y、z是独立选择的整数,其范围为0到1000或更多,典型的0-100,优选0-50,可理解在特定的文库中每种复合体模板种类(及由此编码的复合体)的复合体特异区将与所述文库中其它种类的复合体特异区不同。本图还阐释了,在某些优选的具体实施方式中,得到的复合体可以被设计成包含质量修饰的亚单位(这里,以甲基化C残基代表性阐释,“Cme”)。
图8描述了根据本发明的一组靶检测试剂种类,其中每一种包括第一和第二寡核苷酸。如本实施例所示,两种第一寡核苷酸可以用来区分基因组DNA中的单核苷酸转变(即:靶核酸中特定核苷酸位置的A或G之间的差异)。哪种或哪些等位基因(含有A或G)存在于特定样品中可以通过将所述第二寡核苷酸的5’亚单位连接到第一寡核苷酸3’亚单位而确定,后者互补于含有A或G的等位基因。当所述第一和第二寡核苷酸相连时(例如,通过连接),得到的靶检测试剂可以利用互补于所述靶检测试剂中存在的引物结合位点(标明为“普适引物2”和“普适引物1”)的普适引物对来扩增。
图9A示出的模拟质谱,是通过利用例如线性轴向TOF质谱分析检测根据本发明的分析中所产生的复合体而获得的。如在本代表性实施例中示出的,85种易于区分的复合体(其分子式、长度以及质量在图9B中示出)可以从具有标准的或天然的同位素分布的核糖核苷酸而合成。在本示例性文库中示出的复合体种类可以通过分子式(rAxrGy)zrC代表,其中z在3-30之间,且z=x+y。这些复合体种类包括rA和rG亚单位中的一种或两种,且每个种类均包括切割碱基(这里,在每种复合体3’-末端为单个rC,其切割可以通过例如RNase A消化而实现)。基于RNA的复合体如在本实施例中描述的,例如,可以通过在体外转录反应中转录相应的切割模板而生成。如所描述的,这里阐述的85个成员的复合体库经设计用于通过线性轴向TOF质谱分析的检测,所利用的质谱窗在2500Da到10000Da之间,450质量分辨率(mr)为1500Da,650为4000Da,850为6000Da。设计所述文库时,考虑盐加成物的位置(Na和K),且所述库经设计而排除了某些复合体,因为其所具有盐加成物的质量而与其它复合体种类过于类似可能引起对结果的曲解。也考虑了双电荷质量信号,并在设计阶段即将那些可能因此而具有令人混淆的质量的复合体种类排除在外。
图10阐述了一类靶检测试剂,其中所述靶结合基团包括抗体,所述抗体与所述复合体模板相连。这种键可能涉及到连接子,优选为共价的。另外也示出了具体实施方式,其中所述靶检测试剂编码一个(图B)或两个(图C)引物结合位点,所述位点可以用来在生成所述编码复合体(或切割(分裂,cleavage)底物)之前扩增其邻近的复合体模板。
具体实施方式
宽泛地说,本发明提供的方法用于间接检测样品(例如生物样品)中的一个或多个特定靶分子种类,例如特定多肽或核酸种类,通过检测与所述靶分子种类特异性相关的复合体而间接检测特定种类的靶分子。复合体为线性聚合物,由亚单位特别是碱基亚单位组成,且其从与特异性结合于所述靶分子的靶特异性分子相关的模板而生成。为了帮助在单个分析中平行分析多个靶分子种类,复合体种类经设计可彼此区分。单独识别可通过一种或多种确定的特征而实现,所述特征在复合体种类之间不同。可被确定的复合体特征包括分子质量、亚单位序列和长度、结构、以及任何其它可经设计而区分不同种类的分子特征。根据所述复合体特定的确定特征,可采用恰当的系统用于复合体检测。
本发明的复合体有益于间接检测大量靶分子的存在,其中特别优选生物靶分子。可通过复合体表示其在样品中存在的生物分子的代表性实例包括基因序列检测、等位基因检测、等位基因的变异检测、非编码核苷酸序列检测、基因或蛋白序列内的突变检测、金属检测、毒素检测、多肽检测、糖类检测和脂类检测。
下面的描述从讨论代表性的样品制备技术开始,随后是对本发明的试剂和方法进行非限定性以及代表性的详细描述。
A.样品;样品制备
本发明适用于对单个样品中一个或多个靶分子同时进行高效检测。可根据本发明进行分析的样品包括环境样品,其可能包括或不包括生物材料。特别优选的样品是已知或怀疑其含有感兴趣生物分子种类的生物样品。用于分析的样品可从任何恰当来源获得。获得样品后,利用任何恰当技术进行处理,使所述靶分子能够被检测,如果其存在于所述样品或其一部分中,所述部分易于与根据本发明的靶检测试剂相互作用。
在含有一种或多种感兴趣靶分子的生物样品中,其中感兴趣靶分子为例如核酸分子、多肽、脂类、金属、毒素以及糖类,样品可从任何已知或怀疑含有待检测靶生物分子种类的来源而获得。这种样品可从固态材料如组织、细胞团和活检以及液体中制得。生物液体样品包括尿液、血液、唾液、羊水、漱口液、淋巴液、汗液、精液、粘液、泪液等。生物样品还包括那些从细胞培养等获得的样品。
生物样品可从任何活的或死的生物体获得。代表性的实例包括植物和动物以及从其衍生的细胞和组织。可以设想,本发明将在人类和动物医学中得到特别广泛的应用。
如果需要,生物样品可利用任何恰当步骤进行制备而用于分析。例如,冻-融和碱裂解步骤有利于从固态材料获得核酸分子;加热和碱裂解步骤有利于从尿液细胞中获得核酸分子;而蛋白酶K提取物可用来从血细胞获得核酸。其它恰当步骤在本领域中是已知的,且易于根据待检测的靶分子种类和将要获得的样品类型进行调整而用于实施本发明。如果需要,在样品制备过程中可采用一种或多种提取和浓缩步骤,以初步纯化和/或浓缩待检测种类的靶分子。例如,核酸可利用用多种本领域中已知的恰当试剂通过沉淀从细胞碎片中提取核酸。其它细胞组分可利用恰当的分级步骤而提取。
为了获得足够量的靶分子用于分析,特别是靶核酸分子,预期可能有必要进行初始扩增。用于本发明的恰当扩增步骤实例包括:克隆(见例如Sambrook,et al.,Molecular Cloning:A Laboratory Manual,Cold Spring HarborLaboratory Press,1989)、聚合酶链反应(PCR)(见例如C.R.Newton and A.Graham,PCR,BIOS Publishers,1994;第4,683,195;4,683,202;4,800,159;4,965,188;5,468,613;5,604,099;5,656,493;6,040,166以及6,514,736号美国专利)、连接酶链反应(LCR)(见例如Wiedmann,et al.,(1994)PCR Methods Appl.,vol.3:57-64;Barnay,F.(1991),Proc.Natl.Acad.Sci.USA,vol.88:189-93;第5,869,252和6,368,801号美国专利)、链取代性扩增(SDA)(见例如Walker,et al.(1994),Nucleic Acids Res.,vol.22:2670-77;U.S.patent no.5,455,166)以及变通例,如RT-PCR(见例如Higuchi,et al.(1993),Bio/Technology,vol.11:1026-1030)、等位基因特异性扩增(ASA)、利用Q-β复制酶扩增(Lizardi,et al.(1992),Bio/Technology,vol.6:1197-1202),以及基于转录的过程(见例如第5,480,784;5,824,518;6,087,133以及6,214,587号美国专利)。
为了有利于分析,靶分子可被固定于固态载体上,然而优选基于溶液的方法。恰当的固态载体的实例包括珠子(例如:硅胶珠子、可控孔玻璃珠子、磁化珠子、葡聚糖凝胶/琼脂糖珠子、纤维素珠子等);涂层及未涂层的纳米颗粒;平面或芯片(例如玻璃纤维滤器、玻璃表面、金属表面(如钢、金、银、铝、铜等))、毛细管、塑料(例如:聚乙烯、聚丙烯、聚酰胺、PVDF膜以及微滴定板);或者从类似材料制得的针或梳子,所述材料包括珠子或平面或置于平面如晶片(例如硅胶晶片)的孔内的珠子。
当需要或有必要在复合体(或切割底物)合成前,将尚未结合于其所特异的靶分子的靶检测试剂从分析中去除时,优选实施靶分子的固定。在优选的具体实施方式中,利用恰当的捕获试剂可将靶分子固定于固态载体上。例如,适用于基于核酸的靶分子环境中的捕获试剂包括结合于固态载体的寡核苷酸。优选这种寡核苷酸杂交于所述靶核苷酸序列附近区域的靶核酸分子。核酸分子被捕获后,可将一种或多种靶检测试剂加入到所述反应中。那些杂交于其各自靶序列的靶检测试剂被保留,而那些未杂交的靶检测试剂则被洗掉。其后,复合体被生成并进行检测。
B.靶检测试剂
靶检测试剂用来检测存在于样品中的感兴趣靶分子。靶检测试剂是合成的分子,包括靶结合基团和复合体模板(或其互补物),如在图1中示出的。靶结合基团和复合体模板可以在单个反应中合成,或者其可以通过使不同反应中的两个或多个亚单位组合而连接。在优选的具体实施方式中,靶结合基团和复合体模板独立合成,随后当需要或按要求将其连接。复合体模板和靶结合基团相对于彼此的取向由熟练技术人员判断,且依赖于特定应用。由核酸组分构成的靶检测试剂的代表性取向包括那些其中所述复合体模板位于所述靶结合基团的5’或3’的方向。类似的,其它可选组分例如引物结合位点(或其互补物)可能包括在内且位于靶结合基团和/或复合体模板的上游或下游(例如在基于核酸的组分中,分别为5’或3’)。
因为复合体不依赖于靶分子的序列或结构,单个产生复合体的复合体模板(或其子集)文库可以连接于多种不同类型靶结合基团例如那些从核酸和多肽(例如抗体和抗体片段)制得的基团,其中所述复合体被优化用于通过特定检测系统(如MALDI质谱分析)进行检测。如人们所理解的,所述复合体模板和靶结合基团可以通过连接子而相连。另外,所述复合体模板-靶结合基团的键合是共价的,尽管也可以采用由高亲和性结合对(例如抗生物素蛋白链菌素与生物素、抗体与抗原、受体与配体,等等)介导的非共价键。
靶结合基团包含一个或多个反应基团,其中每一种特异于特定种类的靶分子(例如,特定等位基因或多肽),然而,针对不同区域,两个反应基团可能对同一靶分子都具有特异性。例如,不同抗体可能抗同一多肽,其中每一种不同种类针对不同抗原决定簇。可替代的,两种寡核苷酸如果靶向于同一基因的不同区域例如针对不同等位基因或同一等位基因内的不同区域,则可将其合并。检测核酸时,优选的靶结合基团是与其特异性反应的,且因此能够选择性地杂交于感兴趣靶核酸分子中的靶核酸序列的寡核苷酸。除了肽、多肽、核酸等,其它靶结合基团种类包括适配体和小分子。
至于检测非核酸靶分子,典型地,所述靶检测试剂包含至少一个反应基团,所述反应基团包括多肽,优选抗体、抗体片段(即所述抗原反应活性部分)、受体、其靶分子是受体的配体、或从基于噬菌体展示的步骤衍生的靶特异性多肽。这种基于多肽的靶结合分子可从任何恰当来源的生物体获得,且其可以利用任何恰当技术合成。特别优选的是从与待检测靶分子相同的植物或动物种类衍生的靶结合基团。另外,对于含有多于25个氨基酸残基的多肽,这种分子优选利用重组技术合成,而较短的多肽则优选利用固态化学而合成。
在其它具体实施方式中,特别是那些其中所述靶分子是核酸或者特异性结合含有特定核苷酸序列的核酸的多肽,所述靶检测试剂的反应基团包括核酸分子(例如寡核苷酸),其特异性靶向于靶核酸分子中的靶核苷酸序列或者,在某些具体实施方式中为核酸结合蛋白。在某些具体实施方式中,所述靶结合基团由所述靶分子的靶核苷酸序列内两个彼此特异性邻近结合的分子构成。优选所述分子结合于所述靶,致使一个分子的3’-末端核苷酸相邻于另一个分子的5’末端核苷酸,使得其能够被连接,优选通过连接酶连接,以形成包括所述特定靶检测试剂的靶结合基团的单个分子。
无论特定靶检测试剂中包括的反应基团(即所述靶结合基团)是什么,所述试剂还包括至少一个复合体模板。复合体模板或其互补物,至少编码可在恰当条件下生成的复合体。在某些优选的具体实施方式中,复合体模板编码转录单位,能够指导编码的复合体表达,例如通过转录进行,这种情况出现在所述复合体包括核糖核苷酸的具体实施方式中,或者通过转录和翻译,而这种情况是出现在复合体由氨基酸残基构成时。在其它具体实施方式中,所述复合体模板作为后期复合体合成(例如通过引物延伸)的模板。
优选所述复合体模板为单链核酸,典型地为寡核苷酸,其包括设计的核苷酸、核苷或其它含有碱基的单体亚单位序列。然而,如有需要,所述复合体模板可以为双链分子,在这种情况下,采用的方法和试剂要作相应的调整。如人们所理解的,非酶促途径可以用来从复合体模板生成复合体,其中所述复合体模板的组分无需设计就能提供由RNA聚合酶转录的能力。
在优选的的具体实施方式中,所述复合体模板编码转录单位,所述转录单位至少编码一个启动子区和一个复合体编码区。从所述转录单位进行的转录产生复合体或被翻译以生成基于氨基酸的复合体的mRNA。在某些具体实施方式中,除了构成所述复合体(或可被翻译生成所述复合体的RNA分子)的核苷酸之外,转录单位的复合体编码区还编码一个或多个其它核苷酸。然后,这种较大前体分子或切割底物,可经化学或酶促处理以释放所述特定复合体。
在某些具体实施方式中,其中复合体作为切割底物的一部分而合成,较大前体经设计以辅助所述复合体的随后释放,例如通过化学、物理或酶促切割。尽管复合体释放可通过任何恰当方法而实现,但现在优选通过一种或多种试剂(优选单个试剂种类)处理所述反应而同时释放一种、几种或多种复合体种类,而所述试剂是在所述较大前体的复合体部分之外的亚单位之处或之内特异性切割所述切割底物种类。如人们所理解的,所述切割基团可能为不稳定基团,适于将复合体从切割底物释放。因此,所述切割基团可能为可化学上可切割的键或不稳定化学连接键,并可能位于复合体的一端或两端。典型地,这种键可通过本领域中的熟练技术人员所熟知的方法而切割,例如通过酸、碱、氧化、还原、加热、光照或金属离子催化、取代或消除化学方法。当然,切割也可以在包括可由酶切割的基团或连接基团的亚单位发生。酶促可切割性释放基团包括磷酸二酯或酰胺连接基团,以及限制性内切酶的识别位点。
对于基于多肽的单链切割底物,复合体可以通过例如在所述切割底物中其它位置包括一个或多个在所述复合体部分不存在的可切割碱基亚单位种类。在生成所述切割底物后,用所述切割试剂处理可切割预计与切割试剂反应的亚单位,以生成具有预期质量的复合体种类,切割所需的特定条件将依赖于所采用的特定切割试剂。在由核苷酸构成的单链复合体中,恰当的切割试剂包括那些适用于核苷酸特异性切割的试剂。这种化合物的实例包括那些在Maxam和Gilbert测序技术中(Proc.Nat’l Acad.Sci.USA,vol.74(2):560-564,1977)使用的化合物,例如硫酸二甲酯、肼以及哌啶。另外,可采用对切割易感或抗切割(其为化学、酶促或物理)的修饰核酸碱基亚单位(例如那些含有甲基磷酸酯基团的亚单位)。
另一方面,如果一个或多个复合体设计为双链核酸,可能优选其它切割方法。例如,可在所述切割底物中引入一个或多个限制性内切酶识别位点。特别优选的是II型限制性内切酶位点,特别是那些包括四碱基对回文结构序列的位点,其可得到平端切割产物。在由内切酶切割得到单链突出末端的具体实施方式中,外切核酸酶可以用来去除未配对的核苷酸。
在由含有碱基的亚单位构成的优选单链复合体和切割底物环境中,优选所述待检测的复合体种类(如果在特定反应容器中合成的一个、几个或多个不同复合体种类作为较大切割底物一部分而合成)不含有所述可切割碱基的亚单位种类。如人们所理解的,当生成多个不同复合体时,优选所述复合体部分均不包含切割亚单位。以这种方式,仅所述可切割碱基亚单位种类将在所述切割反应中被切割,因此释放所述复合体。而且,仅需采用一种切割试剂以实现所述切割种类中包含的所有不同复合体种类的释放。优选的可切割碱基亚单位种类包括腺嘌呤、胞嘧啶、鸟嘌呤、次黄嘌呤、乳清酸、胸腺嘧啶、尿嘧啶以及黄嘌呤和肌苷。当一种或多种碱基亚单位整合入切割底物时,其可以在本领域已知的条件下用任何恰当的化学、酶促或物理技术处理而进行切割。在特定具体实施方式中,所述可化学切割的连接基包括修饰的碱基、修饰的糖、二硫键、整合入由核苷酸而合成的核酸的磷酸主干的可化学切割基团或另外的恰当可化学切割连接子。可整合入磷酸主干的可化学切割基团为人熟知,包括二烷氧基硅烷(dialkoxysilane)、3’(S)-硫代磷酸酯、5’(S)-硫代磷酸酯、3’(N)-氨基磷酸酯或5’(N)-氨基磷酸酯。在另外的具体实施方式中,所述可化学切割键可能是修饰的糖例如修饰的核糖基团。
关于由不含碱基的亚单位种类构成的复合体和切割亚单位,本发明的方法可以相应调整。例如,在生成由氨基酸组成的切割底物(即:通过翻译从一种或多种恰当设计的转录单位而合成的相应mRNA)的具体实施方式中,复合体可通过恰当的化学或酶促切割而释放,其过程类似于从蛋白裂解去除基于肽的亲和性标签。所采用的特定切割系统将依赖于预期的特定切割。例如,在某些具体实施方式中,切割试剂可用来特异性切割切割底物的复合体部分中不包含的氨基酸种类,所述切割底物存在于所述反应中。可替代的,利用特异性肽链外切酶和肽链内切酶的切割位点可以设计入所述切割底物。典型地,利用特定肽链内切酶的切割位点包括短而唯一的氨基酸序列。任何位点或序列特异性蛋白酶可以用于该目的,且本发明的试剂易于调整,通过整合用于所述同源蛋白酶的恰当识别位点,使得这种蛋白酶能够用于实施本发明的方法。例如,已有研究报道利用重组表达和纯化的牛血清蛋白酶肠激酶的催化亚单位(见,例如Stratagene Cloning Systems,Inc.的网站),其中EK处理可在所述酶的5残基切割位点的C末端残基的紧邻位置切割融合蛋白,以产生具有天然序列的蛋白。因此,所述EK识别位点可以改造入切割亚单位使得所述位点的C末端氨基酸残基紧邻于所述复合体的第一个氨基酸残基之前。因为所述切割识别位点(以及任何其它可能位于所述位点的N-末端氨基酸之前的氨基酸)的质量已知,在得到的质谱中对应于所述位点的信号易于检测。在反应中,合成多个复合体种类且每一种均具有这种切割位点,结果质谱图中所述分裂的非复合体片段仅具有单峰。
本发明还包括一些具体实施方式,其中靶检测试剂还包含一个标签(例如生物素或地高辛),其能够被固定于固态载体上,例如反应容器的表面或溶液中珠子或颗粒的表面。通常,所述标签能够连接于所述固态载体连接的化合物或被其键连。所述标签可能直接连接于所述靶检测试剂,例如通过所述标签和所述固态载体之间的化学连接基团,或者通过位于所述标签和所述固态载体之间的连接分子连接。根据所使用的标签分子,标签分子可以共价或非共价键合于所述固态载体。
本发明还预见了包含一种以上靶检测试剂的组合物,其靶向于特定遗传位点或多肽的特定区域。以这种方式,例如,特定基因内特定核苷酸位置的两种或多种遗传改变可以在单个反应中检测,因为每种变异体将具有与其相关的不同复合体。类似的,如果所述遗传变异得到具有变异结构的多肽,则这种变异可能利用例如不同的抗体(或抗体片断)种类而检测,其中所述抗体(或抗体片断)的每一种仅仅对于一种所述变异体具有专一性。为了辅助构建这种靶检测试剂,预期可以以片断形式合成所述靶结合基团,特别是在所述靶分子是核酸的具体实施方式中。当以片断合成时,一个片断可能是非变异的,因为所述靶结合基团的该部分对全部可能的变异体均一致。所述其它片断,可能小至含有单个碱基亚单位,用于区分变异体。
类似的,不同靶检测试剂可能靶向于特定基因内的不同区域。例如,如果已知在不同位点具有几种不同SNP,预期可产生特异于每个SNP位点的一种或多种靶检测试剂。
尽管次优选,本发明还预见了一些混合物,其中单个复合体模板种类与两个或多个不同的靶结合基团相关。因此,检测到所述复合体表示所述样品中存在所述几种靶之一。如果需要,实际上,存在哪种靶分子可以在随后的分析中确定。可替代的,如果检测多个不同的复合体种类,其中每一种与一种或多种不同靶分子相关,则其中至少部分分子的存在于否与可在分析中检测到的其它靶分子的存在于否相关,本领域中已知的多种统计方法可用来确定哪种靶分子确实存在于所分析的样品中。
对于特定具体实施方式,靶检测试剂及其组分(例如靶结合基团和复合体模板)的合成利用固态合成方法实现,可利用组合方法产生大量复合物。在这种具体实施方式中,靶结合基团和复合体模板可通过在一定的条件下重复加成活化亚单位(例如:活化的核苷单体种类或活化的氨基酸种类)的步骤而合成,所述条件允许正在形成的核酸或多肽聚合次数足够多地合成所需的分子种类。所述靶结合基团和复合体模板的合成完成后,可将其连接到一起。这种连接可能是直接的,因为所述线性复合体模板的一个末端利用恰当的化学性质直接连接到预期的靶结合基团上。可替代的,所述连接可能是间接的,因此连接分子用来共价将复合体模板同时或依次连接到所述预期的靶结合基团上。连接子与复合体模板的连接可能与所述连接子与所述靶结合基团的连接相同或不同。任何所需连接子均可采用。优选的连接分子包括包括1到约100或更多个碳原子的脂肪链。尽管靶结合基团和复合体模板优选共价相连,所述连接还可以为非共价的,其中所述连接优选通过高亲和结合配对成员而形成。在某些具体实施方式中,靶检测试剂包括靶结合基团和复合体模板,其由利用相容性的化学性质发生聚合的亚单位(例如:利用相同的主干化学性质聚合的碱基)进行装配而成,常常优选在一系列反应中合成完整靶检测试剂。
C.靶检测方法
本发明还提供用于检测特定靶分子的方法。这种方法包括以下步骤:(a)获得包括靶检测基团和复合体模板的靶特异性靶检测试剂;(b)用所述靶检测试剂接触已知或怀疑含有所述靶分子的样品,形成试剂:靶复合物;(c)从所述复合体模板生成复合体(或切割底物,根据具体情况而定);以及(d)利用适用于检测所述分析中生成的复合体种类的检测技术,并因此间接检测所述与特定复合体种类相关的靶分子。这种方法的实施可以用于单个靶分子种类、小组不同靶分子种类以及大量不同靶分子种类(以多重方式),例如检测几种复合体中的一种或多种,每一种均与相同靶分子相关;检测一种或多种复合体,每一种均与两种或多种靶分子种类相关;利用复合体种类文库而间接检测多种不同靶分子物种,每一种均仅与一种靶分子相关。如人们所理解的,不同复合体可以用来在单个分析中同时检测数十、数百甚至数千种不同的靶分子种类(例如靶核酸)。
复合体种类文库可设计用于多种不同分析,或用来间接指示存在不同靶分子。例如,在某些具体实施方式中,本发明的复合体用于分析病人样品以检测存在一种或多种种内遗传变异。在其它具体实施方式中,所述由相同复合体模板编码的相同复合体文库连接于不同靶结合基团,例如特异性结合于来自其它种类的核酸或多肽的靶结合基团,所述其它种类如已知感染特定宿主种类的病原体。可替代的,所述复合体模板可以连接于靶结合基团,其靶向于除了核酸以外的生物分子例如糖类、脂类、蛋白或多肽。
复合体文库可设计成具有任何合适的大小,且将包括至少两种不同复合体种类(当然,其将作为编码所述复合体或切割底物的复合体模板)。文库大小的上限将受到一些因素的限制例如所采用监测系统的分辨率、同位素确定的亚单位的可用性(在某些情况下,质量差别用来区分复合体种类)以及构成所述文库的种类之间的增量差异。很显然,对于大规模多重化,优选所述靶检测试剂适用于生成多种不同复合体种类。
因此,本发明涉及到用于在单个反应中检测靶分子(常常是多种不同靶分子种类)的方法。通常,这种多重化方法涉及获得多种根据本发明的靶检测试剂。在多数具体实施方式中,每种靶检测试剂种类包括靶结合基团和复合体模板,后者所编码的模板适用于直接或间接生成与特定靶分子相关的复合体,所述靶分子对应于所述靶结合基团的靶向。直接生成复合体或切割底物是通过利用所述复合体模板的复合体编码(或切割底物编码)部分作为引导而化学或酶促生成编码的复合体(或切割底物)。在某些优选的具体实施方式中,复合体或切割底物的生成来自于复合体模板中携带的转录单位的转录,利用恰当的RNA聚合酶以生成复合体(或含有复合体的切割底物)。在其它具体实施方式中,短引物杂交于所述复合体模板中碱基的互补区,然后其在例如引物延伸反应中进行延伸,其中所述延伸由恰当的聚合酶催化。另一方面,间接生成复合体是指将一个或多个中间步骤包括在例如所述转录步骤与所述复合体(或切割底物)的生成之间。作为例子,在某些具体实施方式中,复合体在复合体模板的转录单位内编码,所述从所述转录亚单位生成的mRNA转录本可被翻译成特定多肽,其可以需要或无需进一步处理(例如其中初始多肽是切割底物的情况下需要切割,必须进一步处理以释放其中包含的复合体)。
如本领域中技术人员所理解的,当所述靶分子是核酸分子时,为了在生成复合体前增加样品中所述靶分子的表示,可能需要扩增所述核酸的部分。任何恰当的扩增步骤均可采用,其所利用的引物允许特异性扩增待探索的所述靶分子。尽管在某些具体实施方式中,特异于待检测的特定靶分子的靶检测试剂于扩增后包括在所述反应中,然而也可以于扩增前包括于反应中。在其它具体实施方式中,靶区域的扩增由所述靶检测试剂本身的组分介导,典型地通过将一种或多种引物结合位点包括在所述靶检测试剂中。优选引物结合位点位于所述特定检测试剂的复合体模板部分的侧翼或位于其之外。优选引物结合位点设计为对应于所述特定靶检测试剂的复合体模板的5’或3’位。在特别优选的具体实施方式中,至少两个不同的引物结合位点(实际上一个互补于一个引物,而另一个为另一个引物的互补物,所述另一个引物可杂交于从所述第一个引物延伸的链)包括在靶检测试剂内。
例如,如在图8中所阐述的,在某些优选的具体实施方式中,为了随后生成复合体,靶检测试剂包括必须连接在一起的两个或多个部分。如在图8中示出的,两种不同的靶检测试剂可从三种不同的寡核苷酸生成。所述寡核苷酸(每种均为“第一”寡核苷酸)中的两种是等位基因特异的,且允许在一个核苷酸位置的单核苷酸差异(A或G)可由于每种“第一”寡核苷酸的3’末端碱基的差异而区分开(一个中为“T”而另一个中为“C”)。所述其它寡核苷酸(“第二”寡核苷酸)不是等位基因特异的,且设计成含有一个靶结合基团部分,其基本互补并优选完全互补于所述靶序列的一部分。所述第一和第二寡核苷酸一旦杂交,所述两个第一寡核苷酸中的一个(即:其具有的3’-末端与所述特定靶分子中存在的核苷酸互补的那个寡核苷酸)与所述第二寡核苷酸的邻近,使得所述第一和第二寡核苷酸被连接(优选通过连接反应)以形成完整的靶检测试剂。考虑到该方面,如在图8的具体实施方式中示出的,所述第一和第二寡核苷酸的侧翼为通用引物结合位点,随后所述特定靶检测试剂种类(以及其它可能存在于所述反应中且包括相同引物结合位点的种类)可被扩增以产生用于生成切割底物(或复合体)的底物,所述生成利用RNA聚合酶介导的转录从启动子开始。
如人们所理解的,在包括两个引物结合位点(意指:一个引物结合位点对应于第一引物,而另一个引物结合位点的互补物对应于第二引物)的靶检测试剂的具体实施方式中,一个(优选两个)位点经设计形成通用引物,特别是当计划用于多重分析中时。在某些具体实施方式中,所述试剂与其所靶向的生物分子相互作用之后,一对引物用来扩增靶检测试剂的部分或全部,或许需要采用引物结合位点,其中一个位点结合于通用引物而另一个位点特异于所述特定靶检测试剂种类。尽管次优选,也可理解本发明包括一些具体实施方式,其中所述引物结合位点不被通用引物靶向,相反被特异于所述特定靶检测试剂种类的引物而靶向。另外,靶检测试剂可被设计为包括两个以上引物结合位点,因此利于利用不同引物扩增所述试剂的不同部分。
因此,在优选的具体实施方式中,扩增(如果实施了扩增)后,复合体(或包括复合体的较大前体)可以从所述复合体模板生成,而所述复合体模板包括于在所述反应中所包括的一种或多种靶检测试剂种类中。本发明提供了生成复合体的方法,其包括在适于聚合的条件下组合相同或不同亚单位种类的亚单位例如含有碱基的亚单位(例如核苷酸)、氨基酸、糖基等。典型地,核苷酸由聚合酶聚合,而寡核苷酸由连接酶聚合。特别优选的方法是复合体或切割底物利用酶从相应的复合体模板的转录单位生成的那些方法。尤其优选用于聚合核糖核苷酸的酶是RNA聚合酶,特别是T7、T3和SP6RNA聚合酶,然而只要所述复合体模板编码恰当的启动子,也可采用其它RNA聚合酶。当复合体或切割底物由氨基酸残基构成时,优选的合成方法也是酶促方法。优选体外翻译的方法,其中转录的mRNA或以他方式从相应的转录单位生成的mRNA,被翻译成多肽。引物延伸方法也可被采用以生成复合体以及切割底物。可以设想还可采用其它聚合亚单位的方法,如果采用这种方法,单体亚单位或多个单体亚单位,可被组装成前体用于随后组装成更大单位,直至包括复合体、切割底物、转录单位、复合体模板、寡核苷酸等。因此在其它具体实施方式中,复合体的聚合由化学合成介导。在基于核酸或氨基酸的复合体中,优选的合成方法基本上是那些分别用于标准合成的核酸和肽合成的方法。在另外的具体实施方式中,碱基亚单位例如包括在复合体中的核苷酸,可能进行链终止性修饰。例如,加成的核苷酸可能为链终止性的双脱氧核苷酸,从而阻止其它核苷酸的加成。在其它具体实施方式中,加成到复合体上的亚单位可能含有核酸酶阻滞基团以防止所述复合体或切割底物被核酸酶(例如核糖核酸酶)消化。
如上所述,每个复合体种类具有确定的特征使其可与特定分析中可能生成的其它复合体种类区分开。例如,将质量作为所述确定的特征,每个复合体种类将被改造使得当其在分析中生成时将具有唯一的质量或质量范围,通过特定分析中采用的质量检测系统可将其与其它可能的复合体种类分辨开。因此,检测与特定靶分子相关的复合体间接表明所述由靶结合基团靶向的靶分子存在于所分析的样品中。
在本发明的方法中,在适于形成试剂:靶复合物的条件下,用一种或多种靶检测试剂种类接触已知或怀疑含有所述靶分子的样品。如果需要,且所述靶检测试剂已经经过设计而被扩增或以其它方式被扩增,则形成试剂:靶复合物的靶检测试剂可利用与所述特定靶检测试剂的设计相兼容的过程而扩增。然后可能生成复合体或切割底物,随后所述反应产物的一部分可利用检测技术进行检测,所述技术根据设计用于该目的的确定特征而能区分复合体种类。特别优选的确定特征是质量,而优选用于根据质量而区分复合体种类(如果存在)的方法是质谱分析,特别是MALDI-TOF质谱分析。检测到复合体种类表明与所述复合体相关的靶分子存在于所述样品中。
如本文中其它部分所描述的,可同时检测特定样品中的一种以上靶分子包括靶核酸分子种类。确实,不同种类的靶分子例如核酸、多肽、脂类、糖类等可通过应用本发明的方法在同一个分析中间接检测。这种“多重化”可通过利用不同的复合体种类而实现,其中每个复合体种类与特定靶分子唯一相关,因此检测所述与其相关的复合体种类间接表示所述靶分子存在于正分析的样品中。利用每个复合体种类在确定特征方面的差异,不同的复合体种类可在单个分析中区分开。将质量差异作为例子,根据分子质量差异的灵敏质量分析可用来区分不同的复合体种类。如人们所理解的,复合体之间的质量差异应该优选足够大,以使在单个分析中能够进行检测。不同复合体种类之间的质量差异足以利用所采用的特定质量分析平台(即硬件和软件)而分辨。在复合体的情况下,质量差异可通过所述复合体种类的序列(组成和长度)而实现,也可通过将质量修饰基团引入一个或多个用于合成所述复合体的构建模块(例如在基于RNA的复合体中的核糖核苷酸)中而实现。质量修饰基团的实例包括例如卤素(如:F、Cl、Br和/或I)、叠氮或所述类型的XR,其中X是连接基团而R是质量修饰官能团。其它有益于特定种类复合体设计的是同位素确定的核苷酸,因为存在于特定核苷酸种类中的一种或多种所述重原子种类(即:N、C、O等)将对特定同位素而加以富集。
不限定本发明的范围,在质量作为所述确定特征的具体实施方式中,可在复合体或切割底物生成过程中引入不同增加度的质量修饰,优选通过将质量修饰的构建模块(例如核糖核苷酸)整合入初始复合体或切割底物中,特别是当两个或多个复合体种类将同时生成时,要使其各自的质量不同而可分辨。质量增加可能是相同的,如当单个质量修饰基团种类用来修饰一种或多种不同构建模块的质量时,而所述模块用来在特定分析中合成所述复合体。可替代的,质量增加可能是不同的,如当采用不同的质量修饰基团时。任何恰当的化学方法均可用来将质量修饰基团连接到复合体构建模块上。例如,如果低聚/聚乙二醇衍生物具有的质量增加为44,可通过仅变化利用这些基团中的0到4个而生成5个不同质量修饰的种类。低聚/聚乙二醇也可利用低级烷基例如甲基、乙基、丙基、异丙基、t-丁基等单烷基化。连接官能团也可用来将质量修饰基团连接到一种或多种所述复合体构建模块上。当然,也可以选用除了低聚/聚乙二醇之外的质量修饰基团,并通过恰当的连接化学方法进行连接。
因为一种或多种特定靶分子可能仅仅痕量存在于特定样品中,因此常常优选在复合体合成前扩增所述靶分子或更优选所述靶检测试剂(或其一部分,即所述复合体模板)。假如所述相应的靶分子存在于所述样品中,这种扩增则确保合成足够数量的复合体分子用于随后检测。
在某些具体实施方式中,所述靶分子种类是核酸并预期在暴露于所述靶检测试剂之前扩增所述靶,可采用任何恰当的核酸扩增技术。一种优选的方法是聚合酶链反应(“PCR”)及其变通方法,而另一个优选的方法是基于转录的恒温扩增方法。无论采用的扩增方法是哪种,典型地,扩增每种靶(除非两种或多种靶包括同一基因相同区域的遗传变异体)需要利用至少两种不同的扩增引物。因此,高度多重化的反应需要利用大量不同的扩增引物对,在多种情况下这会造成一种或多种所述靶扩增效率的差异。因为这个原因,优选在所述样品已经用特定分析中采用的不同靶检测试剂接触之后,实施扩增反应。然后利用所述试剂:靶复合物而实施扩增,所述复合物可能(但不必)与扩增前的初始反应的其它组分分离。由于这个原因,所述靶检测试剂中设计被扩增的部分(即至少所述复合体模板)可以利用少至一对扩增引物来扩增。在这种情况下,所述引物称为“通用引物”,因其可以用来在特定的多重扩增中扩增所有希望扩增的核酸。而且,对于为了实现高水平的高效扩增而设计用于特定分析的通用引物对而言,所述扩增反应可以进行优化。如本领域中技术人员所已知的,待扩增的核酸区域的侧翼为所述扩增引物结合位点(或其互补物)。
如上所述,对于多重反应,最希望仅利用单对“通用”引物以在所述扩增过程中引导延伸反应。因此,一对引物可用来扩增由所述引物结合位点包括的不同核酸序列中的每一种。当然,也可能采用超过一对引物,甚至对每个待扩增核酸种类采用一对或多对引物。在其它具体实施方式中,单个引物种类可用来引导特定扩增子的正向链或反向链的合成,其中结合位点(或其互补物)位于每种不同的待扩增核酸种类末端的侧翼。所述引物对的另一个引物对所扩增的特定核酸具有特异性。类似的,在这种具体实施方式中每对引物将包括通用引物和特异于特定核酸的引物。如果需要,扩增引物还含有能够被固定于固态载体的官能团,例如生物素或地高辛。然后如果需要,得到的扩增子则可与其它反应组分分离。
如在本文中其它部分所描述的,本发明的方法优选用于多重模式。在这种模式的优选实例中,每种待检测的靶分子与不同的复合体种类相关,即在特定反应中每种复合体唯一识别一种特定靶分子。类似的,作为互相比较目的,每个靶检测试剂种类包括不同的靶结合基团以及不同的复合体模板。因此,随后检测特定复合体就间接表示样品中存在与所述复合体相关的靶分子。
当然,除了这种单个靶/1单个复合体的具体实施方式,还设想了其它具体实施方式。例如,本发明还设想了一些具体实施方式,其中包含一个或多个靶分子种类的样品用多种靶检测试剂接触,两种或多种所述靶检测试剂包括的复合体模板编码所述靶分子种类的同一复合体种类。因此,随后检测特定复合体种类表示几种与所述复合体相关的靶中的一种或多种存在于正检测的样品中。这些结果可通过进一步的试验或统计分析而推算,以确定哪种靶分子存在于所述样品中。在其它具体实施方式中,所述方法涉及利用针对特定靶的多种不同靶检测试剂检测一个样品,所述靶检测试剂的区别不在于其靶结合基团,而在于其复合体模板。因此,所述靶检测试剂靶向于相同靶分子,随后检测到任何、一些或所有与所述特定靶相关的复合体表明所述靶存在于样品中。
D.复合体检测
复合体可利用任何适于检测特定分析中生成的一个或多个复合体种类的检测过程进行检测,然而特定分析中可能的多重化水平可能变动。用于该目的的检测系统的代表性实例包括质谱分析、电泳、色谱、核酸杂交以及NMR。当所述有益于区分复合体种类的确定特征涉及质量时,特别优选的检测是质谱分析;然而,如本领域中的技术人员所能理解的,本领域中已知的其它检测系统也易于根据本说明书而调整用于实施本发明。考虑到这点,下面的描述集中于质量,然而可理解本发明的范围不限于基于质量的检测系统和技术。优选用于本发明的的质谱仪模式是电喷雾(ES)、基质辅助激光解吸电离(MALDI)、离子回旋共振(ICR)以及傅立叶转换(Fourier Transform)。对于ES,溶解于水或挥发性缓冲液的样品连续或间断注射入常压电离接口(interface),然后进行四极质量分析。生成多个利用ES质谱分析获得的离子峰,可增加所述质量测定的准确性。关于所述特定结构的更详细信息可利用MS/MS四极结构(configuration)获得。在MALDI质谱分析中,可采用多种质量分析器,例如单或三倍四极模式中的扇形磁场/磁偏转检测仪器(MS/MS)、傅立叶转换以及飞行时间(TOF)结构。对于所述解吸/电离过程,可以采用任何恰当的基质/激光组合。也可采用离子捕获和反射结构。现在最优选MADLI-TOF质谱分析。质谱分析以及他检测复合体的方法,在例如第5,118,937;5,202,561;5,464,985;5,547,835;5,605,798;5,622,824;5,691,141;5,777,324;5,864,137;5,869,242;5,919,646;5,922,542;5,928,906;6,024,925;6,043,031;6,051,378;6,090,558;6,104,028;6,111,251;6,194,144;6,197,498;6,207,370;6,221,601;6,221,605;6,225,450;6,235,478 6,238,871;6,258,538;6,268,131;6,268,144;6,277,573;6,300,076;6,322,970;6,379,917;6,387,628;6,423,966;6,428,955;6,436,635;6,440,705;6,458,945;6,468,748;6,475,736;6,500,621;6,500,650;6,558,902;6,566,055;6,566,059;6,582,923;6,589,485;6,602,662;6,610,492;6,635,452;6,660,229;6,706,530;以及6,723,564号美国专利以及序列号为09/839,629(公开号20020155587)以及10/128,680(公开号20030033091)的美国公开专利申请中加以描述。
质量分析之前(例如通过质谱分析),“调整”核酸分子以降低挥发所需的激光能量和/或将断裂降到最低,比较有用。优选在靶检测位点被固定时进行调整。调整的实例是修饰所述核酸分子的磷酸二酯主干(例如阳离子交换),这有益于消除由于每个核苷酸单位结合的阳离子异质性造成的峰展宽。用烷化剂例如碘代烷、碘代乙酰胺、β-碘乙醇或者2,3-环氧-1-丙醇等接触核酸分子,可以将核酸分子的单硫代磷酸二酯键转化为磷酸三酯键。可替代的,利用氯化三烷基硅烷可将磷酸二酯键转化为不带电荷的衍生物。进一步的调整涉及到引入核苷酸降低脱嘌呤作用的灵敏度,例如N7-或N9-氮杂嘌呤(deazapurine)核苷酸或RNA构建模块,或者利用寡核苷酸三酯或者引入烷化的硫代磷酸酯官能团或者采用寡核苷酸类似物例如肽核酸(PNA)。
E.应用
靶检测试剂及其编码的复合体具有多种用途。例如,靶结合基团可以靶向于特定的已知生物分子包括蛋白和核酸。尤其优选的靶分子是那些已知与特定病症相关(如果不是其病因的话)的分子,例如疾病或功能障碍。特异于靶分子的靶检测试剂结合于所述靶分子之后,复合体可以从所述复合体模板生成,随后可利用相容性检测系统进行检测,从而间接表明所述特定靶分子的存在。
在某些具体实施方式中,可采用本文中描述的方法,例如去检测任何已知的遗传变异包括多于4000种现在已知的可遗传的遗传性疾病(例如:血友病、地中海贫血、Duchenne型肌营养不良(DMD)、亨廷顿症(HD)、阿尔茨海默病(Alzheimer’s Disease)以及囊性纤维化(CF))。已知某些遗传变异例如某些SNPs与特定疾病相关。除了检测SNP和点突变,其部分与例如对特定疾病的易感性、对特定药物无反应或幅反应等,还可以利用本发明的方法检测其它遗传变异,包括21三倍体、13三倍体、18倍三体、X单倍体以及其它性染色体异倍体例如克莱里菲尔特综合征(Klinefelter’s Syndrome)。其它可根据本发明检测的遗传变异包括缺失、重复、插入以及重排。另外,可对染色体和超数染色体元件的基因和非编码区进行修饰(例如化学修饰如甲基化)。也可利用本发明的方法研究RNA加工和基因转录的差异。
病毒、细菌、真菌以及其它病原体含有的核酸序列可以与宿主生物体的核酸序列区分开。检测或定量核酸序列或其它特异于传染性生物体的生物分子(例如蛋白、酶、细胞壁组分等)对于诊断或检测感染的治疗非常重要。感染人和动物引起疾病的病毒实例包括逆转录病毒(例如人免疫缺陷病毒如HIV-1和HIV-2,以及猫白血病病毒);小RNA病毒(例如脊髓灰质炎病毒、A型肝炎病毒、肠病毒、人柯萨奇病毒、鼻病毒和埃可病毒);杯状病毒(例如引起胃肠炎的病毒株);囊膜病毒(例如马脑炎病毒、风疹病毒);黄病毒(例如登革病毒、脑炎病毒、黄热病毒);冠状病毒;杆状病毒(例如水泡性口炎病毒、狂犬病毒);丝状病毒(例如埃博拉病毒);副粘病毒(例如副流感病毒、腮腺炎病毒、麻疹病毒、呼吸道合胞病毒);正粘病毒(例如流感病毒);野菰病毒(例如汉坦病毒、野菰病毒、白蛉热病毒以及内罗病毒);嵌砂样病毒(例如出血热病毒);孤病毒(例如孤病毒、环状病毒以及轮状病毒);双股核糖核酸病毒;肝病毒(例如:B型肝炎病毒)、细小病毒;乳头状瘤多型空泡形病毒(例如乳头瘤病毒、多瘤病毒);腺病毒;疱疹病毒(例如单纯疱疹病毒(HSV)1和2、水痘-带状疱疹病毒、巨细胞病毒(CMV)、疱疹病毒);痘病毒(例如天花病毒、痘苗病毒、痘病毒);虹彩病毒(例如非洲猪瘟病毒);δ-肝炎因子(the agent ofdelta hepatitis);C型肝炎病毒;诺瓦克以及相关病毒;以及星状病毒。
传染性细菌的实例包括:幽门螺旋杆菌、伯格多费螺旋体、嗜肺军团菌、各种分歧杆菌(例如:结核杆菌、禽分歧杆菌、胞内分歧杆菌、M.Kansaii、戈氏分歧杆菌)、金黄色葡萄球菌、淋病奈瑟菌、脑膜炎奈瑟菌、单核细胞增生李斯特氏菌、化脓性链球菌(A组链球菌)、无乳链球菌(B组链球菌)、链球菌(绿色组)、肠球菌、牛链球菌、链球菌(厌氧种属)、肺炎链球菌、致病性弯曲菌属、肠球菌属、流感嗜血菌、炭疽芽孢杆菌、白喉杆菌、丹毒丝菌、产气荚膜梭状芽孢杆菌、破伤风梭状芽孢杆菌、产气肠杆菌、肺炎克雷伯菌、多杀性巴氏杆菌、拟杆菌属、具核梭杆菌、念珠状链杆菌、梅毒螺旋体、雅司螺旋体、螺旋体菌属以及以色列放线菌。
传染性真菌的实例包括:新生隐球菌、组织胞浆菌、厌酷球孢子菌、皮炎芽生菌、沙眼衣原体、白色念珠菌。其他传染性生物体(例如原生生物)包括恶性疟原虫和刚地弓形虫。
本发明的靶检测试剂包括对待检测靶生物分子的靶结合基团。如人们所理解的,所述靶结合基团将依赖于待检测的靶分子。例如当所述靶分子是核酸分子时,优选所述靶分子的靶结合基团还可以为聚核苷酸(例如合成的寡核苷酸或其它由能够碱基特异性杂交于核苷酸碱基的亚单位构成的分子,所述核苷酸构成所述靶核酸的被靶向区域)。可替代的,在具体实施方式中,其中所述靶分子是蛋白,可从之获得恰当靶结合基团的优选分子种类是抗体(或其抗原结合部分)。
如上所述,某些优选的本发明具体实施方式涉及到检测特定靶核酸分子。检测特定核酸有多种原因,包括检测临床样品内的传染性因子、检测从基因组DNA或RNA或信使RNA起源的扩增产物、检测克隆内的基因(cDNA)插入、检测对核酸分子的甲基化或其它修饰、检测分化mRNA剪接和/或编辑等。如人们所理解的,靶核酸检测可利用本文中描述的用于制备所述靶检测试剂以及释放和检测所述编码的复合体的方法中的一种或任何组合。如果需要,人们还可以对所检测复合体的量进行定量,其在本发明的其它具体实施方式中可能也如此,例如利用靶检测试剂检测靶多肽,所述靶检测试剂包括复合体模板以及靶结合基团,而靶结合基团包括在反应条件下与所述靶多肽特异性反应的抗体。在核酸检测环境中,这些方法中多数涉及使用靶特异性探针(即靶检测基团)作为所述复合体(其由靶检测试剂的复合体模板编码,而所述靶检测试剂还包括所述特定靶检测基团)合成的首要条件。某些情况下,样品中可能仅存在少量靶物质,或者如果仅少量样品可用时,则可以采用扩增技术增加复合体模板的数量。
如上所述,使用可应用复合体的靶检测方法的优势在于同时分析多种靶分子种类的存在。由于荧光生色团产生的光谱有较宽的交迭,荧光多重化的上限最可能为约10种不同标记。利用MALDI-TOF质谱仪或者直接激光解吸质谱仪或电喷雾质谱仪,可能多重化数十、数百甚至数千种不同复合体。
特别优选的具体实施方式涉及检测遗传变异体例如单碱基多态性或SNPs,其通常需要很高的灵敏度。这种方法包括检测“热区”点突变以及识别已知SNP位点的碱基。可以制备杂交于这种位点的靶特异性探针。为了确保高保真性,优选的SNP特异性靶结合基团是那些包括两种可杂交于所述特定靶分子的邻近区域的寡核苷酸的基团。例如,所述探针中的一个结合于所述靶的一部分使得含有3’-末端碱基的亚单位仅与对应于所述特定SNP的核苷酸杂交。另一个寡核苷酸也杂交于所述靶,优选使得其5’-末端残基可以连接于所述第一寡核苷酸的3’-末端残基。如此杂交于靶核酸的寡核苷酸据称是平行的。以这种方式,可以提供一种或多种第一寡核苷酸以区分靶核酸分子中特定核苷酸位置的不同多态性,然而所述第二寡核苷酸,尽管对其靶序列具有专一性,但对特定的遗传变异并不具有专一性。当然除了其中应用三种或多种能够在靶核酸上相邻位置杂交的寡核苷酸外的其它具体实施方式也可以采用。其它具体实施方式涉及寡核苷酸对(或较大基团),其中包括所述基团的寡核苷酸杂交后形成跨越一个或多个核苷酸的空隙。在这种具体实时方式中,优选在扩增之后,实施空隙填充反应以填充所述空隙并连接所述寡核苷酸,形成可用于生成复合体的底物。
SNP检测的优选具体实施方式包括大量不同靶检测试剂的多重化,以同时检测多种遗传变异(例如SNP)。优选复合体的存在可唯一表示检测到一种或多种所述不同变异体,其中所述变异体可利用所述特定靶检测试剂组或特定靶检测试剂库来检测。
根据特定分析情况,本发明的方法可以在出生前或出生后实施,甚至于死后实施。
除了仅仅检测样品中是否存在一种或多种靶检测试剂分子之外,本发明的方法还具有多种应用,包括个体基因分型以及确定同一性或遗传性(例如亲子关系)。如图8所示,可以评估特定核苷酸位点的遗传变异,包括对于特定等位基因变异而言,确定特定二倍体基因组(如果其相关位置存在于样品中)是纯合的还是杂合的。
另一种应用涉及的本发明实施例是关于监测基因表达的。在这种具体实施方式中,不同的靶检测试剂用来检测代表特定细胞培养中所表达基因的复合体,其存在浓度与所述特定基因的mRNA丰度水平相关。靶核酸一般含有mRNA或第一链cDNA,以及扩增的核酸产物。类似的,所述靶核酸的存在浓度应该与其mRNA丰度水平相关。如果需要,扩增可用来选择性扩增来自细胞样品的mRNA库的一部分,以增强那些基因的检测信号并降低来自所述扩增部分之外基因的背景。如本发明的其它方法,典型地这种方法采用针对每种感兴趣基因(或其部分)的靶检测试剂,致使随后检测与所述特定靶分子相关的复合体种类间接表明所述基因在所述样品中具有表达。
无需根据本公开进行过多试验,即可制备并执行本发明中公开和主张权利的所有组合物及方法。尽管本发明的组合物及方法是按照优选具体实施方式进行描述的,对于本领域中的熟练技术人员而言,显而易见,在不偏离本发明的概念、精神和范围的前提下,可对所述组合物和方法进行变动,以及对本文中所描述方法的步骤或步骤的次序进行变动。更具体而言,显而易见,某些化学上以及生理上相关的试剂可以代替本文中描述的试剂,而得到相同或相似的结果。可以认为,所有这些替代物以及对本领域的熟练技术人员来说显而易见的调整,均在由附加的权利要求所定义的本发明的精神、范围以及概念之内。
本说明书中提到的所有专利和公开申请,表示本发明相关领域中普通技术人员的水平。本文中所有专利和公开申请均结合于此供参考,正如同每一个公开申请特别单独指明结合于此供参考。
本文中举例阐释性地恰当描述的本发明,可以在缺乏本文中未特别公开的任何元件时实施。因此,例如在本文中每一种情况下,术语“包括”、“基本上包括”、“由…组成”中任何一个均可由另外两个术语中任何一个来代替。被采用的术语和习语用作说明而非限制本发明,且不意图使用这些术语和习语而排除表示及描述所述特征或其部分的等价用语,但应该认识到所作的各种调整可能在本发明所声明的范围内。因此,应该理解,尽管本发明通过优选具体实施方式和任选的特征进行了具体公开,但可由本领域中的熟练技术人员对本文中所公开的概念作调整和变动,且把这些调整和变动当作属于由附加的权利要求所定义的本发明范围之内。