具体实施方式
术语“核酸”是指核苷酸聚合物,并且除非另有限制,包括能够以与天然存在的核苷酸相似的方式起作用(例如,杂交)的、天然核苷酸的已知类似物。
术语“多核苷酸”、“核苷酸”、“核苷酸序列”、“核酸”和“寡核苷酸”可互换使用。它们是指任意长度的核苷酸(脱氧核糖核苷酸或核糖核苷酸或其类似物)的聚合形式。多核苷酸可具有任意三维结构,并且可行使任何已知的或未知的功能。以下是多核苷酸的非限制性实例:基因或基因片段的编码区或非编码区、基因间DNA、由连锁分析限定的多个基因座(一个基因座)、外显子、内含子、信使RNA(mRNA)、转运RNA、核糖体RNA、短干扰RNA(siRNA)、短发夹RNA(shRNA)、微小RNA(miRNA)、小核仁RNA、核酶、互补DNA(cDNA),cDNA是mRNA的DNA呈现,通常通过信使RNA(mRNA)的逆转录或通过扩增而获得;合成或扩增产生的DNA分子、基因组DNA、重组多核苷酸、分支多核苷酸、质粒、载体、分离的任意序列DNA、分离的任意序列RNA、核酸探针和引物。多核苷酸可包含修饰的核苷酸,如甲基化的核苷酸和核苷酸类似物。如果存在,在聚合物组装之前或之后可对核苷酸结构进行修饰。核苷酸序列可被非核苷酸组分打断。在聚合后可对多核苷酸进行进一步的修饰,如通过与标记组分偶联。当提供时,多核苷酸序列以5’到3’的方向列出,除非另有说明。
术语核酸包括双链或三链核酸以及单链分子。在双链或三链核酸中,核酸链不必是共同延伸的(即,双链核酸不必沿两条链的全长都是双链的)。
术语核酸还包含其任何化学修饰,如通过甲基化和/或通过加帽。核酸修饰可包括将附加电荷、可极化性、氢键、静电相互作用以及官能性引入单独的核酸碱基或整个核酸的化学基团的添加。此类修饰可包括碱基修饰,如2′位的糖修饰、5位的嘧啶修饰、8位的嘌呤修饰、在胞嘧啶环外胺处的修饰、5-溴尿嘧啶的取代、骨架修饰、异常碱基配对组合如异碱基异胞苷和异胍等。
更具体地,在某些实施方案中,核酸可以包括多脱氧核糖核苷酸(含有2-脱氧-D-核糖)、多核糖核苷酸(含有D-核糖)和为嘌呤或嘧啶碱基的N-糖苷或C-糖苷的任何其他类型的核酸,以及含有正核苷酸(normucleotidic)骨架的其他聚合物,例如,聚酰胺(例如,肽核酸(PNA))和聚吗啉基(可从Anti-Virals,Inc.,Corvallis,Oreg.作为Neugene购得)聚合物,以及其他合成的序列特异性核酸聚合物,条件是该聚合物以一种构型含有核碱基,该构型允许如在DNA和RNA中发现的碱基配对和碱基堆积。术语核酸还包括美国专利6,794,499、6,670,461、6,262,490和6,770,748中所述的连接核酸(LNA),通过引用将其对LNA的公开内容整体并入本文。
核酸可来自于完全化学合成过程如固相介导的化学合成,来自于生物来源如通过从任何产生核酸的物种中分离,或来自于涉及通过分子生物学工具操纵核酸的过程如DNA复制、PCR扩增、逆转录,或来自于这些过程的组合。
核酸“探针”是通过一种或多种类型的化学键,一般是通过互补碱基配对,常常是通过氢键的形成,能够与具有互补序列的靶核酸结合,从而形成双链体结构的寡核苷酸。探针与“探针结合位点”结合或杂交。可用可检测标记物来标记探针以允许便捷的探针检测,尤其是一旦探针已与其互补靶标杂交时。然而,备选地,探针可以是未标记的,但通过直接地或间接地与标记的配体特异性结合而可以是可检测的。探针的大小可显著变化。通常,探针长度为至少7至15个核苷酸。其他探针为至少20、30或40个核苷酸长。再其他的探针稍长,为至少50、60、70、80或90个核苷酸长。又其他的探针更长,并且为至少100、150、200个或更多个核苷酸长。探针还可以具有以任何上述值为界限的任何范围内的任何长度(例如,15-20个核苷酸长度)。
引物或探针可与靶核酸序列完全互补或可小于完全互补。在某些实施方案中,在至少7个核苷酸的序列上,更典型地在10-30个核苷酸的序列上,并且常常在至少14-25个核苷酸的序列上,引物与靶核酸序列的互补序列具有至少65%的同一性,并且更通常地具有至少75%的同一性,至少85%的同一性、至少90%的同一性或至少95%、96%、97%、98%或99%的同一性。应当理解,通常期望地,某些碱基(例如,引物的3′碱基)与靶核酸序列的相应碱基完全互补。引物和探针通常在严格的杂交条件下与靶序列退火。
混合物中存在的、依赖于亲和力的可用结合相互作用限定了对于两种或更多种组分的结合特异性的特异性。通常,与对于第一相互作用中的一个或多个结合配偶体可用的其他可用相互作用的结合亲和力相比,对于第一相互作用的高结合亲和力将导致高特异性。具有高特异性的结合配偶体形成指定的结合配偶体。
现在将对本发明的特定优选实施方案进行详细的描述。优选实施方案的实例在以下实施例部分进行阐述。
除非另有说明,否则本文使用的所有技术和科学术语具有与本发明所属领域的技术人员通常理解的相同的含义。本文引用的所有专利和出版物均通过引用整体并入本文。
在一些实施方案中,本发明提供了用于检测和量化生物分子样品中的单独靶分子的方法、组合物和试剂盒。在一些实施方案中,本发明提供了用于检测和量化复杂细胞群体的每个细胞中的单独靶分子而同时保留关于该靶分子的细胞特异性信息的方法、组合物和试剂盒。因此,在一些实施方案中,本发明提供了用于检测和量化具有复杂细胞群体的样品中基于单细胞的单独靶分子的方法、组合物和试剂盒。因此,在一些实施方案中,对每个细胞测定与该细胞相关的每个靶分子的量。尤其是,本发明提供了能够结合单独靶分子的独特结合剂。本发明还提供了使用表位特异性条码来标记靶分子。本发明还提供了使用细胞起源条码来指示起源细胞。通过表位特异性条码和细胞起源条码,独特结合剂与靶分子的结合导致靶分子的鉴定。还提供了制备和使用此类独特结合剂和/或表位特异性条码和/或细胞起源条码的方法。本文所述的方法和组合物可用于多种应用中,如诊断、预后、质量控制和筛选应用。本发明的一些实施方案涉及用于单独标记细胞的方法、组合物和试剂盒。
术语“表位”和“靶分子”在本文中可互换使用,是指通过本文所述的方法检测和/或量化的感兴趣的分子(其部分或整个分子)。
本发明的某些方面涉及多个靶分子的检测。本文所述的方法在多个靶分子的检测、量化和灵敏度方面提供了潜在的益处。在一些实施方案中,本发明提供了用于研究多蛋白质测定和/或多核酸测定的灵敏且可靠的方法和组合物。
在单细胞水平上在一个样品中的多重化(multiplexing)是该方法的主要优势。在一个样品中的多重化节约大量劳力,降低与测量数成比例的样品量需求,并且通过消除由独立样品处理和测量步骤所复杂化的误差来提高精确度。此外,获得对复杂细胞群体中单细胞中的多个靶分子的测量提供了对每个单独细胞内生理学过程的更好的理解。在一些实施方案中,本文所述的方法允许在处理过程中将不同的样品合并在一起以同时进行分析。这提供了通量优势并且可以加速不同样品的分析。
在一些实施方案中,本发明提供了用于分析靶分子的独特结合剂(UBA)。在一些实施方案中,本发明提供了用于多重分析的UBA群体。该群体中的每个UBA对靶分子是特异性的。因此,UBA提供了对在细胞中识别的靶分子的特异性。而后使用表位特异性条码(ESB)和细胞起源条码(COB)来检测靶分子与UBA的结合。每个ESB包含可能与特定靶分子相关的独特代码。每个COB包含可能与特定起源细胞相关的独特代码。
在一些实施方案中,ESB与UBA直接或间接地连接。在其他实施方案中,ESB与细胞或样品中的UBA结合,例如,作为分析过程的一部分。独特的COB与特定细胞中的UBA相关联,以使得每个COB可与该细胞中与UBA结合的靶分子相关联。在一些实施方案中,特定的ESB/COB组合被称为代表每个靶分子或表位的信息量子(参见图1)。
在一些实施方案中,COB由一个或多个可测定聚合物亚单位(APS)组成。本发明的某些方面涉及设计的(例如,合成序列)APS的文库或群体的选择。在一些实施方案中,本发明提供了设计的(例如,合成的)APS的群体,其中所述APS包含独特序列和/或可检测分子,并且其中每个COB中的一个或多个不同APS的组合具有将其与所述群体中的其他COB区别开的可检测信号或序列。在一些实施方案中,本发明提供了包含独特序列(例如,合成的)的APS,该独特序列与其上已连接有可检测标记物的独特互补多核苷酸序列杂交。在一些实施方案中,通过测序来检测APS。因此,本发明的某些方面提供了独特COB或ESB/COB群体,每一个包含独特的基于APS的组合,其中该群体中每个COB或ESB/COB与群体中其他COB或ESB/COB不同。APS通常能够形成包含COB的构建体。允许这种形成的任何化学结构均可用于APS。
独特结合剂(UBA)
UBA是设计为与至少一个靶分子、至少一个靶分子替代物或两者结合的分子或组装体;并且在适当的条件下,可形成包含UBA和靶分子的分子复合物。靶分子的实例包括但不限于蛋白质、核酸、脂质、糖类、离子、小分子、有机单体和药物。仅为了方便起见,本文所述的大部分实施方案在与靶蛋白或靶mRNA结合的UBA的背景下进行解释。然而,这些实施方案还可应用于其他靶分子。术语“蛋白质”、“多肽”、“肽”和“氨基酸序列”在本文中可互换使用,是指任意长度的氨基酸的聚合物。聚合物可以是线性的或分支的,可包含修饰的氨基酸,并且可被非氨基酸或合成氨基酸中断。这些术语还包含已修饰(例如,通过二硫键形成、糖基化、脂化、乙酰化、磷酸化或任何其他操作,如与标记组分偶联)的氨基酸聚合物。如本文所用的术语“氨基酸”是指天然的和/或非天然的抑或合成的氨基酸,包括但不限于甘氨酸和D或L旋光异构体以及氨基酸类似物和拟肽(peptidomimetics)。
UBA包含至少一个反应部分,该反应部分使其能够与至少一个靶分子、至少一个靶分子的至少一部分、至少一个靶分子替代物、靶分子替代物的至少一部分或其组合结合或相互作用;通常以序列特异性的、构象特异性的方式或这两种方式;例如但不限于抗原-抗体结合、适体-靶标结合等。
在某些实施方案中,UBA包含身份部分或身份部分的至少一部分,例如,ESB、COB、ESB和/或连接体寡聚体(oligo)。在某些实施方案中,UBA包含捕获区。在一些实施方案中,该捕获区用于UBA的分离和/或UBA向表面内的固定。该捕获区可以是亲和标签、珠、载玻片、阵列、微滴、微流体装置中的包围体或本领域中任何其他合适的捕获区。在一些实施方案中,该捕获区是ESB,例如,ESB可以是可检测的珠,如具有独特光谱特征的珠(例如,已用红色或红外荧光团进行了内部染色的珠)。捕获区可限定反应体积,在该反应体积中可进行本发明的组合物的操作。
在一些实施方案中,UBA是抗体。如本文所用的术语抗体在广义上使用,不仅包括完整的抗体分子,例如但不限于免疫球蛋白A、免疫球蛋白G和免疫球蛋白M,而且包括免疫特异性地与至少一个表位结合的抗体分子的任何免疫反应性组分。这类免疫反应性组分包括但不限于FAb片段、FAb'片段、FAb'2片段、单链抗体片段(scFv)、迷你抗体(miniantibodies)、双抗体、交联抗体片段、AffibodyTM、环肽(cyclotides)、分子等。使用抗体工程或蛋白质工程技术得到的免疫反应性产物也明显处于术语抗体的含义内。关于抗体和/或蛋白质工程的详细描述,包括相关方案,尤其可见于J.Maynard和G.Georgiou,Ann.Rev.Biomed.Eng.2:33976(2000);AntibodyEngineering,R.Kontermann和S.Dubel,编,SpringerLabManual,SpringerVerlag(2001);美国专利5,831,012;和S.Paul,AntibodyEngineeringProtocols,HumanaPress(1995)。
技术人员将会理解抗体可从多种来源获得,包括但不限于多克隆抗体、单克隆抗体、单特异性抗体、重组表达的抗体、人源化抗体、植物抗体等;并且可从各种动物物种获得,包括兔、小鼠、山羊、大鼠、人、马、牛、豚鼠、鸡、绵羊、驴、人等。许多抗体是可购买到的,并且可从许多合约实验室获得定制的抗体。关于抗体的详细描述,包括相关方案,尤其可见于CurrentProtocolsinImmunology,Coligan等人,编,JohnWiley&Sons(1999,包括截至2003年8月的更新内容);TheElectronicNotebook;BasicMethodsinAntibodyProductionandCharacterization,G.Howard和D.Bethel,编,CRCPress(2000);J.Goding,MonoclonalAntibodies:PrinciplesandPractice,第3版,AcademicPress(1996);E.Harlow和D.Lane,UsingAntibodies,ColdSpringHarborLabPress(1999);P.Shepherd和C.Dean,MonoclonalAntibodies:APracticalApproach,OxfordUniversityPress(2000);A.Johnstone和M.Turner,Immunochemistry1and2,OxfordUniversityPress(1997);C.Borrebaeck,AntibodyEngineering,第2版,OxforduniversityPress(1995);A.Johnstone和R.Thorpe,ImmunochemistryinPractice,BlackwellScience,Ltd.(1996);H.Zola,MonoclonalAntibodies:PreparationandUseofMonoclonalAntibodiesandEngineeredAntibodyDerivatives(Basics:FromBackgroundtoBench),SpringerVerlag(2000);以及S.Hockfield等人,SelectedMethodsforAntibodyandNucleicAcidProbes,ColdSpringHarborLabPress(1993)。此外,大量可商购的抗体(包括标记的或未标记的);多克隆、单克隆和单特异性抗体,及其免疫反应性组分;定制抗体供应者等,都可在万维网上找到,尤其是biocompare.com的抗体搜索页、antibodyresource.com的抗体资源页和sigmaaldrich.com的抗体浏览页。
在一些实施方案中,本文所述的抗体连接至核酸,例如连接体寡聚体或核酸ESB。将核酸与抗体连接的方法是本领域已知的。本发明的方法中包括将核酸与抗体连接的任何合适的方法。可通过在Gullberg等人,PNAS101(22):228420–8424页(2004)和Boozer等人,AnalyticalChemistry,76(23):6967-6972页(2004)(均通过引用并入本文)中所述的方法将本文所述的抗体与核酸连接。可通过随机胺连接而将本文所述的抗体与核酸连接。在一些实施方案中,可使用10:1的核酸:抗体比,通过随机胺连接将本文所述的抗体与核酸连接。可通过在Kozlov等人,Biopolymers5:73(5):621–630页(2004)(通过引用并入本文)中所述的方法将本文所述的抗体与核酸连接。可通过肼化学将本文所述的抗体与核酸连接。可如Nolan,NatureMethods2,11-12(2005)(通过引用并入本文)中所述,使用蝌蚪(tadpoles)将本文所述的抗体与核酸连接。可通过本领域已知的任何合适的方法将本文所述的抗体与核酸连接,以产生包括本文所述的抗体的工程抗体。
在一些实施方案中,UBA是适体。适体包括核酸适体(即,单链DNA分子或单链RNA分子)和肽适体。适体以高度特异性的、构象依赖性的方式结合靶分子,通常具有极高的亲和力,但是如果需要,也可选择具有较低结合亲和力的适体。已经表明,适体可基于非常小的结构差异如甲基或羟基的存在与否来区分靶标,并且某些适体可区分D对映体和L对映体。已获得了结合小分子靶标的适体,该小分子靶标包括药物、金属离子和有机染料、肽、生物素和蛋白质,包括但不限于链霉亲和素、VEGF和病毒蛋白质。已经表明,在生物素化、荧光素标记之后以及当附接至玻璃表面和微球时,适体保留功能活性。
包括镜像异构体(speigelmers)在内的核酸适体通过被称为指数富集配体系统进化法(SELEX)的体外选择过程进行鉴定。在SELEX过程中,通过体外选择和扩增的反复过程定期筛选寡核苷酸的非常大的组合文库,例如1014-1015个单独序列,常常长达60-100个核苷酸。大多数靶标在8-15个循环内被亲和富集,并且该过程已经自动化,从而允许更快的适体分离。肽适体通常通过几种不同的、本领域已知的蛋白质工程技术进行鉴定,这些蛋白质工程技术包括但不限于噬菌体展示、核糖体展示、mRNA展示、选择性感染噬菌体技术(SIP)等。本领域技术人员将会理解,核酸适体和肽适体可通过以下常规程序获得,而无需过多的实验。关于适体的详细描述,包括相关方案,尤其可见于L.Gold,J.Biol.Chem.,270(23):1358184(1995);S.Jayasena,Clin.Chem.,45:1628-50(1999);V.Sieber等人,NatBiotechnol.16(10):955-60(1998);D.Wilson和J.Szostak,Ann.Rev.Biochem.68:611-47(1999);L.Jermutus等人,Eur.Biophys.J.,31:179-84(2002);SS.Spada等人,Biol.Chem.,378:445-56(1997);B.Wlotzka等人,Proc.Natl.Acad.Sci.,99:8898-8902(2002)。
在一些实施方案中,适体将与核酸如连接体寡聚体或核酸ESB连接或杂交。适体的杂交或连接可通过本领域已知的任何合适的方法来完成。例如,连接可由至少一种DNA连接酶或至少一种RNA连接酶来酶促进行,该酶例如但不限于:T4DNA连接酶、T4RNA连接酶、嗜热栖热菌(Tth)连接酶、水生栖热菌(Taq)DNA连接酶或激烈火球菌(Pfu)连接酶。连接还可通过化学连接来进行,可使用激活剂或还原剂,如碳二亚胺、溴化氰(BrCN)、咪唑、1-甲基咪唑/碳二亚胺/胱胺、N-氰基咪唑、二硫苏糖醇(DTT)和紫外线。
在一些实施方案中,UBA是类肽。类肽是能结合蛋白质的N-取代甘氨酸合成肽的短序列。在一些实施方案中,小尺寸的类肽改善了本文所述的方法的扩散和动力学。本文所述的方法包括本领域已知的产生类肽的任何合适的方法。参见Simon等人,PNAS15;89(20):9367–9371(1992),其通过引用并入本文。
在一些实施方案中,UBA是核酸序列,例如,靶mRNA的反义DNA。核酸序列优选为至少15个核苷酸的长度,更优选为至少20个核苷酸的长度。在特定的实施方案中,靶标特异性序列约为10至500、20至400、30至300、40至200或50至100个核苷酸的长度。在其他实施方案中,靶标特异性序列约为30至70、40至80、50至90或60至100、30至120、40至140或50至150个核苷酸的长度。
多个UBA可用于单个靶标。所述多个UBA的成员可能对靶标和/或组装的元件的其余部分,例如,ESB、COB、夹板或CL具有不同的亲和性。所述多个UBA的一个或多个成员可能缺少对于组装所述结构的其余部分(诸如结合区,例如与ESB建立结合相互作用的结合区)所必需的标记物或组件。在一些情况下,所述多个UBA的一个或多个成员可能缺少对于与靶标相关联的组装体的至少一部分的扩增所必需的组件,例如引物结合区或引物序列。
UBA可具有如本文其他地方针对核酸进一步详细描述的一个或多个特征。例如,UBA可具有一个或多个引物结合区、条码、用于多轮混合裂分合成的APS组装的轮次特异性代码、使得能够进行计数的条码、用于从样品中消耗分子的至少一部分的捕获区和/或亲和结合区。捕获区可用于从样品中消耗高丰度的靶标。
表位特异性条码(ESB)
在一些实施方案中,本发明提供了表位特异性条码(ESB)。每个ESB包含可与特定靶分子相关的独特代码。ESB是设计为与至少一个UBA或UBA的一部分结合的分子或组装体;并且在适当的条件下,可形成包含ESB、UBA和靶分子的分子复合物。
ESB可包含至少一个身份确认部分,该身份确认部分使其能够与至少一个UBA结合或相互作用;通常以序列特异性的、构象特异性的方式或这两种方式;例如但不限于UBA-抗体结合、适体-靶标结合等。在一些实施方案中,ESB与UBA直接或间接地连接。在其他实施方案中,ESB与细胞或样品中的UBA结合,例如,作为分析过程的一部分。
在某些实施方案中,ESB是固体表面或捕获区,例如,ESB可以是可检测的珠,如具有独特光谱特征的珠(例如,已用红色或红外荧光团进行了内部染色的珠)。在一些实施方案中,UBA直接或间接地与捕获区连接。
在某些实施方案中,ESB包含共同连接体部分,例如,连接体寡聚体。在某些实施方案中,该共同连接体寡聚体与形成细胞起源条码(COB)的可测定聚合物亚单位(APS)中的共同连接体寡聚体互补。
在某些实施方案中,ESB包含捕获区。在一些实施方案中,捕获区用于ESB的分离和/或ESB向表面内的固定。捕获区可以是亲和标签、珠、载玻片或阵列。在一些实施方案中,捕获区是可检测的珠,如具有独特光谱特征的珠(例如,已用红色或红外荧光团进行了内部染色的珠)。
在一些实施方案中,ESB是如上所述的抗体或其片段、适体、核酸或类肽。
在一些实施方案中,ESB是核酸。在一些实施方案中,核酸的一部分通过合适的方法,例如用PCR、用如本领域已知的支链或滚环方法进行扩增。
在一些实施方案中,ESB是类肽。类肽是能结合蛋白质的N-取代甘氨酸合成肽的短序列。在一些实施方案中,小尺寸的类肽改善了本文所述的方法的扩散和动力学。本文所述的方法包括本领域已知的产生类肽的任何合适的方法。参见Simon等人,PNAS15;89(20):9367–9371(1992),其通过引用并入本文。
在一些实施方案中,ESB是核酸序列,例如,互补靶核酸序列的反义核酸。核酸序列优选为至少15个核苷酸的长度,更优选为至少20个核苷酸的长度。在特定的实施方案中,靶标特异性序列约为10至500、20至400、30至300、40至200或50至100个核苷酸的长度。在其他实施方案中,靶标特异性序列约为30至70、40至80、50至90或60至100、30至120、40至140或50至150个核苷酸的长度。
多个ESB可用于单个靶标。所述多个ESB的成员可能对靶标和/或组装的元件的其余部分,例如,COB、夹板或CL具有不同的亲和性。所述多个ESB的一个或多个成员可能缺少对于组装所述结构的其余部分(诸如结合区,例如与UBA、APS、CL、夹板和/或COB建立结合相互作用的结合区)所必需的标记物或组件。在一些情况下,所述多个ESB的一个或多个成员可能缺少对于与靶标相关联的组装体的至少一部分的扩增所必需的组件,例如引物结合区或引物序列。
ESB可具有如本文其他地方针对核酸进一步详细描述的一个或多个特征。例如,ESB可具有一个或多个引物结合区、条码、用于多轮混合裂分合成的APS组装的轮次特异性代码、使得能够进行计数的条码、用于从样品中消耗分子的至少一部分的捕获区和/或亲和结合区。捕获区可用于从样品中消耗高丰度的靶标。
细胞起源条码(COB)
在一些实施方案中,本发明提供了细胞起源条码(COB)。每个COB提供了可能与特定起源细胞相关的独特代码。在一些实施方案中,在COB与和ESB相关联的共同连接体部分(例如,共同连接体寡聚体)结合后,COB代码确定出与UBA/ESB复合物结合的靶分子的起源细胞。因此,在一些实施方案中,本发明的COB包含两个主要部分:(i)对于与UBA/ESB探针相关联的共同连接体部分(例如,共同连接体寡聚体)具有特异性的序列;和(ii)可能与特定起源细胞相关的独特代码。
在一些实施方案中,COB是模块结构。在一些实施方案中,COB包含多个不同的可测定聚合物亚单位(APS)。在一些实施方案中,COB包含多个以线性组合方式连接的APS。在一些实施方案中,COB是含有以下某些基本元件的分子实体:(i)多个包含标记物连接区的APS,它们以线性组合方式连接形成骨架,和(ii)包含标记物的互补多核苷酸序列,它们与骨架的标记物连接区互补并且与之连接。术语标记物连接区包括给定骨架内限定的多核苷酸序列的区域,其可作为可检测的分子的单独连接点。在一些实施方案中,COB包含以线性组合方式连接的多个不同的APS,其中APS包含具有确定性重量的小分子。在一些实施方案中,COB包含以线性组合方式连接的2个、3个、4个、5个、6个、7个、8个、9个、10个或更多个独特APS。在一些实施方案中,COB包含以线性组合方式连接的4个或更多个APS。
在一些实施方案中,以线性组合方式连接的多个APS可包含独特设计的核酸序列。此外,COB中以线性组合方式连接的多个APS可包含至少一个模板,例如但不限于至少一个核酸序列,如线性或可线性化的病毒基因组的至少一部分,如腺病毒、肝炎病毒、疱疹病毒、轮状病毒等或诸如λ、M13、ΦX-174、T系列噬菌体等噬菌体的基因组,包括包含克隆盒、多接头等的其衍生物;质粒,如pBR322和pUC系列质粒等,包括包含克隆盒、多接头等的其衍生物;合成模板;包含人工序列的模板;等等。技术人员将会理解,实际上任何核酸片段都可作为用于构造COB的模板,只要其大到足以包括至少两个APS,或其可与至少一个其他的核酸序列组合,使得组合的序列大到足以包括至少两个APS。在一些实施方案中,本发明的ESB、APS或COB涉及可模板化的结构单元。在一些实施方案中,本发明的UBA涉及可模板化的分子。
在一些实施方案中,COB还包含一个或多个含有共同连接体部分(例如,共同连接体寡聚体)的APS。共同连接体部分可与APS直接或间接连接。因此,共同连接体部分可与COB共价连接,或者共同连接体可稍后在试验中与COB结合。术语共同连接体部分包括约10至约25个核苷酸的串联重复序列。共同连接体部分可在COB的5'区或3'区进行连接,并且可用于COB的捕获或固定以供成像或检测,例如通过将与共同连接体部分互补的序列连接到固体基质上。
COB的元件可存在于单个分子实体(单COB)或两个不同的分子实体(双COB)中。每个分子实体可由一个分子或通过共价或非共价方式彼此连接的多于一个分子组成。在一些实施方案中,双COB的每种组分具有与相同靶分子上的不同位点结合的靶分子特异性UBA/ESB。当使用双COB系统时,其中一个COB可以是未标记的。在一些实施方案中,未标记的COB可包含捕获区。
在本发明的许多实施方案中,COB由单独APS结构单元构建而成。在一些实施方案中,APS以线性方式组合。在一些实施方案中,由APS构建的COB保留了APS的顺序。在一些实施方案中,COB包含分支结构。在一些实施方案中,分支的COB结构包含关于APS添加顺序的信息。在许多实施方案中,可将形成COB的单独APS进行解码。在一些实施方案中,可将形成COB的APS的顺序或添加顺序进行解码。不受理论所限制,允许保护和解码APS添加顺序的平台支持由同等数目的APS结构单元产生更高数目的不同COB。利用较高数目的总COB分子类型,群体中的两个细胞/颗粒被相同COB标记的可能性降低。因此,本发明的许多实施方案的方法为细胞/颗粒身份的确定给出了更高的统计显著性。
在一些实施方案中,与APS连接的互补多核苷酸序列用于将可检测分子或标记物单体与APS连接。互补多核苷酸序列可被直接标记,例如通过将一个或多个可检测分子共价引入互补多核苷酸序列中。或者,互补多核苷酸序列可被间接标记,例如通过将能够进行特异性配体相互作用的生物素或其他分子引入互补多核苷酸序列中。在这类情况下,配体(例如,在生物素引入互补多核苷酸序列中的情况下的链霉亲和素)可共价连接于可检测分子。在不直接将与APS连接的可检测分子引入互补多核苷酸序列的情况下,该序列作为可检测分子与APS之间的桥梁,并且可称为桥接分子,例如桥接核酸。
在一些实施方案中,本发明的基于核酸的COB、COB-ESB复合物或COB/ESB/UBA复合物包含核酸,该核酸可使用与COB的恒定区(例如,共同连接体部分、捕获区或亲和标签)互补的核酸如寡核苷酸进行亲和纯化或固定。如上所述,在一些实施方案中,COB包含可作为用于纯化和/或固定(例如固定至固体表面)的亲和标签的至少一个共同连接体部分。共同连接体部分可包含重复核苷酸(如一系列15个碱基的重复)的两个或更多个串联重复区域。在这类示例性实施方案中,与ESB、ESB/UBA、靶分子/UBA/ESB复合或不与之复合的COB均可用涂覆有15个碱基的寡核苷酸的亲和试剂进行纯化或固定化,该15个碱基的寡核苷酸是重复单元的反向互补序列。
可在两个或更多个亲和选择步骤中纯化COB、COB-ESB复合物或COB/ESB/UBA复合物。例如,在COB与ESB/UBA复合物连接的实施方案中,COB可包含亲和标签。在其他实施方案中,当使用双COB时,一个COB可包含第一亲和标签,而另一个COB可包含第二(不同的)亲和标签。将COB与靶分子混合,并通过针对一个或两个单独亲和标签的亲和纯化将包含双COB的两个探针的复合物从未结合的材料中分离出来。
在第一步中,可将混合物与针对第一亲和标签的亲和试剂结合,以使得仅有包含第一亲和标签和所需复合物的探针得到纯化。结合的材料从第一亲和试剂中释放出来,并且任选地与针对第二亲和标签的亲和试剂结合,从而允许从包含第一亲和标签的COB中分离出复合物。此时,仅有完整复合物将会被结合。最后,复合物从针对第二亲和标签的亲和试剂中释放出来,然后通过本文所述的方法进行分析。亲和试剂可以是涂覆有亲和标签的结合配偶体的任何固体表面,如柱、珠(例如,乳胶珠或磁珠),或涂覆有结合配偶体的载玻片。本领域已知的许多亲和标签,例如,可以用于纯化和/或固定COB、COB-ESB复合物或COB/ESB/UBA复合物。在一些实施方案中,生物素锚与COB、ESB和/或UBA连接,这允许COB、COB-ESB复合物或COB/ESB/UBA复合物在链霉亲和素表面(例如,涂覆的载玻片或珠)上的固定。在一些实施方案中,亲和标签与UBA连接,例如,用于纯化和/或固定UBA。亲和标签可用于为了多种有用的应用而附接至珠或其他基质上,这些应用包括但不限于纯化。亲和标签的实例及其制备方法和/或其与核酸连接的方法在美国专利7,473,767;美国申请10/542,458;12/324,357;11/645,270和12/541,131中有述,它们通过引用整体并入本文。在一些实施方案中,ESB、UBA、APS和COB中的至少两个包含本文所述的不同的化学组合物或本领域已知的任何其他合适的组合物。例如,ESB可包含肽和/或核酸,而APS包含肽或类肽。所述化学成分的任意组合预期在本发明的范围内。
在许多实施方案中,ESB、APS和/或COB可以是模板、有序的和/或解码的。在一些实施方案中,可检测构建体中这些亚单位中任何一个的顺序。ESB、APS和/或COB可为添加ESB、APS和/或COB中的任意另一个提供模板,例如,通过核酸互补性或本领域已知的任何其他合适的化学互补性进行添加。ESB、APS和/或COB可编码次级产物,如编码另一种核酸或肽的核酸。在一些实施方案中,对ESB、APS和/或COB的检测包括对其进行解码,例如从ESB、APS和/或COB产生扩增子或表达肽,以及测序或以其他方式检测产物。
与给定细胞的COB的各种APS相关联的标记物单体所提供的序列、重量或信号允许对COB的独特鉴定。例如,当使用核酸序列时,具有独特身份或独特序列特征的COB与识别特定靶分子或其一部分的UBA相关联。对COB序列的检测允许检测混合物中靶分子的存在(定性分析)。在另一个实例中,当使用荧光标记物时,具有独特身份或独特光谱特征的COB与识别特定靶分子或其一部分的UBA相关联。对COB信号如荧光标记的COB的光谱代码的检测允许检测混合物中靶分子的存在(定性分析)。在又一个实例中,当依据组合合成程序使用小分子时,具有独特确定性重量的COB与识别特定靶分子或其一部分的UBA相关联。对COB确定性重量的检测(例如,经由质谱法)允许检测混合物中靶分子的存在(定性分析)。对与给定特征(例如,光谱代码、独特序列或独特的确定性重量)相关的代码(例如,序列、标记物单体或确定性重量)的计数或量化允许计数或量化混合物中与COB偶联的UBA相关联的所有分子(定量分析)。因此,通过对已知生物标志物的定量分析,UBA/ESB/COB复合物对于不同生物状态(例如,疾病与健康)的诊断或预后是有用的。
此外,由本发明的COB提供的单分子检测和量化的高灵敏度允许鉴定新的诊断和预后标志物,包括那些在不同生物状态间的波动太微弱因而不能使用传统分子方法检测与特定生物状态的相关性的那些标志物。基于COB的分子检测的灵敏度允许对小生物样品中的治疗剂和诊断剂进行详细的药代动力学分析。
COB合成可通过本领域已知的任何合适的方法(包括本文所述的方法)来进行。
在许多实施方案中,本发明涉及将要通过逐步添加包含寡核苷酸的可测定聚合物亚单位(APS)而合成的COB。COB可通过共同连接体(CL)与UBA连接。CL也可以是寡核苷酸的一部分。在一些实施方案中,还提供了作为寡核苷酸的表位特异性条码。在一些情况下,表位特异性条码可包括在包含共同连接体的寡核苷酸中。在一些实施方案中,CL、ESB和APS都包含寡核苷酸序列。因此,可将寡核苷酸CL与寡核苷酸ESB或APS连接。可利用基本上互补或完全互补的退火区域进行杂交。可在寡核苷酸ESB或APS的两端设置退火区域。在一些实施方案中,APS在混合裂分合成或本领域已知的任何其他合适的逐步合成的各个步骤中加入。可将对于逐步合成的每一步为特异性的退火区引入寡核苷酸中。不受理论所限制,只要在步骤期间跳过寡核苷酸添加,下一个寡核苷酸的步骤特异性退火区将不会与前一个可用的寡核苷酸的步骤特异性退火区有效地杂交。因此,本发明的一些实施方案提供了停止缺少一个或多个APS的COB的合成的方法。
COB和/或CL可具有如本文其他地方针对核酸进一步详细描述的一个或多个特征。例如,COB可具有一个或多个引物结合区、条码、用于多轮混合裂分合成的APS组装的轮次特异性代码、使得能够进行计数的条码、用于从样品中消耗分子的至少一部分的捕获区和/或亲和结合区。
可使用互补链上的夹板将APS连接在一起。在一些情况下,在交替链中使用多个夹板。夹板可共价连接至UBA和/或ESB。在一些情况下,夹板可与UBA和/或ESB杂交。夹板可具有如本文其他地方针对核酸进一步详细描述的一个或多个特征。例如,夹板可具有一个或多个引物结合区、条码、用于多轮混合裂分合成的APS组装的轮次特异性代码、使得能够进行计数的条码、用于从样品中消耗分子的至少一部分的捕获区和/或亲和结合区。可提供夹板作为组装组件如UBA、ESB或CL的一部分。
在一些实施方案中,用不同的CL寡核苷酸来标记UBA,每个CL寡核苷酸都具有UBA特异性的独特ESB序列和共有退火区。在许多情况下,在多轮混合裂分合成过程中将APS组装至COB中。在这些情况下,在每一轮,将样品分入n个不同的容器中。可向每个容器中加入不同的寡核苷酸APS,总共m个不同的APS。在一些实施方案中,n和m是相同的。在其他实施方案中,n大于m或m大于n。可设计每个APS以使其将选择性地与前一轮中加入的退火区杂交(图6)。在许多实施方案中,将一对轮次特异性退火区引入每个APS中。可向APS的每一端引入退火区。引入APS每一端的退火区可以是不同的。因此,加入的APS的退火区可与来自前一轮的可用退火区互补从而促进组装。
在一些实施方案中,可使用退火引物将APS订合在一起和/或与CL订合(图7和图8)。退火引物可包含与CL互补的或与在逐步合成的前一轮中添加的APS互补的第一互补区。退火引物还可包含与在当前一轮中加入的APS互补的第二互补区。因此,退火引物可与后几轮的两个寡核苷酸亚单位杂交,从而将它们订合在一起。在一些实施方案中,每轮的退火引物的第一互补区不同于其他几轮的退火引物的第一互补区(图7)。在一些实施方案中,每轮的退火引物的第二互补区不同于其他几轮的退火引物的第二互补区。在一些实施方案中,不同轮次的退火引物的第一或第二互补区在轮次之间是共同的(图8)。
在一些实施方案中,CL寡核苷酸包含成对环状退火区(图9和图10)。因此,APS可设计为以环状几何形状与CL杂交,其沿着环状退火区在每一端与CL杂交。环状退火区可以是轮次特异性的。杂交可沿着CL填充(populate)APS。可使用本文所述的任何方法或本领域已知的其他普通方法将APS连接起来。APS可以设计为使得它们不会沿着对于其他轮次具有特异性的环状退火区与CL有效地杂交。因此,如果来自特定轮次的APS缺失,则APS可能无法成功地连接在一起,这取决于连接过程。或者,可利用缺失的APS合成COB,其位置的侧翼为一对环状退火区。之后可相应地对得到的COB进行分析,并且可将其丢弃或可备选地处理重新获得的信息。
在给定轮次中的每个APS可包含独特的子代码序列,该序列不同于该轮次中其余的APS(图6-11)。该子代码可包含独特的核苷酸序列。
CL或者一个或多个APS可进一步包含允许随后对检测到的COB进行归一化的随机标签区(图6-11)。此类随机标签区内的条码可用于在下游事件之前对起始分子的数目进行计数,所述下游事件通常包括对靶分子的组装体的至少一部分进行扩增。利用这类随机标签区的合适方法的变化是本领域已知的,例如,参见Casbon等人(NucleicAcidsResearch,2011,39:12,e81)。在一些情况下,随机标签区可作为分子计数器用来估计与每个序列变体相关的模板分子的数目。在一些情况下,在扩增反应例如PCR之前将分子计数器引入CL、ESB、APS或组装的COB中。可将包含简并碱基区(DBR)的分子计数器文库引入CL、ESB、APS或组装的COB。文库中独特DBR的数目通常受到DBR的长度和碱基组成的限制。例如,DBR中的一个核苷酸将允许有四个不同的可能的计数器,一个计数器针对一个碱基。较长的DBR可以产生较高数目的独特计数器序列。可将每个来自序列文库的分子计数器引入CL、ESB、APS或组装的COB。分子计数器可用于确定序列变体是与一个模板分子相关还是与多个模板分子相关。与一个序列变体相关的不同DBR序列的数目可作为初始模板分子数目的直接量度。该信息可以补充或替代由每个序列变体的读取数目(包括,例如,扩增反应如PCR后的读取数目)提供的信息。DBR还可用于确定序列变体源自扩增反应期间的聚合酶错误或为扩增反应如PCR之前的真实的原始变体的可能性。在一些实施方案中,在COB组装之前或同时将独特结合剂(UBA)固定于它们的靶标上。
图12示出了靶标特异性和/或细胞特异性组装的进一步的示例性特征。在一些情况下,使用多于一个夹板,每个夹板具有一个或多个APS的互补区,而一些实施方案使用具有针对多个APS的多个结合位点的单个通用夹板。该夹板可具有至少2、3、4、5、6、7、8、9、10个或更多个通常设计为结合APS的结合位点。夹板还可具有用于一个或多个引物延伸反应(例如扩增或测序反应)的引物结合区。可在不同的组装中使用这些引物结合区的一些或全部,例如,以将核酸募集至不同数目的扩增反应中,从而通常使核酸的丰度归一化。在一些情况下,差别性地扩增的序列的量化仍然可进行,例如通过使用用于计数的随机标签区,该方法的细节进一步详细描述于本文的其他地方。在一些实施方案中,夹板上所有的APS结合位点均被APS靶向。在一些实施方案中,并非所有的APS结合位点均被使用。例如,夹板可具有10个APS结合位点,并且可仅与4个APS相关联。图12示出了结合2个APS的通用夹板。
一个或多个夹板可通过使用一个或多个探针连接至靶标和/或UBA。所述一个或多个探针、靶标和/或UBA可具有核酸组分。引物结合区可位于在其他地方针对核酸进一步详细描述的任何特征的下游或上游,并且可用于排除或包括本文在引物延伸反应(包括扩增和测序)中所描述的组装体的部分。因此,可使用插入的引物结合区来启动可订合在一起的重叠测序读取值。
例如,图12A和12B示出了在具有三个APS结合位点的夹板上的示例性组装。在图12A中,三个APS被组装在夹板上,而在图12B中,仅两个APS被组装,而针对第三个APS的结合区仍未使用。任何APS可有助于引物序列或引物结合区,如图12A中的第三个APS和图12B中的第二个APS。所述一个或多个探针也可有助于引物序列或引物结合区。例如,图12示出了探针2,其将成为允许进行扩增、组装和/或测序的引物的靶标。引物位点可拷贝到来自APS3(图12A)或APS2(图12B)的这样的延伸产物,从而允许采用合适的引物复制该延伸产物。
本发明的许多实施方案涉及COB在细胞表面上的组装。例如,COB可与靶向细胞表面组分的UBA组装结合。在一些实施方案中,在COB组装之前或同时将UBA固定于细胞表面组分上。在一些实施方案中,将UBA递送至细胞内或细胞区室内。在一些实施方案中,COB与细胞或细胞区室内的UBA组装结合。可在加入UBA、ESB之前或在COB组装之前将细胞固定。合适的细胞透化方法是本领域已知的,并且可用于将该试验的组分递送至细胞和细胞区室内。
在一些实施方案中,该试验在非细胞的物体上进行。本领域已知的合适的支持材料,如珠或表面涂层,能用来以与细胞相同的方式提供原始结合表面。支持材料可用结合靶标来装饰。在一些实施方案中,支持材料在空间上将结合靶标彼此拆分。
在一些实施方案中,该试验可包含主要结合靶标和能与主要结合靶标结合的一个或多个次要靶标。支持材料可以例如涂覆有一个或多个主要靶标。可提供次要靶标的文库以结合主要靶标。可提供UBA以结合主要靶标和/或次要靶标的表位。如对于其他类型的靶标所述,COB可与这些UBA组装结合。可通过分析COB来监测次要靶标与主要靶标的相互依赖性结合。
在一些实施方案中,多个COB在同一UBA分子上组装。
在一些实施方案中,ESB或组装的COB编码衍生物序列。在一些实施方案中,ESB和/或COB包含多核苷酸序列。在一些情况下,ESB和/或COB可编码RNA序列。在一些情况下,ESB和/或COB编码肽序列。ESB和/或COB可直接编码肽序列。或者,COB可间接地例如通过中间RNA序列来编码肽序列。例如,多核苷酸ESB或COB可编码开放阅读框。在一些情况下,在将ESB或COB引入能够进行肽表达的构建体后,肽序列得到翻译。在一些实施方案中,构建体是载体。
在一些实施方案中,ESB和COB由寡核苷酸组装。连接剂可以是连接酶。在一些实施方案中,连接酶是T4DNA连接酶,采用众所周知的程序(Maniatis,T.,MolecularCloning,ColdSpringHarborLaboratory(1982))。还可使用其他DNA连接酶。关于连接,可使用其他连接酶,如来源于嗜热生物的连接酶,从而允许在较高温度下连接,这允许使用较长的寡核苷酸(具有增强的特异性)作为ESB、CL或APS,其在通常允许这类寡核苷酸退火的较高温度下可同时退火和连接。然而,连接并非必须通过酶,相应地,连接剂可以是这样的化学试剂:其将导致ESB和APS连接,除非在退火区存在核苷酸碱基对错配。为简单起见,本发明的一些实施方案将用T4DNA连接酶作为连接剂来描述。该酶需要在将要与相邻寡核苷酸上的3'OH基团连接的5'端存在磷酸基团。
当寡聚体堆积在一起而结合至在其末端接合处完全匹配的退火区时,导致与退火区的特异性结合。可将CL、ESB和APS连接起来以形成连接有ESB的COB。连接有ESB的COB转而可用于检测。
在一些实施方案中,ESB和/或COB组装包括采用点击化学。采用点击化学连接多个分子的合适方法是本领域已知的(关于寡核苷酸的点击化学连接,参见,例如El-Sagheer等人(PNAS,108:28,11338-11343,2011))。
在一些实施方案中,ESB和/或COB组装在细胞内发生。在一些实施方案中,ESB和/或APS首先在细胞内组装。在一些实施方案中,ESB和/或APS在细胞内连接。在一些实施方案中,ESB和/或APS在细胞外连接。
在一些实施方案中,对组装的产物进行扩增,并任选地将结果与来自参比样品的相似靶核酸的扩增进行比较。在一些实施方案中,对APS的连接产物进行扩增,并任选地将结果与来自参比样品的相似COB的扩增进行比较。可通过本领域已知的任何方法进行扩增。在一些情况下,通过聚合酶链反应(PCR)来扩增连接的产物。可使用的PCR技术的实例包括但不限于定量PCR、定量荧光PCR(QF-PCR)、多重荧光PCR(MF-PCR)、实时PCR(RTPCR)、单细胞PCR、限制性片段长度多态性PCR(PCR-RFLP)、PCK-RFLPIRT-PCR-IRFLP、热启动PCR、巢式PCR、原位聚合酶群落(polonony)PCR、原位滚环扩增(RCA)、桥式PCR、picotiterPCR和乳液PCR。其他合适的扩增方法包括连接酶链反应(LCR)、转录扩增、自动维持序列复制、靶多核苷酸序列的选择性扩增、共有序列引物聚合酶链反应(CP-PCR)、任意引物聚合酶链反应(AP-PCR)、简并寡核苷酸引物PCR(DOP-PCR)和基于核酸的序列扩增(NABSA)。本文可用的其他扩增方法包括美国专利5,242,794、5,494,810、4,988,617和6,582,938中描述的方法。在一些实施方案中,扩增在细胞内进行。
在任何实施方案中,连接产物的扩增可在载体如珠或表面上发生。在本文的任何实施方案中,COB可在来自单细胞的靶标上进行组装。
探针群体中每个UBA/ESB探针的独特性允许对多个靶分子进行多重分析。而且,探针群体中每个COB探针的独特性允许对单细胞中的多个靶分子进行多重分析。
例如,在一些实施方案中,每个COB含有六个APS。如果打算对APS进行测序,并且对于APS存在20个可能的独特序列。在该实例中将存在3.84x108个可能的COB。因此,在该实例中可分析3.84x108个细胞及其相应的UBA/ESB探针。考虑到在测序中没有在一些荧光方法中存在的颜色限制,所以每个细胞可以分析多个UBA/ESB探针。在一些实施方案中,每个细胞分析至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、40、50、60、65、70、90、100个不同的UBA/ESB。在一些实施方案中,每个细胞分析最多达5、6、7、8、9、10、15、20、25、30、35、40、50、75、100个或更多个不同的UBA/ESB。在一些实施方案中,每个细胞分析最多达1000个不同的UBA/ESB。在一些实施方案中,每个细胞分析最多达2000个不同的UBA/ESB。
在某些实施方案中,在多重分析中执行检测方法,以此在同一分析(单一反应混合物)中检测多个靶分子。在优选的实施方案中,该分析是杂交分析或亲和结合分析,其中同时检测多个靶分子。在优选的实施方案中,该分析是杂交分析或亲和结合分析,其中在单细胞中同时检测多个靶分子。在某些实施方案中,在同一分析中检测的多个靶分子是至少2个、至少5个不同的靶分子、至少10个不同的靶分子、至少20个不同的靶分子、至少50个不同的靶分子、至少75个不同的靶分子、至少100个不同的靶分子、至少200个不同的靶分子、至少500个不同的靶分子,或至少750个不同的靶分子,或至少1000个不同的靶分子。在其他实施方案中,在同一分析中检测的多个靶分子是最多达50个不同的靶分子、最多达100个不同的靶分子、最多达150个不同的靶分子、最多达200个不同的靶分子、最多达300个不同的靶分子、最多达500个不同的靶分子、最多达750个不同的靶分子、最多达1000个不同的靶分子、最多达2000个靶分子或最多达5000个靶分子。在另外其他的实施方案中,所检测的多个靶分子处于前述不同靶分子的数目之间的任何范围内,例如但不限于20至50个不同的靶分子、50至200个不同的靶分子、100至1000个不同的靶分子、500至5000个不同的靶分子等等。
根据本发明的各个实施方案,本文其他地方进一步详细描述的组合物和方法可用于提高用于检测多个靶标的实验设置(set-up)的动态范围。样品或样品子集内(例如单个细胞内)的多个靶标中的两个靶标,可具有小于1:10、1:100、1:1000、1:10000、1:100000、1:1000000、1:10000000、1:100000000、1:1000000000、1:10000000000、1:100000000000或更小的丰度比,而所述多个靶标中的靶标数目可变化,如本文其他地方所述。用于提高动态范围的合适的方法包括但不限于,不成比例地富集低丰度靶标或在该靶标上组装的结构,不成比例地消耗高丰度靶标或在该靶标上组装的结构,以及降低在信号读出值中高丰度靶标或在该靶标上组装的结构的表示。不成比例地富集低丰度靶标或在该靶标上组装的结构,例如可通过使用具有不同亲和力的引物结合区进行相关联核酸的优先扩增来实现,如本文其他地方进一步详细描述的。不成比例地消耗高丰度靶标或在该靶标上组装的结构,例如可通过滴定特异性结合高丰度靶标或在该靶标上组装的结构的捕获剂来实现。降低在信号读出值中高丰度靶标或在该靶标上组装的结构的表示,可通过使用形成在高丰度靶标上组装的结构的组分(例如UBA、ESB、CL、夹板或COB)的标记和未标记形式的混合物来实现。标记物可指直接可检测的标记物或能够实现或阻止在下游步骤中的表示的标记物,例如,通过不允许扩增或COB形成,如本文其他地方进一步详细描述的或本领域已知的。例如,标记物可为引物结合区。
在一些实施方案中,检测是数字化检测。在一些实施方案中,检测是直接的,即该方法获得直接由所检测的实体产生的信号。在一些实施方案中,检测是间接的,即在获得信号之前发生对待检测的实体的操作。在一些实施方案中,待检测的实体的多种组分直接地或间接地产生检测信号。在一些实施方案中,可通过本文所述的检测方法确定多个组分的顺序。此类检测方法还被描述为有序检测方法或具有有序信号的检测方法。
在任何实施方案中,COB的检测或量化分析可通过测序来完成。可通过本领域已知的任何合适的方法,例如IlluminaHiSeq2000,包括本文所述的测序方法,经过对所有DNA标签的完整测序来检测APS亚单位或整个COB。
可通过本领域公知的经典Sanger测序法来完成测序。还可使用高通量系统来完成测序,其中一些高通量系统允许在测序的核苷酸并入增长中的链时或之后立即对其进行检测,即,实时或基本上实时地检测序列。在一些情况下,高通量测序产生至少1,000、至少5,000、至少10,000、至少20,000、至少30,000、至少40,000、至少50,000、至少100,000或至少500,000次序列读取/小时;其中每次读取为至少50、至少60、至少70、至少80、至少90、至少100、至少120或至少150个碱基/读取。
在一些实施方案中,高通量测序涉及使用可通过Illumina的HiSeq2000机器获得的技术。该机器采用通过合成化学进行的基于可逆终止子的测序。该机器在八天内可进行2千亿次DNA读取。
在一些实施方案中,高通量测序涉及使用可通过ABISolidSystem获得的技术。这种遗传分析平台能够实现与珠连接的克隆扩增的DNA片段的大规模并行测序。该测序方法基于与染料标记的寡核苷酸的相继连接。
在一些实施方案中,高通量测序涉及使用可通过IonTorrentPersonalGenomeMachine(PMG)获得的技术。PGM在两个小时内可以进行1千万次读取。
在一些实施方案中,高通量测序涉及使用可通过HelicosBioSciencesCorporation(Cambridge,Massachusetts)获得的技术,如单分子合成测序(SMSS)法。SMSS是独一无二的,因为其允许在最多达24小时内对整个人类基因组进行测序。这种快速测序方法还允许基本实时地或实时地检测序列中的SNP核苷酸。最后,SMSS是强大的,因为如MIP技术一样,其在杂交之前不需要预扩增步骤。实际上,SMSS不需要任何扩增。在公开号为20060024711、20060024678、20060012793、20060012784和20050100932的美国申请中对SMSS进行了部分描述。
在一些实施方案中,高通量测序涉及使用可通过454Lifesciences,Inc.(Branford,Connecticut)获得的技术,如PicoTiterPlate装置,该装置包括光纤板,该光纤板传输将由该仪器中的CCD照相机记录的、测序反应产生的化学发光信号。光纤的这种使用允许在4.5小时内检测最少2千万个碱基对。
先采用珠扩增而后进行光纤检测的方法在Marguiles,M.等人,"Genomesequencinginmicrofabricatedhigh-densitypricolitrereactors",Nature,doi:10.1038/nature03959以及公开号为20020012930、20030058629、20030100102、20030148344、20040248161、20050079510、20050124022和20060078909的美国申请中有所描述。
在一些实施方案中,使用克隆单分子序列(ClonalSingleMoleculeArray)(Solexa,Inc.)或利用可逆终止子化学的合成测序(SBS)来进行高通量测序。在美国专利6,969,488、6,897,023、6,833,246、6,787,308和公开号为20040106130、20030064398、20030022207的美国申请和Constans,A.,TheScientist2003,17(13):36中对这些技术进行了部分描述。
在一些实施方案中,RNA或DNA的高通量测序可使用AnyDot.chips(Genovoxx,Germany)进行。特别是,AnyDot-chips允许将核苷酸荧光信号检测增强10-50倍。AnyDot.chips及其使用方法在公开号为WO02/088382、WO03/020968、WO03/031947、WO2005/044836、PCT/EP05/105657、PCT/EP05/105655的国际申请和德国专利申请DE10149786、DE10214395、DE10356837、DE102004009704、DE102004025696、DE102004025746、DE102004025694、DE102004025695、DE102004025744、DE102004025745和DE102005012301中有部分描述。
其他高通量测序系统包括在Venter,J.等人,Science,2001年2月16日、Adams,M.等人,Science,2000年3月24日和M.J,Levene等人,Science299:682-686,2003年1月以及公开号为20030044781和2006/0078937的美国申请中公开的系统。总体上这类系统涉及通过经由在核酸分子上测定的聚合反应暂时添加碱基而对具有多个碱基的靶核酸分子进行测序,即实时跟踪待测序的模板核酸分子上核酸聚合酶的活性。而后可通过确定在碱基添加顺序的每一步中哪个碱基正在经由核酸聚合酶的催化活性而并入靶核酸的增长互补链中来推断序列。在适合沿着靶核酸分子移动并在活性位点处延伸寡核苷酸引物的位置上提供靶核酸分子复合物上的聚合酶。在接近活性位点处提供多种标记类型的核苷酸类似物,其中每个可区分类型的核苷酸类似物与靶核酸序列中的不同核苷酸互补。通过使用聚合酶将核苷酸类似物添加到核酸链的活性位点处,来延伸增长的核酸链,其中添加的核苷酸类似物与活性位点处的靶核酸的核苷酸互补。对作为聚合步骤的结果而添加到寡核苷酸引物上的核苷酸类似物进行鉴定。重复进行提供标记的核苷酸类似物、使增长的核酸链聚合和鉴定添加的核苷酸类似物的步骤,以使得核酸链进一步延伸并且确定靶核酸的序列。
在许多实施方案中,直接鉴定寡核苷酸ESB或COB。直接鉴定可包含以上所述的核酸测序。在一些实施方案中,APS序列编码衍生物序列,转而鉴定该衍生物序列。例如,多核苷酸ESB和COB可翻译成肽序列。而后可采用本领域已知的合适的方法鉴定该肽序列。
在一些实施方案中,采用质谱分析来鉴定代表COB或ESB的序列。包含质谱法的测序方法是本领域已知的。在许多实施方案中,衍生物序列如肽采用质谱法进行测序。在一些实施方案中,质谱法包含片段化(fragmentation)。在一些实施方案中,质谱法包含N末端测序。在一些实施方案中,质谱法包含C末端测序。在一些实施方案中,质谱法包含Edman降解。在许多实施方案中,衍生物序列在鉴定之前经历分离过程。在一些实施方案中,分离过程包含色谱法。在一些实施方案中,分离过程包含HPLC。用于分离过程的合适的分离方法包括,例如,离子交换色谱法或疏水相互作用色谱法。离子交换色谱法可使用包含强酸性(通常为磺酸基团,例如聚苯乙烯磺酸钠或聚AMPS)、强碱性(季氨基,例如三甲基铵基团,如聚APTAC)、弱酸性(主要是羧酸基团)或弱碱性(伯、仲和/或叔氨基,如聚乙烯胺)官能团的任何基质材料。分离方法可以例如使用磺化聚苯乙烯作为基质,在酸溶液中加入氨基酸,并使pH稳定增加的缓冲液过柱。当pH达到其各自的等电点时氨基酸洗脱下来。可通过采用反向色谱法来使用疏水相互作用色谱法。已证明许多可商购的C8和C18硅胶柱通过使用梯度洗脱而成功分离了溶液中的肽。
在一些实施方案中,设计代表ESB、APS和所得的COB的肽序列来提高检测的容易程度。在一些情况下,可设计肽序列以改善质谱仪中的片段化模式。本领域众所周知,肽序列中键的片段化效率是序列依赖性的(参见,例如Tabb等人,AnalChem.2003March1;75(5):1155以及Klammer等人,Bioinformatics2008,24:348-356)。可利用序列依赖性的片段化效率设计具有期望的片段化模式的代表性肽序列。
在一些实施方案中,设计代表ESB、APS和所得的COB的肽序列来赋予肽分子某些理化特性。例如,可设计代表性肽序列以得到在水溶液中的溶解度处于所需范围内的肽分子。再如,可设计代表性肽序列以得到具有或缺乏所需程度的二级或三级结构的肽分子。又如,可设计代表性肽序列以得到具有或缺乏二硫键的肽分子。再如,可设计代表性肽序列以得到与选定的靶标具有期望的结合特性的肽分子。可进一步设计ESB、CL、APS和所得的COB的序列以在蛋白质表达系统中利用特别负载的tRNA。于是,可完成非天然氨基酸向所得肽分子中的并入。
许多实施方案涉及在检测之前分离与ESB连接的COB或衍生物序列,如肽序列。在一些实施方案中,分离是基于分子的合适的理化性质。这些类型的分离对于将分子连续地引导至检测器从而增加它们在检测时的相对丰度以及信号的复杂度是特别有用的。许多实施方案包含以针对序列的方式对分子的分离。例如,包含特定ESB的所有分子可通过使ESB序列与充分互补的序列杂交、使用ESB特异性连接标签的亲和纯化、使用由ESB序列编码的衍生物序列的亲和纯化或本领域已知的任何其他合适的方法而得到分离。分离方法还可针对细胞特异性COB或其一部分。
在一些实施方案中,对包含ESB和COB的构建体进行分离。例如,可根据ESB对该构建体进行梯度或亲和纯化分选。在一些实施方案中,分离可包含多维度,例如2、3、4、5、6、7个或更多维度。例如,该构建体可通过在一个维度上根据第一APS分选并在另一维度上根据第二APS分选以及任选地在第三维度上根据ESB分选而得到分离。
在一些实施方案中,分离方法包含通过梯度、在凝胶上、使用电磁场和/或本领域已知的任何其他合适的分离方法进行的分离。在一些实施方案中,可在检测之前对包含ESB和/或COB的构建体进行分离。例如,可根据ESB来分离该构建体,并且可在分离后检测该构建体中的ESB和/或COB。检测可以是摩尔比检测、酶检测、测序、梯度或凝胶中的差别亲和力、电磁场例如UV、荧光或化学发光、本文所述的任何检测方法或本领域已知的任何其他合适的检测方法。在一些实施方案中,分离包含固定该构建体。例如,可将构建体固定至阵列表面或珠上。ESB和/或COB的一部分可用于固定该构建体。可从固定位置检测ESB和/或COB。在一个实例中,可将包含寡核苷酸的ESB和/或COB固定至涂覆有互补寡核苷酸的珠或微阵列上。
可检测的分子或标记物单体
本发明的COB可用多种标记物单体中的任一种进行标记,如放射性同位素、荧光染料、染料、酶、纳米颗粒、化学发光标记物、生物素或本领域已知的可直接(例如,通过光发射)或间接(例如,通过荧光标记的抗体的结合)检测的其他单体。通常,COB中一个或多个标记的APS是用一个或多个标记物单体标记的,并且由与COB的APS连接的标记物单体提供的信号构成了鉴定UBA、COB所结合的靶标的可检测代码。在某些实施方案中,缺乏来自APS的给定信号(例如,暗点)也可构成COB代码的一部分。
可与本文所述的COB一起使用的标记物单体和将标记物单体引入COB的方法的实例在美国专利7,473,767、美国申请10/542,458、12/324,357、11/645,270和12/541,131中有所描述,它们通过引用整体并入本文。
当将可检测分子或标记物单体添加至COB时,除了由本发明的COB提供的定性分析能力和基于其的分析技术,本发明的COB也独特地适合于进行定量分析。通过在本发明的COB与生物分子样品中的其靶分子之间提供一对一结合,可对样品中存在的所有靶分子或其代表性部分进行鉴定和计数。这种对多种分子种类的单独计数为确定生物分子样品中靶分子的绝对或相对浓度提供了精确而直接的方法。此外,单独针对混合物中的每个分子的能力提供了小型化的益处,包括高灵敏度、最小样品量需求、由小体积中的溶液相动力学提供的高反应速率和最终非常低的试剂成本。在一些实施方案中,本文所述的方法可检测来自单个样品的两个或更多个相对丰度为至少10、100、1000、10000、100000、1000000、10000000、100000000、1000000000倍或更多倍的靶标。
靶分子
靶分子或表位是通过UBA的结合来检测或测定的分子,该UBA的靶标特异性区域能识别该靶分子或表位。靶分子的实例包括但不限于蛋白质、核酸、脂质、糖类、小分子、有机单体或药物。可通过本文的方法分析的核酸包括:双链DNA、单链DNA、单链DNA发夹、DNA/RNA杂合体、RNA(例如,mRNA或miRNA)和RNA发夹。仅为了方便起见,本文所述的方法主要在分析蛋白质或mRNA的背景下进行说明。然而,本文所述的实施方案也可用于检测非蛋白质或非mRNA靶标。在一些实施方案中,靶分子选自肽、多肽、寡肽、蛋白质、磷蛋白、抗体、核酸、肽核酸、合成小分子、二糖、三糖、寡糖、多糖、脂质、类固醇和磷脂。
靶分子可以是含有其他成分的生物分子样品的一部分,或可以是样品的唯一成分或主要成分。靶分子可以是全细胞或组织的成分、细胞或组织提取物、其分级分离的裂解物或基本纯化的分子。靶分子可在溶液或固相中附接至,包括,例如,固体表面,如芯片、微阵列或珠。靶分子也可具有已知的或未知的结构或序列。
本文公开的组合物、方法和试剂盒还可用于许多应用中来确定样品中靶分子的存在。例如但非限制性地,该组合物、方法和试剂盒可用于药代动力学研究,包括但不限于药物代谢、ADME谱分析和毒性研究;用于药物发现的靶标验证;基因表达谱分析、蛋白质表达谱分析;蛋白质组分析;代谢物组学研究;翻译后修饰研究,包括但不限于糖基化、磷酸化、乙酰化和氨基酸修饰,如谷氨酸修饰而形成γ-羧基谷氨酸以及脯氨酸羟基化而形成羟基化;特异性血清或粘膜抗体水平的分析;非核酸诊断指标的评估;外来抗原检测;等等。
在某一实施方案中,至少一个UBA、至少一个ESB或UBA和ESB两者包含与至少一个靶分子特异性反应的至少一个抗体、适体或类肽。在某些实施方案中,至少一个UBA、至少一个ESB或UBA和ESB两者包含与至少一个靶分子特异性相互作用的结合蛋白质。在一些实施方案中,ESB包含共同连接体部分。
技术人员将会理解,尤其可根据特定分子复合物或可切割组分的性质和所采用的SMD技术和检测装置,在束缚或附接至基底上的同时或在溶液中的同时,单独地检测本文所述的分子复合物和分子复合物的至少一部分。
方法
本发明提供了用于检测和量化生物分子样品中的靶分子的方法。特别是,本发明提供了能够结合单独靶分子的UBA。本发明还提供了ESB和COB的应用(参见图2)。通过ESB和COB的代码,UBA与靶分子的结合导致单细胞中的靶分子的鉴定。在一些实施方案中,ESB/COB复合物代表信息量子,该信息量子代表靶分子和起源细胞(参见图1)。还提供了制备和使用此类UBA和/或ESB以及COB的方法。
一方面,本发明提供了鉴定复杂细胞群体的每个分子中的多个靶分子并保留有关该靶分子的细胞特异性信息的方法。因此,对于每个细胞测定与该细胞相关的每个靶分子的量。在一些实施方案中,确定多个信息量子以鉴定复杂细胞群体的每个细胞中的多个靶分子。
在一些实施方案中,本发明提供了用于检测样品中的至少一个靶分子的方法,其包括以下步骤:(a)提供:(i)可能包含至少一个靶分子的细胞群体,(ii)对第一靶分子具有特异性的第一UBA,(iii)对第一UBA的区域具有特异性的第一表位特异性条码ESB,其中该ESB包含第一共同连接体部分,以及(iv)COB群体,其中该COB群体包含第二共同连接体部分,其中第二连接体部分与第一ESB中的第一共同连接体部分是互补的;(b)形成包含至少一个靶分子、第一UBA探针和第一ESB的至少第一复合物,其中至少一个靶分子与第一UBA结合,并且ESB与UBA结合;(c)加入COB群体,其中由至少一个靶分子、第一UBA探针、第一ESB和第一COB形成第二复合物,并且其中来自第一COB的第二共同连接体部分与来自第一ESB的第一连接体部分结合,并且其中来自COB群体的COB与来自细胞群体的细胞相关;以及(d)检测第二复合物或第三复合物的至少一部分。
在一些实施方案中,本发明提供了通过将UBA与靶分子结合来检测和/或量化靶分子的方法。UBA包含至少一个反应部分,该反应部分允许UBA与靶分子结合或相互作用;通常以序列特异性的方式、构象特异性的方式或这两种方式;例如但不限于抗原-抗体结合、适体-靶标结合等(参见图2和3)。
在一些实施方案中,UBA可以是至少一个探针组的一部分,其包含至少一个第一探针和至少一个第二探针。因此,在一些实施方案中,本发明提供了通过将UBA探针组与靶分子结合来检测和/或量化靶分子的方法,其中UBA探针组包含第一UBA探针和第二UBA探针。第一UBA探针和第二UBA探针包含至少一个反应部分,该反应部分允许探针与靶分子的不同区域例如以序列特异性的方式、构象特异性的方式或这两种方式结合或相互作用。在一些实施方案中,UBA探针和/或第二UBA探针含有如本文所述的捕获区。
在某些实施方案中,UBA包含身份部分或身份部分的至少一部分,例如,ESB、COB、ESB和/或连接体寡聚体。身份部分允许在本文所述的方法的检测步骤中鉴定与靶分子结合的UBA的存在与否。因此,在一些实施方案中,本发明提供了通过将UBA与靶分子结合来检测和/或量化靶分子的方法,其中UBA含有身份部分(例如,ESB、COB、ESB和/或连接体寡聚体)。
在一些实施方案中,靶分子在细胞内直接用表位特异性条码(ESB)来标记。每个ESB包含可与特定靶分子相关的独特代码。ESB是设计为与至少一个UBA或UBA的一部分结合的分子或组装体;并且在合适的条件下可形成包含ESB、UBA和靶分子的分子复合物。ESB包含至少一个身份鉴定部分,该身份鉴定部分允许它们与至少一个UBA结合或相互作用;通常以序列特异性的方式、构象特异性的方式或这两种方式;例如但不限于UBA-抗体结合、适体-靶标结合等。在一些实施方案中,ESB与UBA直接或间接地连接。在其他实施方案中,ESB与细胞或样品中的UBA结合,例如,作为分析过程的一部分。在某些实施方案中,UBA和/或ESB包含捕获区。在一些实施方案中,捕获区用于UBA/ESB的分离和/或UBA/ESB向表面内的固定。捕获区可以是亲和标签、珠、载玻片或阵列。在某些实施方案中,ESB包含共同连接体部分,例如,连接体寡聚体。在某些实施方案中,共同连接体寡聚体与形成细胞起源条码(COB)的可测定聚合物亚单位(APS)中的共同连接体寡聚体互补。
在一些情况下,在靶标上组装的结构的一部分可缺失ESB,其UBA-ESB组装和/或COB组装可能受到阻碍,例如通过缺失用于COB组装的UBA、ESB和/或夹板上的杂交区。在一些情况下,在靶标上组装的结构的一部分可缺失一个或多个标记物,例如允许扩增的标记物。这样的部分对于低丰度靶标来说可能是较低含量或不存在的。通过使用多个引物结合区以及将不到全集的一部分引入靶标的不同部分,靶标和/或在该靶标上组装的结构可在不同数目的连续扩增反应如2、3、4、5、6、7、8、9、10个扩增反应中扩增,每个扩增反应包括一轮或多轮,例如至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30轮或更多轮。在一些情况下,靶分子中设置为接受UBA、ESB、COB、CL或夹板的亚型的部分可少于99.999%、99.99%、99.9%、99%、98%、97%、96%、95%、90%、80%、70%、60%、50%、40%、30%、20%、10%、5%、4%、3%、2%、1%、0.5%、0.4%、0.3%、0.2%、0.1%、0.01%、0.001%、0.0001%或更低。可使用此类方法来提高相同实验中低和高丰度靶标检测的动态范围。
图3和图4示出了本发明的一个实施方案的示意图,其中采用混合裂分合成法将COB附加到靶分子/UBA/ESB复合物上。图3在步骤1中示出了用UBA-ESB-CL试剂标记细胞。UBA提供了对细胞中待识别的靶分子的特异性。在一些实施方案中,UBA可以是对表面标志物如CD8或细胞内表位如激酶如Stat-3上的磷酸表位具有特异性的抗体。在一些实施方案中,UBA可以是固定的细胞中的靶mRNA的反义DNA。UBA由具有CL部分的ESB来鉴定,CL用于随后细胞特异性标记信息的加入。图4在步骤2中示出了混合裂分合成的开始。在该实例中,将细胞群体裂分至20个管中。可将细胞群体分入孔、珠或本领域已知的任何合适的表面。在步骤3中,将APS单位加入每个管中。APS通过APS和ESB中的互补CL结合UBA/ESB复合物。在步骤4中,给定管中的每个细胞现在已附加到每个UBA-ESB对上如由管的内容物所限定的相同亚单位(在该实例中,1-20个APS中的一个)。来自步骤3的每个裂分群体现在具有添加至该细胞中所有DBAA上的DAPS“标签”聚合物亚单位。在步骤5中,将来自20个管的细胞合并到一个管中。1/20的细胞具有相同的APS亚单位。在步骤6中,重复步骤2-4以将第二APS添加到先前的APS上。在该实例中,一个管中的细胞将具有细胞混合物,所有细胞都以统计学平均分布的方式具有来自第2轮的APS亚单位和在第1轮中使用的20个APS中的一个。因此,在第2轮,在每个单独管混合物中,所有聚合物通过加入相同的APS而得到延伸。根据需要重复该过程。通过本领域已知的任何方法(包括本文所述的方法)来读取表位/条码以及连接的细胞起源特征。
所需的混合裂分轮数由试验中的细胞数以及对导致确保每个细胞有独特COB的标签数过度表示的统计学估计所限定。这由以下方程给出:
其中C=过度表示的确定性,以及
其中N=细胞数
因此,如果你有1百万个细胞并且你想得到99.9%的标签独特性的确定性,则需要:
或大约7百万个标签。在许多实施方案中,标签独特性的高确定性确保将细胞/颗粒鉴定为不同实体的高统计学显著性。不受理论所限制,标签独特性的高确定性提供了两种相同的COB标签来源于相同细胞/颗粒的高可能性。
然而,对于106个细胞,7百万个标签意味着1000个细胞对可被标记为“相同”细胞。因此,为了获得仅1/10的存在单对复制细胞的几率,该方程应设定为99.99999%
因此需要比细胞多16倍的标签。
为了确定给定的轮数,给定的用于条码创建的亚单位数:
xy=T得出
如果你有20个亚单位,对于1.7x107个标签,你需要以下的APS添加循环:
这可以向上舍入(roundup)为6个APS添加循环。
如果你有100个亚单位,你将仅需要3.6轮,或向上舍入为4个APS添加循环。
在一些实施方案中,通过被称为“生日”问题的加密方法来估计所需要的条码数,这样,如果n(p;d)表示从[1,d]个不同的细胞起源条码得到的具有条码的随机细胞的数目,则至少两个条码相同的概率p可采用以下关系式来估计:
因此,在一些实施方案中,本发明提供了用ESB间接地标记细胞内的靶分子的方法。细胞群体在混合裂分合成方法中进行处理,该方法将指示起源细胞或细胞起源条码的第二特征附加至表位特异性条码上。对于蛋白质,UBA可以是抗体、双抗体等,或者对于RNA,可以是反义DNA标签,而对于核酸,可以是DNA。ESB可以是可由高通量测序方法读取的核酸或可由质谱法测定的化学亚单位。COB可以是可由高通量测序方法读取的核酸或可由质谱法测定的化学亚单位。
APS可以是DNA或DNA模拟物的特定链。APS可通过连接酶连接。可用于连接的酶的实例包括但不限于DNA连接酶和RNA连接酶如T4DNA连接酶、T4RNA连接酶、嗜热栖热菌(Tth)连接酶、水生栖热菌(Taq)DNA连接酶或激烈火球菌(Pfu)连接酶。化学连接可使用激活剂和还原剂如碳二亚胺、溴化氰(BrCN)、咪唑、1-甲基咪唑/碳二亚胺/胱胺、N-氰基咪唑、二硫苏糖醇(DTT)和紫外线进行。在本发明的范围内也有连接技术如缺口填补连接,包括但不限于缺口填补OLA和LCR、桥接寡核苷酸连接和校正连接。关于这些技术的描述尤其可见于美国专利5,185,243、已公布的欧洲专利申请EP320308和EP439182以及PCT公开号WO90/01069和WO01/57268。APS可通过聚合酶进行延伸。
可通过本领域已知的任何合适的方法,例如IlluminaHiSeq2500、HiSeq2000、HiSeq1500、HiSeq1000、GenomeAnalyzerIIX或MiSeq个人测序仪(personalsequencer),包括本文所述的测序方法,经由对所有DNA标签的完全测序来检测这些APS亚单位。
APS可以是按照组合合成程序得到的小分子或具有确定性重量的可构建的复合分子。这些亚单位可通过质谱法进行检测。
因此,在一些实施方案中,细胞特异性信息经由与其相关COB(信息来源于该细胞)连接的UBA(针对将被识别的表位的条码)而组装(参见图5)。
在一些实施方案中,UBA/ESB/COB复合物经由如本文所述的捕获区来分离。在一些实施方案中,捕获区用于将UBA/ESB/COB复合物固定至表面内。
在一些实施方案中,可在随后的COB程序(混合裂分)之前,利用本领域已知的任何合适的扩增技术(包括本文所述的技术,如支链或滚环方法)来扩增UBA上的信息。
在一些实施方案中,可将错误校正和检测编码至亚单位中。实现错误检测和校正的总体思路是将一定的冗余度(即,一些额外数据)添加到信息中,其接收器可用于检查所传递的信息的一致性,并复原被确定为错误的数据。错误检测与校正方案可以是系统的或非系统的:在系统性方案中,发射器发送原始数据,并附加固定数目的校验位(或奇偶校验数据),该校验位来源于一些确定性算法获得的数据位。如果只需要错误检测,则接收器可简单地将相同的算法应用于所接收的数据位并且将其输出与所接收的校验位进行比较;如果数值不匹配,则在传输过程中的某一点发生了错误。在使用非系统性代码的系统中,原始信息被转化为具有至少与原始信息一样多的位元的编码信息。错误检测与校正方案包括重复代码、奇偶校验位、校验和、循环冗余校验(CRC)、密码杂凑函数、错误校正码、自动重复请求、混合ARQ、错误校正代码、卷积码、分组码如汉明码、多维奇偶校验码、Reed-Solomon码、涡轮码和低密度奇偶校验码(LDPC)。
在一些实施方案中,如果未添加聚合物,则每一轮的链被阻止进一步添加。如果每一轮使用不同的突出端进行互补添加,则这可用DNA作为聚合物单位来实现。
在一些实施方案中,通过使用本领域已知的方法(包括本文所述的方法)进行测序来读取表位/条码以及所连接的细胞起源特征。对于靶蛋白而言,假设每100bp读取代表ESB-COB对的测序方法灵敏度如下。感兴趣的分子的蛋白质拷贝数为100至100,000。假设想要读取具有以下大体分布的100种蛋白质:
|
测试1蛋白质 |
测试1读取 |
测试2蛋白质 |
测试2读取 |
100个拷贝 |
20 |
2x 103 |
20 |
2x 103 |
500个拷贝 |
20 |
1x 104 |
20 |
1x 104 |
1000个拷贝 |
20 |
2x 104 |
20 |
2x 104 |
10000个拷贝 |
20 |
2x 105 |
40 |
4x 105 |
100000个拷贝 |
20 |
2x 106 |
0 |
|
在测试1中,需要能够读取2,232,000个序列/细胞,以接近细胞中所有100种蛋白质。采用可以进行2x109次读取的测序技术如IlluminaHiSeq2000,这意味着该方法可在约1000个细胞中读取100种蛋白质。然而,如果通过完全避免它们或通过归一化(几种方法可对此有效)对它们的表示进行“加帽”来限制高拷贝数蛋白质,则我们可以增加可接近的细胞数。比如说,因此对100,000个拷贝进行归一化并加帽至10,000个拷贝的限制(测试2),则读取的总数是432,000。即,可读取约5000个细胞中的100种蛋白质。
对于mRNA,数目是不同的,因为RNA通常表达得相当低。感兴趣的分子的RNA拷贝数为5至1000(基于Lewin必需基因数);对于高蛋白质产生如肌动蛋白或Ig不计数特化mRNA。因此,假设想要读取具有以下大体分布的100种mRNA:
|
测试1mRNA |
测试1读取 |
5个拷贝 |
60 |
300 |
50个拷贝 |
20 |
1000 |
100个拷贝 |
10 |
1000 |
1000个拷贝 |
10 |
10000 |
在测试1中,需要能够读取12,300个序列/细胞以接近细胞中所有100种mRNA。采用可以进行2x109次读取的测序技术如IlluminaHiSeq2000,这意味着该方法可读取约162,000个细胞中的100种mRNA。这等同于高参数流式细胞术运行。具有相同分布的200种mRNA可以线性转变为在约80,000个细胞上读取。
对于本领域技术人员显而易见的是,增加读取数将增加细胞数和可获得的参数(例如,mRNA或蛋白质)。
在各个实施方案中,通过适当地改变在读出值中不同丰度靶标的表示来提高相同实验中低和高丰度靶标(例如蛋白质靶标或核酸靶标)检测的动态范围。例如,信号中高丰度靶标的表示可降低至少10、100、1000、10000、100000、1000000倍或更多倍。在一些情况下,信号中低丰度靶标的表示可提高至少10、100、1000、10000、100000、1000000倍或更多倍。
在各个实施方案中,通过序列含量的归一化来提高相同实验中低和高丰度靶标(例如蛋白质靶标或核酸靶标)检测的动态范围。合适的技术包括但不限于双链体特异性核酸酶(Shagina等人,NormalizationofgenomicDNAusingduplex-specificnuclease,BioTechniques2010;48:455-459;以及Soares等人,Expressedsequencetags:normalizationandsubtractionofcDNAlibrariesexpressedsequencetags\normalizationandsubtractionofcDNAlibraries,MethodsMolBiol.2009;533:109-22)、DNA消减以及其他杂交方法。
许多方法可用于提高单个样品中具有不同丰度的多个靶标的检测动态范围。在各个实施方案中,本文所述的引物结合区可充当一个或多个引物延伸反应的起始位点。引物结合区在本文所述的各种元件(包括但不限于UBA、ESB、CL、APS、夹板和/或退火引物)组装之前可以是不完整的,使得多个此类组件有助于引物结合区,并且可通过来自多个元件的序列贡献来产生。不同的引物结合区可基于靶标的身份并入到本文所述的组装的组合物中。例如,直接或间接地连接至第一靶标或设计为与第一靶标结合的第一UBA、CL、夹板或ESB可具有第一引物结合区,而直接或间接地连接至第一靶标或设计为与第一靶标结合的第二UBA、CL、夹板或ESB可具有第二引物结合区。在一些情况下,第一ESB或UBA可连接至具有第一引物结合区的第一CL或夹板或者设计为与该第一CL或夹板杂交,而第二ESB或UBA可连接至具有第二引物结合区的第一CL或夹板或者设计为与该第一CL或夹板杂交。本文描述的组装体可具有多个引物结合区。引物结合区可以是巢式的。不同的引物结合区对于一组引物可具有不同的亲和性。本文所描述的引物结合区可用于扩增反应,该扩增反应可相对于其他核酸组装体优先扩增一种核酸组装体,相对于与较高丰度靶标相关的组装体通常优先扩增与较低丰度靶标相关的组装体。因此,可提高来自单个来源的多个靶标的检测动态范围。示例性的扩增反应包括但不限于:巢式PCR、不对称PCR、单引物扩增(包括单引物等温扩增)或本文其他地方进一步详细描述的或其他本领域已知的用于优先扩增期望的核酸的其他合适的扩增反应。引物组中的引物可靶向多个与一个或多个靶分子相关联的引物结合区,以便该引物组的子集能够产生处于或高于靶标或在靶标上的靶标特异性组装体的第一预选阈值浓度的可检测扩增子。引物组的另一子集可以能够产生处于或高于靶标或在靶标上的靶标特异性组装体的第二预选阈值浓度的可检测扩增子。可挑选多个此类阈值浓度,如在美国专利号5,858,732中进一步描述的,该专利通过引用全部并入本文。
可采用连续测定环境和/或测定试剂,其中每一个针对不同的靶标丰度范围,从而任选地消耗较高丰度靶标和/或在该靶标上组装的结构,使得较低丰度靶标的检测更实用。描述了一系列测定和/或试剂的示例性的方法进一步描述于,例如美国专利公开US2011/0160078、PCT公开及美国专利号6,350,579中,这两篇文献均通过引用全部并入本文。
在一些情况下,高和低丰度靶标可通过使靶标和/或在靶标上组装的任何结构或它们的扩增产物与不同的探针或引物杂交而区分,该探针或引物被设计为以较高的频率杂交与低丰度靶标相关的元件,并因此可提高其丰度或表示。或者,探针或引物可以被工程化为优先杂交与高丰度靶标相关联的元件以供消耗。使用探针和引物的不同频率杂交以提高动态范围的方法进一步详细描述于美国专利公开2006/0246475中,该文献通过引用全部并入本文,且此类方法可通过使用在靶标上组装的结构而应用到具有不同丰度的两个不同的靶标上。
用于提高多个靶标的检测的动态范围的方法可利用从单个细胞或群体数据对此类靶标的丰度水平的事先预测。在一些情况下,此类数据可能对于细胞类型、样品类型、组织类型、发育阶段、疾病状态、实验输入(如药物或其他外部刺激的递送)或实验时段是特定的。用于量化靶标和数据源/数据库(这样的信息可位于其中,包括本文其他地方进一步详细描述的不同类型的样品或样品组分的基因表达谱或蛋白质表达谱)的合适的方法是本领域已知的。用于量化核酸分子的一些示例性方法详细描述于美国专利公开US2011/0160078和其中的参考文献中,所有这些文献均通过引用全部并入本文。
本文所述的任何实施方案可用于检测多个靶分子。在一些实施方案中,本发明提供了包含用于分析靶分子的UBA的方法。在一些实施方案中,本发明提供了用于多重分析的UBA群体。群体中的每个UBA对靶分子是特异性的。随后使用ESB-COB对来检测靶分子与UBA的结合。每个ESB-COB对包含可与特定靶分子和本文所述的起源细胞相关的独特标记物代码。
在一些实施方案中,如下所述的ESB-COB的检测本质上是数字化的,因为每次计数一个分子。当用荧光读取代码时,信号高,并且斑点存在或不存在,因此是数字化检测。使用数字化检测,而非用于量化信号的模拟荧光信号,导致更精确的量化。因此本文所述的方法允许多重化达到超过当前可能的水平,以得到更精确的量化和可能更高的灵敏度。
生物分子样品
本发明的UBA和ESB/COB系统可用于检测任何生物分子样品中的靶分子。本领域技术人员将会理解,该样品可包含任何数量的物质,包括但不限于:生物样品如细胞(包括原代细胞和培养的细胞系)、细胞裂解物或提取物、组织和组织提取物;体液(包括但不限于血液、尿液、血清、淋巴、胆汁、脑脊液、间隙液、房水或玻璃体液、初乳、痰、羊水、唾液、肛门和阴道分泌物、汗液和精液、渗出液、溢泌物(例如,从脓肿或任何其他感染或炎症部位获得的流体)或从几乎任何生物体的关节(例如,正常关节或受诸如类风湿性关节炎、骨关节炎、痛风或脓毒性关节炎等疾病影响的关节)获得的流体,哺乳动物样品是优选的,并且人类样品是特别优选的;环境样品(包括但不限于空气样品、农业样品、水样品和土壤样品);生物战剂样品;研究样品,包括细胞外液、来自细胞培养物的细胞外上清液、细菌内的包涵体、细胞区室、细胞周质、线粒体区室等。
生物分子样品可间接地来源于生物标本。例如,当感兴趣的靶分子是蛋白激酶时,本发明的生物分子样品可以是含有从细胞裂解物分离的蛋白质的样品。在另一个实例中,本发明的生物分子样品是通过使生物标本经过分级分离例如大小分级分离或膜分级分离而产生的。
蛋白质分离技术也是本领域公知的,并且在至少一些这样的技术中使用的试剂盒是可购买到的。蛋白质分离技术通常采用一种或多种以下方法:离析(maceration)和细胞裂解,包括物理、化学和酶方法;离心;按分子量的分离,如大小排阻色谱法和制备电泳;选择性沉淀,例如,盐溶和盐析程序;各种色谱法;等等。关于蛋白质纯化技术的详细描述和相关方案尤其可见于Marchak等人,StrategiesforProteinPurificationandCharacterization:ALaboratoryCourseManual,ColdSpringHarborPress(1996);EssentialsfromCells:ALaboratoryManual,D.Spector和R.Goldman,编,ColdSpringHarborPress(2003);R.Simpson,ProteinsandProteomics:ALaboratoryManual,ColdSpringHarborPress(2003);和D.Liebler,IntroductiontoProteomics,HumanaPress(2002)。也可以使用可商购的试剂盒,例如但不限于,可购自CALBIOCHEM.RTM.,LaJolla,Calif的ProteoExtract.TM.部分蛋白质组提取试剂盒(PartialProteomeExtractionKits)(P-PEK)和ProteoExtract.TM.完整蛋白质组提取试剂盒(CompleteProteomeExtractionKits)(C-PEK)。技术人员将会理解,供本发明的组合物、方法和试剂盒使用的非核酸分析物可以很容易地获得,而无需使用此类纯化技术和商品化试剂盒进行过多的实验。
本发明的生物分子样品可以是天然的例如未经过操作或处理,或是经处理的,其可包括任何数量的处理,包括暴露于候选药剂(包括药物)、遗传工程(例如,基因的添加或缺失)等。
生物分子样品还可包括环境样品,如含有细菌或其他生物体如硅藻、沟鞭藻类、藻类的样品,尤其例如在某些海基或陆基样品中。
COB的检测
COB/ESB复合物通过本领域中可用的、能够检测给定COB/ESB复合物上的特定序列或信号的任何手段来检测。
在一些实施方案中,可扩增关于UBA、ESB、COB、UBA/ESB复合物、UBA/ESB/COB复合物、COB/ESB复合物和/或其组合的信息。可通过本领域已知的任何方法进行扩增。在一些情况下,通过聚合酶链反应(PCR)扩增关于UBA、ESB、COB、UBA/ESB复合物、UBA/ESB/COB复合物、COB/ESB复合物和/或其组合的信息。可以使用的PCR技术的实例包括但不限于定量PCR、定量荧光PCR(QF-PCR)、多重荧光PCR(MF-PCR)、实时PCR(RT-PCR)、单细胞PCR、限制性片段长度多态性PCR(PCR-RFLP)、PCR-RFLP/RT-PCR-RFLP、热启动PCR、巢式PCR、原位聚合酶群落PCR、原位滚环扩增(RCA)、桥式PCR、picotiterPCR和乳液PCR。其他合适的扩增方法包括连接酶链反应(LCR)、转录扩增、自动维持序列复制、靶多核苷酸序列的选择性扩增、共有序列引物聚合酶链反应(CP-PCR)、任意引物聚合酶链反应(AP-PCR)、简并寡核苷酸引物PCR(DOP-PCR)和基于核酸的序列扩增(NABSA)。本文可使用的其他扩增方法包括美国专利5,242,794、5,494,810、4,988,617和6,582,938中描述的那些方法。
在任何实施方案中,关于UBA、ESB、COB、UBA/ESB复合物、UBA/ESB/COB复合物、COB/ESB复合物和/或其组合的信息的扩增可在珠上进行。在本文的任何实施方案中,可从单细胞获得靶核酸。
在本文的任何实施方案中,在扩增步骤(例如,PCR)之前,可对关于UBA、ESB、COB、UBA/ESB复合物、UBA/ESB/COB复合物、COB/ESB复合物和/或其组合的信息进行预扩增。
在一些实施方案中,对UBA、ESB、COB、UBA/ESB复合物、UBA/ESB/COB复合物、COB/ESB复合物和/或其组合进行量化。核酸量化方法是本领域已知的并且包括但不限于气相色谱法、超临界流体色谱法、液相色谱法(包括分配色谱法、吸附色谱法、离子交换色谱法、大小排阻色谱法、薄层色谱法和亲和色谱法)、电泳(包括毛细管电泳、毛细管区带电泳、毛细管等电聚焦、毛细管电色谱法、胶束电动毛细管色谱法、等速电泳、瞬时等速电泳和毛细管凝胶电泳)、比较基因组杂交(CGH)、微阵列、珠阵列和高通量基因分型,如使用分子倒置探针(MIP)。
UBA、ESB、COB、UBA/ESB复合物、UBA/ESB/COB复合物、COB/ESB复合物和/或其组合的量化可用于确定基因/等位基因拷贝数、基因或外显子水平的表达、甲基化状态分析,或检测新型转录物,以便诊断病症如胎儿异常或癌症。
在一些实施方案中,对UBA、ESB、COB、UBA/ESB复合物、UBA/ESB/COB复合物、COB/ESB复合物和/或其组合进行测序。可通过本领域熟知的经典Sanger测序法来实现测序。测序还可使用高通量系统来实现,其中一些系统允许在测序的核苷酸引入增长中的链时或之后立即对其进行检测,即,实时或基本上实时地检测序列。在一些情况下,高通量测序产生至少1,000、至少5,000、至少10,000、至少20,000、至少30,000、至少40,000、至少50,000、至少100,000或至少500,000次序列读取/小时;其中每次读取为至少50、至少60、至少70、至少80、至少90、至少100、至少120或至少150个碱基/读取。
在一些实施方案中,高通量测序涉及使用可通过Illumina的GenomeAnalyzerIIX、MiSeq个人测序仪或HiSeq系统如使用HiSeq2500、HiSeq1500、HiSeq2000或HiSeq1000机器的那些系统所获得的技术。这些机器使用通过合成化学进行的基于可逆终止子的测序。这些机器可在八天内进行2千亿次DNA读取或更多次读取。较小的系统可用于在3、2、1天或更少时间内的运行。
在一些实施方案中,高通量测序涉及使用可通过ABISolidSystem获得的技术。该遗传分析平台能够实现与珠连接的克隆扩增的DNA片段的大规模并行测序。该测序方法基于与染料标记的寡核苷酸的相继连接。
下一代测序可包括离子半导体测序(例如,使用来自LifeTechnologies(IonTorrent)的技术)。离子半导体测序可利用下列事实:当核苷酸并入DNA链时,可释放离子。为进行离子半导体测序,可形成微机械加工孔的高密度阵列。每个孔可容纳单个DNA模板。孔下方可以是离子敏感层,并且在离子敏感层下方可以是离子传感器。当将核苷酸添加至DNA时,可释放H+,H+可作为pH的变化来测量。H+离子可转化为电压,并由半导体传感器记录。阵列芯片可依次充满一种接一种的核苷酸。可以不需要扫描、光或相机。在一些情况下,使用IONPROTONTM测序仪来对核酸进行测序。在一些情况下,使用IONPGMTM测序仪。IonTorrent个人基因组机器(PersonalGenomeMachine,PGM)。PGM可在两个小时内进行1千万次读取。
在一些实施方案中,高通量测序涉及使用可通过HelicosBioSciencesCorporation(Cambridge,Massachusetts)获得的技术,如单分子合成测序(SMSS)法。SMSS是独一无二的,因为其允许在最多达24小时内对整个人类基因组进行测序。最后,SMSS在公开号为20060024711、20060024678、20060012793、20060012784和20050100932的美国申请中有部分描述。
在一些实施方案中,高通量测序涉及使用可通过454Lifesciences,Inc.(Branford,Connecticut)获得的技术,如PicoTiterPlate装置,该装置包括光纤板,该光纤板传输将由该仪器中的CCD照相机记录的、测序反应产生的化学发光信号。光纤的这种使用允许在4.5小时内检测最少2千万个碱基对。
先采用珠扩增而后进行光纤检测的方法在Marguiles,M.等人,"Genomesequencinginmicrofabricatedhigh-densitypricolitrereactors",Nature,doi:10.1038/nature03959以及公开号为20020012930、20030058629、20030100102、20030148344、20040248161、20050079510、20050124022和20060078909的美国申请中有所描述。
在一些实施方案中,使用克隆单分子序列(ClonalSingleMoleculeArray)(Solexa,Inc.)或利用可逆终止子化学的合成测序(SBS)来进行高通量测序。在美国专利6,969,488、6,897,023、6,833,246、6,787,308和公开号为20040106110、20030064398、20030022207的美国申请和Constans,A.,TheScientist2003,17(13):36中对这些技术进行了部分描述。
下一代测序技术可包括来自PacificBiosciences的实时(SMRTTM)技术。在SMRT中,四种DNA碱基中的每一种可附接至四种不同的荧光染料之一。这些染料可以是磷连接的。单个DNA聚合酶可在零模式波导(ZMW)的底部用模板单链DNA的单个分子进行固定。ZMW可以是限制性结构,其能够实现相对于荧光核苷酸的背景观察DNA聚合酶对单个核苷酸的并入,该荧光核苷酸可在ZMW之中及之外迅速扩散(在数微秒内)。可能需要几毫秒来将核苷酸并入生长链。在该时间内,荧光标记物可被激发,并产生荧光信号,并且荧光标签可被切除。ZMW可从下方被照亮。来自激发光束的衰减光可穿透每个ZMW的下部20-30nm。可创建检测极限为20仄升(10"升)的显微镜。微小的检测体积可提供在背景噪声的降低上1000倍的改善。染料的相应荧光的检测可指示并入了哪种碱基。可重复该过程。
在一些情况下,下一代测序为纳米孔测序{参见,例如,SoniGV和MellerA.(2007)ClinChem53:1996-2001)。纳米孔可以是直径为约1纳米数量级的小孔。将纳米孔浸没在导电流体中并横跨该纳米孔施加电势可因离子传导通过纳米孔而产生轻微的电流。流过的电流的量可能对于纳米孔的尺寸敏感。当DNA分子通过纳米孔时,DNA分子上的每个核苷酸均可能不同程度地阻塞纳米孔。因此,DNA分子通过纳米孔时通过纳米孔的电流的变化可代表DNA序列的读取。纳米孔测序技术可来自OxfordNanoporeTechnologies;例如GridlON系统。单个纳米孔可插入横跨微孔顶部的聚合物膜中。每个微孔可具有用于单独感测的电极。微孔可制作成阵列芯片,其中每个芯片具有100,000个或更多个微孔(例如,多于200,000、300,000、400,000、500,000、600,000、700,000、800,000、900,000或1,000,000个)。可使用仪器(或节点)来分析芯片。可实时分析数据。可在同一时间操作一个或多个仪器。纳米孔可以是蛋白质纳米孔,例如,蛋白α-溶血素、七聚体蛋白质孔。纳米孔可以是制成的固态纳米孔,例如,在合成膜(例如,SiNx或SiO2)中形成的纳米尺寸的孔。纳米孔可以是混合孔(例如,将蛋白质孔整合至固态膜中)。纳米孔可以是具有集成传感器(例如,隧道电极检测器(tunnelingelectrodedetector)、电容式检测器或基于石墨烯的纳米间隙或边缘态检测器(参见,例如,Garaj等人.(2010)Naturevol.67,doi:10.1038/nature09379))的纳米孔。纳米孔可被官能化,以用于分析分子的特定类型(例如,DNA、RNA或蛋白质)。纳米孔测序可包括“链测序”,其中完整的DNA聚合物可通过蛋白质纳米孔,当DNA在孔中易位时进行实时测序。酶可分离双链DNA的链并使链通过纳米孔。DNA可在一个末端具有发夹,并且系统可读取两条链。在一些情况下,纳米孔测序是“外切核酸酶测序”,其中个别核苷酸可通过连续性外切核酸酶从DNA链上切除,并且该核苷酸可通过蛋白质纳米孔。该核苷酸可与孔中的分子(例如,环糊精)瞬时结合。电流的特征性破坏可用于鉴定碱基。
可使用来自GENIA的纳米孔测序技术。可将工程化的蛋白质孔嵌入脂双层膜中。“主动控制(ActiveControl)”技术可用于实现高效的纳米孔-膜组装以及对DNA移动通过通道的控制。在一些情况下,纳米孔测序技术来自NABsys。可将基因组DNA片段化成平均长度为约100kb的链。可将100kb的片段制作成单链并随后与6-mer探针杂交。可驱动具有探针的基因组片段通过纳米孔,这可产生电流-时间示踪。电流示踪可提供每个基因组片段上探针的位置。可将基因组片段排列,以创建基因组的探针图。对于探针的文库,该方法可平行进行。可产生每个探针的基因组长度的探针图。可用称为“移动窗口杂交测序(mwSBH)”的方法来固定错误。在一些情况下,纳米孔测序技术来自IBM/Roche。可使用电子束在微芯片中制作纳米孔尺寸的开口。可使用电场来将DNA拉动或通过纳米孔。纳米孔中的DNA晶体管器件可包括交替的纳米尺寸的金属和电介质层。可通过DNA纳米孔内部的电场来捕获DNA骨架中的离散电荷。关闭和打开门电压可使得DNA序列被读取。
下一代测序可包括DNA纳米球测序(正如,例如由CompleteGenomics所进行的;参见,例如Drmanac等人.(2010)Science327:78-81)。可将DNA进行分离、片段化和尺寸选择。例如,可将DNA片段化(例如,通过超声处理)成约500bp的平均长度。可将衔接子(Adl)附接至片段的末端。该衔接子可用于与锚杂交以用于测序反应。各末端与衔接子结合的DNA可进行PCR扩增。可对衔接子序列进行修饰,使得互补单链末端彼此结合,从而形成环状DNA。可将DNA甲基化以保护它免于被随后的步骤中使用的IIS型限制酶切割。衔接子(例如,右衔接子)可具有限制性识别位点,且该限制性识别位点可保持非甲基化。衔接子中的非甲基化限制性识别位点可被限制酶(例如,Acul)识别,并且该DNA可被Acul在右衔接子右侧13bp处切割,以形成线性双链DNA。第二轮的右和左衔接子(Ad2)可连接至线性DNA的任一末端上,并且结合两个衔接子的所有DNA可进行PCR扩增(例如,通过PCR)。可对Ad2序列进行修饰,以使它们彼此结合并形成环状DNA。可将DNA进行甲基化,但限制酶识别位点可在左Adl衔接子上保持非甲基化。可施用限制酶(例如,Acul),并且DNA可在Adl左侧13bp处切割,以形成线性DNA片段。第三轮的右和左衔接子(Ad3)可连接至线性DNA的右侧和左侧翼,并且所得片段可进行PCR扩增。可对衔接子进行修饰,使得它们可彼此结合并形成环状DNA。可添加III型限制酶(例如,EcoP15);EcoP15可在Ad3左侧26bp和Ad2右侧26bp切割DNA。该切割可去除DNA的大片段,并再次将DNA线性化。第四轮的右和左衔接子(Ad4)可连接至该DNA,该DNA可进行扩增(例如,通过PCR),并被修饰,使得它们彼此结合,并形成完整的环状DNA模板。
滚环复制(例如,使用Phi29DNA聚合酶)可用于扩增DNA的小片段。四个衔接子序列可包含可杂交的回文序列,且单链可折叠到其自身上以形成平均直径约为200-300纳米的DNA纳米球(DNBTM)。DNA纳米球可附接(例如,通过吸附)至微阵列(测序流动池)。流动池可以是涂覆有二氧化硅、钛和六甲基二硅氮烷(hexamehtyldisilazane,HMDS)和光阻材料的硅晶片。测序可通过将荧光探针连接至DNA通过非链式测序来进行。探查位置的荧光的颜色可由高分辨率相机可视化。可确定衔接子序列之间的核苷酸序列的身份。
在一些实施方案中,高通量测序可使用AnyDot.chips(Genovoxx,Germany)进行。特别是,AnyDot-chips允许将核苷酸荧光信号检测增强10-50倍。AnyDot.chips及其使用方法在国际公开申请号WO02/088382、WO03/020968、WO03/031947、WO2005/044836、PCT/EP05/05657、PCT/EP05/05655和德国专利申请DE10149786、DE10214395、DE10356837、DE102004009704、DE102004025696、DE102004025746、DE102004025694、DE102004025695、DE102004025744、DE102004025745和DE102005012301中有部分描述。
其他高通量测序系统包括在Venter,J.等人,Science,2001年2月16日、Adams,M.等人,Science,2000年3月24日和M.J,Levene等人,Science299:682-686,2003年1月以及公开号为20030044781和2006/0078937的美国申请中公开的系统。总体上这样的系统涉及通过经由在核酸分子上测定的聚合反应暂时添加碱基而对具有多个碱基的靶核酸分子进行测序,即实时跟踪待测序的模板核酸分子上核酸聚合酶的活性。而后可通过确定在碱基添加顺序的每一步中哪个碱基正在经由核酸聚合酶的催化活性而并入靶核酸的增长互补链中来推断序列。在适合沿着靶核酸分子移动并在活性位点处延伸寡核苷酸引物的位置上提供靶核酸分子复合物上的聚合酶。在接近活性位点处提供多种标记类型的核苷酸类似物,其中每个可区分类型的核苷酸类似物与靶核酸序列中的不同核苷酸互补。通过使用聚合酶将核苷酸类似物添加到核酸链的活性位点处,来延伸增长的核酸链,其中添加的核苷酸类似物与活性位点处的靶核酸的核苷酸互补。对作为聚合步骤的结果而添加到寡核苷酸引物上的核苷酸类似物进行鉴定。重复进行提供标记的核苷酸类似物、使增长的核酸链聚合和鉴定添加的核苷酸类似物的步骤,以使得核酸链进一步延伸并且确定靶核酸的序列。
在一些实施方案中,对于鉴定来自本文所述的组装体的颗粒起源和靶标所必需的序列长度短于每个核酸链的特定测序仪的读取长度。例如,用于鉴定COB/ESB组合的读取的总长度可短于DNA测序仪的每条DNA链的读取长度。少于100、90、80、70、50、40、30、20或10个核苷酸可能足以鉴定给定组装体的COB和ESB。相比之下,DNA测序仪的潜在序列读取可能为每次读取多于100、20、300、400、500、600、700、800、900、1000、1250、1500、1750、2000个碱基对或更多个碱基对。在此类情况下,较短的COB-ESB组装体或它们的全部或一部分的复制品可彼此附加,例如通过连接和聚合,最高达到DNA测序仪的总序列长度读取。因此,每个序列读取可鉴定多个组装体例如至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、40、50、75、100个组装体或更多个组装体的颗粒起源和靶标。
在一些实施方案中,UBA、ESB、COB、UBA/ESB复合物、UBA/ESB/COB复合物、COB/ESB复合物和/或其组合的序列分析可包括通过连接方案(简并连接)进行的四色测序,其包括将锚引物与四个位置之一杂交。而后进行将引物锚定至用荧光染料标记的简并九聚体群体的酶连接反应。在任何给定的循环中,所使用的九聚体群体的结构为使得其位置之一的身份与连接至该九聚体的荧光团的身份相关。在连接酶鉴别该探查的位置的互补性的情况下,荧光信号允许碱基身份的推断。进行连接和四色成像之后,剥离锚引物:九聚体复合物,并开始新的循环。进行连接后对序列信息进行成像的方法是本领域已知的。
可通过检测和/或量化感兴趣的组装检测复合物的存在的任何方法来检测和/或量化一个或多个UBA、ESB、COB、UBA/ESB复合物、UBA/ESB/COB复合物、COB/ESB复合物和/或其组合复合物。此类方法可包括放射免疫测定(RIA)或酶联免疫吸附测定(ELISA)、免疫组织化学、利用或不利用共聚焦显微镜检查的免疫荧光组织化学、拉曼光谱法、X射线放射自显影、X射线放射显影、发光光谱法、反相测定、均相酶免疫测定和相关的非酶技术、Western印迹法、全细胞染色、免疫电子显微镜术、核酸扩增、基因阵列、蛋白质阵列、质谱法、膜片钳、二维凝胶电泳、差示凝胶电泳、基于微球的多重蛋白质测定、无标记的细胞测定和流式细胞术等。美国专利4,568,649描述了采用闪烁计数的配体检测系统。这些技术对于修饰的蛋白质参数是尤其有用的。可使用荧光或其他标记的报道分子来获得蛋白质和其他细胞决定簇的细胞读出值。显微镜方法对于测定形态学方面的参数是有用的。流式细胞术方法对于测定细胞内参数是有用的。
当在本发明的方法和组合物中使用荧光标记的组分时,公认不同类型的荧光监测系统(例如,细胞计数(Cytometric)测量装置系统)可用于实施本发明。在一些实施方案中,使用流式细胞计数系统或专用于高通量筛选的系统,例如96孔或更大的微量滴定板,例如Lakowicz,J.R.,PrinciplesofFluorescenceSpectroscopy,NewYork:PlenumPress(1983);Herman,B.,Resonanceenergytransfermicroscopy,in:FluorescenceMicroscopyofLivingCellsinCulture,PartB,MethodsinCellBiology,vol.30,编Taylor,D.L.&Wang,Y.-L.,SanDiego:AcademicPress(1989),pp.219-243;Turro,N.J.,ModernMolecularPhotochemistry,MenloPark:Benjamin/CummingsPublishingCol,Inc.(1978),pp.296-361。当COB/ESB复合物是荧光标记的时,可对适当激发源的合适的考虑因素进行研究。可能的激发源可包括但不限于弧光灯、氙灯、激光、发光二级管或其一些组合。适当的激发源与适当的光学检测系统(例如倒置荧光显微镜、表面荧光显微镜或共聚焦显微镜)结合使用。优选地,使用可允许以足够的空间分辨率进行检测的显微镜来确定COB/ESB复合物上斑点的顺序。如果例如,COB/ESB复合物用三种不同的颜色Alexa488、Cy3和Alexa647(分别标记为1、2和3)标记。颜色1、2和3各自在不同的通道中获得,并且将可看作成排斑点的第一和第二寄存器(register)向上移动几个像素以便能够单独地显示每个寄存器。用于检测可在本发明的方法中使用的多种颜色的方法的实例在美国专利号7,473,767、美国专利公开号2007/0166708、美国申请号11/645,270和PCT申请号US06/049274中有所描述,其通过引用整体并入本文。
可使用荧光计测量样品中的荧光。还可使用检测荧光的其他方法,例如,量子点方法(参见,例如,Goldman等人,J.Am.Chem.Soc.(2002)124:6378-82;Pathak等人,J.Am.Chem.Soc.(2001)123:4103-4;和Remade等人,Proc.Natl.Sci.USA(2000)18:553-8,各自通过引用明确地引入本文)以及共聚焦显微镜检查。
在一些实施方案中,FACS细胞分选仪(例如,FACSVantageTM,LSRII或CantoCellSorter,BectonDickinsonImmunocytometrySystems,SanJose,Calif.)用于根据存在或不存在COB/ESB复合物来分选和收集细胞。通过赋予含有阳性细胞的小滴电磁电荷,可将该细胞与其他细胞分离。而后可在无菌收集容器中收获阳性选择的细胞。这些细胞分选程序在例如FACSVantageTM.培训手册中有详细描述,具体参见第3-11至3-28以及10-1至10-17节,关于上述仪器的内容,其通过引用整体并入本文。
在另一实施方案中,可基于COB/ESB复合物的存在与否采用细胞的磁分离来分选阳性细胞。在这类分离技术中,将要进行阳性选择的细胞首先与包含可回收颗粒(例如,磁响应性颗粒)的COB/ESB复合物接触。而后可例如利用磁场将该细胞与非阳性或未标记的细胞进行物理分离。当使用磁响应性颗粒时,可利用磁场将阳性细胞或标记的细胞保留在容器中,同时去除阴性细胞。这些以及相似的分离程序在例如BaxterImmunotherapyIsolex培训手册中有所描述,其整体并入本文。
在一些实施方案中,将一种或多种细胞包含在96孔板或其他可商购的多孔板的孔中。在备选的实施方案中,反应混合物或细胞在细胞计数测量装置中。可用于本发明的其他多孔板包括但不限于384孔板和1536孔板。用于容纳反应混合物或细胞并可用于本发明的其他容器对于技术人员将是显而易见的。
在一些实施方案中,使用电感耦合等离子体质谱仪(ICP-MS)测量COB/ESB复合物的丰度。已用特定元件标记的UBA与COB/ESB复合物结合。当将细胞引入ICP中时,其被雾化和电离。测定包括COB/ESB复合物在内的细胞的元件组分。与COB/ESB复合物上的标记物相对应的信号的存在和强度指示该细胞上COB/ESB复合物的丰度(Tanner等人,SpectrochimicaActaPartB:AtomicSpectroscopy,(2007),62(3):188-195.)。
在一些实施方案中,“流式细胞仪”是一种微流体装置,其中在设计为引导细胞在几组平行的多通道中通过检测装置的通道中进行细胞测量或细胞内含物的一些测量。参见美国专利7,378,280、7,294,503、7,294,298和6,830,936。
在一些实施方案中,细胞或其内含物的某些部分经超声包裹在液体的单独小滴内,并利用设计为测定每个单独小滴的特征和这些小滴内的材料的检测系统进行探查。
灵活的硬件和软件使仪器适应于多种应用。软件程序模块允许方法的构建、修改和运行。系统诊断模块允许仪器校准、正确连接和马达运行。定制工具、实验室器具和液体、颗粒、细胞和生物体传输模式允许进行不同应用。数据库允许方法和参数的储存。机扑(robotic)接口和计算机接口允许仪器之间的通信。
在一些实施方案中,本发明的方法包括液体处理组件的使用。液体处理系统可包括包含任意数量的组件的机扑系统。此外,本文概述的任何或所有步骤可以是自动化的;因此,例如,该系统可以是完全或部分自动化的。
本领域技术人员将会理解,存在众多可以使用的组件,包括但不限于一个或多个机扑臂;用于微孔板定位的平板处理器(handler);取下或更换非交叉污染板上的孔盖的自动化盖或帽处理器;用于利用一次性吸头进行样品分布的吸头组装件;用于样品分布的可洗吸头组装件;96孔加载块;冷却试剂架;微量滴定板移液管位置(任选地冷却的);平板和吸头的堆积塔;以及计算机系统。
完全机扑或微流体系统包括自动化的液体、颗粒、细胞和生物体处理,包括高通量移液以进行筛选应用的所有步骤。这包括液体、颗粒、细胞和生物体操作,如抽吸、分配、混合、稀释、洗涤、精确体积转移;回收和丢弃移液吸头;以及重复吸移相同体积以从单次样品抽吸中进行多次递送。这些操作是无交叉污染的液体、颗粒、细胞和生物体转移。该仪器进行微孔板样品通向过滤器、膜和/或子板、高密度转移器、全板系列稀释和高容量操作的自动化重复。
在一些实施方案中,使用化学衍生的颗粒、板、盒、管、磁性颗粒或对测定组分具有特异性的其他固相基质。微孔板、管或任何固相基质的结合表面包括非极性表面、高极性表面、促进共价结合的经修饰的葡聚糖涂层、抗体涂层、结合融合蛋白或肽的亲和介质、表面固定的蛋白质如重组蛋白A或G、核苷酸树脂或涂层,并且其他亲和基质在本发明中也是有用的。
在一些实施方案中,将用于多孔板、多通管、支持器、盒、微型管、超声悬浮和包裹、深孔板、微量离心管、冷冻管、方孔板、过滤器、芯片、微通道芯片、微流体芯片、光纤、珠和其他固相基质的平台或具有多种体积的平台安装在可升级的模块平台上以提供额外的容量。该模块平台包括变速轨道振荡器,和用于源样品、样品和试剂稀释的多位置工作台、测定板、样品和试剂储存器、移液吸头和活性洗涤站。在一些实施方案中,本发明的方法包括使用读板器。
在一些实施方案中,热循环仪和温度调节系统用于稳定热交换器的温度,如提供孵育样品从0℃至100℃的精确温度控制的控制组块或平台。
在一些实施方案中,可与单个或多个磁探头、亲和探头或移液管互换的移液管头(单通道或多通道)机扑地操作液体、颗粒、细胞和生物体。多孔或多管磁力分离器或平台以单样品或多样品形式操作液体、颗粒、细胞和生物体。
在一些实施方案中,仪器将包括检测器,该检测器根据标记物和试验可以是多种不同的检测器。在一些实施方案中,有用的检测器包括具有多荧光通道的显微镜;读板器,以提供具有单和双波长端点和动力学能力、荧光共振能量转移(FRET)、发光、猝灭、双光子激发和强度再分配的荧光、紫外线和可见光分光光度检测;捕获数据和图像并将其转换为可定量格式的CCD相机;以及计算机工作站。
在一些实施方案中,机扑装置包括与存储器和一组输入/输出设备(例如,键盘、鼠标、监视器、打印机等)通过总线进行通信的中央处理器。此外,如下所述,这可补充或替代用于本发明多路复用装置的CPU。中央处理器、存储器、输入/输出设备与总线之间的一般交互是本领域已知的。因此,根据将要运行的实验,将多种不同的流程存储在CPU存储器中。
这些机扑流体处理系统可利用任何数量的不同试剂,包括缓冲液、试剂、样品、洗涤液、测定组分如标记物探针等。
靶分子检测的应用
本发明的组合物和方法可用于诊断、预后、治疗、患者分层、药物开发、治疗选择和筛选目的。本发明提供了采用本发明的方法可从单一生物分子样品同时分析许多不同靶分子的优点。这允许例如对一个样品进行数种诊断试验。在单个样品中分析的不同靶分子的丰度可跨越至少10、100、1000、10000、100000、1000000、10000000、100000000、1000000000倍或更多倍的范围。
本发明的组合物和方法可用于蛋白质组学。本文所述的方法通常将提供对于该应用非常理想的快速应答。本文所述的方法和组合物可在寻找可用于诊断和预后以及用作健康和疾病指标的生物标志物的过程中使用。本文所述的方法和组合物可用于筛选药物,例如,药物开发、治疗选择、治疗效果的确定和/或鉴定用于药物开发的靶标。在涉及药物的筛选试验中检测蛋白质表达的能力是非常重要的,因为蛋白质是体内的最终基因产物。在一些实施方案中,本文所述的方法和组合物将同时测定蛋白质和基因两者的表达,这将提供最多的关于正在进行的特定筛选的信息。
本发明的组合物和方法可用于基因表达分析。本文所述的方法区分核苷酸序列。靶核苷酸序列之间的差异可以是例如单核酸碱基差异、核酸缺失、核酸插入或重排。还可以检测这类涉及一个以上碱基的序列差异。在一些实施方案中,UBA,例如,寡核苷酸探针,具有基本相同的长度,使得它们在基本相似的杂交条件下与靶核苷酸序列杂交。因此,本发明的方法能够检测传染病、遗传病和癌症。其在环境监测、法医学以及食品科学中也是有用的。可在核酸上进行的遗传分析的实例包括例如SNP检测、STR检测、RNA表达分析、启动子甲基化、基因表达、病毒检测、病毒亚型分型和抗药性。
本方法可用于分析获自或来源于患者的生物分子样品,以便确定样品中是否存在患病细胞类型,疾病的阶段,患者的预后,患者响应于特定治疗的能力,或对患者的最佳治疗。本方法还可用于鉴定特定疾病的生物标志物。
在一些实施方案中,本文所述的方法用于病症的诊断。如本文所用的术语病症的“诊断”包括预测或诊断病症、确定病症易感性、监测病症的治疗、诊断疾病的治疗反应以及病症的预后、病症进展和对病症特定治疗的响应。例如,可根据本文所述的任何方法来测定血液样品,以确定样品中疾病标志物或恶性细胞类型的存在和/或量,从而对疾病或癌症进行诊断或分期。
在一些实施方案中,本文所述的方法和组合物用于病症的诊断和预后。
许多免疫性、增生性和恶性疾病和病症特别适合于本文所述的方法。免疫性疾病和病症包括变应性疾病和病症、免疫功能紊乱和自身免疫疾病和病况。变应性疾病和病症包括但不限于变应性鼻炎、变应性结膜炎、变应性哮喘、特应性湿疹、特应性皮炎和食物变态反应。免疫缺陷包括但不限于重症联合免疫缺陷(SCID)、嗜酸细胞增多综合征、慢性肉芽肿病、I型和II型白细胞粘附缺陷、高IgE综合征、ChediakHigashi、中性白细胞增多症、中性白细胞减少症、发育不全、丙种球蛋白缺乏血症、高IgM综合征、迪乔治/腭-心-面综合征以及干扰素γ-TH1途径缺陷。自身免疫和免疫调节异常疾病包括但不限于类风湿性关节炎、糖尿病、系统性红斑狼疮、格雷夫斯病、格雷夫斯眼病、克罗恩病、多发性硬化症、银屑病、系统性硬化症、甲状腺肿和淋巴瘤性甲状腺肿(桥本甲状腺炎、淋巴细胞性甲状腺肿)、斑秃、自身免疫性心肌炎、硬化萎缩苔藓、自身免疫性葡萄膜炎、艾迪生病、萎缩性胃炎、重症肌无力、特发性血小板减少性紫癜、溶血性贫血、原发性胆汁性肝硬化、韦格纳肉芽肿病、结节性多动脉炎和炎性肠病、同种异体移植物排斥和对传染性微生物或环境抗原的变态反应引起的组织破坏。
可通过本发明的方法进行评估的增生性疾病和病症包括但不限于新生儿血管瘤病;继发性进行性多发性硬化;慢性进行性骨髓退行性疾病;多发性神经纤维瘤病;节细胞性神经瘤病;瘢痕疙瘩形成;骨佩吉特病;纤维性囊肿病(例如,乳房或子宫纤维性囊肿病);结节病;Peronies和Duputren纤维化、硬化、动脉粥样硬化和血管再狭窄。
可通过本发明的方法进行评估的恶性疾病和病症包括恶性血液病和实体瘤。
当样品是血液样品时,恶性血液病尤其适合于本发明的方法,因为这类恶性病涉及到血液承载的细胞的变化。这类恶性病包括非霍奇金淋巴瘤、霍奇金淋巴瘤、非B细胞淋巴瘤和其他淋巴瘤、急性或慢性白血病、红细胞增多症、血小板增多症、多发性骨髓瘤、骨髓增生异常疾病、骨髓增生性疾病、骨髓纤维化、非典型免疫淋巴增生和浆细胞疾病。
可通过本发明的方法进行评估的浆细胞疾病包括多发性骨髓瘤、淀粉样变性和瓦尔登斯特伦巨球蛋白血症。
实体瘤的实例包括但不限于结肠癌、乳腺癌、肺癌、前列腺癌、脑瘤、中枢神经系统肿瘤、膀胱肿瘤、黑素瘤、肝癌、骨肉瘤和其他骨癌、睾丸癌和卵巢癌、头颈肿瘤和宫颈肿瘤。
遗传疾病也可通过本发明的方法进行检测。这可通过针对染色体和基因畸变或针对遗传疾病的产前和产后筛查来进行。可检测的遗传疾病的实例包括:21-羟化酶缺乏症、囊性纤维化、脆性X综合征、特纳综合征、迪谢纳肌营养不良、唐氏综合症或其他三体性、心脏病、单基因病、HLA分型、苯丙酮尿症、镰状细胞性贫血、泰-萨克斯病(Tay-SachsDisease)、地中海贫血、克莱恩费尔特综合征、亨廷顿病、自身免疫性疾病、脂沉积症、肥胖缺陷、血友病、先天性代谢缺陷和糖尿病。
本文所述的方法可用于通过分别确定样品中细菌或病毒的标志物的存在和/或量来诊断病原体感染,例如,细胞内细菌和病毒的感染。
许多传染病可通过本发明的方法来检测。通常,这些是由细菌、病毒、寄生虫和真菌传染原引起的。还可利用本发明来确定各种传染原对药物的抗性。
可通过本发明检测的细菌传染原包括大肠杆菌、沙门氏菌属、志贺氏菌属、克雷伯氏菌属(KlESBiella)、假单胞菌属、单核细胞增生利斯特氏菌、结核分支杆菌、鸟型细胞内分枝杆菌(Mycobacteriumaviumintracellulare)、耶尔森氏菌属、弗朗西斯氏菌属、巴斯德氏菌属、布鲁氏菌属、梭菌属、百日咳博代氏菌、拟杆菌属、金黄色葡萄球菌、肺炎链球菌、B-溶血性链球菌、棒杆菌属、军团菌属、支原体属、脲原体属、衣原体属、淋病奈瑟氏球菌、脑膜炎奈瑟氏球菌、流感嗜血杆菌、粪肠球菌、普通变形菌、奇异变形菌、幽门螺杆菌、彻白密螺旋体、伯氏疏螺旋体、回归热疏螺旋体、立克次体病原体、诺卡氏菌属和放线菌属(Acitnomycetes)。
可通过本发明检测的真菌传染原包括新型隐球菌、皮炎芽生菌、荚膜组织胞浆菌、粗球孢子菌、巴西副球孢子菌、白色念珠菌、烟曲霉(Aspergillusfumigautus)、藻菌目(根霉属)、申克孢子丝菌、着色真菌病和马杜拉分支菌病。
可通过本发明检测的病毒传染原包括人免疫缺陷病毒、人T细胞淋巴细胞病毒(humanT-celllymphocytotrophicvirus)、肝炎病毒(例如,乙型肝炎病毒和丙型肝炎病毒)、EB病毒、巨细胞病毒、人乳头瘤病毒、正黏病毒、副黏病毒、腺病毒、冠状病毒、弹状病毒、脊髓灰质炎病毒、披膜病毒、布尼病毒(bunyaviruses)、嵌沙样病毒(arenaviruses)、风疹病毒和呼肠病毒。
可通过本发明检测的寄生虫传染原包括恶性疟原虫、三日疟原虫、间日疟原虫、卵形疟原虫、盘尾丝虫(Onchovervavolvulus)、利什曼原虫属、锥体虫属的种、血吸虫属的种、溶组织内阿米巴、隐孢子虫属、贾第虫属的种、滴虫属的种、结肠小袋纤毛虫(Balatidiumcoli)、班氏吴策线虫属、弓形虫属的种、蠕形住肠蛲虫、人蛔虫、鞭形鞭虫、麦地那龙线虫(Dracunculusmedinesis)、吸虫类、阔节裂头绦虫、绦虫属的种、卡氏肺囊虫和美洲板口线虫(Necatoramericanis)。
本发明还可用于检测传染原的抗药性。例如,抗万古霉素粪肠球菌、抗甲氧西林金黄色葡萄球菌、抗青霉素肺炎链球菌、多重耐药性结核分枝杆菌和抗AZT人类免疫缺陷病毒都可利用本发明进行鉴定。
因此,使用本发明的组合物和方法检测的靶分子可以是患者标志物(如癌症标志物)或由外来物引起的感染的标志物如细菌或病毒标志物。
由于UBA/ESB/COB的定量性质,本发明的组合物和方法可用于量化其丰度指示生物学状态或疾病状况的靶分子,例如,由于疾病状态而被上调或下调的血液标志物。
在一些实施方案中,本发明的方法和组合物可用于细胞因子检测。本文所述方法的低灵敏度将有助于例如作为病症生物标志物的细胞因子的早期检测,诸如癌症等疾病的诊断或预后,以及亚临床状况的鉴定。
试剂盒
本发明还提供了包含本发明的一种或多种组分的试剂盒。试剂盒可包含,例如,一个或多个UBA、一个或多个ESB和/或一个或多个APS。试剂盒可用于对本领域技术人员显而易见的任何目的,包括以上所述的目的。
在某些实施方案中,本发明还提供了可用于延伸和选择性固定COB、UBA、ESB和/或其组合的试剂盒。该试剂盒可包含固定用基底和一种或多种结合配偶体以促进COB、UBA、ESB和/或其组合的延伸和固定。在某些实施方案中,结合配偶体可包含可用于以适当的力延伸COB、UBA、ESB和/或其组合的部分。在某些实施方案中,结合配偶体可促进COB、UBA、ESB和/或其组合向表面上的固定或选择性固定。在进一步的实施方案中,试剂盒可包含能够延伸COB、UBA、ESB和/或其组合的装置。
试剂盒可包含如本文所述的COB、APS、UBA、ESB和/或其组合的群体。一个或多个对靶标具有特异性的UBA、ESB和/或COB的一部分可缺乏标记物,或对靶分子的代表性检测受到阻碍。
试剂盒可包含用一种或多种用于标记APS的组分预标记的APS或未标记的APS。此外,在试剂盒中提供的ESB和/或APS可具有或可不具有预连接的UBA。在一个实施方案中,在试剂盒中提供不与ESB和/或APS连接的UBA。
试剂盒可包含其他试剂如连接体寡聚体和桥接寡聚体。在一些实施方案中,试剂盒可将UBA分至不同的预混合物中。
试剂盒还可包括其他试剂,例如,用于进行杂交反应的缓冲液、连接体、限制性核酸内切酶和DNA连接酶I。
试剂盒还将包括使用该试剂盒的组分和/或制备和/或使用APS、COB、UBA和/或ESB的说明书。