【附图说明】
图1显示本发明的组合物和方法的一实施方式。
图2显示本发明的组合物和方法的一实施方式。
图3显示本发明的组合物和方法的一实施方式。
图4显示本发明的组合物和方法的一实施方式。
图5显示本发明的组合物和方法的一实施方式。
图6显示本发明的组合物和方法的一实施方式。
图7显示本发明的组合物和方法的一实施方式。
图8显示本发明的组合物和方法的一实施方式。
图9显示本发明的组合物和方法的一实施方式。
图10显示本发明的组合物和方法的一实施方式。
图11显示本发明的组合物和方法的一实施方式。
图12显示本发明的组合物和方法的一实施方式。
图13显示本发明的组合物和方法的一实施方式。
图14显示本发明的组合物和方法的一实施方式。
图15显示本发明的组合物和方法的一实施方式。
图16显示本发明的组合物和方法的一实施方式。
图17A,17B和17C显示可用于构建检测许多不同SNP的探针和引物的例示核苷酸序列。
图18显示设计为模拟本发明的连接的探针的例示线性寡核苷酸。
图19提供显示通过实施本发明的方法形成的产物的环化,再线性化和扩增的数据。
图20A和20B提供显示本发明的例示连接的探针和二级靶序列的PCR扩增和检测的数据。
图21A和21B提供显示本发明的例示连接的探针和二级靶序列的PCR扩增和检测的数据。
图22提供显示本发明的例示连接的探针和二级靶序列的PCR扩增和检测的数据。
【发明详述】
本发明提供在一级靶序列中检测(或,在一些情况中,发现)单核苷酸多态性(SNP)的组合物和方法。在例示实施方式中,未扩增一级靶序列。与此相比,方法利用不同于一级靶序列的二级靶序列的扩增,以便为特定SNP的存在基因分型一级靶序列。因此,本发明提供,在例示实施方式中,无一级靶本身扩增地在一级靶中检测核酸变异,通常通过对齐扩增引物,以防止一级靶扩增。二级靶序列通常是“地址序列”,其鉴定在SNP检测位置的核苷酸;即,不同二级靶序列用于在SNP检测位置的各核苷酸。
本发明的方法可以各种方式实施。如本文总的所述,在SNP位置的碱基被称为“检测位置”,与检测位置杂交的连接探针的碱基被称为在“询问位置”的“询问碱基”。一方面,使用各包含对应于SNP的不同等位基因的不同地址序列和询问核苷酸的多个不同第1连接探针,由此允许医师区别一级靶序列中在检测核苷酸的可能的基因变异。不同第1连接探针沿着第2连接探针允许在相同的反应容器中与一级靶序列杂交(邻近或有间隔,还如下文描述)。含有与在检测核苷酸的SNP完美互补的询问核苷酸的仅第1连接探针会与第2连接探针连接。将连接的探针环化及切割,产生包含用于进一步扩增和检测的地址序列的二级靶序列。二级靶序列侧翼有用于聚合酶链反应(PCR)的引物序列,由此导致仅二级靶序列扩增以形成扩增子。
在一些实施方式中,第1和第2连接探针实际上是单探针,常被称为“前环”或“开环”探针的不同端。因此,不必需在连接之后的另外的环化步骤,但在实施任何扩增步骤之前,通常例如,通过使用外切核酸酶降解来移出任何未连接的探针。
一方面,用另外的步骤实施以上方法,其中第1和第2连接探针沿着靶序列与它们之间的一个或更多核苷酸杂交,例如连接探针当杂交时在它们之间形成“间隔”。在此实施方式中,连接探针之一在连接之前使用聚合酶延长一个或更多dNTP。此导致添加的特异性,由于聚合酶通常不会将碱基添加到错配的末端;即,如果询问碱基不是正确的,聚合酶会不延伸间隔,且连接酶会不能将2个探针(或开环探针的端)连接在一起。由此需要,在连接之前聚合酶成功地延伸连接探针可导致SNP的等位基因的更精确的检测。
一方面,在一级靶序列中检测SNP包括使用不包含对应于任何特定SNP的询问核苷酸,且与具有单核苷酸间隔的检测(SNP)位置的任意侧上的互补靶序列杂交的连接探针。在本文中,第1和第2连接探针允许在至少2个不同反应容器中与一级靶序列杂交,向各容器中添加不同dNTP。在添加的dNTP与在检测核苷酸的SNP完美互补的容器中,连接探针之一会延长聚合酶。然后将连接探针连接,环化及切割,产生包含用于进一步扩增和检测的地址序列的二级靶序列。如本文所述,此也可用开环探针进行,其中开环探针的末端之间的“间隔”是检测位置。
一方面,检测一级靶序列中的SNP包含使用(i)第1连接探针,其包含(a)地址盒,其依次包含第1引发结构域,地址序列和第2引发结构域,及(b)第1靶特定序列,其互补于靶序列的第1靶结构域(有时在本文被称为“第1杂交结构域”)及在询问位置含有询问碱基,及(ii)第2连接探针,其包含(a)第2靶特定序列,其互补于靶序列的第2靶结构域(有时在本文被称为“第2杂交结构域”)及(b)结合标记物,其是结合对的部分。如下文进一步描述,重要的是地址及询问位置在一个探针上,而结合标记物在另一探针上,使得仅如果询问位置匹配检测位置,则会发生连接及结合标记物与地址关联。
一方面,以上方法用另外的步骤实施,其中在连接之前连接探针使用聚合酶延长一个或更多dNTP。添加的特异性需要,在连接会导致SNP的更精确的检测之前,聚合酶成功地延伸连接探针。
二级靶序列可通过使用本文公开的本领域知道的各种方法或还,包括但不限于测序及以下描述的传统阵列检测方法扩增及检测。
本文所述的SNP检测方法广泛用于各种应用,其中测定核酸靶中各种核苷酸的同一性。但是,这些方法在一级靶序列扩增不是期望的情景中尤其有用。一种应用是自怀孕的女性的血样品中细胞的分选。使用本文公开的方法,可为了胚胎诊断测试的通用的目的检测在母源血中以非常低数正常存在的胚胎DNA和胚胎细胞。一般而言,对知道是母源的DNA样品中的许多基因进行基因分型以鉴定母亲是纯合的一组基因中的一组SNP。此组然后在自无细胞的核酸或自母源血样品获得的细胞的核酸中基因分型,直到组中的至少一种鉴定为杂合。带有对于在母亲中正常纯合的基因发现的杂合基因型的DNA的细胞,或无细胞的核酸可由此鉴定为胚胎源,由于杂合性必需遗传自父亲,例如在来源上是父源的。如总地描述于国际公开WO2010/075459,在此通过引用以其整体合并,在母源血流中鉴定胚胎细胞允许最低限度侵袭性胚胎诊断测试。一般而言,本发明的方法通过选择母亲是纯合的SNP而用于鉴定非-母源等位基因,例如父源等位基因;由此,“其他”等位基因的呈现鉴定含有父源DNA的细胞,由此是胚胎细胞。
自一群胚胎细胞的DNA可然后合并用于广泛的进一步分析。在一应用中,将合并的DNA扩增,标记及在比较性基因组杂交测定中分析。此测试可用于检测染色体拷贝数变异,例如,三体性或其他遗传疾病。类似地,可克隆可现在鉴定为胚胎的细胞,且可进行任意数的遗传测试,包括全基因组测序,另外的SNP分析,等。一般而言,可将获得胚胎遗传信息的任何测定应用于通过本方法收集的DNA。
【靶序列】
在本文提供的是测定一级靶序列中的一个或更多核苷酸的同一性的组合物和方法。“一级靶序列”或“一级靶核酸”指称包含待测定同一性的一个或更多核苷酸的寡核苷酸。在一些实例中,测定一个或更多核苷酸的存在或缺失。一级靶序列可直接检测或,在特定实施方式中,可利用二级靶序列,三级靶序列等间接检测。这些“更高-顺序”或“衍生物”靶序列不同于一级靶序列,但然而可检测为检测一级靶序列的手段。在一些实施方式中,衍生靶序列是反应产物,诸如来自PCR反应的延伸的探针,PCR扩增产物(“扩增子”)等。
靶序列可取许多形式。例如,其可含有在更大核酸序列之内,即尤其是基因或mRNA的全部或部分,质粒或基因组DNA的限制片段。由此,靶序列可为部分基因,调控序列,基因组DNA,cDNA,RNA包括mRNA和rRNA,或其他,包括其任何补体。当说到“靶序列”时,应明白等同涵盖靶序列的补体。因此,在一些实施方式中,检测靶序列指称检测靶序列的补体。在例示实施方式中,靶序列(例如一级靶序列)指称,例如,自哺乳动物,特别自人的基因组DNA。
一级靶序列得自样品。在胚胎诊断学的情况中,优选非-侵袭性地获得的样品,诸如母源血样品。血样品可为全血,血细胞(优选白细胞),血清或血浆。当期望完全母源样品(例如为原纯合性测试)时,可使用其他样品,诸如颊拭子,唾液,尿,等。在一些实施方式中,在本发明的方法中使用的样品包含母源和胚胎物质(即,无细胞的核酸和/或细胞)的混合物。在其他实施方式中,在本发明的方法中使用的样品就胚胎或母源物质(即,无细胞的核酸和/或细胞)基本上纯化。
如以下更完全地描述,制造与靶序列杂交的探针,以测定样品中靶序列(例如,一种等位基因对比另一)的存在或缺失。靶序列可包含一个或更多靶结构域,其为靶序列的更小亚序列。靶结构域通常作为用于构建与靶结构域杂交的互补序列的模板。例如,如下所述,靶序列的第1靶结构域可与第1连接探针的第1杂交结构域杂交,靶序列的第2靶结构域可与第2连接探针的第2杂交结构域杂交。顺序的术语诸如“第1”和“第2”未旨在赋予关于靶序列的5’和3’端的结构域的取向。例如,第1靶结构域可位于第2结构域的5’或第2结构域的3’。
靶结构域可为相邻(即连续的)或分离的。在特定实施方式中,一级靶序列包含第1和第2靶结构域。在靶结构域是相邻的情况中,一个或其他靶结构域含有检测(SNP)位置。一般而言,检测位置位于靶结构域的“末端”(例如.5’或3’末端)(在本文被称为“0位置”),尽管在一些实施方式中,检测位置位于结构域的1,2,3,4,5或6个核苷酸的末端之内。重要的是检测位置足够接近连接接头,以允许错配和完美匹配之间的区别;即,连接酶通常会不连接含有在0~6个碱基的连接接头之内的错配,在连接接头(例如第0位)的碱基提供对连接酶活性的最高特异性。
在替代性的实施方式中,靶结构域被一个或更多核苷酸分隔,当它们与靶杂交时,例如连接探针之间有“间隔”。在此实施方式中,检测位置仍在探针末端之一的0~6个核苷酸的之内,但在2个探针之间有另外的核苷酸。或者,“间隔”是检测位置,如本文所述。由此,在一些实施方式中,第1靶结构域和第2靶结构域仅由检测核苷酸分隔。
靶序列的检测核苷酸是待查明存在或同一性的核苷酸。检测核苷酸通常是基因的多个多态性之一。在例示实施方式中,检测一个检测核苷酸的同一性。在一些实施方式中,检测由一个或更多核苷酸连续的或分离的多个检测核苷酸的同一性。可通过使用在本文的方法和组合物检测任意数的多态性或任意数的核酸序列的SNP。
检测核苷酸可利用“读数”或“询问核苷酸”鉴定。询问核苷酸是定位以与检测核苷酸形成互补碱基对的寡核苷酸,诸如探针的部分。探针在许多实例中含有与接近检测核苷酸的靶序列杂交的部分。在一些实施方式中,询问核苷酸与检测核苷酸形成互补碱基对,及在一些实施方式中,询问核苷酸不与检测核苷酸形成互补碱基对。连接探针,如第1连接探针,可包含询问核苷酸,及在一些情况中可延伸而包含询问核苷酸。
术语“核酸”,“寡核苷酸”或“多核苷酸”在本文是指共价连接在一起的至少2个核苷酸。本发明的核酸会通常含有一个或更多磷酸二酯键,尽管在一些情况中,如下所述(例如在引物和探针诸如标记物探针的构建中),包括可具有替代主链的核酸类似物,包含,例如,磷酰胺(Beaucage等人,Tetrahedron49(10):1925(1993)和该文的参考文献;Letsinger,J.Org.Chem.35:3800(1970);Sprinzl et al.,Eur.J.Biochem.81:579(1977);Letsinger et al.,Nucl.Acids Res.14:3487(1986);Sawai et al,Chem.Lett.805(1984),Letsinger et al.,J.Am.Chem.Soc.110:4470(1988);和Pauwels et al.,Chemica Scripta26:1419(1986)),硫代磷酸酯(Mag et al.,Nucleic Acids Res.19:1437(1991);及美国专利No.5,644,048),二硫代磷酸酯(Briu et al.,J.Am.Chem.Soc.111:2321(1989)),O-甲基亚磷酰胺连接(见Eckstein,Oligonucleotides and Analogues:A Practical Approach,OxfordUniversity Press),及肽核酸(也在本文被称为“PNA”)主链和连接(见Egholm,J.Am.Chem.Soc.114:1895(1992);Meier et al.,Chem.Int.Ed.Engl.31:1008(1992);Nielsen,Nature,365:566(1993);Carlsson et al.,Nature380:207(1996))。其他类似物核酸包括具有双环结构的那些,包括锁核酸(也在本文被称为“LNA”,Koshkin et al.,J.Am.Chem.Soc.120:132523(1998));正主链(Denpcy et al.,Proc.Natl.Acad.Sci.USA92:6097(1995));非-离子主链(美国专利.No.5,386,023,5,637,684,5,602,240,5,216,141和4,469,863;Kiedrowshi etal.,Angew.Chem.Intl.Ed.English30:423(1991);Letsinger et al.,J.Am.Chem.Soc.110:4470(1988);Letsinger et al.,Nucleoside&Nucleotide13:1597(1994);Chapters2and3,ASC Symposium Series580,"Carbohydrate Modifications in Antisense Research",Ed.Y.S.Sanghui and P.Dan Cook;Mesmaeker et al.,Bioorganic&MedicinalChem.Lett.4:395(1994);Jeffs et al.,J.Biomolecular NMR34:17(1994);Tetrahedron Lett.37:743(1996))和非-核糖主链,包括描述于美国专利No.5,235,033和5,034,506,及Chapters6and7,ASCSymposium Series580,“Carbohydrate Modifications in AntisenseResearch”,Ed.Y.S.Sanghui and P.Dan Cook的那些。含有一个或更多碳环糖的核酸也包括在核酸的定义之内(见Jenkins等人,Chem.Soc.Rev.(1995)pp169-176)。非核糖的主链糖部分包括甘露糖,阿拉伯糖,吡喃葡萄糖,吡喃半乳糖,4’-硫代核糖等。几种核酸类似物描述于Rawls,C&E News Jun.2,1997page35。“锁核酸”(LNATM)也包括在核酸类似物的定义之内。LNA是核糖环由连接2’-O原子与4’-C原子的亚甲基桥“锁的”一类核酸类似物。可进行核糖-磷酸主链的这些修饰,以增加生理学环境中该分子的稳定性和半衰期。例如,PNA:DNA和LNA-DNA杂交体可呈现更高稳定性,由此可在一些实施方式中使用。也见美国专利申请公开No.2010/0105052。
在一些实施方式中,末端阻断部分,或“延伸阻断部”,用于防止反应中一种或更多酶改变探针。例如,可在探针之一上使用3’延伸阻断部来避免延伸或连接。在一些实施方式中,核酸在呋喃核糖基环的2’碳包含修饰(见美国专利申请公开No.2009/0198047)或增加分子的稳定性的任何其他糖修饰,尤其是通过赋予针对核酸酶的抗性。例示2’碳修饰包括用选自H,卤素,-R,-OR,-SH,-SR,-NH2,-NHR,-NR2和-CN的基团取代,其中R是烷基。术语“烷基”指称直链或支链,环状烃自由基或其组合,其可完全饱和,单-或多-不饱和和可包括二-及多价自由基。在一些实施方式中,R是选自C1,C2,C3,C4,C5和C6烷基的烷基。在例示实施方式中,2’碳被卤素取代。在例示实施方式中,2’碳被-OR取代,其中R是烷基,特别其中R是选自C1,C2,C3,C4,C5和C6烷基的烷基。在一些实施方式中,核酸在呋喃核糖基环的3’碳包含修饰。在特定实施方式中,在呋喃核糖基环的3’碳的修饰是3’延伸阻断部。3’延伸阻断部指称防止由聚合酶的核苷酸的添加的在3’碳的部分。这些实施方式可特别用于校正以下描述的及如本领域知道的测定。在一些实施方式中,3’延伸阻断部是-R-M,其中R是烷基,M是极性基。在特定实施方式中,R是选自C1,C2,C3,C4,C5,C6,C7,C8,C9,C10烷基的烷基。在一些实施方式中,M选自-OR,-SH,-SR,-NH2,-NHR,-NR2和-CN,其中R是烷基,其在一些实施方式中是选自C1,C2,C3,C4,C5和C6烷基的烷基。在一些实施方式中,3’延伸阻断部选自-(CH2)3SH,-(CH2)3NH2,-(CH2)3OH和无机磷酸。在特定实施方式中,3’延伸阻断部是-(CH2)3OH。在一些实施方式中,3’延伸阻断部选自无机磷酸及-R-M,其中R是烷基,M是极性基。在一些实施方式中,烷基是C1~C10烷基,极性基选自-NH2,-SH和-OH。
在一些实施方式中,核苷酸包含腺嘌呤,鸟嘌呤,胞嘧啶,胸腺嘧啶或尿嘧啶之外的碱基。例如,核苷酸可为黄嘌呤,肌苷,q核苷或本领域知道的其他碱基。任何类型的碱基可由取代或添加一个或更多原子或基团来修饰。因此,碱基可以任何组合烷基化,卤化,硫醇化,胺基化,酰胺化或乙酰化。修饰的碱基的特定例包括,例如,5-丙炔基尿苷,5-丙炔基胞苷,6-甲基腺嘌呤,6-甲基鸟嘌呤,N,N,-二甲基腺嘌呤,2-丙基腺嘌呤,2-丙基鸟嘌呤,2-氨基腺嘌呤,1-甲基肌苷,3-甲基尿苷,5-甲基胞苷,5-甲基尿苷和在5位置具有修饰的其他碱基,5-(2-氨基)丙基尿嘧啶核苷,5-卤代胞苷,5-卤代尿苷,4-乙酰胞苷,1-甲基腺苷,2-甲基腺苷,3-甲基胞苷,6-甲基尿苷,2-甲基鸟苷,7-甲基鸟苷,2,2-二甲基鸟苷,5-甲基氨基乙基尿苷,5-甲基氧基尿苷,脱氮核苷酸诸如7-脱氮-腺苷,6-偶氮尿苷,6-偶氮胞苷,6-偶氮胸苷,5-甲基-2-硫脲苷,其他硫代碱基诸如2-硫脲苷和4-硫脲苷和2-硫代胞苷,二氢尿苷,假尿苷,q核苷,原曙红,萘基及取代的萘基,任何O-及N-烷基化的嘌呤和嘧啶诸如N6-甲基腺苷,5-甲基羰基甲基尿苷,尿嘧啶核苷5-氧基乙酸,吡啶-4-酮,吡啶-2-酮,苯基及修饰的苯基诸如氨基苯酚或2,4,6-三甲氧基苯,作为G-钳核苷酸作用的修饰的胞嘧啶,8-取代的腺嘌呤和鸟嘌呤,5-取代的尿嘧啶和胸腺嘧啶,氮杂嘧啶,羧基羟基烷基核苷酸,羧基烷基氨基烷基核苷酸及烷基羰基烷基化的核苷酸。
术语“核苷酸”也包括为本领域所知的通用碱基。例如,通用碱基包括但不限于3-硝基吡咯,5-硝基吲哚或水粉蕈素。术语“核苷酸”也旨在包括由核糖基3’-氧用胺基取代得到的N3’至P5’氨基磷酸酯。
【连接探针】
本文所述的方法通常需要使用一种或更多连接探针。连接探针可为等位基因特异性探针或座位特异性探针。“等位基因特异性”探针是与靶序列杂交(例如询问位置含有在探针内)及区别等位基因的探针。“座位特异性”探针是在特定座位与靶序列杂交,但不必然区别等位基因(例如其中“间隔”是询问位置)的探针。
在例示实施方式中,连接探针包含与靶序列的靶结构域互补的杂交结构域。一般而言,本文公开的探针设计为互补于靶序列(一级靶序列或衍生靶序列)的结构域,使得靶序列和探针的杂交发生。在例示实施方式中,杂交结构域和靶结构域彼此完美互补。在一些实施方式中,互补不是完美的;靶序列和探针之间可有任意数的碱基对错配。如果错配数大到在甚至最小严格杂交条件下无杂交可发生,序列不是互补靶序列。由此,“基本上互补”指称足够互补,使得它们在选择的反应条件,例如,为本领域所知的严格杂交条件下杂交的序列。
在例示实施方式中,连接探针包含引发结构域。在一些实施方式中,连接探针包含2个引发结构域。“引发结构域”指称与用于产生寡核苷酸与之杂交的分子的一些部分的拷贝的寡核苷酸(即引物)互补的核苷酸序列(一般而言,地址序列)。例如,引物可与引发结构域杂交而形成复合物,然后使其经历PCR条件或允许拷贝合成的一些其他领域-知道的条件。
在一些实施方式中,引发结构域还包含附加序列,有时在本文被称为“延伸”序列。引发结构域延伸可对于为服务各种目的,诸如为添加适配体,指标序列,另外的地址序列,标记物或其任何组合添加核苷酸有用。例如,当一个引发结构域包含第1地址序列时,第2引发结构域的延伸结构域可包括另外的地址序列,使得在环化的探针形成后,地址序列就更长,含有原地址序列和延伸地址序列二者。一般而言,引发结构域的延伸结构域不杂交/不互补于引物。
在一些实施方式中,第1连接探针的第1引发结构域包含第1标记物。在一些实施方式中,第1连接探针的第1引发结构域包含第1标记物,第3连接探针的第1引发结构域包含第2标记物。在一些实施方式中,所述第1标记物及所述第2标记物不同。
在例示实施方式中,其中使用第1连接探针和第2连接探针,第1连接探针包含第1引发结构域,第2连接探针包含第2引发结构域,以在环化后,如在图中通常描绘的一样侧接地址序列的构型,以允许地址序列的扩增。在一些实施方式中,单连接探针包含第1引发结构域和第2引发结构域(再次,在环化后侧接地址序列)。在一些实施方式中,当使用2个引物时,它们的与2个相应引发结构域的互补性可不同。即,一个PCR引物会与一个引发结构域直接杂交,而其他PCR引物会与其他引发结构域的补体杂交。即,当使用PCR技术时,引物对与相反链杂交。即,如果探针被认为是“Crick”链,与引发结构域杂交的引物会包括“Watson”引物,其与“Crick”引发结构域直接杂交,及“Crick”引物,其与第2引发结构域的补体杂交。
在例示实施方式中,选择第1和第2引物,使得仅引物和地址序列扩增。换言之,在例示实施方式中,选择第1和第2引物,使得无一级靶序列部分被扩增。在例示实施方式中,引物与一级靶序列(诸如基因组DNA)不相同或互补(完美,基本上或另外)。
在例示实施方式中,连接探针包含地址序列。在本领域也被知道为“zip代码”,“条代码”或“标签”,地址序列用于区别发现地址序列的分子与发现不同地址序列的不同分子。如本文所述,“地址序列”可为可基于尺寸(例如用于毛细管电泳读数)及/或序列(例如当不同扩增子与含有会与不同地址序列杂交的捕获探针的阵列杂交时)彼此区分。
在一些实施方式中,地址序列包含本身可被称为地址序列的一个或更多较短序列。例如,“模板地址序列”可包含一个或更多适配体,座位或等位基因指标序列和样品指标序列或其任何组合。如下进一步讨论,“座位或等位基因指标序列”和“样品指标序列”用于将更大序列分别与特定座位或等位基因或与一类样品关联。
在一些实施方式中,地址序列包含适配体。地址序列可具有发挥适配体功能的另外的随附的核苷酸。或者,地址序列可本身是适配体。“适配体”是可用于将第1分子共价或非共价结合于第2分子或结构的序列。
适配体可对于制造与各种系统相容的或在各种系统中有用的分子有用,所述系统诸如核酸测序系统,其中可使用适配体,例如,在样品制备期期间。在一些实施方式中,地址序列发挥测序适配体的功能。适配体寡核苷酸可与,例如,HiSeq(Illumina),固体(AppliedBiosystems),454测序技术(Roche),Ion Torrent(Life Technologies),HeliScope(Helicos Biosciences),SMRT(Pacific Biosciences),CGA服务(Complete Genomics)或任何其他测序或阵列技术和服务相容。相容的适配体寡核苷酸为本领域所熟知(见,例如,Ansorge W,(2009)New Biotechnology.25:195-203)。在一些实施方式中,测序系统中使用的适配体可具有另外的官能性。例如,可将适配体用作用于靶扩增的引物或引发结构域。
在例示实施方式中,包含第1地址序列的第1序列和包含第2地址序列的第2序列之间的差异是在对应询问位置的核苷酸不同。探针之内含有的地址序列可辅助探针固定到通用阵列,其是含有不是特异于一级靶,而是,特异于个体,特别人工序列,例如地址序列的捕获探针的阵列(固相或液相阵列)。在例示实施方式中,地址序列不同于或互补(完美,基本上或另外)于一级靶序列(诸如基因组DNA)。在例示实施方式中,地址序列是等位基因特异性的。即,等位基因特异性地址序列用于鉴定特定等位基因。例如,等位基因特异性地址序列可为包含第1询问核苷酸的探针,诸如第1连接探针的部分,且与是包含第2询问核苷酸的另一探针,诸如不同连接探针(即,第3连接探针)的部分的另一等位基因特异性地址序列可区分。第1和第2询问核苷酸不同,因此使地址序列是等位基因特异性的。
在一些实施方式中,第1地址序列具有不同于第2地址序列的尺寸。改变2个探针之间的地址序列的尺寸提供对于区分2个探针的添加的尺度。此可,例如,通过沿着探针移位或“行走”引发结构域达到,以获得探针和因此获得地址序列由序列长度不同的扩增子。含有不同尺寸的地址序列的分子可以多种方式检测,诸如毛细管或标准电泳或知道用于基于尺寸检测分子的任何其他方法。在其他实施方式中,可基于尺寸选择连接探针,以增强,例如,连接探针的环化。
尺寸区分可任选地与其他组分组合以提供用于检测不同探针和探针可用于产生的扩增子的多尺度。例如,可通过标记用于合成扩增子的引物或dNTP来将标记物(例如荧光标记物)合入扩增子,如本领域所熟知。由此,在一些实施方式中,引物包含标记物。此外,标记物可为与扩增子的一些部分杂交的分离的标记探针的部分(例如在“夹层测定”中)。包含不同尺寸和光学标记物二者的分子可以各种方式检测,诸如通过电泳(例如,毛细管电泳)。标记物可为在不同频度发射光的2种或更多标记物。可除光学标记物之外或代替其用其他类型的标记物,诸如本文所述的电子检测的,放射性或其他标记物。
在一些实施方式中,地址序列互补于阵列表面上的捕获探针。一般而言,开发地址序列组和阵列上的对应捕获探针,以最小化彼此和与反应混合物的其他组分,包括在靶序列之外的核酸序列(例如与基因组DNA内的序列)交叉-杂交。其他形式的地址序列作为可通过使用质量光谱学分离的质量标签,可基于电泳运动性分离的电泳标签,等。一些地址序列描述于美国专利申请公开No.2003/0096239。在例示实施方式中,地址序列或其补体未见于基因组,特别人基因组,及缺乏发卡环。
在一些实施方式中,与“通用”表面,即,包含可用于任何应用的一组捕获探针的一种标准阵列使用地址序列。终端用户可通过设计不同可溶性捕获探针来定制阵列,如本领域技术人员会同意,通常是简单和成本-有效的。例如,可溶性捕获探针可包含与捕获探针杂交的第1结构域和与地址序列杂交的第2结构域。需知,多可溶性捕获探针可用于创建将地址序列与捕获探针间接结合的链。在例示实施方式中,使用不同和通常人工捕获探针阵列;即,与天然存在的一级靶序列不具有互补性的捕获探针。地址序列可然后合并进捕获探针。
地址序列的长度可改变,依赖于期望的结合强度及期望的不同地址序列数。在例示实施方式中,地址序列范围是约6~约500个核苷酸长,在更特定实施方式中,约8~约100,且在更特定实施方式中,约10~约25。
在例示实施方式中,连接探针包含询问核苷酸。如前所述,询问核苷酸用于区别一级靶序列中的可能的检测核苷酸。询问核苷酸可在连接探针的任何位置。在例示实施方式中,连接探针中侧接询问核苷酸的一个或更多核苷酸互补于一级靶序列的靶向结构域。在例示实施方式中,连接探针的3’末端核苷酸是询问核苷酸(尽管在本文所述,询问位置可自3’末端稍微移出)。在一些实施方式中,连接探针的5’末端核苷酸是询问核苷酸(尽管在本文所述,询问位置可自5’末端稍微移出)。各包含不同询问核苷酸的多连接探针可同时使用。在例示实施方式中,使用一组2,3或4个连接探针,各探针包含组中连接探针彼此的询问核苷酸彼此不同的询问核苷酸。探针数依赖于SNP位置的等位基因;而多数SNP包含2个等位基因,一些包含3或4个。该组通常包含可用于对基因基因分型的等位基因特异性探针。多组连接探针可用于对多基因基因分型。本领域技术人员会明白,可实施在本文所述的任何实施方式中的筛选或基因分型方法以检测至少一个遗传座位的至少一个等位基因。
一般而言,独特地址序列用于各等位基因特定连接探针。如果可以一些方式与另一地址序列区别,地址序列是独特的。例如,地址序列可由序列,尺寸,化学标记等,以任何组合区分。
在一些实施方式中,连接探针不包含询问核苷酸。该连接探针可用于以下描述的游离碱基测定,其中将相同的连接探针但不同游离碱基加入包含一级靶序列的不同反应容器。连接探针在杂交复合物中与一级靶序列形成开环及在互补于开环端之间的间隔内的检测核苷酸的游离碱基的存在下延伸(或“填充”)。由此,连接探针可延伸或填充,以包含询问核苷酸。
在一实施方式中,在2个或更多连接探针内的一个或更多询问核苷酸之外的全部核苷酸是与在连接探针之间相同的;即,在一些实施方式中,在本发明的方法中使用的探针具有询问位置之外的同一的全部组分(例如探针长度以及非-询问碱基),以允许良好区别。
在一些实施方式中,连接探针包含标记物序列,即可用于结合标记物或信号探针的序列。标记物序列可为基本上或完美互补于标记物探针。利用该标记物探针的系统有时在本领域被称为“夹层”测定。即,通过将标记物序列合并到连接探针,然后将其至少部分扩增及存在于扩增子,可将包含一级(或二级)检测标记物的标记物探针加入混合物,在添加到阵列之前或之后。此允许为有效杂交使用高浓度的标记物探针。在一实施方式中,为阵列上的全部连接探针可能使用相同的标记物序列和标记物探针;替代性地,不同连接探针可具有不同标记物序列。
【延伸阻断部】
在一些实施方式中,连接探针在3’末端包含核酸类似物。在一些实施方式中,连接探针在包括3’末端的多个位置包含核酸类似物。在包括3’末端的一个或更多位置的核酸类似物会是在期望针对核苷酸被酶切除的抗性的实施方式中特别有用的。例如,除了能延伸与模板序列杂交的引发序列之外,特定核酸聚合酶,诸如T4DNA聚合酶,能“校正”导致经历延伸的链的3’端的错配的移出的3’-5’外切核酸酶活性。为了确保包含错配的连接探针通过会切下错配的校正活性不延伸,可将连接探针的3’端的询问核苷酸经非磷酸二酯键的连接附接于其余连接探针。例如,连接探针可在探针的3’末端包含含有硫代磷酸酯键的核酸类似物。换言之,在3’末端的核苷由硫代磷酸酯键偶联于探针的残基。在一些实施方式中,在包括3’末端的多个核酸之间合并多于一个硫代磷酸酯键可为必需的。例如,为了增加核酸酶抗性,在3’末端核酸和分子的其余部分之间的第1硫代磷酸酯键的5’包括第2硫代磷酸酯键可为必需的。由此,在一些实施方式中,至少一个连接探针在至少3’末端包含核苷酸类似物。在一些实施方式中,核苷酸类似物选自:硫代磷酸酯和锁核苷酸。
在一些实施方式中,连接探针包含3’延伸阻断部。在特定实施方式中,连接探针包括包含3’延伸阻断部的询问核苷酸。如本领域知道,包含3’延伸阻断部的连接探针在“校正测定”中是有用的。见Bi和Stambrook,Nucleic Acids Research,1998,26(12):3073-3075。在这些测定的特定例中,连接探针允许与靶序列杂交以形成杂交复合物,其中连接探针包含是与靶序列的检测核苷酸的错配的询问核苷酸。错配通过使杂交复合物与至少一种dNTP和具有校正能力的聚合酶(即,校正聚合酶,其任选地缺乏链位移活性)接触来校正,其用Watson-Crick配对的正确的核苷酸取代错配。在一些实施方式中,校正核苷酸可然后连接到第2连接探针。在一些实施方式中,校正核苷酸可然后延伸(例如由聚合酶与至少一种dNTP接触),然后连接到第2连接探针。在一些实施方式中,延伸具有校正的核苷酸的连接探针及检测,或延伸及扩增,检测扩增产物。由此,可将本文所述的任何实施方式适应于利用校正测定,其中将含有与靶序列的检测核苷酸的错配的探针用于检测基因的SNP。
【切割位点】
第1和第2连接探针中的至少一个包含切割位点。在一些实施方式中,第1连接探针包含第1切割位点,第2连接探针包含第2切割位点,及第1和第2切割位点可为相同的或不同的。术语“切割位点”指称包含当经历本领域知道的导致键断裂的条件时断裂的一个或更多共价键的部分寡核苷酸。这些条件包括高能量条件,诸如高热或电离辐射(例如,UV光);有助于键断裂的pH条件,诸如酸性或碱溶液;及催化键断裂的酶,诸如内切核酸酶或水解寡核苷酸之内的特定类型的键的其他酶。一般而言,当经历适当的条件时,切割位点之内的仅一个或更多键断裂,其余寡核苷酸缺少其他切割位点,由此抵抗任何其他键断裂。
连接探针内的切割位点是核苷酸,即,DNA,RNA,核酸类似物或这些的组合的单链序列。在一些实施方式中,在实际切割要发生之前使附加序列与切割位点杂交可为必需的。在那些实施方式中,双链切割位点包含2个单链DNA的杂交体,2个单链RNA的杂交体,单链DNA和单链RNA或其类似物的混合的杂交体。双链切割位点可具有完美互补或在除了一个或更多错配之外的每位置完美互补的核酸的2个链。在切割位点的链数可不同于见于含有切割位点的其余寡核苷酸的链数。例如,切割位点可为双链,然而在切割位点之外的部分(例如,在以下描述的环化的探针中)是单链。在切割位点的一个或更多核苷酸也可含有不同于其余寡核苷酸中的糖部分的糖部分。例如,DNA链可包含切割位点,其包含一个或更多RNA。由此,在本文的单链寡核苷酸可包含DNA,RNA和其类似物的混合物。切割位点内的一个或更多主链糖部分可缺乏碱基;该部分有时被称为无碱基,AP,无嘌呤或无嘧啶位点。
在例示实施方式中,切割位点包含肌苷。“肌苷”指称次黄嘌呤经β-N9-糖苷键附接于呋喃核糖的核苷酸。在一些实施方式中,肌苷指称脱氧肌苷。合并肌苷进其序列的寡核苷酸当与核酸酶,诸如内切核酸酶接触时可在接近肌苷位点切割。在例示实施方式中,内切核酸酶是内切核酸酶V。内切核酸酶V,也被称为脱氧肌苷3’-内切核酸酶,是切割在双链或单链DNA中肌苷的3’的第2磷酸二酯键的酶。此外,内切核酸酶V也可切割含有无碱基位点,脲,尿嘧啶,碱基错配,插入/缺失错配,发卡或未配对的环,瓣和假-Y结构的DNA。由此,在一些实施方式中,切割位点包含被内切核酸酶V识别的一个或更多核苷酸或位点。
在一些实施方式中,切割位点包含无碱基位点。无碱基位点是糖主链缺乏碱基的部分寡核苷酸。本领域用来指称无碱基位点的术语包括无嘌呤,无嘧啶和AP。无碱基位点的切割可由任何许多本领域知道的AP-切割酶催化,包括大肠埃希氏菌(Escherichia coli)外切核酸酶III(基因xthA),肺炎链球菌(Streptococcus pneumoniae)和枯草芽孢杆菌(Bacillus subtilis)外切核酸酶A(基因exoA),哺乳动物AP内切核酸酶1(AP1),果蝇属(Drosophila)重组修复蛋白1(基因Rrp1),拟南芥(Arabidopsis thaliana)无嘌呤内切核酸酶-氧化还原蛋白(基因arp),网柱菌属(Dictyostelium)DNA-(无嘌呤或无嘧啶位点)裂合酶(基因apeA),细菌内切核酸酶IV(基因nfo),真菌和秀丽隐杆线虫(Caenorhabditis elegans)无嘌呤内切核酸酶APN1,网柱菌属(Dictyostelium)内切核酸酶4同源物,古细菌可能的内切核酸酶4同源物和拟菌病毒属(Mimivirus)推定的内切核酸酶4。
此外,无碱基位点可通过热或化学-处理切割。例如,包含无碱基位点的寡核苷酸可经历100℃经30min。见Sugiyama et al.,Chem.Res.Toxicol.,1994,7:673-683。无碱基位点也可通过使用剂诸如吗啉,哌啶,哌嗪,1,2-乙二胺和N,N'-二甲基亚乙基二胺化学切割。碱处理,诸如使用氢氧化钠升高样品pH,也可用于在无碱基位点切割寡核苷酸。
在一些实施方式中,如下所述,在寡核苷酸创建无碱基位点,然后由用AP-切割酶处理,热或化学处理或本领域知道的其他方法切割。
在一些实施方式中,切割位点包含核糖核苷酸。特定酶,尤其是RNA酶,已知切割RNA。特定RNA酶诸如RNA酶A和RNA酶T1作用于单链RNA。其他RNA酶作用于双链核酸。例包括RNA酶III,其底物是双链RNA,及RNA酶H,其切割见于RNA:DNA杂交体的RNA。如果需要,包含RNA的切割位点可通过会形成对于识别和由这些酶切割足够的双链位点的另外的DNA或RNA链的导入来由RNA酶III,RNA酶H等切割。
在一些实施方式中,切割位点包含尿嘧啶。在例示实施方式中,切割位点包含脱氧尿嘧啶。各种糖基化酶识别DNA序列之内尿嘧啶的存在。这些糖基化酶切下尿嘧啶,留下可以本文所述的及本领域知道的各种方式切割的无碱基位点。例如,尿嘧啶DNA糖基化酶(UDG)自单或双链DNA移出尿嘧啶,及可,例如,由热处理或由与AP-切割酶,诸如内切核酸酶VIII接触来切割得到的无碱基位点。因此,可组合糖基化酶和AP-切割酶的活性,以切割含有尿嘧啶的DNA的一个或更多链。
在一些实施方式中,切割位点包含碱基对错配。如本领域所知,互补碱基对在双链核酸内的腺嘌呤(A)和胸腺嘧啶(T)之间,腺嘌呤和尿嘧啶(U)之间及鸟嘌呤(G)和胞嘧啶(C)之间形成。“碱基对错配”或“错配”是自这些可能性偏离的碱基对。修复酶在各种生物中起到作用而自核酸去除错配。例如,MutY糖基化酶识别G:A错配,从自移出腺嘌呤而留下无碱基位点。AP-切割酶,诸如内切核酸酶IV,随后切割含有无碱基位点的链。因此,可组合糖基化酶和AP-切割酶的活性,以切割一个或更多含有错配的杂交的核酸链。
在一些实施方式中,切割位点包含限制酶切割位点。限制酶切割位点是核酸序列,一般尽管不总是4~8bp长,其被许多限制酶中的任何一种切割。包括多样的组的催化性蛋白,对于实验目的有用的限制酶包括II型,III型和IV型酶。特定II型酶,包括HhaI,HindIII和NotI,切割它们的识别位点之内的核酸,其可为连续或非连续,对称或不对称。其他II型酶在它们的识别位点之外切割。IIS型内切核酸酶识别4~7bp长的不对称双链DNA序列,及在离它们的识别位点达20个碱基的特定位置切割两条链。IIS型内切核酸酶,诸如FokI和AlwI,含有用于DNA识别结合及切割的2个不同结构域。在一些情况中,IIS型酶与多于一个识别序列相互作用后在DNA切割更有效。IIG型酶是在限制酶识别位点之外切割的另一类型的内切核酸酶。因此,在一些实施方式中,核酸包含除切割位点,诸如限制酶切割位点之外的限制酶识别位点。在一些实施方式中,使得另外的核酸链与切割位点杂交,以便确保由限制酶的适当的识别和切割可为必需的。
在一些实施方式中,切割位点包含3’-S-硫代磷酸酯键。已显示,含有3’-S-硫代磷酸酯键的DNA可通过DNA与含有碘和嘧啶的水溶液接触来切割。见Vyle等人,Biochemistry,1992,31:3012。由此,在一些实施方式中,具有包含是在核酸中正常发现的磷酸二酯键的类似物的连接的切割位点可有用。
在其他实施方式中,切割位点包含光切割性基团。光切割性基团为本领域所知。(见例如,美国专利No.5,919,917)。光切割性基团通过在适当的波长用光照射预定的时间来光化学切割,由此切割含有光切割性基团的多核苷酸中的预定的键。因此,光切割允许环状寡核苷酸为线性寡核苷酸。例如,使对DNA的光解切割具有催化性活性的光敏texaphyrin或texaphyrin-缀合物与寡核苷酸接触,及然后使texaphyrin暴露于光足够切割寡核苷酸的时间。(见,例如,美国专利No.5,607,924)。
【探针构型】
本文所述的组分可以各种方式组合。在一些实施方式中,第1连接探针但非第2连接探针包含切割位点。在一些实施方式中,第2连接探针,但非第1连接探针包含切割位点。在一些实施方式中,第1连接探针包含第1切割位点,第2连接探针包含第2切割位点,及第1和第2切割位点可为相同的或不同的。当第1靶结构域在第2靶结构域的5’时,第1和第2切割位点的使用是尤其有用的;此可进行,以确保仅引物对和地址序列扩增。因此,在一些实施方式中,第1连接探针依次包含:(i)地址序列,(ii)第1引发结构域,(iii)与第1靶结构域互补的第1杂交结构域及(iv)询问核苷酸;及第2连接探针依次包含:(i)与第2靶结构域互补的第2杂交结构域,(ii)切割位点及(iii)第2引发结构域。在一些实施方式中,第1连接探针依次包含:(i)地址序列,(ii)第1引发结构域,(iii)切割位点,(iv)与第1靶结构域互补的第1杂交结构域及(v)询问核苷酸;及第2连接探针依次包含:(i)与第2靶结构域互补的第2杂交结构域及(ii)第2引发结构域。在一些实施方式中,第1连接探针依次包含:(i)地址序列,(ii)第1引发结构域,(iii)第1切割位点,(iv)与第1靶结构域互补的第1杂交结构域及(v)询问核苷酸;及第2连接探针依次包含:(i)与第2靶结构域互补的第2杂交结构域,(ii)第2切割位点及(iii)第2引发结构域。“依次”指称5’到3’方向或3’到5’方向,及不排除不变化特定的顺序的另外的元件。
在一些实施方式中,使用另外的连接探针,其除了具有不同地址序列和不同询问核苷酸之外与第1连接探针相同。另外的连接探针可或可不包含切割位点。另外的连接探针会在多个包含询问核苷酸的探针存在于样品中及竞争结合相同的位点的测定中有用。因此,在例示实施方式中,第3连接探针依次包含:(i)第2地址序列,(ii)第1引发结构域,(iii)与第1靶结构域互补的第1杂交结构域及(iv)第2询问核苷酸。在例示实施方式中,第3连接探针依次包含:(i)第2地址序列,(ii)第1引发结构域,(iii)切割位点,(iv)与第1靶结构域互补的第1杂交结构域及(v)第2询问核苷酸。在例示实施方式中,第4连接探针依次包含:(i)第3地址序列,(ii)第1引发结构域,(iii)与第1靶结构域互补的第1杂交结构域及(iv)第3询问核苷酸。在例示实施方式中,第4连接探针依次包含:(i)第3地址序列,(ii)第1引发结构域,(iii)切割位点,(iv)与第1靶结构域互补的第1杂交结构域及(v)第3询问核苷酸。在例示实施方式中,第5连接探针依次包含:(i)第4地址序列,(ii)第1引发结构域,(iii)与第1靶结构域互补的第1杂交结构域及(iv)第4询问核苷酸。在例示实施方式中,第5连接探针依次包含:(i)第4地址序列,(ii)第1引发结构域,(iii)切割位点,(iv)与第1靶结构域互补的第1杂交结构域及(v)第4询问核苷酸。在例示实施方式中,各第3,第4或第5连接探针的询问核苷酸和地址序列不同于其他及第1连接探针的询问核苷酸和地址序列。本领域技术人员会明白,在本文的一些实施方式中,术语“第1引发结构域”和“与第1靶结构域互补的第1杂交结构域”可分别指称第1引发结构域的拷贝和与第1靶结构域互补的第1杂交结构域的拷贝。
在一些实施方式中,第1连接探针和第2连接探针在第1连接探针的地址序列和第2连接探针的第2引发结构域之间接合。得到的“开环”或“前环”探针可然后与一级靶序列杂交。开环探针中的切割位点可在(i)第1引发结构域和与第1靶结构域互补的第1杂交结构域之间,(ii)第2引发结构域和与第2靶结构域互补的第2杂交结构域之间或(iii)二者。由此,在一些实施方式中,各含有独特对的地址序列和询问核苷酸的不同连接探针各接合到第2连接探针,产生包含特征地址序列和询问核苷酸的多个开环探针。因此,在一些实施方式中,连接探针依次包含:(i)询问核苷酸,(ii)与第1靶结构域互补的第1杂交结构域,(iii)第1引发结构域,(iv)第1地址序列,(v)第2引发结构域,(vi)切割位点及(vii)与第2靶结构域互补的第2杂交结构域。在一些实施方式中,连接探针依次包含:(i)询问核苷酸,(ii)与第1靶结构域互补的第1杂交结构域,(iii)切割位点,(iv)第1引发结构域,(v)第1地址序列,(vi)第2引发结构域及(vii)与第2靶结构域互补的第2杂交结构域。在一些实施方式中,连接探针依次包含:(i)询问核苷酸,(ii)与第1靶结构域互补的第1杂交结构域,(iii)第1切割位点,(iv)第1引发结构域,(v)第1地址序列,(vi)第2引发结构域,(vii)第2切割位点及(viii)与第2靶结构域互补的第2杂交结构域。
在一些实施方式中,连接探针不包含询问核苷酸。尤其是,第1连接探针可与本文公开的第2连接探针使用,其中均不包含询问核苷酸。这些探针可在本文所述的游离碱基测定中有用。因此,在一些实施方式中,第1连接探针依次包含:(i)地址序列,(ii)第1引发结构域及(iii)与第1靶结构域互补的第1杂交结构域;及第2连接探针依次包含:(i)与第2靶结构域互补的第2杂交结构域,(ii)切割位点及(iii)第2引发结构域。在一些实施方式中,第1连接探针依次包含:(i)地址序列,(ii)第1引发结构域,(iii)切割位点及(iv)与第1靶结构域互补的第1杂交结构域;及第2连接探针依次包含:(i)与第2靶结构域互补的第2杂交结构域及(ii)第2引发结构域。在一些实施方式中,第1连接探针依次包含:(i)地址序列,(ii)第1引发结构域,(iii)第1切割位点及(iv)与第1靶结构域互补的第1杂交结构域;及第2连接探针依次包含:(i)与第2靶结构域互补的第2杂交结构域,(ii)第2切割位点及(iii)第2引发结构域。
类似地,在一些实施方式中,开环探针不包含询问核苷酸。因此,在一些实施方式中,连接探针依次包含:(i)与第1靶结构域互补的第1杂交结构域,(ii)第1引发结构域,(iii)地址序列,(iv)第2引发结构域,(v)切割位点及(vi)与第2靶结构域互补的第2杂交结构域。在一些实施方式中,连接探针依次包含:(i)与第1靶结构域互补的第1杂交结构域,(ii)切割位点,(iii)第1引发结构域,(iv)地址序列,(v)第2引发结构域及(vi)与第2靶结构域互补的第2杂交结构域。在一些实施方式中,连接探针依次包含:(i)与第1靶结构域互补的第1杂交结构域,(ii)第1切割位点,(iii)第1引发结构域,(iv)地址序列,(v)第2引发结构域,(vi)第2切割位点及(vii)与第2靶结构域互补的第2杂交结构域。
在一些实施方式中,在本文的任何连接探针包含标记物。在例示实施方式中,标记物是结合标记物。在一些实施方式中,第1连接探针依次包含:(i)第1引发结构域,(ii)地址序列,(iii)第2引发结构域,(iv)第1杂交结构域,其互补于第1靶结构域及(v)询问核苷酸;及第2连接探针包含:(i)第2杂交结构域,其互补于第2靶结构域及(ii)结合标记物。在一些实施方式中,第1连接探针依次包含:(i)第1引发结构域,(ii)地址序列,(iii)第2引发结构域及(iv)第1杂交结构域,其互补于第1靶结构域;及第2连接探针包含:(i)第2杂交结构域,其互补于第2靶结构域及(ii)结合标记物。术语“地址盒”可在本文用于指称,依次,第1引发结构域,地址序列和第2引发结构域。另外的组分可为地址盒的部分,且可第1和第2引发结构域之间添加。
【杂交】
本文所述的连接探针设计为与靶序列杂交以形成杂交复合物。“杂交复合物”包含靶序列及一个或更多连接探针,且当连接探针的杂交结构域与靶序列的靶结构域杂交时形成。术语“杂交”是指形成稳定的双联体。“双联”是指在全部或多数它们的核苷酸之中经历Watson-Crick类型碱基配对的完全或部分互补的至少2个寡核苷酸。在一实施方式中,稳定的双联体是未被严格洗涤毁坏的双联结构,例如包括小于双联体链的Tm约5℃的温度和低单价盐浓度,例如小于0.2M,或小于0.1M的条件。术语“双联体”包括与核苷酸类似物,诸如脱氧肌苷,具有2-二氨基嘌呤碱基的核苷,PNA,等配对。2个寡核苷酸之间的双联体的“错配”指称未经历Watson-Crick键合的双联体的相反链中的一对核苷酸。
在例示实施方式中,杂交结构域是与靶结构域完美互补。在一些实施方式中,杂交结构域是与靶结构域基本上互补。当一条链的核苷酸,最佳对齐及比较及具有适当的核苷酸插入或缺失,与其他链的至少约80%的核苷酸配对,通常至少约90%~95%,及更特别约98~100%时,2个单链RNA或DNA分子可说是“基本上互补”。一般而言,杂交结构域应具有不多于1或2个与靶未完美匹配的碱基(除了询问核苷酸之外)。在一些情况中,例如,靶结构域可含有多于一个SNP位置,及探针组设计为允许杂交以查询第1SNP位置和第2SNP位置,由此需要分别在第2或第1位置的错配。
或者,当RNA或DNA链会在选择性杂交条件下与其补体杂交时,实质性互补性存在。一般而言,当在至少约14~约25个核苷酸的延伸物上有至少约65%互补,特别至少约75%,更特别至少约90%互补时,选择性杂交会发生。见,通常,M.Kanehisa,Nucleic Acids Res.,2004,12:203。
在一些实施方式中,杂交复合物包含一级靶序列和第1和第2连接探针,其中第1杂交结构域的末端核苷酸与第2杂交结构域的更近末端核苷酸被至少一个核苷酸隔开。在一些实施方式中,杂交复合物包含一级靶序列和第1和第2连接探针,其中第1杂交结构域的末端核苷酸与第2杂交结构域的末端核苷酸被1,2,3,4,5或6个核苷酸隔开。在例示实施方式中,杂交复合物包含一级靶序列和第1和第2连接探针,其中第1杂交结构域的末端核苷酸与第2杂交结构域的末端核苷酸被2个核苷酸隔开。
在一些实施方式中,杂交复合物包含一级靶序列和连接探针(例如,开环探针),其中第1杂交结构域的末端核苷酸与第2杂交结构域的更近末端核苷酸被至少一个核苷酸隔开。在一些实施方式中,杂交复合物包含一级靶序列和连接探针(例如,开环探针),其中第1杂交结构域的末端核苷酸与第2杂交结构域的末端核苷酸被1,2,3,4,5或6个核苷酸隔开。在例示实施方式中,杂交复合物包含一级靶序列和连接探针(例如,开环探针),其中第1杂交结构域的末端核苷酸与第2杂交结构域的末端核苷酸被2个核苷酸隔开。
【连接】
杂交复合物可使经历条件,使得第1和第2连接探针的端或相同的连接探针的端连接以形成连接的探针。即,连接可为分子内或分子间。连接探针一般在连接之前与靶序列杂交。在例示实施方式中,如果第1连接探针的询问核苷酸与靶序列上的检测核苷酸完美互补,第1和第2连接探针的端连接在一起。在一些实施方式中,询问核苷酸与第2连接探针直接连接。在例示实施方式中,询问核苷酸偶联于一个或更多核苷酸,特别是一个核苷酸,及最后偶联的核苷酸与第2连接探针连接。在一些实施方式中,如果询问核苷酸与靶序列上的检测核苷酸完美互补,连接探针的端连接在一起。
在无连接探针在杂交复合物中包含询问核苷酸的实施方式中,连接探针可被聚合酶延长,使得连接探针包含询问核苷酸。询问核苷酸可然后与第2连接探针连接或还偶联于一个或更多核苷酸,最后偶联的核苷酸连接于第2连接探针。在杂交复合物包含连接探针的另一形式中,询问核苷酸可然后连接于连接探针的另一端。
在一些实施方式中,在使经历延伸和/或连接一个或更多连接探针的端的条件后,使杂交复合物与核酸酶(例如外切核酸酶)接触。在该时间使用核酸酶的一个原因是降解未成功地延伸和/或连接的连接探针。由此,在一些实施方式中,在本文的方法包括例如,在延伸步骤,连接步骤或二者后,移出或分离或降解(或其组合)未连接的连接探针(诸如未彼此连接的第1和第2连接探针,或未本身连接的连接探针)。
连接可以各种方式实施。在例示实施方式中,使连接酶,诸如连接酶,与一种或更多连接探针接触。在例示实施方式中,连接酶是T4DNA连接酶。T4DNA连接酶催化双联DNA或RNA中5’磷酸及3’羟基末端之间磷酸二酯键的形成。尤其是,T4DNA连接酶可封闭双联DNA,RNA或DNA/RNA杂交体中的单链切口。可实施此功能的任何连接酶可用于在本文的方法。其他有用的连接酶的例包括DNA连接酶,小球藻病毒PBCV-1DNA连接酶,人DNA连接酶I和人DNA连接酶III。
在一些实施方式中,将连接剂与一种或更多连接探针接触。典型连接剂是已知实现核酸的“化学连接”的小(例如<500D)分子。连接剂的例包括溴化氰(BrCN),碳二亚胺,N-氰基咪唑,1-乙基-3-(3-二甲基氨基丙基)-碳二亚胺盐酸盐,见Dolinnaya et al.,Nucleic AcidsResearch,1988,16(9):3721-3738;and Shabarova et al.,Nucleic AcidsResearch,1991,19(15):4247-4251;Metelev et al.,Nucleosides&Nucleotides(1999)18:2711;Luebke and Dervan,J.Am.Chem.Soc.(1989)111:8733。Kool(美国专利No.7,033,753)描述使用化学连接和荧光共振能量转移(FRET)以检测遗传多态性。其他化学连接方法使5’-甲苯磺酸或5’-碘基团与3’-硫代磷酸酯基团反应,产生DNA结构,硫取代桥磷酸二酯氧原子之一。见Gryanov,S.M.,and Letsinger,R.L.,Nucleic Acids Research(1993)21:1403;Xu,Y.and Kool,E.T.Tetrahedron Letters(1997)38:5595;and Xu,Y.and Kool,E.T.,Nucleic Acids Research(1999)27:875。见也就本领域知道的其他化学连接技术讨论的US2008/0124810。
由此,如果询问核苷酸完美互补于在杂交复合物中的检测核苷酸,可使杂交复合物经历任何连接技术,诸如上述那些,以便连接一个或更多探针。
【延伸】
在一些实施方式中,一个或更多连接探针延长一个或更多核苷酸。在例示实施方式中,第1或第2连接探针在杂交复合物中与聚合酶及一个或更多dNTP(换言之,游离碱基或游离的核苷酸)接触,由此延伸第1或第2连接探针一个或更多dNTP以形成延伸的第1或第2连接探针。在一些实施方式中,连接探针(诸如开环探针)与聚合酶及一个或更多dNTP接触,由此延伸连接探针一个或更多dNTP以形成延伸的连接探针。通过采用除了连接步骤之外的延伸步骤,测定的特异性可在一些实例中增加,由于成功的延伸,例如,由于在一些实施方式中,在连接可在延伸的连接探针和本身或另一连接探针之间发生之前,需要询问核苷酸与检测位点的匹配。由此,在一些实施方式中,连接探针,诸如第1或第2连接探针,在连接步骤之前延伸一个或更多dNTP。在一些实施方式中,连接探针,诸如第1或第2连接探针,延长1,2,3,4,5,6,7,8,9或10个核酸。在例示实施方式中,连接探针,诸如第1或第2连接探针,延长1个核酸。术语“填充”可与“延伸”同义,特别当探针延长1个核酸时。
在一些实施方式中,可延伸杂交复合物中连接探针的端,以包括一个或更多dNTP。在一些实施方式中,连接探针包含询问核苷酸,及一个或更多dNTP随附于询问核苷酸。在例示实施方式中,包含末端询问核苷酸的第1连接探针通过dNTP与末端询问核苷酸结合来延伸。其可在这些实施方式中对于本文所述的杂交复合物与一种或更多不同dNTP接触,各在分离容器中,然后为测定哪种dNTP已被合入连接探针有用,例如在询问位置有单核苷酸间隔的情况中。本文所用的术语“容器”指称任何物质用容器或容具。容器的一例是本领域明白的微阵列的孔。
“聚合酶”,如本文所用,指称对于将游离的核苷酸共价结合到寡核苷酸有用的任何蛋白。许多聚合酶为本领域所知,且可根据聚合酶具有的活性或活性缺乏选择。例如,聚合酶可根据是否其尤其是具有或缺乏5’-3’外切核酸酶活性,3’-5’外切核酸酶活性,链位移活性或加热活化/灭活能力来选择。在一些实施方式中,聚合酶缺乏链位移活性,缺乏外切核酸酶活性或二者。在例示实施方式中,聚合酶具有3’-5’外切核酸酶活性,缺乏5’-3’外切核酸酶活性及缺乏链位移活性。延伸中使用的例示聚合酶,例如在连接之前,是T4聚合酶。如本文所述,在一些实施方式中为延伸使用的聚合酶可不同于为核酸产物,诸如二级靶序列的扩增使用的聚合酶。例如,T4聚合酶可用于延伸而TaqDNA聚合酶可用于扩增。
【环化】
已接合在一起而形成线性分子的第1和第2连接探针(“连接的探针”)可再次接合在一起而形成环化的探针。在例示实施方式中,连接的探针分离自靶序列,诸如一级靶序列,在环化之前。在例示实施方式中,使连接的探针与环化酶接触。一种特别有用的环化酶是CircLigaseTM(Epicentre Biotechnologies)。CircLigaseTM催化具有5’-磷酸和3’-羟基的ssDNA模板或具有3’-羟基核糖核苷酸和5’-磷酸化的核糖核苷酸或脱氧核糖核苷酸的单链寡核苷酸的分子内连接(即环化)。一般而言,可使用连接寡核苷酸,特别是单链分子,诸如ssDNA的5’和3’末端核苷酸的任何环化酶。
在一些实施方式中,环化步骤不需要或实施。
【切割】
包含切割位点的探针可根据本领域知道的或在本文描述的方法切割。在切割位点切割探针,诸如环化的探针,包括使探针经历有助于由键断裂形成“二级靶序列”的任何条件。在例示实施方式中,二级靶序列依次包含:第1引发结构域,地址序列和第2引发结构域,有任何端上的任选的序列,诸如杂交结构域及有地址序列和任何引发结构域之间的任选的序列。切割探针可包括,例如,使探针与酶接触;使探针暴露于电离辐射,提升的温度,碱性或酸性条件,或导致在切割位点键断裂的一种或更多化学试剂;或本文所述的这些和其他方法的任何组合。如上所述,使附加序列与切割位点杂交以形成双链位点而作为用于识别和/或切割的底物可为必需的。在例示实施方式中,将环化的探针与内切核酸酶,诸如内切核酸酶V接触。在切割位点切割环化的探针会导致线性分子(例如,二级靶序列),及此步骤有时被称为“线性化”或“再线性化”。
【捕获】
在一些实施方式中,由附接于固体支持物的捕获配体捕获分子可为有用的。可使用广泛数的适合的支持物,依赖于测定的复杂性;即,检测多少不同地址/SNP。可在测定中的任何点实施捕获步骤,捕获的分子可为实施的方法产生的任何分子。在捕获之后,将支持物洗涤,及还使各种捕获的物质经历另外的步骤,例如,扩增和/或检测。由捕获配体捕获的分子一般包含与捕获配体结合的结合标记物。在一些实施方式中,一种或更多连接探针,诸如第1或第2连接探针,包含结合标记物。在例示实施方式中,连接探针,诸如第2连接探针,包含杂交结构域(诸如第2杂交结构域,其互补于第2靶结构域)和结合标记物,及在特定实施方式中在使连接探针经历连接步骤之前不包含地址序列或地址盒。
在一些实施方式中,第2连接探针包含:(i)结合标记物及(ii)第2杂交结构域,其互补于第2靶结构域连接于第1连接探针,其包含:(i)地址盒及(ii)第1杂交结构域,其互补于第1靶结构域,以提供二级靶序列。常常,不会发生与一级靶序列杂交而形成二级靶序列的第1和第2连接探针的连接,除非核苷酸与一级靶序列中的检测核苷酸形成互补碱基对。二级靶序列然后由附接于固体支持物的捕获配体捕获,然后检测。任选地,二级靶序列在检测之前扩增。在此及其他情况中,洗涤固体支持物,以便消除包含地址序列或盒但未成功地连接于包含结合标记物的探针的物质会是有用的。由此,这些实施方式例示捕获及洗涤步骤如何可用于测定是否2种探针已成功地连接。
【扩增】
由本文所述的方法形成的二级靶序列可直接检测。但是,其在扩增部分二级靶序列,以便,例如,为改善的检测产生多个拷贝(即.“三级靶序列”,也被称为“扩增子”)的一些情况中可为期望的。由此,在一些实施方式中,扩增地址序列。引发结构域对通常应关于二级靶序列上的地址序列定向,使得仅引发结构域,引物结构域对之间的任何序列和其任何补体可扩增。此外,选择引物对,以便确保仅引发结构域,引物结构域对之间的任何序列,及其任何补体可扩增可为必需的。在例示实施方式中,与在地址位点的5’的引发结构域杂交的引物(即,5’地址引物)与引发结构域具有相同的5’-3’序列。在例示实施方式中,与在地址位点的3’的引发结构域杂交的引物(即,3’地址引物)是引发结构域的反向互补体;换言之,3’地址引物的5’-3’序列是引发结构域的3’-5’序列的补体。在例示实施方式中,包含部分一级靶序列(例如,杂交结构域)或一级靶序列的补体的序列未扩增。换言之,在例示实施方式中,三级靶序列不互补(完美,基本上或另外)于一级靶序列(诸如基因组DNA)或其补体。
扩增部分二级靶序列(诸如地址序列)以获得一个或更多三级靶序列可通过任何领域知道的方法,诸如聚合酶链反应(PCR)实现。可使用本文所述的或本领域知道的聚合酶。在例示实施方式中,聚合酶具有5’-3’外切核酸酶活性。在例示实施方式中,聚合酶缺乏链位移活性。在例示实施方式中,聚合酶具有5’-3’外切核酸酶活性及缺乏链位移活性。该聚合酶可用于确保线性化失效了的环化的探针(例如,切割位点的缺乏)不会扩增。特别有用的聚合酶是Taq DNA聚合酶。
在一些实施方式中,二级靶通过使用乳剂PCR扩增。乳剂PCR沿着油相之内的水滴中引物-包被的珠分离多核苷酸分子。聚合酶链反应(PCR)然后用多核苷酸分子的克隆拷贝包被各珠,之后是固定用于由,例如,测序随后分析。本领域技术人员可利用的乳剂PCR的任何方法可在本发明的方法中使用(见,例如,Hori et al.(2007)BiochemBiophys Res Commun.352:323-8;Xu et al.(2010)Biotechniques.48:409-12;Williams et al.(2006)Nat Methods.3:545-50;Nakano et al.(2003)J Biotechnol.102:117-24)。
【检测】
靶序列,尤其是衍生靶序列诸如三级靶序列,可通过本领域技术人员知道的各种测定,方法和检测系统检测或测量。术语“测量”,“检测”或“测量”指称实体的性质或特征的定量或定性确定,例如,定量分子的量或活性水平或测定分子的缺失或存在。
各种方法包括但不限于紫外(UV)光谱学,近红外线(接近-IR)光谱学,红外线(IR)光谱学,可见光谱学,折射率(RI)光谱学,荧光光谱学,比色法,核磁共振光谱学(NMR),分散拉曼光谱学,光散射分析(LS),质量光谱法(MS)(诸如飞行MS的矩阵-辅助的激光解吸电离-时间(MALDI-TOF MS),热解MS,离子喷射MS),气相层析(任选地与质量光谱法组合),液相层析(任选地与质量光谱法组合),电泳(诸如毛细管或凝胶电泳),放射化学分析和表面等离子体共振(诸如根据由Biacore Life Sciences提供的系统)和比浊法。
本领域新发现或知道的序列,诸如保存在序列数据库或商业上提供的那些,可用于构建用于各种检测方法的探针和引物。由此,在本文提供的是探针组包含用于检测靶序列的多个探针或由其组成。本文提供的也是引物组包含用于检测靶序列的多个探针或由其组成。
如下进一步定义,“特异性结合”或“选择性地结合”或对于物质“选择性”的配体是指配体以足够区分物质和样品的其他组分或混杂物的特异性结合该物质。
在一些实施方式中,以溶液形式进行检测靶序列的测定。在一些实施方式中,使用端-点或实时PCR形式,如本领域所熟知。这些测定可作为一组,在个体管或孔中,或作为多重测定,使用引物组和单管或孔之内的不同标记物进行。也可使用依赖于使用FRET探针或嵌入染料诸如SYBR Green的5’核酸酶测定的qPCR技术。除了基于PCR的溶液形式之外,可利用其他形式,包括,例如,利用FRET染料对的基于连接的测定。在此实施方式中,仅在与靶序列杂交的2种(或更)探针连接后产生信号。
在例示实施方式中,检测靶序列的测定利用阵列进行。阵列可分为2大类基于表面的多重平台:使用固定的平面表面的那些(固定的阵列,有时被称为芯片或生物芯片)和基于粒子的那些(液体阵列)。在固定的阵列平台中,在共享的,一般测定通过位置鉴定的2-维矩阵上实施测定。在液体阵列平台中,各测定在分离的支持物,诸如珠上实施,其可由一些非位置的特征性,诸如荧光频度鉴定。在任何情况中,检定系统包括包含捕获配体(也被称为吸附剂,亲和性试剂或结合配体,或当测量核酸时,捕获探针)的基材或固体支持物。
术语“固体支持物”或“底物”指称对于捕获结合配体的附接或关联适当的任何物质。适合的底物包括金属表面诸如金,电极,玻璃及修饰的或官能化的玻璃,塑料(包括丙烯酸脂类,聚苯乙烯和苯乙烯和其他物质的共聚物,聚丙烯,聚乙烯,聚丁烯,聚碳酸酯,聚氨基甲酸酯,特氟隆,其衍生物,等),多糖,尼龙或硝酸纤维素,树脂,云母,氧化硅或基于氧化硅的物质包括硅及修饰的硅,碳,金属,无机玻璃,纤维玻璃,陶瓷,GETEK(聚丙烯氧化物和纤维玻璃的混合物)和各种其他聚合物。
在一些实施方式中,固体支持物被修饰为含有离散个体位点。生物芯片表面由此可包含多个可寻址的位置,各包含捕获结合配体。“阵列位置”,“可寻址的位置”,“垫”或“位点”是指包含共价附接的捕获配体的基材上的位置。阵列可以规则,有序的形式,诸如矩阵包含多个捕获配体。阵列也可包括对照,标记物的复本等。在一些实施方式中,也可制造包含单捕获配体的组合物。此外,在一些阵列中,可使用不同或同一组合物的多个基材。由此,例如,大阵列可包含多个更小基材。
可使用本领域知道的许多不同生物芯片阵列平台。例如,本发明的组合物和方法可用阵列平台诸如GeneChip(Affymetrix),CodeLinkBioarray(Amersham),表达阵列系统(Applied Biosystems),SurePrint微阵列(Agilent),Sentrix LD BeadChip或Sentrix阵列矩阵(Illumina)和Verigene(Nanosphere)实施。在例示实施方式中,包括使用液体阵列,例如,xMAP(Luminex Corp.)或Arrayable液体阵列平台,基于编码的可分选的粒子(ESP)技术(诸如由Arrayomics提供的)的检测靶序列的存在。
捕获探针或捕获结合配体可,例如,经官能团,诸如附接于表面诸如硅烷化的玻璃的氨基,羟基或氢硫基共价附接于表面。或者,可利用非共价附接,诸如静电,疏水/亲水粘接。如由本领域技术人员同意,在广泛的表面上大量的附接是可能的。例如对于测量核酸有用的平台和方法,见美国专利申请公开No.2006/0275782和2005/0064469。
说到“结合配体”,“捕获结合配体”,“捕获结合物质”,“捕获探针”或“捕获配体”在本文是指会与靶分析物,靶物质或靶序列(全部互换使用)结合,以便检测靶分析物,靶物质或靶序列的存在或相对或绝对定量,靶分析物,靶物质或靶序列的化合物。在例示实施方式中,捕获结合配体或捕获探针允许为本文进一步所述的检测目的将靶物质或靶序列附接于固体支持物。靶物质附接于捕获结合配体可为直接或间接。在例示实施方式中,靶物质是靶序列,诸如二级,三级或其他衍生靶序列。本领域技术人员会同意,结合配体的组成会依赖于靶序列的组成。用于广泛的物质的结合配体知道或可通过使用知道的技术容易发现。结合配体包括蛋白(特别包括抗体或其片段(FAbs,等)如下进一步讨论)或小分子。结合配体也可与其他物质的蛋白具有交叉反应性。抗原-抗体对,受体-配体和碳水化合物和它们的结合偶体也是适合的分析物-结合配体对。在例示实施方式中,结合配体可为核酸。如总描述于美国专利No.5,270,163;5,475,096;5,567,588;5,595,877;5,637,459;5,683,867;5,705,337及相关的专利,可开发核酸“适体”用于与实际上是任何靶结合。有与基于组合的化学方法的结合偶体的开发相关的广泛的文献。见,例如,国际公开No。WO1998/020162。
捕获探针可直接结合靶序列,其可任选地结合到一种或更多另外的组分,诸如标记物或信号探针。在该“夹层”测定的一些实施方式中,捕获探针结合到靶序列的第1结构域,标记物探针结合到靶序列的第2结构域。或者,捕获探针可通过使用另外的探针,诸如可溶性结合配体或可溶性捕获配体而间接结合到靶序列。例如,捕获探针可结合可溶性结合配体的第1结构域,靶序列可结合可溶性结合配体的第2结构域。
常常,检测“标记物”或“报告子”,以便测定样品中靶序列的存在。标记物是致使检测化合物的原子或分子。在一些实施方式中,标记物直接结合(例如,经共价,离子或氢键,或范德华相互作用)到靶序列。在一些实施方式中,标记物间接结合(例如,经分子)到靶序列。在一些实施方式中,标记物与指示靶序列存在的一个或更多分子直接或间接结合。可检测由包含标记物及一种或更多分子的“信号传导复合物”产生的信号,以提供作为目标分子,诸如一级靶序列的存在的指示。一般而言,标记物落入4类:(a)同位素标记物,其可为放射性或重同位素;(b)磁,电,热;(c)发光染料;及(d)酶;尽管标记物也包括粒子诸如磁粒子。染料可为生色团或磷光体,但在特定实施方式中是荧光染料,因为它们的强信号提供用于解码的良好信号-噪音比。用于在本发明中使用的适合的染料包括,但不限于,荧光镧系元素络合物,包括铕和铽的那些,荧光素,若丹明,四甲基若丹明,伊红,赤藓红,香豆素,甲基-香豆素,芘,Malacite绿,茋,Lucifer黄,级联蓝,德克萨斯红,Alexa染料和其他描述于Molecular ProbesHandbook(6th ed.)by Richard P.Haugland的。另外的标记物包括描述于美国专利No.6,544,732的纳米晶体或Q-点。
标记物可为主要或二级标记物。主要标记物产生可直接检测的可检测的信号。例如,引物或在扩增可期间合并的dNTP上的标记物是主要标记物,诸如荧光团。或者,标记物可为二级标记物,诸如生物素或酶。二级标记物需要导致可检测的信号产生的另外的试剂。二级标记物是间接检测的标记物;例如,二级标记物可与用于检测的主要标记物结合或反应,可作用于另外的试剂而产生主要标记物,或可允许包含来自未标记的物质的二级标记物的化合物,等的分离。二级标记物包括,但不限于,结合偶体对之一,诸如生物素;结合偶体对;化学可修饰的部分;核酸酶抑制物;酶诸如辣根过氧化物酶;碱性磷酸酶;萤光素酶,等。
在一些实施方式中,信号传导复合物是夹层形式,其中靶未标记。在这些实施方式中,信号传导复合物,其包含:(i)附接于支持物的捕获配体,(ii)与捕获配体结合的靶及(iii)与靶独立地结合的及直接或间接包含一个或更多标记物的“信号探针”或“标记物探针”。在这些实施方式中,标记物探针可包含一级(例如荧光团)或二级(生物素或酶)标记物。在一些情况中,标记物探针包含生物素,其然后结合到链霉亲和素-酶(例如包含辣根过氧化物酶)缀合物及随着沉淀剂,诸如3,3’,5,5’-四甲基联苯胺(TMB),o-二茴香胺(3,3′-二甲氧基联苯胺(二盐酸盐),Fast Blue B的添加而形成着色的沉淀物)等。此实施方式具有特定益处,即检测用光学不需要使用荧光计或其他检测器,其可添加到实施方法消费中。在一些实施方式中,酶诸如辣根过氧化物酶直接缀合到标记物探针。
在一些实施方式中,信号传导复合物包含结合偶体对。适合的结合偶体对包括,但不限于:抗原(诸如多肽)和抗体(包括其片段(FAbs,等));其他多肽和小分子,包括生物素/链霉亲和素;酶和底物或抑制物;其他蛋白-蛋白相互作用对;受体-配体;及碳水化合物和它们的结合偶体。核酸-核酸结合蛋白对也是有用的。在特定实施方式中,结合偶体对包括,但不限于,生物素(或亚氨基-生物素)和链霉亲和素,地高辛配基和Abs,及ProlinxTM试剂。
在一些实施方式中,连接探针包含二级标记物,诸如生物素。在例示实施方式中,使包含二级标记物诸如生物素的连接探针与包含针对二级标记物,诸如链霉亲和素的结合偶体的固体支持物接触。由此形成的复合物可洗涤及含有生物素的部分可用于进一步测定。
如本文所用,术语“荧光信号产生部分”或“荧光团”指称在一种波长吸收能量且在另一波长再发射能量的分子或分子的部分。可测量的荧光性质包括荧光强度,荧光寿命,发射光谱特征,能量转移等。可产生来自单分子的信号及由许多检测系统,包括但不限于扫描电子显微镜检,近场扫描光学显微镜检(NSOM),总内部反射荧光显微镜检(TIRFM),等检测。丰富的指导见于将该技术应用于分析及检测表面上的纳米尺度结构的文献,如由通过引用合并的以下参考文献证明:Reimer et al,editors,Scanning Electron Microscopy:Physics ofImage Formation and Microanalysis,2nd Edition(Springer,1998);Nie et al,Anal.Chem.,78:1528-1534(2006);Hecht et al,JournalChemical Physics,112:7761-7774(2000);Zhu et al,editors,Near-Field Optics:Principles and Applications(World ScientificPublishing,Singapore,1999);Drmanac,WO2004/076683;Lehr et al,Anal.Chem.,75:2414-2420(2003);Neuschafer et al,Biosensors&Bioelectronics,18:489-497(2003);Neuschafer et al,美国专利No.6,289,144;等。由此,用于荧光团的检测系统包括可用于测量以上讨论的荧光性质的任何装置。在各种实施方式中,检测系统包含激发源,荧光团,用于自激发光子分离发射光子的波长滤器和寄存发射光子及产生可记载的输出,在一些实施方式中为电信号或摄影像的检测器。检测装置的例包括无限制地分光荧光计和酶标仪,荧光显微镜,荧光扫描仪(包括例如微阵列读取器)和流式细胞仪。
在一些实施方式中,如果其由可检测的差异表征,分子可被认为标记的。例如,“尺寸标记物”是在尺寸上与另一分子不同的分子。尺寸标记物可通过检测或测量尺寸差异,诸如通过质量光谱法或电泳来区别。任何本领域知道的许多分析系统可用于此目的。例如,LabChipGX/GXII(Caliper Life Sciences),3130遗传分析仪和其他分析仪系统(Applied Biosystems),PA800+(Beckman Coulter),MegaBACE(GE Healthcare),及2100生物分析仪(Agilent)具有对于分析物分离和遗传分析有用的电泳能力。
在本发明中有用的捕获结合配体可对于它们的靶为“选择性”的,“特异性结合”或“选择性地结合”的。如果捕获结合配体,相比不同捕获结合配体以更高结合常数或更低解离常数与靶结合,捕获结合配体对靶是选择性的。一般而言,特异性或选择性结合可区别于非特异性或非-选择性结合,当解离常数(KD)小于约10-5M,小于约10-6M,小于约10-7M,小于约10-8M,小于约10-9M,小于约10-10M,小于约,小于约10-11M,小于约10-12M,小于约10-13M,小于约10-14M,或小于约10-15M。特异性结合可,例如,由ELISA,免疫沉淀,共沉淀,有或无化学交联,2-杂交体检定等检测。适当的对照可用于区别特异性和非特异性结合。
对靶核酸“选择性地结合”(即,是“互补”或“基本上互补”)或“选择性”的捕获探针可在本发明中使用。“互补”或“基本上互补”指称核苷酸或核酸之间,诸如,例如,双链DNA分子的2条链之间或寡核苷酸引物和单链核酸上的引发结构域之间的杂交或碱基配对或双联体形成;这些术语已在以上定义。
【试剂盒】
在本文提供的是用于实施任何本文公开的方法的试剂盒。试剂盒可包含便携载体,诸如箱,盒,管等,其中紧密具有一个或更多容器,诸如瓶,管,安瓿,瓶,袋,包膜等。在各种实施方式中,试剂盒包含选自一种或更多培养基或培养基成分和用于实施本文公开的基因分型方法的试剂的一种或更多组分。例如,本发明的试剂盒也可,在相同的或不同容器中,以任何组合,包含一种或更多酶(例如聚合酶,核酸酶,连接酶等,以任何组合),一种或更多引物,一种或更多探针,一种或更多结合配体,一种或更多缓冲剂,一种或更多核苷酸(诸如脱氧核苷三磷酸(dNTP)及标记的dNTP),一种或更多可检测的标记物和标记物及一种或更多固体支持物,其中任何均在本文所述。组分可含有在相同的容器之内,或可在待在使用之前混合的分离的容器中。试剂盒也可包含用于实施本文公开的方法的一个或更多使用说明或流程。试剂盒可包含用于通过结合样品使用本发明的组分产生的检测信号的检测器。试剂盒也可包含计算机或计算机组分,诸如计算机-可读性存储介质或装置。存储介质的例包括,无限制地,光盘诸如CD,DVD和蓝光盘(BD);磁-光盘;磁培养基诸如磁带和内部硬盘和可移出的盘;半-导体记忆装置诸如EPROM,EEPROM和快擦写存储器;及RAM。任何存储介质可转化(例如,电磁)以包含可由计算机解析以辅助由本文所述的各种物质产生的分析信号的软件。一般而言,任何本文公开的方法可包括使用本文公开的任何试剂盒(包括引物,探针,标记物,配体,试剂和固体支持物,以任何组合)。
【测定形式】
【竞争性连接】
本文所述的组分可以各种组合使用,以用许多不同方式检测一级靶序列。图1,2,5和6显示如何实施“竞争性连接”测定的例。包含不同询问核苷酸的多个不同连接探针竞争结合给定目标。当连接探针包含在杂交复合物中与检测核苷酸形成互补碱基对的询问核苷酸时,2个连接探针的端之间或相同的连接探针端之间(例如,与前环探针)发生连接。竞争性连接测定可在相同的容器中使用由询问核苷酸不同的多个第1连接探针实施。
在图1中,一级靶序列100包含检测核苷酸101,第1靶结构域102和第2靶结构域103。第1连接探针110包含地址序列111,第1引发结构域112,第1杂交结构域113和询问核苷酸114。第2连接探针120包含第2杂交结构域121,切割位点122和第2引发结构域123。第1杂交结构域113与第1靶结构域102互补由此杂交。第2杂交结构域121与第2靶结构域103互补由此杂交。杂交复合物140由此形成。因为询问核苷酸114和检测核苷酸101之间的互补碱基配对,连接可在询问核苷酸114到第2连接探针120的接近端之间发生。连接后,连接的探针150的端接合而形成环化的探针160。环化的探针160然后在切割位点切割而产生二级靶序列170。部分二级靶序列170通过使用5’引物171和3’引物172扩增而产生三级靶序列180,其可如本文所述标记及检测。
在杂交复合物141中,第1连接探针130包含地址序列115(不同于地址序列111)和询问核苷酸116,其不与检测核苷酸101形成互补碱基对。因此无连接发生。环状物质191不线性化及未扩增,如果使用,例如,具有5’-3’外切核酸酶活性及缺少链位移活性的聚合酶。环状物质192线性化为物质193,其未扩增,因为用于扩增的5’引物与第2引发结构域具有相同的序列,且因此不会结合。地址序列115未扩增。
图2显示与图1中显示的相同的通用的测定,除了一级靶序列100的第1靶结构域102在第2靶结构域103的5’之外。通过第1和第2连接探针与一级靶序列杂交而形成杂交复合物240。因为询问核苷酸114和检测核苷酸101之间的互补碱基配对,连接可发生而形成连接的探针250。连接后,连接的探针250的端接合而形成环化的探针260。环化的探针260然后在切割位点切割而产生二级靶序列270。部分二级靶序列270通过使用5’引物271和3’引物272扩增而产生三级靶序列280,其可如本文所述标记及检测。三级靶序列280会形成大多数扩增产物。
在杂交复合物241中,第1连接探针130包含地址序列115(不同于地址序列111)和询问核苷酸116,其不与检测核苷酸101形成互补碱基对。因此无连接发生。环状物质292不线性化及未扩增,如果,例如,使用具有5’-3’外切核酸酶活性及缺少链位移活性的聚合酶。环状物质291线性化为物质293及扩增,但扩增子294缺乏地址序列,且在例示实施方式中不会被检测到。
图5显示开环探针510与一级靶序列100杂交的竞争性连接测定。因为杂交复合物540中询问核苷酸114和检测核苷酸101之间的互补碱基配对,询问核苷酸114可连接于开环探针510的另一端,由此形成圆形探针550。圆形探针550然后在切割位点切割而产生二级靶序列560。部分二级靶序列560通过使用5’引物561和3’引物562扩增而产生三级靶序列570,其可如本文所述标记及检测。
在杂交复合物541中,开环探针520包含地址序列115(不同于地址序列111)和询问核苷酸116,其不与检测核苷酸101形成互补碱基对。因此无连接发生。开环探针511由此,例如,通过经外切核酸酶降解来自样品移出。地址序列115由此不扩增。
图6显示与图5显示的相同的通用的测定,除了靶序列100的第1靶结构域102在第2靶结构域103的5’之外。通过圆形探针510与一级靶序列100杂交来形成杂交复合物640。因为询问核苷酸114和检测核苷酸101之间的互补碱基配对,连接可发生而形成圆形探针650。圆形探针650然后在切割位点切割而产生二级靶序列660。部分二级靶序列660通过使用5’引物661和3’引物662扩增而产生三级靶序列670,其可如本文所述标记及检测。三级靶序列670会形成大多数扩增产物。
在杂交复合物641中,开环探针520包含地址序列115(不同于地址序列111)和询问核苷酸116,其不与检测核苷酸101形成互补碱基对。因此无连接发生。开环探针520由此,例如,通过经外切核酸酶降解来自样品移出。地址序列115由此不扩增。
图13显示一类竞争性连接测定,其中一种探针包含地址盒和另一探针包含结合标记物。此实施方式还在以下进一步描述。
【竞争性延伸和连接】
图3,4,7和8显示如何实施竞争性延伸和连接测定的例。包含不同询问核苷酸的多个不同连接探针竞争结合给定目标。在一些实施方式中,询问核苷酸延长一个或更多核苷酸(例如由聚合酶)。在一些实施方式中,连接探针,例如在杂交结构域的端,延长一个或更多核苷酸。在任何一种情况中,当连接探针包含在杂交复合物中与检测核苷酸形成互补碱基对的询问核苷酸时,连接在2个连接探针端之间或相同的连接探针的端之间发生。竞争性延伸和连接测定可在相同的容器中使用由询问核苷酸不同的多个连接探针实施。
在图3中,一级靶序列300包含检测核苷酸101,第1靶结构域102,第2靶结构域103和靶延伸结构域301。第1连接探针110包含地址序列111,第1引发结构域112,第1杂交结构域113和询问核苷酸114。第2连接探针120包含第2杂交结构域121,切割位点122和第2引发结构域123。第1杂交结构域113与第1靶结构域102互补由此杂交。第2杂交结构域121与第2靶结构域103互补由此杂交。杂交复合物340由此形成。因为询问核苷酸114和检测核苷酸101之间的互补碱基配对,聚合酶可用与靶延伸结构域301互补的碱基对延伸第1连接探针110,形成延伸的第1连接探针350。延伸的第1连接探针350的末端核苷酸连接于第2连接探针的接近端而形成连接的探针360。连接后,环化酶接合连接的探针360的端而形成环化的探针370。环化的探针370然后在切割位点切割而产生二级靶序列380。部分二级靶序列380通过使用5’引物381和3’引物382扩增而产生三级靶序列390,其可如本文所述标记及检测。
在杂交复合物341中,第1连接探针130包含地址序列115(不同于地址序列111)和询问核苷酸116,其不与检测核苷酸101形成互补碱基对。因此无延伸和无连接发生。环状物质391不线性化及未扩增,如果,例如,使用具有5’-3’外切核酸酶活性及缺少链位移活性的聚合酶。环状物质392线性化为物质393,其未扩增,因为用于扩增的5’引物与第2引发结构域具有相同的序列,因此不会结合。地址序列115未扩增。
图4显示与图3中显示的相同的通用的测定,除了一级靶序列300的第1靶结构域102在第2靶结构域103的5’之外。聚合酶可用与靶延伸结构域301互补的碱基对延伸第2连接探针120,形成延伸的第2连接探针450。因为询问核苷酸114和检测核苷酸101之间的互补碱基配对,延伸的第2连接探针450的端连接于第1连接探针的接近端,形成连接的探针460。连接后,环化酶接合连接的探针460的端而形成环化的探针470。环化的探针470然后在切割位点切割而产生二级靶序列480。部分二级靶序列480通过使用5’引物481和3’引物482扩增而产生三级靶序列490,其可如本文所述标记及检测。三级靶序列490会形成大多数扩增产物。
在杂交复合物441中,第2连接探针120用与靶延伸结构域301互补的碱基对延伸,形成延伸的第2连接探针450。第1连接探针130包含地址探针115(不同于地址序列111)和询问核苷酸116,其不与检测核苷酸101形成互补碱基对。因此无连接发生。环状物质492不线性化及未扩增,如果,例如,使用具有5’-3’外切核酸酶活性及缺少链位移活性的聚合酶。环状物质491线性化为物质493及扩增,但扩增子494缺乏地址序列,且在例示实施方式中不会被检测到。
图7显示竞争性延伸和连接测定,其中开环探针510与一级靶序列300杂交。因为杂交复合物740中询问核苷酸114和检测核苷酸101之间的互补碱基配对,聚合酶可自询问核苷酸114,用与靶延伸结构域104的互补碱基配对延伸开环探针510,形成延伸的开环探针750。延伸的开环探针750的端可连接于探针的另一端,形成圆形探针760。圆形探针760然后在切割位点切割而产生二级靶序列770。部分二级靶序列770通过使用5’引物771和3’引物772扩增而产生三级靶序列780,其可如本文所述标记及检测。
在杂交复合物741中,开环探针520包含地址探针115(不同于地址序列111)和询问核苷酸116,其不与检测核苷酸101形成互补碱基对。因此无延伸和连接发生。开环探针520,例如,通过经外切核酸酶降解而从样品除去。地址序列115由此不扩增。
图8显示与图7中显示的相同的通用的测定,除了靶序列100的第1靶结构域102在第2靶结构域103的5’之外。杂交复合物840通过开环探针510与一级靶序列300杂交而形成。聚合酶可延伸开环探针510,形成延伸的开环探针850。因为询问核苷酸114和检测核苷酸101之间的互补碱基配对,连接可发生而形成圆形探针860。圆形探针860然后在切割位点切割而产生二级靶序列870。部分二级靶序列870通过使用5’引物871和3’引物872扩增而产生三级靶序列880,其可如本文所述标记及检测。三级靶序列880会形成大多数扩增产物。
在杂交复合物841中,开环探针520用与靶延伸结构域301互补的碱基对延伸,形成延伸的开环探针851。开环探针520包含地址序列115(不同于地址序列111)和询问核苷酸116,其不与检测核苷酸101形成互补碱基对。因此无连接发生。开环探针520由此,例如,通过经外切核酸酶降解来自样品移出。地址序列115由此不扩增。
图14显示一类竞争性延伸和连接测定,其中一种探针包含地址盒和另一探针包含结合标记物。此实施方式还在以下进一步描述。
【游离碱基测定】
图9,10,11和12显示如何实施“游离碱基”或“游离的核苷酸”测定的例。在此实施方式中,无连接探针起初包含询问核苷酸。测定通过将相同的连接探针但不同游离的核苷酸添加到独立反应容器来实施。连接探针任选地在地址序列上不同。当游离的核苷酸与检测核苷酸形成互补碱基对时,延伸和连接可在2个连接探针的端之间或相同的连接探针的端之间发生。
在图9中,一级靶序列100包含检测核苷酸101,第1靶结构域102和第2靶结构域103。第1连接探针110包含地址序列111,第1引发结构域112和第1杂交结构域113。第2连接探针120包含第2杂交结构域121,切割位点122和第2引发结构域123。第1杂交结构域113与第1靶结构域102互补由此杂交。第2杂交结构域121与第2靶结构域103互补由此杂交。杂交复合物940由此形成。因为游离的核苷酸G和检测核苷酸101之间的互补碱基配对,聚合酶可用游离的核苷酸G延伸第1连接探针110。延伸的第1连接探针950的末端核苷酸然后连接于第2连接探针的接近端。连接后,环化酶接合连接的探针960的端而形成环化的探针970。环化的探针970然后在切割位点切割而产生二级靶序列980。部分二级靶序列980通过使用5’引物981和3’引物982扩增而产生三级靶序列990,其可如本文所述标记及检测。
在分离容器中,杂交复合物941包括包含不同于地址序列111的地址序列115的第1连接探针130。在一些实施方式中,全部容器使用具有相同的地址序列的相同的第1连接探针。游离的核苷酸T不与检测核苷酸101形成互补碱基对。因此不发生延伸和连接。探针然后环化。环状物质991不线性化及未扩增,如果,例如,使用具有5’-3’外切核酸酶活性及缺少链位移活性的聚合酶。环状物质992线性化为物质993,其未扩增,因为用于扩增的5’引物与第2引发结构域具有相同的序列,因此不会结合。地址序列115由此不扩增。
图10显示与图9中显示的相同的通用的测定,除了靶序列100的第1靶结构域102在第2靶结构域103的5’之外。游离的核苷酸G和检测核苷酸101之间的互补碱基配对允许形成延伸的第2连接探针1050。延伸的第2连接探针1050和第1连接探针之间的连接产生连接的探针1060,其环化而形成环化的探针1070。环化的探针1070然后在切割位点切割而产生二级靶序列1080。部分二级靶序列1080通过使用5’引物1081和3’引物1082扩增而产生三级靶序列1090,其可如本文所述标记及检测。三级靶序列1090会形成大多数扩增产物。
在分离的容器中,杂交复合物1041包括包含不同于地址序列111的地址序列115的第1连接探针130。在一些实施方式中,全部容器使用具有相同的地址序列的相同的第1连接探针。游离的核苷酸T不与检测核苷酸101形成互补碱基对。因此不发生延伸和连接。探针然后环化。环状物质1092不线性化及未扩增,如果,例如,使用具有5’-3’外切核酸酶活性及缺少链位移活性的聚合酶。环状物质1091线性化为物质1093及扩增,但扩增子1094缺乏地址序列,且在例示实施方式中不会被检测到。
图11显示游离碱基测定,其中开环探针1110与一级靶序列100杂交。因为游离的核苷酸G和检测核苷酸101之间的互补碱基配对,聚合酶可用游离的核苷酸G延伸开环探针1110。延伸的开环探针1150的末端核苷酸可连接于探针的另一端,由此形成圆形探针1160。圆形探针1160然后在切割位点切割而产生二级靶序列1170。部分二级靶序列1170通过使用5’引物1171和3’引物1172扩增而产生三级靶序列1180,其可如本文所述标记及检测。
在分离的容器中,杂交复合物1141包括包含不同于地址序列111的地址序列115的开环探针1120。在一些实施方式中,全部容器使用具有相同的地址序列的相同的开环探针。游离的核苷酸T不与检测核苷酸101形成互补碱基对。因此不发生延伸和连接。开环探针1120,例如,通过经外切核酸酶降解而从样品除去。地址序列115由此不扩增。
图12显示与图11中显示的相同的通用的测定,除了靶序列100的第1靶结构域102在第2靶结构域103的5’之外。游离的核苷酸G和检测核苷酸101之间的互补碱基配对允许形成延伸的开环探针1260。延伸的开环探针1260的端的连接产生连接的探针1270。连接的探针1270然后在切割位点切割而产生二级靶序列1280。部分二级靶序列1280通过使用5’引物1281和3’引物1282扩增而产生三级靶序列1290,其可如本文所述标记及检测。三级靶序列1290会形成大多数扩增产物。
在分离的容器中,杂交复合物1241包括包含不同于地址序列111的地址序列115的第1连接探针130。在一些实施方式中,全部容器使用具有相同的地址序列的相同的第1连接探针。游离的核苷酸T不与检测核苷酸101形成互补碱基对。因此不发生延伸和连接。开环探针1120,例如,通过经外切核酸酶降解而从样品除去。地址序列115由此不扩增。
图15和16显示一类游离碱基测定,其中一种探针包含地址盒和另一探针包含结合标记物。此实施方式还在以下进一步描述。
【捕获测定】
图13~16显示捕获测定的例,其可以竞争性或游离碱基形式进行,且可包含简单连接或连接和延伸二者。在此实施方式中,第1连接探针包含地址盒,第2连接探针包含结合标记物。测定组分可由固体支持物捕获,然后可进一步分析,以测定是否发生了连接。
在图13中,第1连接探针1310包含地址盒(包含第2引发结构域123,第1地址序列111和第1引发结构域112),第1杂交结构域113和询问核苷酸114。第2连接探针1320包含第2杂交结构域121和结合标记物(例如,生物素)1301。第1杂交结构域113与第1靶结构域102互补由此杂交。第2杂交结构域121与第2靶结构域103互补由此杂交。杂交复合物1340由此形成。因为询问核苷酸114和检测核苷酸101之间的互补碱基配对,连接可在询问核苷酸114到第2连接探针的接近端之间发生。连接的探针1350然后由附接于固体支持1360的捕获配体1361捕获,其可然后洗涤。部分连接的探针,诸如地址盒,通过使用5’引物1362和3’引物1363扩增而产生衍生物(二级)靶序列1370,其可如本文所述标记及检测。
在杂交复合物1341中,第1连接探针1330包含地址序列115和询问核苷酸116,其不与检测核苷酸101形成互补碱基对。因此无连接发生。然后捕获第2连接探针。第2连接探针通过使用5’引物和3’引物也不会扩增,由于其不含有用于那些引物的引发位点,因此无扩增产物会被检测到。
图14显示与图13中显示的相同的测定,除了实施另外的延伸步骤之外。因为询问核苷酸114和检测核苷酸101之间的互补碱基配对,聚合酶可用与靶延伸结构域301互补的碱基对延伸第1连接探针1410,形成延伸的第1连接探针1450。延伸的第1连接探针1450的末端核苷酸连接于第2连接探针的接近端而形成连接的探针1460。连接的探针1460然后由附接于固体支持1470的捕获配体1471捕获,其可然后洗涤。部分连接的探针,诸如地址盒,通过使用5’引物1472和3’引物1473扩增而产生衍生物(二级)靶序列1480,其可如本文所述标记及检测。
在杂交复合物1441中,第1连接探针1430包含地址序列115和询问核苷酸116,其不与检测核苷酸101形成互补碱基对。因此无延伸和无连接发生。然后捕获第2连接探针。第2连接探针通过使用5’引物和3’引物也不会扩增,由于其不含有用于那些引物的引发位点,因此无扩增产物会被检测到。
类似于图2,4,6,8,10和12中显示的测定,图13和14中显示的测定可在一级靶序列上实施,其中第1靶结构域在第2靶结构域的5’。
可以游离碱基形式在分离的容器中实施使用包含地址盒的第1连接探针和包含结合标记物的第2连接探针的测定。
在图15中,第1连接探针1510包含地址盒(包含第2引发结构域123,第1地址序列111和第1引发结构域112)和第1杂交结构域113。第2连接探针1320包含第2杂交结构域121和结合标记物(例如,生物素)1301。第1杂交结构域113与第1靶结构域102互补由此杂交。第2杂交结构域121与第2靶结构域103互补由此杂交。杂交复合物1540由此形成。因为游离的核苷酸G和检测核苷酸101之间的互补碱基配对,聚合酶可用游离的核苷酸G延伸第1连接探针110。延伸的第1连接探针1550的末端核苷酸然后连接于第2连接探针的接近端而形成连接的探针1560。连接的探针1560然后由附接于固体支持1560的捕获配体1561捕获,其可然后洗涤。部分连接的探针,诸如地址盒,通过使用5’引物1562和3’引物1563扩增而产生衍生物(二级)靶序列1570,其可如本文所述标记及检测。
在分离的容器中,杂交复合物1541包括包含不同于地址序列111的地址序列115的第1连接探针130。在一些实施方式中,全部容器使用具有相同的地址序列的相同的第1连接探针。游离的核苷酸T不与检测核苷酸101形成互补碱基对。因此不发生延伸和连接。然后捕获第2连接探针。第2连接探针通过使用5’引物和3’引物也不会扩增,由于其不含有用于那些引物的引发位点,因此无扩增产物会被检测到。
图16显示图15中显示的相同的通用的测定,除了靶序列100的第1靶结构域102在第2靶结构域103的5’之外。游离的核苷酸G之间的互补碱基配对允许形成延伸的第2连接探针1650。延伸的第2连接探针1650和第1连接探针之间的连接产生连接的探针1660。连接的探针1660然后由附接于固体支持1670的捕获配体1671捕获,其可然后洗涤。部分连接的探针,诸如地址盒,通过使用5’引物1672和3’引物1673扩增而产生衍生物(二级)靶序列1680,其可如本文所述标记及检测。三级靶序列1680会形成大多数扩增产物。
在分离的容器中,杂交复合物1641包括包含不同于地址序列111的地址序列115的第1连接探针130。在一些实施方式中,全部容器使用具有相同的地址序列的相同的第1连接探针。游离的核苷酸T不与检测核苷酸101形成互补碱基对。因此不发生延伸和连接。然后捕获第2连接探针。第2连接探针通过使用5’引物和3’引物也不会扩增,由于其不含有用于那些引物的引发位点,因此无扩增产物会被检测到。
在任何图中,可知,第2连接探针显示包含切割位点,第1连接探针可代替或除了第2连接探针之外包含切割位点。例如,图中显示的或在本文描述的任何第1连接探针可在第1引发结构域和第1杂交结构域之间包含切割位点。
此外,结合标记物诸如生物素可在图中显示的任何组分的各种部分合并。例如,在图1~12中,生物素或其他结合标记物可在第2杂交结构域和切割位点之间合并。以此方式使用结合标记物可辅助或改善显示的各种物质的检测。例如,在图中显示的探针中合并结合标记物可允许探针结合到固体支持物,其可洗涤,从而仅保留目标物质。
【应用】
本文所述的组合物和方法可在广泛的应用中采用。在一些实施方式中,本发明的筛选或基因分型方法可用于检测至少一个遗传座位的至少一种等位基因。在一特别有用的实施方式中,在本文的基因分型方法用于检测在胚胎基因组中发现的等位基因。目前知道的出生前诊断方法一般涉及侵袭性技术诸如羊膜腔穿刺术,移出绒毛膜绒毛和移出胚胎血或组织活组织检查。已描述基于就胚胎细胞富集母源血样品的及分析样品中细胞群以鉴定胚胎细胞的非-侵袭性方法。见国际公开WO2008/048931和WO2010/075459。Lo,美国专利No.6,258,540公开对母源血样品实施出生前诊断的方法,该方法包括获得血样品的非-细胞级分,自非-细胞级分扩增父源地遗传的核酸,及对扩增的核酸实施核酸分析,以检测父源地遗传的胚胎核酸。但是,本文所述的基因分型方法,不需要及在特定实施方式中不扩增一级靶序列,诸如自父亲或母亲遗传的胚胎基因组DNA。
本基因分型方法可与本领域知道的测定胚胎基因变体的方法组合。例如,Oliphant,国际公开WO2010/075459,其内容在本文通过引用以其整体合并,尤其描述了对母源样品基因分型的方法,获得母源和胚胎细胞的混合物,及就胚胎细胞浓缩样品,及分为子样品。选择母源样品是纯合的一组至少一个靶座位用于子样品的筛选或基因分型。在这些座位中的至少一个个别筛选或基因分型各子样品,杂合基因型的检测指示子样品中非-母源等位基因的存在。或者,选择母源样品是杂合的一组至少一个靶座位用于子样品的筛选或基因分型。在这些座位中的至少一个个别筛选或基因分型各子样品,纯合基因型的检测指示子样品中非-母源等位基因的存在。本文所述的基因分型方法特别适合在描述于Oliphant的该及其他方法中使用,及提供不扩增和/或检测胚胎DNA地,特别通过扩增和/或检测人工,非-基因组序列地检测胚胎DNA的方式。
本领域会同意,可测试广泛数的不同SNP或其他类型的多态性,以进行等位基因母源样品是纯合的测定。例如,Oliphant,国际公开WO2010/075459,公开了设计对于鉴定样品中的胚胎遗传物质有用的SNP组的方法。可使用任意数的常见的SNP/等位基因。一般而言,起初评价一组SNP以进行等位基因母源样品是纯合的测定。此组可为1~200,10~150有用,及50~100特别有用。在一些实施方式中,就母源纯合性测试的SNP组选自dbSNP登录记录中公开的SNP的任何组合:rs1424506,rs207509,rs1004044,rs1673003,rs4789798,rs1887889,rs207509,rs4593206,rs189664,rs1006779,rs7027512,rs165924,rs6803756,rs207509,rs4684327,rs239683,rs1014803,rs598416,rs2830169,rs448887,rs220162,rs4982485,rs2825069,rs1014803,rs576762,rs10129348,rs13151776,rs2205533,rs2650957,rs2830234,rs11087884,rs1419747,rs2269355,rs12920309,rs2205533,rs35748020,rs2838818,rs1153280,rs731750,rs2242360,rs6581667,rs2268262,rs2391110,rs2010355,rs1153280,rs3788696,rs658857,rs1263416,rs2824547,rs2306612,rs1153280,rs11700636,rs6902513,rs11074601,rs7462034,rs2829694,rs354359,rs1537852,rs11700636,rs1522666,rs10758556,rs1241633,rs2832668,rs1864462,rs2268262,rs12482516,rs224065,rs3784301,rs2130643,rs2833756,rs10805396,rs879261,rs12482516,rs1039753,rs10217351,rs7589684,rs2839619,rs6955206,rs6687726,rs12626413,rs6533225,rs1111832,rs2249102,rs3787659,rs13332281,rs2205533,rs12626873,rs1841946,rs12423234,rs13406272,rs3787728,rs1830138,rs2725303,rs13049530,rs12662883,rs1572641,rs3213856,rs3787831,rs7155331,rs3818,rs13049530,rs2270433,rs1554472,rs2634421,rs3787894,rs1889819,rs9888005,rs1537852,rs224147,rs10815923,rs7311115,rs3788097,rs7585579,rs723469,rs1543754,rs1456017,rs1335788,rs1495772,rs3853054,rs6844640,rs1481065,rs1543754,rs4437273,rs6475240,rs721457,rs461853,rs13095333,rs284877,rs1921361,rs11071641,rs2182957,rs11161520,rs587085,rs220162,rs2241145,rs2000490,rs7573728,rs1923874,rs4271524,rs7279064,rs11087884,rs4144457,rs2000490,rs4753881,rs2812148,rs1385161,rs917580,rs3787728,rs9610714,rs2032652,rs11624331,rs2834708,rs324554,rs3787831,rs7875113,rs2064391,rs2182241,rs747039,rs11935170,rs3788097,rs2834924,rs2064391,rs7295630,rs8130025和rs4368579。dbSNP是细节化遗传变异的记录的在线公共档案,其可由以上提供的参考号的方式访问。
在其他实施方式中,通过选择一个或另一亲本是纯合(通常但不总是母亲)的SNP,本发明的测定可以利用相比正常需要的更少标记物的形式进行。在这些实施方式中,不是标记全部探针,而仅标记非-纯合等位基因。例如,推定第1SNP,其在检测位置是A/G,及一个亲本是纯合A,仅标记G探针;类似地,第2SNP,其是T/C,一个亲本是纯合T,仅标记C探针。以此方式,通过使用更少标记物获得更多信息。
【合成测序库】
本发明的组合物和方法可用于产生合成核酸库。该合成核酸库可用于测序或在寡核苷酸阵列中。在特定实施方式中,本发明的方法和组合物用于产生编码靶座位或等位基因的合成核酸库。在其他实施方式中,可同时使用多种连接探针,各包含不同询问核苷酸。在例示实施方式中,使用多组连接探针,各探针包含不同于组中各其他连接探针的各其他询问核苷酸的询问核苷酸。
在本实施方式的另一方面,连接探针包含座位或等位基因指标序列及,任选地,样品指标序列。座位或等位基因指标序列可编码由连接探针靶向的座位或等位基因的一些或全部。样品指标序列提供对于多重的选项。样品指标序列可用于鉴定靶序列源。例如,包含第1样品指标序列的一个或更多连接探针可允许与自第1源,该第1受试者获得的样品中含有的靶序列结合。独立地,包含不同于第1样品指标序列的第2样品指标序列的一个或更多连接探针可允许与自第2源,诸如第2受试者获得的样品中含有的靶序列结合。自两样品的连接探针可然后合并及在单运行中分析。例如,可将合并的样品与单DNA阵列芯片接触或可沉淀进电泳的单泳道中。本发明的连接探针中座位或等位基因指标序列的供应辅助靶座位或等位基因的鉴定及计数。本文所述的方法可用于产生与样品中靶序列的各组分是1:1的库。库组分可计数,例如通过测序。以此方式,测序平台发挥样品中序列的数字计算器的作用。
在一些实施方式中,由本发明的方法和组合物产生的序列库寡核苷酸的长度是由特定测序技术(例如.Illumina HiSeq)优选的长度。在特定方面,合成库寡核苷酸是约25~50bp,约50~100bp,约100~500bp,或约500~1000bp。
合成测序库的组分可合并可对于降低可在各种应用中出现的误差或伪像的有用的任意数的合成序列。本文公开的任何适配体,指标序列或地址序列可设计为就它们的旨在的用途优化序列。例如,本领域知道,核酸扩增可由于GC碱基对的存在而偏倚。因此,合成序列可设计为提供均一的GC分布,以便最小化偏倚。
在其他实施方式中,误差修正代码包括在本发明的方法中使用的指标寡核苷酸中。该误差修正代码对于补偿测序误差有用(见,例如,美国专利申请公开No.2007/0042372)。误差修正代码的例包括,例如,环状冗余检查的类似物。在一些实施方式中,功能可用于标位知道的序列到误差修正代码,诸如检查值。功能可然后应用于测序结果,以产生可与误差修正代码比较的测试值。测试值和误差修正代码之间的差异可警戒医师测序结果中的潜在误差。