通过聚合酶结合进行的基因分型
相关申请的交叉引用
本申请要求2017年1月20日提交的美国临时申请号62/448,630的权益,所述临时申请特此以引用的方式整体并入。
背景技术
核酸序列的小差异可导致生物学功能的显著差异。例如,人基因组中的单核苷酸多态性(SNP)是疾病易感性的差异的基础。广泛范围的人疾病,如镰状细胞性贫血、β-地中海贫血、阿尔茨海默氏病和囊性纤维化由SNP引起。基因分型和DNA测序的最新进展已经鉴定了与发展各种疾病和疾患的可能性相关的大量SNP。此类SNP可适用于它们一直与其相关的疾病或疾患的诊断和预后。此外,许多这些SNP可能是治疗上相关的遗传变体和/或参与疾病的遗传易感性。然而,准确的诊断相关性通常需要针对大量个体评价大SNP组(例如在全基因组规模上)。目前可用的方法昂贵且耗时,这对于将所述方法扩展至临床上有意义的水平是不利的。
因此,对于通常在许多个体中检测多种SNP或其他核酸多态性的有效方法存在需要。本公开满足了这种需要并且也提供了相关的优点。
发明内容
本公开提供了一种用于鉴定核酸混合物中的靶等位基因的方法。所述方法可包括以下步骤:(a)在阵列上的多个特征处形成多种稳定化的三元复合物,其中所述稳定化的三元复合物各自具有聚合酶、具有基因座的靶等位基因的模板核酸、与所述基因座杂交的引物,以及在所述基因座中具有同源物的下一个正确的核苷酸,其中(i)所述引物是具有3'核苷酸的等位基因特异性引物,所述3'核苷酸是所述靶等位基因的同源核苷酸,或者(ii)所述引物是基因座特异性引物,并且所述下一个正确的核苷酸与所述靶等位基因杂交;以及(b)检测所述特征处的稳定化的三元复合物,从而鉴定所述靶等位基因。
在一些实施方案中,所述用于鉴定核酸混合物中的靶等位基因的方法可包括以下步骤:(a)提供特征的阵列,其中不同的基因座特异性引物附接在所述阵列的不同特征处;(b)使所述阵列与多种核酸模板、聚合酶和核苷酸接触以在多个所述特征处形成多种稳定化的三元复合物,其中所述稳定化的三元复合物各自具有聚合酶、具有基因座的靶等位基因的模板核酸、与所述基因座杂交的基因座特异性引物,以及下一个正确的核苷酸,所述下一个正确的核苷酸是所述靶等位基因的同源物;以及(c)检测所述特征处的稳定化的三元复合物,从而鉴定所述靶等位基因。
所述用于鉴定核酸混合物中的靶等位基因的方法的替代实施方案可包括以下步骤:(a)提供特征的阵列,其中不同的等位基因特异性引物附接在所述阵列的不同特征处;(b)使所述阵列与多种核酸模板、聚合酶和核苷酸接触以在多个所述特征处形成多种稳定化的三元复合物,其中所述稳定化的三元复合物各自具有聚合酶、具有基因座的靶等位基因的模板核酸、与所述基因座杂交的等位基因特异性引物,以及在所述基因座中具有同源物的下一个正确的核苷酸,其中所述等位基因特异性引物的3'端具有所述靶等位基因的同源核苷酸;以及(c)检测所述特征处的稳定化的三元复合物,从而鉴定所述靶等位基因。
本公开进一步提供了一种用于鉴定核酸混合物中的靶等位基因的方法,所述方法包括以下步骤:(a)提供特征的阵列,其中不同的基因座特异性引物附接在所述阵列的所述特征的第一子集处,并且其中不同的等位基因特异性引物附接在所述阵列的所述特征的第二子集处;(b)使所述阵列与多种核酸模板、聚合酶和核苷酸接触以在多个所述特征处形成多种稳定化的三元复合物,其中所述第一特征子集处的所述稳定化的三元复合物各自具有聚合酶、具有基因座的靶等位基因的模板核酸、与所述基因座杂交的基因座特异性引物,以及下一个正确的核苷酸,所述下一个正确的核苷酸是所述靶等位基因的同源物,其中所述第二特征子集处的所述稳定化的三元复合物各自具有聚合酶、具有基因座的靶等位基因的模板核酸、与所述基因座杂交的等位基因特异性引物,以及在所述基因座中具有同源物的下一个正确的核苷酸,并且其中所述等位基因特异性引物的3'端具有所述靶等位基因的同源核苷酸;以及(c)检测所述特征处的稳定化的三元复合物,从而鉴定所述靶等位基因。
还提供了一种用于鉴定核酸混合物中的靶等位基因的方法,所述方法包括以下步骤:(a)提供特征的阵列,其中不同的模板核酸附接在所述阵列的不同特征处;(b)使所述阵列与多种引物、聚合酶和核苷酸接触以在多个所述特征处形成多种稳定化的三元复合物,其中所述特征处的所述稳定化的三元复合物各自具有聚合酶、与所述阵列的特征附接且具有基因座的靶等位基因的模板核酸、与所述基因座杂交的引物,以及在所述基因座中具有同源物的下一个正确的核苷酸,其中(i)所述引物是具有3'核苷酸的等位基因特异性引物,所述3'核苷酸是所述靶等位基因的同源核苷酸,或者(ii)所述引物是基因座特异性引物,并且所述下一个正确的核苷酸与所述靶等位基因杂交;以及(c)检测所述特征处的稳定化的三元复合物,从而鉴定所述靶等位基因。
进一步提供了一种用于鉴定核酸混合物中的靶等位基因的方法,所述方法包括以下步骤:(a)提供特征的阵列,其中聚合酶附接在所述阵列的特征处;(b)使所述阵列与多种引物、模板核酸和核苷酸接触以在多个所述特征处形成多种稳定化的三元复合物,其中所述特征处的所述稳定化的三元复合物各自具有附接在所述阵列的特征处的聚合酶、具有基因座的靶等位基因的模板核酸、与所述基因座杂交的引物,以及在所述基因座中具有同源物的下一个正确的核苷酸,其中(i)所述引物是具有3'核苷酸的等位基因特异性引物,所述3'核苷酸是所述靶等位基因的同源核苷酸,或者(ii)所述引物是基因座特异性引物,并且所述下一个正确的核苷酸与所述靶等位基因杂交;以及(c)检测所述特征处的稳定化的三元复合物,从而鉴定所述靶等位基因。
附图说明
图1A是示出使用聚合酶(表示为饼形)、与模板结合的等位基因特异性引物和结合在所述模板上与所述等位基因位置相邻的位置处的同源核苷酸的等位基因特异性三元复合物形成的图解表示的示意图。
图1B是示出使用聚合酶(表示为饼形)、等位基因特异性同源核苷酸和结合在与所述等位基因位置相邻的区域处的基因座引物的等位基因特异性三元复合物形成的图解表示的示意图。
图2是示出根据由在稳定化的三元复合物中结合至阵列的不同特征处的等位基因特异性引物的标记产生的信号的位置在空间上区分等位基因的检测方法的图解的示意图。
图3是示出基于在稳定化的三元复合物中结合至存在于阵列的单个特征内的基因座特异性引物的差异标记的核苷酸区分基因座的等位基因的检测方法的图解的示意图。
图4是示出使用非标记光学检测方法的结合测定的结果的图,其中引发的模板、聚合酶和核苷酸在镁存在或不存在下一起孵育。
图5是示出盐浓度对在Octet仪器(Menlo Park,CA)上使用生物层干涉测量法的匹配和错配碱基辨别效应的影响的图。
具体实施方式
本公开提供了用于检测或鉴定目标靶等位基因的基于聚合酶的方法。所述方法的实施方案利用聚合酶可与引发的模板和下一个正确的核苷酸形成稳定化的三元复合物的特异性。例如,可在聚合酶、具有靶等位基因的引发的模板和等位基因的同源核苷酸之间形成稳定化的三元复合物。所述方法的一个优点是聚合酶特异性允许靶等位基因与其他核酸区分开,包括例如与靶等位基因(在一些情况下仅因单个核苷酸)不同的其他等位基因。例如,可在聚合酶、编码靶单核苷酸多态性(SNP)等位基因的引发的模板和SNP等位基因的同源核苷酸之间形成三元复合物。与同一基因座处的非靶SNP等位基因相比,三元复合物的检测将导致SNP等位基因的选择性检测,因为当与聚合酶形成三元复合物时,同源核苷酸对靶SNP具有选择性。
本文阐述的方法和组合物可用于检测在其序列内含有各种突变的稀有等位基因(例如基于DNA或RNA的)。所述方法非常适合于从含有相同基因座的野生型DNA序列以及其他不相关序列的纯化或半纯化的寡核苷酸池检测甚至稀有变体等位基因。图1示出可用于形成等位基因特异性三元复合物的两种不同引物-核苷酸组合的图解表示。如图1A所示,可使用等位基因特异性引物,以使得引物的3'端选择性地与特定基因座处的靶等位基因匹配,但与所述基因座处的其他等位基因错配。例如,在单核苷酸多态性(SNP)基因座的情况下,引物的3'端与所述基因座的位置N处的靶向SNP等位基因C碱基配对,但不与所述基因座的位置N处的等位基因A碱基配对。在对于所述基因座的位置N+1添加聚合酶和下一个正确的核苷酸(即图中的ATP)后,可在不与错配的非靶等位基因形成稳定化的三元复合物的条件下,针对靶等位基因选择性地形成稳定化的三元复合物。
或者,如图1B所示,可使用基因座特异性引物,所述基因座特异性引物结合至特定基因座的多个等位基因,以使得所述基因座引物的3'端与所述基因座的N-1位置碱基配对。这种构型使目标靶等位基因(在位置N处)可用于结合至等位基因特异性同源核苷酸。再次,以SNP基因座为例,引物与两个等位基因杂交。在添加聚合酶和靶SNP的同源核苷酸(即靶SNP为C且同源核苷酸为图中的GTP)后,可在不与非靶A等位基因形成稳定化的三元复合物的条件下针对靶等位基因选择性地形成稳定化的三元复合物。
使用等位基因特异性引物的示例性检测模式在图2中示出。第一等位基因特异性引物存在于阵列的第一特征处,并且第二等位基因特异性引物存在于所述阵列的第二特征处。顶部特征的引物具有与A等位基因互补的3’T,并且底部特征处的引物具有与C等位基因互补的G。在第一步骤中,将核酸模板的混合物与阵列杂交。出于说明的目的,在图中所示的混合物中仅存在C等位基因。在顶部特征处产生错配,而在底部特征处产生完美匹配。然后使所述阵列与聚合酶和都具有相同标记的四种不同核苷酸类型的混合物(具有由图中的实心圆圈表示的标记的NTP)。所述顶部特征处的错配抑制聚合酶结合,而所述底部特征处的匹配的杂合体可结合聚合酶和下一个正确的核苷酸以形成稳定化的三元复合物。任选地,可在标记的核苷酸存在下洗涤所述阵列,以从所述特征中进一步除去污染物。然后可使用在空间上解析特征并感测所述标记的存在或不存在的装置来检测所述阵列。在这种情况下,检测将显示C等位基因存在(即,因为在下部特征处检测到信号),并且A等位基因不存在(即,因为在顶部特征处未检测到信号)。图2中的构型是一个实例,其中由于所述阵列上的空间位置,可区分不同基因座和相应基因座的不同等位基因。
图3示出利用可区分标记的基因座特异性引物和等位基因特异性同源核苷酸的检测方法的图解表示。在第一步骤中,使具有不同等位基因的核酸模板与具有基因座特异性引物的多个拷贝的阵列上的特征杂交。在所示的实例中,两个不同的等位基因结合在所述特征处。然后在具有不同标记的两种不同核苷酸类型(具有由图中的实心圆圈指示的第一标记的GTP和具有由图中的空心圆圈指示的第二标记的TTP)存在下使聚合酶结合至引物-模板杂合体以形成稳定化的三元复合物。任选地,可在标记的核苷酸存在下洗涤所述阵列,以从所述特征中进一步除去污染物。然后可使用区分所述两种标记的装置来检测所述阵列。在这种情况下,检测将显示在所述特征处存在两个等位基因。图3中的构型是一个实例,其中由于阵列上的空间位置而可区分不同的基因座,并且由于每个特征处的等位基因特异性同源核苷酸的差异标记而可区分等位基因。
除非另有说明,否则本文所用的术语将被理解为具有它们在相关技术中的普通含义。本文所用的若干术语及其含义在以下列出。
如本文所用,术语“等位基因”当关于遗传基因座使用时,是指在遗传基因座处出现的替代核苷酸、序列或其他遗传特征中的任一者。示例性等位基因包括但不限于在基因座处出现的单核苷酸多态性(SNP)、插入和/或缺失(插入缺失)、替代mRNA剪接位点或重复。
如本文所用,术语“等位基因特异性引物”是指与基因座的一个等位基因互补而不与所述基因座的另一个等位基因互补的寡核苷酸。等位基因特异性引物的一部分可与两个等位基因互补,只要引物中的至少一个核苷酸是所述等位基因中的仅一个的同源物。例如,等位基因特异性引物可具有3'核苷酸,所述3'核苷酸是基因座处的第一等位基因的同源物,但不是所述基因座处的第二等位基因的同源物。应当理解,等位基因特异性引物可具有缺乏与任一等位基因的互补性的部分,例如标签或接头。
如本文所用,术语“阵列”是指与一个或多个固相基底附接、以使得一个特征处的分子可与其他特征处的分子区分开的分子群体。阵列可包括不同的分子,所述分子各自位于固相基底上的不同可寻址特征处。或者,阵列可包括单独的固相基底,所述固相基底各自用作携带不同分子的特征,其中可根据固相基底在所述固相基底所附接至的表面上的位置或根据所述固相基底在诸如流体流的液体中的位置来鉴定不同的探针分子。所述阵列的分子可以是核苷酸、核酸引物、核酸探针、核酸模板或核酸酶,如聚合酶、连接酶或核酸外切酶。
如本文所用,术语“二元复合物”是指聚合酶与引发的模板核酸之间的分子间缔合,不包括诸如所述引发的模板核酸的下一个正确的核苷酸的核苷酸分子。
如本文所用,术语“催化金属离子”是指通过聚合酶促进核酸(例如引物)的3'-OH与引入的核苷酸的磷酸酯之间的磷酸二酯键形成的金属离子。“二价催化金属阳离子”是化合价为2的催化金属离子。催化金属离子可以使聚合酶、核苷酸和引发的模板核酸之间的复合物形成稳定的浓度(被称为金属离子的非催化浓度)存在,只要不发生磷酸二酯键形成即可。金属离子的催化浓度是指足以使聚合酶催化核酸(例如引物)的3'-OH基团与引入的核苷酸的磷酸酯基团之间的反应的金属离子的量。
如本文所用,术语“包括”在本文中意图是开放式的,不仅包括所列举的要素,而且还涵盖任何另外的要素。
如本文所用,在关于项目的集合使用时,术语“每个”意图鉴定集合中的个别项目,但不一定是指集合中的每个项目。如果明确的公开或上下文清楚地另外指示,则可出现例外情况。
如本文所用,术语“外源的”当关于分子的部分使用时,是指不存在于分子的天然类似物中的化学部分。例如,核苷酸的外源标记是不存在于天然存在的核苷酸上的标记。类似地,聚合酶上存在的外源标记未在其天然环境中的聚合酶上发现。
如本文所用,术语“延伸”当关于核酸使用时,是指将至少一个核苷酸添加至所述核酸的3'端的过程。通过延伸添加至核酸中的核苷酸被称为并入所述核酸中。因此,术语“并入”可用于指通过磷酸二酯键的形成将核苷酸连接至核酸的3'端的过程。
如本文所用,术语“特征”是指阵列中存在特定分子的位置。特征可仅含有单个分子,或者它可含有相同物种的若干分子的群体。或者,特征可包括为不同物种的分子群体(例如具有不同模板序列的三元复合物的群体)。阵列的特征通常是离散的。离散特征可以是连续的,或者它们可在彼此之间具有空间。可用于本文的阵列可具有例如相隔小于100微米、50微米、10微米、5微米、1微米或0.5微米的特征。可替代地或另外地,阵列可具有相隔大于0.5微米、1微米、5微米、10微米、50微米或100微米的特征。所述特征可各自具有小于1平方毫米、500平方微米、100平方微米、25平方微米、1平方微米或更小的面积。
如本文所用,术语“凝胶材料”意图表示对液体和气体是可渗透的半刚性材料。通常,凝胶材料可在吸收液体时溶胀,并且可在通过干燥除去液体时收缩。示例性凝胶包括但不限于具有胶体结构的那些,如琼脂糖;具有聚合物网状结构的那些,如明胶;或具有交联聚合物结构的那些,如聚丙烯酰胺。有用的凝胶描述于例如美国公布号2011/0059865和美国专利号9,012,022中,所述专利各自以引用的方式并入本文。
术语“基因座”当关于核酸使用时,是指核酸中出现核苷酸、核酸序列、插入缺失或其他遗传特征的位置。
如本文所用,术语“基因座特异性引物”是指与核酸中的第一基因座互补而不与所述核酸中的第二基因座互补的寡核苷酸,其中所述第一基因座的至少两个等位基因与所述寡核苷酸互补。例如,基因座特异性引物可与核酸中两个等位基因的位置附近或邻近的基因座的一部分互补。在后一种构型中,基因座特异性引物可与为等位基因的下一个模板核苷酸相邻的核酸杂交。应当理解,基因座特异性引物可具有缺乏与任一基因座的互补性的部分,例如标签部分或接头。
如本文所用,术语“下一个正确的核苷酸”是指将在引物的3'端结合和/或并入以补充所述引物与其杂交的模板链中的碱基的核苷酸类型。所述模板链中的碱基被称为“下一个模板核苷酸”,并且紧邻与所述引物的3'端杂交的模板中的碱基的5'。下一个正确的核苷酸可被称为下一个模板核苷酸的“同源无”,反之亦然。在三元复合物或双链核酸中彼此相互作用的同源核苷酸据称彼此“配对”。具有与下一个模板碱基不互补的碱基的核苷酸被称为“不正确”、“错配”或“非同源”核苷酸。
如本文所用,术语“非催化金属离子”是指当在聚合酶存在下不促进将核苷酸化学并入引物所需的磷酸二酯键形成的金属离子。非催化金属离子可例如与催化金属离子相比经由竞争性结合与聚合酶相互作用。“二价非催化金属离子”是化合价为2的非催化金属离子。二价非催化金属离子的实例包括但不限于Ca2+、Zn2+、Co2+、Ni2+和Sr2+。三价Eu3+和Tb3+离子是化合价为3的非催化金属离子。
如本文所用,术语“核苷酸”可用于指天然核苷酸或其类似物。实例包括但不限于核苷酸三磷酸(NTP),如核糖核苷酸三磷酸(rNTP)、脱氧核糖核苷酸三磷酸(dNTP)或其类似物,如双脱氧核糖核苷酸三磷酸(ddNTP)或可逆终止的核苷酸三磷酸(rtNTP)。其他核苷酸包括核苷酸单磷酸(NMP)及其类似物。
如本文所用,术语“聚合酶”可用于指核酸合成酶,包括但不限于DNA聚合酶、RNA聚合酶、逆转录酶、引发酶和转移酶。通常,聚合酶具有一个或多个活性位点,在所述一个或多个活性位点处可发生核苷酸结合和/或核苷酸聚合的催化。聚合酶可催化核苷酸聚合至双链核酸分子的第一链的3'端。例如,聚合酶经由磷酸二酯键催化下一个正确的核苷酸添加至双链核酸分子的第一链的3'OH基团,从而将所述核苷酸共价并入至所述双链核酸的第一链。任选地,聚合酶不需要能够在本文阐述的方法中使用的一种或多种条件下进行核苷酸并入。例如,突变型聚合酶可能能够形成三元复合物,但不能催化核苷酸并入。
如本文所用,术语“固体载体”是指不溶于水性液体中的刚性基底。所述基底可以是无孔的或多孔的。所述基底可任选地能够吸收液体(例如由于孔隙率),但通常将具有足够的刚性,以使得所述基底在吸收所述液体时基本上不会溶胀,并且在通过干燥除去所述液体时基本上不会收缩。无孔固体载体通常对液体或气体是不可渗透的。示例性固体载体包括但不限于玻璃和改性的或功能化的玻璃、塑料(包括丙烯酸类、聚苯乙烯以及苯乙烯与其他材料的共聚物、聚丙烯、聚乙烯、聚丁烯、聚氨酯、TeflonTM、环烯烃、聚酰亚胺等)、尼龙、陶瓷、树脂、Zeonor、二氧化硅或基于二氧化硅的材料(包括硅和改性硅)、碳、金属、无机玻璃、光纤束以及聚合物。
如本文所用,术语“三元复合物”是指聚合酶、双链核酸和核苷酸之间的分子间缔合。通常,聚合酶促进下一个正确的核苷酸与引发的核酸的模板链之间的相互作用。下一个正确的核苷酸可经由沃森-克里克(Watson-Crick)氢键合与模板链相互作用。术语“稳定化的三元复合物”是指具有促进的或延长的存在的三元复合物或已抑制其破坏的三元复合物。通常,三元复合物的稳定化防止三元复合物的核苷酸组分并入所述三元复合物的引发的核酸组分中。
如本文所用,术语“铺瓦式(tiled)”当关于阵列使用时,是指与靶核酸的连续区域互补的引物阵列,其中所述连续序列的大部分与所述阵列中的引物序列互补(或相同)。与引物序列互补的连续序列的大部分可以是例如所述连续序列的至少60%、75%、80%、90%、95%、98%、99%或更多。存在于铺瓦式阵列中的引物可与连续序列进行比对,以使得在比对中最近邻引物之间出现小空位和/或使得比对中的最近邻引物重叠。在比对中与连续序列相邻的最近邻引物序列可具有至多100个核苷酸、50个核苷酸、25个核苷酸、10个核苷酸、8个核苷酸、6个核苷酸、5个核苷酸、4个核苷酸、3个核苷酸、2个核苷酸或1个核苷酸的平均空位。或者或另外,在比对中与连续序列重叠的最近邻引物序列可具有至少1个核苷酸、2个核苷酸、3个核苷酸、4个核苷酸、5个核苷酸、6个核苷酸、8个核苷酸、10个核苷酸或更多的平均重叠。在铺瓦式阵列的相邻特征处的引物可具有在与连续区域的比对中为最近邻引物序列的序列。
根据以上定义可理解以下列出并且在权利要求书中阐述的实施方案。
本公开提供了一种用于鉴定核酸混合物中的靶等位基因的方法。所述方法可包括以下步骤:(a)提供特征的阵列,其中不同的基因座特异性引物附接在所述阵列的不同特征处;(b)使所述阵列与多种核酸模板、聚合酶和核苷酸接触以在多个所述特征处形成多种稳定化的三元复合物,其中所述稳定化的三元复合物各自具有聚合酶、具有带靶等位基因的基因座的模板核酸、与所述基因座杂交的基因座特异性引物,以及下一个正确的核苷酸,所述下一个正确的核苷酸是所述靶等位基因的同源物;以及(c)检测所述特征处的稳定化的三元复合物,从而鉴定所述靶等位基因。
上述实施方案使用基因座特异性引物和等位基因特异性核苷酸。或者,用于鉴定核酸混合物中的靶等位基因的方法可使用等位基因特异性引物。例如,所述方法可包括以下步骤:(a)提供特征的阵列,其中不同的等位基因特异性引物附接在所述阵列的不同特征处;(b)使所述阵列与多种核酸模板、聚合酶和核苷酸接触以在多个所述特征处形成多种稳定化的三元复合物,其中所述稳定化的三元复合物各自具有聚合酶、具有基因座的靶等位基因的模板核酸、与所述基因座杂交的等位基因特异性引物,以及在所述基因座中具有同源物的下一个正确的核苷酸,其中所述等位基因特异性引物的3'端具有所述靶等位基因的同源核苷酸;以及(c)检测所述特征处的稳定化的三元复合物,从而鉴定所述靶等位基因。
在一些实施方案中,可使用包括等位基因特异性引物和基因座特异性引物两者的阵列。因此,本公开提供了一种用于鉴定核酸混合物中的靶等位基因的方法,所述方法包括以下步骤:(a)提供特征的阵列,其中不同的基因座特异性引物附接在所述阵列的所述特征的第一子集处,并且其中不同的等位基因特异性引物附接在所述阵列的所述特征的第二子集处;(b)使所述阵列与多种核酸模板、聚合酶和核苷酸接触以在多个所述特征处形成多种稳定化的三元复合物,其中所述第一特征子集处的所述稳定化的三元复合物各自具有聚合酶、具有基因座的靶等位基因的模板核酸、与所述基因座杂交的基因座特异性引物,以及下一个正确的核苷酸,所述下一个正确的核苷酸是所述靶等位基因的同源物,其中所述第二特征子集处的所述稳定化的三元复合物各自具有聚合酶、具有基因座的靶等位基因的模板核酸、与所述基因座杂交的等位基因特异性引物,以及在所述基因座中具有同源物的下一个正确的核苷酸,并且其中所述等位基因特异性引物的3'端具有所述靶等位基因的同源核苷酸;以及(c)检测所述特征处的稳定化的三元复合物,从而鉴定所述靶等位基因。
本文描述了用于检测具有目标靶序列(如靶等位基因)的核酸的基于聚合酶的方法。所述方法的实施方案利用聚合酶可与靶等位基因和所述等位基因的同源核苷酸形成稳定化的三元复合物的特异性。所述稳定化的三元复合物可包括所述聚合酶、具有所述靶等位基因的引发的核酸模板和所述靶等位基因的同源核苷酸。在特定实施方案中,所述同源核苷酸与所述稳定化的三元复合物非共价结合,仅经由非共价相互作用与所述复合物的其他成员相互作用。用于形成三元复合物的有用方法和组合物在下文以及在共同拥有的美国专利申请序列号14/805,381(现在公布为美国公布号2017/0022553)和62/375,379(其在美国序列号15/677,870中以引用的方式并入)中进一步详细阐述,所述专利各自以引用的方式并入本文。
虽然在不存在某些催化金属离子(例如,Mg2+)的情况下,可在聚合酶、引发的模板核酸和下一个正确的核苷酸之间形成三元复合物,但在不存在催化金属离子的情况下,核苷酸的化学添加受到抑制。低或不足的催化金属离子水平导致稳定化的三元复合物中下一个正确的核苷酸的非共价(物理)敖合。本文公开的其他方法也可用于产生稳定化的三元复合物。
任选地,当引发的模板核酸的引物包括阻止将引入的核苷酸酶并入所述引物中的封闭基团时,可形成稳定化的三元复合物。相互作用可在稳定剂存在下进行,由此聚合酶-核酸相互作用在下一个正确的核苷酸存在下稳定(即使三元复合物稳定的稳定剂)。引发的模板核酸的引物任选地可以是可延伸的引物,或在其3'端被阻断延伸的引物(例如,通过可逆终止子部分的存在)。当同源核苷酸的碱基与引发的模板核酸的下一碱基互补时,所述引发的模板核酸、聚合酶和所述同源核苷酸能够形成三元复合物。
如上所述,有利于三元复合物或使三元复合物稳定的条件可通过封闭基团(所述封闭基团阻止将引入的核苷酸酶促并入引物中(例如所述引物的3'核苷酸上的可逆终止子部分))的存在或催化金属离子的不存在来提供。其他有用的条件包括存在三元复合物稳定剂,如抑制核苷酸并入或聚合的非催化离子(例如二价或三价非催化金属离子)。非催化金属离子包括但不限于钙、锶、钪、钛、钒、铬、铁、钴、镍、铜、锌、镓、锗、砷、硒、铑、铕和铽离子。任选地,通过一种或多种单价阳离子和/或谷氨酸阴离子的存在来提供不利于二元复合物或使二元复合物(即聚合酶与引发的核酸之间的复合物,但缺乏同源核苷酸)不稳定的条件。作为进一步的选择,可使用工程化为具有降低的催化活性或降低的二元复合物形成的倾向的聚合酶。
如上所述,三元复合物稳定化条件可强调在不同核苷酸存在下聚合酶对引发的模板核酸的亲和力差异,例如通过使二元复合物不稳定。任选地,所述条件在不同核苷酸存在下引起聚合酶对引发的模板核酸的差异亲和力。举例来说,所述条件包括但不限于高盐和谷氨酸离子。例如,盐可溶解在水溶液中以产生一价阳离子,如一价金属阳离子(例如,钠离子或钾离子)。任选地,提供一价阳离子(例如,一价金属阳离子)的盐进一步提供谷氨酸阴离子。任选地,谷氨酸离子的来源可以是谷氨酸钾。在一些情况下,可用于改变引发的模板核酸的聚合酶亲和力的谷氨酸钾的浓度从10mM至1.6M的谷氨酸钾或10mM与1.6M之间的任何量延伸。如上所述,高盐是指50至1,500mM盐的盐浓度。
应当理解,本文阐述的用于使三元复合物稳定的选择不需要相互排斥,而是可以各种组合使用。例如,三元复合物可通过一种方式或多种方式的组合来稳定,所述方式包括但不限于聚合酶结构域的交联、聚合酶与核酸的交联、使三元复合物稳定的聚合酶突变、通过小分子的变构抑制、非竞争性抑制剂、竞争性抑制剂、非竞争性抑制剂和本文阐述的其他方式。
可用本文阐述的方法中的各种核酸模板序列中的任一种形成三元复合物。所述方法特别适用于选择性地检测遗传基因座处的一个等位基因以将其与所述基因座处的一个或多个其他等位基因区分开。因此,在本文阐述的方法中使用的核酸模板的混合物可包含特定基因座处的一个或多个等位基因。例如,所述混合物可包含第一和第二等位基因,所述等位基因中的一个被选择性地检测。混合物可包含多种其他核酸,例如来自一种或多种生物体的基因组或外显子组的一些或全部序列内容物。
本文阐述的方法对于选择性地检测次要等位基因可以是特别有用的。次等位基因可以是在双等位基因基因座处出现的一对中的一个、在三等位基因基因座处的三个等位基因中的一个或在四等位基因基因座处的四个等位基因中的一个。本文选择性地检测的等位基因的次要等位基因频率可以是至多40%、25%、10%、5%、0.5%或更低。所述方法还可用于选择性地检测具有更高频率的等位基因,包括例如主要等位基因。可检测的示例性等位基因包括但不限于单核苷酸多态性(SNP)、插入-缺失(indel)多态性和选择性剪接多态性。
尽管本公开的方法特别适合于选择性地检测多等位基因基因座处的等位基因,但是也可检测其他序列。因此,针对等位基因所例示的方法和组合物可扩展至其他序列和其他模板。例如,所述方法可用于检测非多态性序列。在此类情况下,下一个正确的核苷酸和引物不需要与模板中的特定等位基因相关。在其他实施方案中,所述方法可用于选择性地检测与其野生型序列相比的突变序列,反之亦然。例如,当评价蛋白质工程化或合成生物学的试剂或产物时,这可能是有用的。
在本文的方法或组合物中使用的核酸模板可以是DNA,如基因组DNA、合成DNA、扩增的DNA、拷贝DNA(cDNA)等。也可使用RNA,如mRNA、核糖体RNA、tRNA等。核酸类似物也可用作本文的模板。因此,本文使用的核酸混合物可源自生物来源、合成来源或扩增产物。本文使用的引物可以是DNA、RNA或其类似物。
特别有用的核酸模板是包含与基因组的一部分相同的序列的基因组片段。基因组片段的群体可包含基因组的至少5%、10%、20%、30%或40%、50%、60%、70%、75%、80%、85%、90%、95%或99%。基因组片段可具有例如与基因组的至少约25、50、70、100、200、300、400、500、600、700、800、900或1000个或更多个核苷酸基本上相同的序列。基因组片段可以是DNA、RNA或其类似物。
核酸可来源于的示例性生物体包括例如来自以下的那些:哺乳动物,如啮齿类动物、小鼠、大鼠、兔、豚鼠、有蹄类动物、马、绵羊、猪、山羊、牛、猫、狗、灵长类动物、人或非人灵长类动物;植物,如拟南芥、玉米(玉米、高粱、燕麦、小麦、大米、油菜、或大豆;藻类,如莱茵衣藻;线虫,如秀丽隐杆线虫;昆虫,如黑尾果蝇、蚊、果蝇、蜜蜂或蜘蛛;鱼,如斑马鱼;爬行动物;两栖动物,如蛙或非洲蟾蜍;盘基网柄菌;真菌,如卡氏肺孢子虫、红鳍东方鲀、酵母、酿酒酵母或粟酒裂殖酵母;或恶性疟原虫。核酸也可来源于原核生物,如细菌、大肠杆菌、葡萄球菌或肺炎支原体;古细菌;病毒,如丙型肝炎病毒或人类免疫缺陷病毒;或类病毒。核酸可来源于上述生物体的同质培养物或群体,或者可替代地来自若干不同生物体的集合,例如,在群落或生态系统中。可使用本领域中已知的方法分离核酸,包括例如Sambrook等人,Molecular Cloning:A Laboratory Manual,第3版,Cold Spring HarborLaboratory,New York(2001)或Ausubel等人,Current Protocols in MolecularBiology,John Wiley and Sons,Baltimore,Md.(1998)中描述的那些方法,所述文献各自以引用的方式并入本文。
模板核酸可从诸如基因组分离、基因组片段化、基因克隆和/或扩增的制备方法获得。模板可从诸如聚合酶链反应(PCR)、滚环扩增(RCA)、多重置换扩增(MDA)等的扩增技术获得。用于分离、扩增和片段化核酸以产生用于在阵列上分析的模板的示例性方法在美国专利号6,355,431或9,045,796中阐述,所述专利各自以引用的方式并入本文。也可使用Sambrook等人,Molecular Cloning:A Laboratory Manual,第3版,Cold Spring HarborLaboratory,New York(2001)或Ausubel等人,Current Protocols in MolecularBiology,John Wiley and Sons,Baltimore,Md.(1998)中阐述的方法进行扩增,所述文献各自以引用的方式并入本文。
本文阐述的方法的具体实施方案可使用天然核苷酸、核苷酸类似物或修饰的核苷酸。此类核苷酸可用于例如形成稳定化的三元复合物。任选地,核苷酸类似物具有含氮碱基、五碳糖和磷酸基团;其中可修饰、除去和/或替代核苷酸的任何部分。核苷酸类似物可以是不可并入的核苷酸。此类不能并入的核苷酸包括例如单磷酸和二磷酸核苷酸。在另一个实例中,核苷酸可含有对三磷酸基团的修饰,所述修饰使得核苷酸不可并入。不可并入的核苷酸的实例可在美国专利号7,482,120中找到,所述专利以引用的方式并入本文随后可修饰不可并入的核苷酸以变得可并入。核苷酸类似物包括但不限于α-磷酸修饰的核苷酸、α-β核苷酸类似物、β-磷酸修饰的核苷酸、β-γ核苷酸类似物、γ-磷酸修饰的核苷酸、笼状(caged)核苷酸或ddNTP。核苷酸类似物的实例描述于美国专利号8,071,755中,所述专利以引用的方式并入本文。
核苷酸类似物可包括终止子,所述终止子在已经并入类似物后可逆地防止在引物的3'端处的核苷酸并入。例如,U.S.7,544,794和U.S.8,034,923(这些专利的公开内容以引用的方式并入本文)描述了可逆终止子,其中3'-OH基团被3’-ONH2部分替代。另一种类型的可逆终止子与核苷酸的含氮碱基连接,如例如U.S.8,808,989(其公开内容以引用的方式并入本文)中所阐述。类似地可与本文所述的方法结合使用的其他可逆终止子包括在U.S.7,956,171、U.S.8,071,755和U.S.9,399,798中描述的那些(这些美国专利的公开内容以引用的方式并入本文)。在某些实施方案中,可从引物除去可逆的封闭部分,从而允许核苷酸并入。用于解封闭的组合物和方法在以上参考文献中阐述。
或者,核苷酸类似物不可逆地防止在它们已经并入的引物的3'端处的核苷酸并入。不可逆的核苷酸类似物包括2’,3’-双脱氧核苷酸(ddNTP,如ddGTP、ddATP、ddTTP、ddCTP)。双脱氧核苷酸缺乏dNTP的3'-OH基团,所述3'-OH基团对于聚合酶介导的引物延伸是必需的。
任选地,在形成稳定化的三元复合物期间,核苷酸(例如天然核苷酸或核苷酸类似物)存在于混合物中。例如,可存在至少1、2、3、4或更多种核苷酸类型。或者或另外,可存在至多4、3、2或1种核苷酸类型。类似地,所存在的一种或多种核苷酸类型可与模板核酸中的至少1、2、3或4种核苷酸类型互补。或者或另外,所存在的一种或多种核苷酸类型可与模板核酸中的至多4、3、2或1种核苷酸类型互补。
在三元复合物中使聚合酶稳定的任何核苷酸修饰可用于本文公开的方法中。核苷酸可永久地或瞬时地结合。任选地,核苷酸类似物与聚合酶融合。任选地,多种核苷酸类似物与多种聚合酶融合,其中每种核苷酸类似物与不同的聚合酶融合。任选地,存在于稳定化的三元复合物中的核苷酸不是使三元复合物稳定的手段。因此,任何各种其他三元复合物稳定化方法可在利用核苷酸类似物的反应中组合。
在特定实施方案中,经历本文阐述的方法的一个或多个步骤的引发的模板核酸分子的引物链在化学上不被聚合酶改变。也就是说,引物既不通过形成新的磷酸二酯键而延伸,也不会在检查步骤中通过溶核降解而缩短以鉴定下一个正确的核苷酸。
可用于实施本公开的方法的聚合酶包括天然存在的聚合酶及其修饰的变型,包括但不限于突变体、重组体、融合体、遗传修饰、化学修饰、合成物和类似物。天然存在的聚合酶及其修饰的变型不限于具有催化聚合反应的能力的聚合酶。任选地,天然存在的和/或其修饰的变型具有催化聚合反应的能力。任选地,天然存在的和/或修饰的变型具有改变的性质,例如,与核酸的结合亲和力增强、与核酸的结合亲和力降低、与核苷酸的结合亲和力增强、与核苷酸的结合亲和力降低、对下一个正确的核苷酸的特异性增强、对下一个正确的核苷酸的特异性降低、催化速率增强、催化速率降低、催化无活性等。突变型聚合酶包括,例如,其中一个或多个氨基酸被其他氨基酸或一个或多个氨基酸的插入或缺失替代的聚合酶。
修饰的聚合酶包括含有外源标记部分(例如,外源荧光团)的聚合酶,所述外源标记部分可用于检测聚合酶。任选地,在使用蛋白质分离技术至少部分地纯化聚合酶后,可附接标记部分。例如,可使用聚合酶的游离巯基或游离胺部分将外源标记部分化学连接至聚合酶。这可涉及通过半胱氨酸残基的侧链或通过N-末端的游离氨基与聚合酶的化学键联。外源标记部分也可经由蛋白质融合与聚合酶附接。可经由蛋白质融合附接的示例性标记部分包括例如绿色荧光蛋白(GFP)或GFP的波长偏移的变体。
有用的DNA聚合酶包括但不限于细菌DNA聚合酶、真核DNA聚合酶、古细菌DNA聚合酶、病毒DNA聚合酶和噬菌体DNA聚合酶。细菌DNA聚合酶包括大肠杆菌DNA聚合酶I、II和III、IV以及V、大肠杆菌DNA聚合酶的Klenow片段、粪堆梭菌(Clostridium stercorarium)(Cst)DNA聚合酶、热纤维梭菌(Clostridium thermocellum)(Cth)DNA聚合酶和硫磺矿硫化叶菌(Sulfolobus solfataricus)(Sso)DNA聚合酶。真核DNA聚合酶包括DNA聚合酶α、β、γ、δ、€、η、ζ、λ、σ、μ和κ,以及Rev1聚合酶(末端脱氧胞苷基转移酶)和末端脱氧核苷酸基转移酶(TdT)。病毒DNA聚合酶包括T4 DNA聚合酶、phi-29 DNA聚合酶、GA-1、phi-29样DNA聚合酶、PZA DNA聚合酶、phi-15 DNA聚合酶、Cpl DNA聚合酶、Cp7 DNA聚合酶、T7 DNA聚合酶和T4聚合酶。其他有用的DNA聚合酶包括热稳定和/或嗜热DNA聚合酶,如栖热水生菌(Thermusaquaticus)(Taq)DNA聚合酶、丝状栖热菌(Thermus filiformis)(Tfi)DNA聚合酶、速生热球菌(Thermococcus zilligi)(Tzi)DNA聚合酶、嗜热栖热菌(Thermus thermophilus)(Tth)DNA聚合酶、黄色栖热菌(Thermus flavusu)(Tfl)DNA聚合酶、沃氏火球菌(Pyrococcus woesei)(Pwo)DNA聚合酶、强烈火球菌(Pyrococcus furiosus)(Pfu)DNA聚合酶和Turbo Pfu DNA聚合酶、海滨嗜热球菌(Thermococcus litoralis)(Tli)DNA聚合酶、火球菌属GB-D聚合酶、海栖热袍菌(Thermotoga maritima)(Tma)DNA聚合酶、嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)(Bst)DNA聚合酶、柯达克氏火球菌(PyrococcusKodakaraensis)(KOD)DNA聚合酶、Pfx DNA聚合酶、热球菌属JDF-3(JDF-3)DNA聚合酶、高氏热球菌(Thermococcus gorgonarius)(Tgo)DNA聚合酶、嗜酸热球菌(Thermococcusacidophilium)DNA聚合酶;嗜酸热硫化叶菌(Sulfolobus acidocaldarius)DNA聚合酶;热球菌属go N-7DNA聚合酶;隐蔽热网菌(Pyrodictium occultum)DNA聚合酶;沃氏甲烷球菌(Methanococcus voltae)DNA聚合酶;嗜热自养甲烷球菌(Methanococcusthermoautotrophicum)DNA聚合酶;詹氏甲烷球菌(Methanococcus jannaschii)DNA聚合酶;除硫球菌属(Desulfurococcus)菌株TOK DNA聚合酶(D.Tok Pol);深海火球菌(Pyrococcus abyssi)DNA聚合酶;掘越氏火球菌(Pyrococcus horikoshii)DNA聚合酶;海岛火球菌(Pyrococcus islandicum)DNA聚合酶;烟生热球菌(Thermococcus fumicolans)DNA聚合酶;敏捷气热菌(Aeropyrum pernix)DNA聚合酶;以及异二聚体DNA聚合酶DP1/DP2。工程化的和修饰的聚合酶也可与所公开的技术结合使用。例如,可使用极端嗜热海洋古细菌热球菌属9°N的修饰的型式(例如,来自New England BioLabs Inc.;Ipswich,MA的Therminator DNA聚合酶)。其他有用的DNA聚合酶(包括3PDX聚合酶)公开于U.S.8,703,461中,其公开内容以引用的方式并入本文。
有用的RNA聚合酶包括但不限于病毒RNA聚合酶,如T7RNA聚合酶、T3聚合酶、SP6聚合酶和Kll聚合酶;真核RNA聚合酶,如RNA聚合酶I、RNA聚合酶II、RNA聚合酶III、RNA聚合酶IV和RNA聚合酶V;以及古细菌RNA聚合酶。
有用的逆转录酶包括但不限于来自人类免疫缺陷病毒1型(PDB1HMV)的HIV-1逆转录酶、来自人类免疫缺陷病毒2型的HIV-2逆转录酶、来自莫洛尼鼠白血病病毒的M-MLV逆转录酶、来自禽成髓细胞瘤病毒的AMV逆转录酶以及维持真核染色体的端粒的端粒酶逆转录酶。
具有内在3'-5'校正核酸外切酶活性的聚合酶可用于一些实施方案。基本上缺乏3'-5'校正核酸外切酶活性的聚合酶在一些实施方案中也是有用的,例如,在大多数测序实施方案中。核酸外切酶活性的不存在可以是野生型特征或由变体或工程化的聚合酶结构赋予的特征。例如,exo minus Klenow片段是缺乏3'-5'校正核酸外切酶活性的Klenow片段的突变型式。Klenow片段及其exo minus变体可用于本文阐述的方法或组合物中。
稳定化的三元复合物或能够形成(即参与形成)三元复合物的组分可附接至固体载体。固体载体可由本文阐述的各种材料中的任一种制成,例如以上在定义中或下文中。合适的材料可包括玻璃、聚合物材料、硅、石英(熔融石英)、硼浮法玻璃、二氧化硅、基于二氧化硅的材料、碳、金属、光纤或光纤束、蓝宝石或塑料材料。可基于特定用途所需的性质来选择特定材料。例如,对所需波长的辐射透明的材料可用于将利用所述波长的辐射的分析技术。相反,可能希望选择不通过特定波长的辐射(例如,不透明、吸收或反射)的材料。可利用的材料的其他性质是对下游工艺中使用的某些试剂(如本文阐述的那些)的惰性或反应性;或易于操作或低制造成本。
特别有用的固体载体是颗粒,如珠粒或微球体,如下文所例示。珠粒群体可用于附接稳定化的三元复合物的群体或能够形成所述复合物的组分(例如聚合酶、模板、引物或核苷酸)。在一些实施方案中,可能有用的是使用其中每个珠粒具有单一类型的稳定化的三元复合物或能够形成所述复合物的单一类型的组分的构型。例如,单独珠粒可附接至单一类型的三元复合物、单一类型的模板等位基因、单一类型的等位基因特异性引物、单一类型的基因座特异性引物或单一类型的核苷酸。或者,不需要在逐个珠粒的基础上分离不同类型的组分。因此,单个珠粒可携带多种不同类型的三元复合物、模板等位基因、等位基因特异性引物、基因座特异性引物和/或核苷酸。珠粒的组成可根据例如待使用的形式、化学和/或附接方法而变化。示例性珠粒组合物包括用于蛋白质和核酸捕获方法中的固体载体和赋予其的化学官能团。此类组合物包括,例如,塑料、陶瓷、玻璃、聚苯乙烯、三聚氰胺、甲基苯乙烯、丙烯酸聚合物、顺磁性材料、氧化钍溶胶、石墨碳、二氧化钛、胶乳或交联葡聚糖如SepharoseTM、纤维素、尼龙、交联胶束和TeflonTM、以及来自Bangs Laboratories,FishersInd.的“Microsphere Detection Guide”中所阐述的其他材料,所述文献以引用的方式并入本文。
颗粒、珠粒或微球体的几何形状也可对应于各种不同的形式和形状。例如,它们可以是对称形状的(例如球形或圆柱形)或不规则形状的(例如可控孔度玻璃)。另外,珠粒可以是多孔的,因此增加可用于捕获三元复合物或其组分的表面积。本文使用的珠粒的示例性尺寸可在纳米至毫米或约10nm-1mm的范围内。
在特定实施方案中,珠粒可排列或以其他方式在空间上区分。可使用的示例性的基于珠粒的阵列包括但不限于可从llumina,Inc.(San Diego,CA)获得的BeadChipTM阵列或诸如美国专利号6,266,459、6,355,431、6,770,441、6,859,570或7,622,294或PCT公布号WO00/63437中描述的那些的阵列,所述专利各自以引用的方式并入本文。珠粒可位于固相载体上的离散位置,如孔,其中每个位置容纳单个珠粒。或者,珠粒所在的离散位置可各自包括多个珠粒,如例如在美国公布号2004/0263923、2004/0233485、2004/0132205或2004/0125424中所描述,所述公布各自以引用的方式并入本文。
如从上述珠粒阵列实施方案中将认识到的,本公开的方法可以多重形式进行,由此在本文阐述的方法中并行检测多种不同类型的核酸。尽管还有可能使用本文阐述的方法的一个或多个步骤连续加工不同类型的核酸,但并行加工可提供成本节省、时间节省和条件均一性。
可使用的可商购阵列的其他实例包括例如Affymetrix GeneChipTM阵列。根据一些实施方案还可使用成点阵列。示例性成点阵列是可从Amersham Biosciences获得的CodeLinkTM阵列。另一种有用的阵列是使用喷墨印刷方法,如可从Agilent Technologies获得的SurePrintTM技术制造的阵列。
核酸阵列可被构造成使得附接在特征处的核酸具有可与聚合酶相互作用的3'端。在此类实施方案中,附接的引物的3'端可参与三元复合物形成或聚合酶催化的延伸或两者。例如,引物可经由引物的5'端或在引物的不会在空间上阻断3'端与聚合酶的相互作用的另一部分处附接至特征。经由它们的5'端附接的引物的实例示于图2和图3中。
尽管使用与聚合酶直接相互作用的引物阵列举例说明了本文阐述的若干实施方案,但应理解阵列的引物可充当与其他核酸杂交的探针,这些其他核酸提供与聚合酶相互作用的3’端。例如,引物可经由它们的3'端附接至阵列特征。在此类情况下,互补核酸链可与引物杂交,并且聚合酶可与所述互补核酸链的3'端相互作用。互补核酸链可与阵列引物杂交,而不依赖于与阵列附接的引物端。此外,互补核酸可与阵列引物杂交以形成第三核酸链与其杂交的接头或夹板。第三核酸链可具有与聚合酶相互作用以形成稳定化的三元复合物、参与引物延伸或两者的游离的3'端。使用其中一种或多种互补核酸与阵列引物杂交的构型的优点是保持阵列免于不希望的修饰。例如,聚合酶延伸步骤可用于修饰与阵列引物杂交的核酸的3'端。然后可除去修饰的核酸,并在相似的测定中重新使用阵列。然而,如果通过延伸修饰排列的引物,则它可能已被有效地耗费并且不能用于进一步测定。
在一些实施方案中,阵列可被构造为铺瓦式阵列。可使用铺瓦式阵列来密集地探测已知存在于连续区域中的序列。铺瓦式阵列可被构造成使得连续区域的序列的大部分或全部与附接至阵列的引物序列对准。因此,阵列为连续区域提供相对高的序列分辨率。示例性的铺瓦式阵列包括可商购的那些,如GeneHuman Tiling 2.0R阵列组(Affymetrix,Santa Clara,CA)。尽管铺瓦式阵列是有用的,但它们的准确性依赖于相对窄的探针设计参数和窄范围的杂交条件来提供检测特异性。与仅依赖于杂交互补性来区分与靶序列或结合靶序列中的不同等位基因的引物比对时最近邻的引物相比,本公开的方法提供了基于由三元复合物形成提供的靶序列的增加水平的特异性的提高的特异性的优点。
在本发明方法的一些实施方案中,与铺瓦式阵列接触的样品可含有源自连续核酸的核酸片段,并且引物相对于连续序列平铺。例如,连续核酸可以是酶促或物理片段化的,或者片段扩增子可从连续核酸中拷贝。在一些实施方案中,连续序列是基因组序列,并且核酸混合物是基因组序列的片段。可使用本文阐述或本领域已知的其他连续序列。阵列上的多种引物可以一定的分辨率平铺,所述分辨率导致在与连续序列的比对中相邻的最近邻引物序列被预定的平均空位(例如至多10个核苷酸的空位)隔开。或者或另外,当与连续序列比对时,最近邻引物序列可彼此重叠(例如引物之间的重叠可为至少1个核苷酸)。
其他有用的阵列包括用于核酸测序应用的那些阵列。例如,用于附接基因组片段(通常称为簇)的扩增子的阵列可能是特别有用的。可修饰以在本文中使用的核酸测序阵列的实例包括Bentley大人,Nature 456:53-59(2008);PCT公布号WO 91/06678;WO 04/018497或WO 07/123744;美国专利号7,057,026;7,211,414;7,315,019;7,329,492或7,405,281;或美国专利申请公布号2008/0108082中描述的那些,所述文献以引用的方式并入本文。
因此,提供了一个实施方案,其中模板核酸附接至阵列。例如,一种用于鉴定核酸混合物中的靶等位基因的方法可包括以下步骤:(a)提供特征的阵列,其中不同的模板核酸附接在所述阵列的不同特征处;(b)使所述阵列与多种引物、聚合酶和核苷酸接触以在多个所述特征处形成多种稳定化的三元复合物,其中所述特征处的所述稳定化的三元复合物各自具有聚合酶、与所述阵列的特征附接且具有基因座的靶等位基因的模板核酸、与所述基因座杂交的引物,以及在所述基因座中具有同源物的下一个正确的核苷酸,其中(i)所述引物是具有3'核苷酸的等位基因特异性引物,所述3'核苷酸是所述靶等位基因的同源核苷酸,或者(ii)所述引物是基因座特异性引物,并且所述下一个正确的核苷酸与所述靶等位基因杂交;以及(c)检测所述特征处的稳定化的三元复合物,从而鉴定所述靶等位基因。
如上所述,采用附接的核酸的方法的实施方案可使用本领域中已知的阵列,并且在一些情况下可使用可商购的阵列。此外,由商业阵列(或其他核酸阵列)制成的与核酸探针的键联可用用于将聚合酶或核苷酸附接至表面的键联替代。在其他实施方案中,聚合酶或核苷酸可附接至与位于核酸阵列上的探针互补的寡核苷酸部分。在此类实施方案中,核苷酸或聚合酶可经由互补链的杂交或交联附接至表面。
可使用本领域熟知的各种方法中的任一种将稳定化的三元复合物或用于制备这种复合物的组分附接至阵列或其他固体载体。此类方法包括例如通过直接化学合成附接至固体载体、化学附接、光化学附接、热附接、酶促附接和/或吸收。这些和其他方法是本领域熟知的,并且适用于以各种形式和构型中的任一种附接蛋白质、核苷酸或核酸。与固体载体的附接可经由共价键联或经由非共价相互作用发生。示例性的非共价相互作用是配体-受体对如链霉抗生物素蛋白(或其类似物)与生物素(或其类似物)之间或抗体(或其功能片段,如Fab或ScFv)与表位之间的相互作用。其他有用的受体-配体对包括凝集素和碳水化合物,以及双链核酸的互补的第一链和第二链。
其他有用的化学条件和键联是称为“点击化学”的那些(例如美国专利号6,737,236和美国专利号7,427,678,所述专利各自以引用的方式整体并入本文)。还有用的是叠氮化物炔烃胡伊斯根(Huisgen)环加成反应,其使用铜催化剂(例如美国专利号7,375,234和美国专利号7,763,736,所述专利各自以引用的方式整体并入本文)。可采用使用应变炔烃的无铜胡伊斯根反应(“无金属点击”)。其他有用的键联化学包括但不限于可与醛部分连接的三嗪-肼部分,例如,如美国专利号7,259,258中所描述,所述专利以引用的方式并入本文;可与胺部分连接的三嗪氯化物部分;可使用偶联剂如EDC与胺部分连接的羧酸部分;可与硫醇部分连接的硫醇部分;可与通过狄尔斯-阿尔德(Diels-Alder)反应偶联的二烯烃部分连接的烯烃部分;以及可与硫代磷酸酯部分连接的乙酰溴部分,如WO 2005/065814中描述的那些,所述专利以引用的方式并入本文。玻璃状表面也可用各种玻璃反应性分子(如官能化硅烷)改性,其中一些可通过Gelest,Inc商购获得。
在特定实施方案中,稳定化的三元复合物、聚合酶、核酸或核苷酸附接至流动池表面或流动池中的固体载体。流动池通过使溶液进出与载体结合的三元复合物接触的流体室而允许方便的流体操作。流动池还提供流体操作的组分的检测。例如,可定位检测器以检测来自固体载体的信号,如来自由于形成稳定化的三元复合物而募集至固体载体的标记的信号。可使用的示例性流动池描述于,例如美国专利申请公布号2010/0111768 A1、WO 05/065814和美国专利申请公布号2012/0270305 A1中,所述专利各自以引用的方式并入本文。
聚合酶分子可附接至用于鉴定靶等位基因的阵列。例如,一种用于鉴定核酸混合物中的靶等位基因的方法可包括以下步骤:(a)提供特征的阵列,其中聚合酶附接在所述阵列的特征处;(b)使所述阵列与多种引物、模板核酸和核苷酸接触以在多个所述特征处形成多种稳定化的三元复合物,其中所述特征处的所述稳定化的三元复合物各自具有附接在所述阵列的特征处的聚合酶、具有基因座的靶等位基因的模板核酸、与所述基因座杂交的引物,以及在所述基因座中具有同源物的下一个正确的核苷酸,其中(i)所述引物是具有3'核苷酸的等位基因特异性引物,所述3'核苷酸是所述靶等位基因的同源核苷酸,或者(ii)所述引物是基因座特异性引物,并且所述下一个正确的核苷酸与所述靶等位基因杂交;以及(c)检测所述特征处的稳定化的三元复合物,从而鉴定所述靶等位基因。
本文阐述的方法可包括使特征的阵列与在一个或多个特征处形成稳定化的三元复合物的组分接触的步骤。如上文和本文其他地方所例示的,稳定化的三元复合物的不同组分可附接至阵列的特征。参与形成稳定化的三元复合物的其他组分可提供在溶液中。例如,如果引物附接在特征处,则可通过在溶液中提供模板核酸、聚合酶和下一个正确的核苷酸来形成稳定化的三元复合物。对于模板核酸附接至特征的实施方案,可通过在溶液中提供引物、聚合酶和下一个正确的核苷酸来形成稳定化的三元复合物。在其他实施方案中,可在特征附接的核苷酸与流体递送的聚合酶、模板和引物之间形成三元复合物。
提供在溶液中的组分可混合物的形式同时输送,或者可替代地所述组分可顺序递送。在顺序递送的实例中,可顺序递送溶液组分,直到阐述所有基于溶液的组分的混合物。在替代实例中,可顺序地递送和除去溶液组分。例如,可在阵列的特征处形成引物-模板杂合体,然后可通过在溶液中递送聚合酶来形成二元复合物,然后可通过在溶液中递送下一个正确的核苷酸来形成三元复合物。在后一实例中,可执行任选的洗涤以在递送后续组分之前除去未结合的溶液组分。
根据本公开制备或使用的三元复合物可任选地包含一种或多种外源标记。所述标记可存在于聚合酶、模板核酸、引物和/或同源核苷酸上。通常,标记的组分在溶液中递送且然后募集至在附接的组分上形成三元复合物的特征。在本文阐述的一种或多种操作过程中,外源标记可用于检测三元复合物或其单独组分。示例性标记、用于附接标记的方法和使用标记的组分的方法在共同拥有的美国专利申请序列号14/805,381(现在公布为美国公布号2017/0022553 A1)和62/375,379(其在美国序列号15/677,870中以引用的方式并入)中阐述,所述专利各自以引用的方式并入本文。
有用的外源标记的其他实例包括但不限于放射性标记部分、荧光团部分、量子点部分、发色团部分、酶部分、电磁旋转标记的部分、纳米颗粒光散射部分以及本领域已知的各种其他产生信号的部分中的任一种。合适的酶部分包括例如,辣根过氧化物酶、碱性磷酸酶、β-半乳糖苷酶或乙酰胆碱酯酶。示例性荧光团部分包括但不限于伞形酮、荧光素、异硫氰酸酯、若丹明、四甲基若丹明、曙红、绿色荧光蛋白、赤藓红、香豆素、甲基香豆素、芘、孔雀石绿、芪、lucifer yellowTM、Cascade BlueTM、Texas RedTM、丹磺酰氯、藻红蛋白、藻蓝蛋白、荧光镧系元素络合物(如包括铕和铽的那些)、Cy3、Cy5以及本领域已知的其他,例如在Principles of Fluorescence Spectroscopy,Joseph R.Lakowicz(Editor),Plenum PubCorp,第2版(1999年7月)和Richard P.Hoagland的Molecular Probes Handbook的第6版中所描述。
第二标记可用于本公开的方法中。第二标记是可与标记的配偶体部分特异性地结合的结合部分。例如,配体部分可附接至聚合酶、核酸或核苷酸,以允许经由对标记的受体的特异性亲和力进行检测。可使用的示例性结合部分对包括但不限于抗原和免疫球蛋白或其活性片段如FAb;免疫球蛋白和免疫球蛋白(或相应地活性片段);抗生物素蛋白和生物素或其对抗生物素蛋白具有特异性的类似物;链霉抗生物素蛋白和生物素或其对链霉抗生物素蛋白具有特异性的类似物;或碳水化合物和凝集素。
在一些实施方案中,第二标记可以是化学可修饰的部分。在此实施方案中,具有反应性官能团的标记可并入稳定化的三元复合物中。官能团可随后与第一标记部分共价反应。合适的官能团包括但不限于氨基、羧基、马来酰亚胺基、氧代基和硫醇基。
在替代实施方案中,三元复合物可缺乏外源标记。例如,三元复合物和用于形成三元复合物的组分(例如聚合酶、模板核酸、引物和/或同源核苷酸)可缺乏本文所述或以上并入的参考文献中的一种、几种或所有外源标记。在此类实施方案中,可基于稳定化的三元复合物的固有性质(如质量、电荷、固有光学性质等)检测三元复合物。用于检测未标记的三元复合物的示例性方法在共同拥有的美国专利申请序列号14/805,381(现在公布为美国公布号2017/0022553)和62/375,379(其在美国序列号15/677,870中以引用的方式并入)中阐述,所述专利各自以引用的方式并入本文。
附接的组分的适当空间分布与溶液组分上标记的适当分布相结合可用于产生稳定化的三元复合物阵列,所述阵列可用于鉴定核酸样品的一个或多个基因座处的等位基因。在一些实施方案中,可能有用的是使用其中每个特征具有单一类型的稳定化的三元复合物(例如每个特征一个等位基因类型)的构型。因此,可代替或除了使用不同等位基因的不同标记之外,基于阵列上的空间位置来区分等位基因。或者,不需要在逐个特征的基础上分离不同的稳定化的三元复合物。因此,特征可携带多种不同类型的稳定化的三元复合物(例如,每个特征多种类型的等位基因),所述三元复合物可任选地基于分别与不同类型的等位基因缔合的不同类型的标记加以区分。
在一些实施方案中,所述用于鉴定核酸混合物中的靶等位基因的方法可包括以下步骤:(a)提供特征的阵列,其中不同的基因座特异性引物附接在所述阵列的不同特征处;(b)使所述阵列与多种核酸模板、聚合酶和核苷酸接触以在多个所述特征处形成多种稳定化的三元复合物,其中所述核苷酸具有外源标记,其中所述稳定化的三元复合物各自具有聚合酶、具有基因座的靶等位基因的模板核酸、与所述基因座杂交的基因座特异性引物,以及下一个正确的核苷酸,所述下一个正确的核苷酸是所述靶等位基因的同源物;以及(c)通过检测所述外源标记来检测所述特征处的稳定化的三元复合物,从而鉴定所述靶等位基因。
在以上实施方案的一种构型中,在步骤(b)中使至少两种类型的核苷酸与所述阵列接触,并且在步骤(c)中不同的外源标记区分每个基因座处的至少两个等位基因。如在图3中所例示,两种类型的标记可用于区分存在于阵列的同一特征处的两个等位基因。在替代构型中,可在步骤(b)中使单一类型的核苷酸与阵列接触。在此实施方案中,不需要使其他类型的核苷酸与阵列接触。然而,任选地,一种或多种其他类型的核苷酸可顺序地与阵列接触。可顺序地检测顺序添加的核苷酸,以使得添加顺序与新信号的出现结合可用于区分新形成的稳定化的三元复合物,无论顺序添加的核苷酸类型是否具有相互可区分的标记。或者,可在多次添加完成后检测顺序添加的核苷酸。
在一些实施方案中,一种用于鉴定核酸混合物中的靶等位基因的方法可包括以下步骤:(a)提供特征的阵列,其中不同的基因座特异性引物附接在所述阵列的不同特征处;(b)使所述阵列与多种核酸模板、聚合酶和核苷酸接触以在多个所述特征处形成多种稳定化的三元复合物,其中所述聚合酶具有外源标记,其中所述稳定化的三元复合物各自具有聚合酶、具有基因座的靶等位基因的模板核酸、与所述基因座杂交的基因座特异性引物,以及下一个正确的核苷酸,所述下一个正确的核苷酸是所述靶等位基因的同源物;以及(c)通过检测所述外源标记来检测所述特征处的稳定化的三元复合物,从而鉴定所述靶等位基因。在一些构型中,在步骤(b)中使单一类型的核苷酸与阵列接触。在此实施方案中,不需要使其他类型的核苷酸与阵列接触。然而,任选地,一种或多种其他类型的核苷酸可顺序地与阵列接触。同样,检测可在将不同的核苷酸并入三元复合物中时顺序地进行,或者可在多个核苷酸添加后进行检测。
在一些实施方案中,一种用于鉴定核酸混合物中的靶等位基因的方法包括以下步骤:(a)提供特征的阵列,其中不同的等位基因特异性引物附接在所述阵列的不同特征处;(b)使所述阵列与多种核酸模板、聚合酶和核苷酸接触以在多个所述特征处形成多种稳定化的三元复合物,其中所述核苷酸具有外源标记,其中所述稳定化的三元复合物各自具有聚合酶、具有基因座的靶等位基因的模板核酸、与所述基因座杂交的等位基因特异性引物,以及在所述基因座中具有同源物的下一个正确的核苷酸,其中所述等位基因特异性引物的3'端具有所述靶等位基因的同源核苷酸;以及(c)通过检测所述外源标记来检测所述特征处的稳定化的三元复合物,从而鉴定所述靶等位基因。
在以上实施方案的一种构型中,在步骤(b)中使至少两种类型的核苷酸与所述阵列接触,并且所述至少两种类型的核苷酸具有在步骤(c)中彼此不区分的外源标记。如图2中所例示,等位基因特异性引物可存在于阵列的不同特征处,以使得等位基因通过空间位置而不是在所述特征处募集以形成三元复合物的核苷酸类型的差异来进行区分。然而,如果需要,两种或更多种类型的核苷酸可具有可区分的标记。在替代构型中,可在步骤(b)中使单一类型的核苷酸与阵列接触。在此实施方案中,不需要使其他类型的核苷酸与阵列接触。然而,任选地,一种或多种其他类型的核苷酸可顺序地与阵列接触。同样,检测可在将不同的核苷酸并入三元复合物中时顺序地进行,或者可在多个核苷酸添加后进行检测。
任选地,所提供的方法还包括洗涤步骤。所述洗涤步骤可在所述方法中的任何其他步骤之前或之后进行。例如,本文阐述的方法可任选地包括在形成一种或多种稳定化的三元配合物之后洗涤固体载体的步骤。洗涤可提供除去污染物(如稳定化的三元复合物的一种或多种组分所来源于的混合物的组分)的优点。在特定实施方案中,洗涤步骤在使三元复合物稳定的条件下进行。例如,可在洗涤步骤过程中采用本文其他地方所阐述的一种或多种稳定条件或稳定剂。任选地,洗涤溶液包含与在形成稳定化的三元复合物过程中使用的下一个正确的核苷酸相同类型的核苷酸。包含足够浓度的下一个正确的核苷酸可提供使先前形成的三元复合物稳定免于不希望的解离的优点。这进而防止由于洗去先前形成的三元复合物所致的检测灵敏度的不希望的降低。任选地,三元复合物具有半衰期,并且进行洗涤步骤持续短于三元复合物的半衰期的持续时间。
本公开的方法可包括检测步骤。通常,可通过感知标记部分所固有的性质的方法来实现检测。检测可基于的示例性性质包括但不限于质量、电导率、能量吸收、荧光等。荧光的检测可使用与核酸阵列有关的领域中已知的方法来进行。可基于多种荧光现象中的任一种来检测荧光团,所述荧光现象包括例如发射波长、激发波长、荧光共振能量转移(FRET)强度、猝灭、各向异性或寿命。可用于本文阐述的方法的其他检测技术包括例如,可用于感知质量的质谱;可用于感知与表面的结合的表面等离子体共振;可用于感知标记所吸收的能量的波长的吸光度;可用于感知由于标记的存在所致的温度变化的量热法;可用于感知标记的电性质的电导或阻抗,或其他已知的分析技术。用于检测阵列上的标记的其他技术例如在共同拥有的美国专利申请序列号14/805,381(现在公布为美国公布号2017/0022553)和62/375,379(其在美国序列号15/677,870或美国专利号6,355,431或9,045,796中以引用的方式并入)中阐述,所述专利各自以引用的方式并入本文。
可使用其中重复本文阐述的方法的特定步骤的迭代方法将靶等位基因或其他靶序列与其他等位基因区分开。本文阐述的方法非常适合于迭代,因为在用于检测靶等位基因后不需要消耗或修饰核酸引物。这与其中使引物延伸以并入标记的核苷酸的其他等位基因检测方法形成对比。一旦引物延伸,它就已经耗费并且必须更换或化学回复以用于引物延伸步骤的重复中。
本公开提供的迭代方法的优点在于每次迭代可增加对一种或多种靶等位基因的鉴定的置信度,从而改善与其他生物材料,包括具有相似序列的其他核酸(例如,在每个靶等位基因的同一基因座处的其他等位基因)的辨别。可重复使用试剂,从而为消耗引物和其他试剂的其他方法提供成本和时间有效的替代方案。
因此,一种用于鉴定核酸混合物中的靶等位基因的方法可包括以下步骤:(a)提供特征的阵列,其中不同的基因座特异性引物附接在所述阵列的不同特征处;(b)使所述阵列与多种核酸模板、聚合酶和核苷酸接触以在多个所述特征处形成多种稳定化的三元复合物,其中所述稳定化的三元复合物各自具有聚合酶、具有基因座的靶等位基因的模板核酸、与所述基因座杂交的基因座特异性引物,以及下一个正确的核苷酸,所述下一个正确的核苷酸是所述靶等位基因的同源物;(c)检测所述特征处的稳定化的三元复合物,从而鉴定所述靶等位基因;以及(d)在检测到所述稳定化的三元复合物后,使所述下一个正确的核苷酸从所述阵列的每个特征中解离,由此将所述特征中的每个特征处的所述三元复合物转化为二元复合物,所述二元复合物包含来自所述特征处的所述三元复合物的所述聚合酶、所述模板核酸和所述基因座特异性引物。任选地,步骤(d)还可包括在检测到所述稳定化的三元复合物后,使所述聚合酶从所述阵列中解离,由此将所述特征中的每个特征处的所述三元复合物转化为由来自所述特征处的所述三元复合物的所述模板核酸和所述基因座特异性引物组成的双链核酸。
作为另一选择,在步骤(d)之后,所述方法可包括步骤(e)在多个所述特征处形成第二多种稳定化的三元复合物,其中所述特征中的每个均包含来自所述特征处的所述三元复合物的所述模板核酸和所述基因座特异性引物、聚合酶以及下一个正确的核苷酸,所述下一个正确的核苷酸是所述模板核酸的所述靶等位基因的同源物。如果需要,所述方法还可包括步骤:(f)检测所述特征处的所述第二多种稳定化的三元复合物,从而鉴定所述靶等位基因。
在上述方法的具体实施方案中,相同聚合酶分子从步骤(b)至步骤(f)保留在所述特征中的每个特征处。然而,如果需要,可在一个或多个中间步骤中递送不同的聚合酶。
在上述方法的一些实施方案中,第一类型的核苷酸在步骤(c)中具有第一类型的外源标记,并且第一类型的核苷酸在步骤(f)中具有第二类型的外源标记。
可使用标记的不同组合。例如,所述方法的步骤(c)可包括检测在第一类型的核苷酸上的第一类型的外源标记、在第二类型的核苷酸上的第二类型的外源标记、在第三类型的核苷酸上的第三类型的外源标记以及在第四类型的核苷酸上的第四类型的外源标记。
或者,所述方法的步骤(c)可包括检测在第一类型的核苷酸上的第一类型的外源标记、在第二类型的核苷酸上的第一类型的外源标记、在第三类型的核苷酸上的第二类型的外源标记以及在第四类型的核苷酸上的第二类型的外源标记。任选地,步骤(f)可通过检测在所述第一类型的核苷酸上的第二类型的外源性标记、在所述第二类型的核苷酸上的第二类型的外源标记、在所述第三类型的核苷酸上的第一类型的外源标记以及在所述第四类型的核苷酸上的第一类型的外源标记来进行。
作为另一替代方案,可在两种或更多种核苷酸类型上使用相同类型的标记,或者,如果使用不同的标记,它们可在所采用的检测条件下产生不可区分的信号。
在另一种迭代方法中,一种用于鉴定核酸混合物中的靶等位基因的方法可包括以下步骤:(a)提供特征的阵列,其中不同的等位基因特异性引物附接在所述阵列的不同特征处;(b)使所述阵列与多种核酸模板、聚合酶和核苷酸接触以在多个所述特征处形成多种稳定化的三元复合物,其中所述稳定化的三元复合物各自具有聚合酶、具有基因座的靶等位基因的模板核酸、与所述基因座杂交的等位基因特异性引物,以及在所述基因座中具有同源物的下一个正确的核苷酸,其中所述等位基因特异性引物的3'端具有所述靶等位基因的同源核苷酸;(c)检测所述特征处的稳定化的三元复合物,从而鉴定所述靶等位基因;以及(d)在检测到所述稳定化的三元复合物后,使所述下一个正确的核苷酸从所述阵列的每个特征中解离,由此将所述特征中的每个特征处的所述三元复合物转化为二元复合物,所述二元复合物包含来自所述特征处的所述三元复合物的所述聚合酶、所述模板核酸和所述等位基因特异性引物。任选地,步骤(d)还可包括在检测到所述稳定化的三元复合物后,使所述聚合酶从所述阵列中解离,由此将所述特征中的每个特征处的所述三元复合物转化为包含以下的复合物:来自所述特征处的所述三元复合物的所述模板核酸和所述等位基因特异性引物。
作为另一选择,在步骤(d)之后,所述方法可包括步骤:(e)在多个所述特征处形成第二多种稳定化的三元复合物,其中所述特征中的每个均包含来自所述特征处的所述三元复合物的所述模板核酸和所述等位基因特异性引物、聚合酶以及下一个正确的核苷酸,所述下一个正确的核苷酸是所述模板核酸的所述靶等位基因的同源物。如果需要,所述方法还可包括步骤:(f)检测所述特征处的所述第二多种稳定化的三元复合物,从而鉴定所述靶等位基因。
在上述方法的具体实施方案中,相同聚合酶分子从步骤(b)至步骤(f)保留在所述特征中的每个特征处。然而,如果需要,可在一个或多个中间步骤中递送不同的聚合酶。
如上文所例示,本公开的方法还可包括将三元复合物从固体载体解离的步骤。任选地,可在不将下一个正确的核苷酸共价添加至引物的3'端的情况下进行解离。这可通过保持三元复合物稳定直至释放三元复合物来实现。释放未修饰的引物的优点是引物可重复用于检测相同类型的等位基因。例如,引物可以迭代方法使用以重新捕获如上所述的相同等位基因。引物也可与新的核酸混合物一起使用,以检测具有相同类型等位基因的新模板核酸。
示例性的解离技术包括但不限于聚合酶的变性,不同核酸与聚合酶的竞争性结合以引起靶等位基因的释放,三元复合物在没有下一个正确的核苷酸的溶液中、在没有引发的模板的溶液中或在下一个正确的核苷酸或引发的模板的浓度基本上分别低于用于下一个正确的核苷酸或引发的模板的聚合酶的解离常数(Kd)的溶液中的孵育。在一些实施方案中,三元复合物可与不同于下一个正确的核苷酸的核苷酸(例如,与靶等位基因不同的等位基因的同源核苷酸)一起孵育。这种解离方法提供了相对温和和特异以使得选择所需等位基因的解离而不是可能作为污染物存在的其他等位基因的优点。
在一些实施方案中,第一三元复合物的解离可通过用相同类型的第二标记的组分替换所述复合物的第一标记的组分来进行,其中所述第二标记的组分具有可与所述第一标记的组分区分开的不同标记。例如,用具有第一标记的核苷酸类型形成的三元复合物可用具有第二标记的相同类型的核苷酸替换。这将导致在三元复合物所在的阵列的特征处的明显标记交换。与仅检测复合物中的一种标记相比,检测两种标记可提供等位基因鉴定的准确性的置信度。
或者,可通过使引物延伸以并入下一个正确的核苷酸来进行解离三元复合物的步骤。所并入的核苷酸可以是在稳定化的三元复合物中当其在混合物中形成时存在的核苷酸分子。或者,不同的核苷酸分子可进入三元复合物且然后并入引物中。因此,并入步骤可涉及替换来自先前步骤核苷酸并将另一核苷酸并入引物的3'端。并入步骤可涉及从三元复合物内释放核苷酸,并将不同种类的核苷酸并入引物的3'端。
可进行并入步骤以添加标记的核苷酸。然后可例如在检测和解离三元复合物之后检测标记的核苷酸。在检测三元复合物后并入标记的核苷酸的优点是两种不同类型的测定(三元复合物的检测和延伸产物的检测)与仅进行一种测定相比可提供鉴定等位基因的增加的置信度。用于在诸如阵列的固体载体上进行延伸测定的示例性方法在美国专利号6,355,431或9,045,796种阐述,所述专利各自以引用的方式并入本文。本文阐述的方法可用于替代或增强参考文献中阐述的延伸测定。
在一些实施方案中,在引物的3'端仅并入单个核苷酸。例如,可修饰核苷酸的3'位置以包括3'终止子部分。3'终止子部分可以是可逆终止子或者可以是不可逆终止子。任选地,可逆终止子核苷酸包括附接在糖部分的3'位置处的3’-ONH2部分。有用的可逆终止子部分的其他实例描述于例如Bentley等人,Nature 456:53-59(2008);WO 04/018497;美国专利号7,057,026;WO 91/06678;WO 07/123744;美国专利号7,329,492;美国专利号7,211,414;美国专利号7,315,019;美国专利号7,405,281和US 2008/0108082中,其各自以引用的方式并入本文。任选地,在引物的3'端并入多个核苷酸。例如,所并入的核苷酸可包含在并入后能够进一步延伸的3'-羟基。在一些实施方案中,并入步骤是测序技术、扩增技术或使用核酸进行的其他技术的一部分,已经使用本文阐述的方法检测了所述核酸的等位基因。
并入的核苷酸或者可以是未标记的核苷酸或可检测标记的核苷酸类似物。无论是否标记,所述核苷酸可以是一旦并入引物中就被永久地或可逆地阻止延伸的终止子核苷酸。在核苷酸并入后,聚合酶可从引发的模板中解离。用于将核苷酸并入三元复合物的引发的模板中的示例性试剂和条件在共同拥有的美国序列号14/805,381(现在公布为美国公布号2017/0022553)和62/375,379(其在美国序列号15/677,870中以引用的方式并入)中阐述,所述专利各自以引用的方式并入本文。
使用本公开的方法检测的一种或多种模板核酸可用于各种后续应用。例如,所述模板核酸可用于制备方法,如基因或基因片段的克隆。可使用诸如聚合酶链反应(PCR)、滚环扩增(RCA)、多重置换扩增(MDA)等的方法扩增模板。在一些情况下,用于在检测方法中形成三元复合物的引物也可用于扩增。通常,使用本文阐述的方法检测的模板可使用本领域已知的方法进行操作,包括但不限于,在Sambrook等人,Molecular Cloning:A LaboratoryManual,第3版,Cold Spring Harbor Laboratory,New York(2001)或Ausubel等人,Current Protocols in Molecular Biology,John Wiley and Sons,Baltimore,Md.(1998)中描述的那些方法,所述文献各自以引用的方式并入本文。
在特定实施方案中,使用本文阐述的方法检测的一种或多种模板核酸可用于另一种分析方法,例如,实时聚合酶链反应(rtPCR)、定量PCR(qPCR)、核酸测序、单碱基延伸基因分型等。这些方法中的一些采用使引物沿着待分析的模板延伸的步骤。在一些情况下,用于在本文阐述的检测方法中形成三元复合物的引物也可用于另一种分析技术中的引物延伸。
任选地,如共同拥有的U.S.S.N.14/805,381(现在公布为美国公布号2017/0022553)中所描述进行测序,所述专利以引用的方式并入本文。简言之,用于确定模板核酸分子的序列的方法可基于在指定条件下形成三元复合物(聚合酶、引发的核酸和同源核苷酸之间)。所述方法通常可包括在并入核苷酸之前的检查步骤。检查步骤可涉及提供用引物引发的模板核酸分子;使所述引发的模板核酸分子与包含聚合酶和至少一个核苷酸分子的第一反应混合物接触;监测所述聚合酶与所述引发的模板核酸分子在所述核苷酸分子存在下的相互作用,而不将所述核苷酸分子化学并入到所述引发的模板核酸中;以及使用在所述核苷酸分子存在下所述聚合酶与所述引发的模板核酸分子的监测的相互作用来鉴定所述模板核酸中的下一个碱基。在所述方法中,三元复合物稳定化和二元复合物去稳定化有利地增强了正确核苷酸与不正确核苷酸之间的辨别。
也可使用合成测序(SBS)技术。SBS通常涉及通过针对与引物杂交的模板链反复添加核苷酸而使新生引物酶促延伸。SBS可利用具有终止子部分的核苷酸单体或缺乏任何终止子部分的核苷酸单体。使用具有终止子的单体的方法包括例如,在WO 04/018497、美国专利号7,057,026、WO 91/106678、WO 07/123744、U.S.US 2007/0166705、US 2006/0188901、US 2006/0240439、US 2006/0281109、WO 05/065814、US 2005/0100900、WO 06/064199或WO07010251中描述的那些方法,所述专利的公开内容以引用的方式并入本文。同样有用的是可从Illumina,Inc.,San Diego Calif商购的SBS方法。
一些SBS实施方案包括检测在将核苷酸并入延伸产物中时释放的质子。例如,基于释放的质子的检测的测序可使用可从Thermo Fisher(Waltham,MA)商购获得的电检测器和相关技术或者在美国专利申请公布号2009/0026082 A1、2009/0127589 A1、2010/0137143A1或2010/0282617 A1中描述的测序方法和系统,所述专利各自以引用的方式并入本文。
可使用其他测序程序,如焦磷酸测序。当特定核苷酸并入到与模板核酸链杂交的新生引物中时,焦磷酸测序检测无机焦磷酸盐(PPi)的释放(Ronaghi等人,AnalyticalBiochemistry 242(1),84-9(1996);Ronaghi,Genome Res.11(1),3-11(2001);Ronaghi等人Science 281(5375),363(1998);美国专利号6,210,891;6,258,568和6,274,320,所述文献各自以引用的方式并入本文)。在焦磷酸测序中,释放的PPi可通过经由ATP硫酸化酶转化为三磷酸腺苷(ATP)来检测,并且可经由荧光素酶产生的光子检测所得的ATP。因此,可经由发光检测系统来监测测序反应。
边连接边测序反应也是可用的,包括例如描述于以下中的那些:Shendure等人Science 309:1728-1732(2005);美国专利号5,599,675;以及美国专利号5,750,341,所述文献各自以引用的方式并入本文。一些实施方案可包括边测序边杂交程序,如例如描述于Bains等人,Journal of Theoretical Biology 135(3),303-7(1988);Drmanac等人,Nature Biotechnology 16,54-58(1998);Fodor等人,Science 251(4995),767-773(1995);以及WO 1989/10977中,所述文献各自以引用的方式并入本文。在边连接边测序和边测序边杂交程序两者中,通过寡核苷酸连接对与核酸模板杂交的引物进行重复的延伸循环。通常,寡核苷酸进行荧光标记并且可进行检测以确定模板的序列。
一些实施方案可利用涉及DNA聚合酶活性的实时监测的方法。例如,可通过携带荧光团的聚合酶与γ-磷酸标记的核苷酸之间的荧光共振能量转移(FRET)相互作用或使用零模波导(ZMW)来检测核苷酸并入。经由FRET和/或ZMW检测进行测序的技术和试剂描述于例如Levene等人Science 299,682-686(2003);Lundquist等人Opt.Lett.33,1026-1028(2008);Korlach等人Proc.Natl.Acad.Sci.USA 105,1176-1181(2008)中,所述文献的公开内容以引用的方式并入本文。
在一些实施方案中,测序方法利用附接至ZMW或其他固体载体特征的聚合酶。在本文阐述的方法中捕获的三元复合物或其组分可附接至ZMW或用于上述测序技术或本领域已知的其他固体载体。
尽管本公开已经举例说明了以多重形式检测核酸,但是应当理解,可类似地进行单重检测。例如,本文阐述的多重阵列可用固体载体代替,所述固体载体附接由仅一个基因座或仅一个等位基因形成的三元复合物。此外,检测不一定必须在固体载体上进行,而是可在流体(如容器、管或通道中的流体)中进行。
本公开的方法可与同本申请同时提交并且以引用的方式并入本文的标题为“ALLELE-SPECIFIC CAPTURE OF NUCLEIC ACIDS”的美国专利申请案号OMNI-011(097128-1036628(021PV1)中阐述的方法和组合物组合使用。更具体地,在本文阐述的方法中检测的一种或多种核酸可使用基于聚合酶的方法以选择或捕获具有目标靶标等位基因的核酸来获得。所述方法的实施方案利用聚合酶可与引发的模板和下一个正确的核苷酸形成稳定化的三元复合物的特异性。例如,可在聚合酶、靶等位基因和所述等位基因的同源核苷酸之间形成稳定化的三元复合物。所述方法的一个优点是聚合酶特异性允许靶等位基因与其他核酸分离,包括例如与靶等位基因由于单个核苷酸而不同的其他等位基因。例如,可在聚合酶、编码靶单核苷酸多态性(SNP)等位基因的引发的模板和SNP等位基因的同源核苷酸之间形成三元复合物。与同一基因座处的非靶SNP等位基因相比,三元复合物的捕获将导致SNP等位基因的选择性捕获,因为当与聚合酶形成三元复合物时,同源核苷酸对靶SNP具有选择性。
本文阐述的方法和组合物可用于捕获且任选地富集在其序列内含有各种突变的稀有等位基因(例如基于DNA或RNA的)。所述方法非常适合于从含有相同基因座的野生型DNA序列以及其他不相关序列的纯化或半纯化的寡核苷酸池捕获甚至稀有变体等位基因。用于选择性捕获靶等位基因的三元复合物可如图1A或图1B中所示进行构造。参与三元复合物形成的聚合酶、核苷酸、引物或模板可附接至配体,所述配体允许三元复合物与样品的其他组分分离。携带三元复合物的配体可捕获在具有所述配体的受体的固体载体上。任选地,可洗涤所述固体载体。可使用本文阐述的方法在固体载体上检测靶等位基因。或者,可通过使三元复合物与Mg2+或其他三元复合物去稳定化条件接触来洗脱具有稀有变体等位基因的核酸。富集的等位基因然后可用于本文阐述的检测方法中。
可用于富集靶等位基因的示例性方法包括例如以下方法。
用于使靶等位基因与核酸混合物分离的方法可包括以下步骤:(a)提供与附接至固体载体的稳定化的三元复合物流体接触的核酸混合物,其中所述稳定化的三元复合物包含聚合酶、引发的核酸模板和下一个正确的核苷酸,其中所述模板具有靶等位基因,其中所述下一个正确的核苷酸是所述靶等位基因的同源核苷酸,并且其中所述稳定化的三元复合物经由所述聚合酶与所述固体载体之间的键联或经由所述核苷酸与所述固体载体之间的键联而附接至所述固体载体;以及(b)使所述固体载体与所述核酸混合物分离,从而使所述靶等位基因与所述核酸混合物分离。
在其他实施方案中,用于使基因座的第一等位基因与所述基因座处的第二等位基因分离的方法可包括以下步骤:(a)提供与附接至固体载体的稳定化的三元复合物流体接触的包含所述第二等位基因的混合物,其中所述稳定化的三元复合物包含聚合酶、与核酸模板杂交的引物和下一个正确的核苷酸,其中所述模板具有所述第一等位基因,其中所述下一个正确的核苷酸是所述第一等位基因的同源核苷酸,或者所述引物的3’端具有所述第一等位基因的同源核苷酸,并且其中所述稳定化的三元复合物经由所述聚合酶与所述固体载体之间的键联或经由所述下一个正确的核苷酸与所述固体载体之间的键联而附接至所述固体载体;以及(b)使所述固体载体与所述核酸混合物分离,从而使所述第一等位基因与所述第二等位基因分离。
在其他实施方案中,可进行用于分别使多个基因座处的第一等位基因与所述多个基因座处的第二等位基因分离的方法。所述方法可包括以下步骤:(a)提供分别与多种稳定化的三元复合物流体接触的所述多个基因座处的第二等位基因的混合物,所述稳定化的三元复合物是固体载体附接的,其中所述稳定化的三元复合物各自包含聚合酶、引发的核酸模板和下一个正确的核苷酸,其中所述模板包含第一等位基因,其中所述下一个正确的核苷酸是所述第一等位基因的同源核苷酸,或者所述引物的3'端包含所述第一等位基因的同源核苷酸,并且其中所述稳定化的三元复合物各自经由所述聚合酶与所述固体载体之间的键联或经由所述下一个正确的核苷酸与所述固体载体之间的键联而附接至所述固体载体;以及(b)使所述固体载体与所述核酸混合物分离,从而使所述多个基因座处的所述第一等位基因与所述第二等位基因分离。
实施例I
区分下一个正确的核苷酸与错配的核苷酸。
方法和材料。聚合酶缓冲液:20mM Tris(pH 8)、300mM NaCl、5mM DTT、100μMdNTP、150nM Kienow、0.01%BSA、0.02%Tween-20、10mM MgC12。检查缓冲液:20mM Tris(pH8)、300mM NaCl、5mM DTT、100μM dNTP、150nM Klenow、0.01%BSA、0.02%Tween-20。并入缓冲液:20mM Tris(pH 8)、300mM NaCl、5mM DTT、0.01%BSA、0.02%Tween-20、10mM MgC12。洗涤缓冲液:20mM Tris(pH 8)、300mM NaCl、5mM DTT、0.01%BSA、0.02%Tween-20。
图4示出使用聚合酶、引发的模板和核苷酸(与模板中的下一个碱基匹配或错配)的结合测定的结果,其中在所述结合测定期间存在或不存在镁。第一递送的核苷酸是dCTP(C:T错配),并且第二递送是dATP(A:T匹配)。图4中的实线示出使用聚合酶缓冲液的结果。对于匹配A和不匹配C步骤,前稳态速率常数分别为0.0106和0.0084。差异太小而不能准确地辨别同源碱基。图1中的虚线表示检查缓冲液中的无镁结合步骤,然后浸泡在并入缓冲液中。1.1nm的信号阈值可允许准确鉴定正确的碱基。这些结果表明,当在检查期间镁被包含在缓冲液中时,传感平台不能区分匹配与错配碱基(聚合酶缓冲液,实线,图4)。相反,在不存在镁的情况下结合提供正确碱基与不正确碱基之间的非常大的区分(检查缓冲液,虚线,图4)。通过信号阈值而不是结合速率来确定正确碱基序列。
实施例II
盐浓度对匹配/错配碱基辨别的影响
Octet仪器(Red384或qk)(Menlo Park,CA)使用生物层干涉测量法来测量光纤尖端的表面处的结合反应。在此实施例中,将所述尖端用链霉抗生物素蛋白(SA)功能化以使得能够与5'生物素标记的DNA模板结合,所述DNA模板与与同所述模板的3'端附近的序列互补的引物杂交。
实验条件:将PhiX_匹配C和phiX_匹配A负载到各个尖端上。将引物-模板以在含有0.01-0.02%BSA和0.01-0.02%Tween 20的1-2x PBS(负载缓冲液)中100与500nM之间负载到所述尖端上。FP2引物相对于模板处于1.25-2倍过量。通过信号的变化监测负载,并且通常在30℃下在5分钟内达到平稳水平。将尖端在负载缓冲液中浸泡1-5分钟以除去未结合的DNA材料。对于碱基识别,将所述尖端浸泡在含有补充有0.01-0.02%BSA和0.01-0.02%Tween 20(LS缓冲液)、100nM聚合酶、100μM NTP以及50至300mM的不同浓度的额外NaCl的IXTaq缓冲液(10mM Tris-HCl,50mM KCl,pH 8.3,25℃,不含镁)的溶液中。phiX_匹配C双链体将形成三元复合物并显示结合信号的增加,因为呈现了下一个正确的核苷酸(同源物)。phiX_匹配A应该不会如此,因为它是不正确的核苷酸(非同源物)。
结果:在标准反应条件下,两种模板都结合聚合酶。然而,随着盐浓度的增加,非同源复合物的结合亲和力降低,而同源复合物的结合亲和力仍然较高。因此,碱基辨别的信噪比(SNR)增加,以使得在此检查步骤期间容易地鉴定下一个正确的碱基(图5)。在此实施例中使用氯化钠(NaCl),但也可使用诸如KCl、NH2(SO4)、谷氨酸钾和本领域已知的其他盐的盐。显示正确核苷酸与不正确核苷酸之间的结合亲和力差异的聚合酶包括Klenow、Bst2.0、Bsu和Taq。
贯穿本申请已参考各种公布、专利和/或专利申请。这些文件的公开内容特此以引用的方式整体并入本申请中。
已经描述了多个实施方案。然而,应理解,可做出各种修改。因此,其他实施方案也处于以下权利要求的范围内。