具体实施方式
本公开提供了用于鉴定引发的模板核酸中的核苷酸的方法。基于三元复合物的形成鉴定核苷酸,所述三元复合物包括引发的模板核酸、在引物3’末端与模板结合的聚合酶和与聚合酶结合以与模板中邻近引物3’末端的核苷酸配对的同源核苷酸。可以评估多种不同核苷酸类型形成三元复合物的能力。被观察到参与形成三元复合物的核苷酸类型可被鉴定为所查询的模板位置的同源核苷酸。基于这一观察结果和已知的核苷酸配对法则(即腺嘌呤与胸腺嘧啶或尿嘧啶配对,胞嘧啶与鸟嘌呤配对),可以推断模板位置处的核苷酸类型。
用于查询引发的模板核酸的有用方法是将聚合酶和第一类型的核苷酸递送至固定的核酸,检查固体载体将三元复合物组分募集至固定的核酸,从固定有核苷酸的固体载体中除去聚合酶和核苷酸,然后对不同类型的核苷酸重复该循环。尽管该方法可用于表征核酸,但从固体载体中递送和移除试剂可能很耗时。此外,这种置换循环消耗相对大量的聚合酶,所述聚合酶可以是生产上昂贵的试剂。
本公开提供了籍以连续地递送不同的核苷酸类型,然后将其从将要形成和检查三元复合物的容器中除去的方法。在该模式中,可将第一核苷酸类型递送至反应容器,然后在将第二核苷酸类型递送至容器之前从容器中移除。可在使核苷酸与三元复合物解离的条件下从容器中除去核苷酸同源物,从而使核苷酸与引发的模板核酸分离,而不引起聚合酶的大量去除。然后可以将另一个核苷酸递送至引发的模板核酸。如果聚合酶因引发的模板核酸的存在而基本上未被除去,则不必递送更多的聚合酶。这节约了原本要花费来制备更多聚合酶的时间和资源。
在其它实施方案中,可将不同的核苷酸类型在适于形成三元复合物的条件下连续递送至含有一种或多种引发的模板核酸的容器中。例如,可将第一核苷酸类型递送到含有引发的模板核酸阵列的容器中,然后可递送第二种核苷酸类型,使得两种核苷酸类型在容器中积累。因此,两种类型的三元复合物(各自含有两种不同核苷酸类型中的一种)可在阵列中积累。任选地,至少2种、3种或4种不同的核苷酸类型可在阵列中积累以在阵列上形成至少2种、3种或4种不同类型的三元复合物。当以将不同核苷酸类型连续递送至反应容器以使不同核苷酸累积的模式进行所述方法时,可在每次递送后对容器进行三元复合物的检查。在一些实施方案中,例如当每个核苷酸类型被可区分地标记时,单次检查可在所有核苷酸被递送后进行。
在特定实施方案中,可添加引物延伸步骤以前进至下一个模板位置用于随后的检查。检测模板区域中的一系列位置可用于确定该区域的核苷酸序列。如下面实施例部分中所阐述的,当用于通过BindingTM方案进行的测序中时,上述实施方案令人惊讶地提供了改进的测序准确度和读取长度。
尽管以上实施方案针对在每个步骤中递送单一类型的核苷酸进行了举例说明,但应当理解,可以在一个或多个步骤中递送多种核苷酸类型。例如,可以分别使用与每种类型的核苷酸附接的不同标记物来区分核苷酸。核苷酸的混合物可以彼此不同,使得不同递送和检查的净结果是产生一系列编码特定核苷酸类型的信号。可用于产生所述代码的示例性编码方案和核苷酸的混合物阐述于美国专利第9,951,385号和序列号为15/922,787的美国专利申请(现被授予美国专利第10,161,003号),所述专利和专利申请中的每一篇均通过引用并入。
除非另有说明,否则本文使用的术语将被理解为采用它们在相关领域中的普通含义。本文使用的几个术语及其含义如下。
如本文中所用,术语“阵列”是指附接至一个或多个固体载体,使得一个特征处的分子可与其它特征处的分子区别开来的分子群体。阵列可包括不同的分子,所述不同的分子各自位于固体载体上不同的可寻址特征处。或者,阵列可包括单独的固体载体,每个固体载体起着承载不同分子的特性的作用,其中不同的分子可以根据固体载体在固体载体所附着的表面上的位置来鉴定,或者根据固体载体在液体诸如流体流中的位置来鉴定。阵列的分子可以是例如核苷酸、核酸引物、核酸模板、引发的模板核酸或核酸酶,诸如聚合酶、连接酶、核酸外切酶或其组合。
如本文中所用,术语“封闭部分”,当用于指核苷酸时,意指在核酸聚合反应过程期间抑制或阻止核苷酸的3’氧与下一个正确的核苷酸形成共价键联的核苷酸的部分。“可逆终止的”核苷酸的封闭部分可以从核苷酸类似物中去除,或者以其它方式进行修饰,以允许核苷酸的3’-氧与下一个正确的核苷酸共价连接。这种封闭部分在本文中称为“可逆终止子部分”美国专利第7,427,673号、第7,414,116号、第7,057,026号、第7,544,794号或第8,034,923号或PCT出版物WO91/06678或WO 07/123744(其每一篇均通过引用并入本文)中阐述了示例性可逆终止子部分。具有封闭部分或可逆终止子部分的核苷酸可位于核酸(诸如引物)的3’末端,或者可以是未与核酸共价附接的单体。特别有用的封闭部分将存在于参与形成三元复合物的核酸的3’末端。
如本文中所用,术语“催化金属离子”是指促进聚合酶在核酸(例如,引物)的3’-氧与引入核苷酸的磷酸之间形成磷酸二酯键的金属离子。“二价催化金属阳离子”是具有二价的催化金属离子。催化金属离子可以以稳定聚合酶、核苷酸和引发的模板核酸之间的复合物形成的浓度(只要不发生磷酸二酯键形成,就称为金属离子的非催化浓度)存在。金属离子的催化浓度是指足以使聚合酶催化核酸(例如,引物)的3’-氧基团与引入核苷酸的磷酸基团之间的反应的金属离子的量。
如本文中所用,术语“二元复合物”是指聚合酶与引发的模板核酸之间的分子间缔合,不包括核苷酸分子,诸如引发的模板核酸的下一个正确核苷酸。
术语“包含”在本文中是开放式的,不仅包括例举的要素,还包括任何附加的要素。
如本文中所用,术语“解封闭”是指除去或修饰核苷酸的可逆终止子部分以使该核苷酸可延伸。例如,核苷酸可存在于引物的3’末端,使得解封闭使引物可延伸。示例性解封闭试剂和方法阐述于美国专利第7,427,673号、第7,414,116号、第7,057,026号、第7,544,794号或第8,034,923号或PCT公布WO 91/06678或WO 07/123744中,所述美国专利或PCT公布的每一篇通过引用并入本文。
如本文中所用,术语“每个”,当用于指项目集合时,旨在标识集合中的单个项目,但不一定指代集合中的每个项目。如果明确的公开或上下文清楚地另有规定,则可出现例外情况。
如本文中所用,术语“外源性的”,当用于指分子的一部分时,意指分子的天然类似物中不存在的化学部分。例如,核苷酸的外源标记物是天然存在的核苷酸上不存在的标记物。类似地,存在于聚合酶上的外源标记物不存在于在其天然环境中的聚合酶上。
如本文中所用,术语“延伸”,当用于指核酸时,意指在核酸的3’末端添加至少一个核苷酸的过程。当用于指核酸时,术语“聚合酶延伸”是指向核酸的3’末端添加至少一个核苷酸的聚合酶催化的过程。通过延伸而被添加到核酸中的核苷酸或寡核苷酸被认为掺入到核酸中。因此,术语“掺入”可用于指通过形成磷酸二酯键将核苷酸或寡核苷酸连接到核酸3’末端的过程。
如本文中所用,术语“可延伸的”,当用于指核苷酸时,意是指该核苷酸在3’位置具有氧或羟基部分,并且如果掺入到核酸中和当掺入核酸中时,能够与下一个正确核苷酸形成共价键。可延伸的核苷酸可以位于引物的3’位置,或者其可以是单体核苷酸。可延伸的核苷酸缺乏封闭部分,诸如可逆终止子部分。
如本文中所用,术语“特征”,当用于指阵列时,意指其中中存在特定分子的阵列中的位置。特征可以只包含单个分子,或者其可包含同一种类(即,分子的系综(ensemble))的几个分子的群体。或者,特征可包括不同种类的分子群体(例如,具有不同模板序列的三元复合物群体)。阵列的特征通常是离散的。离散特征可以是连续的,或者它们彼此之间具有间隔。本文中有用的阵列可具有例如间隔小于100微米、50微米、10微米、5微米、1微米或0.5微米的特征。可选地或另外地,阵列可具有间隔大于0.5微米、1微米、5微米、10微米、50微米或100微米的特征。每个特征的面积可以小于1平方毫米、500平方微米、100平方微米、25平方微米、1平方微米或更小。
如本文所用,“流动池”是包括将流体引导到检测区的一个或多个通道的反应室。检测区可耦合至检测器,使得能够观察反应室中发生的反应。例如,流动池可包含拴系于至固体载体上的引发的模板核酸分子,可将核苷酸和辅助试剂反复施加到所述固体载体上并将其洗掉。流动池可包含透明材料,以便在发生所需反应后对样品成像。例如,流动池可包括玻璃或塑料载玻片,其含有可将聚合酶、dNTP和缓冲液泵送通过其的小流体通道。通道内的玻璃或塑料可用一个或多个待测序的引发的模板核酸分子修饰。可放置外部成像系统以在检测区检测分子。示例性流动池、它们的制造方法和它们的使用方法描述于美国专利申请公布第2010/0111768 A1号或第2012-0270305 A1号、或WO 05/065814中,其每一篇均通过引用并入本文。
如本文中所用,术语“标记物”是指提供可检测的特征的分子或其部分。可检测的特征可以是例如光信号,诸如辐射的吸收率、荧光发射、发光发射、荧光寿命、荧光偏振等;瑞利和/或米氏散射;对配体或受体的结合亲和力;磁性;电学特性;电荷;质量;放射性等。示例性标记物包括但不限于荧光团、发光体、生色团、纳米颗粒(例如,金、银、碳纳米管)、重原子、放射性同位素、质量标记、电荷标记、自旋标记、受体、配体等。
如本文中所用,术语“下一个正确的核苷酸”是指将在引物的3’末端结合和/或掺入以补充与引物杂交的模板链中的碱基的核苷酸类型。模板链中的碱基被称为“下一个碱基”,并且正好在模板中与引物3’末端杂交的碱基的5’。下一个正确核苷酸可被称为下一个碱基的“同源物”,反之亦然。在三元复合物或双链核酸中彼此彼此相互作用的同源核苷酸被称为彼此“配对”。根据Watson-Crick配对法则,腺嘌呤(A)与胸腺嘧啶(T)或尿嘧啶(U)配对,胞嘧啶(C)与鸟嘌呤(G)配对。具有与下一个模板碱基不互补的碱基的核苷酸被称为“不正确的”、“错配的”或“非同源的”核苷酸。
如本文中所用,术语“非催化性金属离子”是指当存在聚合酶时,不促进核苷酸化学掺入引物所需的磷酸二酯键形成的金属离子。非催化性金属离子可以与聚合酶相互作用,例如,通过与催化性金属离子相比的竞争性结合。因此,非催化性金属离子可作为抑制性金属离子发挥作用。“二价非催化性金属离子”为化合价为2的非催化性金属离子。二价抑制性金属离子的实例包括但不限于Ca2+、Zn2+、Co2+、Ni2+和Sr2+。三价Eu3+和Tb3+离子是具有三价的非催化性金属离子。
如本文中所用,术语“核苷酸”可用于指天然核苷酸或其类似物。实例包括但不限于核苷酸三磷酸(NTP)诸如核糖核苷酸三磷酸(rNTP)、脱氧核糖核苷酸三磷酸(dNTP)或其非天然类似物,诸如二脱氧核糖核苷酸三磷酸(ddNTP)或可逆终止的核苷酸三磷酸(rtNTP)。
如本文中所用,术语“聚合酶”可用于指核酸合成酶,包括但不限于DNA聚合酶、RNA聚合酶、逆转录酶、引发酶(primase)和转移酶。典型地,聚合酶具有一个或多个可在其上发生核苷酸结合和/或核苷酸聚合的催化的活性部位。聚合酶可以催化核苷酸聚合到双链核酸分子的第一链的3’末端。例如,聚合酶催化通过磷酸二酯键将下一个正确核苷酸添加到双链核酸分子的第一链的3’氧基团上,从而将核苷酸共价掺入双链核酸分子的第一链。任选地,在本文阐述的方法中使用的一种或多种条件下,聚合酶不需要能够掺入核苷酸。例如,突变型聚合酶可以能够形成三元复合物,但不能催化核苷酸掺入。
如本文中所用,术语“引发的模板核酸”或“引发的模板”是指这样的核酸,其具有双链区,使得其中一条链为引物,而另一条链为模板。两条链可以是连续核酸分子的一部分(例如发夹结构),或者两条链可以是彼此不共价连接的可分离分子。
如本文中所用,术语“引物”是指具有与模板序列处或附近的核酸结合的序列的核酸。一般来说,引物以允许模板复制(例如,通过引物的聚合酶延伸)的构型结合。引物可以是与核酸分子的第二部分结合的该核酸分子的第一部分,第一部分是引物序列,第二部分是引物结合序列(例如发夹引物)。或者,引物可以是与具有模板序列的第二核酸分子结合的第一核酸分子。引物可由DNA、RNA或其类似物组成。引物可具有可延伸的3’末端或被封闭而不能引物延伸的3’末端。
如本文中所用,术语“固体载体”是指不溶于含水液体的刚性基板。基板可以是无孔的或多孔的。基板可以任选地能够吸收液体(例如,由于多孔性),但通常具有足够的刚性,使得基板在吸收液体时基本上不膨胀,并且在通过干燥去除液体时基本上不收缩。无孔固体载体通常不透液体或气体。示例性固体载体包括但不限于玻璃和改性或功能化玻璃、塑料(包括丙烯酸树脂、聚苯乙烯和苯乙烯与其它材料的共聚物、聚丙烯、聚乙烯、聚丁烯、聚氨酯、TeflonTM、环烯烃、聚酰亚胺等)、尼龙、陶瓷、树脂、Zeonor、二氧化硅或二氧化硅基材料(包括硅和改性硅)、碳、金属、无机玻璃、光纤束和聚合物。
如本文中所用,术语“三元复合物”是指聚合酶、双链核酸和核苷酸之间的分子间缔合。通常,聚合酶促进下一个正确核苷酸与引发的核酸的模板链之间的相互作用。下一个正确核苷酸可通过沃尔森-克里克氢键合与模板链相互作用。术语“稳定的三元复合物”是指促进或延长存在的三元复合物或已抑制对其的破坏的三元复合物。一般来说,三元复合物的稳定化防止三元复合物的核苷酸组分共价掺入到三元复合物的引发的物核酸组分中。
如本文中所用,术语“类型”用于标识具有相同化学结构的分子。例如,核苷酸的混合物可包括几个dCTP分子。dCTP分子将被理解为是彼此相同类型的核苷酸,但与dATP、dGTP、dTTP等相比是不同类型的核苷酸。同样,核苷酸序列相同的单个DNA分子是同一类型,然而序列不同的DNA分子是不同类型。术语“类型”也可标识具有相同化学结构的部分。例如,模板核酸中的胞嘧啶碱基将被理解为彼此为相同类型的碱基,而与它们在模板序列中的位置无关。
如本文中所用,“容器”是用于将一种化学过程(例如,结合事件;掺入反应;等等)彼此隔开,或者提供化学过程可以发生的空间的容器。与所公开的技术结合使用的容器的非限制性实例包括:流动池、多孔板的孔、显微镜载玻片、管(例如,毛细管)、微滴、囊泡、试管、托盘、离心管、阵列中的特征、管道、基底中的通道等。如本文中所用,“人造容器”是人造的或经人修改的且用于将一种化学过程(例如,结合事件;掺入反应;等等)彼此隔开,或者提供化学过程可以发生的空间的容器。
根据以上定义,可以理解下面阐述的和权利要求中例举的实施方案。
本公开提供了用于鉴定引发的模板核酸中的核苷酸的方法。所述方法可包括以下步骤:(a)提供具有引发的模板核酸、聚合酶和第一碱基类型的核苷酸同源物的容器;(b)检查容器中是否有稳定的三元复合物,所述三元复合物包括聚合酶和结合在引发的模板核酸的碱基位置处的第一碱基类型的核苷酸同源物;(c)将第二碱基类型的核苷酸同源物递送至所述容器,由此所述容器保留来自步骤(b)的引发的模板核酸和聚合酶;(d)检查容器中是否有稳定的三元复合物,所述三元复合物包括聚合酶和结合在引发的模板核酸的碱基位置处的第二碱基类型的核苷酸同源物;以及(e)鉴定在引发的模板核酸的碱基位置处的核苷酸的类型。
还提供了用于鉴定引发的模板核酸中的核苷酸的方法,其包括以下步骤:(a)提供引发的模板核酸的阵列;(b)形成稳定的三元复合物,所述三元复合物各自包括聚合酶、第一碱基类型的核苷酸同源物和阵列中的引发的模板核酸;(c)检测阵列中的稳定的三元复合物;(d)对第二碱基类型的核苷酸同源物重复步骤(b)和(c),由此引发的模板核酸和聚合酶保留在阵列中;以及(e)鉴定存在于步骤(c)中检测到的每一种稳定的三元复合物中的核苷酸的类型。
本公开还提供了用于鉴定引发的模板核酸中的核苷酸的方法,其包括以下步骤:(a)提供引发的模板核酸的阵列;(b)将多种聚合酶和第一碱基类型的多种核苷酸同源物递送至所述阵列,从而形成稳定的三元复合物,所述三元复合物各自包含多种聚合酶中的聚合酶、第一碱基类型的多种核苷酸同源物中的核苷酸和所述阵列的引发的模板核酸;(c)检测阵列中的稳定化三元复合物;(d)对第二碱基类型的核苷酸同源物重复步骤(b)和(c),由此阵列的引发的模板核酸和多种聚合酶中的聚合酶保留在阵列中;以及(e)鉴定存在于步骤(c)中检测到的每一种稳定的三元复合物中的核苷酸的类型。
本公开的方法可包括用于检测三元复合物的检查步骤。所述方法的实施方案利用了聚合酶可利用来与引发的模板核酸和下一个正确核苷酸形成稳定的三元复合物的特异性。下一个正确核苷酸可以非共价结合至稳定的三元复合物,仅通过非共价相互作用与复合物的另外成员相互作用。用于形成稳定的三元复合物的有用方法和组合物更详细地阐述于下面和共同拥有的美国专利申请公布第2017/0022553 A1号或序列号为15/677,870的美国专利申请(公布为美国专利申请公布第2018/0044727 A1号)、序列号为15/851,383的美国专利申请(其被公布为美国专利申请公布第2018/0187245 A1号并要求序列号为62/440,624的美国专利申请的优先权)或序列号为15/873,343的美国专利申请(其被公布为美国专利申请公布第2018/0208983 A1号并要求序列号为62/450,397的美国专利申请的优先权)中,所述专利申请的每一篇通过引用并入本文。
典型地,例如,由于试剂交换或洗涤会干扰检查和延伸,因此将检查与引物延伸分开且离散地进行。或者,在一些实施方案中,检查和引物延伸步骤可在同一混合物中进行。
虽然在某些催化金属离子(例如,Mg2+)不存在的情况下,聚合酶、引发的模板核酸和下一个正确核苷酸之间可以形成三元复合物,但在催化金属离子不存在的情况下,核苷酸的化学添加被抑制。催化金属离子水平低或不足,会导致稳定的三元复合物中下一个正确核苷酸的非共价螯合。本文公开的其它方法也可用于产生稳定的三元复合物。
任选地,当引发的模板核酸的引物包含封闭部分(例如可逆终止子部分)时,可以形成稳定的三元复合物,所述封闭部分阻止引入的核苷酸酶促掺入引物中。所述相互作用可以在稳定剂存在的情况下发生,从而聚合酶-核酸的相互作用在下一个正确核苷酸存在的情况下得以稳定。引发的模板核酸的引物可选地可为可延伸的引物,或为在其3’末端被阻止延伸的引物(例如,通过在引物的3’末端存在可逆终止子部分可以实现封闭)。当下一个正确核苷酸的碱基与引发的模板核酸的下一个碱基互补时,引发的模板核酸、聚合酶和同源核苷酸能够形成稳定的三元复合物。
如上所述,有利于或稳定三元复合物的条件可通过封闭基团(例如引物的3’核苷酸上的可逆终止子部分)的存在或通过催化金属离子的不存在来提供,所述封闭基团阻止引入的核苷酸酶促掺入引物。其它有用的条件包括三元复合稳定剂诸如抑制核苷酸掺入或聚合的非催化性离子(例如,二价或三价非催化性金属离子)的存在。非催化性金属离子包括但不限于钙、锶、钪、钛、钒、铬、铁、钴、镍、铜、锌、镓、锗、砷、硒、铑、铕和铽离子。任选地,一种或多种单价阳离子和/或谷氨酸根阴离子的存在提供了不利于二元复合物(即聚合酶与引发的核酸之间的复合物,但缺乏同源核苷酸)或使所述二元复合物不稳定的条件。作为另外的选择,可使用经工程化阻止催化活性或阻止二元复合物形成倾向的聚合酶。
三元复合物稳定条件可在不同核苷酸存在的情况下,例如,通过破坏二元复合物的稳定性,被进一步配制来增强聚合酶对引发的模板核酸的亲和力差异。任选地,在不同核苷酸存在的情况下,所述条件导致聚合酶对引物-模板的不同亲和力。举例来说,所述条件包括但不限于高盐和谷氨酸根离子。例如,盐可以溶解在水溶液中以产生单价阳离子,诸如单价金属阳离子(例如,钠离子或钾离子)。任选地,提供单价阳离子(例如,单价金属阳离子)的盐进一步提供谷氨酸根离子。任选地,谷氨酸根离子源可以是谷氨酸钾。在一些情况下,可用于改变引物-模板杂交体的聚合酶亲和力的谷氨酸钾的浓度从10mM扩展至1.6M的谷氨酸钾,或在10mM与1.6M之间的任何量。如上所述,高盐是指50mM至1.5M盐的盐浓度。
应当理解,本文阐述的用于稳定三元复合物的选项不需要相互排斥,而是可以以各种组合使用。例如,三元复合物可通过一种或多种手段的组合来稳定,包括但不限于聚合酶结构域的交联、聚合酶与核酸的交联、稳定三元复合物的聚合酶突变、由小分子产生的变构抑制、反竞争性抑制剂(uncompetitive inhibitor)、竞争性抑制剂、非竞争性抑制剂、催化性金属离子不存在、引物上存在封闭部分以及本文阐述的其它手段。在本文阐述的方法或组合物的特定构型中,聚合酶不共价附接至所述聚合酶参与的三元复合物的其它组分。此外,聚合酶不需要共价附接至任何固相材料,诸如用于核酸阵列的基底。相反,若无其对附接至基底(诸如核酸阵列的特征)的三元复合物的组分的非共价亲和力,聚合酶可在溶液中自由扩散。
稳定的三元复合物可以根据需要包括天然核苷酸、核苷酸类似物或经修饰的核苷酸,以适合方法的特定应用或配置。任选地,核苷酸类似物具有含氮碱基、五碳糖和磷酸基团,其中与天然核苷酸相比,核苷酸的任何部分都可以被修饰、去除和/或替代。核苷酸类似物可以是不可掺入的核苷酸(即不能与引物的3’氧反应形成共价键联的核苷酸)。此类不能掺入的核苷酸包括,例如,单磷酸和二磷酸核苷酸。在另一个实例中,核苷酸可在5’位置(例如在三磷酸基团处)包含一个或多个修饰,使得核苷酸不可掺入。不可掺入的核苷酸的实例可见于美国专利第7,482,120号(其通过引用并入本文)中。在一些实施方案中,不可掺入的核苷酸可以随后被修饰成可掺入的。不可掺入的核苷酸类似物包括但不限于α-磷酸修饰的核苷酸、α-β核苷酸类似物、β-磷酸修饰的核苷酸、β-γ核苷酸类似物、γ-磷酸修饰的核苷酸、具有5’硫代磷酸酯部分的核苷酸或笼状核苷酸。核苷酸类似物的实例描述于美国专利第8,071,755号(其通过引用并入本文)中。
参与稳定的三元复合物的核苷酸类似物可以包括终止子,所述终止子在类似物已被掺入引物后可逆地阻止随后在引物3’末端的核苷酸掺入。例如,U.S.7,544,794和U.S.8,034,923(这些专利的公开内容通过引用并入本文)描述了其中3’-OH基团被3’-ONH2部分替代的可逆终止子。另一种类型的可逆终止子与如例如U.S.8,808,989(其公开内容通过引用并入本文)中所阐述的核苷酸的含氮碱基连接。可类似地结合本文所述方法使用的其它可逆终止子包括叠氮基甲基部分或本文其它地方引用的参考文献中或U.S.7,956,171、U.S.8,071,755和U.S.9,399,798(这些美国专利的公开内容通过引用并入本文)中描述的那些终止子。在某些实施方案中,可在称为“解封闭”的过程中以从引物中修饰或去除逆终止子部分,从而允许随后的核苷酸掺入。在可逆终止子的背景下,在本文引用的参考文献中阐述了用于解封闭的组合物和方法。
或者,核苷酸类似物不可逆地阻止核苷酸掺入它们已被掺入其中的引物的3’-末端。不可逆的核苷酸类似物包括2’,3’-双脱氧核苷酸(ddNTP,诸如ddGTP、ddATP、ddTTP、ddCTP)。双脱氧核苷酸缺乏原本参与聚合酶介导的引物延伸的dNTP的3’-OH基团。因此,3’位置具有氢部分,而不是天然的羟基部分。不可逆终止的核苷酸对于基因分型应用或其它不需要引物延伸或沿模板核酸的序贯检测不是想要的应用是特别有用的。
在一些实施方案中,参与形成三元复合物的核苷酸可包括外源标记物诸如发光体。任选地,外源标记的核苷酸可包括可逆或不可逆的终止子部分,外源标记的核苷酸可以是不可掺入的,外源标记的核苷酸可以缺乏封闭部分,外源标记的核苷酸可以是可掺入的,或者外源标记的核苷酸可以是可掺入的和不可掺入的。当用于与非标记的聚合酶形成稳定的三元复合物时,外源标记的核苷酸可以特别有用。例如,标记物可产生在本文阐述的方法中被检测到的发光。或者,核苷酸上的外源标记物可提供荧光共振能量转移(FRET)对中的一个配偶体,聚合酶上的外源标记物可提供该对的第二个配偶体。因此,FRET检测可用于鉴定包含两种配偶体的稳定的三元复合物。或者,参与形成三元复合物的核苷酸可缺乏外源标记物(即核苷酸可以是“非标记的”)。任选地,非标记的核苷酸可包括可逆或不可逆的终止子部分,非标记的核苷酸可以是不可掺入的,非标记的核苷酸可以缺乏终止子部分,非标记的核苷酸可以是可掺入的,或者非标记的核苷酸可以是可掺入的且非终止的。当聚合酶上的标记物用于检测稳定的三元复合物时,非标记的核苷酸可以是有用的。非标记的核苷酸也可用于本文阐述的方法的延伸步骤。应当理解,关于核苷酸的部分或功能的不存在是指核苷酸不具有这样的功能或部分。还应当理解,可在本文阐述的方法或组合物中明确地省略关于核苷酸或其类似的本文阐述的或者关于核苷酸或其类似物的原本在本领域中已知的一种或多种功能或部分。
任选地,在形成稳定的三元复合物期间,混合物中存在核苷酸(例如天然核苷酸或合成的核苷酸类似物)。例如,可存在至少1种、2种、3种、4种或更多种核苷酸类型。可选地或另外地,至多可存在4种、3种、2种或1种核苷酸类型。类似地,存在的一种或多种核苷酸类型可以与模板核酸中的至少1种、2种、3种或4种碱基类型互补。可选地或另外地,存在的一种或多种核苷酸类型可以与模板核酸中至多4种、3种、2种或1种碱基类型互补。
不阻止参与三元复合物的任何核苷酸修饰都可用于本文公开的方法。核苷酸可以永久或短暂地与聚合酶结合。任选地,将核苷酸类似物例如通过共价接头与聚合酶融合。任选地,将多种核苷酸类似物与多种聚合酶融合,其中将每种核苷酸类似物与不同的聚合酶融合。任选地,存在于稳定的三元复合物中的核苷酸不是籍以稳定三元复合物的手段。因此,多种其它三元复合物稳定方法中的任一种都可组合在利用核苷酸类似物的反应中。
在特定的实施方案中,存在于稳定的三元复合物中的引发的模板核酸分子的引物链在本文阐述的方法的一个或多个步骤中未被存在的聚合酶化学改变。例如,引物不需要通过形成新的磷酸二酯键来延伸,也不需要在形成稳定的三元复合物的步骤中以及在检测稳定的三元复合物的步骤中,通过溶核降解来缩短。
根据本公开制备或使用的三元复合物可以任选地包括一种或多种外源标记物。在形成三元复合物之前,可将标记物附接至三元复合物的组分(例如,附接至聚合酶、模板核酸、引物和/或同源核苷酸)。示例性的附接包括共价附接或非共价附接,诸如本文中、本文中引用的参考文献中所阐述的或本领域已知的那些。在一些实施方案中,将标记的组分在溶液中递送至附接至未标记的组分的固体载体上,由此通过形成稳定的三元复合物将标记物招募到固体载体上。因此,可基于对所招募的标记物的观察来检测或鉴定附接于载体的组分。无论是在溶液相中还是在固体载体上使用,外源标记物都可用于在检查步骤期间检测稳定的三元复合物或其单个组分。外源标记物可在组分与已经形成稳定的三元复合物的其它组分解离后保持附接于组分上。示例性标签、用于附接标记物的方法和用于使用标记的组分的方法更详细地阐述于共同拥有的美国专利申请公布第2017/0022553 A1号或美国专利申请序列第15/677,870号(公布为美国专利申请公布第2018/0044727 A1号)、第15/851,383号(公布为美国专利申请公布第2018/0187245 A1号)、第15/873,343号(公布为美国专利申请公布第2018/0208983 A1号)、第62/450,397号和第62/506,759号中,所述美国专利申请的每一篇均通过引用并入本文。
有用的外源标记物的实例包括但不限于放射性标记部分、发光体部分、荧光团部分、量子点部分、生色团部分、酶部分、电磁自旋标记部分、纳米颗粒光散射部分以及本领域已知的各种其它信号生成部分中的任一种。合适的酶部分包括,例如,辣根过氧化物酶、碱性磷酸酶、β-半乳糖苷酶或乙酰胆碱酯酶。示例性荧光团部分包括,但不限于伞形酮、荧光素、异硫氰酸盐、罗丹明、四甲基罗丹明、曙红、绿色荧光蛋白及其波长偏移的变体、赤藓红、香豆素、甲基香豆素、芘、孔雀石绿、茋(stilbene)、Lucifer Yellow
TM、Cascade Blue
TM、Texas Red
TM、
染料、
染料、丹磺酰氯、藻红蛋白、藻蓝蛋白、荧光镧系元素络合物诸如包括铕和铽的那些、Cy3、Cy5、Cy7、Alexa
染料以及本领域已知的其它染料,诸如在
Principles of Fluorescence Spectroscopy,Joseph R.Lakowicz(编辑),Plenum Pub Corp,第2版(1999年7月)和Richard P.Hoagland的
Molecular Probes Handbook的第6版中描述的那些染料。
第二标记物可用于本公开的方法中。第二标记物是可与配偶体部分特异性地结合的结合部分。例如,可将配体部分连接至聚合酶、核酸或核苷酸,以允许通过所述配体对标记的受体的特异性亲和力进行检测。可使用的示例性结合部分对包括但不限于抗原和免疫球蛋白或其活性片段,诸如FAb;免疫球蛋白和免疫球蛋白(或分别的活性片段);抗生物素蛋白和生物素,或其对抗生物素蛋白具有特异性的类似物;链霉抗生物素蛋白和生物素,或其对链霉抗生物素蛋白具有特异性的类似物;互补寡核苷酸;或碳水化合物和凝集素。
在一些实施方案中,第二标记物可以是化学上可修饰的部分。在该实施方案中,具有反应性官能团的标记物可掺入稳定的三元复合物中。随后,官能团可与初级标记部分共价反应。合适的官能团包括但不限于氨基、羧基、马来酰亚胺基、氧代基和巯基。
在替代实施方案中,三元复合物可以缺乏外源标记物。例如,三元复合物和参与三元复合物的所有组分(例如聚合酶、模板核酸、引物和/或同源核苷酸)可缺乏本文描述的或上文并入的参考文献中描述的一个、几个或所有外源标记物。在此类实施方案中,可基于稳定的三元复合物的固有性质,诸如质量、电荷、固有光学性质等,来检测所述三元复合物。用于检测非标记的三元复合物的示例性方法阐述于共同拥有的美国专利申请公布第2017/0022553 A1号、PCT申请序列第PCT/US16/68916号(公布为WO 2017/117243)或美国专利申请序列第62/375,379号或第15/677,870号(公布为美国专利申请公布第2018/0044727 A1号)中,所述美国专利申请每一篇通过引用并入本文。
通常,检测可以在检查步骤中通过感知三元复合物或附接于其上的标记部分的固有性质的方法来实现。检测可基于的示例性性质包括但不限于质量、电导率、能量吸收率、发光等。发光的检测可使用本领域已知的与核酸阵列相关的方法来进行。发光体可基于多种发光特性中的任一种来检测,所述发光性质包括例如发射波长、激发波长、荧光共振能量转移(FRET)强度、淬灭、各向异性或寿命。可用于本文阐述的方法中的其它检测技术包括,例如,可用于感知质量的质谱法;可用于感知表面上的结合的表面等离子共振术;可用于感知标记物吸收的能量的波长的吸光度;可用于感知由于标记物的存在而引起的温度变化的量热法;可用于感知标记物的电特性的电导率或阻抗,或者其它已知的分析技术。可用于产生、操纵和检测稳定的三元复合物的试剂和条件的实例包括,例如,阐述于共同拥有的美国专利申请公布第2017/0022553 A1号;PCT申请序列第PCT/US16/68916号、或美国专利申请序列第15/677,870号(公布为美国专利申请公布第2018/0044727 A1号)、第15/851,383号(公布为美国专利申请公布第2018/0187245 A1号);第15/873,343号(公布为美国专利申请公布第2018/0208983 A1号);第62/450,397号或第62/506,759号中,所述专利申请每一篇通过引用并入本文。
本文阐述的方法的一些实施方案利用两种或更多种可区分的信号来彼此区分稳定的三元复合物和/或区分模板核酸中的一种碱基类型与另一种碱基类型。例如,可以基于独特的光学特性(诸如独特的激发波长或独特的发射波长)来彼此区分两种或更多种发光体。在特定实施方案中,方法可基于发光强度的差异来区分不同的稳定的三元复合物。例如,可在其中第一三元复合物比第二三元复合物发射更低强度的条件下检测第一三元复合物。这种强度缩放(有时称为“灰度缩放”)可利用任何可区分的强度差异。示例性差异包括特定的稳定的三元复合物具有与待检测的另一种稳定的三元复合物的强度相比为至多10%、25%、33%、50%、66%或75%的强度。
强度差异可由使用不同的发光体产生,例如,每种发光体具有不同的消光系数(即,导致不同的激发特性)和/或不同的发光量子产率(即,导致不同的发射特性)。或者,可使用相同的发光体类型,但其可以以不同的量存在。例如,第一三元复合物群体的所有成员都可用特定的发光体标记,而第二群体只有一半成员用所述发光体标记。在本示例中,第二群体预期将产生第一群体的一半信号。可以例如通过使用标记的核苷酸和未标记的核苷酸的混合物(与主要包含标记的核苷酸的第一群体相反)来产生第二群体。类似地,第二群体可以例如通过使用标记的聚合酶和未标记的聚合酶的混合物(与主要包含标记的聚合酶的第一群体相反)来产生。在替代标记方案中,第一三元复合物群体可包括具有多种产生特定发光信号的标记物的聚合酶分子,第二三元复合物群体可包括各自仅具有产生发光信号的标记物中的一种的聚合酶分子。
在一些实施方案中,检查步骤以推定至少一种核苷酸类型的身份的方式进行,例如,如共同拥有的美国专利第9,951,385号或美国专利申请序列第15/922,787号(被授予美国专利第10,161,003号),所述专利的每一篇通过引用并入本文。作为使用插补的替代或补充,检查步骤可使用消歧(disambiguation)来鉴定一种或多种核苷酸类型,例如,如共同拥有的美国专利第9,951,385号或美国专利申请序列第15/922,787号(被授予美国专利第10,161,003号)(其每一篇均通过引用并入本文)中所阐述的。
本公开的方法可以以这样的模式进行,凭借该模式可连续地递送不同的核苷酸类型,然后将其从将要形成和检查三元复合物的容器中除去。在该模式中,可将第一核苷酸类型递送至反应容器,然后在将第二核苷酸类型递送至容器之前从容器中除去。当核苷酸被去除时,聚合酶可保留在容器中。因此,可将聚合酶最初递送至流动池以产生促进与第一核苷酸形成三元复合物的条件,并且可在随后的递送中加入(但不一定加入)新的聚合酶以促进与随后递送的核苷酸形成三元复合物。
因此,用于鉴定引发的模板核酸中的核苷酸的方法可以包括以下步骤:(a)提供具有引发的模板核酸、聚合酶和第一碱基类型的核苷酸同源物的容器;(b)检查容器中是否有稳定的三元复合物,所述三元复合物包括聚合酶和结合在引发的模板核酸的碱基位置处的第一碱基类型的核苷酸同源物;(c)从容器中除去第一碱基类型的核苷酸同源物,并将第二碱基类型的核苷酸同源物递送至所述容器,由此所述容器保留来自步骤(b)的引发的模板核酸和聚合酶;(d)检查容器中是否有稳定的三元复合物,所述三元复合物包括聚合酶和结合在引发的模板核酸的碱基位置处的第二碱基类型的核苷酸同源物;以及(e)鉴定在引发的模板核酸的碱基位置处的核苷酸的类型。
此外,用于鉴定引发的模板核酸中的核苷酸的方法可包括以下步骤:(a)提供引发的模板核酸的阵列;(b)形成稳定的三元复合物,所述三元复合物各自包括聚合酶、第一碱基类型的核苷酸同源物和阵列中的引发的模板核酸;(c)检测阵列中的稳定的三元复合物;(d)从阵列中除去第一碱基类型的核苷酸同源物,然后对第二碱基类型的核苷酸同源物重复步骤(b)和(c),由此引发的模板核酸和聚合酶保留在阵列中;以及(e)鉴定存在于步骤(c)中检测到的每一种稳定的三元复合物中的核苷酸的类型。
此外,还提供了用于鉴定引发的模板核酸中的核苷酸的方法,其包括以下步骤:(a)提供引发的模板核酸的阵列;(b)将多种聚合酶和第一碱基类型的多种核苷酸同源物递送至所述阵列,从而形成稳定的三元复合物,所述三元复合物各自包括所述多种聚合酶中的聚合酶、所述第一碱基类型的多种核苷酸同源物中的核苷酸和所述阵列的引发的模板核酸;(c)检测阵列中的稳定的三元复合物;(d)从阵列中除去第一碱基类型的核苷酸同源物,然后对第二碱基类型的核苷酸同源物重复步骤(b)和(c),由此阵列的引发的模板核酸和多种聚合酶中的聚合酶保留在阵列中;以及(e)鉴定存在于步骤(c)中检测到的每一种稳定的三元复合物中的核苷酸的类型。
可在使核苷酸与三元复合物解离的条件下从容器中除去核苷酸同源物,从而使核苷酸与引发的模板核酸分离,而不引起聚合酶的大量去除。例如,解离的核苷酸可通过使流体流动远离引发的模板核酸、倾析流体远离引发的模板核酸、将附接至引发的模板核酸的固体载体与流体分离等来去除。然后可将另一种核苷酸(通常但不总是与先前去除的核苷酸类型不同的核苷酸类型)递送至引发的模板核酸。如果聚合酶因引发的模板核酸的存在而基本上未被除去,则不必递送更多的聚合酶。这节约了原本要花费来制备更多聚合酶的时间和资源。
可使用多种技术中的任一种从三元复合物中除去核苷酸,而基本上不去除引发的模板核酸和聚合酶。例如,引发的模板核酸和聚合酶都可被固定在固体载体上,使得在其下形成三元复合物的平衡条件的破坏将导致核苷酸解离到溶液中并远离固定的组分。流体与固定的组分的分离将导致核苷酸与引发的模板核酸和聚合酶分离。仅降低流体中未结合的核苷酸的浓度(例如,通过从聚合酶和引发的模板核酸周围的流体中除去未结合的核苷酸)将通过结合平衡的移动引起解离。作为降低核苷酸浓度的替代或补充,可使用破坏结合三元复合物的组分的非共价力的化学或物理条件将核苷酸从三元复合物解离。下文将进一步详细阐述示例性条件。
当固定能够参与三元复合物的两种组分时,相对长且柔性的接头特别有用。所述长度和柔性可使两种组分在定位于固体载体上时相互缔合和解离。示例性接头包括但不限于包括聚乙二醇(PEG)、核酸、肽核酸、肽、聚丙二醇、聚乙烯、聚丙烯、聚酰胺、聚酯等的那些接头。示例性接头和用于它们的附接的反应性基团阐述于Krishnamurthy等人,(2007)J.Am.Chem.Soc.,129:1312-1320和美国专利申请公布第2016/0032379 A1中,所述文献和专利申请公布中的每一篇通过引用并入本文。
在另一个示例性实施方案中,仅固定三元复合物的一种组分。例如,可将引发的模板核酸或聚合酶固定在固体载体上。固定可通过接头(诸如上文阐述的那些)介导,或通过用于将分析物附接至本文中或与本文中的阵列结合引用的参考文献中阐述的阵列的化学物质介导。在此类实施方案中,可使用化学或物理条件解离三元复合物,所述化学或物理条件选择性地将核苷酸从聚合酶和引发的模板核酸解离,同时维持聚合酶和引发的模板核酸之间的缔合。只要所述对中的任一组分被固定在固体载体上,就可以利用这种缔合来保持聚合酶和引发的模板核酸。然后可通过将含有核苷酸的流体与固体载体分离来除去核苷酸。可使用上文在固定两种组分的上下文中阐述的接头固定三元复合物的单一组分。也可使用其它固定部分,无论它们是否具有上文举例说明的接头的柔性或长度。
在本文阐述的方法中可用于将核苷酸从三元复合物解离的物理条件包括,例如,升高至高于生理范围的范围的温度,从而引起核苷酸从三元复合物的选择性解离,或吸引带电荷的核苷酸种类远离聚合酶和核酸的电流。具有物理可操纵部分的核苷酸,诸如响应于光镊或光阱(optical trapping)的发色团、响应于磁操纵的铁磁体或磁体、或可从高亲和力结合状态光异构化为低亲和力结合状态(或反之亦然)的双键。在特定实施方案中,选择物理条件以维持聚合酶与核酸的结合,同时将核苷酸从聚合酶和核酸解离。
可用于将核苷酸从三元复合物中解离的化学条件包括,例如,高盐。有用的高盐条件包括,例如,至少50mM、100mM、150mM、200mM、300mM、400mM、500mM或更高浓度的盐。作为替代或补充,盐浓度最高可为500mM、400mM、300mM、200mM、150mM、100mM、50mM或更低的浓度。有用的盐类包括但不限于KCl、NaCl、硫氰酸胍和用于生化反应的其它盐类。
用于从三元复合物中解离核苷酸的另一个有用的化学条件是有机溶剂以在水溶液中存在至少10%(v/v)、20%(v/v)、30%(v/v)、40%(v/v)、50%(v/v)或更多有机溶剂的量存在。可选地或另外地,有机溶剂可以以在水溶液中存在不超过50%(v/v)、40%(v/v)、30%(v/v)、20%(v/v)、10%(v/v)或更低的有机溶剂的量存在。特别有用的有机溶剂是醇,其可以任选地以在水溶液中存在至少10%(v/v)、20%(v/v)、30%(v/v)、40%(v/v)、50%(v/v)或更多的醇的量存在。可选地或另外地,醇可以以在水溶液存在不超过50%(v/v)、40%(v/v)、30%(v/v)、20%(v/v)、10%(v/v)或更低的醇的量存在。乙醇、甲醇、异丙醇、二醇和1,3-丁二醇是特别有用的醇。还可使用其它极性溶剂,诸如极性质子有机溶剂(例如缓冲有机酸)和极性非质子有机溶剂(例如DMSO、DMF)。通常,有机溶剂(例如醇)可与水溶液混溶,或者以可溶于水溶液的量存在。在特定实施方案中,盐和有机溶剂(例如,醇)均例如各自以上文阐述的量存在。
用于从三元复合物中解离核苷酸的另外的有用的化学条件是生理范围外的pH(例如,处于或低于pH 6、5或4;处于或高于pH 8、9或10)。可使用的其它试剂包括但不限于氧化还原试剂,诸如二硫苏糖醇、谷胱甘肽或2-巯基乙醇;去垢剂诸如阴离子、阳离子或两性离子去垢剂;或与核苷酸结合的蛋白质(例如与聚合酶竞争与核苷酸结合的蛋白质)。本文阐述的用于从三元复合物中解离核苷酸的化学条件可用于各种组合中(例如,水溶液可具有在生理范围外的pH,且还可包含可混溶的有机溶剂)。作为另一选择,可将用于从三元复合物中解离核苷酸一种或多种化学条件与用于从三元复合物中解离核苷酸的物理条件组合。
当以籍以将不同核苷酸类型连续递送至反应容器,然后从容器中除去的模式进行所述方法时,可在每次递送后对容器的三元复合物进行检查。在这种模式下,每次递送后将形成不同类型的三元复合物(即存在的核苷酸类型不同的三元复合物)。在先前的其它类型核苷酸递送中形成的三元复合物将会解离,因为其它类型的核苷酸已被除去。因此,基于一种类型的三元复合物在每次检查中占主导的预期,可以鉴定由每种类型的核苷酸形成的三元复合物。例如,当基于将标记的聚合酶或标记的核苷酸募集至阵列中的引发的模板核酸来检测三元复合物时,具有最高信号的阵列特征可被鉴定为已形成三元复合物的特征。在每个特征处形成的三元复合物的类型(即,三元复合物中存在的核苷酸的类型)可以从知道哪种核苷酸在检查步骤之前被递送推导出来。
在这种模式下,无需通过独特的标记物来区分不同类型的三元复合物。相反,可以基于关于它们何时形成以及哪种核苷酸类型被递送以诱导形成的时间信息来区分不同类型的三元复合物。如果需要,可以对不同类型的三元配合物进行可区分标记。例如,每种核苷酸类型都可具有标记物,所述标记物产生的信号与使用的所有其它核苷酸类型不同。可区分的标记物可以提供增加检测速度的有利方面,因为单个检查步骤可以在递送多种不同类型的核苷酸之后进行。通过在本文阐述的方法中同时递送两种或更多种可区分标记的核苷酸类型可实现时间节约。如果需要,甚至在使用可区分的标记物鉴定不同类型的三元复合物时,也可在每次核苷酸递送后进行检查。
本公开的方法可以以籍以将不同的核苷酸类型连续递送至将在其中形成并检查三元复合物的容器中的模式进行。在该模式中,可以将第一核苷酸类型递送至反应容器,然后可将第二核苷酸类型递送至容器,使得两种核苷酸类型在容器中积累。当容器含有各种不同的引发的模板核酸,例如阵列或其它多重形式时,多种不同类型的三元复合物可在容器中积累。最初可添加聚合酶,以创造促进与第一个核苷酸形成三元复合物的条件。可以(但不一定)在随后的递送中添加新的聚合酶,以促进与随后递送的核苷酸形成三元复合物。
因此,用于鉴定引发的模板核酸中的核苷酸的方法可包括以下步骤:(a)提供具有引发的模板核酸、聚合酶和第一碱基类型的核苷酸同源物的容器;(b)检查容器中是否有稳定的三元复合物,所述三元复合物包括聚合酶和结合在引发的模板核酸的碱基位置处的第一碱基类型的核苷酸同源物;(c)将第二碱基类型的核苷酸同源物递送至所述容器,由此所述容器保留来自步骤(b)的第一碱基类型的核苷酸同源物、引发的模板核酸和聚合酶;(d)检查容器中是否有稳定的三元复合物,所述三元复合物包括聚合酶和结合在引发的模板核酸的碱基位置处的第二碱基类型的核苷酸同源物;以及(e)鉴定在引发的模板核酸的碱基位置处的核苷酸的类型。
用于鉴定引发的模板核酸中的核苷酸的方法还可包括以下步骤:(a)提供引发的模板核酸的阵列;(b)形成稳定的三元复合物,所述三元复合物各自包括聚合酶、第一碱基类型的核苷酸同源物和阵列中的引发的模板核酸;(c)检测阵列中的稳定的三元复合物;(d)对第二碱基类型的核苷酸同源物重复步骤(b)和(c),由此引发的模板核酸、第一碱基类型的核苷酸同源物和聚合酶保留在阵列中;以及(e)鉴定存在于步骤(c)中检测到的每一种稳定的三元复合物中的核苷酸的类型。
用于鉴定引发的模板核酸中的核苷酸的方法可以任选地包括以下步骤:(a)提供引发的模板核酸的阵列;(b)将多种聚合酶和第一碱基类型的多种核苷酸同源物递送至所述阵列,从而形成稳定的三元复合物,所述三元复合物各自包括所述多种聚合酶中的聚合酶、所述第一碱基类型的多种核苷酸同源物中的核苷酸和所述阵列的引发的模板核酸;(c)检测阵列中的稳定的三元复合物;(d)对第二碱基类型的核苷酸同源物重复步骤(b)和(c),由此阵列的引发的模板核酸、多种核苷酸中的核苷酸和多种聚合酶中的聚合酶保留在阵列中;以及(e)鉴定存在于步骤(c)中检测的每一种稳定的三元复合物中的核苷酸的类型。
当以籍以将不同核苷酸类型连续递送至反应容器以使不同核苷酸累积的模式进行所述方法时,可在每次递送后对容器的三元复合物进行检查。在这种模式下,每次递送后将形成不同类型的三元复合物(即存在的核苷酸类型不同的三元复合物)。容器中还将存在于先前递送其它类型的核苷酸中形成的三元复合物。因此,从一次检查到下一次检查,可基于新形成的三元复合物的出现来鉴定由每种类型的核苷酸形成的三元复合物。例如,当基于将标记的聚合酶或标记的核苷酸募集至阵列中的引发的模板核酸来检测三元复合物时,与先前检查中针对阵列特征检测到的信号强度相比具有增强的信号强度的所述阵列特征可被鉴定为其中已形成新的三元复合物的特征。在每个特征处形成的三元复合物的类型(即存在于三元复合物中的核苷酸的类型)可以从知道哪种核苷酸在检查步骤之前被递送推导出来,在所述检查步骤中出现了新的三元复合物信号。
因此,不必通过独特的标记物来区分不同类型的三元配合物。而是,可以基于关于它们何时形成以及哪种核苷酸类型被递送以诱导三元复合物的形成的时间信息来区分三元复合物的不同类型。如果需要,可对不同类型的三元配合物进行可区分标记。例如,两种或更多种核苷酸类型可具有产生可彼此区分的信号的标记物。在一些实施方案中,可基于独特的标记物区分所有的核苷酸类型。因此,标记物可以区分与模板中一种类型的核苷酸配对的核苷酸与与模板中所有其它核苷酸类型配对的核苷酸。可区分的标记物可提供增加检测速度的有利方面,因为单个检查步骤可在所有核苷酸已被连续递送后进行。如果需要,甚至在使用可区分的标记物鉴定不同类型的三元复合物时,也可在每次核苷酸递送后进行检查。
可在引发的模板核酸中的给定位置处进行多个核苷酸递送和检查步骤。在测序实施方案中,可在延伸引物以进入下一个测序循环之前的单个测序循环期间进行的子程序中进行多个检查步骤。
因此,本公开提供了用于鉴定引发的模板核酸中的核苷酸的方法。所述方法可以包括以下步骤:(a)提供具有引发的模板核酸、聚合酶和第一碱基类型的核苷酸同源物的容器;(b)检查容器中是否有稳定的三元复合物,所述三元复合物包括聚合酶和结合在引发的模板核酸的碱基位置处的第一碱基类型的核苷酸同源物;(c)将第二碱基类型的核苷酸同源物递送至所述容器,由此所述容器保留来自步骤(b)的引发的模板核酸和聚合酶;(d)检查容器中是否有稳定的三元复合物,所述三元复合物包括聚合酶和结合在引发的模板核酸的碱基位置处的第二碱基类型的核苷酸同源物;(e)鉴定在引发的模板核酸的碱基位置处的核苷酸的类型;(f)将第三碱基类型的核苷酸同源物递送至所述容器,由此所述容器保留来自步骤(b)的引发的模板核酸和聚合酶;以及(g)检查容器中是否有稳定的三元复合物,所述三元复合物包括聚合酶和结合在引发的模板核酸的碱基位置处的第三碱基类型的核苷酸同源物。任选地,所述方法还包括以下步骤:(h)将第四碱基类型的核苷酸同源物递送至所述容器,由此所述容器保留来自步骤(b)的引发的模板核酸和聚合酶;以及(i)检查容器中是否有稳定的三元复合物,所述三元复合物包括聚合酶和结合在引发的模板核酸的碱基位置处的第四碱基类型的核苷酸同源物。
还提供了用于鉴定引发的模板核酸中的核苷酸的方法,其包括以下步骤:(a)提供引发的模板核酸的阵列;(b)形成稳定的三元复合物,所述三元复合物各自包括聚合酶、第一碱基类型的核苷酸同源物和阵列中的引发的模板核酸;(c)检测阵列中的稳定的三元复合物;(d)对第二碱基类型的核苷酸同源物重复步骤(b)和(c),由此引发的模板核酸和聚合酶保留在阵列中;以及(e)鉴定存在于步骤(c)中检测到的每一种稳定的三元复合物中的核苷酸的类型。任选地,步骤(d)如下进行:对第二碱基类型的核苷酸同源物重复步骤(b)和(c),然后对第三碱基类型的核苷酸同源物重复步骤(b)和(c)。另外,任选地,步骤(d)如下进行:对第二碱基类型的核苷酸同源物重复步骤(b)和(c),然后对第三碱基类型的核苷酸同源物重复步骤(b)和(c),然后对第四碱基类型的核苷酸同源物重复步骤(b)和(c)。
还提供了用于鉴定引发的模板核酸中的核苷酸的方法,其包括以下步骤:(a)提供引发的模板核酸的阵列;(b)将多种聚合酶和第一碱基类型的多种核苷酸同源物递送至所述阵列,从而形成稳定的三元复合物,所述三元复合物各自包含所述多种聚合酶中的聚合酶、所述第一碱基类型的多种核苷酸同源物中的核苷酸和所述阵列的引发的模板核酸;(c)检测阵列中的稳定的三元复合物;(d)对第二碱基类型的核苷酸同源物重复步骤(b)和(c),由此阵列的引发的模板核酸和多种聚合酶中的聚合酶保留在阵列中;以及(e)鉴定存在于步骤(c)中检测到的每一种稳定的三元复合物中的核苷酸的类型。任选地,步骤(d)如下进行:对第二碱基类型的核苷酸同源物重复步骤(b)和(c),然后对第三碱基类型的核苷酸同源物重复步骤(b)和(c)。另外,任选地,步骤(d)如下进行:对第二碱基类型的核苷酸同源物重复步骤(b)和(c),然后对第三碱基类型的核苷酸同源物重复步骤(b)和(c),然后对第四碱基类型的核苷酸同源物重复步骤(b)和(c)。
为了便于解释,在本文中针对在一种碱基类型的核苷酸同源物存在的情况下形成的一种或多种稳定的三元复合物举例说明了本公开的方法。应当理解,一种或多种三元复合物可以在仅一种碱基类型的一种或多种核苷酸同源物存在的情况下形成,例如,在仅单一类型的核苷酸存在的情况下或在为同一碱基类型的同源物的一种或多种核苷酸类型存在的情况下形成。或者,可在核苷酸类型的混合物存在下的情况下形成三元复合物,所述核苷酸类型的混合物为预期存在于模板核酸中的不止一种碱基类型的同源物。例如,本文阐述的方法的特定步骤中存在的核苷酸类型可以是预期存在于模板核酸中的至少2种、3种或4种不同碱基类型的同源物。可选地或另外地,本文阐述的方法的特定步骤中存在的核苷酸类型可以是至多4种、3种或2种不同碱基类型的同源物。可将不同的核苷酸类型在被递送到其中产生引发的模板核酸的容器之前彼此混合。在其它实施方案中,不同的核苷酸类型可被连续递送至其中产生引发的模板核酸的容器中。因此,不同的核苷酸将积累以产生反应混合物,其中不同类型的核苷酸与引发的模板核酸同时存在。
因此,本公开提供了用于鉴定引发的模板核酸中的核苷酸的方法,其包括以下步骤:(a)提供具有引发的模板核酸、聚合酶、第一碱基类型的核苷酸同源物和第三碱基类型的核苷酸同源物的容器;(b)检查容器中是否有稳定的三元复合物,所述三元复合物包括聚合酶和(i)结合在引发的模板核酸的碱基位置处的第一碱基类型的核苷酸同源物或(ii)结合在引发的模板核酸的碱基位置处的第三碱基类型的核苷酸同源物;(c)将第二碱基类型的核苷酸同源物递送至所述容器,由此所述容器保留来自步骤(b)的引发的模板核酸和聚合酶;(d)检查容器中是否有稳定的三元复合物,所述三元复合物包括聚合酶和结合在引发的模板核酸的碱基位置处的第二碱基类型的核苷酸同源物;以及(e)鉴定在引发的模板核酸的碱基位置处的核苷酸的类型。任选地,步骤(c)还包括将第四碱基类型的核苷酸同源物递送至所述容器,并且步骤(d)包括检查所述容器是否有稳定的三元复合物,所述三元复合物包括所述聚合酶和(i)结合在引发的模板核酸的碱基位置处的第二碱基类型的核苷酸同源物或(ii)结合在所述引发的模板核酸的碱基位置处的第四碱基类型的核苷酸同源物。
此外,本公开提供了用于鉴定引发的模板核酸中的核苷酸的方法,其包括以下步骤:(a)提供引发的模板核酸的阵列;(b)形成包括聚合酶、阵列中的引发的模板核酸和第一碱基类型的核苷酸同源物的稳定的三元复合物,以及形成包括聚合酶、阵列中的引发的模板核酸和第三碱基类型的核苷酸同源物的稳定的三元复合物;(c)检测阵列中包括第一碱基类型和第三碱基类型的核苷酸同源物的稳定的三元复合物;(d)对第二碱基类型的核苷酸同源物重复步骤(b)和(c),由此引发的模板核酸和聚合酶保留在阵列中;以及(e)鉴定存在于步骤(c)中检测到的每一种稳定的三元复合物中的核苷酸的类型。
还提供了用于鉴定引发的模板核酸中的核苷酸的方法,其包括以下步骤:(a)提供引发的模板核酸的阵列;(b)将多种聚合酶、第一碱基类型的多种核苷酸同源物和第三碱基类型的多种核苷酸同源物递送至所述阵列,从而形成稳定的三元复合物,所述三元复合物包括所述多种聚合酶中的聚合酶、所述阵列的引发的模板核酸和所述多种第一碱基类型或第三碱基类型的核苷酸同源物中的核苷酸;(c)检测阵列中的稳定的三元复合物;(d)对第二碱基类型的核苷酸同源物重复步骤(b)和(c),由此阵列的引发的模板核酸和多种聚合酶中的聚合酶保留在阵列中;以及(e)鉴定存在于步骤(c)中检测到的每一种稳定的三元复合物中的核苷酸的类型。
本公开的方法可包括修饰引物(例如通过添加一个或多个核苷酸来延伸引物)的步骤。在特定实施方案中,添加至引物的核苷酸将包括可逆终止子部分。可逆终止子部分可提供非限制性益处,即在延伸过程中防止一个以上的核苷酸被添加到引物中,以及在检查过程中稳定引物3’末端处的三元复合物形成。
典型地,在本文阐述的方法中加入引物的核苷酸,诸如可逆终止的核苷酸不具有外源标记物。这是因为在本文阐述的方法中不需要检测延伸的引物。然而,如果需要,可以例如通过附接至核苷酸的外源标记物来检测在本文阐述的方法中使用的一种或多种类型的可逆终止的核苷酸。
引物延伸过程或形成三元复合物的过程不需要使用标记的聚合酶。例如,不需要将用于延伸步骤的聚合酶附接至外源标记物(例如共价地或以其它方式)。或者,用于引物延伸的聚合酶可包括外源标记物,例如,在之前的检查步骤中使用过的标记物。
可用于基于聚合酶的引物延伸步骤的试剂和条件的实例包括,例如,在共同拥有的美国专利申请公布第2017/0022553 A1号或美国专利申请序列第15/677,870号(公布为美国专利申请公布第2018/0044727 A1号)、第15/851,383号(公布为美国专利申请公布第2018/0187245A1号)、第62/450,397号或第62/506,759号中阐述的那些实例,所述美国专利申请的每一篇均通过引用并入本文。示例性可逆终止子部分、将它们掺入引物的方法以及修饰引物以进一步延伸的方法(通常称为“解封闭”)阐述于美国专利第7,544,794号、第7,956,171号、第8,034,923号、第8,071,755号、第8,808,989号或第9,399,798号。另外的实例阐述于在Bentley等人,Nature 456:53-59(2008),WO04/018497;美国专利第7,057,026号、WO 91/06678、WO 07/123744、美国专利第7,329,492号、美国专利第7,211,414号、美国专利第7,315,019号、美国专利第7,405,281号和US 2008/0108082(其每一篇均通过引用并入本文)中。
在特定实施方案中,在与引物-模板杂交体形成稳定的三元复合物的步骤之前,将引物延伸过程中使用的试剂从与引发的模板核酸的接触中去除。例如,当混合物中的一种或多种类型的核苷酸会干扰后续检查步骤中三元复合物的形成或检测时,去除用于延伸步骤的核苷酸混合物可以是所需要的。类似地,可能需要除去引物修饰步骤中使用的聚合酶或辅因子,以便防止在后续的检测步骤中不想要的催化活性。去除之后可进行洗涤步骤,其中使用惰性流体来清除用于引物修饰的试剂混合物的残留组分的引物-模板杂交体。
试剂去除或洗涤程序可在本文阐述的各种步骤之间进行。此类程序可用于除去反应容器中或固体载体上存在的一种或多种试剂。例如,试剂去除或洗涤步骤可用于将引物-模板杂交体与在稳定三元复合物的条件下与引物-模板杂交体接触的其它试剂分离。在特定实施方案中,通过将目标试剂诸如引发的模板核酸附接于固体载体并除去与固体载体接触的流体来促进试剂的分离。可将本文阐述的一种或多种试剂附接于固体载体上或根据需要于溶液中提供,以适合本文阐述的方法或装置的特定用途。
试剂去除或清洗程序可用于除去一种或多种试剂,使其不干扰三元复合物的检查或不污染将在基底上(或容器中)形成的第二三元复合物,所述基底先前已与用于形成第一三元复合物的试剂接触。例如,在稳定三元复合物的条件下,可将引发的模板核酸与聚合酶和至少一种核苷酸类型接触以形成第一混合物,并且可以检查第一混合物或其产物。然而,试剂去除和清洗无需在本文阐述的步骤或过程之间进行。例如,可能需要避免在检查步骤之间除去一种或多种试剂。如本文其它地方进一步详细阐述的,当连续形成不同的三元复合物种类时,当形成第二三元复合物种类时,不需要除去或洗掉用于形成第一三元复合物种类的聚合酶或核苷酸。
任选地,可在检测前进行洗涤,以除去不参与形成稳定的三元复合物的试剂。可选地或另外地,可在检测步骤后进行洗涤,以从引物-模板杂交体中除去第一混合物的一种或多种组分。然后,可在稳定三元复合物的条件下,将引发的模板核酸与聚合酶和至少一种其它核苷酸接触以形成第二混合物,并且可以检查第二混合物的三元复合物形成。如前所述,可在第二次检查前进行任选的洗涤,以除去不参与形成稳定的三元复合物的试剂。
如果带入引物延伸过程,检查步骤中存在的核苷酸可能会导致不想要的副反应,诸如核苷酸掺入反应。因此,可在引物延伸步骤之前采用试剂去除或洗涤步骤。任选地,可对游离核苷酸或其它检查试剂进行修饰或禁用,例如通过诸如磷酸酶等酶、通过化学修饰或通过物理技术进行修饰或禁用。
本公开提供了用于对引发的模板核酸测序的方法。所述方法可包括以下步骤:(a)提供具有引发的模板核酸、第一聚合酶和第一碱基类型的核苷酸同源物的容器;(b)检查容器中是否有稳定的三元复合物,所述三元复合物包括第一聚合酶和结合在引发的模板核酸的碱基位置处的第一碱基类型的核苷酸同源物;(c)将第二碱基类型的核苷酸同源物递送至所述容器,由此所述容器保留来自步骤(b)的引发的模板核酸和第一聚合酶;(d)检查容器中是否有稳定的三元复合物,所述三元复合物包括第一聚合酶和结合在引发的模板核酸的碱基位置处的第二碱基类型的核苷酸同源物;(e)鉴定在引发的模板核酸的碱基位置处的核苷酸的类型;(f)将第三碱基类型的核苷酸同源物递送至所述容器,由此所述容器保留来自步骤(b)的引发的模板核酸和第一聚合酶;(g)检查容器中是否有稳定的三元复合物,所述三元复合物包括第一聚合酶和结合在引发的模板核酸的碱基位置处的第三碱基类型的核苷酸同源物;(h)将第四碱基类型的核苷酸同源物递送至所述容器,由此所述容器保留来自步骤(b)的引发的模板核酸和第一聚合酶;(i)检查容器中是否有稳定的三元复合物,所述三元复合物包括第一聚合酶和结合在引发的模板核酸的碱基位置处的第四碱基类型的核苷酸同源物;(j)将核苷酸添加到引发的模板核酸的引物中,由此所述容器包含延伸的引发的模板核酸;(k)将第二聚合酶和第一碱基类型的核苷酸同源物递送至所述容器;以及(l)使用延伸的引发的模板代替引发的模板核酸并使用第二聚合酶代替第一聚合酶重复步骤(b)至(i)。第一聚合酶可以是与第一类型相同的类型的聚合酶,或者第一聚合酶和第二聚合酶可以是不同类型的聚合酶。
还提供了用于对引发的模板核酸测序的方法,其包括以下步骤:(a)提供具有引发的模板核酸、第一聚合酶和第一碱基类型的核苷酸同源物的容器;(b)检查容器中是否有稳定的三元复合物,所述三元复合物包括第一聚合酶和结合在引发的模板核酸的碱基位置处的第一碱基类型的核苷酸同源物;(c)将第二碱基类型的核苷酸同源物递送至所述容器,由此所述容器保留来自步骤(b)的引发的模板核酸和第一聚合酶;(d)检查容器中是否有稳定的三元复合物,所述三元复合物包括第一聚合酶和结合在引发的模板核酸的碱基位置处的第二碱基类型的核苷酸同源物;(e)鉴定在引发的模板核酸的碱基位置处的核苷酸的类型;(f)将核苷酸添加到引发的模板核酸的引物中,由此所述容器包含延伸的引发的模板核酸;(g)将第二聚合酶和第一碱基类型的核苷酸同源物递送至所述容器;以及(h)使用延伸的引发的模板代替引发的模板核酸并使用第二聚合酶代替第一聚合酶重复步骤(b)至(e)。第一聚合酶可以是与第一类型相同的类型的聚合酶,或者第一聚合酶和第二聚合酶可以是不同类型的聚合酶。
还提供了用于对引发的模板核酸测序的方法,其包括以下步骤:(a)提供引发的模板核酸的阵列;(b)形成稳定的三元复合物,所述三元复合物各自包括第一聚合酶、第一碱基类型的核苷酸同源物和阵列中的引发的模板核酸;(c)检测阵列中的稳定的三元复合物;(d)对第二碱基类型的核苷酸同源物重复步骤(b)和(c),然后对第三碱基类型的核苷酸同源物重复步骤(b)和(c),然后对第四碱基类型的核苷酸同源物重复步骤(b)和(c),由此引发的模板核酸和第一聚合酶保留在阵列中;(e)鉴定存在于步骤(c)中检测到的每一种稳定的三元复合物中的核苷酸的类型;(f)将核苷酸添加到每个引发的模板核酸的引物中,由此阵列包括延伸的引发的模板核酸;以及(g)使用延伸的引发的模板代替引发的模板核酸并使用第二聚合酶代替第一聚合酶重复步骤(b)至(e)。第一聚合酶可以是与第一类型相同的类型的聚合酶,或者第一聚合酶和第二聚合酶可以是不同类型的聚合酶。
用于对引发的模板核酸测序的方法可包括以下步骤:(a)提供引发的模板核酸的阵列;(b)形成稳定的三元复合物,所述三元复复合物各自包括第一聚合酶、第一碱基类型的核苷酸同源物和阵列中的引发的模板核酸;(c)检测阵列中的稳定的三元复合物;(d)对第二碱基类型的核苷酸同源物重复步骤(b)和(c),由此引发的模板核酸和第一聚合酶保留在阵列中;(e)鉴定存在于步骤(c)中检测到的每一种稳定的三元复合物中的核苷酸的类型;(f)将核苷酸添加到每个引发的模板核酸的引物中,由此阵列包括延伸的引发的模板核酸;以及(g)使用延伸的引发的模板代替引发的模板核酸并使用第二聚合酶代替第一聚合酶重复步骤(b)至(e)。第一聚合酶可以是与第一类型相同的类型的聚合酶,或者第一聚合酶和第二聚合酶可以是不同类型的聚合酶。
还提供了用于对引发的模板核酸测序的方法,其包括以下步骤:(a)提供引发的模板核酸的阵列;(b)将多种聚合酶和第一碱基类型的多种核苷酸同源物递送至所述阵列,从而形成稳定的三元复合物,所述三元复合物各自包括所述多种聚合酶中的聚合酶、所述第一碱基类型的多种核苷酸同源物中的核苷酸和所述阵列的引发的模板核酸;(c)检测阵列中的稳定的三元复合物;(d)对第二碱基类型的核苷酸同源物重复步骤(b)和(c),然后对第三碱基类型的核苷酸同源物重复步骤(b)和(c),然后对第四碱基类型的核苷酸同源物重复步骤(b)和(c),由此阵列的引发的模板核酸和多种聚合酶中的聚合酶保留在阵列中;(e)鉴定存在于步骤(c)中检测到的每一种稳定的三元复合物中的核苷酸的类型;(f)将核苷酸添加到每个引发的模板核酸的引物中,由此阵列包含延伸的引发的模板核酸;以及(g)使用延伸的引发的模板代替引发的模板核酸并使用多种第二聚合酶代替多种聚合酶重复步骤(b)至(e)。
用于对引发的模板核酸测序的方法可包括以下步骤:(a)提供引发的模板核酸的阵列;(b)将多种聚合酶和第一碱基类型的多种核苷酸同源物递送至所述阵列,从而形成稳定的三元复合物,所述三元复合物各自包括所述多种聚合酶中的聚合酶、所述第一碱基类型的多种核苷酸同源物中的核苷酸和所述阵列的引发的模板核酸;(c)检测阵列中的稳定化三元复合物;(d)对第二碱基类型的核苷酸同源物重复步骤(b)和(c),由此阵列的引发的模板核酸和多种聚合酶中的聚合酶保留在阵列中;(e)鉴定存在于步骤(c)中检测到的每一种稳定的三元复合物中的核苷酸的类型;(f)将核苷酸添加到每个引发的模板核酸的引物中,由此阵列包含延伸的引发的模板核酸;以及(g)使用延伸的引发的模板代替引发的模板核酸并使用多种第二聚合酶代替多种聚合酶重复步骤(b)至(e)。
当包括在本文阐述的方法中时,解封闭过程可促进引发的模板核酸的测序。解封闭过程可用于将可逆终止的引物转化为可延伸的引物。然后,可使用引物延伸将三元复合物形成位点沿模板核酸移动到不同位置。延伸、检查和解封闭的重复循环可用于揭示模板核酸的序列。每个循环都显示模板核酸中的后续碱基。示例性可逆终止子部分、将它们掺入引物的方法和修饰引物以进一步延伸(通常称为“解封闭”)的方法阐述于美国专利第7,427,673号、第7,414,116号、第7,544,794号、第7,956,171号、第8,034,923号、第8,071,755号、第8,808,989号或第9,399,798号中。另外的实例阐述于Bentley等人,Nature 456:53-59(2008)、WO 04/018497、美国专利第7,057,026号、WO 91/06678、WO 07/123744、美国专利第7,329,492号、美国专利第7,211,414号、美国专利第7,315,019号、美国专利第7,405,281号和US 2008/0108082中,所述文献和专利的每一篇均通过引用并入本文。
测序方法可包括本文阐述的循环的多次重复或循环内的步骤。例如,包括检查和引物延伸步骤的循环可以重复多次。任选地,所述循环还可包括解封闭引物的步骤,或在各个步骤之间洗掉未使用的反应物或用过的产物的步骤。因此,引发的模板核酸可以经历本文阐述的方法的至少2个、5个、10个、25个、50个、100个、150个、200个或更多个重复循环。当较短的读取长度足够时,可以执行更少的循环。因此,引发的模板核酸可经历本文阐述的方法的至多200个、150个、100个、50个、25个、10个、5个或2个循环。
在一些实施方案中,测序方法可以进行预定次数的重复循环。或者,可以重复这些循环,直至达到特定的经验观察状态。例如,只要信号高于可观察阈值、噪声低于可观察阈值或信噪比高于可观察阈值,就可以重复循环。
尽管本文就采用重复循环的测序反应举例说明了本公开的实施方案,但循环不需要重复,循环也不需要包括引物延伸步骤。例如,可以通过形成稳定的三元复合物检查模板核酸中的单个核苷酸位置来进行基因分型。可使用不同碱基类型的核苷酸同源物的连续递送和/或累积来进行基因分型。可被修改以采用本文阐述的核苷酸递送方法的基因分型技术的实例包括在共同拥有的美国专利第9,932,631号(其通过引用并入本文)中所述的那些。
多种聚合酶中的任一种都可用于本文阐述的方法或装置中,例如以形成稳定的三元复合物或进行引物延伸。可使用的聚合酶包括天然存在的聚合酶及其修饰变型,包括但不限于突变体、重组体、融合体、遗传修饰体、化学修饰体、合成物和类似物。天然存在的聚合酶及其修饰变型不限于具有催化聚合反应的能力的聚合酶。任选地,其天然存在的变型和/或修饰变型具有在至少一种条件下催化聚合反应的能力,所述条件在稳定的三元复合物的形成或检查期间不使用。任选地,参与稳定的三元复合物的天然存在的变型和/或修饰变型具有改良的性质,例如,对核酸的增强的结合亲和力、对核酸的降低的结合亲和力、对核苷酸的增强的结合亲和力、对核苷酸的降低的结合亲和力、针对下一个正确核苷酸的增强的特异性、针对下一个正确核苷酸的降低的特异性、降低的催化速率、催化失活等。突变型聚合酶包括,例如,其中一个或多个氨基酸被其它氨基酸或一个或多个氨基酸的插入或缺失取代的聚合酶。可用于形成稳定的三元复合物的示例性聚合酶突变体包括,例如,美国专利申请序列第15/866,353号(公布为美国专利申请公布第2018/0155698A1号)或美国专利申请公布第2017/0314072号中阐述的野生型和突变型聚合酶,所述美国专利申请或美国专利申请公布的每一篇均通过引用并入本文。
经修饰的聚合酶包括含有可用于检测聚合酶的外源标记部分(例如,外源荧光团)的聚合酶。任选地,可以在已使用蛋白质分离技术至少部分纯化聚合酶后附接标记部分。例如,可使用聚合酶的游离巯基或游离胺部分共价连接外源标记部分与聚合酶。这可涉及通过半胱氨酸残基的侧链或通过N末端的游离氨基与聚合酶的共价键联。外源标记部分还可通过蛋白质融合附接至聚合酶。可通过蛋白质融合附接的示例性标记部分包括例如绿色荧光蛋白(GFP)、藻胆蛋白(例如,藻蓝蛋白和藻红蛋白)或者GFP或藻胆蛋白的波长偏移变体。在一些实施方案中,聚合酶上的外源标记物可以作为FRET对的成员发挥作用。FRET对的另一个成员可以是附接至核苷酸的外源标记物,所述核苷酸与稳定的三元复合物中的聚合酶结合。因此,稳定的三元复合物可通过FRET检测或鉴定。
或者,参与稳定的三元复合物或用于延伸引物的聚合酶不需要附接至外源标记物。例如,聚合酶不需要共价附接至外源标记物。相反,聚合酶可以没有任何标记,直至其与标记的核苷酸和/或标记的核酸(例如标记的引物和/或标记的模板)结合。
可在本文所阐述的方法中利用聚合酶的不同活性。聚合酶可用于例如引物延伸步骤、检查步骤或其组合。不同的活性可以由结构的差异产生(例如,通过天然活性、突变或化学修饰)。然而,聚合酶可以从各种已知来源获得,并根据本文阐述的教导和公认的聚合酶活性来应用。有用的DNA聚合酶包括但不限于细菌DNA聚合酶、真核DN A聚合酶、古生菌DNA聚合酶、病毒DNA聚合酶和噬菌体DNA聚合酶。细菌DNA聚合酶包括大肠杆菌(E.coli)DNA聚合酶I、II和III、IV和V、大肠杆菌DNA聚合酶的Klenow片段、粪堆梭菌(Clos tridiumstercorarium)(Cst)DNA聚合酶、热纤梭菌(Clostridium therm ocellum)(Cth)DNA聚合酶和硫磺矿硫化叶菌(Sso)DNA聚合酶。真核DNA聚合酶包括DNA聚合酶α、β、γ、δ、€、η、ζ、λ、σ、μ和к,以及Revl聚合酶(末端脱氧胞苷基转移酶)和末端脱氧核苷酸转移酶(TdT)。病毒DNA聚合酶包括T4 DNA聚合酶、phi-29DNA聚合酶、GA-1、phi-29样DNA聚合酶、PZA DNA聚合酶、phi-15DNA聚合酶、Cpl DNA聚合酶、Cp7 DNA聚合酶、T7 DNA聚合酶和T4聚合酶。其它有用的DNA聚合酶包括热稳定性和/或嗜热DNA聚合酶,例如水生栖热菌(Thermus aquaticus)(Taq)DNA聚合酶、丝状栖热菌(Thermus filiformis)(Tfi)DNA聚合酶、Thermococcuszilligi(Tzi)DNA聚合酶、嗜热栖热菌(Thermus thermophilus)(Tth)DNA聚合酶、黄栖热菌(Thermus flavusu)(Tfl)DNA聚合酶、沃氏火球菌(Pyrococcus woesei)(Pwo)DNA聚合酶、激烈火球菌(Pyrococcus fu riosus)(Pfu)DNA聚合酶和Turbo Pfu DNA聚合酶、滨海嗜热球菌(Thermococcus litoralis)(Tli)DNA聚合酶、火球菌属某种GB-D(P yrococcussp.GB-D)聚合酶、海栖热袍菌(Thermotoga maritima)(Tm a)DNA聚合酶、嗜热脂肪芽孢杆菌(Bst)DNA聚合酶、超嗜热火球菌(Pyrococcus Kodakaraensis)(KOD)DNA聚合酶、Pfx DNA聚合酶、热球菌属某种JDF-3(Thermococcus sp.JDF-3)(JDF-3)DNA聚合酶、古股纳斯热球菌(Thermococcus gorgonarius)(Tgo)DNA聚合酶、嗜酸热球菌(Thermococcusacidophilium)DNA聚合酶、嗜酸热硫化叶菌(Sulfolobus acidocaldarius)DNA聚合酶、热球菌属某种go N-7(Thermococcus sp.go N-7)DNA聚合酶、隐蔽热网菌(Pyrodictiu moccultum)DNA聚合酶、沃氏甲烷球菌(Methanococcus voltae)DN A聚合酶、热自养甲烷球菌(Methanococcus thermoautotrophicum)D NA聚合酶、詹氏甲烷球菌(Methanococcusjannaschii)DNA聚合酶、硫还原球菌属(Desulfurococcus)菌株TOK DNA聚合酶(D.TokPol);激烈火球菌DNA聚合酶、极端嗜热火球菌(Pyrococcus horikoshii)DNA聚合酶、冰岛火球菌(Pyrococcus islandicum)DNA聚合酶、烟生热球菌(Thermococcus fumicolans)DNA聚合酶、敏捷气热菌(Aero pyrum pernix)DNA聚合酶和异二聚体DNA聚合酶DP1/DP2。工程化和经修饰的聚合酶也可与所公开的技术结合使用。例如,可使用极端嗜热海洋古菌热球菌属种9°N的改良形式(例如,来自New Englan d BioLabs Inc.;Ipswich,MA的Therminator DNA聚合酶)。其它有用的DNA聚合酶,包括3PDX聚合酶,公开于U.S.8,703,461(其公开内容通过引用并入本文)中。
有用的RNA聚合酶包括但不限于病毒RNA聚合酶,诸如T7RNA聚合酶、T3聚合酶、SP6聚合酶和Kll聚合酶;真核生物RNA聚合酶,诸如RNA聚合酶I、RNA聚合酶II、RNA聚合酶III、RNA聚合酶IV和RNA聚合酶V;以及古生菌RNA聚合酶。
另一种有用类型的聚合酶是逆转录酶。示例性逆转录酶包括,但不限于,来自人免疫缺陷病毒1型(PDB 1HMV)的HIV-1逆转录酶、来自人免疫缺陷病毒2型的HIV-2逆转录酶、来自莫洛尼鼠白血病病毒的M-MLV逆转录酶、来自禽成髓细胞瘤病毒的AMV逆转录酶和维持真核染色体端粒的端粒酶逆转录酶。
对于一些实施方案,具有内在3’-5’校对外切核酸酶活性的聚合酶可以是有用的。基本上缺乏3’-5’校对外切核酸酶活性的聚合酶在一些实施方案中,例如,在大多数基因分型和测序实施方案中也是有用的。核酸外切酶活性的不存在可以是野生型特性或者可以是变体或工程化聚合酶结构赋予的特性。例如,外切负(exo minus)Klenow片段是Klenow片段的突变形式,其缺乏3’-5’校对外切核酸酶活性。Klenow片段及其外切负变体可用于本文阐述的方法或组合物。
可将稳定的三元复合物,或能够参与形成三元复合物的组分附接至固体载体。固体载体可由用于分析生物化学的多种材料中的任一种制成。合适的材料可包括玻璃、聚合材料、硅、石英(熔凝硅石(fused silica))、硼浮法玻璃(borofloat glass)、二氧化硅、硅基材料、碳、金属、光纤或光纤束、蓝宝石或塑料材料。可根据特定用途所需的性质来选择材料。例如,对所需辐射波长透明的材料对于利用该波长的辐射的分析技术是有用的。相反,可能需要选择不透过某一波长的辐射的材料(例如为不透明的、吸收性的或反射性的)。可利用的材料的其它性质是对下游工艺中使用的某些试剂的惰性或反应性,或操作的容易性,或低制造成本。
特别有用的固体载体是颗粒,诸如珠粒或微球。珠粒群体可用于稳定的三元复合物群体或能够形成复合物的组分(例如聚合酶、模板、引物或核苷酸)的附接。在一些实施方案中,使用其中每个珠粒具有单一类型的稳定的三元复合物或单一类型的能够形成复合物的组分的配置可能是有用的。例如,可使单个珠粒附接至单一类型的三元复合物、单一类型的引发的模板核酸、单一类型的引物、单一类型的模板、单一类型的聚合酶或单一类型的核苷酸。或者,不同类型的组分无需逐个珠粒地分开。这样,单个珠粒可以携带多种不同类型的三元复合物、模板核酸、引物、引发的模板核酸和/或核苷酸。珠粒的组成可以变化,例如,取决于要使用的格式、化学和/或附接方法。示例性珠粒组合物包括用于蛋白质和核酸捕获方法的固体载体和赋予其的化学功能性。此类组合物包括,例如,塑料、陶瓷、玻璃、聚苯乙烯、三聚氰胺、甲基苯乙烯、丙烯酸聚合物、顺磁性材料、氧化钍溶胶、碳石墨、二氧化钛、胶乳或交联葡聚糖,诸如SepharoseTM、纤维素、尼龙、交联胶束和TeflonTM,以及在BangsLaboratories,Fishers Ind的"Microsphere Detection Guide”(其通过引用并入本文)中阐述的其它材料。
颗粒诸如珠粒或微球的几何形状也可对应于各种不同的形式和形状。例如,颗粒可呈对称形状(例如,球形或圆柱形)或不规则形状(例如受控孔隙玻璃)。另外,颗粒可以是多孔的,因此增加了可用于捕获三元复合物或其组分的表面积。本文中使用的珠粒的示例性尺寸范围可以从纳米变化至毫米或者从约10nm变化至1mm。
在特定实施方案中,可以排列珠粒,或以其它方式在空间上区分珠粒。可使用的示例性基于珠粒的阵列包括但不限于可从Illumina,Inc.(San Diego,CA)获得的BeadChipTM阵列或诸如美国专利第6,266,459号、第6,355,431号、第6,770,441号、第6,859,570号或第7,622,294或PCT公布号WO 00/63437(其每一篇均通过引用并入)中描述的那些等的阵列。珠粒可以位于固相载体上的离散位置,诸如孔,由此每个位置容纳单个珠粒。或者,珠粒所在的离散位置可以各自包括多个珠粒,如例如美国专利申请公布第2004/0263923A1号、第2004/0233485A1号、第2004/0132205A1号或第2004/0125424A1号(其每一篇均通过引用并入本文)中所描述的。
如将从上述珠粒阵列实施方案中可认识到的,本公开的方法可以以多重形式进行,由此并行检测多种不同类型的核酸。尽管也可以使用本文阐述的方法的一个或多个步骤来连续处理不同类型的核酸,但并行处理可以节省成本、节省时间以及提供条件的一致性。本公开的装置或方法可包括至少2种、10种、100种、1x103种、1x104种、1x105种、1x106种、1x109种或更多种不同的核酸。可选地或另外地,本公开的装置或方法可包括至多1x109种、1x106种、1x105种、1x104种、1x103种、100种、10种、2种或更少种的不同核酸。因此,可使本文阐述的可用于装置或方法的各种试剂或产物(例如,引发的模板核酸或稳定的三元复合物)多重化,以在这些范围内具有不同的类型或种类。阵列中存在的不同核酸可位于阵列的不同特征处。因此,从特征获得的信号将指示存在于该特征处的特定核酸序列。
可使用的商购可得的阵列的另外实例包括,例如,Affymetrix GeneChipTM阵列。还可根据一些实施方案使用斑点阵列(spotted array)。典型的斑点阵列是可从AmershamBiosciences商购的CodeLinkTM阵列。另一个有用的阵列是使用喷墨打印方法,诸如可从Agilent Technologies商购的SurePrintTM技术制造的阵列。
其它有用的阵列包括用于核酸测序应用的那些阵列。例如,用于附接基因组片段的扩增子(通常称为簇)的阵列可以是特别有用的。可用于本文的核酸测序阵列的实例包括在以下文献中描述的那些阵列:Bentley等人,Nature 456:53-59(2008),PCT公布号WO 91/06678、WO04/018497或WO 07/123744、美国专利第7,057,026号、第7,211,414号、第7,315,019号、第7,329,492号或第7,405,281号或者美国专利申请公布第2008/0108082号,其每一篇均通过引用并入本文。
可以以在单分子水平或系综水平上提供检测的方式将核酸附接至载体。例如,可以以这样的方式将多种不同的核酸附接至固体载体,即在载体上的一个核核酸分子上形成的单个稳定的三元复合物的可以与在载体的核酸分子上形成的所有相邻的三元复合物区分开来。这样,可以以这样的形式将一种或多种不同的模板附接至固体载体,所述格式以将单分子从固体载体上的所有其它分子解析的方式对每个单分子模板物理隔离并检测。
或者,可针对一个或多个核酸系综进行本公开的方法,系综是具有共同模板序列的核酸群体。系综可以包括,例如,至少2个、10个、50个、100个、500个、1000个或更多个具有共同模板序列的核酸。可选地或另外地,系综可包括至多1000个、500个、100个、50个、10个或2个具有相同模板序列的核酸。存在于阵列的特征处的系综可以是克隆的,使得所述特征处的基本上所有核酸具有共同的模板序列。然而,特征不需要包含核酸的克隆群体。相反,特征可包括核酸的混合群体,其中特定模板序列存在于大多数核酸中。例如,处于特定特征处的核酸群体可包括至少51%、60%、75%、90%、95%或99%或更多的具有特定模板序列的种类。可以在允许群体作为系综被检测的条件下检测具有核酸的非克隆群体的特征,由此从特征获得的总信号表示由非克隆群体产生的信号的平均值。只要污染核酸在目的特征处作为少数存在,平均信号就可提供表征该特征处大多数模板核酸的手段。
聚类方法可用于将一个或多个系综附接至固体载体。这样,阵列可具有多个系综,每个系综在该格式中被称为簇或阵列特征。可使用本领域已知的方法诸如桥式扩增或乳液PCR来形成簇。有用的桥式扩增法描述于例如美国专利第5,641,658号或第7,115,400号、或美国专利公开第2002/0055100A1号、第2004/0002090A1号、第2004/0096853A1号、第2007/0128624A1号或第2008/0009420A1号中。乳液PCR法包括,例如,以下文献中描述的方法:Dressman等人,Proc.Natl.Acad.Sci.USA 100:8817-8822(2003)、WO 05/010145或美国专利公布第2005/0130173A1号或第2005/0064460A1号,其每一篇均通过引用整体并入本文。另一种用于扩增表面上的核酸的有用方法是滚环扩增(RCA),例如,如Lizardi等人,Nat.Genet.19:225-232(1998)或US 2007/0099208A1(其每一篇均通过引用并入本文)中所描述的。
在特定的实施方案中,将稳定的三元复合物、聚合酶、引物、模板、引发的模板核酸或核苷酸附接至流动池表面或流动池中的固体载体。流动池允许通过将溶液进出接触结合载体的三元复合物的流体室来方便地进行流体操作。流动池还提供对流体操纵组分的检测。例如,检测器可以定位成检测来自固体载体的信号,诸如来自由于形成稳定的三元复合物而被募集到固体载体上的标记物的信号。可使用的示例性流动池描述于例如美国专利申请公布第2010/0111768A1号、WO05/065814或美国专利申请公布第2012/0270305A1号(其每一篇均通过引用并入本文)中。
在本文的方法或组合物中使用的核酸可以是DNA,诸如基因组DNA、合成DNA、扩增的DNA、互补DNA(cDNA)等。还可使用RNA,诸如mRNA、核糖体RNA、tRNA等。核酸类似物也可在本文中用作模板。因此,本文使用的模板核酸可来源于生物来源、合成来源或扩增产物。本文使用的引物可以是DNA、RNA或其类似物。
特别有用的核酸模板是基因组片段,其各自包括与基因组的一部分相同的序列。基因组片段的群体可覆盖特定基因组的全部或部分序列。例如,基因组片段的群体可包括基因组的至少5%、10%、20%、30%或40%、50%、60%、70%、75%、80%、85%、90%、95%或99%的序列。基因组片段可具有例如与基因组的至少约25个、50个、70个、100个、200个、300个、400个、500个、600个、700个、800个、900个或1000个或更多个连续核苷酸基本相同的序列。可选地或另外地,基因组片段可具有与基因组的不超过1x105个、1x104个、1x103个、800个、600个、400个、200个、100个、75个、50个或25个连续核苷酸基本相同的序列。基因组片段可以是DNA、RNA或其类似物。
核酸可源自其的示例性生物体包括,例如,来自哺乳动物的那些,诸如啮齿动物、小鼠、大鼠、兔、豚鼠、有蹄动物、马、羊、猪、山羊、母牛、猫、狗、灵长类动物、人或非人类灵长类动物;植物,诸如拟南芥、玉米、高粱、燕麦、小麦、水稻、芸苔或大豆;藻类,诸如莱茵衣藻(Chlamydomonas reinhardtii);线虫,诸如秀丽隐杆线虫;昆虫,诸如黑腹果蝇、蚊子、果蝇、蜜蜂或蜘蛛;鱼类,诸如斑马鱼;爬行动物;两栖动物,诸如青蛙或非洲爪蟾;盘状网柄菌(dictyostelium discoideum);真菌,诸如卡氏肺孢子虫(pneumocystis carinii)、红鳍东方鲀(Takifugu rubripes),酵母,酿酒酵母或粟酒裂殖酵母;或者恶性疟原虫。核酸还可源自原核生物,诸如细菌:大肠杆菌(Escherichia coli)、葡萄球菌属(staphylococci)或肺炎支原体(mycoplasma pneumoniae);古菌(archae);病毒,诸如丙型肝炎病毒或人免疫缺陷病毒;或者类病毒。核酸可源自上述生物体的同质培养物或群体,或者可选地来自几个不同生物体的集合,例如,在群落或生态系统中。可使用本领域已知的方法,包括例如Sambrook等人,Molecular Cloning:A Laboratory Manual,第3版,Cold Spring HarborLaboratory,New York(2001)或Ausubel等人,Current Protocols in MolecularBiology,John Wiley和Sons,Baltimore,Md.(1998)(其每一篇均通过引用并入本文)中描述的那些来分离核酸。
模板核酸可通过制备方法诸如基因组分离、基因组片段化、基因克隆和/或扩增获得。模板可通过扩增技术诸如聚合酶链反应(PCR)、滚环扩增(RCA)、多重置换扩增(MDA)等获得。用于分离、扩增和片段化核酸以产生用于阵列分析的模板的示例性方法阐述于美国专利第6,355,431号或第9,045,796号(其每一篇均通过引用并入本文)中。扩增也可使用Sambrook等人,Molecular Cloning:A Laboratory Manual,第3版,Cold Spring HarborLaboratory,New York(2001)或Ausubel等人,Current Protocols in MolecularBiology,John Wiley和Sons,Baltimore,Md.(1998)(其每一篇均通过引用并入本文)中阐述的方法来进行。
任选地,在本公开的装置中将多种引发的模板核酸附接至固体载体上。固体载体可包括本文阐述的各种材料中的任一种,包括例如本文在核酸阵列的上下文中阐述的材料。可将多种引发的模板核酸附接至阵列的特征,并且任选地,附接至该特征的模板可具有相同的序列。可将本文阐述的各种试剂中的任一种代替引发的板核酸附接至固体载体上,或者,可选地,除了附接的引发的模板核酸以外,还可将本文阐述的各种试剂中的任一种附接至固体载体上。在特定实施方案中,本发明的装置不需要附接至任何类型的试剂。
在特定实施方案中,本公开的装置包括容器,诸如人造容器。所述容器可包含多种引发的模板核酸以及参与本文阐述的方法的其它试剂或反应产物。特别有用的人造容器是流动池,其实例已在上文中阐述。
本公开的系统可被配置成用于例如使用本文阐述的方法检测核酸的系统。例如,系统可被配置在核苷酸存在的情况下产生并检测聚合酶与引发的模板核酸之间形成的三元复合物,以鉴定模板核酸序列中的一个或多个碱基的反应。任选地,所述系统包括用于执行本文阐述的一个或多个步骤的组分和试剂,所述步骤包括但不限于:在引发的模板核酸、聚合酶和下一个正确核苷酸之间形成至少一个稳定的三元复合物;检测一种或多种稳定的三元复合物;延伸每个引物-模板杂交体的引物;解封闭可逆终止的引物;和/或鉴定模板中的核苷酸或核苷酸序列。
本公开的系统可包括用于进行核酸检测方法的容器、固体载体或其它装置。例如,所述系统可包括阵列、流动池、多孔板、试管、基板中的通道、液滴或囊泡的集合体、托盘、离心管、管道或其它方便的装置。装置可以是可移除的,从而允许将其放入系统或从系统中移除。这样,系统可被配置成连续或并行处理多个装置(例如容器或固体载体)。所述系统可包括流体组件,所述流体组件具有用于容纳一种或多种本文阐述的试剂(例如用于形成三元复合物的聚合酶、引物、模板核酸、一种或多种核苷酸、用于引物延伸的核苷酸、解封闭试剂、三元复合物抑制剂或此类组分的混合物)的容器。流体系统可被配置成例如经由通道或液滴转移装置(例如电润湿装置)将试剂递送至容器或固体载体。多种检测装置中的任一种都可被配置成检测与试剂相互作用的容器或固体载体。实例包括发光检测器、表面等离子共振检测器和本领域已知的其它检测器。具有可被容易地修改以用于本文的系统的流体和检测组件的示例性系统包括但不限于美国专利申请公布第2018/0280975A1号(其要求美国专利申请序列第62/481,289号的优先权)、美国专利第8,241,573号、第7,329,860号或第8,039,817号、或美国专利申请公布第2009/0272914A1号或第2012/0270305A1号(其每一篇均通过引用并入本文)中描述的那些。
任选地,本公开的系统还包括被配置为操作系统组件的计算机处理单元(CPU)。相同或不同的CPU可以与系统交互,以获取、存储和处理信号(例如,在本文阐述的方法中检测到的信号)。在特定实施方案中,CPU可用于根据信号确定存在于模板核酸中的特定位置处的核苷酸的身份。在一些情况下,CPU将根据检测到的信号鉴定模板的核苷酸序列。
有用的CPU可包括个人计算机系统、服务器计算机系统、瘦客户机、胖客户机、手持或膝上型设备、多处理器系统、基于微处理器的系统、机顶盒、可编程消费电子产品、网络PC、小型计算机系统、大型计算机系统、智能电话和包括任何上述系统或设备的分布式云计算环境等中的一种或多种。CPU可包括一个或多个处理器或处理单元、可以包括RAM和非易失性存储器的存储器架构。存储器结构还可包括可移动/不可移动、易失性/非易失性计算机系统存储介质。另外,存储器架构可包括一个或多个用于从不可移动、非易失性磁介质读取和向其写入的读取器,诸如硬盘驱动器、用于从可移动、非易失性磁盘读取和向其写入的磁盘驱动器和/或用于从可移动、非易失性光盘读取或向其写入的光盘驱动器,诸如CD-ROM或DVD-ROM。CPU还可包括各种计算机系统可读介质。这种介质可以是云计算环境可访问的任何可用介质,诸如易失性和非易失性介质,以及可移动和不可移动介质。
存储器构架可包括至少一个程序产品,该程序产品具有至少一个被实现为可执行指令的程序模块,该程序模块被配置为执行本文阐述的方法的一个或多个步骤。例如,可执行指令可包括操作系统、一个或多个应用程序、其它程序模块和程序数据。通常,程序模块可以包括例程、程序、对象、组件、逻辑、数据结构等,它们执行本文阐述的特定任务。
CPU的组件可通过内部总线耦合,所述内部总线可被实现为若干类型的总线结构中的任何一种或多种,包括存储器总线或存储器控制器、外围总线、加速图形端口以及使用各种总线架构中的任一种的处理器或本地总线。作为实例而非限制,此类架构包括工业标准架构(ISA)总线、微通道架构(MCA)总线、增强型ISA(EISA)总线、视频电子标准协会(VESA)本地总线和外围部件互连(PCI)总线。
CPU可以任选地与一个或多个外部设备诸如键盘、指向设备(pointing device)(例如鼠标)、显示器(诸如图形用户界面(GUI))或便于与核酸检测系统交互的其它设备通信。类似地,CPU可与其它设备通信(例如,通过网卡、BluetoothTM、WiFi调制解调器等)。这种通信可以通过I/O接口进行。此外,本文中的系统的CPU可通过合适的网络适配器与一个或多个网络诸如局域网(LAN)、广域网(WAN)和/或公共网络(例如,因特网)通信。
实施例I
通过BindingTM程序在测序中递送核苷酸的高效方法
本实施例描述了通过BindingTM程序进行的测序,其中在聚合酶存在的情况下,将不同类型的核苷酸连续递送至模板核酸的阵列,以形成三元复合物。每次递送后都要进行检查,以区分一种类型的三元复合物与另一种类型的三元复合物。此处显示的结果表明,改变试剂递送或洗涤步骤导致改进,诸如缩短循环时间、减少试剂消耗和改进测序结果。
如下制备含有引发的模板核酸的流动池。制备使用5’-生物素化引物在12个PCR反应中合成的模板核酸链,然后单独地使其结合至包被有链霉抗生物素蛋白的磁珠上。这导致了具有12种珠粒类型的群体,其中每种珠粒都含有模板链的同质集合。程序中使用的珠粒已用1mM的于磷酸盐缓冲盐水(PBS)中的NHS-PEG4-TCO进行了功能化。接下来,使具有固定的模板链的珠粒流过已用四嗪功能化的氨基硅烷流动池表面。将混合物孵育1小时,以允许经修饰的珠粒共价附接至流动池内的功能化表面。接下来,使测序引物流入流动池,并使其与固定的模板链杂交。
通过重复循环进行测序。通过在杂交的测序引物的3’末端掺入可逆终止子核苷酸以产生封闭的引发的模板核酸分子集合,从而启动测序循环。这是通过向流动池中递送RTS(RTS含有:50mM Tricine pH8.4、0.1%Tween-80、40U/ml的TherminatorTM聚合酶、5mMMgCl2、0.1%羟胺、50mM KCl、0.1%Tween-80、0.1mM EDTA和200nM的未标记的可逆终止的核苷酸类似物dATP、dGTP、dCTP和dTTP)实现的。本说明性程序中使用的可逆终止子核苷酸包括3'-ONH2可逆终止子部分。该可逆终止子核苷酸的描述可见于美国专利第7,544,794号中,其公开内容通过引用并入本文。然后用ESB溶液(1M硫氰酸胍、60mM HEPES、0.1%Tween-80、0.1%羟胺和2mM EDTA)洗涤流动池,然后用PRE溶液(50mM Tricine pH 8.4、50mM KCl、0.1%Tween-80、0.1%羟胺和0.1mM EDTA)洗涤。
然后利用检查子程序继续循环,其中将四种不同的核苷酸依次输送到流动池中。在三元复合物形成和检测步骤中,引物链的3’核苷酸上的可逆终止子部分排除了核苷酸掺入。在标准条件下,将四种不同标记的核苷酸中的一种递送至EXAM溶液(Cy5-dNTP(对于Cy5-dATP、Cy5-dGTP或Cy5-dCTP中的每一种为400nM;或者对于Cy5-dTTP为800nM)、1mMMgCl2和20U/ml的于IMG溶液中的TherminatorTM聚合酶)中的流动池中,然后用IMG溶液(20mM Tricine pH 7.0、1M甜菜碱、50mM LiCl、0.1%Tween-80、50mM KCl、10mM的硫酸铵、0.1%的羟胺和0.1mM EDTA)洗涤。Cy5-dNTP核苷酸描述于美国专利申请序列第15/873,343(公布为美国专利申请公布第2018/0208983A1号,其通过引用并入本文)中。通过荧光显微镜对流动池成像,以检测保留在IMG溶液中的三元复合物。成像后,用ESB溶液洗涤流动池,然后用PRE溶液洗涤。分别单独地对四种核苷酸类型的每一种重复子程序的步骤。如下文在附图上下文中所阐述的,在几个实验中修改了检查子程序。
按照检查子程序,继续测序循环,其中通过用含有0.25M乙酸钠和0.7M亚硝酸钠的溶液(用乙酸滴定至pH 4.8)处理流动池从引物中除去可逆终止子部分。然后在PRE溶液中洗涤流动池,除去乙酸钠和亚硝酸钠。然后,测序过程返回至测序周期启动步骤。
图1显示了通过使用上文阐述的标准条件的BindingTM方案进行的测序的信号强度对比测序循环的图。显示了针对每种核苷酸类型检测到的“开”强度和针对每种核苷酸类型检测到的“关”强度的独立迹线。对于每个循环中的每个珠粒,将产生最高信号的核苷酸类型鉴定为“开”信号,将另外三种核苷酸类型鉴定为“关”信号。在给定循环中检测的所有珠粒类型上对每种核苷酸类型的“开”信号取平均值,在100个循环中绘制平均强度图,以获得图中所示的每条“开”信号迹迹。在每循环的基础上对所有珠粒类型的信号强度进行类似的平均,以得到图1所示的“关”强度迹线。
通过将迹线与由以下公式定义的曲线拟合,评估了“开”迹线的信号衰减:
I=I0e-(n/τ) (式1)
其中I为信号强度,n为循环数,τ为信号约为I0(初始信号强度)的37%时的循环。较高的τ表示信号衰减速率较慢,这对于增加读取长度和测序准确性通常是优选的,而较快的信号衰减速率的特征在于τ值较低。拟合优度被计算为测定系数R2。较高的R2值与来自序列背景的可变性的信号强度方差降低相关,而序列背景不利影响的增加导致较低的R2值。图1所示的标准方案迹线具有为37的平均τ值和为0.88的平均R2值(在所有四种核苷酸类型的开迹线上取平均值)。
运行实验以测试检查例程中成像步骤之间进行的清洗液中不同浓度的NaCl的影响。具体而言,在检查子程序的成像步骤之间用盐溶液替换ESB。测试的盐浓度为1M GdSCN(标准洗涤)、不含盐、64mM NaCl、160mM NaCl、400mM NaCl、1M NaCl和2.5M NaCl。结果表明,与使用较高盐洗涤(400mM NaCl、1M NaCl、2.5M NaCl和1M GdSCN)相比,使用较低盐洗涤(例如,0mM、64mM或160mM的盐)时“开”信号强度较高。与标准洗涤相比,较低的盐洗涤也导致信号强度的变化较小。
图2显示了通过BindingTM方案进行的测序的信号强度对比测序循环的图,在所述BindingTM方案中在检查子程序中递送的EXAM溶液中不包含聚合酶。相反,聚合酶保留在来自前次RTS递送的流动池中。结果表明,令人惊讶的是,在测序循环中进行的多个试剂递送和成像步骤中均保留了聚合酶。此外,与标准程序相比,保留聚合酶导致信号强度变化较小。然而,与标准条件相比,当保留聚合酶时,“关”强度更高,尤其是对于C和T迹线。
图3显示了通过BindingTM方案进行的测序的信号强度对比测序循环的图,在所述BindingTM方案中通过用含有盐和乙醇的洗提溶液代替ESB和PRE洗涤来调节标准条件。具体而言,洗提溶液包含50mM Tricine pH 8.4、150mM KCl、0.1%Tween-80、0.1%的羟胺和0.1mM EDTA以及25%乙醇。此外,在改良条件下,在检查子程序中递送的任何EXAM溶液中均不含聚合酶。相反,聚合酶保留在来自前次RTS递送的流动池中。如前所述,结果表明在检查子程序中进行的多个试剂递送和成像步骤中均保留了聚合酶,还表明与标准程序相比,保留聚合酶导致信号强度变化较小。然而,与高盐一起使用乙醇导致降低的“关”强度,与图2的结果相比有所改善。
在图3所述的条件下将测序方案进行了150个循环。运行的τ=53值表明,与图1中绘制的标准条件的τ=37相比,信号衰减有所改善。在检查子程序中使用盐/乙醇洗涤液也导致与图1的标准条件(R2=0.88)相比,改进的运行的序列背景伪影减少(R2=0.94)。
将测序方案执行了100个循环,其中通过省略成像步骤之间的ESB和PRE洗涤来调整标准条件。此外,在改良条件下,在检查子程序中递送的任何EXAM溶液中均不含聚合酶。相反,聚合酶保留在来自前次RTS递送的流动池中。因此,不同类型的三元复合物(即结合有不同类型的同源核苷酸的三元复合物)在检查子程序期间累积。在这种情况下,“开”强度被识别为显示出从一幅图像到下一幅图像的信号强度增加最大的珠粒,尽管是在特定周期内。与图1的标准条件(τ=37)相比,在改良条件(τ=27)下信号衰减更快。然而,与图1的条件(R2=0.88)相比,对于改良条件,0.97的R2值是一种改善,表明当三元复合物在检查子程序上累积时,序列背景伪影减少。这些结果表明,三元复合物的累积提供了非常好的测序结果。
贯穿本申请,参考了各种出版物、专利和/或专利申请。这些文件的公开内容据此通过引用整体并入本申请。
已经描述了许多实施方案。然而,应当理解,可以进行各种修改。因此,其它实施方案在所附权利要求的范围内。