CN111542532B

CN111542532B - 酶法合成寡核苷酸的方法和体系

Info

Publication number: CN111542532B
Application number: CN201880078052.7A
Authority: CN
Inventors: 肯德尔·霍夫; 米歇尔·哈尔佩因; 詹卡洛·加尔巴尼亚蒂; 周巍
Original assignee: Centrillion Technology Holdings Corp
Current assignee: Centrillion Technology Holdings Corp
Priority date: 2017-10-04
Filing date: 2018-10-01
Publication date: 2024-03-15
Anticipated expiration: 2038-10-01
Also published as: US11414687B2; US20200263218A1; EP3692049A1; EP3692049A4; CN111542532A; WO2019070593A1

Abstract

本发明涉及在聚合酶存在下由单链固定化引物酶法合成寡核苷酸的方法、过程和系统。利用本发明的方法，在脱氧核糖核苷酸三磷酸或核糖核苷酸三磷酸存在下，可从单链固定化引物酶法合成单链寡核苷酸。双脱氧核糖核苷酸三磷酸酯、带有可逆终止子的脱氧核糖核苷酸三磷酸酯或带有可逆终止子的核糖核苷酸三磷酸酯可以酶法添加到引物或其延伸产物的末端。根据本发明的方法，单链引物可与模板结合，所形成的双链结构可使聚合酶在3’端延伸引物。

Description

酶法合成寡核苷酸的方法和体系

交叉引用

本申请要求2017年10月4日提交的第62/568,205号美国临时专利申请和2018年9月5日提交的第62/727,174号美国临时专利申请的权益，其全部内容通过引用结合到本文中。

序列表

本即时申请包含序列表，该序列表已以ASCII格式电子提交，并通过引用整体并入本文。所述ASCII副本创建于2018年10月18日，名为38558-733_601_SL.txt，大小为7,632字节。

背景

合成核酸(如寡核苷酸)在分子生物学、法医学和医学诊断等许多领域发挥着重要作用。寡核苷酸已成为现代生物技术和医学研究的重要工具。例如，寡核苷酸已被广泛应用于各种技术中，包括诊断探测法、聚合酶链式反应(PCR)、基因表达的反义抑制和核酸组装。寡核苷酸合成可能涉及基因组编辑，例如依赖CRISPR、DNAzymes(即通过体外选择获得的催化活性脱氧核苷酸(DNA)分子)、DNA折纸、用于数据存储的DNA和空间转录组学的应用。寡核苷酸的广泛应用也促进了核酸阵列的发展，例如脱氧核糖核酸(DNA)和核糖核酸(RNA)阵列。

设计的核酸序列通过使用聚合酶链反应(PCR)或连接酶链反应(LCR)方法连接相应的(先前合成的)寡核苷酸，一次组装一个。参见，如Smith等人，“通过全基因组组装生成合成基因组：合成寡核苷酸的X174噬菌体”，Proc.Natl.Acad.Sci.USA,100(26):15440-5(2003).Gibson是一种分子克隆方法，它允许在单个等温反应中连接多个DNA片段。参见，如Gibson等人，“酶法组装高达几百千碱基的DNA分子”。Nature Methods.6(5):343–345构建长寡核苷酸需要同时合成多个基因序列。然而，最先进的的寡核苷酸合成基本上是通过化学合成逐个完成的。参见Zhou等人，“寡脱氧核苷酸的微流控PicoArray合成和多个DNA序列的同时组装”，Nucleic Acids Res.,11:32(18):5409-17(2004)。

概述

通过聚合酶催化反应合成单链、固定化或液相寡核苷酸是可取的。本发明提供了通过使用一种酶来完成这种酶合成的方法，该酶需要不超过7个碱基对，即可从游离3’端延伸单链、固定寡核苷酸。在一些实施例中，酶法合成需要1、2、3、4、5、6或7个碱基配对，以从其游离3’端延伸单链、固定寡核苷酸。本发明还提供了通过使用改良聚合酶完成这种酶合成的方法，该聚合酶需要不超过7个碱基配对，即可将单链式溶液相寡核苷酸从其游离3’端延伸出来。在某些情况下，酶法合成需要1、2、3、4、5、6或7个碱基配对，才能从其游离3’端延伸出单链的液相寡核苷酸。

在一个方面，本发明提供了一种合成单链寡核苷酸的方法，包括：(a)提供包含游离3’端、聚合酶和核苷酸试剂的单链引物；(b)通过聚合酶将单链引物从游离3’端延伸至核苷酸试剂；聚合酶需要不超过7个碱基配对来延伸单链引物。

在一些实施例中，所述核苷酸试剂为带有3’端终止子的可逆终止核苷酸。在一些实施例中，单链引物还包括附着于基底的5’端。在一些实施例中，聚合酶是一种改良的聚合酶。在一些实施例中，该方法还包括:(c)从可逆终止核苷酸中去除3’端终止子。在一些实施例中，该方法还包括:(d)重复步骤(a)-(c)。在一些实施例中，(d)中的重复步骤将单链引物从游离3’端延伸，从而合成包含该单链引物的单链寡核苷酸产物。

在一些实施例中，该方法还包括在(b)之后和(c)之前：(b1)在聚合酶或末端脱氧核苷酸转移酶(TdT)存在的情况下，用双脱氧核苷酸试剂处理单链引物。

在一些实施例中，该方法还包括在(a)之后和(b)之前：(a1)将单链引物上的杂交位点与模板杂交，并且杂交位点位于3’端且包含不超过7个碱基。在一些实施例中，所述模板是单链引物、附着于基底上的相邻单链核酸或溶液中的多个单链核酸模板中的一种。在一些实施例中，模板是相邻的单链核酸，相邻的单链核酸与单链引物的序列一致性不超过5％、不超过10％、不超过15％、不超过20％、不超过25％、不超过30％、不超过35％、不超过40％、不超过45％、不超过50％、不超过55％、不超过60％、不超过65％、不超过70％、不超过75％、不超过80％、不超过85％、不超过90％或不超过95％。在一些实施例中，模板是相邻的单链核酸，并且相邻的单链核酸与单链寡核苷酸具有100％的序列一致性。在一些实施例中，相邻的单链核酸与单链引物具有至少25％、至少30％、至少35％、至少40％、至少45％、至少50％、至少55％、至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％或至少95％的序列一致性。在一些实施例中，相邻的单链核酸与单链引物具有约25％、约30％、约35％、约40％、约45％、约50％、约55％、约60％、约65％、约70％、约75％、约80％、约85％、约90％或约95％的序列一致性。在一些实施例中，相邻的单链核酸与单链引物实质上不具有序列一致性。在一些实施例中，溶液中的多个单链核酸模板是多个二聚体、多个三聚体、多个四聚体、多个五聚体、多个六聚体、多个七聚体、多个八聚体、多个九聚体、多个十聚体、多个十一聚体或多个十二聚体。在一些实施例中，溶液中的多个单链核酸模板是多个长度超过10个碱基的寡核苷酸。在一些实施例中，多个单链核酸模板包括随机序列。

在一些实施例中，杂交位点包括1、2、3、4、5、6或7个碱基。在一些实施例中，在(a1)中存在模板的情况下，(b)中延伸的效率得以提高。在一些实施例中，聚合酶需要1、2、3、4、5、6或7个碱基对来延伸单链引物。在一些实施例中，延伸在约20℃到约99℃之间进行。在一些实施例中，延伸在约50℃到约75℃之间进行。在一些实施例中，延伸在约55℃到约65℃之间进行。在一些实施例中，延伸在约60℃下进行。

在一些实施例中，该酶是脱氧核糖核酸(DNA)聚合酶、RNA聚合酶或逆转录酶。在一些实施例中，经修饰的脱氧核糖核酸(DNA)聚合酶是一种嗜热DNA聚合酶，与未经修饰的DNA聚合酶相比，其降低了3’至5’校对外切酶活性。在一些实施例中，与未经修饰的DNA聚合酶相比，经修饰的DNA聚合酶具有不超过6％的3’到5’校正外切核酸酶活性。在一些实施例中，与未经修饰的DNA聚合酶相比，经修饰的DNA聚合酶具有不超过1％、不超过2％、不超过3％、不超过4％或不超过5％的3’至5’校正外切核酸酶活性。

在一些实施例中，经修饰的逆转录酶是莫洛尼鼠白血病病毒(M-MLV)逆转录酶或人类免疫缺陷病毒1型逆转录酶。在一些实施例中，经修饰的逆转录酶是修饰的莫洛尼鼠白血病病毒(M-MLV)逆转录酶或修饰的人类免疫缺陷病毒1型逆转录酶。在一些实施例中，酶可被修饰以增加延伸效率、使用3’-修饰的底物、或降低温度或pH敏感性等提高效率。在一些实施例中，多个单链核酸模板包含随机序列。

在一些实施例中，单链引物包含尿嘧啶。在一些实施例中，该方法还包括：在尿嘧啶上切割单链引物。在一些实施例中，尿嘧啶位于单链引物的3’末端的最后一个碱基处。

在一些实施例中，该酶是DNA聚合酶。在一些实施例中，DNA聚合酶未经修饰。在一些实施例中，DNA聚合酶经修饰。在一些实施例中，该酶是9°Nm TM DNA聚合酶。在一些实施例中，该酶被修饰为9°Nm^TM DNA聚合酶。在一些实施例中，经修饰的9°Nm^TM DNA聚合酶与9°Nm^TM DNA聚合酶(New England Biolabs,Inc.)的序列一致性为至少25％、至少30％、至少35％、至少40％、至少45％、至少50％、至少55％、至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％或至少95％。在一些实施例中，经修饰的9°Nm^TM DNA聚合酶与°Nm^TM DNA Polymerase(New England Biolabs,Inc.)聚合酶的序列一致性为约25％、约30％、约35％、约40％、约45％、约50％、约55％、约60％、约65％、约70％、约75％、约80％、约90％或约95％。

在一些实施例中，逆转录酶是莫洛尼鼠白血病病毒(M-MLV)逆转录酶或人类免疫缺陷病毒1型逆转录酶。在一些实施例中，逆转录酶是经修饰的莫洛尼鼠白血病病毒(M-MLV)逆转录酶或经修饰的人类免疫缺陷病毒1型逆转录酶。在一些实施例中，经修饰的M-MLV逆转录酶与M-MLV逆转录酶具有至少25％、至少30％、至少35％、至少40％、至少45％、至少50％、至少55％、至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％或至少95％的序列一致性。在一些实施例中，经修饰的M-MLV逆转录酶与M-MLV逆转录酶(Sigma-Aldrich)具有约25％、约30％、约35％、约40％、约45％、约50％、约55％、约60％、约65％、约70％、约75％、约80％、约85％、约90％或约95％的序列一致性。在一些实施例中，经修饰的逆转录酶是经修饰的莫洛尼鼠白血病病毒(M-MLV)逆转录酶或经修饰的人类免疫缺陷病毒1型逆转录酶。

在一些实施例中，该方法重复其步骤，使其重复从游离3’端延伸单链引物，从而合成包含单链引物的单链寡核苷酸产物。在一些实施例中，该方法还包括：切割单链寡核苷酸产物。在一些实施例中，该方法还包括：切割合成的生长链或杂交的复合物。在一些实施例中，切割合成生长链或杂交复合物包括使用限制性内切酶、使用合成生长链或杂交复合物中的可切割连接物(例如，连接到生长链5’端和生长链与链5'端之间的可切割连接物，或者用转座酶瞄准5’端的位置。在一些实施例中，切割将酶法合成的寡核苷酸割去。在一些实施例中，在生长链/杂交复合物的酶合成片段内切割并移除模板寡核苷酸。在一些实施例中，切割发生在通用模板寡核苷酸(UTO)内。在一些实施例中，切割位于通用模板寡核苷酸(UTO)的3’-端。在一些实施例中，切割发生在单链引物内。在一些实施例中，切割移除序列包括单链引物的至少一部分。在一些实施例中，去除的序列包含单链引物。

在一些实施例中，单链引物包含尿嘧啶。在一些实施例中，该方法还包括：在尿嘧啶处切割单链引物。在一些实施例中，尿嘧啶位于单链引物3’端的最后一个碱基处。在一些实施例中，经修饰的聚合酶需要1、2、3、4、5、6或7个碱基对来延伸单链引物。

通过以下的详细描述，本发明的其他方面和优点对于本领域的技术人员来说将变得显而易见，其中仅示出和描述了本发明的说明性实施例。技术人员将会认识到，本发明具有实现其他不同的实施例的能力，并且其若干细节易于修改，所有这些都不偏离本公开内容。因此，附图和说明应被视为是说明性的，而非限制性的。

通过引用合并

本说明书中提到的所有出版物，专利和专利申请都以相同的程度通过引用并入本文，就如同每个单独的出版物，专利或专利申请被明确地单独地指出并通过引用并入一样。

附图简要说明

本发明的新特点在所附权利要求书中有详细的阐述。参考下面对示例性实施例(其中使用了本发明的原理)的详细描述及其附图，将有助于更好地理解本发明的特征和优点：

图1a示出了酶法合成寡核苷酸的示例方法:(i)使用脱氧核苷酸转移酶，(ii)使用DNA/RNA聚合酶和逆转录酶，(iii)使用连接酶。

图1b示出了使用化学阻断的底物进行聚合酶介导的固相合成寡核苷酸的示例方法。

图1c示出了一个变性PAGE分析示例,该分析通过在20个碱基的单链寡核苷酸模板的3’-OH端连续加入两个具有可逆终止子的碱基来延伸该模板。

图1d示出了使用Duplase-3基于通用模板寡核苷酸合成20碱基单链DNA片段(GCTGTATCGGCTGAATCGTA(SEQ ID:1))的变性PAGE分析示例。

图2a示出了两个模板的示例，这两个模板用于与M-MLV逆转录酶(RT)和脱氧核糖核苷三磷酸(dNTP)或3’-O-叠氮甲基dNTP的延伸反应，其中使用(i)20碱基单链固相寡核苷酸；或(ii)与模板杂交的33碱基引物。图2a按出现顺序依次展示了序列ID号2、2、2、2、2、2、7和8。

图2b示出了对(i)对图2a(i)所示的单链DNA使用Superscript IV M-MLV-RT；或(ii)对图2a(ii)所示的双链DNA使用Superscript IV M-MLV-RT的延伸产物的变性PAGE分析。

图2c示出了对(i)对图2a(i)所示的单链DNA使用SMARTScribe RT；或(ii)对图2a(ii)所示的双链DNA使用SMARTScribe RT的延伸产物的变性PAGE分析。

图3a显示了在使用四个20碱基单链序列作为引物和模板于Duplase-3反应的单链DNA的序列特异性延伸的示例。图3a按出现顺序依次展示了SEQ ID号2、2、2、2、2、2、2和9-11。

图3b示出了通过分子间反应延伸表面结合的寡核苷酸的示例，一个20碱基的序列紧邻一个30碱基的序列，后者内部有一个CAA，多聚T序列可以杂交(其中两个碱基)并使用三磷酸脱氧鸟苷(dGTP)进行延伸。图3b按出现顺序依次展示了SEQ ID号5、5、5、5、6和5。

图4a使用变性PAGE示出了在以脱氧腺苷三磷酸(dATP)、脱氧胸苷三磷酸(dTTP)、脱氧胞苷三磷酸(dCTP)或脱氧鸟苷三磷酸为底物，在Duplase-1(如(i))、Duplase-2(如(ii))或Duplase-3(如(iii))存在下在双链底物上延伸产物的保真度。图4a按出现顺序依次展示了SEQ ID号12和8。

图4b使用变性PAGE示出了在3’-O-叠氮甲基-dATP、3’-O-叠氮甲基-dTTP、3’-O-叠氮甲基-dCTP或3’-O-叠氮甲基-dGTP作为底物和Duplase-1(如(i))、Duplase-2(如(ii))或Duplase-3(如(iii))存在下，在单链20碱基底物(CACTGATTACCCTACACGAG(序列ID号：2))上延伸产物的保真度。图4b按出现顺序依次展示了SEQ ID号2、2、13和2。

图5示出了对Duplase-3在20碱基单链寡核苷酸中掺入核糖核苷酸的进行变性PAGE分析的示例。

图6示出了对Duplase-3在不同的二价金属存在的情况下将核苷酸掺入20碱基单链寡核苷酸中的PAGE分析示例。图6按出现顺序分别展示了SEQ ID号2、2、13和2。

图7a示出了对Duplase-3在溶液中没有模板的情况下，在不同温度下将核苷酸掺入59碱基单链寡核苷酸中的结果进行变性PAGE分析的示例。

图7b示出了对Duplase-3在溶液中存在3’-磷酸封闭随机六聚体模板的情况下，在不同温度下将核苷酸掺入59碱基单链寡核苷酸中的结果进行变性PAGE分析的示例。

图8a示出了一个变性PAGE分析的示例，其通过向反应溶液中添加随机分子，增强了Duplase-3对短固相寡核苷酸的延伸。符号“-T”表示没有随机分子，符号“+T”表示有随机分子。

图8b示出了溶液中不同的六聚体杂交到固相上的序列的可能结果。图8b展示了序列ID号14为“TTTTTTTTTTTTTTTTTT”。

图8c示出了如图8b所示用Duplase-3和六聚体延伸一个序列的结果的变性PAGE分析。

图8d示出溶液中不同的五聚体与固相上的序列(CACTGAATTCCCTACACGAG，序列ID号:3)杂交的可能结果。

图8e示出了在图8d所示的Duplase-3和五聚体存在的情况下，用图8d中的五聚体延伸其中固相上的寡核苷酸的结果的变性PAGE分析。

图9示出了对Duplase-3在3’-磷酸封闭随机分子存在的情况下，将核苷酸掺入20碱基单链寡核苷酸中的结果进行变性PAGE分析的示例。

图10示出了在实验中和本文所展示的图中使用的寡核苷酸序列的列表。图10按出现顺序依次展示了序列ID号15-26、23和27-30。

图11a示出了使用Duplase-3延伸20碱基寡核苷酸后进行变性PAGE分析的示例。

图11b示出了使用Duplase-3延伸20碱基寡核苷酸后进行变性PAGE分析的又一示例。

详细描述

本发明提供了酶法合成单链、固定化或液相寡核苷酸的方法。本文公开的方法可以使用经修饰或未经修饰的酶，包括聚合酶，它不需要超过7个碱基对来延伸固定化的或液相引物。本文公开的方法可在经修饰或未经修饰的聚合酶对固定化的或液相引物进行延伸反应时使用模板。在一些实施例中，本文公开的方法使用修饰的聚合酶。在一些实施例中，本文公开的过程可在经修饰的聚合酶对固定化引物进行延伸反应时使用模板。

目前，随着DNA和RNA在治疗学、高通量基因分型、合成生物学和数据存储等方面的新应用，对更长、更准确的寡核苷酸的需求正在增加。这些新的应用对分步收率/步进产率/逐步产率(量)提出了很高的要求，但目前的化学合成方法可以达到98.5-99.5％的分步效率。非酶法合成中化学反应所需的环境可能与光刻胶化学法不兼容，从而限制了可嵌入阵列中的复杂程度。参见McGall等人，“使用半导体光刻胶光导合成高密度寡核苷酸阵列”，Proc.Natl.Acad.Sci.USA,93:13555-60(1996)。此外，寡核苷酸的合成每年产生30多万加仑的危险化学废物，这增加了对发开酶法合成方法的需求。参见LeProust等人，“通过新的脱嘌呤控制方法合成高质量长(150mer)寡核苷酸库”，Nucleic Acids Res.,38(8):2522-40(2010)。因此，酶法合成寡核苷酸的需求还没有得到满足。

本文使用的术语仅用于描述特定情况，并无限制之意。本文使用的单数形式“a”、“an”和“the”也可以包含复数形式，除非上下文另有明确指示。此外，如果“including”，“includes”，“having”，“has”，“with”或其变体可用于详细说明和/或权利要求书中，则该等术语的含义类似于“comprising(包括)”一词。

术语“about(大约)”或“approximately(近似)”可指在特定值的可接受误差范围内，如本领域普通技术人员所确定的那样，这将部分取决于如何测量或确定该值，即测量系统的局限性。例如，根据本领域的实践，“大约”可以表示约正负10％。或者，“大约”可以表示给定值的至多20％，至多10％，至多5％或至多1％的范围。或者，特别是关于生物系统或过程，该术语可以意指在值的数量级内，值的5倍以内或2倍以内。如果在申请书和权利要求书中可以描述特定值，除非另有说明，否则应当假定“大约”一词的含义在特定值的可接受误差范围内。此外，在提供了值的范围和/或子范围的情况下，范围和/或子范围可以包括范围和/或子范围的端点。

本文中使用的术语“基本上(substantially)”可指接近给定值100％的值。例如，一种“基本上局部化”的活性剂可以表示，相对于活性剂、盐或代谢物的总量，按重量计约90％的活性剂、盐或代谢物可以存在。在某些情况下，该术语可指至少约为总量的90％、91％、92％、93％、94％、95％、96％、97％、98％、99％、99.9％或99.99％。在某些情况下，该术语可指约为总量的100％。

在本文中，核苷酸缩写为3个字母。第一个字母表示含氮基(例如，A表示腺嘌呤，G表示鸟嘌呤)，第二个字母表示磷酸盐的数量(单、双、三)，第三个字母是P，表示磷酸盐。以核糖为糖的核苷三磷酸，即核糖核苷三磷酸，通常缩写为NTP，而以脱氧核糖为糖的核苷三磷酸，即脱氧核糖核苷三磷酸，则缩写为dNTP。例如，dATP代表脱氧腺苷三磷酸。NTP是RNA的基础，而dNTP是DNA的基础。在某些情况下，核苷酸缩写为2个字母。例如，dA表示dATP，N3-dA表示3’-O-叠氮甲基-dATP。在某些情况下，其他改性糖也可用于生长链的合成。例如，异核苷酸(XNA)是天然核酸DNA和RNA的合成替代物，作为储存信息的生物聚合物，其糖链不同。XNA研究类型可以包括一些合成XNA，例如1,5-脱水己糖醇核酸(HNA)、环己烯核酸(CeNA)、苏糖核酸(TNA)、乙二醇核酸(GNA)、锁定核酸(LNA)和肽核酸(PNA)。

本文中使用的术语“寡核苷酸”通常指核苷酸链。在某些情况下，寡核苷酸的长度小于200个残基，例如，在15到100个核苷酸之间。在一些情况下，寡核苷酸可包含至少/大约1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、60、70或90个碱基。在某些情况下，寡核苷酸可包含至少/大约100、200、300、400、500、600、700、800、900、1000、1500、2000、2500、3000、3500、4000、4500、5000、5500、6000、6500、7000、7500、8000、8500、9000、9500、1万、2万、3万、4万、5万、6万、7万、8万、9万、10万、20万、40万、50万、60万、70万、80万、90万、100万、200万、300万、400万、500万、600万、700万、800万、900万或1000万个碱基。在某些情况下，寡核苷酸可包含超过100、200、300、400、500、600、700、800、900、1000、1500、2000、2500、3000、3500、4000、4500、5000、5500、6000、6500、7000、7500、8000、8500、9000、9500、1万、2万、3万、4万、5万、6万、7万、8万、9万、10万、20万、40万、50万、60万、70万、80万、90万、100万、200万，300万，400万，500万，600万，700万，800万，900万或1000万个碱基。这些寡核苷酸的碱基可以是约3到5个，约1到50个，约8到12个，约15到25个，约25到35个，约35到45个，或约45到55个。寡核苷酸(也称为“oligo”)可以是任何类型的寡核苷酸(例如，引物)。寡核苷酸可包含天然核苷酸、非天然核苷酸或其组合。

本文中使用的术语“固定化”通常指在两个反应基团之间形成共价键。例如，反应基团的聚合是固定化的一种形式。碳-碳共价键的形成是固定化的一个例子。在某些情况下，当讨论将诸如DNA、RNA或寡核苷酸之类的生物分子连接到固体载体上时，可以使用化学键(包括但不限于共价键)来实现“固定化”。例如，在某些情况下，这种连接包括I-Linker^TM、胺修饰的寡核苷酸与活化羧基或琥珀酰亚胺酯共价连接、巯基修饰的寡核苷酸通过烷基化试剂如碘乙酰胺或马来酰亚胺共价连接、acrydite^TM修饰的寡核苷酸通过硫醚、地高辛NHS酯、胆固醇-TEG共价连接、固定化链霉亲和素捕获的生物素修饰的寡核苷酸等。参阅“将寡核苷酸粘附到固体载体上的策略”(可在2018年9月14日的“sfvideo.blob.core.windows.net/sitefinity/docs/default-source/technical-report/attaching-oligos-to-solid-supports.pdf？sfvrsn＝47483407_6,”检索到)。

在本发明的方法和系统中，可以将引物附着到固体底物上。引物可以直接或通过连接剂与底物结合。连接剂可以包括例如氨基酸、多肽、核苷酸、寡核苷酸或其他不干扰探针功能的有机分子。引物或连接剂可包含可裂解基团。例如，引物可包含尿嘧啶基。脱氧尿苷(dU)可以代替DNA寡核苷酸中的dT。尿嘧啶-N-去糖基化酶(UNG)可以去除碱基(dU)，使寡核苷酸易在dU位点发生断链。此外，USER(尿嘧啶特异性切除试剂)酶可在尿嘧啶的位置产生单核苷酸间隙。USER酶可能是尿嘧啶DNA糖基化酶(UDG)和DNA糖基化酶-裂解酶核酸内切酶VIII的混合物。UDG可能催化尿嘧啶基的切除，形成一个无碱基(无嘧啶)位点，同时使磷酸二酯主链保持完整。核酸内切酶VIII的裂解酶活性破坏了无碱基位点3’和5’侧的磷酸二酯主链，从而释放了无碱基的脱氧核糖。

在某些情况下，本发明的方法和系统包括使用未附着于固体底物而停留在液相的引物。

固体底物可以是生物的、非生物的、有机的、无机的，也可以是其中任何一种的组合。例如，底物可以以一种或多种粒子、链、沉淀物、凝胶、片状、管状、球状、容器、毛细管、垫片、切片、膜、板、载玻片或半导体集成芯片等形式存在。固体底物可以是平坦的，也可以呈现不同的表面结构。例如，固体底物可包含发生合成或沉积的凸起或凹陷区域。在一些例子中，可以选择固体底物以提供适当的光吸收特性。例如，底物可以是聚合的LangmuirBlodgett膜、功能化玻璃(例如，可控孔径玻璃)、二氧化硅、氧化钛，氧化铝，氧化铟锡(ITO)、硅(Si)、锗(Ge)、砷化镓(GaAs)、磷化镓(GaP)、二氧化硅(SiO2)、氮化硅(SiN4)、改性硅、半导体集成电路(IC)芯片的顶层介电层，或各种凝胶或聚合物中的任何一种，例如(聚)四氟乙烯、(聚)偏二氟乙烯、聚苯乙烯、聚碳酸酯、聚二甲基硅氧烷(PDMS)、聚甲基丙烯酸甲酯(PMMA)、多环聚烯烃或其组合。

固体底物可包括聚合物涂层或凝胶，例如聚丙烯酰胺凝胶或PDMS凝胶。凝胶和涂层还可以包括用于修改其物理化学性质，例如疏水性，的成分。例如，聚丙烯酰胺凝胶或涂层可在其聚合物结构中包含改性丙烯酰胺单体，如乙氧基丙烯酰胺单体、磷酰胆碱丙烯酰胺单体、甜菜碱丙烯酰胺单体及其组合。

酶法合成寡核苷酸

在某些情况下，如图1a-1d所示，可以在可逆终止核酸存在的情况下，采用酶促寡核苷酸合成方法来延伸表面结合的单链寡核苷酸。本文中使用的术语“可逆终止核酸”或“可逆终止子”通常指可以可逆地终止引物延伸的经修饰的核苷酸类似物。例如，可逆终止子可以是含有共价修饰(例如在其3’-OH基团上)的经修饰的核酸，一旦经修饰的核酸掺入到生长链中，就可以阻止聚合酶的进一步合成。这种共价修饰随后可以被移除，例如使用化学物质或特定酶，以允许聚合酶添加下一个互补核苷酸。如图1a所示，固相酶法寡核苷酸合成的方法可以通过不同的方法来实现，这些方法使用不同种类的作用于DNA和RNA的酶。图1a所示为(i)末端脱氧核苷酸转移酶(TdT)，(ii)DNA/RNA聚合酶和逆转录酶，以及(iii)连接酶。本发明中可用于合成生长链的具有核苷酸转移酶活性的其他酶包括，例如，多核苷酸磷酸化酶(PNPase)，它是一种双功能酶，具有3’到5’磷酸核糖核酸外切酶活性和3’末端寡核苷酸聚合酶活性。

在某些情况下，酶促寡核苷酸合成方法可在可逆终止核酸和一种酶的存在下进行，该酶被配置为可延长液相单链寡核苷酸。

图1b详细说明了DNA聚合酶延伸表面结合的单链寡核苷酸的过程。DNA聚合酶可以催化可逆终止子掺入表面结合的单链寡核苷酸(即起始引物)上。如图1b(i)所示，模板链可以是发夹结构和顺式延伸的初生链本身，与初生链杂交的相邻链，或与初生链杂交的溶液中的另一寡核苷酸。由于新添加的核苷酸上存在3’-或阻断基(或终止基)，表面结合的单链寡核苷酸不能延伸超过一个碱基。在单个掺入之后，可通过去保护恢复3’-羟基。现在可以重复此过程以添加第二，第三个碱基。

在某些情况下，可使用化学可裂解的可逆终止剂3’-O-叠氮甲基-dNTP，并且可使用三(2-羧乙基)盐酸膦(TCEP)实现脱保护。也可以使用其他可逆终止剂，包括可酶解的、特定pH值下可分解的酸性或碱性不稳定的连接剂，或紫外(UV)可裂解的核苷酸，或氨氧基可逆终止剂。其他还原剂可将可逆终止剂3’-o-叠氮甲基-脱氧核糖核酸(3’-o-脱氧核糖核酸)掺入生长链后脱保护。

DNA/RNA聚合酶和逆转录酶需要双链底物来延伸新生链。在一些情况下，本文公开了一种使用引物和兼容的DNA聚合酶合成DNA或RNA序列的方法。在某些情况下，一种需要碱基配对的DNA聚合酶，例如需要1、2、3、4、5或6个碱基配对，可用于驱动添加核苷酸以延伸引物。在某些情况下，引物可以与通用模板(包含3碱基序列的所有可能组合)杂交。单碱基的延伸可以通过使用经修饰的核苷酸底物例如可逆终止子来控制。例如，由于所用的聚合酶可能仅需要在引物的3’端进行两个碱基配对，即可添加单个核苷酸，如果模板上的第三个碱基(紧邻配对的碱基对，例如T)与要添加的所需碱基(例如A)互补，可以通过DNA聚合酶处理所需核苷酸(例如dATP)，并添加碱基A以延伸引物(如图1b所示(ii)，R是终止子，因此新生物不能进一步延伸。但是，如果模板上的第三个碱基(例如G)不是所需的互补碱基(例如T)，并且唯一可用的底物碱基是经修饰的dATP可逆终止子，则该酶可能由于错误的掺入反应而掺入碱基A，或者在此条件下不会延伸引物。然而，由于模板可能有其他杂交位点可用，并且引物/模板复合物可能经历了几轮解离/缔合，因此在适当的杂交条件下，引物可能与模板以不同的模板序列形成正确的构型。因此，该变性和杂交的过程可以重复进行，直到引物与模板序列杂交，以允许聚合酶结合，然后以所需序列延伸一个碱基(例如，A)。例如，如果要添加的所需碱基是“A”，并且模板包含以下序列：TNN(例如，模板序列是：TTTTTACCTCTGTATGCATCGATAGGTCCGGGAAGCCCACAAACTAATTTCAGAGTGACGTTACTTGGCGCTTTTTT(序列ID号:4))，则引物可以在高温下与模板瞬时杂交。在将引物与具有T作为下一个未杂交碱基的子序列(即上文讨论的第三个碱基)杂交后，DNA聚合酶可以处理溶液中的dATP可逆终止子，并将位于3’端的包含终止子基团的新碱基A延伸至引物。在某些情况下，UTO可包括通用碱基，例如5-硝基吲哚(5-NI)或7-硝基吲哚(7-NI)类似物。在某些情况下，UTO可能包括两个、三个或三个以上的通用碱基。本文所用的“通用碱基”可指可以与来自天然核苷酸的所有四个标准碱基配对的碱基。通用碱基可以与其他碱基任意配对。示例可能包括2’-脱氧肌苷(次黄嘌呤脱氧核苷酸)衍生物、硝基唑类似物、硝基吲哚类似物和疏水性芳香族非氢键碱(强堆积效应)。

然后可以除去3’端的终止基团(如图1b(iii)所示，OH是3’OH，可以被聚合酶或其他酶进一步延伸)。此后，通过重复上述过程，下一个所需的碱基可以被添加到游离3’OH中。在某些情况下，模板本身也可以作为引物，称为自启动寡核苷酸(SPO)或通用模板寡核苷酸(UTO)。引物也可以以可切割的碱基(例如，U碱基)开始或包含该碱基。这将使合成的序列可以从引物的“U”位置切割，这样固定化的序列就可以从与引物结合的固体底物上移除。

图1c显示了使用可逆终止子在固体表面上的20碱基单链寡核苷酸上按顺序掺入两个碱基的结果。对20个碱基的模板进行变性PAGE分析(掺入3’-O-叠氮基甲基-dTTP(+1个碱基)后，切割3’-O-叠氮基甲基封端基团，并掺入3’-O-叠氮基甲基-dCTP(+2个碱基))。符号*表示未延伸的对照组。图1d显示了在通用模板寡核苷酸上合成20碱基单链DNA片段的结果。使用Duplase-3在通用模板寡核苷酸上合成20碱基序列GCTGTATCGGCTGAATCGTA(序列ID号：1)，期间在添加4、8、12、16和20碱基后，可进行变性PAGE分析。符号*表示未延伸的对照组。

在某些情况下，本申请的延伸方法可允许在没有全长互补模板的情况下，在酶的存在下合成与底物结合的单链核酸序列。在某些情况下，当模板中与合成的底物结合的单链核酸序列互补的最长序列的长度为1、2、3、4、5或6个碱基，且模板中最长的互补序列比合成的与底物结合的单链核酸序列的全长短时，本申请的延伸方法可允许在酶存在的情况下合成底物结合的单链核酸序列。在某些情况下，当与底物结合的单链核酸序列的全长是从第一个添加到底物的碱基计算起时(即，从第一次延伸反应添加的第一个碱基开始，到最后一次延伸反应添加的最后一个碱基结束)，模板中最长的互补序列比合成的与底物结合的单链核酸序列的全长至少短3、4、5、6、7、8、9、10、11、12、13、14、15、16、17或18个碱基。在某些情况下，对于合成的与底物结合的单链核酸序列中的任意三个连续碱基，模板中存在互补序列。在某些情况下，对于合成的与底物结合的单链核酸序列中的任意四个连续碱基，模板中存在互补序列。在某些情况下，对于合成的与底物结合的单链核酸序列中的任意五个连续碱基，模板中存在互补序列。在某些情况下，对于合成的与底物结合的单链核酸序列中的任意六个连续碱基，模板中存在互补序列。

用于延伸反应的酶

使用可逆终止子的延伸反应可能需要催化域足够大以容纳3’-封端基团的酶。为此可以开发一些改进的DNA聚合酶。例如，逆转录酶(RT)可能具有模板切换“钳制”能力，这是SMART cDNA合成的基础。莫洛尼鼠白血病病毒(M-MLV)RT和人类免疫缺陷病毒1型RT可能只需要两个碱基杂交即可获得这种活性，M-MLV RT可以在引物延伸反应中在双链DNA上掺入可逆终止子。SMART模板切换可能需要在不存在模板的情况下在新合成的cDNA的3’端添加核苷酸，使用锰作为二价离子辅因子来增强其活性。例如，M-MLV逆转录酶，SuperScriptIV和SMARTScribe可以在单链DNA上掺入天然dNTP(图2)。M-MLV RT可掺入可逆终止子。Superscript IV和SMARTScribe或都可以在双链DNA模板上掺入3’-O-叠氮甲基可逆终止子，但可能无法在单链模板上掺入可逆终止子。

图2显示M-MLV逆转录酶(RT)可以在单链DNA上掺入dNTP，并且M-MLV RT能够使用可逆终止子作为底物。在某些情况下，可以修饰M-MLV RT，以掺入可逆终止子。在某些情况下，未经修饰的M-MLV RT可能不像经修饰的M-MLV RT那样高效地掺入3’-O-叠氮甲基dNTP。在某些情况下，M-MLV RT可掺入可逆终止子。图2a显示了用M-MLV-RT延伸的DNA序列的试验。可使用20碱基单链固相寡核苷酸(如图2a(i)所示)或与模板杂交的33碱基引物(如图2a(ii)所示)实现延伸。两个序列都可以使用模板来检测鸟苷的掺入。图2b示出了使用Superscript IV延伸的结果。图2b(i)示出Superscript IV可以在单链DNA上掺入dGTP，但不能掺入3’-O-叠氮基甲基-dGTP。从图2b(i i)可以看出，在图2b(i)相同的反应条件下，双链DNA上的两种核苷酸都可以延伸。符号*表示未延伸的对照物。图2c示出了使用SMARTScribe延伸的结果。图2c(i)显示SMARTScribe可以在单链DNA上掺入dGTP，但不能掺入3’O-叠氮甲基-dGTP。从图2c(ii)可以看出，在图2c(i)相同的反应条件下，双链DNA上的两种核苷酸都可以延伸。符号*表示未延伸的对照物。

在某些情况下，使用了经修饰的9°N^TMDNA聚合酶，该酶能够使用可逆终止子作为新碱基的来源，在固体表面延伸单链引物。在某些情况下，寡核苷酸既充当引物又充当模板。在某些情况下，这种经饰的9°N^TMDNA聚合酶可以称为Duplase(可在加利福尼亚州帕洛阿尔托市的Centrillion Technologies购买)。Duplases可能仅需要两个碱基的杂交进行延伸(图3)。例如，当溶液中核苷酸浓度低至2μM时，Duplase-1(也称为CENT1，参见US20160355541)可以在短至一分钟的反应时间内沿双链DNA底物有效地掺入可逆终止子。单链寡核苷酸的延伸可能需要更长的延伸时间和更高的核苷酸浓度。

如图3a所示，单链DNA的序列特异性延伸可以通过Duplase-3(Duplase的另一个例子)完成。图3a还显示了在与Duplase-3和3’O-叠氮基甲基-dNTP反应中用作引物和模板的四个20个碱基的序列的变性PAGE分析。在这些自为引物的反应中，自为引物的寡核苷酸(SPO)被称为SPO 1-4。通过仅将引物上的最后两个3’碱基杂交，Duplase-3可以用模板化的碱基扩展寡核苷酸。符号*表示未延伸的对照物。如图3b所示，表面结合的寡核苷酸的延伸可以通过分子间反应来完成。如图3b右侧所示，序列为TTTTTTTTTTTTTTTTTTTT(20个碱基)(序列ID号：5)和TTTTTTTCAATTTTTTTTTTTTTTTTTTTTTTTT(30个碱基(序列ID号：6))的寡核苷酸可以固定在磁珠上，可以在同一珠子上使用一种寡核苷酸或两种寡核苷酸。可以通过使PAGE变性来分析样品(参见图3b的左侧)。泳道1和3可以使用右侧(i)所示的珠子。泳道2和4可以使用右侧(ii)所示的珠子。泳道1和2可以是未使用Duplase-3延伸的对照样品。泳道3和4可以使用Duplase-3和Cy5-ddGTP进行延伸。然后，所有样品都可以用末端脱氧核苷酸转移酶(TdT)和荧光素-12-ddUTP进行标记，这样任何没有用Cy5-ddGTP延伸的引物都可以用荧光素进行标记。如变性PAGE凝胶上泳道3所示，Duplase-3可能无法有效延伸20个碱基的多聚T序列。但是，如泳道4所示，当30个碱基的序列TTTTTTTCAATTTTTTTTTTTTTTTTTTTTTT(序列ID号：6)与20个碱基的多聚T寡核苷酸固定在同一表面上时，该20聚体的延伸信号在PAGE凝胶上表现得很强。这可能演示了如何在相邻模板寡核苷酸存在的情况下合成由连接剂连接到载体上的表面结合的寡核苷酸；在生长链合成完成后，模板寡核苷酸可以被切下。

图3显示仅分子间反应就可促进表面结合的寡核苷酸的延伸。多聚T序列不能与其他多聚T序列杂交。当表面结合的寡核苷酸仅为多聚T序列时，延伸可能受限。然而，当第二个模板寡核苷酸也结合到同一表面，使得多聚T序列可以与相邻的第二模板寡核苷酸杂交时，可以实现稳健的延伸。

图4显示了三种Duplase酶保真度的比较分析。图4a示出了在双链底物上的保真度。可以使用图4a所示的两个寡核苷酸序列进行引物延伸反应。较短的序列是引物，较长的序列是固定在底物上的模板。延伸反应完成后，可以从表面结合的模板上剥离已延伸的较短引物链，并对其进行变性PAGE分析。如图4a所示，以dATP、dTTP、dCTP或dGTP为底物，以Duplase-1(如(i))、Duplase-2(如(ii))或Duplase-3(如(iii))为底物，进行腺嘌呤对侧延伸。通过观察变性PAGE凝胶可知，从Duplase-1到Duplase-2保真度降低。符号*表示未延伸的引物对照。图4b示出了使用三个不同的Duplase进行的单链底物的延伸。如图4b所示，可在Duplase-1(如(i))、Duplase-2(如(ii))或Duplase-3(如(iii))存在的情况下，使用表面结合的单链寡核苷酸与溶液中的3’-O-叠氮甲基-dATP、3’-O-叠氮甲基-dTTP、3’-O-叠氮甲基-dCTP或3’-O-叠氮甲基-dGTP进行延伸反应。符号*表示未延伸的引物对照。随着聚合酶保真度的降低，掺入未被相邻链或发夹结构模板化的碱基的能力可能会增强。图4a中传统的引物延伸反应表明，Duplase-1比Duplase-2保真度高，后者又比Duplase-3保真度高。酶保真度的降低增加了错误掺入或错误掺入事件的概率，从而增加了非模板化碱基被添加到短的表面结合的寡核苷酸的机会。酶的性质越混杂，单链引物的反应产物的产率可能越高。Duplase-3可用于单链核酸序列的控制合成。

此外，Duplases可以使用核糖核苷酸作为底物(见图5)，从而合成单链RNA序列。如图5所示，Duplase-3可在单链寡核苷酸上掺入核糖核苷酸。图5示出了在NTP或dNTP存在下用Duplase-3延伸的20碱基单链表面结合寡核苷酸的变性PAGE分析。符号*表示未延伸的对照物。在某些情况下，包括例如各种Duplase在内的聚合酶可以掺入非天然碱基，或掺入与天然糖主链不同的糖主链的核苷酸，修饰的核苷酸(如荧光标记的dNTP或生物素化的dNTP或硫代修饰的dNTP等)。

延伸反应条件

为了使延伸反应起作用，错误掺入可能导致在溶液中添加核苷酸时延伸率增加。例如，反应温度和使用的金属离子可能会有一些影响。例如，锰可以改变聚合酶底物结合口袋的几何形状，从而使其打开，以便与非配对碱基进行聚合。另外，聚合酶的保真度可能是温度敏感的，因为较高的反应温度可以导致较低的保真度和较高的掺入率。Duplase可能是嗜热的，其活性随着反应温度的升高而增加，最高可达75℃左右。

图6显示了使用不同的二价离子可以实现单链寡核苷酸的延伸。单链寡核苷酸的合成反应可以在不同的二价金属存在下进行。对用Duplase-3和dATP、dTTP、dCTP和dGTP进行延伸的20碱基单链表面结合寡核苷酸的变性PAGE分析发现，在使用镁、锰或钴离子作为反应溶液的辅助因子时，可能会出现不同的延伸结果。如图6所示，三种金属都可以实现模板化碱基的延伸。但锰离子可以实现非模板化碱基的延伸。

图7显示，单链寡核苷酸的延伸可在各种温度下实现，包括在约60℃下。延伸反应温度可能会对使用Duplase-3的单链延伸产生影响。对用Duplase-3和dCTP扩展的59个碱基的固相寡核苷酸进行的变性PAGE分析可能表明，不同的反应温度下可能会产生不同的效果。图7a示出了在没有模板的情况下，在约40℃、约50℃、约60℃、约70℃、约80℃、约90℃或约100℃的溶液中进行反应的结果。图7b示出了在3’-磷酸封闭的随机六聚体模板存在的情况下，在约40℃、约50℃、约60℃、约70℃、约80℃、约90℃或约100℃的溶液中进行反应的结果。

单链寡核苷酸可在高达约40℃、约50℃、约60℃、约70℃、约80℃、约90℃或约100℃的温度下延伸，在该温度下它们可杂交两个碱基、三个碱基、四个碱基、五个碱基或六个碱基。单链寡核苷酸可在20℃到80℃(包括20℃和80℃)的温度下延伸。在某些情况下，可以基于以下因素来调节延伸温度：例如，寡核苷酸的稳定性、双链复合物的杂交、固定或附着在载体上的寡核苷酸的稳定性等。

在溶液中使用模板

可以通过添加溶液中模板来增强表面结合的寡核苷酸的延伸。可以对这些溶液中的模板进行3’端修饰，以防止它们在与引物竞争的反应中被聚合酶延长。例如，在本发明的单链核酸延伸反应中，可使用随机六聚体引发。在本文中，随机物是由序列是随机的碱基组成的。反应混合物中每N位置的四种碱基的所有组合都存在。例如，随机六聚体由六个碱基组成，其序列在所有六个位置上都是随机的。

如图8所示，随机六聚体可在Duplase-3和固相结合引物反应中增加模板对应碱基和非模板对应碱基的添加。图8a示出了在反应溶液中加入随机物时固相结合寡核苷酸的延伸。如本文所使用的，随机物是其序列是随机的核酸。变性PAGE分析可显示20碱基寡核苷酸与Duplase-3和3’-O-叠氮甲基-dNTP延伸的结果，延伸反应中未向溶液中添加模板(-T)，或向反应溶液中添加3’-磷酸封闭的随机六聚体(+T)。符号*表示未反应的对照物。图8b示出溶液中不同模板与固相结合的序列的可能杂交配对。使用的模板可以是六聚体。图8c显示，聚合酶需要至少三个碱基与溶液中的模板杂交才能成功扩增引物。在存在或不存在六聚体的情况下，用Duplase-3和Cy5-ddGTP扩展的序列并进行变性PAGE分析。图8c所示的一些序列已列出的3’-磷酸封闭的六聚体可用于反应溶液中。符号*表示未反应的对照物。符号-T表示没有添加模板的反应。在Duplase-3存在的情况下，与可以使3个或更多碱基与序列杂交的模板的反应可能可以使G碱基更好的掺入。用Duplase-3延伸后，所有样品用末端脱氧核苷酸转移酶(TdT)和荧光素-12-ddUTP孵育，以标记任何未用Duplase-3延伸的引物。图8d示出了溶液中不同模板与固相结合寡核苷酸(CACTGAATTCCCTACACGAG(序列ID号:3))可能的杂交配对。使用的模板可以是五聚体。瞬时杂交反应中可能出现的序列排列如图8d所示。图8e示出了图8d所示的固相寡核苷酸在溶液中加入特定、随机和半随机模板后的延伸结果。用Duplase-3和3’-O-azidomethyl-dCTP延伸后，可显示序列CACTGAATTCCCTACACGAG(序列ID号:3)的变性PAGE分析。一些3’-磷酸封闭五聚体可以用在反应溶液中，它们的序列被列出。标志*表示未反应的对照物。符号-T表示没有添加模板的反应。

与单链寡核苷酸的延伸反应类似，溶液中随机模板的反应可以在40℃左右、50℃左右、60℃左右、70℃左右进行(图7b)。

图9显示了溶液中不同长度(6、9、12、15、18、21或混合的6+9碱基)的随机物的反应产率。变性PAGE分析显示了用Duplase-3和3’-O-叠氮甲基-dATP延伸的20碱基固相寡核苷酸与溶液中3’-磷酸封闭的随机模板的结果。符号*表示未延伸的对照物。符号-T表示未添加溶液中模板的对照样品。

当有三个连续的核苷酸与溶液中的靶标杂交，并且与溶液中的寡核苷酸结合的固相引物的3’至少有一个突出(overhang)碱基时，Duplase可以使得生长链链式伸长(图8)。当有2个、3个、4个、5个、6个或7个连续的核苷酸与溶液中的靶标杂交，并且与溶液中的寡核苷酸结合的固相引物的3’至少有一个突出(overhang)碱基时，Duplase可以使得生长链链式伸长(图8)。理论上，五聚体可能存在1024种可能的序列组合。因此，储备能够与任何可能的序列完美杂交并模板化的溶液中模板可能是不切实际的。对于具有固定5’碱基的半随机序列XNNNN，存在四种不同的序列组合，其中X为将要被添加的碱基的模板，N为随机碱基(A，T，C或G)。半随机序列XYNNN具有两个固定的5’碱基，共有16种可能的序列组合，其中X为将要被添加的碱基的模板，Y与固相寡核苷酸的最后一个碱基互补。例如，当固相引物的3’碱基为胞嘧啶时，AGNNN将作为模板使得胸腺嘧啶掺入。半随机序列增加了延伸引物的产量(图8)。半随机序列的例子可能包括，例如，NXYNN或NNXTN。

通用模板寡核苷酸

通用模板寡核苷酸(UTOs)可用于模板化任何碱基，通过循环可逆终止使酶法合成任何序列成为可能。例如，它们可以设计为本文所述的UTO-1或通用碱基，如一个或多个5-硝基吲哚或7-硝基吲哚碱。一种这样的通用碱可能包括5-硝基-1-吲哚-3’-脱氧核糖(5-NI)。然而，可能没有一个通用的碱基能够满足所有的要求；能够与所有天然碱基以同等程度配对，通过DNA聚合酶进行DNA合成，并直接掺入每个天然核苷酸。由于DNA聚合酶与许多通用碱基缺乏氢键结合，因此在与大多数通用碱基相对或在其之后的位置可能不能很好地掺入核苷酸。此外，即使聚合酶可以克服这一障碍并在相对通用碱基的位置掺入核苷酸，聚合酶也不可能在缺乏氢键的位置继续进行DNA合成。连续的内部5-NI碱基不能改善Duplase对序列的延伸。

通用模板寡核苷酸UTO-1(如图10所示)可以包含所有密码子，并且包含作为间隔子的3’和5’端的序列。可以使用尿嘧啶DNA糖基化酶和无嘌呤/无嘧啶内切核酸酶联合酶解3’脱氧尿嘧啶，以分离出任何酶合成的片段。所有的ANN、TNN、CNN和GNN序列都可能包含在UTO-1中，这意味着引物3’端任何2-碱基的组合都可以在重复合成步骤中模板化，以掺入任意A、T、C和G碱基。例如，可以以UTO-1为模板，使用Duplase-3合成20碱基序列的酶合成寡核苷酸-1(ESO-1)。图10还示出了本申请中讨论的用于延伸反应、测序文库制备和序列分析的寡核苷酸序列的示例。对寡核苷酸的修饰(例如5’-生物素化、3’-脱氧尿嘧啶、3’-磷酸盐和硫键)，按照根据IDT公司的订购规范在图10示出。

在合成生长链之后，可以通过其他方式来切割UTO。在某些情况下，UTO酶切会切下酶法合成的寡核苷酸。在某些情况下，UTO切割发生在生长链/杂交复合物的酶合成片段内，从而去除UTO。在某些情况下，UTO切割发生在UTO内部。在一些实施例中，切割发生在UTO的3’-端。在一些实施例中，切割发生在UTO的5’-端。在某些情况下，UTO切割使用光化学裂解。在某些情况下，UTO切割使用酸性或碱性条件来实现。

酶法合成寡核苷酸的方法

可逆终止子可以用一种聚合酶进行酶法纯化，这样的聚合酶可以掺入dNTP，但不能掺入3’-O-叠氮甲基dNTP，如Taq或Klenow聚合酶。可逆终止子裂解后的中和作用也可能阻止下一碱基的合成。

当使用3’-O-叠氮甲基可逆终止子时，TCEP可立即用碘乙酰胺等试剂中和。

通过使用更高浓度的聚合酶或其他酶，可以提高分步效率(图11)。变性PAGE分析显示了在含有1μg Duplase-3、200mM NaCl和20mM Tris-HCl(在pH 8.0时)(如图11a所示)或2μg Duplase-3、80mM NaCl和8mM Tris-HCl(在pH 8.0时)(如图11b所示)的反应中，使用3’-O-叠氮甲基可逆终止子，通过Duplase-3对20碱基寡核苷酸进行延伸的结果。

在加入每个可逆终止子之后，在其去保护之前加入封端步骤，可以提高寡核苷酸的合成产率。实现这一点的一种方法可以是使用双脱氧核苷酸和TdT和/或Duplase进行延伸。在上述条件下，未使用可逆终止子延伸的寡核苷酸可能会被截断，并且可能无法在随后的步骤中延伸。

如果在合成过程中添加的最后一个碱基被修饰为仅选择全长序列，或者如果后续使用需要3’OH，则该封端步骤可以提供一种简单的纯化方法。例如，可以在最后的合成步骤中用生物素化的碱修饰3’端；然后，可以在涂有链霉亲和素的表面捕获全长的寡核苷酸，并且留下截短的寡核苷酸。另一种纯化方法可能涉及使用3’核酸外切酶无法识别的3’基团核苷酸进行合成，从而使用酶促反应去除合成不完全的寡核苷酸。

在某些情况下，其他经过修饰的糖基也可用于生长链的合成。例如，异种核酸(XNA)是天然核酸DNA和RNA的合成替代物，作为储存信息的生物聚合物，其糖链不同。研究中的XNA的类型可包括合成型XNA，例如，1,5-脱水己糖醇核酸(HNA)、环己烯核酸(CeNA)、苏糖核酸(TNA)、乙二醇核酸(GNA)、锁核酸(LNA)和肽核酸(PNA)。荧光标记的核苷酸和其他非天然核苷酸也可能是酶延伸的底物。

工程改造聚合酶可能可以使合成更快、更有效。错误掺入率较高的低保真度聚合酶可能不需要溶液的中的碱基有对应的模板。UTO可能可以进一步缩短，使得它的唯一功能为促进3’端的杂交。如果3’端有杂交，但溶液中的碱基没有对应的模板，而是由低保真度聚合酶添加，则反应时间也可能会缩短。

材料与方法

双链DNA的引物延伸分析

将引物在RB缓冲液(1M氯化钠,2 5mM Tris-HCl pH 7.5,0.01％TWEEN20)中加热至70℃持续5分钟，然后在55℃持续15分钟，然后在25℃持续5分钟后，将其与固定在链霉亲和素包被的磁珠(Dynabeads MyOne Streptavidin T1,Thermo Fisher,Waltham,MA)上的生物素化靶序列杂交。每25μL反应体积使用0.1mg磁珠。通过在选定温度下添加核苷酸开始反应，并通过添加1.6倍体积的RB缓冲液终止反应。在室温条件下，用0.1N氢氧化钠将杂交引物从磁珠结合模板上洗脱10分钟，并通过变性PAGE进行分析。所有寡核苷酸均购自Integrated DNA Technologies(IDT,Redwood City,CA)。其序列如图10所示。

在固体表面制备单链DNA以进行延伸

将单链寡核苷酸固定在链霉亲和素包被的磁珠上。每25μL反应体积用0.1mg磁珠。在选定的温度下加入核苷酸开始反应，加入1.6体积的RB缓冲液终止反应。

引物与Duplase酶的延伸反应

对于双链DNA上的反应，如前所述，用固定化模板和杂交引物制备磁珠。将磁珠在反应缓冲液中洗涤，然后重悬于反应混合物中，该反应混合物含有最终浓度为20mM的Tris-HCl(pH8.8)、10mM硫酸铵、10mM KCl、0.1％Triton X-100、2mM硫酸镁、1mg/mL牛血清白蛋白(Sigma-Aldrich,St.Louis,MO)、4μg/mL聚乙烯吡咯烷酮10和1μg酶。将反应混合物预热至45℃，并添加核苷酸至终浓度为2μM。反应进行一分钟后停止，进行PAGE分析。尽管缓冲液成分、反应时间和温度以及核苷酸浓度在为研究目的而进行的各种实验中存在很大差异，但单链DNA上的延伸反应仍按前面所述进行。下文中介绍了合成20碱基ESO-1序列的最佳条件。

可逆终止子的去保护

掺入可逆终止子后，将磁珠重悬于pH9.0的50mM TCEP(Gold Bio，Olivette，MO)中，并在60℃下孵育10分钟。除去TCEP溶液，并将磁珠重悬于RB缓冲液中，并转移到新的反应容器中。

用UTO-1合成20碱基ESO-1序列

如前所述，用固定化UTO-1制备磁珠。将0.2Mg珠子用于50μL反应中，其中含有200mM NaCl、20mM Tris(pH 8.0)、8mM MnCl2、1μg Duplase-3和100μM 3’-O-叠氮甲基-dNTP。反应持续一小时后停止。通过掺入3’-O-叠氮基甲基-dCTP，然后用TCEP去保护，并掺入3’-O-叠氮基甲基-dGTP，然后用TCEP去保护，来合成序列ESO-1。在第一次合成中，加入4、8、12、16和20个碱基后，从溶液中除去0.025mg的磁珠，从磁珠上洗脱寡核苷酸，并通过变性PAGE进行分析。下一步的数量也做相应调整。在最后的掺入/裂解步骤后，使用带有ESO-1序列的寡核苷酸进行测序。

用MMLV逆转录酶进行延伸反应

本文检测了两种MMLV逆转录酶，Superscript IV(Thermo Fisher)和SMARTScribe(Clonetech，Mountain View，CA)，测试了它们将核苷酸掺入双链和单链寡核苷酸上的能力。用Zeba旋转脱盐柱(Thermo-Fisher)对两种酶进行脱盐，以从酶存储缓冲液中去除2-巯基乙醇。蛋白质在脱盐前后用Qubit(Thermo Fisher)定量，并通过SDS-PAGE分析。对于双链DNA上的反应，如前所述，用固定化模板和杂交引物制备磁珠。将磁珠在反应缓冲液中洗涤，然后重悬于反应混合物中，该反应混合物含有最终浓度为20mM的Tris-HCl(pH8.8)、10mM硫酸铵、10mM KCl、0.1％Triton X-100、4mM MnCl2和3μL脱盐酶。对于Superscript IV，将反应混合物预热至50℃，对于SMARTScribe，将其反应混合物预热至42℃，并添加核苷酸至终浓度为10μM。反应持续两个小时。对于单链DNA上的反应，如前所述制备磁珠并用单链寡核苷酸固定。将磁珠在反应缓冲液中洗涤，然后重悬于22μL反应混合物中，该反应混合物含有最终浓度为20mM的Tris-HCl(pH8.8)、10mM硫酸铵、10mM KCl、0.1％Triton X-100、4mMMnCl2和10μM核苷酸。将Superscript IV的反应混合物预热至50℃，然后加入3μL脱盐酶开始反应。对于SMARTScribe，将反应混合物加热至72℃，并在冰上快速冷却。然后将样品在42℃下孵育，并添加3μL脱盐酶开始反应。反应持续两个小时。

用末端脱氧核苷酸转移酶(TdT)对寡核苷酸进行荧光标记

(可以使用TdT(New England Biolabs,Ipswich,MA)和荧光素-12-ddUTP(PerkinElmer,San Jose,CA)对寡核苷酸进行末端标记，以对不易被SYBR-Gold染色的序列的标记。方法是在20mM Tris HCl(pH7.5)、10mM硫酸铵、10mM KCl、0.1％Triton X-100和0.5mMMnCl2中孵育0.1mg含有5μM核苷酸和20U酶的磁珠。反应在37℃下进行3小时，然后在75℃下酶热失活20分钟。

对含有20碱基合成ESO-1序列的SPO-13进行测序

使用TdT(Roche,Santa Clara,CA)和Duplase-1将仍在磁珠上的SPO-13-ESO-1寡核苷酸聚腺苷酸化。使用PCR将Illumina接头添加到这些序列中，分别用poly(T)-尾P7接头序列，P7-Poly(T)，具有PCR-ESO1-FPCR序列的寡核苷酸与Illumina P5和P7接头进行重复，并使用bioanalyzer和qPCR分析文库的质量。所有寡核苷酸均购自IDT。用90％PhiX和10％PCR制备的4pm库对MiSeq纳米流动池(Illumina)进行簇生成。使用V2试剂盒(Illumina)运行150步配对末端循环，并通过手动排序首次输出序列读取来识别ESO-1序列。

变性PAGE

样品在6％或15％的聚丙烯酰胺TBE-尿素凝胶(Thermo Fisher)中进行电泳分离。凝胶在室温下在SYBR Gold(Thermo-Fisher)中染色5-10分钟，并在Bio-Rad-ChemiDoc-MP系统上成像。染色前后观察荧光产物。

尽管本发明的优选实施例已经在本文中示出和描述，但是对于本领域技术人员来说，显而易见的是，这些实施例仅供示例。在不脱离本发明的情况下，本领域技术人员将对其做出诸多改变和替换。应当理解，在实施本发明时，可以采用本文所描述实施例的各种替代方案。以下权利要求限定了本发明的范围，并包括了在这些权利要求范围内的方法和结构及其等同物。

Claims

1.一种合成单链寡核苷酸的方法，包括:

(a)提供固定在固体表面上的包含游离3’端和5’端的单链引物、聚合酶和核苷酸试剂，其中所述核苷酸试剂带有3’端终止子的可逆终止子核苷酸，并且所述聚合酶是duplase；

(b)使所述单链引物上的杂交位点与模板上的互补片段杂交，其中所述杂交位点在所述3’端且包含不超过7个碱基；

(c)通过所述聚合酶用所述核苷酸试剂从所述游离3’端延伸所述单链引物；以及

(d)从所述互补片段分离所述杂交位点，由此形成固定在所述固体表面上的延伸的单链引物；

其中所述聚合酶需要不超过7个碱基配对来延伸所述单链引物。

2.根据权利要求1的方法，其中所述聚合酶是修饰的duplase。

3.根据权利要求1的方法，还包括：

(e)从所述可逆终止子核苷酸移除所述3’端终止子。

4.根据权利要求3所述的方法，还包括：

(f)重复步骤(a)-(e)。

5.根据权利要求1的方法，其中所述模板是固定在所述固体表面上的所述单链引物、或相邻的单链核酸。

6.根据权利要求5的方法，其中所述模板是所述相邻的单链核酸，并且其中所述相邻的单链核酸与所述单链引物的序列一致性不超过5％、不超过10％、不超过15％、不超过20％、不超过25％、不超过30％、不超过35％、不超过40％、不超过45％、不超过50％、不超过55％、不超过60％、不超过65％、不超过70％、不超过75％、不超过80％、不超过85％、不超过90％、不超过95％或100％。

7.根据权利要求5的方法，其中所述模板是所述相邻的单链核酸，并且其中所述相邻的单链核酸与所述单链引物具有100％的序列一致性。

8.根据权利要求1的方法，其中所述杂交点长度为1、2、3、4、5、6或7个碱基。

9.根据权利要求4的方法，其中(f)中的所述重复从所述游离3’端延伸所述单链引物，从而合成包含所述单链引物的单链核苷酸产物。