WO2024138664A1

WO2024138664A1 - 一种核酸连接酶及其应用

Info

Publication number: WO2024138664A1
Application number: PCT/CN2022/144081
Authority: WO
Inventors: 郭斐; 师虓; 王欧; 章文蔚; 董宇亮
Original assignee: 深圳华大生命科学研究院
Filing date: 2022-12-30
Publication date: 2024-07-04

Abstract

提供了一种核酸连接酶，该核酸连接酶包含与SEQ ID NO：1相比具有至少80％同一性的突变序列，所述突变包括取代、缺失和插入中的至少一种。

Description

一种核酸连接酶及其应用

技术领域

本申请涉及分子生物学技术领域，具体涉及一种核酸连接酶及其应用。

背景技术

核酸连接酶是一类可以催化两个核酸片段(如DNA或者RNA片段)之间形成磷酸二酯键以将两个片段连接的重要的工具酶。核酸连接酶的来源多种多样，其中来源于T4噬菌体的T4核酸连接酶被广泛用于分子克隆等应用中。

根据连接酶催化的核酸底物构象的不同，连接反应包括缺口连接(Nick ligation)、粘性末端连接(Cohesive end ligation)、TA连接(TA ligation)、平末端连接(Blunt end ligation)及分支连接(Branch ligation)，其中TA连接和平末端连接在分子克隆和建库测序中应用较广，但是效率较低，尤其是对于具有末端修饰的核酸底物的催化效率更低。

由此，亟待提供一种具有提高的连接效率的T4核酸连接酶。

发明内容

为了解决现有核酸连接酶存在的连接效率较低的问题，本申请的实施例提供了一种核酸连接酶，其具有较高的连接效率，特别适用于催化具有末端修饰的核酸底物。

本申请第一方面提出了一种核酸连接酶或其生物活性片段，所述核酸连接酶或其生物活性片段包含与SEQ ID NO：1相比具有至少80％、至少85％、至少90％、至少95％、至少96％、至少97％、至少98％或至少99％同一性的突变序列，其中所述突变包括取代、缺失和插入中的至少一种。

在一些实施例中，所述核酸连接酶或其生物活性片段包含与SEQ ID NO：1相比具有至少1个、至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个或至少10个氨基酸突变的突变序列。

在一些实施例中，所述突变序列与SEQ ID NO：1相比具有至少1个氨基酸突变，且所述至少1个氨基酸突变包括在SEQ ID NO：1第159位和/或第164位的突变。在一些实施例中，所述突变为取代。

在一些实施例中，所述在SEQ ID NO：1第159位和/或第164位的突变包括：SEQ ID NO：1第159位的氨基酸被取代为G、H、N、A、V、Q、C、S或T；SEQ ID NO：1第164位的氨基酸被取代为G、H、N、A、V、Q、C、S或T。

在一些实施例中，SEQ ID NO：1第159位的氨基酸被取代为G或H和/或SEQ ID NO：1第164位的氨基酸被取代为G或H。

在一些实施例中，SEQ ID NO：1第159位的氨基酸被取代为G和/或SEQ ID NO：1第164位的氨基酸被取代为H。

在一些实施例中，所述突变序列为SEQ ID NO：3或SEQ ID NO：7所示序列。

在一些实施例中，所述核酸连接酶为T4 DNA连接酶。

本申请第二方面提出了一种多核苷酸，所述多核苷酸编码如本申请第一方面的任一实施例提出的核酸连接酶或其生物活性片段或其互补序列。

本申请第三方面提出了一种载体，所述载体包含如本申请第二方面的实施例提出的多核苷酸。

本申请第四方面提出了一种细胞，所述细胞包含如本申请第一方面的任一实施例提出的核酸连接酶或其生物活性片段或如本申请第二方面的实施例提出的多核苷酸。

本申请第五方面提出了一种试剂盒，所述试剂盒包含以下中的至少一个：如本申请第一方面的任一实施例提出的核酸连接酶或其生物活性片段、如本申请第二方面的实施例提出的多核苷酸、如本申请第三方面的实施例提出的载体和如本申请第四方面的实施例提出的细胞。

本申请第六方面提出了一种试剂盒，所述试剂盒包含如本申请第一方面的任一实施例提出的核酸连接酶或其生物活性片段和反应缓冲液。

本申请第七方面提出了一种如本申请第一方面的任一实施例提出的核酸连接酶或其生物活性片段、如本申请第二方面的实施例提出的多核苷酸、如本申请第三方面的实施例提出的载体、如本申请第四方面的实施例提出的细胞或如本申请第五方面或第六方面的实施例提出的试剂盒在多核苷酸连接中的应用。

本申请第八方面提出了一种连接多核苷酸的方法，包括：将如本申请第一方面的任一实施例提出的核酸连接酶或其生物活性片段与第一核苷酸片段和第二核苷酸片段混合以获得反应混合物；孵育所述反应混合物以使所述第一核苷酸片段的3’端与所述第二核苷酸片段的5’端在所述的核酸连接酶或其生物活性片段的作用下通过磷酸二酯键连接。

在一些实施例中，所述第一核苷酸片段的3’端和所述第二核苷酸片段的5’端独立地包含平末端或粘性末端。在一些实施例中，所述粘性末端为粘性T末端或粘性A末端。

在一些实施例中，所述第一核苷酸片段和/或第二核苷酸片段包含带有修饰的单核苷酸或多核苷酸。在一些实施例中，所述第一核苷酸片段和/或第二核苷酸片段包含带有修饰的单核苷酸。在一些实施例中，所述修饰为取代修饰；在一些实施例中，所述取代修饰为烷基取代修饰。在一些实施例中，所述烷基取代修饰发生于所述单核苷酸或多核苷酸的磷酸基团上，所述烷基优选为甲基。

在一些实施例中，所述带有修饰的单核苷酸或多核苷酸位于所述第一核苷酸片段和所述第二核苷酸片段的平末端或粘性末端。

本申请第九方面提出了一种测序文库制备方法，包括：将如本申请第一方面的任一实施例提出的核酸连接酶或其生物活性片段与待测片段和接头片段混合以获得反应混合物；孵育所述反应混合物以使所述接头片段与所述待测片段在所述核酸连接酶或其生物活性片段的作用下通过磷酸二酯键连接。在一些实施例中，所述待测片段包含带有修饰的单核苷酸或多核苷酸。

在一些实施例中，所述测序文库用于NGS测序或纳米孔测序。

在一些实施例中，所述接头片段包含间隔器序列，且所述间隔器序列选自iSp18、iSpC3或带有修饰的单核苷酸或多核苷酸的至少一种。

在一些实施例中，所述修饰为取代修饰。在一些实施例中，所述取代修饰为烷基取代修饰。在一些实施例中，所述烷基取代修饰发生于所述单核苷酸或多核苷酸的磷酸基团上，所述烷基优选为甲基。

本申请的技术方案实现了如下技术效果：

相较于野生型T4 DNA连接酶，本申请的核酸连接酶在常规核酸片段之间的连接、带有末端修饰的核酸片段之间的连接以及常规核酸片段与带有末端修饰的核酸片段之间的连接上，均显示出较高的催化连接效率。此外，在测序文库构建中，基于本申请的核酸连接酶催化的接头连接效率高，能够获得更多的有效文库；同时基于本申请的核酸连接酶构建的文库在纳米孔测序中表现出更高的有效测序时间。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为根据本申请实施例的纯化蛋白的电泳检测图；

图2为根据本申请实施例的纯化蛋白的电泳检测图；

图3为根据本申请实施例的待测片段与接头Adp的连接产物的电泳检测图；

图4为根据本申请实施例的典型测序电流信号图；

图5为根据本申请实施例的基于T4 DNA连接酶的野生型与突变体构建的测序文库在纳米孔测序时获得的有效测序时间；

图6示出了本申请实施例的α-烷基取代-脱氧核糖核苷酸；

图7为根据本申请实施例的iSpC3的结构图；

图8为根据本申请实施例的iSp18的结构图。

具体实施方式

下面结合具体实施方式对本发明进行进一步的详细描述，给出的实施例仅为了阐明本发明，并非限制本发明的范围。以下提供的实施例可作为本技术领域普通技术人员进行进一步改进的指南，并不以任何方式构成对本发明的限制。

本申请是基于发明人的以下认识做出的：

在相关技术中，来源于T4噬菌体的T4核酸连接酶具有平末端或者TA末端连接活性，是分子克隆、核酸修饰、建库测序中广泛使用的一种酶。在建库测序中，基于平末端或者TA末端的接头连接是建库测序中的关键步骤，其连接效率直接影响了连接反应时间、后续测序结果的覆盖度和效率，尤其对于待测片段较长的测序，基于T4核酸连接酶的接头的连接效率更是测序效率的重要限速步骤之一。

纳米孔(nanopore)测序为近些年新兴起的第三代测序技术，其具有读长长、通量高、成本低和便携性等优势。纳米孔测序是基于电信号识别的测序技术，其中进入纳米孔的不同分子会对离子的流动造成阻碍，这被称为nanopore信号。当待测片段如ssDNA穿过纳米孔时，核苷酸的不同会造成电流阻碍的大小不同。通过检测纳米孔的电流波动信号，并通过计算机深度学习建立模型分析该电流信号，可测定得到穿孔的所测片段的序列。

纳米孔测序技术的建库流程包括与二代测序建库流程中类似的末端修复和末端(3’端)加A尾(dATP尾)的步骤，然后再通过T4连接酶介导的TA连接进行接头连接，其间T4连接酶的连接催化活性对接头连接的速度和效率具有重要影响。

此外，在纳米孔测序中，未施加电势时，通常需要使多核苷酸结合蛋白停滞在靶多核苷酸上，防止多核苷酸结合蛋白沿着靶多核苷酸进一步移动，由此，纳米孔测序中的接头序列除包含常规的核酸分子例如标签序列、拘束序列(tether)外，还包含间隔器序列(spacer)，其可用于停滞多核苷酸结合蛋白，以阻断多核苷酸结合蛋白在测序前的进一步解旋。

通常情况下会采用含有iSp18或iSpC3等无碱基基团的间隔器序列来停滞多核苷酸结合蛋白。除iSp18或iSpC3外，其它一些带有碱基修饰的核苷酸也可以行使间隔器序列的作用，如在α磷酸上进行烷基取代的脱氧核糖核苷酸(如图6所示)。可以使用T4连接酶将这种包含带有修饰核苷酸的序列(例如接头序列)与核酸片段(例如待测片段)连接，并用于制备测序文库。在这一步骤中，T4核酸连接酶同样对连接速度和效率具有重要影响。

本申请发明人通过对T4 DNA连接酶进行大量蛋白质结构分析和突变体理性设计，针对反应活性中心氨基酸残基进行位阻调控和电荷调控，利用蛋白工程手段构建和制备了大量T4 DNA连接酶的突变体，并对这些突变体进行了大量的性能实验以进行进一步筛选。经由大量筛选和实验，发明人惊喜地发现，相较于野生型T4 DNA连接酶，本申请实施例中提出的T4 DNA连接酶突变体对核酸片段间连接的连接效率均有提升，包括不带有修饰的常规核酸片段间的连接、常规核酸片段与带有修饰的核酸片段间的连接、带有修饰的核酸片段间的连接等，同时对纳米孔测序的效率也有较强的提升作用。

本申请实施例中，术语“核酸连接酶”是指催化DNA或RNA片段通过磷酸二酯键连接的工具酶。在一些实施例中，“核酸连接酶”为DNA连接酶。在另一些实施例中，“核酸连接酶”为RNA连接酶，具体可以为T4 DNA连接酶或T4 RNA连接酶。在本申请中，“T4连接酶”可以为T4 DNA连接酶或T4 RNA连接酶。

本申请实施例中，术语“生物活性片段”是指T4 DNA连接酶突变体的任何片段、衍生物、同源物或类似物，其具有生物分子特有的体内或体外活性；包括例如连接酶活性，或经由连接修复带切口DNA中存在的错配。在一些实施例中，突变型T4 DNA连接酶的生物活性片段、衍生物、同源物或类似物在任何感兴趣的体内或体外测定中均具有突变型T4 DNA连接酶的任何程度的生物活性。

在一些实施例中，生物活性片段可以任选地包括突变型T4 DNA连接酶的任何数量的连续氨基酸残基。本申请实施例还包括编码任何这种生物活性片段的多核苷酸。

本申请实施例中，“天然存在”或“野生型”是指在自然界中发现的形式。例如，天然存在或野生型多肽或多核苷酸序列是存在于生物体中的序列，其没有被人为操作有意修饰。“突变体”意指相对于天然或野生型氨基酸序列，其具有至少一个氨基酸的改变。在一些实施例中，所述改变(突变)包括取代、缺失和插入中的至少一种。

本申请实施例中，关于核酸或多肽序列的术语“同一性百分比”定义为在排列序列以获得最大同一性百分比并引入缺口(如果需要)以实现最大同源性百分比之后，候选序列中与已知多肽相同的核苷酸或氨基酸残基的百分比。N-末端或C-末端插入或缺失不应被解释为影响同源性。核苷酸或氨基酸序列水平上的同源性或同一性可以通过BLAST(基本局部比对搜索工具，Basic Local Alignment Search Tool)分析来确定，所述分析使用由程序blastp、blastn、blastx、tblastn和tblastx采用的算法(Altschul(1997),Nucleic Acids Res[核酸研究].25,3389-3402和Karlin(1990),Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]87,2264-2268)，所述程序是为序列相似性搜索定制的。

本申请实施例提出的核酸连接酶或其生物活性片段可以包含与SEQ ID NO：1相比具有至少80％、至少85％、至少90％、91％、92％、93％、94％、95％、96％、97％、98％或至少99％、99.1％、99.2％、99.3％、99.4％、99.5％、99.6％、99.7％、99.8％、99.9％、99.91％、99.92％、99.93％、99.94％、99.95％、99.96％、99.97％、99.98％、99.99％但小于100％同一性的序列，其中该序列与SEQ ID NO：1相比具有一个或多个氨基酸突变。

具体地，本申请第一方面提出的核酸连接酶或其生物活性片段包含与SEQ ID NO：1相比具有至少80％、至少85％、至少90％、至少95％、至少96％、至少97％、至少98％或至少99％同一性的突变序列，其中所述突变包括取代、缺失和插入中的至少一种。

在一些实施例中，该核酸连接酶或其生物活性片段包含与SEQ ID NO：1相比具有至少1个、至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个或至少10个氨基酸突变的突变序列。本申请实施例中，如无特殊说明，除指出的突变外，核酸连接酶或其生物活性片段的突变片段的其余氨基酸与SEQ ID NO：1相同。

在一些实施例中，所述突变序列与SEQ ID NO：1相比具有至少1个氨基酸突变，且至少1个氨基酸突变包括在SEQ ID NO：1第159位的突变。在另一些实施例中，至少1个氨基酸突变包括在SEQ ID NO：1第164位的突变。在另一些实施例中，至少1个氨基酸突变包括在SEQ ID NO：1第159位和第164位的突变。在一些实施例中，突变序列在SEQ ID NO：1第159位和/或第164位的突变形式为取代。

在一些实施例中，突变序列在SEQ ID NO：1第159位和/或第164位的突变形式可以为：SEQ ID NO：1第159位的氨基酸K被取代为G、H、N、A、V、Q、C、S或T，和/或SEQ ID NO：1第164位的氨基酸R被取代为G、H、N、A、V、Q、C、S或T。可以理解的是，突变序列可以具有上述任一种单点取代形式或其组合，例如K159G、K159H、K159N、K159A、K159V、K159Q、K159C、K159S、K159T、R164G、R164H、R164N、K164A、K164V、K164Q、K164C、K164S、K164T或其任意组合，例如K159G-R164G、K159G-R164H、K159G-R164N、K159H-R164G、K159H-R164H、K159H-R164N、K159N-R164G、K159N-R164H或K159N-R164N等等。

在一些实施例中，突变序列为SEQ ID NO：3-9中的任一序列。在一些实施例中，SEQ ID NO：1第159位的氨基酸K被取代为G，和/或SEQ ID NO：1第164位的氨基酸R被取代为H，即具有K159G、R164H或K159G-R164H的突变形式，其对应的氨基酸序列分别为SEQ ID NO：3、SEQ ID NO：7、SEQ ID NO：9。在一些实施例中，突变序列为SEQ ID NO：3或SEQ ID NO：7所示序列。

本申请实施例还涉及一种编码上述任一实施例中的突变型的核酸连接酶或其生物活性片段或其互补序列的多核苷酸、包含该多核苷酸的载体或表达上述任一实施例中的突变型的核酸连接酶或其生物活性片段的细胞，和一种试剂盒，该试剂盒包含上述任一实施例中的突变型的核酸连接酶或其生物活性片段、编码上述任一实施例中的突变型的核酸连接酶或其生物活性片段或其互补序列的多核苷酸、包含该多核苷酸的载体或表达上述任一实施例中的突变型的核酸连接酶或其生物活性片段的细胞中的任一或其组合。本申请实施例还提出一种试剂盒，该试剂盒包含上述任一实施例中的突变型的核酸连接酶或其生物活性片段和反应缓冲液。可以理解的是，只要保证该反应缓冲液能够为所述突变型连接酶或其生物活性片段提供反应背景即可，本申请对反应缓冲液的类型不作限制。

本申请实施例中提出的突变型的核酸连接酶或其生物活性片段，其相对于野生型(SEQ ID NO：1)，其催化核酸片段底物的催化连接效率提高。当底物包含末端修饰的核苷酸时，相对于野生型(SEQ ID NO：1)，本申请实施例中提出的突变型的核酸连接酶或其生物活性片段同样显示出高效的催化连接能力。

本申请第二方面提出一种上述任一实施例提出的核酸连接酶或其生物活性片段、多核苷酸、载体、细胞或试剂盒在多核苷酸连接中的应用。

本申请第三方面提出一种连接多核苷酸的方法，包括：将上述任一实施例提出的核酸连接酶或其生物活性片段与第一核苷酸片段和第二核苷酸片段混合以获得反应混合物；孵育该反应混合物以使第一核苷酸片段的3’端与第二核苷酸片段的5’端在该核酸连接酶或其生物活性片段的作用下通过磷酸二酯键连接。可以理解的是，第一核苷酸片段与第二核苷酸片段在上述任一实施例中的核酸连接酶或其生物活性片段的催化下形成磷酸二酯键并实现二者的连接。在本申请实施例中，第一核苷酸片段可以为DNA片段或RNA片段，第二核苷酸片段可以为DNA片段或RNA片段。

在一些实施例中，第一核苷酸片段的3’端和第二核苷酸片段的5’端独立地包含平末端或粘性末端。可以理解的是，本申请实施例提出的T4 DNA连接酶突变体可以介导第一核苷酸片段的平末端和第二核苷酸片段的平末端之间的连接，也可以介导催化第一核苷酸片段和第二核苷酸片段的粘性互补末端之间的连接。在一些实施例中，粘性互补末端为粘性T末端和粘性A末端。本申请实施例提出的突变型核酸连接酶或其生物活性片段在核苷酸片段的平末端连接及粘性末端连接中均显示出较高的催化连接效率。

在一些实施例中，第一核苷酸片段和/或第二核苷酸片段可以包含带有修饰的单核苷酸或多核苷酸。“修饰”是指基于核苷酸的基本结构，在其磷酸基团、五碳糖部分或碱基部分存在修饰基团。在一些实施例中，修饰可以为取代修饰，即在核苷酸中存在原子或原子基团的取代等，例如由碳原子、氧原子、氮原子、硫原子、烷基、羟基、氨基、羧基、磷酸基等替换原核苷酸中的原子或基团等。在一些实施例中，所述修饰可以为烷基取代修饰。在一些实施例中，所述烷基取代修饰可以发生于单核苷酸或多核苷酸的磷酸基团上。在一些实施例中，所述烷基可以为甲基、乙基、丙基、丁基等，其修饰产物为α-烷基取代-(脱氧)核糖核苷酸。图6示出了本申请实施例中脱氧核糖核苷酸的一种具体的修饰结构，其中R代表烷基，base(碱基)可以为A、T、C或G。

在一些实施例中，带有修饰的单核苷酸或多核苷酸可以位于第一核苷酸片段和第二核苷酸片段中间部分，或位于平末端或粘性末端。在一些实施例中，第一核苷酸片段和/或第二核苷酸片段包含带有修饰的单核苷酸。本申请实施例提出的突变型核酸连接酶或其生物活性片段在带有修饰的核苷酸片段的平末端连接及粘性末端连接中均显示出较高的催化连接效率。

具体地，本申请第一方面任一实施例提出的突变型核酸连接酶或其生物活性片段可以用于核酸片段间的连接，例如在分子克隆中，可以用于载体和插入序列间的连接；在修饰引入中，可以用于带有修饰的核苷酸片段与其它片段之间的连接，其中其它片段可以为带有修饰的核苷酸片段或不带有修饰的常规核苷酸片段；在测序文库构建中，可以用于待测片段与接头间的连接。

本申请第四方面提出一种测序文库制备方法，包括：将上述任一实施例提出的核酸连接酶或其生物活性片段与待测片段和接头片段混合以获得反应混合物；孵育所述反应混合物以使所述接头片段与所述待测片段在所述核酸连接酶或其生物活性片段的作用下通过磷酸二酯键连接。

在一些实施例中，所述待测片段包含带有修饰的单核苷酸或多核苷酸。

在一些实施例中，根据本申请第四方面任一实施例提出的测序文库制备方法所制备的测序文库可以用于下一代测序(NGS)或纳米孔测序。在纳米孔测序中，可以使用本申请实施例提出的突变型核酸连接酶或其生物活性片段将待测序列与带有修饰片段的接头片段连接，其中接头片段中的修饰片段可以为单核苷酸或多核苷酸，并且作为间隔器序列。相较于野生型，本申请实施例中提出的突变型核酸连接酶或其生物活性片段所制备的测序文库具有更高的有效文库含量，且在纳米孔测序中显著提升了有效测序时间。

下述实施例中的实验方法，如无特殊说明，均为常规方法，按照本领域内的文献所描述的技术或条件或者按照产品说明书进行。下述实施例中所用的材料、试剂等，如无特殊说明，均可从商业途径得到。

如无特殊说明，以下实施例中的定量试验，均设置三次重复实验，结果取平均值。

实施例一：野生型T4 DNA连接酶(T4L-WT)的制备

1.1野生型T4 DNA连接酶(T4L-WT)的克隆和表达

野生型T4 DNA连接酶(T4L-WT)的氨基酸序列如SEQ ID NO：1所示，其编码区序列如SEQ ID NO：2所示。合成SEQ ID NO：2所示的DNA序列(委托六合华大合成，以下涉及DNA序列合成均如此操作，不再累述)，基于双酶切位点NdeI和XhoI，采用常规方法将该序列插入到PET-28a(+)质粒中，对应表达的T4L-WT蛋白N端具有6×His-tag标签和thrombin(凝血酶)酶切位点。

T4L-WT氨基酸序列：

T4L-WT编码区序列：

将连接好的PET-28a(+)-T4L-WT质粒转化入大肠杆菌表达菌BL21(DE3)中。将转化产物涂布在含卡纳霉素抗性的固体LB培养基中，37℃过夜培养。次日，挑取单菌落，将其接入5mL含有卡纳霉素抗性的LB液体培养基中，37℃震荡培养过夜。接着，取10μL过夜培养的菌液，将其转接入1L的LB液体培养基中，37℃震荡培养至OD ₆₀₀＝0.6至0.8，然后加入终浓度为500μM的IPTG，16℃过夜培养以诱导蛋白表达。

1.2纯化

配制下方溶液：

Buffer A:20mM Tris-HCl pH 7.5,250mM NaCl,20mM咪唑

Buffer B:20mM Tris-HCl pH 7.5,250mM NaCl,300mM咪唑

Buffer C:20mM Tris-HCl pH 7.5,50mM NaCl

Buffer D:20mM Tris-HCl pH 7.5,100mM NaCl

收集步骤1.1中IPTG诱导后的菌体，使用Buffer A重悬菌体，用细胞破碎仪破碎菌体，离心后取上清。将所得上清与预先用Buffer A平衡好的Ni-NTA填料混合，结合1h。收集填料，用Buffer A清洗填料，直至没有杂蛋白被洗出。然后在填料中加入Buffer B以洗脱T4L-WT。将洗脱得到的T4L-WT蛋白过预先用Buffer C平衡好的脱盐柱，使用Buffer C进行脱盐，然后加入凝血酶(翌圣生物，20402ES05)，4℃酶切过夜。次日，将酶切后的蛋白液上分子筛Superdex 200(Sigma，GE28-9909-44)进行纯化，其中所用分子筛buffer为Buffer D。收集目的蛋白峰，并用10kD超滤管(Millipore MRCPRT010)进行浓缩，然后-80℃冻存备用。使用SDS-PAGE(十二烷基硫酸钠聚丙烯酰胺凝胶电泳，sodium dodecyl sulfate polyacrylamide gel electrophoresis)对纯化浓缩后的蛋白进行检测。

检测结果如图1所示，其中，泳道2为纯化后的T4L-WT蛋白。由图1可见，经过纯化步骤，本实施例制备得到大量高纯度的T4L-WT蛋白。

实施例二：T4 DNA连接酶突变体的制备和纯化

本实施例中的T4 DNA连接酶突变体的具体突变位点和氨基酸序列如表1所示。

表1

注：以T4L-Mut1(即突变体1)为例，其在SEQ ID NO：1所示序列的基础上，SEQ ID NO：1的第159位的K被取代为G，其余位点与SEQ ID NO：1相同；T4L-Mut2至T4L-Mut6同理。T4L-Mut7 在SEQ ID NO：1所示序列的基础上，SEQ ID NO：1的第159位的K被取代为G，并且第164位的R被取代为G，其余位点与SEQ ID NO：1相同。

T4L-Mut1氨基酸序列：

T4L-Mut2氨基酸序列：

T4L-Mut3氨基酸序列：

T4L-Mut4氨基酸序列：

T4L-Mut5氨基酸序列：

T4L-Mut6氨基酸序列：

T4L-Mut7氨基酸序列：

对表1中的T4 DNA连接酶突变体对应的编码其相应氨基酸序列的DNA进行序列合成，然后按照实施例一步骤1.1将这些突变体的DNA序列插入PET-28a(+)质粒中并分别表达，然后按照实施例一步骤1.2对表达的蛋白分别进行纯化。

结果如图2所示。其中，泳道1-7分别为T4L-Mut1至T4L-Mut7的纯化蛋白的电泳图。由图2可见，经过纯化步骤，本实施例制备得到大量与T4L-WT蛋白纯化效果相当的高纯度的突变体蛋白。

实施例三：接头的制备

合成SEQ ID NO：10和SEQ ID NO：11所示序列，并取浓度均为20μM的SEQ ID NO：10和SEQ ID NO：11所示序列各30μL混合，混匀后置于PCR仪中，70℃孵育10分钟，随后按照0.1℃/s的降温速度降至25℃后继续孵育半小时，得到10μM的接头溶液，将接头命名为Adp。

SEQ ID NO：10：

5’-XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXTTTTTTTTTTYYYYGGTTGTTTCTGTTGGTGCTGATATTGCT-3’(X＝iSpC3，其结构如图7所示；Y＝iSp18，其结构如图8所示)

SEQ ID NO：11：

5’pho-GCAATATCAGCACCAACAGAAACAACCTTTGAGGCGAGCGGTCAA-3’

实施例四：待测片段的制备

4.1质粒的大量提取

将空载pUC57质粒转化进DH5alpha(Vazyme Biotech，C502-02)感受态细菌中，并大量培养。使用质粒提取试剂盒(天根，DP117)提取DH5alpha中的空载pUC57质粒。使用Qubit dsDNA BR试剂盒(Thermofisher,Q32853)对提取后的质粒进行浓度测定。

4.2酶切

使用HindIII(NEB，R0104L)和EcoRI(NEB，R0101L)酶对步骤4.1所得的质粒进行酶切，具体酶切反应体系如表2所示。

表2

4.3纯化

使用Ampure XP磁珠(Beckman Coulter，A63882)对酶切产物进行纯化，具体步骤如下：

向上述酶切体系中加入50μL室温平衡后的磁珠，振荡混匀并短暂离心后室温静置10分钟。将反应体系置于磁力架上10分钟后移除上清。使用200μL 75％乙醇溶液洗涤磁珠两次。洗涤后，移除上清，打开管盖，待磁珠干燥后加入22μL TE缓冲液(pH＝8)将磁珠重悬，置于室温静置10分钟。将离心管放置于磁力架上，待液体澄清后，将上清液转移至新的离心管中，得到纯化后的长度接近2Kb的酶切产物(即待测片段)，其序列如SEQ ID NO：12所示。

待测片段DNA序列：

实施例五：末端加A尾

5.1末端修复、末端加A尾和磷酸化

采用普通无修饰的dATP和α甲基磷酸修饰的dATP(Me-dATP)，对实施例四所得的长为近2Kb的待测片段进行末端修复、加A尾和5’端磷酸化，反应体系如表3所示，反应程序如表4所示。

表3

表4

温度	时间
37℃	30min
72℃	30min

经此步骤，待测片段完成了末端修复、末端加A尾和磷酸化处理，即获得以下两组产物：①待测片段的3’末端添加了一个dATP且5’端磷酸化，②待测片段的3’末端添加了一个Me-dATP且5’端磷酸化。

5.2产物的纯化

使用Ampure XP磁珠(Beckman Coulter，A63882)对步骤5.1获得的两组产物进行纯化，具体步骤如下：

向步骤5.1的末端修复体系中加入50μL室温平衡后的磁珠，振荡混匀并短暂离心后室温静置10分钟。将反应体系置于磁力架上10分钟后移除上清。使用200μL 75％乙醇溶液洗涤磁珠两次。洗涤后，移除上清，打开管盖，待磁珠干燥后加入21μL分子级水将磁珠重悬，置于室温静置10分钟。将离心管放置于磁力架上，待液体澄清后，将上清液转移至新的离心管中，得到纯化后的产物。取1μL纯化产物，使用Qubit dsDNA HS试剂盒(Thermofisher，Q32854)进行定量，剩余产物进行下一步反应。

实施例六：待测片段与接头Adp的连接反应

6.1待测片段与接头Adp的连接

按表5所示配制连接反应液A，并基于该反应液配置如表6所示的连接反应体系A，以在T4 DNA连接酶野生型(T4L-WT)或突变体(T4L-Mut1-7)的作用下，将步骤5.2获得的待测片段与接头Adp进行连接，连接条件为25℃，10分钟。

表5

表6

6.2连接产物的纯化

使用Ampure XP磁珠(Beckman Coulter，A63882)对步骤6.1获得的连接产物进行纯化，具体步骤如下：

向步骤6.1的连接体系中加入60μL室温平衡后的磁珠，振荡混匀并短暂离心后室温静置10分钟。将反应体系置于磁力架上10分钟后移除上清。使用200μL 75％乙醇溶液洗涤磁珠两次。洗涤后，移除上清，打开管盖，待磁珠干燥后加入22μL TE缓冲液(pH＝8)将磁珠重悬，置于室温静置10分钟。将离心管放置于磁力架上，待液体澄清后，将上清液转移至新的离心管中，得到纯化后的待测片段1与Adp的连接产物。

6.3连接产物的检测

使用非变性聚丙烯酰胺凝胶电泳(PAGE)对6.2所得的纯化后的连接产物进行检测，检测结果如图3所示。由图3可见，在待测片段的末端加上常规dATP的情况下，与T4L-WT(泳道2)相比，T4L-Mut1(泳道3)和T4L-Mut5(泳道7)在加常规A尾的连接反应中显示出更高的连接效率，即通过T4L-Mut1和T4L-Mut5的催化作用，得到了更多的连接产物，并且所剩底物更少。同时，待测片段的末端加上带有修饰的Me-dATP的情况下，与T4L-WT(泳道2)相比，T4L-Mut1(泳道3)和T4L-Mut5(泳道7)这两个突变体的催化连接效率也略高，即通过T4L-Mut1和T4L-Mut5的作用，同样得到了更多的连接产物，并且所剩底物更少。这说明本申请实施例提出的T4 DNA连接酶突变体与野生型相比，催化接头与待测片段的连接反应的效率提高。

实施例七：解旋酶Dda的克隆、表达和纯化

本实施例通过在大肠杆菌中重组表达以制备解旋酶Dda，该解旋酶用作马达蛋白。解旋酶Dda的氨基酸序列如SEQ ID NO：13所示；其编码区序列如SEQ ID NO：14所示。

解旋酶Dda的氨基酸序列：

解旋酶Dda的编码区序列：

具体实验步骤如下。

7.1解旋酶Dda的克隆和表达

合成SEQ ID NO：14所示的DNA序列，基于双酶切位点NdeI和XhoI，将该序列插入到PET-28a(+)质粒中，对应表达的解旋酶Dda蛋白N端具有6×His-tag标签和thrombin酶切位点。

将连接好的PET-28a(+)-Dda质粒转化入Arctic Express(DE3)感受态细菌(Tolo Biotech，96183-02)中。将转化产物涂布在含卡纳霉素抗性的固体LB培养基中，37℃过夜培养。次日，挑取单菌落，将其接入5mL含有卡纳霉素抗性的LB液体培养基中，37℃震荡培养过夜。接着，取10μL过夜培养的菌液，将其转接入1L的LB液体培养基中，37℃震荡培养至OD ₆₀₀＝0.6至0.8，然后加入终浓度为500μM的IPTG，16℃过夜培养以诱导Dda蛋白表达。

7.2纯化

配制下方溶液：

缓冲液E:20mM Tris-HCl pH 7.5,100mM NaCl

收集步骤7.1中IPTG诱导后的菌体，使用实施例一的1.2步骤中配置的Buffer A重悬菌体，用细胞破碎仪破碎菌体，离心后取上清。将所得上清与预先用Buffer A平衡好的Ni-NTA填料混合，结合1h。收集填料，用Buffer A清洗填料，直至没有杂蛋白被洗出。然后在填料中加入Buffer B以洗脱Dda。将洗脱得到的Dda蛋白过预先用Buffer C平衡好的脱盐柱，使用Buffer C进行脱盐，然后加入凝血酶(翌圣生物，20402ES05)，加入到预先用Buffer C平衡好的ssDNA纤维素(Sigma,D8273-10G)填料中，4℃酶切过夜。次日，收集ssDNA纤维素填料，用Buffer C洗3-4次后用Buffer D洗脱纯化后的蛋白。将纯化后的Dda蛋白液上分子筛Superdex 200(Sigma，GE28-9909-44)，其中所用分子筛buffer为Buffer E。收集目的蛋白峰，并浓缩，以获得纯化后的解旋酶Dda。

实施例八：测序文库与马达蛋白的结合

本实施例通过将实施例六中所得的纯化后的连接产物(即测序文库)与实施例七中的解旋酶Dda孵育，制备用于纳米孔测序的结合物。具体实验步骤如下。

配制2×结合缓冲液：将100mL 1M Tris-HCL(pH＝7.5)与100mL 1M KCl溶液混合，然后加入超纯水定容至1L。按照表7在冰上配制解旋酶Dda及连接产物的结合体系，随后30℃孵育一小时。

表7

使用Qubit DNA HS试剂盒对结合产物进行浓度测定。

实施例九：纳米孔测序

本实施例构建基于膜片钳平台的纳米孔测序平台，对实施例八获得的测序文库与马达蛋白结合产物进行纳米孔测序，以验证本公开实施例通过T4 DNA连接酶突变体所构建的测序文库在纳米孔测序中的表现。

参考文献(耿佳,郭培宣，“噬菌体phi29DNA包装马达磷脂膜嵌合体在单分子检测及纳米医学领域的应用”.生命科学,2011,23(11):1114-1129)中公开的单通道电生理检测系统，搭建基于膜片钳平台的纳米孔检测平台，将孔蛋白(Sigma-Aldrich,H9395-5mg)插入磷脂双分子层膜上，形成单通道纳米孔。

将实施例八中获得的结合产物加入到该单通道纳米孔体系中，通过膜片钳体系检测并记录电流振幅变化。待测片段(SEQ ID NO：12)的典型测序电流信号图如图4所示。

对测序结果进行统计分析，通过统计每个小时中，所有测序信号累加的总时长，可以判断测序文库样品中的有效文库的含量。图5示出了本实施例基于T4 DNA连接酶的野生型与突变体构建的测序文库在纳米孔测序时获得的有效测序时间。由图5可见，相较于野生型T4L-WT，由T4L-Mut1催化的连接反应在纳米孔测序中显示出更高的有效测序时间，说明经本申请实施例的T4 DNA连接酶突变体催化的连接反应得到了更多的有效文库，证明了与野生型相比，本申请实施例提出的T4 DNA连接酶突变体具有更高的催化连接效率，并且该突变体能够有效提升了纳米孔测序中有效文库的含量，显著提升了有效测序时间。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外，在不相互矛盾的情况下，本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

尽管上面已经示出和描述了本发明的实施例，可以理解的是，上述实施例是示例性的，不能理解为对本发明的限制，本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims

一种核酸连接酶或其生物活性片段，所述核酸连接酶或其生物活性片段包含与SEQ ID NO：1相比具有至少80％、至少85％、至少90％、至少95％、至少96％、至少97％、至少98％或至少99％同一性的突变序列，其中所述突变包括取代、缺失和插入中的至少一种。
根据权利要求1所述的核酸连接酶或其生物活性片段，所述核酸连接酶或其生物活性片段包含与SEQ ID NO：1相比具有至少1个、至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个或至少10个氨基酸突变的突变序列。
根据权利要求1或2所述的核酸连接酶或其生物活性片段，所述突变序列与SEQ ID NO：1相比具有至少1个氨基酸突变，且所述至少1个氨基酸突变包括在SEQ ID NO：1第159位和/或第164位的突变，

优选地，所述突变为取代。
根据权利要求3所述的核酸连接酶或其生物活性片段，所述在SEQ ID NO：1第159位和/或第164位的突变包括：

SEQ ID NO：1第159位的氨基酸被取代为G、H、N、A、V、Q、C、S或T，

SEQ ID NO：1第164位的氨基酸被取代为G、H、N、A、V、Q、C、S或T。
根据权利要求1至4中任一项所述的核酸连接酶或其生物活性片段，SEQ ID NO：1第159位的氨基酸被取代为G或H，和/或SEQ ID NO：1第164位的氨基酸被取代为G或H，

优选地，SEQ ID NO：1第159位的氨基酸被取代为G，和/或SEQ ID NO：1第164位的氨基酸被取代为H。
根据权利要求5所述的核酸连接酶或其生物活性片段，所述突变序列为SEQ ID NO：3或SEQ ID NO：7所示序列。
根据权利要求1至6中任一项所述的核酸连接酶或其生物活性片段，其中所述核酸连接酶为T4 DNA连接酶。
一种多核苷酸，所述多核苷酸编码如权利要求1至7中任一项所述的核酸连接酶或其生物活性片段或其互补序列。
一种载体，所述载体包含如权利要求8所述的多核苷酸。
一种细胞，所述细胞包含如权利要求8所述的多核苷酸或表达如权利要求1至7中任一项所述的核酸连接酶或其生物活性片段。
一种试剂盒，包含以下中的至少一个：如权利要求1至7中任一项所述的核酸连接酶或其生物活性片段、如权利要求8所述的多核苷酸、如权利要求9所述的载体和如权利要求10所述的细胞。
一种试剂盒，所述试剂盒包含如权利要求1至7中任一项所述的核酸连接酶或其生物活性片段和反应缓冲液。
权利要求1至7中任一项所述的核酸连接酶或其生物活性片段、权利要求8所述的多核苷酸、权利要求9所述的载体、权利要求10所述的细胞或权利要求11或12所述的试剂盒在多核苷酸连接中的应用。
一种连接多核苷酸的方法，包括：

将权利要求1至7中任一项所述的核酸连接酶或其生物活性片段与第一核苷酸片段和第二核苷酸片段混合以获得反应混合物；

孵育所述反应混合物以使所述第一核苷酸片段的3’端与所述第二核苷酸片段的5’端在所述核酸连接酶或其生物活性片段的作用下通过磷酸二酯键连接，

可选地，所述第一核苷酸片段的3’端和所述第二核苷酸片段的5’端独立地包含平末端或粘性末端，优选地，所述粘性末端为粘性T末端或粘性A末端。
根据权利要求14所述的方法，所述第一核苷酸片段和/或第二核苷酸片段包含带有修饰的单核苷酸或多核苷酸，

优选地，所述第一核苷酸片段和/或第二核苷酸片段包含带有修饰的单核苷酸，

任选地，所述修饰为取代修饰，可选地，所述取代修饰为烷基取代修饰，

优选地，所述烷基取代修饰发生于所述单核苷酸或多核苷酸的磷酸基团上，所述烷基优选为甲基。
根据权利要求14或15所述的方法，所述带有修饰的单核苷酸或多核苷酸位于所述第一核苷酸片段和/或所述第二核苷酸片段的平末端或粘性末端。
一种测序文库制备方法，包括：

将权利要求1至7中任一项所述的核酸连接酶或其生物活性片段与待测片段和接头片段混合以获得反应混合物；

孵育所述反应混合物以使所述接头片段与所述待测片段在所述核酸连接酶或其生物活性片段的作用下通过磷酸二酯键连接，

可选地，所述待测片段包含带有修饰的单核苷酸或多核苷酸。
根据权利要求17所述的方法，所述测序文库用于NGS测序或纳米孔测序。
根据权利要求18所述的方法，所述接头片段包含间隔器序列，且所述间隔器序列选自iSp18、iSpC3或带有修饰的单核苷酸或多核苷酸的至少一种。
根据权利要求19所述的方法，所述修饰为取代修饰，优选地，所述取代修饰为烷基取代修饰，

优选地，所述烷基取代修饰发生于所述单核苷酸或多核苷酸的磷酸基团上，所述烷基优选为甲基。