CN108779442B - 多种连接酶的组合物、系统以及方法 - Google Patents

多种连接酶的组合物、系统以及方法 Download PDF

Info

Publication number
CN108779442B
CN108779442B CN201780015885.4A CN201780015885A CN108779442B CN 108779442 B CN108779442 B CN 108779442B CN 201780015885 A CN201780015885 A CN 201780015885A CN 108779442 B CN108779442 B CN 108779442B
Authority
CN
China
Prior art keywords
ligase
atp
dependent
adsnas
acid sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201780015885.4A
Other languages
English (en)
Other versions
CN108779442A (zh
Inventor
郑钰
洪曼青
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Rgene Inc
Original Assignee
Rgene Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Rgene Inc filed Critical Rgene Inc
Publication of CN108779442A publication Critical patent/CN108779442A/zh
Application granted granted Critical
Publication of CN108779442B publication Critical patent/CN108779442B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/93Ligases (6)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y605/00Ligases forming phosphoric ester bonds (6.5)
    • C12Y605/01Ligases forming phosphoric ester bonds (6.5) forming phosphoric ester bonds (6.5.1)
    • C12Y605/01001DNA ligase (ATP) (6.5.1.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y605/00Ligases forming phosphoric ester bonds (6.5)
    • C12Y605/01Ligases forming phosphoric ester bonds (6.5) forming phosphoric ester bonds (6.5.1)
    • C12Y605/01002DNA ligase (NAD+) (6.5.1.2)

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Computer And Data Communications (AREA)

Abstract

本文提供了使用多种连接酶的组合物、系统、以及方法,其中至少一种连接酶是腺苷酸化缺陷型ATP依赖性连接酶或未腺苷酸化的ATP依赖性连接酶(例如存在于无ATP混合物中)。在某些实施方式中,使用多种连接酶来使预腺苷酸化的双链序列与非腺苷酸化的双链序列连接(例如所述腺苷酸化缺陷型ATP依赖性连接酶或未腺苷酸化的ATP依赖性连接酶连接第一链,并且第二连接酶连接第二链)。在其他实施方式中,本文提供了突变型T4连接酶(例如K159S突变体或K159C突变体)。

Description

多种连接酶的组合物、系统以及方法
本申请要求2016年2月8日提交的美国临时申请序列号62/292,558的优先权,所述美国临时申请通过引用以整体并入本文。
技术领域
本文提供了使用多种连接酶的组合物、系统以及方法,其中至少一种连接酶是腺苷酸化缺陷型ATP依赖性连接酶或未腺苷酸化的ATP依赖性连接酶(例如存在于无ATP混合物中)。在某些实施方式中,使用多种连接酶来使预腺苷酸化的双链序列与非腺苷酸化的双链序列连接(例如腺苷酸化缺陷型ATP依赖性连接酶或未腺苷酸化的ATP依赖性连接酶连接第一链,并且不同的连接酶连接第二链)。在其他实施方式中,本文提供了突变型T4连接酶(例如K159S突变体或K159C突变体)。
背景技术
DNA连接酶是二价金属离子依赖性酶,其利用ATP或NAD+催化具有3'-羟基和5'-磷酸酯的相邻多核苷酸末端之间的磷酸二酯键形成(Tomkinson AE,PNAS,2006)。DNA连接酶是用于DNA复制和修复的必要的酶并且普遍存在于真核生物、细菌、古菌以及许多病毒中。根据它们的物种起源,天然存在的DNA连接酶可以具有许多独特的特性,例如底物特异性、序列和结构域组织、最佳的反应条件如pH值、温度以及耐盐性。
所有已知的DNA连接酶经由共同的途径进行催化,所述途径涉及三个核苷酸基转移反应(参见Lehman IR.等,Science,1974;以及Lindahl T等,Annu Rev Biochem,1992;这两者都通过引用以整体并入本文,特别是关于用于连接的步骤)。在ATP依赖性DNA连接酶的情况下,第一步骤(步骤1)涉及连接酶攻击ATP的α-磷酸酯,这会引起焦磷酸酯的释放和连接酶-AMP中间体的形成。AMP与保守序列基序内赖氨酸残基的氨基共价连接。在第二步骤(步骤2)中,将AMP核苷酸转移到5'-磷酸酯封端的DNA链以形成5'-App-DNA中间体。在第三和最终步骤(步骤3)中,3'-OH链攻击5'-App-DNA使两个多核苷酸连接并且释放AMP。
T4DNA连接酶是最早分离的DNA连接酶之一(Weiss B等,PNAS,1967),并且所述酶此后一直被广泛用作工具用于分子生物学应用以及分子诊断学,包括克隆、测序以及基因合成等。T4DNA连接酶容易通过互补碱基配对接受带切口的双链DNA和双链断口。此外,它的独特之处在于它能够连接具有平末端或单碱基突出端的DNA片段,即使是在不存在连接增强剂,如聚乙二醇(PEG)或其他小分子的情况下(参见Sogaramella V等,JMB,1972;美国专利8,697,408)。出于这个原因,T4DNA连接酶常规地用于许多体外应用,如用于高通量测序或下一代测序(NGS测序)的文库制备工作流程。
在许多分子生物学应用中常见的是将双链寡核苷酸衔接子与双链DNA片段的文库连接。举例来说,衔接子连接是NGS测序的文库制备工作流程中的一个重要的步骤。使具有设计和已知序列的双链寡核苷酸与具有未知序列的DNA片段的文库连接有助于下游操作,如PCR扩增或引物延伸。高效和完全的连接步骤确保了文库制备的成功,并且可以减少文库的PCR扩增所需的循环数,这有助于减少起始材料的必需量并且使所得的测序数据中的偏差减到最低限度。出于这些原因,需要提高连接反应的效率和完全性以用于许多应用。
发明内容
本文提供了使用多种不同连接酶的组合物、系统、试剂盒以及方法,其中至少一种连接酶是腺苷酸化缺陷型ATP依赖性连接酶或未腺苷酸化的ATP依赖性连接酶(例如存在于无ATP混合物中)。在某些实施方式中,使用多种连接酶来使预腺苷酸化的双链序列与非腺苷酸化的双链序列连接(例如腺苷酸化缺陷型ATP依赖性连接酶或未腺苷酸化的ATP依赖性连接酶连接第一链,并且不同的连接酶连接第二链)。在其他实施方式中,本文提供了突变型T4连接酶(例如K159S突变体或K159C突变体)。
在一些实施方式中,本文提供了组合物(例如体外组合物),所述组合物包含:a)第一连接酶,所述第一连接酶包括腺苷酸化缺陷型ATP依赖性连接酶(即不能通过与ATP反应形成AMP-连接酶中间体的连接酶);以及b)第二连接酶,其中所述第二连接酶是:i)ATP依赖性连接酶,或ii)NAD依赖性连接酶。在某些实施方式中,所述第一连接酶和/或第二连接酶是重组产生的。在某些实施方式中,所述第一连接酶和第二连接酶可以被融合成一种单一多肽并且重组产生。在某些实施方式中,所述组合物不含或基本上不含除所述第一连接酶和第二连接酶之外的生物分子(例如,所述组合物基本上仅由所述第一连接酶和第二连接酶组成而没有其他生物分子,可能的例外是待连接的靶核酸序列)。
在某些实施方式中,本文提供了包含融合蛋白的组合物,其中所述融合蛋白包含:a)第一连接酶,所述第一连接酶包括腺苷酸化缺陷型ATP依赖性连接酶(即不能通过与ATP反应形成AMP-连接酶中间体的连接酶);以及b)第二连接酶,其中所述第二连接酶是:i)ATP依赖性连接酶,或ii)NAD依赖性连接酶。
在一些实施方式中,本文提供了组合物,所述组合物包含:a)未腺苷酸化的ATP依赖性连接酶;以及b)NAD依赖性连接酶,并且其中所述组合物不含或在可检测水平上不含腺苷三磷酸(ATP)。在某些实施方式中,所述未腺苷酸化的ATP依赖性连接酶和/或NAD依赖性连接酶是重组产生的。
在一些实施方式中,本文提供了系统和/或试剂盒,其包括:a)含有包含第一连接酶的第一组合物的第一容器,其中所述第一连接酶是:i)腺苷酸化缺陷型ATP依赖性连接酶,或ii)未腺苷酸化的ATP依赖性连接酶,并且其中如果所述未腺苷酸化的ATP依赖性连接酶存在于所述第一组合物中,那么所述第一组合物不含或在可检测水平上不含腺苷三磷酸(ATP);以及b)含有包含第二连接酶的第二组合物的第二容器,其中所述第二连接酶是:i)ATP依赖性连接酶,或ii)NAD依赖性连接酶。在某些实施方式中,所述第一连接酶和/或第二连接酶是重组产生的。
在一些实施方式中,本文提供了连接核酸序列的方法,所述方法包括:a)将以下组分组合成反应混合物:i)第一连接酶,其中所述第一连接酶是:A)腺苷酸化缺陷型ATP依赖性连接酶,或B)未腺苷酸化的ATP依赖性连接酶,并且其中如果所述未腺苷酸化的ATP依赖性连接酶存在于所述反应混合物中,那么所述反应混合物不含或在可检测水平上不含腺苷三磷酸(ATP);ii)腺苷酸化的双链核酸序列(ADSNAS)(例如具有平末端或具有突出端,如粘性末端或单碱基突出端);以及iii)非腺苷酸化的双链核酸序列(非ADSNAS)(例如具有平末端或具有突出端,如粘性末端或单碱基突出端),其中所述非ADSNAS包含与第二链杂交的第一链(或其中所述非ADSNAS是作为可彼此杂交的第一单独的单链和第二单独的单链提供的),其中所述将所述组分组合是在使得所述第一连接酶将所述非ADSNAS的第一链与所述ADSNAS(即与所述ADSNA的第一腺苷酸化链)连接的条件下进行的;以及b)在下述条件下将第二连接酶添加到所述反应混合物中,所述条件使得所述第二连接酶将所述非ADSNAS的第二链与所述ADSNAS(即与所述ADSNA的第二链)连接,其中所述第二连接酶是:i)ATP依赖性连接酶,或ii)NAD依赖性连接酶。在特定实施方式中,所述方法还包括使通过将所述ADSNAS与所述非ADSNAS连接所形成的核酸分子进行测序反应以确定所述核酸序列分子的至少一部分(例如使用利用与文库片段连接的衔接子的测序方法)。
在一些实施方式中,本文提供了连接核酸序列的方法,所述方法包括:将以下组分组合成反应混合物:a)第一连接酶,其中所述第一连接酶是:i)腺苷酸化缺陷型ATP依赖性连接酶,或ii)未腺苷酸化的ATP依赖性连接酶,并且其中如果所述未腺苷酸化的ATP依赖性连接酶存在于所述反应混合物中,那么所述反应混合物不含或在可检测水平上不含腺苷三磷酸(ATP);b)第二连接酶,其中所述第二连接酶是NAD依赖性连接酶;c)腺苷酸化的双链核酸序列(ADSNAS);d)非腺苷酸化的双链核酸序列(非ADSNAS),并且其中所述将所述组分组合是在这样的条件下进行的,所述条件使得所述第一连接酶将所述非ADSNAS的第一链与所述ADSNAS连接,并且所述第二连接酶将所述非ADSNAS的第二链与所述ADSNAS连接。在特定实施方式中,所述方法还包括使通过将所述ADSNAS与所述非ADSNAS连接所形成的核酸分子进行测序反应以确定所述核酸序列分子的至少一部分。
在某些实施方式中,所述未腺苷酸化的ATP依赖性连接酶选自:T4DNA连接酶、T7DNA连接酶、T3DNA连接酶以及PBCV-1DNA连接酶或它们的明显密切同源物。在其他实施方式中,所述NAD依赖性连接酶选自:大肠杆菌DNA连接酶、嗜热栖热菌(Thermusthermophiles)DNA连接酶以及水生栖热菌(Thermus aquaticus)DNA连接酶或它们的明显密切同源物。
在某些实施方式中,所述组合物还包含腺苷酸化的双链核酸序列(ADSNAS)(例如,如图2和图3中所示;并且其可以是杂交在一起的两个单独的序列或与自身杂交的单链发夹)。在具体实施方式中,所述ADSNAS具有5个至2000个碱基对的长度(例如5个……15个……35个……300个……500个……1000个……或2000个碱基对的长度)。在一些实施方式中,所述ADSNAS包含可检测的标记或内部标记。在其他实施方式中,所述组合物还包含非腺苷酸化的双链核酸序列(非ADSNAS)。在某些实施方式中,所述非ADSNAS包含与第二链杂交的第一链,并且其中所述第一链可以通过所述第一连接酶与所述ADSNAS连接并且所述第二链可以通过所述第二连接酶与所述ADSNAS连接。在具体实施方式中,所述非ADSNAS具有5个至4000个碱基对的长度(例如5个……15个……35个……300个……500个……2000个……或4000个碱基对的长度)。在具体实施方式中,所述非ADSNAS编码蛋白质或蛋白质的一部分。在一些实施方式中,所述ADSNAS包含双链测序衔接子(例如Illumina TRUSEQ衔接子、Illumina NEXTERA衔接子、SOLEXA测序衔接子、ROCHE 454测序衔接子、SOLID测序衔接子以及用于ION TORRENT的ION XPRESS条形码衔接子)。在具体实施方式中,所述非ADSNAS包含测序文库片段或令人感兴趣的其他核酸序列。
在特定实施方式中,所述第一连接酶(腺苷酸化缺陷型连接酶)包括野生型连接酶的突变体。在特定实施方式中,所述第一连接酶包括具有Kx(D/N)G基序(其中x是任何氨基酸)的野生型连接酶的突变体,并且其中所述突变体包含所述Kx(D/N)G基序,除了所述基序中的赖氨酸被替换为不同的氨基酸,所述不同的氨基酸使得所述突变体是腺苷酸化缺陷型,但是仍然具有步骤3连接能力。在特定实施方式中,所述突变体包含选自以下的赖氨酸替换基序:Gx(D/N)G(SEQ ID NO:5)、Px(D/N)G(SEQ ID NO:6)、Ax(D/N)G(SEQ ID NO:7)、Vx(D/N)G(SEQ ID NO:8)、Lx(D/N)G(SEQ ID NO:9)、Ix(D/N)G(SEQ ID NO:10)、Mx(D/N)G(SEQID NO:11)、Cx(D/N)G(SEQ ID NO:12)、Fx(D/N)G(SEQ ID NO:13)、Yx(D/N)G(SEQ ID NO:14)、Wx(D/N)G(SEQ ID NO:15)、Hx(D/N)G(SEQ ID NO:16)、Rx(D/N)G(SEQ ID NO:17)、Qx(D/N)G(SEQ ID NO:18)、Nx(D/N)G(SEQ ID NO:19)、Ex(D/N)G(SEQ ID NO:20)、Dx(D/N)G(SEQ ID NO:21)、Sx(D/N)G(SEQ ID NO:22)、Tx(D/N)G(SEQ ID NO:23)以及x(D/N)G(SEQID NO:24,赖氨酸的点缺失);其中x是任何氨基酸,并且其中N是天冬酰胺。
在某些实施方式中,所述突变体包括突变型T4DNA连接酶(例如在位置159处具有从赖氨酸的氨基酸变化)。在特定实施方式中,突变型T4DNA连接酶选自:K159S突变体、K159C突变体以及K159A突变体(例如,如SEQ ID NO:1-3所示,或这些序列的变体,所述变体与这些序列具有97%-99%的同一性,或具有这些序列的N末端截短或C末端截短,所述截短基本上不改变正常的步骤3连接酶活性)。在特定实施方式中,所述T4DNA连接酶是由SEQ IDNO:1-3编码的,但是具有一个氨基酸变化(不在位置159处),该氨基酸变化基本上不改变连接酶步骤3活性。在某些实施方式中,所述第一连接酶是来自小球藻(Chlorella)病毒PBCV-1DNA连接酶的K27A突变体(参见Sriskana等,Nucleic Acids Research,1998,26(2),525-531,其通过引用以整体并入本文,特别是关于K27A突变体)。
在一些实施方式中,所述第二连接酶是ATP依赖性连接酶,并且其中所述ATP依赖性连接酶选自:T4DNA连接酶、T7DNA连接酶、T3DNA连接酶以及PBCV-1DNA连接酶。在另外的实施方式中,所述第二连接酶是NAD依赖性连接酶,并且其中所述NAD依赖性连接酶选自:大肠杆菌DNA连接酶、嗜热栖热菌DNA连接酶以及水生栖热菌DNA连接酶。
在某些实施方式中,本文提供了系统和试剂盒,其包括:a)包括第一组合物的第一容器,所述第一组合物包含T4DNA连接酶K159S突变体和/或T4DNA连接酶K159C突变体;以及b)包括第二组合物的第二容器,所述第二组合物包含腺苷酸化的双链核酸序列(ADSNAS)。在某些实施方式中,所述第一容器和所述第二容器两者都存在于包装(例如盒子或其他运输容器)中。在特定实施方式中,本文提供了组合物,所述组合物包含:T4DNA连接酶K159S突变体和/或T4DNA连接酶K159C突变体。
在某些实施方式中,所述K159S突变体是由氨基酸序列SEQ ID NO:1或该序列的变体编码的,所述变体与该序列具有97%-99%的同一性,或具有该序列的N末端截短或C末端截短,所述截短基本上不改变正常连接酶步骤3活性。在一些实施方式中,T4DNA连接酶是由SEQ ID NO:1编码的,但是具有一个氨基酸变化(不在位置159处),该氨基酸变化基本上不改变连接酶步骤3活性。在其他实施方式中,所述K159S突变体是由氨基酸序列SEQ ID NO:2或该序列的变体编码的,所述变体与该序列具有97%-99%的同一性,或具有该序列的N末端截短或C末端截短,所述截短基本上不改变正常连接酶步骤3活性。在特定实施方式中,所述T4DNA连接酶是由SEQ ID NO:2编码的,但是具有一个氨基酸变化(不在位置159处),所述氨基酸变化基本上不改变连接酶步骤3活性。
附图说明
图1示出了描绘了A加尾的文库DNA片段与T加尾的衔接子之间的常规连接中的某些反应步骤的示例性工作流程。
图2是对于A加尾的DNA片段和腺苷酸化的T加尾的衔接子仅使用步骤3进行第一链连接(例如使用腺苷酸化缺陷型ATP依赖性连接酶或未腺苷酸化的ATP依赖性连接酶)并且使用另一种连接酶进行第二链连接的一个示例性非限制性实施方式。
图3是对于平末端DNA片段和腺苷酸化的平末端衔接子仅使用步骤3进行第一链连接(例如使用腺苷酸化缺陷型ATP依赖性连接酶或未腺苷酸化的ATP依赖性连接酶)并且使用另一种连接酶进行第二链连接的一个示例性非限制性实施方式。
图4示出了来自实施例1的结果,其中在步骤3连接反应中测试了T4DNA连接酶K159X突变体的活性。在含有70mM Tris-HCl、10mM MgCl2、5mM DTT(pH 7.6)的缓冲液中在25℃进行反应。每10μl的反应物含有0.2μl的平末端PCR片段和0.2μl的腺苷酸化的平末端衔接子。将反应物在室温下孵育1小时,然后在50℃进行蛋白酶K消化1小时。然后将反应物在10%TBE凝胶上进行电泳,用SYBR Gold染色,并且在GE ImageQuant上扫描以进行可视化。凝胶中的泳道如下:C)使用野生型T4DNA连接酶(NEB公司目录号:M0202L)的阳性对照反应;1)K159Y;2)K159W;3)K159P;4)K159R;5)K159D;6)K159N;7)K159T;8)K159Q;9)K159A;10)K159E;11)K159H;12)K159V;13)K159F;14)K159I;15)K159C;16)K159S;17)K159G;以及18)K159M。
图5示出了来自实施例1的结果,其中使用各种连接酶混合物测试平末端连接。凝胶中的泳道如下:泳道1:仅PCR片段和衔接子;泳道2:使用K159S;泳道3:使用K159S和大肠杆菌连接酶;泳道4:使用T4DNA连接酶连接PCR片段和磷酸化的平末端衔接子。
图6示出了T4DNA连接酶K159S突变体的氨基酸序列(SEQ ID NO:1)。
图7示出了T4DNA连接酶K159C突变体的氨基酸序列(SEQ ID NO:2)。
图8示出了T4DNA连接酶K159A突变体的氨基酸序列(SEQ ID NO:3)。
定义
如本文所用的短语“腺苷酸化缺陷型ATP依赖性连接酶”指的是下述ATP依赖性连接酶,其不能如由ATP依赖性连接酶通常所进行的那样通过与ATP反应形成AMP-连接酶中间体。这样的DNA连接酶的实例包括但不限于T4DNA连接酶K159S突变体、K159C突变体和K159A突变体,以及来自小球藻病毒PBCV-1DNA连接酶的K27A突变体。实例还包括连接酶的其他保守基序中的诱变,如T4RNA连接酶2中的R55K、K227Q以及K225R(Yin等,J Biol Chem 2003,278:17601-17608,其通过引用以整体并入本文,特别是关于这些突变体)。腺苷酸化缺陷型ATP依赖性连接酶的其他实例包括ATP依赖性连接酶,其中连接酶的KxDG(基序I)内的赖氨酸被突变成其他19种氨基酸之一,使得所述连接酶是腺苷酸化缺陷型,但是具有步骤3连接酶能力。可以使用例如在以下实施例部分中所示的方法产生这些突变体并且针对腺苷酸化缺陷和步骤3连接酶能力进行筛选。
如本文所用的短语“未腺苷酸化的ATP依赖性连接酶”指的是下述ATP依赖性连接酶,其能够通过与ATP反应形成正常的AMP-连接酶中间体,但是尚未形成这样的AMP-连接酶中间体(例如,因为它存在于无ATP混合物中)。
具体实施方式
本文提供了使用多种连接酶的组合物、系统以及方法,其中至少一种连接酶是腺苷酸化缺陷型ATP依赖性连接酶或未腺苷酸化的ATP依赖性连接酶(例如存在于无ATP混合物中)。在某些实施方式中,使用多种连接酶来使预腺苷酸化的双链序列与非腺苷酸化的双链序列连接(例如腺苷酸化缺陷型ATP依赖性连接酶或未腺苷酸化的ATP依赖性连接酶连接第一链,并且不同的连接酶连接第二链)。在其他实施方式中,本文提供了突变型T4连接酶(例如K159S突变体或K159C突变体)。
在典型文库制备工作流程,如用于ILLUMINA平台(或其他下一代测序平台)的典型文库制备工作流程中,首先将大尺寸的DNA片段化成更小段。通过酶的混合物将片段化的DNA的异质末端修复成平末端,继而在3'末端处延伸额外的A碱基,例如通过利用Taq聚合酶的非模板依赖性聚合活性(Clarks JM,NAR,1988,其通过引用并入本文)。然后使A加尾的DNA片段与具有互补3'-T突出端的双链寡核苷酸衔接子连接。所述连接反应通常仅由T4DNA连接酶催化以使这两条链在T/A连接处连接。由于互补的单碱基T末端与A末端之间的连接一般是低效的,因此通常向所述连接反应补充过量的连接酶以及连接增强剂,如PEG8000或其他分子(参见美国专利8,697,408,其通过引用并入本文)。A加尾的文库DNA片段与T加尾的衔接子之间的连接确保了所述连接在文库DNA片段与衔接子之间是定向的,并且存在最少的不想要的文库DNA片段自身或衔接子自身内连接产物。
平末端文库DNA片段与衔接子之间的连接还用于高通量测序的文库制备工作流程中。举例来说,在用于PACBIO(加利福尼亚州的太平洋生物科学公司(PacificBiosciences,CA))平台的文库制备工作流程中,首先将大尺寸的DNA片段化成受控的尺寸。将片段化的DNA的末端修复成平末端并且与5'磷酸化的平末端衔接子连接(太平洋生物科学公司手册PN 001-143-835-08)。再次,该连接仅由T4DNA连接酶催化以使这两条链在平末端连接处连接。可能形成不想要的连接产物,如衔接子二聚体,但是可以通过尺寸选择,如通过使用AMPure珠粒(贝克曼库尔特公司(Beckman Coulter))来有效地去除。也可能形成其他不想要的连接产物,如文库片段之间的多联体。然而,鉴于衔接子相对于文库片段是过量的,这些产物的分数被认为是小的。
DNA文库片段与衔接子之间的典型连接反应一般需要每个连接酶分子进行多轮连接(即多次转换条件)。为了密封连接处的每一个链断口,连接酶需要经历所有3个核苷酸基转移步骤(参见图1)。然而,连接第一链比连接第二链更加具有挑战性,这是因为第一连接事件涉及两个单独的双链DNA分子的连接,而第二连接事件在已经连接的,但是带切口的双链底物上发生(图1)。可以预期的是,虽然第一连接事件一般需要更好地连接平末端和单碱基突出端的连接酶如T4DNA连接酶的作用,但是第二连接可以由其他ATP依赖性或NAD依赖性DNA连接酶,如T7DNA连接酶、T3DNA连接酶、大肠杆菌DNA连接酶、PBCV-1连接酶等催化。由于T4DNA连接酶本身也有效催化双链切口连接,因此仅使用T4DNA连接酶来催化这两条链的密封而不是使用连接酶的混合物。
从连接过程中的反应动力学角度来看,已经观测到,对于使用双链带切口的DNA作为底物的DNA连接酶,在单次转换条件(酶>>底物)下的反应速率比在多次转换条件(酶<<底物)下的反应速率快得多。动力学研究已经表明在步骤3之后发生的产物从酶的释放(Lohman GJ,J.Biol.Chem,2011,其通过引用并入本文)或者在步骤1中发生的酶腺苷酸化(Wang Y等,Biochemistry,2007,其通过引用并入本文)是可能的限速步骤以解释所述差异。已经观测到,作为从腺苷酸化的连接酶向DNA的5'磷酸化末端的核苷酸基转移步骤的步骤2和作为通过3'-OH攻击进行的链密封步骤的步骤3相对有效地发生,在单次转换条件和多次转换条件下具有类似的动力学。因此,虽然本发明不限于任何特定的机制并且对机制的了解不是为实施本发明所必需的,但是认为,为了提高连接效率,有利的是绕过限速步骤并且直接进行快速动力学步骤。这可以例如通过使用酶的组合来实现,其中第一连接酶连接预腺苷酸化的第一链(例如使用腺苷酸化缺陷型ATP依赖性连接酶和/或未腺苷酸化的ATP依赖性连接酶),并且第二连接酶(例如任何有用的连接酶)连接第二链。
此外,还认识到的是,连接酶在步骤2之后可以从底物上脱落,从而在DNA上留下腺苷酸化的5'末端。一旦连接酶在步骤2之后从底物上脱落,它就可以再次重新开始步骤1并且自身进行重新腺苷酸化。一旦连接酶被腺苷酸化,它就不能再结合腺苷酸化的5'末端并且催化连接的步骤3,从而导致这些末端是不可连接的。为此,在连接反应中补充5'脱腺苷酸化酶可以有助于通过将5'腺苷酸化末端逆转成5'磷酸化末端来挽救这些无效的末端,从而随时间推移提高连接产率(参见美国专利公开20150031026和美国专利公开20150218608)。然而,可能的是,在连接反应中包括5'脱腺苷酸化酶可能通过逆转过量的5'腺苷酸化末端而干扰正常的连接过程。
可以设想的是,在体外在单独的核苷酸基转移步骤中进行连接反应(Shuman S.,J.Bio.Chem,2009,其通过引用并入本文)。举例来说,当连接酶遇到的辅因子如ATP或NAD时发生步骤1。来自表达宿主如大肠杆菌的DNA连接酶的异源表达和纯化通常产生腺苷酸化的连接酶和非腺苷酸化的连接酶的混合物。本领域已知的是,连接酶可以被纯化为腺苷酸化的形式或非腺苷酸化的形式或其中一种形式占多数的混合物(Lohman GJ,JBC,2011和WO2010094040,两者都通过引用并入本文,并且特别是关于纯化非腺苷酸化的连接酶)。通过使用化学计量的腺苷酸化的连接酶,有可能仅进行连接的步骤2和步骤3并且绕过步骤1反应(WO2010094040A1)。这样的反应不需要辅因子如ATP或NAD的存在。然而,为了制备腺苷酸化的连接酶,需要在酶纯化期间采用额外的步骤并且需要化学计量的酶进行连接反应。类似地,通过使用预腺苷酸化的5'末端,可以绕过步骤1和步骤2并且可以在非腺苷酸化的连接酶的催化下在不存在ATP的情况下在预腺苷酸化的5'末端与3'-OH末端之间直接进行步骤3连接。第二连接步骤的产物——5'腺苷酸化末端可以例如通过酶促方法或化学方法合成(例如Torchia,Nucl.Acids,Res,2008,其通过引用并入本文,并且特别是关于制备腺苷酸化的核酸)。在RNA研究领域中,进行“分解(split)”连接的多种方法已经对于RNA连接越来越普及(Lau NC,Science,2001;Zhelkovsky AM,BMC Mol Bio,2012)。
除了野生型非腺苷酸化DNA连接酶之外,还有可能获得腺苷酸化缺陷型但是擅长进行步骤3的DNA连接酶突变体。举例来说,腺苷酸化缺陷型DNA连接酶可以经由野生型T4DNA连接酶的诱变来获得。在序列水平上,ATP依赖性连接酶由一组六个短保守基序(I、III、IIIa、IV、V以及VI)限定(Shuman S,Mol.Microbio.,1995,其通过引用并入本文)。与AMP共价连接的活性位点赖氨酸残基位于保守基序I(Kx(D/N)G)内,其中x是任何氨基酸。在PBCV-1DNA连接酶中保守赖氨酸突变成丙氨酸(K27A)阻断了腺苷基的转移并且使得所述酶不能自身腺苷酸化。然而,突变酶仍能够催化连接反应的步骤3(Sriskanda V.等,NAR,1998,其通过引用以整体并入本文)。在T4DNA连接酶中,赖氨酸159是基序I中的催化性赖氨酸。先前的研究已经证实,在T4DNA连接酶中保守赖氨酸159突变成亮氨酸消除了它的整体连接活性(Ross R.等,NAR,1997)。
在本公开的某些实施方式中,通过使用预腺苷酸化的双链衔接子(或其他预腺苷酸化的双链核酸序列),可以绕过双链DNA连接中的限速步骤,并且可以进行第一链连接中的相对快速的步骤3连接(图2)。举例来说,如图2中所示,可以将双链3'-T加尾的衔接子腺苷酸化(例如使用酶促方法或化学方法)。A加尾的DNA片段与腺苷酸化的衔接子之间的第一链连接可以由例如未腺苷酸化的野生型连接酶(例如野生型T4DNA连接酶)在不存在ATP的情况下催化或由腺苷酸化缺陷型DNA连接酶(例如T4DNA连接酶突变体或突变型PBCV-1DNA连接酶)催化。在某些实施方式中,使用T4DNA连接酶进行第一链连接,这是因为它有效连接平末端和单碱基突出端。一旦第一链连接,就可以使用其他连接酶,如T7连接酶、T3连接酶、大肠杆菌连接酶、Taq连接酶、PBCV-1连接酶等进行第二链连接。因此,并不是仅使用一种连接酶进行这两条链的连接,而是可以使用连接酶混合物分别连接每条链。
虽然本发明不限于任何特定的机制并且对机制的了解不是为实施本发明所必需的,但是认为,使用多种不同连接酶的混合物催化单独链密封具有几个优势。首先,在第一链连接中,已经绕过了潜在限速步骤1和步骤2,因此认为可以预期更快的动力学。其次,对于第二链切口密封连接,存在可以使用而不干扰第一链连接的连接酶的广泛选择。例如,NAD依赖性大肠杆菌连接酶在连接平末端或单碱基末端时相对惰性,但在连接双链切口时是高效的。通过使用大肠杆菌连接酶作为第二链连接酶,有可能消除整体连接对ATP的要求,这对于某些应用可以是有用的。再次,如下文所述,由于第一连接在核酸片段的3'-OH末端与衔接子的5'腺苷酸化末端之间是定向的,并且由于第二链连接酶仅催化切口密封,因此有可能在平末端连接中使不想要的核酸片段内连接最小化。
一般来说,当在本文的方法中使用ATP依赖性DNA连接酶进行第二链连接时,通常在反应中需要ATP,如果使用未腺苷酸化的连接酶(例如野生型T4连接酶),那么这可能干扰第一链连接。因此,在某些实施方式中,如果使用ATP依赖性DNA连接酶进行第二链连接,那么使用腺苷酸化缺陷型突变型连接酶(例如突变型T4DNA连接酶突变体)进行第一链连接。可替选地,如果使用NAD+依赖性连接酶进行第二链连接(例如大肠杆菌DNA连接酶),那么可以使用未腺苷酸化的野生型连接酶或腺苷酸化缺陷型连接酶突变体进行第一链连接。因此,在一些实施方式中,可以在一锅中使用连接酶混合物的组合来进行第一链连接和第二链连接。
如图3中所示,也可以使用连接酶混合物进行文库DNA片段与衔接子之间的平末端连接。举例来说,DNA文库片段与腺苷酸化的衔接子之间的第一链连接可以由未腺苷酸化的连接酶(例如T4DNA连接酶)在不存在ATP的情况下催化或由腺苷酸化缺陷型连接酶突变体(例如T4DNA连接酶突变体)催化。第二链连接可以使用上文概述的相同组合指导,使用其他DNA连接酶,如T7DNA连接酶、T3DNA连接酶、大肠杆菌DNA连接酶、Taq DNA连接酶等来进行。由于所述连接是按从衔接子到文库片段定向的,因此与传统的平末端连接相比,主要优势在于总体上避免了文库DNA片段内形成的不想要的连接产物。可能形成衔接子二聚体,但是可以通过例如尺寸选择,例如通过使用AMPure珠粒来有效地去除。因此,通过在文库制备工作流程中使用所提出的定向平末端连接,有可能避免A加尾步骤,这在各种测序背景下具有不同的效率(参见Magnuson VL等,Biotechniques,1996)并且可能会给测序结果带来偏差;以及单碱基T-A连接,其通常比平末端连接低效。
如以下实施例中所述,在平末端PCR片段与腺苷酸化的平末端衔接子之间的步骤3连接测定中测试了T4DNA连接酶的赖氨酸159的所有19种突变体。该数据表明不是所有的赖氨酸突变体都在步骤3连接中具有活性(包括先前研究的K159L)。所述实施例鉴定出至少三种有活性的腺苷酸化缺陷型、擅长进行步骤3的赖氨酸突变体,其中效率排序是K159S>K159C>K159A。鉴于赖氨酸和丝氨酸的氨基酸侧链的性质,惊人的是,K159S突变体似乎在催化连接的步骤3中具有最高水平的活性。
在某些实施方式中,可以在常规的连接反应中使用DNA连接酶的腺苷酸化缺陷型、擅长进行步骤3的突变体,这是因为它们具有一旦产生腺苷酸化的5'末端,就完成步骤3连接的能力。举例来说,认识到的是,连接酶在步骤2之后可能从底物上脱落,从而在DNA上留下腺苷酸化的5'末端。5'腺苷酸化的末端可以由腺苷酸化缺陷型、擅长进行步骤3的连接酶突变体识别并且进行链密封。与补充5'脱腺苷酸化酶(美国专利公开20150031026)相比,这种方法不会逆转反应。
在某些实施方式中,在测序方法中使用多种连接酶混合物和/或突变型连接酶,如使衔接子与文库片段连接以进行后续的测序。举例来说,在一些实施方式中,本文提供的公开内容可用于第二代(也被称为下一代(Next Generation或Next-Gen))、第三代(也被称为下下一代)或第四代(也被称为N3-Gen)测序技术中,包括但不限于焦磷酸测序、边连接边测序、单分子测序、边合成边测序(SBS)、半导体测序、大规模并行克隆、大规模并行单分子SBS、大规模并行单分子实时、大规模并行单分子实时纳米孔技术等。Morozova和Marra在Genomics,92:255(2008)中提供了一些这样的技术的综述,该文献通过引用以整体并入本文。
许多DNA测序技术是合适的,包括基于荧光的测序方法(参见例如Birren等,Genome Analysis:Analyzing DNA(基因组分析:分析DNA),1,纽约州的冷泉港(ColdSpring Harbor,N.Y.);其通过引用以整体并入本文)。在一些实施方式中,本公开可用于本领域中了解的自动化测序技术中。在一些实施方式中,本发明的技术可用于对分区的扩增子进行并行测序(PCT公开号:WO2006084132,其通过引用以整体并入本文)。在一些实施方式中,所述技术可用于通过并行寡核苷酸延伸进行DNA测序(参见例如美国专利号5,750,341和美国专利号6,306,597,这两者都通过引用以整体并入本文)。所述技术可用于的测序技术的另外的实例包括Church聚合酶克隆技术(Mitra等,2003,Analytical Biochemistry320,55-65;Shendure等,2005Science 309,1728-1732;美国专利号6,432,360、美国专利号6,485,944、美国专利号6,511,803;所有这些文献都通过引用以整体并入本文)、454微微量滴定(picotiter)焦磷酸测序技术(Margulies等,2005Nature 437,376-380;US20050130173;其通过引用以整体并入本文)、Solexa单碱基加成技术(Bennett等,2005,Pharmacogenomics,6,373-382;美国专利号6,787,308;美国专利号6,833,246;其通过引用以整体并入本文)、Lynx大规模并行签名测序技术(Brenner等(2000).Nat.Biotechnol.18:630-634;美国专利号5,695,934;美国专利号5,714,330;所有这些文献通过引用以整体并入本文)、以及Adessi PCR菌落技术(Adessi等(2000).Nucleic Acid Res.28,E87;WO00018957;其通过引用以整体并入本文)。
下一代测序(NGS)方法共有大规模并行、高通量策略的共同特征,目标在于与较老的测序方法相比降低成本(参见例如Voelkerding等,Clinical Chem.,55:641-658,2009;MacLean等,Nature Rev.Microbiol.,7:287-296;这些文献各自通过引用以整体并入本文)。NGS方法可以大致分成通常使用模板扩增的那些和不使用模板扩增的那些。需要扩增的方法包括由罗氏公司(Roche)作为454技术平台(例如GS 20和GS FLX)商业化的焦磷酸测序,生命科技公司(Life Technologies)/Ion Torrent,由Illumina公司商业化的Solexa平台,GnuBio,以及由应用生物系统公司(Applied Biosystems)商业化的支撑式寡核苷酸连接和检测(SOLiD)平台。也被称为单分子测序的非扩增方法的实例有由HelicosBioSciences公司商业化的HeliScope平台以及分别由VisiGen公司、牛津纳米孔技术有限公司(Oxford Nanopore Technologies Ltd.)和太平洋生物科学公司商业化的新兴平台。
在焦磷酸测序(Voelkerding等,Clinical Chem.,55:641-658,2009;MacLean等,Nature Rev.Microbiol.,7:287-296;美国专利号6,210,891;美国专利号6,258,568;这些文献各自通过引用以整体并入本文)中,将模板DNA片段化,末端修复,与衔接子连接,并且通过用带有与所述衔接子互补的寡核苷酸的珠粒捕捉单个模板分子来原位克隆扩增。将带有单一模板类型的每一个珠粒隔室化到油包水微泡中,并且使用被称为乳液PCR的技术克隆扩增模板。在扩增之后将乳液破乳并且珠粒沉积到在测序反应期间充当流动池的微微量滴定板的单个孔中。在测序酶和发光报告分子如荧光素酶的存在下,在流动池中发生四种dNTP试剂中的每一种的有序的迭代引入。如果将适当的dNTP添加到测序引物的3'末端,那么所引起的ATP产生会导致孔内一阵发光,使用CCD照相机记录所述发光。有可能实现大于或等于400个碱基的读长,并且可以实现106个序列读段,从而产生多达500百万个碱基对(Mb)的序列。
在Solexa/Illumina公司平台(Voelkerding等,Clinical Chem.,55:641-658,2009;MacLean等,Nature Rev.Microbiol.,7:287-296;美国专利号6,833,246;美国专利号7,115,400;美国专利号6,969,488;这些文献各自通过引用以整体并入本文)中,以更短长度的读段形式产生测序数据。在这种方法中,将单链片段化的DNA进行末端修复以产生5'磷酸化的平末端,继而向片段的3'末端进行克列诺酶(Klenow)介导的单个A碱基的添加。A的添加有助于添加T突出端衔接子寡核苷酸,所述寡核苷酸随后用于将模板-衔接子分子捕捉到散布有寡核苷酸锚的流动池表面上。所述锚用作PCR引物,但是由于模板的长度和它与其他附近的锚寡核苷酸的接近度,通过PCR的延伸引起分子的“拱起”以与相邻的锚寡核苷酸杂交,以在流动池的表面上形成桥结构。将这些DNA环变性并且切割。然后用可逆染料终止子对正向链进行测序。通过检测掺入后荧光来确定掺入的核苷酸的序列,在下一个dNTP添加循环之前去除每一个荧光标记和嵌段。序列读长在36个核苷酸至超过250个核苷酸的范围内,每次分析运行的总输出超过10亿个核苷酸对。
使用SOLiD技术对核酸分子进行测序(Voelkerding等,Clinical Chem.,55:641-658,2009;MacLean等,Nature Rev.Microbiol.,7:287-296;美国专利号5,912,148;美国专利号6,130,073;这些文献各自通过引用以整体并入本文)也涉及模板的片段化、与寡核苷酸衔接子连接、与珠粒连接以及通过乳液PCR进行克隆扩增。在这之后,将带有模板的珠粒固定到玻璃流动池的衍生化表面上,并且使与衔接子寡核苷酸互补的引物退火。然而,不是利用该引物进行3'延伸,而是将它用于提供5'磷酸酯基以用于与询问探针连接,所述询问探针含有两个探针特异性碱基,之后是6个简并碱基和四种荧光标记之一。在SOLiD系统中,询问探针具有每个探针的3'末端处两个碱基的16种可能的组合,和5'末端处四种荧光标记之一。荧光颜色以及因此每一个探针的身份对应于特定的颜色空间编码方案。在多轮(通常是7轮)探针退火、连接以及荧光检测之后是变性,然后是使用相对于初始引物偏移一个碱基的引物进行第二轮测序。以这种方式,可以计算重建模板序列,并且询问模板碱基两次,从而使得准确度提高。序列读长平均是35个核苷酸,并且每次测序运行的总输出超过40亿个碱基。
在某些实施方式中,本文所述的技术可用于纳米孔测序(参见例如Astier等,J.Am.Chem.Soc.2006年2月8日;128(5):1705-10,其通过引用并入本文)。纳米孔测序背后的理论与在将纳米孔浸入导电流体中并且在它之上施加电位(电压)时发生的事件有关。在这些条件下,可以观测到由于离子通过纳米孔传导而产生的微电流,并且电流量对纳米孔的尺寸非常敏感。在核酸的每一个碱基穿过纳米孔时,这会引起通过纳米孔的电流的大小的变化,所述变化对于四种碱基中的每一种是不同的,从而允许确定DNA分子的序列。
在某些实施方式中,本文所述的技术可用于Helicos BioSciences公司的HeliScope(Voelkerding等,Clinical Chem.,55:641-658,2009;MacLean等,NatureRev.Microbiol.,7:287-296;美国专利号7,169,560;美国专利号7,282,337;美国专利号7,482,120;美国专利号7,501,245;美国专利号6,818,395;美国专利号6,911,345;美国专利号7,501,245;这些文献各自通过引用以整体并入本文)中。将模板DNA片段化并且在3'末端处多聚腺苷酸化,最终的腺苷带有荧光标记。使变性的多聚腺苷酸化的模板片段与流动池表面上的聚(dT)寡核苷酸连接。通过CCD照相机记录捕捉的模板分子的初始物理位置,然后将标记切割并且洗掉。通过添加聚合酶并且连续添加荧光标记的dNTP试剂来实现测序。掺入事件产生对应于dNTP的荧光信号,并且在每一轮dNTP添加之前通过CCD照相机捕获信号。序列读长在25个-50个核苷酸的范围内,每次分析运行的总输出超过10亿个核苷酸对。
Ion Torrent技术是一种基于检测在DNA聚合期间释放的氢离子的DNA测序方法(参见例如Science 327(5970):1190(2010);美国专利申请公开号20090026082、20090127589、20100301398、20100197507、20100188073以及20100137143,这些文献通过引用以整体并入本文用于所有目的)。微孔含有待测序的模板DNA链。在微孔层下方是超灵敏的ISFET离子传感器。所有层都被包含在CMOS半导体芯片内,所述半导体芯片类似于电子工业中所用的半导体芯片。当dNTP被掺入不断增长的互补链中时,释放氢离子,这会触发超灵敏的离子传感器。如果在模板序列中存在均聚物重复序列,那么将在单个循环中被掺入多个dNTP分子。这会产生相应数量的释放的氢和按比例更高的电子信号。该技术与其他测序技术的不同之处在于不使用修饰的核苷酸或光学器件。Ion Torrent测序仪的每个碱基准确度对于具有50个碱基的读段来说是约99.6%,每次运行产生约100Mb至100Gb。读长是100个-300个碱基对。具有5个重复序列的长度的均聚物重复序列的准确度是约98%。离子半导体测序的益处是迅速的测序速度以及低的前期和操作成本。
本文公开的技术可用于由Stratos Genomics公司开发的另一种核酸测序方法并且涉及使用Xpandomer。该测序方法通常包括提供由模板指导的合成产生的子链。该子链一般包括在对应于靶核酸的全部或一部分的连续核苷酸序列的序列中偶联的多个亚基,其中单个亚基包含系链、至少一个探针或核苷碱基残基以及至少一个可选择性切割的键。所述可选择性切割的键被切割以产生具有比所述子链的多个亚基更长的长度的Xpandomer。所述Xpandomer通常包括系链和报告元件,所述报告元件用于剖析对应于靶核酸的全部或一部分的连续核苷酸序列的序列中的遗传信息。然后检测Xpandomer的报告元件。关于基于Xpandomer的方法的另外的细节描述于例如美国专利公开号20090035777中,该美国专利公开以整体并入本文。
其他单分子测序方法包括使用VisiGen平台的实时边合成边测序(Voelkerding等,Clinical Chem.,55:641-58,2009;美国专利号7,329,492;美国专利申请序列号11/671956;美国专利申请序列号11/781166;这些文献各自通过引用以整体并入本文),其中使用荧光修饰的聚合酶和荧光受体分子对固定的、引发的DNA模板进行链延伸,从而在添加核苷酸时产生可检出的荧光共振能量传递(FRET)。
在某些实施方式中,本文提供了组合物、试剂盒以及系统,其包含由SEQ ID NO:1编码或由与SEQ ID NO:1具有显著同一性的序列编码的T4DNA连接酶K159S突变体,和/或由SEQ ID NO:2编码或由与SEQ ID NO:2具有显著同一性的序列编码的T4DNA连接酶K159C突变体。如对于这些多肽所应用的术语“显著同一性”意指两个肽序列在最佳比对,如通过程序GAP或BESTFIT使用默认空位权重最佳比对时,共有至少80%的序列同一性或至少90%的序列同一性或至少95%的序列同一性或更高(例如95%……97%……或99%的序列同一性)。在具体实施方式中,没有同一性的残基位置因保守氨基酸替换而不同。保守氨基酸替换指的是具有相似侧链的残基的可互换性。举例来说,具有脂族侧链的一组氨基酸是甘氨酸、丙氨酸、缬氨酸、亮氨酸以及异亮氨酸;具有脂族羟基侧链的一组氨基酸是丝氨酸和苏氨酸;具有含酰胺侧链的一组氨基酸是天冬酰胺和谷氨酰胺;具有芳族侧链的一组氨基酸是苯丙氨酸、酪氨酸以及色氨酸;具有碱性侧链的一组氨基酸是赖氨酸、精氨酸以及组氨酸;并且具有含硫侧链的一组氨基酸是半胱氨酸和甲硫氨酸。在一些实施方式中,保守氨基酸替换组是:缬氨酸-亮氨酸-异亮氨酸、苯丙氨酸-酪氨酸、赖氨酸-精氨酸、丙氨酸-缬氨酸以及天冬酰胺-谷氨酰胺。在某些实施方式中,本文提供了与SEQ ID NO:1和2所示的氨基酸序列的至少一部分具有显著同一性的肽。
实验
实施例1
活性腺苷酸化缺陷型、擅长进行步骤3的T4DNA连接酶突变体的鉴定
使用具有N末端6×His标签的优化的大肠杆菌密码子合成野生型T4DNA连接酶(T4DL)。将合成基因克隆到T7启动子驱动的表达载体pTXB1(NEB公司)中。使用pTXB1_T4DLWT作为模板进行基于PCR的诱变以将赖氨酸159变成所有其他19种氨基酸。对所有突变体表达载体进行序列验证以确认预期的变化。然后将每一种突变体在T7表达菌株(编号C2566,NEB公司)中表达。简单地说,首先将每一个6ml培养物培养到O.D.约0.6,IPTG诱导达到0.5mM的最终浓度,并且在20℃振荡过夜。然后将表达培养物旋转沉降,重悬在450μl含有20mM Tris(pH=7.5)、150mM NaCl、1×FastBreak(普洛麦格公司(Promega))、200μg/ml溶菌酶的缓冲液中,并且超声处理。然后在4℃以14,000rpm将细胞裂解物离心30分钟。将澄清的裂解物上样到Ni-NTA珠粒柱上并且使用含有20mM Tris(pH=7.5)、150mM NaCl、400mM咪唑的洗脱缓冲液洗脱靶蛋白。
对于步骤3连接测定,从IDT(5'-GATCGGAAGAGCACACGTCTGAACTCCAGTC/ideoxyU/ACACTCTTTCCCTACACGACGCTCTTCCGATC-3',SEQ ID NO:4)合成平末端衔接子,然后使用T4多核苷酸激酶(NEB公司)磷酸化,并且使用5'腺苷酸化试剂盒根据制造商的说明书(NEB公司)腺苷酸化。使用Phusion DNA聚合酶从pBR322载体扩增短PCR片段(约250bp)并且纯化。在含有70mM Tris-HCl、10mM MgCl2、5mM DTT的缓冲液中进行步骤3连接反应。每个反应含有0.2μl的PCR片段(约60ng/μl)和0.2μl腺苷酸化的衔接子(约6μM)。将所有反应在室温(25℃)下温育1小时,之后将1μl的蛋白酶K(NEB公司)添加到每个反应中,继而在50℃进一步温育1小时。然后将反应物在10%TBE凝胶上电泳,用SYBR Gold染色并且可视化。从图4中,可以观测到,大部分的赖氨酸突变体没有显示出显著的步骤3连接活性。与其他连接酶突变体相比,K159S表现出最强的连接活性,其次是K159C和K159A。
为了使用连接酶混合物测试平末端连接,使用连接酶混合物建立反应并且与仅使用T4DNA连接酶的常规连接相比较。如图5中所示,泳道1显示仅使用K159S突变体的平末端PCR片段与腺苷酸化的平末端衔接子之间的连接,泳道2显示使用K159S和大肠杆菌连接酶的连接酶混合物的相同连接。在这两种情况下,连接接近完成。泳道4显示仅使用T4DNA连接酶的平末端PCR片段与磷酸化的衔接子之间的连接。尽管具有相似的效率,但是可以看出的是,形成了超高分子量条带,这可能来自PCR片段的多联化。
参考文献:
Clark JM.Novel non-templated nucleotide addition reactions catalyzedby procaryotic and eucaryotic DNA polymerases(由原核和真核DNA聚合酶催化的新的非模板化的核苷酸加成反应),Nucleic Acids Res.1988,16(20):9677-86。
Lau NC,Lim LP,Weinstein EG,Bartel DP.An abundant class of tiny RNAswith probable regulatory roles in Caenorhabditis elegans(秀丽隐杆线虫中具有可能的调节作用的一大类极小RNA),Science.2001,294(5543):858-62。
Lehman IR.DNA ligase:structure,mechanism,and function(DNA连接酶:结构、机制以及功能),Science.1974年11月29日;186(4166):790-7。
Lindahl T,Barnes DE.Mammalian DNA ligases(哺乳动物DNA连接酶),Annu RevBiochem.1992;61:251-81。
Lohman GJ,Chen L,Evans TC Jr.Kinetic characterization of singlestrand break ligation in duplex DNA by T4DNA ligase(在双链DNA中通过T4DNA连接酶的单链断裂连接的动力学表征),J Biol Chem.2011年12月23日;286(51):44187-96。
Magnuson VL,Ally DS,Nylund SJ,Karanjawala ZE,Rayman JB,Knapp JI,LoweAL,Ghosh S,Collins FS.Substrate nucleotide-determined non-templated additionof adenine by Taq DNA polymerase:implications for PCR-based genotyping andcloning(通过Taq DNA聚合酶进行的底物核苷酸决定的非模板化腺嘌呤添加:对于基于PCR的基因分型和克隆的启示),Biotechniques.1996年10月;21(4):700-9。
Rossi R,Montecucco A,Ciarrocchi G,Biamonti G.Functionalcharacterization of the T4DNA ligase:a new insight into the mechanism ofaction(T4DNA连接酶的功能表征:对作用机制的新见解),Nucleic Acids Res.1997,25(11):2106-13。
Shuman S,Schwer B.RNA capping enzyme and DNA ligase:a superfamily ofcovalent nucleotidyl transferases(RNA加帽酶和DNA连接酶:共价核苷酸基转移酶的超家族),Mol Microbiol.1995,17(3):405-10。
Shuman S.DNA ligases:progress and prospects(DNA连接酶:进展和前景),JBiol Chem.2009,284(26):17365-9。
Sogaramella V,Khorana HG.Studies on polynucleotides.CXVI.A furtherstudy of the T4ligase-catalyzed joining of DNA at base-paired ends(对多核苷酸的研究:CXVI.对T4连接酶催化的DNA在碱基配对末端处的连接的进一步研究),J MolBiol.1972,72(3):493-502。
Sriskanda V,Shuman S.Chlorella virus DNA ligase:nick recognition andmutational analysis(小球藻病毒DNA连接酶:切口识别和突变分析),Nucleic AcidsRes.1998,26(2):525-31。
Torchia C,Takagi Y,Ho CK.Archaeal RNA ligase is a homodimeric proteinthat catalyzes intramolecular ligation of single-stranded RNA and DNA(古菌RNA连接酶是催化单链RNA和DNA的分子内连接的同二聚体蛋白),Nucleic Acids Res.2008,36(19):6218-27。
Tomkinson AE,Vijayakumar S,Pascal JM,Ellenberger T.DNA ligases:structure,reaction mechanism,and function(DNA连接酶:结构、反应机制以及功能),Chem Rev.2006,106(2):687-99。
Wang Y,Lamarche BJ,Tsai MD.Human DNA ligase IV and the ligase IV/XRCC4complex:analysis of nick ligation fidelity(人类DNA连接酶IV和连接酶IV/XRCC4复合物:切口连接保真度的分析),Biochemistry.2007,46(17):4962-76。
Weiss B,Richardson CC Enzymatic breakage and joining ofdeoxyribonucleic acid,I.Repair of single-strand breaks in DNA by an enzymesystem from Escherichia coli infected with T4bacteriophage(脱氧核糖核酸的酶促断裂和连接:I.通过来自用T4噬菌体感染的大肠杆菌的酶系统修复DNA中的单链断裂),Proc Natl Acad Sci U S A.1967年4月;57(4):1021-1028。
Zhelkovsky AM,McReynolds LA.Structure-function analysis ofMethanobacterium thermoautotrophicum RNA ligase-engineering a thermostableATP independent enzyme(嗜热自养甲烷杆菌RNA连接酶的结构-功能分析——工程化热稳定性非ATP依赖性酶),BMC Mol Biol.2012,13:24。doi:10.1186/1471-2199-13-24。
本说明书中提到和/或下文所列的所有出版物和专利通过引用并入本文。本发明所述的方法和系统的各种改动方案和变化方案对本领域技术人员来说将是显而易见的而不脱离本发明的范围和精神。尽管已经关于具体实施方式描述了本发明,但是应当了解的是,要求保护的本发明不应当不适当地限于这些具体实施方式。实际上,对相关领域的技术人员来说显而易见的用于实施本发明的所述方式的各种改动方案旨在落入本文所述的范围内。
序列表
<110> 瑞尔基因公司(RGENE, INC.)
<120> 多种连接酶的组合物、系统以及方法
<130> RGENE-34712/WO-1/ORD
<150> US 62/292,558
<151> 2016-02-08
<160> 24
<170> PatentIn version 3.5
<210> 1
<211> 487
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 1
Met Ile Leu Lys Ile Leu Asn Glu Ile Ala Ser Ile Gly Ser Thr Lys
1 5 10 15
Gln Lys Gln Ala Ile Leu Glu Lys Asn Lys Asp Asn Glu Leu Leu Lys
20 25 30
Arg Val Tyr Arg Leu Thr Tyr Ser Arg Gly Leu Gln Tyr Tyr Ile Lys
35 40 45
Lys Trp Pro Lys Pro Gly Ile Ala Thr Gln Ser Phe Gly Met Leu Thr
50 55 60
Leu Thr Asp Met Leu Asp Phe Ile Glu Phe Thr Leu Ala Thr Arg Lys
65 70 75 80
Leu Thr Gly Asn Ala Ala Ile Glu Glu Leu Thr Gly Tyr Ile Thr Asp
85 90 95
Gly Lys Lys Asp Asp Val Glu Val Leu Arg Arg Val Met Met Arg Asp
100 105 110
Leu Glu Cys Gly Ala Ser Val Ser Ile Ala Asn Lys Val Trp Pro Gly
115 120 125
Leu Ile Pro Glu Gln Pro Gln Met Leu Ala Ser Ser Tyr Asp Glu Lys
130 135 140
Gly Ile Asn Lys Asn Ile Lys Phe Pro Ala Phe Ala Gln Leu Ser Ala
145 150 155 160
Asp Gly Ala Arg Cys Phe Ala Glu Val Arg Gly Asp Glu Leu Asp Asp
165 170 175
Val Arg Leu Leu Ser Arg Ala Gly Asn Glu Tyr Leu Gly Leu Asp Leu
180 185 190
Leu Lys Glu Glu Leu Ile Lys Met Thr Ala Glu Ala Arg Gln Ile His
195 200 205
Pro Glu Gly Val Leu Ile Asp Gly Glu Leu Val Tyr His Glu Gln Val
210 215 220
Lys Lys Glu Pro Glu Gly Leu Asp Phe Leu Phe Asp Ala Tyr Pro Glu
225 230 235 240
Asn Ser Lys Ala Lys Glu Phe Ala Glu Val Ala Glu Ser Arg Thr Ala
245 250 255
Ser Asn Gly Ile Ala Asn Lys Ser Leu Lys Gly Thr Ile Ser Glu Lys
260 265 270
Glu Ala Gln Cys Met Lys Phe Gln Val Trp Asp Tyr Val Pro Leu Val
275 280 285
Glu Ile Tyr Ser Leu Pro Ala Phe Arg Leu Lys Tyr Asp Val Arg Phe
290 295 300
Ser Lys Leu Glu Gln Met Thr Ser Gly Tyr Asp Lys Val Ile Leu Ile
305 310 315 320
Glu Asn Gln Val Val Asn Asn Leu Asp Glu Ala Lys Val Ile Tyr Lys
325 330 335
Lys Tyr Ile Asp Gln Gly Leu Glu Gly Ile Ile Leu Lys Asn Ile Asp
340 345 350
Gly Leu Trp Glu Asn Ala Arg Ser Lys Asn Leu Tyr Lys Phe Lys Glu
355 360 365
Val Ile Asp Val Asp Leu Lys Ile Val Gly Ile Tyr Pro His Arg Lys
370 375 380
Asp Pro Thr Lys Ala Gly Gly Phe Ile Leu Glu Ser Glu Cys Gly Lys
385 390 395 400
Ile Lys Val Asn Ala Gly Ser Gly Leu Lys Asp Lys Ala Gly Val Lys
405 410 415
Ser His Glu Leu Asp Arg Thr Arg Ile Met Glu Asn Gln Asn Tyr Tyr
420 425 430
Ile Gly Lys Ile Leu Glu Cys Glu Cys Asn Gly Trp Leu Lys Ser Asp
435 440 445
Gly Arg Thr Asp Tyr Val Lys Leu Phe Leu Pro Ile Ala Ile Arg Leu
450 455 460
Arg Glu Asp Lys Thr Lys Ala Asn Thr Phe Glu Asp Val Phe Gly Asp
465 470 475 480
Phe His Glu Val Thr Gly Leu
485
<210> 2
<211> 487
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 2
Met Ile Leu Lys Ile Leu Asn Glu Ile Ala Ser Ile Gly Ser Thr Lys
1 5 10 15
Gln Lys Gln Ala Ile Leu Glu Lys Asn Lys Asp Asn Glu Leu Leu Lys
20 25 30
Arg Val Tyr Arg Leu Thr Tyr Ser Arg Gly Leu Gln Tyr Tyr Ile Lys
35 40 45
Lys Trp Pro Lys Pro Gly Ile Ala Thr Gln Ser Phe Gly Met Leu Thr
50 55 60
Leu Thr Asp Met Leu Asp Phe Ile Glu Phe Thr Leu Ala Thr Arg Lys
65 70 75 80
Leu Thr Gly Asn Ala Ala Ile Glu Glu Leu Thr Gly Tyr Ile Thr Asp
85 90 95
Gly Lys Lys Asp Asp Val Glu Val Leu Arg Arg Val Met Met Arg Asp
100 105 110
Leu Glu Cys Gly Ala Ser Val Ser Ile Ala Asn Lys Val Trp Pro Gly
115 120 125
Leu Ile Pro Glu Gln Pro Gln Met Leu Ala Ser Ser Tyr Asp Glu Lys
130 135 140
Gly Ile Asn Lys Asn Ile Lys Phe Pro Ala Phe Ala Gln Leu Cys Ala
145 150 155 160
Asp Gly Ala Arg Cys Phe Ala Glu Val Arg Gly Asp Glu Leu Asp Asp
165 170 175
Val Arg Leu Leu Ser Arg Ala Gly Asn Glu Tyr Leu Gly Leu Asp Leu
180 185 190
Leu Lys Glu Glu Leu Ile Lys Met Thr Ala Glu Ala Arg Gln Ile His
195 200 205
Pro Glu Gly Val Leu Ile Asp Gly Glu Leu Val Tyr His Glu Gln Val
210 215 220
Lys Lys Glu Pro Glu Gly Leu Asp Phe Leu Phe Asp Ala Tyr Pro Glu
225 230 235 240
Asn Ser Lys Ala Lys Glu Phe Ala Glu Val Ala Glu Ser Arg Thr Ala
245 250 255
Ser Asn Gly Ile Ala Asn Lys Ser Leu Lys Gly Thr Ile Ser Glu Lys
260 265 270
Glu Ala Gln Cys Met Lys Phe Gln Val Trp Asp Tyr Val Pro Leu Val
275 280 285
Glu Ile Tyr Ser Leu Pro Ala Phe Arg Leu Lys Tyr Asp Val Arg Phe
290 295 300
Ser Lys Leu Glu Gln Met Thr Ser Gly Tyr Asp Lys Val Ile Leu Ile
305 310 315 320
Glu Asn Gln Val Val Asn Asn Leu Asp Glu Ala Lys Val Ile Tyr Lys
325 330 335
Lys Tyr Ile Asp Gln Gly Leu Glu Gly Ile Ile Leu Lys Asn Ile Asp
340 345 350
Gly Leu Trp Glu Asn Ala Arg Ser Lys Asn Leu Tyr Lys Phe Lys Glu
355 360 365
Val Ile Asp Val Asp Leu Lys Ile Val Gly Ile Tyr Pro His Arg Lys
370 375 380
Asp Pro Thr Lys Ala Gly Gly Phe Ile Leu Glu Ser Glu Cys Gly Lys
385 390 395 400
Ile Lys Val Asn Ala Gly Ser Gly Leu Lys Asp Lys Ala Gly Val Lys
405 410 415
Ser His Glu Leu Asp Arg Thr Arg Ile Met Glu Asn Gln Asn Tyr Tyr
420 425 430
Ile Gly Lys Ile Leu Glu Cys Glu Cys Asn Gly Trp Leu Lys Ser Asp
435 440 445
Gly Arg Thr Asp Tyr Val Lys Leu Phe Leu Pro Ile Ala Ile Arg Leu
450 455 460
Arg Glu Asp Lys Thr Lys Ala Asn Thr Phe Glu Asp Val Phe Gly Asp
465 470 475 480
Phe His Glu Val Thr Gly Leu
485
<210> 3
<211> 487
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 3
Met Ile Leu Lys Ile Leu Asn Glu Ile Ala Ser Ile Gly Ser Thr Lys
1 5 10 15
Gln Lys Gln Ala Ile Leu Glu Lys Asn Lys Asp Asn Glu Leu Leu Lys
20 25 30
Arg Val Tyr Arg Leu Thr Tyr Ser Arg Gly Leu Gln Tyr Tyr Ile Lys
35 40 45
Lys Trp Pro Lys Pro Gly Ile Ala Thr Gln Ser Phe Gly Met Leu Thr
50 55 60
Leu Thr Asp Met Leu Asp Phe Ile Glu Phe Thr Leu Ala Thr Arg Lys
65 70 75 80
Leu Thr Gly Asn Ala Ala Ile Glu Glu Leu Thr Gly Tyr Ile Thr Asp
85 90 95
Gly Lys Lys Asp Asp Val Glu Val Leu Arg Arg Val Met Met Arg Asp
100 105 110
Leu Glu Cys Gly Ala Ser Val Ser Ile Ala Asn Lys Val Trp Pro Gly
115 120 125
Leu Ile Pro Glu Gln Pro Gln Met Leu Ala Ser Ser Tyr Asp Glu Lys
130 135 140
Gly Ile Asn Lys Asn Ile Lys Phe Pro Ala Phe Ala Gln Leu Ala Ala
145 150 155 160
Asp Gly Ala Arg Cys Phe Ala Glu Val Arg Gly Asp Glu Leu Asp Asp
165 170 175
Val Arg Leu Leu Ser Arg Ala Gly Asn Glu Tyr Leu Gly Leu Asp Leu
180 185 190
Leu Lys Glu Glu Leu Ile Lys Met Thr Ala Glu Ala Arg Gln Ile His
195 200 205
Pro Glu Gly Val Leu Ile Asp Gly Glu Leu Val Tyr His Glu Gln Val
210 215 220
Lys Lys Glu Pro Glu Gly Leu Asp Phe Leu Phe Asp Ala Tyr Pro Glu
225 230 235 240
Asn Ser Lys Ala Lys Glu Phe Ala Glu Val Ala Glu Ser Arg Thr Ala
245 250 255
Ser Asn Gly Ile Ala Asn Lys Ser Leu Lys Gly Thr Ile Ser Glu Lys
260 265 270
Glu Ala Gln Cys Met Lys Phe Gln Val Trp Asp Tyr Val Pro Leu Val
275 280 285
Glu Ile Tyr Ser Leu Pro Ala Phe Arg Leu Lys Tyr Asp Val Arg Phe
290 295 300
Ser Lys Leu Glu Gln Met Thr Ser Gly Tyr Asp Lys Val Ile Leu Ile
305 310 315 320
Glu Asn Gln Val Val Asn Asn Leu Asp Glu Ala Lys Val Ile Tyr Lys
325 330 335
Lys Tyr Ile Asp Gln Gly Leu Glu Gly Ile Ile Leu Lys Asn Ile Asp
340 345 350
Gly Leu Trp Glu Asn Ala Arg Ser Lys Asn Leu Tyr Lys Phe Lys Glu
355 360 365
Val Ile Asp Val Asp Leu Lys Ile Val Gly Ile Tyr Pro His Arg Lys
370 375 380
Asp Pro Thr Lys Ala Gly Gly Phe Ile Leu Glu Ser Glu Cys Gly Lys
385 390 395 400
Ile Lys Val Asn Ala Gly Ser Gly Leu Lys Asp Lys Ala Gly Val Lys
405 410 415
Ser His Glu Leu Asp Arg Thr Arg Ile Met Glu Asn Gln Asn Tyr Tyr
420 425 430
Ile Gly Lys Ile Leu Glu Cys Glu Cys Asn Gly Trp Leu Lys Ser Asp
435 440 445
Gly Arg Thr Asp Tyr Val Lys Leu Phe Leu Pro Ile Ala Ile Arg Leu
450 455 460
Arg Glu Asp Lys Thr Lys Ala Asn Thr Phe Glu Asp Val Phe Gly Asp
465 470 475 480
Phe His Glu Val Thr Gly Leu
485
<210> 4
<211> 64
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 4
gatcggaaga gcacacgtct gaactccagt cuacactctt tccctacacg acgctcttcc 60
gatc 64
<210> 5
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<220>
<221> MISC_FEATURE
<222> (2)..(2)
<223> Xaa=任何氨基酸
<220>
<221> MISC_FEATURE
<222> (3)..(3)
<223> Xaa= D或N
<400> 5
Gly Xaa Xaa Gly
1
<210> 6
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<220>
<221> MISC_FEATURE
<222> (2)..(2)
<223> Xaa=任何氨基酸
<220>
<221> MISC_FEATURE
<222> (3)..(3)
<223> Xaa=D或N
<400> 6
Pro Xaa Xaa Gly
1
<210> 7
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<220>
<221> MISC_FEATURE
<222> (2)..(2)
<223> Xaa=任何氨基酸
<220>
<221> MISC_FEATURE
<222> (3)..(3)
<223> Xaa=D或N
<400> 7
Ala Xaa Xaa Gly
1
<210> 8
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<220>
<221> MISC_FEATURE
<222> (2)..(2)
<223> Xaa=任何氨基酸
<220>
<221> MISC_FEATURE
<222> (3)..(3)
<223> Xaa=D或N
<400> 8
Val Xaa Xaa Gly
1
<210> 9
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<220>
<221> MISC_FEATURE
<222> (2)..(2)
<223> Xaa=任何氨基酸
<220>
<221> MISC_FEATURE
<222> (3)..(3)
<223> Xaa=D或N
<400> 9
Leu Xaa Xaa Gly
1
<210> 10
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<220>
<221> MISC_FEATURE
<222> (2)..(2)
<223> Xaa=任何氨基酸
<220>
<221> MISC_FEATURE
<222> (3)..(3)
<223> Xaa=D或N
<400> 10
Ile Xaa Xaa Gly
1
<210> 11
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<220>
<221> MISC_FEATURE
<222> (2)..(2)
<223> Xaa=任何氨基酸
<220>
<221> MISC_FEATURE
<222> (3)..(3)
<223> Xaa=D或N
<400> 11
Met Xaa Xaa Gly
1
<210> 12
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<220>
<221> MISC_FEATURE
<222> (2)..(2)
<223> Xaa=任何氨基酸
<220>
<221> MISC_FEATURE
<222> (3)..(3)
<223> Xaa=D或N
<400> 12
Cys Xaa Xaa Gly
1
<210> 13
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<220>
<221> MISC_FEATURE
<222> (2)..(2)
<223> Xaa=任何氨基酸
<220>
<221> MISC_FEATURE
<222> (3)..(3)
<223> Xaa=D或N
<400> 13
Phe Xaa Xaa Gly
1
<210> 14
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<220>
<221> MISC_FEATURE
<222> (2)..(2)
<223> Xaa=任何氨基酸
<220>
<221> MISC_FEATURE
<222> (3)..(3)
<223> Xaa=D或N
<400> 14
Tyr Xaa Xaa Gly
1
<210> 15
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<220>
<221> MISC_FEATURE
<222> (2)..(2)
<223> Xaa=任何氨基酸
<220>
<221> MISC_FEATURE
<222> (3)..(3)
<223> Xaa=D或N
<400> 15
Trp Xaa Xaa Gly
1
<210> 16
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<220>
<221> MISC_FEATURE
<222> (2)..(2)
<223> Xaa=任何氨基酸
<220>
<221> MISC_FEATURE
<222> (3)..(3)
<223> Xaa=D或N
<400> 16
His Xaa Xaa Gly
1
<210> 17
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<220>
<221> MISC_FEATURE
<222> (2)..(2)
<223> Xaa=任何氨基酸
<220>
<221> MISC_FEATURE
<222> (3)..(3)
<223> Xaa=D或N
<400> 17
Arg Xaa Xaa Gly
1
<210> 18
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<220>
<221> MISC_FEATURE
<222> (2)..(2)
<223> Xaa=任何氨基酸
<220>
<221> MISC_FEATURE
<222> (3)..(3)
<223> Xaa=D或N
<400> 18
Gln Xaa Xaa Gly
1
<210> 19
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<220>
<221> MISC_FEATURE
<222> (2)..(2)
<223> Xaa=任何氨基酸
<220>
<221> MISC_FEATURE
<222> (3)..(3)
<223> Xaa=D或N
<400> 19
Asn Xaa Xaa Gly
1
<210> 20
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<220>
<221> MISC_FEATURE
<222> (2)..(2)
<223> Xaa=任何氨基酸
<220>
<221> MISC_FEATURE
<222> (3)..(3)
<223> Xaa=D或N
<400> 20
Glu Xaa Xaa Gly
1
<210> 21
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<220>
<221> MISC_FEATURE
<222> (2)..(2)
<223> Xaa=任何氨基酸
<220>
<221> MISC_FEATURE
<222> (3)..(3)
<223> Xaa=D或N
<400> 21
Asp Xaa Xaa Gly
1
<210> 22
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<220>
<221> MISC_FEATURE
<222> (2)..(2)
<223> Xaa=任何氨基酸
<220>
<221> MISC_FEATURE
<222> (3)..(3)
<223> Xaa=D或N
<400> 22
Ser Xaa Xaa Gly
1
<210> 23
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<220>
<221> MISC_FEATURE
<222> (2)..(2)
<223> Xaa=任何氨基酸
<220>
<221> MISC_FEATURE
<222> (3)..(3)
<223> Xaa=D或N
<400> 23
Thr Xaa Xaa Gly
1
<210> 24
<211> 3
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<220>
<221> MISC_FEATURE
<222> (1)..(1)
<223> Xaa=任何氨基酸
<220>
<221> MISC_FEATURE
<222> (2)..(2)
<223> Xaa=D或N
<400> 24
Xaa Xaa Gly
1

Claims (9)

1.一种组合物,所述组合物包含:由SEQ ID NO:1的氨基酸序列组成的T4 DNA连接酶K159S突变体和/或由SEQ ID NO:2的氨基酸序列组成的T4 DNA连接酶K159C突变体。
2.一种体外组合物,所述体外组合物包含:
(a)第一连接酶,所述第一连接酶包括由SEQ ID NO:1的氨基酸序列组成的腺苷酸化缺陷型ATP依赖性T4 DNA连接酶K159S突变体或由SEQ ID NO:2的氨基酸序列组成的T4 DNA连接酶K159C突变体;
(b)第二连接酶,其中所述第二连接酶是:i)ATP依赖性连接酶,或ii)NAD依赖性连接酶;以及
(c)腺苷酸化的双链核酸序列(ADSNAS)。
3.权利要求2的组合物,所述组合物还包含非腺苷酸化的双链核酸序列(非ADSNAS),其中所述非ADSNAS包含与第二链杂交的第一链,并且其中所述第一链能够通过所述第一连接酶与所述ADSNAS连接并且所述第二链能够通过所述第二连接酶与所述ADSNAS连接。
4.权利要求2的组合物,其中所述第二连接酶是所述ATP依赖性连接酶,并且其中所述ATP依赖性连接酶选自:T4 DNA连接酶、T7DNA连接酶、T3 DNA连接酶以及PBCV-1DNA连接酶。
5.一种系统或试剂盒,其包括:
(a)含有包含第一连接酶的第一组合物的第一容器,其中所述第一连接酶是:(i)由SEQID NO:1的氨基酸序列组成的腺苷酸化缺陷型ATP依赖性T4 DNA连接酶K159S突变体或由SEQ ID NO:2的氨基酸序列组成的T4 DNA连接酶K159C突变体,或(ii)未腺苷酸化的ATP依赖性连接酶,并且其中如果所述未腺苷酸化的ATP依赖性连接酶存在于所述第一组合物中,那么所述第一组合物不含或在可检测水平上不含腺苷三磷酸(ATP);以及
(b)含有包含第二连接酶的第二组合物的第二容器,其中所述第二连接酶是:(i)ATP依赖性连接酶,或(ii)NAD依赖性连接酶。
6.一种连接核酸序列的方法,所述方法包括:
(a)将以下组分组合成反应混合物:
(i)第一连接酶,其中所述第一连接酶是:(A)由SEQ ID NO:1的氨基酸序列组成的腺苷酸化缺陷型ATP依赖性T4 DNA连接酶K159S突变体或由SEQ ID NO:2的氨基酸序列组成的T4DNA连接酶K159C突变体,或(B)未腺苷酸化的ATP依赖性连接酶,并且其中如果所述未腺苷酸化的ATP依赖性连接酶存在于所述反应混合物中,那么所述反应混合物不含或在可检测水平上不含腺苷三磷酸(ATP);
(ii)腺苷酸化的双链核酸序列(ADSNAS);以及
(iii)非腺苷酸化的双链核酸序列(非ADSNAS),其中所述非ADSNAS包含与第二链杂交的第一链,
其中所述将所述组分组合是在使得所述第一连接酶将所述非ADSNAS的所述第一链与所述ADSNAS连接的条件下进行的;以及
(b)在下述条件下将第二连接酶添加到所述反应混合物中,所述条件使得所述第二连接酶将所述非ADSNAS的所述第二链与所述ADSNAS连接,其中所述第二连接酶是:(i)ATP依赖性连接酶,或(ii)NAD依赖性连接酶。
7.一种连接核酸序列的方法,所述方法包括:将以下组分组合成反应混合物:
(a)第一连接酶,其中所述第一连接酶是:(i)由SEQ ID NO:1的氨基酸序列组成的腺苷酸化缺陷型ATP依赖性T4 DNA连接酶K159S突变体或由SEQ ID NO:2的氨基酸序列组成的T4DNA连接酶K159C突变体,或(ii)未腺苷酸化的ATP依赖性连接酶,并且其中如果所述未腺苷酸化的ATP依赖性连接酶存在于所述反应混合物中,那么所述反应混合物不含或在可检测水平上不含腺苷三磷酸(ATP);
(b)第二连接酶,其中所述第二连接酶是NAD依赖性连接酶;
(c)腺苷酸化的双链核酸序列(ADSNAS);
(d)非腺苷酸化的双链核酸序列(非ADSNAS),并且
其中所述将所述组分组合是在这样的条件下进行的,所述条件使得所述第一连接酶将所述非ADSNAS的所述第一链与所述ADSNAS连接并且所述第二连接酶将所述非ADSNAS的所述第二链与所述ADSNAS连接。
8.一种系统,所述系统包括:
(a)包括第一组合物的第一容器,所述第一组合物包括由SEQ ID NO:1的氨基酸序列组成的T4 DNA连接酶K159S突变体和/或由SEQ ID NO:2的氨基酸序列组成的T4 DNA连接酶K159C突变体;以及
(b)包括第二组合物的第二容器,所述第二组合物包含腺苷酸化的双链核酸序列(ADSNAS)。
9.权利要求8的系统,其中所述第一容器包括所述由SEQ ID NO:1的氨基酸序列组成的T4 DNA连接酶K159S突变体。
CN201780015885.4A 2016-02-08 2017-02-07 多种连接酶的组合物、系统以及方法 Active CN108779442B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201662292558P 2016-02-08 2016-02-08
US62/292,558 2016-02-08
PCT/US2017/016812 WO2017139260A1 (en) 2016-02-08 2017-02-07 Multiple ligase compositions, systems, and methods

Publications (2)

Publication Number Publication Date
CN108779442A CN108779442A (zh) 2018-11-09
CN108779442B true CN108779442B (zh) 2022-07-12

Family

ID=59496195

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201780015885.4A Active CN108779442B (zh) 2016-02-08 2017-02-07 多种连接酶的组合物、系统以及方法

Country Status (7)

Country Link
US (2) US10626390B2 (zh)
EP (2) EP3848457A1 (zh)
JP (1) JP6902052B2 (zh)
CN (1) CN108779442B (zh)
AU (2) AU2017218431B2 (zh)
CA (1) CA3013916A1 (zh)
WO (1) WO2017139260A1 (zh)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2908704T3 (es) * 2017-01-27 2022-05-03 Integrated Dna Tech Inc Construcción de colecciones de secuenciación de nueva generación (NGS) usando desplazamiento de hebra competitivo
US10894979B2 (en) 2017-01-27 2021-01-19 Integrated Dna Technologies, Inc. Construction of next generation sequencing (NGS) libraries using competitive strand displacement
KR101848200B1 (ko) 2017-02-27 2018-04-11 조용직 Dna 라이게이션 시약
CA3059370C (en) * 2017-04-12 2022-05-10 Karius, Inc. Methods for concurrent analysis of dna and rna in mixed samples
US11920129B2 (en) * 2017-10-25 2024-03-05 National University Of Singapore Ligation and/or assembly of nucleic acid molecules
CN114555831A (zh) * 2019-09-30 2022-05-27 合成Dna技术公司 制备双索引甲基化序列文库的方法
CN113512541B (zh) * 2021-04-29 2022-07-08 温州医科大学 一种新型磷酸化腺苷酰化酶及其制备方法与应用
CN113774032B (zh) * 2021-11-12 2022-03-01 翌圣生物科技(上海)股份有限公司 重组t4连接酶突变体、编码dna及ngs建库方法
US11788082B2 (en) * 2022-02-22 2023-10-17 Abclonal Science, Inc. T4 DNA ligase variants with increased thermostability
US20230295707A1 (en) * 2022-03-21 2023-09-21 Abclonal Science, Inc. T4 DNA Ligase Variants with Increased Ligation Efficiency
US11680293B1 (en) 2022-04-21 2023-06-20 Paragon Genomics, Inc. Methods and compositions for amplifying DNA and generating DNA sequencing results from target-enriched DNA molecules
CN116218953A (zh) * 2023-01-03 2023-06-06 南京诺唯赞生物科技股份有限公司 一种连接核酸片段与接头的方法

Family Cites Families (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5714330A (en) 1994-04-04 1998-02-03 Lynx Therapeutics, Inc. DNA sequencing by stepwise ligation and cleavage
WO1996006190A2 (en) 1994-08-19 1996-02-29 Perkin-Elmer Corporation Coupled amplification and ligation method
US5695934A (en) 1994-10-13 1997-12-09 Lynx Therapeutics, Inc. Massively parallel sequencing of sorted polynucleotides
US5750341A (en) 1995-04-17 1998-05-12 Lynx Therapeutics, Inc. DNA sequencing by parallel oligonucleotide extensions
GB9620209D0 (en) 1996-09-27 1996-11-13 Cemu Bioteknik Ab Method of sequencing DNA
GB9626815D0 (en) 1996-12-23 1997-02-12 Cemu Bioteknik Ab Method of sequencing DNA
US6969488B2 (en) 1998-05-22 2005-11-29 Solexa, Inc. System and apparatus for sequential processing of analytes
AU737174B2 (en) 1997-10-10 2001-08-09 President & Fellows Of Harvard College Replica amplification of nucleic acid arrays
US6511803B1 (en) 1997-10-10 2003-01-28 President And Fellows Of Harvard College Replica amplification of nucleic acid arrays
US6485944B1 (en) 1997-10-10 2002-11-26 President And Fellows Of Harvard College Replica amplification of nucleic acid arrays
US6787308B2 (en) 1998-07-30 2004-09-07 Solexa Ltd. Arrayed biomolecules and their use in sequencing
AR021833A1 (es) 1998-09-30 2002-08-07 Applied Research Systems Metodos de amplificacion y secuenciacion de acido nucleico
US6818395B1 (en) 1999-06-28 2004-11-16 California Institute Of Technology Methods and apparatus for analyzing polynucleotide sequences
US7501245B2 (en) 1999-06-28 2009-03-10 Helicos Biosciences Corp. Methods and apparatuses for analyzing polynucleotide sequences
EP1218543A2 (en) 1999-09-29 2002-07-03 Solexa Ltd. Polynucleotide sequencing
EP2100971A3 (en) 2000-07-07 2009-11-25 Visigen Biotechnologies, Inc. Real-time sequence determination
US7668697B2 (en) 2006-02-06 2010-02-23 Andrei Volkov Method for analyzing dynamic detectable events at the single molecule level
EP2159285B1 (en) 2003-01-29 2012-09-26 454 Life Sciences Corporation Methods of amplifying and sequencing nucleic acids
US7169560B2 (en) 2003-11-12 2007-01-30 Helicos Biosciences Corporation Short cycle methods for sequencing polynucleotides
US7482120B2 (en) 2005-01-28 2009-01-27 Helicos Biosciences Corporation Methods and compositions for improving fidelity in a nucleic acid synthesis reaction
CA2596496A1 (en) 2005-02-01 2006-08-10 Agencourt Bioscience Corp. Reagents, methods, and libraries for bead-based sequencing
US7282337B1 (en) 2006-04-14 2007-10-16 Helicos Biosciences Corporation Methods for increasing accuracy of nucleic acid sequencing
US20080241951A1 (en) 2006-07-20 2008-10-02 Visigen Biotechnologies, Inc. Method and apparatus for moving stage detection of single molecular events
EP2092322B1 (en) 2006-12-14 2016-02-17 Life Technologies Corporation Methods and apparatus for measuring analytes using large scale fet arrays
US8262900B2 (en) 2006-12-14 2012-09-11 Life Technologies Corporation Methods and apparatus for measuring analytes using large scale FET arrays
CA2691364C (en) 2007-06-19 2020-06-16 Stratos Genomics, Inc. High throughput nucleic acid sequencing by expansion
US20100137143A1 (en) 2008-10-22 2010-06-03 Ion Torrent Systems Incorporated Methods and apparatus for measuring analytes
US20100301398A1 (en) 2009-05-29 2010-12-02 Ion Torrent Systems Incorporated Methods and apparatus for measuring analytes
US8790873B2 (en) 2009-01-16 2014-07-29 Affymetrix, Inc. DNA ligation on RNA template
EP2396430B1 (en) 2009-02-16 2013-05-01 Epicentre Technologies Corporation Template-independent ligation of single-stranded dna
US20120156728A1 (en) 2010-12-17 2012-06-21 Life Technologies Corporation Clonal amplification of nucleic acid on solid surface with template walking
JP6669430B2 (ja) * 2011-05-06 2020-03-18 ニユー・イングランド・バイオレイブス・インコーポレイテツド ライゲーションの促進
US20150218608A1 (en) 2014-01-31 2015-08-06 New England Biolabs, Inc. Compositions and Methods for Improvement of Ligation Yields
ES2908704T3 (es) 2017-01-27 2022-05-03 Integrated Dna Tech Inc Construcción de colecciones de secuenciación de nueva generación (NGS) usando desplazamiento de hebra competitivo

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Efficient ligation of DNA on RNA templates using a mutated T4 DNA ligase;Saiful Islam;《MASTER’S THESIS,Uppsala University》;20081231;第4页第2段,第6页第2段,第10页第4段 *

Also Published As

Publication number Publication date
WO2017139260A1 (en) 2017-08-17
CN108779442A (zh) 2018-11-09
JP2019504645A (ja) 2019-02-21
AU2022231746A1 (en) 2022-10-20
US20170226498A1 (en) 2017-08-10
CA3013916A1 (en) 2017-08-17
EP3414324B1 (en) 2021-01-20
EP3848457A1 (en) 2021-07-14
JP6902052B2 (ja) 2021-07-14
US10626390B2 (en) 2020-04-21
EP3414324A4 (en) 2019-07-24
US20200248166A1 (en) 2020-08-06
AU2017218431A1 (en) 2018-08-23
AU2017218431B2 (en) 2022-08-04
EP3414324A1 (en) 2018-12-19
US11124789B2 (en) 2021-09-21

Similar Documents

Publication Publication Date Title
CN108779442B (zh) 多种连接酶的组合物、系统以及方法
US9765388B2 (en) Enhanced ligation reactions
US11560553B2 (en) Thermophilic DNA polymerase mutants
US11046939B2 (en) DNA polymerase variant
JP2024028958A (ja) 不連続な複数の鋳型から相補的DNA(cDNA)を順序だてて連続的に合成するための組成物およびその方法
EP3430154B1 (en) Hyper-thermostable lysine-mutant ssdna/rna ligases
CN114174502A (zh) 具有改进的引物识别的Phi29 DNA聚合酶突变体
EP3645710A1 (en) Thermophilic dna polymerase mutants
US20230220449A1 (en) Marine dna polymerase i
CA3155624A1 (en) Dna polymerase and dna polymerase derived 3&#39;-5&#39;exonuclease
CN115803433A (zh) 序列偏倚降低的热稳定连接酶

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant