WO2024138664A1 - 一种核酸连接酶及其应用 - Google Patents
一种核酸连接酶及其应用 Download PDFInfo
- Publication number
- WO2024138664A1 WO2024138664A1 PCT/CN2022/144081 CN2022144081W WO2024138664A1 WO 2024138664 A1 WO2024138664 A1 WO 2024138664A1 CN 2022144081 W CN2022144081 W CN 2022144081W WO 2024138664 A1 WO2024138664 A1 WO 2024138664A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- fragment
- nucleic acid
- biologically active
- seq
- ligase
- Prior art date
Links
- 102000039446 nucleic acids Human genes 0.000 title claims abstract description 81
- 108020004707 nucleic acids Proteins 0.000 title claims abstract description 81
- 102000003960 Ligases Human genes 0.000 title claims abstract description 80
- 108090000364 Ligases Proteins 0.000 title claims abstract description 80
- 230000035772 mutation Effects 0.000 claims abstract description 30
- 238000006467 substitution reaction Methods 0.000 claims abstract description 29
- 238000003780 insertion Methods 0.000 claims abstract description 7
- 230000037431 insertion Effects 0.000 claims abstract description 7
- 238000012217 deletion Methods 0.000 claims abstract description 6
- 230000037430 deletion Effects 0.000 claims abstract description 6
- 239000012634 fragment Substances 0.000 claims description 159
- 125000003729 nucleotide group Chemical group 0.000 claims description 64
- 239000002773 nucleotide Substances 0.000 claims description 59
- 108091033319 polynucleotide Proteins 0.000 claims description 46
- 239000002157 polynucleotide Substances 0.000 claims description 46
- 102000040430 polynucleotide Human genes 0.000 claims description 46
- 230000004048 modification Effects 0.000 claims description 43
- 238000012986 modification Methods 0.000 claims description 43
- 238000012163 sequencing technique Methods 0.000 claims description 38
- 102000012410 DNA Ligases Human genes 0.000 claims description 28
- 108010061982 DNA Ligases Proteins 0.000 claims description 28
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 28
- 238000007672 fourth generation sequencing Methods 0.000 claims description 21
- 125000000217 alkyl group Chemical group 0.000 claims description 18
- 150000001413 amino acids Chemical class 0.000 claims description 18
- 238000000034 method Methods 0.000 claims description 16
- 239000011541 reaction mixture Substances 0.000 claims description 12
- 230000009471 action Effects 0.000 claims description 8
- 125000006850 spacer group Chemical group 0.000 claims description 8
- 229910052799 carbon Inorganic materials 0.000 claims description 7
- 238000002156 mixing Methods 0.000 claims description 7
- 229910052757 nitrogen Inorganic materials 0.000 claims description 7
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 claims description 7
- 229910052717 sulfur Inorganic materials 0.000 claims description 7
- 230000000295 complement effect Effects 0.000 claims description 6
- 229910052739 hydrogen Inorganic materials 0.000 claims description 6
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 claims description 5
- 239000011535 reaction buffer Substances 0.000 claims description 5
- 238000007481 next generation sequencing Methods 0.000 claims description 4
- 239000000047 product Substances 0.000 description 23
- 150000007523 nucleic acids Chemical group 0.000 description 21
- 102000004169 proteins and genes Human genes 0.000 description 20
- 108090000623 proteins and genes Proteins 0.000 description 20
- 238000006243 chemical reaction Methods 0.000 description 17
- 239000011324 bead Substances 0.000 description 15
- 239000000243 solution Substances 0.000 description 13
- 239000006228 supernatant Substances 0.000 description 13
- 108020004414 DNA Proteins 0.000 description 12
- 210000004027 cell Anatomy 0.000 description 12
- 108060004795 Methyltransferase Proteins 0.000 description 11
- 239000013612 plasmid Substances 0.000 description 11
- 230000003197 catalytic effect Effects 0.000 description 10
- 239000000945 filler Substances 0.000 description 10
- 238000000746 purification Methods 0.000 description 10
- 239000000872 buffer Substances 0.000 description 9
- 238000001514 detection method Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 239000007788 liquid Substances 0.000 description 7
- 239000000758 substrate Substances 0.000 description 7
- 241000894006 Bacteria Species 0.000 description 6
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 6
- 230000000694 effects Effects 0.000 description 6
- 102000014914 Carrier Proteins Human genes 0.000 description 5
- 102000053602 DNA Human genes 0.000 description 5
- 108091028043 Nucleic acid sequence Proteins 0.000 description 5
- 108090000190 Thrombin Proteins 0.000 description 5
- 108091008324 binding proteins Proteins 0.000 description 5
- SUYVUBYJARFZHO-RRKCRQDMSA-N dATP Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-RRKCRQDMSA-N 0.000 description 5
- 239000000203 mixture Substances 0.000 description 5
- 238000002360 preparation method Methods 0.000 description 5
- 230000008439 repair process Effects 0.000 description 5
- 229960004072 thrombin Drugs 0.000 description 5
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 4
- 108091026890 Coding region Proteins 0.000 description 4
- 230000008859 change Effects 0.000 description 4
- 238000010276 construction Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000001976 enzyme digestion Methods 0.000 description 4
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 4
- 229930027917 kanamycin Natural products 0.000 description 4
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 4
- 229960000318 kanamycin Drugs 0.000 description 4
- 229930182823 kanamycin A Natural products 0.000 description 4
- 238000010369 molecular cloning Methods 0.000 description 4
- 239000002808 molecular sieve Substances 0.000 description 4
- URGAHOPLAPQHLN-UHFFFAOYSA-N sodium aluminosilicate Chemical compound [Na+].[Al+3].[O-][Si]([O-])=O.[O-][Si]([O-])=O URGAHOPLAPQHLN-UHFFFAOYSA-N 0.000 description 4
- 238000011191 terminal modification Methods 0.000 description 4
- 102000004190 Enzymes Human genes 0.000 description 3
- 108090000790 Enzymes Proteins 0.000 description 3
- 101710086015 RNA ligase Proteins 0.000 description 3
- 125000000539 amino acid group Chemical group 0.000 description 3
- 125000004429 atom Chemical group 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 3
- 238000010367 cloning Methods 0.000 description 3
- SUYVUBYJARFZHO-UHFFFAOYSA-N dATP Natural products C1=NC=2C(N)=NC=NC=2N1C1CC(O)C(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-UHFFFAOYSA-N 0.000 description 3
- 239000005547 deoxyribonucleotide Substances 0.000 description 3
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 3
- 238000001962 electrophoresis Methods 0.000 description 3
- 229940088598 enzyme Drugs 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- RAXXELZNTBOGNW-UHFFFAOYSA-N imidazole Natural products C1=CNC=N1 RAXXELZNTBOGNW-UHFFFAOYSA-N 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 230000026731 phosphorylation Effects 0.000 description 3
- 238000006366 phosphorylation reaction Methods 0.000 description 3
- 229920001184 polypeptide Polymers 0.000 description 3
- 108090000765 processed proteins & peptides Proteins 0.000 description 3
- 102000004196 processed proteins & peptides Human genes 0.000 description 3
- 239000002096 quantum dot Substances 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 238000005406 washing Methods 0.000 description 3
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 2
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 2
- 241000588724 Escherichia coli Species 0.000 description 2
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 2
- 239000012505 Superdex™ Substances 0.000 description 2
- 239000007984 Tris EDTA buffer Substances 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 230000001580 bacterial effect Effects 0.000 description 2
- 238000002869 basic local alignment search tool Methods 0.000 description 2
- 230000033228 biological regulation Effects 0.000 description 2
- 239000001913 cellulose Substances 0.000 description 2
- 229920002678 cellulose Polymers 0.000 description 2
- 238000005119 centrifugation Methods 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 238000011033 desalting Methods 0.000 description 2
- 230000029087 digestion Effects 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 150000003904 phospholipids Chemical class 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 239000012460 protein solution Substances 0.000 description 2
- 239000012264 purified product Substances 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 241001515965 unidentified phage Species 0.000 description 2
- 241000701844 Bacillus virus phi29 Species 0.000 description 1
- 108091006146 Channels Proteins 0.000 description 1
- 230000003682 DNA packaging effect Effects 0.000 description 1
- 101001121408 Homo sapiens L-amino-acid oxidase Proteins 0.000 description 1
- 101000827703 Homo sapiens Polyphosphoinositide phosphatase Proteins 0.000 description 1
- 102100026388 L-amino-acid oxidase Human genes 0.000 description 1
- 102000008300 Mutant Proteins Human genes 0.000 description 1
- 108010021466 Mutant Proteins Proteins 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 102100023591 Polyphosphoinositide phosphatase Human genes 0.000 description 1
- 108010013381 Porins Proteins 0.000 description 1
- 108091028664 Ribonucleotide Proteins 0.000 description 1
- 101100012902 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) FIG2 gene Proteins 0.000 description 1
- 101100233916 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) KAR5 gene Proteins 0.000 description 1
- 125000003277 amino group Chemical group 0.000 description 1
- 239000003012 bilayer membrane Substances 0.000 description 1
- 239000012148 binding buffer Substances 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- 125000000484 butyl group Chemical group [H]C([*])([H])C([H])([H])C([H])([H])C([H])([H])[H] 0.000 description 1
- 210000004899 c-terminal region Anatomy 0.000 description 1
- 125000004432 carbon atom Chemical group C* 0.000 description 1
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 1
- 238000006555 catalytic reaction Methods 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000012407 engineering method Methods 0.000 description 1
- 125000001495 ethyl group Chemical group [H]C([H])([H])C([H])([H])* 0.000 description 1
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 1
- 239000012535 impurity Substances 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 238000000099 in vitro assay Methods 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 238000005462 in vivo assay Methods 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 150000002500 ions Chemical class 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 125000004433 nitrogen atom Chemical group N* 0.000 description 1
- 125000004430 oxygen atom Chemical group O* 0.000 description 1
- 125000001805 pentosyl group Chemical group 0.000 description 1
- 238000002264 polyacrylamide gel electrophoresis Methods 0.000 description 1
- 102000007739 porin activity proteins Human genes 0.000 description 1
- 125000001436 propyl group Chemical group [H]C([*])([H])C([H])([H])C([H])([H])[H] 0.000 description 1
- 238000012113 quantitative test Methods 0.000 description 1
- 238000009790 rate-determining step (RDS) Methods 0.000 description 1
- 230000035484 reaction time Effects 0.000 description 1
- 238000003259 recombinant expression Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 238000004557 single molecule detection Methods 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- 125000004434 sulfur atom Chemical group 0.000 description 1
- 238000007671 third-generation sequencing Methods 0.000 description 1
- 229910021642 ultra pure water Inorganic materials 0.000 description 1
- 238000000108 ultra-filtration Methods 0.000 description 1
- 239000012498 ultrapure water Substances 0.000 description 1
Images
Abstract
提供了一种核酸连接酶,该核酸连接酶包含与SEQ ID NO:1相比具有至少80%同一性的突变序列,所述突变包括取代、缺失和插入中的至少一种。
Description
本申请涉及分子生物学技术领域,具体涉及一种核酸连接酶及其应用。
核酸连接酶是一类可以催化两个核酸片段(如DNA或者RNA片段)之间形成磷酸二酯键以将两个片段连接的重要的工具酶。核酸连接酶的来源多种多样,其中来源于T4噬菌体的T4核酸连接酶被广泛用于分子克隆等应用中。
根据连接酶催化的核酸底物构象的不同,连接反应包括缺口连接(Nick ligation)、粘性末端连接(Cohesive end ligation)、TA连接(TA ligation)、平末端连接(Blunt end ligation)及分支连接(Branch ligation),其中TA连接和平末端连接在分子克隆和建库测序中应用较广,但是效率较低,尤其是对于具有末端修饰的核酸底物的催化效率更低。
由此,亟待提供一种具有提高的连接效率的T4核酸连接酶。
发明内容
为了解决现有核酸连接酶存在的连接效率较低的问题,本申请的实施例提供了一种核酸连接酶,其具有较高的连接效率,特别适用于催化具有末端修饰的核酸底物。
本申请第一方面提出了一种核酸连接酶或其生物活性片段,所述核酸连接酶或其生物活性片段包含与SEQ ID NO:1相比具有至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%同一性的突变序列,其中所述突变包括取代、缺失和插入中的至少一种。
在一些实施例中,所述核酸连接酶或其生物活性片段包含与SEQ ID NO:1相比具有至少1个、至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个或至少10个氨基酸突变的突变序列。
在一些实施例中,所述突变序列与SEQ ID NO:1相比具有至少1个氨基酸突变,且所述至少1个氨基酸突变包括在SEQ ID NO:1第159位和/或第164位的突变。在一些实施例中,所述突变为取代。
在一些实施例中,所述在SEQ ID NO:1第159位和/或第164位的突变包括:SEQ ID NO:1第159位的氨基酸被取代为G、H、N、A、V、Q、C、S或T;SEQ ID NO:1第164位的氨基酸被取代为G、H、N、A、V、Q、C、S或T。
在一些实施例中,SEQ ID NO:1第159位的氨基酸被取代为G或H和/或SEQ ID NO:1第164位的氨基酸被取代为G或H。
在一些实施例中,SEQ ID NO:1第159位的氨基酸被取代为G和/或SEQ ID NO:1第164位的氨基酸被取代为H。
在一些实施例中,所述突变序列为SEQ ID NO:3或SEQ ID NO:7所示序列。
在一些实施例中,所述核酸连接酶为T4 DNA连接酶。
本申请第二方面提出了一种多核苷酸,所述多核苷酸编码如本申请第一方面的任一实 施例提出的核酸连接酶或其生物活性片段或其互补序列。
本申请第三方面提出了一种载体,所述载体包含如本申请第二方面的实施例提出的多核苷酸。
本申请第四方面提出了一种细胞,所述细胞包含如本申请第一方面的任一实施例提出的核酸连接酶或其生物活性片段或如本申请第二方面的实施例提出的多核苷酸。
本申请第五方面提出了一种试剂盒,所述试剂盒包含以下中的至少一个:如本申请第一方面的任一实施例提出的核酸连接酶或其生物活性片段、如本申请第二方面的实施例提出的多核苷酸、如本申请第三方面的实施例提出的载体和如本申请第四方面的实施例提出的细胞。
本申请第六方面提出了一种试剂盒,所述试剂盒包含如本申请第一方面的任一实施例提出的核酸连接酶或其生物活性片段和反应缓冲液。
本申请第七方面提出了一种如本申请第一方面的任一实施例提出的核酸连接酶或其生物活性片段、如本申请第二方面的实施例提出的多核苷酸、如本申请第三方面的实施例提出的载体、如本申请第四方面的实施例提出的细胞或如本申请第五方面或第六方面的实施例提出的试剂盒在多核苷酸连接中的应用。
本申请第八方面提出了一种连接多核苷酸的方法,包括:将如本申请第一方面的任一实施例提出的核酸连接酶或其生物活性片段与第一核苷酸片段和第二核苷酸片段混合以获得反应混合物;孵育所述反应混合物以使所述第一核苷酸片段的3’端与所述第二核苷酸片段的5’端在所述的核酸连接酶或其生物活性片段的作用下通过磷酸二酯键连接。
在一些实施例中,所述第一核苷酸片段的3’端和所述第二核苷酸片段的5’端独立地包含平末端或粘性末端。在一些实施例中,所述粘性末端为粘性T末端或粘性A末端。
在一些实施例中,所述第一核苷酸片段和/或第二核苷酸片段包含带有修饰的单核苷酸或多核苷酸。在一些实施例中,所述第一核苷酸片段和/或第二核苷酸片段包含带有修饰的单核苷酸。在一些实施例中,所述修饰为取代修饰;在一些实施例中,所述取代修饰为烷基取代修饰。在一些实施例中,所述烷基取代修饰发生于所述单核苷酸或多核苷酸的磷酸基团上,所述烷基优选为甲基。
在一些实施例中,所述带有修饰的单核苷酸或多核苷酸位于所述第一核苷酸片段和所述第二核苷酸片段的平末端或粘性末端。
本申请第九方面提出了一种测序文库制备方法,包括:将如本申请第一方面的任一实施例提出的核酸连接酶或其生物活性片段与待测片段和接头片段混合以获得反应混合物;孵育所述反应混合物以使所述接头片段与所述待测片段在所述核酸连接酶或其生物活性片段的作用下通过磷酸二酯键连接。在一些实施例中,所述待测片段包含带有修饰的单核苷酸或多核苷酸。
在一些实施例中,所述测序文库用于NGS测序或纳米孔测序。
在一些实施例中,所述接头片段包含间隔器序列,且所述间隔器序列选自iSp18、iSpC3或带有修饰的单核苷酸或多核苷酸的至少一种。
在一些实施例中,所述修饰为取代修饰。在一些实施例中,所述取代修饰为烷基取代修饰。在一些实施例中,所述烷基取代修饰发生于所述单核苷酸或多核苷酸的磷酸基团上,所述烷基优选为甲基。
本申请的技术方案实现了如下技术效果:
相较于野生型T4 DNA连接酶,本申请的核酸连接酶在常规核酸片段之间的连接、带有末端修饰的核酸片段之间的连接以及常规核酸片段与带有末端修饰的核酸片段之间的连接上,均显示出较高的催化连接效率。此外,在测序文库构建中,基于本申请的核酸连接酶催化的接头连接效率高,能够获得更多的有效文库;同时基于本申请的核酸连接酶构建的文库在纳米孔测序中表现出更高的有效测序时间。
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为根据本申请实施例的纯化蛋白的电泳检测图;
图2为根据本申请实施例的纯化蛋白的电泳检测图;
图3为根据本申请实施例的待测片段与接头Adp的连接产物的电泳检测图;
图4为根据本申请实施例的典型测序电流信号图;
图5为根据本申请实施例的基于T4 DNA连接酶的野生型与突变体构建的测序文库在纳米孔测序时获得的有效测序时间;
图6示出了本申请实施例的α-烷基取代-脱氧核糖核苷酸;
图7为根据本申请实施例的iSpC3的结构图;
图8为根据本申请实施例的iSp18的结构图。
下面结合具体实施方式对本发明进行进一步的详细描述,给出的实施例仅为了阐明本发明,并非限制本发明的范围。以下提供的实施例可作为本技术领域普通技术人员进行进一步改进的指南,并不以任何方式构成对本发明的限制。
本申请是基于发明人的以下认识做出的:
在相关技术中,来源于T4噬菌体的T4核酸连接酶具有平末端或者TA末端连接活性,是分子克隆、核酸修饰、建库测序中广泛使用的一种酶。在建库测序中,基于平末端或者TA末端的接头连接是建库测序中的关键步骤,其连接效率直接影响了连接反应时间、后续测序结果的覆盖度和效率,尤其对于待测片段较长的测序,基于T4核酸连接酶的接头的连接效率更是测序效率的重要限速步骤之一。
纳米孔(nanopore)测序为近些年新兴起的第三代测序技术,其具有读长长、通量高、成本低和便携性等优势。纳米孔测序是基于电信号识别的测序技术,其中进入纳米孔的不同分子会对离子的流动造成阻碍,这被称为nanopore信号。当待测片段如ssDNA穿过纳米 孔时,核苷酸的不同会造成电流阻碍的大小不同。通过检测纳米孔的电流波动信号,并通过计算机深度学习建立模型分析该电流信号,可测定得到穿孔的所测片段的序列。
纳米孔测序技术的建库流程包括与二代测序建库流程中类似的末端修复和末端(3’端)加A尾(dATP尾)的步骤,然后再通过T4连接酶介导的TA连接进行接头连接,其间T4连接酶的连接催化活性对接头连接的速度和效率具有重要影响。
此外,在纳米孔测序中,未施加电势时,通常需要使多核苷酸结合蛋白停滞在靶多核苷酸上,防止多核苷酸结合蛋白沿着靶多核苷酸进一步移动,由此,纳米孔测序中的接头序列除包含常规的核酸分子例如标签序列、拘束序列(tether)外,还包含间隔器序列(spacer),其可用于停滞多核苷酸结合蛋白,以阻断多核苷酸结合蛋白在测序前的进一步解旋。
通常情况下会采用含有iSp18或iSpC3等无碱基基团的间隔器序列来停滞多核苷酸结合蛋白。除iSp18或iSpC3外,其它一些带有碱基修饰的核苷酸也可以行使间隔器序列的作用,如在α磷酸上进行烷基取代的脱氧核糖核苷酸(如图6所示)。可以使用T4连接酶将这种包含带有修饰核苷酸的序列(例如接头序列)与核酸片段(例如待测片段)连接,并用于制备测序文库。在这一步骤中,T4核酸连接酶同样对连接速度和效率具有重要影响。
本申请发明人通过对T4 DNA连接酶进行大量蛋白质结构分析和突变体理性设计,针对反应活性中心氨基酸残基进行位阻调控和电荷调控,利用蛋白工程手段构建和制备了大量T4 DNA连接酶的突变体,并对这些突变体进行了大量的性能实验以进行进一步筛选。经由大量筛选和实验,发明人惊喜地发现,相较于野生型T4 DNA连接酶,本申请实施例中提出的T4 DNA连接酶突变体对核酸片段间连接的连接效率均有提升,包括不带有修饰的常规核酸片段间的连接、常规核酸片段与带有修饰的核酸片段间的连接、带有修饰的核酸片段间的连接等,同时对纳米孔测序的效率也有较强的提升作用。
本申请实施例中,术语“核酸连接酶”是指催化DNA或RNA片段通过磷酸二酯键连接的工具酶。在一些实施例中,“核酸连接酶”为DNA连接酶。在另一些实施例中,“核酸连接酶”为RNA连接酶,具体可以为T4 DNA连接酶或T4 RNA连接酶。在本申请中,“T4连接酶”可以为T4 DNA连接酶或T4 RNA连接酶。
本申请实施例中,术语“生物活性片段”是指T4 DNA连接酶突变体的任何片段、衍生物、同源物或类似物,其具有生物分子特有的体内或体外活性;包括例如连接酶活性,或经由连接修复带切口DNA中存在的错配。在一些实施例中,突变型T4 DNA连接酶的生物活性片段、衍生物、同源物或类似物在任何感兴趣的体内或体外测定中均具有突变型T4 DNA连接酶的任何程度的生物活性。
在一些实施例中,生物活性片段可以任选地包括突变型T4 DNA连接酶的任何数量的连续氨基酸残基。本申请实施例还包括编码任何这种生物活性片段的多核苷酸。
本申请实施例中,“天然存在”或“野生型”是指在自然界中发现的形式。例如,天然存在或野生型多肽或多核苷酸序列是存在于生物体中的序列,其没有被人为操作有意修饰。“突变体”意指相对于天然或野生型氨基酸序列,其具有至少一个氨基酸的改变。在一些实施例中,所述改变(突变)包括取代、缺失和插入中的至少一种。
本申请实施例中,关于核酸或多肽序列的术语“同一性百分比”定义为在排列序列以获得最大同一性百分比并引入缺口(如果需要)以实现最大同源性百分比之后,候选序列中与已知多肽相同的核苷酸或氨基酸残基的百分比。N-末端或C-末端插入或缺失不应被解释为影响同源性。核苷酸或氨基酸序列水平上的同源性或同一性可以通过BLAST(基本局部比对搜索工具,Basic Local Alignment Search Tool)分析来确定,所述分析使用由程序blastp、blastn、blastx、tblastn和tblastx采用的算法(Altschul(1997),Nucleic Acids Res[核酸研究].25,3389-3402和Karlin(1990),Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]87,2264-2268),所述程序是为序列相似性搜索定制的。
本申请实施例提出的核酸连接酶或其生物活性片段可以包含与SEQ ID NO:1相比具有至少80%、至少85%、至少90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%、99.91%、99.92%、99.93%、99.94%、99.95%、99.96%、99.97%、99.98%、99.99%但小于100%同一性的序列,其中该序列与SEQ ID NO:1相比具有一个或多个氨基酸突变。
具体地,本申请第一方面提出的核酸连接酶或其生物活性片段包含与SEQ ID NO:1相比具有至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%同一性的突变序列,其中所述突变包括取代、缺失和插入中的至少一种。
在一些实施例中,该核酸连接酶或其生物活性片段包含与SEQ ID NO:1相比具有至少1个、至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个或至少10个氨基酸突变的突变序列。本申请实施例中,如无特殊说明,除指出的突变外,核酸连接酶或其生物活性片段的突变片段的其余氨基酸与SEQ ID NO:1相同。
在一些实施例中,所述突变序列与SEQ ID NO:1相比具有至少1个氨基酸突变,且至少1个氨基酸突变包括在SEQ ID NO:1第159位的突变。在另一些实施例中,至少1个氨基酸突变包括在SEQ ID NO:1第164位的突变。在另一些实施例中,至少1个氨基酸突变包括在SEQ ID NO:1第159位和第164位的突变。在一些实施例中,突变序列在SEQ ID NO:1第159位和/或第164位的突变形式为取代。
在一些实施例中,突变序列在SEQ ID NO:1第159位和/或第164位的突变形式可以为:SEQ ID NO:1第159位的氨基酸K被取代为G、H、N、A、V、Q、C、S或T,和/或SEQ ID NO:1第164位的氨基酸R被取代为G、H、N、A、V、Q、C、S或T。可以理解的是,突变序列可以具有上述任一种单点取代形式或其组合,例如K159G、K159H、K159N、K159A、K159V、K159Q、K159C、K159S、K159T、R164G、R164H、R164N、K164A、K164V、K164Q、K164C、K164S、K164T或其任意组合,例如K159G-R164G、K159G-R164H、K159G-R164N、K159H-R164G、K159H-R164H、K159H-R164N、K159N-R164G、K159N-R164H或K159N-R164N等等。
在一些实施例中,突变序列为SEQ ID NO:3-9中的任一序列。在一些实施例中,SEQ ID NO:1第159位的氨基酸K被取代为G,和/或SEQ ID NO:1第164位的氨基酸R被取代为H,即具有K159G、R164H或K159G-R164H的突变形式,其对应的氨基酸序列分 别为SEQ ID NO:3、SEQ ID NO:7、SEQ ID NO:9。在一些实施例中,突变序列为SEQ ID NO:3或SEQ ID NO:7所示序列。
本申请实施例还涉及一种编码上述任一实施例中的突变型的核酸连接酶或其生物活性片段或其互补序列的多核苷酸、包含该多核苷酸的载体或表达上述任一实施例中的突变型的核酸连接酶或其生物活性片段的细胞,和一种试剂盒,该试剂盒包含上述任一实施例中的突变型的核酸连接酶或其生物活性片段、编码上述任一实施例中的突变型的核酸连接酶或其生物活性片段或其互补序列的多核苷酸、包含该多核苷酸的载体或表达上述任一实施例中的突变型的核酸连接酶或其生物活性片段的细胞中的任一或其组合。本申请实施例还提出一种试剂盒,该试剂盒包含上述任一实施例中的突变型的核酸连接酶或其生物活性片段和反应缓冲液。可以理解的是,只要保证该反应缓冲液能够为所述突变型连接酶或其生物活性片段提供反应背景即可,本申请对反应缓冲液的类型不作限制。
本申请实施例中提出的突变型的核酸连接酶或其生物活性片段,其相对于野生型(SEQ ID NO:1),其催化核酸片段底物的催化连接效率提高。当底物包含末端修饰的核苷酸时,相对于野生型(SEQ ID NO:1),本申请实施例中提出的突变型的核酸连接酶或其生物活性片段同样显示出高效的催化连接能力。
本申请第二方面提出一种上述任一实施例提出的核酸连接酶或其生物活性片段、多核苷酸、载体、细胞或试剂盒在多核苷酸连接中的应用。
本申请第三方面提出一种连接多核苷酸的方法,包括:将上述任一实施例提出的核酸连接酶或其生物活性片段与第一核苷酸片段和第二核苷酸片段混合以获得反应混合物;孵育该反应混合物以使第一核苷酸片段的3’端与第二核苷酸片段的5’端在该核酸连接酶或其生物活性片段的作用下通过磷酸二酯键连接。可以理解的是,第一核苷酸片段与第二核苷酸片段在上述任一实施例中的核酸连接酶或其生物活性片段的催化下形成磷酸二酯键并实现二者的连接。在本申请实施例中,第一核苷酸片段可以为DNA片段或RNA片段,第二核苷酸片段可以为DNA片段或RNA片段。
在一些实施例中,第一核苷酸片段的3’端和第二核苷酸片段的5’端独立地包含平末端或粘性末端。可以理解的是,本申请实施例提出的T4 DNA连接酶突变体可以介导第一核苷酸片段的平末端和第二核苷酸片段的平末端之间的连接,也可以介导催化第一核苷酸片段和第二核苷酸片段的粘性互补末端之间的连接。在一些实施例中,粘性互补末端为粘性T末端和粘性A末端。本申请实施例提出的突变型核酸连接酶或其生物活性片段在核苷酸片段的平末端连接及粘性末端连接中均显示出较高的催化连接效率。
在一些实施例中,第一核苷酸片段和/或第二核苷酸片段可以包含带有修饰的单核苷酸或多核苷酸。“修饰”是指基于核苷酸的基本结构,在其磷酸基团、五碳糖部分或碱基部分存在修饰基团。在一些实施例中,修饰可以为取代修饰,即在核苷酸中存在原子或原子基团的取代等,例如由碳原子、氧原子、氮原子、硫原子、烷基、羟基、氨基、羧基、磷酸基等替换原核苷酸中的原子或基团等。在一些实施例中,所述修饰可以为烷基取代修饰。在一些实施例中,所述烷基取代修饰可以发生于单核苷酸或多核苷酸的磷酸基团上。在一 些实施例中,所述烷基可以为甲基、乙基、丙基、丁基等,其修饰产物为α-烷基取代-(脱氧)核糖核苷酸。图6示出了本申请实施例中脱氧核糖核苷酸的一种具体的修饰结构,其中R代表烷基,base(碱基)可以为A、T、C或G。
在一些实施例中,带有修饰的单核苷酸或多核苷酸可以位于第一核苷酸片段和第二核苷酸片段中间部分,或位于平末端或粘性末端。在一些实施例中,第一核苷酸片段和/或第二核苷酸片段包含带有修饰的单核苷酸。本申请实施例提出的突变型核酸连接酶或其生物活性片段在带有修饰的核苷酸片段的平末端连接及粘性末端连接中均显示出较高的催化连接效率。
具体地,本申请第一方面任一实施例提出的突变型核酸连接酶或其生物活性片段可以用于核酸片段间的连接,例如在分子克隆中,可以用于载体和插入序列间的连接;在修饰引入中,可以用于带有修饰的核苷酸片段与其它片段之间的连接,其中其它片段可以为带有修饰的核苷酸片段或不带有修饰的常规核苷酸片段;在测序文库构建中,可以用于待测片段与接头间的连接。
本申请第四方面提出一种测序文库制备方法,包括:将上述任一实施例提出的核酸连接酶或其生物活性片段与待测片段和接头片段混合以获得反应混合物;孵育所述反应混合物以使所述接头片段与所述待测片段在所述核酸连接酶或其生物活性片段的作用下通过磷酸二酯键连接。
在一些实施例中,所述待测片段包含带有修饰的单核苷酸或多核苷酸。
在一些实施例中,根据本申请第四方面任一实施例提出的测序文库制备方法所制备的测序文库可以用于下一代测序(NGS)或纳米孔测序。在纳米孔测序中,可以使用本申请实施例提出的突变型核酸连接酶或其生物活性片段将待测序列与带有修饰片段的接头片段连接,其中接头片段中的修饰片段可以为单核苷酸或多核苷酸,并且作为间隔器序列。相较于野生型,本申请实施例中提出的突变型核酸连接酶或其生物活性片段所制备的测序文库具有更高的有效文库含量,且在纳米孔测序中显著提升了有效测序时间。
下述实施例中的实验方法,如无特殊说明,均为常规方法,按照本领域内的文献所描述的技术或条件或者按照产品说明书进行。下述实施例中所用的材料、试剂等,如无特殊说明,均可从商业途径得到。
如无特殊说明,以下实施例中的定量试验,均设置三次重复实验,结果取平均值。
实施例一:野生型T4 DNA连接酶(T4L-WT)的制备
1.1野生型T4 DNA连接酶(T4L-WT)的克隆和表达
野生型T4 DNA连接酶(T4L-WT)的氨基酸序列如SEQ ID NO:1所示,其编码区序列如SEQ ID NO:2所示。合成SEQ ID NO:2所示的DNA序列(委托六合华大合成,以下涉及DNA序列合成均如此操作,不再累述),基于双酶切位点NdeI和XhoI,采用常规方法将该序列插入到PET-28a(+)质粒中,对应表达的T4L-WT蛋白N端具有6×His-tag标签和thrombin(凝血酶)酶切位点。
T4L-WT氨基酸序列:
T4L-WT编码区序列:
将连接好的PET-28a(+)-T4L-WT质粒转化入大肠杆菌表达菌BL21(DE3)中。将转化产物涂布在含卡纳霉素抗性的固体LB培养基中,37℃过夜培养。次日,挑取单菌落,将其接入5mL含有卡纳霉素抗性的LB液体培养基中,37℃震荡培养过夜。接着,取10μL过夜培养的菌液,将其转接入1L的LB液体培养基中,37℃震荡培养至OD
600=0.6至0.8,然后加入终浓度为500μM的IPTG,16℃过夜培养以诱导蛋白表达。
1.2纯化
配制下方溶液:
Buffer A:20mM Tris-HCl pH 7.5,250mM NaCl,20mM咪唑
Buffer B:20mM Tris-HCl pH 7.5,250mM NaCl,300mM咪唑
Buffer C:20mM Tris-HCl pH 7.5,50mM NaCl
Buffer D:20mM Tris-HCl pH 7.5,100mM NaCl
收集步骤1.1中IPTG诱导后的菌体,使用Buffer A重悬菌体,用细胞破碎仪破碎菌体,离心后取上清。将所得上清与预先用Buffer A平衡好的Ni-NTA填料混合,结合1h。收集填料,用Buffer A清洗填料,直至没有杂蛋白被洗出。然后在填料中加入Buffer B以洗脱T4L-WT。将洗脱得到的T4L-WT蛋白过预先用Buffer C平衡好的脱盐柱,使用Buffer C进行脱盐,然后加入凝血酶(翌圣生物,20402ES05),4℃酶切过夜。次日,将酶切后的蛋白液上分子筛Superdex 200(Sigma,GE28-9909-44)进行纯化,其中所用分子筛buffer为Buffer D。收集目的蛋白峰,并用10kD超滤管(Millipore MRCPRT010)进行浓缩,然后-80℃冻存备用。使用SDS-PAGE(十二烷基硫酸钠聚丙烯酰胺凝胶电泳,sodium dodecyl sulfate polyacrylamide gel electrophoresis)对纯化浓缩后的蛋白进行检测。
检测结果如图1所示,其中,泳道2为纯化后的T4L-WT蛋白。由图1可见,经过纯化步骤,本实施例制备得到大量高纯度的T4L-WT蛋白。
实施例二:T4 DNA连接酶突变体的制备和纯化
本实施例中的T4 DNA连接酶突变体的具体突变位点和氨基酸序列如表1所示。
表1
注:以T4L-Mut1(即突变体1)为例,其在SEQ ID NO:1所示序列的基础上,SEQ ID NO:1的第159位的K被取代为G,其余位点与SEQ ID NO:1相同;T4L-Mut2至T4L-Mut6同理。T4L-Mut7 在SEQ ID NO:1所示序列的基础上,SEQ ID NO:1的第159位的K被取代为G,并且第164位的R被取代为G,其余位点与SEQ ID NO:1相同。
T4L-Mut1氨基酸序列:
T4L-Mut2氨基酸序列:
T4L-Mut3氨基酸序列:
T4L-Mut4氨基酸序列:
T4L-Mut5氨基酸序列:
T4L-Mut6氨基酸序列:
T4L-Mut7氨基酸序列:
对表1中的T4 DNA连接酶突变体对应的编码其相应氨基酸序列的DNA进行序列合成,然后按照实施例一步骤1.1将这些突变体的DNA序列插入PET-28a(+)质粒中并分别表达,然后按照实施例一步骤1.2对表达的蛋白分别进行纯化。
结果如图2所示。其中,泳道1-7分别为T4L-Mut1至T4L-Mut7的纯化蛋白的电泳图。由图2可见,经过纯化步骤,本实施例制备得到大量与T4L-WT蛋白纯化效果相当的高纯度的突变体蛋白。
实施例三:接头的制备
合成SEQ ID NO:10和SEQ ID NO:11所示序列,并取浓度均为20μM的SEQ ID NO:10和SEQ ID NO:11所示序列各30μL混合,混匀后置于PCR仪中,70℃孵育10分钟,随后按照0.1℃/s的降温速度降至25℃后继续孵育半小时,得到10μM的接头溶液,将接头命名为Adp。
SEQ ID NO:10:
5’-XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXTTTTTTTTTTYYYYGGTTGTTTCTGTTGGTGCTGATATTGCT-3’(X=iSpC3,其结构如图7所示;Y=iSp18,其结构如图8所示)
SEQ ID NO:11:
5’pho-GCAATATCAGCACCAACAGAAACAACCTTTGAGGCGAGCGGTCAA-3’
实施例四:待测片段的制备
4.1质粒的大量提取
将空载pUC57质粒转化进DH5alpha(Vazyme Biotech,C502-02)感受态细菌中,并大量培养。使用质粒提取试剂盒(天根,DP117)提取DH5alpha中的空载pUC57质粒。使用Qubit dsDNA BR试剂盒(Thermofisher,Q32853)对提取后的质粒进行浓度测定。
4.2酶切
使用HindIII(NEB,R0104L)和EcoRI(NEB,R0101L)酶对步骤4.1所得的质粒进行酶切,具体酶切反应体系如表2所示。
表2
4.3纯化
使用Ampure XP磁珠(Beckman Coulter,A63882)对酶切产物进行纯化,具体步骤如下:
向上述酶切体系中加入50μL室温平衡后的磁珠,振荡混匀并短暂离心后室温静置10分钟。将反应体系置于磁力架上10分钟后移除上清。使用200μL 75%乙醇溶液洗涤磁珠两次。洗涤后,移除上清,打开管盖,待磁珠干燥后加入22μL TE缓冲液(pH=8)将磁珠重悬,置于室温静置10分钟。将离心管放置于磁力架上,待液体澄清后,将上清液转移至新的离心管中,得到纯化后的长度接近2Kb的酶切产物(即待测片段),其序列如SEQ ID NO:12所示。
待测片段DNA序列:
实施例五:末端加A尾
5.1末端修复、末端加A尾和磷酸化
采用普通无修饰的dATP和α甲基磷酸修饰的dATP(Me-dATP),对实施例四所得的长为近2Kb的待测片段进行末端修复、加A尾和5’端磷酸化,反应体系如表3所示,反应程序如表4所示。
表3
表4
温度 | 时间 |
37℃ | 30min |
72℃ | 30min |
经此步骤,待测片段完成了末端修复、末端加A尾和磷酸化处理,即获得以下两组产物:①待测片段的3’末端添加了一个dATP且5’端磷酸化,②待测片段的3’末端添加了一个Me-dATP且5’端磷酸化。
5.2产物的纯化
使用Ampure XP磁珠(Beckman Coulter,A63882)对步骤5.1获得的两组产物进行纯化,具体步骤如下:
向步骤5.1的末端修复体系中加入50μL室温平衡后的磁珠,振荡混匀并短暂离心后室温静置10分钟。将反应体系置于磁力架上10分钟后移除上清。使用200μL 75%乙醇溶液洗涤磁珠两次。洗涤后,移除上清,打开管盖,待磁珠干燥后加入21μL分子级水将磁珠重悬,置于室温静置10分钟。将离心管放置于磁力架上,待液体澄清后,将上清液转移至 新的离心管中,得到纯化后的产物。取1μL纯化产物,使用Qubit dsDNA HS试剂盒(Thermofisher,Q32854)进行定量,剩余产物进行下一步反应。
实施例六:待测片段与接头Adp的连接反应
6.1待测片段与接头Adp的连接
按表5所示配制连接反应液A,并基于该反应液配置如表6所示的连接反应体系A,以在T4 DNA连接酶野生型(T4L-WT)或突变体(T4L-Mut1-7)的作用下,将步骤5.2获得的待测片段与接头Adp进行连接,连接条件为25℃,10分钟。
表5
表6
6.2连接产物的纯化
使用Ampure XP磁珠(Beckman Coulter,A63882)对步骤6.1获得的连接产物进行纯化,具体步骤如下:
向步骤6.1的连接体系中加入60μL室温平衡后的磁珠,振荡混匀并短暂离心后室温静置10分钟。将反应体系置于磁力架上10分钟后移除上清。使用200μL 75%乙醇溶液洗涤磁珠两次。洗涤后,移除上清,打开管盖,待磁珠干燥后加入22μL TE缓冲液(pH=8)将磁珠重悬,置于室温静置10分钟。将离心管放置于磁力架上,待液体澄清后,将上清液转移至新的离心管中,得到纯化后的待测片段1与Adp的连接产物。
6.3连接产物的检测
使用非变性聚丙烯酰胺凝胶电泳(PAGE)对6.2所得的纯化后的连接产物进行检测,检测结果如图3所示。由图3可见,在待测片段的末端加上常规dATP的情况下,与T4L-WT(泳道2)相比,T4L-Mut1(泳道3)和T4L-Mut5(泳道7)在加常规A尾的连接反应中显示出更高的连接效率,即通过T4L-Mut1和T4L-Mut5的催化作用,得到了更多的连接产物,并且所剩底物更少。同时,待测片段的末端加上带有修饰的Me-dATP的情况下,与T4L-WT(泳道2)相比,T4L-Mut1(泳道3)和T4L-Mut5(泳道7)这两个突变体的催化 连接效率也略高,即通过T4L-Mut1和T4L-Mut5的作用,同样得到了更多的连接产物,并且所剩底物更少。这说明本申请实施例提出的T4 DNA连接酶突变体与野生型相比,催化接头与待测片段的连接反应的效率提高。
实施例七:解旋酶Dda的克隆、表达和纯化
本实施例通过在大肠杆菌中重组表达以制备解旋酶Dda,该解旋酶用作马达蛋白。解旋酶Dda的氨基酸序列如SEQ ID NO:13所示;其编码区序列如SEQ ID NO:14所示。
解旋酶Dda的氨基酸序列:
解旋酶Dda的编码区序列:
具体实验步骤如下。
7.1解旋酶Dda的克隆和表达
合成SEQ ID NO:14所示的DNA序列,基于双酶切位点NdeI和XhoI,将该序列插入到PET-28a(+)质粒中,对应表达的解旋酶Dda蛋白N端具有6×His-tag标签和thrombin酶切位点。
将连接好的PET-28a(+)-Dda质粒转化入Arctic Express(DE3)感受态细菌(Tolo Biotech,96183-02)中。将转化产物涂布在含卡纳霉素抗性的固体LB培养基中,37℃过夜培养。次日,挑取单菌落,将其接入5mL含有卡纳霉素抗性的LB液体培养基中,37℃震荡培养过夜。接着,取10μL过夜培养的菌液,将其转接入1L的LB液体培养基中,37℃震荡培养至OD
600=0.6至0.8,然后加入终浓度为500μM的IPTG,16℃过夜培养以诱导Dda蛋白表达。
7.2纯化
配制下方溶液:
缓冲液E:20mM Tris-HCl pH 7.5,100mM NaCl
收集步骤7.1中IPTG诱导后的菌体,使用实施例一的1.2步骤中配置的Buffer A重悬菌体,用细胞破碎仪破碎菌体,离心后取上清。将所得上清与预先用Buffer A平衡好的Ni-NTA填料混合,结合1h。收集填料,用Buffer A清洗填料,直至没有杂蛋白被洗出。然后在填料中加入Buffer B以洗脱Dda。将洗脱得到的Dda蛋白过预先用Buffer C平衡好的脱盐柱,使用Buffer C进行脱盐,然后加入凝血酶(翌圣生物,20402ES05),加入到预先用Buffer C平衡好的ssDNA纤维素(Sigma,D8273-10G)填料中,4℃酶切过夜。次日,收集ssDNA纤维素填料,用Buffer C洗3-4次后用Buffer D洗脱纯化后的蛋白。将纯化后的Dda蛋白液上分子筛Superdex 200(Sigma,GE28-9909-44),其中所用分子筛buffer为Buffer E。收集目的蛋白峰,并浓缩,以获得纯化后的解旋酶Dda。
实施例八:测序文库与马达蛋白的结合
本实施例通过将实施例六中所得的纯化后的连接产物(即测序文库)与实施例七中的解旋酶Dda孵育,制备用于纳米孔测序的结合物。具体实验步骤如下。
配制2×结合缓冲液:将100mL 1M Tris-HCL(pH=7.5)与100mL 1M KCl溶液混合,然后加入超纯水定容至1L。按照表7在冰上配制解旋酶Dda及连接产物的结合体系,随后30℃孵育一小时。
表7
使用Qubit DNA HS试剂盒对结合产物进行浓度测定。
实施例九:纳米孔测序
本实施例构建基于膜片钳平台的纳米孔测序平台,对实施例八获得的测序文库与马达蛋白结合产物进行纳米孔测序,以验证本公开实施例通过T4 DNA连接酶突变体所构建的测序文库在纳米孔测序中的表现。
参考文献(耿佳,郭培宣,“噬菌体phi29DNA包装马达磷脂膜嵌合体在单分子检测及纳米医学领域的应用”.生命科学,2011,23(11):1114-1129)中公开的单通道电生理检测系统,搭建基于膜片钳平台的纳米孔检测平台,将孔蛋白(Sigma-Aldrich,H9395-5mg)插入磷脂双分子层膜上,形成单通道纳米孔。
将实施例八中获得的结合产物加入到该单通道纳米孔体系中,通过膜片钳体系检测并记录电流振幅变化。待测片段(SEQ ID NO:12)的典型测序电流信号图如图4所示。
对测序结果进行统计分析,通过统计每个小时中,所有测序信号累加的总时长,可以判断测序文库样品中的有效文库的含量。图5示出了本实施例基于T4 DNA连接酶的野生型与突变体构建的测序文库在纳米孔测序时获得的有效测序时间。由图5可见,相较于野生型T4L-WT,由T4L-Mut1催化的连接反应在纳米孔测序中显示出更高的有效测序时间,说明经本申请实施例的T4 DNA连接酶突变体催化的连接反应得到了更多的有效文库,证明了与野生型相比,本申请实施例提出的T4 DNA连接酶突变体具有更高的催化连接效率,并且该突变体能够有效提升了纳米孔测序中有效文库的含量,显著提升了有效测序时间。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。
Claims (20)
- 一种核酸连接酶或其生物活性片段,所述核酸连接酶或其生物活性片段包含与SEQ ID NO:1相比具有至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%同一性的突变序列,其中所述突变包括取代、缺失和插入中的至少一种。
- 根据权利要求1所述的核酸连接酶或其生物活性片段,所述核酸连接酶或其生物活性片段包含与SEQ ID NO:1相比具有至少1个、至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个或至少10个氨基酸突变的突变序列。
- 根据权利要求1或2所述的核酸连接酶或其生物活性片段,所述突变序列与SEQ ID NO:1相比具有至少1个氨基酸突变,且所述至少1个氨基酸突变包括在SEQ ID NO:1第159位和/或第164位的突变,优选地,所述突变为取代。
- 根据权利要求3所述的核酸连接酶或其生物活性片段,所述在SEQ ID NO:1第159位和/或第164位的突变包括:SEQ ID NO:1第159位的氨基酸被取代为G、H、N、A、V、Q、C、S或T,SEQ ID NO:1第164位的氨基酸被取代为G、H、N、A、V、Q、C、S或T。
- 根据权利要求1至4中任一项所述的核酸连接酶或其生物活性片段,SEQ ID NO:1第159位的氨基酸被取代为G或H,和/或SEQ ID NO:1第164位的氨基酸被取代为G或H,优选地,SEQ ID NO:1第159位的氨基酸被取代为G,和/或SEQ ID NO:1第164位的氨基酸被取代为H。
- 根据权利要求5所述的核酸连接酶或其生物活性片段,所述突变序列为SEQ ID NO:3或SEQ ID NO:7所示序列。
- 根据权利要求1至6中任一项所述的核酸连接酶或其生物活性片段,其中所述核酸连接酶为T4 DNA连接酶。
- 一种多核苷酸,所述多核苷酸编码如权利要求1至7中任一项所述的核酸连接酶或其生物活性片段或其互补序列。
- 一种载体,所述载体包含如权利要求8所述的多核苷酸。
- 一种细胞,所述细胞包含如权利要求8所述的多核苷酸或表达如权利要求1至7中任一项所述的核酸连接酶或其生物活性片段。
- 一种试剂盒,包含以下中的至少一个:如权利要求1至7中任一项所述的核酸连接酶或其生物活性片段、如权利要求8所述的多核苷酸、如权利要求9所述的载体和如权利要求10所述的细胞。
- 一种试剂盒,所述试剂盒包含如权利要求1至7中任一项所述的核酸连接酶或其生物活性片段和反应缓冲液。
- 权利要求1至7中任一项所述的核酸连接酶或其生物活性片段、权利要求8所述的多核苷酸、权利要求9所述的载体、权利要求10所述的细胞或权利要求11或12所述的试剂盒在多核苷酸连接中的应用。
- 一种连接多核苷酸的方法,包括:将权利要求1至7中任一项所述的核酸连接酶或其生物活性片段与第一核苷酸片段和第二核苷酸片段混合以获得反应混合物;孵育所述反应混合物以使所述第一核苷酸片段的3’端与所述第二核苷酸片段的5’端在所述核酸连接酶或其生物活性片段的作用下通过磷酸二酯键连接,可选地,所述第一核苷酸片段的3’端和所述第二核苷酸片段的5’端独立地包含平末端或粘性末端,优选地,所述粘性末端为粘性T末端或粘性A末端。
- 根据权利要求14所述的方法,所述第一核苷酸片段和/或第二核苷酸片段包含带有修饰的单核苷酸或多核苷酸,优选地,所述第一核苷酸片段和/或第二核苷酸片段包含带有修饰的单核苷酸,任选地,所述修饰为取代修饰,可选地,所述取代修饰为烷基取代修饰,优选地,所述烷基取代修饰发生于所述单核苷酸或多核苷酸的磷酸基团上,所述烷基优选为甲基。
- 根据权利要求14或15所述的方法,所述带有修饰的单核苷酸或多核苷酸位于所述第一核苷酸片段和/或所述第二核苷酸片段的平末端或粘性末端。
- 一种测序文库制备方法,包括:将权利要求1至7中任一项所述的核酸连接酶或其生物活性片段与待测片段和接头片段混合以获得反应混合物;孵育所述反应混合物以使所述接头片段与所述待测片段在所述核酸连接酶或其生物活性片段的作用下通过磷酸二酯键连接,可选地,所述待测片段包含带有修饰的单核苷酸或多核苷酸。
- 根据权利要求17所述的方法,所述测序文库用于NGS测序或纳米孔测序。
- 根据权利要求18所述的方法,所述接头片段包含间隔器序列,且所述间隔器序列选自iSp18、iSpC3或带有修饰的单核苷酸或多核苷酸的至少一种。
- 根据权利要求19所述的方法,所述修饰为取代修饰,优选地,所述取代修饰为烷基取代修饰,优选地,所述烷基取代修饰发生于所述单核苷酸或多核苷酸的磷酸基团上,所述烷基优选为甲基。
Publications (1)
Publication Number | Publication Date |
---|---|
WO2024138664A1 true WO2024138664A1 (zh) | 2024-07-04 |
Family
ID=
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3619224B1 (en) | Transmembrane pore consisting of two csgg pores | |
AU2021231074B2 (en) | Class II, type V CRISPR systems | |
CN107201352B (zh) | 一种具有高转糖苷活性的β-半乳糖苷酶组合突变体及其制备方法和应用 | |
CN112608933B (zh) | 一种重组蓝铜肽前体-寡肽的高纯度制备方法 | |
CN111410695B (zh) | 基于自噬机制介导Tau蛋白降解的嵌合分子及其应用 | |
WO2024138664A1 (zh) | 一种核酸连接酶及其应用 | |
CN114875002B (zh) | 一种精氨酸突变的dna/rna连接酶 | |
CN115725675A (zh) | 一种长片段基因的生物合成方法及应用 | |
JPS62262994A (ja) | D−アミノ酸オキシダ−ゼ遺伝子 | |
CN116240199B (zh) | 一种突变的核糖核酸酶r及其应用 | |
CN115896047B (zh) | 重组t4 dna连接酶突变体、融合蛋白及其应用 | |
WO2024138626A1 (zh) | 一类解旋酶ToPif 1、其制备方法及其在高通量测序中的应用 | |
CN115873811B (zh) | 一种pbcv-1连接酶突变体、表达纯化方法及应用 | |
CN110066855B (zh) | Hel112解旋酶在聚合酶链式反应中的应用、组合物及试剂盒 | |
Ma et al. | Optimizing the expression and characterization of a thermostable ssDNA ligase from a Thermus scotoductus bacteriophage TS2126 | |
US12024541B2 (en) | Transmembrane pore consisting of two CsgG pores | |
WO2024026499A2 (en) | Class ii, type v crispr systems | |
WO2023164592A2 (en) | Fusion proteins | |
CN117165551A (zh) | 一种甲硫氨酸腺苷转移酶突变体及其应用 | |
CN115974981A (zh) | DNA结合结构域、融合型phi29 DNA聚合酶及其制备方法和应用 | |
CN116590268A (zh) | 一种热稳定性增强的胆盐水解酶以及制备与方法和应用 | |
CN117286192A (zh) | 酰胺合成酶在制备立他司特中间体和/或立他司特中的用途 | |
CN115820677A (zh) | 重组slo抗原的制备方法和应用 | |
KR20100088174A (ko) | 혐기성내열성 고세균으로부터 익스트리모자임의 정제 방법 및 활용법 | |
JPH09173073A (ja) | ヒトのep52遺伝子 |