CN115896047B

CN115896047B - 重组t4 dna连接酶突变体、融合蛋白及其应用

Info

Publication number: CN115896047B
Application number: CN202211589538.1A
Authority: CN
Inventors: 冯速; 曹林; 贡怡; 郑芳园; 唐伟; 郁云兰; 吴静; 陈晓洋; 李雪; 魏恒
Original assignee: Nanjing Novozan Biotechnology Co ltd
Current assignee: Nanjing Novozan Biotechnology Co ltd
Priority date: 2022-12-12
Filing date: 2022-12-12
Publication date: 2023-06-16
Anticipated expiration: 2042-12-12
Also published as: CN115896047A

Abstract

本发明提供重组T4DNA连接酶突变体、融合蛋白及其应用，突变体在野生型T4DL(SEQ ID NO:1)上，进行了K16R、I121R、V125K、K226A、F235A、D371G、D373R、K470D等多个点突变；融合蛋白在突变体的一端或两端包含核酸结合结构域，核酸结合结构域与T4DNA连接酶突变体之间使用多肽桥连接。本发明的突变体及融合蛋白具有高活性、高效率。利用本发明的突变体及融合蛋白进行NGS建库，显示出对低起始投入量的良好兼容，文库产量显著提高，适用于临床样本的NGS检测。

Description

重组T4 DNA连接酶突变体、融合蛋白及其应用

技术领域

本发明涉及一种重组T4 DNA连接酶突变体、融合蛋白及其应用，属于生物技术领域。

背景技术

多核苷酸连接酶，如DNA连接酶，属于最广泛使用的分子生物酶，广泛应用于分子生物学，以及医疗、制药和食品工业等一系列采用分子生物学方法的行业。各种各样的分子生物学方法依赖于DNA连接酶的有效活性。尽管已经研究了一系列不同来源、不同反应条件、偏好性等的核酸连接酶，T4噬菌体来源的DNA连接酶仍是分子生物学相关方法中使用的最主要的工具酶之一。而针对本领域中不同应用场景下DNA连接酶的不同要求，改进T4 DNA连接酶的性能仍是本领域的研究热点之一。

高通量测序技术，又称下一代测序(NGS)是一种大规模平行测序技术，能够以超高的通量、超强的可扩展性和超快的速度进行测序。由于该技术的飞速发展，测序通量大幅增加，要求文库样本处理尽可能简单快速，以提高整个NGS流程的工作效率。同时文库制备对DNA的质量、浓度等有一定的要求，且对建库DNA的起始量也要求至少1ng-0.5ug。而各种复杂样本、珍贵样本，如福尔马林固定石蜡包埋(FFPE)的DNA样本，本身存在各种DNA损伤，如胞嘧啶脱氨、切刻和缺口、碱基氧化、3’端封闭等问题，会对文库质量产生严重影响，如何兼容这类复杂样本和正常DNA样本，稳定获得高质量、高产出的扩增文库，仍是研究热点之一。

连接酶模块的改进对文库转化率和扩增文库产出有极大影响，是后续测序获得数据的关键之一。已有研究表明，在DNA连接酶上添加核酸结合结构域可显著提高连接酶的连接效率，如Sso7d、p50、cTF、DSBA等，但不同结构域对于核酸的亲和性能有较大差异，更高亲和力有利于满足复杂样本、低起始量样本的文库构建需求。

发明内容

本发明提供了重组T4 DNA连接酶突变体、融合蛋白以及组合物，该突变体/融合蛋白具有DNA连接酶活性，本发明还提供了将该重组连接酶突变体、融合蛋白以及组合物应用于诊断、NGS建库和其他领域的方法。

本发明提供一种T4 DNA连接酶突变体，其中突变体与氨基酸序列如SEQ ID NO:1所示的野生型T4 DNA连接酶相比，含有下列位点上的氨基酸取代：第16位、第121位、第125位、第226位、第235位和第371位。

在一些实施方案中，所述T4 DNA连接酶突变体包含K16R、I121R、V125K、K226A、F235A、D371G取代。在一些实施方案中，所述突变体还包含D373R、D385K、E438R、D448K、K470D中的一个或多个突变点。在一些实施方案中，所述突变体还包含D373R和K470D取代。

在一些实施方案中，所述突变体包含下列位点取代组合中的任意一个：

K16R、I121R、V125K、K226A、F235A、D371G、D373R；

K16R、I121R、V125K、K226A、F235A、D371G、D385K；

K16R、I121R、V125K、K226A、F235A、D371G、E438R；

K16R、I121R、V125K、K226A、F235A、D371G、D448K；

K16R、I121R、V125K、K226A、F235A、D371G、K470D；

K16R、I121R、V125K、K226A、F235A、D371G、D373R、K470D。

在一些实施方案中，所述突变体的序列选自SEQ ID NO:2-7。在一些实施方案中，所述突变体的序列如SEQ ID NO:2所示。在一些实施方案中，所述突变体的序列如SEQ IDNO:3所示。在一些实施方案中，所述突变体的序列如SEQ ID NO:4所示。在一些实施方案中，所述突变体的序列如SEQ ID NO:5所示。在一些实施方案中，所述突变体的序列如SEQ IDNO:6所示。在一些实施方案中，所述突变体的序列如SEQ ID NO:7所示。

为了提高突变体对底物DNA末端序列的结合效率，本发明还提供融合蛋白。融合蛋白在本发明的突变体的一端或两端连接DNA结合结构域。在一些实施方案中，所述DNA结合结构域选自p50、p50截短体、Sso7d、Sto7d、Aho7a、Aho7b、Aho7c、Sac7b。在一些实施方案中，所述DNA结合结构域选自Sso7d或Sto7d。在一些实施方案中，所述融合蛋白中，突变体通过多肽桥连接DNA结合结构域。在一些实施方案中，所述多肽桥选自GSGS多肽、PAPAPAPA多肽、AAAA多肽、GGGGS多肽、GQGQGQGQ多肽。在一些实施方案中，所述多肽桥为GSGS多肽。

在一些实施方案中，所述融合蛋白选自下列中的任意一个：

包含K16R、I121R、V125K、K226A、F235A、D371G、D373R、K470D的突变体-GSGS-p50；

包含K16R、I121R、V125K、K226A、F235A、D371G、D373R、K470D的突变体-GSGS-Sso7d；

包含K16R、I121R、V125K、K226A、F235A、D371G、D373R、K470D的突变体-GSGS-Sto7d；

包含K16R、I121R、V125K、K226A、F235A、D371G、D373R、K470D的突变体-GSGS-Aho7a；

包含K16R、I121R、V125K、K226A、F235A、D371G、D373R、K470D的突变体-GSGS-Aho7b；

包含K16R、I121R、V125K、K226A、F235A、D371G、D373R、K470D的突变体-GSGS-Aho7c；

包含K16R、I121R、V125K、K226A、F235A、D371G、D373R、K470D的突变体-GSGS-Sac7b；

包含K16R、I121R、V125K、K226A、F235A、D371G、D373R、K470D的突变体-PAPAPA-Sto7d；

包含K16R、I121R、V125K、K226A、F235A、D371G、D373R、K470D的突变体-AAAA-Sto7d；

Sto7d-AAAA-包含K16R、I121R、V125K、K226A、F235A、D371G、D373R、K470D的突变体-AAAA-Sto7d。

在一些实施方案中，所述融合蛋白的序列选自SEQ ID NO:8-17。在一些实施方案中，所述融合蛋白的序列如SEQ ID NO:8所示。在一些实施方案中，所述融合蛋白的序列如SEQ ID NO:9所示。在一些实施方案中，所述融合蛋白的序列如SEQ ID NO:10所示。在一些实施方案中，所述融合蛋白的序列如SEQ ID NO:11所示。在一些实施方案中，所述融合蛋白的序列如SEQ ID NO:12所示。在一些实施方案中，所述融合蛋白的序列如SEQ ID NO:13所示。在一些实施方案中，所述融合蛋白的序列如SEQ ID NO:14所示。在一些实施方案中，所述融合蛋白的序列如SEQ ID NO:15所示。在一些实施方案中，所述融合蛋白的序列如SEQID NO:16所示。在一些实施方案中，所述融合蛋白的序列如SEQ ID NO:17所示。

本发明还提供一种多核苷酸，其编码本发明的T4 DNA连接酶突变体或融合蛋白。在一些实施方案中，所述多核苷酸的序列选自SEQ ID NO:18-34。在一些实施方案中，所述多核苷酸的序列为SEQ ID NO:18。在一些实施方案中，所述多核苷酸的序列为SEQ ID NO:19。在一些实施方案中，所述多核苷酸的序列为SEQ ID NO:20。在一些实施方案中，所述多核苷酸的序列为SEQ ID NO:21。在一些实施方案中，所述多核苷酸的序列为SEQ ID NO:22。在一些实施方案中，所述多核苷酸的序列为SEQ ID NO:23。在一些实施方案中，所述多核苷酸的序列为SEQ ID NO:24。在一些实施方案中，所述多核苷酸的序列为SEQ ID NO:25。在一些实施方案中，所述多核苷酸的序列为SEQ ID NO:26。在一些实施方案中，所述多核苷酸的序列为SEQ ID NO:27。在一些实施方案中，所述多核苷酸的序列为SEQ ID NO:28。在一些实施方案中，所述多核苷酸的序列为SEQ ID NO:29。在一些实施方案中，所述多核苷酸的序列为SEQ ID NO:30。在一些实施方案中，所述多核苷酸的序列为SEQ ID NO:31。在一些实施方案中，所述多核苷酸的序列为SEQ ID NO:32。在一些实施方案中，所述多核苷酸的序列为SEQ ID NO:33。在一些实施方案中，所述多核苷酸的序列为SEQ ID NO:34。

本发明还提供一种表达载体，其掺入有本发明的多核苷酸。在一些实施方案中，所述表达载体掺入有选自SEQ ID NO:18-34的多核苷酸。

本发明还提供一种宿主细胞，其用本发明所述的多核苷酸转化并表达所述多核苷酸。在一些实施方案中，所述宿主细胞用选自SEQ ID NO:18-34的多核苷酸转化并表达所述多核苷酸。本发明还提供一种宿主细胞，其被用本发明所述的表达载体转化。在一些实施方案中，所述宿主细胞被用掺入有选自SEQ ID NO:18-34的多核苷酸的表达载体转化。

本发明还提供一种在宿主细胞中产生本发明的连接酶突变体或融合蛋白的方法，所述方法包括在使得产生本发明的连接酶突变体或融合蛋白的培养条件下培养本发明所述的宿主细胞。在一些实施方案中，所述产生本发明的连接酶突变体或融合蛋白的方法还包括从培养物和/或宿主细胞回收连接酶突变体或融合蛋白。在一些实施方案中，所述产生本发明的连接酶突变体或融合蛋白的方法还包括纯化所述连接酶突变体或融合蛋白的步骤。

本发明还提供一种组合物，所述组合物包含本发明的连接酶突变体或融合蛋白。

本发明还提供一种NGS建库方法，包括：(1)将DNA模板进行片段化，或总RNA模板进行纯化后片段化；(2)缺口修复；(3)连接酶介导的接头连接；(4)回收DNA；(5)文库扩增及纯化回收，其特征在于所述连接酶选自本发明的连接酶突变体或融合蛋白。在一些实施方案中，步骤(1)中的DNA片段化方法包括采用双链DNA片段化酶或机械打断方法；总RNA富集方法包括使用mRNA抓取磁珠和rRNA去除，包括探针杂交并采用RNase H消化或逆转录后使用双链特异性核酸酶消化。在一些实施方案中，步骤(2)中采用T4磷酸激酶和E.coli聚合酶进行缺口修复。在一些实施方案中，步骤(3)中接头反应的反应温度为20℃，反应时间为15min。在一些实施方案中，步骤(4)中文库纯化可使用磁珠直接纯化或进行长度分选。

本发明还提供一种用于产生DNA文库的方法，所述方法包括提供至少一种本发明的连接酶突变体或融合蛋白、包含输入双链DNA的底物、以及包含至少一种T加尾的衔接子寡核苷酸、腺苷和反应缓冲液的反应混合物组合物；在使得腺苷被添加至所述DNA的两条链的3’末端，并将所述T加尾的衔接子连接至所述输入DNA末端的条件下，将所述至少一种突变体或融合蛋白、所述底物和所述反应混合物混合，以产生包含DNA文库的产物。在一些实施方案中，所述输入双链DNA直接来自片段化后的基因组DNA。在一些实施方案中，所述输入双链DNA为片段化后的mRNA进行双链cDNA的合成所得。

野生型和突变体T4 DNA连接酶及融合蛋白的氨基酸序列见SEQ ID NO:1-17。

SEQ ID NO.1

MILKILNEIASIGSTKQKQAILEKNKDNELLKRVYRLTYSRGLQYYIKKWPKPGIATQSFGMLTLTDMLDFIEFTLATRKLTGNAAIEELTGYITDGKKDDVEVLRRVMMRDLECGASVSIANKVWPGLIPEQPQMLASSYDEKGINKNIKFPAFAQLKADGARCFAEVRGDELDDVRLLSRAGNEYLGLDLLKEELIKMTAEARQIHPEGVLIDGELVYHEQVKKEPEGLDFLFDAYPENSKAKEFAEVAESRTASNGIANKSLKGTISEKEAQCMKFQVWDYVPLVEIYSLPAFRLKYDVRFSKLEQMTSGYDKVILIENQVVNNLDEAKVIYKKYIDQGLEGIILKNIDGLWENARSKNLYKFKEVIDVDLKIVGIYPHRKDPTKAGGFILESECGKIKVNAGSGLKDKAGVKSHELDRTRIMENQNYYIGKILECECNGWLKSDGRTDYVKLFLPIAIRLREDKTKANTFEDVFGDFHEVTGL

SEQ ID NO.2

MILKILNEIASIGSTRQKQAILEKNKDNELLKRVYRLTYSRGLQYYIKKWPKPGIATQSFGMLTLTDMLDFIEFTLATRKLTGNAAIEELTGYITDGKKDDVEVLRRVMMRDLECGASVSRANKKWPGLIPEQPQMLASSYDEKGINKNIKFPAFAQLKADGARCFAEVRGDELDDVRLLSRAGNEYLGLDLLKEELIKMTAEARQIHPEGVLIDGELVYHEQVKAEPEGLDFLADAYPENSKAKEFAEVAESRTASNGIANKSLKGTISEKEAQCMKFQVWDYVPLVEIYSLPAFRLKYDVRFSKLEQMTSGYDKVILIENQVVNNLDEAKVIYKKYIDQGLEGIILKNIDGLWENARSKNLYKFKEVIGVRLKIVGIYPHRKDPTKAGGFILESECGKIKVNAGSGLKDKAGVKSHELDRTRIMENQNYYIGKILECECNGWLKSDGRTDYVKLFLPIAIRLREDKTKANTFEDVFGDFHEVTGL

SEQ ID NO.3

MILKILNEIASIGSTRQKQAILEKNKDNELLKRVYRLTYSRGLQYYIKKWPKPGIATQSFGMLTLTDMLDFIEFTLATRKLTGNAAIEELTGYITDGKKDDVEVLRRVMMRDLECGASVSRANKKWPGLIPEQPQMLASSYDEKGINKNIKFPAFAQLKADGARCFAEVRGDELDDVRLLSRAGNEYLGLDLLKEELIKMTAEARQIHPEGVLIDGELVYHEQVKAEPEGLDFLADAYPENSKAKEFAEVAESRTASNGIANKSLKGTISEKEAQCMKFQVWDYVPLVEIYSLPAFRLKYDVRFSKLEQMTSGYDKVILIENQVVNNLDEAKVIYKKYIDQGLEGIILKNIDGLWENARSKNLYKFKEVIGVRLKIVGIYPHRKKPTKAGGFILESECGKIKVNAGSGLKDKAGVKSHELDRTRIMENQNYYIGKILECECNGWLKSDGRTDYVKLFLPIAIRLREDKTKANTFEDVFGDFHEVTGL

Seq ID NO.4

MILKILNEIASIGSTRQKQAILEKNKDNELLKRVYRLTYSRGLQYYIKKWPKPGIATQSFGMLTLTDMLDFIEFTLATRKLTGNAAIEELTGYITDGKKDDVEVLRRVMMRDLECGASVSRANKKWPGLIPEQPQMLASSYDEKGINKNIKFPAFAQLKADGARCFAEVRGDELDDVRLLSRAGNEYLGLDLLKEELIKMTAEARQIHPEGVLIDGELVYHEQVKAEPEGLDFLADAYPENSKAKEFAEVAESRTASNGIANKSLKGTISEKEAQCMKFQVWDYVPLVEIYSLPAFRLKYDVRFSKLEQMTSGYDKVILIENQVVNNLDEAKVIYKKYIDQGLEGIILKNIDGLWENARSKNLYKFKEVIGVRLKIVGIYPHRKDPTKAGGFILESECGKIKVNAGSGLKDKAGVKSHELDRTRIMENQNYYIGKILRCECNGWLKSDGRTDYVKLFLPIAIRLREDKTKANTFEDVFGDFHEVTGL

Seq ID NO.5

MILKILNEIASIGSTRQKQAILEKNKDNELLKRVYRLTYSRGLQYYIKKWPKPGIATQSFGMLTLTDMLDFIEFTLATRKLTGNAAIEELTGYITDGKKDDVEVLRRVMMRDLECGASVSRANKKWPGLIPEQPQMLASSYDEKGINKNIKFPAFAQLKADGARCFAEVRGDELDDVRLLSRAGNEYLGLDLLKEELIKMTAEARQIHPEGVLIDGELVYHEQVKAEPEGLDFLADAYPENSKAKEFAEVAESRTASNGIANKSLKGTISEKEAQCMKFQVWDYVPLVEIYSLPAFRLKYDVRFSKLEQMTSGYDKVILIENQVVNNLDEAKVIYKKYIDQGLEGIILKNIDGLWENARSKNLYKFKEVIGVRLKIVGIYPHRKDPTKAGGFILESECGKIKVNAGSGLKDKAGVKSHELDRTRIMENQNYYIGKILECECNGWLKSKGRTDYVKLFLPIAIRLREDKTKANTFEDVFGDFHEVTGL

Seq ID NO.6

MILKILNEIASIGSTRQKQAILEKNKDNELLKRVYRLTYSRGLQYYIKKWPKPGIATQSFGMLTLTDMLDFIEFTLATRKLTGNAAIEELTGYITDGKKDDVEVLRRVMMRDLECGASVSRANKKWPGLIPEQPQMLASSYDEKGINKNIKFPAFAQLKADGARCFAEVRGDELDDVRLLSRAGNEYLGLDLLKEELIKMTAEARQIHPEGVLIDGELVYHEQVKAEPEGLDFLADAYPENSKAKEFAEVAESRTASNGIANKSLKGTISEKEAQCMKFQVWDYVPLVEIYSLPAFRLKYDVRFSKLEQMTSGYDKVILIENQVVNNLDEAKVIYKKYIDQGLEGIILKNIDGLWENARSKNLYKFKEVIGVRLKIVGIYPHRKDPTKAGGFILESECGKIKVNAGSGLKDKAGVKSHELDRTRIMENQNYYIGKILECECNGWLKSDGRTDYVKLFLPIAIRLREDKTDANTFEDVFGDFHEVTGL

Seq ID NO.7

Seq ID NO.8

MILKILNEIASIGSTRQKQAILEKNKDNELLKRVYRLTYSRGLQYYIKKWPKPGIATQSFGMLTLTDMLDFIEFTLATRKLTGNAAIEELTGYITDGKKDDVEVLRRVMMRDLECGASVSRANKKWPGLIPEQPQMLASSYDEKGINKNIKFPAFAQLKADGARCFAEVRGDELDDVRLLSRAGNEYLGLDLLKEELIKMTAEARQIHPEGVLIDGELVYHEQVKAEPEGLDFLADAYPENSKAKEFAEVAESRTASNGIANKSLKGTISEKEAQCMKFQVWDYVPLVEIYSLPAFRLKYDVRFSKLEQMTSGYDKVILIENQVVNNLDEAKVIYKKYIDQGLEGIILKNIDGLWENARSKNLYKFKEVIGVRLKIVGIYPHRKDPTKAGGFILESECGKIKVNAGSGLKDKAGVKSHELDRTRIMENQNYYIGKILECECNGWLKSDGRTDYVKLFLPIAIRLREDKTDANTFEDVFGDFHEVTGLGSGSMAEDDPYLGRPEQMFHLDPSLTHTIFNPEVFQPQMALPTDGPYLQILEQPKQRGFRFRYVCEGPSHGGLPGASSEKNKKSYPQVKICNYVGPAKVIVQLVTNGKNIHLHAHSLVGKHCEDGICTVTAGPKDMVVGFANLGILHVTKKKVFETLEARMTEACIRGYNPGLLVHPDLAYLQAEGGGDRQLGDREKELIRQAALQQTKEMDLSVVRLMFTAFLPDSTGSFTRRLEPVVSDAIYDSKAPNASNLKIVRMDRTAGCVTGGEEIYLLCDKVQKDDIQIRFYEEEENGGVWEGFGDFSPTDVHRQFAIVFKTPKYKDINITKPASVFVQLRRKSDLETSEPKPFLYYPEIKDKEEVQRKRQKLMPNFSDSFGGGSGAGAGGGGMFGSGGGGGGTGSTGPGYSFPHYGFPTYGGITFHPGTTKSNAGMKHG

SEQ ID NO.9

MILKILNEIASIGSTRQKQAILEKNKDNELLKRVYRLTYSRGLQYYIKKWPKPGIATQSFGMLTLTDMLDFIEFTLATRKLTGNAAIEELTGYITDGKKDDVEVLRRVMMRDLECGASVSRANKKWPGLIPEQPQMLASSYDEKGINKNIKFPAFAQLKADGARCFAEVRGDELDDVRLLSRAGNEYLGLDLLKEELIKMTAEARQIHPEGVLIDGELVYHEQVKAEPEGLDFLADAYPENSKAKEFAEVAESRTASNGIANKSLKGTISEKEAQCMKFQVWDYVPLVEIYSLPAFRLKYDVRFSKLEQMTSGYDKVILIENQVVNNLDEAKVIYKKYIDQGLEGIILKNIDGLWENARSKNLYKFKEVIGVRLKIVGIYPHRKDPTKAGGFILESECGKIKVNAGSGLKDKAGVKSHELDRTRIMENQNYYIGKILECECNGWLKSDGRTDYVKLFLPIAIRLREDKTDANTFEDVFGDFHEVTGLGSGSMATVKFKYKGEEKEVDISKIKKVWRVGKMISFTYDEGGGKTGRGAVSEKDAPKELLQMLEKQKK

SEQ ID NO.10

MILKILNEIASIGSTRQKQAILEKNKDNELLKRVYRLTYSRGLQYYIKKWPKPGIATQSFGMLTLTDMLDFIEFTLATRKLTGNAAIEELTGYITDGKKDDVEVLRRVMMRDLECGASVSRANKKWPGLIPEQPQMLASSYDEKGINKNIKFPAFAQLKADGARCFAEVRGDELDDVRLLSRAGNEYLGLDLLKEELIKMTAEARQIHPEGVLIDGELVYHEQVKAEPEGLDFLADAYPENSKAKEFAEVAESRTASNGIANKSLKGTISEKEAQCMKFQVWDYVPLVEIYSLPAFRLKYDVRFSKLEQMTSGYDKVILIENQVVNNLDEAKVIYKKYIDQGLEGIILKNIDGLWENARSKNLYKFKEVIGVRLKIVGIYPHRKDPTKAGGFILESECGKIKVNAGSGLKDKAGVKSHELDRTRIMENQNYYIGKILECECNGWLKSDGRTDYVKLFLPIAIRLREDKTDANTFEDVFGDFHEVTGLGSGSMVTVKFKYKGEEKEVDISKIKKVWRVGKMISFTYDDNGKTGRGAVSEKDAPKELLQMLEKSGKK

SEQ ID NO.11

MILKILNEIASIGSTRQKQAILEKNKDNELLKRVYRLTYSRGLQYYIKKWPKPGIATQSFGMLTLTDMLDFIEFTLATRKLTGNAAIEELTGYITDGKKDDVEVLRRVMMRDLECGASVSRANKKWPGLIPEQPQMLASSYDEKGINKNIKFPAFAQLKADGARCFAEVRGDELDDVRLLSRAGNEYLGLDLLKEELIKMTAEARQIHPEGVLIDGELVYHEQVKAEPEGLDFLADAYPENSKAKEFAEVAESRTASNGIANKSLKGTISEKEAQCMKFQVWDYVPLVEIYSLPAFRLKYDVRFSKLEQMTSGYDKVILIENQVVNNLDEAKVIYKKYIDQGLEGIILKNIDGLWENARSKNLYKFKEVIGVRLKIVGIYPHRKDPTKAGGFILESECGKIKVNAGSGLKDKAGVKSHELDRTRIMENQNYYIGKILECECNGWLKSDGRTDYVKLFLPIAIRLREDKTDANTFEDVFGDFHEVTGLGSGSMTTVKFKYKGEEKEVDISKIKKVWRVGKMISFTYDDNGKTGRGAVSEKDAPKELLEKLEKK

SEQ ID NO.12

MILKILNEIASIGSTRQKQAILEKNKDNELLKRVYRLTYSRGLQYYIKKWPKPGIATQSFGMLTLTDMLDFIEFTLATRKLTGNAAIEELTGYITDGKKDDVEVLRRVMMRDLECGASVSRANKKWPGLIPEQPQMLASSYDEKGINKNIKFPAFAQLKADGARCFAEVRGDELDDVRLLSRAGNEYLGLDLLKEELIKMTAEARQIHPEGVLIDGELVYHEQVKAEPEGLDFLADAYPENSKAKEFAEVAESRTASNGIANKSLKGTISEKEAQCMKFQVWDYVPLVEIYSLPAFRLKYDVRFSKLEQMTSGYDKVILIENQVVNNLDEAKVIYKKYIDQGLEGIILKNIDGLWENARSKNLYKFKEVIGVRLKIVGIYPHRKDPTKAGGFILESECGKIKVNAGSGLKDKAGVKSHELDRTRIMENQNYYIGKILECECNGWLKSDGRTDYVKLFLPIAIRLREDKTDANTFEDVFGDFHEVTGLGSGSMATKVKFKYKGEEKEVDISKIKKVWRVGKMISFTYDDNGKTGRGAVSEKDAPKELLDKLEKK

SEQ ID NO.13

MILKILNEIASIGSTRQKQAILEKNKDNELLKRVYRLTYSRGLQYYIKKWPKPGIATQSFGMLTLTDMLDFIEFTLATRKLTGNAAIEELTGYITDGKKDDVEVLRRVMMRDLECGASVSRANKKWPGLIPEQPQMLASSYDEKGINKNIKFPAFAQLKADGARCFAEVRGDELDDVRLLSRAGNEYLGLDLLKEELIKMTAEARQIHPEGVLIDGELVYHEQVKAEPEGLDFLADAYPENSKAKEFAEVAESRTASNGIANKSLKGTISEKEAQCMKFQVWDYVPLVEIYSLPAFRLKYDVRFSKLEQMTSGYDKVILIENQVVNNLDEAKVIYKKYIDQGLEGIILKNIDGLWENARSKNLYKFKEVIGVRLKIVGIYPHRKDPTKAGGFILESECGKIKVNAGSGLKDKAGVKSHELDRTRIMENQNYYIGKILECECNGWLKSDGRTDYVKLFLPIAIRLREDKTDANTFEDVFGDFHEVTGLGSGSMATKVKFKYKGEEKEVDISKIKKVWRVGKMISFTYDDNGKTGRGAVSEKDAPKELLEKLK

SEQ ID NO.14

MILKILNEIASIGSTRQKQAILEKNKDNELLKRVYRLTYSRGLQYYIKKWPKPGIATQSFGMLTLTDMLDFIEFTLATRKLTGNAAIEELTGYITDGKKDDVEVLRRVMMRDLECGASVSRANKKWPGLIPEQPQMLASSYDEKGINKNIKFPAFAQLKADGARCFAEVRGDELDDVRLLSRAGNEYLGLDLLKEELIKMTAEARQIHPEGVLIDGELVYHEQVKAEPEGLDFLADAYPENSKAKEFAEVAESRTASNGIANKSLKGTISEKEAQCMKFQVWDYVPLVEIYSLPAFRLKYDVRFSKLEQMTSGYDKVILIENQVVNNLDEAKVIYKKYIDQGLEGIILKNIDGLWENARSKNLYKFKEVIGVRLKIVGIYPHRKDPTKAGGFILESECGKIKVNAGSGLKDKAGVKSHELDRTRIMENQNYYIGKILECECNGWLKSDGRTDYVKLFLPIAIRLREDKTDANTFEDVFGDFHEVTGLGSGSMVKVKFKYKGEEKEVDTSKIKKVWRVGKMVSFTYDDNGKTGRGAVSEKDAPKELLDMLARAEREKK

SEQ ID NO.15

MILKILNEIASIGSTRQKQAILEKNKDNELLKRVYRLTYSRGLQYYIKKWPKPGIATQSFGMLTLTDMLDFIEFTLATRKLTGNAAIEELTGYITDGKKDDVEVLRRVMMRDLECGASVSRANKKWPGLIPEQPQMLASSYDEKGINKNIKFPAFAQLKADGARCFAEVRGDELDDVRLLSRAGNEYLGLDLLKEELIKMTAEARQIHPEGVLIDGELVYHEQVKAEPEGLDFLADAYPENSKAKEFAEVAESRTASNGIANKSLKGTISEKEAQCMKFQVWDYVPLVEIYSLPAFRLKYDVRFSKLEQMTSGYDKVILIENQVVNNLDEAKVIYKKYIDQGLEGIILKNIDGLWENARSKNLYKFKEVIGVRLKIVGIYPHRKDPTKAGGFILESECGKIKVNAGSGLKDKAGVKSHELDRTRIMENQNYYIGKILECECNGWLKSDGRTDYVKLFLPIAIRLREDKTDANTFEDVFGDFHEVTGLPAPAPAPAMVTVKFKYKGEEKEVDISKIKKVWRVGKMISFTYDDNGKTGRGAVSEKDAPKELLQMLEKSGKK

SEQ ID NO.16

MILKILNEIASIGSTRQKQAILEKNKDNELLKRVYRLTYSRGLQYYIKKWPKPGIATQSFGMLTLTDMLDFIEFTLATRKLTGNAAIEELTGYITDGKKDDVEVLRRVMMRDLECGASVSRANKKWPGLIPEQPQMLASSYDEKGINKNIKFPAFAQLKADGARCFAEVRGDELDDVRLLSRAGNEYLGLDLLKEELIKMTAEARQIHPEGVLIDGELVYHEQVKAEPEGLDFLADAYPENSKAKEFAEVAESRTASNGIANKSLKGTISEKEAQCMKFQVWDYVPLVEIYSLPAFRLKYDVRFSKLEQMTSGYDKVILIENQVVNNLDEAKVIYKKYIDQGLEGIILKNIDGLWENARSKNLYKFKEVIGVRLKIVGIYPHRKDPTKAGGFILESECGKIKVNAGSGLKDKAGVKSHELDRTRIMENQNYYIGKILECECNGWLKSDGRTDYVKLFLPIAIRLREDKTDANTFEDVFGDFHEVTGLAAAAMVTVKFKYKGEEKEVDISKIKKVWRVGKMISFTYDDNGKTGRGAVSEKDAPKELLQMLEKSGKK

SEQ ID NO.17

MVTVKFKYKGEEKEVDISKIKKVWRVGKMISFTYDDNGKTGRGAVSEKDAPKELLQMLEKSGKKAAAAMILKILNEIASIGSTRQKQAILEKNKDNELLKRVYRLTYSRGLQYYIKKWPKPGIATQSFGMLTLTDMLDFIEFTLATRKLTGNAAIEELTGYITDGKKDDVEVLRRVMMRDLECGASVSRANKKWPGLIPEQPQMLASSYDEKGINKNIKFPAFAQLKADGARCFAEVRGDELDDVRLLSRAGNEYLGLDLLKEELIKMTAEARQIHPEGVLIDGELVYHEQVKAEPEGLDFLADAYPENSKAKEFAEVAESRTASNGIANKSLKGTISEKEAQCMKFQVWDYVPLVEIYSLPAFRLKYDVRFSKLEQMTSGYDKVILIENQVVNNLDEAKVIYKKYIDQGLEGIILKNIDGLWENARSKNLYKFKEVIGVRLKIVGIYPHRKDPTKAGGFILESECGKIKVNAGSGLKDKAGVKSHELDRTRIMENQNYYIGKILECECNGWLKSDGRTDYVKLFLPIAIRLREDKTDANTFEDVFGDFHEVTGLAAAAMVTVKFKYKGEEKEVDISKIKKVWRVGKMISFTYDDNGKTGRGAVSEKDAPKELLQMLEKSGKK

氨基酸序列如SEQ ID NO:1-17的野生型和突变体T4 DNA连接酶及融合蛋白的核苷酸编码序列见SEQ ID NO:18-34。

SEQ ID NO:18

ATGCATCACCACCACCATCACATCTTGAAGATCCTGAATGAGATCGCTTCTATCGGCAGCACCAAACAAAAGCAGGCCATCTTGGAGAAAAACAAGGATAACGAATTACTGAAACGCGTGTACCGCTTGACCTATTCCCGCGGCCTGCAGTATTACATAAAAAAGTGGCCGAAACCGGGTATCGCTACCCAGTCGTTCGGTATGTTGACGCTGACGGATATGCTGGATTTCATTGAGTTCACCCTGGCGACCCGTAAACTCACCGGAAACGCGGCAATCGAGGAGCTGACGGGTTACATTACCGACGGCAAAAAAGATGATGTGGAAGTGCTGCGTCGTGTTATGATGCGCGATTTGGAGTGCGGCGCATCTGTTAGCATAGCTAATAAGGTGTGGCCAGGTCTGATTCCGGAGCAACCGCAGATGCTGGCTTCGTCCTATGACGAGAAGGGTATTAACAAGAACATTAAGTTCCCGGCATTCGCGCAACTAAAGGCGGATGGCGCGCGTTGTTTTGCGGAAGTACGCGGTGACGAACTTGACGACGTTAGACTCCTGAGCCGCGCAGGCAACGAATATCTGGGTCTGGACCTGCTTAAGGAGGAACTGATTAAAATGACTGCGGAGGCGCGTCAGATTCATCCGGAGGGTGTGCTGATCGACGGCGAGCTGGTGTACCACGAACAAGTTAAAAAGGAGCCGGAGGGTTTGGACTTCTTGTTCGACGCATATCCGGAAAACAGCAAGGCCAAAGAGTTCGCGGAAGTTGCGGAATCTCGCACGGCAAGCAACGGCATCGCGAACAAGTCCCTGAAGGGCACCATTAGCGAAAAAGAGGCCCAATGTATGAAATTTCAGGTGTGGGATTACGTGCCGCTGGTTGAAATTTACAGCCTGCCTGCTTTTCGTCTGAAGTACGACGTTCGTTTTAGCAAACTGGAACAAATGACCTCCGGTTATGATAAGGTGATCCTGATCGAGAACCAGGTTGTTAATAATCTGGACGAAGCCAAAGTCATCTACAAAAAATACATCGACCAGGGTTTGGAGGGCATCATTTTGAAGAACATCGACGGCCTGTGGGAAAACGCGCGTAGCAAAAATTTATATAAATTCAAAGAGGTGATTGATGTCGATCTGAAGATCGTGGGCATCTACCCACATCGTAAGGACCCGACAAAGGCGGGCGGTTTTATCCTGGAGAGCGAATGCGGTAAAATCAAGGTTAACGCCGGTAGCGGTTTAAAGGACAAAGCTGGGGTGAAGTCGCACGAGTTGGATCGTACCCGGATTATGGAAAACCAGAATTATTATATTGGAAAAATTTTGGAGTGCGAATGCAATGGCTGGCTGAAGTCCGATGGTAGAACTGACTACGTTAAGCTGTTTCTTCCGATTGCGATTCGTCTGCGTGAAGATAAAACCAAAGCGAATACCTTTGAAGACGTATTTGGCGATTTCCACGAAGTCACCGGTCTT

SEQ ID NO:19

ATGCATCACCACCACCATCACATCTTGAAGATCCTGAATGAGATCGCTTCTATCGGCAGCACCAAACAAAAGCAGGCCATCTTGGAGAAAAACAAGGATAACGAATTACTGAAACGCGTGTACCGCTTGACCTATTCCCGCGGCCTGCAGTATTACATAAAAAAGTGGCCGAAACCGGGTATCGCTACCCAGTCGTTCGGTATGTTGACGCTGACGGATATGCTGGATTTCATTGAGTTCACCCTGGCGACCCGTAAACTCACCGGAAACGCGGCAATCGAGGAGCTGACGGGTTACATTACCGACGGCAAAAAAGATGATGTGGAAGTGCTGCGTCGTGTTATGATGCGCGATTTGGAGTGCGGCGCATCTGTTAGCATAGCTAATAAGGTGTGGCCAGGTCTGATTCCGGAGCAACCGCAGATGCTGGCTTCGTCCTATGACGAGAAGGGTATTAACAAGAACATTAAGTTCCCGGCATTCGCGCAACTAAAGGCGGATGGCGCGCGTTGTTTTGCGGAAGTACGCGGTGACGAACTTGACGACGTTAGACTCCTGAGCCGCGCAGGCAACGAATATCTGGGTCTGGACCTGCTTAAGGAGGAACTGATTAAAATGACTGCGGAGGCGCGTCAGATTCATCCGGAGGGTGTGCTGATCGACGGCGAGCTGGTGTACCACGAACAAGTTAAAAAGGAGCCGGAGGGTTTGGACTTCTTGTTCGACGCATATCCGGAAAACAGCAAGGCCAAAGAGTTCGCGGAAGTTGCGGAATCTCGCACGGCAAGCAACGGCATCGCGAACAAGTCCCTGAAGGGCACCATTAGCGAAAAAGAGGCCCAATGTATGAAATTTCAGGTGTGGGATTACGTGCCGCTGGTTGAAATTTACAGCCTGCCTGCTTTTCGTCTGAAGTACGACGTTCGTTTTAGCAAACTGGAACAAATGACCTCCGGTTATGATAAGGTGATCCTGATCGAGAACCAGGTTGTTAATAATCTGGACGAAGCCAAAGTCATCTACAAAAAATACATCGACCAGGGTTTGGAGGGCATCATTTTGAAGAACATCGACGGCCTGTGGGAAAACGCGCGTAGCAAAAATTTATATAAATTCAAAGAGGTGATTGGCGTCCGCCTGAAGATCGTGGGCATCTACCCACATCGTAAGGACCCGACAAAGGCGGGCGGTTTTATCCTGGAGAGCGAATGCGGTAAAATCAAGGTTAACGCCGGTAGCGGTTTAAAGGACAAAGCTGGGGTGAAGTCGCACGAGTTGGATCGTACCCGGATTATGGAAAACCAGAATTATTATATTGGAAAAATTTTGGAGTGCGAATGCAATGGCTGGCTGAAGTCCGATGGTAGAACTGACTACGTTAAGCTGTTTCTTCCGATTGCGATTCGTCTGCGTGAAGATAAAACCAAAGCGAATACCTTTGAAGACGTATTTGGCGATTTCCACGAAGTCACCGGTCTT

SEQ ID NO:20

ATGCATCACCACCACCATCACATCTTGAAGATCCTGAATGAGATCGCTTCTATCGGCAGCACCAAACAAAAGCAGGCCATCTTGGAGAAAAACAAGGATAACGAATTACTGAAACGCGTGTACCGCTTGACCTATTCCCGCGGCCTGCAGTATTACATAAAAAAGTGGCCGAAACCGGGTATCGCTACCCAGTCGTTCGGTATGTTGACGCTGACGGATATGCTGGATTTCATTGAGTTCACCCTGGCGACCCGTAAACTCACCGGAAACGCGGCAATCGAGGAGCTGACGGGTTACATTACCGACGGCAAAAAAGATGATGTGGAAGTGCTGCGTCGTGTTATGATGCGCGATTTGGAGTGCGGCGCATCTGTTAGCATAGCTAATAAGGTGTGGCCAGGTCTGATTCCGGAGCAACCGCAGATGCTGGCTTCGTCCTATGACGAGAAGGGTATTAACAAGAACATTAAGTTCCCGGCATTCGCGCAACTAAAGGCGGATGGCGCGCGTTGTTTTGCGGAAGTACGCGGTGACGAACTTGACGACGTTAGACTCCTGAGCCGCGCAGGCAACGAATATCTGGGTCTGGACCTGCTTAAGGAGGAACTGATTAAAATGACTGCGGAGGCGCGTCAGATTCATCCGGAGGGTGTGCTGATCGACGGCGAGCTGGTGTACCACGAACAAGTTAAAAAGGAGCCGGAGGGTTTGGACTTCTTGTTCGACGCATATCCGGAAAACAGCAAGGCCAAAGAGTTCGCGGAAGTTGCGGAATCTCGCACGGCAAGCAACGGCATCGCGAACAAGTCCCTGAAGGGCACCATTAGCGAAAAAGAGGCCCAATGTATGAAATTTCAGGTGTGGGATTACGTGCCGCTGGTTGAAATTTACAGCCTGCCTGCTTTTCGTCTGAAGTACGACGTTCGTTTTAGCAAACTGGAACAAATGACCTCCGGTTATGATAAGGTGATCCTGATCGAGAACCAGGTTGTTAATAATCTGGACGAAGCCAAAGTCATCTACAAAAAATACATCGACCAGGGTTTGGAGGGCATCATTTTGAAGAACATCGACGGCCTGTGGGAAAACGCGCGTAGCAAAAATTTATATAAATTCAAAGAGGTGATTGGCGTCGATCTGAAGATCGTGGGCATCTACCCACATCGTAAGAAACCGACAAAGGCGGGCGGTTTTATCCTGGAGAGCGAATGCGGTAAAATCAAGGTTAACGCCGGTAGCGGTTTAAAGGACAAAGCTGGGGTGAAGTCGCACGAGTTGGATCGTACCCGGATTATGGAAAACCAGAATTATTATATTGGAAAAATTTTGGAGTGCGAATGCAATGGCTGGCTGAAGTCCGATGGTAGAACTGACTACGTTAAGCTGTTTCTTCCGATTGCGATTCGTCTGCGTGAAGATAAAACCAAAGCGAATACCTTTGAAGACGTATTTGGCGATTTCCACGAAGTCACCGGTCTT

SEQ ID NO:21

ATGCATCACCACCACCATCACATCTTGAAGATCCTGAATGAGATCGCTTCTATCGGCAGCACCAAACAAAAGCAGGCCATCTTGGAGAAAAACAAGGATAACGAATTACTGAAACGCGTGTACCGCTTGACCTATTCCCGCGGCCTGCAGTATTACATAAAAAAGTGGCCGAAACCGGGTATCGCTACCCAGTCGTTCGGTATGTTGACGCTGACGGATATGCTGGATTTCATTGAGTTCACCCTGGCGACCCGTAAACTCACCGGAAACGCGGCAATCGAGGAGCTGACGGGTTACATTACCGACGGCAAAAAAGATGATGTGGAAGTGCTGCGTCGTGTTATGATGCGCGATTTGGAGTGCGGCGCATCTGTTAGCATAGCTAATAAGGTGTGGCCAGGTCTGATTCCGGAGCAACCGCAGATGCTGGCTTCGTCCTATGACGAGAAGGGTATTAACAAGAACATTAAGTTCCCGGCATTCGCGCAACTAAAGGCGGATGGCGCGCGTTGTTTTGCGGAAGTACGCGGTGACGAACTTGACGACGTTAGACTCCTGAGCCGCGCAGGCAACGAATATCTGGGTCTGGACCTGCTTAAGGAGGAACTGATTAAAATGACTGCGGAGGCGCGTCAGATTCATCCGGAGGGTGTGCTGATCGACGGCGAGCTGGTGTACCACGAACAAGTTAAAAAGGAGCCGGAGGGTTTGGACTTCTTGTTCGACGCATATCCGGAAAACAGCAAGGCCAAAGAGTTCGCGGAAGTTGCGGAATCTCGCACGGCAAGCAACGGCATCGCGAACAAGTCCCTGAAGGGCACCATTAGCGAAAAAGAGGCCCAATGTATGAAATTTCAGGTGTGGGATTACGTGCCGCTGGTTGAAATTTACAGCCTGCCTGCTTTTCGTCTGAAGTACGACGTTCGTTTTAGCAAACTGGAACAAATGACCTCCGGTTATGATAAGGTGATCCTGATCGAGAACCAGGTTGTTAATAATCTGGACGAAGCCAAAGTCATCTACAAAAAATACATCGACCAGGGTTTGGAGGGCATCATTTTGAAGAACATCGACGGCCTGTGGGAAAACGCGCGTAGCAAAAATTTATATAAATTCAAAGAGGTGATTGGCGTCGATCTGAAGATCGTGGGCATCTACCCACATCGTAAGGACCCGACAAAGGCGGGCGGTTTTATCCTGGAGAGCGAATGCGGTAAAATCAAGGTTAACGCCGGTAGCGGTTTAAAGGACAAAGCTGGGGTGAAGTCGCACGAGTTGGATCGTACCCGGATTATGGAAAACCAGAATTATTATATTGGAAAAATTTTGCGCTGCGAATGCAATGGCTGGCTGAAGTCCGATGGTAGAACTGACTACGTTAAGCTGTTTCTTCCGATTGCGATTCGTCTGCGTGAAGATAAAACCAAAGCGAATACCTTTGAAGACGTATTTGGCGATTTCCACGAAGTCACCGGTCTT

SEQ ID NO:22

ATGCATCACCACCACCATCACATCTTGAAGATCCTGAATGAGATCGCTTCTATCGGCAGCACCAAACAAAAGCAGGCCATCTTGGAGAAAAACAAGGATAACGAATTACTGAAACGCGTGTACCGCTTGACCTATTCCCGCGGCCTGCAGTATTACATAAAAAAGTGGCCGAAACCGGGTATCGCTACCCAGTCGTTCGGTATGTTGACGCTGACGGATATGCTGGATTTCATTGAGTTCACCCTGGCGACCCGTAAACTCACCGGAAACGCGGCAATCGAGGAGCTGACGGGTTACATTACCGACGGCAAAAAAGATGATGTGGAAGTGCTGCGTCGTGTTATGATGCGCGATTTGGAGTGCGGCGCATCTGTTAGCATAGCTAATAAGGTGTGGCCAGGTCTGATTCCGGAGCAACCGCAGATGCTGGCTTCGTCCTATGACGAGAAGGGTATTAACAAGAACATTAAGTTCCCGGCATTCGCGCAACTAAAGGCGGATGGCGCGCGTTGTTTTGCGGAAGTACGCGGTGACGAACTTGACGACGTTAGACTCCTGAGCCGCGCAGGCAACGAATATCTGGGTCTGGACCTGCTTAAGGAGGAACTGATTAAAATGACTGCGGAGGCGCGTCAGATTCATCCGGAGGGTGTGCTGATCGACGGCGAGCTGGTGTACCACGAACAAGTTAAAAAGGAGCCGGAGGGTTTGGACTTCTTGTTCGACGCATATCCGGAAAACAGCAAGGCCAAAGAGTTCGCGGAAGTTGCGGAATCTCGCACGGCAAGCAACGGCATCGCGAACAAGTCCCTGAAGGGCACCATTAGCGAAAAAGAGGCCCAATGTATGAAATTTCAGGTGTGGGATTACGTGCCGCTGGTTGAAATTTACAGCCTGCCTGCTTTTCGTCTGAAGTACGACGTTCGTTTTAGCAAACTGGAACAAATGACCTCCGGTTATGATAAGGTGATCCTGATCGAGAACCAGGTTGTTAATAATCTGGACGAAGCCAAAGTCATCTACAAAAAATACATCGACCAGGGTTTGGAGGGCATCATTTTGAAGAACATCGACGGCCTGTGGGAAAACGCGCGTAGCAAAAATTTATATAAATTCAAAGAGGTGATTGGCGTCGATCTGAAGATCGTGGGCATCTACCCACATCGTAAGGACCCGACAAAGGCGGGCGGTTTTATCCTGGAGAGCGAATGCGGTAAAATCAAGGTTAACGCCGGTAGCGGTTTAAAGGACAAAGCTGGGGTGAAGTCGCACGAGTTGGATCGTACCCGGATTATGGAAAACCAGAATTATTATATTGGAAAAATTTTGGAGTGCGAATGCAATGGCTGGCTGAAGTCCAAGGGTAGAACTGACTACGTTAAGCTGTTTCTTCCGATTGCGATTCGTCTGCGTGAAGATAAAACCAAAGCGAATACCTTTGAAGACGTATTTGGCGATTTCCACGAAGTCACCGGTCTT

SEQ ID NO:23

ATGCATCACCACCACCATCACATCTTGAAGATCCTGAATGAGATCGCTTCTATCGGCAGCACCAAACAAAAGCAGGCCATCTTGGAGAAAAACAAGGATAACGAATTACTGAAACGCGTGTACCGCTTGACCTATTCCCGCGGCCTGCAGTATTACATAAAAAAGTGGCCGAAACCGGGTATCGCTACCCAGTCGTTCGGTATGTTGACGCTGACGGATATGCTGGATTTCATTGAGTTCACCCTGGCGACCCGTAAACTCACCGGAAACGCGGCAATCGAGGAGCTGACGGGTTACATTACCGACGGCAAAAAAGATGATGTGGAAGTGCTGCGTCGTGTTATGATGCGCGATTTGGAGTGCGGCGCATCTGTTAGCATAGCTAATAAGGTGTGGCCAGGTCTGATTCCGGAGCAACCGCAGATGCTGGCTTCGTCCTATGACGAGAAGGGTATTAACAAGAACATTAAGTTCCCGGCATTCGCGCAACTAAAGGCGGATGGCGCGCGTTGTTTTGCGGAAGTACGCGGTGACGAACTTGACGACGTTAGACTCCTGAGCCGCGCAGGCAACGAATATCTGGGTCTGGACCTGCTTAAGGAGGAACTGATTAAAATGACTGCGGAGGCGCGTCAGATTCATCCGGAGGGTGTGCTGATCGACGGCGAGCTGGTGTACCACGAACAAGTTAAAAAGGAGCCGGAGGGTTTGGACTTCTTGTTCGACGCATATCCGGAAAACAGCAAGGCCAAAGAGTTCGCGGAAGTTGCGGAATCTCGCACGGCAAGCAACGGCATCGCGAACAAGTCCCTGAAGGGCACCATTAGCGAAAAAGAGGCCCAATGTATGAAATTTCAGGTGTGGGATTACGTGCCGCTGGTTGAAATTTACAGCCTGCCTGCTTTTCGTCTGAAGTACGACGTTCGTTTTAGCAAACTGGAACAAATGACCTCCGGTTATGATAAGGTGATCCTGATCGAGAACCAGGTTGTTAATAATCTGGACGAAGCCAAAGTCATCTACAAAAAATACATCGACCAGGGTTTGGAGGGCATCATTTTGAAGAACATCGACGGCCTGTGGGAAAACGCGCGTAGCAAAAATTTATATAAATTCAAAGAGGTGATTGGCGTCGATCTGAAGATCGTGGGCATCTACCCACATCGTAAGGACCCGACAAAGGCGGGCGGTTTTATCCTGGAGAGCGAATGCGGTAAAATCAAGGTTAACGCCGGTAGCGGTTTAAAGGACAAAGCTGGGGTGAAGTCGCACGAGTTGGATCGTACCCGGATTATGGAAAACCAGAATTATTATATTGGAAAAATTTTGGAGTGCGAATGCAATGGCTGGCTGAAGTCCGATGGTAGAACTGACTACGTTAAGCTGTTTCTTCCGATTGCGATTCGTCTGCGTGAAGATAAAACCGATGCGAATACCTTTGAAGACGTATTTGGCGATTTCCACGAAGTCACCGGTCTT

SEQ ID NO:24

ATGCATCACCACCACCATCACATCTTGAAGATCCTGAATGAGATCGCTTCTATCGGCAGCACCAAACAAAAGCAGGCCATCTTGGAGAAAAACAAGGATAACGAATTACTGAAACGCGTGTACCGCTTGACCTATTCCCGCGGCCTGCAGTATTACATAAAAAAGTGGCCGAAACCGGGTATCGCTACCCAGTCGTTCGGTATGTTGACGCTGACGGATATGCTGGATTTCATTGAGTTCACCCTGGCGACCCGTAAACTCACCGGAAACGCGGCAATCGAGGAGCTGACGGGTTACATTACCGACGGCAAAAAAGATGATGTGGAAGTGCTGCGTCGTGTTATGATGCGCGATTTGGAGTGCGGCGCATCTGTTAGCATAGCTAATAAGGTGTGGCCAGGTCTGATTCCGGAGCAACCGCAGATGCTGGCTTCGTCCTATGACGAGAAGGGTATTAACAAGAACATTAAGTTCCCGGCATTCGCGCAACTAAAGGCGGATGGCGCGCGTTGTTTTGCGGAAGTACGCGGTGACGAACTTGACGACGTTAGACTCCTGAGCCGCGCAGGCAACGAATATCTGGGTCTGGACCTGCTTAAGGAGGAACTGATTAAAATGACTGCGGAGGCGCGTCAGATTCATCCGGAGGGTGTGCTGATCGACGGCGAGCTGGTGTACCACGAACAAGTTAAAAAGGAGCCGGAGGGTTTGGACTTCTTGTTCGACGCATATCCGGAAAACAGCAAGGCCAAAGAGTTCGCGGAAGTTGCGGAATCTCGCACGGCAAGCAACGGCATCGCGAACAAGTCCCTGAAGGGCACCATTAGCGAAAAAGAGGCCCAATGTATGAAATTTCAGGTGTGGGATTACGTGCCGCTGGTTGAAATTTACAGCCTGCCTGCTTTTCGTCTGAAGTACGACGTTCGTTTTAGCAAACTGGAACAAATGACCTCCGGTTATGATAAGGTGATCCTGATCGAGAACCAGGTTGTTAATAATCTGGACGAAGCCAAAGTCATCTACAAAAAATACATCGACCAGGGTTTGGAGGGCATCATTTTGAAGAACATCGACGGCCTGTGGGAAAACGCGCGTAGCAAAAATTTATATAAATTCAAAGAGGTGATTGGCGTCCGCCTGAAGATCGTGGGCATCTACCCACATCGTAAGGACCCGACAAAGGCGGGCGGTTTTATCCTGGAGAGCGAATGCGGTAAAATCAAGGTTAACGCCGGTAGCGGTTTAAAGGACAAAGCTGGGGTGAAGTCGCACGAGTTGGATCGTACCCGGATTATGGAAAACCAGAATTATTATATTGGAAAAATTTTGGAGTGCGAATGCAATGGCTGGCTGAAGTCCGATGGTAGAACTGACTACGTTAAGCTGTTTCTTCCGATTGCGATTCGTCTGCGTGAAGATAAAACCGATGCGAATACCTTTGAAGACGTATTTGGCGATTTCCACGAAGTCACCGGTCTT

SEQ ID NO:25

ATGCATCACCACCACCATCACATCTTGAAGATCCTGAATGAGATCGCTTCTATCGGCAGCACCAAACAAAAGCAGGCCATCTTGGAGAAAAACAAGGATAACGAATTACTGAAACGCGTGTACCGCTTGACCTATTCCCGCGGCCTGCAGTATTACATAAAAAAGTGGCCGAAACCGGGTATCGCTACCCAGTCGTTCGGTATGTTGACGCTGACGGATATGCTGGATTTCATTGAGTTCACCCTGGCGACCCGTAAACTCACCGGAAACGCGGCAATCGAGGAGCTGACGGGTTACATTACCGACGGCAAAAAAGATGATGTGGAAGTGCTGCGTCGTGTTATGATGCGCGATTTGGAGTGCGGCGCATCTGTTAGCATAGCTAATAAGGTGTGGCCAGGTCTGATTCCGGAGCAACCGCAGATGCTGGCTTCGTCCTATGACGAGAAGGGTATTAACAAGAACATTAAGTTCCCGGCATTCGCGCAACTAAAGGCGGATGGCGCGCGTTGTTTTGCGGAAGTACGCGGTGACGAACTTGACGACGTTAGACTCCTGAGCCGCGCAGGCAACGAATATCTGGGTCTGGACCTGCTTAAGGAGGAACTGATTAAAATGACTGCGGAGGCGCGTCAGATTCATCCGGAGGGTGTGCTGATCGACGGCGAGCTGGTGTACCACGAACAAGTTAAAAAGGAGCCGGAGGGTTTGGACTTCTTGTTCGACGCATATCCGGAAAACAGCAAGGCCAAAGAGTTCGCGGAAGTTGCGGAATCTCGCACGGCAAGCAACGGCATCGCGAACAAGTCCCTGAAGGGCACCATTAGCGAAAAAGAGGCCCAATGTATGAAATTTCAGGTGTGGGATTACGTGCCGCTGGTTGAAATTTACAGCCTGCCTGCTTTTCGTCTGAAGTACGACGTTCGTTTTAGCAAACTGGAACAAATGACCTCCGGTTATGATAAGGTGATCCTGATCGAGAACCAGGTTGTTAATAATCTGGACGAAGCCAAAGTCATCTACAAAAAATACATCGACCAGGGTTTGGAGGGCATCATTTTGAAGAACATCGACGGCCTGTGGGAAAACGCGCGTAGCAAAAATTTATATAAATTCAAAGAGGTGATTGGCGTCCGCCTGAAGATCGTGGGCATCTACCCACATCGTAAGGACCCGACAAAGGCGGGCGGTTTTATCCTGGAGAGCGAATGCGGTAAAATCAAGGTTAACGCCGGTAGCGGTTTAAAGGACAAAGCTGGGGTGAAGTCGCACGAGTTGGATCGTACCCGGATTATGGAAAACCAGAATTATTATATTGGAAAAATTTTGGAGTGCGAATGCAATGGCTGGCTGAAGTCCGATGGTAGAACTGACTACGTTAAGCTGTTTCTTCCGATTGCGATTCGTCTGCGTGAAGATAAAACCGATGCGAATACCTTTGAAGACGTATTTGGCGATTTCCACGAAGTCACCGGTCTTGGGTCAGGAAGTATGGCTGAAGATGACCCCTACCTGGGTCGTCCTGAGCAGATGTTCCACTTAGATCCGAGCTTGACCCACACCATCTTTAACCCGGAGGTGTTCCAGCCGCAGATGGCTCTGCCGACCGACGGTCCGTATCTGCAGATTTTGGAGCAACCGAAGCAGAGAGGCTTCCGCTTTCGTTACGTGTGCGAAGGTCCGAGCCATGGTGGTCTGCCGGGTGCGTCAAGCGAAAAGAACAAAAAGTCCTACCCACAGGTTAAAATCTGTAATTACGTCGGTCCGGCGAAAGTGATTGTGCAACTTGTGACGAACGGCAAAAACATCCACTTGCACGCCCATAGCCTGGTTGGTAAGCACTGCGAGGATGGTATCTGCACCGTTACTGCGGGACCGAAGGACATGGTGGTGGGGTTCGCTAATCTGGGTATTCTGCATGTTACCAAGAAGAAGGTATTCGAAACCCTGGAAGCACGTATGACCGAGGCGTGCATTAGAGGTTATAACCCGGGCTTGCTGGTTCATCCAGATCTCGCATATCTGCAAGCGGAAGGTGGTGGCGATCGTCAACTGGGTGATCGTGAAAAAGAACTGATCCGCCAGGCGGCACTGCAACAAACAAAGGAGATGGATTTATCTGTTGTTCGTCTGATGTTCACGGCGTTTTTGCCCGACTCCACCGGTTCGTTCACCCGTCGTCTGGAACCGGTTGTGTCTGACGCCATCTACGACAGCAAAGCCCCTAATGCAAGCAATCTGAAAATCGTCCGCATGGATCGCACCGCTGGGTGCGTAACGGGTGGTGAAGAGATCTACTTGCTGTGTGACAAAGTCCAGAAGGATGATATTCAGATTCGCTTCTATGAAGAGGAGGAGAACGGTGGCGTTTGGGAAGGCTTCGGAGATTTTAGCCCGACTGACGTTCATCGTCAATTTGCGATTGTGTTCAAAACTCCGAAGTATAAAGACATCAACATTACCAAACCGGCGTCCGTGTTTGTTCAACTGCGTCGTAAAAGTGACCTCGAGACGAGCGAACCGAAGCCGTTTCTGTATTACCCGGAGATCAAAGACAAAGAGGAAGTCCAGCGTAAGCGCCAGAAACTGATGCCGAATTTCAGCGACTCTTTCGGCGGCGGCAGCGGCGCCGGTGCGGGTGGCGGCGGGATGTTTGGCAGCGGTGGCGGTGGCGGTGGCACCGGTTCGACCGGCCCAGGTTACAGCTTCCCGCATTATGGTTTTCCGACGTACGGCGGCATTACCTTTCACCCGGGCACCACCAAGTCCAACGCTGGCATGAAGCACGGT

SEQ ID NO:26

ATGCATCACCACCACCATCACATCTTGAAGATCCTGAATGAGATCGCTTCTATCGGCAGCACCAAACAAAAGCAGGCCATCTTGGAGAAAAACAAGGATAACGAATTACTGAAACGCGTGTACCGCTTGACCTATTCCCGCGGCCTGCAGTATTACATAAAAAAGTGGCCGAAACCGGGTATCGCTACCCAGTCGTTCGGTATGTTGACGCTGACGGATATGCTGGATTTCATTGAGTTCACCCTGGCGACCCGTAAACTCACCGGAAACGCGGCAATCGAGGAGCTGACGGGTTACATTACCGACGGCAAAAAAGATGATGTGGAAGTGCTGCGTCGTGTTATGATGCGCGATTTGGAGTGCGGCGCATCTGTTAGCATAGCTAATAAGGTGTGGCCAGGTCTGATTCCGGAGCAACCGCAGATGCTGGCTTCGTCCTATGACGAGAAGGGTATTAACAAGAACATTAAGTTCCCGGCATTCGCGCAACTAAAGGCGGATGGCGCGCGTTGTTTTGCGGAAGTACGCGGTGACGAACTTGACGACGTTAGACTCCTGAGCCGCGCAGGCAACGAATATCTGGGTCTGGACCTGCTTAAGGAGGAACTGATTAAAATGACTGCGGAGGCGCGTCAGATTCATCCGGAGGGTGTGCTGATCGACGGCGAGCTGGTGTACCACGAACAAGTTAAAAAGGAGCCGGAGGGTTTGGACTTCTTGTTCGACGCATATCCGGAAAACAGCAAGGCCAAAGAGTTCGCGGAAGTTGCGGAATCTCGCACGGCAAGCAACGGCATCGCGAACAAGTCCCTGAAGGGCACCATTAGCGAAAAAGAGGCCCAATGTATGAAATTTCAGGTGTGGGATTACGTGCCGCTGGTTGAAATTTACAGCCTGCCTGCTTTTCGTCTGAAGTACGACGTTCGTTTTAGCAAACTGGAACAAATGACCTCCGGTTATGATAAGGTGATCCTGATCGAGAACCAGGTTGTTAATAATCTGGACGAAGCCAAAGTCATCTACAAAAAATACATCGACCAGGGTTTGGAGGGCATCATTTTGAAGAACATCGACGGCCTGTGGGAAAACGCGCGTAGCAAAAATTTATATAAATTCAAAGAGGTGATTGGCGTCCGCCTGAAGATCGTGGGCATCTACCCACATCGTAAGGACCCGACAAAGGCGGGCGGTTTTATCCTGGAGAGCGAATGCGGTAAAATCAAGGTTAACGCCGGTAGCGGTTTAAAGGACAAAGCTGGGGTGAAGTCGCACGAGTTGGATCGTACCCGGATTATGGAAAACCAGAATTATTATATTGGAAAAATTTTGGAGTGCGAATGCAATGGCTGGCTGAAGTCCGATGGTAGAACTGACTACGTTAAGCTGTTTCTTCCGATTGCGATTCGTCTGCGTGAAGATAAAACCGATGCGAATACCTTTGAAGACGTATTTGGCGATTTCCACGAAGTCACCGGTCTTGGAAGTGGGTCAATGGCTACAGTAAAATTTAAGTACAAAGGCGAAGAGAAGGAGGTTGACATCTCCAAAATCAAAAAGGTGTGGCGTGTTGGTAAGATGATTAGCTTCACCTATGATGAAGGTGGCGGCAAGACGGGTCGCGGTGCGGTGAGCGAGAAGGACGCTCCGAAAGAGTTGCTGCAAATGCTGGAAAAGCAGAAAAAA

SEQ ID NO:27

ATGCATCACCACCACCATCACATCTTGAAGATCCTGAATGAGATCGCTTCTATCGGCAGCACCAAACAAAAGCAGGCCATCTTGGAGAAAAACAAGGATAACGAATTACTGAAACGCGTGTACCGCTTGACCTATTCCCGCGGCCTGCAGTATTACATAAAAAAGTGGCCGAAACCGGGTATCGCTACCCAGTCGTTCGGTATGTTGACGCTGACGGATATGCTGGATTTCATTGAGTTCACCCTGGCGACCCGTAAACTCACCGGAAACGCGGCAATCGAGGAGCTGACGGGTTACATTACCGACGGCAAAAAAGATGATGTGGAAGTGCTGCGTCGTGTTATGATGCGCGATTTGGAGTGCGGCGCATCTGTTAGCATAGCTAATAAGGTGTGGCCAGGTCTGATTCCGGAGCAACCGCAGATGCTGGCTTCGTCCTATGACGAGAAGGGTATTAACAAGAACATTAAGTTCCCGGCATTCGCGCAACTAAAGGCGGATGGCGCGCGTTGTTTTGCGGAAGTACGCGGTGACGAACTTGACGACGTTAGACTCCTGAGCCGCGCAGGCAACGAATATCTGGGTCTGGACCTGCTTAAGGAGGAACTGATTAAAATGACTGCGGAGGCGCGTCAGATTCATCCGGAGGGTGTGCTGATCGACGGCGAGCTGGTGTACCACGAACAAGTTAAAAAGGAGCCGGAGGGTTTGGACTTCTTGTTCGACGCATATCCGGAAAACAGCAAGGCCAAAGAGTTCGCGGAAGTTGCGGAATCTCGCACGGCAAGCAACGGCATCGCGAACAAGTCCCTGAAGGGCACCATTAGCGAAAAAGAGGCCCAATGTATGAAATTTCAGGTGTGGGATTACGTGCCGCTGGTTGAAATTTACAGCCTGCCTGCTTTTCGTCTGAAGTACGACGTTCGTTTTAGCAAACTGGAACAAATGACCTCCGGTTATGATAAGGTGATCCTGATCGAGAACCAGGTTGTTAATAATCTGGACGAAGCCAAAGTCATCTACAAAAAATACATCGACCAGGGTTTGGAGGGCATCATTTTGAAGAACATCGACGGCCTGTGGGAAAACGCGCGTAGCAAAAATTTATATAAATTCAAAGAGGTGATTGGCGTCCGCCTGAAGATCGTGGGCATCTACCCACATCGTAAGGACCCGACAAAGGCGGGCGGTTTTATCCTGGAGAGCGAATGCGGTAAAATCAAGGTTAACGCCGGTAGCGGTTTAAAGGACAAAGCTGGGGTGAAGTCGCACGAGTTGGATCGTACCCGGATTATGGAAAACCAGAATTATTATATTGGAAAAATTTTGGAGTGCGAATGCAATGGCTGGCTGAAGTCCGATGGTAGAACTGACTACGTTAAGCTGTTTCTTCCGATTGCGATTCGTCTGCGTGAAGATAAAACCGATGCGAATACCTTTGAAGACGTATTTGGCGATTTCCACGAAGTCACCGGTCTTGGGTCAGGAAGTATGGTAACAGTTAAATTTAAGTATAAAGGCGAAGAGAAGGAGGTTGATATCTCCAAAATCAAAAAGGTGTGGCGTGTTGGCAAGATGATTTCTTTCACGTACGACGACAACGGCAAGACCGGTCGCGGTGCGGTGAGCGAAAAAGATGCTCCGAAAGAGTTGCTGCAGATGCTGGAAAAAAGCGGTAAGAAG

SEQ ID No:28

ATGCATCACCACCACCATCACATCTTGAAGATCCTGAATGAGATCGCTTCTATCGGCAGCACCAAACAAAAGCAGGCCATCTTGGAGAAAAACAAGGATAACGAATTACTGAAACGCGTGTACCGCTTGACCTATTCCCGCGGCCTGCAGTATTACATAAAAAAGTGGCCGAAACCGGGTATCGCTACCCAGTCGTTCGGTATGTTGACGCTGACGGATATGCTGGATTTCATTGAGTTCACCCTGGCGACCCGTAAACTCACCGGAAACGCGGCAATCGAGGAGCTGACGGGTTACATTACCGACGGCAAAAAAGATGATGTGGAAGTGCTGCGTCGTGTTATGATGCGCGATTTGGAGTGCGGCGCATCTGTTAGCATAGCTAATAAGGTGTGGCCAGGTCTGATTCCGGAGCAACCGCAGATGCTGGCTTCGTCCTATGACGAGAAGGGTATTAACAAGAACATTAAGTTCCCGGCATTCGCGCAACTAAAGGCGGATGGCGCGCGTTGTTTTGCGGAAGTACGCGGTGACGAACTTGACGACGTTAGACTCCTGAGCCGCGCAGGCAACGAATATCTGGGTCTGGACCTGCTTAAGGAGGAACTGATTAAAATGACTGCGGAGGCGCGTCAGATTCATCCGGAGGGTGTGCTGATCGACGGCGAGCTGGTGTACCACGAACAAGTTAAAAAGGAGCCGGAGGGTTTGGACTTCTTGTTCGACGCATATCCGGAAAACAGCAAGGCCAAAGAGTTCGCGGAAGTTGCGGAATCTCGCACGGCAAGCAACGGCATCGCGAACAAGTCCCTGAAGGGCACCATTAGCGAAAAAGAGGCCCAATGTATGAAATTTCAGGTGTGGGATTACGTGCCGCTGGTTGAAATTTACAGCCTGCCTGCTTTTCGTCTGAAGTACGACGTTCGTTTTAGCAAACTGGAACAAATGACCTCCGGTTATGATAAGGTGATCCTGATCGAGAACCAGGTTGTTAATAATCTGGACGAAGCCAAAGTCATCTACAAAAAATACATCGACCAGGGTTTGGAGGGCATCATTTTGAAGAACATCGACGGCCTGTGGGAAAACGCGCGTAGCAAAAATTTATATAAATTCAAAGAGGTGATTGGCGTCCGCCTGAAGATCGTGGGCATCTACCCACATCGTAAGGACCCGACAAAGGCGGGCGGTTTTATCCTGGAGAGCGAATGCGGTAAAATCAAGGTTAACGCCGGTAGCGGTTTAAAGGACAAAGCTGGGGTGAAGTCGCACGAGTTGGATCGTACCCGGATTATGGAAAACCAGAATTATTATATTGGAAAAATTTTGGAGTGCGAATGCAATGGCTGGCTGAAGTCCGATGGTAGAACTGACTACGTTAAGCTGTTTCTTCCGATTGCGATTCGTCTGCGTGAAGATAAAACCGATGCGAATACCTTTGAAGACGTATTTGGCGATTTCCACGAAGTCACCGGTCTTGGAAGTGGGTCAATGACAACTGTAAAATTTAAGTACAAAGGCGAAGAGAAAGAAGTTGATATCTCCAAAATCAAAAAGGTGTGGCGTGTTGGTAAAATGATTAGCTTCACCTATGATGACAACGGCAAGACGGGTCGCGGTGCGGTGAGCGAAAAGGACGCTCCGAAAGAGCTGTTGGAGAAGCTGGAGAAGAAG

SEQ ID No:29

ATGCATCACCACCACCATCACATCTTGAAGATCCTGAATGAGATCGCTTCTATCGGCAGCACCAAACAAAAGCAGGCCATCTTGGAGAAAAACAAGGATAACGAATTACTGAAACGCGTGTACCGCTTGACCTATTCCCGCGGCCTGCAGTATTACATAAAAAAGTGGCCGAAACCGGGTATCGCTACCCAGTCGTTCGGTATGTTGACGCTGACGGATATGCTGGATTTCATTGAGTTCACCCTGGCGACCCGTAAACTCACCGGAAACGCGGCAATCGAGGAGCTGACGGGTTACATTACCGACGGCAAAAAAGATGATGTGGAAGTGCTGCGTCGTGTTATGATGCGCGATTTGGAGTGCGGCGCATCTGTTAGCATAGCTAATAAGGTGTGGCCAGGTCTGATTCCGGAGCAACCGCAGATGCTGGCTTCGTCCTATGACGAGAAGGGTATTAACAAGAACATTAAGTTCCCGGCATTCGCGCAACTAAAGGCGGATGGCGCGCGTTGTTTTGCGGAAGTACGCGGTGACGAACTTGACGACGTTAGACTCCTGAGCCGCGCAGGCAACGAATATCTGGGTCTGGACCTGCTTAAGGAGGAACTGATTAAAATGACTGCGGAGGCGCGTCAGATTCATCCGGAGGGTGTGCTGATCGACGGCGAGCTGGTGTACCACGAACAAGTTAAAAAGGAGCCGGAGGGTTTGGACTTCTTGTTCGACGCATATCCGGAAAACAGCAAGGCCAAAGAGTTCGCGGAAGTTGCGGAATCTCGCACGGCAAGCAACGGCATCGCGAACAAGTCCCTGAAGGGCACCATTAGCGAAAAAGAGGCCCAATGTATGAAATTTCAGGTGTGGGATTACGTGCCGCTGGTTGAAATTTACAGCCTGCCTGCTTTTCGTCTGAAGTACGACGTTCGTTTTAGCAAACTGGAACAAATGACCTCCGGTTATGATAAGGTGATCCTGATCGAGAACCAGGTTGTTAATAATCTGGACGAAGCCAAAGTCATCTACAAAAAATACATCGACCAGGGTTTGGAGGGCATCATTTTGAAGAACATCGACGGCCTGTGGGAAAACGCGCGTAGCAAAAATTTATATAAATTCAAAGAGGTGATTGGCGTCCGCCTGAAGATCGTGGGCATCTACCCACATCGTAAGGACCCGACAAAGGCGGGCGGTTTTATCCTGGAGAGCGAATGCGGTAAAATCAAGGTTAACGCCGGTAGCGGTTTAAAGGACAAAGCTGGGGTGAAGTCGCACGAGTTGGATCGTACCCGGATTATGGAAAACCAGAATTATTATATTGGAAAAATTTTGGAGTGCGAATGCAATGGCTGGCTGAAGTCCGATGGTAGAACTGACTACGTTAAGCTGTTTCTTCCGATTGCGATTCGTCTGCGTGAAGATAAAACCGATGCGAATACCTTTGAAGACGTATTTGGCGATTTCCACGAAGTCACCGGTCTTGGAAGTGGTTCAATGGCTACAAAGGTAAAATTCAAATACAAAGGCGAAGAGAAGGAGGTGGACATCTCCAAAATCAAAAAGGTTTGGCGTGTTGGTAAGATGATTAGCTTTACCTATGATGACAACGGCAAGACGGGTCGCGGTGCGGTGAGCGAAAAGGACGCTCCGAAAGAGTTGCTGGATAAACTGGAAAAGAAG

SEQ ID No:30

SEQ ID NO:31

ATGCATCACCACCACCATCACATCTTGAAGATCCTGAATGAGATCGCTTCTATCGGCAGCACCAAACAAAAGCAGGCCATCTTGGAGAAAAACAAGGATAACGAATTACTGAAACGCGTGTACCGCTTGACCTATTCCCGCGGCCTGCAGTATTACATAAAAAAGTGGCCGAAACCGGGTATCGCTACCCAGTCGTTCGGTATGTTGACGCTGACGGATATGCTGGATTTCATTGAGTTCACCCTGGCGACCCGTAAACTCACCGGAAACGCGGCAATCGAGGAGCTGACGGGTTACATTACCGACGGCAAAAAAGATGATGTGGAAGTGCTGCGTCGTGTTATGATGCGCGATTTGGAGTGCGGCGCATCTGTTAGCATAGCTAATAAGGTGTGGCCAGGTCTGATTCCGGAGCAACCGCAGATGCTGGCTTCGTCCTATGACGAGAAGGGTATTAACAAGAACATTAAGTTCCCGGCATTCGCGCAACTAAAGGCGGATGGCGCGCGTTGTTTTGCGGAAGTACGCGGTGACGAACTTGACGACGTTAGACTCCTGAGCCGCGCAGGCAACGAATATCTGGGTCTGGACCTGCTTAAGGAGGAACTGATTAAAATGACTGCGGAGGCGCGTCAGATTCATCCGGAGGGTGTGCTGATCGACGGCGAGCTGGTGTACCACGAACAAGTTAAAAAGGAGCCGGAGGGTTTGGACTTCTTGTTCGACGCATATCCGGAAAACAGCAAGGCCAAAGAGTTCGCGGAAGTTGCGGAATCTCGCACGGCAAGCAACGGCATCGCGAACAAGTCCCTGAAGGGCACCATTAGCGAAAAAGAGGCCCAATGTATGAAATTTCAGGTGTGGGATTACGTGCCGCTGGTTGAAATTTACAGCCTGCCTGCTTTTCGTCTGAAGTACGACGTTCGTTTTAGCAAACTGGAACAAATGACCTCCGGTTATGATAAGGTGATCCTGATCGAGAACCAGGTTGTTAATAATCTGGACGAAGCCAAAGTCATCTACAAAAAATACATCGACCAGGGTTTGGAGGGCATCATTTTGAAGAACATCGACGGCCTGTGGGAAAACGCGCGTAGCAAAAATTTATATAAATTCAAAGAGGTGATTGGCGTCCGCCTGAAGATCGTGGGCATCTACCCACATCGTAAGGACCCGACAAAGGCGGGCGGTTTTATCCTGGAGAGCGAATGCGGTAAAATCAAGGTTAACGCCGGTAGCGGTTTAAAGGACAAAGCTGGGGTGAAGTCGCACGAGTTGGATCGTACCCGGATTATGGAAAACCAGAATTATTATATTGGAAAAATTTTGGAGTGCGAATGCAATGGCTGGCTGAAGTCCGATGGTAGAACTGACTACGTTAAGCTGTTTCTTCCGATTGCGATTCGTCTGCGTGAAGATAAAACCGATGCGAATACCTTTGAAGACGTATTTGGCGATTTCCACGAAGTCACCGGTCTTGGGTCAGGAAGTATGGTTAAAGTAAAGTTTAAGTATAAAGGTGAAGAGAAGGAGGTCGATACCAGCAAAATCAAAAAGGTGTGGCGCGTGGGCAAAATGGTTTCCTTCACGTACGACGACAACGGCAAAACCGGTCGTGGTGCAGTTAGCGAGAAGGACGCTCCGAAAGAGTTGCTGGATATGCTGGCGCGTGCGGAACGTGAAAAGAAG

SEQ ID NO:32

ATGCATCACCACCACCATCACATCTTGAAGATCCTGAATGAGATCGCTTCTATCGGCAGCACCAAACAAAAGCAGGCCATCTTGGAGAAAAACAAGGATAACGAATTACTGAAACGCGTGTACCGCTTGACCTATTCCCGCGGCCTGCAGTATTACATAAAAAAGTGGCCGAAACCGGGTATCGCTACCCAGTCGTTCGGTATGTTGACGCTGACGGATATGCTGGATTTCATTGAGTTCACCCTGGCGACCCGTAAACTCACCGGAAACGCGGCAATCGAGGAGCTGACGGGTTACATTACCGACGGCAAAAAAGATGATGTGGAAGTGCTGCGTCGTGTTATGATGCGCGATTTGGAGTGCGGCGCATCTGTTAGCATAGCTAATAAGGTGTGGCCAGGTCTGATTCCGGAGCAACCGCAGATGCTGGCTTCGTCCTATGACGAGAAGGGTATTAACAAGAACATTAAGTTCCCGGCATTCGCGCAACTAAAGGCGGATGGCGCGCGTTGTTTTGCGGAAGTACGCGGTGACGAACTTGACGACGTTAGACTCCTGAGCCGCGCAGGCAACGAATATCTGGGTCTGGACCTGCTTAAGGAGGAACTGATTAAAATGACTGCGGAGGCGCGTCAGATTCATCCGGAGGGTGTGCTGATCGACGGCGAGCTGGTGTACCACGAACAAGTTAAAAAGGAGCCGGAGGGTTTGGACTTCTTGTTCGACGCATATCCGGAAAACAGCAAGGCCAAAGAGTTCGCGGAAGTTGCGGAATCTCGCACGGCAAGCAACGGCATCGCGAACAAGTCCCTGAAGGGCACCATTAGCGAAAAAGAGGCCCAATGTATGAAATTTCAGGTGTGGGATTACGTGCCGCTGGTTGAAATTTACAGCCTGCCTGCTTTTCGTCTGAAGTACGACGTTCGTTTTAGCAAACTGGAACAAATGACCTCCGGTTATGATAAGGTGATCCTGATCGAGAACCAGGTTGTTAATAATCTGGACGAAGCCAAAGTCATCTACAAAAAATACATCGACCAGGGTTTGGAGGGCATCATTTTGAAGAACATCGACGGCCTGTGGGAAAACGCGCGTAGCAAAAATTTATATAAATTCAAAGAGGTGATTGGCGTCCGCCTGAAGATCGTGGGCATCTACCCACATCGTAAGGACCCGACAAAGGCGGGCGGTTTTATCCTGGAGAGCGAATGCGGTAAAATCAAGGTTAACGCCGGTAGCGGTTTAAAGGACAAAGCTGGGGTGAAGTCGCACGAGTTGGATCGTACCCGGATTATGGAAAACCAGAATTATTATATTGGAAAAATTTTGGAGTGCGAATGCAATGGCTGGCTGAAGTCCGATGGTAGAACTGACTACGTTAAGCTGTTTCTTCCGATTGCGATTCGTCTGCGTGAAGATAAAACCGATGCGAATACCTTTGAAGACGTATTTGGCGATTTCCACGAAGTCACCGGTCTTCCCGCGCCAGCTCCTGCACCCGCTATGGTAACGGTCAAATTTAAATACAAAGGCGAAGAGAAGGAGGTTGATATCTCCAAAATCAAGAAGGTGTGGCGTGTTGGTAAGATGATTTCGTTCACCTATGACGACAACGGCAAGACCGGTCGCGGTGCGGTGAGCGAAAAAGATGCTCCGAAAGAGTTGCTGCAGATGCTGGAAAAAAGCGGCAAGAAG

SEQ ID NO:33

ATGCATCACCACCACCATCACATCTTGAAGATCCTGAATGAGATCGCTTCTATCGGCAGCACCAAACAAAAGCAGGCCATCTTGGAGAAAAACAAGGATAACGAATTACTGAAACGCGTGTACCGCTTGACCTATTCCCGCGGCCTGCAGTATTACATAAAAAAGTGGCCGAAACCGGGTATCGCTACCCAGTCGTTCGGTATGTTGACGCTGACGGATATGCTGGATTTCATTGAGTTCACCCTGGCGACCCGTAAACTCACCGGAAACGCGGCAATCGAGGAGCTGACGGGTTACATTACCGACGGCAAAAAAGATGATGTGGAAGTGCTGCGTCGTGTTATGATGCGCGATTTGGAGTGCGGCGCATCTGTTAGCATAGCTAATAAGGTGTGGCCAGGTCTGATTCCGGAGCAACCGCAGATGCTGGCTTCGTCCTATGACGAGAAGGGTATTAACAAGAACATTAAGTTCCCGGCATTCGCGCAACTAAAGGCGGATGGCGCGCGTTGTTTTGCGGAAGTACGCGGTGACGAACTTGACGACGTTAGACTCCTGAGCCGCGCAGGCAACGAATATCTGGGTCTGGACCTGCTTAAGGAGGAACTGATTAAAATGACTGCGGAGGCGCGTCAGATTCATCCGGAGGGTGTGCTGATCGACGGCGAGCTGGTGTACCACGAACAAGTTAAAAAGGAGCCGGAGGGTTTGGACTTCTTGTTCGACGCATATCCGGAAAACAGCAAGGCCAAAGAGTTCGCGGAAGTTGCGGAATCTCGCACGGCAAGCAACGGCATCGCGAACAAGTCCCTGAAGGGCACCATTAGCGAAAAAGAGGCCCAATGTATGAAATTTCAGGTGTGGGATTACGTGCCGCTGGTTGAAATTTACAGCCTGCCTGCTTTTCGTCTGAAGTACGACGTTCGTTTTAGCAAACTGGAACAAATGACCTCCGGTTATGATAAGGTGATCCTGATCGAGAACCAGGTTGTTAATAATCTGGACGAAGCCAAAGTCATCTACAAAAAATACATCGACCAGGGTTTGGAGGGCATCATTTTGAAGAACATCGACGGCCTGTGGGAAAACGCGCGTAGCAAAAATTTATATAAATTCAAAGAGGTGATTGGCGTCCGCCTGAAGATCGTGGGCATCTACCCACATCGTAAGGACCCGACAAAGGCGGGCGGTTTTATCCTGGAGAGCGAATGCGGTAAAATCAAGGTTAACGCCGGTAGCGGTTTAAAGGACAAAGCTGGGGTGAAGTCGCACGAGTTGGATCGTACCCGGATTATGGAAAACCAGAATTATTATATTGGAAAAATTTTGGAGTGCGAATGCAATGGCTGGCTGAAGTCCGATGGTAGAACTGACTACGTTAAGCTGTTTCTTCCGATTGCGATTCGTCTGCGTGAAGATAAAACCGATGCGAATACCTTTGAAGACGTATTTGGCGATTTCCACGAAGTCACCGGTCTTGCTGCTGCGGCAATGGTAACAGTTAAATTTAAGTACAAAGGCGAAGAGAAGGAGGTTGATATCTCCAAAATCAAAAAGGTGTGGCGTGTTGGCAAGATGATTTCTTTCACCTATGACGACAACGGCAAGACGGGTCGCGGTGCGGTGAGCGAAAAAGATGCTCCGAAAGAGTTGCTGCAGATGCTGGAAAAAAGCGGTAAGAAG

SEQ ID NO:34

ATGCATCACCACCACCATCACATGGTAACAGTTAAATTTAAGTATAAAGGAGAGGAAAAGGAGGTTGATATCTCCAAAATCAAAAAGGTGTGGCGTGTTGGCAAGATGATTTCGTTCACGTACGACGACAACGGCAAGACCGGTCGCGGTGCTGTGAGCGAAAAAGATGCACCGAAAGAGTTGCTGCAGATGCTGGAAAAAAGCGGTAAGAAGGCGGCCGCGGCGATCTTGAAGATCCTGAATGAGATCGCTTCTATCGGCAGCACCAAACAAAAGCAGGCCATCTTGGAGAAAAACAAGGATAACGAATTACTGAAACGCGTGTACCGCTTGACCTATTCCCGCGGCCTGCAGTATTACATAAAAAAGTGGCCGAAACCGGGTATCGCTACCCAGTCGTTCGGTATGTTGACGCTGACGGATATGCTGGATTTCATTGAGTTCACCCTGGCGACCCGTAAACTCACCGGAAACGCGGCAATCGAGGAGCTGACGGGTTACATTACCGACGGCAAAAAAGATGATGTGGAAGTGCTGCGTCGTGTTATGATGCGCGATTTGGAGTGCGGCGCATCTGTTAGCATAGCTAATAAGGTGTGGCCAGGTCTGATTCCGGAGCAACCGCAGATGCTGGCTTCGTCCTATGACGAGAAGGGTATTAACAAGAACATTAAGTTCCCGGCATTCGCGCAACTAAAGGCGGATGGCGCGCGTTGTTTTGCGGAAGTACGCGGTGACGAACTTGACGACGTTAGACTCCTGAGCCGCGCAGGCAACGAATATCTGGGTCTGGACCTGCTTAAGGAGGAACTGATTAAAATGACTGCGGAGGCGCGTCAGATTCATCCGGAGGGTGTGCTGATCGACGGCGAGCTGGTGTACCACGAACAAGTTAAAAAGGAGCCGGAGGGTTTGGACTTCTTGTTCGACGCATATCCGGAAAACAGCAAGGCCAAAGAGTTCGCGGAAGTTGCGGAATCTCGCACGGCAAGCAACGGCATCGCGAACAAGTCCCTGAAGGGCACCATTAGCGAAAAAGAGGCCCAATGTATGAAATTTCAGGTGTGGGATTACGTGCCGCTGGTTGAAATTTACAGCCTGCCTGCTTTTCGTCTGAAGTACGACGTTCGTTTTAGCAAACTGGAACAAATGACCTCCGGTTATGATAAGGTGATCCTGATCGAGAACCAGGTTGTTAATAATCTGGACGAAGCCAAAGTCATCTACAAAAAATACATCGACCAGGGTTTGGAGGGCATCATTTTGAAGAACATCGACGGCCTGTGGGAAAACGCGCGTAGCAAAAATTTATATAAATTCAAAGAGGTGATTGGCGTCCGCCTGAAGATCGTGGGCATCTACCCACATCGTAAGGACCCGACAAAGGCGGGCGGTTTTATCCTGGAGAGCGAATGCGGTAAAATCAAGGTTAACGCCGGTAGCGGTTTAAAGGACAAAGCTGGGGTGAAGTCGCACGAGTTGGATCGTACCCGGATTATGGAAAACCAGAATTATTATATTGGAAAAATTTTGGAGTGCGAATGCAATGGCTGGCTGAAGTCCGATGGTAGAACTGACTACGTTAAGCTGTTTCTTCCGATTGCGATTCGTCTGCGTGAAGATAAAACCGATGCGAATACCTTTGAAGACGTATTTGGCGATTTCCACGAAGTCACCGGTCTTGCTGCTGCGGCAATGGTAACAGTTAAATTTAAGTACAAAGGCGAAGAGAAGGAGGTTGATATCTCCAAAATCAAAAAGGTGTGGCGTGTTGGCAAGATGATTTCTTTCACCTATGACGACAACGGCAAGACGGGTCGCGGTGCGGTGAGCGAAAAAGATGCTCCGAAAGAGTTGCTGCAGATGCTGGAAAAAAGCGGTAAGAAG

附图说明：

附图1：野生型及突变体连接酶应用于DNA文库构建中的DNA建库文库产量柱状图；

附图2：野生型及突变体连接酶应用于RNA文库构建中的RNA建库文库产量柱状图；

有益效果：

本发明在野生型T4 DNA连接酶的基础上，对野生型T4 DNA连接酶的进行了选自K16R、I121R、V125K、K226A、F235A和D371G、D373R、D385K、E438R、D448K、K470D中多个点的突变；在突变体的一端或两端连接DNA结合结构域，最终获得了一系列高效率的融合多肽。突变体和融合多肽均具有相比野生型提高的活性，融合多肽显示出比融合前显著提高的DNA亲和力，使在低模板浓度NGS建库连接上具有显著优势，具有耗时短、文库产量更高等明显的优势，非常适用于珍稀样本的NGS检测。

具体实施方式

以下的实施例便于更好地理解本发明，但并不限定本发明。下述实施例中的实验方法，如无特殊说明，均为常规方法。下述实施例中所用的试验材料，如无特殊说明，均为自常规生化试剂厂商购买得到的。

实施例1：重组T4DNA连接酶的表达和纯化(一)

在本实施例中，野生型(SEQ ID NO.1)和重组T4 DNA连接酶突变体(SEQ ID NO.2-7)序列都以添加HHHHHHGSS的形式(核苷酸序列如SEQ ID NO:18-24所示)克隆至大肠杆菌表达载体pET-28a(+)(Merck，货号69864)中，并使用BL21(DE3)表达宿主进行摇瓶表达。将包含上述DNA连接酶序列质粒的大肠杆菌铺在含有5％葡萄糖和50mg/L卡那霉素的LB琼脂平板上，37℃过夜培养。将来自平板的单菌落转移至5mL含有5％葡萄糖和50mg/L卡那霉素的LB培养基试管中，37℃、200rpm培养约12h。以1:100稀释到1L含有50mg/L卡那霉素的TB培养基中，37℃培养至OD600为0.6-0.8，添加终浓度为0.5mM的IPTG进行诱导，在25℃、200rpm继续培养12-16h。以4000rpm离心培养物，弃去上清，将沉淀物用100mLBufferA(50mM Tris-HCl,500mM NaCl,1mM DTT,1mM EDTA,5％甘油)重悬，使用小型高压均质机(上海励图)破碎裂解后，12000rpm离心30min，上清液用0.22μm滤膜过滤后上柱纯化。使用赛谱SDL-100层析系统和5mLNi-Smart层析柱(天地人和)纯化分离目的蛋白。用BufferA平衡柱子后，上清液以1ml/min的流速上柱结合，用BufferA平衡，然后用Buffer B(50mM Tris-HCl,500mMNaCl,250mM咪唑，1mM DTT,1mM EDTA,5％甘油)洗脱，收集洗脱峰。洗脱液用G-25脱盐柱(博格隆)置换到Buffer C(40mM Tris-HCl,100mM KCl,1mM DTT,0.1mM EDTA)中，然后加入等体积的甘油混匀，-20℃条件保存。

实施例2：T4 DNA连接酶突变体的连接效率测定(一)

我们使用链霉亲和素磁珠测定连接产物的方法，测试T4DNA连接酶及其突变体对两种标记的双链DNA的连接效率，用以模仿NGS样品制备流程中的DNA连接过程。该测定检测两种标记的双链DNA底物的连接。其一为在磷酸主链上进行生物素标记的双链DNA，其制备方式为分别合成两条反向互补的单链引物(生工生物，HPLC纯化，SEQ ID NO:18、SEQ IDNO:19)，使这两条单链引物在退火缓冲液(10mM Tris，pH7.5、50mMNaCl、0.1mM EDTA)中退火，形成生物素标记的双链DNA存在3’单碱基脱氧腺苷突出及5’单磷酸基团。另一个双链DNA底物为荧光素标记，使用两条HPLC纯化的单链引物(SEQ ID NO:20和SEQ ID NO:21，生工生物)在上述退火缓冲液中退火，其序列包含连接处的硫代磷酸保护的5’脱氧胸苷突出和5'磷酸，荧光素标记位置位于连接处相对的另一端。此底物的模型与文库构建中文库与接头的连接模型相似，用以反映对应的连接效率。

连接反应在50μl的连接缓冲液(50mM Tris-HCI,10mM MgCl₂,5mM DTT,1mMATP，pH7.6@25℃)中进行，包含上述两种DNA分子分别为1nM和3nM，以及0.5ug连接酶。反应在20℃下进行30分钟，反应结束后添加25μl的3*淬灭溶液(30mM EDTA和0.15％TWEEN-20试剂)以停止连接反应。反应将产生生物素及荧光素共同标记的双链DNA分子。

将链霉亲和素磁珠(英芮诚，MPS550/Streptavidin C5)用200μL 1×wash buffer缓冲液(5mM Tris,pH7.5,1M NaCl,0.5mM EDTA)预洗涤3次。将100μl淬灭的连接反应物添加到预洗涤的磁珠中，室温振荡15分钟以进行链霉亲和素与生物素的结合，磁力架吸附后，弃去未结合的上清液。将磁珠用200μl 1×wash buffer洗涤3次，用链霉亲和素磁珠洗脱液(10mM EDTApH8.2+95％(w/V)甲酰胺溶液)100μl洗脱链霉亲和素磁结合的带有荧光标记的产物。取洗脱产物至黑色酶标板中测定荧光。荧光强度使用酶标仪(Beckman Coulter)的485/10nm激发和535/35nm发射滤光器来测量。表1提供了各种连接酶突变体相对于SEQ IDNO:1的活性改进数据(活性改进＝突变体的荧光强度/野生型的荧光强度)。

表1连接酶突变体相对于Seq ID NO.1的活性改进(1nM插入片段和3nM衔接子)

实施例3：重组T4 DNA连接酶的表达和纯化(二)

为进一步提高T4 DNA连接酶突变体的连接效率，我们设计了T4 DNA连接酶突变体(T4DL-M6)与不同核酸结合结构域的融合蛋白(SEQ ID NO:8-17,SEQ ID NO:25-34),采用与实施例1相同的方法进行表达、纯化。

实施例4：T4 DNA连接酶突变体的连接效率测定(二)

采用与实施例2相同的方法，对实施例3得到的融合蛋白进行测试，研究不同核酸结构域的影响，其结果如表2所示。

表2添加不同核酸结合结构域对连接效率的影响

实施例5：连接酶亲和力测定

我们使用生物膜干涉技术(BLI)进行连接酶对核酸底物的亲和力测试，该方法将发生在BLI生物传感器表面的光干涉信号转化为实时的响应信号。以干涉光谱曲线的偏移距离(以nm为单位)与反应发生时间绘制的关系图被称为传感图，通过传感图可在各种结合模型的基础上拟合出Ka，Kd和KD的数值。Kon(Ka)：结合速率常数，代表酶与底物复合物的结合速率，在1M酶和底物的条件下，每秒产生的复合物数量。Koff(Kd):解离速率常数，反映了酶与底物复合物的稳定性，即每秒中解离的复合物的百分比。KD：反映了相互作用能力的强弱，单位为M，是平衡常数的倒数。

将SA传感器用1×PBST(0.02％)预湿10min。不同T4DNA连接酶样品使用前先用混匀仪混匀，将混匀后的T4DL连接酶用1×PBST稀释至50ug/ml，DNA(SEQ ID 18和19退火而成的双链底物)用1×PBST稀释至100nM，混匀3min。将混匀好的样品加入黑色96孔板中，每孔加200ul。打开OCTET分子互作仪(RED96e)程序设置页面，按照样品排布顺序设置实验步骤以及检测时间，选择SA传感器，设置检测温度为25℃，运行程序开始检测。使用分析软件，设置reference和sample传感器，扣除对照孔，输出检测数据。具体数据见下表：

表3连接酶与DNA的亲和力

SeqID	名称	KD(M)
			7	T4DL-M6	1.37E-10
8	T4DL-M6-GSGS-p50	4.01E-10
			9	T4DL-M6-GSGS-Sso7d	9.71E-11
10	T4DL-M6-GSGS-Sto7d	1.91E-11
			13	T4DL-M6-GSGS-Aho7c	5.16E-09
14	T4DL-M6-GSGS-Sac7b	2.02E-11
			15	T4DL-M6-PAPAPAPA-Sto7d	8.41E-11
16	T4DL-M6-AAAA-Sto7d	1.02E-10
			17	Sto7d-AAAA-T4DL-M6-AAAA-Sto7d	2.41E-12

实施例6：DNA建库应用测试

使用诺唯赞DNA建库试剂盒VAHTS Universal Pro DNA Library Prep Kit forIllumina(Vazyme，货号：ND608)替换对应说明书的步骤二Adapter Ligation步骤的RapidDNALigase2组分为纯化后的连接酶，评测突变体在低模板量下的DNA建库产量差异。

投入0.1ng的片段化的鲑鱼精基因组(input DNA)，依据ND608的建库流程进行文库构建。将片段化的DNA在DNA Damage Repair&End Preparation步骤中进行修复后，在体系中加入Rapid Ligation buffer5及实施例1、3中的连接酶。根据说明书推荐加入稀释后的DNAAdapter(Vazyme，VAHTS DNAAdapters set 1-6for Illumina，货号：N805)。连接接头后的连接产物经过磁珠(Vazyme，VAHTS DNAClean Beads，货号：N411)纯化，对纯化后的Adapter Ligation产物根据说明书推荐的循环数进行PCR扩增后，再次纯化产物，对产物文库使用Equalbit1×dsDNAHSAssay Kit(Vazyme，货号：EQ121)定量试剂盒在Qubit4(Thermo)进行文库产量测定。图1提供了各种连接酶的DNA建库文库产量。

实施例7：RNA建库应用测试

使用诺唯赞RNA建库试剂盒

Universal V6RNA-seq Library Prep Kitfor Illumina(Vazyme，货号：NR604)替换对应说明书的接头连接步骤的RapidDNALigase 2组分为纯化后的连接酶，评测突变体在低模板量下的RNA建库产量差异。

投入50ng总量的293RNA，依据NR604实验流程Poly(A)法构建普通mRNA文库的建库流程进行文库构建。使用VAHTS mRNACapture Beads(Vazyme，货号：N401)进行mRNA富集，对富集后的片段化mRNA按说明书步骤进行双链cDNA的合成。合成完毕后进行接头连接步骤，按照说明书的连接体系，依次加入Nuclease-free ddH₂O、Rapid Ligation buffer3、实施例1和3的连接酶。根据说明书推荐加入稀释后的RNAAdapter(Vazyme，VAHTS RNA AdaptersSet3-Set6 for Illumina，货号：N809)。连接接头后的连接产物经过磁珠(Vazyme，VAHTSDNAClean Beads货号：N411)纯化，对纯化后的Adapter Ligation产物根据说明书推荐的循环数进行PCR扩增后，再次纯化产物，对产物文库使用Equalbit1×dsDNAHSAssay Kit(Vazyme，货号：EQ121)定量试剂盒在Qubit4(Thermo)进行文库产量测定。图2提供了各种连接酶的RNA建库产量。

Claims

1.一种T4DNA连接酶突变体，其中突变体与氨基酸序列如SEQ ID NO:1所示的野生型T4DNA连接酶相比，含有下列位点上的氨基酸取代组合：

K16R、I121R、V125K、K226A、F235A、D371G、D373R、K470D。

2.根据权利要求1所述的突变体，其序列为SEQ ID NO:7。

3.一种融合蛋白，其在权利要求1或2的突变体的一端或两端连接DNA结合结构域。

4.根据权利要求3所述的融合蛋白，其中所述DNA结合结构域选自p50、p50截短体、Sso7d、Sto7d、Aho7a、Aho7b、Aho7c、Sac7b。

5.根据权利要求3所述的融合蛋白，其中突变体通过多肽桥连接DNA结合结构域。

6.根据权利要求5所述的融合蛋白，其中所述多肽桥选自GSGS多肽、PAPAPAPA多肽、AAAA多肽、GGGGS多肽、GQGQGQGQ多肽。

7.根据权利要求3所述的融合蛋白，选自下列中的任意一个：

8.根据权利要求3所述的融合蛋白，其序列选自SEQ ID NO:8-17。

9.一种多核苷酸，其编码权利要求1所述的突变体或权利要求3所述的融合蛋白。

10.一种表达载体，其掺入有权利要求9所述的多核苷酸。

11.一种宿主细胞，其用权利要求9所述的多核苷酸转化并表达所述多核苷酸。

12.一种组合物，所述组合物包含权利要求1所述的突变体或权利要求3所述的融合蛋白。

13.一种用于产生DNA文库的方法，所述方法包括提供：至少一种权利要求1所述的突变体或权利要求3所述的融合蛋白、包含输入双链DNA的底物、以及包含至少一种T加尾的衔接子寡核苷酸、腺苷和反应缓冲液的反应混合物组合物；在使得腺苷被添加至所述DNA的两条链的3’末端，并将所述T加尾的衔接子连接至所述输入DNA末端的条件下，将所述至少一种突变体或融合蛋白、所述底物和所述反应混合物混合，以产生包含DNA文库的产物。