CN117070514B

CN117070514B - 非天然rna的制备方法及产品

Info

Publication number: CN117070514B
Application number: CN202311335114.7A
Authority: CN
Inventors: 洪浩; 詹姆斯·盖吉; 张娜; 焦学成; 刘芳; 马翠萍; 庞会宁; 贾旭; 王召帅; 耿宇菡; 崔丽心; 朱文轩; 赵晓岚
Original assignee: Asymchem Laboratories Jilin Co Ltd; Tianjin Asymchem Pharmaceutical Co Ltd
Current assignee: Asymchem Laboratories Jilin Co Ltd; Tianjin Asymchem Pharmaceutical Co Ltd
Priority date: 2023-10-16
Filing date: 2023-10-16
Publication date: 2024-04-26
Anticipated expiration: 2043-10-16
Also published as: CN117070514A

Abstract

本发明提供了一种非天然RNA的制备方法及产品。其中，上述非天然RNA的制备方法包括：利用RNA连接酶将底物供体的3'端与底物受体的5'端连接形成磷酸二酯键，连接不需要模板链，制备获得非天然RNA，底物供体和/或底物受体中包括一个或多个非天然核苷酸；底物受体的5'端为磷酸基团；底物供体的3'端为羟基基团；RNA连接酶包括RNA连接酶家族Rnl1和Rnl2中任意的一种或多种酶。能够解决现有技术中难以利用酶催化制备非天然RNA的问题，适用于RNA合成领域。

Description

非天然RNA的制备方法及产品

技术领域

本发明涉及RNA合成领域，具体而言，涉及一种非天然RNA的制备方法及产品。

背景技术

核糖核酸是存在于生物细胞以及部分病毒、类病毒中的遗传信息载体。在很长的一段时间内，RNA被认为只是在基因与蛋白质之间进行信息传递的分子。其实，在生命起源之初，RNA是唯一的生命分子，既可储存信息，也具有酶的功能。RNA除了充当蛋白质合成的信使之外（mRNA），还具有着非常重要的调控功能，非转录RNA包括miRNA，siRNA，lncRNA，piwiRNA等等。其中，仅miRNA分子就有400多种，调控至少三分之一的人类基因。从20世纪70年代起，基因载体技术、基因克隆技术、基因编辑技术等给现代基因疗法技术带来了深刻的影响。同时RNA编辑技术实现了从遗传水平对人体细胞中特定的核苷酸进行编辑，这一技术不仅可以用作研究工具，而且可作为由突变引发的疾病的临时治疗方法。

近年来，RNA药物领域飞速发展，一方面是以siRNA和ASO为代表的小核酸药物在罕见病等领域大放异彩，另一方面是以mRNA疫苗为代表的mRNA药物在新冠疫情中发挥了重要的作用。目前寡核苷酸（12-30个核苷酸）通用的合成方法多为固相合成法，而固相合成是将核酸固定在固相载体上完成合成反应的，最常用的固相载体为可控微孔玻璃珠（CPG），但是载量有限，一般为70-80 μmol/g。但是固相合成核苷酸链存在很大的缺点，合成的寡核苷酸初产物纯度低，且合成链长受限，一般用于合成25个核苷酸以内的链长，随着合成链长的增加，产率降低，引物合成至~80nt链长时粗品纯度只有~40%，过低的纯度同时影响了纯化的收率，导致了纯化的低收率，因此极大限制了核苷酸链的合成。同时还存在有机试剂用量大，加大了三废处理的困难，对环境的污染较严重。

天然的寡核苷酸在体内容易被降解，特异性低，并且具有毒副作用，因此，药物寡核苷酸通常以特定的化学修饰来增强其在体内的稳定性，提高特异性，并降低毒副作用，这些化学修饰有氟代、甲基及甲氧乙基修饰等。相较于传统的蛋白水平发挥作用的药物相比，核酸药物具有高特异性、高效性、长效性等明显的优势，但是由于天然核酸对核酸内切酶或外切酶都非常敏感，极易被降解，因此核酸药物使用化学修饰来提高稳定性和降低免疫原性、增强特异性。单化学修饰的核酸属于人为创造的，并非天然的，因此天然的酶对非天然的核酸的活性是未知的。

酶法催化合成是一种绿色高效的方式，反应条件比较温和，对有机试剂需求小甚至不需要有机试剂，因此是一种比较有前景的催化方式。利用连接酶合成核苷酸链，可以实现绿色催化，同时合成链长不受限制，可以解决固相合成的技术瓶颈。但连接酶连接单链RNA的应用多限制于天然的RNA链，文献或专利中对于酶法催化合成非天然单链RNA的报道几乎没有。

发明内容

本发明的主要目的在于提供一种非天然RNA的制备方法及产品，以解决现有技术中难以利用酶催化制备非天然RNA的问题。

为了实现上述目的，根据本发明的第一个方面，提供了一种非天然RNA的制备方法，该制备方法包括：利用RNA连接酶将底物供体的3'端与底物受体的5'端连接形成磷酸二酯键，连接不需要模板链，制备获得非天然RNA，底物供体和/或底物受体中包括一个或多个非天然核苷酸；底物受体的5'端为磷酸基团；底物供体的3'端为羟基基团；RNA连接酶包括RNA连接酶家族Rnl1和Rnl2中任意的一种或多种酶。

进一步地，RNA连接酶包括：SEQ ID NO：1、SEQ ID NO：2、SEQ ID NO：3、SEQ ID NO：4、SEQ ID NO：5、SEQ ID NO：6、SEQ ID NO：7、SEQ ID NO：8、SEQ ID NO：15、SEQ ID NO：16、SEQ ID NO：17、SEQ ID NO：18、SEQ ID NO：19、SEQ ID NO：20、SEQ ID NO：21或SEQ ID NO：22所示的RNA连接酶中的一种或多种；或与SEQ ID NO：1~ SEQ ID NO：8、SEQ ID NO：15~SEQID NO：22中所示的任一RNA连接酶具有70%以上同一性，且具有催化磷酸二酯键形成活性的酶。

进一步地，制备方法中的底物供体包括一个或n个，n为大于等于2的整数，当底物供体为n个时，制备方法包括：第一底物供体与第一底物受体连接，形成第二底物受体；第二底物供体再与第二底物受体连接，形成第三底物受体；直至第n-1底物供体与第n-1底物受体连接，形成第n底物受体；第n底物供体与第n底物受体连接，形成非天然RNA。

进一步地，第一底物受体的5'端为磷酸基团；第n底物供体的5'端为5'保护基；第二底物供体至第n-1底物供体的5'端为羟基；第二底物供体至第n底物供体的3'端为羟基。

进一步地，第二底物受体的前体至第n底物受体的前体的5'端均为5'保护基，5'保护基包括羟基；在将第二底物受体至第n底物受体与相应底物供体连接前，将第二底物受体的前体至第n底物受体的前体上的5'保护基替换为磷酸基团；利用多聚核苷酸激酶分别将第二底物受体至第n底物受体的前体的5'端修饰为磷酸基团，获得5'端为磷酸基团的底物受体，并失活多聚核苷酸激酶。

进一步地，制备方法中的底物受体包括一个或n个，n为大于等于2的整数；当底物受体为n个时，制备方法包括：将第一底物供体与第一底物受体连接，形成第二底物供体；将第二底物受体与第二底物供体连接，形成第三底物供体；直至将第n-1底物受体与第n-1底物供体连接，形成第n底物供体；将第n底物受体与第n底物供体连接，形成非天然RNA。

进一步地，底物受体的3'端为保护基团；第二底物供体的前体至第n底物供体的前体和非天然RNA的前体的3'端均为保护基团；在将第二底物供体至第n底物供体与相应底物受体连接前，对保护基团进行脱保护，获得3'端为羟基的底物供体或非天然RNA。

进一步地，非天然核苷酸包括：具有核糖2'位修饰、核糖骨架修饰、碱基修饰或磷酸骨架修饰中的一种或多种的核糖核苷酸；核糖2'位修饰包括2'-甲氧基修饰、2'-氟修饰、2'-甲氧乙基修饰、2'-FANA修饰、锁核酸修饰或己糖醇核酸修饰；核糖骨架修饰包括将核苷酸中的核糖替换为ribuloNA、TNA、tPhoNA或dXNA；碱基修饰包括脱氮腺嘌呤C7修饰、脱氮鸟苷C7修饰、胞嘧啶C5修饰或尿苷C5修饰；磷酸骨架修饰包括PS修饰。

进一步地，底物供体和/或底物受体中含有1个或多个非天然核苷酸；底物供体的3'端碱基和/或底物受体的5'端碱基为非天然核苷酸。

进一步地，底物供体和/或底物受体由非天然核苷酸组成。

进一步地，底物供体和底物受体的长度均为2-500 nt。

进一步地，非天然RNA的长度>3 nt。

进一步地，底物受体的3'端为保护基团；底物供体的5'端为5'保护基。

进一步地，保护基团包括N-乙酰半乳糖胺基团、磷酸基团、-O-NH₂、叠氮基、氰乙基、烯丙基或2-硝基苄基；5'保护基包括羟基、氢或甲基。

根据本发明的第二个方面，提供了一种非天然RNA，该非天然RNA包括利用上述制备方法制备获得的所述非天然RNA。

应用本发明的技术方案，上述制备方法中，通过RNA连接酶催化合成的方法组装非天然RNA片段，从而合成更长的非天然RNA链，无需模板链的引入即可实现特异性高效性的连接。可实现高效催化，较化学法合成非天然RNA能有效提高效率和收率。

附图说明

构成本申请的一部分的说明书附图用来提供对本发明的进一步理解，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：

图1示出了根据本发明实施例的多条底物供体和底物受体连接制备非天然RNA的示意图。

图2示出了根据本发明实施例的多条底物受体和底物供体连接制备非天然RNA的示意图。

图3示出了根据本发明实施例2的SDS-PAGE凝胶电泳结果图。

图4示出了根据本发明实施例3的SDS-PAGE凝胶电泳结果图。

图5示出了根据本发明实施例3的UPLC色谱图。

图6示出了根据本发明实施例4的UPLC色谱图。

图7示出了根据本发明实施例4的UPLC色谱图。

图8示出了根据本发明实施例4的L96的结构示意图。

图9示出了根据本发明实施例5的底物9、10和11的结构示意图。

具体实施方式

需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。下面将结合实施例来详细说明本发明。

如背景技术所提到的，利用连接酶连接单链RNA的应用多限制于天然的RNA链，文献或专利中对于酶法催化合成非天然单链RNA的报道几乎没有。因而，在本申请中发明人尝试开发一种非天然RNA的制备方法，利用RNA连接酶催化合成的方法组装非天然RNA片段，从而合成更长的非天然RNA链，因而提出了本申请的一系列保护方案。

在本申请第一种典型的实施方式中，提供了一种非天然RNA的制备方法，该制备方法包括：利用RNA连接酶将底物供体的3'端与底物受体的5'端连接形成磷酸二酯键，连接不需要模板链，制备获得非天然RNA，底物供体和/或底物受体中包括一个或多个非天然核苷酸；底物受体的5'端为磷酸基团；底物供体的3'端为羟基基团；RNA连接酶包括RNA连接酶家族Rnl1和Rnl2中任意的一种或多种酶。

在上述制备方法中，利用RNA连接酶连接底物供体和底物受体，能够在不需要模板链的情况下完成连接，将底物供体的5'端和底物受体的3'端以磷酸二酯键连接。其中，底物供体的5'端为磷酸基团，底物受体的3'端为羟基基团。

底物受体或底物供体的数量包括1个或多个，若底物受体的数量为多个时，可以通过RNA连接酶进行分步连接，将底物受体连接至底物供体上形成新的底物供体后，再将新的底物受体连接在新的底物供体上；相似地，若底物供体的数量为多个时，通过RNA连接酶进行分步连接，将底物供体连接在底物受体上形成新的底物受体后，再将新的底物供体连接在新的底物受体上。利用上述方法能够实现多个底物受体和底物供体的连接，实现对于长链非天然RNA的制备，防止由于RNA片段过长影响连接效率和RNA稳定性。

在本申请中，底物供体和底物受体的概念并不限制底物的具体性质，仅将在RNA连接中位于5'方向的底物定义为底物供体，位于3'方向的底物定义为底物受体。在不同的反应中，相同的反应底物可能为底物供体，也可能为底物受体。

在一种优选的实施例中，RNA连接酶包括：SEQ ID NO：1、SEQ ID NO：2、SEQ ID NO：3、SEQ ID NO：4、SEQ ID NO：5、SEQ ID NO：6、SEQ ID NO：7、SEQ ID NO：8、SEQ ID NO：15、SEQ ID NO：16、SEQ ID NO：17、SEQ ID NO：18、SEQ ID NO：19、SEQ ID NO：20、SEQ ID NO：21或SEQ ID NO：22所示的RNA连接酶中的一种或多种，或与上述SEQ ID NO：1~8、SEQ ID NO：15~SEQ ID NO：22中所示的任一RNA连接酶具有70%以上同一性的酶，优选为75%以上同一性、80%以上同一性、85%以上同一性、90%以上同一性、95%以上同一性、98%以上同一性、99%以上同一性、99.5%以上同一性、99.9%以上同一性，且具有催化上述磷酸二酯键形成活性的酶。

上述所示的RNA连接酶是在本申请中筛选出的能够连接非天然RNA的RNA连接酶。其中非天然RNA中包括单化学修饰的核酸，属于人为创造的并非天然的，因此天然的酶对非天然的核酸的活性是未知的。在本申请中，通过对现有的RNA连接酶进行大规模筛选，获得了上述能够不依赖模板链即能够连接非天然RNA的RNA连接酶。

本申请中的同一性（Identity）是指氨基酸序列或核酸序列之间的“同一性”，即氨基酸序列或核酸序列中的种类相同的氨基酸残基或核苷酸的比率的总计。氨基酸序列或核酸序列的同一性可以利用BLAST（Basic Local Alignment Search Tool）、FASTA等比对程序来确定。

70%、75%、80%、85%、90%、95%、99%以上（比如85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、98.5%、99%、99.5%、99.6%、99.7%、99.8%以上，甚至99.9%以上）同一性且具有相同功能的蛋白质，其活性位点、活性口袋、活性机制、蛋白结构等均和a）序列提供的蛋白质大概率相同。

如本文所用，氨基酸残基缩写如下：丙氨酸(Ala；A)、天冬酰胺(Asn；N)、天冬氨酸(Asp；D)、精氨酸(Arg；R)、半胱氨酸(Cys；C)、谷氨酸(Glu；E)、谷氨酰胺(Gln；Q)、甘氨酸(Gly；G)、组氨酸(His；H)、异亮氨酸(Ile；I)、亮氨酸(Leu；L)、赖氨酸(Lys；K)、蛋氨酸(Met；M)、苯丙氨酸(Phe；F)、脯氨酸(Pro；P)，丝氨酸(Ser；S)、苏氨酸(Thr；T)、色氨酸(Trp；W)、酪氨酸(Tyr；Y)和缬氨酸(Val；V)。

取代、替换等规则，一般情况下，哪些氨基酸性质类似，替换后的效果也类似。例如，在上述同源蛋白中，可发生保守的氨基酸替换。“保守的氨基酸替换”包括但不限于：

疏水性氨基酸（Ala、Cys、Gly、Pro、Met、Val、Ile、Leu）被其他疏水性氨基酸取代；

侧链粗大的疏水性氨基酸（Phe、Tyr、Trp）被其他侧链粗大的疏水性氨基酸取代；

侧链带正电的氨基酸（Arg、His、Lys）被其他侧链带正电的氨基酸取代；

侧链有极性不带电的氨基酸（Ser、Thr、Asn、Gln）被其他侧链有极性不带电的氨基酸取代。

本领域技术人员也可以根据现有技术中的“blosum62评分矩阵”等本领域技术人员熟知的氨基酸替换规则对氨基酸进行保守替换。

在一种优选的实施例中，制备方法中的底物供体包括一个或n个，n为大于等于2的整数，当底物供体为n个时，制备方法包括：第一底物供体与第一底物受体连接，形成第二底物受体；第二底物供体再与第二底物受体连接，形成第三底物受体；直至第n-1底物供体与第n-1底物受体连接，形成第n底物受体；第n底物供体与第n底物受体连接，形成非天然RNA。

在一种优选的实施例中，第一底物受体的5'端为磷酸基团；第n底物供体的5'端为5'保护基；第二底物供体至第n-1底物供体的5'端为羟基；第二底物供体至第n底物供体的3'端为羟基。

在一种优选的实施例中，第二底物受体的前体至第n底物受体的前体的5'端均为5'保护基，5'保护基包括但不限于羟基；在将第二底物受体至第n底物受体与相应底物供体连接前，将第二底物受体的前体至第n底物受体的前体上的5'保护基替换为磷酸基团；利用多聚核苷酸激酶分别将第二底物受体至第n底物受体的前体的5'端均修饰为磷酸基团，获得5'端为磷酸基团的底物受体，并失活多聚核苷酸激酶。

上述底物供体为n个，表示在制备方法中有n个作为底物原料的底物供体，逐渐连接在底物受体上形成新的底物受体；新的底物受体进一步地与新的底物供体连接，从而实现将底物受体和n个底物供体相连接。在利用上述方法以此连接多条底物供体和底物受体时，由于新生成的底物受体的前体的5'端不是磷酸基团，因此需要利用多聚核苷酸激酶，将底物受体和底物供体连接形成的新的底物供体的前体的5'端（即原底物受体的5'端碱基）修饰为磷酸基团，再利用RNA连接酶催化新的底物受体的3'端的羟基与该磷酸基团相连。反应步骤如图1所示。图1中的底物1即为上述第一底物受体，底物2即为上述第一底物供体，底物3即为上述第二底物供体。

在一种优选的实施例中，上述制备方法中的底物受体包括一个或n个，n为大于等于2的整数；当底物受体为n个时，制备方法包括：将第一底物供体与第一底物受体连接，形成第二底物供体；将第二底物受体与第二底物供体连接，形成第三底物供体；直至将第n-1底物受体与第n-1底物供体连接，形成第n底物供体；将第n底物受体与第n底物供体连接，形成非天然RNA。

在上述制备方法中，上述底物受体为n个，表示在制备方法中有n个作为底物原料的底物受体，逐步连接在底物供体上形成新的底物供体；新的底物供体进一步地与新的底物受体连接，从而实现将底物供体和n个底物受体相连接。反应步骤如图2所示。图2中的底物1即为上述第一底物供体，底物2即为上述第一底物受体，底物3即为上述第二底物受体。

在一种优选的实施例中，底物受体的3'端为保护基团；第二底物供体至第n底物供体的前体和非天然RNA的前体的3'端均为保护基团；在将第二底物供体至第n底物供体与相应底物受体连接前，对保护基团进行脱保护，获得3'端为羟基的底物供体或非天然RNA。

为了防止底物受体自连影响反应收率和产物纯度，底物受体的3'端为保护基团，当底物受体与底物供体连接形成新的底物供体后，此种新的底物供体的3'端为保护基团，需要对新的底物供体进行脱保护，获得3'端为羟基的新的底物供体，从而实现进一步地与新的底物受体的连接。

在一种优选的实施例中，非天然核苷酸包括但不限于：具有核糖2'位修饰、核糖骨架修饰、碱基修饰或磷酸骨架修饰中的一种或多种的核糖核苷酸；优选地，核糖2'位修饰包括但不限于2'-甲氧基修饰、2'-氟修饰、2'-甲氧乙基修饰、2'-FANA修饰、锁核酸修饰或己糖醇核酸修饰；优选地，核糖骨架修饰包括但不限于将核苷酸中的核糖替换为ribuloNA、TNA、tPhoNA、或dXNA；优选地，碱基修饰包括但不限于脱氮腺嘌呤C7修饰、脱氮鸟苷C7修饰、胞嘧啶C5修饰、或尿苷C5修饰；磷酸骨架修饰包括PS修饰。

其中，锁核酸修饰为；己糖醇核酸修饰为/>；2’甲氧基乙基修饰为/>；2’甲氧基修饰为/>；2’氟修饰为；2'-FANA为/>；ribuloNA为/>；TNA为；tPhoNA为/>；dXNA为/>；PS修饰为。上述结构中Base均表示碱基，R表示羟基、氢、甲氧基、甲氧乙基或氟修饰。上述对于非天然核苷酸的修饰参见文献：Duffy K , Arangundy-Franklin S , HolligerP . Modified nucleic acids: replication, evolution, and next-generationtherapeutics[J]. BMC Biology, 2020, 18(1):112。

在一种优选的实施例中，底物供体和/或底物受体中含有1个或多个非天然核苷酸；优选地，底物供体的3'端碱基和/或底物受体的5'端碱基为非天然核苷酸；优选地，底物供体和/或底物受体由非天然核苷酸组成。

非天然核苷酸（xeno-nucleic acid，XNA）是一类具有非天然骨架或核酸碱基的核酸分子。非天然核糖核苷酸，即为具有非天然骨架或核酸碱基的核糖核苷酸。上述底物供体和/或底物受体中含有非天然核苷酸，连接制备的RNA中即含有非天然核苷酸，属于非天然RNA。若底物供体的3'端碱基和/或底物受体的5'端碱基为非天然核苷酸时，虽然连接处的碱基与天然碱基不同，属于人为创造的非天然碱基，上述RNA连接酶也能够发挥连接活性。

在一种优选的实施例中，底物供体和底物受体的长度均为2-500 nt，包括但不限于2、3、4、5、6、7、8、9、10、15、20、25、30、40、50、60、80、100、150、200、300、400和500nt。

在一种优选的实施例中，非天然RNA的长度>3 nt，利用具有上述长度的底物供体和底物受体连接形成的非天然RNA，通过对一个或多个的底物受体和底物供体进行连接，能够获得长度>3 nt的非天然RNA。上述非天然RNA的长度包括但不限于4、5、6、7、8、9、10、12、15、20、25、30、35、40、45、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000nt。

在一种优选的实施例中，底物受体的3'端为保护基团；优选地，底物供体的5'端为5'保护基；优选地，保护基团包括GalNac（N-乙酰半乳糖胺基团）、磷酸基团、-O-NH₂、叠氮基（-C-N=N⁺=N^-，3'-O-azidomethyl）、氰乙基（-C-CN,3'-O-2-cyanoethyl）、烯丙基（-C-C=C，3'-O-allyl）、2-硝基苄基（3'-O-2-nitrobenzyl）；优选地，5'保护基包括羟基、氢或甲基。

在本申请第二种典型的实施方式中，提供了一种非天然RNA，该非天然RNA包括利用上述制备方法制备获得的非天然RNA。

本申请中使用的连接酶的序列、来源和所属家族如下。

连接酶1，SEQ ID NO：1，Bacteriophage，RNA ligase 2：

MFKKYSSLENHYNSKFIEKLYSLGLTGGEWVAREKIHGTNFSLIIERDKVTCAKRTGPILPAEDFFGYEIILKNYADSIKAVQDIMETSAVVSYQVFGEFAGPGIQKNVDYCDKDFYVFDIIVTTESGDVTYVDDYMMESFCNTFKFKMAPLLGRGKFEELIKLPNDLDSVVQDYNFTVDHAGLVDANKCVWNAEAKGEVFTAEGYVLKPCYPSWLRNGNRVAIKCKNSKFSEKKKSDKPIKAKVELSEADNKLVGILACYVTLNRVNNVISKIGEIGPKDFGKVMGLTVQDILEETSREGITLTQADNPSLIKKELVKMVQDVLRPAWIELVS。

连接酶2，SEQ ID NO：2，Vibrio phage ，RNA ligase 2：

MSFVKYTSLENSYRQAFVDKCDMLGVREWVALEKIHGANFSFIVEFKPNEAQDGAEFTVTPAKRTSTIGANVMGDYDFYGCTSVVEAHTAKMEAISNWLWARGIINVGETIIVYGELAGKGVQKEVNYGDKDFWAYDILLPETGKFLDWDVVLEACEFAKVKTTHEIARGTLDELLRIDPLFRSFHTPADVDGDNVAEGFVVKQLRNEKRLHNGSRAILKVKNDKFKEKKNKAGKTPRAAVVLTEEQEKLHAAFSCYLTENRLRNVLSKLETVTQKQFGMISGLFIKDAKDEFERDELNETAIARDDWDVIKRSLTNIANEILRKNWLDILDGNF。

连接酶3，SEQ ID NO：3，Bacteriophage AR1，RNA ligase 1：

MQELFNNLMELCKDSQRKFFYSDDVSASGRTYRIFSYNYASYSDWLLPDALECRGIMFEMDGEKPVRIASRPMEKFFNLNENPFTMNIDLNDVDYILTKEDGSLVSTYLDGDEILFKSKGSIKSEQALMANGILMNINHHQLRDRLKELAEDGFTANFEFVAPTNRIVLAYQEMKIILLNIRENETGEYISYDDIYKDAALRPYLVERYEIDSPKWVEEAKNAENIEGYVAVMKDGSHFKIKSDWYVSLHSTKSSLDNPEKLFKTIIDGASDDLKAMYADDEYSYRKIEAFETTYLKYLDRALFLVLDCHNKHCGKDRKTYAMEAQGVAKGAGMDHLFGIIMSLYQGYDSQEKVMCEIEQNFLKNYKKFIPEGY。

连接酶4，SEQ ID NO：4，Bacteriophage dhaeg ，RNA ligase 2：

MFKKYSSLENHYNSKFIEKLRTNGLTGGEWVAREKIHGTNFSLIIERDAVTCAKRTGPILPAEDFYGYEIVLKNYADSIKSIQDIMETSAAVSYQVFGEFAGTGIQKNVDYGDKDFYVFDIIVTTESGDVTYVDDYMMESFCKTFKFKMAPLLGRGKFEDLIKLPNDLDSVLPDYNFTVDNVGLAEANAHVWNAEAKGEVFTAEGYVLKPCYPLWLPNGNRVAIKCKNSKFSEKKKTDKPIKVAVVLSQDDLDLLQQFTDYVTVNRINNVISKIGEVSPKDFGKVMGLTVQDILEEAAREELELTDAENPVEVKKQLIECVKDTLRAVWIELVSK。

连接酶5，SEQ ID NO：5，Klebsiella phage KP179，RNA ligase 1：

MLELYKNLMNLCESSEVAKFFYKDFTGPMDGKFRVFSYHYASYSEWLKPDALECRGIMFEMDGDTPIRIASRPMEKFFNLNENPLTMGIDISDVEYIMDKADGSLVSSYVDDGYLYLKSKTSLYSDQARQASALLNSEEYSSLHQVILELTLDGYTVNMEFVSPNNRVVLAYQEPQLFVLNVRNNTTGEYIKYDDLYANAKIRPYLINAYGISDPTTWVEGVRELEGVEGYIAVLNTGQRFKVKTEWYSALHHTKDSITSNERLFASVVSANSDDLRSLFAGDEYAIKKISAFEQAYLDYLGKSLELCQSFYDEYRGRARKDYAIAAQKATVNQRHLFGVIMNMYEGTVDVDKLLKDLERVFLKYWAGYVPKEYEKEIELSEE。

连接酶6，SEQ ID NO：6，Vibrio phage，RNA ligase 1：

MTTQELYNHLMTLTDDAEGKFFFADHISPLGEKLRVFSYHIASYSDWLLPGALEARGIMFQLDEQDKMVRIVSRPMEKFFNLNENPFTMDLDLTTTVQLMDKADGSLISTYLTGENFALKSKTSIFSEQAVAANRYIKLPENRDLWEFCDDLTQAGCTVNMEWCAPNNRIVLEYPEAKLVILNIRDNETGDYVSFDDIPLPALMRVKKWLVDEYDPETAHADDFVEKLRATKGIEGMILRLANGQSVKIKTQWYVDLHSQKDSVNVPKKLVTTILNNNHDDLYALFADDKPTIDRIREFDSHVSKTVSASFHAVSQFYVKNRHMSRKDYAIAGQKTLKPWEFGVAMIAYQNQTVEGVYEALVGAYLKRPELLIPEKYLNEA。

连接酶7，SEQ ID NO：7，Escherichia phage JN02，RNA ligase 1：

MEKLYYNLLSLCKSSSDRKFFYSDDVSPIGKKYRIFSYNFASYSDWLLPDALECRGIMFEMDGETPVRIASRPMEKFFNLNENPFTLSINLDDVKYLMTKEDGSLVSTYLDGGTVRFKSKGSIKSDQAVSATSILLDIDHKNLADRLLELCNDGFTANFEYVAPTNKIVLTYPEKRLILLNIRDNNTGEYIEYDDIYLDPVFRKYLVDRFEVPEGDWTSDVKSSTNIEGYVAVMKDGSHFKLKTDWYVALHTTRDSISSPEKLFLAIVNGASDDLKAMYADDEFSFKKVELFEKAYLDFLDRSFYICLDTYDKHKGKDRKTYAIEAQAVCKGAQTPWLFGIIMNLYQGGSKEQMMTALESVFIKNHKNFIPEGY。

连接酶8，SEQ ID NO：8，Klebsiella phage KP15，RNA ligase 2：

MFKKYSSLTNHYEGKFINGVIMNGLTGGVWVAREKIHGANFSFITDDGITVTPAKRTDVVKPAEDFYGCSAVVAKYSPGIRKMWETLKKTGTYDDLVIQVYGEFAGRGVQKDVDYGEKDFYVFDIRVNGEFLPDNLCSLISRSHGLKMAPLLGYGTFEEIKELPITFESVVNKANSGIGSDNTVYGEFVYPIMDVEEGNIAEGFVMKPVSPAFMPNGERVAIKCKTTKFTEKKAKKATRFNAPVSLSEKDKNQLDEFVCYLTENRVKNVLSKLDLASITAKDFGRIMGLTVQDAIEEISRNHGPFIEQFEDPAMAKKLFVTEAQNMIRPVWGKILNHEF。

连接酶9，SEQ ID NO：9，Thermococcus，RNA ligase 2-like：

MVSSYFRNLLLKLGLPEERLEVLEGKGALAEDEFEGIRYVRFRDSARNFRRGTVVFETGEAVLGFPHIKRVVQLENGIRRVFKNKPFYVEEKVDGYNVRVVKVKDKILAITRGGFVCPFTTERIEDFVNFDFFKDYPNLVLVGEMAGPESPYLVEGPPYVKEDIEFFLFDIQEKGTGRSLPAEERYRLAEEYGIPQVERFGLYDSSKVGELKELIEWLSEEKREGIVMKSPDMRRIAKYVTPYANINDIKIGSHIFFDLPHGYFMGRIKRLAFYLAENHVRGEEFENYAKALGTALLRPFVESIHEVANGGEVDETFTVRVKNITTAHKMVTHFERLGVKIHIEDIEDLGNGYWRITFKRVYPDATREIRELWNGLAFVD。

连接酶10，SEQ ID NO：10，Archaea，tRNA-splicing ligase ：

MVVPLKRIDKIRWEIPKFDKRMRVPGRVYADEVLLEKMKNDRTLEQATNVAMLPGIYKYSIVMPDGHQGYGFPIGGVAAFDVKEGVISPGGIGYDINCGVRLIRTNLTEKEVRPRIKQLVDTLFKNVPSGVGSQGRIKLHWTQIDDVLVDGAKWAVDNGYGWERDLERLEEGGRMEGADPEAVSQRAKQRGAPQLGSLGSGNHFLEVQVVDKIFDPEVAKAYGLFEGQVVVMVHTGSRGLGHQVASDYLRIMERAIRKYRIPWPDRELVSVPFQSEEGQRYFSAMKAAANFAWANRQMITHWVRESFQEVFKQDPEGDLGMDIVYDVAHNIGKVEEHEVDGKRVKVIVHRKGATRAFPPGHEAVPRLYRDVGQPVLIPGSMGTASYILAGTEGAMKETFGSTCHGAGRVLSRKAATRQYRGDRIRQELLNRGIYVRAASMRVVAEEAPGAYKNVDNVVKVVSEAGIAKLVARMRPIGVAKGAAALEH。

连接酶11，SEQ ID NO：11，thermophilic bacteriophage，RNA ligase 1：

MESMNVKYPVEYLIEHLNSFESPEVAVESLRKEGIMCKNRGDLYMFKYHLGCKFDKIYHLACRGAILRKTDSGWKVLSYPFDKFFNWGEELQPEIVNYYQTLRYASPLNEKRKAGFMFKLPMKLVEKLDGTCVVLYYDEGWKIHTLGSIDANGSIVKNGMVTTHMDKTYRELFWETFEKKYPPYLLYHLNSSYCYIFEMVHPDARVVVPYEEPNIILIGVRSVDPEKGYFEVGPSEEAVRIFNESGGKINLKLPAVLSQEQNYTLFRANRLQELFEEVTPLFKSLRDGYEVVYEGFVAVQEIAPRVYYRTKIKHPVYLELHRIKTTITPEKLADLFLENKLDDFVLTPDEQETVMKLKEIYTDMRNQLESSFDTIYKEISEQVSPEENPGEFRKRFALRLMDYHDKSWFFARLDGDEEKMQKSEKKLLTERIEKGLFK。

连接酶12，SEQ ID NO：12，Diplonema papillatum，RNA ligase 2：

MPLSQGAALIRSPTVTAEEKVDGSNLAVYLDASGAVTCQNRGKFVTPSSGSQWGGQLATWLESHYCELVSLLRQRYILYGEWLLARHSIRYQSLPDYFVAFDVYDRTARRFLSAKKRNAFLSQSTIPVVKPLAVGPFAEADILRLLGSPSRYGAAKVEGIYLRSDSGAWLQQRAKVVNSDFLQTIDDDGHWQKRVLEKNQLKY。

连接酶13，SEQ ID NO：13，virus，RNA ligase 2-like：

MVYICIDTGSHAKGYAVESSDTDYHIYTKCDRETFEKFIDNKELLKNRHAKDESGNDVKYVDLYTGLIGILTGKSPELSMFSKREDFKDKYGIENLQLYEFVTKLMTVSMVKIIYTLMRYKILNNAKGLLQLMFNYVYVEYYLDYKRAPKSTKILNMLFNVGDEIKITMDKNNQLVVNDLNVLDLNKNNGGYKIDETLTLFVKNVKLLKLYVKLMQRGEYQQEWTEYFQQWKQQLQDRLHHVPEPPERTDIRHNIVMYALNERGPVMPEDENKIVYQIYPSVSHLDQGKKGTLADKEIIVQEKLDGCNFRIICNQNKITYGSRNTYRPDGNFMNYYRIRKDLETCMRSLQARFNDGFIVYGELMGWKDDAKTTPINVINYVDQKESLKYYAYEIQLYGGEFVPFVEAQELLTNVGFNTIPCHKYLYNDFVERLNFKSLMFPQSPLEGFIIRCGNLIYKLKSDYKDLNKLKIEKGPFEWLTCDYIKSNCDAIDKSDMMKILIFCYNMCKVKNYNEKLLFNKVFNLFRQQFNLNHNDYKNLYKQYVNMCKCTEYK。

连接酶14，SEQ ID NO：14，Archaea，RNA ligase 3：

MVSSVYKEILVKLGLTEDRIETLEMKGGIIEDEFDGIRYVRFKDSAGKLRRGTVVIDEEYVIPGFPHIKRIINLRSGIRRIFKRGEFYVEEKVDGYNVRVVMYKGKMLGITRGGFICPFTTERIPDFVPQEFFKDNPNLILVGEMAGPESPYLVEGPPYVKEDIQFFLFDVQEIKTGRSLPVEERLKIAEEYGINHVEVFGKYTKDDVDELYQLIERLSKEGREGIIMKSPDMKKIVKYVTPYANINDIKIGARVFYELPPGYFTSRISRLAFYLAEKRIKGEEFERVAKELGSALLQPFVESIFDVEQEEDIHELFKVRVKRIETAYKMVTHFEKLGLKIEIVDIEEIKDGWRITFKRLYPDATNEIRELIGGKAFVD。

连接酶15，SEQ ID NO: 15, Trypanosoma brucei gambiense, RNA ligase 2：

MLRCLGVRHFRRTPLLFVGGDGSIFERYTEIDNSNERRINALKGCGMFEDEWIATEKVHGANFGIYSIEGEKMIRYAKRSGIMPPNEHFFGYHILIPELQRYVTSIREMLCEKQKKKLHVVLINGELFGGKYDHPSVPKTRKTVMVAGKPRTISAVQTDSFPQYSPDLHFYAFDIKYKETEGGDYTTLVYDEAIELFQRVPGLLYARAVIRGPMSKVAAFDVERFVTTIPPLVGMGNYPLTGNWAEGLVVKHSRLGMAGFDPKGPTVLKFKCTAFQEISTDRAQGPRVDEMRNVRRDSINRAGVQLPDLESIVQDPIQLEASKLLLNHVCENRLKNVLSKIGTEPFEKEEMTPDQLATLLAKDAMKDFLKDTEPSIVNIPVLIRKDLTRYVIFESRRLVCSQWKDILKRQSPDFSE。

连接酶16，SEQ ID NO: 16, Acidobacteria bacterium, RNA ligase 1：

MKQMYDNLKALTQKNDMFFSSIQTTPSNKPVEIFSYHIASYSDWLEPDAIECRGIMFDITDKENPVILSRPMEKFFNLGENPLALPEDVLPLVKTIEEKRDGSLISTYLDDGKLYTKSKGSLYSDQANDSNRFLMRSENKDFKQALKTLAELGYTANMEYTSPKNQIVLKYEKQELIVLNIRNTETGDYLTLDDLAELDAENPEHTIYTHIAERFVDYEEVDGMSDEDVERIRDMKGIEGYVLVGQNQRVKLKTDWYVNLHRLKDNINNNRRLVESVVESRTDDLRQLFEHDQGSIDKIKEFEQYVLSKIKSCLAEVRTVYERVKHLDRKHYAINAQRYVDYTPLFSVIMRQFDDYNEENVVENIKQIALKNVDDFIPMHYK。

连接酶17，SEQ ID NO: 17, Klebsiella phage KP27, RNA ligase 2：

MFKKYSSLTNHYEGKFINGVIMNGLTGGVWVAREKIHGANFSFITDDGITVTPAKRTDVVKPAEDFYGCSAVVAKYSPGIRKMWETLKKTGTYDDLVIQVYGEFAGRGVQKDVDYGEKDFYVFDIRVNGEFLPDNLCSLISRSHGLKMAPLLGYGTFEEIKELPITFESVVNKANSGIGSDNTVYGEFVYPIMDVEEGNIAEGFVMKPVSPAFMPNGERVAIKCKTTKFTEKKAKKATRFNAPVSLSEKDKNQLDEFVCYLTENRVKNVLSKLDLASITAKDFGRIMGLTVQDAIEEISRNHGPFLEQFEDPAMAKKLFVTEAQNMIRPVWGKILNHEF。

连接酶18，SEQ ID NO: 18, Vibrio phage, RNA ligase 2：

MNVQELYKNLMSLADDAEGKFFFADHLSPLGEKFRVFSYHIASYSDWLLPGALEARGIMFQLDDNDEMIRIVSRPMEKFFNLNENPFTMELDLTTTVQLMDKADGSLISTYLSGENFALKSKTSIFSEQAVAANRYIKKPENRDLWEFCDDCTQAGLTVNMEWCAPNNRIVLEYPEAKLVILNIRDNETGDYVSFDDIPQSALMRVKQWLVDEYDPATAHEPDFVEKLRDTKGIEGMILRLANGQSVKIKTQWYVDLHSQKDSVNVPKKLVTTILNGNHDDLYALFADDKPTIERIREFDSHVTKTLTNSFNAVRQFYARNRHLARKDYAIAGQKVLKPWEFGVAMIAYQKQTVEGVYESLVTAYLKRPELAIPEKYLNGV。

连接酶19，SEQ ID NO: 19, Vibrio phage JN02, RNA ligase 2：

MFKKYSSLENHYNSKFIEKLYTNGLTTGVWVAREKIHGTNFSLIIERDNVTCAKRTGPILPAEDFYGYEIVLKKYDKAIKAVQEVMESISTSVPVSYQVFGEFAGGGIQKGVDYGEKDFYVFDIIINTESDDTYYMSDYEMQDFCNTFGFKMAPMLGRGTFDSLIMIPNDLDSVLAAYNSTASEDLVEANNCVFDANVIGDNTAEGYVLKPCFPKWLSNGTRVAIKCKNSKFSEKKKSDKPVKTQVPLTEIDKNLLDVLACYVTLNRVNNVISKIGTVTPKDFGKVMGLTVQDILEETSREGIVLTSSDNPNLVKKELVRMVQDVLRPAWIELVS。

连接酶20，SEQ ID NO: 20, Vibrio phage JS98, RNA ligase 2：

MFKKYSSLENHYNSKFIEKLRTNGLTGGEWVAREKIHGTNFSLIIERDAVTCAKRTGPILPAEDFYGYEIVLKNYADSIKSVQHLIESINYQSYQIYGELAGPGIQKNVDYGDKDFYVFDIRVTKEDGTESVLTDTLMEAFCIIHKFKVAPCLATGSFEDLIKLPNDFDSVIPDYNFAVDNAGLTIANSTDFIPKVEGKVFTAEGFVLKPDIPTWLPNGNRVAIKCKNSKFSEKKKSDKPIKAAVVLSQDDMDLMWQFTDYVTVNRINNVISKIGEVSKKDFGKVMGLTVQDILEEAAREELELTDAENPVEVKKQLVECVKDTLRAVWIELVS。

连接酶21，SEQ ID NO: 21, Vibrio phage nt-1, RNA ligase 2：

MNELYNNLMTLAESAEGKFFFADHLSPQGEKFRVFSYHIASYSDWLLPDALEARGIMFQLDENDEMIRIVSRPMEKFFNLGENPFTMDLDLTTTVQLMDKADGSLISTYLTGDNFALKSKTSIYSEQAVAANRYIKHVDNRDLWEFCDDCAAQNFTVNMEWCAPNNRIVLEYTEPKLIILNIRDNETGQYVSFDDIPIGALTRIKKWLVDEYDPMTAHVDDFVETLKAKKGIEGMILRLASGQSVKIKTTWYVDLHAQKDSVNSPKKLVTTILNKNHDDLYALFADDKPTIERIREFDDHVSKKVVESFHAVSQYYTKNRHLSRKDFAIAGQKALKPWEFGVAMIAYQNQTVEGVVTMLINAYLKRPELLIPEKYLSEV。

连接酶22，SEQ ID NO: 22, Vibrio phage phi-ST2, RNA ligase 2：

MSFVKYTSLENSYRQAFVDKCDMLGVKEWVALEKIHGANFSFIVEFKPSTEEVPGEMSVTPAKRTSTIGANAMGDYDFYGCTSVVEAHIEKMQDISNWLFANDFIKNDETIIVYGELAGKGIQKEVNYGDKDFWAYDILCPETGEFLDWDVVLKACKFAGVKTTHEIARGTLDELLKIDPLFRSFHTPADVDSENVAEGFVVKQLKAEKRLHNGSRAILKVKNEKFKEKKNKQGKTPRAKVVLTEEQEKLHAAFSCYLTENRLRNVLSKIGKVEAKQFGMVSGLFVKDAKDEFERDERDEVAIPRDDWDVIKRSLVNVANEILRKNWLNIVDGTF。

下面将结合具体的实施例来进一步详细解释本申请的有益效果。

实施例1 RNA连接酶纯化制备

将编码RNA连接酶的基因构建与pET28a(+)载体上，并转化入大肠杆菌BL21(DE3)表达菌株。表达菌株以0.1%的接种量接种至5 mL LB培养基中（含50 µg/mL），于37℃培养16h。得到的培养液以1%的接种量转接到500 mL LB培养基中，于37℃培养至OD₆₀₀=0.6时，加入0.1 mM的IPTG，在20℃诱导16 h。得到的诱导培养液经离心获得菌泥。菌泥用裂解缓冲液（50 mM Tris-Cl pH8.0， 0~500 mM NaCl，10%甘油）重悬，使得菌体终浓度为10%，经超声破碎，离心后得到粗酶液。粗酶液中加入10 mM咪唑，用0.22 µm滤膜过滤后得到的酶液用镍柱进行纯化，经过脱盐换液后，用强阴离子柱进行二次纯化，得到的酶液经脱盐换液后储存于30%甘油中。

实施例2 RNA连接酶催化非模板依赖性的非天然RNA连接

将底物1和底物2加入到干净的试剂瓶中（底物1和底物2的序列如表1所示），配制反应体系，使得终体积为100 µL，底物1和底物2的浓度为500 µM，ATP浓度为1 mM，Tris-HCl（pH 7.5 @ 25℃）浓度为50 mM，MgCl₂浓度为10 mM，DTT（二硫苏糖醇）浓度为1 mM，连接酶的浓度为0.2 mg/mL。将反应体系于16℃反应16 h。得到的反应体系经80℃ 5 min失活连接酶，经12000 rpm离心去除沉淀，上清以SDS-PAGE和UPLC进行检测。结果显示连接酶6和酶8能催化终产品的合成，SDS-PAGE电泳图如图3所示，其中泳道1为Marker，泳道2为对照组（无连接酶），泳道3为利用连接酶9催化的体系，泳道4为利用连接酶10催化的体系，泳道5为利用连接酶11催化的体系，泳道6为利用连接酶13催化的体系，泳道7为利用连接酶6催化的体系，泳道8为利用连接酶8催化的体系，泳道9为利用连接酶12催化的体系。UPLC的结果显示底物已经基本反应完全转化完全。表明连接酶催化合成非天然的RNA的方法是成功的。

表1

。

其中，A、C、G或U后的m表示对于该核糖核苷酸的2'甲氧基修饰，f表示对于该核糖核苷酸的2'氟修饰。

底物1的第1、2、3、4、5、6、8、12和13位核糖核苷酸上具有2'甲氧基修饰，7、9、10和11位核糖核苷酸上具有2'氟修饰。

底物2的第1、2、5和6位核糖核苷酸上具有2'甲氧基修饰，3和4位核糖核苷酸上具有2'氟修饰。

然而并非所有的连接酶都能实现非天然RNA的拼接，以上述同样的条件进行反应，连接酶9、10、11、12就不具备这种活性，连接酶13产生大量的底物剩余和杂质条带的生成。

实施例3 RNA连接酶催化非模板依赖性的短链非天然RNA连接

将底物3和底物4加入到干净的试剂瓶中（底物3和底物4的序列如表2所示），配制反应体系，使得终体积为100 µL，RNA片段3和4的浓度为1000 µM，ATP浓度为1.5 mM，Tris-HCl（pH 7.5 @ 25℃）浓度为50 mM，MgCl₂浓度为10 mM，DTT浓度为1 mM，连接酶的浓度为0.2 mg/mL。将反应体系于16℃反应16 h。得到的反应体系经80℃ 5 min失活连接酶，经12000 rpm离心去除沉淀，上清以SDS-PAGE和UPLC进行检测。结果显示在没有加入连接酶的对照体系中（孔道3），没有目标产品的生成，而加入RNA连接酶的体系中发现了终产品的合成，SDS-PAGE电泳图如图4所示，其中泳道1为利用连接酶6催化的体系，泳道2为利用连接酶11催化的体系，泳道3为对照组（无连接酶），对于其他连接酶的进行相同的筛选。但是由于底物3和4较短。在SDS-PAGE中不能清晰的观测底物的剩余情况，因此用UPLC检测反应的情况。结果显示底物已经基本反应完全转化完全，利用连接酶7催化的反应的UPLC色谱图如图5所示。表明连接酶催化合成非天然的RNA的方法是成功的。所用的RNA连接酶及催化活性如表3所示。

表2

。

底物3的第1、2、5和6位核糖核苷酸上具有2'甲氧基修饰，3和4位核糖核苷酸上具有2'氟修饰。

底物4的第1、2、5、6、9和10位核糖核苷酸上具有2'甲氧基修饰，3、4、7和8位核糖核苷酸上具有2'氟修饰。

表3

。

注：本申请中“+++”表示催化活性70%~100%，“++”表示催化活性60%~70%（不包括70%的端点值），“-”表示基本无催化活性。

实施例4 RNA连接酶催化非模板依赖性的长链非天然RNA连接

将底物7和8加入到干净的试剂瓶中，配制反应体系，使得终体积为100 µL，底物7和8的浓度为300 µM，ATP浓度为0.6 mM，Tris-HCl（pH 7.5 @ 25℃）浓度为50 mM，MgCl₂浓度为10 mM，DTT浓度为1 mM，连接酶的浓度为0.2 mg/mL。将反应体系于37℃反应16 h。得到的反应体系经80℃ 5 min失活连接酶，经12000 rpm离心去除沉淀，上清以SDS-PAGE和UPLC进行检测。利用连接酶4催化的反应的UPLC色谱图如图6所示。结果显示加入RNA连接酶的体系中有产品的生成，表明连接酶催化合成非天然的RNA的方法是成功的。所用的RNA连接酶及催化活性如表4所示。

表4

。

将底物5和6加入到干净的试剂瓶中，配制反应体系，使得终体积为100 µL，底物5和6的浓度为100 µM，ATP浓度为0.2 mM，Tris-HCl（pH 7.5 @ 25℃）浓度为50 mM，MgCl₂浓度为10 mM，DTT浓度为1 mM，连接酶的浓度为0.2 mg/mL。将反应体系于37℃反应16 h。得到的反应体系经80℃ 5 min失活连接酶，经12000 rpm离心去除沉淀，上清以SDS-PAGE和UPLC进行检测。利用连接酶5催化的反应的UPLC色谱图如图7所示，结果显示在加入RNA连接酶的体系中有终产品的生成，表明连接酶催化合成非天然的RNA的方法是成功的。所用的RNA连接酶及催化活性如表5所示。

底物5、6、7和8的序列如表6所示。

表5

。

表6

。

其中，L96的结构如图8所示，其中表示L96基团连接的碱基；A、C、G或U后的m表示对于该核糖核苷酸的2'甲氧基修饰。

底物5、6、7和8的所有核糖核苷酸上都具有2'甲氧基修饰。

实施例5 RNA连接酶催化合成多片段的非天然RNA底物连接

Step1：将底物10和11加入到干净的试剂瓶中，配制反应体系，使得终体积为100 µL，底物10和11的浓度为800 µM，ATP浓度为1.6 mM，Tris-HCl（pH 7.5 @ 25℃）浓度为50mM，MgCl₂浓度为10 mM，DTT浓度为1 mM，连接酶的浓度为0.2 mg/mL。将反应体系于16℃反应16 h。经检测底物已经消耗完全。

Step2：加入10 U/µL的T4多聚核苷酸激酶8 µL，将反应体系于37℃反应6 h，得到的反应体系于80℃ 5 min失活T4多聚核苷酸激酶和连接酶。

Step3：加入与底物10等摩尔数的底物9，补加等摩尔的ATP，最终体系底物浓度为200 µM，加入0.2 mg/mL的连接酶，于16℃反应16 h。得到的终反应体系于80℃ 5 min失活连接酶，经12000 rpm离心去除沉淀，上清以SDS-PAGE和UPLC进行检测。结果显示在最终的体系中有终产品的生成。终产品由5'端至3'端由底物9、底物10和底物11连接而成，产品的转化率达到60%以上，表明RNA连接酶催化合成非天然的RNA的方法是成功的。所用的RNA连接酶及催化活性如表7所示。

底物9、10和11的序列如表8所示，底物9、10和11的示意图如图9所示。

表7

。

表8

。

底物9的第1、2、5和6位核糖核苷酸上具有2'甲氧基修饰，3和4位核糖核苷酸上具有2'氟修饰。

底物10的第3、4、7和8位核糖核苷酸上具有2'甲氧基修饰，1、2、5和6位核糖核苷酸上具有2'氟修饰。

底物11的第1、2、5、6、9和10位核糖核苷酸上具有2'甲氧基修饰，3、4、7和8位核糖核苷酸上具有2'氟修饰。

从以上的描述中，可以看出，本发明上述的实施例实现了如下技术效果：本发明发现了部分RNA连接酶能够连接非天然核苷酸，利用上述制备方法，通过上述RNA连接酶催化合成的方法，能够连接组装2条或更多条非天然RNA片段，从而合成更长的非天然RNA链，无需模板链的引入即可实现特异性高效性的连接。可实现高效催化，较化学法合成非天然RNA能有效提高效率和收率。也克服了现有技术中难以利用现有的用于连接天然核酸的RNA连接酶连接非天然核苷酸的问题。

以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种非天然RNA的制备方法，其特征在于，所述制备方法包括：

利用RNA连接酶将底物供体的3'端与底物受体的5'端连接形成磷酸二酯键，所述连接不需要模板链，制备获得所述非天然RNA，

所述底物供体和/或所述底物受体中包括一个或多个非天然核苷酸；

所述底物受体的5'端为磷酸基团；

所述底物供体的3'端为羟基基团；

所述RNA连接酶为：

SEQ ID NO：1、SEQ ID NO：2、SEQ ID NO：3、SEQ ID NO：4、SEQ ID NO：5、SEQ ID NO：6、SEQ ID NO：7、SEQ ID NO：8、SEQ ID NO：15、SEQ ID NO：16、SEQ ID NO：17、SEQ ID NO：18、SEQ ID NO：19、SEQ ID NO：20、SEQ ID NO：21、SEQ ID NO：22所示的RNA连接酶中的一种或多种；

所述底物供体和所述底物受体由所述非天然核苷酸组成；

所述非天然RNA的长度>3 nt。

2.根据权利要求1所述的制备方法，其特征在于，所述制备方法中的所述底物供体包括一个或n个，n为2或3，

当所述底物供体为n个时，所述制备方法包括：

第一底物供体与第一底物受体连接，形成第二底物受体；

第二底物供体再与所述第二底物受体连接，形成第三底物受体；

直至第n-1底物供体与第n-1底物受体连接，形成第n底物受体；

第n底物供体与所述第n底物受体连接，形成所述非天然RNA。

3.根据权利要求2所述的制备方法，其特征在于，

所述第一底物受体的5'端为磷酸基团；

所述第n底物供体的5'端为5'保护基；

所述第二底物供体至所述第n-1底物供体的5'端为羟基；

所述第二底物供体至所述第n底物供体的3'端为羟基。

4.根据权利要求3所述的制备方法，其特征在于，所述第二底物受体的前体至所述第n底物受体的前体的5'端均为所述5'保护基，所述5'保护基包括羟基；

在将所述第二底物受体至所述第n底物受体与相应所述底物供体连接前，将所述第二底物受体的前体至所述第n底物受体的前体上的所述5'保护基替换为磷酸基团；

利用多聚核苷酸激酶分别将所述第二底物受体的前体至所述第n底物受体的前体的5'端均修饰为磷酸基团，获得5'端为磷酸基团的所述底物受体，并失活所述多聚核苷酸激酶。

5.根据权利要求1所述的制备方法，其特征在于，所述制备方法中的所述底物受体包括一个或n个，n为2或3；

当所述底物受体为n个时，所述制备方法包括：

将第一底物供体与所述第一底物受体连接，形成第二底物供体；

将第二底物受体与所述第二底物供体连接，形成第三底物供体；

直至将第n-1底物受体与第n-1底物供体连接，形成第n底物供体；

将第n底物受体与所述第n底物供体连接，形成所述非天然RNA。

6.根据权利要求5所述的制备方法，其特征在于，所述底物受体的3'端为保护基团；相应地，连接获得的所述第二底物供体的前体至所述第n底物供体的前体的3'端均为所述保护基团；

在将所述第二底物供体至所述第n底物供体与相应所述底物受体连接前，对所述保护基团进行脱保护，获得3'端为羟基的所述底物供体或所述非天然RNA。

7.根据权利要求1所述的制备方法，其特征在于，所述非天然核苷酸包括：具有核糖2'位修饰、核糖骨架修饰、碱基修饰或磷酸骨架修饰中的一种或多种的核糖核苷酸；

所述核糖2'位修饰包括2'-甲氧基修饰、2'-氟修饰、2'-甲氧乙基修饰、2'-FANA修饰、锁核酸修饰或己糖醇核酸修饰；

所述核糖骨架修饰包括将核苷酸中的核糖替换为ribuloNA、TNA、tPhoNA或dXNA；

所述碱基修饰包括脱氮腺嘌呤C7修饰、脱氮鸟苷C7修饰、胞嘧啶C5修饰或尿苷C5修饰；

所述磷酸骨架修饰包括PS修饰。

8.根据权利要求1所述的制备方法，其特征在于，所述底物供体和所述底物受体的长度均为2-50 nt。

9.根据权利要求1所述的制备方法，其特征在于，所述底物受体的3'端为保护基团；所述底物供体的5'端为5'保护基。

10.根据权利要求9所述的制备方法，其特征在于，所述保护基团包括N-乙酰半乳糖胺基团、磷酸基团、-O-NH₂、叠氮基、氰乙基、烯丙基或2-硝基苄基；所述5'保护基包括羟基、氢或甲基。