CN114591986A

CN114591986A - 环状rna分子及其在目标蛋白的靶向降解中的应用

Info

Publication number: CN114591986A
Application number: CN202110863519.2A
Authority: CN
Inventors: 左炽健; 杨嘉丽; 朱佳凤; 杜雅冉; 赵阳; 孙振华
Original assignee: Suzhou Kerui Maide Biomedical Technology Co ltd
Current assignee: Suzhou Kerui Maide Biomedical Technology Co ltd
Priority date: 2021-07-29
Filing date: 2021-07-29
Publication date: 2022-06-07
Also published as: EP4124347A1; US20230042694A1

Abstract

本公开属于生物医药领域，具体来说，本公开涉及一种环状RNA分子、环化前体RNA分子、重组核酸分子、重组表达载体、重组宿主细胞、组合物及其在目标蛋白的靶向降解中的应用，以及一种预防或治疗疾病的方法。环状RNA分子具有良好的透膜性，易于向胞内递送，具有高效的体内蛋白靶向降解活性。本公开的环状RNA分子成功实现了对肿瘤生长抑制，首次证明了bio‑PROTACs的体内蛋白降解活性，为肿瘤等疾病的治疗提供了积极、有效的治疗方案。

Description

环状RNA分子及其在目标蛋白的靶向降解中的应用

技术领域

本公开属于生物医药领域，具体来说，本公开涉及一种环状RNA分子、环化前体RNA分子、重组核酸分子、重组表达载体、重组宿主细胞、组合物及其在目标蛋白的靶向降解中的应用，以及一种预防或治疗疾病的方法。

背景技术

细胞中的蛋白质不断处于合成、修饰与降解的代谢更新过程中，保持正常的蛋白质代谢对于生命的正常功能至关重要。对特定蛋白的降解或干预是研究蛋白质功能的重要途径，也是用于治疗由蛋白异常表达引起的相关疾病的重要措施。目前，对致病蛋白的降解或干预已经成为最有效的疾病治疗策略之一。

传统的小分子抑制剂通过结合目标蛋白(Protein of interest，POI)的活性位点来影响致病蛋白的生物学功能，从而达到治疗效果，至今已被成功用于癌症等多种疾病的临床治疗中。然而，传统小分子药物的研发策略决定其无法作用于“无成药性”(Undruggable)的靶点蛋白，导致目前细胞内仅有20％左右的蛋白可以作为靶点被应用于小分子药物的临床研究中。与此同时，基因编辑技术(例如，CRISPR/Cas技术)、RNAi技术都在一定程度上下调了目标蛋白的表达。然而，这些方法的缺点是需要很长时间才能有效地消除蛋白表达，并且，也无法作用于翻译后修饰的蛋白。一旦目标蛋白的翻译停止，蛋白质的消耗完全取决于其固有的半衰期。因此，CRISPR/Cas技术、RNAi技术等方法对于目标蛋白的调控存在很大的应用局限性^[1]。

细胞中的蛋白质稳态主要依赖细胞内固有的蛋白质降解途径的协调运作维持，其中自噬-溶酶体途径(autophagy-lysosome pathway)和泛素-蛋白酶体途径(ubiquitin-proteasome pathway，UPP)在蛋白质降解中发挥着重要的生物学功能。

蛋白降解靶向嵌合体(PROTACs)技术是近年来发展起来的一种有效的内源性蛋白质降解工具^[2-3]，主要由三部分组成：1)E3连接酶配体，主要用于招募E3连接酶；2)靶标蛋白配体，可以与靶标蛋白(protein of interest，POI)相结合；3)linker，连接E3连接酶配体和靶标蛋白配体。当PROTAC进入细胞后，其一端的靶标蛋白配体特异性识别靶标蛋白并与之结合，另一端的E3连接酶配体与E3结合，从而形成POI-PROTAC-E3ligase三元复合物。PROTAC复合物可以将E3连接酶连接到靶标蛋白上，并招募泛素化的E2，最终将靶标蛋白进行泛素化降解。传统的PROTACs蛋白降解剂主要是小分子化合物。小分子PROTACs蛋白降解剂的出现为解决不可成药靶点提供了可能，因此也成为药物研发的热点领域。然而，小分子PROTACs的药物研发也具有显著缺点，例如其分子量与传统小分子药物相比较大，因此不容易穿透细胞膜，难以进入细胞产生作用；小分子PROTACs依赖细胞内现存的E3泛素连接酶，如果后者表达量较低，则难以产生预期效果。

近年以来开发出来的抗体或多肽介导的蛋白质降解技术，称为生物-蛋白降解靶向嵌合体技术(Bio-PROTAC)能克服以上小分子PROTACs的缺点。TRIM21是一种E3泛素连接酶，与抗体的Fc结构域具有高亲和力^[4]，在多种细胞类型和组织中广泛表达^[5]。TRIM21可以识别抗体结合的病原体并招募泛素-蛋白酶体系统对其进行降解^[6]。利用TRIM21的特性，将抗体与PROTAC技术相结合产生的降解内源性蛋白的技术称为Trim-Away^[7]。在Trim-Away系统中，抗体即相当于PROTAC技术的三连体结构，将抗体通过电转等形式进入细胞后可以结合特定的靶标蛋白，然后Fc端结合TRIM21，抗体，靶标蛋白和TRIM21三元复合物被泛素化并最终被蛋白酶降解。完成蛋白降解需要三个步骤：1)引入可与靶标蛋白相结合的抗体；2)将内源或外源的TRIM21募集至靶标蛋白；3)招募泛素化的E2，促使蛋白酶体介导的蛋白复合物降解。该方法可以快速降解细胞中的靶标蛋白，因此避免了因为长时间筛选而形成的补偿路径。相较于传统的DNA和RNA水平的基因干扰技术，Trim-Away技术可以对已经产生的蛋白尤其是长寿命的蛋白实现更好的降解效果；另外，Trim-Away技术对胞质和核内的蛋白都可实现降解。此外，也有研究报道通过构建纳米抗体-RNF4 E3泛素连接酶的RING结构域嵌合蛋白实现靶蛋白降解^[8]；以及其他分别采用单链抗体、Darpins、纳米抗体、多肽等手段靶向目的蛋白，并分别与不同的E3连接酶组成嵌合蛋白起到蛋白降解作用。然而，无论Trim-Away还是其他各种重组蛋白形式的Bio-PROTAC，均面临重大的临床应用难题，即需要将该重组蛋白形式的蛋白降解剂递送至特定的细胞内才能发挥作用。Bio-PROTAC的分子量大、透膜性差，导致Bio-PROTAC难以进入细胞内发挥作用。对于体外培养的细胞系，尚能采用电转化的方式实现递送重组蛋白的胞内递送。然而，对于Bio-PROTAC分子的体内递送尚未有合适的技术手段。因此，Bio-PROTAC的体内应用实例目前尚未见报道。

引用文献：

[1]Toyama,B.H.,Savas,J.N.,Park,S.K.,Harris,M.S.,Ingolia,N.T.,Yates,J.R.,3rd,and Hetzer,M.W.(2013).Identification of long-lived proteins revealsexceptional stability of essential cellular structures.Cell 154,971–982.

[2]Sakamoto KM,Kim KB,Verma R,Ransick A,Stein B,Crews CM,DeshaiesRJ.Development of Protacs to target cancer-promoting proteins forubiquitination and degradation.Mol Cell Proteomics.2003 Dec；2(12):1350-8.

[3]Burslem GM,Crews CM.Proteolysis-Targeting Chimeras as Therapeuticsand Tools for Biological Discovery.Cell.2020 Apr 2；181(1):102-114.

[4]James LC,Keeble AH,Khan Z,Rhodes DA,Trowsdale J.Structural basisfor PRYSPRY-mediated tripartite motif(TRIM)protein function.Proc Natl AcadSci USA.2007 Apr 10；104(15):6200-5.

[5]Yoshimi R,Chang TH,Wang H,Atsumi T,Morse HC 3rd,Ozato K.Genedisruption study reveals a nonredundant role for TRIM21/Ro52 in NF-kappaB-dependent cytokine expression in fibroblasts.J Immunol.2009 Jun 15；182(12):7527-38.

[6]Mallery DL,McEwan WA,Bidgood SR,Towers GJ,Johnson CM,JamesLC.Antibodies mediate intracellular immunity through tripartite motif-containing 21(TRIM21).Proc Natl Acad Sci U S A.2010 Nov 16；107(46):19985-90.

[7]Clift D,McEwan WA,Labzin LI,Konieczny V,Mogessie B,James LC,SchuhM.A Method for the Acute and Rapid Degradation of EndogenousProteins.Cell.2017 Dec 14；171(7):1692-1706.e18.

[8]Juríková M,Danihel L’,Polák

Varga I.Ki67,PCNA,and MCM proteins:Markers of proliferation in the diagnosis of breast cancer.ActaHistochem.2016 Jun；118(5):544-52.

发明内容

发明要解决的问题

鉴于现有技术中存在的问题，例如，Bio-PROTAC的重组蛋白存在分子量大、入胞能力差，无法有效递送至体内，在体内发挥蛋白降解作用的缺陷。为此，本公开提供了环状RNA分子，首次以环状RNA实现了对目标蛋白的靶向降解，为蛋白靶向降解技术提供了新型的功能分子。环状RNA分子具有良好的透膜性，易于向胞内递送，具有高效的体内蛋白靶向降解活性；有效解决了现有的蛋白靶向降解嵌合体分子存在的难以实现跨膜递送，以及难以实现对体内目标蛋白的降解的问题。

用于解决问题的方案

第一方面，本公开提供了一种环状RNA分子，其中，所述环状RNA分子编码具有目标效应活性的重组多肽，所述目标效应活性为目标蛋白的靶向降解活性。

在一些实施方式中，根据本公开所述的环状RNA分子，其中，所述重组多肽包括靶向结合所述目标蛋白的第一多肽，和与所述第一多肽融合的第二多肽，所述第二多肽具有E3泛素连接酶的酶活性；

可选地，所述重组多肽还包含连接所述第一多肽与所述第二多肽的连接肽。

在一些实施方式中，根据本公开所述的环状RNA分子，其中，所述目标蛋白为跨膜蛋白或细胞内蛋白；优选地，所述目标蛋白为疾病相关蛋白；可选地，所述疾病相关蛋白为肿瘤相关蛋白。

在一些可选的实施方式中，肿瘤相关蛋白包括但不限于K-ras、c-myc、EGFR、PD-L1、PDGF-β、bcl-2、ErbB2、P21、EGF受体、RAS、neu、raf、PCNA。

在一些实施方式中，根据本公开所述的环状RNA分子，其中，所述第一多肽为靶向结合所述目标蛋白的抗体、抗体片段或抗原结合多肽。

在一些实施方式中，根据本公开所述的环状RNA分子，其中，所述第二多肽选自E3泛素连接酶或其功能片段；可选地，所述E3泛素连接酶的功能片段包含如下的任一种：HECT结构域、RING结构域或U-box结构域。

在一些实施方式中，根据本公开所述的环状RNA分子，其中，所述第二多肽选自CRBN、VHL、MDM2、cIAP、βTrCP、FBW7、SPOP、SKP2、DDB2、SOCS2、ASB1、CHIP或上述任一种的功能片段。

在一些实施方式中，根据本公开所述的环状RNA分子，其中，所述重组多肽具有如SEQ ID NO：34-45任一项所示的氨基酸序列，或者如SEQ ID NO：34-45所示的氨基酸序列经过取代、重复、缺失或添加一个或多个氨基酸，且具有所述重组多肽的多肽活性的突变体

在一些实施方式中，根据本公开所述的环状RNA分子，其中，所述环状RNA分子包括编码所述重组多肽的编码区序列，和与所述编码区序列可操作地连接的IRES序列。

在一些实施方式中，根据本公开所述的环状RNA分子，其中，环状RNA分子还包括位于IRES序列上游的第二外显子序列。

在一些实施方式中，根据本公开所述的环状RNA分子，其中，环状RNA分子还包括位于编码区序列下游的第一外显子序列。

在一些实施方式中，根据本公开所述的环状RNA分子，其中，环状RNA分子包括5’间隔区和3’间隔区，其中5’间隔区序列位于第二外显子E2序列与IRES序列之间，3’间隔区序列位于第一外显子E1序列与编码区序列之间。

在一些实施方式中，根据本公开所述的环状RNA分子，其中，环状RNA分子包括顺次连接的如下所示序列：第二外显子序列、5’间隔序列、IRES序列、编码区序列、3’间隔序列和第一外显子序列。

在一些实施方式中，根据本公开所述的环状RNA分子，其中，所述环状RNA分子选自如下(i)-(ii)组成的组中的任一项：

(i)如SEQ ID NO：2、SEQ ID NO：4、SEQ ID NO：46-55中任一项所示的核苷酸序列；

(ii)与(i)所示的核苷酸序列具有至少90％，可选至少95％，优选至少97％，更优选至少98％，最优选至少99％的序列同一性的序列。

在一些实施方式中，根据本公开所述的环状RNA分子，其中，所述目标效应活性为受试者体内的目标蛋白的靶向降解活性；优选地，所述环状RNA分子被施用于受试者体内；

可选地，所述环状RNA分子通过口服、腹膜内、静脉内、动脉内、肌肉内、皮内、皮下、经皮、鼻腔、经直肠，肿瘤体内注射、肿瘤腔内留置、神经鞘内注射、蛛网膜下腔注射或系统性施用，优选为肿瘤体内注射。

第二方面，本公开提供了一种环化前体RNA分子，其中，所述环化前体RNA分子环化形成根据本公开第一方面所述的环状RNA分子；

可选地，所述环化前体RNA分子包括顺次连接的如下所示序列：

5’同源臂序列、3’内含子序列、第二外显子序列、5’间隔区序列、IRES序列、编码区序列、3’间隔区序列、第一外显子序列、5’内含子序列和3’同源臂序列。

第三方面，本公开提供了一种重组核酸分子，其中，所述重组核酸分子转录形成根据本公开所述的环化前体RNA分子。

第四方面，本公开提供了一种重组表达载体，其中，所述重组表达载体包含根据本公开所述的重组核酸分子。

第五方面，本公开提供了一种重组宿主细胞，其中，所述重组宿主细胞包含根据本公开第一方面所述的环状RNA分子，根据本公开第二方面所述的环化前体RNA分子，根据本公开第三方面所述的重组核酸分子，或根据本公开第四方面所述的重组表达载体。

第六方面，本公开提供了一种组合物，其中，所述组合物包括根据本公开第一方面所述的环状RNA分子；可选地，所述组合物还包括一种或多种药学上可接受的载体。

第七方面，本公开提供了根据本公开第一方面所述的环状RNA分子，根据本公开第二方面所述的环化前体RNA分子，根据本公开第三方面所述的重组核酸分子，根据本公开第四方面所述的重组表达载体，根据本公开第五方面所述的重组宿主细胞，或根据本公开第六方面所述的组合物在如下(a)-(d)至少一种中的用途：

(a)目标蛋白的靶向降解，优选受试者体内的目标蛋白的靶向降解；

(b)降低或消除目标蛋白的表达，优选降低或消除受试者体内的目标蛋白的表达；

(c)作为或制备目标蛋白的靶向降解的试剂，优选作为或制备受试者体内的目标蛋白的靶向降解的试剂；

(d)作为或制备治疗疾病的药物，优选作为或制备治疗肿瘤的药物。

第八方面，本公开提供了一种预防或治疗疾病的方法，其中，包括向受试者施用根据本公开第一方面所述的环状RNA分子，根据本公开第二方面所述的环化前体RNA分子，根据本公开第三方面所述的重组核酸分子，根据本公开第四方面所述的重组表达载体，根据本公开第五方面所述的重组宿主细胞，或根据本公开第六方面所述的组合物；

可选地，所述施用选自口服、腹膜内、静脉内、动脉内、肌肉内、皮内、皮下、经皮、鼻腔、经直肠，肿瘤体内注射、肿瘤腔内留置、神经鞘内注射、蛛网膜下腔注射或系统性施用；优选为肿瘤体内注射。

发明的效果

在一些实施方式中，本公开提供的环状RNA分子，首次以环状RNA实现了对目标蛋白的靶向降解，为蛋白靶向降解技术提供了新型的功能分子。环状RNA分子具有良好的肿瘤细胞透膜性，易于向胞内递送，并且不会造成细胞的代谢负担，有效解决了现有的蛋白靶向降解嵌合体分子存在的难以实现跨膜递送、蛋白降解活性低的问题。

在一些实施方式中，本公开提供的环状RNA分子，其编码具有E3泛素连接酶的酶活性的第二多肽，解除了对细胞内固有泛素连接酶的依赖，有效提高了对目标蛋白的降解效率。

在一些实施方式中，本公开提供的环状RNA分子，与线性mRNA分子相比具有更好的蛋白翻译水平、蛋白表达持久性，以及更为优异的目标蛋白的靶向降解效果；并且环状RNA分子不需要进行加帽、加poly(A)尾、核苷酸修饰等步骤，生产工艺简单、生产成本降低。

在一些优选的实施方式中，环状RNA分子适于向受试者体内递送，实现对受试者体内的目标蛋白的有效降解，解决了蛋白靶向降解嵌合体难以实现体内递送、蛋白降解活性低的问题。

在一些实施方式中，本公开提供的环状RNA分子，通过对肿瘤模型小鼠的瘤内注射，实现了对成功实现肿瘤生长抑制，首次证明了bio-PROTACs的体内蛋白降解活性，为肿瘤等疾病的治疗提供了积极、有效的治疗方案。

附图说明

图1示出了细胞转染后48小时荧光图。图1中A-D依次表示EV29-H2B-eGFP mRNA的转染量为50ng、100ng、200ng、400ng时，与EV29-EGFP-DASP mRNA共转染的荧光检测结果。

图2示出了细胞转染24小时和48小时后流式检测图。图中A为24h后的流式检测图，图中B为48h后的流式检测图。

图3示出了比较环状mRNA与线性mRNA介导的EH2B-EGFP的蛋白降解效果。

图4示出了Western Blot检测PCNA蛋白表达水平。

图5示出了肿瘤细胞内EGFP表达流式检测图。图中A示出了肿瘤内GFP阳性细胞的比例，图中B示出了肿瘤内GFP平均荧光强度。

图6示出了肿瘤的生长曲线。

图7示出了环状RNA分子靶向降解KRAS蛋白的检测结果图。

具体实施方式

当在权利要求和/或说明书中与术语“包含”联用时，词语“一(a)”或“一(an)”可以指“一个”，但也可以指“一个或多个”、“至少一个”以及“一个或多于一个”。

如在权利要求和说明书中所使用的，词语“包含”、“具有”、“包括”或“含有”是指包括在内的或开放式的，并不排除额外的、未引述的元件或方法步骤。

在整个申请文件中，术语“约”表示：一个值包括测定该值所使用的装置或方法的误差的标准偏差。

虽然所公开的内容支持术语“或”的定义仅为替代物以及“和/或”，但除非明确表示仅为替代物或替代物之间相互排斥外，权利要求中的术语“或”是指“和/或”。

如本公开所使用的，术语“多肽”、“肽”和“蛋白质”在本文中互换地使用并且为任意长度的氨基酸聚合物。该聚合物可以是线形或分支的，它可以包含修饰的氨基酸，并且它可以由非氨基酸隔断。该术语也包括已经被修饰(例如，二硫键形成、糖基化、脂质化、乙酰化、磷酸化或任何其他操作，如以标记组分缀合)的氨基酸聚合物。多肽可以从天然来源分离，可以通过重组技术从真核或原核宿主产生并且可以是合成方法的产物。

如本公开所使用的，“重组多肽”又称“工程化多肽”是指具有自然界不相连的肽序列的多肽、蛋白。重组多肽可以是利用基因工程技术，在原核或真核细胞中获得的目标多肽；也可以是利用合成技术得到的目标多肽。

如本公开所使用的，术语“连接肽”是指由氨基酸组成的连接肽，用于将多肽、蛋白质或其片段连接在一起。在本公开中，术语“连接子”与“连接肽”可以互换地使用。

如本公开所使用的，术语“E3泛素连接酶”又称泛素连接酶(ubiquitin-proteinligase)、泛素连接酶E3，E3具有特异性识别靶蛋白的能力，其通过招募底物蛋白和E2泛素结合酶，介导泛素从E2转移到靶蛋白并与靶蛋白共价结合，蛋白酶体催化泛素与靶蛋白的偶连体降解。目前已发现的E3泛素连接酶数量众多，主要包括具有HECT结构域、RING结构域或U-box结构域的E3泛素连接酶。

如本公开所使用的，术语“目标蛋白”、“靶蛋白”可以互换地使用。

如本公开所使用的，术语“疾病相关蛋白”是指在患病个体中异常性表达的蛋白。进一步地，本公开中的“疾病相关蛋白”是指在患病个体中异常高表达的蛋白。

如本公开所使用的，术语“抗体”，指免疫球蛋白或其片段或它们的衍生物，并且包括其包含的抗原结合位点的任何多肽，而不管其是否是在体外或体内产生。该术语包括，但不限于，多克隆、单克隆、单特异性的、多特异性的、非特异性的、人源化、单链的、嵌合的、合成的、重组的、杂合的、突变的、嫁接的抗体。术语“抗体”还包括抗体片段例如Fab、F(ab’)₂、FV、scFv、Fd、dAb和其它保留抗原结合功能的抗体片段。通常情况下，这样的片段将包括抗原结合片段。

如本公开所使用的，术语“环状RNA”是一种呈封闭环形RNA分子，主要由外显子、IRES元件、蛋白编码区和间隔区。在一些优选的实施方案中，环状RNA具有如下结构：“第二外显子E2-间隔区-IRES元件-编码区-间隔区-第一外显子E1”。本公开所使用的环状RNA具有蛋白翻译活性，又可称为“环状mRNA”。

如本公开所使用的，术语“环化前体RNA”是指能够环化形成环状RNA的RNA前体，其一般由环化前体的DNA分子转录形成。在一些实施方案中，环化前体RNA中包括如下元件：5’同源臂、3’内含子、第二外显子E2、间隔区、IRES元件、编码区、间隔区、第一外显子E1、5’内含子、3’同源臂。在一些实施方案中，5’同源臂、3’内含子、5’内含子、3’同源臂在环化前体RNA剪切形成环状RNA的过程中发挥作用。其中，内含子具有核酶特性，例如，利用5’内含子的核酶特性，使5’内含子与第一外显子E1的连接处在GTP引发下断裂，断裂位点又可以进一步引发3’内含子与第二外显子E2的连接处断裂，第二外显子E2与第一外显子E1连接形成环状RNA。

如本公开所使用的，术语“线性RNA”是指包括5’帽子结构(5’Cap)，3’多聚腺苷尾巴(PolyA tail)，5’非翻译序列(5’untranslational region，5’UTR),3’非翻译序列(3’untranslational region，3’UTR)以及开放阅读框(Open reading frame，ORF)等结构的具有翻译功能的RNA。

如本公开所使用的，术语“IRES”(Internal ribosome entry site，IRES)又称内部核糖体进入位点，“内部核糖体进入位点”(IRES)属于翻译控制序列，通常位于所关注基因的5’端，并使得以帽非依赖性方式翻译RNA。经转录的IRES可直接结合核糖体亚单位，以使得mRNA起始密码子在核糖体中适当地取向以进行翻译。IRES序列通常位于mRNA的5’UTR中(起始密码子的正上游)。IRES在功能上取代对各种与真核生物翻译机制相互作用的蛋白因子的需求。

如本公开所使用的，术语“编码区”(Coding Region)是指能够转录信使RNA，并最终翻译为目标多肽、蛋白的基因序列。

如本公开所使用的，术语“表达”包括涉及多肽产生的任何步骤，包括但不限于：转录、转录后修饰、翻译、翻译后修饰、和分泌。

如本公开所使用的，术语“上游”或“下游”是指沿编码区的蛋白翻译方向的上游及下游。

如本公开所使用的，术语“多核苷酸”、“核酸分子”指由核苷酸组成的聚合物。多核苷酸可以是单独片段的形式，也可以是更大的核苷酸序列结构的一个组成部分，其是从至少在数量或浓度上分离一次的核苷酸序列衍生而来的，能够通过标准分子生物学方法(例如，使用克隆载体)识别、操纵以及恢复序列及其组分核苷酸序列。当一个核苷酸序列通过一个DNA序列(即A、T、G、C)表示时，这也包括一个RNA序列(即A、U、G、C)，其中“U”取代“T”。换句话说，“多核苷酸”指从其他核苷酸(单独的片段或整个片段)中去除的核苷酸聚合物，或者可以是一个较大核苷酸结构的组成部分或成分，如表达载体或多顺反子序列。多核苷酸包括DNA、RNA和cDNA序列。“重组多核苷酸”、“重组核酸分子”属于“多核苷酸”中的一种。

如本公开所使用的，术语“重组核酸分子”指具有在自然界中不连接在一起的序列的多核苷酸。重组多核苷酸可包括在合适的载体中，且该载体可用于转化至合适的宿主细胞。然后多核苷酸在重组宿主细胞中表达以产生例如“重组多肽”“重组蛋白”“融合蛋白”等。

如本公开所使用的，术语“载体”指的是DNA构建体，其含有与合适的控制序列可操作地连接的DNA序列，从而在合适的宿主中表达目的基因。

如本公开所使用的，术语“重组表达载体”指用于表达例如编码所需多肽的多核苷酸的DNA结构。重组表达载体可包括，例如包含i)对基因表达具有调控作用的遗传元素的集合，例如启动子和增强子；ii)转录成mRNA并翻译成蛋白质的结构或编码序列；以及iii)适当的转录和翻译起始和终止序列的转录亚单位。重组表达载体以任何合适的方式构建。载体的性质并不重要，并可以使用任何载体，包括质粒、病毒、噬菌体和转座子。用于本公开的可能载体包括但不限于染色体、非染色体和合成DNA序列，例如病毒质粒、细菌质粒、噬菌体DNA、酵母质粒以及从质粒和噬菌体DNA的组合中衍生的载体，来自如慢病毒、逆转录病毒、牛痘、腺病毒、鸡痘、杆状病毒、SV40和伪狂犬病等病毒的DNA。

如本公开所使用的，术语“宿主细胞”指已经向其中引入外源多核苷酸的细胞，包括这类细胞的子代。宿主细胞包括“转化体”和“转化的细胞”，这包括原代转化的细胞和从其衍生的子代。宿主细胞是可以用来产生本发明抗体分子的任何类型的细胞系统，包括真核细胞，例如，哺乳动物细胞、昆虫细胞、酵母细胞；和原核细胞，例如，大肠杆菌细胞。宿主细胞包括培养的细胞，也包括转基因动物、转基因植物或培养的植物组织或动物组织内部的细胞。术语“重组宿主细胞”涵盖导入环状RNA、环化前体RNA、重组核酸分子或重组表达载体后不同于亲本细胞的宿主细胞，重组宿主细胞具体通过转化来实现。本公开的宿主细胞可以是原核细胞或真核细胞，只要是能够导入本公开的环状RNA、环化前体RNA、重组核酸分子或重组表达载体的细胞即可。

如本公开所使用的，术语“转化、转染、转导”具有本领域技术人员普遍理解的意思，即将外源性的DNA导入宿主的过程。所述转化、转染、转导的方法包括任何将核酸导入细胞的方法，这些方法包括但不限于电穿孔法、磷酸钙(CaPO₄)沉淀法、氯化钙(CaCl₂)沉淀法、微注射法、聚乙二醇(PEG)法、DEAE-葡聚糖法、阳离子脂质体法以及乙酸锂-DMSO法。

如本公开所使用的，“治疗”是指：在罹患疾病之后，使受试者接触(例如给药)本发明的环状RNA、环化前体RNA、重组核酸分子、重组表达载体、组合物，从而与不接触时相比使该疾病的症状减轻，并不意味着必需完全抑制疾病的症状。罹患疾病是指：身体出现了疾病症状。

如本公开所使用的，“预防”是指：在罹患疾病之前，通过使受试者接触(例如给药)本发明的环状RNA、环化前体RNA、重组核酸分子、重组表达载体、组合物等，从而与不接触时相比减轻罹患疾病后的症状，并不意味着必需完全抑制患病。

如本公开所使用的，术语“有效量”指本发明的重组核酸分子、重组表达载体、环化前体RNA、环状RNA、疫苗或组合物的这样的量或剂量，其以单一或多次剂量施用患者后，在需要治疗或预防的患者中产生预期效果。有效量可以由作为本领域技术人员的主治医师通过考虑以下多种因素来容易地确定：诸如哺乳动物的物种；它的大小、年龄和一般健康；涉及的具体疾病；疾病的程度或严重性；个体患者的应答；施用的具体抗体；施用模式；施用制剂的生物利用率特征；选择的给药方案；和任何伴随疗法的使用。

如本公开所使用的，术语“个体”、“患者”或“受试者”包括哺乳动物。哺乳动物包括但不限于，家养动物(例如，牛，羊，猫，狗和马)，灵长类动物(例如，人和非人灵长类动物如猴)，兔，以及啮齿类动物(例如，小鼠和大鼠)。

术语“癌症”和“癌性”指向或描述哺乳动物中特征通常为细胞生长不受调节的生理疾患。癌症的例子包括但不限于癌，淋巴瘤，母细胞瘤，肉瘤和白血病或淋巴样恶性肿瘤。此类癌症的更具体例子包括但不限于鳞状细胞癌(例如上皮鳞状细胞癌)，肺癌(包括小细胞肺癌，非小细胞肺癌，肺的腺癌，和肺的鳞癌)，腹膜癌，肝细胞癌，胃癌(包括胃肠癌和胃肠基质癌)，胰腺癌，成胶质细胞瘤，宫颈癌，卵巢癌，肝癌，膀胱癌，尿道癌，肝瘤，乳腺癌，结肠癌，直肠癌，结肠直肠癌，子宫内膜癌或子宫癌，唾液腺癌，肾癌，前列腺癌，外阴癌，甲状腺癌，肝癌，肛门癌，阴茎癌，黑素瘤，浅表扩散性黑素瘤，恶性雀斑样痣黑素瘤，肢端黑素瘤，结节性黑素瘤，多发性骨髓瘤和B细胞淋巴瘤，慢性淋巴细胞性白血病(CLL)，急性成淋巴细胞性白血病(ALL)，毛细胞性白血病，慢性成髓细胞性白血病，和移植后淋巴增殖性病症(PTLD)，以及与瘢痣病(phakomatoses)，水肿(诸如与脑瘤有关的)和梅格斯氏(Meigs)综合征有关的异常血管增殖，脑瘤和脑癌，以及头颈癌，及相关转移。在某些实施方案中，适合于通过本发明的抗体来治疗的癌症包括肺癌(例如非小细胞肺癌)、肝癌、胃癌或结肠癌，包括那些癌症的转移性形式。

术语“肿瘤”指所有赘生性(neoplastic)细胞生长和增殖，无论是恶性的还是良性的，及所有癌前(pre-cancerous)和癌性细胞和组织。术语“癌症”、“癌性”和“肿瘤”在本文中提到时并不互相排斥。

除非另外定义或由背景清楚指示，否则在本公开中的全部技术与科学术语具有如本公开所属领域的普通技术人员通常理解的相同含义。

技术方案

在本公开的技术方案中，说明书核苷酸和氨基酸序列表的编号所代表的含义如下所示：

SEQ ID NO：1所示的序列是编码H2B-EGFP蛋白的环状RNA分子的核苷酸序列；

SEQ ID NO：2所示的序列是编码重组多肽EGFP-DASP的环状RNA分子的核苷酸序列；

SEQ ID NO：3所示的序列是编码重组多肽EGFP-DASP的线状RNA分子的核苷酸序列；

SEQ ID NO：4所示的序列是编码重组多肽CON1-SP-WT的环状RNA分子的核苷酸序列；

SEQ ID NO：5所示的序列是编码重组多肽CON1-SP-mu的环状RNA分子的核苷酸序列；

SEQ ID NO：6所示的序列是编码重组多肽CON1-mu-SP的环状RNA分子的核苷酸序列；

SEQ ID NO：7所示的序列是PCNA蛋白的氨基酸序列；

SEQ ID NO：8所示的序列是靶向结合PCNA蛋白的第一多肽的氨基酸序列；

SEQ ID NO：9所示的序列是编码靶向结合PCNA蛋白的第一多肽的核苷酸序列；

SEQ ID NO：10所示的序列是连接第一多肽和第二多肽的连接肽的氨基酸序列；

SEQ ID NO：11所示的序列是编码连接肽的核苷酸序列；

SEQ ID NO：12所示的序列是具有SPOP的泛素连接酶活性的第二多肽的氨基酸序列；

SEQ ID NO：13所示的序列是编码具有SPOP的泛素连接酶活性的第二多肽的核苷酸序列；

SEQ ID NO：14所示的序列是CVB3 IRES的核苷酸序列；

SEQ ID NO：15所示的序列是EV24 IRES的核苷酸序列；

SEQ ID NO：16所示的序列是EV29 IRES的核苷酸序列；

SEQ ID NO：17所示的序列是EV33 IRES的核苷酸序列；

SEQ ID NO：18所示的序列是EV24与CVB3v嵌合IRES的核苷酸序列；

SEQ ID NO：19所示的序列是EV29与CVB3v嵌合IRES的核苷酸序列；

SEQ ID NO：20所示的序列是EV33与CVB3v嵌合IRES的核苷酸序列；

SEQ ID NO：21所示的序列是第一外显子(E1)的核苷酸序列；

SEQ ID NO：22所示的序列是第二外显子(E2)的核苷酸序列；

SEQ ID NO：23所示的序列是5’间隔区序列1的核苷酸序列；

SEQ ID NO：24所示的序列是5’间隔区序列2的核苷酸序列；

SEQ ID NO：25所示的序列是3’间隔区序列1的核苷酸序列；

SEQ ID NO：26所示的序列是3’间隔区序列2的核苷酸序列；

SEQ ID NO：27所示的序列5’内含子的核苷酸序列；

SEQ ID NO：28所示的序列是3’内含子的核苷酸序列；

SEQ ID NO：29所示的序列是5’同源臂序列1(H1)的核苷酸序列；

SEQ ID NO：30所示的序列是5’同源臂序列2(H2)的核苷酸序列；

SEQ ID NO：31所示的序列是3’同源臂序列1的核苷酸序列；

SEQ ID NO：32所示的序列是3’同源臂序列2的核苷酸序列；

SEQ ID NO：33所示的序列是靶向KRAS蛋白的K19/K19-VHKC的氨基酸序列；

SEQ ID NO：34所示的序列是重组多肽N-EGFP(第一多肽)-连接肽-SPOP(第二多肽)-C的氨基酸序列；

SEQ ID NO：35所示的序列是重组多肽N-CON1(第一多肽)-连接肽-SPOP(第二多肽)-C的氨基酸序列；

SEQ ID NO：36所示的序列是重组多肽N-βTrCP(第二多肽)-连接肽-K19(第一多肽)-C的氨基酸序列；

SEQ ID NO：37所示的序列是重组多肽N-FBW7(第二多肽)-连接肽-K19(第一多肽)-C的氨基酸序列；

SEQ ID NO：38所示的序列是重组多肽N-SKP2(第二多肽)-连接肽-K19(第一多肽)-C的氨基酸序列；

SEQ ID NO：39所示的序列是重组多肽N-CRBN(第二多肽)-连接肽-K19(第一多肽)-C的氨基酸序列；

SEQ ID NO：40所示的序列是重组多肽N-DDB2(第二多肽)-连接肽-K19(第一多肽)-C的氨基酸序列；

SEQ ID NO：41所示的序列是重组多肽N-K19(第一多肽)-连接肽-SOCS2(第二多肽)-C的氨基酸序列；

SEQ ID NO：42所示的序列是重组多肽N-K19(第一多肽)-连接肽-ASB1(第二多肽)-C的氨基酸序列；

SEQ ID NO：43所示的序列是重组多肽N-K19(第一多肽)-连接肽-CHIP(第二多肽)-C的氨基酸序列；

SEQ ID NO：44所示的序列是重组多肽N-K19(第一多肽)-连接肽-SPOP(第二多肽)-C的氨基酸序列；

SEQ ID NO：45所示的序列是重组多肽N-K19(第一多肽)-连接肽-VHL(第二多肽)-C的氨基酸序列；

SEQ ID NO：46所示的序列是编码重组多肽N-βTrCP(第二多肽)-连接肽-K19(第一多肽)-C的环状RNA分子的核苷酸序列；

SEQ ID NO：47所示的序列是编码重组多肽N-FBW7(第二多肽)-连接肽-K19(第一多肽)-C的环状RNA分子的核苷酸序列；

SEQ ID NO：48所示的序列是编码重组多肽N-SKP2(第二多肽)-连接肽-K19(第一多肽)-C的环状RNA分子的核苷酸序列；

SEQ ID NO：49所示的序列是编码重组多肽N-CRBN(第二多肽)-连接肽-K19(第一多肽)-C的环状RNA分子的核苷酸序列；

SEQ ID NO：50所示的序列是编码重组多肽N-DDB2(第二多肽)-连接肽-K19(第一多肽)-C的环状RNA分子的核苷酸序列；

SEQ ID NO：51所示的序列是编码重组多肽N-K19(第一多肽)-连接肽-SOCS2(第二多肽)-C的环状RNA分子的核苷酸序列；

SEQ ID NO：52所示的序列是编码重组多肽N-K19(第一多肽)-连接肽-ASB1(第二多肽)-C的环状RNA分子的核苷酸序列；

SEQ ID NO：53所示的序列是编码重组多肽N-K19(第一多肽)-连接肽-CHIP(第二多肽)-C的环状RNA分子的核苷酸序列；

SEQ ID NO：54所示的序列是编码重组多肽N-K19(第一多肽)-连接肽-SPOP(第二多肽)-C的环状RNA分子的核苷酸序列；

SEQ ID NO：55所示的序列是编码重组多肽N-K19(第一多肽)-连接肽-VHL(第二多肽)-C的环状RNA分子的核苷酸序列；

SEQ ID NO：55所示的序列是环状RNA分子EV29-K19-VHKC的核苷酸序列；

SEQ ID NO：56所示的序列是连接肽的氨基酸序列。

环状RNA分子

本公开的环状RNA分子编码具有目标效应活性的重组多肽，所述目标效应活性为目标蛋白的靶向降解活性。环状RNA分子通过表达能够靶向降解目标蛋白的重组多肽，能够实现对目标蛋白的特异性降解，为蛋白靶向降解技术提供的新型的功能分子。

本领域技术人员知晓，对于小分子形式的蛋白靶向降解嵌合体，透明性差、难以递送至胞内发挥蛋白降解作用；而嵌合蛋白形式的Bio-PROTACs分子，其分子量较大，在体内跨膜递送在存在较大的技术困难。因此，目前蛋白靶向降解嵌合体普遍存在体内递送困难，难以有效降解目标蛋白的问题。与此相比，本公开中的环状RNA分子具有良好的透膜性，易于向胞内递送，特别递送至体内，实现针对目标蛋白的高效、特异性降解。

在一些实施方式中，所述重组多肽包括靶向结合所述目标蛋白的第一多肽，和与所述第一多肽融合的第二多肽，所述第二多肽具有E3泛素连接酶的酶活性。通过第一多肽和第二多肽融合形成重组多肽，能够在与目标蛋白靶向结合后，利用E3泛素连接酶的酶活性将目标蛋白泛素化，泛素化的目标蛋白被蛋白酶体识别并降解。

在本公开中，目标蛋白可以是参与机体生理、病理进程的任意蛋白类型，包括跨膜蛋白和胞内蛋白。

在一些实施方式中，目标蛋白为疾病相关蛋白。疾病类型包括但不限于在肿瘤、神经系统类疾病、免疫系统类疾病、心脑血管类疾病等等。在一些实施方式中，疾病相关蛋白是在任一类型疾病中异常表达的蛋白。进一步的，疾病相关蛋白是在疾病的发生、发展、预后等过程中异常高表达的蛋白。在本公开中，异常高表达是指与未患病的健康体相比，蛋白表达量呈过量表达。环状RNA分子通过对疾病相关蛋白的特异、高效降解，从而达到疾病治疗效果。

在一些实施方式中，目标蛋白为参与机体生理活性的蛋白。示例性的，目标蛋白为参与细胞周期、增殖、凋亡、分化、转移等生命活动调控的蛋白。利用本公开的环状RNA分子，能够实现对目标蛋白的靶向降解，为蛋白功能的研究提供基础。在本公开中，参与机体生理活性的蛋白与疾病相关蛋白并不互相排斥。

在一些更为具体的实施方式中，目标蛋白为肿瘤相关蛋白。示例性地，目标蛋白包括但不限于K-ras、c-myc、EGFR、PD-L1、PDGF-β、bcl-2、ErbB2、P21、EGF受体、RAS、neu、raf、PCNA等等。

在一些可选的实施方式中，目标蛋白为PCNA。PCNA的氨基酸序列如包含如SEQ IDNO：7所示的氨基酸序列，或者如SEQ ID NO：7所示的氨基酸序列经过取代、重复、缺失或添加一个或多个氨基酸，且具有PCNA蛋白活性的蛋白突变体。

PCNA在DNA复制及DNA切除修复，细胞周期调控，染色质组装，RNA转录等细胞活动中发挥作用，并且可为肿瘤增殖活性的标准标记物，用于评估肿瘤细胞的分裂增殖情况，在多种恶性肿瘤中高表达，是一种潜在的药物靶标。本公开通过对肿瘤模型小鼠的瘤内注射靶向降解PCNA的环状RNA分子，有效抑制了肿瘤的生长，说明本公开的环状RNA分子适合在受试者体内递送中具有高的递送效率，蛋白靶向降解效果显著，具有广泛的疾病治疗的应用前景。

在一些可选的实施方式中，目标蛋白为KRAS，当KRAS异常高表达时，则导致细胞持续生长，并阻止细胞自我毁灭，细胞增殖失控而癌变。

在本公开中，第一多肽不具有特别限定的序列，其具体序列依据所需结合的目标蛋白的序列而设计。

在一些实施方式中，第一多肽为靶向结合目标蛋白的抗体、抗体片段或抗原结合多肽。示例性的，第一多肽可以是与目标蛋白结合的天然抗体，或通过重组DNA技术、或通过酶或化学切割完整的抗体制备的抗体片段，或与抗原结合的抗原结合多肽。

在本公开中，抗体指包含抗原结合位点的蛋白质，涵盖各种结构的天然抗体和人工抗体，包括但不限于单克隆抗体、多克隆抗体、多特异性抗体(例如，双特异性抗体)、单链抗体、完整抗体等。

在本公开中，抗体结合片段包含完整抗体的一部分且结合完整抗体所结合的抗原。抗体片段的例子包括但不限于Fv，Fab，Fab’，Fab’-SH，F(ab’)2；双抗体；线性抗体；单链抗体(例如scFv)；单结构域抗体；双价或双特异性抗体或其片段；骆驼科抗体；和由抗体片段形成的双特异性抗体或多特异性抗体。

在本公开中，抗原结合多肽可以是化学合成的，或重组制备的与目标蛋白特异性结构的多肽或多肽片段。

示例性的，第一多肽为与目标蛋白结合的DARPins、αReps、单域抗体、结合肽等。

在一些可选地实施方式中，第一多肽靶向结合PCNA，第一多肽的氨基酸序列包含如SEQ ID NO：8所示的氨基酸序列，或者如SEQ ID NO：8所示的氨基酸序列经过取代、重复、缺失或添加一个或多个氨基酸，且具有靶向结合PCNA的蛋白活性的突变体。

在一些可选的实施方式中，编码第一多肽的编码区序列包含如SEQ ID NO：9所示的核苷酸序列，或与SEQ ID NO：9所示的核苷酸序列具有80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％序列同一性的序列，且编码具有靶向结合PCNA的蛋白活性的蛋白的突变体。

在一些可选地实施方式中，第一多肽靶向结合KRAS，第一多肽的氨基酸序列包含如SEQ ID NO：33所示的氨基酸序列，或者如SEQ ID NO：33所示的氨基酸序列经过取代、重复、缺失或添加一个或多个氨基酸，且具有靶向结合PCNA的蛋白活性的突变体。

在本公开中，第二多肽不具有特别限定的序列，只要其能够使第二多肽具有E3泛素连接酶的酶活性，以实现对目标蛋白的泛素化标记即可。

在一些实施方式中，所述第二多肽选自E3泛素连接酶或其功能片段，具体而言，第二多肽可以选自任意具有泛素连接酶活性的E3泛素连接酶或其功能片段。进一步的，E3泛素连接酶的功能片段包含如下的任一种：HECT结构域、RING结构域或U-box结构域。其中，HECT结构域的保守Cys残基可与E2携带的泛素形成硫酯键，E2先将泛素传递给E3，再由E3递呈给底物。RING结构域包含相似的E2结合结构域，作为桥梁将活化的泛素从E2直接转移到靶蛋白。U-box结构域通过与泛素结合酶E2相连，然后与泛素形成通过硫酯键结合的中间复合体，最后催化靶蛋白的多聚泛素化修饰。

在一些可选的实施方式中，第二多肽选自如下任一种的E3泛素连接酶或其功能片段：CRBN、VHL、MDM2、cIAP、βTrCP、FBW7、SPOP、SKP2、DDB2、SOCS2、ASB1、CHIP。

在一些可选地实施方式中，第二多肽为具有E3泛素连接酶活性的SPOP蛋白结构域，其氨基酸序列包含如SEQ ID NO：12所示的氨基酸序列，或者如SEQ ID NO：12所示的氨基酸序列经过取代、重复、缺失或添加一个或多个氨基酸，且具有E3泛素连接酶活性的突变体。

在一些可选的实施方式中，编码第二多肽的编码区序列包含如SEQ ID NO：13所示的核苷酸序列，或与SEQ ID NO：13所示的核苷酸序列具有80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％序列同一性的序列，且编码具有E3泛素连接酶活性的蛋白的突变体。

在另外一些实施方式中，第二多肽还可以是具有E3泛素连接酶活性的βTrCP、FBW7、SKP2、CRBN、DDB2、SOCS2、ASB1、CHIP、SPOP、VHL等等的蛋白结构域。

在一些实施方式中，所述重组多肽还包含连接所述第一多肽与所述第二多肽的连接肽。利用连接肽对第一多肽和第二多肽进行连接，以优化重组多肽的空间构象，保证其靶向结合目标蛋白的蛋白活性和E3泛素连接酶的酶活性。

在一些可选地实施方式中，连接肽的氨基酸序列包含如SEQ ID NO：10所示的氨基酸序列，或者如SEQ ID NO：10或65所示的氨基酸序列经过取代、重复、缺失或添加一个或多个氨基酸，且具有连接肽活性的突变体。

在一些可选的实施方式中，编码SEQ ID NO：10所示连接肽的编码区序列包含如SEQ ID NO：11所示的核苷酸序列，或与SEQ ID NO：11所示的核苷酸序列具有80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％序列同一性的序列，且编码具有连接肽活性的蛋白的突变体。

在一些具体的实施方式中，重组多肽具有如下任一项所示的结构：

(1)N-EGFP(第一多肽)-连接肽-SPOP(第二多肽)-C

(2)N-CON1(第一多肽)-连接肽-SPOP(第二多肽)-C

(3)N-βTrCP(第二多肽)-连接肽-K19(第一多肽)-C

(4)N-FBW7(第二多肽)-连接肽-K19(第一多肽)-C

(5)N-SKP2(第二多肽)-连接肽-K19(第一多肽)-C

(6)N-CRBN(第二多肽)-连接肽-K19(第一多肽)-C

(7)N-DDB2(第二多肽)-连接肽-K19(第一多肽)-C

(8)N-K19(第一多肽)-连接肽-SOCS2(第二多肽)-C

(9)N-K19(第一多肽)-连接肽-ASB1(第二多肽)-C

(10)N-K19(第一多肽)-连接肽-CHIP(第二多肽)-C

(11)N-K19(第一多肽)-连接肽-SPOP(第二多肽)-C

(12)N-K19(第一多肽)-连接肽-VHL(第二多肽)-C

其中，如(1)所示结构的重组多肽具有如SEQ ID NO：34所示的氨基酸序列，或者如SEQ ID NO：34所示的氨基酸序列经过取代、重复、缺失或添加一个或多个氨基酸，且具有SEQ ID NO：34所示多肽活性的突变体。该重组多肽利用第一多肽靶向结合EGFP蛋白后，利用第二多肽的E3泛素连接酶活性实现对EGFP蛋白的靶向降解。

如(2)所示结构的重组多肽具有如SEQ ID NO：35所示的氨基酸序列，或者如SEQID NO：35所示的氨基酸序列经过取代、重复、缺失或添加一个或多个氨基酸，且具有SEQ IDNO：35所示多肽活性的突变体。该重组多肽利用第一多肽靶向结合PCNA蛋白后，利用第二多肽的E3泛素连接酶活性实现对PCNA蛋白的靶向降解。

如(3)所示结构的重组多肽具有如SEQ ID NO：36所示的氨基酸序列，或者如SEQID NO：36所示的氨基酸序列经过取代、重复、缺失或添加一个或多个氨基酸，且具有SEQ IDNO：36所示多肽活性的突变体。该重组多肽利用第一多肽靶向结合KRAS蛋白后，利用第二多肽的E3泛素连接酶活性实现对KRAS蛋白的靶向降解。

如(4)所示结构的重组多肽具有如SEQ ID NO：37所示的氨基酸序列，或者如SEQID NO：37所示的氨基酸序列经过取代、重复、缺失或添加一个或多个氨基酸，且具有SEQ IDNO：37所示多肽活性的突变体。该重组多肽利用第一多肽靶向结合KRAS蛋白后，利用第二多肽的E3泛素连接酶活性实现对KRAS蛋白的靶向降解。

如(5)所示结构的重组多肽具有如SEQ ID NO：38所示的氨基酸序列，或者如SEQID NO：38所示的氨基酸序列经过取代、重复、缺失或添加一个或多个氨基酸，且具有SEQ IDNO：38所示多肽活性的突变体。该重组多肽利用第一多肽靶向结合KRAS蛋白后，利用第二多肽的E3泛素连接酶活性实现对KRAS蛋白的靶向降解。

如(6)所示结构的重组多肽具有如SEQ ID NO：39所示的氨基酸序列，或者如SEQID NO：39所示的氨基酸序列经过取代、重复、缺失或添加一个或多个氨基酸，且具有SEQ IDNO：39所示多肽活性的突变体。该重组多肽利用第一多肽靶向结合KRAS蛋白后，利用第二多肽的E3泛素连接酶活性实现对KRAS蛋白的靶向降解。

如(7)所示结构的重组多肽具有如SEQ ID NO：40所示的氨基酸序列，或者如SEQID NO：40所示的氨基酸序列经过取代、重复、缺失或添加一个或多个氨基酸，且具有SEQ IDNO：40所示多肽活性的突变体。该重组多肽利用第一多肽靶向结合KRAS蛋白后，利用第二多肽的E3泛素连接酶活性实现对KRAS蛋白的靶向降解。

如(8)所示结构的重组多肽具有如SEQ ID NO：41所示的氨基酸序列，或者如SEQID NO：41所示的氨基酸序列经过取代、重复、缺失或添加一个或多个氨基酸，且具有SEQ IDNO：41所示多肽活性的突变体。该重组多肽利用第一多肽靶向结合KRAS蛋白后，利用第二多肽的E3泛素连接酶活性实现对KRAS蛋白的靶向降解。

如(9)所示结构的重组多肽具有如SEQ ID NO：42所示的氨基酸序列，或者如SEQID NO：42所示的氨基酸序列经过取代、重复、缺失或添加一个或多个氨基酸，且具有SEQ IDNO：42所示多肽活性的突变体。该重组多肽利用第一多肽靶向结合KRAS蛋白后，利用第二多肽的E3泛素连接酶活性实现对KRAS蛋白的靶向降解。

如(10)所示结构的重组多肽具有如SEQ ID NO：43所示的氨基酸序列，或者如SEQID NO：43所示的氨基酸序列经过取代、重复、缺失或添加一个或多个氨基酸，且具有SEQ IDNO：43所示多肽活性的突变体。该重组多肽利用第一多肽靶向结合KRAS蛋白后，利用第二多肽的E3泛素连接酶活性实现对KRAS蛋白的靶向降解。

如(11)所示结构的重组多肽具有如SEQ ID NO：44所示的氨基酸序列，或者如SEQID NO：44所示的氨基酸序列经过取代、重复、缺失或添加一个或多个氨基酸，且具有SEQ IDNO：44所示多肽活性的突变体。该重组多肽利用第一多肽靶向结合KRAS蛋白后，利用第二多肽的E3泛素连接酶活性实现对KRAS蛋白的靶向降解。

如(12)所示结构的重组多肽具有如SEQ ID NO：45所示的氨基酸序列，或者如SEQID NO：45所示的氨基酸序列经过取代、重复、缺失或添加一个或多个氨基酸，且具有SEQ IDNO：45所示多肽活性的突变体。该重组多肽利用第一多肽靶向结合KRAS蛋白后，利用第二多肽的E3泛素连接酶活性实现对KRAS蛋白的靶向降解。

本公开的环状RNA分子，有效解决了蛋白靶向降解嵌合体难以实现胞内递送、无法有效发挥作用的问题。编码第一多肽与第二多肽的嵌合体，其中第二多肽具有E3泛素连接酶的酶活性，不受细胞内E3泛素连接酶的限制，具有降解效率高、稳定性好的优势。

在一些实施方式中，环状RNA分子包括编码所述重组多肽的编码区序列，和与所述编码区序列可操作地连接的IRES序列。本公开中的IRES序列来源包括但不限于柯萨奇病毒、埃可病毒(Echovirus)、Taura综合征病毒、吸血猎蝽病毒、泰累尔氏脑脊髓炎病毒、猿猴病毒40、红火蚁病毒1、禾谷缢管蚜病毒、网状内皮增生症病毒、福曼脊髓灰质炎病毒1、大豆尺蠖病毒、克什米尔蜂病毒、人鼻病毒2、琉璃叶蝉病毒-1、人免疫缺陷病毒1型、琉璃叶蝉病毒-1、虱P病毒、丙型肝炎病毒、甲型肝炎病毒、GB型肝炎病毒、口蹄疫病毒、人肠道病毒71、马鼻病毒、茶尺蠖样病毒、脑心肌炎病毒(EMCV)、果蝇C病毒、十字花科烟草病毒、蟋蟀麻痹病毒、牛病毒性腹泻病毒1、黑皇后细胞病毒、蚜虫致死麻痹病毒、禽脑脊髓炎病毒、急性蜂麻痹病毒、芙蓉枯黄环斑病毒、猪瘟病毒、人类FGF2、人类SFTPA1、人类AMLl/RUNXl、果蝇触角、人类AQP4、人类AT1R、人类BAG-1、人类BCL2、人类BiP、人类c-IAPl、人类c-myc、人类eIF4G、小鼠NDST4L、人类LEF1、小鼠HIF1α、人类n.myc、小鼠Gtx、人类p27kipl、人类PDGF2/c-sis、人类p53、人类Pim-1、小鼠Rbm3、果蝇reaper、犬Scamper、果蝇Ubx、人类UNR、小鼠UtrA、人类VEGF-A、人类XIAP、果蝇hairless、酿酒酵母TFIID、酿酒酵母YAP1、人类c-src、人类FGF-1、猿猴小核糖核酸病毒等等。

在一些优选地实施方式中，IRES序列包含如SEQ ID NO：14-20任一序列所组成的组中的一种或多种序列的核苷酸序列具有至少80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％、100％序列同一性的序列。在一些实施方案中，IRES序列为SEQ ID NO：14所示核苷酸序列的CVB3 IRES、SEQ ID NO：15所示核苷酸序列的EV24 IRES、SEQ ID NO：16所示核苷酸序列的EV29 IRES、SEQ ID NO：17所示核苷酸序列的EV33 IRES。在一些实施方案中，IRES序列包含CVB3v IRES与EV24 IRES、EV29 IRES和EV33 IRES中任意一种的嵌合体序列。在一些实施方式中，IRES序列包含CVB3v与EV24 IRES的嵌合体序列，其核苷酸序列如SEQ ID NO：18所示。在一些实施方式中，IRES序列包含CVB3v与EV29IRES的嵌合体序列，其核苷酸序列如SEQ ID NO：19所示。在一些实施方式中，IRES序列包含CVB3v与EV33 IRES的嵌合体序列，其核苷酸序列如SEQ ID NO：20所示。本公开的IRES序列能够实现重组多肽的高效、持久表达，有效提高环状RNA分子靶向降解目标蛋白的活性。

在一些优选地实施方式中，环状RNA分子还包括位于IRES序列上游的第二外显子序列，第二外显子(E2)序列为与SEQ ID NO：22所示的核苷酸序列相比具有至少80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％、100％序列同一性的序列。

在一些优选地实施方式中，环状RNA分子还包括位于编码区序列下游的第一外显子序列，第一外显子(E1)序列为与SEQ ID NO：21所示的核苷酸序列相比具有至少80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％、100％序列同一性的序列。

在一些优选地实施方案中，环状RNA分子包括5’间隔区和3’间隔区，其中5’间隔区序列位于第二外显子E2序列与IRES序列之间，3’间隔区序列位于第一外显子E1序列与编码区序列之间。具体的，5’间隔区序列为与SEQ ID NO：23-24任一序列所示的核苷酸序列相比具有至少80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％、100％序列同一性的序列。3’间隔区序列为与SEQID NO：25-26任一序列所示的核苷酸序列相比具有至少80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％、100％序列同一性的序列。环状RNA分子中的特定序列的5’间隔区和3’间隔区原件可以进一步延长编码区表达目标多肽的时间，提高重组多肽的表达效率。

在一些具体地实施方式，环状RNA分子包括顺次连接的如下所示序列：第二外显子序列、5’间隔序列、IRES序列、编码区序列、3’间隔序列和第一外显子序列。

在一些具体地实施方式，本公开提供了一种靶向降解EGFP蛋白的环状RNA分子，其编码如(1)所示结构的重组多肽，环状RNA分子的核苷酸序列如SEQ ID NO：2所示，与靶向降解EGFP蛋白的线性RNA分子(核苷酸序列如SEQ ID NO：2所示)相比，环状RNA分子具有更加显著的蛋白降解效果；并且，随着时间的延长，环状RNA分子降解细胞内蛋白的优势效果更加明显。

在一些具体地实施方式，本公开提供了一种靶向降解PCNA蛋白的环状RNA分子，其编码如(2)所示结构的重组多肽，环状RNA分子的核苷酸序列如SEQ ID NO：4，通过与编码不具有E3泛素连接酶活性的重组多肽的环状RNA分子(核苷酸序列如SEQ ID NO：5所示)相比，以及与编码不能靶向结合PCNA蛋白的重组多肽的环状RNA分子(核苷酸序列如SEQ ID NO：6所示)相比，证明了SEQ ID NO：4所示序列的环状RNA分子能够有效降解细胞内的PCNA蛋白水平，具有优异的蛋白降解效果。

在一些具体地实施方式中，通过向活体肿瘤组织内注射SEQ ID NO：2所示序列的环状RNA分子，发现能够显著降低GFP阳性细胞比例，说明本公开的环状RNA分子适于向体内递送，能够在体内发挥蛋白降解作用。在一些具体的实施方式中，通过向活体肿瘤组织内注射SEQ ID NO：4所示序列的环状RNA分子，发现肿瘤体积减小、增长速度被抑制，说明本公开的环状RNA分子能对活体肿瘤发挥明显的治疗效果。

在一些具体地实施方式，本公开提供了一种靶向降解KRAS蛋白的环状RNA分子，其编码如(3)所示结构的重组多肽，环状RNA分子的核苷酸序列如SEQ ID NO：46，通过编码靶向结合KRAS蛋白并具有E3泛素连接酶活性的重组多肽，利用E3泛素连接酶的酶活性将KRAS蛋白泛素化，能够实现对目标蛋白的高效、特异性降解。

在一些具体地实施方式，本公开提供了一种靶向降解KRAS蛋白的环状RNA分子，其编码如(4)所示结构的重组多肽，环状RNA分子的核苷酸序列如SEQ ID NO：47，通过编码靶向结合KRAS蛋白并具有E3泛素连接酶活性的重组多肽，利用E3泛素连接酶的酶活性将KRAS蛋白泛素化，能够实现对目标蛋白的高效、特异性降解。

在一些具体地实施方式，本公开提供了一种靶向降解KRAS蛋白的环状RNA分子，其编码如(5)所示结构的重组多肽，环状RNA分子的核苷酸序列如SEQ ID NO：48，通过编码靶向结合KRAS蛋白并具有E3泛素连接酶活性的重组多肽，利用E3泛素连接酶的酶活性将KRAS蛋白泛素化，能够实现对目标蛋白的高效、特异性降解。

在一些具体地实施方式，本公开提供了一种靶向降解KRAS蛋白的环状RNA分子，其编码如(6)所示结构的重组多肽，环状RNA分子的核苷酸序列如SEQ ID NO：49，通过编码靶向结合KRAS蛋白并具有E3泛素连接酶活性的重组多肽，利用E3泛素连接酶的酶活性将KRAS蛋白泛素化，能够实现对目标蛋白的高效、特异性降解。

在一些具体地实施方式，本公开提供了一种靶向降解KRAS蛋白的环状RNA分子，其编码如(7)所示结构的重组多肽，环状RNA分子的核苷酸序列如SEQ ID NO：50，通过编码靶向结合KRAS蛋白并具有E3泛素连接酶活性的重组多肽，利用E3泛素连接酶的酶活性将KRAS蛋白泛素化，能够实现对目标蛋白的高效、特异性降解。

在一些具体地实施方式，本公开提供了一种靶向降解KRAS蛋白的环状RNA分子，其编码如(8)所示结构的重组多肽，环状RNA分子的核苷酸序列如SEQ ID NO：51，通过编码靶向结合KRAS蛋白并具有E3泛素连接酶活性的重组多肽，利用E3泛素连接酶的酶活性将KRAS蛋白泛素化，能够实现对目标蛋白的高效、特异性降解。

在一些具体地实施方式，本公开提供了一种靶向降解KRAS蛋白的环状RNA分子，其编码如(9)所示结构的重组多肽，环状RNA分子的核苷酸序列如SEQ ID NO：52，通过编码靶向结合KRAS蛋白并具有E3泛素连接酶活性的重组多肽，利用E3泛素连接酶的酶活性将KRAS蛋白泛素化，能够实现对目标蛋白的高效、特异性降解。

在一些具体地实施方式，本公开提供了一种靶向降解KRAS蛋白的环状RNA分子，其编码如(10)所示结构的重组多肽，环状RNA分子的核苷酸序列如SEQ ID NO：53，通过编码靶向结合KRAS蛋白并具有E3泛素连接酶活性的重组多肽，利用E3泛素连接酶的酶活性将KRAS蛋白泛素化，能够实现对目标蛋白的高效、特异性降解。

在一些具体地实施方式，本公开提供了一种靶向降解KRAS蛋白的环状RNA分子，其编码如(11)所示结构的重组多肽，环状RNA分子的核苷酸序列如SEQ ID NO：54，通过编码靶向结合KRAS蛋白并具有E3泛素连接酶活性的重组多肽，利用E3泛素连接酶的酶活性将KRAS蛋白泛素化，能够实现对目标蛋白的高效、特异性降解。

在一些具体地实施方式，本公开提供了一种靶向降解KRAS蛋白的环状RNA分子，其编码如(12)所示结构的重组多肽，环状RNA分子的核苷酸序列如SEQ ID NO：55，通过编码靶向结合KRAS蛋白并具有E3泛素连接酶活性的重组多肽，利用E3泛素连接酶的酶活性将KRAS蛋白泛素化，能够实现对目标蛋白的高效、特异性降解。

在一些实施方式中，本公开提供了一种环化前体RNA分子，能够环化形成上述的环状RNA分子。

在一些优选地实施方式中，环化前体RNA分子还包括位于第二外显子序列上游的5’同源臂序列，5’同源臂序列为与SEQ ID NO：29-30任一序列所示的核苷酸序列相比具有至少80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％、100％序列同一性的序列。

在一些优选地实施方式中，环化前体RNA分子还包括位于第一外显子序列下游的3’同源臂序列。3’同源臂序列为与SEQ ID NO：31-32任一序列所示的核苷酸序列相比具有至少80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％、100％序列同一性的序列。

在一些优选地实施方式中，环化前体RNA分子还包括位于第二外显子序列与5’同源臂序列之间的3’内含子序列，3’内含子序列为与SEQ ID NO：28所示的核苷酸序列相比具有至少80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％、100％序列同一性的序列。

在一些优选地实施方式中，环化前体RNA分子还包括位于第一外显子序列与3’同源臂序列之间的5’内含子序列，5’内含子序列为与SEQ ID NO：27所示的核苷酸序列相比具有至少80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％、100％序列同一性的序列。

在一些具体地实施方式，环化前体RNA分子包括顺次连接的如下所示序列：

环化前体RNA分子通过如下过程成环：利用内含子的核酶特性，在GTP的引发下，5’内含子与第一外显子的连接处发生断裂；第一外显子的核酶裂口进一步攻击3’内含子与第二外显子的连接处，使该处发生断裂，3’内含子解离，第一外显子和第二外显子连接形成环状RNA。

在一些实施方式中，本公开提供了一种重组核酸分子，能够转录形成上述的环化前体RNA分子。为使重组核酸分子能够进一步转录形成RNA分子，在重组核酸分子中还可以包含调控序列。示例性的，调控序列为连接于5’同源臂上游的T7启动子。

在一些实施方案中，本公开提供了一种重组表达载体，包含上述的重组核酸分子。其中，连接重组核酸分子的载体可以是本领域常用的各类载体，例如pUC57质粒等。进一步的重组核酸分子中包含限制性酶切位点，使重组表达载体经酶切后得到适于转录的线性化载体。

组合物

本公开提供的组合物包括根据本公开所述的环状RNA，具有优异的蛋白靶向降解活性，组合物适于向体内递送，能够解决目前Bio-PROTACS分子无法实现靶向降解体内的目标蛋白的问题。

在一些实施方式中，组合物中还包括一种或多种药学上可接受的载体。在本公开中，使用组合物的目的在于促进针对生物体的给药，有利于活性成分的吸收，进而发挥生物活性。本发明的组合物可以通过任何形式给药，包括注射(动脉内、静脉内、肌肉内、腹膜内、皮下)、粘膜、口服(口服固体制剂、口服液体制剂)、直肠、吸入、植入、局部(例如眼部)给药等。口服固体制剂的非限制性实例包括但不限于散剂、胶囊剂、锭剂、颗粒剂、片剂等。口服或粘膜给药的液体制剂的非限制性实例包括但不限于混悬剂、酊剂、酏剂、溶液剂等。局部给药制剂的非限制性实例包括但不限于乳剂、凝胶剂、软膏剂、乳膏剂、贴剂、糊剂、泡沫剂、洗剂、滴剂或血清制剂。胃肠外给药制剂的非限制性实例包括但不限于注射用溶液剂、注射用干粉剂、注射用悬浮液、注射用乳剂等。本发明的组合物还可以制成控制释放或延迟释放剂型(例如脂质体或微球)。

在本公开中，施用途经能够以任何适用的方式进行变化或调整，以满足药物的性质、患者和医务人员的便利以及其它相关因素的需求。

在一些优选地实施方式中，组合物仅由环状RNA分子，及溶解环状RNA分子的溶剂组成。示例性的，溶剂为1xTE buffer或其他任意类型的能够溶解环状RNA分子的溶剂。本公开意外地发现，本公开中的环状RNA分子，不需要以脂质纳米粒(lipid nanoparticle，LNP)等对环状RNA进行包裹，即具有高的稳定性，在递送至体内后能充分发挥针对目标蛋白的靶向降解活性，能够实现对疾病相关蛋白的特异、高效降解，从而达到疾病治疗的效果。

环状RNA或组合物的用途

在一些实施方式中，本公开提供了环状RNA分子或包含环状RNA分子的组合物在目标蛋白的靶向降解中的用途。本公开首次实现了以环状RNA分子递送至胞内，靶向降解目标蛋白。与小分子蛋白靶向降解嵌合体或大分子Bio-PROTACs相比，本公开中的环状RNA分子易于向胞内递送，能够实现胞内高效率的目标蛋白降解。与线性mRNA相比，本公开中的环状RNA分子有更好的蛋白翻译水平与表达持久性，蛋白降解效果更为显著。

在一些优选地实施方式中，本公开提供了环状RNA分子或包含环状RNA分子的组合物在受试者体内的目标蛋白的靶向降解。本公开意外地发现，环状RNA分子在施用于受试者的活体肿瘤后，有效抑制了肿瘤的生长，证明了环状RNA分子具有优异的体内蛋白靶向降解的活性，完整解决Bio-PROTACs无法实现体内蛋白降解的问题。

在一些实施方式中，本公开提供了环状RNA分子或包含环状RNA分子的组合物在降低或消除目标蛋白的表达中的用途。本公开中的环状RNA分子具有显著改善的胞内蛋白降解活性，适用于作为或制备目标蛋白的靶向降解的试剂，特别是作为或制备受试者体内的目标蛋白的靶向降解的试剂。

在一些实施方式中，本公开提供了环状RNA分子或包含环状RNA分子的组合物在作为或制备治疗疾病的药物中的用途。环状RNA分子在施用于受试者体内后，能够实现对疾病相关蛋白的特异、高效降解，从而达到疾病治疗的效果。

在一些优选地实施方式中，本公开提供了环状RNA分子或包含环状RNA分子的组合物在作为或制备治疗肿瘤的药物中的用途。本公开首次以环状RNA分子瘤内注射裸鼠肿瘤模型，成功实现肿瘤生长抑制，首次证实环状RNA分子能应用于肿瘤治疗，具有重要医药应用前景。

实施例

本公开的其他目的、特征和优点将从以下详细描述中变得明显。但是，应当理解的是，详细描述和具体实施例(虽然表示本公开的具体实施方式)仅为解释性目的而给出，因为在阅读该详细说明后，在本公开的精神和范围内所作出的各种改变和修饰，对于本领域技术人员来说将变得显而易见。

本实施例中所用到的实验技术与实验方法，如无特殊说明均为常规技术方法，例如下列实施例中未注明具体条件的实验方法，通常按照常规条件如Sambrook等人，分子克隆：实验室手册(New York:Cold Spring Harbor Laboratory Press，1989)中所述的条件，或按照制造厂商所建议的条件。实施例中所使用的材料、试剂等，如无特殊说明，均可通过正规商业渠道获得。

实施例1：基于环状RNA编码的靶向EGFP蛋白降解的融合蛋白在293T细胞降解效果验证

1.1实验方法与步骤：

(1)EV29-H2B-EGFP等质粒构建

构建含有表达H2B-EGFP和靶向H2B-EGFP蛋白降解的目的基因，该步骤委托苏州金唯智生物科技有限公司进行基因合成与克隆。此处所使用的构建环状RNA的DNA载体，包含T7启动子，5’同源臂，3’内含子，第二外显子E2，5’间隔区，IRES元件，H2B-EGFP与靶向EGFP蛋白降解的序列编码区，下游间隔区，5’内含子，第一外显子E1，3’同源臂，以及可用于质粒线性化的酶切位点XbaI。对于线性mRNA TRNP-EGFP-DASP所得基因片段连接到pUC57载体。

表1

蛋白序列名称	RNA序列名称	质粒名称	RNA序列
				H2B-EGFP	EV29-H2B-EGFP	pUC57-EV29-H2B-EGFP	SEQ.ID No：1
EGFP-DASP	EV29-EGFP-DASP	pUC57-EV29-EGFP-DASP	SEQ.ID No：2
				EGFP-DASP	TRNP-EGFP-DASP	pUC57-TRNP-EGFP-DASP	SEQ.ID No：3

(2)EV29-H2B-EGFP等体外转录线性质粒模板制备

1)质粒抽提

①将外部合成的穿刺菌活化，条件37℃/220rpm/3～4h；

②取活化菌液扩大培养，培养条件：37℃/220rpm/过夜；

③质粒抽提(天根无内毒素小量中提试剂盒)，测定OD值。

2)质粒酶切

采取Xba I单酶切的方法酶切上述1)制备质粒

酶切体系如下：

表2

试剂	体积
		质粒	10μg
酶(1000units)	5μl
		10x cutsmart buffer	30μl
Nuclease free，H2O	Total 300μl

37℃下酶切过夜：采用直接过柱(天根通用型DNA胶回收试剂盒)的方法回收酶切产物，测定OD值和1％琼脂糖凝胶电泳鉴定产物；纯化的线性质粒模板用于体外转录。

(3)环状mRNA合成

1)采用体外转录的方法合成mRNA

转录体系如下：

表3

试剂	体积
		10xReaction Buffer	2μl
ATP(20mM)	2μl
		CTP(20mM)	2μl
UTP(20mM)	2μl
		GTP(20mM)	2μl
Xba I单酶切线性化DNA	Xμl(500-1000ng)
		T7 RNAPolymerase	2μl
RNA inhibitor	2μl
		RNA Nuclease free，H2O	Total 20μl

37℃孵育2-3h，然后将20μl转录体系，用2μl DNaseI消化以去除线性DNA模板，消化条件：37℃消化15min。

2)mRNA纯化

将上述1)所得转录产物，使用硅膜离心柱法纯化(Thermo，GeneJET RNAPurification Kit)，测定OD值及1％变性琼脂糖凝胶电泳鉴定RNA大小。

3)mRNA环化：

环化试剂：GTP Buffer：50mM Tris-HCl，10mM MgCl2，1mM DTT，pH 7.5左右

环化体系与条件：

表4

溶液	体积
		mRNA	25μg RNA溶液
GTP solution(20mM)	50μl
		GTP buffer	补足至500μl

将上述溶液于55℃加热15min，环化RNA产物使用硅膜离心柱法纯化(Thermo，GeneJET RNA Purification Kit)，测定OD值。

(4)线性mRNA的合成

pUC57-TRNP-EGFP-DASP质粒酶切线性化及模板纯化方法同(2)-2)。采用APExBio试剂盒HyperScribe^TMAll in One mRNA Synthesis Kit II通过体外转录合成Cap1结构的线性mRNA，采用假尿嘧啶进行核苷修饰。最终得到Cap1结构，带PolyA尾且具有假尿嘧啶核苷修饰的线性mRNA。

(5)细胞培养与转染：

1)细胞培养：

293T接种于含有10％胎牛血清，1％双抗的DMEM高糖培养基中，于37℃，5％CO₂培养箱中培养。细胞每隔2-3天进行传代培养。

2)细胞转染：

转染前将293T细胞以1×10⁵个/孔接种于24孔板中，于37℃，5％CO₂培养箱中培养。待细胞达到70-90％融合度后，使用Lipofectamine MessengerMax(Invitrogen)转染试剂，先转染不同质量的EV29-H2B-EGFP mRNA，6小时后再以不同比例转染EV29-EGFP-DASP mRNA或EGFP-DASP线性mRNA至293T细胞，具体操作如下：

①稀释MessengerMAX^TM Reagent

表5

试剂	体积/孔
		MEM无血清培养基	25μl
Messenger MAX<sup>TM</sup> Reagent	0.75μl

稀释混合后，室温静置孵育10min。

②稀释mRNA

表6

试剂	体积/孔
		mRNA	按照实际转染量计算
MEM无血清培养基	补足至25μl

③取混合稀释后的MessengerMAX^TM Reagent和mRNA(1：1)

表7

试剂	体积/孔
		稀释的Messenger MAX<sup>TM</sup> Reagent	25μl
稀释的mRNA	25μl

稀释混合后，室温静置孵育5min。

④吸取上述混合液50μl贴壁缓缓加入24孔板中，37℃、5％CO₂培养箱中孵育培养。

3)EGFP蛋白表达检测

①细胞荧光观察：将转染后24小时和48小时的293T细胞于200×荧光显微镜下观察EGFP的表达情况。

②流式细胞术检测细胞平均荧光强度：将转染后24小时和48小时293T细胞用流式细胞仪检测细胞平均荧光强度。

1.2实验结果

1)DNA转录模板制备

①质粒提取浓度：pUC57-EV29-H2B-EGFP：557.8ng/μl，pUC57-EV29-EGFP-DASP：565.2ng/μl；

②质粒酶切线性化浓度：pUC57-EV29-H2B-EGFP：148ng/μl，pUC57-EV29-EGFP-DASP：142.3ng/μl；

2)mRNA转录与环化

①mRNA转录纯化后浓度：EV29-H2B-EGFP：914.4ng/μl，EV29-EGFP-DASP：491.8ng/μl；

②mRNA环化纯化后浓度：EV29-H2B-EGFP：201ng/μl，EV29-EGFP-DASP：108ng/μl；

③体外转录纯化获得EGFP-DASP的Cap1帽结构，假尿嘧啶修饰核苷的线性mRNA97ng/μl。

3)蛋白表达检测

如图1(转染后48小时的H2B-EGFP荧光)与图2(流式细胞定量)所示：荧光观察与流式细胞检测数据显示初始转染EV29-H2B-eGFP mRNA 50ng、100ng、200ng、400ng时，随着转染量的增大，EGFP蛋白表达荧光强度越高，在此基础上转染EV29-EGFP-DASP mRNA后，EGFP蛋白荧光强度显著下降，且随着转染的EV29-EGFP-DASP mRNA量增大荧光强度减弱。说明EV29-EGFP-DASP翻译的蛋白质可以实现对H2B-EGFP蛋白的降解作用。如图3所示，比较同样数量(转染数量同为1μg)的编码相同Bio-PROTACs的线性mRNA与环状mRNA对H2B-EGFP(转染mRNA数量为400ng)蛋白降解的效应，发现环状mRNA对H2B-EGFP的蛋白降解作用显著优于线性mRNA，且随着时间延长(至72小时)，环状mRNA的蛋白降解优势进一步加大。

实施例2：基于环状RNA编码的靶向PCNA蛋白降解的融合蛋白在A549细胞降解效果验证

2.1实验方法与步骤

(1)EV29-CON1-SP-WT等质粒构建

在上述实施例1的基础上，采用与上述实施例1相同的环状RNA元件，构建编码靶向PCNA蛋白降解的融合蛋白基因序列EV29-CON1-SP-WT，以及功能缺失的融合蛋白基因序列pUC57-EV29-CON1-SP-mu与pUC57-EV29-CON1-mu-SP，信息如下所示。DNA合成委托苏州金唯智生物科技有限公司完成。

表8

蛋白序列名称	RNA序列名称	质粒名称	RNASEQ.ID
				CON1-SP-WT	EV29-CON1-SP-WT	pUC57-EV29-CON1-SP-WT	SEQ.ID No：4
CON1-SP-mu	EV29-CON1-SP-mu	pUC57-EV29-CON1-SP-mu	SEQ.ID No：5
				CON1-mu-SP	EV29-CON1-mu-SP	pUC57-EV29-CON1-mu-SP	SEQ.ID No：6

(2)质粒DNA线性化，环化前体mRNA体外转录，环化前体mRNA纯化，mRNA的成环反应，环状mRNA的纯化，细胞培养与转染等方法均与实施例1的1.1相同，细胞类型更换为表达PCNA的肿瘤细胞系A549。

(3)Western Blot检测细胞pCNA蛋白水平

1)SDS-PAGE胶配制

按以下表格配制所需浓度凝胶：

表9

加入TEMED后加入TEMED后立即混匀，缓缓加入两玻璃板间的胶床中，然后胶上加一层水；待下层分离胶凝固(水和胶之间可看到一条折射线)后倒出上层水层，按以下表格配制所需体积的上层浓缩胶：

表10

加入TEMED后加入TEMED后立即混匀，缓缓加入浓缩胶将剩余空间灌满后将梳子插入浓缩胶中，待上层浓缩胶凝固后可进行电泳

1)蛋白样品上样及电泳

蛋白样品上样前进行变性处理：向蛋白样品中加入5×SDS Loading至终浓度为1×，充分混匀后于95℃加热5min；上样后进行电泳：恒压100V电泳20min后将电压改为120V进行电泳，至目的条带充分分离开后即可终止电泳，进行转膜。

2)转膜

根据蛋白样品上样及检测范围裁剪出适当大小的PVDF膜，将膜置于甲醇溶液中浸泡数分钟；将电泳完成后的胶板取出，剥掉多余的胶后放于滤纸上，以夹板负极-海绵垫-滤纸-凝胶-PVDF膜-滤纸-海绵垫-夹板正极的顺序放入转膜槽中，200mA恒流转膜1.5小时，电转移时会产热，需将槽子周围放置冰块进行降温。

3)免疫反应

转膜完成后将膜转移至含有封闭液(封闭液为TBST配制的5％牛奶)的平皿中，室温下摇床摇动封闭1小时；将一抗用5％牛奶稀释为适当的工作浓度，加入到平皿中，以可以覆盖住膜为佳，室温摇床孵育1-2h或4℃孵育过夜；用TBST在室温下脱色摇床上洗三次，每次10min；弃去TBST清洗液，将二抗用5％牛奶稀释为适当的工作浓度，加入到平皿中，以可以覆盖住膜为佳，室温摇床孵育1-2h；用TBST在室温下脱色摇床上洗三次，每次10min；

4)化学发光显影

将ECL的A和B两种试剂在EP管内等体积混合，然后均匀滴在PVDF膜的蛋白面，反应1-2min后显影；

2.2实验结果

1)DNA线性化模板制备

①质粒提取浓度：pUC57-EV29-CON1-SP-WT：404.4ng/μl，pUC57-EV29-CON1-SP-mu：775.8ng/μl，pUC57-EV29-CON1-mu-SP：563.4ng/μl；

②质粒酶切线性化浓度：pUC57-EV29-CON1-SP-WT：144.4ng/μl，pUC57-EV29-CON1-SP-mu：157.3ng/μl，pUC57-EV29-CON1-mu-SP：149.8ng/μl；

2)mRNA转录与环化

①mRNA转录纯化后浓度：EV29-CON1-SP-WT：1788.8ng/μl，EV29-CON1-SP-mu：1716.8ng/μl，EV29-CON1-mu-SP：1347.4ng/μl；

②mRNA环化纯化后浓度：EV29-CON1-SP-WT：2097.4ng/μl，EV29-CON1-SP-mu：2515.5ng/μl，EV29-CON1-mu-SP：2160ng/μl；

3)细胞转染后24小时检测PCNA蛋白表达水平：Western Blot结果显示(图4)，与空白对照组(不转染环状RNA)和阴性对照组相比(转染编码丧失降解功能的环状RNA)，转染EV29-CON1-SP-WT mRNA组的细胞中PCNA蛋白表达水平更低，表明EV29-CON1-SP-WT mRNA在A549细胞中可以实现对PCNA蛋白的降解作用。

实施例3：基于环状mRNA编码的靶向EGFP蛋白降解的融合蛋白在体内降解效果验证

3.1实验方法

1)质粒DNA线性化，环化前体mRNA体外转录，环化前体mRNA纯化，mRNA的成环反应，环状mRNA的纯化，细胞培养等方法均与实施例1的1.1相同，细胞类型更换为肿瘤细胞系A549。

2)细胞收集:使用0.25％胰蛋白酶-EDTA(Gibco)消化细胞，1000rpm离心5min，弃上清，将细胞于重悬于添加了Matrigel(Corning)的磷酸盐缓冲液，并细胞计数。

3)A549肿瘤模型：雌性CD-1Nude裸鼠(6-7周龄)皮下接种3×10⁶个A549细胞，每周两次用游标卡尺测量肿瘤大小直至实验终结。当肿瘤大小达到约2000mm³或存在动物健康问题(肿瘤的20％面积溃疡)时，对动物实施安乐死。使用GraphPad Prism 8.0.2整理数据并绘制肿瘤生长曲线图。

4)环状RNA注射：造模两周后，每只老鼠瘤内注射20μg EV29-H2B-EGFP的环状RNA，并将裸鼠随机分为两组。6小时后，一组瘤内注射20μg编码GFP降解的环状RNA(EV29-GFP-DASP)，另一组瘤内注射20μg对照mRNA(control)，40小时后，将裸鼠安乐死，将肿瘤剥离。

5)单细胞悬液：置于含有DMEM基础培养基的24孔板中，并将24孔板放置在冰上。将DMEM基础培养基替换为5mL含有1mg/mL胶原蛋白酶IV(赛默飞)和100U/mL DnaseI的DMEM基础培养基，并用剪刀将肿瘤剪碎至约1mm3的小块。将肿瘤碎块和消化液一同转移到15mL离心管中，放在37度摇床孵育30分钟，转速为70r/min。消化结束后，向离心管中加入5mL含有10％灭活胎牛血清的DMEM完全培养基终止消化，过70um细胞筛网后，离心。

6)细胞荧光检测：制成的单细胞悬液，加入Fixable cell viability dye efluor780(赛默飞)的PBS溶液后，4度避光孵育20分钟，离心后，PBS溶液洗一遍后，以200μl PBS溶液重悬细胞，将死细胞进行染色。流式细胞仪检测分析每组肿瘤细胞GFP阳性细胞比例以及总细胞的GFP平均荧光强度。

3.2实验结果

如图5所示，瘤内注射降解GFP的环状RNA(EV29-EGFP-DASP)可以显著降低肿瘤里GFP阳性细胞的比例，并且降低GFP平均荧光强度。这一结果直观地说明了环状RNA可以在体内实现靶蛋白降解。

实施例4：基于环状mRNA编码的靶向PCNA蛋白降解的融合蛋白在体内降解效果验证

4.1实验方法

1)质粒DNA线性化，环化前体mRNA体外转录，环化前体mRNA纯化，mRNA的成环反应，环状mRNA的纯化，细胞培养等方法均与实施例2的2.1相同。

2)细胞收集，肿瘤造模等方法与实施例3的3.1相同。

3)肿瘤大约长到2mm×3mm左右，随机分为对照组和PCNA降解组，其中对照组n＝5，PCNA降解组n＝6。对照组为失去降解功能的EV29-CON1-SP-mu环状RNA，实验组为具备降解PCNA功能的EV29-CON1-SP-WT环状RNA。每隔2天瘤内注射10μg对照RNA或者PCNA降解RNA。给药的同时测量肿瘤体积，绘制肿瘤生长曲线。实验终止时，将裸鼠安乐死，剥离肿瘤拍照。

4.2实验结果

如图6结果所示：因肿瘤模型采用的是裸鼠模型以及人的非小细胞肺癌细胞系，而EV29-CON1-SP-WT mRNA靶向的是人的PCNA蛋白，在注射了该组RNA后，小鼠肿瘤体积增长速度渐缓，且显著小于注射阴性对照RNA组的肿瘤大小。该实验验证了环状RNA可以在体内降解靶蛋白，并且导致靶蛋白的功能受到影响。

实施例5：基于环状RNA编码的靶向KRAS蛋白降解的融合蛋白在H358细胞降解效果验证

实验方法与步骤：EV29-K19-VHK/VHKC等质粒构建

在上述实施例1的基础上，采用与上述实施例1相同的环状RNA元件，构建编码靶向KRAS蛋白降解的融合蛋白基因序列EV29-K19-VHK，以及E3连接酶VHL功能缺失的融合蛋白基因序列EV29-K19-VHKC，信息如下所示。DNA合成委托苏州金唯智生物科技有限公司完成。

表11

蛋白序列名称	RNA序列名称	质粒名称	RNA SEQ.ID
				K19-VHK	EV29-K19-VHK	pUC57-EV29-K19-VHK	SEQ.ID No：55
K19-VHKC	EV29-K19-VHKC	pUC57-EV29-K19-VHKC	SEQ.ID No：56

质粒DNA线性化，环化前体mRNA体外转录，环化前体mRNA纯化，mRNA的成环反应，环状mRNA的纯化，细胞培养与转染等方法均与实施例1的1.1相同，细胞类型更换为表达KRAS的肿瘤细胞系H358。细胞转染，Western Blot的实验步骤同实施例2。细胞转染后的6小时、24小时、48小时分别采用Western Blot测试H358细胞的KRAS蛋白水平。结果如图7所示，转染环状RNA EV29-VHK的6、24小时后H358细胞的KRAS蛋白的水平出现显著下降，而转染环状RNA EV29-VHKC后H358细胞的KRAS水平未见显著改变，说明环状RNA EV29-VHK导致KRAS蛋白发生显著降解。

实施例6：环状RNA编码的不同E3连接酶构建的靶向KRAS蛋白降解的融合蛋白在H358细胞降解效果验证

实验方法与步骤：

在上述实施例1的基础上，采用与上述实施例1相同的环状RNA元件，构建编码靶向KRAS蛋白降解的融合蛋白基因序列EV29-βTrCP-K19、EV29-FBW7-K19、EV29-SKP2-K19、EV29-CRBN-K19、EV29-DDB2-K19、EV29-K19-SOCS2、EV29-K19-ASB1、EV29-K19-CHIP、EV29-K19-SPOP。信息如下表所示。DNA合成委托苏州金唯智生物科技有限公司完成。

表12

蛋白序列名称	RNA序列名称	质粒名称	RNA SEQ.ID
				ΒTrCP-K19	EV29-βTrCP-K19	pUC57-EV29-βTrCP-K19	SEQ.ID No：36
FBW7-K19	EV29-FBW7-K19	pUC57-EV29-FBW7-K19	SEQ.ID No：37
				SKP2-K19	EV29-SKP2-K19	pUC57-EV29-SKP2-K19	SEQ.ID No：38
CRBN-K19	EV29-CRBN-K19	pUC57-EV29-CRBN-K19	SEQ.ID No：39
				DDB2-K19	EV29-DDB2-K19	pUC57-EV29-DDB2-K19	SEQ.ID No：40
K19-SOCS2	EV29-K19-SOCS2	pUC57-EV29-K19-SOCS2	SEQ.ID No：41
				K19-ASB1	EV29-K19-ASB1	pUC57-EV29-K19-ASB1	SEQ.ID No：42
K19-CHIP	EV29-K19-CHIP	pUC57-EV29-K19-CHIP	SEQ.ID No：43
				K19-SPOP	EV29-K19-SPOP	pUC57-EV29-K19-SPOP	SEQ.ID No：44

质粒DNA线性化，环化前体mRNA体外转录，环化前体mRNA纯化，mRNA的成环反应，环状mRNA的纯化，细胞培养与转染等方法均与实施例1的1.1相同，细胞类型更换为表达KRAS的肿瘤细胞系H358。细胞转染，Western Blot的实验步骤同实施例2。细胞转染后的6小时采用Western Blot测试H358细胞的KRAS蛋白水平。KRAS蛋白降解的效果如表13所示，以EV29-K19-VHKC的蛋白水平作为对照，计算不同的环状RNA转染后的KRAS蛋白水平百分比。实验结果显示，采用不同的E3连接酶构建的基于K19 KRAS结合蛋白的融合蛋白均实现对KRAS蛋白的降解。其中，采用E3连接酶βTrCP、SKP2、CRBN、CHIP、SPOP以及VHK取得较好的蛋白降解效果。

表13

RNA序列名称	KRAS蛋白水平百分比
		EV29-βTrCP-K19	19.3％
EV29-FBW7-K19	45.9％
		EV29-SKP2-K19	20.4％
EV29-CRBN-K19	28.2％
		EV29-DDB2-K19	52.6％
EV29-K19-SOCS2	47.3％
		EV29-K19-ASB1	39.8％
EV29-K19-CHIP	28.3％
		EV29-K19-SPOP	22.4％
EV29-K19-VHK	26.8％

本公开的上述实施例仅是为清楚地说明本公开所作的举例，而并非是对本公开的实施方式的限定。对于所属领域的普通技术人员来说，在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本公开的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本公开权利要求的保护范围之内。

序列表

<110> 江苏普瑞康生物医药科技有限公司

<120> 环状RNA分子及其在目标蛋白的靶向降解中的应用

<130> 6A23-2163722I-SU

<160> 57

<170> SIPOSequenceListing 1.0

<210> 1

<211> 2035

<212> RNA

<213> Artificial Sequence

<220>

<223> 环状RNA分子序列

<400> 1

aaaauccguu gaccuuaaac ggucgugugg guucaagucc cuccaccccc acgccggaaa 60

cgcaauagcc gaaaaaacaa aaacaaaaaa aacaaaaaaa caaaaaaaaa accaaaacac 120

auuaaaacag ccuguggguu gaucccaccc acagggccca cugggcgcua gcacucuggu 180

aucacgguac cuuugugcgc cuguuuuaua cuuccucccc caacugcaac uuagaaguaa 240

cacaaaccga ucaacaguca gcguggcaca ccagccacgu uuugaucaaa cacuucuguu 300

accccggacu gaguaucaau agacugcuca cgcgguugaa ggagaaaacg uucguuaucc 360

ggccaacuac uucgagaaac cuaguaacgc cauggaaguu guggaguguu ucgcucagca 420

cuaccccagu guagaucagg uugaugaguc accgcauucc ccacggguga ccguggcggu 480

ggcugcguug gcggccugcc cauggggaaa cccaugggac gcucuuauac agacauggug 540

cgaagagucu auugagcuag uugguagucc uccggccccu gaaugcggcu aaucccaacu 600

gcggagcaua cacucucaag ccagagggua gugugucgua augggcaacu cugcagcgga 660

accgacuacu uugggugucc guguuucauu uuauuccuau acuggcugcu uauggugaca 720

auugagagau uguuaccaua uagcuauugg auuggccauc cggugacuaa cagagcuauu 780

auauaucuuu uuguuggguu uauaccacuu agcuugaaag agguuaaaac ucuacauuac 840

auuuuaauac ugaacaccgc aaaaugcccg agcccgccaa gagcgccccc gcucccaaga 900

agggcagcaa gaaggccgug accaaggccc agaagaaggg cggcaagaaa aggaagagga 960

gcaggaagga gagcuacagc aucuacgugu acaaggugcu gaagcaggug caccccgaca 1020

ccggcaucag cagcaaggcc augggcauca ugaacagcuu cgugaacgac aucuucgaga 1080

ggaucgccgg cgaggccagc agacuggccc acuacaacaa gaggagcacc aucaccagca 1140

gagagaucca gaccgccgug agacugcugc ugcccggcga gcuggccaag cacgccguga 1200

gcgagggcac caaggccauc accaaguaca ccagcgccaa ggacccuccc guggccacca 1260

uggugagcaa gggcgaggag cuguucaccg gcguggugcc cauccuggug gagcuggacg 1320

gcgacgugaa cggccacaag uucagcguga gcggcgaggg agagggcgac gccaccuacg 1380

gcaagcugac ccugaaguuc aucugcacca ccggcaagcu gcccgugccc uggcccaccc 1440

uggugaccac ccugaccuac ggcgugcagu gcuucagcag guaccccgac cacaugaagc 1500

agcacgacuu cuucaagagc gccaugcccg agggcuacgu gcaggagagg accaucuucu 1560

ucaaggacga cggcaacuac aagaccaggg ccgaggugaa guucgagggc gacacccugg 1620

ugaacaggau cgagcugaag ggcaucgacu ucaaggagga cggcaacauc cugggccaca 1680

agcuggagua caacuacaau agccacaacg uguacaucau ggccgacaag cagaagaacg 1740

gcaucaaggu gaacuucaag aucaggcaca acaucgagga cggcagcgug cagcuggccg 1800

accacuacca gcagaacacc cccaucggcg acggccccgu gcugcugccc gacaaccacu 1860

accugagcac ccagagcgcc cugagcaagg accccaacga gaagagggac cacauggugc 1920

ugcuggaguu cgugaccgcc gccggcauca cccugggcau ggacgagcug uacaagugaa 1980

aaaaacaaaa aacaaaacgg cuauuaugcg uuaccggcga gacgcuacgg acuua 2035

<210> 2

<211> 2089

<212> RNA

<213> Artificial Sequence

<220>

<223> 环状RNA分子序列

<400> 2

aaaauccguu gaccuuaaac ggucgugugg guucaagucc cuccaccccc acgccggaaa 60

cgcaauagcc gaaaaaacaa aaacaaaaaa aacaaaaaaa caaaaaaaaa accaaaacac 120

auuaaaacag ccuguggguu gaucccaccc acagggccca cugggcgcua gcacucuggu 180

aucacgguac cuuugugcgc cuguuuuaua cuuccucccc caacugcaac uuagaaguaa 240

cacaaaccga ucaacaguca gcguggcaca ccagccacgu uuugaucaaa cacuucuguu 300

accccggacu gaguaucaau agacugcuca cgcgguugaa ggagaaaacg uucguuaucc 360

ggccaacuac uucgagaaac cuaguaacgc cauggaaguu guggaguguu ucgcucagca 420

cuaccccagu guagaucagg uugaugaguc accgcauucc ccacggguga ccguggcggu 480

ggcugcguug gcggccugcc cauggggaaa cccaugggac gcucuuauac agacauggug 540

cgaagagucu auugagcuag uugguagucc uccggccccu gaaugcggcu aaucccaacu 600

gcggagcaua cacucucaag ccagagggua gugugucgua augggcaacu cugcagcgga 660

accgacuacu uugggugucc guguuucauu uuauuccuau acuggcugcu uauggugaca 720

auugagagau uguuaccaua uagcuauugg auuggccauc cggugacuaa cagagcuauu 780

auauaucuuu uuguuggguu uauaccacuu agcuugaaag agguuaaaac ucuacauuac 840

auuuuaauac ugaacaccgc aaaaugggcg gccuggacua caaggacgac gacgauaagg 900

ccagcagcga ccugggcaag aagcugcugg aggccgccag ggccggccag gacgacgagg 960

ugaggauccu gauggccaac ggcgccgacg ugaacgcccu ggacagguuc ggccugaccc 1020

ccuugcaccu ggccgcccag aggggccacc uggagaucgu ggaggugcug cugaagugcg 1080

gcgccgacgu gaacgccgcc gaccuguggg gccagacccc cuugcaccug gcugccaccg 1140

ccggccaccu ggagaucguc gaggugcugc ugaaguacgg cgccgacgug aacgcucugg 1200

accugaucgg caagaccccc uugcaccuga ccgccaucga cggccaccug gaaaucgugg 1260

aggugcuccu gaagcacggc gccgacguga acgcacagga caaguucggc aagaccgcuu 1320

uugauauuag caucgacaac ggcaaugagg aucuugcuga aaucuugcag aagcugaacg 1380

gcucuggauc uggcagcgga agcgugaaca ucagcggcca gaacaccaug aacaugguga 1440

aggugcccga gugcagacug gccgacgagc ugggcggccu gugggagaac agcagguuca 1500

ccgacugcug ccugugcgug gccggccagg aguuccaggc ccacaaggcc auccuggccg 1560

ccaggagccc cguguucagc gccauguucg agcacgagau ggaggagagc aagaagaaca 1620

gaguggagau caacgacgug gagcccgagg uguucaagga gaugaugugc uucaucuaca 1680

ccggcaaggc ccccaaccug gacaagaugg ccgacgaccu gcuggccgcc gccgacaagu 1740

acgcccugga gagacugaag gugaugugcg aggacgcccu gugcagcaac cugagcgugg 1800

agaacgccgc cgagauccuc auccuggccg accugcacag cgccgaccag cugaagaccc 1860

aggccgugga cuucaucaac uaccacgcca gcgacgugcu ggagaccagc ggcuggaaga 1920

gcaugguggu gagccacccc caccuggugg ccgaggccua caggagccug gccagcgccc 1980

agugccccuu ccugggcccu cccaggaaga gacugaagca gagcggcagc ugaaaaaaac 2040

aaaaaacaaa acggcuauua ugcguuaccg gcgagacgcu acggacuua 2089

<210> 3

<211> 1630

<212> RNA

<213> Artificial Sequence

<220>

<223> 线性RNA分子序列

<400> 3

gacucacuau uuguuuucgc gcccaguugc aaaaaguguc gccuaggguu ggccaaucua 60

cucccaggag cagggagggc aggagccagg gcugggcaua aaagucaggg cagagccauc 120

uauugcuuac auuugcuucu gacacaacug uguucacuag caaccucaaa cagacaccgc 180

caccaugggc ggccuggacu acaaggacga cgacgauaag gccagcagcg accugggcaa 240

gaagcugcug gaggccgcca gggccggcca ggacgacgag gugaggaucc ugauggccaa 300

cggcgccgac gugaacgccc uggacagguu cggccugacc cccuugcacc uggccgccca 360

gaggggccac cuggagaucg uggaggugcu gcugaagugc ggcgccgacg ugaacgccgc 420

cgaccugugg ggccagaccc ccuugcaccu ggcugccacc gccggccacc uggagaucgu 480

cgaggugcug cugaaguacg gcgccgacgu gaacgcucug gaccugaucg gcaagacccc 540

cuugcaccug accgccaucg acggccaccu ggaaaucgug gaggugcucc ugaagcacgg 600

cgccgacgug aacgcacagg acaaguucgg caagaccgcu uuugauauua gcaucgacaa 660

cggcaaugag gaucuugcug aaaucuugca gaagcugaac ggcucuggau cuggcagcgg 720

aagcgugaac aucagcggcc agaacaccau gaacauggug aaggugcccg agugcagacu 780

ggccgacgag cugggcggcc ugugggagaa cagcagguuc accgacugcu gccugugcgu 840

ggccggccag gaguuccagg cccacaaggc cauccuggcc gccaggagcc ccguguucag 900

cgccauguuc gagcacgaga uggaggagag caagaagaac agaguggaga ucaacgacgu 960

ggagcccgag guguucaagg agaugaugug cuucaucuac accggcaagg cccccaaccu 1020

ggacaagaug gccgacgacc ugcuggccgc cgccgacaag uacgcccugg agagacugaa 1080

ggugaugugc gaggacgccc ugugcagcaa ccugagcgug gagaacgccg ccgagauccu 1140

cauccuggcc gaccugcaca gcgccgacca gcugaagacc caggccgugg acuucaucaa 1200

cuaccacgcc agcgacgugc uggagaccag cggcuggaag agcauggugg ugagccaccc 1260

ccaccuggug gccgaggccu acaggagccu ggccagcgcc cagugccccu uccugggccc 1320

ucccaggaag agacugaagc agagcggcag cugaagcucg cuuucuugcu guccaauuuc 1380

uauuaaaggu uccuuuguuc ccuaagucca acuacuaaac ugggggauau uaugaagggc 1440

cuugagcauc uggauucugc cuaauaaaaa acauuuauuu ucauugcgca uaugacuagc 1500

ucgcuuucuu gcuguccaau uucuauuaaa gguuccuuug uucccuaagu ccaacuacua 1560

aacuggggga uauuaugaag ggccuugagc aucuggauuc ugccuaauaa aaaacauuua 1620

uuuucauugc 1630

<210> 4

<211> 1648

<212> RNA

<213> Artificial Sequence

<220>

<223> 环状RNA分子序列

<400> 4

aaaauccguu gaccuuaaac ggucgugugg guucaagucc cuccaccccc acgccggaaa 60

cgcaauagcc gaaaaaacaa aaacaaaaaa aacaaaaaaa caaaaaaaaa accaaaacac 120

auuaaaacag ccuguggguu gaucccaccc acagggccca cugggcgcua gcacucuggu 180

aucacgguac cuuugugcgc cuguuuuaua cuuccucccc caacugcaac uuagaaguaa 240

cacaaaccga ucaacaguca gcguggcaca ccagccacgu uuugaucaaa cacuucuguu 300

accccggacu gaguaucaau agacugcuca cgcgguugaa ggagaaaacg uucguuaucc 360

ggccaacuac uucgagaaac cuaguaacgc cauggaaguu guggaguguu ucgcucagca 420

cuaccccagu guagaucagg uugaugaguc accgcauucc ccacggguga ccguggcggu 480

ggcugcguug gcggccugcc cauggggaaa cccaugggac gcucuuauac agacauggug 540

cgaagagucu auugagcuag uugguagucc uccggccccu gaaugcggcu aaucccaacu 600

gcggagcaua cacucucaag ccagagggua gugugucgua augggcaacu cugcagcgga 660

accgacuacu uugggugucc guguuucauu uuauuccuau acuggcugcu uauggugaca 720

auugagagau uguuaccaua uagcuauugg auuggccauc cggugacuaa cagagcuauu 780

auauaucuuu uuguuggguu uauaccacuu agcuugaaag agguuaaaac ucuacauuac 840

auuuuaauac ugaacaccgc aaaauggacu acaaggacga cgacgauaag gccagcagcg 900

ccgugcugca gaagaagauc accgacuacu uccaccccaa gaagggcagc ggcucuggca 960

gcggaagcgu gaacaucagc ggccagaaca ccaugaacau ggugaaggug cccgagugca 1020

gacuggccga cgagcugggc ggccuguggg agaacagcag guucaccgac ugcugccugu 1080

gcguggccgg ccaggaguuc caggcccaca aggccauccu ggccgccagg agccccgugu 1140

ucagcgccau guucgagcac gagauggagg agagcaagaa gaacagagug gagaucaacg 1200

acguggagcc cgagguguuc aaggagauga ugugcuucau cuacaccggc aaggccccca 1260

accuggacaa gauggccgac gaccugcugg ccgccgccga caaguacgcc cuggagagac 1320

ugaaggugau gugcgaggac gcccugugca gcaaccugag cguggagaac gccgccgaga 1380

uccucauccu ggccgaccug cacagcgccg accagcugaa gacccaggcc guggacuuca 1440

ucaacuacca cgccagcgac gugcuggaga ccagcggcug gaagagcaug guggugagcc 1500

acccccaccu gguggccgag gccuacagga gccuggccag cgcccagugc cccuuccugg 1560

gcccucccag gaagagacug aagcagagcu gaaaaaaaca aaaaacaaaa cggcuauuau 1620

gcguuaccgg cgagacgcua cggacuua 1648

<210> 5

<211> 1648

<212> RNA

<213> Artificial Sequence

<220>

<223> 环状RNA分子序列

<400> 5

aaaauccguu gaccuuaaac ggucgugugg guucaagucc cuccaccccc acgccggaaa 60

cgcaauagcc gaaaaaacaa aaacaaaaaa aacaaaaaaa caaaaaaaaa accaaaacac 120

auuaaaacag ccuguggguu gaucccaccc acagggccca cugggcgcua gcacucuggu 180

aucacgguac cuuugugcgc cuguuuuaua cuuccucccc caacugcaac uuagaaguaa 240

cacaaaccga ucaacaguca gcguggcaca ccagccacgu uuugaucaaa cacuucuguu 300

accccggacu gaguaucaau agacugcuca cgcgguugaa ggagaaaacg uucguuaucc 360

ggccaacuac uucgagaaac cuaguaacgc cauggaaguu guggaguguu ucgcucagca 420

cuaccccagu guagaucagg uugaugaguc accgcauucc ccacggguga ccguggcggu 480

ggcugcguug gcggccugcc cauggggaaa cccaugggac gcucuuauac agacauggug 540

cgaagagucu auugagcuag uugguagucc uccggccccu gaaugcggcu aaucccaacu 600

gcggagcaua cacucucaag ccagagggua gugugucgua augggcaacu cugcagcgga 660

accgacuacu uugggugucc guguuucauu uuauuccuau acuggcugcu uauggugaca 720

auugagagau uguuaccaua uagcuauugg auuggccauc cggugacuaa cagagcuauu 780

auauaucuuu uuguuggguu uauaccacuu agcuugaaag agguuaaaac ucuacauuac 840

auuuuaauac ugaacaccgc aaaauggacu acaaggacga cgacgauaag gccagcagcg 900

ccgugcugca gaagaaggcc accgacgccg cccaccccaa gaagggcagc ggcucuggca 960

gcggaagcgu gaacaucagc ggccagaaca ccaugaacau ggugaaggug cccgagugca 1020

gacuggccga cgagcugggc ggccuguggg agaacagcag guucaccgac ugcugccugu 1080

gcguggccgg ccaggaguuc caggcccaca aggccauccu ggccgccagg agccccgugu 1140

ucagcgccau guucgagcac gagauggagg agagcaagaa gaacagagug gagaucaacg 1200

acguggagcc cgagguguuc aaggagauga ugugcuucau cuacaccggc aaggccccca 1260

accuggacaa gauggccgac gaccugcugg ccgccgccga caaguacgcc cuggagagac 1320

ugaaggugau gugcgaggac gcccugugca gcaaccugag cguggagaac gccgccgaga 1380

uccucauccu ggccgaccug cacagcgccg accagcugaa gacccaggcc guggacuuca 1440

ucaacuacca cgccagcgac gugcuggaga ccagcggcug gaagagcaug guggugagcc 1500

acccccaccu gguggccgag gccuacagga gccuggccag cgcccagugc cccuuccugg 1560

gcccucccag gaagagacug aagcagagcu gaaaaaaaca aaaaacaaaa cggcuauuau 1620

gcguuaccgg cgagacgcua cggacuua 1648

<210> 6

<211> 1573

<212> RNA

<213> Artificial Sequence

<220>

<223> 环状RNA分子序列

<400> 6

aaaauccguu gaccuuaaac ggucgugugg guucaagucc cuccaccccc acgccggaaa 60

cgcaauagcc gaaaaaacaa aaacaaaaaa aacaaaaaaa caaaaaaaaa accaaaacac 120

auuaaaacag ccuguggguu gaucccaccc acagggccca cugggcgcua gcacucuggu 180

aucacgguac cuuugugcgc cuguuuuaua cuuccucccc caacugcaac uuagaaguaa 240

cacaaaccga ucaacaguca gcguggcaca ccagccacgu uuugaucaaa cacuucuguu 300

accccggacu gaguaucaau agacugcuca cgcgguugaa ggagaaaacg uucguuaucc 360

ggccaacuac uucgagaaac cuaguaacgc cauggaaguu guggaguguu ucgcucagca 420

cuaccccagu guagaucagg uugaugaguc accgcauucc ccacggguga ccguggcggu 480

ggcugcguug gcggccugcc cauggggaaa cccaugggac gcucuuauac agacauggug 540

cgaagagucu auugagcuag uugguagucc uccggccccu gaaugcggcu aaucccaacu 600

gcggagcaua cacucucaag ccagagggua gugugucgua augggcaacu cugcagcgga 660

accgacuacu uugggugucc guguuucauu uuauuccuau acuggcugcu uauggugaca 720

auugagagau uguuaccaua uagcuauugg auuggccauc cggugacuaa cagagcuauu 780

auauaucuuu uuguuggguu uauaccacuu agcuugaaag agguuaaaac ucuacauuac 840

auuuuaauac ugaacaccgc aaaauggacu acaaggacga cgacgauaag gccagcagcg 900

ccgugcugca gaagaagauc accgacuacu uccaccccaa gaagggcagc ggcucuggca 960

gcggaagcgu gaacaucagc ggccagaaca ccaugaacau ggugaaggug cccgagugca 1020

gacuggccga cgagcugggc ggccuguggg agaacagcag guucaccgac ugcugccugu 1080

gcguggccgg ccaggaguuc caggcccaca aggccauccu ggccgccagg agccccgugu 1140

ucagcgccau guucgagcac gagauggagg agagcaagaa gaacagagug gagaucaacg 1200

acguggagcc cgagguguuc aaggagauga ugugcuucau cuacaccggc aaggccccca 1260

accuggacaa gauggccgac gaccugcugg ccgccgccga caaguacgcc cuggagagac 1320

ugaaggugau gugcgaggac gcccugugca gcaaccugag cguggagaac uaccacgcca 1380

gcgacgugcu ggagaccagc ggcuggaaga gcaugguggu gagccacccc caccuggugg 1440

ccgaggccua caggagccug gccagcgccc agugccccuu ccugggcccu cccaggaaga 1500

gacugaagca gagcugaaaa aaacaaaaaa caaaacggcu auuaugcguu accggcgaga 1560

cgcuacggac uua 1573

<210> 7

<211> 261

<212> PRT

<213> Homo sapiens

<400> 7

Met Phe Glu Ala Arg Leu Val Gln Gly Ser Ile Leu Lys Lys Val Leu

1 5 10 15

Glu Ala Leu Lys Asp Leu Ile Asn Glu Ala Cys Trp Asp Ile Ser Ser

20 25 30

Ser Gly Val Asn Leu Gln Ser Met Asp Ser Ser His Val Ser Leu Val

35 40 45

Gln Leu Thr Leu Arg Ser Glu Gly Phe Asp Thr Tyr Arg Cys Asp Arg

50 55 60

Asn Leu Ala Met Gly Val Asn Leu Thr Ser Met Ser Lys Ile Leu Lys

65 70 75 80

Cys Ala Gly Asn Glu Asp Ile Ile Thr Leu Arg Ala Glu Asp Asn Ala

85 90 95

Asp Thr Leu Ala Leu Val Phe Glu Ala Pro Asn Gln Glu Lys Val Ser

100 105 110

Asp Tyr Glu Met Lys Leu Met Asp Leu Asp Val Glu Gln Leu Gly Ile

115 120 125

Pro Glu Gln Glu Tyr Ser Cys Val Val Lys Met Pro Ser Gly Glu Phe

130 135 140

Ala Arg Ile Cys Arg Asp Leu Ser His Ile Gly Asp Ala Val Val Ile

145 150 155 160

Ser Cys Ala Lys Asp Gly Val Lys Phe Ser Ala Ser Gly Glu Leu Gly

165 170 175

Asn Gly Asn Ile Lys Leu Ser Gln Thr Ser Asn Val Asp Lys Glu Glu

180 185 190

Glu Ala Val Thr Ile Glu Met Asn Glu Pro Val Gln Leu Thr Phe Ala

195 200 205

Leu Arg Tyr Leu Asn Phe Phe Thr Lys Ala Thr Pro Leu Ser Ser Thr

210 215 220

Val Thr Leu Ser Met Ser Ala Asp Val Pro Leu Val Val Glu Tyr Lys

225 230 235 240

Ile Ala Asp Met Gly His Leu Lys Tyr Tyr Leu Ala Pro Lys Ile Glu

245 250 255

Asp Glu Glu Gly Ser

260

<210> 8

<211> 16

<212> PRT

<213> Artificial Sequence

<220>

<223> 第一多肽序列

<400> 8

Ser Ala Val Leu Gln Lys Lys Ile Thr Asp Tyr Phe His Pro Lys Lys

1 5 10 15

<210> 9

<211> 48

<212> DNA

<213> Artificial Sequence

<220>

<223> 第一多肽序列

<400> 9

agcgccgtgc tgcagaagaa gatcaccgac tacttccacc ccaagaag 48

<210> 10

<211> 7

<212> PRT

<213> Artificial Sequence

<220>

<223> 连接肽序列

<400> 10

Gly Ser Gly Ser Gly Ser Gly

1 5

<210> 11

<211> 21

<212> DNA

<213> Artificial Sequence

<220>

<223> 连接肽序列

<400> 11

ggcagcggct ctggcagcgg a 21

<210> 12

<211> 208

<212> PRT

<213> Artificial Sequence

<220>

<223> 第二多肽序列

<400> 12

Ser Val Asn Ile Ser Gly Gln Asn Thr Met Asn Met Val Lys Val Pro

1 5 10 15

Glu Cys Arg Leu Ala Asp Glu Leu Gly Gly Leu Trp Glu Asn Ser Arg

20 25 30

Phe Thr Asp Cys Cys Leu Cys Val Ala Gly Gln Glu Phe Gln Ala His

35 40 45

Lys Ala Ile Leu Ala Ala Arg Ser Pro Val Phe Ser Ala Met Phe Glu

50 55 60

His Glu Met Glu Glu Ser Lys Lys Asn Arg Val Glu Ile Asn Asp Val

65 70 75 80

Glu Pro Glu Val Phe Lys Glu Met Met Cys Phe Ile Tyr Thr Gly Lys

85 90 95

Ala Pro Asn Leu Asp Lys Met Ala Asp Asp Leu Leu Ala Ala Ala Asp

100 105 110

Lys Tyr Ala Leu Glu Arg Leu Lys Val Met Cys Glu Asp Ala Leu Cys

115 120 125

Ser Asn Leu Ser Val Glu Asn Ala Ala Glu Ile Leu Ile Leu Ala Asp

130 135 140

Leu His Ser Ala Asp Gln Leu Lys Thr Gln Ala Val Asp Phe Ile Asn

145 150 155 160

Tyr His Ala Ser Asp Val Leu Glu Thr Ser Gly Trp Lys Ser Met Val

165 170 175

Val Ser His Pro His Leu Val Ala Glu Ala Tyr Arg Ser Leu Ala Ser

180 185 190

Ala Gln Cys Pro Phe Leu Gly Pro Pro Arg Lys Arg Leu Lys Gln Ser

195 200 205

<210> 13

<211> 627

<212> DNA

<213> Artificial Sequence

<220>

<223> 第二多肽序列

<400> 13

agcgtgaaca tcagcggcca gaacaccatg aacatggtga aggtgcccga gtgcagactg 60

gccgacgagc tgggcggcct gtgggagaac agcaggttca ccgactgctg cctgtgcgtg 120

gccggccagg agttccaggc ccacaaggcc atcctggccg ccaggagccc cgtgttcagc 180

gccatgttcg agcacgagat ggaggagagc aagaagaaca gagtggagat caacgacgtg 240

gagcccgagg tgttcaagga gatgatgtgc ttcatctaca ccggcaaggc ccccaacctg 300

gacaagatgg ccgacgacct gctggccgcc gccgacaagt acgccctgga gagactgaag 360

gtgatgtgcg aggacgccct gtgcagcaac ctgagcgtgg agaacgccgc cgagatcctc 420

atcctggccg acctgcacag cgccgaccag ctgaagaccc aggccgtgga cttcatcaac 480

taccacgcca gcgacgtgct ggagaccagc ggctggaaga gcatggtggt gagccacccc 540

cacctggtgg ccgaggccta caggagcctg gccagcgccc agtgcccctt cctgggccct 600

cccaggaaga gactgaagca gagctga 627

<210> 14

<211> 741

<212> RNA

<213> Artificial Sequence

<220>

<223> IRES序列

<400> 14

uuaaaacagc cuguggguug aucccaccca caggcccauu gggcgcuagc acucugguau 60

cacgguaccu uugugcgccu guuuuauacc cccuccccca acuguaacuu agaaguaaca 120

cacaccgauc aacagucagc guggcacacc agccacguuu ugaucaagca cuucuguuac 180

cccggacuga guaucaauag acugcucacg cgguugaagg agaaagcguu cguuauccgg 240

ccaacuacuu cgaaaaaccu aguaacaccg uggaaguugc agaguguuuc gcucagcacu 300

accccagugu agaucagguc gaugagucac cgcauucccc acgggcgacc guggcggugg 360

cugcguuggc ggccugccca uggggaaacc caugggacgc ucuaauacag acauggugcg 420

aagagucuau ugagcuaguu gguaguccuc cggccccuga augcggcuaa uccuaacugc 480

ggagcacaca cccucaagcc agagggcagu gugucguaac gggcaacucu gcagcggaac 540

cgacuacuuu ggguguccgu guuucauuuu auuccuauac uggcugcuua uggugacaau 600

ugagagaucg uuaccauaua gcuauuggau uggccauccg gugacuaaua gagcuauuau 660

auaucccuuu guuggguuua uaccacuuag cuugaaagag guuaaaacau uacaauucau 720

uguuaaguug aauacagcaa a 741

<210> 15

<211> 682

<212> RNA

<213> Artificial Sequence

<220>

<223> IRES序列

<400> 15

uuaaaacagc cuguggguug cacccaccca cagggcccac agggcgcuag cacucuggua 60

ucacgguacc uuugugcgcc uguuuuauua ccccuucccc aauugaaaau uagaagcaau 120

gcacaccgau caacagcagg cguggcgcac cagucacguc ucgaucaagc acuucuguuu 180

ccccggaccg aguaucaaua gacugcucac gcgguugaag gagaaagugu ucguuauccg 240

gcuaaccacu ucgagaaacc caguaacacc augaaaguug caggguguuu cgcucagcac 300

uuccccagug uagaucaggu cgaugaguca ccgcguuccc cacgggcgac cguggcggug 360

gcugcguugg cggccugccu auggguuaac ccauaggacg cucuaauaca gacauggugc 420

gaagaguuua uugagcuggu uaguaucccu ccggccccug aaugcggcua auccuaacug 480

cggagcacgu gccuccaauc caggggguug caugucguaa cggguaacuc ugcagcggaa 540

ccgacuacuu uggguguccg uguuuccuuu uauucuuaua cuggcugcuu auggugacaa 600

ucgaggaauu guuaccauau agcuauugga uuggccaucc ggugucuaac agagcgauua 660

uauaccucuu uguuggauuu au 682

<210> 16

<211> 742

<212> RNA

<213> Artificial Sequence

<220>

<223> IRES序列

<400> 16

uuaaaacagc cuguggguug aucccaccca cagggcccac ugggcgcuag cacucuggua 60

ucacgguacc uuugugcgcc uguuuuauac uuccuccccc aacugcaacu uagaaguaac 120

acaaaccgau caacagucag cguggcacac cagccacguu uugaucaaac acuucuguua 180

ccccggacug aguaucaaua gacugcucac gcgguugaag gagaaaacgu ucguuauccg 240

gccaacuacu ucgagaaacc uaguaacgcc auggaaguug uggaguguuu cgcucagcac 300

uaccccagug uagaucaggu ugaugaguca ccgcauuccc cacgggugac cguggcggug 360

gcugcguugg cggccugccc auggggaaac ccaugggacg cucuuauaca gacauggugc 420

gaagagucua uugagcuagu ugguaguccu ccggccccug aaugcggcua aucccaacug 480

cggagcauac acucucaagc cagaggguag ugugucguaa ugggcaacuc ugcagcggaa 540

ccgacuacuu uggguguccg uguuucauuu uauuccuaua cuggcugcuu auggugacaa 600

uugagagauu guuaccauau agcuauugga uuggccaucc ggugacuaac agagcuauua 660

uauaucuuuu uguuggguuu auaccacuua gcuugaaaga gguuaaaacu cuacauuaca 720

uuuuaauacu gaacaccgca aa 742

<210> 17

<211> 737

<212> RNA

<213> Artificial Sequence

<220>

<223> IRES序列

<400> 17

uuaaaacagc cuguggguug aucccaccca cagggcccau ugggcgcuag cacucuggua 60

ucacgguacc cuugugcgcc uguuuuaugu cccuucccuc aacuguaacu uagaaguaac 120

gcacaccgau caacagucag cguggcacac cagccauguu uugaucaagc acuucuguua 180

ccccggaccg aguaucaaca gacugcucac gcgguugaag gagaaagugu ucguuauccg 240

gccaacuacu ucgaaaaacc uaguaacacc auggaaguug cagaguguuu cgcucagcac 300

uaccccagug uagaucaggu cgaugaguca ccgcaucccc cacgggcgac cguggcggug 360

gcugcguugg cggccugccu augggggaac ccauaggacg cucuaauaca gacauggugc 420

gaagagucca uugagcuagu ugguaguccu ccggccccug aaugcggcua auccuaacug 480

cggagcacac accuucaagc cagagggcag ugugucguaa cgggcaacuc ugcagcggaa 540

ccgacuacuu uggguguccg uguuucauuu uauucuuaua cuggcugcuu auggugacaa 600

uugagagauu guuaccauau agcuauugga uuggccaucc agugacuagc agagcuauua 660

uauaccucuu uguuggguuu auaccaccua auuugaaaga aguuaaaaca uuagaauuca 720

uuauuaaauu gaauaca 737

<210> 18

<211> 683

<212> RNA

<213> Artificial Sequence

<220>

<223> IRES序列

<400> 18

uuaaaacagc cuguggguug cacccaccca cagggcccac agggcgcuag cacucuggua 60

ucacgguacc uuugugcgcc uguuuuauua ccccuucccc aauugaaaau uagaagcaau 120

gcacaccgau caacagcagg cguggcgcac cagucacguc ucgaucaagc acuucuguuu 180

ccccggaccg aguaucaaua gacugcucac gcgguugaag gagaaagugu ucguuauccg 240

gcuaaccacu ucgagaaacc caguaacacc augaaaguug caggguguuu cgcucagcac 300

uuccccagug uagaucaggu cgaugaguca ccgcguuccc cacgggcgac cguggcggug 360

gcugcguugg cggccugccu auggguuaac ccauaggacg cucuaauaca gacauggugc 420

gaagaguuua uugagcuggu uaguaucucc uccggccccu gaaugcggcu aauccuaacu 480

gcggagcaca cacccucaag ccagagggca gugugucgua acgggcaacu cugcagcgga 540

accgacuacu uugggugucc guguuuccuu uuauucuuau acuggcugcu uauggugaca 600

aucgaggaau uguuaccaua uagcuauugg auuggccauc cggugucuaa cagagcgauu 660

auauaccucu uuguuggauu uau 683

<210> 19

<211> 742

<212> RNA

<213> Artificial Sequence

<220>

<223> IRES序列

<400> 19

uuaaaacagc cuguggguug aucccaccca cagggcccac ugggcgcuag cacucuggua 60

ucacgguacc uuugugcgcc uguuuuauac uuccuccccc aacugcaacu uagaaguaac 120

acaaaccgau caacagucag cguggcacac cagccacguu uugaucaaac acuucuguua 180

ccccggacug aguaucaaua gacugcucac gcgguugaag gagaaaacgu ucguuauccg 240

gccaacuacu ucgagaaacc uaguaacgcc auggaaguug uggaguguuu cgcucagcac 300

uaccccagug uagaucaggu ugaugaguca ccgcauuccc cacgggugac cguggcggug 360

gcugcguugg cggccugccc auggggaaac ccaugggacg cucuuauaca gacauggugc 420

gaagagucua uugagcuagu ugguaguccu ccggccccug aaugcggcua auccuaacug 480

cggagcacac acccucaagc cagagggcag ugugucguaa cgggcaacuc ugcagcggaa 540

ccgacuacuu uggguguccg uguuucauuu uauuccuaua cuggcugcuu auggugacaa 600

uugagagauu guuaccauau agcuauugga uuggccaucc ggugacuaac agagcuauua 660

uauaucuuuu uguuggguuu auaccacuua gcuugaaaga gguuaaaacu cuacauuaca 720

uuuuaauacu gaacaccgca aa 742

<210> 20

<211> 737

<212> RNA

<213> Artificial Sequence

<220>

<223> IRES序列

<400> 20

uuaaaacagc cuguggguug aucccaccca cagggcccau ugggcgcuag cacucuggua 60

ucacgguacc cuugugcgcc uguuuuaugu cccuucccuc aacuguaacu uagaaguaac 120

gcacaccgau caacagucag cguggcacac cagccauguu uugaucaagc acuucuguua 180

ccccggaccg aguaucaaca gacugcucac gcgguugaag gagaaagugu ucguuauccg 240

gccaacuacu ucgaaaaacc uaguaacacc auggaaguug cagaguguuu cgcucagcac 300

uaccccagug uagaucaggu cgaugaguca ccgcaucccc cacgggcgac cguggcggug 360

gcugcguugg cggccugccu augggggaac ccauaggacg cucuaauaca gacauggugc 420

gaagagucca uugagcuagu ugguaguccu ccggccccug aaugcggcua auccuaacug 480

cggagcacac acccucaagc cagagggcag ugugucguaa cgggcaacuc ugcagcggaa 540

ccgacuacuu uggguguccg uguuucauuu uauucuuaua cuggcugcuu auggugacaa 600

uugagagauu guuaccauau agcuauugga uuggccaucc agugacuagc agagcuauua 660

uauaccucuu uguuggguuu auaccaccua auuugaaaga aguuaaaaca uuagaauuca 720

uuauuaaauu gaauaca 737

<210> 21

<211> 16

<212> RNA

<213> Artificial Sequence

<220>

<223> 第一外显子序列

<400> 21

agacgcuacg gacuua 16

<210> 22

<211> 51

<212> RNA

<213> Artificial Sequence

<220>

<223> 第二外显子序列

<400> 22

aaaauccguu gaccuuaaac ggucgugugg guucaagucc cuccaccccc a 51

<210> 23

<211> 50

<212> RNA

<213> Artificial Sequence

<220>

<223> 5'间隔区序列

<400> 23

aaaaaacaaa aacaaaaaaa acaaaaaaac aaaaaaaaaa ccaaaacaca 50

<210> 24

<211> 50

<212> RNA

<213> Artificial Sequence

<220>

<223> 5'间隔区序列

<400> 24

aaaaacaaaa aacaaaaaaa aaaccaaaaa aacaaaaaaa acaaaacaca 50

<210> 25

<211> 25

<212> RNA

<213> Artificial Sequence

<220>

<223> 3'间隔区序列

<400> 25

aaaaaaacaa aaaaacaaaa caaac 25

<210> 26

<211> 22

<212> RNA

<213> Artificial Sequence

<220>

<223> 3'间隔区序列

<400> 26

aaaaacaaaa aacaaaacaa ac 22

<210> 27

<211> 114

<212> DNA

<213> Artificial Sequence

<220>

<223> 5'内含子序列

<400> 27

aataattgag ccttaaagaa gaaattcttt aagtggatgc tctcaaactc agggaaacct 60

aaatctagtt atagacaagg caatcctgag ccaagccgaa gtagtaatta gtaa 114

<210> 28

<211> 131

<212> DNA

<213> Artificial Sequence

<220>

<223> 3'内含子序列

<400> 28

aacaatagat gacttacaac taatcggaag gtgcagagac tcgacgggag ctaccctaac 60

gtcaagacga gggtaaagag agagtccaat tctcaaagcc aataggcagt agcgaaagct 120

gcaagagaat g 131

<210> 29

<211> 21

<212> DNA

<213> Artificial Sequence

<220>

<223> 5'同源臂序列

<400> 29

accgtcagtt gctcactgtg c 21

<210> 30

<211> 21

<212> DNA

<213> Artificial Sequence

<220>

<223> 5'同源臂序列

<400> 30

accgtgctat gtccacgtgt c 21

<210> 31

<211> 21

<212> DNA

<213> Artificial Sequence

<220>

<223> 3'同源臂序列

<400> 31

gcacagtgag caactgacgg a 21

<210> 32

<211> 21

<212> DNA

<213> Artificial Sequence

<220>

<223> 3'同源臂序列

<400> 32

gacacgtgga catagcacgg a 21

<210> 33

<211> 170

<212> PRT

<213> Artificial Sequence

<220>

<223> 第一多肽序列

<400> 33

Met Asp Leu Gly Lys Lys Leu Leu Glu Ala Ala Arg Ala Gly Gln Asp

1 5 10 15

Asp Glu Val Arg Ile Leu Met Ala Asn Gly Ala Asp Val Asn Ala Ser

20 25 30

Asp Arg Gly Gly Gly Thr Pro Leu His Leu Ala Ala Ala Gly Gly His

35 40 45

Leu Glu Ile Val Glu Val Leu Leu Lys Arg Gly Ala Asp Val Ser Ala

50 55 60

Ala Asp Leu His Gly Gln Ser Pro Leu His Leu Ala Ala Met Val Gly

65 70 75 80

His Leu Glu Ile Val Glu Val Leu Leu Lys Tyr Gly Ala Asp Val Asn

85 90 95

Ala Lys Asp Thr Met Gly Ala Thr Pro Leu His Leu Ala Ala Arg Ser

100 105 110

Gly His Leu Glu Ile Val Glu Glu Leu Leu Lys Asn Gly Ala Asp Met

115 120 125

Asn Ala Gln Asp Lys Phe Gly Lys Thr Thr Phe Asp Ile Ser Thr Asp

130 135 140

Asn Gly Asn Glu Asp Leu Ala Glu Ile Leu Gln Lys Leu Val Asp Gly

145 150 155 160

Gly Ser Asp Tyr Lys Asp Asp Asp Asp Lys

165 170

<210> 34

<211> 387

<212> PRT

<213> Artificial Sequence

<220>

<223> 重组多肽序列

<400> 34

Met Gly Gly Leu Asp Tyr Lys Asp Asp Asp Asp Lys Ala Ser Ser Asp

1 5 10 15

Leu Gly Lys Lys Leu Leu Glu Ala Ala Arg Ala Gly Gln Asp Asp Glu

20 25 30

Val Arg Ile Leu Met Ala Asn Gly Ala Asp Val Asn Ala Leu Asp Arg

35 40 45

Phe Gly Leu Thr Pro Leu His Leu Ala Ala Gln Arg Gly His Leu Glu

50 55 60

Ile Val Glu Val Leu Leu Lys Cys Gly Ala Asp Val Asn Ala Ala Asp

65 70 75 80

Leu Trp Gly Gln Thr Pro Leu His Leu Ala Ala Thr Ala Gly His Leu

85 90 95

Glu Ile Val Glu Val Leu Leu Lys Tyr Gly Ala Asp Val Asn Ala Leu

100 105 110

Asp Leu Ile Gly Lys Thr Pro Leu His Leu Thr Ala Ile Asp Gly His

115 120 125

Leu Glu Ile Val Glu Val Leu Leu Lys His Gly Ala Asp Val Asn Ala

130 135 140

Gln Asp Lys Phe Gly Lys Thr Ala Phe Asp Ile Ser Ile Asp Asn Gly

145 150 155 160

Asn Glu Asp Leu Ala Glu Ile Leu Gln Lys Leu Asn Gly Ser Gly Ser

165 170 175

Gly Ser Gly Ser Val Asn Ile Ser Gly Gln Asn Thr Met Asn Met Val

180 185 190

Lys Val Pro Glu Cys Arg Leu Ala Asp Glu Leu Gly Gly Leu Trp Glu

195 200 205

Asn Ser Arg Phe Thr Asp Cys Cys Leu Cys Val Ala Gly Gln Glu Phe

210 215 220

Gln Ala His Lys Ala Ile Leu Ala Ala Arg Ser Pro Val Phe Ser Ala

225 230 235 240

Met Phe Glu His Glu Met Glu Glu Ser Lys Lys Asn Arg Val Glu Ile

245 250 255

Asn Asp Val Glu Pro Glu Val Phe Lys Glu Met Met Cys Phe Ile Tyr

260 265 270

Thr Gly Lys Ala Pro Asn Leu Asp Lys Met Ala Asp Asp Leu Leu Ala

275 280 285

Ala Ala Asp Lys Tyr Ala Leu Glu Arg Leu Lys Val Met Cys Glu Asp

290 295 300

Ala Leu Cys Ser Asn Leu Ser Val Glu Asn Ala Ala Glu Ile Leu Ile

305 310 315 320

Leu Ala Asp Leu His Ser Ala Asp Gln Leu Lys Thr Gln Ala Val Asp

325 330 335

Phe Ile Asn Tyr His Ala Ser Asp Val Leu Glu Thr Ser Gly Trp Lys

340 345 350

Ser Met Val Val Ser His Pro His Leu Val Ala Glu Ala Tyr Arg Ser

355 360 365

Leu Ala Ser Ala Gln Cys Pro Phe Leu Gly Pro Pro Arg Lys Arg Leu

370 375 380

Lys Gln Ser

385

<210> 35

<211> 242

<212> PRT

<213> Artificial Sequence

<220>

<223> 重组多肽序列

<400> 35

Met Asp Tyr Lys Asp Asp Asp Asp Lys Ala Ser Ser Ala Val Leu Gln

1 5 10 15

Lys Lys Ile Thr Asp Tyr Phe His Pro Lys Lys Gly Ser Gly Ser Gly

20 25 30

Ser Gly Ser Val Asn Ile Ser Gly Gln Asn Thr Met Asn Met Val Lys

35 40 45

Val Pro Glu Cys Arg Leu Ala Asp Glu Leu Gly Gly Leu Trp Glu Asn

50 55 60

Ser Arg Phe Thr Asp Cys Cys Leu Cys Val Ala Gly Gln Glu Phe Gln

65 70 75 80

Ala His Lys Ala Ile Leu Ala Ala Arg Ser Pro Val Phe Ser Ala Met

85 90 95

Phe Glu His Glu Met Glu Glu Ser Lys Lys Asn Arg Val Glu Ile Asn

100 105 110

Asp Val Glu Pro Glu Val Phe Lys Glu Met Met Cys Phe Ile Tyr Thr

115 120 125

Gly Lys Ala Pro Asn Leu Asp Lys Met Ala Asp Asp Leu Leu Ala Ala

130 135 140

Ala Asp Lys Tyr Ala Leu Glu Arg Leu Lys Val Met Cys Glu Asp Ala

145 150 155 160

Leu Cys Ser Asn Leu Ser Val Glu Asn Ala Ala Glu Ile Leu Ile Leu

165 170 175

Ala Asp Leu His Ser Ala Asp Gln Leu Lys Thr Gln Ala Val Asp Phe

180 185 190

Ile Asn Tyr His Ala Ser Asp Val Leu Glu Thr Ser Gly Trp Lys Ser

195 200 205

Met Val Val Ser His Pro His Leu Val Ala Glu Ala Tyr Arg Ser Leu

210 215 220

Ala Ser Ala Gln Cys Pro Phe Leu Gly Pro Pro Arg Lys Arg Leu Lys

225 230 235 240

Gln Ser

<210> 36

<211> 441

<212> PRT

<213> Artificial Sequence

<220>

<223> 重组多肽序列

<400> 36

Met Gly Gly Leu Asp Tyr Lys Asp Asp Asp Asp Lys Ala Ser Asp Pro

1 5 10 15

Ala Glu Ala Val Leu Gln Glu Lys Ala Leu Lys Phe Met Asn Ser Ser

20 25 30

Glu Arg Glu Asp Cys Asn Asn Gly Glu Pro Pro Arg Lys Ile Ile Pro

35 40 45

Glu Lys Asn Ser Leu Arg Gln Thr Tyr Asn Ser Cys Ala Arg Leu Cys

50 55 60

Leu Asn Gln Glu Thr Val Cys Leu Ala Ser Thr Ala Met Lys Thr Glu

65 70 75 80

Asn Cys Val Ala Lys Thr Lys Leu Ala Asn Gly Thr Ser Ser Met Ile

85 90 95

Val Pro Lys Gln Arg Lys Leu Ser Ala Ser Tyr Glu Lys Glu Lys Glu

100 105 110

Leu Cys Val Lys Tyr Phe Glu Gln Trp Ser Glu Ser Asp Gln Val Glu

115 120 125

Phe Val Glu His Leu Ile Ser Gln Met Cys His Tyr Gln His Gly His

130 135 140

Ile Asn Ser Tyr Leu Lys Pro Met Leu Gln Arg Asp Phe Ile Thr Ala

145 150 155 160

Leu Pro Ala Arg Gly Leu Asp His Ile Ala Glu Asn Ile Leu Ser Tyr

165 170 175

Leu Asp Ala Lys Ser Leu Cys Ala Ala Glu Leu Val Cys Lys Glu Trp

180 185 190

Tyr Arg Val Thr Ser Asp Gly Met Leu Trp Lys Lys Leu Ile Glu Arg

195 200 205

Met Val Arg Thr Asp Ser Leu Trp Arg Gly Leu Ala Glu Arg Arg Gly

210 215 220

Trp Gly Gln Tyr Leu Phe Lys Asn Lys Pro Pro Asp Gly Asn Ala Pro

225 230 235 240

Pro Asn Ser Phe Tyr Arg Ala Leu Tyr Pro Lys Ile Ile Gln Asp Ile

245 250 255

Glu Thr Ile Glu Ser Asn Trp Arg Cys Gly Arg His Ser Leu Gln Arg

260 265 270

Ile His Cys Arg Ser Gly Ser Gly Ser Gly Ser Gly Met Asp Leu Gly

275 280 285

Lys Lys Leu Leu Glu Ala Ala Arg Ala Gly Gln Asp Asp Glu Val Arg

290 295 300

Ile Leu Met Ala Asn Gly Ala Asp Val Asn Ala Ser Asp Arg Gly Gly

305 310 315 320

Gly Thr Pro Leu His Leu Ala Ala Ala Gly Gly His Leu Glu Ile Val

325 330 335

Glu Val Leu Leu Lys Arg Gly Ala Asp Val Ser Ala Ala Asp Leu His

340 345 350

Gly Gln Ser Pro Leu His Leu Ala Ala Met Val Gly His Leu Glu Ile

355 360 365

Val Glu Val Leu Leu Lys Tyr Gly Ala Asp Val Asn Ala Lys Asp Thr

370 375 380

Met Gly Ala Thr Pro Leu His Leu Ala Ala Arg Ser Gly His Leu Glu

385 390 395 400

Ile Val Glu Glu Leu Leu Lys Asn Gly Ala Asp Met Asn Ala Gln Asp

405 410 415

Lys Phe Gly Lys Thr Thr Phe Asp Ile Ser Thr Asp Asn Gly Asn Glu

420 425 430

Asp Leu Ala Glu Ile Leu Gln Lys Leu

435 440

<210> 37

<211> 471

<212> PRT

<213> Artificial Sequence

<220>

<223> 重组多肽序列

<400> 37

Met Gly Gly Leu Asp Tyr Lys Asp Asp Asp Asp Lys Ala Ser Cys Val

1 5 10 15

Pro Arg Ser Gly Leu Ile Leu Ser Cys Ile Cys Leu Tyr Cys Gly Val

20 25 30

Leu Leu Pro Val Leu Leu Pro Asn Leu Pro Phe Leu Thr Cys Leu Ser

35 40 45

Met Ser Thr Leu Glu Ser Val Thr Tyr Leu Pro Glu Lys Gly Leu Tyr

50 55 60

Cys Gln Arg Leu Pro Ser Ser Arg Thr His Gly Gly Thr Glu Ser Leu

65 70 75 80

Lys Gly Lys Asn Thr Glu Asn Met Gly Phe Tyr Gly Thr Leu Lys Met

85 90 95

Ile Phe Tyr Lys Met Lys Arg Lys Leu Asp His Gly Ser Glu Val Arg

100 105 110

Ser Phe Ser Leu Gly Lys Lys Pro Cys Lys Val Ser Glu Tyr Thr Ser

115 120 125

Thr Thr Gly Leu Val Pro Cys Ser Ala Thr Pro Thr Thr Phe Gly Asp

130 135 140

Leu Arg Ala Ala Asn Gly Gln Gly Gln Gln Arg Arg Arg Ile Thr Ser

145 150 155 160

Val Gln Pro Pro Thr Gly Leu Gln Glu Trp Leu Lys Met Phe Gln Ser

165 170 175

Trp Ser Gly Pro Glu Lys Leu Leu Ala Leu Asp Glu Leu Ile Asp Ser

180 185 190

Cys Glu Pro Thr Gln Val Lys His Met Met Gln Val Ile Glu Pro Gln

195 200 205

Phe Gln Arg Asp Phe Ile Ser Leu Leu Pro Lys Glu Leu Ala Leu Tyr

210 215 220

Val Leu Ser Phe Leu Glu Pro Lys Asp Leu Leu Gln Ala Ala Gln Thr

225 230 235 240

Cys Arg Tyr Trp Arg Ile Leu Ala Glu Asp Asn Leu Leu Trp Arg Glu

245 250 255

Lys Cys Lys Glu Glu Gly Ile Asp Glu Pro Leu His Ile Lys Arg Arg

260 265 270

Lys Val Ile Lys Pro Gly Phe Ile His Ser Pro Trp Lys Ser Ala Tyr

275 280 285

Ile Arg Gln His Arg Ile Asp Thr Asn Trp Arg Arg Gly Glu Leu Lys

290 295 300

Ser Pro Ser Gly Ser Gly Ser Gly Ser Gly Met Asp Leu Gly Lys Lys

305 310 315 320

Leu Leu Glu Ala Ala Arg Ala Gly Gln Asp Asp Glu Val Arg Ile Leu

325 330 335

Met Ala Asn Gly Ala Asp Val Asn Ala Ser Asp Arg Gly Gly Gly Thr

340 345 350

Pro Leu His Leu Ala Ala Ala Gly Gly His Leu Glu Ile Val Glu Val

355 360 365

Leu Leu Lys Arg Gly Ala Asp Val Ser Ala Ala Asp Leu His Gly Gln

370 375 380

Ser Pro Leu His Leu Ala Ala Met Val Gly His Leu Glu Ile Val Glu

385 390 395 400

Val Leu Leu Lys Tyr Gly Ala Asp Val Asn Ala Lys Asp Thr Met Gly

405 410 415

Ala Thr Pro Leu His Leu Ala Ala Arg Ser Gly His Leu Glu Ile Val

420 425 430

Glu Glu Leu Leu Lys Asn Gly Ala Asp Met Asn Ala Gln Asp Lys Phe

435 440 445

Gly Lys Thr Thr Phe Asp Ile Ser Thr Asp Asn Gly Asn Glu Asp Leu

450 455 460

Ala Glu Ile Leu Gln Lys Leu

465 470

<210> 38

<211> 325

<212> PRT

<213> Artificial Sequence

<220>

<223> 重组多肽序列

<400> 38

Met Gly Gly Leu Asp Tyr Lys Asp Asp Asp Asp Lys Ala Ser His Arg

1 5 10 15

Lys His Leu Gln Glu Ile Pro Asp Leu Ser Ser Asn Val Ala Thr Ser

20 25 30

Phe Thr Trp Gly Trp Asp Ser Ser Lys Thr Ser Glu Leu Leu Ser Gly

35 40 45

Met Gly Val Ser Ala Leu Glu Lys Glu Glu Pro Asp Ser Glu Asn Ile

50 55 60

Pro Gln Glu Leu Leu Ser Asn Leu Gly His Pro Glu Ser Pro Pro Arg

65 70 75 80

Lys Arg Leu Lys Ser Lys Gly Ser Asp Lys Asp Phe Val Ile Val Arg

85 90 95

Arg Pro Lys Leu Asn Arg Glu Asn Phe Pro Gly Val Ser Trp Asp Ser

100 105 110

Leu Pro Asp Glu Leu Leu Leu Gly Ile Phe Ser Cys Leu Cys Leu Pro

115 120 125

Glu Leu Leu Lys Val Ser Gly Val Cys Lys Arg Trp Tyr Arg Leu Ala

130 135 140

Ser Asp Glu Ser Leu Trp Gln Thr Leu Asp Leu Thr Gly Lys Asn Leu

145 150 155 160

Ser Gly Ser Gly Ser Gly Ser Gly Met Asp Leu Gly Lys Lys Leu Leu

165 170 175

Glu Ala Ala Arg Ala Gly Gln Asp Asp Glu Val Arg Ile Leu Met Ala

180 185 190

Asn Gly Ala Asp Val Asn Ala Ser Asp Arg Gly Gly Gly Thr Pro Leu

195 200 205

His Leu Ala Ala Ala Gly Gly His Leu Glu Ile Val Glu Val Leu Leu

210 215 220

Lys Arg Gly Ala Asp Val Ser Ala Ala Asp Leu His Gly Gln Ser Pro

225 230 235 240

Leu His Leu Ala Ala Met Val Gly His Leu Glu Ile Val Glu Val Leu

245 250 255

Leu Lys Tyr Gly Ala Asp Val Asn Ala Lys Asp Thr Met Gly Ala Thr

260 265 270

Pro Leu His Leu Ala Ala Arg Ser Gly His Leu Glu Ile Val Glu Glu

275 280 285

Leu Leu Lys Asn Gly Ala Asp Met Asn Ala Gln Asp Lys Phe Gly Lys

290 295 300

Thr Thr Phe Asp Ile Ser Thr Asp Asn Gly Asn Glu Asp Leu Ala Glu

305 310 315 320

Ile Leu Gln Lys Leu

325

<210> 39

<211> 498

<212> PRT

<213> Artificial Sequence

<220>

<223> 重组多肽序列

<400> 39

Met Gly Gly Leu Asp Tyr Lys Asp Asp Asp Asp Lys Ala Ser Ala Gly

1 5 10 15

Glu Gly Asp Gln Gln Asp Ala Ala His Asn Met Gly Asn His Leu Pro

20 25 30

Leu Leu Pro Ala Glu Ser Glu Glu Glu Asp Glu Met Glu Val Glu Asp

35 40 45

Gln Asp Ser Lys Glu Ala Lys Lys Pro Asn Ile Ile Asn Phe Asp Thr

50 55 60

Ser Leu Pro Thr Ser His Thr Tyr Leu Gly Ala Asp Met Glu Glu Phe

65 70 75 80

His Gly Arg Thr Leu His Asp Asp Asp Ser Cys Gln Val Ile Pro Val

85 90 95

Leu Pro Gln Val Met Met Ile Leu Ile Pro Gly Gln Thr Leu Pro Leu

100 105 110

Gln Leu Phe His Pro Gln Glu Val Ser Met Val Arg Asn Leu Ile Gln

115 120 125

Lys Asp Arg Thr Phe Ala Val Leu Ala Tyr Ser Asn Val Gln Glu Arg

130 135 140

Glu Ala Gln Phe Gly Thr Thr Ala Glu Ile Tyr Ala Tyr Arg Glu Glu

145 150 155 160

Gln Asp Phe Gly Ile Glu Ile Val Lys Val Lys Ala Ile Gly Arg Gln

165 170 175

Arg Phe Lys Val Leu Glu Leu Arg Thr Gln Ser Asp Gly Ile Gln Gln

180 185 190

Ala Lys Val Gln Ile Leu Pro Glu Cys Val Leu Pro Ser Thr Met Ser

195 200 205

Ala Val Gln Leu Glu Ser Leu Asn Lys Cys Gln Ile Phe Pro Ser Lys

210 215 220

Pro Val Ser Arg Glu Asp Gln Cys Ser Tyr Lys Trp Trp Gln Lys Tyr

225 230 235 240

Gln Lys Arg Lys Phe His Cys Ala Asn Leu Thr Ser Trp Pro Arg Trp

245 250 255

Leu Tyr Ser Leu Tyr Asp Ala Glu Thr Leu Met Asp Arg Ile Lys Lys

260 265 270

Gln Leu Arg Glu Trp Asp Glu Asn Leu Lys Asp Asp Ser Leu Pro Ser

275 280 285

Asn Pro Ile Asp Phe Ser Tyr Arg Val Ala Ala Cys Leu Pro Ile Asp

290 295 300

Asp Val Leu Arg Ile Gln Leu Leu Lys Ile Gly Ser Ala Ile Gln Arg

305 310 315 320

Leu Arg Cys Glu Leu Asp Ile Met Asn Lys Cys Thr Ser Ser Gly Ser

325 330 335

Gly Ser Gly Ser Gly Met Asp Leu Gly Lys Lys Leu Leu Glu Ala Ala

340 345 350

Arg Ala Gly Gln Asp Asp Glu Val Arg Ile Leu Met Ala Asn Gly Ala

355 360 365

Asp Val Asn Ala Ser Asp Arg Gly Gly Gly Thr Pro Leu His Leu Ala

370 375 380

Ala Ala Gly Gly His Leu Glu Ile Val Glu Val Leu Leu Lys Arg Gly

385 390 395 400

Ala Asp Val Ser Ala Ala Asp Leu His Gly Gln Ser Pro Leu His Leu

405 410 415

Ala Ala Met Val Gly His Leu Glu Ile Val Glu Val Leu Leu Lys Tyr

420 425 430

Gly Ala Asp Val Asn Ala Lys Asp Thr Met Gly Ala Thr Pro Leu His

435 440 445

Leu Ala Ala Arg Ser Gly His Leu Glu Ile Val Glu Glu Leu Leu Lys

450 455 460

Asn Gly Ala Asp Met Asn Ala Gln Asp Lys Phe Gly Lys Thr Thr Phe

465 470 475 480

Asp Ile Ser Thr Asp Asn Gly Asn Glu Asp Leu Ala Glu Ile Leu Gln

485 490 495

Lys Leu

<210> 40

<211> 292

<212> PRT

<213> Artificial Sequence

<220>

<223> 重组多肽序列

<400> 40

Met Gly Gly Leu Asp Tyr Lys Asp Asp Asp Asp Lys Ala Ser Ala Pro

1 5 10 15

Lys Lys Arg Pro Glu Thr Gln Lys Thr Ser Glu Ile Val Leu Arg Pro

20 25 30

Arg Asn Lys Arg Ser Arg Ser Pro Leu Glu Leu Glu Pro Glu Ala Lys

35 40 45

Lys Leu Cys Ala Lys Gly Ser Gly Pro Ser Arg Arg Cys Asp Ser Asp

50 55 60

Cys Leu Trp Val Gly Leu Ala Gly Pro Gln Ile Leu Pro Pro Cys Arg

65 70 75 80

Ser Ile Val Arg Thr Leu His Gln His Lys Leu Gly Arg Ala Ser Trp

85 90 95

Pro Ser Val Gln Gln Gly Leu Gln Gln Ser Phe Leu His Thr Leu Asp

100 105 110

Ser Tyr Arg Ile Leu Gln Lys Ala Ala Pro Phe Asp Arg Arg Ala Ser

115 120 125

Gly Ser Gly Ser Gly Ser Gly Met Asp Leu Gly Lys Lys Leu Leu Glu

130 135 140

Ala Ala Arg Ala Gly Gln Asp Asp Glu Val Arg Ile Leu Met Ala Asn

145 150 155 160

Gly Ala Asp Val Asn Ala Ser Asp Arg Gly Gly Gly Thr Pro Leu His

165 170 175

Leu Ala Ala Ala Gly Gly His Leu Glu Ile Val Glu Val Leu Leu Lys

180 185 190

Arg Gly Ala Asp Val Ser Ala Ala Asp Leu His Gly Gln Ser Pro Leu

195 200 205

His Leu Ala Ala Met Val Gly His Leu Glu Ile Val Glu Val Leu Leu

210 215 220

Lys Tyr Gly Ala Asp Val Asn Ala Lys Asp Thr Met Gly Ala Thr Pro

225 230 235 240

Leu His Leu Ala Ala Arg Ser Gly His Leu Glu Ile Val Glu Glu Leu

245 250 255

Leu Lys Asn Gly Ala Asp Met Asn Ala Gln Asp Lys Phe Gly Lys Thr

260 265 270

Thr Phe Asp Ile Ser Thr Asp Asn Gly Asn Glu Asp Leu Ala Glu Ile

275 280 285

Leu Gln Lys Leu

290

<210> 41

<211> 223

<212> PRT

<213> Artificial Sequence

<220>

<223> 重组多肽序列

<400> 41

Met Asp Leu Gly Lys Lys Leu Leu Glu Ala Ala Arg Ala Gly Gln Asp

1 5 10 15

Asp Glu Val Arg Ile Leu Met Ala Asn Gly Ala Asp Val Asn Ala Ser

20 25 30

Asp Arg Gly Gly Gly Thr Pro Leu His Leu Ala Ala Ala Gly Gly His

35 40 45

Leu Glu Ile Val Glu Val Leu Leu Lys Arg Gly Ala Asp Val Ser Ala

50 55 60

Ala Asp Leu His Gly Gln Ser Pro Leu His Leu Ala Ala Met Val Gly

65 70 75 80

His Leu Glu Ile Val Glu Val Leu Leu Lys Tyr Gly Ala Asp Val Asn

85 90 95

Ala Lys Asp Thr Met Gly Ala Thr Pro Leu His Leu Ala Ala Arg Ser

100 105 110

Gly His Leu Glu Ile Val Glu Glu Leu Leu Lys Asn Gly Ala Asp Met

115 120 125

Asn Ala Gln Asp Lys Phe Gly Lys Thr Thr Phe Asp Ile Ser Thr Asp

130 135 140

Asn Gly Asn Glu Asp Leu Ala Glu Ile Leu Gln Lys Leu Ser Gly Ser

145 150 155 160

Gly Ser Gly Ser Gly Pro Arg Asn Gly Thr Val His Leu Tyr Leu Thr

165 170 175

Lys Pro Leu Tyr Thr Ser Ala Pro Ser Leu Gln His Leu Cys Arg Leu

180 185 190

Thr Ile Asn Lys Cys Thr Gly Ala Ile Trp Gly Leu Pro Leu Pro Thr

195 200 205

Arg Leu Lys Asp Tyr Leu Glu Glu Tyr Lys Phe Gln Val Gly Ser

210 215 220

<210> 42

<211> 237

<212> PRT

<213> Artificial Sequence

<220>

<223> 重组多肽序列

<400> 42

Met Asp Leu Gly Lys Lys Leu Leu Glu Ala Ala Arg Ala Gly Gln Asp

1 5 10 15

Asp Glu Val Arg Ile Leu Met Ala Asn Gly Ala Asp Val Asn Ala Ser

20 25 30

Asp Arg Gly Gly Gly Thr Pro Leu His Leu Ala Ala Ala Gly Gly His

35 40 45

Leu Glu Ile Val Glu Val Leu Leu Lys Arg Gly Ala Asp Val Ser Ala

50 55 60

Ala Asp Leu His Gly Gln Ser Pro Leu His Leu Ala Ala Met Val Gly

65 70 75 80

His Leu Glu Ile Val Glu Val Leu Leu Lys Tyr Gly Ala Asp Val Asn

85 90 95

Ala Lys Asp Thr Met Gly Ala Thr Pro Leu His Leu Ala Ala Arg Ser

100 105 110

Gly His Leu Glu Ile Val Glu Glu Leu Leu Lys Asn Gly Ala Asp Met

115 120 125

Asn Ala Gln Asp Lys Phe Gly Lys Thr Thr Phe Asp Ile Ser Thr Asp

130 135 140

Asn Gly Asn Glu Asp Leu Ala Glu Ile Leu Gln Lys Leu Ser Gly Ser

145 150 155 160

Gly Ser Gly Ser Gly Val Lys Trp Glu Ser Leu Gly Pro Glu Ser Arg

165 170 175

Gly Arg Arg Lys Val Asp Pro Glu Ala Leu Gln Val Phe Lys Glu Ala

180 185 190

Arg Ser Val Pro Arg Thr Leu Leu Cys Leu Cys Arg Val Ala Val Arg

195 200 205

Arg Ala Leu Gly Lys His Arg Leu His Leu Ile Pro Ser Leu Pro Leu

210 215 220

Pro Asp Pro Ile Lys Lys Phe Leu Leu His Glu Gly Ser

225 230 235

<210> 43

<211> 343

<212> PRT

<213> Artificial Sequence

<220>

<223> 重组多肽序列

<400> 43

Met Asp Leu Gly Lys Lys Leu Leu Glu Ala Ala Arg Ala Gly Gln Asp

1 5 10 15

Asp Glu Val Arg Ile Leu Met Ala Asn Gly Ala Asp Val Asn Ala Ser

20 25 30

Asp Arg Gly Gly Gly Thr Pro Leu His Leu Ala Ala Ala Gly Gly His

35 40 45

Leu Glu Ile Val Glu Val Leu Leu Lys Arg Gly Ala Asp Val Ser Ala

50 55 60

Ala Asp Leu His Gly Gln Ser Pro Leu His Leu Ala Ala Met Val Gly

65 70 75 80

His Leu Glu Ile Val Glu Val Leu Leu Lys Tyr Gly Ala Asp Val Asn

85 90 95

Ala Lys Asp Thr Met Gly Ala Thr Pro Leu His Leu Ala Ala Arg Ser

100 105 110

Gly His Leu Glu Ile Val Glu Glu Leu Leu Lys Asn Gly Ala Asp Met

115 120 125

Asn Ala Gln Asp Lys Phe Gly Lys Thr Thr Phe Asp Ile Ser Thr Asp

130 135 140

Asn Gly Asn Glu Asp Leu Ala Glu Ile Leu Gln Lys Leu Ser Gly Ser

145 150 155 160

Gly Ser Gly Ser Gly Arg Leu Asn Phe Gly Asp Asp Ile Pro Ser Ala

165 170 175

Leu Arg Ile Ala Lys Lys Lys Arg Trp Asn Ser Ile Glu Glu Arg Arg

180 185 190

Ile His Gln Glu Ser Glu Leu His Ser Tyr Leu Ser Arg Leu Ile Ala

195 200 205

Ala Glu Arg Glu Arg Glu Leu Glu Glu Cys Gln Arg Asn His Glu Gly

210 215 220

Asp Glu Asp Asp Ser His Val Arg Ala Gln Gln Ala Cys Ile Glu Ala

225 230 235 240

Lys His Asp Lys Tyr Met Ala Asp Met Asp Glu Leu Phe Ser Gln Val

245 250 255

Asp Glu Lys Arg Lys Lys Arg Asp Ile Pro Asp Tyr Leu Cys Gly Lys

260 265 270

Ile Ser Phe Glu Leu Met Arg Glu Pro Cys Ile Thr Pro Ser Gly Ile

275 280 285

Thr Tyr Asp Arg Lys Asp Ile Glu Glu His Leu Gln Arg Val Gly His

290 295 300

Phe Asp Pro Val Thr Arg Ser Pro Leu Thr Gln Glu Gln Leu Ile Pro

305 310 315 320

Asn Leu Ala Met Lys Glu Val Ile Asp Ala Phe Ile Ser Glu Asn Gly

325 330 335

Trp Val Glu Asp Tyr Gly Ser

340

<210> 44

<211> 372

<212> PRT

<213> Artificial Sequence

<220>

<223> 重组多肽序列

<400> 44

Met Asp Leu Gly Lys Lys Leu Leu Glu Ala Ala Arg Ala Gly Gln Asp

1 5 10 15

Asp Glu Val Arg Ile Leu Met Ala Asn Gly Ala Asp Val Asn Ala Ser

20 25 30

Asp Arg Gly Gly Gly Thr Pro Leu His Leu Ala Ala Ala Gly Gly His

35 40 45

Leu Glu Ile Val Glu Val Leu Leu Lys Arg Gly Ala Asp Val Ser Ala

50 55 60

Ala Asp Leu His Gly Gln Ser Pro Leu His Leu Ala Ala Met Val Gly

65 70 75 80

His Leu Glu Ile Val Glu Val Leu Leu Lys Tyr Gly Ala Asp Val Asn

85 90 95

Ala Lys Asp Thr Met Gly Ala Thr Pro Leu His Leu Ala Ala Arg Ser

100 105 110

Gly His Leu Glu Ile Val Glu Glu Leu Leu Lys Asn Gly Ala Asp Met

115 120 125

Asn Ala Gln Asp Lys Phe Gly Lys Thr Thr Phe Asp Ile Ser Thr Asp

130 135 140

Asn Gly Asn Glu Asp Leu Ala Glu Ile Leu Gln Lys Leu Gly Ser Gly

145 150 155 160

Ser Gly Ser Gly Ser Val Asn Ile Ser Gly Gln Asn Thr Met Asn Met

165 170 175

Val Lys Val Pro Glu Cys Arg Leu Ala Asp Glu Leu Gly Gly Leu Trp

180 185 190

Glu Asn Ser Arg Phe Thr Asp Cys Cys Leu Cys Val Ala Gly Gln Glu

195 200 205

Phe Gln Ala His Lys Ala Ile Leu Ala Ala Arg Ser Pro Val Phe Ser

210 215 220

Ala Met Phe Glu His Glu Met Glu Glu Ser Lys Lys Asn Arg Val Glu

225 230 235 240

Ile Asn Asp Val Glu Pro Glu Val Phe Lys Glu Met Met Cys Phe Ile

245 250 255

Tyr Thr Gly Lys Ala Pro Asn Leu Asp Lys Met Ala Asp Asp Leu Leu

260 265 270

Ala Ala Ala Asp Lys Tyr Ala Leu Glu Arg Leu Lys Val Met Cys Glu

275 280 285

Asp Ala Leu Cys Ser Asn Leu Ser Val Glu Asn Ala Ala Glu Ile Leu

290 295 300

Ile Leu Ala Asp Leu His Ser Ala Asp Gln Leu Lys Thr Gln Ala Val

305 310 315 320

Asp Phe Ile Asn Tyr His Ala Ser Asp Val Leu Glu Thr Ser Gly Trp

325 330 335

Lys Ser Met Val Val Ser His Pro His Leu Val Ala Glu Ala Tyr Arg

340 345 350

Ser Leu Ala Ser Ala Gln Cys Pro Phe Leu Gly Pro Pro Arg Lys Arg

355 360 365

Leu Lys Gln Ser

370

<210> 45

<211> 393

<212> PRT

<213> Artificial Sequence

<220>

<223> 重组多肽序列

<400> 45

Met Pro Arg Arg Ala Glu Asn Trp Asp Glu Ala Glu Val Gly Ala Glu

1 5 10 15

Glu Ala Gly Val Glu Glu Tyr Gly Pro Glu Glu Asp Gly Gly Glu Glu

20 25 30

Ser Gly Ala Glu Glu Ser Gly Pro Glu Glu Ser Gly Pro Glu Glu Leu

35 40 45

Gly Ala Glu Glu Glu Met Glu Ala Gly Arg Pro Arg Pro Val Leu Arg

50 55 60

Ser Val Asn Ser Arg Glu Pro Ser Gln Val Ile Phe Cys Asn Arg Ser

65 70 75 80

Pro Arg Val Val Leu Pro Val Trp Leu Asn Phe Asp Gly Glu Pro Gln

85 90 95

Pro Tyr Pro Thr Leu Pro Pro Gly Thr Gly Arg Arg Ile His Ser Tyr

100 105 110

Arg Gly His Leu Trp Leu Phe Arg Asp Ala Gly Thr His Asp Gly Leu

115 120 125

Leu Val Asn Gln Thr Glu Leu Phe Val Pro Ser Leu Asn Val Asp Gly

130 135 140

Gln Pro Ile Phe Ala Asn Ile Thr Leu Pro Val Tyr Thr Leu Lys Glu

145 150 155 160

Arg Cys Leu Gln Val Val Arg Ser Leu Val Lys Pro Glu Asn Tyr Arg

165 170 175

Arg Leu Asp Ile Val Arg Ser Leu Tyr Glu Asp Leu Glu Asp His Pro

180 185 190

Asn Val Gln Lys Asp Leu Glu Arg Leu Thr Gln Glu Arg Ile Ala His

195 200 205

Gln Arg Met Gly Asp Leu Glu Gly Gly Gly Gly Ser Ala Ala Ala Met

210 215 220

Asp Leu Gly Lys Lys Leu Leu Glu Ala Ala Arg Ala Gly Gln Asp Asp

225 230 235 240

Glu Val Arg Ile Leu Met Ala Asn Gly Ala Asp Val Asn Ala Ser Asp

245 250 255

Arg Trp Gly Trp Thr Pro Leu His Leu Ala Ala Trp Trp Gly His Leu

260 265 270

Glu Ile Val Glu Val Leu Leu Lys Arg Gly Ala Asp Val Ser Ala Ala

275 280 285

Asp Leu His Gly Gln Ser Pro Leu His Leu Ala Ala Met Val Gly His

290 295 300

Leu Glu Ile Val Glu Val Leu Leu Lys Tyr Gly Ala Asp Val Asn Ala

305 310 315 320

Lys Asp Thr Met Gly Ala Thr Pro Leu His Leu Ala Ala Arg Ser Gly

325 330 335

His Leu Glu Ile Val Glu Glu Leu Leu Lys Asn Gly Ala Asp Met Asn

340 345 350

Ala Gln Asp Lys Phe Gly Lys Thr Thr Phe Asp Ile Ser Thr Asp Asn

355 360 365

Gly Asn Glu Asp Leu Ala Glu Ile Leu Gln Lys Leu Val Asp Gly Gly

370 375 380

Ser Asp Tyr Lys Asp Asp Asp Asp Lys

385 390

<210> 46

<211> 2245

<212> RNA

<213> Artificial Sequence

<220>

<223> 环状RNA分子序列

<400> 46

aaaauccguu gaccuuaaac ggucgugugg guucaagucc cuccaccccc acgccggaaa 60

cgcaauagcc gaaaaaacaa aaacaaaaaa aacaaaaaaa caaaaaaaaa accaaaacac 120

auuaaaacag ccuguggguu gaucccaccc acagggccca cugggcgcua gcacucuggu 180

aucacgguac cuuugugcgc cuguuuuaua cuuccucccc caacugcaac uuagaaguaa 240

cacaaaccga ucaacaguca gcguggcaca ccagccacgu uuugaucaaa cacuucuguu 300

accccggacu gaguaucaau agacugcuca cgcgguugaa ggagaaaacg uucguuaucc 360

ggccaacuac uucgagaaac cuaguaacgc cauggaaguu guggaguguu ucgcucagca 420

cuaccccagu guagaucagg uugaugaguc accgcauucc ccacggguga ccguggcggu 480

ggcugcguug gcggccugcc cauggggaaa cccaugggac gcucuuauac agacauggug 540

cgaagagucu auugagcuag uugguagucc uccggccccu gaaugcggcu aaucccaacu 600

gcggagcaua cacucucaag ccagagggua gugugucgua augggcaacu cugcagcgga 660

accgacuacu uugggugucc guguuucauu uuauuccuau acuggcugcu uauggugaca 720

auugagagau uguuaccaua uagcuauugg auuggccauc cggugacuaa cagagcuauu 780

auauaucuuu uuguuggguu uauaccacuu agcuugaaag agguuaaaac ucuacauuac 840

auuuuaauac ugaacaccgc aaaaugggcg gccuggacua caaggaugac gacgacaagg 900

ccagcgaccc cgccgaggcc gugcugcagg agaaggcccu gaaguucaug aacagcagcg 960

agagggagga cugcaacaac ggcgagcccc cuaggaagau cauccccgag aagaacagcc 1020

ugaggcagac cuacaacagc ugcgccaggc ugugccugaa ccaggagacc gugugccugg 1080

ccagcaccgc caugaagacc gagaacugcg uggccaagac caagcuggcc aacggcacca 1140

gcagcaugau cgugcccaag cagaggaagc ugagcgccag cuacgagaaa gagaaggagc 1200

ugugcgugaa guacuucgag caguggagcg aguccgacca gguggaguuc guggagcacc 1260

ugaucagcca gaugugccac uaccagcacg gccacaucaa cagcuaccug aagcccaugc 1320

ugcagaggga cuucaucacc gcccugcccg ccaggggccu ggaccacauc gccgagaaca 1380

uccugagcua ccuggacgcc aagagccugu gcgccgccga gcuggugugc aaggaguggu 1440

acagggugac cagcgacggc augcugugga agaagcugau cgagaggaug gugaggaccg 1500

acagccugug gaggggccug gccgagagga ggggcugggg ccaguaccug uucaagaaca 1560

agcccccuga cggcaacgcc ccucccaaca gcuucuacag ggcccuguac cccaagauca 1620

uccaggacau cgagaccauc gagucuaacu ggaggugcgg caggcacagc cugcagagga 1680

uccacugcag gagcggcagc gggagcggca gcgggaugga ccugggcaag aagcugcugg 1740

aggccgccag ggccggccag gacgacgagg ugaggauccu gauggccaac ggcgccgaug 1800

ugaacgcuuc ugacagggga ggaggaaccc cuuuacaccu ggccgccgcc ggaggccacc 1860

uggagaucgu ggaggugcug uugaagaggg gagcugacgu gagcgcugcu gaccugcacg 1920

gccagagccc cuugcaccuu gcugccaugg ugggacaccu ggagaucgug gaagugcugu 1980

ugaaguacgg cgcugacgug aacgccaagg acaccauggg cgccaccccc uugcaccugg 2040

ccgccagguc uggacacuua gagaucgugg aggagcugcu gaagaacggc gccgacauga 2100

acgcccagga caaguucggc aagaccaccu ucgacaucag caccgacaac ggcaacgagg 2160

accuggccga gauccugcag aagcugugaa aaaaacaaaa aacaaaacgg cuauuaugcg 2220

uuaccggcga gacgcuacgg acuua 2245

<210> 47

<211> 2335

<212> RNA

<213> Artificial Sequence

<220>

<223> 环状RNA分子序列

<400> 47

aaaauccguu gaccuuaaac ggucgugugg guucaagucc cuccaccccc acgccggaaa 60

cgcaauagcc gaaaaaacaa aaacaaaaaa aacaaaaaaa caaaaaaaaa accaaaacac 120

auuaaaacag ccuguggguu gaucccaccc acagggccca cugggcgcua gcacucuggu 180

aucacgguac cuuugugcgc cuguuuuaua cuuccucccc caacugcaac uuagaaguaa 240

cacaaaccga ucaacaguca gcguggcaca ccagccacgu uuugaucaaa cacuucuguu 300

accccggacu gaguaucaau agacugcuca cgcgguugaa ggagaaaacg uucguuaucc 360

ggccaacuac uucgagaaac cuaguaacgc cauggaaguu guggaguguu ucgcucagca 420

cuaccccagu guagaucagg uugaugaguc accgcauucc ccacggguga ccguggcggu 480

ggcugcguug gcggccugcc cauggggaaa cccaugggac gcucuuauac agacauggug 540

cgaagagucu auugagcuag uugguagucc uccggccccu gaaugcggcu aaucccaacu 600

gcggagcaua cacucucaag ccagagggua gugugucgua augggcaacu cugcagcgga 660

accgacuacu uugggugucc guguuucauu uuauuccuau acuggcugcu uauggugaca 720

auugagagau uguuaccaua uagcuauugg auuggccauc cggugacuaa cagagcuauu 780

auauaucuuu uuguuggguu uauaccacuu agcuugaaag agguuaaaac ucuacauuac 840

auuuuaauac ugaacaccgc aaaaugggcg gccuggacua caaggacgac gaugacaagg 900

ccagcugcgu gcccaggagc ggccugaucc ugagcugcau cugccuguac ugcggcgugc 960

ugcugcccgu gcugcugccc aaccugcccu uccugaccug ccugagcaug uccacccugg 1020

agagcgugac cuaccugccc gagaagggcc uguacugcca gaggcugccc agcagcagga 1080

cccacggcgg caccgagagc cugaagggca agaacaccga gaacaugggc uucuacggca 1140

cccugaagau gaucuucuac aagaugaaga ggaagcugga ccacggcagc gaggugagga 1200

gcuucagccu gggcaagaag cccugcaagg ugagcgagua caccagcacc accggccugg 1260

ugcccugcag cgccaccccc accaccuucg gcgaccugag ggccgccaac ggccagggac 1320

agcagaggag gaggaucacc agcgugcagc cucccaccgg cuuacaggag uggcugaaga 1380

uguuccagag cuggagcggc cccgagaagc ugcuggcccu ggacgagcug aucgacagcu 1440

gcgagcccac acaggugaag cacaugaugc aggugaucga gccccaguuc cagagggacu 1500

ucaucagccu gcugcccaag gagcuggccc uguacgugcu gagcuuccug gagcccaagg 1560

accugcugca ggccgcccag accugcaggu acuggaggau ccuggccgag gacaaccugc 1620

uguggaggga gaagugcaag gaggagggca ucgacgagcc ccugcacauc aagaggagga 1680

aggugaucaa gcccggcuuc auccacagcc ccuggaagag cgccuacauc aggcagcaca 1740

ggaucgacac aaacuggagg aggggcgagc ugaagagccc cagcgggagc ggcagcggga 1800

gcggcaugga ccugggcaag aagcugcugg aggccgccag ggccggccag gacgacgagg 1860

ugaggauccu gauggccaac ggcgccgacg ugaacgccag cgacaggggc ggaggcaccc 1920

ccuugcacuu agcugcugcc ggaggccacc uugagaucgu ggaaguguug cugaagaggg 1980

gcgcugaugu gucugcugcu gacuugcacg gacagagccc ucugcaccug gcugccaugg 2040

uuggacaccu ggagaucgug gaggugcugc ugaaguacgg cgccgacgug aacgcuaagg 2100

acaccauggg cgccaccccc uugcaucugg ccgccagguc uggacaccug gagaucgucg 2160

aggagcugcu gaagaacggc gcugacauga acgcccagga caaguucggc aagaccaccu 2220

ucgacaucag caccgacaac ggcaacgagg accuggcuga gauccugcag aagcugugaa 2280

aaaaacaaaa aacaaaacgg cuauuaugcg uuaccggcga gacgcuacgg acuua 2335

<210> 48

<211> 1897

<212> RNA

<213> Artificial Sequence

<220>

<223> 环状RNA分子序列

<400> 48

aaaauccguu gaccuuaaac ggucgugugg guucaagucc cuccaccccc acgccggaaa 60

cgcaauagcc gaaaaaacaa aaacaaaaaa aacaaaaaaa caaaaaaaaa accaaaacac 120

auuaaaacag ccuguggguu gaucccaccc acagggccca cugggcgcua gcacucuggu 180

aucacgguac cuuugugcgc cuguuuuaua cuuccucccc caacugcaac uuagaaguaa 240

cacaaaccga ucaacaguca gcguggcaca ccagccacgu uuugaucaaa cacuucuguu 300

accccggacu gaguaucaau agacugcuca cgcgguugaa ggagaaaacg uucguuaucc 360

ggccaacuac uucgagaaac cuaguaacgc cauggaaguu guggaguguu ucgcucagca 420

cuaccccagu guagaucagg uugaugaguc accgcauucc ccacggguga ccguggcggu 480

ggcugcguug gcggccugcc cauggggaaa cccaugggac gcucuuauac agacauggug 540

cgaagagucu auugagcuag uugguagucc uccggccccu gaaugcggcu aaucccaacu 600

gcggagcaua cacucucaag ccagagggua gugugucgua augggcaacu cugcagcgga 660

accgacuacu uugggugucc guguuucauu uuauuccuau acuggcugcu uauggugaca 720

auugagagau uguuaccaua uagcuauugg auuggccauc cggugacuaa cagagcuauu 780

auauaucuuu uuguuggguu uauaccacuu agcuugaaag agguuaaaac ucuacauuac 840

auuuuaauac ugaacaccgc aaaaugggcg gccuggacua caaggacgac gaugacaagg 900

ccagccacag gaagcaccug caggagaucc ccgaccugag cagcaacgug gccaccagcu 960

ucaccugggg cugggacagc agcaagacca gcgagcugcu gagcggcaug ggcgugagcg 1020

cccuggagaa ggaggagccc gacagcgaga acauccccca ggagcugcug agcaaccugg 1080

gccaccccga gagcccuccc aggaagaggc ugaagagcaa gggcagcgac aaggacuucg 1140

ugaucgugcg gaggcccaag cugaacaggg agaacuuccc cggcgugagc ugggacagcc 1200

ugcccgacga gcugcugcug ggcaucuuca gcugccugug ccuccccgag cugcugaagg 1260

ugagcggcgu gugcaagagg ugguacaggc uggccagcga cgagagccug uggcagaccc 1320

uggaccugac cggcaagaac cuuucuggaa gcggcucugg aucuggcaug gaccugggca 1380

agaagcugcu ggaagcugcc agggcuggac aagacgacga ggugaggauc cugauggcca 1440

acggcgcuga cgugaacgcc agcgacaggg gcggaggaac cccuuugcac cuugcugccg 1500

cuggaggaca ccuggagauc guggaggugc ugcugaagag gggcgccgac gugagcgccg 1560

cugaccugca uggacagagc ccccugcacc uggccgccau ggugggacac cuugagaucg 1620

uggaggugcu guugaaguac ggcgcugacg ugaacgcuaa ggacaccaug ggcgccaccc 1680

ccuugcaccu ggccgcuagg agcggccacc uggagaucgu ggaggagcug cugaagaacg 1740

gcgccgacau gaacgcccag gacaaguucg gcaagaccac cuucgacauc agcaccgaca 1800

acggcaacga ggaccuggcc gagauccugc agaagcugug aaaaaaacaa aaaacaaaac 1860

ggcuauuaug cguuaccggc gagacgcuac ggacuua 1897

<210> 49

<211> 2416

<212> RNA

<213> Artificial Sequence

<220>

<223> 环状RNA分子序列

<400> 49

aaaauccguu gaccuuaaac ggucgugugg guucaagucc cuccaccccc acgccggaaa 60

cgcaauagcc gaaaaaacaa aaacaaaaaa aacaaaaaaa caaaaaaaaa accaaaacac 120

auuaaaacag ccuguggguu gaucccaccc acagggccca cugggcgcua gcacucuggu 180

aucacgguac cuuugugcgc cuguuuuaua cuuccucccc caacugcaac uuagaaguaa 240

cacaaaccga ucaacaguca gcguggcaca ccagccacgu uuugaucaaa cacuucuguu 300

accccggacu gaguaucaau agacugcuca cgcgguugaa ggagaaaacg uucguuaucc 360

ggccaacuac uucgagaaac cuaguaacgc cauggaaguu guggaguguu ucgcucagca 420

cuaccccagu guagaucagg uugaugaguc accgcauucc ccacggguga ccguggcggu 480

ggcugcguug gcggccugcc cauggggaaa cccaugggac gcucuuauac agacauggug 540

cgaagagucu auugagcuag uugguagucc uccggccccu gaaugcggcu aaucccaacu 600

gcggagcaua cacucucaag ccagagggua gugugucgua augggcaacu cugcagcgga 660

accgacuacu uugggugucc guguuucauu uuauuccuau acuggcugcu uauggugaca 720

auugagagau uguuaccaua uagcuauugg auuggccauc cggugacuaa cagagcuauu 780

auauaucuuu uuguuggguu uauaccacuu agcuugaaag agguuaaaac ucuacauuac 840

auuuuaauac ugaacaccgc aaaaugggcg gccuggacua caaggacgac gaugacaagg 900

ccagcgccgg cgagggcgac cagcaggacg ccgcccacaa caugggcaac caccugcccc 960

ugcugcccgc cgagagcgag gaggaggacg agauggaggu ggaagaccag gacagcaagg 1020

aggccaagaa gcccaacauc aucaacuucg acaccagccu gcccaccagc cacaccuacc 1080

ugggcgccga cauggaggag uuccacggca ggacccugca cgacgacgac agcugccagg 1140

ugauccccgu gcugccccag gugaugauga uccugauucc cggccagacc cugccccucc 1200

agcuguucca cccccaggag gugagcaugg ugaggaaccu gauccagaag gacaggaccu 1260

ucgccgugcu ggccuacagc aacgugcagg agagggaggc ccaguucggc accaccgccg 1320

agaucuacgc cuacagggag gagcaggacu ucggcaucga gaucgugaag gucaaggcca 1380

ucggcaggca gagguucaag gugcuggagc ugaggaccca gagcgacggc auccagcagg 1440

ccaaggugca gauccugccc gagugcgugc ugcccagcac caugagcgcc gugcagcugg 1500

agagccugaa caagugccag aucuucccca gcaagcccgu gagcagggag gaccagugca 1560

gcuacaagug guggcagaag uaccagaaga ggaaguucca cugcgccaac cugaccagcu 1620

ggcccaggug gcuguacagc cuguacgacg ccgagacccu gauggacagg aucaagaagc 1680

agcugaggga gugggacgag aaccugaagg acgacagccu gcccagcaac cccaucgacu 1740

ucagcuacag gguggccgcc ugccugccca ucgacgacgu gcugaggauc cagcugcuga 1800

agaucggcag cgccauccag aggcugaggu gcgagcugga caucaugaac aagugcacca 1860

gcagcggcuc cggcagcggc uccggcaugg accugggcaa gaagcugcug gaggccgcca 1920

gggccggcca ggacgacgag gugaggaucc ugauggccaa cggcgccgac gugaacgcca 1980

gcgacagggg cggcggcacc cccuugcacc uggcugcugc uggaggccac cuugagaucg 2040

uggaggugcu gcugaagagg ggcgcugacg uuucugcugc ugaccuucau ggacagucuc 2100

cucugcaccu ggcugcuaug gugggccacc uggagaucgu ggaggugcug uugaaguacg 2160

gcgccgacgu gaacgcuaag gacaccaugg gcgccacacc uuugcacuug gcugcuagga 2220

gcggccacuu ggagaucgug gaggaguugc ugaagaacgg cgccgacaug aacgcccagg 2280

acaaguucgg caagaccacc uucgacauca gcaccgacaa cggcaacgag gaccuggccg 2340

agauccugca gaagcuguga aaaaaacaaa aaacaaaacg gcuauuaugc guuaccggcg 2400

agacgcuacg gacuua 2416

<210> 50

<211> 1798

<212> RNA

<213> Artificial Sequence

<220>

<223> 环状RNA分子序列

<400> 50

aaaauccguu gaccuuaaac ggucgugugg guucaagucc cuccaccccc acgccggaaa 60

cgcaauagcc gaaaaaacaa aaacaaaaaa aacaaaaaaa caaaaaaaaa accaaaacac 120

auuaaaacag ccuguggguu gaucccaccc acagggccca cugggcgcua gcacucuggu 180

aucacgguac cuuugugcgc cuguuuuaua cuuccucccc caacugcaac uuagaaguaa 240

cacaaaccga ucaacaguca gcguggcaca ccagccacgu uuugaucaaa cacuucuguu 300

accccggacu gaguaucaau agacugcuca cgcgguugaa ggagaaaacg uucguuaucc 360

ggccaacuac uucgagaaac cuaguaacgc cauggaaguu guggaguguu ucgcucagca 420

cuaccccagu guagaucagg uugaugaguc accgcauucc ccacggguga ccguggcggu 480

ggcugcguug gcggccugcc cauggggaaa cccaugggac gcucuuauac agacauggug 540

cgaagagucu auugagcuag uugguagucc uccggccccu gaaugcggcu aaucccaacu 600

gcggagcaua cacucucaag ccagagggua gugugucgua augggcaacu cugcagcgga 660

accgacuacu uugggugucc guguuucauu uuauuccuau acuggcugcu uauggugaca 720

auugagagau uguuaccaua uagcuauugg auuggccauc cggugacuaa cagagcuauu 780

auauaucuuu uuguuggguu uauaccacuu agcuugaaag agguuaaaac ucuacauuac 840

auuuuaauac ugaacaccgc aaaaugggcg gccuggacua caaggacgac gaugacaagg 900

ccagcgcccc caagaagagg cccgagaccc agaagaccag cgagaucgug cugaggccca 960

ggaacaagag gagcaggucc cccuuggagc ucgagcccga ggccaagaag cugugcgcca 1020

agggcagcgg ccccagcagg aggugcgaca gcgacugccu gugggugggc cuggccggcc 1080

cccagauccu gcccccuugc aggagcaucg ugaggacccu gcaccagcac aagcugggca 1140

gggccagcug gcccagcgug cagcagggcc ugcagcagag cuuccugcac acccuggaca 1200

gcuacaggau ccugcagaag gccgcccccu ucgacaggag ggccagcggc uccgggagcg 1260

gcagcgggau ggaccugggc aagaagcugc uggaagcugc uagggcugga caggaugaug 1320

aaguuaggau uuuaauggcu aauggagcug auguuaaugc cucugacagg ggcggaggaa 1380

cacccuugca uuuagccgcu gccggcggcc acuuagagau cguggaggug cugcugaaga 1440

ggggcgcuga cgugagcgcu gcugacuugc acggacagag ccccuugcac cuggccgcca 1500

ugguuggaca ccuggagauc guggaggugc uguugaagua cggcgccgac gugaacgcca 1560

aggacaccau gggcgccacc cccuugcacc uggccgcccg gagcggccac cuggagaucg 1620

uggaggagcu gcugaagaac ggcgccgaca ugaacgccca ggacaaguuc ggcaagacca 1680

ccuucgacau cagcaccgac aacggcaacg aggaccuggc cgagauccug cagaagcugu 1740

gaaaaaaaca aaaaacaaaa cggcuauuau gcguuaccgg cgagacgcua cggacuua 1798

<210> 51

<211> 1591

<212> RNA

<213> Artificial Sequence

<220>

<223> 环状RNA分子序列

<400> 51

aaaauccguu gaccuuaaac ggucgugugg guucaagucc cuccaccccc acgccggaaa 60

cgcaauagcc gaaaaaacaa aaacaaaaaa aacaaaaaaa caaaaaaaaa accaaaacac 120

auuaaaacag ccuguggguu gaucccaccc acagggccca cugggcgcua gcacucuggu 180

aucacgguac cuuugugcgc cuguuuuaua cuuccucccc caacugcaac uuagaaguaa 240

cacaaaccga ucaacaguca gcguggcaca ccagccacgu uuugaucaaa cacuucuguu 300

accccggacu gaguaucaau agacugcuca cgcgguugaa ggagaaaacg uucguuaucc 360

ggccaacuac uucgagaaac cuaguaacgc cauggaaguu guggaguguu ucgcucagca 420

cuaccccagu guagaucagg uugaugaguc accgcauucc ccacggguga ccguggcggu 480

ggcugcguug gcggccugcc cauggggaaa cccaugggac gcucuuauac agacauggug 540

cgaagagucu auugagcuag uugguagucc uccggccccu gaaugcggcu aaucccaacu 600

gcggagcaua cacucucaag ccagagggua gugugucgua augggcaacu cugcagcgga 660

accgacuacu uugggugucc guguuucauu uuauuccuau acuggcugcu uauggugaca 720

auugagagau uguuaccaua uagcuauugg auuggccauc cggugacuaa cagagcuauu 780

auauaucuuu uuguuggguu uauaccacuu agcuugaaag agguuaaaac ucuacauuac 840

auuuuaauac ugaacaccgc aaaauggacc ugggcaagaa gcugcuggag gccgccaggg 900

ccggccagga cgacgaggug aggauccuga uggccaacgg cgccgacgug aacgccagcg 960

acaggggcgg cggcaccccc uugcaccugg ccgccgccgg cggccaccug gagaucgugg 1020

aggugcugcu gaagaggggc gccgacguga gcgccgccga ccugcacggc cagagccccc 1080

ugcaccuggc cgccauggug ggccaccugg aaaucgugga ggugcugcuc aaguacggcg 1140

ccgacgugaa cgcuaaggac accaugggcg ccacccccuu gcaccuggcu gccaggagcg 1200

gccaccugga gaucgucgag gagcugcuga agaacggcgc cgacaugaac gcccaggaca 1260

aguucggcaa gaccaccuuc gacaucagca cagauaaugg caaugaagau cuggcugaaa 1320

uuuuacaaaa auuaagcgga ucugggucug gcucuggacc uaggaacggc accguucacu 1380

uguaccugac caagccccug uacaccagcg cccccagccu gcagcaccug ugcaggcuga 1440

ccaucaacaa gugcaccggc gccaucuggg gccugccccu ccccaccagg cugaaggacu 1500

accuggagga guacaaguuc caggugggca gcugaaaaaa acaaaaaaca aaacggcuau 1560

uaugcguuac cggcgagacg cuacggacuu a 1591

<210> 52

<211> 1633

<212> RNA

<213> Artificial Sequence

<220>

<223> 环状RNA分子序列

<400> 52

aaaauccguu gaccuuaaac ggucgugugg guucaagucc cuccaccccc acgccggaaa 60

cgcaauagcc gaaaaaacaa aaacaaaaaa aacaaaaaaa caaaaaaaaa accaaaacac 120

auuaaaacag ccuguggguu gaucccaccc acagggccca cugggcgcua gcacucuggu 180

aucacgguac cuuugugcgc cuguuuuaua cuuccucccc caacugcaac uuagaaguaa 240

cacaaaccga ucaacaguca gcguggcaca ccagccacgu uuugaucaaa cacuucuguu 300

accccggacu gaguaucaau agacugcuca cgcgguugaa ggagaaaacg uucguuaucc 360

ggccaacuac uucgagaaac cuaguaacgc cauggaaguu guggaguguu ucgcucagca 420

cuaccccagu guagaucagg uugaugaguc accgcauucc ccacggguga ccguggcggu 480

ggcugcguug gcggccugcc cauggggaaa cccaugggac gcucuuauac agacauggug 540

cgaagagucu auugagcuag uugguagucc uccggccccu gaaugcggcu aaucccaacu 600

gcggagcaua cacucucaag ccagagggua gugugucgua augggcaacu cugcagcgga 660

accgacuacu uugggugucc guguuucauu uuauuccuau acuggcugcu uauggugaca 720

auugagagau uguuaccaua uagcuauugg auuggccauc cggugacuaa cagagcuauu 780

auauaucuuu uuguuggguu uauaccacuu agcuugaaag agguuaaaac ucuacauuac 840

auuuuaauac ugaacaccgc aaaauggacc ugggcaagaa gcugcuggag gccgccaggg 900

ccggccagga cgacgaggug aggauccuga uggccaacgg cgccgacgug aacgccagcg 960

acaggggcgg cggcaccccu cugcaccugg ccgccgccgg cggccaccug gagaucgugg 1020

aggugcugcu gaagaggggc gccgacguga gcgccgccga ccugcacggc cagagccccc 1080

ugcaccuggc cgccauggug ggccaccugg agaucgucga ggugcugcug aaguacggcg 1140

ccgacgugaa cgcuaaggac accaugggcg ccaccccucu gcaccuggcu gccaggagcg 1200

gccaccugga gaucguugag gagcugcuga agaacggcgc cgacaugaac gcccaggaca 1260

aguucggcaa gaccaccuuc gacaucagca ccgacaacgg caacgaggau uuagcugaaa 1320

uuuuacaaaa auuaagcggu agcggaucug gaaguggagu uaaaugggag agccuuggac 1380

cugagagcag gggcaggagg aagguggacc ccgaggcccu gcagguguuc aaggaggcca 1440

ggagcgugcc caggacccug cugugccucu gcaggguggc cgugaggagg gcccugggca 1500

agcacaggcu gcaccugauc cccagccugc cccuccccga ccccaucaag aaguuccugc 1560

ugcacgaggg cagcugaaaa aaacaaaaaa caaaacggcu auuaugcguu accggcgaga 1620

cgcuacggac uua 1633

<210> 53

<211> 1951

<212> RNA

<213> Artificial Sequence

<220>

<223> 环状RNA分子序列

<400> 53

aaaauccguu gaccuuaaac ggucgugugg guucaagucc cuccaccccc acgccggaaa 60

cgcaauagcc gaaaaaacaa aaacaaaaaa aacaaaaaaa caaaaaaaaa accaaaacac 120

auuaaaacag ccuguggguu gaucccaccc acagggccca cugggcgcua gcacucuggu 180

aucacgguac cuuugugcgc cuguuuuaua cuuccucccc caacugcaac uuagaaguaa 240

cacaaaccga ucaacaguca gcguggcaca ccagccacgu uuugaucaaa cacuucuguu 300

accccggacu gaguaucaau agacugcuca cgcgguugaa ggagaaaacg uucguuaucc 360

ggccaacuac uucgagaaac cuaguaacgc cauggaaguu guggaguguu ucgcucagca 420

cuaccccagu guagaucagg uugaugaguc accgcauucc ccacggguga ccguggcggu 480

ggcugcguug gcggccugcc cauggggaaa cccaugggac gcucuuauac agacauggug 540

cgaagagucu auugagcuag uugguagucc uccggccccu gaaugcggcu aaucccaacu 600

gcggagcaua cacucucaag ccagagggua gugugucgua augggcaacu cugcagcgga 660

accgacuacu uugggugucc guguuucauu uuauuccuau acuggcugcu uauggugaca 720

auugagagau uguuaccaua uagcuauugg auuggccauc cggugacuaa cagagcuauu 780

auauaucuuu uuguuggguu uauaccacuu agcuugaaag agguuaaaac ucuacauuac 840

auuuuaauac ugaacaccgc aaaauggacc ugggcaagaa gcugcuggag gccgccaggg 900

ccggccagga cgacgaggug aggauccuga uggccaacgg cgccgacgug aacgccagcg 960

acaggggcgg cggcaccccc uugcaccugg ccgccgccgg cggccaccug gagaucgugg 1020

aggugcugcu gaagaggggc gccgacguga gcgccgccga ccugcacggc cagagccccc 1080

ugcaccuggc cgccauggug ggccaccugg agaucgucga ggugcugcug aaguacggcg 1140

ccgacgugaa cgcuaaggac accaugggcg ccacccccuu gcaccuggcu gccaggagcg 1200

gccaccugga gaucguugag gagcugcuga agaacggcgc cgacaugaac gcccaggaca 1260

aguucggcaa gaccaccuuc gacaucagca cagacaaugg aaaugaggau uuagcugaaa 1320

uuuuacaaaa acugucuggc agcggcucug gaucugguag gcuuaacuuc ggcgacgaca 1380

ucccuagcgc ccugaggauc gccaagaaga agagguggaa cagcaucgag gagaggagga 1440

uccaccagga gagcgagcug cacagcuacc ugagcaggcu gaucgccgcc gagagagaga 1500

gggagcugga ggagugccag aggaaccacg agggcgacga ggacgacagc cacgugaggg 1560

cccagcaggc cugcaucgag gccaagcacg acaaguacau ggccgacaug gacgagcugu 1620

ucagccaggu ggacgagaag aggaagaaga gggacauccc cgacuaccug ugcggcaaga 1680

ucagcuucga gcugaugagg gagcccugca ucacccccag cggcaucacc uacgacagga 1740

aggacaucga ggagcaccug cagagggugg gccacuucga ccccgugacc aggagccccc 1800

ugacccagga gcagcugauc cccaaccugg ccaugaagga ggugaucgac gccuucauca 1860

gcgagaacgg cuggguggag gacuacggca gcugaaaaaa acaaaaaaca aaacggcuau 1920

uaugcguuac cggcgagacg cuacggacuu a 1951

<210> 54

<211> 2038

<212> RNA

<213> Artificial Sequence

<220>

<223> 环状RNA分子序列

<400> 54

aaaauccguu gaccuuaaac ggucgugugg guucaagucc cuccaccccc acgccggaaa 60

cgcaauagcc gaaaaaacaa aaacaaaaaa aacaaaaaaa caaaaaaaaa accaaaacac 120

auuaaaacag ccuguggguu gaucccaccc acagggccca cugggcgcua gcacucuggu 180

aucacgguac cuuugugcgc cuguuuuaua cuuccucccc caacugcaac uuagaaguaa 240

cacaaaccga ucaacaguca gcguggcaca ccagccacgu uuugaucaaa cacuucuguu 300

accccggacu gaguaucaau agacugcuca cgcgguugaa ggagaaaacg uucguuaucc 360

ggccaacuac uucgagaaac cuaguaacgc cauggaaguu guggaguguu ucgcucagca 420

cuaccccagu guagaucagg uugaugaguc accgcauucc ccacggguga ccguggcggu 480

ggcugcguug gcggccugcc cauggggaaa cccaugggac gcucuuauac agacauggug 540

cgaagagucu auugagcuag uugguagucc uccggccccu gaaugcggcu aaucccaacu 600

gcggagcaua cacucucaag ccagagggua gugugucgua augggcaacu cugcagcgga 660

accgacuacu uugggugucc guguuucauu uuauuccuau acuggcugcu uauggugaca 720

auugagagau uguuaccaua uagcuauugg auuggccauc cggugacuaa cagagcuauu 780

auauaucuuu uuguuggguu uauaccacuu agcuugaaag agguuaaaac ucuacauuac 840

auuuuaauac ugaacaccgc aaaauggacc ugggcaagaa gcugcuggag gccgccaggg 900

ccggccagga cgacgaggug aggauccuga uggccaacgg cgccgacgug aacgccagcg 960

acaggggcgg cggcaccccc uugcaccugg ccgccgccgg cggccaccug gagauugugg 1020

aggugcugcu gaagaggggc gccgacguga gcgccgccga ccugcacggc cagagccccc 1080

ugcaccuggc cgccauggug ggccaccugg agaucgugga ggugcugcug aaguacggcg 1140

ccgacgugaa cgcuaaggac accaugggcg ccacccccuu gcaccucgcc gccaggagcg 1200

gccaccugga gaucgucgag gagcugcuga agaacggcgc cgacaugaac gcccaggaca 1260

aguucggcaa gaccaccuuc gacaucagca ccgacaacgg caacgaggac uuagcugaaa 1320

uuuuacaaaa auuaggaucu ggaagcggau caggaucugu uaauaucagc ggccagaaca 1380

ccaugaacau ggugaaggug cccgagugca ggcuggccga cgagcugggc ggccuguggg 1440

agaacagcag guucaccgac ugcugccugu gcguggccgg ccaggaguuc caggcccaca 1500

aggccauccu ggccgccagg agccccgugu ucagcgccau guucgagcac gagauggagg 1560

agagcaagaa gaacagggug gagaucaacg acguggagcc cgagguguuc aaggagauga 1620

ugugcuucau cuacaccggc aaggccccca accuggacaa gauggccgac gaccugcugg 1680

ccgccgccga caaguacgcc cuggagaggc ugaaggugau gugcgaggac gcccugugca 1740

gcaaccugag cguggagaac gccgccgaga uccugauucu ggccgaccug cacagcgccg 1800

accagcugaa gacccaggcc guggacuuca ucaacuacca cgccagcgac gugcuggaga 1860

ccagcggcug gaagagcaug guggugagcc acccccaccu gguggccgag gccuacagga 1920

gccuggccag cgcccagugc cccuuccugg gcccuccuag gaagaggcug aagcagagcu 1980

gaaaaaaaca aaaaacaaaa cggcuauuau gcguuaccgg cgagacgcua cggacuua 2038

<210> 55

<211> 2101

<212> RNA

<213> Artificial Sequence

<220>

<223> 环状RNA分子序列

<400> 55

aaaauccguu gaccuuaaac ggucgugugg guucaagucc cuccaccccc acgccggaaa 60

cgcaauagcc gaaaaaacaa aaacaaaaaa aacaaaaaaa caaaaaaaaa accaaaacac 120

auuaaaacag ccuguggguu gaucccaccc acagggccca cugggcgcua gcacucuggu 180

aucacgguac cuuugugcgc cuguuuuaua cuuccucccc caacugcaac uuagaaguaa 240

cacaaaccga ucaacaguca gcguggcaca ccagccacgu uuugaucaaa cacuucuguu 300

accccggacu gaguaucaau agacugcuca cgcgguugaa ggagaaaacg uucguuaucc 360

ggccaacuac uucgagaaac cuaguaacgc cauggaaguu guggaguguu ucgcucagca 420

cuaccccagu guagaucagg uugaugaguc accgcauucc ccacggguga ccguggcggu 480

ggcugcguug gcggccugcc cauggggaaa cccaugggac gcucuuauac agacauggug 540

cgaagagucu auugagcuag uugguagucc uccggccccu gaaugcggcu aaucccaacu 600

gcggagcaua cacucucaag ccagagggua gugugucgua augggcaacu cugcagcgga 660

accgacuacu uugggugucc guguuucauu uuauuccuau acuggcugcu uauggugaca 720

auugagagau uguuaccaua uagcuauugg auuggccauc cggugacuaa cagagcuauu 780

auauaucuuu uuguuggguu uauaccacuu agcuugaaag agguuaaaac ucuacauuac 840

auuuuaauac ugaacaccgc aaaaugccca ggagggccga gaacugggac gaggccgagg 900

ugggcgccga ggaggccggc guggaggagu acggccccga ggaggacggc ggcgaggaga 960

gcggcgccga ggagagcggc cccgaagaga gcggccccga ggaacugggc gccgaggagg 1020

agauggaggc cggcaggccc agacccgugc ugaggagcgu gaacagcagg gagcccagcc 1080

aggugaucuu cugcaacagg agccccaggg uggugcugcc cguguggcug aacuucgacg 1140

gcgagcccca gcccuacccc acccugcccc cuggcaccgg caggaggauc cacagcuaca 1200

ggggccaccu guggcuguuc agagacgccg gcacacacga uggccuucug guuaaccaaa 1260

cagaauuauu ugugccuucu cugaauguug acggacagcc uauuuuugcc aauaucacac 1320

ugccugugua uacacugaaa gagaggugcc ugcagguugu gaggagccug gugaagcccg 1380

agaacuacag gagacuggac aucgugagga gccuguacga ggaccuggag gaccacccca 1440

acgugcagaa ggaccuggag aggcugaccc aggagaggau cgcccaccag aggaugggcg 1500

accuggaggg cggaggcggc agcgccgccg ccauggaccu gggcaagaag cugcuggagg 1560

ccgccagggc cggccaggac gacgagguga ggauccugau ggccaauggc gccgacguga 1620

acgccagcga cagguggggc uggaccccuc ugcaccuggc cgccuggugg ggccaccugg 1680

agaucgugga ggugcuguug aagaggggcg cugauguuag cgccgcugau cugcacggac 1740

aaagcccccu gcaucuggcu gccauggugg gccaccugga aauuguggaa gugcuguuga 1800

aguacggagc ugauguuaac gccaaagaua ccaugggagc uaccccucug caccuggcug 1860

ccaggagcgg ccaccucgag aucguggagg agcuguugaa gaacggcgcu gacaugaacg 1920

cccaggacaa guucggcaag accaccuucg acaucagcac cgacaacggc aacgaggacc 1980

uggccgagau ccugcagaag cugguggacg gcggcagcga cuacaaggac gacgaugaca 2040

agugaaaaaa acaaaaaaca aaacggcuau uaugcguuac cggcgagacg cuacggacuu 2100

a 2101

<210> 56

<211> 1432

<212> RNA

<213> Artificial Sequence

<220>

<223> 环状RNA分子序列

<400> 56

aaaauccguu gaccuuaaac ggucgugugg guucaagucc cuccaccccc acgccggaaa 60

cgcaauagcc gaaaaaacaa aaacaaaaaa aacaaaaaaa caaaaaaaaa accaaaacac 120

auuaaaacag ccuguggguu gaucccaccc acagggccca cugggcgcua gcacucuggu 180

aucacgguac cuuugugcgc cuguuuuaua cuuccucccc caacugcaac uuagaaguaa 240

cacaaaccga ucaacaguca gcguggcaca ccagccacgu uuugaucaaa cacuucuguu 300

accccggacu gaguaucaau agacugcuca cgcgguugaa ggagaaaacg uucguuaucc 360

ggccaacuac uucgagaaac cuaguaacgc cauggaaguu guggaguguu ucgcucagca 420

cuaccccagu guagaucagg uugaugaguc accgcauucc ccacggguga ccguggcggu 480

ggcugcguug gcggccugcc cauggggaaa cccaugggac gcucuuauac agacauggug 540

cgaagagucu auugagcuag uugguagucc uccggccccu gaaugcggcu aaucccaacu 600

gcggagcaua cacucucaag ccagagggua gugugucgua augggcaacu cugcagcgga 660

accgacuacu uugggugucc guguuucauu uuauuccuau acuggcugcu uauggugaca 720

auugagagau uguuaccaua uagcuauugg auuggccauc cggugacuaa cagagcuauu 780

auauaucuuu uuguuggguu uauaccacuu agcuugaaag agguuaaaac ucuacauuac 840

auuuuaauac ugaacaccgc aaaauggacc ugggcaagaa gcugcuggag gccgccaggg 900

ccggccagga cgacgaggug aggauccuga uggccaaugg cgccgacgug aacgccagcg 960

acagaggcgg cggcaccccu cugcaccugg ccgccgccgg cggacaccug gaaauugugg 1020

aggugcuguu gaagaggggc gcugauguua gcgccgcuga ucugcacgga caaagccccc 1080

ugcaucuggc ugccauggug ggccaccugg aaauugugga agugcuguug aaguacggag 1140

cugauguuaa cgccaaagau accaugggag cuaccccucu gcaccuggcu gccaggagcg 1200

gccaccucga gaucguggag gagcuguuga agaacggcgc ugacaugaac gcccaggaca 1260

aguucggcaa gaccaccuuc gacaucagca ccgacaacgg caacgaggac cuggccgaga 1320

uccugcagaa gcugguggac ggcggcagcg acuacaagga cgacgaugac aagugaaaaa 1380

aacaaaaaac aaaacggcua uuaugcguua ccggcgagac gcuacggacu ua 1432

<210> 57

<211> 10

<212> PRT

<213> Artificial Sequence

<220>

<223> 连接肽序列

<400> 57

Leu Glu Gly Gly Gly Gly Ser Ala Ala Ala

1 5 10

Claims

1.一种环状RNA分子，其中，所述环状RNA分子编码具有目标效应活性的重组多肽，所述目标效应活性为目标蛋白的靶向降解活性。

2.根据权利要求1所述的环状RNA分子，其中，所述重组多肽包括靶向结合所述目标蛋白的第一多肽，和与所述第一多肽融合的第二多肽，所述第二多肽具有E3泛素连接酶的酶活性；

3.根据权利要求1或2所述的环状RNA分子，其中，所述目标蛋白为跨膜蛋白或细胞内蛋白；优选地，所述目标蛋白为疾病相关蛋白；可选地，所述疾病相关蛋白为肿瘤相关蛋白。

4.根据权利要求2或3所述的环状RNA分子，其中，所述第一多肽为靶向结合所述目标蛋白的抗体、抗体片段或抗原结合多肽。

5.根据权利要求2-4任一项所述的环状RNA分子，其中，所述第二多肽选自E3泛素连接酶或其功能片段；可选地，所述E3泛素连接酶的功能片段包含如下的任一种：HECT结构域、RING结构域或U-box结构域。

6.根据权利要求2-5任一项所述的环状RNA分子，其中，所述第二多肽选自CRBN、VHL、MDM2、cIAP、βTrCP、FBW7、SPOP、SKP2、DDB2、SOCS2、ASB1、CHIP或上述任一种的功能片段。

7.根据权利要求1-6任一项所述的环状RNA分子，其中，所述环状RNA分子包括编码所述重组多肽的编码区序列，和与所述编码区序列可操作地连接的IRES序列。

8.根据权利要求7所述的环状RNA分子，其中，环状RNA分子还包括如下的一种或两种以上的序列：第二外显子序列、第一外显子序列、5’间隔序列、3’间隔序列；

优选地，所述环状RNA分子包括顺次连接的如下所示序列：第二外显子序列、5’间隔序列、IRES序列、编码区序列、3’间隔序列和第一外显子序列。

9.根据权利要求1-8任一项所述的环状RNA分子，其中，所述目标效应活性为受试者体内的目标蛋白的靶向降解活性；优选地，所述环状RNA分子被施用于受试者体内；

10.一种环化前体RNA分子，其中，所述环化前体RNA分子环化形成根据权利要求1-9任一项所述的环状RNA分子；

11.一种重组核酸分子，其中，所述重组核酸分子转录形成根据权利要求10所述的环化前体RNA分子。

12.一种重组表达载体，其中，所述重组表达载体包含根据权利要求11所述的重组核酸分子。

13.一种重组宿主细胞，其中，所述重组宿主细胞包含根据权利要求1-9任一项所述的环状RNA分子，根据权利要求10所述的环化前体RNA分子，根据权利要求11所述的重组核酸分子，或根据权利要求12所述的重组表达载体。

14.一种组合物，其中，所述组合物包括根据权利要求1-9任一项所述的环状RNA分子；可选地，所述组合物还包括一种或多种药学上可接受的载体。

15.根据权利要求1-9任一项所述的环状RNA分子，根据权利要求10所述的环化前体RNA分子，根据权利要求11所述的重组核酸分子，根据权利要求12所述的重组表达载体，根据权利要求13所述的重组宿主细胞，或根据权利要求14所述的组合物在如下(a)-(d)至少一种中的用途：

16.一种预防或治疗疾病的方法，其中，包括向受试者施用根据权利要求1-9任一项所述的环状RNA分子，根据权利要求10所述的环化前体RNA分子，根据权利要求11所述的重组核酸分子，根据权利要求12所述的重组表达载体，根据权利要求13所述的重组宿主细胞，或根据权利要求14所述的组合物；