CN114591986A - 环状rna分子及其在目标蛋白的靶向降解中的应用 - Google Patents

环状rna分子及其在目标蛋白的靶向降解中的应用 Download PDF

Info

Publication number
CN114591986A
CN114591986A CN202110863519.2A CN202110863519A CN114591986A CN 114591986 A CN114591986 A CN 114591986A CN 202110863519 A CN202110863519 A CN 202110863519A CN 114591986 A CN114591986 A CN 114591986A
Authority
CN
China
Prior art keywords
leu
sequence
ala
protein
rna molecule
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110863519.2A
Other languages
English (en)
Inventor
左炽健
杨嘉丽
朱佳凤
杜雅冉
赵阳
孙振华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Kerui Maide Biomedical Technology Co ltd
Original Assignee
Suzhou Kerui Maide Biomedical Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Kerui Maide Biomedical Technology Co ltd filed Critical Suzhou Kerui Maide Biomedical Technology Co ltd
Priority to CN202110863519.2A priority Critical patent/CN114591986A/zh
Publication of CN114591986A publication Critical patent/CN114591986A/zh
Priority to US17/815,035 priority patent/US20230042694A1/en
Priority to EP22187715.2A priority patent/EP4124347A1/en
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/93Ligases (6)
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K31/00Medicinal preparations containing organic active ingredients
    • A61K31/70Carbohydrates; Sugars; Derivatives thereof
    • A61K31/7088Compounds having three or more nucleosides or nucleotides
    • A61K31/7105Natural ribonucleic acids, i.e. containing only riboses attached to adenine, guanine, cytosine or uracil and having 3'-5' phosphodiester links
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • A61K38/16Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • A61K38/43Enzymes; Proenzymes; Derivatives thereof
    • A61K38/53Ligases (6)
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/0075Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the delivery route, e.g. oral, subcutaneous
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y603/00Ligases forming carbon-nitrogen bonds (6.3)
    • C12Y603/02Acid—amino-acid ligases (peptide synthases)(6.3.2)
    • C12Y603/02019Ubiquitin-protein ligase (6.3.2.19), i.e. ubiquitin-conjugating enzyme
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide

Abstract

本公开属于生物医药领域,具体来说,本公开涉及一种环状RNA分子、环化前体RNA分子、重组核酸分子、重组表达载体、重组宿主细胞、组合物及其在目标蛋白的靶向降解中的应用,以及一种预防或治疗疾病的方法。环状RNA分子具有良好的透膜性,易于向胞内递送,具有高效的体内蛋白靶向降解活性。本公开的环状RNA分子成功实现了对肿瘤生长抑制,首次证明了bio‑PROTACs的体内蛋白降解活性,为肿瘤等疾病的治疗提供了积极、有效的治疗方案。

Description

环状RNA分子及其在目标蛋白的靶向降解中的应用
技术领域
本公开属于生物医药领域,具体来说,本公开涉及一种环状RNA分子、环化前体RNA分子、重组核酸分子、重组表达载体、重组宿主细胞、组合物及其在目标蛋白的靶向降解中的应用,以及一种预防或治疗疾病的方法。
背景技术
细胞中的蛋白质不断处于合成、修饰与降解的代谢更新过程中,保持正常的蛋白质代谢对于生命的正常功能至关重要。对特定蛋白的降解或干预是研究蛋白质功能的重要途径,也是用于治疗由蛋白异常表达引起的相关疾病的重要措施。目前,对致病蛋白的降解或干预已经成为最有效的疾病治疗策略之一。
传统的小分子抑制剂通过结合目标蛋白(Protein of interest,POI)的活性位点来影响致病蛋白的生物学功能,从而达到治疗效果,至今已被成功用于癌症等多种疾病的临床治疗中。然而,传统小分子药物的研发策略决定其无法作用于“无成药性”(Undruggable)的靶点蛋白,导致目前细胞内仅有20%左右的蛋白可以作为靶点被应用于小分子药物的临床研究中。与此同时,基因编辑技术(例如,CRISPR/Cas技术)、RNAi技术都在一定程度上下调了目标蛋白的表达。然而,这些方法的缺点是需要很长时间才能有效地消除蛋白表达,并且,也无法作用于翻译后修饰的蛋白。一旦目标蛋白的翻译停止,蛋白质的消耗完全取决于其固有的半衰期。因此,CRISPR/Cas技术、RNAi技术等方法对于目标蛋白的调控存在很大的应用局限性[1]
细胞中的蛋白质稳态主要依赖细胞内固有的蛋白质降解途径的协调运作维持,其中自噬-溶酶体途径(autophagy-lysosome pathway)和泛素-蛋白酶体途径(ubiquitin-proteasome pathway,UPP)在蛋白质降解中发挥着重要的生物学功能。
蛋白降解靶向嵌合体(PROTACs)技术是近年来发展起来的一种有效的内源性蛋白质降解工具[2-3],主要由三部分组成:1)E3连接酶配体,主要用于招募E3连接酶;2)靶标蛋白配体,可以与靶标蛋白(protein of interest,POI)相结合;3)linker,连接E3连接酶配体和靶标蛋白配体。当PROTAC进入细胞后,其一端的靶标蛋白配体特异性识别靶标蛋白并与之结合,另一端的E3连接酶配体与E3结合,从而形成POI-PROTAC-E3ligase三元复合物。PROTAC复合物可以将E3连接酶连接到靶标蛋白上,并招募泛素化的E2,最终将靶标蛋白进行泛素化降解。传统的PROTACs蛋白降解剂主要是小分子化合物。小分子PROTACs蛋白降解剂的出现为解决不可成药靶点提供了可能,因此也成为药物研发的热点领域。然而,小分子PROTACs的药物研发也具有显著缺点,例如其分子量与传统小分子药物相比较大,因此不容易穿透细胞膜,难以进入细胞产生作用;小分子PROTACs依赖细胞内现存的E3泛素连接酶,如果后者表达量较低,则难以产生预期效果。
近年以来开发出来的抗体或多肽介导的蛋白质降解技术,称为生物-蛋白降解靶向嵌合体技术(Bio-PROTAC)能克服以上小分子PROTACs的缺点。TRIM21是一种E3泛素连接酶,与抗体的Fc结构域具有高亲和力[4],在多种细胞类型和组织中广泛表达[5]。TRIM21可以识别抗体结合的病原体并招募泛素-蛋白酶体系统对其进行降解[6]。利用TRIM21的特性,将抗体与PROTAC技术相结合产生的降解内源性蛋白的技术称为Trim-Away[7]。在Trim-Away系统中,抗体即相当于PROTAC技术的三连体结构,将抗体通过电转等形式进入细胞后可以结合特定的靶标蛋白,然后Fc端结合TRIM21,抗体,靶标蛋白和TRIM21三元复合物被泛素化并最终被蛋白酶降解。完成蛋白降解需要三个步骤:1)引入可与靶标蛋白相结合的抗体;2)将内源或外源的TRIM21募集至靶标蛋白;3)招募泛素化的E2,促使蛋白酶体介导的蛋白复合物降解。该方法可以快速降解细胞中的靶标蛋白,因此避免了因为长时间筛选而形成的补偿路径。相较于传统的DNA和RNA水平的基因干扰技术,Trim-Away技术可以对已经产生的蛋白尤其是长寿命的蛋白实现更好的降解效果;另外,Trim-Away技术对胞质和核内的蛋白都可实现降解。此外,也有研究报道通过构建纳米抗体-RNF4 E3泛素连接酶的RING结构域嵌合蛋白实现靶蛋白降解[8];以及其他分别采用单链抗体、Darpins、纳米抗体、多肽等手段靶向目的蛋白,并分别与不同的E3连接酶组成嵌合蛋白起到蛋白降解作用。然而,无论Trim-Away还是其他各种重组蛋白形式的Bio-PROTAC,均面临重大的临床应用难题,即需要将该重组蛋白形式的蛋白降解剂递送至特定的细胞内才能发挥作用。Bio-PROTAC的分子量大、透膜性差,导致Bio-PROTAC难以进入细胞内发挥作用。对于体外培养的细胞系,尚能采用电转化的方式实现递送重组蛋白的胞内递送。然而,对于Bio-PROTAC分子的体内递送尚未有合适的技术手段。因此,Bio-PROTAC的体内应用实例目前尚未见报道。
引用文献:
[1]Toyama,B.H.,Savas,J.N.,Park,S.K.,Harris,M.S.,Ingolia,N.T.,Yates,J.R.,3rd,and Hetzer,M.W.(2013).Identification of long-lived proteins revealsexceptional stability of essential cellular structures.Cell 154,971–982.
[2]Sakamoto KM,Kim KB,Verma R,Ransick A,Stein B,Crews CM,DeshaiesRJ.Development of Protacs to target cancer-promoting proteins forubiquitination and degradation.Mol Cell Proteomics.2003 Dec;2(12):1350-8.
[3]Burslem GM,Crews CM.Proteolysis-Targeting Chimeras as Therapeuticsand Tools for Biological Discovery.Cell.2020 Apr 2;181(1):102-114.
[4]James LC,Keeble AH,Khan Z,Rhodes DA,Trowsdale J.Structural basisfor PRYSPRY-mediated tripartite motif(TRIM)protein function.Proc Natl AcadSci USA.2007 Apr 10;104(15):6200-5.
[5]Yoshimi R,Chang TH,Wang H,Atsumi T,Morse HC 3rd,Ozato K.Genedisruption study reveals a nonredundant role for TRIM21/Ro52 in NF-kappaB-dependent cytokine expression in fibroblasts.J Immunol.2009 Jun 15;182(12):7527-38.
[6]Mallery DL,McEwan WA,Bidgood SR,Towers GJ,Johnson CM,JamesLC.Antibodies mediate intracellular immunity through tripartite motif-containing 21(TRIM21).Proc Natl Acad Sci U S A.2010 Nov 16;107(46):19985-90.
[7]Clift D,McEwan WA,Labzin LI,Konieczny V,Mogessie B,James LC,SchuhM.A Method for the Acute and Rapid Degradation of EndogenousProteins.Cell.2017 Dec 14;171(7):1692-1706.e18.
[8]Juríková M,Danihel L’,Polák
Figure BDA0003186654190000021
Varga I.Ki67,PCNA,and MCM proteins:Markers of proliferation in the diagnosis of breast cancer.ActaHistochem.2016 Jun;118(5):544-52.
发明内容
发明要解决的问题
鉴于现有技术中存在的问题,例如,Bio-PROTAC的重组蛋白存在分子量大、入胞能力差,无法有效递送至体内,在体内发挥蛋白降解作用的缺陷。为此,本公开提供了环状RNA分子,首次以环状RNA实现了对目标蛋白的靶向降解,为蛋白靶向降解技术提供了新型的功能分子。环状RNA分子具有良好的透膜性,易于向胞内递送,具有高效的体内蛋白靶向降解活性;有效解决了现有的蛋白靶向降解嵌合体分子存在的难以实现跨膜递送,以及难以实现对体内目标蛋白的降解的问题。
用于解决问题的方案
第一方面,本公开提供了一种环状RNA分子,其中,所述环状RNA分子编码具有目标效应活性的重组多肽,所述目标效应活性为目标蛋白的靶向降解活性。
在一些实施方式中,根据本公开所述的环状RNA分子,其中,所述重组多肽包括靶向结合所述目标蛋白的第一多肽,和与所述第一多肽融合的第二多肽,所述第二多肽具有E3泛素连接酶的酶活性;
可选地,所述重组多肽还包含连接所述第一多肽与所述第二多肽的连接肽。
在一些实施方式中,根据本公开所述的环状RNA分子,其中,所述目标蛋白为跨膜蛋白或细胞内蛋白;优选地,所述目标蛋白为疾病相关蛋白;可选地,所述疾病相关蛋白为肿瘤相关蛋白。
在一些可选的实施方式中,肿瘤相关蛋白包括但不限于K-ras、c-myc、EGFR、PD-L1、PDGF-β、bcl-2、ErbB2、P21、EGF受体、RAS、neu、raf、PCNA。
在一些实施方式中,根据本公开所述的环状RNA分子,其中,所述第一多肽为靶向结合所述目标蛋白的抗体、抗体片段或抗原结合多肽。
在一些实施方式中,根据本公开所述的环状RNA分子,其中,所述第二多肽选自E3泛素连接酶或其功能片段;可选地,所述E3泛素连接酶的功能片段包含如下的任一种:HECT结构域、RING结构域或U-box结构域。
在一些实施方式中,根据本公开所述的环状RNA分子,其中,所述第二多肽选自CRBN、VHL、MDM2、cIAP、βTrCP、FBW7、SPOP、SKP2、DDB2、SOCS2、ASB1、CHIP或上述任一种的功能片段。
在一些实施方式中,根据本公开所述的环状RNA分子,其中,所述重组多肽具有如SEQ ID NO:34-45任一项所示的氨基酸序列,或者如SEQ ID NO:34-45所示的氨基酸序列经过取代、重复、缺失或添加一个或多个氨基酸,且具有所述重组多肽的多肽活性的突变体
在一些实施方式中,根据本公开所述的环状RNA分子,其中,所述环状RNA分子包括编码所述重组多肽的编码区序列,和与所述编码区序列可操作地连接的IRES序列。
在一些实施方式中,根据本公开所述的环状RNA分子,其中,环状RNA分子还包括位于IRES序列上游的第二外显子序列。
在一些实施方式中,根据本公开所述的环状RNA分子,其中,环状RNA分子还包括位于编码区序列下游的第一外显子序列。
在一些实施方式中,根据本公开所述的环状RNA分子,其中,环状RNA分子包括5’间隔区和3’间隔区,其中5’间隔区序列位于第二外显子E2序列与IRES序列之间,3’间隔区序列位于第一外显子E1序列与编码区序列之间。
在一些实施方式中,根据本公开所述的环状RNA分子,其中,环状RNA分子包括顺次连接的如下所示序列:第二外显子序列、5’间隔序列、IRES序列、编码区序列、3’间隔序列和第一外显子序列。
在一些实施方式中,根据本公开所述的环状RNA分子,其中,所述环状RNA分子选自如下(i)-(ii)组成的组中的任一项:
(i)如SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:46-55中任一项所示的核苷酸序列;
(ii)与(i)所示的核苷酸序列具有至少90%,可选至少95%,优选至少97%,更优选至少98%,最优选至少99%的序列同一性的序列。
在一些实施方式中,根据本公开所述的环状RNA分子,其中,所述目标效应活性为受试者体内的目标蛋白的靶向降解活性;优选地,所述环状RNA分子被施用于受试者体内;
可选地,所述环状RNA分子通过口服、腹膜内、静脉内、动脉内、肌肉内、皮内、皮下、经皮、鼻腔、经直肠,肿瘤体内注射、肿瘤腔内留置、神经鞘内注射、蛛网膜下腔注射或系统性施用,优选为肿瘤体内注射。
第二方面,本公开提供了一种环化前体RNA分子,其中,所述环化前体RNA分子环化形成根据本公开第一方面所述的环状RNA分子;
可选地,所述环化前体RNA分子包括顺次连接的如下所示序列:
5’同源臂序列、3’内含子序列、第二外显子序列、5’间隔区序列、IRES序列、编码区序列、3’间隔区序列、第一外显子序列、5’内含子序列和3’同源臂序列。
第三方面,本公开提供了一种重组核酸分子,其中,所述重组核酸分子转录形成根据本公开所述的环化前体RNA分子。
第四方面,本公开提供了一种重组表达载体,其中,所述重组表达载体包含根据本公开所述的重组核酸分子。
第五方面,本公开提供了一种重组宿主细胞,其中,所述重组宿主细胞包含根据本公开第一方面所述的环状RNA分子,根据本公开第二方面所述的环化前体RNA分子,根据本公开第三方面所述的重组核酸分子,或根据本公开第四方面所述的重组表达载体。
第六方面,本公开提供了一种组合物,其中,所述组合物包括根据本公开第一方面所述的环状RNA分子;可选地,所述组合物还包括一种或多种药学上可接受的载体。
第七方面,本公开提供了根据本公开第一方面所述的环状RNA分子,根据本公开第二方面所述的环化前体RNA分子,根据本公开第三方面所述的重组核酸分子,根据本公开第四方面所述的重组表达载体,根据本公开第五方面所述的重组宿主细胞,或根据本公开第六方面所述的组合物在如下(a)-(d)至少一种中的用途:
(a)目标蛋白的靶向降解,优选受试者体内的目标蛋白的靶向降解;
(b)降低或消除目标蛋白的表达,优选降低或消除受试者体内的目标蛋白的表达;
(c)作为或制备目标蛋白的靶向降解的试剂,优选作为或制备受试者体内的目标蛋白的靶向降解的试剂;
(d)作为或制备治疗疾病的药物,优选作为或制备治疗肿瘤的药物。
第八方面,本公开提供了一种预防或治疗疾病的方法,其中,包括向受试者施用根据本公开第一方面所述的环状RNA分子,根据本公开第二方面所述的环化前体RNA分子,根据本公开第三方面所述的重组核酸分子,根据本公开第四方面所述的重组表达载体,根据本公开第五方面所述的重组宿主细胞,或根据本公开第六方面所述的组合物;
可选地,所述施用选自口服、腹膜内、静脉内、动脉内、肌肉内、皮内、皮下、经皮、鼻腔、经直肠,肿瘤体内注射、肿瘤腔内留置、神经鞘内注射、蛛网膜下腔注射或系统性施用;优选为肿瘤体内注射。
发明的效果
在一些实施方式中,本公开提供的环状RNA分子,首次以环状RNA实现了对目标蛋白的靶向降解,为蛋白靶向降解技术提供了新型的功能分子。环状RNA分子具有良好的肿瘤细胞透膜性,易于向胞内递送,并且不会造成细胞的代谢负担,有效解决了现有的蛋白靶向降解嵌合体分子存在的难以实现跨膜递送、蛋白降解活性低的问题。
在一些实施方式中,本公开提供的环状RNA分子,其编码具有E3泛素连接酶的酶活性的第二多肽,解除了对细胞内固有泛素连接酶的依赖,有效提高了对目标蛋白的降解效率。
在一些实施方式中,本公开提供的环状RNA分子,与线性mRNA分子相比具有更好的蛋白翻译水平、蛋白表达持久性,以及更为优异的目标蛋白的靶向降解效果;并且环状RNA分子不需要进行加帽、加poly(A)尾、核苷酸修饰等步骤,生产工艺简单、生产成本降低。
在一些优选的实施方式中,环状RNA分子适于向受试者体内递送,实现对受试者体内的目标蛋白的有效降解,解决了蛋白靶向降解嵌合体难以实现体内递送、蛋白降解活性低的问题。
在一些实施方式中,本公开提供的环状RNA分子,通过对肿瘤模型小鼠的瘤内注射,实现了对成功实现肿瘤生长抑制,首次证明了bio-PROTACs的体内蛋白降解活性,为肿瘤等疾病的治疗提供了积极、有效的治疗方案。
附图说明
图1示出了细胞转染后48小时荧光图。图1中A-D依次表示EV29-H2B-eGFP mRNA的转染量为50ng、100ng、200ng、400ng时,与EV29-EGFP-DASP mRNA共转染的荧光检测结果。
图2示出了细胞转染24小时和48小时后流式检测图。图中A为24h后的流式检测图,图中B为48h后的流式检测图。
图3示出了比较环状mRNA与线性mRNA介导的EH2B-EGFP的蛋白降解效果。
图4示出了Western Blot检测PCNA蛋白表达水平。
图5示出了肿瘤细胞内EGFP表达流式检测图。图中A示出了肿瘤内GFP阳性细胞的比例,图中B示出了肿瘤内GFP平均荧光强度。
图6示出了肿瘤的生长曲线。
图7示出了环状RNA分子靶向降解KRAS蛋白的检测结果图。
具体实施方式
当在权利要求和/或说明书中与术语“包含”联用时,词语“一(a)”或“一(an)”可以指“一个”,但也可以指“一个或多个”、“至少一个”以及“一个或多于一个”。
如在权利要求和说明书中所使用的,词语“包含”、“具有”、“包括”或“含有”是指包括在内的或开放式的,并不排除额外的、未引述的元件或方法步骤。
在整个申请文件中,术语“约”表示:一个值包括测定该值所使用的装置或方法的误差的标准偏差。
虽然所公开的内容支持术语“或”的定义仅为替代物以及“和/或”,但除非明确表示仅为替代物或替代物之间相互排斥外,权利要求中的术语“或”是指“和/或”。
如本公开所使用的,术语“多肽”、“肽”和“蛋白质”在本文中互换地使用并且为任意长度的氨基酸聚合物。该聚合物可以是线形或分支的,它可以包含修饰的氨基酸,并且它可以由非氨基酸隔断。该术语也包括已经被修饰(例如,二硫键形成、糖基化、脂质化、乙酰化、磷酸化或任何其他操作,如以标记组分缀合)的氨基酸聚合物。多肽可以从天然来源分离,可以通过重组技术从真核或原核宿主产生并且可以是合成方法的产物。
如本公开所使用的,“重组多肽”又称“工程化多肽”是指具有自然界不相连的肽序列的多肽、蛋白。重组多肽可以是利用基因工程技术,在原核或真核细胞中获得的目标多肽;也可以是利用合成技术得到的目标多肽。
如本公开所使用的,术语“连接肽”是指由氨基酸组成的连接肽,用于将多肽、蛋白质或其片段连接在一起。在本公开中,术语“连接子”与“连接肽”可以互换地使用。
如本公开所使用的,术语“E3泛素连接酶”又称泛素连接酶(ubiquitin-proteinligase)、泛素连接酶E3,E3具有特异性识别靶蛋白的能力,其通过招募底物蛋白和E2泛素结合酶,介导泛素从E2转移到靶蛋白并与靶蛋白共价结合,蛋白酶体催化泛素与靶蛋白的偶连体降解。目前已发现的E3泛素连接酶数量众多,主要包括具有HECT结构域、RING结构域或U-box结构域的E3泛素连接酶。
如本公开所使用的,术语“目标蛋白”、“靶蛋白”可以互换地使用。
如本公开所使用的,术语“疾病相关蛋白”是指在患病个体中异常性表达的蛋白。进一步地,本公开中的“疾病相关蛋白”是指在患病个体中异常高表达的蛋白。
如本公开所使用的,术语“抗体”,指免疫球蛋白或其片段或它们的衍生物,并且包括其包含的抗原结合位点的任何多肽,而不管其是否是在体外或体内产生。该术语包括,但不限于,多克隆、单克隆、单特异性的、多特异性的、非特异性的、人源化、单链的、嵌合的、合成的、重组的、杂合的、突变的、嫁接的抗体。术语“抗体”还包括抗体片段例如Fab、F(ab’)2、FV、scFv、Fd、dAb和其它保留抗原结合功能的抗体片段。通常情况下,这样的片段将包括抗原结合片段。
如本公开所使用的,术语“环状RNA”是一种呈封闭环形RNA分子,主要由外显子、IRES元件、蛋白编码区和间隔区。在一些优选的实施方案中,环状RNA具有如下结构:“第二外显子E2-间隔区-IRES元件-编码区-间隔区-第一外显子E1”。本公开所使用的环状RNA具有蛋白翻译活性,又可称为“环状mRNA”。
如本公开所使用的,术语“环化前体RNA”是指能够环化形成环状RNA的RNA前体,其一般由环化前体的DNA分子转录形成。在一些实施方案中,环化前体RNA中包括如下元件:5’同源臂、3’内含子、第二外显子E2、间隔区、IRES元件、编码区、间隔区、第一外显子E1、5’内含子、3’同源臂。在一些实施方案中,5’同源臂、3’内含子、5’内含子、3’同源臂在环化前体RNA剪切形成环状RNA的过程中发挥作用。其中,内含子具有核酶特性,例如,利用5’内含子的核酶特性,使5’内含子与第一外显子E1的连接处在GTP引发下断裂,断裂位点又可以进一步引发3’内含子与第二外显子E2的连接处断裂,第二外显子E2与第一外显子E1连接形成环状RNA。
如本公开所使用的,术语“线性RNA”是指包括5’帽子结构(5’Cap),3’多聚腺苷尾巴(PolyA tail),5’非翻译序列(5’untranslational region,5’UTR),3’非翻译序列(3’untranslational region,3’UTR)以及开放阅读框(Open reading frame,ORF)等结构的具有翻译功能的RNA。
如本公开所使用的,术语“IRES”(Internal ribosome entry site,IRES)又称内部核糖体进入位点,“内部核糖体进入位点”(IRES)属于翻译控制序列,通常位于所关注基因的5’端,并使得以帽非依赖性方式翻译RNA。经转录的IRES可直接结合核糖体亚单位,以使得mRNA起始密码子在核糖体中适当地取向以进行翻译。IRES序列通常位于mRNA的5’UTR中(起始密码子的正上游)。IRES在功能上取代对各种与真核生物翻译机制相互作用的蛋白因子的需求。
如本公开所使用的,术语“编码区”(Coding Region)是指能够转录信使RNA,并最终翻译为目标多肽、蛋白的基因序列。
如本公开所使用的,术语“表达”包括涉及多肽产生的任何步骤,包括但不限于:转录、转录后修饰、翻译、翻译后修饰、和分泌。
如本公开所使用的,术语“上游”或“下游”是指沿编码区的蛋白翻译方向的上游及下游。
如本公开所使用的,术语“多核苷酸”、“核酸分子”指由核苷酸组成的聚合物。多核苷酸可以是单独片段的形式,也可以是更大的核苷酸序列结构的一个组成部分,其是从至少在数量或浓度上分离一次的核苷酸序列衍生而来的,能够通过标准分子生物学方法(例如,使用克隆载体)识别、操纵以及恢复序列及其组分核苷酸序列。当一个核苷酸序列通过一个DNA序列(即A、T、G、C)表示时,这也包括一个RNA序列(即A、U、G、C),其中“U”取代“T”。换句话说,“多核苷酸”指从其他核苷酸(单独的片段或整个片段)中去除的核苷酸聚合物,或者可以是一个较大核苷酸结构的组成部分或成分,如表达载体或多顺反子序列。多核苷酸包括DNA、RNA和cDNA序列。“重组多核苷酸”、“重组核酸分子”属于“多核苷酸”中的一种。
如本公开所使用的,术语“重组核酸分子”指具有在自然界中不连接在一起的序列的多核苷酸。重组多核苷酸可包括在合适的载体中,且该载体可用于转化至合适的宿主细胞。然后多核苷酸在重组宿主细胞中表达以产生例如“重组多肽”“重组蛋白”“融合蛋白”等。
如本公开所使用的,术语“载体”指的是DNA构建体,其含有与合适的控制序列可操作地连接的DNA序列,从而在合适的宿主中表达目的基因。
如本公开所使用的,术语“重组表达载体”指用于表达例如编码所需多肽的多核苷酸的DNA结构。重组表达载体可包括,例如包含i)对基因表达具有调控作用的遗传元素的集合,例如启动子和增强子;ii)转录成mRNA并翻译成蛋白质的结构或编码序列;以及iii)适当的转录和翻译起始和终止序列的转录亚单位。重组表达载体以任何合适的方式构建。载体的性质并不重要,并可以使用任何载体,包括质粒、病毒、噬菌体和转座子。用于本公开的可能载体包括但不限于染色体、非染色体和合成DNA序列,例如病毒质粒、细菌质粒、噬菌体DNA、酵母质粒以及从质粒和噬菌体DNA的组合中衍生的载体,来自如慢病毒、逆转录病毒、牛痘、腺病毒、鸡痘、杆状病毒、SV40和伪狂犬病等病毒的DNA。
如本公开所使用的,术语“宿主细胞”指已经向其中引入外源多核苷酸的细胞,包括这类细胞的子代。宿主细胞包括“转化体”和“转化的细胞”,这包括原代转化的细胞和从其衍生的子代。宿主细胞是可以用来产生本发明抗体分子的任何类型的细胞系统,包括真核细胞,例如,哺乳动物细胞、昆虫细胞、酵母细胞;和原核细胞,例如,大肠杆菌细胞。宿主细胞包括培养的细胞,也包括转基因动物、转基因植物或培养的植物组织或动物组织内部的细胞。术语“重组宿主细胞”涵盖导入环状RNA、环化前体RNA、重组核酸分子或重组表达载体后不同于亲本细胞的宿主细胞,重组宿主细胞具体通过转化来实现。本公开的宿主细胞可以是原核细胞或真核细胞,只要是能够导入本公开的环状RNA、环化前体RNA、重组核酸分子或重组表达载体的细胞即可。
如本公开所使用的,术语“转化、转染、转导”具有本领域技术人员普遍理解的意思,即将外源性的DNA导入宿主的过程。所述转化、转染、转导的方法包括任何将核酸导入细胞的方法,这些方法包括但不限于电穿孔法、磷酸钙(CaPO4)沉淀法、氯化钙(CaCl2)沉淀法、微注射法、聚乙二醇(PEG)法、DEAE-葡聚糖法、阳离子脂质体法以及乙酸锂-DMSO法。
如本公开所使用的,“治疗”是指:在罹患疾病之后,使受试者接触(例如给药)本发明的环状RNA、环化前体RNA、重组核酸分子、重组表达载体、组合物,从而与不接触时相比使该疾病的症状减轻,并不意味着必需完全抑制疾病的症状。罹患疾病是指:身体出现了疾病症状。
如本公开所使用的,“预防”是指:在罹患疾病之前,通过使受试者接触(例如给药)本发明的环状RNA、环化前体RNA、重组核酸分子、重组表达载体、组合物等,从而与不接触时相比减轻罹患疾病后的症状,并不意味着必需完全抑制患病。
如本公开所使用的,术语“有效量”指本发明的重组核酸分子、重组表达载体、环化前体RNA、环状RNA、疫苗或组合物的这样的量或剂量,其以单一或多次剂量施用患者后,在需要治疗或预防的患者中产生预期效果。有效量可以由作为本领域技术人员的主治医师通过考虑以下多种因素来容易地确定:诸如哺乳动物的物种;它的大小、年龄和一般健康;涉及的具体疾病;疾病的程度或严重性;个体患者的应答;施用的具体抗体;施用模式;施用制剂的生物利用率特征;选择的给药方案;和任何伴随疗法的使用。
如本公开所使用的,术语“个体”、“患者”或“受试者”包括哺乳动物。哺乳动物包括但不限于,家养动物(例如,牛,羊,猫,狗和马),灵长类动物(例如,人和非人灵长类动物如猴),兔,以及啮齿类动物(例如,小鼠和大鼠)。
术语“癌症”和“癌性”指向或描述哺乳动物中特征通常为细胞生长不受调节的生理疾患。癌症的例子包括但不限于癌,淋巴瘤,母细胞瘤,肉瘤和白血病或淋巴样恶性肿瘤。此类癌症的更具体例子包括但不限于鳞状细胞癌(例如上皮鳞状细胞癌),肺癌(包括小细胞肺癌,非小细胞肺癌,肺的腺癌,和肺的鳞癌),腹膜癌,肝细胞癌,胃癌(包括胃肠癌和胃肠基质癌),胰腺癌,成胶质细胞瘤,宫颈癌,卵巢癌,肝癌,膀胱癌,尿道癌,肝瘤,乳腺癌,结肠癌,直肠癌,结肠直肠癌,子宫内膜癌或子宫癌,唾液腺癌,肾癌,前列腺癌,外阴癌,甲状腺癌,肝癌,肛门癌,阴茎癌,黑素瘤,浅表扩散性黑素瘤,恶性雀斑样痣黑素瘤,肢端黑素瘤,结节性黑素瘤,多发性骨髓瘤和B细胞淋巴瘤,慢性淋巴细胞性白血病(CLL),急性成淋巴细胞性白血病(ALL),毛细胞性白血病,慢性成髓细胞性白血病,和移植后淋巴增殖性病症(PTLD),以及与瘢痣病(phakomatoses),水肿(诸如与脑瘤有关的)和梅格斯氏(Meigs)综合征有关的异常血管增殖,脑瘤和脑癌,以及头颈癌,及相关转移。在某些实施方案中,适合于通过本发明的抗体来治疗的癌症包括肺癌(例如非小细胞肺癌)、肝癌、胃癌或结肠癌,包括那些癌症的转移性形式。
术语“肿瘤”指所有赘生性(neoplastic)细胞生长和增殖,无论是恶性的还是良性的,及所有癌前(pre-cancerous)和癌性细胞和组织。术语“癌症”、“癌性”和“肿瘤”在本文中提到时并不互相排斥。
除非另外定义或由背景清楚指示,否则在本公开中的全部技术与科学术语具有如本公开所属领域的普通技术人员通常理解的相同含义。
技术方案
在本公开的技术方案中,说明书核苷酸和氨基酸序列表的编号所代表的含义如下所示:
SEQ ID NO:1所示的序列是编码H2B-EGFP蛋白的环状RNA分子的核苷酸序列;
SEQ ID NO:2所示的序列是编码重组多肽EGFP-DASP的环状RNA分子的核苷酸序列;
SEQ ID NO:3所示的序列是编码重组多肽EGFP-DASP的线状RNA分子的核苷酸序列;
SEQ ID NO:4所示的序列是编码重组多肽CON1-SP-WT的环状RNA分子的核苷酸序列;
SEQ ID NO:5所示的序列是编码重组多肽CON1-SP-mu的环状RNA分子的核苷酸序列;
SEQ ID NO:6所示的序列是编码重组多肽CON1-mu-SP的环状RNA分子的核苷酸序列;
SEQ ID NO:7所示的序列是PCNA蛋白的氨基酸序列;
SEQ ID NO:8所示的序列是靶向结合PCNA蛋白的第一多肽的氨基酸序列;
SEQ ID NO:9所示的序列是编码靶向结合PCNA蛋白的第一多肽的核苷酸序列;
SEQ ID NO:10所示的序列是连接第一多肽和第二多肽的连接肽的氨基酸序列;
SEQ ID NO:11所示的序列是编码连接肽的核苷酸序列;
SEQ ID NO:12所示的序列是具有SPOP的泛素连接酶活性的第二多肽的氨基酸序列;
SEQ ID NO:13所示的序列是编码具有SPOP的泛素连接酶活性的第二多肽的核苷酸序列;
SEQ ID NO:14所示的序列是CVB3 IRES的核苷酸序列;
SEQ ID NO:15所示的序列是EV24 IRES的核苷酸序列;
SEQ ID NO:16所示的序列是EV29 IRES的核苷酸序列;
SEQ ID NO:17所示的序列是EV33 IRES的核苷酸序列;
SEQ ID NO:18所示的序列是EV24与CVB3v嵌合IRES的核苷酸序列;
SEQ ID NO:19所示的序列是EV29与CVB3v嵌合IRES的核苷酸序列;
SEQ ID NO:20所示的序列是EV33与CVB3v嵌合IRES的核苷酸序列;
SEQ ID NO:21所示的序列是第一外显子(E1)的核苷酸序列;
SEQ ID NO:22所示的序列是第二外显子(E2)的核苷酸序列;
SEQ ID NO:23所示的序列是5’间隔区序列1的核苷酸序列;
SEQ ID NO:24所示的序列是5’间隔区序列2的核苷酸序列;
SEQ ID NO:25所示的序列是3’间隔区序列1的核苷酸序列;
SEQ ID NO:26所示的序列是3’间隔区序列2的核苷酸序列;
SEQ ID NO:27所示的序列5’内含子的核苷酸序列;
SEQ ID NO:28所示的序列是3’内含子的核苷酸序列;
SEQ ID NO:29所示的序列是5’同源臂序列1(H1)的核苷酸序列;
SEQ ID NO:30所示的序列是5’同源臂序列2(H2)的核苷酸序列;
SEQ ID NO:31所示的序列是3’同源臂序列1的核苷酸序列;
SEQ ID NO:32所示的序列是3’同源臂序列2的核苷酸序列;
SEQ ID NO:33所示的序列是靶向KRAS蛋白的K19/K19-VHKC的氨基酸序列;
SEQ ID NO:34所示的序列是重组多肽N-EGFP(第一多肽)-连接肽-SPOP(第二多肽)-C的氨基酸序列;
SEQ ID NO:35所示的序列是重组多肽N-CON1(第一多肽)-连接肽-SPOP(第二多肽)-C的氨基酸序列;
SEQ ID NO:36所示的序列是重组多肽N-βTrCP(第二多肽)-连接肽-K19(第一多肽)-C的氨基酸序列;
SEQ ID NO:37所示的序列是重组多肽N-FBW7(第二多肽)-连接肽-K19(第一多肽)-C的氨基酸序列;
SEQ ID NO:38所示的序列是重组多肽N-SKP2(第二多肽)-连接肽-K19(第一多肽)-C的氨基酸序列;
SEQ ID NO:39所示的序列是重组多肽N-CRBN(第二多肽)-连接肽-K19(第一多肽)-C的氨基酸序列;
SEQ ID NO:40所示的序列是重组多肽N-DDB2(第二多肽)-连接肽-K19(第一多肽)-C的氨基酸序列;
SEQ ID NO:41所示的序列是重组多肽N-K19(第一多肽)-连接肽-SOCS2(第二多肽)-C的氨基酸序列;
SEQ ID NO:42所示的序列是重组多肽N-K19(第一多肽)-连接肽-ASB1(第二多肽)-C的氨基酸序列;
SEQ ID NO:43所示的序列是重组多肽N-K19(第一多肽)-连接肽-CHIP(第二多肽)-C的氨基酸序列;
SEQ ID NO:44所示的序列是重组多肽N-K19(第一多肽)-连接肽-SPOP(第二多肽)-C的氨基酸序列;
SEQ ID NO:45所示的序列是重组多肽N-K19(第一多肽)-连接肽-VHL(第二多肽)-C的氨基酸序列;
SEQ ID NO:46所示的序列是编码重组多肽N-βTrCP(第二多肽)-连接肽-K19(第一多肽)-C的环状RNA分子的核苷酸序列;
SEQ ID NO:47所示的序列是编码重组多肽N-FBW7(第二多肽)-连接肽-K19(第一多肽)-C的环状RNA分子的核苷酸序列;
SEQ ID NO:48所示的序列是编码重组多肽N-SKP2(第二多肽)-连接肽-K19(第一多肽)-C的环状RNA分子的核苷酸序列;
SEQ ID NO:49所示的序列是编码重组多肽N-CRBN(第二多肽)-连接肽-K19(第一多肽)-C的环状RNA分子的核苷酸序列;
SEQ ID NO:50所示的序列是编码重组多肽N-DDB2(第二多肽)-连接肽-K19(第一多肽)-C的环状RNA分子的核苷酸序列;
SEQ ID NO:51所示的序列是编码重组多肽N-K19(第一多肽)-连接肽-SOCS2(第二多肽)-C的环状RNA分子的核苷酸序列;
SEQ ID NO:52所示的序列是编码重组多肽N-K19(第一多肽)-连接肽-ASB1(第二多肽)-C的环状RNA分子的核苷酸序列;
SEQ ID NO:53所示的序列是编码重组多肽N-K19(第一多肽)-连接肽-CHIP(第二多肽)-C的环状RNA分子的核苷酸序列;
SEQ ID NO:54所示的序列是编码重组多肽N-K19(第一多肽)-连接肽-SPOP(第二多肽)-C的环状RNA分子的核苷酸序列;
SEQ ID NO:55所示的序列是编码重组多肽N-K19(第一多肽)-连接肽-VHL(第二多肽)-C的环状RNA分子的核苷酸序列;
SEQ ID NO:55所示的序列是环状RNA分子EV29-K19-VHKC的核苷酸序列;
SEQ ID NO:56所示的序列是连接肽的氨基酸序列。
环状RNA分子
本公开的环状RNA分子编码具有目标效应活性的重组多肽,所述目标效应活性为目标蛋白的靶向降解活性。环状RNA分子通过表达能够靶向降解目标蛋白的重组多肽,能够实现对目标蛋白的特异性降解,为蛋白靶向降解技术提供的新型的功能分子。
本领域技术人员知晓,对于小分子形式的蛋白靶向降解嵌合体,透明性差、难以递送至胞内发挥蛋白降解作用;而嵌合蛋白形式的Bio-PROTACs分子,其分子量较大,在体内跨膜递送在存在较大的技术困难。因此,目前蛋白靶向降解嵌合体普遍存在体内递送困难,难以有效降解目标蛋白的问题。与此相比,本公开中的环状RNA分子具有良好的透膜性,易于向胞内递送,特别递送至体内,实现针对目标蛋白的高效、特异性降解。
在一些实施方式中,所述重组多肽包括靶向结合所述目标蛋白的第一多肽,和与所述第一多肽融合的第二多肽,所述第二多肽具有E3泛素连接酶的酶活性。通过第一多肽和第二多肽融合形成重组多肽,能够在与目标蛋白靶向结合后,利用E3泛素连接酶的酶活性将目标蛋白泛素化,泛素化的目标蛋白被蛋白酶体识别并降解。
在本公开中,目标蛋白可以是参与机体生理、病理进程的任意蛋白类型,包括跨膜蛋白和胞内蛋白。
在一些实施方式中,目标蛋白为疾病相关蛋白。疾病类型包括但不限于在肿瘤、神经系统类疾病、免疫系统类疾病、心脑血管类疾病等等。在一些实施方式中,疾病相关蛋白是在任一类型疾病中异常表达的蛋白。进一步的,疾病相关蛋白是在疾病的发生、发展、预后等过程中异常高表达的蛋白。在本公开中,异常高表达是指与未患病的健康体相比,蛋白表达量呈过量表达。环状RNA分子通过对疾病相关蛋白的特异、高效降解,从而达到疾病治疗效果。
在一些实施方式中,目标蛋白为参与机体生理活性的蛋白。示例性的,目标蛋白为参与细胞周期、增殖、凋亡、分化、转移等生命活动调控的蛋白。利用本公开的环状RNA分子,能够实现对目标蛋白的靶向降解,为蛋白功能的研究提供基础。在本公开中,参与机体生理活性的蛋白与疾病相关蛋白并不互相排斥。
在一些更为具体的实施方式中,目标蛋白为肿瘤相关蛋白。示例性地,目标蛋白包括但不限于K-ras、c-myc、EGFR、PD-L1、PDGF-β、bcl-2、ErbB2、P21、EGF受体、RAS、neu、raf、PCNA等等。
在一些可选的实施方式中,目标蛋白为PCNA。PCNA的氨基酸序列如包含如SEQ IDNO:7所示的氨基酸序列,或者如SEQ ID NO:7所示的氨基酸序列经过取代、重复、缺失或添加一个或多个氨基酸,且具有PCNA蛋白活性的蛋白突变体。
PCNA在DNA复制及DNA切除修复,细胞周期调控,染色质组装,RNA转录等细胞活动中发挥作用,并且可为肿瘤增殖活性的标准标记物,用于评估肿瘤细胞的分裂增殖情况,在多种恶性肿瘤中高表达,是一种潜在的药物靶标。本公开通过对肿瘤模型小鼠的瘤内注射靶向降解PCNA的环状RNA分子,有效抑制了肿瘤的生长,说明本公开的环状RNA分子适合在受试者体内递送中具有高的递送效率,蛋白靶向降解效果显著,具有广泛的疾病治疗的应用前景。
在一些可选的实施方式中,目标蛋白为KRAS,当KRAS异常高表达时,则导致细胞持续生长,并阻止细胞自我毁灭,细胞增殖失控而癌变。
在本公开中,第一多肽不具有特别限定的序列,其具体序列依据所需结合的目标蛋白的序列而设计。
在一些实施方式中,第一多肽为靶向结合目标蛋白的抗体、抗体片段或抗原结合多肽。示例性的,第一多肽可以是与目标蛋白结合的天然抗体,或通过重组DNA技术、或通过酶或化学切割完整的抗体制备的抗体片段,或与抗原结合的抗原结合多肽。
在本公开中,抗体指包含抗原结合位点的蛋白质,涵盖各种结构的天然抗体和人工抗体,包括但不限于单克隆抗体、多克隆抗体、多特异性抗体(例如,双特异性抗体)、单链抗体、完整抗体等。
在本公开中,抗体结合片段包含完整抗体的一部分且结合完整抗体所结合的抗原。抗体片段的例子包括但不限于Fv,Fab,Fab’,Fab’-SH,F(ab’)2;双抗体;线性抗体;单链抗体(例如scFv);单结构域抗体;双价或双特异性抗体或其片段;骆驼科抗体;和由抗体片段形成的双特异性抗体或多特异性抗体。
在本公开中,抗原结合多肽可以是化学合成的,或重组制备的与目标蛋白特异性结构的多肽或多肽片段。
示例性的,第一多肽为与目标蛋白结合的DARPins、αReps、单域抗体、结合肽等。
在一些可选地实施方式中,第一多肽靶向结合PCNA,第一多肽的氨基酸序列包含如SEQ ID NO:8所示的氨基酸序列,或者如SEQ ID NO:8所示的氨基酸序列经过取代、重复、缺失或添加一个或多个氨基酸,且具有靶向结合PCNA的蛋白活性的突变体。
在一些可选的实施方式中,编码第一多肽的编码区序列包含如SEQ ID NO:9所示的核苷酸序列,或与SEQ ID NO:9所示的核苷酸序列具有80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%序列同一性的序列,且编码具有靶向结合PCNA的蛋白活性的蛋白的突变体。
在一些可选地实施方式中,第一多肽靶向结合KRAS,第一多肽的氨基酸序列包含如SEQ ID NO:33所示的氨基酸序列,或者如SEQ ID NO:33所示的氨基酸序列经过取代、重复、缺失或添加一个或多个氨基酸,且具有靶向结合PCNA的蛋白活性的突变体。
在本公开中,第二多肽不具有特别限定的序列,只要其能够使第二多肽具有E3泛素连接酶的酶活性,以实现对目标蛋白的泛素化标记即可。
在一些实施方式中,所述第二多肽选自E3泛素连接酶或其功能片段,具体而言,第二多肽可以选自任意具有泛素连接酶活性的E3泛素连接酶或其功能片段。进一步的,E3泛素连接酶的功能片段包含如下的任一种:HECT结构域、RING结构域或U-box结构域。其中,HECT结构域的保守Cys残基可与E2携带的泛素形成硫酯键,E2先将泛素传递给E3,再由E3递呈给底物。RING结构域包含相似的E2结合结构域,作为桥梁将活化的泛素从E2直接转移到靶蛋白。U-box结构域通过与泛素结合酶E2相连,然后与泛素形成通过硫酯键结合的中间复合体,最后催化靶蛋白的多聚泛素化修饰。
在一些可选的实施方式中,第二多肽选自如下任一种的E3泛素连接酶或其功能片段:CRBN、VHL、MDM2、cIAP、βTrCP、FBW7、SPOP、SKP2、DDB2、SOCS2、ASB1、CHIP。
在一些可选地实施方式中,第二多肽为具有E3泛素连接酶活性的SPOP蛋白结构域,其氨基酸序列包含如SEQ ID NO:12所示的氨基酸序列,或者如SEQ ID NO:12所示的氨基酸序列经过取代、重复、缺失或添加一个或多个氨基酸,且具有E3泛素连接酶活性的突变体。
在一些可选的实施方式中,编码第二多肽的编码区序列包含如SEQ ID NO:13所示的核苷酸序列,或与SEQ ID NO:13所示的核苷酸序列具有80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%序列同一性的序列,且编码具有E3泛素连接酶活性的蛋白的突变体。
在另外一些实施方式中,第二多肽还可以是具有E3泛素连接酶活性的βTrCP、FBW7、SKP2、CRBN、DDB2、SOCS2、ASB1、CHIP、SPOP、VHL等等的蛋白结构域。
在一些实施方式中,所述重组多肽还包含连接所述第一多肽与所述第二多肽的连接肽。利用连接肽对第一多肽和第二多肽进行连接,以优化重组多肽的空间构象,保证其靶向结合目标蛋白的蛋白活性和E3泛素连接酶的酶活性。
在一些可选地实施方式中,连接肽的氨基酸序列包含如SEQ ID NO:10所示的氨基酸序列,或者如SEQ ID NO:10或65所示的氨基酸序列经过取代、重复、缺失或添加一个或多个氨基酸,且具有连接肽活性的突变体。
在一些可选的实施方式中,编码SEQ ID NO:10所示连接肽的编码区序列包含如SEQ ID NO:11所示的核苷酸序列,或与SEQ ID NO:11所示的核苷酸序列具有80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%序列同一性的序列,且编码具有连接肽活性的蛋白的突变体。
在一些具体的实施方式中,重组多肽具有如下任一项所示的结构:
(1)N-EGFP(第一多肽)-连接肽-SPOP(第二多肽)-C
(2)N-CON1(第一多肽)-连接肽-SPOP(第二多肽)-C
(3)N-βTrCP(第二多肽)-连接肽-K19(第一多肽)-C
(4)N-FBW7(第二多肽)-连接肽-K19(第一多肽)-C
(5)N-SKP2(第二多肽)-连接肽-K19(第一多肽)-C
(6)N-CRBN(第二多肽)-连接肽-K19(第一多肽)-C
(7)N-DDB2(第二多肽)-连接肽-K19(第一多肽)-C
(8)N-K19(第一多肽)-连接肽-SOCS2(第二多肽)-C
(9)N-K19(第一多肽)-连接肽-ASB1(第二多肽)-C
(10)N-K19(第一多肽)-连接肽-CHIP(第二多肽)-C
(11)N-K19(第一多肽)-连接肽-SPOP(第二多肽)-C
(12)N-K19(第一多肽)-连接肽-VHL(第二多肽)-C
其中,如(1)所示结构的重组多肽具有如SEQ ID NO:34所示的氨基酸序列,或者如SEQ ID NO:34所示的氨基酸序列经过取代、重复、缺失或添加一个或多个氨基酸,且具有SEQ ID NO:34所示多肽活性的突变体。该重组多肽利用第一多肽靶向结合EGFP蛋白后,利用第二多肽的E3泛素连接酶活性实现对EGFP蛋白的靶向降解。
如(2)所示结构的重组多肽具有如SEQ ID NO:35所示的氨基酸序列,或者如SEQID NO:35所示的氨基酸序列经过取代、重复、缺失或添加一个或多个氨基酸,且具有SEQ IDNO:35所示多肽活性的突变体。该重组多肽利用第一多肽靶向结合PCNA蛋白后,利用第二多肽的E3泛素连接酶活性实现对PCNA蛋白的靶向降解。
如(3)所示结构的重组多肽具有如SEQ ID NO:36所示的氨基酸序列,或者如SEQID NO:36所示的氨基酸序列经过取代、重复、缺失或添加一个或多个氨基酸,且具有SEQ IDNO:36所示多肽活性的突变体。该重组多肽利用第一多肽靶向结合KRAS蛋白后,利用第二多肽的E3泛素连接酶活性实现对KRAS蛋白的靶向降解。
如(4)所示结构的重组多肽具有如SEQ ID NO:37所示的氨基酸序列,或者如SEQID NO:37所示的氨基酸序列经过取代、重复、缺失或添加一个或多个氨基酸,且具有SEQ IDNO:37所示多肽活性的突变体。该重组多肽利用第一多肽靶向结合KRAS蛋白后,利用第二多肽的E3泛素连接酶活性实现对KRAS蛋白的靶向降解。
如(5)所示结构的重组多肽具有如SEQ ID NO:38所示的氨基酸序列,或者如SEQID NO:38所示的氨基酸序列经过取代、重复、缺失或添加一个或多个氨基酸,且具有SEQ IDNO:38所示多肽活性的突变体。该重组多肽利用第一多肽靶向结合KRAS蛋白后,利用第二多肽的E3泛素连接酶活性实现对KRAS蛋白的靶向降解。
如(6)所示结构的重组多肽具有如SEQ ID NO:39所示的氨基酸序列,或者如SEQID NO:39所示的氨基酸序列经过取代、重复、缺失或添加一个或多个氨基酸,且具有SEQ IDNO:39所示多肽活性的突变体。该重组多肽利用第一多肽靶向结合KRAS蛋白后,利用第二多肽的E3泛素连接酶活性实现对KRAS蛋白的靶向降解。
如(7)所示结构的重组多肽具有如SEQ ID NO:40所示的氨基酸序列,或者如SEQID NO:40所示的氨基酸序列经过取代、重复、缺失或添加一个或多个氨基酸,且具有SEQ IDNO:40所示多肽活性的突变体。该重组多肽利用第一多肽靶向结合KRAS蛋白后,利用第二多肽的E3泛素连接酶活性实现对KRAS蛋白的靶向降解。
如(8)所示结构的重组多肽具有如SEQ ID NO:41所示的氨基酸序列,或者如SEQID NO:41所示的氨基酸序列经过取代、重复、缺失或添加一个或多个氨基酸,且具有SEQ IDNO:41所示多肽活性的突变体。该重组多肽利用第一多肽靶向结合KRAS蛋白后,利用第二多肽的E3泛素连接酶活性实现对KRAS蛋白的靶向降解。
如(9)所示结构的重组多肽具有如SEQ ID NO:42所示的氨基酸序列,或者如SEQID NO:42所示的氨基酸序列经过取代、重复、缺失或添加一个或多个氨基酸,且具有SEQ IDNO:42所示多肽活性的突变体。该重组多肽利用第一多肽靶向结合KRAS蛋白后,利用第二多肽的E3泛素连接酶活性实现对KRAS蛋白的靶向降解。
如(10)所示结构的重组多肽具有如SEQ ID NO:43所示的氨基酸序列,或者如SEQID NO:43所示的氨基酸序列经过取代、重复、缺失或添加一个或多个氨基酸,且具有SEQ IDNO:43所示多肽活性的突变体。该重组多肽利用第一多肽靶向结合KRAS蛋白后,利用第二多肽的E3泛素连接酶活性实现对KRAS蛋白的靶向降解。
如(11)所示结构的重组多肽具有如SEQ ID NO:44所示的氨基酸序列,或者如SEQID NO:44所示的氨基酸序列经过取代、重复、缺失或添加一个或多个氨基酸,且具有SEQ IDNO:44所示多肽活性的突变体。该重组多肽利用第一多肽靶向结合KRAS蛋白后,利用第二多肽的E3泛素连接酶活性实现对KRAS蛋白的靶向降解。
如(12)所示结构的重组多肽具有如SEQ ID NO:45所示的氨基酸序列,或者如SEQID NO:45所示的氨基酸序列经过取代、重复、缺失或添加一个或多个氨基酸,且具有SEQ IDNO:45所示多肽活性的突变体。该重组多肽利用第一多肽靶向结合KRAS蛋白后,利用第二多肽的E3泛素连接酶活性实现对KRAS蛋白的靶向降解。
本公开的环状RNA分子,有效解决了蛋白靶向降解嵌合体难以实现胞内递送、无法有效发挥作用的问题。编码第一多肽与第二多肽的嵌合体,其中第二多肽具有E3泛素连接酶的酶活性,不受细胞内E3泛素连接酶的限制,具有降解效率高、稳定性好的优势。
在一些实施方式中,环状RNA分子包括编码所述重组多肽的编码区序列,和与所述编码区序列可操作地连接的IRES序列。本公开中的IRES序列来源包括但不限于柯萨奇病毒、埃可病毒(Echovirus)、Taura综合征病毒、吸血猎蝽病毒、泰累尔氏脑脊髓炎病毒、猿猴病毒40、红火蚁病毒1、禾谷缢管蚜病毒、网状内皮增生症病毒、福曼脊髓灰质炎病毒1、大豆尺蠖病毒、克什米尔蜂病毒、人鼻病毒2、琉璃叶蝉病毒-1、人免疫缺陷病毒1型、琉璃叶蝉病毒-1、虱P病毒、丙型肝炎病毒、甲型肝炎病毒、GB型肝炎病毒、口蹄疫病毒、人肠道病毒71、马鼻病毒、茶尺蠖样病毒、脑心肌炎病毒(EMCV)、果蝇C病毒、十字花科烟草病毒、蟋蟀麻痹病毒、牛病毒性腹泻病毒1、黑皇后细胞病毒、蚜虫致死麻痹病毒、禽脑脊髓炎病毒、急性蜂麻痹病毒、芙蓉枯黄环斑病毒、猪瘟病毒、人类FGF2、人类SFTPA1、人类AMLl/RUNXl、果蝇触角、人类AQP4、人类AT1R、人类BAG-1、人类BCL2、人类BiP、人类c-IAPl、人类c-myc、人类eIF4G、小鼠NDST4L、人类LEF1、小鼠HIF1α、人类n.myc、小鼠Gtx、人类p27kipl、人类PDGF2/c-sis、人类p53、人类Pim-1、小鼠Rbm3、果蝇reaper、犬Scamper、果蝇Ubx、人类UNR、小鼠UtrA、人类VEGF-A、人类XIAP、果蝇hairless、酿酒酵母TFIID、酿酒酵母YAP1、人类c-src、人类FGF-1、猿猴小核糖核酸病毒等等。
在一些优选地实施方式中,IRES序列包含如SEQ ID NO:14-20任一序列所组成的组中的一种或多种序列的核苷酸序列具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%序列同一性的序列。在一些实施方案中,IRES序列为SEQ ID NO:14所示核苷酸序列的CVB3 IRES、SEQ ID NO:15所示核苷酸序列的EV24 IRES、SEQ ID NO:16所示核苷酸序列的EV29 IRES、SEQ ID NO:17所示核苷酸序列的EV33 IRES。在一些实施方案中,IRES序列包含CVB3v IRES与EV24 IRES、EV29 IRES和EV33 IRES中任意一种的嵌合体序列。在一些实施方式中,IRES序列包含CVB3v与EV24 IRES的嵌合体序列,其核苷酸序列如SEQ ID NO:18所示。在一些实施方式中,IRES序列包含CVB3v与EV29IRES的嵌合体序列,其核苷酸序列如SEQ ID NO:19所示。在一些实施方式中,IRES序列包含CVB3v与EV33 IRES的嵌合体序列,其核苷酸序列如SEQ ID NO:20所示。本公开的IRES序列能够实现重组多肽的高效、持久表达,有效提高环状RNA分子靶向降解目标蛋白的活性。
在一些优选地实施方式中,环状RNA分子还包括位于IRES序列上游的第二外显子序列,第二外显子(E2)序列为与SEQ ID NO:22所示的核苷酸序列相比具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%序列同一性的序列。
在一些优选地实施方式中,环状RNA分子还包括位于编码区序列下游的第一外显子序列,第一外显子(E1)序列为与SEQ ID NO:21所示的核苷酸序列相比具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%序列同一性的序列。
在一些优选地实施方案中,环状RNA分子包括5’间隔区和3’间隔区,其中5’间隔区序列位于第二外显子E2序列与IRES序列之间,3’间隔区序列位于第一外显子E1序列与编码区序列之间。具体的,5’间隔区序列为与SEQ ID NO:23-24任一序列所示的核苷酸序列相比具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%序列同一性的序列。3’间隔区序列为与SEQID NO:25-26任一序列所示的核苷酸序列相比具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%序列同一性的序列。环状RNA分子中的特定序列的5’间隔区和3’间隔区原件可以进一步延长编码区表达目标多肽的时间,提高重组多肽的表达效率。
在一些具体地实施方式,环状RNA分子包括顺次连接的如下所示序列:第二外显子序列、5’间隔序列、IRES序列、编码区序列、3’间隔序列和第一外显子序列。
在一些具体地实施方式,本公开提供了一种靶向降解EGFP蛋白的环状RNA分子,其编码如(1)所示结构的重组多肽,环状RNA分子的核苷酸序列如SEQ ID NO:2所示,与靶向降解EGFP蛋白的线性RNA分子(核苷酸序列如SEQ ID NO:2所示)相比,环状RNA分子具有更加显著的蛋白降解效果;并且,随着时间的延长,环状RNA分子降解细胞内蛋白的优势效果更加明显。
在一些具体地实施方式,本公开提供了一种靶向降解PCNA蛋白的环状RNA分子,其编码如(2)所示结构的重组多肽,环状RNA分子的核苷酸序列如SEQ ID NO:4,通过与编码不具有E3泛素连接酶活性的重组多肽的环状RNA分子(核苷酸序列如SEQ ID NO:5所示)相比,以及与编码不能靶向结合PCNA蛋白的重组多肽的环状RNA分子(核苷酸序列如SEQ ID NO:6所示)相比,证明了SEQ ID NO:4所示序列的环状RNA分子能够有效降解细胞内的PCNA蛋白水平,具有优异的蛋白降解效果。
在一些具体地实施方式中,通过向活体肿瘤组织内注射SEQ ID NO:2所示序列的环状RNA分子,发现能够显著降低GFP阳性细胞比例,说明本公开的环状RNA分子适于向体内递送,能够在体内发挥蛋白降解作用。在一些具体的实施方式中,通过向活体肿瘤组织内注射SEQ ID NO:4所示序列的环状RNA分子,发现肿瘤体积减小、增长速度被抑制,说明本公开的环状RNA分子能对活体肿瘤发挥明显的治疗效果。
在一些具体地实施方式,本公开提供了一种靶向降解KRAS蛋白的环状RNA分子,其编码如(3)所示结构的重组多肽,环状RNA分子的核苷酸序列如SEQ ID NO:46,通过编码靶向结合KRAS蛋白并具有E3泛素连接酶活性的重组多肽,利用E3泛素连接酶的酶活性将KRAS蛋白泛素化,能够实现对目标蛋白的高效、特异性降解。
在一些具体地实施方式,本公开提供了一种靶向降解KRAS蛋白的环状RNA分子,其编码如(4)所示结构的重组多肽,环状RNA分子的核苷酸序列如SEQ ID NO:47,通过编码靶向结合KRAS蛋白并具有E3泛素连接酶活性的重组多肽,利用E3泛素连接酶的酶活性将KRAS蛋白泛素化,能够实现对目标蛋白的高效、特异性降解。
在一些具体地实施方式,本公开提供了一种靶向降解KRAS蛋白的环状RNA分子,其编码如(5)所示结构的重组多肽,环状RNA分子的核苷酸序列如SEQ ID NO:48,通过编码靶向结合KRAS蛋白并具有E3泛素连接酶活性的重组多肽,利用E3泛素连接酶的酶活性将KRAS蛋白泛素化,能够实现对目标蛋白的高效、特异性降解。
在一些具体地实施方式,本公开提供了一种靶向降解KRAS蛋白的环状RNA分子,其编码如(6)所示结构的重组多肽,环状RNA分子的核苷酸序列如SEQ ID NO:49,通过编码靶向结合KRAS蛋白并具有E3泛素连接酶活性的重组多肽,利用E3泛素连接酶的酶活性将KRAS蛋白泛素化,能够实现对目标蛋白的高效、特异性降解。
在一些具体地实施方式,本公开提供了一种靶向降解KRAS蛋白的环状RNA分子,其编码如(7)所示结构的重组多肽,环状RNA分子的核苷酸序列如SEQ ID NO:50,通过编码靶向结合KRAS蛋白并具有E3泛素连接酶活性的重组多肽,利用E3泛素连接酶的酶活性将KRAS蛋白泛素化,能够实现对目标蛋白的高效、特异性降解。
在一些具体地实施方式,本公开提供了一种靶向降解KRAS蛋白的环状RNA分子,其编码如(8)所示结构的重组多肽,环状RNA分子的核苷酸序列如SEQ ID NO:51,通过编码靶向结合KRAS蛋白并具有E3泛素连接酶活性的重组多肽,利用E3泛素连接酶的酶活性将KRAS蛋白泛素化,能够实现对目标蛋白的高效、特异性降解。
在一些具体地实施方式,本公开提供了一种靶向降解KRAS蛋白的环状RNA分子,其编码如(9)所示结构的重组多肽,环状RNA分子的核苷酸序列如SEQ ID NO:52,通过编码靶向结合KRAS蛋白并具有E3泛素连接酶活性的重组多肽,利用E3泛素连接酶的酶活性将KRAS蛋白泛素化,能够实现对目标蛋白的高效、特异性降解。
在一些具体地实施方式,本公开提供了一种靶向降解KRAS蛋白的环状RNA分子,其编码如(10)所示结构的重组多肽,环状RNA分子的核苷酸序列如SEQ ID NO:53,通过编码靶向结合KRAS蛋白并具有E3泛素连接酶活性的重组多肽,利用E3泛素连接酶的酶活性将KRAS蛋白泛素化,能够实现对目标蛋白的高效、特异性降解。
在一些具体地实施方式,本公开提供了一种靶向降解KRAS蛋白的环状RNA分子,其编码如(11)所示结构的重组多肽,环状RNA分子的核苷酸序列如SEQ ID NO:54,通过编码靶向结合KRAS蛋白并具有E3泛素连接酶活性的重组多肽,利用E3泛素连接酶的酶活性将KRAS蛋白泛素化,能够实现对目标蛋白的高效、特异性降解。
在一些具体地实施方式,本公开提供了一种靶向降解KRAS蛋白的环状RNA分子,其编码如(12)所示结构的重组多肽,环状RNA分子的核苷酸序列如SEQ ID NO:55,通过编码靶向结合KRAS蛋白并具有E3泛素连接酶活性的重组多肽,利用E3泛素连接酶的酶活性将KRAS蛋白泛素化,能够实现对目标蛋白的高效、特异性降解。
在一些实施方式中,本公开提供了一种环化前体RNA分子,能够环化形成上述的环状RNA分子。
在一些优选地实施方式中,环化前体RNA分子还包括位于第二外显子序列上游的5’同源臂序列,5’同源臂序列为与SEQ ID NO:29-30任一序列所示的核苷酸序列相比具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%序列同一性的序列。
在一些优选地实施方式中,环化前体RNA分子还包括位于第一外显子序列下游的3’同源臂序列。3’同源臂序列为与SEQ ID NO:31-32任一序列所示的核苷酸序列相比具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%序列同一性的序列。
在一些优选地实施方式中,环化前体RNA分子还包括位于第二外显子序列与5’同源臂序列之间的3’内含子序列,3’内含子序列为与SEQ ID NO:28所示的核苷酸序列相比具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%序列同一性的序列。
在一些优选地实施方式中,环化前体RNA分子还包括位于第一外显子序列与3’同源臂序列之间的5’内含子序列,5’内含子序列为与SEQ ID NO:27所示的核苷酸序列相比具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%序列同一性的序列。
在一些具体地实施方式,环化前体RNA分子包括顺次连接的如下所示序列:
5’同源臂序列、3’内含子序列、第二外显子序列、5’间隔区序列、IRES序列、编码区序列、3’间隔区序列、第一外显子序列、5’内含子序列和3’同源臂序列。
环化前体RNA分子通过如下过程成环:利用内含子的核酶特性,在GTP的引发下,5’内含子与第一外显子的连接处发生断裂;第一外显子的核酶裂口进一步攻击3’内含子与第二外显子的连接处,使该处发生断裂,3’内含子解离,第一外显子和第二外显子连接形成环状RNA。
在一些实施方式中,本公开提供了一种重组核酸分子,能够转录形成上述的环化前体RNA分子。为使重组核酸分子能够进一步转录形成RNA分子,在重组核酸分子中还可以包含调控序列。示例性的,调控序列为连接于5’同源臂上游的T7启动子。
在一些实施方案中,本公开提供了一种重组表达载体,包含上述的重组核酸分子。其中,连接重组核酸分子的载体可以是本领域常用的各类载体,例如pUC57质粒等。进一步的重组核酸分子中包含限制性酶切位点,使重组表达载体经酶切后得到适于转录的线性化载体。
组合物
本公开提供的组合物包括根据本公开所述的环状RNA,具有优异的蛋白靶向降解活性,组合物适于向体内递送,能够解决目前Bio-PROTACS分子无法实现靶向降解体内的目标蛋白的问题。
在一些实施方式中,组合物中还包括一种或多种药学上可接受的载体。在本公开中,使用组合物的目的在于促进针对生物体的给药,有利于活性成分的吸收,进而发挥生物活性。本发明的组合物可以通过任何形式给药,包括注射(动脉内、静脉内、肌肉内、腹膜内、皮下)、粘膜、口服(口服固体制剂、口服液体制剂)、直肠、吸入、植入、局部(例如眼部)给药等。口服固体制剂的非限制性实例包括但不限于散剂、胶囊剂、锭剂、颗粒剂、片剂等。口服或粘膜给药的液体制剂的非限制性实例包括但不限于混悬剂、酊剂、酏剂、溶液剂等。局部给药制剂的非限制性实例包括但不限于乳剂、凝胶剂、软膏剂、乳膏剂、贴剂、糊剂、泡沫剂、洗剂、滴剂或血清制剂。胃肠外给药制剂的非限制性实例包括但不限于注射用溶液剂、注射用干粉剂、注射用悬浮液、注射用乳剂等。本发明的组合物还可以制成控制释放或延迟释放剂型(例如脂质体或微球)。
在本公开中,施用途经能够以任何适用的方式进行变化或调整,以满足药物的性质、患者和医务人员的便利以及其它相关因素的需求。
在一些优选地实施方式中,组合物仅由环状RNA分子,及溶解环状RNA分子的溶剂组成。示例性的,溶剂为1xTE buffer或其他任意类型的能够溶解环状RNA分子的溶剂。本公开意外地发现,本公开中的环状RNA分子,不需要以脂质纳米粒(lipid nanoparticle,LNP)等对环状RNA进行包裹,即具有高的稳定性,在递送至体内后能充分发挥针对目标蛋白的靶向降解活性,能够实现对疾病相关蛋白的特异、高效降解,从而达到疾病治疗的效果。
环状RNA或组合物的用途
在一些实施方式中,本公开提供了环状RNA分子或包含环状RNA分子的组合物在目标蛋白的靶向降解中的用途。本公开首次实现了以环状RNA分子递送至胞内,靶向降解目标蛋白。与小分子蛋白靶向降解嵌合体或大分子Bio-PROTACs相比,本公开中的环状RNA分子易于向胞内递送,能够实现胞内高效率的目标蛋白降解。与线性mRNA相比,本公开中的环状RNA分子有更好的蛋白翻译水平与表达持久性,蛋白降解效果更为显著。
在一些优选地实施方式中,本公开提供了环状RNA分子或包含环状RNA分子的组合物在受试者体内的目标蛋白的靶向降解。本公开意外地发现,环状RNA分子在施用于受试者的活体肿瘤后,有效抑制了肿瘤的生长,证明了环状RNA分子具有优异的体内蛋白靶向降解的活性,完整解决Bio-PROTACs无法实现体内蛋白降解的问题。
在一些实施方式中,本公开提供了环状RNA分子或包含环状RNA分子的组合物在降低或消除目标蛋白的表达中的用途。本公开中的环状RNA分子具有显著改善的胞内蛋白降解活性,适用于作为或制备目标蛋白的靶向降解的试剂,特别是作为或制备受试者体内的目标蛋白的靶向降解的试剂。
在一些实施方式中,本公开提供了环状RNA分子或包含环状RNA分子的组合物在作为或制备治疗疾病的药物中的用途。环状RNA分子在施用于受试者体内后,能够实现对疾病相关蛋白的特异、高效降解,从而达到疾病治疗的效果。
在一些优选地实施方式中,本公开提供了环状RNA分子或包含环状RNA分子的组合物在作为或制备治疗肿瘤的药物中的用途。本公开首次以环状RNA分子瘤内注射裸鼠肿瘤模型,成功实现肿瘤生长抑制,首次证实环状RNA分子能应用于肿瘤治疗,具有重要医药应用前景。
实施例
本公开的其他目的、特征和优点将从以下详细描述中变得明显。但是,应当理解的是,详细描述和具体实施例(虽然表示本公开的具体实施方式)仅为解释性目的而给出,因为在阅读该详细说明后,在本公开的精神和范围内所作出的各种改变和修饰,对于本领域技术人员来说将变得显而易见。
本实施例中所用到的实验技术与实验方法,如无特殊说明均为常规技术方法,例如下列实施例中未注明具体条件的实验方法,通常按照常规条件如Sambrook等人,分子克隆:实验室手册(New York:Cold Spring Harbor Laboratory Press,1989)中所述的条件,或按照制造厂商所建议的条件。实施例中所使用的材料、试剂等,如无特殊说明,均可通过正规商业渠道获得。
实施例1:基于环状RNA编码的靶向EGFP蛋白降解的融合蛋白在293T细胞降解效果验证
1.1实验方法与步骤:
(1)EV29-H2B-EGFP等质粒构建
构建含有表达H2B-EGFP和靶向H2B-EGFP蛋白降解的目的基因,该步骤委托苏州金唯智生物科技有限公司进行基因合成与克隆。此处所使用的构建环状RNA的DNA载体,包含T7启动子,5’同源臂,3’内含子,第二外显子E2,5’间隔区,IRES元件,H2B-EGFP与靶向EGFP蛋白降解的序列编码区,下游间隔区,5’内含子,第一外显子E1,3’同源臂,以及可用于质粒线性化的酶切位点XbaI。对于线性mRNA TRNP-EGFP-DASP所得基因片段连接到pUC57载体。
表1
蛋白序列名称 RNA序列名称 质粒名称 RNA序列
H2B-EGFP EV29-H2B-EGFP pUC57-EV29-H2B-EGFP SEQ.ID No:1
EGFP-DASP EV29-EGFP-DASP pUC57-EV29-EGFP-DASP SEQ.ID No:2
EGFP-DASP TRNP-EGFP-DASP pUC57-TRNP-EGFP-DASP SEQ.ID No:3
(2)EV29-H2B-EGFP等体外转录线性质粒模板制备
1)质粒抽提
①将外部合成的穿刺菌活化,条件37℃/220rpm/3~4h;
②取活化菌液扩大培养,培养条件:37℃/220rpm/过夜;
③质粒抽提(天根无内毒素小量中提试剂盒),测定OD值。
2)质粒酶切
采取Xba I单酶切的方法酶切上述1)制备质粒
酶切体系如下:
表2
试剂 体积
质粒 10μg
酶(1000units) 5μl
10x cutsmart buffer 30μl
Nuclease free,H2O Total 300μl
37℃下酶切过夜:采用直接过柱(天根通用型DNA胶回收试剂盒)的方法回收酶切产物,测定OD值和1%琼脂糖凝胶电泳鉴定产物;纯化的线性质粒模板用于体外转录。
(3)环状mRNA合成
1)采用体外转录的方法合成mRNA
转录体系如下:
表3
试剂 体积
10xReaction Buffer 2μl
ATP(20mM) 2μl
CTP(20mM) 2μl
UTP(20mM) 2μl
GTP(20mM) 2μl
Xba I单酶切线性化DNA Xμl(500-1000ng)
T7 RNAPolymerase 2μl
RNA inhibitor 2μl
RNA Nuclease free,H2O Total 20μl
37℃孵育2-3h,然后将20μl转录体系,用2μl DNaseI消化以去除线性DNA模板,消化条件:37℃消化15min。
2)mRNA纯化
将上述1)所得转录产物,使用硅膜离心柱法纯化(Thermo,GeneJET RNAPurification Kit),测定OD值及1%变性琼脂糖凝胶电泳鉴定RNA大小。
3)mRNA环化:
环化试剂:GTP Buffer:50mM Tris-HCl,10mM MgCl2,1mM DTT,pH 7.5左右
环化体系与条件:
表4
溶液 体积
mRNA 25μg RNA溶液
GTP solution(20mM) 50μl
GTP buffer 补足至500μl
将上述溶液于55℃加热15min,环化RNA产物使用硅膜离心柱法纯化(Thermo,GeneJET RNA Purification Kit),测定OD值。
(4)线性mRNA的合成
pUC57-TRNP-EGFP-DASP质粒酶切线性化及模板纯化方法同(2)-2)。采用APExBio试剂盒HyperScribeTMAll in One mRNA Synthesis Kit II通过体外转录合成Cap1结构的线性mRNA,采用假尿嘧啶进行核苷修饰。最终得到Cap1结构,带PolyA尾且具有假尿嘧啶核苷修饰的线性mRNA。
(5)细胞培养与转染:
1)细胞培养:
293T接种于含有10%胎牛血清,1%双抗的DMEM高糖培养基中,于37℃,5%CO2培养箱中培养。细胞每隔2-3天进行传代培养。
2)细胞转染:
转染前将293T细胞以1×105个/孔接种于24孔板中,于37℃,5%CO2培养箱中培养。待细胞达到70-90%融合度后,使用Lipofectamine MessengerMax(Invitrogen)转染试剂,先转染不同质量的EV29-H2B-EGFP mRNA,6小时后再以不同比例转染EV29-EGFP-DASP mRNA或EGFP-DASP线性mRNA至293T细胞,具体操作如下:
①稀释MessengerMAXTM Reagent
表5
试剂 体积/孔
MEM无血清培养基 25μl
Messenger MAX<sup>TM</sup> Reagent 0.75μl
稀释混合后,室温静置孵育10min。
②稀释mRNA
表6
试剂 体积/孔
mRNA 按照实际转染量计算
MEM无血清培养基 补足至25μl
③取混合稀释后的MessengerMAXTM Reagent和mRNA(1:1)
表7
试剂 体积/孔
稀释的Messenger MAX<sup>TM</sup> Reagent 25μl
稀释的mRNA 25μl
稀释混合后,室温静置孵育5min。
④吸取上述混合液50μl贴壁缓缓加入24孔板中,37℃、5%CO2培养箱中孵育培养。
3)EGFP蛋白表达检测
①细胞荧光观察:将转染后24小时和48小时的293T细胞于200×荧光显微镜下观察EGFP的表达情况。
②流式细胞术检测细胞平均荧光强度:将转染后24小时和48小时293T细胞用流式细胞仪检测细胞平均荧光强度。
1.2实验结果
1)DNA转录模板制备
①质粒提取浓度:pUC57-EV29-H2B-EGFP:557.8ng/μl,pUC57-EV29-EGFP-DASP:565.2ng/μl;
②质粒酶切线性化浓度:pUC57-EV29-H2B-EGFP:148ng/μl,pUC57-EV29-EGFP-DASP:142.3ng/μl;
2)mRNA转录与环化
①mRNA转录纯化后浓度:EV29-H2B-EGFP:914.4ng/μl,EV29-EGFP-DASP:491.8ng/μl;
②mRNA环化纯化后浓度:EV29-H2B-EGFP:201ng/μl,EV29-EGFP-DASP:108ng/μl;
③体外转录纯化获得EGFP-DASP的Cap1帽结构,假尿嘧啶修饰核苷的线性mRNA97ng/μl。
3)蛋白表达检测
如图1(转染后48小时的H2B-EGFP荧光)与图2(流式细胞定量)所示:荧光观察与流式细胞检测数据显示初始转染EV29-H2B-eGFP mRNA 50ng、100ng、200ng、400ng时,随着转染量的增大,EGFP蛋白表达荧光强度越高,在此基础上转染EV29-EGFP-DASP mRNA后,EGFP蛋白荧光强度显著下降,且随着转染的EV29-EGFP-DASP mRNA量增大荧光强度减弱。说明EV29-EGFP-DASP翻译的蛋白质可以实现对H2B-EGFP蛋白的降解作用。如图3所示,比较同样数量(转染数量同为1μg)的编码相同Bio-PROTACs的线性mRNA与环状mRNA对H2B-EGFP(转染mRNA数量为400ng)蛋白降解的效应,发现环状mRNA对H2B-EGFP的蛋白降解作用显著优于线性mRNA,且随着时间延长(至72小时),环状mRNA的蛋白降解优势进一步加大。
实施例2:基于环状RNA编码的靶向PCNA蛋白降解的融合蛋白在A549细胞降解效果验证
2.1实验方法与步骤
(1)EV29-CON1-SP-WT等质粒构建
在上述实施例1的基础上,采用与上述实施例1相同的环状RNA元件,构建编码靶向PCNA蛋白降解的融合蛋白基因序列EV29-CON1-SP-WT,以及功能缺失的融合蛋白基因序列pUC57-EV29-CON1-SP-mu与pUC57-EV29-CON1-mu-SP,信息如下所示。DNA合成委托苏州金唯智生物科技有限公司完成。
表8
蛋白序列名称 RNA序列名称 质粒名称 RNASEQ.ID
CON1-SP-WT EV29-CON1-SP-WT pUC57-EV29-CON1-SP-WT SEQ.ID No:4
CON1-SP-mu EV29-CON1-SP-mu pUC57-EV29-CON1-SP-mu SEQ.ID No:5
CON1-mu-SP EV29-CON1-mu-SP pUC57-EV29-CON1-mu-SP SEQ.ID No:6
(2)质粒DNA线性化,环化前体mRNA体外转录,环化前体mRNA纯化,mRNA的成环反应,环状mRNA的纯化,细胞培养与转染等方法均与实施例1的1.1相同,细胞类型更换为表达PCNA的肿瘤细胞系A549。
(3)Western Blot检测细胞pCNA蛋白水平
1)SDS-PAGE胶配制
按以下表格配制所需浓度凝胶:
表9
Figure BDA0003186654190000221
加入TEMED后加入TEMED后立即混匀,缓缓加入两玻璃板间的胶床中,然后胶上加一层水;待下层分离胶凝固(水和胶之间可看到一条折射线)后倒出上层水层,按以下表格配制所需体积的上层浓缩胶:
表10
Figure BDA0003186654190000222
加入TEMED后加入TEMED后立即混匀,缓缓加入浓缩胶将剩余空间灌满后将梳子插入浓缩胶中,待上层浓缩胶凝固后可进行电泳
1)蛋白样品上样及电泳
蛋白样品上样前进行变性处理:向蛋白样品中加入5×SDS Loading至终浓度为1×,充分混匀后于95℃加热5min;上样后进行电泳:恒压100V电泳20min后将电压改为120V进行电泳,至目的条带充分分离开后即可终止电泳,进行转膜。
2)转膜
根据蛋白样品上样及检测范围裁剪出适当大小的PVDF膜,将膜置于甲醇溶液中浸泡数分钟;将电泳完成后的胶板取出,剥掉多余的胶后放于滤纸上,以夹板负极-海绵垫-滤纸-凝胶-PVDF膜-滤纸-海绵垫-夹板正极的顺序放入转膜槽中,200mA恒流转膜1.5小时,电转移时会产热,需将槽子周围放置冰块进行降温。
3)免疫反应
转膜完成后将膜转移至含有封闭液(封闭液为TBST配制的5%牛奶)的平皿中,室温下摇床摇动封闭1小时;将一抗用5%牛奶稀释为适当的工作浓度,加入到平皿中,以可以覆盖住膜为佳,室温摇床孵育1-2h或4℃孵育过夜;用TBST在室温下脱色摇床上洗三次,每次10min;弃去TBST清洗液,将二抗用5%牛奶稀释为适当的工作浓度,加入到平皿中,以可以覆盖住膜为佳,室温摇床孵育1-2h;用TBST在室温下脱色摇床上洗三次,每次10min;
4)化学发光显影
将ECL的A和B两种试剂在EP管内等体积混合,然后均匀滴在PVDF膜的蛋白面,反应1-2min后显影;
2.2实验结果
1)DNA线性化模板制备
①质粒提取浓度:pUC57-EV29-CON1-SP-WT:404.4ng/μl,pUC57-EV29-CON1-SP-mu:775.8ng/μl,pUC57-EV29-CON1-mu-SP:563.4ng/μl;
②质粒酶切线性化浓度:pUC57-EV29-CON1-SP-WT:144.4ng/μl,pUC57-EV29-CON1-SP-mu:157.3ng/μl,pUC57-EV29-CON1-mu-SP:149.8ng/μl;
2)mRNA转录与环化
①mRNA转录纯化后浓度:EV29-CON1-SP-WT:1788.8ng/μl,EV29-CON1-SP-mu:1716.8ng/μl,EV29-CON1-mu-SP:1347.4ng/μl;
②mRNA环化纯化后浓度:EV29-CON1-SP-WT:2097.4ng/μl,EV29-CON1-SP-mu:2515.5ng/μl,EV29-CON1-mu-SP:2160ng/μl;
3)细胞转染后24小时检测PCNA蛋白表达水平:Western Blot结果显示(图4),与空白对照组(不转染环状RNA)和阴性对照组相比(转染编码丧失降解功能的环状RNA),转染EV29-CON1-SP-WT mRNA组的细胞中PCNA蛋白表达水平更低,表明EV29-CON1-SP-WT mRNA在A549细胞中可以实现对PCNA蛋白的降解作用。
实施例3:基于环状mRNA编码的靶向EGFP蛋白降解的融合蛋白在体内降解效果验证
3.1实验方法
1)质粒DNA线性化,环化前体mRNA体外转录,环化前体mRNA纯化,mRNA的成环反应,环状mRNA的纯化,细胞培养等方法均与实施例1的1.1相同,细胞类型更换为肿瘤细胞系A549。
2)细胞收集:使用0.25%胰蛋白酶-EDTA(Gibco)消化细胞,1000rpm离心5min,弃上清,将细胞于重悬于添加了Matrigel(Corning)的磷酸盐缓冲液,并细胞计数。
3)A549肿瘤模型:雌性CD-1Nude裸鼠(6-7周龄)皮下接种3×106个A549细胞,每周两次用游标卡尺测量肿瘤大小直至实验终结。当肿瘤大小达到约2000mm3或存在动物健康问题(肿瘤的20%面积溃疡)时,对动物实施安乐死。使用GraphPad Prism 8.0.2整理数据并绘制肿瘤生长曲线图。
4)环状RNA注射:造模两周后,每只老鼠瘤内注射20μg EV29-H2B-EGFP的环状RNA,并将裸鼠随机分为两组。6小时后,一组瘤内注射20μg编码GFP降解的环状RNA(EV29-GFP-DASP),另一组瘤内注射20μg对照mRNA(control),40小时后,将裸鼠安乐死,将肿瘤剥离。
5)单细胞悬液:置于含有DMEM基础培养基的24孔板中,并将24孔板放置在冰上。将DMEM基础培养基替换为5mL含有1mg/mL胶原蛋白酶IV(赛默飞)和100U/mL DnaseI的DMEM基础培养基,并用剪刀将肿瘤剪碎至约1mm3的小块。将肿瘤碎块和消化液一同转移到15mL离心管中,放在37度摇床孵育30分钟,转速为70r/min。消化结束后,向离心管中加入5mL含有10%灭活胎牛血清的DMEM完全培养基终止消化,过70um细胞筛网后,离心。
6)细胞荧光检测:制成的单细胞悬液,加入Fixable cell viability dye efluor780(赛默飞)的PBS溶液后,4度避光孵育20分钟,离心后,PBS溶液洗一遍后,以200μl PBS溶液重悬细胞,将死细胞进行染色。流式细胞仪检测分析每组肿瘤细胞GFP阳性细胞比例以及总细胞的GFP平均荧光强度。
3.2实验结果
如图5所示,瘤内注射降解GFP的环状RNA(EV29-EGFP-DASP)可以显著降低肿瘤里GFP阳性细胞的比例,并且降低GFP平均荧光强度。这一结果直观地说明了环状RNA可以在体内实现靶蛋白降解。
实施例4:基于环状mRNA编码的靶向PCNA蛋白降解的融合蛋白在体内降解效果验证
4.1实验方法
1)质粒DNA线性化,环化前体mRNA体外转录,环化前体mRNA纯化,mRNA的成环反应,环状mRNA的纯化,细胞培养等方法均与实施例2的2.1相同。
2)细胞收集,肿瘤造模等方法与实施例3的3.1相同。
3)肿瘤大约长到2mm×3mm左右,随机分为对照组和PCNA降解组,其中对照组n=5,PCNA降解组n=6。对照组为失去降解功能的EV29-CON1-SP-mu环状RNA,实验组为具备降解PCNA功能的EV29-CON1-SP-WT环状RNA。每隔2天瘤内注射10μg对照RNA或者PCNA降解RNA。给药的同时测量肿瘤体积,绘制肿瘤生长曲线。实验终止时,将裸鼠安乐死,剥离肿瘤拍照。
4.2实验结果
如图6结果所示:因肿瘤模型采用的是裸鼠模型以及人的非小细胞肺癌细胞系,而EV29-CON1-SP-WT mRNA靶向的是人的PCNA蛋白,在注射了该组RNA后,小鼠肿瘤体积增长速度渐缓,且显著小于注射阴性对照RNA组的肿瘤大小。该实验验证了环状RNA可以在体内降解靶蛋白,并且导致靶蛋白的功能受到影响。
实施例5:基于环状RNA编码的靶向KRAS蛋白降解的融合蛋白在H358细胞降解效果验证
实验方法与步骤:EV29-K19-VHK/VHKC等质粒构建
在上述实施例1的基础上,采用与上述实施例1相同的环状RNA元件,构建编码靶向KRAS蛋白降解的融合蛋白基因序列EV29-K19-VHK,以及E3连接酶VHL功能缺失的融合蛋白基因序列EV29-K19-VHKC,信息如下所示。DNA合成委托苏州金唯智生物科技有限公司完成。
表11
蛋白序列名称 RNA序列名称 质粒名称 RNA SEQ.ID
K19-VHK EV29-K19-VHK pUC57-EV29-K19-VHK SEQ.ID No:55
K19-VHKC EV29-K19-VHKC pUC57-EV29-K19-VHKC SEQ.ID No:56
质粒DNA线性化,环化前体mRNA体外转录,环化前体mRNA纯化,mRNA的成环反应,环状mRNA的纯化,细胞培养与转染等方法均与实施例1的1.1相同,细胞类型更换为表达KRAS的肿瘤细胞系H358。细胞转染,Western Blot的实验步骤同实施例2。细胞转染后的6小时、24小时、48小时分别采用Western Blot测试H358细胞的KRAS蛋白水平。结果如图7所示,转染环状RNA EV29-VHK的6、24小时后H358细胞的KRAS蛋白的水平出现显著下降,而转染环状RNA EV29-VHKC后H358细胞的KRAS水平未见显著改变,说明环状RNA EV29-VHK导致KRAS蛋白发生显著降解。
实施例6:环状RNA编码的不同E3连接酶构建的靶向KRAS蛋白降解的融合蛋白在H358细胞降解效果验证
实验方法与步骤:
在上述实施例1的基础上,采用与上述实施例1相同的环状RNA元件,构建编码靶向KRAS蛋白降解的融合蛋白基因序列EV29-βTrCP-K19、EV29-FBW7-K19、EV29-SKP2-K19、EV29-CRBN-K19、EV29-DDB2-K19、EV29-K19-SOCS2、EV29-K19-ASB1、EV29-K19-CHIP、EV29-K19-SPOP。信息如下表所示。DNA合成委托苏州金唯智生物科技有限公司完成。
表12
蛋白序列名称 RNA序列名称 质粒名称 RNA SEQ.ID
ΒTrCP-K19 EV29-βTrCP-K19 pUC57-EV29-βTrCP-K19 SEQ.ID No:36
FBW7-K19 EV29-FBW7-K19 pUC57-EV29-FBW7-K19 SEQ.ID No:37
SKP2-K19 EV29-SKP2-K19 pUC57-EV29-SKP2-K19 SEQ.ID No:38
CRBN-K19 EV29-CRBN-K19 pUC57-EV29-CRBN-K19 SEQ.ID No:39
DDB2-K19 EV29-DDB2-K19 pUC57-EV29-DDB2-K19 SEQ.ID No:40
K19-SOCS2 EV29-K19-SOCS2 pUC57-EV29-K19-SOCS2 SEQ.ID No:41
K19-ASB1 EV29-K19-ASB1 pUC57-EV29-K19-ASB1 SEQ.ID No:42
K19-CHIP EV29-K19-CHIP pUC57-EV29-K19-CHIP SEQ.ID No:43
K19-SPOP EV29-K19-SPOP pUC57-EV29-K19-SPOP SEQ.ID No:44
质粒DNA线性化,环化前体mRNA体外转录,环化前体mRNA纯化,mRNA的成环反应,环状mRNA的纯化,细胞培养与转染等方法均与实施例1的1.1相同,细胞类型更换为表达KRAS的肿瘤细胞系H358。细胞转染,Western Blot的实验步骤同实施例2。细胞转染后的6小时采用Western Blot测试H358细胞的KRAS蛋白水平。KRAS蛋白降解的效果如表13所示,以EV29-K19-VHKC的蛋白水平作为对照,计算不同的环状RNA转染后的KRAS蛋白水平百分比。实验结果显示,采用不同的E3连接酶构建的基于K19 KRAS结合蛋白的融合蛋白均实现对KRAS蛋白的降解。其中,采用E3连接酶βTrCP、SKP2、CRBN、CHIP、SPOP以及VHK取得较好的蛋白降解效果。
表13
RNA序列名称 KRAS蛋白水平百分比
EV29-βTrCP-K19 19.3%
EV29-FBW7-K19 45.9%
EV29-SKP2-K19 20.4%
EV29-CRBN-K19 28.2%
EV29-DDB2-K19 52.6%
EV29-K19-SOCS2 47.3%
EV29-K19-ASB1 39.8%
EV29-K19-CHIP 28.3%
EV29-K19-SPOP 22.4%
EV29-K19-VHK 26.8%
本公开的上述实施例仅是为清楚地说明本公开所作的举例,而并非是对本公开的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本公开的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本公开权利要求的保护范围之内。
序列表
<110> 江苏普瑞康生物医药科技有限公司
<120> 环状RNA分子及其在目标蛋白的靶向降解中的应用
<130> 6A23-2163722I-SU
<160> 57
<170> SIPOSequenceListing 1.0
<210> 1
<211> 2035
<212> RNA
<213> Artificial Sequence
<220>
<223> 环状RNA分子序列
<400> 1
aaaauccguu gaccuuaaac ggucgugugg guucaagucc cuccaccccc acgccggaaa 60
cgcaauagcc gaaaaaacaa aaacaaaaaa aacaaaaaaa caaaaaaaaa accaaaacac 120
auuaaaacag ccuguggguu gaucccaccc acagggccca cugggcgcua gcacucuggu 180
aucacgguac cuuugugcgc cuguuuuaua cuuccucccc caacugcaac uuagaaguaa 240
cacaaaccga ucaacaguca gcguggcaca ccagccacgu uuugaucaaa cacuucuguu 300
accccggacu gaguaucaau agacugcuca cgcgguugaa ggagaaaacg uucguuaucc 360
ggccaacuac uucgagaaac cuaguaacgc cauggaaguu guggaguguu ucgcucagca 420
cuaccccagu guagaucagg uugaugaguc accgcauucc ccacggguga ccguggcggu 480
ggcugcguug gcggccugcc cauggggaaa cccaugggac gcucuuauac agacauggug 540
cgaagagucu auugagcuag uugguagucc uccggccccu gaaugcggcu aaucccaacu 600
gcggagcaua cacucucaag ccagagggua gugugucgua augggcaacu cugcagcgga 660
accgacuacu uugggugucc guguuucauu uuauuccuau acuggcugcu uauggugaca 720
auugagagau uguuaccaua uagcuauugg auuggccauc cggugacuaa cagagcuauu 780
auauaucuuu uuguuggguu uauaccacuu agcuugaaag agguuaaaac ucuacauuac 840
auuuuaauac ugaacaccgc aaaaugcccg agcccgccaa gagcgccccc gcucccaaga 900
agggcagcaa gaaggccgug accaaggccc agaagaaggg cggcaagaaa aggaagagga 960
gcaggaagga gagcuacagc aucuacgugu acaaggugcu gaagcaggug caccccgaca 1020
ccggcaucag cagcaaggcc augggcauca ugaacagcuu cgugaacgac aucuucgaga 1080
ggaucgccgg cgaggccagc agacuggccc acuacaacaa gaggagcacc aucaccagca 1140
gagagaucca gaccgccgug agacugcugc ugcccggcga gcuggccaag cacgccguga 1200
gcgagggcac caaggccauc accaaguaca ccagcgccaa ggacccuccc guggccacca 1260
uggugagcaa gggcgaggag cuguucaccg gcguggugcc cauccuggug gagcuggacg 1320
gcgacgugaa cggccacaag uucagcguga gcggcgaggg agagggcgac gccaccuacg 1380
gcaagcugac ccugaaguuc aucugcacca ccggcaagcu gcccgugccc uggcccaccc 1440
uggugaccac ccugaccuac ggcgugcagu gcuucagcag guaccccgac cacaugaagc 1500
agcacgacuu cuucaagagc gccaugcccg agggcuacgu gcaggagagg accaucuucu 1560
ucaaggacga cggcaacuac aagaccaggg ccgaggugaa guucgagggc gacacccugg 1620
ugaacaggau cgagcugaag ggcaucgacu ucaaggagga cggcaacauc cugggccaca 1680
agcuggagua caacuacaau agccacaacg uguacaucau ggccgacaag cagaagaacg 1740
gcaucaaggu gaacuucaag aucaggcaca acaucgagga cggcagcgug cagcuggccg 1800
accacuacca gcagaacacc cccaucggcg acggccccgu gcugcugccc gacaaccacu 1860
accugagcac ccagagcgcc cugagcaagg accccaacga gaagagggac cacauggugc 1920
ugcuggaguu cgugaccgcc gccggcauca cccugggcau ggacgagcug uacaagugaa 1980
aaaaacaaaa aacaaaacgg cuauuaugcg uuaccggcga gacgcuacgg acuua 2035
<210> 2
<211> 2089
<212> RNA
<213> Artificial Sequence
<220>
<223> 环状RNA分子序列
<400> 2
aaaauccguu gaccuuaaac ggucgugugg guucaagucc cuccaccccc acgccggaaa 60
cgcaauagcc gaaaaaacaa aaacaaaaaa aacaaaaaaa caaaaaaaaa accaaaacac 120
auuaaaacag ccuguggguu gaucccaccc acagggccca cugggcgcua gcacucuggu 180
aucacgguac cuuugugcgc cuguuuuaua cuuccucccc caacugcaac uuagaaguaa 240
cacaaaccga ucaacaguca gcguggcaca ccagccacgu uuugaucaaa cacuucuguu 300
accccggacu gaguaucaau agacugcuca cgcgguugaa ggagaaaacg uucguuaucc 360
ggccaacuac uucgagaaac cuaguaacgc cauggaaguu guggaguguu ucgcucagca 420
cuaccccagu guagaucagg uugaugaguc accgcauucc ccacggguga ccguggcggu 480
ggcugcguug gcggccugcc cauggggaaa cccaugggac gcucuuauac agacauggug 540
cgaagagucu auugagcuag uugguagucc uccggccccu gaaugcggcu aaucccaacu 600
gcggagcaua cacucucaag ccagagggua gugugucgua augggcaacu cugcagcgga 660
accgacuacu uugggugucc guguuucauu uuauuccuau acuggcugcu uauggugaca 720
auugagagau uguuaccaua uagcuauugg auuggccauc cggugacuaa cagagcuauu 780
auauaucuuu uuguuggguu uauaccacuu agcuugaaag agguuaaaac ucuacauuac 840
auuuuaauac ugaacaccgc aaaaugggcg gccuggacua caaggacgac gacgauaagg 900
ccagcagcga ccugggcaag aagcugcugg aggccgccag ggccggccag gacgacgagg 960
ugaggauccu gauggccaac ggcgccgacg ugaacgcccu ggacagguuc ggccugaccc 1020
ccuugcaccu ggccgcccag aggggccacc uggagaucgu ggaggugcug cugaagugcg 1080
gcgccgacgu gaacgccgcc gaccuguggg gccagacccc cuugcaccug gcugccaccg 1140
ccggccaccu ggagaucguc gaggugcugc ugaaguacgg cgccgacgug aacgcucugg 1200
accugaucgg caagaccccc uugcaccuga ccgccaucga cggccaccug gaaaucgugg 1260
aggugcuccu gaagcacggc gccgacguga acgcacagga caaguucggc aagaccgcuu 1320
uugauauuag caucgacaac ggcaaugagg aucuugcuga aaucuugcag aagcugaacg 1380
gcucuggauc uggcagcgga agcgugaaca ucagcggcca gaacaccaug aacaugguga 1440
aggugcccga gugcagacug gccgacgagc ugggcggccu gugggagaac agcagguuca 1500
ccgacugcug ccugugcgug gccggccagg aguuccaggc ccacaaggcc auccuggccg 1560
ccaggagccc cguguucagc gccauguucg agcacgagau ggaggagagc aagaagaaca 1620
gaguggagau caacgacgug gagcccgagg uguucaagga gaugaugugc uucaucuaca 1680
ccggcaaggc ccccaaccug gacaagaugg ccgacgaccu gcuggccgcc gccgacaagu 1740
acgcccugga gagacugaag gugaugugcg aggacgcccu gugcagcaac cugagcgugg 1800
agaacgccgc cgagauccuc auccuggccg accugcacag cgccgaccag cugaagaccc 1860
aggccgugga cuucaucaac uaccacgcca gcgacgugcu ggagaccagc ggcuggaaga 1920
gcaugguggu gagccacccc caccuggugg ccgaggccua caggagccug gccagcgccc 1980
agugccccuu ccugggcccu cccaggaaga gacugaagca gagcggcagc ugaaaaaaac 2040
aaaaaacaaa acggcuauua ugcguuaccg gcgagacgcu acggacuua 2089
<210> 3
<211> 1630
<212> RNA
<213> Artificial Sequence
<220>
<223> 线性RNA分子序列
<400> 3
gacucacuau uuguuuucgc gcccaguugc aaaaaguguc gccuaggguu ggccaaucua 60
cucccaggag cagggagggc aggagccagg gcugggcaua aaagucaggg cagagccauc 120
uauugcuuac auuugcuucu gacacaacug uguucacuag caaccucaaa cagacaccgc 180
caccaugggc ggccuggacu acaaggacga cgacgauaag gccagcagcg accugggcaa 240
gaagcugcug gaggccgcca gggccggcca ggacgacgag gugaggaucc ugauggccaa 300
cggcgccgac gugaacgccc uggacagguu cggccugacc cccuugcacc uggccgccca 360
gaggggccac cuggagaucg uggaggugcu gcugaagugc ggcgccgacg ugaacgccgc 420
cgaccugugg ggccagaccc ccuugcaccu ggcugccacc gccggccacc uggagaucgu 480
cgaggugcug cugaaguacg gcgccgacgu gaacgcucug gaccugaucg gcaagacccc 540
cuugcaccug accgccaucg acggccaccu ggaaaucgug gaggugcucc ugaagcacgg 600
cgccgacgug aacgcacagg acaaguucgg caagaccgcu uuugauauua gcaucgacaa 660
cggcaaugag gaucuugcug aaaucuugca gaagcugaac ggcucuggau cuggcagcgg 720
aagcgugaac aucagcggcc agaacaccau gaacauggug aaggugcccg agugcagacu 780
ggccgacgag cugggcggcc ugugggagaa cagcagguuc accgacugcu gccugugcgu 840
ggccggccag gaguuccagg cccacaaggc cauccuggcc gccaggagcc ccguguucag 900
cgccauguuc gagcacgaga uggaggagag caagaagaac agaguggaga ucaacgacgu 960
ggagcccgag guguucaagg agaugaugug cuucaucuac accggcaagg cccccaaccu 1020
ggacaagaug gccgacgacc ugcuggccgc cgccgacaag uacgcccugg agagacugaa 1080
ggugaugugc gaggacgccc ugugcagcaa ccugagcgug gagaacgccg ccgagauccu 1140
cauccuggcc gaccugcaca gcgccgacca gcugaagacc caggccgugg acuucaucaa 1200
cuaccacgcc agcgacgugc uggagaccag cggcuggaag agcauggugg ugagccaccc 1260
ccaccuggug gccgaggccu acaggagccu ggccagcgcc cagugccccu uccugggccc 1320
ucccaggaag agacugaagc agagcggcag cugaagcucg cuuucuugcu guccaauuuc 1380
uauuaaaggu uccuuuguuc ccuaagucca acuacuaaac ugggggauau uaugaagggc 1440
cuugagcauc uggauucugc cuaauaaaaa acauuuauuu ucauugcgca uaugacuagc 1500
ucgcuuucuu gcuguccaau uucuauuaaa gguuccuuug uucccuaagu ccaacuacua 1560
aacuggggga uauuaugaag ggccuugagc aucuggauuc ugccuaauaa aaaacauuua 1620
uuuucauugc 1630
<210> 4
<211> 1648
<212> RNA
<213> Artificial Sequence
<220>
<223> 环状RNA分子序列
<400> 4
aaaauccguu gaccuuaaac ggucgugugg guucaagucc cuccaccccc acgccggaaa 60
cgcaauagcc gaaaaaacaa aaacaaaaaa aacaaaaaaa caaaaaaaaa accaaaacac 120
auuaaaacag ccuguggguu gaucccaccc acagggccca cugggcgcua gcacucuggu 180
aucacgguac cuuugugcgc cuguuuuaua cuuccucccc caacugcaac uuagaaguaa 240
cacaaaccga ucaacaguca gcguggcaca ccagccacgu uuugaucaaa cacuucuguu 300
accccggacu gaguaucaau agacugcuca cgcgguugaa ggagaaaacg uucguuaucc 360
ggccaacuac uucgagaaac cuaguaacgc cauggaaguu guggaguguu ucgcucagca 420
cuaccccagu guagaucagg uugaugaguc accgcauucc ccacggguga ccguggcggu 480
ggcugcguug gcggccugcc cauggggaaa cccaugggac gcucuuauac agacauggug 540
cgaagagucu auugagcuag uugguagucc uccggccccu gaaugcggcu aaucccaacu 600
gcggagcaua cacucucaag ccagagggua gugugucgua augggcaacu cugcagcgga 660
accgacuacu uugggugucc guguuucauu uuauuccuau acuggcugcu uauggugaca 720
auugagagau uguuaccaua uagcuauugg auuggccauc cggugacuaa cagagcuauu 780
auauaucuuu uuguuggguu uauaccacuu agcuugaaag agguuaaaac ucuacauuac 840
auuuuaauac ugaacaccgc aaaauggacu acaaggacga cgacgauaag gccagcagcg 900
ccgugcugca gaagaagauc accgacuacu uccaccccaa gaagggcagc ggcucuggca 960
gcggaagcgu gaacaucagc ggccagaaca ccaugaacau ggugaaggug cccgagugca 1020
gacuggccga cgagcugggc ggccuguggg agaacagcag guucaccgac ugcugccugu 1080
gcguggccgg ccaggaguuc caggcccaca aggccauccu ggccgccagg agccccgugu 1140
ucagcgccau guucgagcac gagauggagg agagcaagaa gaacagagug gagaucaacg 1200
acguggagcc cgagguguuc aaggagauga ugugcuucau cuacaccggc aaggccccca 1260
accuggacaa gauggccgac gaccugcugg ccgccgccga caaguacgcc cuggagagac 1320
ugaaggugau gugcgaggac gcccugugca gcaaccugag cguggagaac gccgccgaga 1380
uccucauccu ggccgaccug cacagcgccg accagcugaa gacccaggcc guggacuuca 1440
ucaacuacca cgccagcgac gugcuggaga ccagcggcug gaagagcaug guggugagcc 1500
acccccaccu gguggccgag gccuacagga gccuggccag cgcccagugc cccuuccugg 1560
gcccucccag gaagagacug aagcagagcu gaaaaaaaca aaaaacaaaa cggcuauuau 1620
gcguuaccgg cgagacgcua cggacuua 1648
<210> 5
<211> 1648
<212> RNA
<213> Artificial Sequence
<220>
<223> 环状RNA分子序列
<400> 5
aaaauccguu gaccuuaaac ggucgugugg guucaagucc cuccaccccc acgccggaaa 60
cgcaauagcc gaaaaaacaa aaacaaaaaa aacaaaaaaa caaaaaaaaa accaaaacac 120
auuaaaacag ccuguggguu gaucccaccc acagggccca cugggcgcua gcacucuggu 180
aucacgguac cuuugugcgc cuguuuuaua cuuccucccc caacugcaac uuagaaguaa 240
cacaaaccga ucaacaguca gcguggcaca ccagccacgu uuugaucaaa cacuucuguu 300
accccggacu gaguaucaau agacugcuca cgcgguugaa ggagaaaacg uucguuaucc 360
ggccaacuac uucgagaaac cuaguaacgc cauggaaguu guggaguguu ucgcucagca 420
cuaccccagu guagaucagg uugaugaguc accgcauucc ccacggguga ccguggcggu 480
ggcugcguug gcggccugcc cauggggaaa cccaugggac gcucuuauac agacauggug 540
cgaagagucu auugagcuag uugguagucc uccggccccu gaaugcggcu aaucccaacu 600
gcggagcaua cacucucaag ccagagggua gugugucgua augggcaacu cugcagcgga 660
accgacuacu uugggugucc guguuucauu uuauuccuau acuggcugcu uauggugaca 720
auugagagau uguuaccaua uagcuauugg auuggccauc cggugacuaa cagagcuauu 780
auauaucuuu uuguuggguu uauaccacuu agcuugaaag agguuaaaac ucuacauuac 840
auuuuaauac ugaacaccgc aaaauggacu acaaggacga cgacgauaag gccagcagcg 900
ccgugcugca gaagaaggcc accgacgccg cccaccccaa gaagggcagc ggcucuggca 960
gcggaagcgu gaacaucagc ggccagaaca ccaugaacau ggugaaggug cccgagugca 1020
gacuggccga cgagcugggc ggccuguggg agaacagcag guucaccgac ugcugccugu 1080
gcguggccgg ccaggaguuc caggcccaca aggccauccu ggccgccagg agccccgugu 1140
ucagcgccau guucgagcac gagauggagg agagcaagaa gaacagagug gagaucaacg 1200
acguggagcc cgagguguuc aaggagauga ugugcuucau cuacaccggc aaggccccca 1260
accuggacaa gauggccgac gaccugcugg ccgccgccga caaguacgcc cuggagagac 1320
ugaaggugau gugcgaggac gcccugugca gcaaccugag cguggagaac gccgccgaga 1380
uccucauccu ggccgaccug cacagcgccg accagcugaa gacccaggcc guggacuuca 1440
ucaacuacca cgccagcgac gugcuggaga ccagcggcug gaagagcaug guggugagcc 1500
acccccaccu gguggccgag gccuacagga gccuggccag cgcccagugc cccuuccugg 1560
gcccucccag gaagagacug aagcagagcu gaaaaaaaca aaaaacaaaa cggcuauuau 1620
gcguuaccgg cgagacgcua cggacuua 1648
<210> 6
<211> 1573
<212> RNA
<213> Artificial Sequence
<220>
<223> 环状RNA分子序列
<400> 6
aaaauccguu gaccuuaaac ggucgugugg guucaagucc cuccaccccc acgccggaaa 60
cgcaauagcc gaaaaaacaa aaacaaaaaa aacaaaaaaa caaaaaaaaa accaaaacac 120
auuaaaacag ccuguggguu gaucccaccc acagggccca cugggcgcua gcacucuggu 180
aucacgguac cuuugugcgc cuguuuuaua cuuccucccc caacugcaac uuagaaguaa 240
cacaaaccga ucaacaguca gcguggcaca ccagccacgu uuugaucaaa cacuucuguu 300
accccggacu gaguaucaau agacugcuca cgcgguugaa ggagaaaacg uucguuaucc 360
ggccaacuac uucgagaaac cuaguaacgc cauggaaguu guggaguguu ucgcucagca 420
cuaccccagu guagaucagg uugaugaguc accgcauucc ccacggguga ccguggcggu 480
ggcugcguug gcggccugcc cauggggaaa cccaugggac gcucuuauac agacauggug 540
cgaagagucu auugagcuag uugguagucc uccggccccu gaaugcggcu aaucccaacu 600
gcggagcaua cacucucaag ccagagggua gugugucgua augggcaacu cugcagcgga 660
accgacuacu uugggugucc guguuucauu uuauuccuau acuggcugcu uauggugaca 720
auugagagau uguuaccaua uagcuauugg auuggccauc cggugacuaa cagagcuauu 780
auauaucuuu uuguuggguu uauaccacuu agcuugaaag agguuaaaac ucuacauuac 840
auuuuaauac ugaacaccgc aaaauggacu acaaggacga cgacgauaag gccagcagcg 900
ccgugcugca gaagaagauc accgacuacu uccaccccaa gaagggcagc ggcucuggca 960
gcggaagcgu gaacaucagc ggccagaaca ccaugaacau ggugaaggug cccgagugca 1020
gacuggccga cgagcugggc ggccuguggg agaacagcag guucaccgac ugcugccugu 1080
gcguggccgg ccaggaguuc caggcccaca aggccauccu ggccgccagg agccccgugu 1140
ucagcgccau guucgagcac gagauggagg agagcaagaa gaacagagug gagaucaacg 1200
acguggagcc cgagguguuc aaggagauga ugugcuucau cuacaccggc aaggccccca 1260
accuggacaa gauggccgac gaccugcugg ccgccgccga caaguacgcc cuggagagac 1320
ugaaggugau gugcgaggac gcccugugca gcaaccugag cguggagaac uaccacgcca 1380
gcgacgugcu ggagaccagc ggcuggaaga gcaugguggu gagccacccc caccuggugg 1440
ccgaggccua caggagccug gccagcgccc agugccccuu ccugggcccu cccaggaaga 1500
gacugaagca gagcugaaaa aaacaaaaaa caaaacggcu auuaugcguu accggcgaga 1560
cgcuacggac uua 1573
<210> 7
<211> 261
<212> PRT
<213> Homo sapiens
<400> 7
Met Phe Glu Ala Arg Leu Val Gln Gly Ser Ile Leu Lys Lys Val Leu
1 5 10 15
Glu Ala Leu Lys Asp Leu Ile Asn Glu Ala Cys Trp Asp Ile Ser Ser
20 25 30
Ser Gly Val Asn Leu Gln Ser Met Asp Ser Ser His Val Ser Leu Val
35 40 45
Gln Leu Thr Leu Arg Ser Glu Gly Phe Asp Thr Tyr Arg Cys Asp Arg
50 55 60
Asn Leu Ala Met Gly Val Asn Leu Thr Ser Met Ser Lys Ile Leu Lys
65 70 75 80
Cys Ala Gly Asn Glu Asp Ile Ile Thr Leu Arg Ala Glu Asp Asn Ala
85 90 95
Asp Thr Leu Ala Leu Val Phe Glu Ala Pro Asn Gln Glu Lys Val Ser
100 105 110
Asp Tyr Glu Met Lys Leu Met Asp Leu Asp Val Glu Gln Leu Gly Ile
115 120 125
Pro Glu Gln Glu Tyr Ser Cys Val Val Lys Met Pro Ser Gly Glu Phe
130 135 140
Ala Arg Ile Cys Arg Asp Leu Ser His Ile Gly Asp Ala Val Val Ile
145 150 155 160
Ser Cys Ala Lys Asp Gly Val Lys Phe Ser Ala Ser Gly Glu Leu Gly
165 170 175
Asn Gly Asn Ile Lys Leu Ser Gln Thr Ser Asn Val Asp Lys Glu Glu
180 185 190
Glu Ala Val Thr Ile Glu Met Asn Glu Pro Val Gln Leu Thr Phe Ala
195 200 205
Leu Arg Tyr Leu Asn Phe Phe Thr Lys Ala Thr Pro Leu Ser Ser Thr
210 215 220
Val Thr Leu Ser Met Ser Ala Asp Val Pro Leu Val Val Glu Tyr Lys
225 230 235 240
Ile Ala Asp Met Gly His Leu Lys Tyr Tyr Leu Ala Pro Lys Ile Glu
245 250 255
Asp Glu Glu Gly Ser
260
<210> 8
<211> 16
<212> PRT
<213> Artificial Sequence
<220>
<223> 第一多肽序列
<400> 8
Ser Ala Val Leu Gln Lys Lys Ile Thr Asp Tyr Phe His Pro Lys Lys
1 5 10 15
<210> 9
<211> 48
<212> DNA
<213> Artificial Sequence
<220>
<223> 第一多肽序列
<400> 9
agcgccgtgc tgcagaagaa gatcaccgac tacttccacc ccaagaag 48
<210> 10
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> 连接肽序列
<400> 10
Gly Ser Gly Ser Gly Ser Gly
1 5
<210> 11
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> 连接肽序列
<400> 11
ggcagcggct ctggcagcgg a 21
<210> 12
<211> 208
<212> PRT
<213> Artificial Sequence
<220>
<223> 第二多肽序列
<400> 12
Ser Val Asn Ile Ser Gly Gln Asn Thr Met Asn Met Val Lys Val Pro
1 5 10 15
Glu Cys Arg Leu Ala Asp Glu Leu Gly Gly Leu Trp Glu Asn Ser Arg
20 25 30
Phe Thr Asp Cys Cys Leu Cys Val Ala Gly Gln Glu Phe Gln Ala His
35 40 45
Lys Ala Ile Leu Ala Ala Arg Ser Pro Val Phe Ser Ala Met Phe Glu
50 55 60
His Glu Met Glu Glu Ser Lys Lys Asn Arg Val Glu Ile Asn Asp Val
65 70 75 80
Glu Pro Glu Val Phe Lys Glu Met Met Cys Phe Ile Tyr Thr Gly Lys
85 90 95
Ala Pro Asn Leu Asp Lys Met Ala Asp Asp Leu Leu Ala Ala Ala Asp
100 105 110
Lys Tyr Ala Leu Glu Arg Leu Lys Val Met Cys Glu Asp Ala Leu Cys
115 120 125
Ser Asn Leu Ser Val Glu Asn Ala Ala Glu Ile Leu Ile Leu Ala Asp
130 135 140
Leu His Ser Ala Asp Gln Leu Lys Thr Gln Ala Val Asp Phe Ile Asn
145 150 155 160
Tyr His Ala Ser Asp Val Leu Glu Thr Ser Gly Trp Lys Ser Met Val
165 170 175
Val Ser His Pro His Leu Val Ala Glu Ala Tyr Arg Ser Leu Ala Ser
180 185 190
Ala Gln Cys Pro Phe Leu Gly Pro Pro Arg Lys Arg Leu Lys Gln Ser
195 200 205
<210> 13
<211> 627
<212> DNA
<213> Artificial Sequence
<220>
<223> 第二多肽序列
<400> 13
agcgtgaaca tcagcggcca gaacaccatg aacatggtga aggtgcccga gtgcagactg 60
gccgacgagc tgggcggcct gtgggagaac agcaggttca ccgactgctg cctgtgcgtg 120
gccggccagg agttccaggc ccacaaggcc atcctggccg ccaggagccc cgtgttcagc 180
gccatgttcg agcacgagat ggaggagagc aagaagaaca gagtggagat caacgacgtg 240
gagcccgagg tgttcaagga gatgatgtgc ttcatctaca ccggcaaggc ccccaacctg 300
gacaagatgg ccgacgacct gctggccgcc gccgacaagt acgccctgga gagactgaag 360
gtgatgtgcg aggacgccct gtgcagcaac ctgagcgtgg agaacgccgc cgagatcctc 420
atcctggccg acctgcacag cgccgaccag ctgaagaccc aggccgtgga cttcatcaac 480
taccacgcca gcgacgtgct ggagaccagc ggctggaaga gcatggtggt gagccacccc 540
cacctggtgg ccgaggccta caggagcctg gccagcgccc agtgcccctt cctgggccct 600
cccaggaaga gactgaagca gagctga 627
<210> 14
<211> 741
<212> RNA
<213> Artificial Sequence
<220>
<223> IRES序列
<400> 14
uuaaaacagc cuguggguug aucccaccca caggcccauu gggcgcuagc acucugguau 60
cacgguaccu uugugcgccu guuuuauacc cccuccccca acuguaacuu agaaguaaca 120
cacaccgauc aacagucagc guggcacacc agccacguuu ugaucaagca cuucuguuac 180
cccggacuga guaucaauag acugcucacg cgguugaagg agaaagcguu cguuauccgg 240
ccaacuacuu cgaaaaaccu aguaacaccg uggaaguugc agaguguuuc gcucagcacu 300
accccagugu agaucagguc gaugagucac cgcauucccc acgggcgacc guggcggugg 360
cugcguuggc ggccugccca uggggaaacc caugggacgc ucuaauacag acauggugcg 420
aagagucuau ugagcuaguu gguaguccuc cggccccuga augcggcuaa uccuaacugc 480
ggagcacaca cccucaagcc agagggcagu gugucguaac gggcaacucu gcagcggaac 540
cgacuacuuu ggguguccgu guuucauuuu auuccuauac uggcugcuua uggugacaau 600
ugagagaucg uuaccauaua gcuauuggau uggccauccg gugacuaaua gagcuauuau 660
auaucccuuu guuggguuua uaccacuuag cuugaaagag guuaaaacau uacaauucau 720
uguuaaguug aauacagcaa a 741
<210> 15
<211> 682
<212> RNA
<213> Artificial Sequence
<220>
<223> IRES序列
<400> 15
uuaaaacagc cuguggguug cacccaccca cagggcccac agggcgcuag cacucuggua 60
ucacgguacc uuugugcgcc uguuuuauua ccccuucccc aauugaaaau uagaagcaau 120
gcacaccgau caacagcagg cguggcgcac cagucacguc ucgaucaagc acuucuguuu 180
ccccggaccg aguaucaaua gacugcucac gcgguugaag gagaaagugu ucguuauccg 240
gcuaaccacu ucgagaaacc caguaacacc augaaaguug caggguguuu cgcucagcac 300
uuccccagug uagaucaggu cgaugaguca ccgcguuccc cacgggcgac cguggcggug 360
gcugcguugg cggccugccu auggguuaac ccauaggacg cucuaauaca gacauggugc 420
gaagaguuua uugagcuggu uaguaucccu ccggccccug aaugcggcua auccuaacug 480
cggagcacgu gccuccaauc caggggguug caugucguaa cggguaacuc ugcagcggaa 540
ccgacuacuu uggguguccg uguuuccuuu uauucuuaua cuggcugcuu auggugacaa 600
ucgaggaauu guuaccauau agcuauugga uuggccaucc ggugucuaac agagcgauua 660
uauaccucuu uguuggauuu au 682
<210> 16
<211> 742
<212> RNA
<213> Artificial Sequence
<220>
<223> IRES序列
<400> 16
uuaaaacagc cuguggguug aucccaccca cagggcccac ugggcgcuag cacucuggua 60
ucacgguacc uuugugcgcc uguuuuauac uuccuccccc aacugcaacu uagaaguaac 120
acaaaccgau caacagucag cguggcacac cagccacguu uugaucaaac acuucuguua 180
ccccggacug aguaucaaua gacugcucac gcgguugaag gagaaaacgu ucguuauccg 240
gccaacuacu ucgagaaacc uaguaacgcc auggaaguug uggaguguuu cgcucagcac 300
uaccccagug uagaucaggu ugaugaguca ccgcauuccc cacgggugac cguggcggug 360
gcugcguugg cggccugccc auggggaaac ccaugggacg cucuuauaca gacauggugc 420
gaagagucua uugagcuagu ugguaguccu ccggccccug aaugcggcua aucccaacug 480
cggagcauac acucucaagc cagaggguag ugugucguaa ugggcaacuc ugcagcggaa 540
ccgacuacuu uggguguccg uguuucauuu uauuccuaua cuggcugcuu auggugacaa 600
uugagagauu guuaccauau agcuauugga uuggccaucc ggugacuaac agagcuauua 660
uauaucuuuu uguuggguuu auaccacuua gcuugaaaga gguuaaaacu cuacauuaca 720
uuuuaauacu gaacaccgca aa 742
<210> 17
<211> 737
<212> RNA
<213> Artificial Sequence
<220>
<223> IRES序列
<400> 17
uuaaaacagc cuguggguug aucccaccca cagggcccau ugggcgcuag cacucuggua 60
ucacgguacc cuugugcgcc uguuuuaugu cccuucccuc aacuguaacu uagaaguaac 120
gcacaccgau caacagucag cguggcacac cagccauguu uugaucaagc acuucuguua 180
ccccggaccg aguaucaaca gacugcucac gcgguugaag gagaaagugu ucguuauccg 240
gccaacuacu ucgaaaaacc uaguaacacc auggaaguug cagaguguuu cgcucagcac 300
uaccccagug uagaucaggu cgaugaguca ccgcaucccc cacgggcgac cguggcggug 360
gcugcguugg cggccugccu augggggaac ccauaggacg cucuaauaca gacauggugc 420
gaagagucca uugagcuagu ugguaguccu ccggccccug aaugcggcua auccuaacug 480
cggagcacac accuucaagc cagagggcag ugugucguaa cgggcaacuc ugcagcggaa 540
ccgacuacuu uggguguccg uguuucauuu uauucuuaua cuggcugcuu auggugacaa 600
uugagagauu guuaccauau agcuauugga uuggccaucc agugacuagc agagcuauua 660
uauaccucuu uguuggguuu auaccaccua auuugaaaga aguuaaaaca uuagaauuca 720
uuauuaaauu gaauaca 737
<210> 18
<211> 683
<212> RNA
<213> Artificial Sequence
<220>
<223> IRES序列
<400> 18
uuaaaacagc cuguggguug cacccaccca cagggcccac agggcgcuag cacucuggua 60
ucacgguacc uuugugcgcc uguuuuauua ccccuucccc aauugaaaau uagaagcaau 120
gcacaccgau caacagcagg cguggcgcac cagucacguc ucgaucaagc acuucuguuu 180
ccccggaccg aguaucaaua gacugcucac gcgguugaag gagaaagugu ucguuauccg 240
gcuaaccacu ucgagaaacc caguaacacc augaaaguug caggguguuu cgcucagcac 300
uuccccagug uagaucaggu cgaugaguca ccgcguuccc cacgggcgac cguggcggug 360
gcugcguugg cggccugccu auggguuaac ccauaggacg cucuaauaca gacauggugc 420
gaagaguuua uugagcuggu uaguaucucc uccggccccu gaaugcggcu aauccuaacu 480
gcggagcaca cacccucaag ccagagggca gugugucgua acgggcaacu cugcagcgga 540
accgacuacu uugggugucc guguuuccuu uuauucuuau acuggcugcu uauggugaca 600
aucgaggaau uguuaccaua uagcuauugg auuggccauc cggugucuaa cagagcgauu 660
auauaccucu uuguuggauu uau 683
<210> 19
<211> 742
<212> RNA
<213> Artificial Sequence
<220>
<223> IRES序列
<400> 19
uuaaaacagc cuguggguug aucccaccca cagggcccac ugggcgcuag cacucuggua 60
ucacgguacc uuugugcgcc uguuuuauac uuccuccccc aacugcaacu uagaaguaac 120
acaaaccgau caacagucag cguggcacac cagccacguu uugaucaaac acuucuguua 180
ccccggacug aguaucaaua gacugcucac gcgguugaag gagaaaacgu ucguuauccg 240
gccaacuacu ucgagaaacc uaguaacgcc auggaaguug uggaguguuu cgcucagcac 300
uaccccagug uagaucaggu ugaugaguca ccgcauuccc cacgggugac cguggcggug 360
gcugcguugg cggccugccc auggggaaac ccaugggacg cucuuauaca gacauggugc 420
gaagagucua uugagcuagu ugguaguccu ccggccccug aaugcggcua auccuaacug 480
cggagcacac acccucaagc cagagggcag ugugucguaa cgggcaacuc ugcagcggaa 540
ccgacuacuu uggguguccg uguuucauuu uauuccuaua cuggcugcuu auggugacaa 600
uugagagauu guuaccauau agcuauugga uuggccaucc ggugacuaac agagcuauua 660
uauaucuuuu uguuggguuu auaccacuua gcuugaaaga gguuaaaacu cuacauuaca 720
uuuuaauacu gaacaccgca aa 742
<210> 20
<211> 737
<212> RNA
<213> Artificial Sequence
<220>
<223> IRES序列
<400> 20
uuaaaacagc cuguggguug aucccaccca cagggcccau ugggcgcuag cacucuggua 60
ucacgguacc cuugugcgcc uguuuuaugu cccuucccuc aacuguaacu uagaaguaac 120
gcacaccgau caacagucag cguggcacac cagccauguu uugaucaagc acuucuguua 180
ccccggaccg aguaucaaca gacugcucac gcgguugaag gagaaagugu ucguuauccg 240
gccaacuacu ucgaaaaacc uaguaacacc auggaaguug cagaguguuu cgcucagcac 300
uaccccagug uagaucaggu cgaugaguca ccgcaucccc cacgggcgac cguggcggug 360
gcugcguugg cggccugccu augggggaac ccauaggacg cucuaauaca gacauggugc 420
gaagagucca uugagcuagu ugguaguccu ccggccccug aaugcggcua auccuaacug 480
cggagcacac acccucaagc cagagggcag ugugucguaa cgggcaacuc ugcagcggaa 540
ccgacuacuu uggguguccg uguuucauuu uauucuuaua cuggcugcuu auggugacaa 600
uugagagauu guuaccauau agcuauugga uuggccaucc agugacuagc agagcuauua 660
uauaccucuu uguuggguuu auaccaccua auuugaaaga aguuaaaaca uuagaauuca 720
uuauuaaauu gaauaca 737
<210> 21
<211> 16
<212> RNA
<213> Artificial Sequence
<220>
<223> 第一外显子序列
<400> 21
agacgcuacg gacuua 16
<210> 22
<211> 51
<212> RNA
<213> Artificial Sequence
<220>
<223> 第二外显子序列
<400> 22
aaaauccguu gaccuuaaac ggucgugugg guucaagucc cuccaccccc a 51
<210> 23
<211> 50
<212> RNA
<213> Artificial Sequence
<220>
<223> 5'间隔区序列
<400> 23
aaaaaacaaa aacaaaaaaa acaaaaaaac aaaaaaaaaa ccaaaacaca 50
<210> 24
<211> 50
<212> RNA
<213> Artificial Sequence
<220>
<223> 5'间隔区序列
<400> 24
aaaaacaaaa aacaaaaaaa aaaccaaaaa aacaaaaaaa acaaaacaca 50
<210> 25
<211> 25
<212> RNA
<213> Artificial Sequence
<220>
<223> 3'间隔区序列
<400> 25
aaaaaaacaa aaaaacaaaa caaac 25
<210> 26
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> 3'间隔区序列
<400> 26
aaaaacaaaa aacaaaacaa ac 22
<210> 27
<211> 114
<212> DNA
<213> Artificial Sequence
<220>
<223> 5'内含子序列
<400> 27
aataattgag ccttaaagaa gaaattcttt aagtggatgc tctcaaactc agggaaacct 60
aaatctagtt atagacaagg caatcctgag ccaagccgaa gtagtaatta gtaa 114
<210> 28
<211> 131
<212> DNA
<213> Artificial Sequence
<220>
<223> 3'内含子序列
<400> 28
aacaatagat gacttacaac taatcggaag gtgcagagac tcgacgggag ctaccctaac 60
gtcaagacga gggtaaagag agagtccaat tctcaaagcc aataggcagt agcgaaagct 120
gcaagagaat g 131
<210> 29
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> 5'同源臂序列
<400> 29
accgtcagtt gctcactgtg c 21
<210> 30
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> 5'同源臂序列
<400> 30
accgtgctat gtccacgtgt c 21
<210> 31
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> 3'同源臂序列
<400> 31
gcacagtgag caactgacgg a 21
<210> 32
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> 3'同源臂序列
<400> 32
gacacgtgga catagcacgg a 21
<210> 33
<211> 170
<212> PRT
<213> Artificial Sequence
<220>
<223> 第一多肽序列
<400> 33
Met Asp Leu Gly Lys Lys Leu Leu Glu Ala Ala Arg Ala Gly Gln Asp
1 5 10 15
Asp Glu Val Arg Ile Leu Met Ala Asn Gly Ala Asp Val Asn Ala Ser
20 25 30
Asp Arg Gly Gly Gly Thr Pro Leu His Leu Ala Ala Ala Gly Gly His
35 40 45
Leu Glu Ile Val Glu Val Leu Leu Lys Arg Gly Ala Asp Val Ser Ala
50 55 60
Ala Asp Leu His Gly Gln Ser Pro Leu His Leu Ala Ala Met Val Gly
65 70 75 80
His Leu Glu Ile Val Glu Val Leu Leu Lys Tyr Gly Ala Asp Val Asn
85 90 95
Ala Lys Asp Thr Met Gly Ala Thr Pro Leu His Leu Ala Ala Arg Ser
100 105 110
Gly His Leu Glu Ile Val Glu Glu Leu Leu Lys Asn Gly Ala Asp Met
115 120 125
Asn Ala Gln Asp Lys Phe Gly Lys Thr Thr Phe Asp Ile Ser Thr Asp
130 135 140
Asn Gly Asn Glu Asp Leu Ala Glu Ile Leu Gln Lys Leu Val Asp Gly
145 150 155 160
Gly Ser Asp Tyr Lys Asp Asp Asp Asp Lys
165 170
<210> 34
<211> 387
<212> PRT
<213> Artificial Sequence
<220>
<223> 重组多肽序列
<400> 34
Met Gly Gly Leu Asp Tyr Lys Asp Asp Asp Asp Lys Ala Ser Ser Asp
1 5 10 15
Leu Gly Lys Lys Leu Leu Glu Ala Ala Arg Ala Gly Gln Asp Asp Glu
20 25 30
Val Arg Ile Leu Met Ala Asn Gly Ala Asp Val Asn Ala Leu Asp Arg
35 40 45
Phe Gly Leu Thr Pro Leu His Leu Ala Ala Gln Arg Gly His Leu Glu
50 55 60
Ile Val Glu Val Leu Leu Lys Cys Gly Ala Asp Val Asn Ala Ala Asp
65 70 75 80
Leu Trp Gly Gln Thr Pro Leu His Leu Ala Ala Thr Ala Gly His Leu
85 90 95
Glu Ile Val Glu Val Leu Leu Lys Tyr Gly Ala Asp Val Asn Ala Leu
100 105 110
Asp Leu Ile Gly Lys Thr Pro Leu His Leu Thr Ala Ile Asp Gly His
115 120 125
Leu Glu Ile Val Glu Val Leu Leu Lys His Gly Ala Asp Val Asn Ala
130 135 140
Gln Asp Lys Phe Gly Lys Thr Ala Phe Asp Ile Ser Ile Asp Asn Gly
145 150 155 160
Asn Glu Asp Leu Ala Glu Ile Leu Gln Lys Leu Asn Gly Ser Gly Ser
165 170 175
Gly Ser Gly Ser Val Asn Ile Ser Gly Gln Asn Thr Met Asn Met Val
180 185 190
Lys Val Pro Glu Cys Arg Leu Ala Asp Glu Leu Gly Gly Leu Trp Glu
195 200 205
Asn Ser Arg Phe Thr Asp Cys Cys Leu Cys Val Ala Gly Gln Glu Phe
210 215 220
Gln Ala His Lys Ala Ile Leu Ala Ala Arg Ser Pro Val Phe Ser Ala
225 230 235 240
Met Phe Glu His Glu Met Glu Glu Ser Lys Lys Asn Arg Val Glu Ile
245 250 255
Asn Asp Val Glu Pro Glu Val Phe Lys Glu Met Met Cys Phe Ile Tyr
260 265 270
Thr Gly Lys Ala Pro Asn Leu Asp Lys Met Ala Asp Asp Leu Leu Ala
275 280 285
Ala Ala Asp Lys Tyr Ala Leu Glu Arg Leu Lys Val Met Cys Glu Asp
290 295 300
Ala Leu Cys Ser Asn Leu Ser Val Glu Asn Ala Ala Glu Ile Leu Ile
305 310 315 320
Leu Ala Asp Leu His Ser Ala Asp Gln Leu Lys Thr Gln Ala Val Asp
325 330 335
Phe Ile Asn Tyr His Ala Ser Asp Val Leu Glu Thr Ser Gly Trp Lys
340 345 350
Ser Met Val Val Ser His Pro His Leu Val Ala Glu Ala Tyr Arg Ser
355 360 365
Leu Ala Ser Ala Gln Cys Pro Phe Leu Gly Pro Pro Arg Lys Arg Leu
370 375 380
Lys Gln Ser
385
<210> 35
<211> 242
<212> PRT
<213> Artificial Sequence
<220>
<223> 重组多肽序列
<400> 35
Met Asp Tyr Lys Asp Asp Asp Asp Lys Ala Ser Ser Ala Val Leu Gln
1 5 10 15
Lys Lys Ile Thr Asp Tyr Phe His Pro Lys Lys Gly Ser Gly Ser Gly
20 25 30
Ser Gly Ser Val Asn Ile Ser Gly Gln Asn Thr Met Asn Met Val Lys
35 40 45
Val Pro Glu Cys Arg Leu Ala Asp Glu Leu Gly Gly Leu Trp Glu Asn
50 55 60
Ser Arg Phe Thr Asp Cys Cys Leu Cys Val Ala Gly Gln Glu Phe Gln
65 70 75 80
Ala His Lys Ala Ile Leu Ala Ala Arg Ser Pro Val Phe Ser Ala Met
85 90 95
Phe Glu His Glu Met Glu Glu Ser Lys Lys Asn Arg Val Glu Ile Asn
100 105 110
Asp Val Glu Pro Glu Val Phe Lys Glu Met Met Cys Phe Ile Tyr Thr
115 120 125
Gly Lys Ala Pro Asn Leu Asp Lys Met Ala Asp Asp Leu Leu Ala Ala
130 135 140
Ala Asp Lys Tyr Ala Leu Glu Arg Leu Lys Val Met Cys Glu Asp Ala
145 150 155 160
Leu Cys Ser Asn Leu Ser Val Glu Asn Ala Ala Glu Ile Leu Ile Leu
165 170 175
Ala Asp Leu His Ser Ala Asp Gln Leu Lys Thr Gln Ala Val Asp Phe
180 185 190
Ile Asn Tyr His Ala Ser Asp Val Leu Glu Thr Ser Gly Trp Lys Ser
195 200 205
Met Val Val Ser His Pro His Leu Val Ala Glu Ala Tyr Arg Ser Leu
210 215 220
Ala Ser Ala Gln Cys Pro Phe Leu Gly Pro Pro Arg Lys Arg Leu Lys
225 230 235 240
Gln Ser
<210> 36
<211> 441
<212> PRT
<213> Artificial Sequence
<220>
<223> 重组多肽序列
<400> 36
Met Gly Gly Leu Asp Tyr Lys Asp Asp Asp Asp Lys Ala Ser Asp Pro
1 5 10 15
Ala Glu Ala Val Leu Gln Glu Lys Ala Leu Lys Phe Met Asn Ser Ser
20 25 30
Glu Arg Glu Asp Cys Asn Asn Gly Glu Pro Pro Arg Lys Ile Ile Pro
35 40 45
Glu Lys Asn Ser Leu Arg Gln Thr Tyr Asn Ser Cys Ala Arg Leu Cys
50 55 60
Leu Asn Gln Glu Thr Val Cys Leu Ala Ser Thr Ala Met Lys Thr Glu
65 70 75 80
Asn Cys Val Ala Lys Thr Lys Leu Ala Asn Gly Thr Ser Ser Met Ile
85 90 95
Val Pro Lys Gln Arg Lys Leu Ser Ala Ser Tyr Glu Lys Glu Lys Glu
100 105 110
Leu Cys Val Lys Tyr Phe Glu Gln Trp Ser Glu Ser Asp Gln Val Glu
115 120 125
Phe Val Glu His Leu Ile Ser Gln Met Cys His Tyr Gln His Gly His
130 135 140
Ile Asn Ser Tyr Leu Lys Pro Met Leu Gln Arg Asp Phe Ile Thr Ala
145 150 155 160
Leu Pro Ala Arg Gly Leu Asp His Ile Ala Glu Asn Ile Leu Ser Tyr
165 170 175
Leu Asp Ala Lys Ser Leu Cys Ala Ala Glu Leu Val Cys Lys Glu Trp
180 185 190
Tyr Arg Val Thr Ser Asp Gly Met Leu Trp Lys Lys Leu Ile Glu Arg
195 200 205
Met Val Arg Thr Asp Ser Leu Trp Arg Gly Leu Ala Glu Arg Arg Gly
210 215 220
Trp Gly Gln Tyr Leu Phe Lys Asn Lys Pro Pro Asp Gly Asn Ala Pro
225 230 235 240
Pro Asn Ser Phe Tyr Arg Ala Leu Tyr Pro Lys Ile Ile Gln Asp Ile
245 250 255
Glu Thr Ile Glu Ser Asn Trp Arg Cys Gly Arg His Ser Leu Gln Arg
260 265 270
Ile His Cys Arg Ser Gly Ser Gly Ser Gly Ser Gly Met Asp Leu Gly
275 280 285
Lys Lys Leu Leu Glu Ala Ala Arg Ala Gly Gln Asp Asp Glu Val Arg
290 295 300
Ile Leu Met Ala Asn Gly Ala Asp Val Asn Ala Ser Asp Arg Gly Gly
305 310 315 320
Gly Thr Pro Leu His Leu Ala Ala Ala Gly Gly His Leu Glu Ile Val
325 330 335
Glu Val Leu Leu Lys Arg Gly Ala Asp Val Ser Ala Ala Asp Leu His
340 345 350
Gly Gln Ser Pro Leu His Leu Ala Ala Met Val Gly His Leu Glu Ile
355 360 365
Val Glu Val Leu Leu Lys Tyr Gly Ala Asp Val Asn Ala Lys Asp Thr
370 375 380
Met Gly Ala Thr Pro Leu His Leu Ala Ala Arg Ser Gly His Leu Glu
385 390 395 400
Ile Val Glu Glu Leu Leu Lys Asn Gly Ala Asp Met Asn Ala Gln Asp
405 410 415
Lys Phe Gly Lys Thr Thr Phe Asp Ile Ser Thr Asp Asn Gly Asn Glu
420 425 430
Asp Leu Ala Glu Ile Leu Gln Lys Leu
435 440
<210> 37
<211> 471
<212> PRT
<213> Artificial Sequence
<220>
<223> 重组多肽序列
<400> 37
Met Gly Gly Leu Asp Tyr Lys Asp Asp Asp Asp Lys Ala Ser Cys Val
1 5 10 15
Pro Arg Ser Gly Leu Ile Leu Ser Cys Ile Cys Leu Tyr Cys Gly Val
20 25 30
Leu Leu Pro Val Leu Leu Pro Asn Leu Pro Phe Leu Thr Cys Leu Ser
35 40 45
Met Ser Thr Leu Glu Ser Val Thr Tyr Leu Pro Glu Lys Gly Leu Tyr
50 55 60
Cys Gln Arg Leu Pro Ser Ser Arg Thr His Gly Gly Thr Glu Ser Leu
65 70 75 80
Lys Gly Lys Asn Thr Glu Asn Met Gly Phe Tyr Gly Thr Leu Lys Met
85 90 95
Ile Phe Tyr Lys Met Lys Arg Lys Leu Asp His Gly Ser Glu Val Arg
100 105 110
Ser Phe Ser Leu Gly Lys Lys Pro Cys Lys Val Ser Glu Tyr Thr Ser
115 120 125
Thr Thr Gly Leu Val Pro Cys Ser Ala Thr Pro Thr Thr Phe Gly Asp
130 135 140
Leu Arg Ala Ala Asn Gly Gln Gly Gln Gln Arg Arg Arg Ile Thr Ser
145 150 155 160
Val Gln Pro Pro Thr Gly Leu Gln Glu Trp Leu Lys Met Phe Gln Ser
165 170 175
Trp Ser Gly Pro Glu Lys Leu Leu Ala Leu Asp Glu Leu Ile Asp Ser
180 185 190
Cys Glu Pro Thr Gln Val Lys His Met Met Gln Val Ile Glu Pro Gln
195 200 205
Phe Gln Arg Asp Phe Ile Ser Leu Leu Pro Lys Glu Leu Ala Leu Tyr
210 215 220
Val Leu Ser Phe Leu Glu Pro Lys Asp Leu Leu Gln Ala Ala Gln Thr
225 230 235 240
Cys Arg Tyr Trp Arg Ile Leu Ala Glu Asp Asn Leu Leu Trp Arg Glu
245 250 255
Lys Cys Lys Glu Glu Gly Ile Asp Glu Pro Leu His Ile Lys Arg Arg
260 265 270
Lys Val Ile Lys Pro Gly Phe Ile His Ser Pro Trp Lys Ser Ala Tyr
275 280 285
Ile Arg Gln His Arg Ile Asp Thr Asn Trp Arg Arg Gly Glu Leu Lys
290 295 300
Ser Pro Ser Gly Ser Gly Ser Gly Ser Gly Met Asp Leu Gly Lys Lys
305 310 315 320
Leu Leu Glu Ala Ala Arg Ala Gly Gln Asp Asp Glu Val Arg Ile Leu
325 330 335
Met Ala Asn Gly Ala Asp Val Asn Ala Ser Asp Arg Gly Gly Gly Thr
340 345 350
Pro Leu His Leu Ala Ala Ala Gly Gly His Leu Glu Ile Val Glu Val
355 360 365
Leu Leu Lys Arg Gly Ala Asp Val Ser Ala Ala Asp Leu His Gly Gln
370 375 380
Ser Pro Leu His Leu Ala Ala Met Val Gly His Leu Glu Ile Val Glu
385 390 395 400
Val Leu Leu Lys Tyr Gly Ala Asp Val Asn Ala Lys Asp Thr Met Gly
405 410 415
Ala Thr Pro Leu His Leu Ala Ala Arg Ser Gly His Leu Glu Ile Val
420 425 430
Glu Glu Leu Leu Lys Asn Gly Ala Asp Met Asn Ala Gln Asp Lys Phe
435 440 445
Gly Lys Thr Thr Phe Asp Ile Ser Thr Asp Asn Gly Asn Glu Asp Leu
450 455 460
Ala Glu Ile Leu Gln Lys Leu
465 470
<210> 38
<211> 325
<212> PRT
<213> Artificial Sequence
<220>
<223> 重组多肽序列
<400> 38
Met Gly Gly Leu Asp Tyr Lys Asp Asp Asp Asp Lys Ala Ser His Arg
1 5 10 15
Lys His Leu Gln Glu Ile Pro Asp Leu Ser Ser Asn Val Ala Thr Ser
20 25 30
Phe Thr Trp Gly Trp Asp Ser Ser Lys Thr Ser Glu Leu Leu Ser Gly
35 40 45
Met Gly Val Ser Ala Leu Glu Lys Glu Glu Pro Asp Ser Glu Asn Ile
50 55 60
Pro Gln Glu Leu Leu Ser Asn Leu Gly His Pro Glu Ser Pro Pro Arg
65 70 75 80
Lys Arg Leu Lys Ser Lys Gly Ser Asp Lys Asp Phe Val Ile Val Arg
85 90 95
Arg Pro Lys Leu Asn Arg Glu Asn Phe Pro Gly Val Ser Trp Asp Ser
100 105 110
Leu Pro Asp Glu Leu Leu Leu Gly Ile Phe Ser Cys Leu Cys Leu Pro
115 120 125
Glu Leu Leu Lys Val Ser Gly Val Cys Lys Arg Trp Tyr Arg Leu Ala
130 135 140
Ser Asp Glu Ser Leu Trp Gln Thr Leu Asp Leu Thr Gly Lys Asn Leu
145 150 155 160
Ser Gly Ser Gly Ser Gly Ser Gly Met Asp Leu Gly Lys Lys Leu Leu
165 170 175
Glu Ala Ala Arg Ala Gly Gln Asp Asp Glu Val Arg Ile Leu Met Ala
180 185 190
Asn Gly Ala Asp Val Asn Ala Ser Asp Arg Gly Gly Gly Thr Pro Leu
195 200 205
His Leu Ala Ala Ala Gly Gly His Leu Glu Ile Val Glu Val Leu Leu
210 215 220
Lys Arg Gly Ala Asp Val Ser Ala Ala Asp Leu His Gly Gln Ser Pro
225 230 235 240
Leu His Leu Ala Ala Met Val Gly His Leu Glu Ile Val Glu Val Leu
245 250 255
Leu Lys Tyr Gly Ala Asp Val Asn Ala Lys Asp Thr Met Gly Ala Thr
260 265 270
Pro Leu His Leu Ala Ala Arg Ser Gly His Leu Glu Ile Val Glu Glu
275 280 285
Leu Leu Lys Asn Gly Ala Asp Met Asn Ala Gln Asp Lys Phe Gly Lys
290 295 300
Thr Thr Phe Asp Ile Ser Thr Asp Asn Gly Asn Glu Asp Leu Ala Glu
305 310 315 320
Ile Leu Gln Lys Leu
325
<210> 39
<211> 498
<212> PRT
<213> Artificial Sequence
<220>
<223> 重组多肽序列
<400> 39
Met Gly Gly Leu Asp Tyr Lys Asp Asp Asp Asp Lys Ala Ser Ala Gly
1 5 10 15
Glu Gly Asp Gln Gln Asp Ala Ala His Asn Met Gly Asn His Leu Pro
20 25 30
Leu Leu Pro Ala Glu Ser Glu Glu Glu Asp Glu Met Glu Val Glu Asp
35 40 45
Gln Asp Ser Lys Glu Ala Lys Lys Pro Asn Ile Ile Asn Phe Asp Thr
50 55 60
Ser Leu Pro Thr Ser His Thr Tyr Leu Gly Ala Asp Met Glu Glu Phe
65 70 75 80
His Gly Arg Thr Leu His Asp Asp Asp Ser Cys Gln Val Ile Pro Val
85 90 95
Leu Pro Gln Val Met Met Ile Leu Ile Pro Gly Gln Thr Leu Pro Leu
100 105 110
Gln Leu Phe His Pro Gln Glu Val Ser Met Val Arg Asn Leu Ile Gln
115 120 125
Lys Asp Arg Thr Phe Ala Val Leu Ala Tyr Ser Asn Val Gln Glu Arg
130 135 140
Glu Ala Gln Phe Gly Thr Thr Ala Glu Ile Tyr Ala Tyr Arg Glu Glu
145 150 155 160
Gln Asp Phe Gly Ile Glu Ile Val Lys Val Lys Ala Ile Gly Arg Gln
165 170 175
Arg Phe Lys Val Leu Glu Leu Arg Thr Gln Ser Asp Gly Ile Gln Gln
180 185 190
Ala Lys Val Gln Ile Leu Pro Glu Cys Val Leu Pro Ser Thr Met Ser
195 200 205
Ala Val Gln Leu Glu Ser Leu Asn Lys Cys Gln Ile Phe Pro Ser Lys
210 215 220
Pro Val Ser Arg Glu Asp Gln Cys Ser Tyr Lys Trp Trp Gln Lys Tyr
225 230 235 240
Gln Lys Arg Lys Phe His Cys Ala Asn Leu Thr Ser Trp Pro Arg Trp
245 250 255
Leu Tyr Ser Leu Tyr Asp Ala Glu Thr Leu Met Asp Arg Ile Lys Lys
260 265 270
Gln Leu Arg Glu Trp Asp Glu Asn Leu Lys Asp Asp Ser Leu Pro Ser
275 280 285
Asn Pro Ile Asp Phe Ser Tyr Arg Val Ala Ala Cys Leu Pro Ile Asp
290 295 300
Asp Val Leu Arg Ile Gln Leu Leu Lys Ile Gly Ser Ala Ile Gln Arg
305 310 315 320
Leu Arg Cys Glu Leu Asp Ile Met Asn Lys Cys Thr Ser Ser Gly Ser
325 330 335
Gly Ser Gly Ser Gly Met Asp Leu Gly Lys Lys Leu Leu Glu Ala Ala
340 345 350
Arg Ala Gly Gln Asp Asp Glu Val Arg Ile Leu Met Ala Asn Gly Ala
355 360 365
Asp Val Asn Ala Ser Asp Arg Gly Gly Gly Thr Pro Leu His Leu Ala
370 375 380
Ala Ala Gly Gly His Leu Glu Ile Val Glu Val Leu Leu Lys Arg Gly
385 390 395 400
Ala Asp Val Ser Ala Ala Asp Leu His Gly Gln Ser Pro Leu His Leu
405 410 415
Ala Ala Met Val Gly His Leu Glu Ile Val Glu Val Leu Leu Lys Tyr
420 425 430
Gly Ala Asp Val Asn Ala Lys Asp Thr Met Gly Ala Thr Pro Leu His
435 440 445
Leu Ala Ala Arg Ser Gly His Leu Glu Ile Val Glu Glu Leu Leu Lys
450 455 460
Asn Gly Ala Asp Met Asn Ala Gln Asp Lys Phe Gly Lys Thr Thr Phe
465 470 475 480
Asp Ile Ser Thr Asp Asn Gly Asn Glu Asp Leu Ala Glu Ile Leu Gln
485 490 495
Lys Leu
<210> 40
<211> 292
<212> PRT
<213> Artificial Sequence
<220>
<223> 重组多肽序列
<400> 40
Met Gly Gly Leu Asp Tyr Lys Asp Asp Asp Asp Lys Ala Ser Ala Pro
1 5 10 15
Lys Lys Arg Pro Glu Thr Gln Lys Thr Ser Glu Ile Val Leu Arg Pro
20 25 30
Arg Asn Lys Arg Ser Arg Ser Pro Leu Glu Leu Glu Pro Glu Ala Lys
35 40 45
Lys Leu Cys Ala Lys Gly Ser Gly Pro Ser Arg Arg Cys Asp Ser Asp
50 55 60
Cys Leu Trp Val Gly Leu Ala Gly Pro Gln Ile Leu Pro Pro Cys Arg
65 70 75 80
Ser Ile Val Arg Thr Leu His Gln His Lys Leu Gly Arg Ala Ser Trp
85 90 95
Pro Ser Val Gln Gln Gly Leu Gln Gln Ser Phe Leu His Thr Leu Asp
100 105 110
Ser Tyr Arg Ile Leu Gln Lys Ala Ala Pro Phe Asp Arg Arg Ala Ser
115 120 125
Gly Ser Gly Ser Gly Ser Gly Met Asp Leu Gly Lys Lys Leu Leu Glu
130 135 140
Ala Ala Arg Ala Gly Gln Asp Asp Glu Val Arg Ile Leu Met Ala Asn
145 150 155 160
Gly Ala Asp Val Asn Ala Ser Asp Arg Gly Gly Gly Thr Pro Leu His
165 170 175
Leu Ala Ala Ala Gly Gly His Leu Glu Ile Val Glu Val Leu Leu Lys
180 185 190
Arg Gly Ala Asp Val Ser Ala Ala Asp Leu His Gly Gln Ser Pro Leu
195 200 205
His Leu Ala Ala Met Val Gly His Leu Glu Ile Val Glu Val Leu Leu
210 215 220
Lys Tyr Gly Ala Asp Val Asn Ala Lys Asp Thr Met Gly Ala Thr Pro
225 230 235 240
Leu His Leu Ala Ala Arg Ser Gly His Leu Glu Ile Val Glu Glu Leu
245 250 255
Leu Lys Asn Gly Ala Asp Met Asn Ala Gln Asp Lys Phe Gly Lys Thr
260 265 270
Thr Phe Asp Ile Ser Thr Asp Asn Gly Asn Glu Asp Leu Ala Glu Ile
275 280 285
Leu Gln Lys Leu
290
<210> 41
<211> 223
<212> PRT
<213> Artificial Sequence
<220>
<223> 重组多肽序列
<400> 41
Met Asp Leu Gly Lys Lys Leu Leu Glu Ala Ala Arg Ala Gly Gln Asp
1 5 10 15
Asp Glu Val Arg Ile Leu Met Ala Asn Gly Ala Asp Val Asn Ala Ser
20 25 30
Asp Arg Gly Gly Gly Thr Pro Leu His Leu Ala Ala Ala Gly Gly His
35 40 45
Leu Glu Ile Val Glu Val Leu Leu Lys Arg Gly Ala Asp Val Ser Ala
50 55 60
Ala Asp Leu His Gly Gln Ser Pro Leu His Leu Ala Ala Met Val Gly
65 70 75 80
His Leu Glu Ile Val Glu Val Leu Leu Lys Tyr Gly Ala Asp Val Asn
85 90 95
Ala Lys Asp Thr Met Gly Ala Thr Pro Leu His Leu Ala Ala Arg Ser
100 105 110
Gly His Leu Glu Ile Val Glu Glu Leu Leu Lys Asn Gly Ala Asp Met
115 120 125
Asn Ala Gln Asp Lys Phe Gly Lys Thr Thr Phe Asp Ile Ser Thr Asp
130 135 140
Asn Gly Asn Glu Asp Leu Ala Glu Ile Leu Gln Lys Leu Ser Gly Ser
145 150 155 160
Gly Ser Gly Ser Gly Pro Arg Asn Gly Thr Val His Leu Tyr Leu Thr
165 170 175
Lys Pro Leu Tyr Thr Ser Ala Pro Ser Leu Gln His Leu Cys Arg Leu
180 185 190
Thr Ile Asn Lys Cys Thr Gly Ala Ile Trp Gly Leu Pro Leu Pro Thr
195 200 205
Arg Leu Lys Asp Tyr Leu Glu Glu Tyr Lys Phe Gln Val Gly Ser
210 215 220
<210> 42
<211> 237
<212> PRT
<213> Artificial Sequence
<220>
<223> 重组多肽序列
<400> 42
Met Asp Leu Gly Lys Lys Leu Leu Glu Ala Ala Arg Ala Gly Gln Asp
1 5 10 15
Asp Glu Val Arg Ile Leu Met Ala Asn Gly Ala Asp Val Asn Ala Ser
20 25 30
Asp Arg Gly Gly Gly Thr Pro Leu His Leu Ala Ala Ala Gly Gly His
35 40 45
Leu Glu Ile Val Glu Val Leu Leu Lys Arg Gly Ala Asp Val Ser Ala
50 55 60
Ala Asp Leu His Gly Gln Ser Pro Leu His Leu Ala Ala Met Val Gly
65 70 75 80
His Leu Glu Ile Val Glu Val Leu Leu Lys Tyr Gly Ala Asp Val Asn
85 90 95
Ala Lys Asp Thr Met Gly Ala Thr Pro Leu His Leu Ala Ala Arg Ser
100 105 110
Gly His Leu Glu Ile Val Glu Glu Leu Leu Lys Asn Gly Ala Asp Met
115 120 125
Asn Ala Gln Asp Lys Phe Gly Lys Thr Thr Phe Asp Ile Ser Thr Asp
130 135 140
Asn Gly Asn Glu Asp Leu Ala Glu Ile Leu Gln Lys Leu Ser Gly Ser
145 150 155 160
Gly Ser Gly Ser Gly Val Lys Trp Glu Ser Leu Gly Pro Glu Ser Arg
165 170 175
Gly Arg Arg Lys Val Asp Pro Glu Ala Leu Gln Val Phe Lys Glu Ala
180 185 190
Arg Ser Val Pro Arg Thr Leu Leu Cys Leu Cys Arg Val Ala Val Arg
195 200 205
Arg Ala Leu Gly Lys His Arg Leu His Leu Ile Pro Ser Leu Pro Leu
210 215 220
Pro Asp Pro Ile Lys Lys Phe Leu Leu His Glu Gly Ser
225 230 235
<210> 43
<211> 343
<212> PRT
<213> Artificial Sequence
<220>
<223> 重组多肽序列
<400> 43
Met Asp Leu Gly Lys Lys Leu Leu Glu Ala Ala Arg Ala Gly Gln Asp
1 5 10 15
Asp Glu Val Arg Ile Leu Met Ala Asn Gly Ala Asp Val Asn Ala Ser
20 25 30
Asp Arg Gly Gly Gly Thr Pro Leu His Leu Ala Ala Ala Gly Gly His
35 40 45
Leu Glu Ile Val Glu Val Leu Leu Lys Arg Gly Ala Asp Val Ser Ala
50 55 60
Ala Asp Leu His Gly Gln Ser Pro Leu His Leu Ala Ala Met Val Gly
65 70 75 80
His Leu Glu Ile Val Glu Val Leu Leu Lys Tyr Gly Ala Asp Val Asn
85 90 95
Ala Lys Asp Thr Met Gly Ala Thr Pro Leu His Leu Ala Ala Arg Ser
100 105 110
Gly His Leu Glu Ile Val Glu Glu Leu Leu Lys Asn Gly Ala Asp Met
115 120 125
Asn Ala Gln Asp Lys Phe Gly Lys Thr Thr Phe Asp Ile Ser Thr Asp
130 135 140
Asn Gly Asn Glu Asp Leu Ala Glu Ile Leu Gln Lys Leu Ser Gly Ser
145 150 155 160
Gly Ser Gly Ser Gly Arg Leu Asn Phe Gly Asp Asp Ile Pro Ser Ala
165 170 175
Leu Arg Ile Ala Lys Lys Lys Arg Trp Asn Ser Ile Glu Glu Arg Arg
180 185 190
Ile His Gln Glu Ser Glu Leu His Ser Tyr Leu Ser Arg Leu Ile Ala
195 200 205
Ala Glu Arg Glu Arg Glu Leu Glu Glu Cys Gln Arg Asn His Glu Gly
210 215 220
Asp Glu Asp Asp Ser His Val Arg Ala Gln Gln Ala Cys Ile Glu Ala
225 230 235 240
Lys His Asp Lys Tyr Met Ala Asp Met Asp Glu Leu Phe Ser Gln Val
245 250 255
Asp Glu Lys Arg Lys Lys Arg Asp Ile Pro Asp Tyr Leu Cys Gly Lys
260 265 270
Ile Ser Phe Glu Leu Met Arg Glu Pro Cys Ile Thr Pro Ser Gly Ile
275 280 285
Thr Tyr Asp Arg Lys Asp Ile Glu Glu His Leu Gln Arg Val Gly His
290 295 300
Phe Asp Pro Val Thr Arg Ser Pro Leu Thr Gln Glu Gln Leu Ile Pro
305 310 315 320
Asn Leu Ala Met Lys Glu Val Ile Asp Ala Phe Ile Ser Glu Asn Gly
325 330 335
Trp Val Glu Asp Tyr Gly Ser
340
<210> 44
<211> 372
<212> PRT
<213> Artificial Sequence
<220>
<223> 重组多肽序列
<400> 44
Met Asp Leu Gly Lys Lys Leu Leu Glu Ala Ala Arg Ala Gly Gln Asp
1 5 10 15
Asp Glu Val Arg Ile Leu Met Ala Asn Gly Ala Asp Val Asn Ala Ser
20 25 30
Asp Arg Gly Gly Gly Thr Pro Leu His Leu Ala Ala Ala Gly Gly His
35 40 45
Leu Glu Ile Val Glu Val Leu Leu Lys Arg Gly Ala Asp Val Ser Ala
50 55 60
Ala Asp Leu His Gly Gln Ser Pro Leu His Leu Ala Ala Met Val Gly
65 70 75 80
His Leu Glu Ile Val Glu Val Leu Leu Lys Tyr Gly Ala Asp Val Asn
85 90 95
Ala Lys Asp Thr Met Gly Ala Thr Pro Leu His Leu Ala Ala Arg Ser
100 105 110
Gly His Leu Glu Ile Val Glu Glu Leu Leu Lys Asn Gly Ala Asp Met
115 120 125
Asn Ala Gln Asp Lys Phe Gly Lys Thr Thr Phe Asp Ile Ser Thr Asp
130 135 140
Asn Gly Asn Glu Asp Leu Ala Glu Ile Leu Gln Lys Leu Gly Ser Gly
145 150 155 160
Ser Gly Ser Gly Ser Val Asn Ile Ser Gly Gln Asn Thr Met Asn Met
165 170 175
Val Lys Val Pro Glu Cys Arg Leu Ala Asp Glu Leu Gly Gly Leu Trp
180 185 190
Glu Asn Ser Arg Phe Thr Asp Cys Cys Leu Cys Val Ala Gly Gln Glu
195 200 205
Phe Gln Ala His Lys Ala Ile Leu Ala Ala Arg Ser Pro Val Phe Ser
210 215 220
Ala Met Phe Glu His Glu Met Glu Glu Ser Lys Lys Asn Arg Val Glu
225 230 235 240
Ile Asn Asp Val Glu Pro Glu Val Phe Lys Glu Met Met Cys Phe Ile
245 250 255
Tyr Thr Gly Lys Ala Pro Asn Leu Asp Lys Met Ala Asp Asp Leu Leu
260 265 270
Ala Ala Ala Asp Lys Tyr Ala Leu Glu Arg Leu Lys Val Met Cys Glu
275 280 285
Asp Ala Leu Cys Ser Asn Leu Ser Val Glu Asn Ala Ala Glu Ile Leu
290 295 300
Ile Leu Ala Asp Leu His Ser Ala Asp Gln Leu Lys Thr Gln Ala Val
305 310 315 320
Asp Phe Ile Asn Tyr His Ala Ser Asp Val Leu Glu Thr Ser Gly Trp
325 330 335
Lys Ser Met Val Val Ser His Pro His Leu Val Ala Glu Ala Tyr Arg
340 345 350
Ser Leu Ala Ser Ala Gln Cys Pro Phe Leu Gly Pro Pro Arg Lys Arg
355 360 365
Leu Lys Gln Ser
370
<210> 45
<211> 393
<212> PRT
<213> Artificial Sequence
<220>
<223> 重组多肽序列
<400> 45
Met Pro Arg Arg Ala Glu Asn Trp Asp Glu Ala Glu Val Gly Ala Glu
1 5 10 15
Glu Ala Gly Val Glu Glu Tyr Gly Pro Glu Glu Asp Gly Gly Glu Glu
20 25 30
Ser Gly Ala Glu Glu Ser Gly Pro Glu Glu Ser Gly Pro Glu Glu Leu
35 40 45
Gly Ala Glu Glu Glu Met Glu Ala Gly Arg Pro Arg Pro Val Leu Arg
50 55 60
Ser Val Asn Ser Arg Glu Pro Ser Gln Val Ile Phe Cys Asn Arg Ser
65 70 75 80
Pro Arg Val Val Leu Pro Val Trp Leu Asn Phe Asp Gly Glu Pro Gln
85 90 95
Pro Tyr Pro Thr Leu Pro Pro Gly Thr Gly Arg Arg Ile His Ser Tyr
100 105 110
Arg Gly His Leu Trp Leu Phe Arg Asp Ala Gly Thr His Asp Gly Leu
115 120 125
Leu Val Asn Gln Thr Glu Leu Phe Val Pro Ser Leu Asn Val Asp Gly
130 135 140
Gln Pro Ile Phe Ala Asn Ile Thr Leu Pro Val Tyr Thr Leu Lys Glu
145 150 155 160
Arg Cys Leu Gln Val Val Arg Ser Leu Val Lys Pro Glu Asn Tyr Arg
165 170 175
Arg Leu Asp Ile Val Arg Ser Leu Tyr Glu Asp Leu Glu Asp His Pro
180 185 190
Asn Val Gln Lys Asp Leu Glu Arg Leu Thr Gln Glu Arg Ile Ala His
195 200 205
Gln Arg Met Gly Asp Leu Glu Gly Gly Gly Gly Ser Ala Ala Ala Met
210 215 220
Asp Leu Gly Lys Lys Leu Leu Glu Ala Ala Arg Ala Gly Gln Asp Asp
225 230 235 240
Glu Val Arg Ile Leu Met Ala Asn Gly Ala Asp Val Asn Ala Ser Asp
245 250 255
Arg Trp Gly Trp Thr Pro Leu His Leu Ala Ala Trp Trp Gly His Leu
260 265 270
Glu Ile Val Glu Val Leu Leu Lys Arg Gly Ala Asp Val Ser Ala Ala
275 280 285
Asp Leu His Gly Gln Ser Pro Leu His Leu Ala Ala Met Val Gly His
290 295 300
Leu Glu Ile Val Glu Val Leu Leu Lys Tyr Gly Ala Asp Val Asn Ala
305 310 315 320
Lys Asp Thr Met Gly Ala Thr Pro Leu His Leu Ala Ala Arg Ser Gly
325 330 335
His Leu Glu Ile Val Glu Glu Leu Leu Lys Asn Gly Ala Asp Met Asn
340 345 350
Ala Gln Asp Lys Phe Gly Lys Thr Thr Phe Asp Ile Ser Thr Asp Asn
355 360 365
Gly Asn Glu Asp Leu Ala Glu Ile Leu Gln Lys Leu Val Asp Gly Gly
370 375 380
Ser Asp Tyr Lys Asp Asp Asp Asp Lys
385 390
<210> 46
<211> 2245
<212> RNA
<213> Artificial Sequence
<220>
<223> 环状RNA分子序列
<400> 46
aaaauccguu gaccuuaaac ggucgugugg guucaagucc cuccaccccc acgccggaaa 60
cgcaauagcc gaaaaaacaa aaacaaaaaa aacaaaaaaa caaaaaaaaa accaaaacac 120
auuaaaacag ccuguggguu gaucccaccc acagggccca cugggcgcua gcacucuggu 180
aucacgguac cuuugugcgc cuguuuuaua cuuccucccc caacugcaac uuagaaguaa 240
cacaaaccga ucaacaguca gcguggcaca ccagccacgu uuugaucaaa cacuucuguu 300
accccggacu gaguaucaau agacugcuca cgcgguugaa ggagaaaacg uucguuaucc 360
ggccaacuac uucgagaaac cuaguaacgc cauggaaguu guggaguguu ucgcucagca 420
cuaccccagu guagaucagg uugaugaguc accgcauucc ccacggguga ccguggcggu 480
ggcugcguug gcggccugcc cauggggaaa cccaugggac gcucuuauac agacauggug 540
cgaagagucu auugagcuag uugguagucc uccggccccu gaaugcggcu aaucccaacu 600
gcggagcaua cacucucaag ccagagggua gugugucgua augggcaacu cugcagcgga 660
accgacuacu uugggugucc guguuucauu uuauuccuau acuggcugcu uauggugaca 720
auugagagau uguuaccaua uagcuauugg auuggccauc cggugacuaa cagagcuauu 780
auauaucuuu uuguuggguu uauaccacuu agcuugaaag agguuaaaac ucuacauuac 840
auuuuaauac ugaacaccgc aaaaugggcg gccuggacua caaggaugac gacgacaagg 900
ccagcgaccc cgccgaggcc gugcugcagg agaaggcccu gaaguucaug aacagcagcg 960
agagggagga cugcaacaac ggcgagcccc cuaggaagau cauccccgag aagaacagcc 1020
ugaggcagac cuacaacagc ugcgccaggc ugugccugaa ccaggagacc gugugccugg 1080
ccagcaccgc caugaagacc gagaacugcg uggccaagac caagcuggcc aacggcacca 1140
gcagcaugau cgugcccaag cagaggaagc ugagcgccag cuacgagaaa gagaaggagc 1200
ugugcgugaa guacuucgag caguggagcg aguccgacca gguggaguuc guggagcacc 1260
ugaucagcca gaugugccac uaccagcacg gccacaucaa cagcuaccug aagcccaugc 1320
ugcagaggga cuucaucacc gcccugcccg ccaggggccu ggaccacauc gccgagaaca 1380
uccugagcua ccuggacgcc aagagccugu gcgccgccga gcuggugugc aaggaguggu 1440
acagggugac cagcgacggc augcugugga agaagcugau cgagaggaug gugaggaccg 1500
acagccugug gaggggccug gccgagagga ggggcugggg ccaguaccug uucaagaaca 1560
agcccccuga cggcaacgcc ccucccaaca gcuucuacag ggcccuguac cccaagauca 1620
uccaggacau cgagaccauc gagucuaacu ggaggugcgg caggcacagc cugcagagga 1680
uccacugcag gagcggcagc gggagcggca gcgggaugga ccugggcaag aagcugcugg 1740
aggccgccag ggccggccag gacgacgagg ugaggauccu gauggccaac ggcgccgaug 1800
ugaacgcuuc ugacagggga ggaggaaccc cuuuacaccu ggccgccgcc ggaggccacc 1860
uggagaucgu ggaggugcug uugaagaggg gagcugacgu gagcgcugcu gaccugcacg 1920
gccagagccc cuugcaccuu gcugccaugg ugggacaccu ggagaucgug gaagugcugu 1980
ugaaguacgg cgcugacgug aacgccaagg acaccauggg cgccaccccc uugcaccugg 2040
ccgccagguc uggacacuua gagaucgugg aggagcugcu gaagaacggc gccgacauga 2100
acgcccagga caaguucggc aagaccaccu ucgacaucag caccgacaac ggcaacgagg 2160
accuggccga gauccugcag aagcugugaa aaaaacaaaa aacaaaacgg cuauuaugcg 2220
uuaccggcga gacgcuacgg acuua 2245
<210> 47
<211> 2335
<212> RNA
<213> Artificial Sequence
<220>
<223> 环状RNA分子序列
<400> 47
aaaauccguu gaccuuaaac ggucgugugg guucaagucc cuccaccccc acgccggaaa 60
cgcaauagcc gaaaaaacaa aaacaaaaaa aacaaaaaaa caaaaaaaaa accaaaacac 120
auuaaaacag ccuguggguu gaucccaccc acagggccca cugggcgcua gcacucuggu 180
aucacgguac cuuugugcgc cuguuuuaua cuuccucccc caacugcaac uuagaaguaa 240
cacaaaccga ucaacaguca gcguggcaca ccagccacgu uuugaucaaa cacuucuguu 300
accccggacu gaguaucaau agacugcuca cgcgguugaa ggagaaaacg uucguuaucc 360
ggccaacuac uucgagaaac cuaguaacgc cauggaaguu guggaguguu ucgcucagca 420
cuaccccagu guagaucagg uugaugaguc accgcauucc ccacggguga ccguggcggu 480
ggcugcguug gcggccugcc cauggggaaa cccaugggac gcucuuauac agacauggug 540
cgaagagucu auugagcuag uugguagucc uccggccccu gaaugcggcu aaucccaacu 600
gcggagcaua cacucucaag ccagagggua gugugucgua augggcaacu cugcagcgga 660
accgacuacu uugggugucc guguuucauu uuauuccuau acuggcugcu uauggugaca 720
auugagagau uguuaccaua uagcuauugg auuggccauc cggugacuaa cagagcuauu 780
auauaucuuu uuguuggguu uauaccacuu agcuugaaag agguuaaaac ucuacauuac 840
auuuuaauac ugaacaccgc aaaaugggcg gccuggacua caaggacgac gaugacaagg 900
ccagcugcgu gcccaggagc ggccugaucc ugagcugcau cugccuguac ugcggcgugc 960
ugcugcccgu gcugcugccc aaccugcccu uccugaccug ccugagcaug uccacccugg 1020
agagcgugac cuaccugccc gagaagggcc uguacugcca gaggcugccc agcagcagga 1080
cccacggcgg caccgagagc cugaagggca agaacaccga gaacaugggc uucuacggca 1140
cccugaagau gaucuucuac aagaugaaga ggaagcugga ccacggcagc gaggugagga 1200
gcuucagccu gggcaagaag cccugcaagg ugagcgagua caccagcacc accggccugg 1260
ugcccugcag cgccaccccc accaccuucg gcgaccugag ggccgccaac ggccagggac 1320
agcagaggag gaggaucacc agcgugcagc cucccaccgg cuuacaggag uggcugaaga 1380
uguuccagag cuggagcggc cccgagaagc ugcuggcccu ggacgagcug aucgacagcu 1440
gcgagcccac acaggugaag cacaugaugc aggugaucga gccccaguuc cagagggacu 1500
ucaucagccu gcugcccaag gagcuggccc uguacgugcu gagcuuccug gagcccaagg 1560
accugcugca ggccgcccag accugcaggu acuggaggau ccuggccgag gacaaccugc 1620
uguggaggga gaagugcaag gaggagggca ucgacgagcc ccugcacauc aagaggagga 1680
aggugaucaa gcccggcuuc auccacagcc ccuggaagag cgccuacauc aggcagcaca 1740
ggaucgacac aaacuggagg aggggcgagc ugaagagccc cagcgggagc ggcagcggga 1800
gcggcaugga ccugggcaag aagcugcugg aggccgccag ggccggccag gacgacgagg 1860
ugaggauccu gauggccaac ggcgccgacg ugaacgccag cgacaggggc ggaggcaccc 1920
ccuugcacuu agcugcugcc ggaggccacc uugagaucgu ggaaguguug cugaagaggg 1980
gcgcugaugu gucugcugcu gacuugcacg gacagagccc ucugcaccug gcugccaugg 2040
uuggacaccu ggagaucgug gaggugcugc ugaaguacgg cgccgacgug aacgcuaagg 2100
acaccauggg cgccaccccc uugcaucugg ccgccagguc uggacaccug gagaucgucg 2160
aggagcugcu gaagaacggc gcugacauga acgcccagga caaguucggc aagaccaccu 2220
ucgacaucag caccgacaac ggcaacgagg accuggcuga gauccugcag aagcugugaa 2280
aaaaacaaaa aacaaaacgg cuauuaugcg uuaccggcga gacgcuacgg acuua 2335
<210> 48
<211> 1897
<212> RNA
<213> Artificial Sequence
<220>
<223> 环状RNA分子序列
<400> 48
aaaauccguu gaccuuaaac ggucgugugg guucaagucc cuccaccccc acgccggaaa 60
cgcaauagcc gaaaaaacaa aaacaaaaaa aacaaaaaaa caaaaaaaaa accaaaacac 120
auuaaaacag ccuguggguu gaucccaccc acagggccca cugggcgcua gcacucuggu 180
aucacgguac cuuugugcgc cuguuuuaua cuuccucccc caacugcaac uuagaaguaa 240
cacaaaccga ucaacaguca gcguggcaca ccagccacgu uuugaucaaa cacuucuguu 300
accccggacu gaguaucaau agacugcuca cgcgguugaa ggagaaaacg uucguuaucc 360
ggccaacuac uucgagaaac cuaguaacgc cauggaaguu guggaguguu ucgcucagca 420
cuaccccagu guagaucagg uugaugaguc accgcauucc ccacggguga ccguggcggu 480
ggcugcguug gcggccugcc cauggggaaa cccaugggac gcucuuauac agacauggug 540
cgaagagucu auugagcuag uugguagucc uccggccccu gaaugcggcu aaucccaacu 600
gcggagcaua cacucucaag ccagagggua gugugucgua augggcaacu cugcagcgga 660
accgacuacu uugggugucc guguuucauu uuauuccuau acuggcugcu uauggugaca 720
auugagagau uguuaccaua uagcuauugg auuggccauc cggugacuaa cagagcuauu 780
auauaucuuu uuguuggguu uauaccacuu agcuugaaag agguuaaaac ucuacauuac 840
auuuuaauac ugaacaccgc aaaaugggcg gccuggacua caaggacgac gaugacaagg 900
ccagccacag gaagcaccug caggagaucc ccgaccugag cagcaacgug gccaccagcu 960
ucaccugggg cugggacagc agcaagacca gcgagcugcu gagcggcaug ggcgugagcg 1020
cccuggagaa ggaggagccc gacagcgaga acauccccca ggagcugcug agcaaccugg 1080
gccaccccga gagcccuccc aggaagaggc ugaagagcaa gggcagcgac aaggacuucg 1140
ugaucgugcg gaggcccaag cugaacaggg agaacuuccc cggcgugagc ugggacagcc 1200
ugcccgacga gcugcugcug ggcaucuuca gcugccugug ccuccccgag cugcugaagg 1260
ugagcggcgu gugcaagagg ugguacaggc uggccagcga cgagagccug uggcagaccc 1320
uggaccugac cggcaagaac cuuucuggaa gcggcucugg aucuggcaug gaccugggca 1380
agaagcugcu ggaagcugcc agggcuggac aagacgacga ggugaggauc cugauggcca 1440
acggcgcuga cgugaacgcc agcgacaggg gcggaggaac cccuuugcac cuugcugccg 1500
cuggaggaca ccuggagauc guggaggugc ugcugaagag gggcgccgac gugagcgccg 1560
cugaccugca uggacagagc ccccugcacc uggccgccau ggugggacac cuugagaucg 1620
uggaggugcu guugaaguac ggcgcugacg ugaacgcuaa ggacaccaug ggcgccaccc 1680
ccuugcaccu ggccgcuagg agcggccacc uggagaucgu ggaggagcug cugaagaacg 1740
gcgccgacau gaacgcccag gacaaguucg gcaagaccac cuucgacauc agcaccgaca 1800
acggcaacga ggaccuggcc gagauccugc agaagcugug aaaaaaacaa aaaacaaaac 1860
ggcuauuaug cguuaccggc gagacgcuac ggacuua 1897
<210> 49
<211> 2416
<212> RNA
<213> Artificial Sequence
<220>
<223> 环状RNA分子序列
<400> 49
aaaauccguu gaccuuaaac ggucgugugg guucaagucc cuccaccccc acgccggaaa 60
cgcaauagcc gaaaaaacaa aaacaaaaaa aacaaaaaaa caaaaaaaaa accaaaacac 120
auuaaaacag ccuguggguu gaucccaccc acagggccca cugggcgcua gcacucuggu 180
aucacgguac cuuugugcgc cuguuuuaua cuuccucccc caacugcaac uuagaaguaa 240
cacaaaccga ucaacaguca gcguggcaca ccagccacgu uuugaucaaa cacuucuguu 300
accccggacu gaguaucaau agacugcuca cgcgguugaa ggagaaaacg uucguuaucc 360
ggccaacuac uucgagaaac cuaguaacgc cauggaaguu guggaguguu ucgcucagca 420
cuaccccagu guagaucagg uugaugaguc accgcauucc ccacggguga ccguggcggu 480
ggcugcguug gcggccugcc cauggggaaa cccaugggac gcucuuauac agacauggug 540
cgaagagucu auugagcuag uugguagucc uccggccccu gaaugcggcu aaucccaacu 600
gcggagcaua cacucucaag ccagagggua gugugucgua augggcaacu cugcagcgga 660
accgacuacu uugggugucc guguuucauu uuauuccuau acuggcugcu uauggugaca 720
auugagagau uguuaccaua uagcuauugg auuggccauc cggugacuaa cagagcuauu 780
auauaucuuu uuguuggguu uauaccacuu agcuugaaag agguuaaaac ucuacauuac 840
auuuuaauac ugaacaccgc aaaaugggcg gccuggacua caaggacgac gaugacaagg 900
ccagcgccgg cgagggcgac cagcaggacg ccgcccacaa caugggcaac caccugcccc 960
ugcugcccgc cgagagcgag gaggaggacg agauggaggu ggaagaccag gacagcaagg 1020
aggccaagaa gcccaacauc aucaacuucg acaccagccu gcccaccagc cacaccuacc 1080
ugggcgccga cauggaggag uuccacggca ggacccugca cgacgacgac agcugccagg 1140
ugauccccgu gcugccccag gugaugauga uccugauucc cggccagacc cugccccucc 1200
agcuguucca cccccaggag gugagcaugg ugaggaaccu gauccagaag gacaggaccu 1260
ucgccgugcu ggccuacagc aacgugcagg agagggaggc ccaguucggc accaccgccg 1320
agaucuacgc cuacagggag gagcaggacu ucggcaucga gaucgugaag gucaaggcca 1380
ucggcaggca gagguucaag gugcuggagc ugaggaccca gagcgacggc auccagcagg 1440
ccaaggugca gauccugccc gagugcgugc ugcccagcac caugagcgcc gugcagcugg 1500
agagccugaa caagugccag aucuucccca gcaagcccgu gagcagggag gaccagugca 1560
gcuacaagug guggcagaag uaccagaaga ggaaguucca cugcgccaac cugaccagcu 1620
ggcccaggug gcuguacagc cuguacgacg ccgagacccu gauggacagg aucaagaagc 1680
agcugaggga gugggacgag aaccugaagg acgacagccu gcccagcaac cccaucgacu 1740
ucagcuacag gguggccgcc ugccugccca ucgacgacgu gcugaggauc cagcugcuga 1800
agaucggcag cgccauccag aggcugaggu gcgagcugga caucaugaac aagugcacca 1860
gcagcggcuc cggcagcggc uccggcaugg accugggcaa gaagcugcug gaggccgcca 1920
gggccggcca ggacgacgag gugaggaucc ugauggccaa cggcgccgac gugaacgcca 1980
gcgacagggg cggcggcacc cccuugcacc uggcugcugc uggaggccac cuugagaucg 2040
uggaggugcu gcugaagagg ggcgcugacg uuucugcugc ugaccuucau ggacagucuc 2100
cucugcaccu ggcugcuaug gugggccacc uggagaucgu ggaggugcug uugaaguacg 2160
gcgccgacgu gaacgcuaag gacaccaugg gcgccacacc uuugcacuug gcugcuagga 2220
gcggccacuu ggagaucgug gaggaguugc ugaagaacgg cgccgacaug aacgcccagg 2280
acaaguucgg caagaccacc uucgacauca gcaccgacaa cggcaacgag gaccuggccg 2340
agauccugca gaagcuguga aaaaaacaaa aaacaaaacg gcuauuaugc guuaccggcg 2400
agacgcuacg gacuua 2416
<210> 50
<211> 1798
<212> RNA
<213> Artificial Sequence
<220>
<223> 环状RNA分子序列
<400> 50
aaaauccguu gaccuuaaac ggucgugugg guucaagucc cuccaccccc acgccggaaa 60
cgcaauagcc gaaaaaacaa aaacaaaaaa aacaaaaaaa caaaaaaaaa accaaaacac 120
auuaaaacag ccuguggguu gaucccaccc acagggccca cugggcgcua gcacucuggu 180
aucacgguac cuuugugcgc cuguuuuaua cuuccucccc caacugcaac uuagaaguaa 240
cacaaaccga ucaacaguca gcguggcaca ccagccacgu uuugaucaaa cacuucuguu 300
accccggacu gaguaucaau agacugcuca cgcgguugaa ggagaaaacg uucguuaucc 360
ggccaacuac uucgagaaac cuaguaacgc cauggaaguu guggaguguu ucgcucagca 420
cuaccccagu guagaucagg uugaugaguc accgcauucc ccacggguga ccguggcggu 480
ggcugcguug gcggccugcc cauggggaaa cccaugggac gcucuuauac agacauggug 540
cgaagagucu auugagcuag uugguagucc uccggccccu gaaugcggcu aaucccaacu 600
gcggagcaua cacucucaag ccagagggua gugugucgua augggcaacu cugcagcgga 660
accgacuacu uugggugucc guguuucauu uuauuccuau acuggcugcu uauggugaca 720
auugagagau uguuaccaua uagcuauugg auuggccauc cggugacuaa cagagcuauu 780
auauaucuuu uuguuggguu uauaccacuu agcuugaaag agguuaaaac ucuacauuac 840
auuuuaauac ugaacaccgc aaaaugggcg gccuggacua caaggacgac gaugacaagg 900
ccagcgcccc caagaagagg cccgagaccc agaagaccag cgagaucgug cugaggccca 960
ggaacaagag gagcaggucc cccuuggagc ucgagcccga ggccaagaag cugugcgcca 1020
agggcagcgg ccccagcagg aggugcgaca gcgacugccu gugggugggc cuggccggcc 1080
cccagauccu gcccccuugc aggagcaucg ugaggacccu gcaccagcac aagcugggca 1140
gggccagcug gcccagcgug cagcagggcc ugcagcagag cuuccugcac acccuggaca 1200
gcuacaggau ccugcagaag gccgcccccu ucgacaggag ggccagcggc uccgggagcg 1260
gcagcgggau ggaccugggc aagaagcugc uggaagcugc uagggcugga caggaugaug 1320
aaguuaggau uuuaauggcu aauggagcug auguuaaugc cucugacagg ggcggaggaa 1380
cacccuugca uuuagccgcu gccggcggcc acuuagagau cguggaggug cugcugaaga 1440
ggggcgcuga cgugagcgcu gcugacuugc acggacagag ccccuugcac cuggccgcca 1500
ugguuggaca ccuggagauc guggaggugc uguugaagua cggcgccgac gugaacgcca 1560
aggacaccau gggcgccacc cccuugcacc uggccgcccg gagcggccac cuggagaucg 1620
uggaggagcu gcugaagaac ggcgccgaca ugaacgccca ggacaaguuc ggcaagacca 1680
ccuucgacau cagcaccgac aacggcaacg aggaccuggc cgagauccug cagaagcugu 1740
gaaaaaaaca aaaaacaaaa cggcuauuau gcguuaccgg cgagacgcua cggacuua 1798
<210> 51
<211> 1591
<212> RNA
<213> Artificial Sequence
<220>
<223> 环状RNA分子序列
<400> 51
aaaauccguu gaccuuaaac ggucgugugg guucaagucc cuccaccccc acgccggaaa 60
cgcaauagcc gaaaaaacaa aaacaaaaaa aacaaaaaaa caaaaaaaaa accaaaacac 120
auuaaaacag ccuguggguu gaucccaccc acagggccca cugggcgcua gcacucuggu 180
aucacgguac cuuugugcgc cuguuuuaua cuuccucccc caacugcaac uuagaaguaa 240
cacaaaccga ucaacaguca gcguggcaca ccagccacgu uuugaucaaa cacuucuguu 300
accccggacu gaguaucaau agacugcuca cgcgguugaa ggagaaaacg uucguuaucc 360
ggccaacuac uucgagaaac cuaguaacgc cauggaaguu guggaguguu ucgcucagca 420
cuaccccagu guagaucagg uugaugaguc accgcauucc ccacggguga ccguggcggu 480
ggcugcguug gcggccugcc cauggggaaa cccaugggac gcucuuauac agacauggug 540
cgaagagucu auugagcuag uugguagucc uccggccccu gaaugcggcu aaucccaacu 600
gcggagcaua cacucucaag ccagagggua gugugucgua augggcaacu cugcagcgga 660
accgacuacu uugggugucc guguuucauu uuauuccuau acuggcugcu uauggugaca 720
auugagagau uguuaccaua uagcuauugg auuggccauc cggugacuaa cagagcuauu 780
auauaucuuu uuguuggguu uauaccacuu agcuugaaag agguuaaaac ucuacauuac 840
auuuuaauac ugaacaccgc aaaauggacc ugggcaagaa gcugcuggag gccgccaggg 900
ccggccagga cgacgaggug aggauccuga uggccaacgg cgccgacgug aacgccagcg 960
acaggggcgg cggcaccccc uugcaccugg ccgccgccgg cggccaccug gagaucgugg 1020
aggugcugcu gaagaggggc gccgacguga gcgccgccga ccugcacggc cagagccccc 1080
ugcaccuggc cgccauggug ggccaccugg aaaucgugga ggugcugcuc aaguacggcg 1140
ccgacgugaa cgcuaaggac accaugggcg ccacccccuu gcaccuggcu gccaggagcg 1200
gccaccugga gaucgucgag gagcugcuga agaacggcgc cgacaugaac gcccaggaca 1260
aguucggcaa gaccaccuuc gacaucagca cagauaaugg caaugaagau cuggcugaaa 1320
uuuuacaaaa auuaagcgga ucugggucug gcucuggacc uaggaacggc accguucacu 1380
uguaccugac caagccccug uacaccagcg cccccagccu gcagcaccug ugcaggcuga 1440
ccaucaacaa gugcaccggc gccaucuggg gccugccccu ccccaccagg cugaaggacu 1500
accuggagga guacaaguuc caggugggca gcugaaaaaa acaaaaaaca aaacggcuau 1560
uaugcguuac cggcgagacg cuacggacuu a 1591
<210> 52
<211> 1633
<212> RNA
<213> Artificial Sequence
<220>
<223> 环状RNA分子序列
<400> 52
aaaauccguu gaccuuaaac ggucgugugg guucaagucc cuccaccccc acgccggaaa 60
cgcaauagcc gaaaaaacaa aaacaaaaaa aacaaaaaaa caaaaaaaaa accaaaacac 120
auuaaaacag ccuguggguu gaucccaccc acagggccca cugggcgcua gcacucuggu 180
aucacgguac cuuugugcgc cuguuuuaua cuuccucccc caacugcaac uuagaaguaa 240
cacaaaccga ucaacaguca gcguggcaca ccagccacgu uuugaucaaa cacuucuguu 300
accccggacu gaguaucaau agacugcuca cgcgguugaa ggagaaaacg uucguuaucc 360
ggccaacuac uucgagaaac cuaguaacgc cauggaaguu guggaguguu ucgcucagca 420
cuaccccagu guagaucagg uugaugaguc accgcauucc ccacggguga ccguggcggu 480
ggcugcguug gcggccugcc cauggggaaa cccaugggac gcucuuauac agacauggug 540
cgaagagucu auugagcuag uugguagucc uccggccccu gaaugcggcu aaucccaacu 600
gcggagcaua cacucucaag ccagagggua gugugucgua augggcaacu cugcagcgga 660
accgacuacu uugggugucc guguuucauu uuauuccuau acuggcugcu uauggugaca 720
auugagagau uguuaccaua uagcuauugg auuggccauc cggugacuaa cagagcuauu 780
auauaucuuu uuguuggguu uauaccacuu agcuugaaag agguuaaaac ucuacauuac 840
auuuuaauac ugaacaccgc aaaauggacc ugggcaagaa gcugcuggag gccgccaggg 900
ccggccagga cgacgaggug aggauccuga uggccaacgg cgccgacgug aacgccagcg 960
acaggggcgg cggcaccccu cugcaccugg ccgccgccgg cggccaccug gagaucgugg 1020
aggugcugcu gaagaggggc gccgacguga gcgccgccga ccugcacggc cagagccccc 1080
ugcaccuggc cgccauggug ggccaccugg agaucgucga ggugcugcug aaguacggcg 1140
ccgacgugaa cgcuaaggac accaugggcg ccaccccucu gcaccuggcu gccaggagcg 1200
gccaccugga gaucguugag gagcugcuga agaacggcgc cgacaugaac gcccaggaca 1260
aguucggcaa gaccaccuuc gacaucagca ccgacaacgg caacgaggau uuagcugaaa 1320
uuuuacaaaa auuaagcggu agcggaucug gaaguggagu uaaaugggag agccuuggac 1380
cugagagcag gggcaggagg aagguggacc ccgaggcccu gcagguguuc aaggaggcca 1440
ggagcgugcc caggacccug cugugccucu gcaggguggc cgugaggagg gcccugggca 1500
agcacaggcu gcaccugauc cccagccugc cccuccccga ccccaucaag aaguuccugc 1560
ugcacgaggg cagcugaaaa aaacaaaaaa caaaacggcu auuaugcguu accggcgaga 1620
cgcuacggac uua 1633
<210> 53
<211> 1951
<212> RNA
<213> Artificial Sequence
<220>
<223> 环状RNA分子序列
<400> 53
aaaauccguu gaccuuaaac ggucgugugg guucaagucc cuccaccccc acgccggaaa 60
cgcaauagcc gaaaaaacaa aaacaaaaaa aacaaaaaaa caaaaaaaaa accaaaacac 120
auuaaaacag ccuguggguu gaucccaccc acagggccca cugggcgcua gcacucuggu 180
aucacgguac cuuugugcgc cuguuuuaua cuuccucccc caacugcaac uuagaaguaa 240
cacaaaccga ucaacaguca gcguggcaca ccagccacgu uuugaucaaa cacuucuguu 300
accccggacu gaguaucaau agacugcuca cgcgguugaa ggagaaaacg uucguuaucc 360
ggccaacuac uucgagaaac cuaguaacgc cauggaaguu guggaguguu ucgcucagca 420
cuaccccagu guagaucagg uugaugaguc accgcauucc ccacggguga ccguggcggu 480
ggcugcguug gcggccugcc cauggggaaa cccaugggac gcucuuauac agacauggug 540
cgaagagucu auugagcuag uugguagucc uccggccccu gaaugcggcu aaucccaacu 600
gcggagcaua cacucucaag ccagagggua gugugucgua augggcaacu cugcagcgga 660
accgacuacu uugggugucc guguuucauu uuauuccuau acuggcugcu uauggugaca 720
auugagagau uguuaccaua uagcuauugg auuggccauc cggugacuaa cagagcuauu 780
auauaucuuu uuguuggguu uauaccacuu agcuugaaag agguuaaaac ucuacauuac 840
auuuuaauac ugaacaccgc aaaauggacc ugggcaagaa gcugcuggag gccgccaggg 900
ccggccagga cgacgaggug aggauccuga uggccaacgg cgccgacgug aacgccagcg 960
acaggggcgg cggcaccccc uugcaccugg ccgccgccgg cggccaccug gagaucgugg 1020
aggugcugcu gaagaggggc gccgacguga gcgccgccga ccugcacggc cagagccccc 1080
ugcaccuggc cgccauggug ggccaccugg agaucgucga ggugcugcug aaguacggcg 1140
ccgacgugaa cgcuaaggac accaugggcg ccacccccuu gcaccuggcu gccaggagcg 1200
gccaccugga gaucguugag gagcugcuga agaacggcgc cgacaugaac gcccaggaca 1260
aguucggcaa gaccaccuuc gacaucagca cagacaaugg aaaugaggau uuagcugaaa 1320
uuuuacaaaa acugucuggc agcggcucug gaucugguag gcuuaacuuc ggcgacgaca 1380
ucccuagcgc ccugaggauc gccaagaaga agagguggaa cagcaucgag gagaggagga 1440
uccaccagga gagcgagcug cacagcuacc ugagcaggcu gaucgccgcc gagagagaga 1500
gggagcugga ggagugccag aggaaccacg agggcgacga ggacgacagc cacgugaggg 1560
cccagcaggc cugcaucgag gccaagcacg acaaguacau ggccgacaug gacgagcugu 1620
ucagccaggu ggacgagaag aggaagaaga gggacauccc cgacuaccug ugcggcaaga 1680
ucagcuucga gcugaugagg gagcccugca ucacccccag cggcaucacc uacgacagga 1740
aggacaucga ggagcaccug cagagggugg gccacuucga ccccgugacc aggagccccc 1800
ugacccagga gcagcugauc cccaaccugg ccaugaagga ggugaucgac gccuucauca 1860
gcgagaacgg cuggguggag gacuacggca gcugaaaaaa acaaaaaaca aaacggcuau 1920
uaugcguuac cggcgagacg cuacggacuu a 1951
<210> 54
<211> 2038
<212> RNA
<213> Artificial Sequence
<220>
<223> 环状RNA分子序列
<400> 54
aaaauccguu gaccuuaaac ggucgugugg guucaagucc cuccaccccc acgccggaaa 60
cgcaauagcc gaaaaaacaa aaacaaaaaa aacaaaaaaa caaaaaaaaa accaaaacac 120
auuaaaacag ccuguggguu gaucccaccc acagggccca cugggcgcua gcacucuggu 180
aucacgguac cuuugugcgc cuguuuuaua cuuccucccc caacugcaac uuagaaguaa 240
cacaaaccga ucaacaguca gcguggcaca ccagccacgu uuugaucaaa cacuucuguu 300
accccggacu gaguaucaau agacugcuca cgcgguugaa ggagaaaacg uucguuaucc 360
ggccaacuac uucgagaaac cuaguaacgc cauggaaguu guggaguguu ucgcucagca 420
cuaccccagu guagaucagg uugaugaguc accgcauucc ccacggguga ccguggcggu 480
ggcugcguug gcggccugcc cauggggaaa cccaugggac gcucuuauac agacauggug 540
cgaagagucu auugagcuag uugguagucc uccggccccu gaaugcggcu aaucccaacu 600
gcggagcaua cacucucaag ccagagggua gugugucgua augggcaacu cugcagcgga 660
accgacuacu uugggugucc guguuucauu uuauuccuau acuggcugcu uauggugaca 720
auugagagau uguuaccaua uagcuauugg auuggccauc cggugacuaa cagagcuauu 780
auauaucuuu uuguuggguu uauaccacuu agcuugaaag agguuaaaac ucuacauuac 840
auuuuaauac ugaacaccgc aaaauggacc ugggcaagaa gcugcuggag gccgccaggg 900
ccggccagga cgacgaggug aggauccuga uggccaacgg cgccgacgug aacgccagcg 960
acaggggcgg cggcaccccc uugcaccugg ccgccgccgg cggccaccug gagauugugg 1020
aggugcugcu gaagaggggc gccgacguga gcgccgccga ccugcacggc cagagccccc 1080
ugcaccuggc cgccauggug ggccaccugg agaucgugga ggugcugcug aaguacggcg 1140
ccgacgugaa cgcuaaggac accaugggcg ccacccccuu gcaccucgcc gccaggagcg 1200
gccaccugga gaucgucgag gagcugcuga agaacggcgc cgacaugaac gcccaggaca 1260
aguucggcaa gaccaccuuc gacaucagca ccgacaacgg caacgaggac uuagcugaaa 1320
uuuuacaaaa auuaggaucu ggaagcggau caggaucugu uaauaucagc ggccagaaca 1380
ccaugaacau ggugaaggug cccgagugca ggcuggccga cgagcugggc ggccuguggg 1440
agaacagcag guucaccgac ugcugccugu gcguggccgg ccaggaguuc caggcccaca 1500
aggccauccu ggccgccagg agccccgugu ucagcgccau guucgagcac gagauggagg 1560
agagcaagaa gaacagggug gagaucaacg acguggagcc cgagguguuc aaggagauga 1620
ugugcuucau cuacaccggc aaggccccca accuggacaa gauggccgac gaccugcugg 1680
ccgccgccga caaguacgcc cuggagaggc ugaaggugau gugcgaggac gcccugugca 1740
gcaaccugag cguggagaac gccgccgaga uccugauucu ggccgaccug cacagcgccg 1800
accagcugaa gacccaggcc guggacuuca ucaacuacca cgccagcgac gugcuggaga 1860
ccagcggcug gaagagcaug guggugagcc acccccaccu gguggccgag gccuacagga 1920
gccuggccag cgcccagugc cccuuccugg gcccuccuag gaagaggcug aagcagagcu 1980
gaaaaaaaca aaaaacaaaa cggcuauuau gcguuaccgg cgagacgcua cggacuua 2038
<210> 55
<211> 2101
<212> RNA
<213> Artificial Sequence
<220>
<223> 环状RNA分子序列
<400> 55
aaaauccguu gaccuuaaac ggucgugugg guucaagucc cuccaccccc acgccggaaa 60
cgcaauagcc gaaaaaacaa aaacaaaaaa aacaaaaaaa caaaaaaaaa accaaaacac 120
auuaaaacag ccuguggguu gaucccaccc acagggccca cugggcgcua gcacucuggu 180
aucacgguac cuuugugcgc cuguuuuaua cuuccucccc caacugcaac uuagaaguaa 240
cacaaaccga ucaacaguca gcguggcaca ccagccacgu uuugaucaaa cacuucuguu 300
accccggacu gaguaucaau agacugcuca cgcgguugaa ggagaaaacg uucguuaucc 360
ggccaacuac uucgagaaac cuaguaacgc cauggaaguu guggaguguu ucgcucagca 420
cuaccccagu guagaucagg uugaugaguc accgcauucc ccacggguga ccguggcggu 480
ggcugcguug gcggccugcc cauggggaaa cccaugggac gcucuuauac agacauggug 540
cgaagagucu auugagcuag uugguagucc uccggccccu gaaugcggcu aaucccaacu 600
gcggagcaua cacucucaag ccagagggua gugugucgua augggcaacu cugcagcgga 660
accgacuacu uugggugucc guguuucauu uuauuccuau acuggcugcu uauggugaca 720
auugagagau uguuaccaua uagcuauugg auuggccauc cggugacuaa cagagcuauu 780
auauaucuuu uuguuggguu uauaccacuu agcuugaaag agguuaaaac ucuacauuac 840
auuuuaauac ugaacaccgc aaaaugccca ggagggccga gaacugggac gaggccgagg 900
ugggcgccga ggaggccggc guggaggagu acggccccga ggaggacggc ggcgaggaga 960
gcggcgccga ggagagcggc cccgaagaga gcggccccga ggaacugggc gccgaggagg 1020
agauggaggc cggcaggccc agacccgugc ugaggagcgu gaacagcagg gagcccagcc 1080
aggugaucuu cugcaacagg agccccaggg uggugcugcc cguguggcug aacuucgacg 1140
gcgagcccca gcccuacccc acccugcccc cuggcaccgg caggaggauc cacagcuaca 1200
ggggccaccu guggcuguuc agagacgccg gcacacacga uggccuucug guuaaccaaa 1260
cagaauuauu ugugccuucu cugaauguug acggacagcc uauuuuugcc aauaucacac 1320
ugccugugua uacacugaaa gagaggugcc ugcagguugu gaggagccug gugaagcccg 1380
agaacuacag gagacuggac aucgugagga gccuguacga ggaccuggag gaccacccca 1440
acgugcagaa ggaccuggag aggcugaccc aggagaggau cgcccaccag aggaugggcg 1500
accuggaggg cggaggcggc agcgccgccg ccauggaccu gggcaagaag cugcuggagg 1560
ccgccagggc cggccaggac gacgagguga ggauccugau ggccaauggc gccgacguga 1620
acgccagcga cagguggggc uggaccccuc ugcaccuggc cgccuggugg ggccaccugg 1680
agaucgugga ggugcuguug aagaggggcg cugauguuag cgccgcugau cugcacggac 1740
aaagcccccu gcaucuggcu gccauggugg gccaccugga aauuguggaa gugcuguuga 1800
aguacggagc ugauguuaac gccaaagaua ccaugggagc uaccccucug caccuggcug 1860
ccaggagcgg ccaccucgag aucguggagg agcuguugaa gaacggcgcu gacaugaacg 1920
cccaggacaa guucggcaag accaccuucg acaucagcac cgacaacggc aacgaggacc 1980
uggccgagau ccugcagaag cugguggacg gcggcagcga cuacaaggac gacgaugaca 2040
agugaaaaaa acaaaaaaca aaacggcuau uaugcguuac cggcgagacg cuacggacuu 2100
a 2101
<210> 56
<211> 1432
<212> RNA
<213> Artificial Sequence
<220>
<223> 环状RNA分子序列
<400> 56
aaaauccguu gaccuuaaac ggucgugugg guucaagucc cuccaccccc acgccggaaa 60
cgcaauagcc gaaaaaacaa aaacaaaaaa aacaaaaaaa caaaaaaaaa accaaaacac 120
auuaaaacag ccuguggguu gaucccaccc acagggccca cugggcgcua gcacucuggu 180
aucacgguac cuuugugcgc cuguuuuaua cuuccucccc caacugcaac uuagaaguaa 240
cacaaaccga ucaacaguca gcguggcaca ccagccacgu uuugaucaaa cacuucuguu 300
accccggacu gaguaucaau agacugcuca cgcgguugaa ggagaaaacg uucguuaucc 360
ggccaacuac uucgagaaac cuaguaacgc cauggaaguu guggaguguu ucgcucagca 420
cuaccccagu guagaucagg uugaugaguc accgcauucc ccacggguga ccguggcggu 480
ggcugcguug gcggccugcc cauggggaaa cccaugggac gcucuuauac agacauggug 540
cgaagagucu auugagcuag uugguagucc uccggccccu gaaugcggcu aaucccaacu 600
gcggagcaua cacucucaag ccagagggua gugugucgua augggcaacu cugcagcgga 660
accgacuacu uugggugucc guguuucauu uuauuccuau acuggcugcu uauggugaca 720
auugagagau uguuaccaua uagcuauugg auuggccauc cggugacuaa cagagcuauu 780
auauaucuuu uuguuggguu uauaccacuu agcuugaaag agguuaaaac ucuacauuac 840
auuuuaauac ugaacaccgc aaaauggacc ugggcaagaa gcugcuggag gccgccaggg 900
ccggccagga cgacgaggug aggauccuga uggccaaugg cgccgacgug aacgccagcg 960
acagaggcgg cggcaccccu cugcaccugg ccgccgccgg cggacaccug gaaauugugg 1020
aggugcuguu gaagaggggc gcugauguua gcgccgcuga ucugcacgga caaagccccc 1080
ugcaucuggc ugccauggug ggccaccugg aaauugugga agugcuguug aaguacggag 1140
cugauguuaa cgccaaagau accaugggag cuaccccucu gcaccuggcu gccaggagcg 1200
gccaccucga gaucguggag gagcuguuga agaacggcgc ugacaugaac gcccaggaca 1260
aguucggcaa gaccaccuuc gacaucagca ccgacaacgg caacgaggac cuggccgaga 1320
uccugcagaa gcugguggac ggcggcagcg acuacaagga cgacgaugac aagugaaaaa 1380
aacaaaaaac aaaacggcua uuaugcguua ccggcgagac gcuacggacu ua 1432
<210> 57
<211> 10
<212> PRT
<213> Artificial Sequence
<220>
<223> 连接肽序列
<400> 57
Leu Glu Gly Gly Gly Gly Ser Ala Ala Ala
1 5 10

Claims (16)

1.一种环状RNA分子,其中,所述环状RNA分子编码具有目标效应活性的重组多肽,所述目标效应活性为目标蛋白的靶向降解活性。
2.根据权利要求1所述的环状RNA分子,其中,所述重组多肽包括靶向结合所述目标蛋白的第一多肽,和与所述第一多肽融合的第二多肽,所述第二多肽具有E3泛素连接酶的酶活性;
可选地,所述重组多肽还包含连接所述第一多肽与所述第二多肽的连接肽。
3.根据权利要求1或2所述的环状RNA分子,其中,所述目标蛋白为跨膜蛋白或细胞内蛋白;优选地,所述目标蛋白为疾病相关蛋白;可选地,所述疾病相关蛋白为肿瘤相关蛋白。
4.根据权利要求2或3所述的环状RNA分子,其中,所述第一多肽为靶向结合所述目标蛋白的抗体、抗体片段或抗原结合多肽。
5.根据权利要求2-4任一项所述的环状RNA分子,其中,所述第二多肽选自E3泛素连接酶或其功能片段;可选地,所述E3泛素连接酶的功能片段包含如下的任一种:HECT结构域、RING结构域或U-box结构域。
6.根据权利要求2-5任一项所述的环状RNA分子,其中,所述第二多肽选自CRBN、VHL、MDM2、cIAP、βTrCP、FBW7、SPOP、SKP2、DDB2、SOCS2、ASB1、CHIP或上述任一种的功能片段。
7.根据权利要求1-6任一项所述的环状RNA分子,其中,所述环状RNA分子包括编码所述重组多肽的编码区序列,和与所述编码区序列可操作地连接的IRES序列。
8.根据权利要求7所述的环状RNA分子,其中,环状RNA分子还包括如下的一种或两种以上的序列:第二外显子序列、第一外显子序列、5’间隔序列、3’间隔序列;
优选地,所述环状RNA分子包括顺次连接的如下所示序列:第二外显子序列、5’间隔序列、IRES序列、编码区序列、3’间隔序列和第一外显子序列。
9.根据权利要求1-8任一项所述的环状RNA分子,其中,所述目标效应活性为受试者体内的目标蛋白的靶向降解活性;优选地,所述环状RNA分子被施用于受试者体内;
可选地,所述环状RNA分子通过口服、腹膜内、静脉内、动脉内、肌肉内、皮内、皮下、经皮、鼻腔、经直肠,肿瘤体内注射、肿瘤腔内留置、神经鞘内注射、蛛网膜下腔注射或系统性施用,优选为肿瘤体内注射。
10.一种环化前体RNA分子,其中,所述环化前体RNA分子环化形成根据权利要求1-9任一项所述的环状RNA分子;
可选地,所述环化前体RNA分子包括顺次连接的如下所示序列:
5’同源臂序列、3’内含子序列、第二外显子序列、5’间隔区序列、IRES序列、编码区序列、3’间隔区序列、第一外显子序列、5’内含子序列和3’同源臂序列。
11.一种重组核酸分子,其中,所述重组核酸分子转录形成根据权利要求10所述的环化前体RNA分子。
12.一种重组表达载体,其中,所述重组表达载体包含根据权利要求11所述的重组核酸分子。
13.一种重组宿主细胞,其中,所述重组宿主细胞包含根据权利要求1-9任一项所述的环状RNA分子,根据权利要求10所述的环化前体RNA分子,根据权利要求11所述的重组核酸分子,或根据权利要求12所述的重组表达载体。
14.一种组合物,其中,所述组合物包括根据权利要求1-9任一项所述的环状RNA分子;可选地,所述组合物还包括一种或多种药学上可接受的载体。
15.根据权利要求1-9任一项所述的环状RNA分子,根据权利要求10所述的环化前体RNA分子,根据权利要求11所述的重组核酸分子,根据权利要求12所述的重组表达载体,根据权利要求13所述的重组宿主细胞,或根据权利要求14所述的组合物在如下(a)-(d)至少一种中的用途:
(a)目标蛋白的靶向降解,优选受试者体内的目标蛋白的靶向降解;
(b)降低或消除目标蛋白的表达,优选降低或消除受试者体内的目标蛋白的表达;
(c)作为或制备目标蛋白的靶向降解的试剂,优选作为或制备受试者体内的目标蛋白的靶向降解的试剂;
(d)作为或制备治疗疾病的药物,优选作为或制备治疗肿瘤的药物。
16.一种预防或治疗疾病的方法,其中,包括向受试者施用根据权利要求1-9任一项所述的环状RNA分子,根据权利要求10所述的环化前体RNA分子,根据权利要求11所述的重组核酸分子,根据权利要求12所述的重组表达载体,根据权利要求13所述的重组宿主细胞,或根据权利要求14所述的组合物;
可选地,所述施用选自口服、腹膜内、静脉内、动脉内、肌肉内、皮内、皮下、经皮、鼻腔、经直肠,肿瘤体内注射、肿瘤腔内留置、神经鞘内注射、蛛网膜下腔注射或系统性施用;优选为肿瘤体内注射。
CN202110863519.2A 2021-07-29 2021-07-29 环状rna分子及其在目标蛋白的靶向降解中的应用 Pending CN114591986A (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN202110863519.2A CN114591986A (zh) 2021-07-29 2021-07-29 环状rna分子及其在目标蛋白的靶向降解中的应用
US17/815,035 US20230042694A1 (en) 2021-07-29 2022-07-26 Circular rna molecule and use thereof in targeted degradation of protein of interest
EP22187715.2A EP4124347A1 (en) 2021-07-29 2022-07-29 Circular rna molecule and use thereof in targeted degradation of protein of interest

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110863519.2A CN114591986A (zh) 2021-07-29 2021-07-29 环状rna分子及其在目标蛋白的靶向降解中的应用

Publications (1)

Publication Number Publication Date
CN114591986A true CN114591986A (zh) 2022-06-07

Family

ID=81803854

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110863519.2A Pending CN114591986A (zh) 2021-07-29 2021-07-29 环状rna分子及其在目标蛋白的靶向降解中的应用

Country Status (3)

Country Link
US (1) US20230042694A1 (zh)
EP (1) EP4124347A1 (zh)
CN (1) CN114591986A (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114591952A (zh) * 2021-08-13 2022-06-07 苏州科锐迈德生物医药科技有限公司 一种组织特异性表达的环状rna分子及其应用
CN116732039B (zh) * 2023-08-03 2023-11-14 呈诺再生医学科技(北京)有限公司 一种促进rna序列在细胞内直接环化翻译的序列组合及其应用

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015034925A1 (en) * 2013-09-03 2015-03-12 Moderna Therapeutics, Inc. Circular polynucleotides
CN112189051A (zh) * 2018-03-16 2021-01-05 康奈尔大学 用工程化细菌泛素连接酶模拟物进行的广谱蛋白质组编辑
CN112481289A (zh) * 2020-12-04 2021-03-12 江苏普瑞康生物医药科技有限公司 一种转录环状rna的重组核酸分子及其在蛋白表达中的应用

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021531022A (ja) * 2018-07-24 2021-11-18 フラッグシップ パイオニアリング イノベーションズ シックス,エルエルシー 環状ポリリボヌクレオチドを含む組成物及びその使用
CA3139032A1 (en) * 2019-05-22 2020-11-26 Robert Alexander WESSELHOEFT Circular rna compositions and methods
WO2020257730A1 (en) * 2019-06-19 2020-12-24 Flagship Pioneering Innovations Vi, Llc Compositions comprising circular polyribonucleotides for protein modulation and uses thereof

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015034925A1 (en) * 2013-09-03 2015-03-12 Moderna Therapeutics, Inc. Circular polynucleotides
CN112189051A (zh) * 2018-03-16 2021-01-05 康奈尔大学 用工程化细菌泛素连接酶模拟物进行的广谱蛋白质组编辑
CN112481289A (zh) * 2020-12-04 2021-03-12 江苏普瑞康生物医药科技有限公司 一种转录环状rna的重组核酸分子及其在蛋白表达中的应用

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
GEORGE M. BURSLEM 等: "Proteolysis-Targeting Chimeras as Therapeutics and Tools for Biological Discovery", 《CELL》, pages 102 - 114 *
JIALI YANG 等: "Circular mRNA encoded PROTAC (RiboPROTAC) as a new platform for the degradation of intracellular therapeutic targets", 《BIORXIV》, pages 1 - 24 *
SHUHUI LIM 等: "bioPROTACs as versatile modulators of intracellular therapeutic targets including proliferating cell nuclear antigen (PCNA)", 《PNAS》, pages 5791 *
SHUHUI LIM 等: "Exquisitely Specific anti-KRAS Biodegraders Inform on the Cellular Prevalence of Nucleotide-Loaded States", 《ACS CENTRAL SCIENCE》, pages 274 - 291 *
李鳌 等: "环状RNA相关功能研究进展", 《中华卫生应急电子杂志》, pages 311 - 313 *

Also Published As

Publication number Publication date
EP4124347A1 (en) 2023-02-01
US20230042694A1 (en) 2023-02-09

Similar Documents

Publication Publication Date Title
US11634727B2 (en) Recombinant nucleic acid molecule of transcriptional circular RNA and its application in protein expression
JP5697042B2 (ja) 遺伝子発現を上昇させるシステム及び該システムを保持したベクター
CN105349618B (zh) 三阴性乳腺癌标记物及其在诊断和治疗中的应用
JP2021530223A (ja) 組織特異性Wntシグナル増強分子及びその使用
EA029954B1 (ru) Анти-muc1 антитела
EP4124347A1 (en) Circular rna molecule and use thereof in targeted degradation of protein of interest
CA2743057C (en) Compositions and methods for the inhibition of cripto/grp78 complex formation and signaling
Bot et al. Multiple-interactions among EMILIN1 and EMILIN2 N-and C-terminal domains
WO2018184267A1 (zh) mRNA编码的纳米抗体及其应用
CN101643511B (zh) 抑制端粒酶活性的融合蛋白、其制备及应用
CN103675294A (zh) 新的肿瘤血清标志物及其应用
CN111410695B (zh) 基于自噬机制介导Tau蛋白降解的嵌合分子及其应用
WO2023179789A1 (zh) 干扰趋化素样因子超家族成员6(cmtm6)表达的基因治疗载体的制备和抗肿瘤应用
CN113727602B (zh) 抗nme抗体及治疗癌症或癌症转移的方法
WO2022116528A1 (zh) 环状rna、包含环状rna的疫苗及用于检测新型冠状病毒中和抗体的试剂盒
WO2022174451A1 (zh) 一种具有抗癌活性的多结构域融合蛋白
CN116367857A (zh) 抗nme抗体及治疗癌症或癌症转移的方法
JP2002518008A (ja) アンジオスタチン結合性タンパク質
CN113637695A (zh) 靶向刺激体液免疫和细胞免疫的新冠病毒mRNA疫苗
WO2020143507A1 (zh) 治疗恶性肿瘤的抗体及其应用
WO2022253340A1 (zh) 环状RNA Circ-ACE2翻译的多肽及其应用
US8282918B2 (en) Polynucleotides encoding RPA4/RPA32 hybrid polypeptides
US20130287792A1 (en) Compositions and methods to block mtb-mediated evasion
CN105420260A (zh) 重组靶向Wnt融合蛋白及其在制备抗癌药中的应用
US20210388086A1 (en) Antibodies for detecting various tumor cells and uses thereof

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40075253

Country of ref document: HK