CN107124889A - 人工核酸分子 - Google Patents

人工核酸分子 Download PDF

Info

Publication number
CN107124889A
CN107124889A CN201580070984.3A CN201580070984A CN107124889A CN 107124889 A CN107124889 A CN 107124889A CN 201580070984 A CN201580070984 A CN 201580070984A CN 107124889 A CN107124889 A CN 107124889A
Authority
CN
China
Prior art keywords
utr
nucleic acid
gene
acid molecule
artificial nucleic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201580070984.3A
Other languages
English (en)
Inventor
斯缔芬尼·格朗德
托马斯·施拉克
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Curevac SE
Original Assignee
Curevac AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Curevac AG filed Critical Curevac AG
Publication of CN107124889A publication Critical patent/CN107124889A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/67General methods for enhancing the expression
    • C12N15/68Stabilisation of the vector
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P1/00Drugs for disorders of the alimentary tract or the digestive system
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K31/00Medicinal preparations containing organic active ingredients
    • A61K31/70Carbohydrates; Sugars; Derivatives thereof
    • A61K31/7088Compounds having three or more nucleosides or nucleotides
    • A61K31/713Double-stranded nucleic acids or oligonucleotides
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • A61K48/0066Manipulation of the nucleic acid to modify its expression pattern, e.g. enhance its duration of expression, achieved by the presence of particular introns in the delivered nucleic acid
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P11/00Drugs for disorders of the respiratory system
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P15/00Drugs for genital or sexual disorders; Contraceptives
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P17/00Drugs for dermatological disorders
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P17/00Drugs for dermatological disorders
    • A61P17/02Drugs for dermatological disorders for treating wounds, ulcers, burns, scars, keloids, or the like
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P19/00Drugs for skeletal disorders
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P19/00Drugs for skeletal disorders
    • A61P19/04Drugs for skeletal disorders for non-specific disorders of the connective tissue
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P21/00Drugs for disorders of the muscular or neuromuscular system
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P25/00Drugs for disorders of the nervous system
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P3/00Drugs for disorders of the metabolism
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P3/00Drugs for disorders of the metabolism
    • A61P3/02Nutrients, e.g. vitamins, minerals
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P43/00Drugs for specific purposes, not provided for in groups A61P1/00-A61P41/00
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P5/00Drugs for disorders of the endocrine system
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P7/00Drugs for disorders of the blood or the extracellular fluid
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P9/00Drugs for disorders of the cardiovascular system
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/67General methods for enhancing the expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/50Vector systems having a special element relevant for transcription regulating RNA stability, not being an intron, e.g. poly A signal
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2840/00Vectors comprising a special translation-regulating system
    • C12N2840/10Vectors comprising a special translation-regulating system regulates levels of translation
    • C12N2840/105Vectors comprising a special translation-regulating system regulates levels of translation enhancing translation

Abstract

本发明涉及人工核酸分子,其包含至少一个可读框和至少一个3’‑非翻译区元件(3’‑UTR元件)和/或至少一个5’‑非翻译区元件(5’‑UTR元件),其中所述至少一个3’‑UTR元件和/或所述至少一个5’‑UTR元件延长和/或增加从所述人工核酸分子的蛋白生产,并且其中所述至少一个3’‑UTR元件和/或所述至少一个5’‑UTR元件源自稳定mRNA。本发明还涉及所述人工核酸分子在基因治疗和/或基因疫苗接种中的用途。此外,公开了用于鉴别源自稳定mRNA元件的3’‑UTR元件和/或5’‑UTR的方法。

Description

人工核酸分子
在DARPA授予的协定号HR0011-11-3-0001下由政府支持进行本发明。政府对本发明有某些权利。本申请要求2014年12月30日提交的国际专利申请PCT/EP2014/003479的优先权,其通过引用结合于本文。
本发明涉及人工核酸分子,其包含可读框,3’-非翻译区元件(3’-UTR 元件)和/或5’-非翻译区元件(5’-UTR元件)和任选地聚腺苷酸序列和/或聚腺苷酸化-信号。本发明还涉及包含3’-UTR元件和/或5’-UTR元件的载体,涉及包含所述人工核酸分子或所述载体的细胞,涉及包含所述人工核酸分子或所述载体的药物组合物,以及涉及包含所述人工核酸分子,所述载体和/或所述药物组合物的试剂盒,优选用于基因治疗和/或基因接种疫苗的领域。
基因治疗和基因接种疫苗属于最有希望和快速发展的现代医学方法。它们可以为多种疾病的治疗提供高度特异和个性化选择。尤其是,不仅遗传病,而且自身免疫疾病、癌或肿瘤相关疾病以及炎性疾病可以是此种治疗方法的对象。而且,人们设想通过这些方法预防此类疾病的早期发病。
基因治疗背后的主要构思理念为适当调节与特定疾病的病理状态相关的受损的基因表达。病理学上改变的基因表达可以导致缺少或过量生产关键基因产物,例如,信号传导因子诸如激素,看家因子(housekeeping factors),代谢酶,结构蛋白等。改变的基因表达可以不仅由于转录和/或翻译的错误调节,而且还由于编码特定蛋白的ORF内的突变。病理突变可以由例如染色体畸变,或由更特异突变,如点或移码突变引起,它们全部都导致受限的功能和,可能完全丧失基因产物的功能。然而,转录或翻译的错误调节也可以发生,如果突变影响编码参与细胞的转录或翻译机制的蛋白的基因。此种突变可以导致基因病理上调或下调,其因此是功能性的。编码发挥此种调节功能的基因产物的基因,可以是例如,转录因子、信号受体、信使蛋白等。然而,此种编码调节蛋白的基因的功能缺失,在某些情况下可以由人工引入进一步作用于受损的基因产物下游的其它因子反转。此种基因缺陷还可以通过置换受影响基因本身的基因治疗补偿。
基因接种疫苗允许引起对选择的抗原所需的免疫应答,所述选择的抗原诸如细菌表面的特征组分、病毒粒子、肿瘤抗原等。一般而言,疫苗接种是现代医学的关键性成就之一。然而,目前仅对有限的疾病有可用的有效疫苗。因此,不能由疫苗接种预防的感染每年仍然影响数百万人。
通常,疫苗可以细分为“第一代”,“第二代”和“第三代”疫苗。“第一代”疫苗典型地是,全生物体疫苗。它们基于活的和减毒或被杀灭的病原体,例如病毒,细菌等。活疫苗和减毒疫苗的主要缺点是向危及生命的变体回复的风险。因此,尽管被减毒,但此种病原体本质上仍然可以带有不可预测的风险。杀灭的病原体可能不如所需要的那样有效产生特异免疫应答。为了最小化这些风险,开发了“第二代”疫苗。这些典型地为亚单位疫苗,所述亚单位疫苗由源自病原体的限定的抗原或重组蛋白组分组成。
基因疫苗,即用于基因接种的疫苗,通常被理解为“第三代”疫苗。它们典型地由遗传改造的核酸分子构成,所述遗传改造的核酸分子允许表达对于体内病原体或肿瘤抗原为特征性的肽或蛋白(抗原)片段。在施用于患者,由靶细胞摄取后,基因疫苗表达。施用的核酸的表达导致产生编码的蛋白。如果这些蛋白被患者的免疫系统识别为外源,则引发免疫应答。
如从上文可以看出的,基因治疗和基因接种疫苗方法,基本上都基于向患者施用核酸分子并随后转录和/或翻译编码的遗传信息。备选地,基因接种疫苗或基因治疗还可以包含以下方法,所述方法包括从要治疗的患者分离特异体细胞,随后活体外转染此种细胞,并将处理后的细胞再施用于患者。
DNA以及RNA可以用作在基因治疗或基因接种疫苗范畴内施用的核酸分子。已知DNA相对稳定并易于操作。然而,使用DNA承担施用的 DNA-片段不希望的插入患者基因组中、从而导致突变事件如受损基因功能的丧失的风险。作为进一步的风险,出现不希望产生的抗DNA抗体。另一个缺点是在DNA施用后可以获得的编码肽或蛋白的有限表达水平,因为DNA必需进入核,从而被转录,之后得到的mRNA可以被翻译。在其它原因中,施用的DNA的表达水平将依赖于调节DNA转录的特定转录因子的存在。缺少此种因子的情况下,DNA转录将不产生令人满意量的RNA。从而,获得的翻译的肽或蛋白的水平有限。
通过使用RNA替代DNA用于基因治疗或基因接种疫苗,不希望的基因组整合和抗DNA抗体产生的风险被最小化或被避免。然而,RNA被认为是相当不稳定的分子种类,其可以容易地被遍在的RNA酶降解。
通常,RNA-降解促进调节RNA半衰期。该效果被认为和证明是精细调整真核基因表达的调节(Friedel等人,2009.Conserved principles of mammalian transcriptionalregulation revealed by RNA half-life,Nucleic Acid Research,37(17):1-12)。因此,每个天然存在的mRNA具有依赖于mRNA 源自的基因以及其在何种细胞类型中表达的其各自的半衰期。其促进调节该基因的表达水平。不稳定RNA对于及时在不同点实现瞬时基因表达是重要的。然而,耐久的RNA可能与不同蛋白的积累或基因的连续表达相关。在体内,mRNA的半衰期还可以依赖于环境因素,如激素处理,如例如对胰岛素样生长因子I,肌动蛋白,和白蛋白mRNA所显示的(Johnson 等人,Newly synthesized RNA:Simultaneous measurementin intact cells of transcription rates and RNA stability of insulin-likegrowth factor I,actin,and albumin in growth hormone-stimulated hepatocytes,Proc.Natl.Acad.Sci.,第 88卷,第5287-5291页,1991)。
对于基因治疗和基因接种疫苗,通常需要稳定的RNA。一方面,这是由于通常需要由RNA-序列编码的产物在体内积累的事实。另一方面,当在其储存过程中制备合适剂型时,和当施用时,RNA必须保持其结构和功能完整性。因此,对提供用于基因治疗或基因接种疫苗的稳定RNA分子进行尝试,以阻止它们经历早期降解或衰变。
据报道,核酸分子的G/C-含量可以影响其稳定性。因此,包含增加量的鸟嘌呤(G)和/或胞嘧啶(C)残基的核酸可以比含有大量腺嘌呤(A)和胸腺嘧啶(T)或尿嘧啶(U)核苷酸的核酸在功能上更稳定。在这方面, WO02/098443提供含有由编码区中的序列修饰稳定化的mRNA的药物组合物。此序列修饰利用遗传密码简并性。因此,含有不太有利的核苷酸组合(就RNA稳定性而言不太有利)的密码子可以在不改变编码的氨基酸序列的情况下被替代的密码子置换。该RNA稳定化方法受提供不允许留下所需氨基酸序列间隔的各个单个RNA分子的特定核苷酸序列限制。此外,该方法受限于RNA编码区。
作为mRNA稳定化的备选方案,已经发现天然存在的真核mRNA分子含有特征稳定化元件。例如,它们可以包含在其5'末端(5'-UTR)和/ 或在其3'末端(3'-UTR)的所谓非翻译区(UTR)以及其它结构特征,如5'帽结构或3'-聚腺苷酸尾。5'-UTR和3'-UTR二者都典型地从基因组DNA 转录并且因此是成熟前(premature)mRNA元件。在mRNA加工过程中,成熟mRNA的特有结构特征,如5'帽和3'-聚腺苷酸尾(也称为多聚腺苷酸尾或聚腺苷酸序列)通常被添加于转录的(成熟前)mRNA。
3'-聚腺苷酸尾典型地是添加在转录的mRNA的3'末端的一段单调腺苷核苷酸序列。其可以包含至多约400个腺苷核苷酸。发现此种3'-聚腺苷酸尾的长度对于个体mRNA的稳定性是可能的关键要素。
此外,已显示α-球蛋白mRNA的3'UTR可能是对于公知的α-球蛋白 mRNA稳定性的重要因素(Rodgers等人,Regulatedα-globin mRNA decay is a cytoplasmic eventproceeding through 3'-to-5'exosome-dependent decapping,RNA,8,第1526-1537页,2002)。α-球蛋白mRNA的3'UTR 明显参与特定核蛋白-复合物(α-复合物)的形成,其存在与mRNA体外稳定性相关(Wang等人,An mRNA stability complex functions with poly(A)-binding protein to stabilize mRNA in vitro,Molecular and Cellular biology,第19卷,第7期,1999年7月,第4552-4560页)。
对于核糖体蛋白mRNA中的UTR已经进一步表明有趣的调节功能:在核糖体蛋白mRNA的5’-UTR控制生长相关的mRNA翻译的同时,该调节的严格性由核糖体蛋白mRNA中的各个3’-UTR赋予(Ledda等人, Effect of the 3’-UTR length on the translationalregulation of 5’-terminal oligopyrimidine mRNAs,Gene,第344卷,2005,p.213-220)。该机制促进核糖体蛋白的特异表达,所述核糖体蛋白通常以恒定的方式转录从而一些核糖体蛋白mRNA如核糖体蛋白S9或核糖体蛋白L32称为看家基因 (Janovick-Guretzky等人,Housekeeping Gene Expression in Bovine Liver is Affected by PhysiologicalState,Feed Intake,and Dietary Treatment,J.Dairy Sci.,Vol.90,2007,p.2246-2252)。核糖体蛋白的生长相关的表达模式因此主要是由于对翻译水平的调节。
不考虑影响mRNA稳定性的因素,由靶细胞或组织有效翻译施用的核酸分子对于任何使用用于基因治疗或基因接种疫苗的核酸分子的方法都至关重要。从上文引用的实例可以看出,与调节稳定性一起,大多数 mRNA的翻译也由结构特征如UTR、5'帽和3'-聚腺苷酸尾调节。在此种情况下,据报道,聚腺苷酸尾的长度可以对于翻译效率也发挥重要作用。然而,稳定化3'-元件也可能对翻译具有减弱效果。
本发明的目的是提供可以适于应用于基因治疗和/或基因接种疫苗的核酸分子。尤其是,本发明的目的是提供mRNA种类,针对早期降解或降解得到稳定,但不显示翻译效率的显著功能损失。本发明的目的还是提供人工核酸分子,优选mRNA,其特征是由所述核酸分子编码的各个蛋白的表达增强。本发明的一个特别目的是提供mRNA,其中各个编码的蛋白翻译效率增强。本发明的另一个目的是提供编码此种优异mRNA种类的核酸分子,其可以适于在基因治疗和/或基因接种疫苗中使用。本发明进一步的目的是提供用于基因治疗和/或基因接种疫苗的药物组合物。归纳起来,本发明的目的是提供改进的核酸种类,其通过节省成本和直接的途径克服上文讨论的现有技术的缺陷。
通过要求保护的主题解决本发明的有关目的。
为了清楚和易读,提供以下定义。对于这些定义所提到的任何技术特征,可以基于每个本发明的实施方案读懂。可以在这些实施方案范围内具体提供其它定义和解释。
适应性免疫应答:适应性免疫应答典型地理解为免疫系统的抗原-特异应答。抗原特异性允许产生适应特异病原体或病原体感染的细胞的应答。发起这些适应的应答的能力通常由“记忆细胞”保持在体内。假如病原体不止一次感染身体,这些特异记忆细胞用于快速消除它。在此种情况下,适应性免疫应答的第一步是激活能够通过抗原呈递细胞诱导抗原特异免疫应答的幼稚抗原特异T细胞或不同免疫细胞。这在幼稚T细胞不断通过的淋巴组织和器官中发生。可以用作抗原呈递细胞的三种细胞类型是树突细胞、巨噬细胞和B细胞。这些细胞中的每个在引起免疫应答方面具有不同功能。树突细胞可以通过吞噬作用和大胞饮摄取抗原并且可以通过与例如外来抗原相接触而被刺激,从而迁移至局部淋巴组织,在那它们分化为成熟树突细胞。巨噬细胞摄取颗粒抗原如细菌并通过由传染剂或其它合适的刺激物诱导以表达MHC分子。B细胞通过其受体结合和内化可溶蛋白抗原的独特能力对于诱导T细胞也可以是重要的。MHC-分子典型地负责向T-细胞呈递抗原。其中,将抗原呈递到MHC分子上导致T 细胞的激活,其诱导其增殖和向武装的效应T细胞的分化。效应T细胞的最重要功能是通过CD8+细胞毒性T细胞杀灭感染的细胞和通过Th1 细胞激活巨噬细胞(二者一起构成细胞介导的免疫),和通过Th2和Th1细胞激活B细胞以产生不同种类的抗体,从而驱动体液免疫应答。T细胞通过其T细胞受体识别抗原,其不直接识别和结合抗原,而是识别短肽片段例如源自病原体的蛋白抗原的片段,例如所谓的表位,其结合其它细胞表面上的MHC分子。
适应性免疫系统:适应性免疫系统基本上致力于消除或阻止病原体生长。其典型地通过向脊椎动物免疫系统提供识别和记忆特定病原体(以产生免疫性),并在每次遭遇病原体时产生更强烈的攻击的能力调节适应性免疫应答。该系统是高度可适应的,这是因为体细胞超变(加速的体细胞突变过程),和V(D)J重组(抗原受体基因片段的不可逆遗传重组)。该机制允许小量基因产生大量不同抗原受体,其随后独特地表达在每个个体淋巴细胞上。因为基因重排导致各个细胞DNA的不可逆改变,所以之后此种细胞的所有子代(后代)将遗传编码相同受体特异性的基因,包括为持久的特异免疫性的关键的记忆B细胞和记忆T细胞。
辅剂/辅剂组分:辅剂或辅剂组分广义上典型地是可以改良(例如增强) 其它试剂(如药物或疫苗)的效果的药剂和/或免疫剂。将在广义上解释它并且指广谱的物质。典型地,这些物质能够增加抗原的免疫原性。例如,辅剂可以被先天免疫系统识别并且,例如可以引起先天免疫应答。“辅剂”典型地不引起适应性免疫应答。在这个程度,“辅剂”不算抗原。其作用模式不同于由导致适应性免疫应答的抗原引发的效果。
抗原:在本发明的背景下,“抗原”典型地指可以被免疫系统,优选被适应性免疫系统识别,并能够例如通过作为适应性免疫应答的一部分的抗体和/或抗原-特异T细胞的形成引发抗原-特异免疫应答的物质。典型地,抗原可以是或可以包含可以被MHC呈递到T-细胞的肽或蛋白。在本发明的意义中,抗原可以是提供的核酸分子,优选本文中限定的mRNA的翻译产物。在此情况下,肽和蛋白的包含至少一个表位的片段、变体和衍生物也理解为抗原。在本发明的情形中,本文中限定的肿瘤抗原和病原体抗原是特别优选的。
人工核酸分子:人工核酸分子可以典型地理解为天然不存在的核酸分子,例如DNA或RNA。换句话说,人工核酸分子可以理解为非天然核酸分子。此种核酸分子可以由于其个体序列(其天然不存在)和/或由于其它修饰,例如天然不存在的核苷酸的结构修饰而是非天然的。人工核酸分子可以是DNA分子,RNA分子或包含DNA和RNA部分的杂合分子。典型地,可以通过遗传工程方法设计和/或产生人工核酸分子以符合想要的人工核苷酸序列(异源序列)。在此种情况下,人工序列通常是可以天然不存在的序列,即其与野生型序列至少有一个核苷酸不同。术语“野生型”可以理解为天然存在的序列。进一步地,术语“人工核酸分子”不限于意为“一个单个分子”,而典型地理解为包含全体相同分子。因此,它可以涉及等分部分中含有的多个相同分子。
双顺反子RNA,多顺反子RNA:双顺反子或多顺反子RNA典型地是典型地可以具有两个(双顺反子)或更多个(多顺反子)可读框(ORF)的 RNA,优选mRNA。在此种情况下,可读框是可翻译为肽或蛋白的密码子序列。
载体/聚合载体:本发明范围内的载体典型地可以是促进另一个化合物(货物)的转运和/或复合的化合物。聚合载体典型地是由聚合物形成的载体。载体可以通过共价或非共价相互作用与货物关联。载体可以将核酸,例如RNA或DNA转运至靶细胞。对于一些实施方案,载体可以是阳离子组分。
阳离子组分:术语“阳离子组分”典型地指在pH值典型地为从1至9,优选为或低于9(例如从5至9),为或低于8(例如从5至8),为或低于7(例如从5至7)的pH值,最优选在生理pH,例如从7.3至7.4带正电荷(阳离子)的带电分子。因此,阳离子组分可以是任何带正电荷的化合物或聚合物,优选在生理条件下,尤其是在体内生理条件下带正电荷的阳离子肽或蛋白。“阳离子肽或蛋白”可以含有至少一个带正电荷的氨基酸,或多于一个带正电荷的氨基酸,例如选自Arg,His,Lys或Orn。因此,“聚阳离子”组分也在给定条件下呈现多于一个正电荷的范围内。
5'帽:5'帽是实体,典型地是修饰的核苷酸实体,其通常“加帽(cap)”成熟mRNA的5'末端。5'帽可以典型地由修饰的核苷酸,尤其是由鸟嘌呤核苷酸衍生物形成。优选地,5'帽通过5'-5'-三磷酸酯键与5'-末端连接。 5'帽可以是甲基化的,例如m7GpppN,其中N是携带5'帽的核酸的末端 5'核苷酸,典型地是RNA的5'末端。5'帽结构的进一步实例包括甘油基 (反转的脱氧脱碱基残基(部分))、4',5'亚甲基核苷酸,1-(β-D-赤呋喃糖基) 核苷酸,4'-硫代核苷酸,碳环核苷酸,1,5-失水己糖醇核苷酸,L-核苷酸,α-核苷酸,修饰碱基的核苷酸,苏式-戊呋喃糖核苷酸,无环3',4'-开环核苷酸,无环3,4-二羟基丁基核苷酸,无环3,5二羟基戊基核苷酸,3'-3'- 反向核苷酸部分,3'-3'-反向脱碱基部分,3'-2'-反向核苷酸部分,3'-2'-反向脱碱基部分,1,4-丁二醇磷酸酯,3'-氨基磷酸酯,己基磷酸酯,氨基己基磷酸酯,3'-磷酸酯,3'硫代磷酸,二硫代磷酸酯,或桥接或非桥接甲基磷酸酯部分。
细胞免疫性/细胞免疫应答:细胞免疫性典型地涉及巨噬细胞,天然杀伤细胞(NK),抗原特异性细胞毒性T-淋巴细胞的激活,和应答抗原时各种细胞因子的释放。更概括地,细胞免疫性不基于抗体,而基于免疫系统细胞的激活。典型地,细胞免疫应答可以例如特征在于激活能够在细胞(例如特定免疫细胞如树突细胞或其它细胞)中诱导凋亡的抗原特异性细胞毒性T-淋巴细胞,将外来抗原的表位展示在其表面。此种细胞可以是病毒感染的或细胞内细菌感染的,或展示肿瘤抗原的癌症细胞。进一步特性可以是巨噬细胞和天然杀伤细胞的激活,使它们能够破坏病原体并刺激细胞分泌多种影响参与适应性免疫应答和先天免疫应答的其它细胞的功能的细胞因子。
本说明书全文中使用的术语“源自”,在核酸的情况下,即对于“源自” (另一)核酸的核酸,意为源自(另一)核酸的核酸与其源自的核酸具有,至少50%,优选至少60%,优选至少70%,更优选至少75%,更优选至少 80%,更优选至少85%,甚至更优选至少90%,甚至更优选至少95%,并且特别优选至少98%的序列同一性。技术人员了解,通常对于相同类型的核酸,即对于DNA序列或RNA序列计算序列同一性。因此,要理解,如果DNA“源自”RNA或如果RNA“源自”DNA,在第一步骤,RNA序列转变为相应DNA序列(特别是通过在整个序列中用胸腺嘧啶(T)替代尿嘧啶 (U)或反之亦然,DNA序列转变为相应RNA序列(特别是通过在整个序列中用尿嘧啶(U)替代胸腺嘧啶(T))。之后,确定DNA序列的序列同一性或RNA序列的序列同一性。优选地,“源自”核酸的核酸还指例如为了增加RNA稳定性甚至进一步和/或延长和/或增加蛋白生产,与其源自的核酸相比修饰的核酸。这并不意味着所述修饰是优选的,例如与其源自的核酸相比,其不破坏RNA稳定性。
DNA:DNA是脱氧核糖核酸的常见缩写。其是核酸分子,即由核苷酸组成的聚合物。这些核苷酸通常是脱氧腺苷单磷酸酯,脱氧胸苷单磷酸酯,脱氧鸟苷单磷酸酯和脱氧胞苷单磷酸酯单体,其本身由糖部分(脱氧核糖),碱基部分和磷酸酯部分构成,并通过特征骨架结构聚合。所述骨架结构典型地通过第一个相邻单体的核苷酸的糖部分,即脱氧核糖和第二个相邻单体的磷酸酯部分之间的磷酸二酯键形成。单体的特定顺序,即与糖/磷酸酯 -骨架连接的碱基的顺序,被称为DNA序列。DNA可以是单链或双链的。在双链形式中,第一链的核苷酸典型地与第二链的核苷酸例如通过A/T- 碱基配对和G/C碱基配对杂交。
表位:表位(也称为“抗原决定簇”)可以在T细胞表位和B细胞表位相区别。本发明范围内的蛋白的T细胞表位或部分可以包含片段,所述片段优选具有约6至约20或甚至更多个氨基酸的长度,例如如由I类MHC 分子加工和呈递的片段,优选具有约8至约10个氨基酸,例如8,9,或 10个,(或甚至11,或12个氨基酸)的长度,或由II类MHC分子加工和呈递的片段,优选具有约13或更多个氨基酸,例如13,14,15,16,17, 18,19,20或甚至更多个氨基酸的长度,其中这些片段可以选自氨基酸序列的任何部分。这些片段典型地以由肽片段和MHC分子组成的复合物形式被T细胞识别,即所述片段典型地不以其天然形式被识别。B细胞表位典型地是位于如本文限定的(天然)蛋白或肽抗原的外表面的片段,优选具有5至15个氨基酸,更优选具有5至12个氨基酸,甚至更优选具有6 至9个氨基酸,其可以即以其天然形式被抗体识别。
此外蛋白或肽的此种表位可以选自任何本文提到的此种蛋白或肽的变体。在此种情况下抗原决定簇可以是由如本文限定的蛋白或肽氨基酸序列不连续的,但在三维结构中汇集在一起的蛋白或肽片段构成的构象或不连续表位或由单一多肽链构成的连续或线性表位。
序列片段:序列片段可以典型地是例如核酸分子或氨基酸序列的全长序列的较短部分。因此,典型地,片段由与全长序列内相应一段相同的序列组成。本发明范围内优选的序列片段,由与所述片段源自的分子中连续段实体对应的连续段的实体,如核苷酸或氨基酸组成,其代表所述片段源自的总(即全长)分子的至少5%,10%,20%,优选至少30%,更优选至少 40%,更优选至少50%,甚至更优选至少60%,甚至更优选至少70%,和最优选至少80%。
G/C修饰的:G/C-修饰的核酸可以典型地是核酸,优选如本文限定的人工核酸分子,其基于优选包含与野生型序列相比增加的鸟苷和/或胞嘧啶核苷酸数量的修饰的野生型序列。此种增加的数量可以通过用含有鸟苷或胞嘧啶核苷酸的密码子置换含有腺苷或胸苷核苷酸的密码子产生。如果富集的G/C含量发生在DNA或RNA的编码区,则其使用遗传密码的简并性。因此,所述密码子置换优选不改变编码的氨基酸残基,但仅增加核酸分子的G/C含量。
基因治疗:基因治疗可以典型地理解为通过编码肽或蛋白的核酸治疗患者的身体或患者身体的分离的组成部分,例如分离的组织/细胞。其典型地可以包括至少一个以下步骤:a)直接将核酸,优选如本文限定的人工核酸分子通过任何给药途径施用于患者或体外施用于患者的分离的细胞/组织,其导致体内/离体或体外转染患者的细胞;b)转录和/或翻译引入的核酸分子;和任选地c)如果核酸未直接施用于患者,则将分离、转染的细胞再施用于患者。
基因疫苗接种:基因疫苗接种可以典型地理解为通过施用编码抗原或免疫原或其片段的核酸分子疫苗接种。核酸分子可以施用于受试者的身体或施用于受试者的分离的细胞。当转染身体的某些细胞或当转染分离的细胞后,抗原或免疫原可以由那些细胞表达并随后呈递到免疫系统,引起适应性,即抗原特异性免疫应答。因此,基因疫苗接种典型地包含至少一个以下步骤:a)将核酸,优选如本文限定的人工核酸分子施用受试者,优选患者,或施用于受试者,优选患者的分离的细胞,其通常导致体内或体外转染受试者的细胞;b)转录和/或翻译引入的核酸分子;并且任选地c)如果核酸未直接施用于患者,则将分离、转染的细胞再施用于受试者,优选患者。
异源序列:如果它们不源于相同基因,则两条序列典型地被理解为‘异源的’。即,尽管异源序列可以源自相同生物体,但它们天然(在自然中)不存在于相同的核酸分子中,如不存在于相同的mRNA中。
体液免疫/体液免疫应答:体液免疫典型地指抗体产生和任选地指伴随抗体产生的附加过程。体液免疫应答可以典型地特征在于,例如Th2激活和细胞因子产生、生发中心形成和同种型转换、亲和力成熟和记忆细胞产生。体液免疫性典型地还可以指抗体的效应功能,其包括病原体和毒素中和、经典补体激活、和吞噬作用的调理素促进和病原体清除。
免疫原:在本发明范围内,免疫原可以典型地理解为能够刺激免疫应答的化合物。优选地,免疫原是肽、多肽、或蛋白。在特别优选的实施方案中,从本发明的意义上说,免疫原是提供的核酸分子,优选如本文限定的人工核酸分子的翻译产物。典型地,免疫原至少引起适应性免疫应答。
免疫刺激组合物:本发明范围内,免疫刺激组合物可以典型地理解为含有至少一个能够诱导免疫应答的组分或能够诱导免疫应答的组分源自的组分的组合物。此种免疫应答可以优选为先天免疫应答或适应性和先天免疫应答的组合。优选地,本发明范围内免疫刺激组合物含有至少一种人工核酸分子,更优选RNA,例如mRNA分子。免疫刺激组分,如mRNA可以与合适的载体复合。因此,所述免疫刺激组合物可以包含mRNA/载体-复合物。此外,所述免疫刺激组合物可以包含用于免疫刺激组分,如 mRNA的佐剂和/或合适的载体。
免疫应答:免疫应答可以典型地是针对特定抗原的适应性免疫系统的特异反应(所谓特异或适应性免疫应答)或先天免疫系统的非特异反应(所谓非特异或先天免疫应答),或其组合。
免疫系统:免疫系统可以保护生物体免受感染。如果病原体成功通过生物体的物理屏障并进入该生物体,则先天免疫系统提供立即、但非特异的应答。如果病原体避开了该先天应答,则脊椎动物拥有第二层保护,适应性免疫系统。这里,免疫系统在感染过程中适应其应答以改善其对病原体的识别。病原体被消除之后,此种改善的应答随后以免疫记忆的形式保留,并且允许适应性免疫系统每次遭遇该病原体时发起更快速和更强烈的攻击。据此,免疫系统包含先天和适应性免疫系统。这些两部分的每个典型地含有所谓体液和细胞组分。
免疫刺激RNA:本发明范围内,免疫刺激RNA(isRNA)可以典型地是能够诱导先天免疫应答的RNA。其通常不具有可读框并且因此不提供肽-抗原或免疫原,但例如通过结合特定类型的Toll样受体(TLR)或其它合适的受体引起免疫应答。然而,当然具有可读框并编码肽/蛋白的mRNA 也可以诱导先天免疫应答并且,因此可以是免疫刺激RNA。
先天免疫系统:先天免疫系统,也被称为非特异(non-specific)(或非特异(unspecific))免疫系统,典型地包含以非特异的方式保护宿主免受其它生物体感染的细胞和机制。这意味着先天系统的细胞可以以一般的方式识别和响应于病原体,但不像适应性免疫系统,它不赋予宿主持久或保护性免疫。先天免疫系统可以例如被以下激活:Toll样受体(TLR)的配体或其它辅助物质如脂多糖,TNF-α,CD40配体,或细胞因子,单核因子,淋巴因子,白细胞介素或趋化因子,IL-1,IL-2,IL-3,IL-4,IL-5,IL-6, IL-7,IL-8,IL-9,IL-10,IL-11,IL-12,IL-13,IL-14,IL-15,IL-16,IL-17, IL-18,IL-19,IL-20,IL-21,IL-22,IL-23,IL-24,IL-25,IL-26,IL-27, IL-28,IL-29,IL-30,IL-31,IL-32,IL-33,IFN-α,IFN-β,IFN-γ,GM-CSF, G-CSF,M-CSF,LT-β,TNF-α,生长因子,和hGH,人Toll样受体TLR1、TLR2、TLR3、TLR4、TLR5、TLR6、TLR7、TLR8、TLR9、TLR10的配体,鼠Toll样受体TLR1、TLR2、TLR3、TLR4、TLR5、TLR6、TLR7、 TLR8、TLR9、TLR10、TLR11、TLR12或TLR13的配体,NOD样受体的配体,RIG-I样受体的配体,免疫刺激核酸,免疫刺激RNA(isRNA),CpG-DNA,抗细菌剂,或抗病毒剂。根据本发明的药物组合物可以包含一种以上此种物质。典型地,先天免疫系统的应答包括:通过产生化学因子招募免疫细胞到感染位点,所述化学因子包括专用的化学介质,称为细胞因子;激活补体级联;通过专门的白细胞鉴别和去除器官、组织、血液和淋巴中的外来物质;激活适应性免疫系统;和/或用作针对传染剂的物理和化学屏障。
克隆位点:克隆位点典型地理解为适于插入核酸序列,例如包含可读框的核酸序列的核酸分子片段。插入可以通过任何本领域技术人员已知的分子生物学方法进行,例如通过限制酶切和连接。克隆位点典型地包含一个以上限制性酶识别位点(限制性位点)。这些一个以上限制性位点可以被在这些位点切割DNA的限制性酶识别。包含一个以上限制性位点的克隆位点也可以称为多克隆位点(MCS)或多聚接头。
核酸分子:核酸分子是包含核酸组分,优选由核酸组分组成的分子。术语核酸分子优选指DNA或RNA分子。其优选与术语“多核苷酸”同义使用。优选地,核酸分子是聚合物,包含通过糖/磷酸酯-骨架的磷酸二酯键彼此共价连接的核苷酸单体或由通过糖/磷酸酯-骨架的磷酸二酯键彼此共价连接的核苷酸单体组成。术语“核酸分子”还包括修饰的核酸分子,如碱基修饰的,糖修饰的或骨架修饰的等DNA或RNA分子。
可读框:本发明范围内可读框(ORF)可以典型地是一些核苷酸三联体的序列,其可以翻译为肽或蛋白。可读框优选在其5'末端含有起始密码子,即通常编码氨基酸甲硫氨酸的三个连续的核苷酸的组合(ATG),和通常呈现多个3核苷酸长度的紧接的区域。ORF优选由终止密码子(例如,TAA, TAG,TGA)终止。典型地,这是可读框仅有的终止密码子。因此,本发明范围内可读框优选为核苷酸序列,由可以被三整除的很多核苷酸组成,其以起始密码子(例如ATG)起始并且其优选以终止密码子(例如,TAA, TGA,或TAG)终止。可读框可以是分离的或其可以被整合入更长的核酸序列,例如载体或mRNA中。可读框还可以被称为“蛋白编码区”。
肽:肽或多肽典型地是通过肽键连接的氨基酸单体的聚合物。其典型地含有少于50个单体单元。尽管如此,术语肽不否认为具有多于50个单体单元的分子。长肽也称为多肽,典型地具有50到600个单体单元。
药学有效量:本发明范围内药学有效量典型地理解为例如在病理状况下足以诱导药学效应,如免疫应答、改变表达的肽或蛋白的病理水平、或替代缺少的基因产物的量。
蛋白:蛋白典型地包含一个以上肽或多肽。蛋白典型地折叠为3-维形式,其可以是蛋白发挥其生物学功能所需的。
聚腺苷酸序列:聚腺苷酸序列,也称为聚腺苷酸尾或3'-聚腺苷酸尾,典型地理解为例如多达约400个腺苷核苷酸,例如从约20至约400,优选从约50至约400,更优选从约50至约300,甚至更优选从约50至约250,最优选从约60至约250个腺苷核苷酸的腺苷核苷酸序列。聚腺苷酸序列典型地位于mRNA的3'末端。本发明范围内,聚腺苷酸序列可以例如通过载体的转录位于mRNA内或位于任何其它核酸分子,诸如例如,载体,例如用作产生RNA的模板的载体,优选mRNA中。
聚腺苷酸化:聚腺苷酸化典型地理解为向核酸分子,如RNA分子,例如成熟前mRNA添加聚腺苷酸序列。聚腺苷酸化可以由所谓聚腺苷酸化信号诱导。该信号优选位于要被聚腺苷酸化的核酸分子,如RNA分子的3'末端的一段核苷酸内。聚腺苷酸化信号典型地包含由腺嘌呤和尿嘧啶 /胸腺嘧啶核苷酸组成的六聚体,优选为六聚体序列AAUAAA。其它序列,优选六聚体序列,也是可能的。聚腺苷酸化典型地发生在前mRNA(也称为成熟前-mRNA)的加工过程中。典型地,RNA成熟(从前mRNA到成熟 mRNA)包含聚腺苷酸化的步骤。
限制性位点:限制性位点,也称为‘限制性酶识别位点’,为由限制性酶识别的核苷酸序列。限制性位点典型地是短的,优选回文核苷酸序列,例如包含4至8个核苷酸的序列。限制性位点优选由限制性酶特异识别。限制性酶典型地切割在此位点包含限制性位点的核苷酸序列。在双链核苷酸序列,如双链DNA序列中,限制性酶典型地切割核苷酸序列的两条链。
RNA,mRNA:RNA是核糖核酸的常见缩写。其是核酸分子,即由核苷酸组成聚合物。这些核苷酸通常是沿所谓骨架彼此连接的腺苷-单磷酸酯,尿苷-单磷酸酯,鸟苷-单磷酸酯和胞苷-单磷酸酯单体。所述骨架由第一相邻单体的糖,即核糖和第二相邻单体的磷酸酯部分之间的磷酸二酯键形成。单体的特定连续被称为RNA-序列。通常RNA是可以通过例如在细胞内 DNA-序列的转录可获得的。真核细胞中,转录典型地在细胞核或线粒体中进行。通常,DNA的转录通常产生所谓的成熟前RNA,其必须被加工为所谓的信使-RNA,通常简写为mRNA。例如在真核生物体中,成熟前RNA的加工包含多种不同转录后修饰如剪接、5′加帽、聚腺苷酸化、从细胞核或线粒体输出等。这些过程的总和也称为RNA的成熟。成熟信使RNA通常提供可以被翻译为特定肽或蛋白氨基酸序列的核苷酸序列。典型地,成熟mRNA包含5′帽、5′UTR、可读框、3′UTR和聚腺苷酸序列。除了信使RNA外,一些非编码RNA类型存在,其可以参与调节转录和/或翻译。
核酸分子序列:核酸分子序列典型地理解为特定和独特顺序,即其核苷酸的连续。蛋白或肽序列典型地理解为该顺序,即其氨基酸的连续。
序列同一性:如果它们呈现相同长度和顺序的核苷酸或氨基酸,则两条以上序列相同。同一性百分数典型地描述两条序列相同的程度,即其典型地描述与参照序列的相同核苷酸在其序列位置上对应的核苷酸的百分数。为了确定同一性程度,要比较的序列被认为是呈现相同长度,即要比较的序列的最长序列长度。这意为由8个核苷酸组成的第一序列与包含第一序列的由10个核苷酸组成的第二序列80%相同。换句话说,本发明范围内,序列同一性优选指具有相同长度的两条以上序列中具有相同位置的序列的核苷酸的百分数。通常将缺口认为是不相同的位置,而不考虑其在比对中的真正位置。
稳定的核酸分子:稳定的核酸分子是被修饰从而其对例如由环境因素或酶消化,如由核酸外切酶或核酸内切酶降解导致的分解或降解比无修饰的核酸分子更稳定的核酸分子,优选DNA或RNA分子。优选地,本发明范围内,稳定的核酸分子在细胞,如原核或真核细胞中,优选在哺乳动物细胞,如人细胞中稳定。稳定效应也可以在细胞外,例如在缓冲溶液等中,例如在包含所述稳定化的核酸分子的药物组合物的制造过程中发挥。
转染:术语“转染”指将核酸分子,如DNA或RNA(例如mRNA)分子引入细胞,优选引入真核细胞。在本发明范围内,术语“转染”包括本领域技术人员已知的用于将核酸分子引入细胞,优选引入真核细胞,如引入哺乳动物细胞的任何方法。此种方法包括例如,电穿孔、例如基于阳离子脂质和/或脂质体的脂转染、磷酸钙沉淀、基于纳米粒子的转染、基于病毒的转染、或基于阳离子聚合物(如DEAE-葡聚糖或聚乙烯亚胺)的转染等。优选地,所述引入是非病毒性的。
疫苗:疫苗典型地理解为提供至少一种抗原,优选免疫原的预防或治疗物质。所述抗原或免疫原可以源自任何适于疫苗接种的物质。例如,所述抗原或免疫原可以源自病原体,如源自细菌或病毒粒子等,或源自肿瘤或癌症组织。所述抗原或免疫原刺激身体的适应性免疫系统以提供适应性免疫应答。
载体:术语“载体”指核酸分子,优选指人工核酸分子。在本发明范围内,载体适于整合或包含所需核酸序列,如包含可读框的核酸序列。此种载体可以是储存载体、表达载体、克隆载体、转移载体等。储存载体是允许方便储存核酸分子(例如mRNA分子)的载体。因此,所述载体可以包含对应于例如所需mRNA序列或其部分的序列,如对应于mRNA的可读框和3′UTR和/或5′UTR的序列。表达载体可以用于生产表达产物诸如 RNA(例如mRNA)、或肽、多肽或蛋白。例如,表达载体可以包含载体的一段序列,如启动子序列(例如RNA聚合酶启动子序列)的转录所需的序列。克隆载体典型地是含有可以用于将核酸序列并入载体的克隆位点的载体。克隆载体可以是,例如质粒载体或噬菌体载体。转移载体可以是适于将核酸分子转移入细胞或生物体的载体,例如,病毒载体。在本发明范围内,载体可以是,例如RNA载体或DNA载体。优选地,载体是DNA分子。优选地,在本申请的意义中的载体包含克隆位点、选择标记(如抗生素抗性因子)、和适于载体扩增的序列,如复制起点。优选地,本申请范围内的载体是质粒载体。
媒介物(vehicle):媒介物典型地理解为适于储存、转运、和/或施用化合物,如药学活性化合物的材料。例如,其可以是生理学可接受的适于储存、转运、和/或施用药学活性化合物的液体。
3’-非翻译区(3’-UTR):通常,术语“3’-UTR”是指人工核酸分子的一部分,其位于可读框的3’(即“下游”),并且其不翻译为蛋白。通常,3’-UTR 是mRNA的蛋白编码区(可读框(ORF)或编码序列(CDS))和聚腺苷酸序列之间的mRNA的一部分。在本发明的情况中,术语3’-UTR还可以包含这样的元件,其不在模板中编码,RNA由其转录,但在成熟过程中在转录后添加,例如聚腺苷酸序列。mRNA的3’-UTR不翻译为氨基酸序列。 3′UTR序列通常由在基因表达过程中被转录为各自的mRNA的基因编码。基因组序列首先转录为包含任选内含子的成熟前mRNA。成熟前mRNA 随后在成熟过程中进一步被加工为成熟mRNA。该成熟过程包含以下步骤:5′加帽、剪接成熟前mRNA以切除任选内含子和3′末端修饰(如成熟前mRNA 3′末端的聚腺苷酸化和任选的核酸内切酶/或核酸外切酶切割等)。在本发明范围内,3′-UTR对应于位于蛋白编码区终止密码子,优选紧接蛋白编码区终止密码子的3′端和mRNA的聚腺苷酸序列之间。术语“对应于”意为3′-UTR序列可以是如用于限定3′-UTR序列的mRNA 序列中的RNA序列,或对应于此RNA序列的DNA序列中。在本发明范围内,术语“基因的3′-UTR”,为对应于源自该基因的成熟mRNA的 3′-UTR的序列,所述成熟mRNA即通过基因转录和成熟前mRNA的成熟获得的mRNA。术语“基因的3′-UTR”包括3′-UTR的DNA序列和 RNA序列(正义和反义链二者以及成熟和未成熟的二者)。优选3′UTR 具有多于20,30,40或50个核苷酸的长度。
5’-非翻译区(5’-UTR):通常,术语“5’-UTR”是指人工核酸分子的一部分,其位于可读框的5’(即“上游”),并且其不翻译为蛋白。5’-UTR通常理解为信使RNA(mRNA)的特定区段,所述信使RNA位于mRNA的可读框的5’。通常,5’-UTR在转录起始位点起始并且在可读框的起始密码子之前的一个核苷酸处终止。优选地,所述5’UTR具有多于20,30,40或 50个核苷酸的长度。5’-UTR可以包含用于控制基因表达的元件,也称为调控元件。所述调控元件可以是例如核糖体结合位点。5’-UTR可以被转录后修饰,例如通过加入5’-帽修饰。mRNA的5’-UTR不翻译为氨基酸序列。5’-UTR序列通常由基因表达过程中转录为各个mRNA的基因编码。基因组序列首先转录为成熟前mRNA,其包含任选的内含子。成熟前 mRNA然后在成熟过程中进一步加工为成熟mRNA。该成熟过程包括以下步骤:5′加帽、剪接成熟前mRNA以切除任选内含子和3′末端修饰(如成熟前mRNA 3′末端的聚腺苷酸化和任选的核酸内切酶/或核酸外切酶切割等)。在本发明范围内,5′-UTR对应于位于起始密码子和例如5’-帽之间的成熟mRNA序列。优选地,5′-UTR对应于从位于5′帽的3′侧的核苷酸,更优选从紧邻5′帽的3′侧核苷酸,向位于蛋白编码区起始密码子5′侧的核苷酸,优选向紧接蛋白编码区起始密码子5′侧的核苷酸延伸的序列。紧接成熟mRNA 5′帽的3′侧的核苷酸典型地对应于转录起始位点。术语“对应于”意为5′-UTR序列可以是如用于限定5′-UTR序列的mRNA序列中的RNA序列,或与此RNA序列对应的DNA序列。在本发明范围内,术语“基因的5′-UTR”,是对应于源自该基因的成熟mRNA的5′-UTR的序列,所述成熟mRNA即通过基因转录和成熟前mRNA的成熟获得的mRNA。术语“基因的5′-UTR”包括5′-UTR的DNA序列和RNA序列(正义和反义链以及成熟和未成熟的二者)。
5′末端寡嘧啶束(TOP):5′末端寡嘧啶束(TOP)典型地是位于核酸分子的5′末端区域,如某些mRNA分子的5′末端区域或功能实体的5′末端区域,例如某些基因的转录区的一段嘧啶核苷酸。该序列以通常对应于转录起始位点的胞苷起始,并且接着一段通常约3至30个嘧啶核苷酸。例如,TOP可以包含3,4,5,6,7,8,9,10,11,12,13,14,15, 16,17,18,19,20,21,22,23,24,25,26,27,28,29,30或甚至更多个核苷酸。所述一段嘧啶序列和由此的5′TOP终止于位于TOP下游的第一个嘌呤核苷酸的5′侧的一个核苷酸。含有5′末端寡嘧啶束的信使 RNA常被称为TOP mRNA。因此,提供此种信使RNA的基因被称为TOP 基因。例如,已经在编码肽延长因子和核糖体蛋白的基因和mRNA中发现了TOP序列。
TOP基序:在本发明范围内,TOP基序是对应于如上文限定的5′TOP 的核酸序列。因此,本发明范围内的TOP基序优选为具有3-30个核苷酸长度的一段嘧啶核苷酸。优选地,所述TOP基序由至少3个嘧啶核苷酸,优选至少4个嘧啶核苷酸,优选至少5嘧啶核苷酸,更优选至少6个核苷酸,更优选至少7个核苷酸,最优选至少8个嘧啶核苷酸组成,其中所述一段嘧啶核苷酸优选在其5′末端以胞嘧啶核苷酸起始。在TOP基因和TOP mRNA中,所述TOP-基序优选在其5′末端以转录起始位点起始并终止于所述基因或mRNA中的第一个嘌呤残基的5′侧一个核苷酸。本发明意义中的TOP基序优选位于表示5′-UTR的序列的5′末端或位于编码5′-UTR 的序列的5′末端。因此,优选地,从本发明的意义上说,如果该段序列位于各自序列(如人工核酸分子,人工核酸分子的5′-UTR元件,或源自如本文描述的TOP基因的5′-UTR的核酸序列)的5′末端,则一段3个以上嘧啶核苷酸的序列被称为“TOP基序”。换句话说,不位于5′-UTR或5′-UTR 元件的5′末端而是位于5′-UTR或5′-UTR元件内任何位置的一段3个以上嘧啶核苷酸优选不称为“TOP基序”。
TOP基因:TOP基因典型地以存在5′末端寡嘧啶束为特征。此外,大多数TOP基因以生长相关翻译调节为特征。然而,还已知TOP基因有组织特异翻译调节。如上文限定的,TOP 基因的5′UTR对应于源自TOP 基因的成熟mRNA的5′-UTR序列,其优选从位于5′帽的3′侧的核苷酸向位于起始密码子5′侧的核苷酸延伸。TOP基因的5′-UTR典型地不包含任何起始密码子,优选无上游AUG(uAUG)或上游可读框(uORF)。其中,上游AUG和上游可读框典型地理解为存在于应该被翻译的可读框的起始密码子(AUG)5′侧的AUG和可读框。TOP基因的5′-UTR通常相当短。 TOP基因的5′-UTR的长度可以在20个核苷酸到高达500个核苷酸之间变化,并且典型地少于约200个核苷酸,优选少于约150个核苷酸,更优选少于约100个核苷酸。本发明意义中典型的TOP基因的5′-UTR是在根据专利申请WO2013/143700的SEQ ID Nos.1-1363的序列中,从位置5 的核苷酸到紧接起始密码子(例如ATG)5′侧的核苷酸延伸的核酸序列,WO2013/143700的公开内容通过引用结合于本文。在该情况下,特别优选的TOP基因的5’-UTR的片段是缺少5’TOP基序的TOP基因的5’-UTR。术语“TOP基因的5’-UTR”或“5’-TOP UTR”优选指天然存在的TOP基因的5’-UTR。
在第一个方面,本发明涉及人工核酸分子,其包含
a.至少一个可读框(ORF);和
b.至少一个3’-非翻译区元件(3’-UTR元件)和/或至少一个5’-非翻译区元件(5’-UTR元件),其中所述至少一个3’-UTR元件和/或所述至少一个5’-UTR元件延长和/或增加从所述人工核酸分子的蛋白生产并且其中所述至少一个3’-UTR元件和/或所述至少一个5’-UTR元件源自稳定mRNA。
优选地,根据本发明的人工核酸分子不包含核糖体蛋白S6,RPL36AL, rps16或核糖体蛋白L9的3’-UTR(元件)和/或5’-UTR(元件)。更优选地,根据本发明的人工核酸分子不包含核糖体蛋白S6,RPL36AL,rps16或核糖体蛋白L9的3’-UTR(元件)和/或5’-UTR(元件),并且根据本发明的人工核酸分子的可读框不编码GFP蛋白。甚至更优选地,根据本发明的人工核酸分子不包含核糖体蛋白S6,RPL36AL,rps16或核糖体蛋白L9的 3’-UTR(元件)和/或5’-UTR(元件),并且根据本发明的人工核酸分子的可读框不编码例如选自由以下各项组成的组的报告蛋白:球蛋白(特别是β- 球蛋白),荧光素酶蛋白,GFP蛋白,glucurinodase蛋白(特别是β- glucurinodase)或其变体,例如,显示与球蛋白,荧光素酶蛋白,GFP蛋白,或glucurinodase蛋白至少70%序列同一性的变体。
术语“3’-UTR元件”是指包含源自3’-UTR或源自3’-UTR的变体或片段的核酸序列或由源自3’-UTR或源自3’-UTR的变体或片段的核酸序列组成的核酸序列。“3’-UTR元件”优选是指人工核酸序列,如人工mRNA的 3’-UTR包含的核酸序列。因此,在本发明的意义中,优选地,3’-UTR元件可以由mRNA,优选人工mRNA的3’-UTR包含,或3’-UTR元件可以由各自的转录模板的3’-UTR包含。优选地,3’-UTR元件是对应于mRNA 的3’-UTR,优选人工mRNA,如通过转录基因改造的载体构建体获得的 mRNA的3’-UTR的核酸序列。优选地,本发明的意义中的3’-UTR元件作为3’-UTR行使功能或编码执行3’-UTR的功能的核苷酸序列。
因此,术语“5’-UTR元件”是指包含源自5’-UTR或5’-UTR的变体或片段的核酸序列或由源自5’-UTR或5’-UTR的变体或片段的核酸序列组成的核酸序列。“5’-UTR元件”优选是指人工核酸序列,如人工mRNA的 5’-UTR包含的核酸序列。因此,在本发明的意义中,优选地,5’-UTR元件可以由mRNA,优选人工mRNA的5’-UTR包含,或5’-UTR元件可以由各自的转录模板的5’-UTR包含。优选地,5’-UTR元件是对应于mRNA 的5’-UTR,优选人工mRNA,如通过转录基因改造的载体构建体获得的 mRNA的5’-UTR的核酸序列。优选地,本发明的意义中的5’-UTR元件作为5’-UTR行使功能或编码执行5’-UTR的功能的核苷酸序列。
根据本发明的人工核酸分子中的3’-UTR元件和/或5’-UTR元件延长和/或增加从所述人工核酸分子的蛋白生产。因此,根据本发明的人工核酸分子可以尤其包含:
-增加从所述人工核酸分子的蛋白生产的3’-UTR元件,
-延长从所述人工核酸分子的蛋白生产的3’-UTR元件,
-增加和延长从所述人工核酸分子的蛋白生产的3’-UTR元件,
-增加从所述人工核酸分子的蛋白生产的5’-UTR元件,
-延长从所述人工核酸分子的蛋白生产的5’-UTR元件,
-增加和延长从所述人工核酸分子的蛋白生产的5’-UTR元件,
-增加从所述人工核酸分子的蛋白生产的3’-UTR元件和增加从所述人工核酸分子的蛋白生产的5’-UTR元件,
-增加从所述人工核酸分子的蛋白生产的3’-UTR元件和延长从所述人工核酸分子的蛋白生产的5’-UTR元件,
-增加从所述人工核酸分子的蛋白生产的3’-UTR元件和增加和延长从所述人工核酸分子的蛋白生产的5’-UTR元件,
-延长从所述人工核酸分子的蛋白生产的3’-UTR元件和增加从所述人工核酸分子的蛋白生产的5’-UTR元件,
-延长从所述人工核酸分子的蛋白生产的3’-UTR元件和延长从所述人工核酸分子的蛋白生产的5’-UTR元件,
-延长从所述人工核酸分子的蛋白生产的3’-UTR元件和增加和延长从所述人工核酸分子的蛋白生产的5’-UTR元件,
-增加和延长从所述人工核酸分子的蛋白生产的3’-UTR元件和增加从所述人工核酸分子的蛋白生产的5’-UTR元件,
-增加和延长从所述人工核酸分子的蛋白生产的3’-UTR元件和延长从所述人工核酸分子的蛋白生产的5’-UTR元件,或
-增加和延长从所述人工核酸分子的蛋白生产的3’-UTR元件和增加和延长从所述人工核酸分子的蛋白生产的5’-UTR元件。
优选地,根据本发明的人工核酸分子包含延长从所述人工核酸分子的蛋白生产的3’-UTR元件和/或增加从所述人工核酸分子的蛋白生产的 5’-UTR元件。
优选地,根据本发明的人工核酸分子包含至少一个3’-UTR元件和至少一个5’-UTR元件,即延长和/或增加从所述人工核酸分子的蛋白生产并且源自稳定mRNA的至少一个3’-UTR元件和延长和/或增加从所述人工核酸分子的蛋白生产并且源自稳定mRNA的至少一个5’-UTR元件。
“延长和/或增加从所述人工核酸分子的蛋白生产”通常是指与从缺少3’-UTR和/或5’-UTR或包含参比3’-UTR和/或参比5’-UTR(如天然与ORF 组合存在的3’-UTR和/或5’-UTR)的各个参比核酸产生的蛋白的量相比,从具有各个3’-UTR元件和/或5’-UTR元件的根据本发明的人工核酸分子产生的蛋白的量。
尤其是,与缺少3’-UTR和/或5’-UTR或包含参比3’-UTR和/或5’-UTR,如天然与ORF组合存在的3’-和/或5’-UTR的各个核酸相比,根据本发明的人工核酸分子的至少一个3’-UTR元件和/或5’-UTR元件延长从根据本发明的人工核酸分子,例如从根据本发明的mRNA的蛋白生产。
尤其是,与缺少3’-和/或5’-UTR或包含参比3’-和/或5’-UTR,如天然与ORF组合存在的3’-和/或5’-UTR的各个核酸相比,根据本发明的人工核酸分子的至少一个3’-UTR元件和/或5’-UTR元件增加从根据本发明的人工核酸分子,例如从根据本发明的mRNA的蛋白生产,尤其是蛋白表达和/或总蛋白生产。
优选地,与缺少3’-UTR和/或5’-UTR或包含参比3’-UTR和/或参比 5’-UTR,如天然与ORF组合存在的3’-UTR和/或5’-UTR的各个核酸的翻译效率相比,根据本发明的人工核酸分子的所述至少一个3’-UTR元件和/ 或所述至少一个5’-UTR元件不消极影响核酸的翻译效率。甚至更优选地,与其天然情况下各个ORF编码的蛋白的翻译效率相比,翻译效率由3’-UTR和/或5’-UTR增强。
本文中使用的术语“各个核酸分子”或“参比核酸分子”意为-除不同 3’-UTR和/或5’-UTR之外-参比核酸分子是与包含3’-UTR元件和/或 5’-UTR元件的本发明的人工核酸分子相当的,优选相同的。
为了评估本发明的人工核酸分子的本文定义的体内或体外的蛋白生产 (即体外涉及(“活体”)细胞和/或组织(包括活体受试者的组织);细胞尤其包括细胞系,原代细胞,组织或受试者中的细胞,优选为哺乳动物细胞,例如人细胞和小鼠细胞并且特别优选是人细胞系HeLa,和U-937以及小鼠细胞系NIH3T3,JAWSII和L929,此外原代细胞是特别优选的,在尤其优选的实施方案中,人皮肤成纤维细胞(HDF)),编码的蛋白的表达按照将本发明的人工核酸分子注射/转染入靶细胞/组织确定,并且与由参比核酸诱导的蛋白表达相比。用于确定蛋白表达的定量方法是本领域中已知的(例如蛋白质印迹,FACS,ELISA,质谱)。在该情况下特别有用的是确定报告蛋白如荧光素酶,绿色荧光蛋白(GFP),或分泌的碱性磷酸酶(SEAP) 的表达。因此,将根据本发明的人工核酸或参比核酸。例如通过转染或注射引入靶组织或细胞,优选在哺乳动物表达系统中,如在哺乳动物细胞中,例如HeLa或HDF细胞中。表达起始后或引入核酸分子后的数小时或数天(例如6,12,24,48或72小时),收集靶细胞样品并通过FACS测量和 /或裂解。之后,裂解产物可以用于使用多种方法,例如蛋白质印迹,FACS, ELISA,质谱或通过荧光或发光测量检测表达的蛋白(并且因此确定蛋白表达的效率)。
因此,如果将在特定时间点(例如表达起始后或引入核酸分子后6,12, 24,48或72小时)根据本发明的人工核酸分子的蛋白表达与从参比核酸分子的蛋白表达相比,两种核酸分子分开引入靶组织/细胞,在特定时间点后收集组织/细胞的样品,根据对特定检测方法(例如蛋白质印迹,ELISA,荧光或发光测量等,如本领域中已知的)调整的特定方案制备蛋白裂解产物,并且蛋白通过选择的检测方法检测。作为细胞裂解产物中表达的蛋白量的测量的备选方案-或,除了在裂解收集的细胞之前测量细胞裂解产物中的蛋白量或平行使用等分部分-蛋白量也可以通过使用FACS分析确定。
术语“延长”从人工核酸分子如人工mRNA的“蛋白生产”优选意为,优选在哺乳动物表达系统,如在HeLa或HDF细胞中,与从参比核酸分子如参比mRNA(例如包括参比3’-和/或5’-UTR或缺少3’-和/或5’-UTR) 的蛋白生产相比,从人工核酸分子如人工mRNA的蛋白生产延长。因此与对于从参比核酸分子产生的蛋白可以观察到的相比,从工核酸分子如人工mRNA产生的蛋白可更长期观察到。换句话说,在较晚的时间点,例如转染后48小时或72小时测量的从人工核酸分子如人工mRNA产生的蛋白量,比在相应较晚的时间点从参比核酸分子如参比mRNA产生的蛋白量大。所述“较晚时间点”可以是,例如,超过起始表达后,如转染核酸分子后24小时的任意时间,例如起始表达,即转染后36,48,60,72, 96小时。此外,对于相同核酸,可以将在较晚时间点产生的蛋白量标准化为在较早(参考)时间点产生的量,例如在较晚时间点的蛋白量可以表达为转染后24h的蛋白量的百分数。
优选地,该延长蛋白生产的效果通过以下步骤确定:(i)测量,例如优选在哺乳动物表达系统中如HeLa或HDF细胞中通过表达编码的报告蛋白如荧光素酶获得的随时间的蛋白量,(ii)确定在“参考”时间点t1,例如后t1=24h观察到的蛋白量,并且将该蛋白量设为100%,(iii)确定在一个或多个较晚时间点t2,t3,等,例如转染后t2=48h和t3=72h观察到的蛋白量,并且将在较晚时间点观察到的蛋白的相对量计算为在时间点t1的蛋白量的百分数。例如,在t1“80”的量表达,在t2以“20”的量表达,并且在 t3以“10”的量表达的蛋白,蛋白在t2的相对量将是25%,并且在t3的为12,5%。可以随后将在较晚时间点的这些相对量在步骤(iv)中与对于分别缺少3’-和 /或5’-UTR或分别包含参比3’-和/或5’-UTR的核酸分子在相应时间点的相对蛋白量相比。通过比较从根据本发明的人工核酸分子产生的相对蛋白量与从参比核酸分子(即分别缺少3’-和/或5’-UTR或分别包含参比3’-和/ 或5’-UTR的核酸分子)产生的相对蛋白量,可以确定造成与从参比核酸分子的蛋白生产相比,从根据本发明的人工核酸分子的蛋白生产延长的因素。
优选地,与从分别缺少3’-和/或5’-UTR或分别包含参比3’-和/或 5’-UTR的参比核酸分子的蛋白生产相比,根据本发明的人工核酸分子的至少一个3’-和/或5’-UTR元件延长从所述人工核酸分子的蛋白生产至少 1.2倍,优选至少1.5倍,更优选至少2倍,甚至更优选至少2.5倍。换句话说,对于相同的较晚时间点,与从参比核酸分子(其例如分别缺少3’-和/或5’-UTR或分别包含参比3’-和/或5’-UTR)产生的蛋白的(相对)量相比,在如上文所述的某较晚时间点从根据本发明的人工核酸分子产生的蛋白的(相对)量以至少1.2,优选至少1.5,更优选至少2,甚至更优选至少 2.5的因数增加。
备选地,延长蛋白生产的效应也可以通过以下步骤确定:(i)测量例如优选在哺乳动物表达系统如在HeLa或HDF细胞中通过表达编码的报告蛋白如荧光素酶获得的随时间的蛋白量,(ii)确定蛋白量低于例如,在起始表达后1,2,3,4,5,或6小时,例如转染人工核酸分子后1,2,3, 4,5,或6小时观察到的蛋白量的时间点,并且(iii)将蛋白量低于在起始表达后1,2,3,4,5,或6小时观察到的蛋白量的时间点与对于分别缺少3’-和/或5’-UTR或分别包含参比3’-和/或5’-UTR的核酸分子确定的所述时间点相比。
例如,与从参比核酸分子,如参比mRNA的蛋白生产相比,在哺乳动物表达系统中,如在哺乳动物细胞中,例如在HeLa或HDF细胞中,从人工核酸分子如人工mRNA的蛋白生产-以是至少在表达的起始阶段中,如起始表达后,如转染核酸分子后1,2,3,4,5,或6小时观察到的量的量-延长至少约5小时,优选至少约10小时,更优选至少约24小时。因此,与分别缺少3’-和/或5’-UTR或分别包含参比3’-和/或5’-UTR的参比核酸分子相比,根据本发明的人工核酸分子优选允许将以是至少在表达的起始阶段,如表达起始后,如转染后1,2,3,4,5,或6小时观察到的量的量的蛋白生产延长至少约5小时,优选至少约10小时,更优选至少约24小时。
在优选的实施方案中,与从分别缺少3’-和/或5’-UTR或分别包含参比 3’-和/或5’-UTR的参比核酸分子的蛋白生产相比,从根据本发明的人工核酸分子的蛋白生产期延伸至少1.2倍,优选至少1.5倍,更优选至少2倍,甚至更优选至少2.5倍。
优选地,实现蛋白生产的该延长效果,同时例如在48或72小时的时间间隔内从根据本发明的人工核酸分子产生的蛋白总量,至少对应于从分别缺少3’-和/或5’-UTR或分别包含参比3’-和/或5’-UTR(如天然与人工核酸分子的ORF存在的3’-UTR和/或5’-UTR)的参比核酸分子产生的蛋白量。由此,本发明提供允许如上文所述在哺乳动物表达系统中,如哺乳动物细胞中,例如在HeLa或HDF细胞中延长蛋白生产的人工核酸分子,其中从所述人工核酸分子(例如在48或72小时的时间间隔内)产生的蛋白总量,是至少例如在所述时间间隔内,从分别缺少3’-和/或5’-UTR或分别包含参比3’-和/或5’-UTR(如天然与人工核酸分子的ORF存在的3’- 和/或5’-UTR)的参比核酸分子产生的蛋白的总量。
此外,术语“延长的蛋白表达”还包括“稳定化的蛋白表达”,由此“稳定化的蛋白表达”优选意为,当与参比核酸分子(例如,分别包含参比3’- 和/或5’-UTR或分别缺少3’-和/或5’-UTR的mRNA)相比时,存在经预定的时期,如经24小时,更优选经48小时,甚至更优选经72小时更均匀的从根据本发明的人工核酸分子的蛋白生产。
因此,例如在哺乳动物系统中,从根据本发明的包含3’-和/或5’-UTR 元件的人工核酸分子,例如从根据本发明的mRNA的蛋白生产水平,优选不降低至对于参比核酸分子,如如上文所述的参比mRNA观察到的程度。为了评估从具体核酸分子的蛋白生产降低至的程度,例如,起始表达后24小时,例如将根据本发明的人工核酸分子转染入细胞,如哺乳动物细胞后24小时观察到的蛋白(由各个ORF编码)的量,可以与起始表达后 48小时,例如转染后48小时观察到的蛋白量相比。因此,在较晚时间点,例如,起始表达,例如转染后48小时观察到的根据本发明的人工核酸分子的ORF编码的蛋白量,如报告蛋白,例如,荧光素酶的量,与在较早时间点,例如,起始表达后,例如转染后24小时观察到的蛋白量的比率,优选高于对于分别包含参比3’-和/或5’-UTR或分别缺少3’-和/或5’-UTR 的参比核酸分子的相应比例(包括相同时间点)。
优选地,在较晚时间点,例如,起始表达后,例如转染后48小时观察到的根据本发明的人工核酸分子的ORF编码的蛋白量,如报告蛋白,例如,荧光素酶的量,与在较早时间点,例如,起始表达后,例如转染后24 小时观察到的蛋白量的比率,优选为至少0.2,更优选至少约0.3,甚至更优选至少约0.4,甚至更优选至少约0.5,并且特别是优选至少约0.7。对于各个参比核酸分子,例如分别包含参比3’-和/或5’-UTR或分别缺少3’- 和/或5’-UTR的mRNA,所述比例可以在,例如约0.05至约0.35之间。
由此,本发明提供人工核酸分子,其如上文所述的包含ORF和3’-和/ 或5’-UTR元件,其中优选在哺乳动物表达系统中,如在哺乳动物细胞中,例如在HDF细胞中或在HeLa细胞中,起始表达后48小时观察到的蛋白量,例如荧光素酶量与起始表达后24小时观察到的蛋白量的比率,优选至少0.2,更优选至少约0.3,更优选至少约0.4,甚至更优选至少约0.5,甚至更优选至少约0.6,并且特别是优选至少约0.7。由此,优选例如在48 小时的时间间隔内从所述人工核酸分子产生的蛋白总量,至少对应例如在所述时间间隔内,从分别缺少3’-和/或5’-UTR或分别包含参比3’-和/或 5’-UTR(如天然与人工核酸分子的ORF存在的3’-UTR和/或5’-UTR)的参比核酸分子产生的蛋白总量。
优选地,本发明提供如上文所述的包含ORF和3’-UTR元件和/或 5’-UTR元件的人工核酸分子,其中优选在哺乳动物表达系统中,如在哺乳动物细胞中,例如在HeLa细胞或HDF细胞中,起始表达后72小时观察到的蛋白量,例如荧光素酶量与起始表达后24小时观察到的蛋白量的比率优选高于约0.05,更优选高于约0.1,更优选高于约0.2,甚至更优选高于约0.3,其中优选例如在72小时的时间间隔内从所述人工核酸分子产生的蛋白的总量,至少是例如在所述时间间隔内,从分别缺少3’-和/或 5’-UTR或分别包含参比3’-和/或5’-UTR(如天然与人工核酸分子的ORF 存在的3’-和/或5’-UTR)的参比核酸分子产生的蛋白总量。
在本发明的情况下“增加的蛋白表达”或“增强的蛋白表达”优选意为与由参比核酸分子引起的表达相比,在起始表达后的一个时间点增加的/ 增强的蛋白表达或增加的/增强的表达的蛋白的总量。由此,在起始表达后,例如转染根据本发明的人工核酸分子后,例如转染根据本发明的mRNA 后某时间点,例如,转染后6,12,24,48或72小时观察到的蛋白水平,优选高于起始表达后,例如转染参比核酸分子,如分别包含参比3’-和/或 5’-UTR或分别缺少3’-和/或5’-UTR的参比mRNA后的相同时间点观察到的蛋白水平。在优选的实施方案中,就从分别包含参比3’-和/或5’-UTR 或分别缺少3’-和/或5’-UTR的参比核酸表达的蛋白量而言,从人工核酸分子表达的蛋白的最大量(如例如通过蛋白活性或质量确定的)增加。优选例如,转染后在48小时内,更优选24小时内和甚至更优选12小时内达到峰表达水平。
优选地,术语“增加的”根据本发明的人工核酸分子的“总蛋白生产”或“增强的”根据本发明的人工核酸分子的“总蛋白生产”是指优选在哺乳动物表达系统中,如在哺乳动物细胞中,例如在HeLa或HDF细胞中,与分别缺少3’-和/或5’-UTR或分别包含参比3’-和/或5’-UTR的参比核酸分子相比,经从人工核酸分子生产蛋白的时间间隔,例如48小时或72小时,增加的/增强的蛋白生产。根据优选的实施方案,当使用根据本发明的人工核酸分子时,表达的蛋白随时间的积累量增加。
对于特定时期的蛋白总量可以通过以下步骤确定:(i)在引入人工核酸分子后的多个时间点(例如起始表达后或引入核酸分子后6,12,24,48 和72小时)收集组织或细胞,并且每个时间点的蛋白量可以如上文所述确定。为了计算积累的蛋白量,可以使用确定蛋白的总量的数学方法,例如曲线下面积(AUC)可以根据下式确定:
为了计算蛋白总量的曲线下面积,从每个端点(a和b)计算表达曲线的等式的积分。
由此,“总蛋白生产”优选是指表示蛋白生产相对时间的曲线下面积 (AUC)。
优选地,与从分别缺少3’-和/或5’-UTR的参比核酸分子的蛋白生产相比,根据本发明的至少一个3’-或5’-UTR元件增加从所述人工核酸分子的蛋白生产至少1.5倍,优选至少2倍,更优选至少2.5倍。换句话说,与对于相应较晚时间点从参比核酸分子(其例如分别缺少3’-和/或5’-UTR 或分别包含参比3’-和/或5’-UTR)产生的蛋白的(相对)量相比,在某时间点,例如起始表达后,例如转染后48小时或72小时,从根据本发明的人工核酸分子产生的蛋白总量以至少1.5,优选至少2,更优选至少2.5的因素增加。
3’-UTR和/或5’-UTR的变体,片段和/或变体片段的mRNA和/或蛋白生产延长效果和效率和/或蛋白生产增加效果和效率以及mRNA和/或根据本发明的人工核酸分子的所述至少一个3’-UTR元件和/或所述至少一个 5’-UTR元件的蛋白生产延长效果和效率和/或蛋白生产增加效果和效率可以通过技术人员已知的适于此目的的任意方法确定。
例如,可以产生人工mRNA分子,其包含报告蛋白,如荧光素酶的编码序列/可读框(ORF),和根据本发明的3’-UTR元件,即其延长和/或增加从所述人工mRNA分子的蛋白生产。此外,这样的发明的mRNA分子还可以包含根据本发明的5’-UTR元件,即其延长和/或增加从所述人工 mRNA分子的蛋白生产,不包含5’-UTR元件或包含不是根据本发明的 5’-UTR元件,例如参比5’-UTR。因此,可以产生人工mRNA分子,其包含报告蛋白,如荧光素酶的编码序列/可读框(ORF),和根据本发明的 5’-UTR元件,即其延长和/或增加从所述人工mRNA分子的蛋白生产。此外,这样的发明的mRNA分子还可以包含根据本发明的3’-UTR元件,即其延长和/或增加从所述人工mRNA分子的蛋白生产,不包含3’-UTR元件或包含不是根据本发明的3’-UTR元件,例如参比3’-UTR。
根据本发明,可以例如,通过体外转录各个载体如质粒载体产生mRNA,所述载体例如包含T7启动子和编码各个mRNA序列的序列。产生的 mRNA分子可以通过适于转染mRNA的转染方法转染入细胞,例如它们可以脂转染入哺乳动物细胞,如HeLa细胞或HDF细胞,并且可以在转染后的某时间点,例如,转染后6小时,24小时,48小时,和72小时分析样品。可以通过技术人员公知的方法分析所述样品的mRNA量和/或蛋白量。例如,在样品时间点存在于细胞中的报告mRNA的量可以通过定量PCR方法的确定。由各个mRNA编码的报告蛋白的量可以例如,通过蛋白质印迹,ELISA测定,FACS分析或报告子测定如荧光素酶测定确定,这取决于使用的报告蛋白。稳定蛋白表达和/或延长蛋白表达的效果可以,例如,通过确定转染后48小时观察到的蛋白水平和转染后24小时观察到的蛋白水平的比例分析。所述值越接近1,在该时期内的蛋白表达越稳定。所述测量当然还可以在72以上小时进行,并且可以确定转染后72小时观察到的蛋白水平和转染后24小时观察到的蛋白水平的比例,从而确定蛋白表达的稳定性。
此外,根据本发明的人工核酸分子中所述至少一个3’-UTR元件和/或所述至少一个5’-UTR元件源自稳定mRNA。由此,“源”自稳定mRNA意为,所述至少一个3’-UTR元件和/或所述至少一个5’-UTR元件与稳定 mRNA的3’-UTR元件和/或5’-UTR元件具有至少50%,优选至少60%,优选至少70%,更优选至少75%,更优选至少80%,更优选至少85%,甚至更优选至少90%,甚至更优选至少95%,并且特别优选至少98%序列同一性。优选地,稳定mRNA是天然存在的mRNA,并且,由此,稳定mRNA 的3’-UTR元件和/或5’-UTR元件是指天然存在的mRNA的3’-UTR和/ 或5’-UTR,或其片段或变体。此外,源自稳定mRNA的3’-UTR元件和/ 或5’-UTR元件还优选指与天然存在的3’-UTR元件和/或5’-UTR元件相比是修饰的,例如以增加RNA稳定性,甚至进一步和/或延长和/或增加蛋白生产的3’-UTR元件和/或5’-UTR元件。其并不是说,所述修饰是优选的,例如与天然存在的(未修饰的)3’-UTR元件和/或5’-UTR元件相比,其不破坏RNA稳定性。尤其是,如本文中使用的术语mRNA是指mRNA 分子,然而,其还可以指如本文所定义的mRNA种类。
优选地,mRNA的稳定性,即mRNA降解和/或半衰期在标准条件下,例如用于使用的某细胞系的标准条件(标准培养基,孵育等)评估。
如本文中使用的术语“稳定mRNA”通常是指具有缓慢mRNA降解的 mRNA。由此,“稳定mRNA”通常具有长的半衰期。mRNA的半衰期是降解50%的体内或体外存在的mRNA分子所需的时间。因此,mRNA的稳定性通常在体内或体外评估。由此,体外尤其是指(“活”)细胞和/或组织,包括活受试者的组织。细胞尤其包括细胞系,原代细胞,组织或受试者中的细胞。在具体实施方案中,允许细胞培养的细胞类型可以适于本发明。特别优选的是哺乳动物细胞,例如人细胞和小鼠细胞。在特别优选的实施方案中,使用人细胞系HeLa,和U-937以及小鼠细胞系NIH3T3,JAWSII 和L929。此外,原代细胞是特别优选的,在特别优选的实施方案中,可以使用人皮肤成纤维细胞(HDF)。备选地,还可以使用受试者的组织。
优选地,“稳定mRNA”的半衰期是至少5h,至少6h,至少7h,至少 8h,至少9h,至少10h,至少11h,至少12h,至少13h,至少14h,和 /或至少15h。研究的mRNA的半衰期可以通过本领域技术人员已知的不同方法确定。通常,研究的mRNA的半衰期通过确定降解常数确定,由此推测通常理想的体内(或如上文定义体外)状态,其中研究的mRNA的转录可以完全“关闭”(或至少调至不可检测水平)。在该理想状态下,通常推测,mRNA降解按照一阶(first-order)动力学。因此,mRNA的降解通常可以通过以下等式描述:
A(t)=A0*e-λt
A0是研究的mRNA在时间0,即降解开始前的量(或浓度),A(t)是研究的mRNA在降解期间时间t的量(或浓度),并且λ是降解常数。由此,如果研究的mRNA在0的量(或浓度)(A0)和研究的mRNA在降解过程期间某时间t的量(或浓度)(A(t)和t)已知,可以计算降解常数λ。基于降解常数λ,可以通过以下等式计算半衰期t1/2
t1/2=ln2/λ.
因为按照定义在t1/2A(t)/A0=1/2。由此,为了评估研究的mRNA的半衰期,在体内(或如上文定义的体外)RNA降解过程中确定通常mRNA的量或浓度。
为了确定体内(或如上文所定义的体外)RNA降解过程中mRNA的量或浓度,可以使用各种方法,这是技术人员已知的。所述方法的非限制性实例包括例如利用转录抑制剂如放线菌素D一般性抑制转录,使用诱导形启动子特异启动瞬时转录,例如c-fos血清-诱导型启动子系统和Tet-off调节启动子系统,以及例如通过4-硫尿核苷(4sU),5-乙炔基尿苷(EU)或5’- 溴-尿苷(BrU)的动力学标记技术,例如脉冲标记。关于如何在RNA降解过程中确定mRNA的量或浓度的进一步详述和优选的实施方案在下文,在鉴别根据本发明的源自稳定mRNA的3’-UTR元件和/或至少一个5’-UTR 元件的方法的情况中概述。如何在RNA降解过程中确mRNA量或浓度的各个描述和优选的实施方案也应用于此。
优选地,与平均mRNA相比,在本发明的意义中的“稳定mRNA”’具有较慢的mRNA降解,优选在体内(或如上文所定义的体外)评估。例如,“平均mRNA降解”可以通过研究多种mRNA种类,优选100,至少300,至少500,至少1000,至少2000,至少3000,至少4000,至少5000,至少6000,至少7000,至少8000,至少9000,至少10000,至少11000,至少12000,至少13000,至少14000,至少15000,至少16000,至少17000,至少18000,至少19000,至少20000,至少21000,至少22000,至少23000,至少24000,至少25000,至少26000,至少27000,至少28000,至少29000,至少30000种mRNA种类的mRNA降解来评估。特别优选的是,评估整个转录组,或转录组的尽可能多的mRNA种类。这可以,例如,通过使用提供整个转录本覆盖的微阵列实现。
如本文中使用的“mRNA种类”对应于基因组转录单元,即通常对应于基因。由此,例如,由于mRNA加工,在一个“mRNA种类”中可以存在不同转录本。例如,mRNA种类可以由微阵列上的点表示。因此,微阵列提供有利的工具以确定例如在mRNA降解期间某时间点的多种mRNA种类的量。然而,还可以使用技术人员已知的其他技术,例如RNA-seq,定量PCR等。
在本发明中,特别优选的是,稳定mRNA特征为其中所述mRNA在第二时间点的量与所述mRNA在第一时间点的量的比是至少0.5(50%),至少0.6(60%),至少0.7(70%),至少0.75(75%),至少0.8(80%),至少 0.85(85%),至少0.9(90%),或至少0.95(95%)的mRNA降解。由此,在降解过程中所述第二时间点晚于所述第一时间点。
优选地,选择这样的第一时间点,从而仅考虑经历降解过程的mRNA,即避开出现的mRNA-例如在进行的转录中。例如,如果使用动力学标记技术,例如脉冲标记,优选选择这样的第一时间点,从而完成将标记引入 mRNA,即不发生持续地将标记引入mRNA。由此,如果使用动力学标记,所述第一时间点可以是实验标记过程结束之后,例如将细胞与标记孵育结束后至少10min,至少20min,至少30min,至少40min,至少50min,至少60min,至少70min,至少80min,或至少90min。
例如,所述第一时间点可以优选是在诱导型启动子的情况下终止转录 (例如通过转录抑制剂),终止启动子诱导后或在终止脉冲或标记供应后,例如标记结束后0至6h。更优选地,所述第一时间点可以是在诱导型启动子的情况下终止转录(例如通过转录抑制剂),终止启动子诱导后或在终止脉冲或标记供应后,例如标记结束后30min至5h,甚至更优选1h至 4h并且特别优选约3h。
优选地,在mRNA降解过程中尽可能晚地选择第二时间点。然而,如果考虑多种mRNA种类,优选选择这样的第二时间点,从而相当多的量的多种mRNA种类,优选至少10%的mRNA种类,仍然以可检测的量,即以高于0的量存在。优选地,所述第二时间点是转录结束或实验标记过程结束后至少5h,至少6h,至少7h,至少8h,至少9h,至少10h,至少11h,至少12h,至少13h,至少14h,或至少15h。
由此,所述第一时间点和所述第二时间点之间的时间间隔优选在上述极限内尽可能大。因此,所述第一时间点和所述第二时间点之间的时间间隔优选是至少4h,至少5h,至少6h,至少7h,至少8h,至少9h,至少10h,至少11h,或至少12h。
此外,优选的是,源自稳定mRNA的根据本发明的人工核酸分子的所述至少一个3’-UTR元件和/或所述至少一个5’-UTR元件,通过如本文中所述的用于鉴别根据本发明的源自稳定mRNA的3’-UTR元件和/或 5’-UTR元件的方法鉴别。特别优选的是,根据本发明的人工核酸分子中的所述至少一个3’-UTR元件和/或所述至少一个5’-UTR元件,通过如本文中所述的用于鉴别根据本发明的延长和/或增加从人工核酸分子的蛋白生产并且源自稳定mRNA的3’-UTR元件和/或5’-UTR元件的方法鉴别。
优选地,根据本发明的人工核酸分子中的所述至少一个3’-UTR元件和/或所述至少一个5’-UTR元件包含以下各项或由以下各项组成:源自真核蛋白编码基因的3’-UTR和/或5’-UTR,优选源自脊椎动物蛋白编码基因的3’-UTR和/或5’-UTR,更优选源自哺乳动物蛋白编码基因,例如源自小鼠和人蛋白编码基因的3’-UTR和/或5’-UTR,甚至更优选源自灵长类或啮齿类蛋白编码基因的3’-UTR和/或5’-UTR,尤其是人或鼠蛋白编码基因的3’-UTR和/或5’-UTR的核酸序列。
通常,要理解的是,根据本发明的人工核酸分子中的至少一个3’-UTR 元件包含优选源自天然(天然状态)存在的3’-UTR的核酸序列或由优选源自天然(天然状态)存在的3’-UTR的核酸序列组成,而根据本发明的人工核酸分子中的至少一个5’-UTR元件包含优选源自天然(天然状态)存在的 5’-UTR的核酸序列或由优选源自天然(天然状态)存在的5’-UTR的核酸序列组成。
优选地,所述至少一个可读框与至少一个3’-UTR元件和/或与至少一个5’-UTR元件异源。在该情况下,术语“异源的”是指,人工核酸分子包含的两个序列元件,如可读框和3’-UTR元件和/或可读框和5’-UTR元件不天然地(天然状态)以此组合存在。它们通常是重组的。优选地,3’-UTR 元件和/或5’-UTR元件源自与可读框不同的基因。例如,ORF可以源自与3’-UTR元件和/或与至少一个5’-UTR元件不同的基因,例如编码不同的蛋白或相同但属于不同种类的蛋白等。即可读框源自与3’-UTR元件源自的和/或至少一个5’-UTR元件源自的基因不同的基因。在优选的实施方案中,ORF不编码人或植物(例如,拟南芥)核糖体蛋白,优选不编码人核糖体蛋白S6(RPS6),人核糖体蛋白L36a-样(RPL36AL)或拟南芥核糖体蛋白S16(RPS16)。在进一步优选的实施方案中,可读框(ORF)不编码核糖体蛋白S6(RPS6),核糖体蛋白L36a-样(RPL36AL)或核糖体蛋白 S16(RPS16)。
在具体实施方案中,优选的是,可读框不编码,例如,选自由以下各项组成的组的报告蛋白:球蛋白(特别是β-球蛋白),荧光素酶蛋白,GFP蛋白或其变体,例如,呈现与球蛋白,荧光素酶蛋白,或GFP蛋白至少70%序列同一性的变体。由此,特别优选的是,可读框不编码GFP蛋白。还特别优选的是,可读框(ORF)不编码报告基因或不源自报告基因,其中报告基因优选不选自由以下各项组成的组:球蛋白(特别是β-球蛋白),荧光素酶蛋白,β-葡糖苷酸酶(GUS)和GFP蛋白或其变体,优选不选自EGFP,或上述基因的任一种的变体,所述变体通常呈现与这些报告基因中的任一种,优选球蛋白,荧光素酶蛋白,或GFP蛋白的至少70%序列同一性。
甚至更优选地,3’-UTR元件和/或5’-UTR元件与包含在本文中定义的人工核酸中的任意其他元件异源。例如,如果根据本发明的人工核酸包含来自给定基因的3’-UTR元件,其优选不包含任意其他核酸序列,尤其是来自相同基因的非功能性核酸序列(例如编码或调节序列元件),包括其在所述基因的ORF的5’和3’末端的调节序列。因此,例如,如果根据本发明的人工核酸包含来自给定基因的5’-UTR元件,其优选不包含任意其他核酸序列,尤其是来自相同基因的非功能核酸序列(例如编码或调节序列元件),包括其在所述基因的ORF的5’和3’末端的调节序列。
此外,优选的是,根据本发明的人工核酸包含至少一个可读框,至少一个3’-UTR(元件)和至少一个5’-UTR(元件),其中至少一个3’-UTR(元件)是根据本发明的3’-UTR元件和/或至少一个5’-UTR(元件)是根据本发明的5’-UTR元件。在所述优选的根据本发明的包含至少一个可读框,至少一个3’-UTR(元件)和至少一个5’-UTR(元件)的人工核酸中,特别优选的是,至少一个可读框,至少一个3’-UTR(元件)和至少一个5’-UTR(元件) 中的每个是异源的,即至少一个3’-UTR(元件)和至少一个5’-UTR(元件) 以及可读框和3’-UTR(元件)或5’-UTR(元件)分别都不天然(天然状态)以此组合存在。这意为,人工核酸分子包含ORF,3’-UTR(元件)和5’-UTR(元件),它们彼此都是异源的,例如由于它们每个都源自不同基因(以及它们的5’和3’UTR’s),它们是重组的。在另一优选的实施方案中,3’-UTR(元件)不源自病毒基因的3’-UTR(元件)或不是病毒来源的。
优选地,根据本发明的人工核酸分子:
(i)包含至少一个3’-UTR元件和至少一个5’-UTR元件,其中优选至少一个3’-UTR元件和至少一个5’-UTR元件(中的每个)包含分别源自人或鼠蛋白编码基因的3’-UTR或5’-UTR的核酸序列或由分别源自人或鼠蛋白编码基因的3’-UTR或5’-UTR的核酸序列组成;
(ii)根据本发明的人工核酸分子的至少一个3’-UTR元件,至少一个 5’-UTR元件和至少一个可读框彼此全部是异源的;
(iii)至少一个3’UTR元件源自选自由以下各项组成的组的基因:看家基因,编码膜蛋白的基因,参与细胞代谢的基因,参与转录、翻译和复制过程的基因,参与蛋白修饰的基因和参与细胞分裂的基因;并且
(iv)3’UTR不源自编码核糖体蛋白的基因或Fig4基因。
看家基因通常是用于维持基本的细胞功能所需的并且在正常和病理生理学状况下通常在生物的所有细胞中表达的组成型基因。尽管一些看家基因在大多数非病理状况下以相对恒定水平表达,但其他看家基因可以根据实验条件改变。通常,看家基因以至少25个拷贝/细胞表达并且有时数量上千。在本发明的情况下看家基因的优选实例在下表10中显示。
表10.多种看家基因的列表(参考WO 2007/068265 A1,表1)。
上表获自WO 2007/068265 A1,表1并且基于Eisenberg,E.和E.Y. Levanon(2003):Human housekeeping genes are compact;Trends Genet.19(7): 362-365提供的登录号的列表。登录号用作用于PERL(Programmed Extraction Report Language)计算机程序的输入,所述计算机程序从Unigene 数据库提取EST数据。Unigene数据库从NCBI网站作为文本文件下载。 3′UTR的长度通过提取3′UTR以计算机方式衍生(Bakheet,T.,Frevel,M.,Williams,BR,和K.S.Khabar,2001.ARED:Human AU-rich element-containing mRNAdatabase reveals unexpectedly diverse functional repertoire of encodedproteins.Nucleic Acids Research.29:246-254)。<a>是通常使用的基因产物的缩写;<b>是3′UTR的长度;<c>是EST的数量。
优选的看家基因包括LDHA,NONO,PGK1和PPIH。
编码膜蛋白的基因通常是指这样的基因,其编码与生物膜相互作用的蛋白。在大多数基因组中,所有基因的约20-30%编码膜蛋白。常见类型的蛋白包括-除了膜蛋白外-可溶球状蛋白,纤维状蛋白和无序蛋白。由此,编码膜蛋白的基因通常编码可溶球状蛋白,纤维状蛋白或无序蛋白的基因。膜蛋白包括膜受体,转运蛋白,膜酶和细胞粘附分子。
参与细胞代谢的基因通常是指这样的基因,其编码参与细胞代谢的蛋白,即参与活生物体的细胞内维持生命的化学转化的组。这些通常是酶催化的反应,其允许生物生长和复制,维持其结构,并且响应其环境。因此,优选的参与细胞代谢的基因是这样的基因,其编码催化允许生物生长和复制、维持其结果和响应于其环境的反应的酶。参与细胞代谢的基因的其他实例包括编码具有结构或机械功能的蛋白的基因,如形成细胞骨架的那些。参与细胞代谢的其他蛋白包括参与细胞信号转导,免疫应答,细胞粘附,跨膜主动转运和细胞周期的蛋白。代谢通常分为两类:异化,通过细胞呼吸的方式降解有机物质,和同化,建立细胞成分如蛋白和核酸。
参与转录,翻译和复制过程的基因通常是指这样的基因,其编码参与转录,翻译和复制过程的蛋白。尤其是,术语“复制”,如该情况下使用的,优选指核酸的复制,例如DNA复制。优选的参与转录、翻译和复制过程的基因是编码参与转录,翻译和/或(DNA)复制过程的酶的基因。其他优选的实例包括编码转录因子或翻译因子的基因。核糖体基因是参与转录、翻译和复制过程的基因的优选的其他实例。
参与蛋白修饰的基因通常是指这样的基因,其编码参与蛋白修饰的蛋白。所述基因的优选的实例编码参与蛋白修饰,尤其是参与翻译后修饰过程的酶。参与翻译后修饰的酶的优选的实例包括(i)参与疏水基团的添加的酶,尤其是用于膜定位,例如参与豆蔻酰化,棕榈酰化,异戊二烯化或异戊烯化,法尼基化,牻牛儿基化或糖基磷脂酰肌醇化的酶;(ii)参与用于增强的酶活性的辅因子的添加的酶,例如参与脂化,参与黄素结构部分的连接,参与血红素C的连接,参与磷酸泛酰巯基乙胺化 (phosphopantetheinylation)或视黄基亚基西夫碱形成的酶;(iii)参与翻译因子的修饰,例如参与白喉酰胺形成,参与乙醇胺磷酸甘油连接或参与尾下素形成的酶;和(vi)参与较小化学基团的添加,例如酰化,如乙酰化和甲酰化,烷基化如甲基化,酰胺键形成,如在C-末端的氨基化和氨基酸形成 (例如精氨酰化(arginylation),多谷氨酰化(polyglutamylation)和多甘氨酰化(polyglycylation)),丁酰化,γ-羧基化,糖基化,丙二酸化,羟基化,碘化,核苷酸添加,氧化,磷酸酯或氨基磷酸酯形成如磷酸化和腺苷酰化,丙酸化,焦谷氨酸盐形成,S-谷胱甘肽化,S-亚硝基化,琥珀酰化和硫酸化的酶。
参与细胞分裂过程的基因通常是指这样的基因,其编码参与细胞分裂的蛋白。细胞分裂是亲本细胞分为两个或多个子细胞的过程。细胞分裂通常作为更大细胞周期的部分发生。在真核细胞中,存在两个不同类型的细胞分裂:植物性分裂,由此每个子细胞遗传上与亲本细胞相同(有丝分裂),和减少性细胞分裂,由此子细胞中的染色体数量减半,产生单倍体配子(减数分裂)。因此,参与细胞分裂过程的优选的基因编码参与有丝分裂和/或减数分裂的蛋白。
Fig4是因子诱导的基因缩写。Fig4基因编码聚磷酸肌醇磷酸酶,也称为磷脂酰肌醇3,5-二磷酸5-磷酸酶或含SAC结构域的蛋白3(Sac3)。
优选地,根据本发明的人工核酸分子:
(i)包含至少一个3’-UTR元件和至少一个5’-UTR元件,其中优选所述至少一个3’-UTR元件和至少一个5’-UTR元件(中的每个)包含分别源自人或鼠蛋白编码基因的3’-UTR或5’-UTR的核酸序列或由分别源自人或鼠蛋白编码基因的3’-UTR或5’-UTR的核酸序列组成;
(ii)至少一个3’-UTR元件,至少一个5’-UTR元件和至少一个可读框彼此全部是异源的;
(iii)至少一个5’-UTR元件源自选自由以下各项组成的组的基因:看家基因,编码膜蛋白的基因,参与细胞代谢的基因,参与转录、翻译和复制过程的基因,参与蛋白修饰的基因和参与细胞分裂的基因;
(iv)5’-UTR优选不是5’TOP UTR;并且
(v)3’-UTR优选不源自编码核糖体蛋白或白蛋白的基因或Fig4基因。
更优选地,所述根据本发明的人工核酸分子:
(i)包含至少一个3’-UTR元件和至少一个5’-UTR元件,其中优选所述至少一个3’-UTR元件和至少一个5’-UTR元件(中的每个)包含分别源自人或鼠蛋白编码基因的3’-UTR或5’-UTR的核酸序列或由分别源自人或鼠蛋白编码基因的3’-UTR或5’-UTR的核酸序列组成;
(ii)至少一个3’-UTR元件,至少一个5’-UTR元件和至少一个可读框彼此全部是异源的;
(iii)至少一个3’UTR元件源自选自由以下各项组成的组的人或鼠基因:看家基因,编码膜蛋白的基因,参与细胞代谢的基因,参与转录、翻译和复制过程的基因,参与蛋白修饰的基因和参与细胞分裂的基因;
(iv)3’UTR不源自编码核糖体蛋白或白蛋白的基因或Fig4基因;
(v)至少一个5’-UTR元件源自选自由以下各项组成的组的人或鼠基因:看家基因,编码膜蛋白的基因,参与细胞代谢的基因,参与转录、翻译和复制过程的基因,参与蛋白修饰的基因和参与细胞分裂的基因;和
(vi)5’-UTR不是5’TOP UTR。
由此,在根据本发明的人工核酸分子中优选的是,所述3’-UTR和所述5’-UTR源自人或鼠看家基因。还优选的是,所述3’-UTR和所述5’-UTR 源自编码膜蛋白的人或鼠基因。还优选的是,所述3’-UTR和所述5’-UTR 源自参与细胞代谢的人或鼠基因。还优选的是,所述3’-UTR和所述5’-UTR 源自参与转录,翻译和复制过程的人或鼠基因。还优选的是,所述3’-UTR 和所述5’-UTR源自参与蛋白修饰的人或鼠基因。还优选的是,所述3’-UTR 和所述5’-UTR源自参与细胞分裂的人或鼠基因。在此情况下,如果(i)所述3’-UTR和所述5’-UTR源自属于相同基因类型的基因和(ii)至少一个 3’-UTR和至少一个5’-UTR彼此异源,技术人员知晓所述3’-UTR和所述 5’-UTR不源自相同基因,而源自属于相同基因类型的不同基因。因此,优选的是至少一个3’-UTR和至少一个5’-UTR源自属于相同基因类型的不同基因。
如本文中使用的术语“基因类型”是指基因的分类。基因类型的实例包括(i)看家基因,(ii)编码膜蛋白的基因,(iii)参与细胞代谢的基因,(iv) 参与转录、翻译和复制过程的基因,(v)参与蛋白修饰的基因和(vi)参与细胞分裂的基因。换句话说,“看家基因”是一种基因类型,而“参与转录的基因”是另一基因类型,“参与细胞代谢的基因”是其他基因类型等。
在本文所述的根据本发明的人工核酸分子中还优选的是,所述3’-UTR 和所述5’-UTR源自选自由以下各项组成的组的人或鼠基因:编码膜蛋白的基因,参与细胞代谢的基因,参与转录、翻译和复制过程的基因,参与蛋白修饰的基因和参与细胞分裂的基因,其中所述3’-UTR和所述5’-UTR 选自不同的基因类型。
优选地,至少一个3’-UTR元件和/或至少一个5’-UTR元件与ORF功能性连接。这优选意为,3’-UTR元件和/或至少一个5’-UTR元件与ORF 相关,从而其可以发挥功能,如对于编码的肽或蛋白的表达的增强或稳定功能或对于人工核酸分子的稳定功能。优选地,ORF和3’-UTR元件以 5’→3’方向关联和/或5’-UTR元件和ORF以5’→3’方向关联。由此,优选地,人工核酸分子通常包含结构5’-[5’-UTR元件]-(任选的)-接头-ORF-(任选的)-接头-[3’-UTR元件]-3’,其中所述人工核酸分子可以仅包含5’-UTR 元件而没有3’-UTR元件,仅3’-UTR元件而没有5’-UTR元件,或包含 3’-UTR元件和5’-UTR元件二者。此外,接头可以存在或不存在。例如,接头可以是一个或多个核苷酸,如1-50或1-20个核苷酸的链,例如,包含一个或多个限制性酶识别位点(限制性位点)或由一个或多个限制性酶识别位点(限制性位点)组成。
优选地,所述至少一个3’-UTR元件和/或所述至少一个5’-UTR元件包含源自选自由以下各项组成的组的基因的转录本的3’-UTR和/或 5’-UTR的核酸序列或由源自选自由以下各项组成的组的基因的转录本的 3’-UTR和/或5’-UTR的核酸序列组成:GNAS(鸟嘌呤核苷酸结合蛋白,α刺激复合基因座),MORN2(含有MORN重复2),GSTM1(谷胱甘肽S- 转移酶,μl),NDUFA1(NADH脱氢酶(泛醌)1α亚复合体),CBR2(羰基还原酶2),MP68(RIKEN cDNA2010107E04基因),NDUFA4(NADH 脱氢酶(泛醌)1α亚复合体4),Ybx1(Y-Box结合蛋白1),Ndufb8(NADH 脱氢酶(泛醌)1β亚复合体8),CNTN1(接触蛋白1),LTA4H,SLC38A6, DECR1,PIGK,FAM175A,PHYH,TBC1D19,PIGB,ALG6,CRYZ, BRP44L,ACADSB,SUPT3H,TMEM14A,GRAMD1C,C11orf80,C9orf46, ANXA4,TBCK,IFI6,C2orf34,ALDH6A1,AGTPBP1,CCDC53,LRRC28, CCDC109B,PUS10,CCDC104,CASP1,SNX14,SKAP2,NDUFB6, EFHA1,BCKDHB,BBS2,LMBRD1,ITGA6,HERC5,NT5DC1,RAB7A, AGA,TPK1,MBNL3,HADHB,MCCC2,CAT,ANAPC4,PCCB,PHKB, ABCB7,PGCP,GPD2,TMEM38B,NFU1,OMA1,LOC128322/NUTF2, NUBPL,LANCL1,HHLA3,PIR,ACAA2,CTBS,GSTM4,ALG8, Atp5e,Gstm5,Uqcr11,Ifi27I2a,Anapc13,Atp5I,Tmsb10,Nenf,Ndufa7, AtpSk,1110008P14Rik,Cox4i1,Cox6a1,Ndufs6,Sec61b,Romo1,Snrpd2,Mgst3,Aldh2,Ssr4,Myl6,Prdx4,Ub15,1110001J03Rik,Ndufa13,Ndufa3,Gstp2,Tmem160,Ergic3,Pgcp,Slpi,Myeov2,Ndufs5, 1810027O10Rik,Atp5o,Shfm1,Tspo,S100a6,Taldo1,Bloc1s1,Hexa, Ndufb11,Map11c3a,Gpx4,Mif,Cox6b1,RIKEN cDNA2900010J23(Swi5),Sec61g,2900010M23Rik,Anapc5,Mars2,Phpt1,Pfdn5,Arpc3,Ndufb7, Atp5h,Mrp123,Uba52,Tomm6,Mtch1,Pcbd2,Ecm1,Hrsp12,Mecr, Uqcrq,Gstm3,Lsm4,Park7,Usmg5,Cox8a,Ly6c1,Cox7b,Ppib, Bag1,S100a4,Bcap31,Tecr,Rabac1,Robld3,Sod1,Nedd8,Higd2a,Trappc6a,Ldhb,Nme2,Snrpg,Ndufa2,Serf1,Oaz1,Rps4x,Rps13, Sepp1,Gaa,ACTR10,PIGF,MGST3,SCP2,HPRT1,ACSF2,VPS13A, CTH,NXT2,MGST2,C11orf67,PCCA,GLMN,DHRS1,PON2,NME7, ETFDH,ALG13,DDX60,DYNC2LI1,VPS8,ITFG1,CDK5,C1orf112, IFT52,CLYBL,FAM114A2,NUDT7,AKD1,MAGED2,HRSP12,STX8, ACAT1,IFT74,KIFAP3,CAPN1,COX11,GLT8D4,HACL1,IFT88, NDUFB3,ANO10,ARL6,LPCAT3,ABCD3,COPG2,MIPEP,LEPR, C2orf76,ABCA6,LY96,CROT,ENPP5,SERPINB7,TCP11L2,IRAK1BP1, CDKL2,GHR,KIAA1107,RPS6KA6,CLGN,TMEM45A,TBC1D8B, ACP6,RP6-213H19.1,SNRPN,GLRB,HERC6,CFH,GALC,PDE1A,GSTM5,CADPS2,AASS,TRIM6-TRIM34(通读转录本),SEPP1,PDE5A, SATB1,CCPG1,LMBRD2,TLR3,BCAT1,TOM1L1,SLC35A1,GLYATL2, STAT4,GULP1,EHHADH,NBEAL1,KIAA1598,HFE,KIAA1324L,和MANSC1。
在特别优选的实施方案中,所述至少一个3’-UTR元件和/或所述至少一个5’-UTR元件包含源自选自由以下各项组成的组的基因的转录本的 3’-UTR和/或5’-UTR的核酸序列或由源自选自由以下各项组成的组的基因的转录本的3’-UTR和/或5’-UTR的核酸序列组成:GNAS(鸟嘌呤核苷酸结合蛋白,α刺激复合基因座),MORN2(含有MORN重复2),NDUFA1(NADH脱氢酶(泛醌)1α亚复合体),CBR2(羰基还原酶2),MP68 (RIKEN cDNA 2010107E04基因),NDUFA4(NADH脱氢酶(泛醌)1α亚复合体4),LTA4H,SLC38A6,DECR1,PIGK,FAM175A,PHYH,TBC1D19, PIGB,ALG6,CRYZ,BRP44L,ACADSB,SUPT3H,TMEM14A,GRAMD1C,C11orf80,C9orf46,ANXA4,TBCK,IFI6,C2orf34,ALDH6A1,AGTPBP1, CCDC53,LRRC28,CCDC109B,PUS10,CASP1,SNX14,SKAP2,NDUFB6, EFHA1,BCKDHB,BBS2,ITGA6,HERC5,NT5DC1,RAB7A,AGA, TPK1,MBNL3,HADHB,MCCC2,CAT,ANAPC4,PCCB,PHKB, ABCB7,PGCP,GPD2,TMEM38B,NFU1,OMA1,LOC128322/NUTF2, NUBPL,LANCL1,HHLA3,PIR,ACAA2,CTBS,GSTM4,ALG8,Atp5e,Gstm5,Uqcr11,Ifi27I2a,Anapc13,Atp5I,Nenf,Ndufa7,Atp5k, 1110008P14Rik,Cox4i1,Cox6a1,Ndufs6,Sec61b,Romo1,Snrpd2, Mgst3,Aldh2,Ssr4,Myl6,Prdx4,Ubl5,1110001J03Rik,Ndufa13, Ndufa3,Gstp2,Tmem160,Ergic3,Pgcp,Slpi,Ndufs5,1810027O10Rik, Atp5o,Shfm1,Tspo,S100a6,Taldo1,Bloc1s1,Hexa,Ndufb11,Map1lc3a,Gpx4,Mif,Cox6b1,RIKEN cDNA2900010J23(Swi5),Sec61g, 2900010M23Rik,Anapc5,Mars2,Phpt1,Ndufb8,Pfdn5,Arpc3,Ndufb7, Atp5h,Mrp123,Tomm6,Mtch1,Pcbd2,Ecm1,Hrsp12,Mecr,Uqcrq, Gstm3,Lsm4,Park7,Usmg5,Cox8a,Ly6c1,Cox7b,Ppib,Bag1,S100a4,Bcap31,Tecr,Rabac1,Robld3,Sod1,Nedd8,Higd2a,Ldhb,Nme2, Snrpg,Ndufa2,Serf1,Oaz1,Ybx1,Sepp1,Gaa,ACTR10,PIGF,MGST3, SCP2,HPRT1,ACSF2,VPS13A,CTH,NXT2,MGST2,C11orf67, PCCA,GLMN,DHRS1,PON2,NME7,ETFDH,ALG13,DDX60, DYNC2LI1,VPS8,ITFG1,CDK5,C1orf112,IFT52,CLYBL,FAM114A2, NUDT7,AKD1,MAGED2,HRSP12,STX8,ACAT1,IFT74,KIFAP3, CAPN1,COX11,GLT8D4,HACL1,IFT88,NDUFB3,ANO10,ARL6, LPCAT3,ABCD3,COPG2,MIPEP,C2orf76,ABCA6,LY96,CROT, ENPP5,SERPINB7,TCP11L2,IRAK1BP1,CDKL2,GHR,KIAA1107, RPS6KA6,CLGN,TMEM45A,TBC1D8B,ACP6,RP6-213H19.1,SNRPN,GLRB,HERC6,CFH,GALC,PDE1A,GSTM5,CADPS2,AASS, TRIM6-TRIM34(通读转录本),SEPP1,PDE5A,SATB1,CCPG1,CNTN1, LMBRD2,TLR3,BCAT1,TOM1L1,SLC35A1,GLYATL2,STAT4,GULP1,EHHADH,NBEAL1,KIAA1598,HFE,KIAA1324L,和MANSC1。
更优选地,所述至少一个3’-UTR元件和/或所述至少一个5’-UTR元件包含源自选自由以下各项组成的组的基因的转录本的3’-UTR和/或 5’-UTR的核酸序列或由源自选自由以下各项组成的组的基因的转录本的 3’-UTR和/或5’-UTR的核酸序列组成:GNAS(鸟嘌呤核苷酸结合蛋白,α刺激复合基因座),MORN2(含有MORN重复2),GSTM1(谷胱甘肽S- 转移酶,μl),NDUFA1(NADH脱氢酶(泛醌)1α亚复合体),CBR2(羰基还原酶2),MP68(RIKEN cDNA2010107E04基因),Ybx1(Y-Box结合蛋白1),Ndufb8(NADH脱氢酶(泛醌)1β亚复合体8),CNTN1(接触蛋白1)和NDUFA4(NADH脱氢酶(泛醌)1α亚复合体4)。
优选地,根据本发明的人工核酸分子的所述至少一个3’-UTR元件和/ 或所述至少一个5’-UTR元件包含基因的转录本的3’-UTR和/或5’-UTR 的“功能性片段”,“功能性变体”或“变体的功能性片段”或由基因的转录本的3’-UTR和/或5’-UTR的“功能性片段”,“功能性变体”或“变体的功能性片段”组成。
优选地,所述至少一个3’-UTR元件和/或所述至少一个5’-UTR元件包含源自选自由以下各项组成的组的人基因的转录本的3’-UTR和/或 5’-UTR的核酸序列:GNAS(鸟嘌呤核苷酸结合蛋白,α刺激复合基因座), MORN2(含有MORN重复2),GSTM1(谷胱甘肽S-转移酶,μl),NDUFA1 (NADH脱氢酶(泛醌)1α亚复合体),CBR2(羰基还原酶2),MP68 (RIKEN cDNA2010107E04基因),NDUFA4(NADH脱氢酶(泛醌)1α亚复合体4),LTA4H,SLC38A6,DECR1,PIGK,FAM175A,PHYH,TBC1D19, PIGB,ALG6,CRYZ,BRP44L,ACADSB,SUPT3H,TMEM14A,GRAMD1C,C11orf80,C9orf46,ANXA4,TBCK,IFI6,C2orf34,ALDH6A1,AGTPBP1, CCDC53,LRRC28,CCDC109B,PUS10,CCDC104,CASP1,SNX14, SKAP2,NDUFB6,EFHA1,BCKDHB,BBS2,LMBRD1,ITGA6,HERC5, NT5DC1,RAB7A,AGA,TPK1,MBNL3,HADHB,MCCC2,CAT, ANAPC4,PCCB,PHKB,ABCB7,PGCP,GPD2,TMEM38B,NFU1, OMA1,LOC128322/NUTF2,NUBPL,LANCL1,HHLA3,PIR,ACAA2, CTBS,GSTM4,ALG8,ACTR10,PIGF,MGST3,SCP2,HPRT1,ACSF2, VPS13A,CTH,NXT2,MGST2,C11orf67,PCCA,GLMN,DHRS1, PON2,NME7,ETFDH,ALG13,DDX60,DYNC2LI1,VPS8,ITFG1,CDK5,C1orf112,IFT52,CLYBL,FAM114A2,NUDT7,AKD1,MAGED2, HRSP12,STX8,ACAT1,IFT74,KIFAP3,CAPN1,COX11,GLT8D4, HACL1,IFT88,NDUFB3,ANO10,ARL6,LPCAT3,ABCD3,COPG2, MIPEP,LEPR,C2orf76,ABCA6,LY96,CROT,ENPP5,SERPINB7, TCP11L2,IRAK1BP1,CDKL2,GHR,KIAA1107,RPS6KA6,CLGN, TMEM45A,TBC1D8B,ACP6,RP6-213H19.1,SNRPN,GLRB,HERC6, CFH,GALC,PDE1A,GSTM5,CADPS2,AASS,TRIM6-TRIM34(通读转录本),SEPP1,PDE5A,SATB1,CCPG1,CNTN1,LMBRD2,TLR3, BCAT1,TOM1L1,SLC35A1,GLYATL2,STAT4,GULP1,EHHADH, NBEAL1,KIAA1598,HFE,KIAA1324L,和MANSC1。
备选地或此外,还优选的是,所述至少一个3’-UTR元件和/或所述至少一个5’-UTR元件包含源自选自由以下各项组成的组的鼠基因的转录本的3’-UTR和/或5’-UTR的核酸序列:GNAS(鸟嘌呤核苷酸结合蛋白,α刺激复合基因座),MORN2(含有MORN重复2),GSTM1(谷胱甘肽S- 转移酶,μl),NDUFA1(NADH脱氢酶(泛醌)1α亚复合体),CBR2(羰基还原酶2),MP68(RIKEN cDNA 2010107E04基因),NDUFA4(NADH 脱氢酶(泛醌)1α亚复合体4),Atp5e,Gstm5,Uqcr11,Ifi27I2a,Anapc13, Atp5I,Tmsb10,Nenf,Ndufa7,Atp5k,1110008P14Rik,Cox4i1,Cox6a1, Ndufs6,Sec61b,Romo1,Snrpd2,Mgst3,Aldh2,Ssr4,Myl6,Prdx4, Ubl5,1110001J03Rik,Ndufa13,Ndufa3,Gstp2,Tmem160,Ergic3,Pgcp, Slpi,Myeov2,Ndufs5,1810027O10Rik,Atp5o,Shfm1,Tspo,S100a6, Taldo1,Bloc1s1,Hexa,Ndufb11,Map1lc3a,Gpx4,Mif,Cox6b1,RIKEN cDNA2900010J23(Swi5),Sec61g,2900010M23Rik,Anapc5,Mars2,Phpt1, Ndufb8,Pfdn5,Arpc3,Ndufb7,Atp5h,Mrp123,Uba52,Tomm6,Mtch1, Pcbd2,Ecm1,Hrsp12,Mecr,Uqcrq,Gstm3,Lsm4,Park7,Usmg5, Cox8a,Ly6c1,Cox7b,Ppib,Bag1,S100a4,Bcap31,Tecr,Rabac1, Robld3,Sod1,Nedd8,Higd2a,Trappc6a,Ldhb,Nme2,Snrpg,Ndufa2,Serf1,Oaz1,Rps4x,Rps13,Ybx1,Sepp1,和Gaa。
优选地,至少一个3’-UTR元件包含源自选自由以下各项组成的组的基因转录本的3’-UTR的核酸序列:GNAS(鸟嘌呤核苷酸结合蛋白,α刺激复合基因座),MORN2(含有MORN重复2),GSTM1(谷胱甘肽S-转移酶,μl),NDUFA1(NADH脱氢酶(泛醌)1α亚复合体),CBR2(羰基还原酶2),SLC38A6,DECR1,PIGK,FAM175A,PHYH,TBC1D19,PIGB, ALG6,CRYZ,BRP44L,ACADSB,TMEM14A,GRAMD1C,C11orf80, ANXA4,TBCK,IFI6,C2orf34,ALDH6A1,AGTPBP1,CCDC53,LRRC28, CCDC109B,PUS10,CCDC104,CASP1,SNX14,SKAP2,NDUFB6, EFHA1,BCKDHB,BBS2,LMBRD1,ITGA6,HERC5,HADHB,ANAPC4, PCCB,ABCB7,PGCP,NFU1,OMA1,HHLA3,ACAA2,GSTM4, ALG8,Atp5e,Gstm5,Uqcr11,Ifi27I2a,Cbr2,Atp5I,Tmsb10,Nenf, Atp5k,1110008P14Rik,Cox4i1,Cox6a1,Ndufs6,Sec61b,Romo1,Gnas, Snrpd2,Mgst3,Aldh2,Ss4,Myl6,Prdx4,Ubl5,1110001J03Rik,Ndufa13, Ndufa3,Gstp2,Tmem160,Ergic3,Pgcp,Slpi,Myeov2,Ndufa4,Ndufs5, Gstm1,1810027O10Rik,Atp5o,Shfm1,Tspo,S100a6,Taldo1,B1oc1s1, Ndufb11,Map1lc3a,Morn2,Gpx4,Mif,Cox6b1,RIKEN cDNA2900010J23 (Swi5),Sec61g,2900010M23Rik,Anapc5,Mars2,Phpt1,Ndufb8,Pfdn5, Arpc3,Ndufb7,Atp5h,Mrp123,Uba52,Tomm6,Mtch1,Pcbd2,Ecm1, Hrsp12,Mecr,Uqcrq,Gstm3,Lsm4,Park7,Usmg5,Cox8a,Ly6c1, Cox7b,Ppib,Bag1,S100a4,Bcap31,Tecr,Rabac1,Robld3,Sod1,Nedd8,Higd2a,Trappc6a,Ldhb,Nme2,Snrpg,Ndufa2,Serf1,Oaz1, Rps4x,Rps13,Ybx1,Sepp1,Gaa,ACTR10,PIGF,MGST3,SCP2, HPRT1,ACSF2,VPS13A,CTH,NXT2,MGST2,C11orf67,PCCA, GLMN,DHRS1,PON2,NME7,ETFDH,ALG13,DDX60,DYNC2LI1, VPS8,ITFG1,CDK5,C1orf112,IFT52,CLYBL,FAM114A2,NUDT7, AKD1,MAGED2,HRSP12,STX8,ACAT1,IFT74,KIFAP3,CAPN1, COX11,GLT8D4,HACL1,IFT88,NDUFB3,ANO10,ARL6,LPCAT3, ABCD3,COPG2,MIPEP,LEPR,C2orf76,ABCA6,LY96,CROT, ENPP5,SERPINB7,TCP11L2,IRAK1BP1,CDKL2,GHR,KIAA1107, RPS6KA6,CLGN,TMEM45A,TBC 1D8B,ACP6,RP6-213H19.1,SNRPN, GLRB,HERC6,CFH,GALC,PDE1A,GSTM5,CADPS2,AASS, TRIM6-TRIM34(通读转录本),SEPP1,PDE5A,SATB1,CCPG1,CNTN1,LMBRD2,TLR3,BCAT1,TOM1L1,SLC35A1,GLYATL2,STAT4, GULP1,EHHADH,NBEAL1,KIAA1598,HFE,KIAA1324L,和MANSC1。更优选地,至少一个3’-UTR元件包含源自选自由以下各项组成的组的基因的转录本的3’-UTR的核酸序列或由源自选自由以下各项组成的组的基因的转录本的3’-UTR的核酸序列组成:GNAS(鸟嘌呤核苷酸结合蛋白,α刺激复合基因座),MORN2(含有MORN重复2),GSTM1(谷胱甘肽S- 转移酶,μl),NDUFA1(NADH脱氢酶(泛醌)1α亚复合体),CBR2(羰基还原酶2),Ybx1(Y-Box结合蛋白1),Ndufb8(NADH脱氢酶(泛醌)1 β亚复合体8),和CNTN1(接触蛋白1)。
在特别优选的实施方案中,至少一个3’-UTR元件包含源自选自由以下各项组成的组的基因的转录本的3’-UTR的核酸序列:GNAS(鸟嘌呤核苷酸结合蛋白,α刺激复合基因座),MORN2(含有MORN重复2),GSTM1 (谷胱甘肽S-转移酶,μl),NDUFA1(NADH脱氢酶(泛醌)1α亚复合体), CBR2(羰基还原酶2),SLC38A6,DECR1,PIGK,FAM175A,PHYH, TBC1D19,PIGB,ALG6,CRYZ,BRP44L,ACADSB,TMEM14A, GRAMD1C,C11orf80,ANXA4,TBCK,IFI6,C2orf34,ALDH6A1, AGTPBP1,CCDC53,LRRC28,CCDC109B,PUS10,CCDC104,CASP1, SNX14,SKAP2,NDUFB6,EFHA1,BCKDHB,BBS2,LMBRD1,ITGA6, HERC5,HADHB,ANAPC4,PCCB,ABCB7,PGCP,NFU1,OMA1, HHLA3,ACAA2,GSTM4,ALG8,Atp5e,Gstm5,Uqcr11,Ifi2712a, Cbr2,Atp5I,Tmsb10,Nenf,Atp5k,1110008P14Rik,Cox4i1,Cox6a1, Ndufs6,Sec61b,Romo1,Gnas,Snrpd2,Mgst3,Aldh2,Ss4,Myl6, Prdx4,Ubl5,1110001J03Rik,Ndufa13,Ndufa3,Gstp2,Tmem160,Ergic3, Pgcp,Slpi,Myeov2,Ndufa4,Ndufs5,Gstm1,1810027O10Rik,Atp5o,Shfm1,Tspo,S100a6,Taldo1,Bloc1s1,Ndufb11,Map1lc3a,Morn2, Gpx4,Mif,Cox6b1,RIKEN cDNA2900010J23(Swi5),Sec61g, 2900010M23Rik,Anapc5,Mars2,Phpt1,Ndufb8,Pfdn5,Arpc3,Ndufb7, Atp5h,Mrp123,Tomm6,Mtch1,Pcbd2,Ecm1,Hrsp12,Mecr,Uqcrq,Gstm3,Lsm4,Park7,Usmg5,Cox8a,Ly6c1,Cox7b,Ppib,Bag1,S100a4, Bcap31,Tecr,Rabac1,Robld3,Sod1,Nedd8,Higd2a,Trappc6a,Ldhb,Nme2,Snrpg,Ndufa2,Serf1,Oaz1,Ybx1,Sepp1,Gaa,ACTR10,PIGF, MGST3,SCP2,HPRT1,ACSF2,VPS13A,CTH,NXT2,MGST2,C11orf67, PCCA,GLMN,DHRS1,PON2,NME7,ETFDH,ALG13,DDX60, DYNC2LI1,VPS8,ITFG1,CDK5,C1orf112,IFT52,CLYBL,FAM114A2, NUDT7,AKD1,MAGED2,HRSP12,STX8,ACAT1,IFT74,KIFAP3, CAPN1,COX11,GLT8D4,HACL1,IFT88,NDUFB3,ANO10,ARL6, LPCAT3,ABCD3,COPG2,MIPEP,LEPR,C2orf76,ABCA6,LY96, CROT,ENPP5,SERPINB7,TCP11L2,IRAK1BP1,CDKL2,GHR, KIAA1107,RPS6KA6,CLGN,TMEM45A,TBC1D8B,ACP6, RP6-213H19.1,SNRPN,GLRB,HERC6,CFH,GALC,PDE1A,GSTM5, CADPS2,AASS,TRIM6-TRIM34(通读转录本),SEPP1,PDE5A,SATB1, CCPG1,CNTN1,LMBRD2,TLR3,BCAT1,TOM1L1,SLC35A1,GLYATL2, STAT4,GULP1,EHHADH,NBEAL1,KIAA1598,HFE,KIAA1324L,和MANSC1。更优选地,至少一个3’-UTR元件包含源自选自由以下各项组成的组的基因的转录本的3’-UTR的核酸序列或由源自选自由以下各项组成的组的基因的转录本的3’-UTR的核酸序列组成:GNAS(鸟嘌呤核苷酸结合蛋白,α刺激复合基因座),MORN2(含有MORN重复2),GSTM1 (谷胱甘肽S-转移酶,μl),NDUFA1(NADH脱氢酶(泛醌)1α亚复合体), CBR2(羰基还原酶2),Ybx1(Y-Box结合蛋白1),Ndufb8(NADH脱氢酶(泛醌)1β亚复合体8),和CNTN1(接触蛋白1)。
更优选地,至少一个3’-UTR元件包含源自选自由以下各项组成的组的人基因的转录本的3’-UTR的核酸序列:GNAS(鸟嘌呤核苷酸结合蛋白,α刺激复合基因座),MORN2(含有MORN重复2),GSTM1(谷胱甘肽S- 转移酶,μl),NDUFA1(NADH脱氢酶(泛醌)1α亚复合体),CBR2(羰基还原酶2),SLC38A6,DECR1,PIGK,FAM175A,PHYH,TBC1D19, PIGB,ALG6,CRYZ,BRP44L,ACADSB,TMEM14A,GRAMD1C, C11orf80,ANXA4,TBCK,IFI6,C2orf34,ALDH6A1,AGTPBP1,CCDC53, LRRC28,CCDC109B,PUS10,CCDC104,CASP1,SNX14,SKAP2, NDUFB6,EFHA1,BCKDHB,BBS2,LMBRD1,ITGA6,HERC5,HADHB, ANAPC4,PCCB,ABCB7,PGCP,NFU1,OMA1,HHLA3,ACAA2,GSTM4,ALG8,ACTR10,PIGF,MGST3,SCP2,HPRT1,ACSF2, VPS13A,CTH,NXT2,MGST2,C11orf67,PCCA,GLMN,DHRS1, PON2,NME7,ETFDH,ALG13,DDX60,DYNC2LI1,VPS8,ITFG1, CDK5,C1orf112,IFT52,CLYBL,FAM114A2,NUDT7,AKD1,MAGED2, HRSP12,STX8,ACAT1,IFT74,KIFAP3,CAPN1,COX11,GLT8D4, HACL1,IFT88,NDUFB3,ANO10,ARL6,LPCAT3,ABCD3,COPG2, MIPEP,LEPR,C2orf76,ABCA6,LY96,CROT,ENPP5,SERPINB7, TCP11L2,IRAK1BP1,CDKL2,GHR,KIAA1107,RPS6KA6,CLGN, TMEM45A,TBC1D8B,ACP6,RP6-213H19.1,SNRPN,GLRB,HERC6, CFH,GALC,PDE1A,GSTM5,CADPS2,AASS,TRIM6-TRIM34(通读转录本),SEPP1,PDE5A,SATB1,CCPG1,CNTN1,LMBRD2,TLR3, BCAT1,TOM1L1,SLC35A1,GLYATL2,STAT4,GULP1,EHHADH, NBEAL1,KIAA1598,HFE,KIAA1324L,和MANSC1;优选地,至少一个3’-UTR元件包含源自选自由以下各项组成的组的人基因的转录本的 3’-UTR的核酸序列或由源自选自由以下各项组成的组的人基因的转录本的3’-UTR的核酸序列组成:GNAS(鸟嘌呤核苷酸结合蛋白,α刺激复合基因座),MORN2(含有MORN重复2),GSTM1(谷胱甘肽S-转移酶,μl), NDUFA1(NADH脱氢酶(泛醌)1α亚复合体),CBR2(羰基还原酶2), Ybx1(Y-Box结合蛋白1),Ndufb8(NADH脱氢酶(泛醌)1β亚复合体8),和CNTN1(接触蛋白1)。
因此,还更优选的是,至少一个3’-UTR元件包含源自选自由以下各项组成的组的鼠基因的转录本的3’-UTR的核酸序列:GNAS(鸟嘌呤核苷酸结合蛋白,α刺激复合基因座),MORN2(含有MORN重复2),GSTM1 (谷胱甘肽S-转移酶,μl),NDUFA1(NADH脱氢酶(泛醌)1α亚复合体), CBR2(羰基还原酶2),Ybx1(Y-Box结合蛋白1),Ndufb8(NADH脱氢酶(泛醌)1β亚复合体8),和CNTN1(接触蛋白1),Ndufa1,Atp5e,Gstm5, Uqcr11,Ifi27I2a,Cbr2,Atp5I,Tmsb10,Nenf,Atp5k,1110008P14Rik, Cox4i1,Cox6a1,Ndufs6,Sec61b,Romo1,Gnas,Snrpd2,Mgst3,Aldh2, Ssr4,Myl6,Prdx4,Ubl5,1110001J03Rik,Ndufa13,Ndufa3,Gstp2,Tmem160,Ergic3,Pgcp,Slpi,Myeov2,Ndufa4,Ndufs5,Gstm1,1810027O10Rik,Atp5o,Shfm1,Tspo,S100a6,Taldo1,B1oc1s1,Ndufb11, Map1lc3a,Morn2,Gpx4,Mif,Cox6b1,RIKEN cDNA2900010J23(Swi5), Sec61g,2900010M23Rik,Anapc5,Mars2,Phpt1,Ndufb8,Pfdn5,Arpc3, Ndufb7,Atp5h,Mrp123,Uba52,Tomm6,Mtch1,Pcbd2,Ecm1,Hrsp12, Mecr,Uqcrq,Gstm3,Lsm4,Park7,Usmg5,Cox8a,Ly6c1,Cox7b, Ppib,Bag1,S100a4,Bcap31,Tecr,Rabac1,Rob1d3,Sod1,Nedd8, Higd2a,Trappc6a,Ldhb,Nme2,Snrpg,Ndufa2,Serf1,Oaz1,Rps4x, Rps13,Ybx1,Sepp1,和Gaa;优选地,至少一个3’-UTR元件包含源自选自由以下各项组成的组的鼠基因的转录本的3’-UTR的核酸序列或由源自选自由以下各项组成的组的鼠基因的转录本的3’-UTR的核酸序列组成: GNAS(鸟嘌呤核苷酸结合蛋白,α刺激复合基因座),MORN2(含有MORN 重复2),GSTM1(谷胱甘肽S-转移酶,μl),NDUFA1(NADH脱氢酶(泛醌)1α亚复合体),CBR2(羰基还原酶2),Ybx1(Y-Box结合蛋白1), Ndufb8(NADH脱氢酶(泛醌)1β亚复合体8),和CNTN1(接触蛋白1)。
优选地,至少一个5’-UTR元件包含源自选自由以下各项组成的组的基因的转录本的5’-UTR的核酸序列:MP68(RIKEN cDNA 2010107E04基因),NDUFA4(NADH脱氢酶(泛醌)1α亚复合体4),LTA4H,DECR1, PIGK,TBC1D19,BRP44L,ACADSB,SUPT3H,TMEM14A,C9orf46,ANXA4,IFI6,C2orf34,ALDH6A1,CCDC53,CCDC104,CASP1,NDUFB6, BCKDHB,BBS2,HERC5,FAM175A,NT5DC1,RAB7A,AGA,TPK1, MBNL3,MCCC2,CAT,ANAPC4,PHKB,ABCB7,GPD2,TMEM38B, NFU1,LOC128322/NUTF2,NUBPL,LANCL1,PIR,CTBS,GSTM4, Ndufa1,Atp5e,Gstm5,Cbr2,Anapc13,Ndufa7,Atp5k,1110008P14Rik, Cox4i1,Ndufs6,Sec61b,Snrpd2,Mgst3,Prdx4;Pgcp;Myeov2;Ndufa4; Ndufs5;Gstm1;Atp5o;Tspo;Taldo1;B1oc1s1;和Hexa。更优选地,至少一个5’-UTR元件包含源自MP68(RIKEN cDNA 2010107E04基因)或NDUFA4(NADH脱氢酶(泛醌)1α亚复合体4)的转录本的5’-UTR的核酸序列或由源自MP68(RIKEN cDNA 2010107E04基因)或NDUFA4 (NADH脱氢酶(泛醌)1α亚复合体4)的转录本的5’-UTR的核酸序列组成。
在特别优选的实施方案中,至少一个5’-UTR元件包含源自选自由以下各项组成的组的基因的转录本的5’-UTR的核酸序列:MP68(RIKEN cDNA 2010107E04基因),NDUFA4(NADH脱氢酶(泛醌)1α亚复合体 4),LTA4H,DECR1,PIGK,TBC1D19,BRP44L,ACADSB,SUPT3H,TMEM14A,C9orf46,ANXA4,IFI6,C2orf34,ALDH6A1,CCDC53, CASP1,NDUFB6,BCKDHB,BBS2,HERC5,FAM175A,NT5DC1, RAB7A,AGA,TPK1,MBNL3,MCCC2,CAT,ANAPC4,PHKB,ABCB7, GPD2,TMEM38B,NFU1,LOC128322/NUTF2,NUBPL,LANCL1,PIR, CTBS,GSTM4,Ndufa1,Atp5e,Gstm5,Cbr2,Anapc13,Ndufa7,Atp5k, 1110008P14Rik,Cox4i1,Ndufs6,Sec61b,Snrpd2,Mgst3,Prdx4;Pgcp; Ndufa4;Ndufs5;Atp5o;Tspo;Ta1do1;B1oc1s1;和Hexa。更优选地,至少一个5’-UTR元件包含源自MP68(RIKEN cDNA 2010107E04基因)或 NDUFA4(NADH脱氢酶(泛醌)1α亚复合体4)的转录本的5’-UTR的核酸序列或由源自MP68(RIKEN cDNA 2010107E04基因)或NDUFA4 (NADH脱氢酶(泛醌)1α亚复合体4)的转录本的5’-UTR的核酸序列组成。
更优选地,至少一个5’-UTR元件包含源自选自由以下各项组成的组的人基因的转录本的5’-UTR的核酸序列:MP68(RIKEN cDNA 2010107E04基因),NDUFA4(NADH脱氢酶(泛醌)1α亚复合体4), LTA4H,DECR1,PIGK,TBC1D19,BRP44L,ACADSB,SUPT3H, TMEM14A,C9orf46,ANXA4,IFI6,C2orf34,ALDH6A1,CCDC53, CCDC104,CASP1,NDUFB6,BCKDHB,BBS2,HERC5,FAM175A, NT5DC1,RAB7A,AGA,TPK1,MBNL3,MCCC2,CAT,ANAPC4, PHKB,ABCB7,GPD2,TMEM38B,NFU1,LOC128322/NUTF2,NUBPL, LANCL1,PIR,CTBS,和GSTM4;优选地,至少一个5’-UTR元件包含源自MP68(RIKEN cDNA 2010107E04基因)或NDUFA4(NADH脱氢酶 (泛醌)1α亚复合体4)的人转录本的5’-UTR的核酸序列或由源自MP68 (RIKEN cDNA 2010107E04基因)或NDUFA4(NADH脱氢酶(泛醌)1o亚复合体4)的人转录本的5’-UTR的核酸序列组成。
因此,而且更优选的是,至少一个5’-UTR元件包含源自选自由以下各项组成的组的鼠基因的转录本的5’-UTR的核酸序列:MP68(RIKEN cDNA 2010107E04基因),NDUFA4(NADH脱氢酶(泛醌)1α亚复合体 4),Ndufa1,Atp5e,Gstm5,Cbr2,Anapc13,Ndufa7,Atp5k,1110008P14Rik, Cox4i1,Ndufs6,Sec61b,Snrpd2,Mgst3,Prdx4;Pgcp;Myeov2;Ndufa4;Ndufs5;Gstm1;Atp5o;Tspo;Taldo1;Bloc1s1;和Hexa;优选地,至少一个5’-UTR元件包含源自MP68(RIKEN cDNA 2010107E04基因)或 NDUFA4(NADH脱氢酶(泛醌)1α亚复合体4)的鼠转录本的5’-UTR的核酸序列或由源自MP68(RIKEN cDNA 2010107E04基因)或NDUFA4 (NADH脱氢酶(泛醌)1α亚复合体4)的鼠转录本的5’-UTR的核酸序列组成。
术语“源自基因的转录本的3’-UTR和/或5’-UTR的核酸序列”优选是指基于基因的转录本或其片段或部分,优选天然存在的基因或其片段或部分的3’-UTR序列和/或5’-UTR序列的核酸序列。该术语包括对应于整个 3’-UTR序列和/或整个5’-UTR序列的序列,即基因的转录本的全长3’-UTR 和/或5’-UTR序列,和对应于基因的转录本的3’-UTR序列和/或5’-UTR 序列的片段的序列。优选地,基因的转录本的3’-UTR和/或5’-UTR的片段由与基因的转录本的全长3’-UTR和/或5’-UTR中的一段连续核苷酸对应的一段连续核苷酸组成,其代表基因的转录本的全长3’-UTR和/或 5’-UTR的至少5%,10%,20%,优选至少30%,更优选至少40%,更优选至少50%,甚至更优选至少60%,甚至更优选至少70%,甚至更优选至少80%,并且最优选至少90%。在本发明的意义中,所述片段优选是本文所述的功能性片段。优选地,片段保留对与3’-UTR和/或5’-UTR或其片段连接的ORF的翻译的调节功能。
在基因的转录本的3’-UTR和/或5’-UTR的范畴中术语“基因的转录本的3’-UTR的变体和/或5’-UTR的变体”和“其变体”是指天然存在的基因的转录本的3’-UTR和/或5’-UTR的变体,优选是指脊椎动物基因的转录本的3’-UTR和/或5’-UTR的变体,更优选是指哺乳动物基因的转录本的 3’-UTR和/或5’-UTR的变体,甚至更优选是指灵长类基因,尤其是如上文所述的人基因的转录本的3’-UTR和/或5’-UTR的变体。所述变体可以是基因的转录本的修饰的3’-UTR和/或5’-UTR。例如,与变体源自的天然存在的3’-UTR和/或5’-UTR相比,3’-UTR的变体和/或5’-UTR的变体可以呈现一个或多个核苷酸缺失、插入、添加和/或置换。优选地,基因的转录本的3’-UTR的变体和/或5’-UTR的变体与变体源自的天然存在的 3’-UTR和/或5’-UTR至少40%,优选至少50%,更优选至少60%,更优选至少70%,甚至更优选至少80%,甚至更优选至少90%,最优选至少 95%相同。优选地,变体是本文中所述的功能性变体。
术语“源自基因的转录本的3’-UTR的变体和/或5’-UTR的变体的核酸序列”优选是指如上文所述的基因的转录本的3’-UTR序列和/或5’-UTR 的变体或其片段或部分的核酸序列。该术语包括对应于基因的转录本的3’-UTR和/或5’-UTR的变体的整个序列的序列,即基因的转录本的全长变体3’-UTR序列和/或全长变体5’-UTR序列,和对应于基因的转录本的变体3’-UTR序列的片段和/或变体5’-UTR序列的片段的序列。优选地,基因的转录本的3’-UTR和/或5’-UTR的变体的片段由与基因的转录本的 3’-UTR和/或5’-UTR的全长变体中的一段连续的核苷酸对应的一段连续的核苷酸组成,其代表基因的转录本的3’-UTR和/或5’-UTR的全长变体的至少20%,优选至少30%,更优选至少40%,更优选至少50%,甚至更优选至少60%,甚至更优选至少70%,甚至更优选至少80%,并且最优选至少90%。所述变体的片段,在本发明的意义中,优选本文中所述的变体的功能性片段。
术语“功能性变体”,“功能性片段”,和“变体的功能性片段”(还称为“功能性变体片段”)在本发明的情况下,意为基因的转录本的3’-UTR和/或 5’-UTR的片段,3’-UTR和/或the 5’-UTR的变体,或3’-UTR和/或5’-UTR 的变体的片段满足变体、片段、或变体的片段源自的基因的转录本的天然存在的3’-UTR和/或5’-UTR的至少一种,优选多于一种功能。所述功能可以,例如,稳定mRNA和/或增强,稳定和/或延长从mRNA的蛋白生产和/或增加从mRNA的蛋白表达或总蛋白生产(优选在哺乳动物细胞中,如人细胞中)。优选地,3’-UTR和/或5’-UTR的功能涉及ORF编码的蛋白的翻译。更优选地,功能包含增强与3’-UTR和/或5’-UTR或其片段或变体连接的ORF的翻译效率。特别优选的是,在本发明的情况下,变体,片段,和变体片段满足与包含参比3’-UTR和/或参比5’-UTR或缺少3’-UTR和/或5’-UTR的mRNA相比,优选在哺乳动物细胞,如人细胞中稳定mRNA的功能,和/或与包含参比3’-UTR和/或参比5’-UTR或缺少 3’-UTR和/或5’-UTR的mRNA相比,优选在哺乳动物细胞中,如在人细胞中,增强,稳定和/或延长从mRNA的蛋白生产的功能,和/或与包含参比3’-UTR和/或参比5’-UTR或缺少3’-UTR和/或5’-UTR的mRNA相比,优选在哺乳动物细胞中,如在人细胞中,增加从mRNA的蛋白生产的功能。参比3’-UTR和/或参比5’-UTR可以是,例如,天然与ORF组合存在的3’-UTR和/或5’-UTR。此外,与变体、片段、或变体片段源自的野生型3’-UTR和/或野生型5’-UTR相比,基因的转录本的3’-UTR和/或5’-UTR 的功能性变体,功能性片段,或功能性变体片段优选对包含3’-UTR和/或 5’-UTR的所述变体、片段或变体片段的mRNA的翻译效率不具有显著减少的效果。在本发明的情况下基因的转录本的3’-UTR和/或5’-UTR的“功能性片段”,“功能性变体”或“变体的功能性片段”的特别优选的功能是通过表达携带如上文所述的功能性片段,功能性变体或变体的功能性片段的 mRNA增强,稳定和/或延长蛋白生产。
优选地,就变体,片段或变体片段源自的基因的转录本的天然存在的 3’-UTR和/或5’-UTR所展现的mRNA和/或蛋白生产稳定效率和/或蛋白生产增加效率而言,功能性变体,功能性片段,或功能性变体片段所展现的一种或多种功能的效率,如mRNA和/或蛋白生产稳定效率和/或蛋白生产增加效率,增加至少5%,更优选至少10%,更优选至少20%,更优选至少30%,更优选至少40%,更优选至少50%,更优选至少60%,甚至更优选至少70%,甚至更优选至少80%,最优选至少90%。
在本发明的情况下,基因的转录本的3’-UTR和/或5’-UTR的片段或基因的转录本的3’-UTR和/或5’-UTR的变体优选呈现至少约3个核苷酸,优选至少约5个核苷酸,更优选至少约10,15,20,25或30个核苷酸,甚至更优选至少约50个核苷酸,最优选至少约70个核苷酸的长度。优选地,基因的转录本的3’-UTR和/或5’-UTR的所述片段或基因的转录本的 3’-UTR和/或5’-UTR的变体是如上文所述的功能性片段。在优选的实施方案中,基因的转录本或其片段或变体的3’-UTR和/或5’-UTR呈现3至约500个核苷酸之间,优选5至约150个核苷酸之间,更优选10至100 个核苷酸之间,甚至更优选15至90个之间,最优选20至70个之间的长度。通常,5’-UTR元件和/或3’-UTR元件特征为少于500,400,300,200, 150或少于100个核苷酸。
优选地,至少一个3’-UTR元件包含这样的核酸序列或由这样的核酸序列组成,所述核酸序列与分别选自由SEQ ID NOs:1至24和SEQ ID NOs: 49至318或相应RNA序列组成的组的核酸序列具有至少约1,2,3,4, 5,10,15,20,30或40%,优选至少约50%,优选至少约60%,优选至少约70%,更优选至少约80%,更优选至少约90%,甚至更优选至少约95%,甚至更优选至少约99%的同一性,或其中至少一个3’-UTR元件包含这样的核酸序列的片段或由这样的核酸序列的片段组成,所述核酸序列的片段与分别选自由SEQ ID NOs:1至24和SEQ ID NOs:49至318或相应RNA序列组成的组的核酸序列具有至少约40%,优选至少约50%,优选至少约60%,优选至少约70%,更优选至少约80%,更优选至少约 90%,甚至更优选至少约95%,甚至更优选至少约99%的同一性:
智人SLC38A6 3’-UTR
SLC38A6-001 ENST00000267488
(SEQ ID NO:49)
智人DECR1 3’-UTR
NM_001359.1
智人PIGK 3’-UTR
智人FAM175A 3’-UTR
FAM175A-009 ENST00000506553
智人PHYH 3’-UTR
PHYH-002 ENST00000396913
智人TBC1D19 3’-UTR
TBC1D19-001 ENST00000264866
智人TBC1D19 NM_018317.2 3’-UTR
智人PIGB 3’-UTR
PIGB-201 ENST00000539642
智人ALG6 3’-UTR
ALG6-006 ENST00000263440
智人CRYZ 3’-UTR
CRYZ-005 ENST00000370871
智人BRP44L 3’-UTR
BRP44L-001 ENST00000360961
智人ACADSB 3’-UTR
ACADSB-004
智人TMEM14A 3’-UTR
NM_014051.3
智人GRAMD1C 3’-UTR
GRAMD1C-005 ENST00000472026
智人C11orf80 3’-UTR
C11orf80-201 ENST00000360962
智人ANXA4 3’-UTR
ANXA4-002 ENST00000409920
智人TBCK 3’-UTR
TBCK-002 ENST00000361687
智人IFI6 3’-UTR
IFI6-001 ENST00000361157
智人CAMKMT 3’-UTR
(同义词C2orf34) ENST00000378494
智人ALDH6A1 3’-UTR
NM_005589.2
智人AGTPBP1 3’-UTR
AGTPBP1-004 ENST00000357081
智人CCDC53 3’-UTR
CCDC53-001 ENST00000240079
智人LRRC28 3’-UTR
LRRC28-002 ENST00000331450
智人CCDC109B 3’-UTR
NM_017918.4
智人PUS10 3’-UTR
PUS10-001 ENST00000316752
智人CCDC104 3’-UTR
CCDC104-002 ENST00000339012
智人CASP1 3’-UTR
CASP1-007 ENST00000527979
智人SNX14 3’-UTR
SNX14-007 ENST00000513865
智人SKAP2 3’-UTR
SKAP2-201(部分的SKAP2.001 ENST00000345317)
智人NDUFB6 3’-UTR
NM_182739.2
智人EFHA1 3’-UTR
EFHA1-001 ENST00000382374
智人BCKDHB 3’-UTR
BCKDHB-005 ENST00000356489
智人BCKDHB 3’-UTR
NM_001164783.1
智人BBS2 3’-UTR
NM_031885.3
智人LMBRD1 3’UTR
NM_018368.3
智人ITGA6 3’-UTR
ITGA6-003 ENST00000409532
智人HERC5 3’-UTR
HERC5-001 ENST00000264350
智人HADHB 3’-UTR
HADHB-001 ENST00000317799
智人ANAPC4 3’-UTR
ANAPC4-001 ENST00000315368
智人PCCB 3’-UTR
NM_000532.4
智人ABCB7 3’-UTR
ABCB7-001 ENST00000253577
智人PGCP 3’-UTR
CPQ-001 ENST00000220763
智人NFU1 3’-UTR
NM_001002755.2
智人OMA1 3’-UTR
OMA1-001 ENST00000371226
智人HHLA3 3’-UTR
NM_001036646.1
智人HHLA3 3’-UTR
NM_001031693.2
智人ACAA2 3’-UTR
NM_006111.2
智人GSTM4 3’-UTR
GSTM4-001 ENST00000369836
智人GSTM4 3’-UTR
GSTM4-003 ENST00000326729
智人ALG8 3’-UTR
NM_001007027.2
智人C11orf74 3’UTR
小家鼠Ndufa1 3’-UTR
Ndufa1-001 ENSMUST00000016571
小家鼠Atp5e 3’-UTR
NM_025983
小家鼠Gstm5 3’-UTR
NM_010360
小家鼠Uqcr11 3’-UTR
NM_025650
小家鼠IFi27I2a 3’-UTR
IFi27I2a-001 ENSMUST00000055071;NM_029803
小家鼠Cbr2 3’-UTR
NM_007621
小家鼠Atp51 3’-UTR
Atp51-201 ENSMUST00000043675
小家鼠Tmsb10 3’-UTR
NM_025284
小家鼠Nenf 3’-UTR
NM_025424
小家鼠Atp5k 3’-UTR
NM_007507
小家鼠1110008P14Rik 3’-UTR
1110008P14Rik-001ENSMUST00000048792
小家鼠Cox4i1 3’-UTR
NM_009941
(SEQ ID NO:111)
小家鼠Cox6a1 3’-UTR
NM_007748
小家鼠Ndufs6 3’-UTR
NM_010888
小家鼠Sec61b 3’-UTR
NM_024171
小家鼠Romo1 3’-UTR
NM_025946
小家鼠Gnas 3’-UTR
NM_010309
小家鼠Snrpd2 3’-UTR
NM_026943
小家鼠Mgst3 3’-UTR
NM_025569
小家鼠Aldh2 3’-UTR
NM_009656
小家鼠Mp68(2010107E04Rik)3’-UTR
NM_027360
小家鼠Ssr4 3’-UTR
NM_001166480
小家鼠Myl6 3’-UTR
NM_010860
小家鼠Prdx4 3’-UTR
Prdx4-001,NM_016764
小家鼠Ubl5 3’-UTR
NM_025401
小家鼠1110001J03Rik 3’-UTR
NM_025363
小家鼠Ndufa13 3’-UTR
Ndufa13-201ENSMUST00000110167
小家鼠Ndufa3 3’-UTR
NM_025348
小家鼠Gstp2 3’-UTR
NM_181796
小家鼠Tmeml60 3’-UTR
NM_026938
小家鼠Ergic3 3’-UTR
NM_025516
小家鼠Pgcp 3’-UTR
NM_018755
小家鼠Slpi 3’-UTR
NM_011414
小家鼠Myeov2 3’-UTR
NM_001163425
小家鼠Ndufa4 3’-UTR
NM_010886
(SEQ ID NO:134)
小家鼠Ndufs5 3’-UTR
NM_001030274
小家鼠Gstm1 3’-UTR
NM_010358
小家鼠1810027010Rik 3’-UTR
1810027010Rik-001ENSMUST00000094065
小家鼠1810027010Rik 3’-UTR
BC117077
小家鼠Atp5o 3’-UTR
NM_138597
小家鼠Shfm1 3’-UTR
NM_009169
小家鼠Tspo 3’-UTR
NM_009775
小家鼠S100a6 3’-UTR
NM_011313
小家鼠Taldo1 3’-UTR
NM_011528
小家鼠Blocls1 3’-UTR
NM_015740
小家鼠Ndufb11 3’-UTR
NM_019435
小家鼠Map11c3a 3’-UTR
NM_025735
小家鼠Morn2 3’-UTR
NM_194269
小家鼠Gpx4 3’-UTR
NM_008162.2
小家鼠Mif 3’-UTR
NM_010798.2
小家鼠Cox6b1 3’-UTR
NM_025628
小家鼠RIKEN cDNA2900010J23(Swi5)3’-UTR
NM_175190
小家鼠Sec61g 3’-UTR
NM_011343.3
小家鼠2900010M23Rik 3’-UTR
BC_030629
小家鼠Anapc5 3’-UTR
Anapc5-201ENSMUST00000086216
小家鼠Mars2 3’-UTR
BC132343.1
小家鼠Phpt1 3’-UTR
NM_029293
小家鼠Ndufb8 3’-UTR
NM_026061
小家鼠Pfdn5 3’-UTR
NM_027044
小家鼠Arpc3 3’-UTR
NM_019824
小家鼠Ndufb7 3’-UTR
NM_025843
小家鼠Atp5h 3’-UTR
NM_027862
小家鼠Mrp123 3’-UTR
NM_011288
小家鼠Tomm6 3’-UTR
NM_025365.3
小家鼠Tomm6 3’-UTR
Tomm6-002ENSMUST00000113301
小家鼠Tomm6 3’-UTR
小家鼠Mtch1 3’-UTR
NM_019880
小家鼠Pcbd2 3’-UTR
NM_028281
小家鼠Ecm1 3’-UTR
NM_007899
小家鼠Hrsp12 3’-UTR
Hrsp12-001ENSMUST00000022946
(SEQ ID NO:169)
小家鼠Mecr 3’-UTR
NM_025297
小家鼠Uqcrq 3’-UTR
NM_025352
小家鼠Gstm3 3’-UTR
NM_010359
小家鼠Lsm4 3’-UTR
NM_015816
小家鼠Park7 3’-UTR
NM_020569
小家鼠Usmg5 3’-UTR
NM_023211
小家鼠Cox8a 3’-UTR
NM_007750
小家鼠Ly6c1 3’-UTR
NM_010741
小家鼠Ly6c1 3’-UTR
NM_001252058.1
小家鼠Cox7b 3’-UTR
NM_025379
小家鼠Ppib 3’-UTR
NM_011149
小家鼠Bag1 3’-UTR
NM_009736
小家鼠S100a4 3’-UTR
S100a4-201 ENSMUST00000001046
小家鼠Bcap31 3’-UTR
NM_012060
小家鼠Tecr 3’-UTR
NM_134118
小家鼠Rabac1 3’-UTR
NM_010261
小家鼠Robld3 3’-UTR
NM_031248(Lamtor2)
小家鼠S0d1 3’-UTR
NM_011434
小家鼠Nedd8 3’-UTR
NM_008683
小家鼠Higd2a 3’-UTR
NM_025933
小家鼠Trappc6a 3’-UTR
Trappc6a-001 ENSMUST00000002112
小家鼠Ldhb 3’-UTR
Ldhb-001 ENSMUST00000032373
小家鼠Nme2 3’-UTR
Nme2-001 ENSMUST00000021217
小家鼠Snrpg 3’-UTR
NM_026506
小家鼠Ndufa2 3’-UTR
NM_010885
小家鼠Serf1 3’-UTR
Serf1-003 ENSMUST00000142155
小家鼠Oaz1 3’-UTR
Oaz1-001 ENSMUST00000180036
小家鼠Ybx1 3’-UTR
Ybx1-001 ENSMUST00000079644
小家鼠Ybx1(v2)3’-UTR
具有突变T128bpG和缺失del236-237bp
小家鼠Sepp1 3’-UTR
NM_009155
小家鼠Gaa 3’-UTR
Gaa-001 ENSMUST00000106259
智人ACTR10 3’-UTR
ACTR10-002 ENST00000254286
智人PIGF 3’-UTR
NM_173074
智人PIGF 3’-UTR
NM_002643.3
智人MGST3 3’-UTR
MGST3-001 ENST00000367889
智人SCP2 3’-UTR
NM_001193599
智人SCP2 3’-UTR
SCP2-015 ENST00000435345
智人HPRT1 3’-UTR
HPRT1-001 ENST00000298556
ACSF2
智人
智人VPS13A 3’-UTR
NM_033305
智人CTH 3’-UTR
NM_001190463.1
智人CTH 3’-UTR
CTH-001 ENST00000370938
智人CTH 3’-UTR
CTH-002 ENST00000346806
智人NXT2 3’-UTR
NXT2-004 ENST00000372107
(SEQ ID NO:213)
智人MGST2 3’-UTR
NM_002413
智人MGST2 3’-UTR
NM_001204366.1
智人C11orf67 3’-UTR
AAMDC-005 ENST00000526415
智人PCCA 3’-UTR
NM_000282
智人GLMN 3’-UTR
NM_053274
智人DHRS1 3’-UTR
NM_001136050
智人PON2 3’-UTR
PON2-001 ENST00000433091
智人NME7 3’-UTR
NM_013330
智人ETFDH 3’-UTR
NM_004453
智人ALG13 3’-UTR
BC117377
智人ALG13 3’-UTR
NM_001099922.2
智人DDX60 3’-UTR
DDX60-001 ENST00000393743
智人DYNC2LI1 3’-UTR
NM_015522.3
智人VPS8 3’-UTR
NM_001009921,NM_015303
智人ITFG1 3’-UTR
NM_030790
智人CDK5 3’-UTR
NM_004935
智人C1orf112 3’-UTR
BC091516
智人IFT52 3’-UTR
NM_016004
智人CLYBL 3’-UTR
CLYBL-003 ENST00000339105
智人FAM114A2 3’-UTR
FAM114A2-006 ENST00000520667
智人NUDT7 3’-UTR
NM_001243661
智人AKD1 3’-UTR
NM_001145128
智人MAGED2 3’-UTR
NM_014599
智人HRSP12 3’-UTR
HRSP12-001 ENST00000254878
智人STX8NM_004853 3’-UTR
智人ACAT1 3’-UTR
ACAT1-001 ENST00000265838
智人IFT74 3’-UTR
IFT74-201 ENST00000433700
智人KIFAP3 3’-UTR
NM_014970
智人CAPN1 3’-UTR
NM_005186
智人COX11 3’-UTR
NM_001162861
智人GLT8D4 3’-UTR
BC127733
智人GLT8D4 3’-UTR
NM_001080393
智人HACL1 3’-UTR
NM_012260
智人IFT88 3’-UTR
NM_175605
智人IFT88 3’-UTR
IFT88-001 ENST00000351808
智人NDUFB3 3’-UTR
NM_002491
智人ANO10 3’-UTR
NM_018075
智人ANO10 3’-UTR
ANO10-005 ENST00000451430
智人ARL6 3’-UTR
NM_032146
智人LPCAT3 3’-UTR
NM_005768
智人ABCD3 3’-UTR
NM_001122674
智人COPG2 3’-UTR
NM_012133
智人MIPEP 3’-UTR
NM_005932
智人LEPR 3’-UTR
NM_002303
智人LEPR 3’-UTR
NM_001198688
智人C2orf76 3’-UTR
NM_001017927
智人C2orf76 3’-UTR
C2orf76-001 ENST00000409466
智人ABCA6 3’-UTR
NM_080284.2
智人LY96 3’-UTR
NM_015364.4
智人CROT 3’-UTR
NM_001243745.1
智人ENPP5 3’-UTR
ENPP5-002 ENST00000230565
智人SERPINB7 3’-UTR
SERPINB7-203 ENST00000546027
智人TCP11L2 3’-UTR
NM_152772
智人IRAK1BP1 3’-UTR
NM_001010844
智人CDKL2 3’-UTR
CDKL2-002 ENST00000307465
智人GHR 3’-UTR
GHR-202 ENST00000537449
智人KIAA1107 3’-UTR
NM_015237
智人RPS6KA6 3’-UTR
RPS6KA6-001 ENST00000262752
智人CLGN 3’-UTR
NM_004362,NM_001130675
智人CLGN-202 3’-UTR
NM_004362,NM_001130675
ENST00000325617
智人TMEM45A 3’-UTR
NM_018004
智人TBC1D8B 3’-UTR
TBC1D8B-007 ENST00000276175
智人ACP6 3’-UTR
NM_016361
智人RP6-213H19.1 3’-UTR
MST4-003(RBM4B-003 ENST00000496850)
智人SNRPN 3’-UTR
NM_022807
智人GLRB 3’-UTR
GLRB-005 ENST00000512619
智人HERC6 3’-UTR
NM_017912
智人CFH 3’-UTR
NM_000186
智人GALC 3’-UTR
GALC-002 ENST00000393569
智人GALC 3’-UTR
GALC-005 ENST00000393568
智人PDE1A 3’-UTR
NM_001003683.2
智人PDE1A 3’-UTR
PDE1A-003 ENST00000410103
智人GSTM5 3’-UTR
NM_000851
智人CADPS2 3’-UTR
CADPS2-002 ENST00000412584
智人CADPS2 3’-UTR
CADPS2-001 ENST00000449022
智人AASS 3’-UTR
AASS-001 ENST00000417368
智人TRIM6-TRIM34 3’-UTR
NM_001003819
智人SEPP1 3’-UTR
NM_005410
智人SEPP1 3’-UTR
SEPP1-004 ENST00000506577
(SEQ ID NO:292)
智人PDE5A 3’-UTR
PDE5A-002 ENST00000264805
智人SATB1 3’-UTR
SATB1-004 ENST00000417717
智人CCPG1 3’-UTR
CCPG1-002 ENST00000442196
智人CCPG1 3’-UTR
CCPG1-004 ENST00000425574
智人CNTN1 3’-UTR
CNTN1-002 ENST00000348761
智人CNTN1 3’-UTR
CNTN1-004 ENST00000547849
智人CNTN1 3’-UTR
CNTN1-004 ENST00000547849
+T,位置30bp,突变G727bpT,A840bpG
智人LMBRD2 3’-UTR
智人TLR3 3’-UTR
NM_003265
智人BCAT1 3’-UTR
BCAT1-002 ENST00000342945
智人BCAT1 3’-UTR
智人TOM1L1 3’-UTR
TOM1L1-001 ENST00000575882
智人SLC35A1 3’-UTR
SLC35A1-201 ENST00000369556
智人GLYATL2 3’-UTR
GLYATL2-003 ENST00000532258
智人STAT4 3’-UTR
STAT4-002 ENST00000392320
智人GULP1 3’-UTR
GULP1-002 ENST00000409609
智人GULP1 3’-UTR
GULP1-010 ENST00000409805
智人EHHADH 3’-UTR
EHHADH-002 ENST00000456310
智人NBEAL1 3’-UTR
NM_001114132.1
智人KIAA1598 3’-UTR
NM_001258299.1
智人HFE 3’-UTR
HFE-006 ENST00000317896
智人HFE 3’-UTR
HFE-004 ENST00000349999
智人HFE 3’-UTR
HFE-005 ENST00000397022
智人HFE 3’-UTR
HFE-012 ENST00000336625
智人KIAA1324L 3’-UTR
KIAA1324L-005 ENST00000416314
智人MANSC1NM_018050 3’-UTR
优选地,至少一个5’-UTR元件包含这样的核酸序列或由这样的核酸序列组成,所述核酸序列与分别选自由SEQ ID NO:25或SEQ ID NO: 30和SEQ ID NOs:319至382或相应DNA或RNA序列组成的组的核酸序列具有至少约1,2,3,4,5,10,15,20,30或40%,优选至少约50%,优选至少约60%,优选至少约70%,更优选至少约80%,更优选至少约 90%,甚至更优选至少约95%,甚至更优选至少约99%的同一性,或其中至少一个5’-UTR元件包含这样的核酸序列的片段或由这样的核酸序列的片段组成,所述核酸序列的片段与分别选自由SEQ ID NO:25或SEQ ID NO:30和SEQ ID NOs:319至382或相应DNA或RNA序列组成的组的核酸序列具有至少约40%,优选至少约50%,优选至少约60%,优选至少约70%,更优选至少约80%,更优选至少约90%,甚至更优选至少约95%,甚至更优选至少约99%的同一性:
智人LTA4H 5’-UTR
LTA4H-001 ENST00000228740
智人DECR1 5’-UTR
DECR1-001 ENST00000220764
智人PIGK 5’-UTR
智人BRP44L 5’-UTR
BRP44L-001
智人ACADSB 5’-UTR
ACADSB-004 NM_001609.3 ENST00000368869
(SEQ ID NO:323)
智人SUPT3H 5’-UTR
SUPT3H-006 ENST00000371459
智人TMEM14A 5’-UTR
NM_014051.3
智人C9orf46 5’-UTR
AF225420.1
智人ANXA4 5’-UTR
NM_001153.3
智人IF16 5’-UTR
NM_022873.2
智人C2orf34 5’-UTR
CAMKMT-008 ENST00000402247
智人C2orf34 5’-UTR
NM_024766.3
智人ALDH6A1 5’-UTR
ALDH6A1-002 ENST00000350259
(SEQ ID NO:331)
智人CCDC53 5’-UTR
CCDC53-002 ENST00000545679
智人CASP1 5’-UTR
NM_001257119.1
智人NDUFB6 5’-UTR
NM_182739.2
智人BCKDHB 5’-UTR
BCKDHB-002 ENST00000369760
智人BCKDHB 5’-UTR
NM_001164783.1
智人BBS2 5’-UTR
NM_031885.3
智人HERC5 5’-UTR
HERC5-001 ENST00000264350
智人FAM175A 5’-UTR
NM_139076.2
智人NT5DC1 5’-UTR
NT5DC1-002 ENST00000319550
智人RAB7A 5’-UTR
RAB7A-001 ENST00000265062
智人AGA 5’-UTR
AGA-001 ENST00000264595
智人TPK1 5’-UTR
TPK1-001 ENST00000360057
智人MBNL3 5’-UTR
MBNL3-001 ENST00000370839
智人MCCC2 5’-UTR
MCCC2-001 ENST00000340941
智人CAT 5’-UTR
CAT-001 ENST00000241052
智人ANAPC4 5’-UTR
ANAPC4-001 ENST00000315368
智人PHKB 5’-UTR
PHKB-002 ENST00000323584
智人ABCB7 5’-UTR
ABCB7-001 ENST00000253577
智人GPD2 5’-UTR
GPD2-002 ENST00000438166
智人TMEM38B 5’-UTR
TMEM38B-001 ENST00000374692
智人NFU1 5’-UTR
NM_001002755.2
智人LOC128322/NUTF2 5’-UTR
NM_005796.1
智人NUBPL 5’-UTR
NM_025152.2
智人LANCL1 5’-UTR
LANCL1-004 ENST00000233714
智人PIR 5’-UTR
PIR-002 ENST00000380420
智人CTBS 5’-UTR
NM_004388.2
智人GSTM4 5’-UTR
NM_000850.4
小家鼠Ndufa1 5’-UTR
Ndufa1-001 ENSMUST00000016571
小家鼠Atp5e 5’-UTR
NM_025983
小家鼠Gstm5 5’-UTR
NM_010360
小家鼠Cbr2 5’-UTR
NM_007621
小家鼠Anapc13 5’-UTR
NM_181394
小家鼠Ndufa7 5’-UTR
NM_023202
TCGGAGCGGAAGGAAT
(SEQ ID NO:364)
小家鼠Atp5k 5’-UTR
NM_007507
小家鼠Cox4i1 5’-UTR
NM_009941
小家鼠Ndufs6 5’-UTR
NM_010888
小家鼠Sec61b 5’-UTR
NM_024171
小家鼠Snrpd2 5’-UTR
NM_026943
小家鼠Mgst3 5’-UTR
NM_025569
小家鼠Mp68(2010107E04Rik)5’-UTR
NM_027360
小家鼠Prdx4-001,5’-UTR
NM_016764
小家鼠Pgcp 5’-UTR
NM_176073
小家鼠Myeov2 5’-UTR
NM_001163425
小家鼠Ndufa4 5’-UTR
NM_010886
小家鼠Ndufs5 5’-UTR
NM_001030274
小家鼠Gstm1 5’-UTR
NM_010358
小家鼠Atp5o 5’-UTR
NM_138597
小家鼠Tspo 5’-UTR
NM_009775
小家鼠Taldo1 5’-UTR
NM_011528
小家鼠Bloc1s1 5’-UTR
NM_015740
小家鼠Hexa 5’-UTR
NM_010421
优选地,根据本发明的人工核酸分子的至少一个3’-UTR元件包含这样的核酸序列或由这样的核酸序列组成,所述核酸序列与选自由以下各项组成的组的基因的转录本的3’-UTR序列具有至少约40%,优选至少约50%,优选至少约60%,优选至少约70%,更优选至少约80%,更优选至少约 90%,甚至更优选至少约95%,甚至更优选至少约99%,最优选100%的同一性:GNAS(鸟嘌呤核苷酸结合蛋白,α刺激复合基因座),MORN2(含有MORN重复2),GSTM1(谷胱甘肽S-转移酶,μ1),NDUFA1(NADH脱氢酶(泛醌)1α亚复合体),CBR2(羰基还原酶2),Ybx1(Y-Box结合蛋白1),Ndufb8(NADH脱氢酶(泛醌)1β亚复合体8),和CNTN1(接触蛋白1;其中CNTN1-004是特别优选的)。最优选地,根据本发明的人工核酸分子的至少一个3’-UTR元件这样的核酸序列包含或由这样的核酸序列组成,所述核酸序列与分别选自由SEQ ID NO:1至SEQ ID NO:24,或相应RNA序列组成的组的序列具有至少约40%,优选至少约50%,优选至少约60%,优选至少约70%,更优选至少约80%,更优选至少约90%,甚至更优选至少约95%,甚至更优选至少约99%,最优选100%的同一性:
SEQ ID NO:1
(小家鼠GNAS 3’-UTR)
SEQ ID NO:2
(小家鼠GNAS 3’-UTR)
SEQ ID NO:3
(智人GNAS 3’-UTR)
SEQ ID NO:4
(智人GNAS 3’-UTR)
SEQ ID NO:5
(小家鼠MORN2 3’-UTR)
SEQ ID NO:6
(小家鼠MORN2 3’-UTR)
SEQ ID NO:7
(智人MORN2 3’-UTR)
SEQ ID NO:8
(小家鼠GSTM1 3’-UTR)
SEQ ID NO:9
(小家鼠GSTM1 3’-UTR)
SEQ ID NO:10
(智人GSTM1 3’-UTR)
SEQ ID NO:11
(小家鼠NDUFA1 3’-UTR)
SEQ ID NO:12
(智人NDUFA1 3’-UTR)
SEQ ID NO:13
(小家鼠CBR2 3’-UTR)
SEQ ID NO:14
(小家鼠YBX1 3’-UTR)
SEQ ID NO:15
(小家鼠YBX1 3’-UTR)
SEQ ID NO:16
(智人YBX1 3’-UTR)
SEQ ID NO:17
(小家鼠Ndufb8 3’-UTR)
SEQ ID NO:18
(智人Ndufb8 3’-UTR)
SEQ ID NO:19
(智人Ndufb8 3’-UTR)
SEQ ID NO:20
(智人CNTN1-004 3’-UTR)
SEQ ID NO:21
(智人CNTN1-004 3’-UTR)
SEQ ID NO:22
(智人CNTN1-004 3’-UTR)
SEQ ID NO:23
(智人CNTN1-004 3’-UTR)
SEQ ID NO:24
(智人CNTN1-004 3’-UTR)
优选地,根据本发明的人工核酸分子的至少一个5’-UTR元件包含这样的核酸序列或由这样的核酸序列组成,所述核酸序列与MP68(RIKEN cDNA 2010107E04基因),或NDUFA4(NADH脱氢酶(泛醌)1α亚复合体4)的转录本的5’-UTR序列具有至少约40%,优选至少约50%,优选至少约60%,优选至少约70%,更优选至少约80%,更优选至少约90%,甚至更优选至少约95%,甚至更优选至少约99%,最优选100%的同一性。最优选地,根据本发明的人工核酸分子的至少一个5’-UTR元件包含这样的核酸序列或由这样的核酸序列组成,所述核酸序列根据SEQ ID NO:25 或SEQ ID NO:30的序列,或相应RNA序列,分别具有至少约40%,优选至少约50%,优选至少约60%,优选至少约70%,更优选至少约80%,更优选至少约90%,甚至更优选至少约95%,甚至更优选至少约99%,最优选100%的同一性:
SEQ ID NO:25
(小家鼠MP68 5’-UTR)
SEQ ID NO:26
(智人MP68 5’-UTR)
SEQ ID NO:27
(智人MP68 5’-UTR)
SEQ ID NO:28
(小家鼠NDUFA4 5’-UTR)
SEQ ID NO:29
(智人NDUFA4 5’-UTR)
SEQ ID NO:30
(智人NDUFA4 5’-UTR)
根据本发明的人工核酸分子的至少一个3’-UTR元件还可以包含这样的核酸序列的片段或由这样的核酸序列的片段组成,所述核酸序列的片段与基因的转录本的3’-UTR的核酸序列,如与根据SEQ ID NOs:1至24 和SEQ ID NOs:49至318的序列的3’-UTR具有至少约40%,优选至少约50%,优选至少约60%,优选至少约70%,更优选至少约80%,更优选至少约90%,甚至更优选至少约95%,甚至更优选至少约99%,最优选100%的同一性,其中所述片段优选是如上文所述的功能性片段或功能性变体片段。所述片段优选呈现至少约3个核苷酸,优选至少约5个核苷酸,更优选至少约10,15,20,25或30个核苷酸,甚至更优选至少约50个核苷酸,最优选至少约70个核苷酸的长度。在优选的实施方案中,其片段或变体呈现3至约500个核苷酸之间,优选5至约150个核苷酸之间,更优选10至100个核苷酸之间,甚至更优选15至90个之间,最优选20 至70个之间的长度。优选地,所述变体,片段或变体片段是3’-UTR的功能性变体,功能性片段,或功能性变体片段,以使由包含选自由SEQ ID NO: 1至SEQ ID NO:24组成的组的核酸序列的人工核酸分子呈现的蛋白生产延长至少30%的效率,优选至少40%,更优选至少50%,更优选至少60%,甚至更优选至少70%,甚至更优选至少80%,最优选至少90%的效率延长从根据本发明的人工核酸分子的蛋白生产。
根据本发明的人工核酸分子的至少一个5’-UTR元件还可以包含这样的核酸序列的片段或由这样的核酸序列的片段组成,所述核酸序列的片段与基因的转录本的5’-UTR的核酸序列,如与根据SEQ ID NO:25或SEQ ID NO:30和SEQ ID NOs:319至382的序列的5’-UTR具有至少约40%,优选至少约50%,优选至少约60%,优选至少约70%,更优选至少约80%,更优选至少约90%,甚至更优选至少约95%,甚至更优选至少约99%,最优选100%的同一性,其中所述片段优选是如上文所述的功能性片段或功能性变体片段。所述片段优选呈现至少约3个核苷酸,优选至少约5个核苷酸,更优选至少约10,15,20,25或30个核苷酸,甚至更优选至少约 50个核苷酸,最优选至少约70个核苷酸的长度。在优选的实施方案中,片段或其变体呈现3至约500个核苷酸之间,优选5至约150个核苷酸之间,更优选10至100个核苷酸之间,甚至更优选15至90个之间,最优选20至70个之间的长度。优选地,所述变体,片段或变体片段是5’-UTR 的功能性变体,功能性片段或功能性变体片段,以使包含选自由SEQ ID NO:25至SEQ ID NO:30组成的组的核酸序列的人工核酸分子呈现的蛋白生产效率增加至少30%的效率,优选以至少40%,更优选至少50%,更优选至少60%,甚至更优选至少70%,甚至更优选至少80%,最优选至少 90%的效率增加从根据本发明的人工核酸分子的蛋白生产。
优选地,根据本发明的人工核酸分子的所述至少一个3’-UTR元件和/ 或所述至少一个5’-UTR元件呈现至少约3个核苷酸,优选至少约5个核苷酸,更优选至少约10,15,20,25或30个核苷酸,甚至更优选至少约 50个核苷酸,最优选至少约70个核苷酸的长度。所述至少一个3’-UTR 元件和/或所述至少一个5’-UTR元件的长度上限可以是500个核苷酸或更少,例如400,300,200,150或100个核苷酸。对于其他实施方案,上限可以在50至100个核苷酸的范围内选择。例如,其片段或变体可以呈现3至约500个核苷酸之间,优选5至约150个核苷酸之间,更优选10 至100个核苷酸之间,甚至更优选15至90个之间,最优选20至70个之间的长度。
此外,根据本发明的人工核酸分子可以包含多于一个3’-UTR元件和/ 或多于一个5’-UTR元件(如上文所述的)。例如,根据本发明的人工核酸分子可以包含一个、两个、三个、四个或更多个3’-UTR元件,和/或一个、两个、三个、四个或更多个5’-UTR元件,其中个体3’-UTR元件可以相同或它们可以不同,并且类似地,个体5’-UTR元件可以相同或它们可以不同。例如,根据本发明的人工核酸分子可以包含两个基本上相同的如上文所述的3’-UTR元件,例如两个3’-UTR元件包含这样的核酸序列的或由这样的核酸序列的组成,所述核酸序列源自基因的转录本的3’-UTR,如源自根据SEQ ID NOs:1至24和SEQ ID NO:49至318的序列,或源自如上文所述的基因的转录本的3’-UTR的片段或变体,其功能性变体,其功能性片段,或其功能性变体片段。因此,例如,根据本发明的人工核酸分子可以包含两个基本上相同的如上文所述的5’-UTR元件,例如两个包含这样的核酸序列或由这样的核酸序列组成的5’-UTR元件,所述核酸序列源自基因的转录本的5’-UTR,如源自根据SEQ ID NOs:25至30和SEQ ID NO:319至382的序列,或源自基因的转录本的5’-UTR的片段或变体,其功能性变体,其功能性片段,或其功能性变体片段,如上文所述。
出人意料地,本发明人发现包含如上文所述的3’-UTR元件和/或如上文所述的5’-UTR元件的人工核酸分子可以表示或可以提供mRNA分子,所述mRNA分子允许增加的,延长的和/或稳定化的蛋白生产。由此,本文中所述的3’-UTR元件和/或本文中所述的5’-UTR元件可以改善从mRNA分子的蛋白表达的稳定性和/或改善翻译效率。
尤其是,根据本发明的人工核酸分子可以包含(i)延长和/或增加蛋白生产的至少一个3’-UTR元件和至少一个5’-UTR元件;(ii)延长和/或增加蛋白生产的至少一个3’-UTR元件,但没有延长和/或增加蛋白生产的 5’-UTR元件;或(iii)延长和/或增加蛋白生产的至少一个5’-UTR元件,但没有延长和/或增加蛋白生产的3’-UTR元件。
然而,尤其是在情况(ii)和(iii)中,但可能也在情况(i)中,根据本发明的人工核酸分子还可以包含一个或多个“其他3’-UTR元件和/或5’-UTR元件”,即不满足如上文所述的需要的3’-UTR元件和/或5’-UTR元件。例如,包含根据本发明的3’-UTR元件(即延长和/或增加从所述人工核酸分子的蛋白生产的3’-UTR元件)的根据本发明的人工核酸分子,可以另外包含任意另外的3’-UTR和/或任意另外的5’-UTR,尤其是另外的5’-UTR,例如5’-TOPUTR,或任意其他5’-UTR或5’-UTR元件。类似地,例如,包含根据本发明5’-UTR元件(即延长和/或增加从所述人工核酸分子的蛋白生产的5’-UTR元件)的根据本发明的人工核酸分子,可以另外包含任意另外的3’-UTR和/或任意另外的5’-UTR,尤其是另外的3’-UTR,例如源自白蛋白基因的3’-UTR的3’-UTR,特别优选包含根据SEQ ID NO.31或 32,尤其是根据SEQ IDNO.32的序列的3’-UTR,或任意其他3’-UTR或 3’-UTR元件。
如果除了延长和/或增加蛋白生产的本发明的至少一个5’-UTR元件和/ 或本发明的至少一个3’-UTR元件以外,另外的3’-UTR(元件)和/或另外的 5’-UTR(元件)存在于根据本发明的人工核酸分子中,则所述另外的 5’-UTR(元件)和/或所述另外的3’-UTR(元件)可以与本发明的3’-UTR元件和/或本发明的5’-UTR元件相互作用,并且,由此,分别支持本发明的 3’-UTR元件和/或本发明的5’-UTR元件的增加和/或延长效果。所述另外的3’-UTR和/或5’-UTR(元件)可以进一步支持稳定性和翻译效率。此外,如果二者(本发明的3’-UTR元件和本发明的5’-UTR元件)都存在于根据本发明的人工核酸分子中,本发明的5’-UTR元件和本发明的3’-UTR元件的延长和/或增加效果优选以协同的方式导致增强的和延长的蛋白生产。
优选地,所述另外的3’-UTR包含这样的核酸序列或由这样的核酸序列组成,所述核酸序列源自选自由以下各项组成的组的基因的3’-UTR:白蛋白基因,α-球蛋白基因,β-球蛋白基因,酪氨酸羟化酶基因,脂氧化酶基因,和胶原蛋白α基因,如胶原蛋白α1(I)基因,或源自选自由以下各项组成的组的基因的3’-UTR的变体:白蛋白基因,α-球蛋白基因,β- 球蛋白基因,酪氨酸羟化酶基因,脂氧化酶基因,和胶原蛋白α基因,如胶原蛋白α1(I)基因,上述基因是根据专利申请WO2013/143700的SEQ ID No.1369-1390,专利申请WO2013/143700的公开内容通过引用结合于本文。在特别优选的实施方案中,所述另外的3’-UTR包含源自白蛋白基因,优选脊椎动物白蛋白基因,更优选哺乳动物白蛋白基因,最优选根据SEQ IDNO.31的人白蛋白基因的3’-UTR的核酸序列或由源自白蛋白基因,优选脊椎动物白蛋白基因,更优选哺乳动物白蛋白基因,最优选根据SEQ ID NO.31的人白蛋白基因的3’-UTR的核酸序列组成:
SEQ ID NO.31:
(人白蛋白3’-UTR;对应于专利申请WO2013/143700的SEQ ID No:1369)
在该情况下特别优选的是,本发明的核酸分子包含源自根据专利申请 WO2013/143700的SEQ ID No.1369-1390的核酸或其片段,同源物或变体的另外的3’-UTR元件。
最优选所述另外的3’-UTR包含源自根据SEQ ID NO.32的人白蛋白基因的片段的核酸序列:
SEQ ID NO.32:
(白蛋白7 3’-UTR;对应于专利申请WO2013/143700的SEQ ID No: 1376)
在该情况下特别优选的是,本发明的人工核酸分子的所述另外的3’-UTR包含根据SEQ ID NO.32的核酸序列,或相应的RNA序列或由根据SEQ ID NO.32的核酸序列,或相应的RNA序列组成。
所述另外的3’-UTR还可以包含这样的核酸序列或由这样的核酸序列组成,所述核酸序列源自核糖体蛋白编码基因,其中另外的3’-UTR可以来源于的核糖体蛋白编码基因包括,但不限于,核糖体蛋白L9(RPL9),核糖体蛋白L3(RPL3),核糖体蛋白L4(RPL4),核糖体蛋白L5(RPL5),核糖体蛋白L6(RPL6),核糖体蛋白L7(RPL7),核糖体蛋白L7a(RPL7A),核糖体蛋白L11(RPL11),核糖体蛋白L12(RPL12),核糖体蛋白L13 (RPL13),核糖体蛋白L23(RPL23),核糖体蛋白L18(RPL18),核糖体蛋白L18a(RPL18A),核糖体蛋白L19(RPL19),核糖体蛋白L21(RPL21),核糖体蛋白L22(RPL22),核糖体蛋白L23a(RPL23A),核糖体蛋白L17(RPL17),核糖体蛋白L24(RPL24),核糖体蛋白L26(RPL26),核糖体蛋白L27(RPL27),核糖体蛋白L30(RPL30),核糖体蛋白L27a(RPL27A),核糖体蛋白L28(RPL28),核糖体蛋白L29(RPL29),核糖体蛋白L31 (RPL31),核糖体蛋白L32(RPL32),核糖体蛋白L35a(RPL35A),核糖体蛋白L37(RPL37),核糖体蛋白L37a(RPL37A),核糖体蛋白L38(RPL38),核糖体蛋白L39(RPL39),核糖体蛋白,大,P0(RPLP0),核糖体蛋白,大,P1(RPLP1),核糖体蛋白,大,P2(RPLP2),核糖体蛋白S3(RPS3),核糖体蛋白S3A(RPS3A),核糖体蛋白S4,X-连接的(RPS4X),核糖体蛋白S4,Y-连接的1(RPS4Y1),核糖体蛋白S5(RPS5),核糖体蛋白S6 (RPS6),核糖体蛋白S7(RPS7),核糖体蛋白S8(RPS8),核糖体蛋白S9 (RPS9),核糖体蛋白S10(RPS10),核糖体蛋白S11(RPS11),核糖体蛋白S12(RPS12),核糖体蛋白S13(RPS13),核糖体蛋白S15(RPS15),核糖体蛋白S15a(RPS15A),核糖体蛋白S16(RPS16),核糖体蛋白S19 (RPS19),核糖体蛋白S20(RPS20),核糖体蛋白S21(RPS21),核糖体蛋白S23(RPS23),核糖体蛋白S25(RPS25),核糖体蛋白S26(RPS26),核糖体蛋白S27(RPS27),核糖体蛋白S27a(RPS27a),核糖体蛋白S28 (RPS28),核糖体蛋白S29(RPS29),核糖体蛋白L15(RPL15),核糖体蛋白S2(RPS2),核糖体蛋白L14(RPL14),核糖体蛋白S14(RPS14),核糖体蛋白L10(RPL10),核糖体蛋白L10a(RPL10A),核糖体蛋白L35 (RPL35),核糖体蛋白L13a(RPL13A),核糖体蛋白L36(RPL36),核糖体蛋白L36a(RPL36A),核糖体蛋白L41(RPL41),核糖体蛋白S18(RPS18),核糖体蛋白S24(RPS24),核糖体蛋白L8(RPL8),核糖体蛋白L34(RPL34),核糖体蛋白S17(RPS17),核糖体蛋白SA(RPSA),泛素A-52残基核糖体蛋白融合产物1(UBA52),普遍表达的Finkel-Biskis-Reilly鼠肉瘤病毒 (FBR-MuSV)(FAU),核糖体蛋白L22-样1(RPL22L1),核糖体蛋白S17 (RPS17),核糖体蛋白L39-样(RPL39L),核糖体蛋白L10-样(RPL10L),核糖体蛋白L36a-样(RPL36AL),核糖体蛋白L3-样(RPL3L),核糖体蛋白S27-样(RPS27L),核糖体蛋白L26-样1(RPL26L1),核糖体蛋白L7- 样1(RPL7L1),核糖体蛋白L13a假基因(RPL13AP),核糖体蛋白L37a 假基因8(RPL37AP8),核糖体蛋白S10假基因5(RPS10P5),核糖体蛋白S26假基因11(RPS26P11),核糖体蛋白L39假基因5(RPL39P5),核糖体蛋白,大,P0假基因6(RPLPOP6)和核糖体蛋白L36假基因14 (RPL36P14)。
优选地,所述另外的5’-UTR包含这样的核酸序列或由这样的核酸序列组成,所述核酸序列源自TOP基因的5’-UTR或源自TOP基因的5’-UTR 的片段,同系物或变体。
特别优选的是,5’-UTR元件不包含如上文所定义的TOP-基序或5’TOP。尤其是,优选的是TOP基因的5’-UTR是缺乏TOP基序的TOP基因的 5’-UTR。
源自TOP基因的5’-UTR的核酸序列源自真核TOP基因,优选植物或动物TOP基因,更优选脊索动物TOP基因,甚至更优选脊椎动物TOP 基因,最优选哺乳动物TOP基因,如人TOP基因。
例如,所述另外的5’-UTR优选选自包含这样的核酸序列或由这样的核酸序列组成的5’-UTR元件,所述核酸序列源自选自由以下各项组成的组的核酸序列:专利申请WO2013/143700(其公开内容通过引用结合于本文)的SEQ ID NOs.1-1363,SEQ ID NO.1395,SEQ IDNO.1421和SEQ ID NO.1422,专利申请WO2013/143700的SEQ ID NOs.1-1363,SEQ IDNO.1395,SEQ ID NO.1421和SEQ ID NO.1422的同系物,其变体,或相应RNA序列。术语“专利申请WO2013/143700的SEQ ID NOs.1-1363,SEQ ID NO.1395,SEQ ID NO.1421和SEQ IDNO.1422的同系物”是指与根据专利申请WO2013/143700的SEQ ID NOs.1-1363,SEQ IDNO.1395, SEQ ID NO.1421和SEQ ID NO.1422的序列同源的除智人之外的其他物种的序列。
在优选的实施方案中,所述另外的5’-UTR包含这样的核酸序列或由这样的核酸序列组成,所述核酸序列源自选自专利申请WO2013/143700 的SEQ ID NOs.1-1363,SEQ IDNO.1395,SEQ ID NO.1421和SEQ ID NO. 1422,专利申请WO2013/143700的SEQ ID NOs.1-1363,SEQ ID NO.1395, SEQ ID NO.1421和SEQ ID NO.1422的同系物,其变体,或相应RNA序列的核酸序列的从核苷酸位置5(即位于序列中位置5的核苷酸)延伸到紧接起始密码子(位于序列的3’末端)的5’的核苷酸位置,例如紧接ATG序列的5’的核苷酸位置的核酸序列。特别优选的是,所述另外的5’-UTR源自选自专利申请WO2013/143700的SEQ ID NOs.1-1363,SEQ ID NO.1395, SEQ ID NO.1421和SEQ ID NO.1422,专利申请WO2013/143700的SEQ ID NOs.1-1363,SEQ ID NO.1395,SEQ ID NO.1421和SEQ ID NO.1422 的同系物,其变体,或相应RNA序列的核酸序列的从紧接5’TOP的3’的核苷酸位置延伸到紧接起始密码子的5’的核苷酸位置(位于序列的3’末端),例如紧接ATG序列的5’的核苷酸位置的核酸序列。
在特别是优选的实施方案中,所述另外的5’-UTR包含这样的核酸序列或由这样的核酸序列组成,所述核酸序列源自编码核糖体蛋白的TOP 基因的5’-UTR或编码核糖体蛋白的TOP基因的5’-UTR的变体。例如,所述5’-UTR元件包含这样的核酸序列或由这样的核酸序列组成,所述核酸序列源自根据专利申请WO2013/143700的SEQ ID NOs:170,232,244,259,1284,1285,1286,1287,1288,1289,1290,1291,1292,1293, 1294,1295,1296,1297,1298,1299,1300,1301,1302,1303,1304, 1305,1306,1307,1308,1309,1310,1311,1312,1313,1314,1315, 1316,1317,1318,1319,1320,1321,1322,1323,1324,1325,1326, 1327,1328,1329,1330,1331,1332,1333,1334,1335,1336,1337, 1338,1339,1340,1341,1342,1343,1344,1346,1347,1348,1349, 1350,1351,1352,1353,1354,1355,1356,1357,1358,1359,或1360 中的任一个的核酸序列的5’-UTR,相应RNA序列,其同系物,或其变体,如上文所述,优选缺少5’-TOP基序。如上文所述的,从位置5延伸至紧接ATG的5’的核苷酸(其位于序列的3’末端)的序列对应于所述序列的 5’-UTR。
优选地,所述另外的5’-UTR包含这样的核酸序列或由这样的核酸序列组成,所述核酸序列源自编码核糖体大蛋白(RPL)的TOP基因的 5’-UTR或编码核糖体大蛋白(RPL)的TOP基因的5’-UTR的同系物或变体。例如,5’-UTR元件包含这样的核酸序列或由这样的核酸序列组成,所述核酸序列源自根据专利申请WO2013/143700的SEQ ID NOs:SEQ ID NOs:67,259,1284-1318,1344,1346,1348-1354,1357,1358,1421 和1422中的任一个的核酸序列的5’-UTR,相应RNA序列,其同系物,或其变体,如上文所述,优选缺少5’TOP基序。
在特别优选的实施方案中,5’-UTR元件包含这样的核酸序列或由这样的核酸序列组成,所述核酸序列源自核糖体蛋白大32基因的5’-UTR的,优选源自脊椎动物核糖体蛋白大32(L32)基因,更优选源自哺乳动物核糖体蛋白大32(L32)基因,最优选源自人核糖体蛋白大32(L32)基因,或源自核糖体蛋白大32基因的5’-UTR的变体,优选源自脊椎动物核糖体蛋白大32(L32)基因,更优选源自哺乳动物核糖体蛋白大32(L32)基因,最优选源自人核糖体蛋白大32(L32)基因,其中优选所述另外的 5’-UTR不包含所述基因的5’TOP。
因此,在特别是优选的实施方案中,所述另外的5’-UTR包含这样的核酸序列或由这样的核酸序列组成,所述核酸序列与根据SEQ ID NO.33 (缺少5’末端寡嘧啶束的人核糖体蛋白大32的5’-UTR: GGCGCTGCCTACGGAGGTGGCAGCCATCTCCTTCTCGGCATC(SEQ ID NO.33);对应于专利申请WO2013/143700的SEQ ID NO.1368)的核酸序列或优选相应RNA序列具有至少约40%,优选至少约50%,优选至少约60%,优选至少约70%,更优选至少约80%,更优选至少约90%,甚至更优选至少约95%,甚至更优选至少约99%同一性,或其中所述另外的5’-UTR包含这样的核酸序列的片段或由这样的核酸序列的片段组成,所述核酸序列的片段与根据SEQ ID NO.33的核酸序列或更优选相应RNA 序列具有至少约40%,优选至少约50%,优选至少约60%,优选至少约 70%,更优选至少约80%,更优选至少约90%,甚至更优选至少约95%,甚至更优选至少约99%的同一性,其中,优选地,所述片段如上文所述,即是代表全长5’-UTR的至少20%等的一段连续的核苷酸。优选地,所述片段呈现至少约20个核苷酸或更多,优选至少约30个核苷酸或更多,更优选至少约40个核苷酸或更多的长度。优选地,所述片段是本文所述的功能性片段。
在一些实施方案中,人工核酸分子包含另外的5’-UTR,其包含这样的核酸序列或由这样的核酸序列组成,所述核酸序列源自选自以下的脊椎动物TOP基因,如哺乳动物,例如人TOP基因的5’-UTR:RPSA,RPS2, RPS3,RPS3A,RPS4,RPS5,RPS6,RPS7,RPS8,RPS9,RPS10,RPS11, RPS12,RPS13,RPS14,RPS15,RPS15A,RPS16,RPS17,RPS18,RPS19, RPS20,RPS21,RPS23,RPS24,RPS25,RPS26,RPS27,RPS27A,RPS28, RPS29,RPS30,RPL3,RPL4,RPL5,RPL6,RPL7,RPL7A,RPL8, RPL9,RPL10,RPL10A,RPL11,RPL12,RPL13,RPL13A,RPL14,RPL15,RPL17,RPL18,RPL18A,RPL19,RPL21,RPL22,RPL23, RPL23A,RPL24,RPL26,RPL27,RPL27A,RPL28,RPL29,RPL30, RPL31,RPL32,RPL34,RPL35,RPL35A,RPL36,RPL36A,RPL37,RPL37A,RPL38,RPL39,RPL40,RPL41,RPLP0,RPLP1,RPLP2, RPLP3,RPLP0,RPLP1,RPLP2,EEF1A1,EEF1B2,EEF1D,EEF1G, EEF2,EIF3E,EIF3F,EIF3H,EIF2S3,EIF3C,EIF3K,EIF3EIP,EIF4A2, PABPCI,HNRNPA1,TPT1,TUBB1,UBA52,NPM1,ATP5G2,GNB2L1, NME2,UQCRB或其同系物或变体,其中优选所述另外的5’-UTR不包含 TOP-基序或所述基因的5’TOP,并且其中任选地所述另外的5’-UTR在其 5’-末端以位于5’末端寡嘧啶束(TOP)下游位置1,2,3,4,5,6,7,8, 9或10处的核苷酸起始并且其中进一步任选地,所述源自TOP基因的 5’-UTR的另外的5’-UTR在其3’-末端以位于其所来源于的基因的起始密码子(A(U/T)G)的上游位置1,2,3,4,5,6,7,8,9或10处的核苷酸终止。
根据本发明的人工核酸分子可以是RNA,如mRNA或病毒RNA或复制子,DNA,如DNA质粒或病毒DNA,或可以是修饰的RNA或DNA 分子。其可以提供为具有正义链和反义链的双链分子,例如,为具有正义链和反义链的DNA分子。
根据本发明的人工核酸分子还可以包含任选地5’-帽。任选的5’-帽优选位于ORF的5’,更优选根据本发明的人工核酸分子内的至少一个 5’-UTR或任意另外的5’-UTR的5’。
优选地,根据本发明的人工核酸分子还包含聚腺苷酸序列和/或聚腺苷酸化信号。优选地,任选的聚腺苷酸序列位于至少一个3’-UTR元件或任意另外的3’-UTR的3’,更优选任选的聚腺苷酸序列与3’-UTR元件的3’- 末端连接。连接可以是直接或间接的,例如,通过一段2,4,6,8,10, 20等的核苷酸,如通过例如包含一个以上限制性位点或由一个以上限制性位点组成的1-50,优选1-20个核苷酸的接头。然而,即使根据本发明的人工核酸分子不包含3’-UTR,例如如果其仅包含至少一个5’-UTR元件,其优选仍然包含聚腺苷酸序列和/或聚腺苷酸化信号。
在一个实施方案中,所述任选的聚腺苷酸化信号位于3'UTR元件的 3'的下游。优选地,所述聚腺苷酸化信号包含共有序列NN(U/T)ANA,其中N=A或U,优选AA(U/T)AAA或A(U/T)(U/T)AAA。此种共有序列可以被多数动物和细菌细胞系统,例如被聚腺苷酸化因子,如与CstF,PAP, PAB2,CFI和/或CFII配合的切割/聚腺苷酸化特异性因子(CPSF)识别。优选地,所述聚腺苷酸化信号,优选所述共有序列NNUANA,位于3'-UTR 元件或ORF(如果不存在3’-UTR元件)的3'末端下游少于约50个碱基,更优选少于约30个碱基,最优选少于约25个碱基,例如21个碱基处。
根据本发明的人工核酸分子,例如在3’-UTR元件或ORF的下游包含聚腺苷酸化信号的人工DNA分子的转录将产生在其3’-UTR元件或ORF 的下游包含聚腺苷酸化信号的成熟前-RNA。
随后使用合适的转录系统将导致聚腺苷酸序列附着于成熟前-RNA。例如,本发明的人工核酸分子可以是包含如上文描述的3'-UTR元件和聚腺苷酸化信号的DNA分子,其可以导致该DNA分子转录后RNA的聚腺苷酸化。因此,产生的RNA可以包含本发明的3'-UTR元件接着聚腺苷酸序列的组合。
可能的转录系统是体外转录系统或细胞转录系统等。因此,根据本发明的人工核酸分子的转录,例如包含可读框、3'-UTR元件和/或5'-UTR元件和任选地聚腺苷酸化信号的人工核酸分子的转录,可以产生包含可读框、 3'-UTR元件和任选地聚腺苷酸序列的mRNA分子。
因此,本发明还提供人工核酸分子,其是包含可读框,如上文所述的 3’-UTR元件和/或如上文所述的5’-UTR元件和任选地聚腺苷酸序列的 mRNA分子。
在另一实施方案中,根据本发明的人工核酸分子的3’-UTR不包含聚腺苷酸化信号或聚腺苷酸序列。还优选地,根据本发明的人工核酸分子不包含聚腺苷酸化信号或聚腺苷酸序列。更优选地,人工核酸分子的3’-UTR 本身,或同样地本发明的人工核酸分子,不包含聚腺苷酸化信号,尤其是其不包含聚腺苷酸化信号AAU/TAAA。
在优选的实施方案中,本发明提供人工核酸分子,其是人工RNA分子,包含可读框和与选自由根据SEQ ID NOs:1至30的序列组成的组,优选选自由根据SEQ ID NO.1,SEQ IDNO.5,SEQ ID NO.8, SEQ ID NO.11,SEQ ID NO.13,SEQ ID NO.14,SEQ ID NO.17, SEQ IDNO.20,SEQ ID NO.25和SEQ ID NO.28的序列或与SEQ ID NOs: 1至30,优选与SEQ IDNO.1,SEQ ID NO.5,SEQ ID NO.8, SEQ ID NO.11,SEQ ID NO.13,SEQ ID NO.14,SEQ IDNO.17, SEQ ID NO.20,SEQ ID NO.25和SEQ ID NO.28具有至少约40%或更多的同一性的序列组成的组的DNA序列对应的RNA序列,或其片段(如上文所述)。此外,提供相应人工DNA分子。
在另一优选的实施方案中,本发明提供人工核酸分子,其是人工DNA 分子,其包含可读框和选自由根据SEQ ID NOs:1至30的序列组成的组,优选选自由根据SEQ ID NO.1,SEQ ID NO.5,SEQ ID NO.8, SEQ ID NO.11,SEQ ID NO.13,SEQ ID NO.14,SEQ ID NO.17,SEQ ID NO.20,SEQ ID NO.25和SEQ ID NO.28的序列,或与SEQ ID NOs:1至30,优选与SEQID NO.1,SEQ ID NO.5,SEQ ID NO.8, SEQ ID NO.11,SEQ ID NO.13,SEQ ID NO.14,SEQID NO.17, SEQ ID NO.20,SEQ ID NO.25和SEQ ID NO.28具有至少约40%或更多的同一性的序列组成的组的序列。
因此,本发明提供一种人工核酸分子,所述人工核酸分子可以用作 RNA分子的,优选mRNA分子的模板,其就翻译效率而言是稳定化和优化的。换句话说,所述人工核酸分子可以是可以用作模板用于生产mRNA 的DNA。可获得的mRNA可以相应被翻译以生产由可读框编码的所需肽或蛋白。如果所述人工核酸分子是DNA,则其可以例如用作双链储存形式以连续和重复地体外或体内生产mRNA。由此,体外尤其是是指(“活”) 细胞和/或组织,包括活受试者的组织。细胞尤其包括细胞系,原代细胞,组织或受试者中的细胞。在具体实施方案中,允许细胞培养的细胞类型可以适于本发明。特别优选的是哺乳动物细胞,例如人细胞和小鼠细胞。在特别优选的实施方案中,使用人细胞系HeLa,和U-937以及小鼠细胞系 NIH3T3,JAWSII和L929。此外原代细胞是特别优选的,在特别优选的实施方案中,可以使用人皮肤成纤维细胞(HDF)。备选地,还可以使用受试者的组织。
在一个实施方案中,根据本发明的人工核酸分子还包含聚腺苷酸序列。例如,包含ORF(任选地接着3’UTR)的DNA分子,可以含有一段在得到的mRNA中可以转录为聚腺苷酸序列的胸腺嘧啶核苷酸。聚腺苷酸序列的长度可以不同。例如,所述聚腺苷酸序列可以具有约20个腺嘌呤核苷酸至高达约300个腺嘌呤核苷酸,优选约40至约200个腺嘌呤核苷酸,更优选从约50至约100个腺嘌呤核苷酸,如约60,70,80,90或100个腺嘌呤核苷酸的长度。最优选地,本发明的核酸包含约60至约70个核苷酸,最优选64个腺嘌呤核苷酸的聚腺苷酸序列。
人工RNA-分子还可以通过在不需要从DNA前体转录的情况下通过化学合成的常规方法体外获得。
在特别是优选的实施方案中,根据本发明的人工核酸分子是RNA分子,优选以5’-至-3’-方向包含可读框,如上文所述的3’-UTR元件和聚腺苷酸序列或以5’-至-3’-方向包含如上文所述的5’-UTR元件,可读框和聚腺苷酸序列的mRNA分子。
在优选的实施方案中,可读框源自与本发明的人工核酸的3’-UTR元件和/或5’-UTR元件源自的基因不同的基因。在一些其他优选的实施方案中,可读框不编码选自由以下各项组成的组的基因:GNAS(鸟嘌呤核苷酸结合蛋白,α刺激复合基因座),MORN2(含有MORN重复2),GSTM1(谷胱甘肽S-转移酶,μ1),NDUFA1(NADH脱氢酶(泛醌)1α亚复合体), CBR2(羰基还原酶2),MP68(RIKEN cDNA 2010107E04基因),NDUFA4 (NADH脱氢酶(泛醌)1α亚复合体4),Ybx1(Y-Box结合蛋白1),Ndufb8 (NADH脱氢酶(泛醌)1β亚复合体8),CNTN1(接触蛋白1),优选 CNTN1-004或其变体,条件是3’-UTR元件和/或5’-UTR元件是选自由根据SEQ IDNO.1至SEQ ID NO.30的序列组成的组的序列。
在优选的实施方案中,ORF不编码人或植物,尤其是拟南芥,核糖体蛋白,尤其是不编码人核糖体蛋白S6(RPS6),人核糖体蛋白L36a-样 (RPL36AL)或拟南芥核糖体蛋白S16(RPS16)。在进一步的优选的实施方案中,可读框(ORF)不编码任何来源的核糖体蛋白S6(RPS6),核糖体蛋白L36a-样(RPL36AL)或核糖体蛋白S16(RPS16)。
在一个实施方案中,本发明提供人工DNA分子,其包含可读框,优选源自与3’-UTR元件和/或5’-UTR元件源自的基因的不同的基因的可读框;3’-UTR元件,所述3’-UTR元件包含这样的序列或由这样的序列组成,所述序列与选自由根据SEQ ID NO.1至24的序列组成的组的DNA序列具有至少约60%,优选至少约70%,更优选至少约80%,更优选至少约90%,甚至更优选至少约95%;甚至更优选至少99%;甚至更优选100%序列同一性,和/或5’-UTR元件,所述5’-UTR元件包含这样的序列或由这样的序列组成,所述序列与选自由根据SEQ ID NO.25至30的序列组成的组的DNA序列具有至少约60%,优选至少约70%,更优选至少约80%,更优选至少约90%,甚至更优选至少约95%;甚至更优选至少99%;甚至更优选100%序列同一性;和聚腺苷酸化信号和/或聚腺苷酸序列。
在进一步的实施方案中,提供组合物,其包含在药用载体中的所述实施方案的多种RNA分子,其中组合物中至少约90%,91%,92%,93%, 94%,95%,96%,97%,98%,99%以上的RNA包含长度差异不超过10 个核苷酸的聚腺苷酸序列。在优选的实施方案中,组合物中至少约90%, 91%,92%,93%,94%,95%,96%,97%,98%,99%以上的RNA包含相同长度的聚腺苷酸序列。在某些实施方案中,聚腺苷酸序列位于RNA 的3’末端,没有位于相对聚腺苷酸序列的3’的其他核苷酸。在更进一步的实施方案中,提供组合物,其包含在药用载体中的所述实施方案的多种 RNA分子,其中所述多种RNA分子包含加帽的和不加帽的RNA。例如,在一些方面,组合物包含多种RNA分子,其中不超过95%,90%,80%, 70%或60%的RNA包含帽,并且其余RNA分子不加帽。
此外,本发明提供人工RNA分子,优选人工mRNA分子或人工病毒 RNA分子,其包含可读框,优选可读框源自与3’-UTR元件和/或5’-UTR 元件源自的基因不同的基因;3’-UTR元件,其包含这样的序列或由这样的序列组成,所述序列与对应于选自由根据SEQ ID NO.1至24的序列组成的组的DNA序列的RNA序列具有至少约60%,优选至少约70%,更优选至少约80%,更优选至少约90%,甚至更优选至少约95%;甚至更优选至少99%;甚至更优选100%序列同一性,和/或5’-UTR元件,其包含或由这样的序列组成,所述序列与对应于选自由根据SEQ ID NO.25至30 的序列组成的组的DNA序列的RNA序列具有至少约60%,优选至少约 70%,更优选至少约80%,更优选至少约90%,甚至更优选至少约95%;甚至更优选至少99%;甚至更优选100%序列同一性;和聚腺苷酸化信号和/或聚腺苷酸序列。
本发明提供人工核酸分子,优选人工mRNA,其可以特征为编码的肽或蛋白的增加的和/或延长的表达。不受任何理论限制,增强的蛋白表达的稳定性和由此延长的蛋白表达可以由根据本发明的人工核酸分子,如人工 mRNA分子的降解的减少导致。因此,本发明的3’-UTR元件和/或本发明的5’-UTR元件可以阻止人工核酸分解和降解。
优选地,人工核酸分子可以另外包含组蛋白茎环。由此,根据本发明的人工核酸分子可以,例如,以5’-至-3’-方向包含ORF,3’-UTR元件,任选的组蛋白茎环序列,任选的聚腺苷酸序列或聚腺苷酸化信号和任选的聚胞苷酸序列或以5’-至-3’-方向包含5’-UTR元件,ORF,任选的组蛋白茎环序列,任选的聚腺苷酸序列或聚腺苷酸化信号和任选的聚胞苷酸序列或以5’-至-3’-方向包含5’-UTR元件,ORF,3’-UTR元件,任选的组蛋白茎环序列,任选的聚腺苷酸序列或聚腺苷酸化信号和任选的聚胞苷酸序列。其还可以以5’-至-3’-方向包含ORF,3’-UTR元件,任选的聚腺苷酸序列,任选的聚胞苷酸序列和任选的组蛋白茎环序列,或以5’-至-3’-方向包含 5’-UTR元件,ORF,任选的聚腺苷酸序列,任选的聚胞苷酸序列和任选的组蛋白茎环序列,或以5’-至-3’-方向包含5’-UTR元件,ORF,3’-UTR 元件,任选的聚腺苷酸序列,任选的聚胞苷酸序列和任选的组蛋白茎环序列。
在优选的实施方案中,根据本发明的人工核酸分子还包含至少一个组蛋白茎环序列。
所述组蛋白茎环序列优选选自组蛋白茎环序列如WO 2012/019780中公开的,其公开内容通过引用结合在本文中。
适于在本发明中使用的组蛋白颈环序列优选选自下式(I)或(II)中的至少一个:
式(I)(不具有茎边界元件的茎环序列):
式(II)(具有茎边界元件的茎环序列):
其中:
其中
茎1和茎2能够彼此碱基配对形成反向互补序列,其中碱基配对可以发生在茎1与茎2之间,例如,通过核苷酸A与U/T或G与C的沃森- 克里克碱基配对或通过非沃森-克里克碱基配对,例如摆动碱基配对,反向沃森-克里克碱基配对,Hoogsteen碱基配对,反向Hoogsteen碱基配对,或者能够彼此碱基配对形成部分反向互补的序列,其中,基于一个茎中的一个或多个碱基在另一个茎的反向互补序列中不具有互补碱基,不完全的碱基配对可以发生在茎1和茎2之间。
根据进一步优选的实施方案,可以根据以下具体式(Ia)或(IIa)中的至少一个选择组蛋白颈环序列:
式(Ia)(不具有茎边界元件的茎环序列):
式(IIa)(具有茎边界元件的茎环序列):
其中:
N,C,G,T和U 如上文定义。
按照第一方面的另一个更特别优选的实施方案,人工核酸分子序列可以包含至少一种按照下述具体的式(Ib)或(IIb)中的至少一个所述的组蛋白茎环序列:
式(Ib)(不具有茎边界元件的茎环序列):
式(IIb)(具有茎边界元件的茎环序列):
其中:N,C,G,T和U 如上文定义。
一个特定的优选的组蛋白颈环序列是根据SEQ ID NO:34:CAAAGGCTCTTTTCAGAGCCACCA的序列或更优选为根据SEQ ID NO: 34的核酸序列的响应RNA序列。
作为实例,单个元件可以以以下顺序存在于人工核酸分子中:
5’-帽-5’-UTR(元件)-ORF-3’-UTR(元件)-组蛋白茎环-聚腺苷酸/聚胞苷酸序列;
5’-帽-5’-UTR(元件)-ORF-3’-UTR(元件)-聚腺苷酸/聚胞苷酸序列-组蛋白茎环;
5’-帽-5’-UTR(元件)-ORF-IRES-ORF-3’-UTR(元件)-组蛋白茎环-聚腺苷酸/聚胞苷酸序列;
5’-帽-5’-UTR(元件)-ORF-IRES-ORF-3’-UTR(元件)-组蛋白茎环-聚腺苷酸/聚胞苷酸序列-聚腺苷酸/聚胞苷酸序列;
5’-帽-5’-UTR(元件)-ORF-IRES-ORF-3’-UTR(元件)-聚腺苷酸/聚胞苷酸序列-组蛋白茎环;
5’-帽-5’-UTR(元件)-ORF-IRES-ORF-3’-UTR(元件)-聚腺苷酸/聚胞苷酸序列-聚腺苷酸/聚胞苷酸序列-组蛋白茎环;
5’-帽-5’-UTR(元件)-ORF-3’-UTR(元件)-聚腺苷酸/聚胞苷酸序列-聚腺苷酸/聚胞苷酸序列;
5’-帽-5’-UTR(元件)-ORF-3’-UTR(元件)-聚腺苷酸/聚胞苷酸序列-聚腺苷酸/聚胞苷酸序列-组蛋白茎环;等。
在一些实施方案中,所述人工核酸分子还包含元件诸如5′帽、聚胞苷酸序列和/或IRES-基序。所述5′帽可以在转录期间或转录后添加于RNA 的5′末端。此外,尤其是如果所述核酸是mRNA的形式或编码mRNA,本发明的人工核酸分子可以被至少10个胞苷,优选至少20个胞苷,更优选至少30个胞苷的序列(所谓的“聚胞苷酸序列”)修饰。尤其是,特别是如果核酸是(m)RNA的形式或编码mRNA,本发明的人工核酸分子可以含有典型地约10至200个胞苷核苷酸,优选约10至100个胞苷核苷酸,更优选约10至70个胞苷核苷酸或甚至更优选约20至50或甚至20至30 个胞苷核苷酸的聚胞苷酸序列。最优选地,本发明的核酸包含30个胞嘧啶的聚胞苷酸序列。由此,优选根据本发明的人工核酸分子,优选在5’- 至-3’方向上,包含如上文所述的至少一个5’-UTR元件,ORF,如上文所述的至少一个3’-UTR元件,聚腺苷酸序列或聚腺苷酸化信号,和聚胞苷酸序列,或在5’-至-3’方向,包含任选地另外的5’-UTR,ORF,如上文所述的至少一个3’-UTR元件,聚腺苷酸序列或聚腺苷酸化信号,和聚胞苷酸序列,或在5’-至-3’方向,包含如上文所述的至少一个5’-UTR元件, ORF,任选地另外的3’-UTR,聚腺苷酸序列或聚腺苷酸化信号,和聚胞苷酸序列。
例如如果所述人工核酸分子编码两个以上肽或蛋白,内部核糖体进入侧(IRES)序列或IRES-基序可以分开一些可读框。如果人工核酸分子是双或多顺反子核酸分子,则IRES-序列可以尤其有用。
此外,所述人工核酸分子可以包含另外的5′-元件,优选启动子,或含启动子的序列。所述启动子可以驱动或调节根据本发明的人工核酸分子,例如根据本发明的人工DNA-分子的转录。
优选地,根据本发明的人工核酸分子,优选所述可读框,是至少部分 G/C修饰的。因此,可以通过修饰所述分子的G(鸟苷)/C(胞苷)含量在热力学上稳定本发明的人工核酸分子。与相应野生型序列的可读框的G/C含量相比,可以优选通过使用遗传密码的简并增加根据本发明的人工核酸分子的可读框的G/C含量。因此,与特定野生型序列的编码氨基酸序列相比,优选不通过G/C修饰来修饰人工核酸分子的编码氨基酸序列。因此,与野生型编码序列相比,编码序列或整个人工核酸分子,例如mRNA的密码子,可以不同,从而在保持翻译的氨基酸序列的同时,他们包括增加的G/C核苷酸量。由于一些密码子编码一个且相同的氨基酸(所谓的遗传密码简并)的事实,易于改变密码子而不改变编码的肽/蛋白序列(所谓的备选密码子使用)。因此,可能具体引入某些密码子(替换各自的编码相同氨基酸的野生型密码子),就受试者中RNA的稳定性和/或密码子使用是更有利的(所谓的密码子优化)。
与其野生型编码区相比,依赖于将由如本文限定的发明的人工核酸分子的编码区编码的氨基酸,对于核酸序列,例如可读框的修饰,存在各种可能性。在由仅含有G或C核苷酸的密码子编码的氨基酸的情况下,不需要密码子修饰。因此,因为不存在A或U/T,对于Pro(CCC或CCG), Arg(CGC或CGG),Ala(GCC或GCG)和Gly(GGC或GGG)的密码子不需要修饰。
相反,含有A和/或U/T核苷酸的密码子可以通过编码相同氨基酸但不含有A和/或U/T的其它密码子的置换被修饰。例如
Pro的密码子可以从CC(U/T)或CCA被修饰为CCC或CCG;
Arg的密码子可以从CG(U/T)或CGA或AGA或AGG被修饰为CGC 或CGG;
Ala的密码子可以从GC(U/T)或GCA被修饰为GCC或GCG;
Gly的密码子可以从GG(U/T)或GGA被修饰为GGC或GGG。
在其它情况下,尽管A或(U/T)核苷酸不能从密码子被消除,然而,通过使用含有更低含量A和/或(U/T)核苷酸的密码子降低A和(U/T) 含量是可能的。这些的实例是:
Phe的密码子可以从(U/T)(U/T)(U/T)被修饰为(U/T)(U/T)C;
Leu的密码子可以从(U/T)(U/T)A,(U/T)(U/T)G,C(U/T)(U/T)或 C(U/T)A被修饰为C(U/T)C或C(U/T)G;
Ser的密码子可以从(U/T)C(U/T)或(U/T)CA或AG(U/T)被修饰为 (U/T)CC,(U/T)CG或AGC;
Tyr的密码子可以从(U/T)A(U/T)被修饰为(U/T)AC;
Cys的密码子可以从(U/T)G(U/T)被修饰为(U/T)GC;
His的密码子可以从CA(U/T)被修饰为CAC;
Gln的密码子可以从CAA被修饰为CAG;
Ile的密码子可以从A(U/T)(U/T)或A(U/T)A被修饰为A(U/T)C;
Thr的密码子可以从AC(U/T)或ACA被修饰为ACC或ACG;
Asn的密码子可以从AA(U/T)被修饰为AAC;
Lys的密码子可以从AAA被修饰为AAG;
Val的密码子可以从G(U/T)(U/T)或G(U/T)A被修饰为G(U/T)C或 G(U/T)G;
Asp的密码子可以从GA(U/T)被修饰为GAC;
Glu的密码子可以从GAA被修饰为GAG;
终止密码子(U/T)AA可以被修饰为(U/T)AG或(U/T)GA。
另一方面,关于Met(A(U/T)G)和Trp((U/T)GG)的密码子,不存在不改变编码的氨基酸序列的情况下序列修饰的可能性。
可以单独或以所有可能的组合使用上文所列的置换以与其特定野生型可读框(即原序列)相比增加如本文限定的发明的人工核酸分子的可读框的G/C含量。因此,例如,野生型序列中存在的Thr的所有密码子可以被修饰为ACC(或ACG)。
优选地,与野生型编码区的G/C含量相比,如本文限定的发明的人工核酸分子的可读框的G/C含量以至少7%,更优选至少15%,尤其优选至少20%增加,而不改变编码的氨基酸序列,即使用遗传密码的简并性。根据一个特定的实施方案,发明的人工核酸分子的可读框或其片段,变体或衍生物的可置换密码子的至少5%,10%,20%,30%,40%,50%,60%,更优选至少70%,甚至更优选至少80%和最优选至少90%,95%或甚至 100%被置换,从而增加所述可读框的G/C含量。
在此种情况下,尤其优选与野生型可读框相比,将如本文限定的发明的人工核酸分子的可读框的G/C含量增加,至最大(即可置换密码子的 100%),而不改变编码的氨基酸序列。
此外,所述可读框优选至少部分被密码子优化。密码子优化基于翻译效率可以由细胞中转移RNA(tRNA)出现的不同频率确定的研究结果。因此,如果所谓的“稀有密码子”存在于如本文限定的发明的人工核酸分子的编码区到增加的程度,相应修饰的核酸序列的翻译比存在编码相对“常见的”tRNA的密码子的情况下效率低。
因此,与相应野生型编码区相比,本发明的人工核酸分子的可读框优选被修饰,从而编码在细胞中相对稀有的tRNA的野生型序列的至少一个密码子被交换为编码在细胞比较频繁并携带与相对稀有tRNA相同的氨基酸的tRNA的密码子。通过该修饰,如本文限定的发明的人工核酸分子的可读框被修饰,从而频繁出现的tRNA可用的密码子可以替换相当于稀有 tRNA的密码子。换句话说,根据本发明,通过此种修饰,编码稀有tRNA 的野生型可读框所有密码子可以交换为编码在细胞中更频繁且携带与稀有tRNA相同的氨基酸的tRNA的密码子。哪些tRNA在细胞中相对频繁存在和相反哪些相对极少存在是本领域技术人员已知的;参见例如Akashi, Curr.Opin.Genet.Dev.2001,11(6):660-666。因此,优选地,优选就根据本发明的人工核酸分子将在其中被表达的系统而言,优选就根据本发明的人工核酸分子将在其中被翻译的系统而言,所述可读框是密码子优化的。优选地,可读框的密码子使用是根据哺乳动物密码子使用,更优选根据人密码子使用密码子优化的。优选地,所述可读框是密码子优化和G/C-含量修饰的。
为了进一步改善降解抗性,例如对由核酸外切酶或核酸内切酶导致的体内(或上文定义的体外)降解的抗性,和/或为了进一步改善根据本发明的人工核酸分子的蛋白表达的稳定性,所述人工核酸分子可以还包含修饰,如骨架修饰,糖修饰和/或碱基修饰,例如,脂修饰等。优选地,根据本发明的人工核酸分子的转录和/或翻译不被所述修饰显著损害。
通常,本发明的人工核酸分子可以包含任何天然(=天然存在的)核苷酸,例如鸟苷、尿嘧啶、腺苷、和/或胞嘧啶或其类似物。在这方面,核苷酸类似物定义为天然存在的核苷酸腺苷、胞嘧啶、胸苷、鸟苷和尿苷的天然或非天然存在的变体。因此,类似物是例如具有非天然存在的功能基团 (其优选为添加于天然存在的核苷酸或从天然存在的核苷酸缺失或其替代核苷酸的天然存在的功能基团)化学衍生的核苷酸。因此,天然存在的核苷酸的各个成分可以被修饰,即碱组分、糖(核糖)组分和/或形成RNA序列的骨架(见上)的磷酸盐组分。鸟苷、尿苷、腺苷、胸苷和胞嘧啶的类似物包括(但不意味任何限制)例如从化学上,例如通过乙酰化、甲基化、羟基化等改变的任何天然存在的或非天然存在的鸟苷,尿苷,腺苷,胸苷或胞嘧啶,包括1-甲基-腺苷,1-甲基-鸟苷,1-甲基-次黄苷,2,2-二甲基-鸟苷, 2,6-二氨基嘌呤,2′-氨基-2′-脱氧腺苷,2′-氨基-2′-脱氧胞苷,2′-氨基-2′-脱氧鸟苷,2′-氨基-2′-脱氧尿苷,2-氨基-6-氯嘌呤核糖苷,2-氨基嘌呤-核糖苷,2′-阿糖腺苷,2′-阿糖胞苷,2′-阿糖尿苷,2′-叠氮基-2′-脱氧腺苷,2′- 叠氮基-2′-脱氧胞苷,2′-叠氮基-2′-脱氧鸟苷,2′-叠氮基-2′-脱氧尿苷,2-氯腺苷,2′-氟-2′-脱氧腺苷,2′-氟-2′-脱氧胞苷,2′-氟-2′-脱氧鸟苷,2′-氟-2′- 脱氧尿苷,2′-氟胸苷,2-甲基-腺苷,2-甲基-鸟苷,2-甲基-硫代-N6-异戊烯基(isopenenyl)-腺苷,2′-O-甲基-2-氨基腺苷,2′-O-甲基-2′-脱氧腺苷,2′-O-甲基-2′-脱氧胞苷,2′-O-甲基-2′-脱氧鸟苷,2′-O-甲基-2′-脱氧尿苷,2′-O- 甲基-5-甲基尿苷,2′-O-甲基次黄苷,2′-O-甲基假尿苷,2-硫代胞苷,2-硫代-胞嘧啶,3-甲基-胞嘧啶,4-乙酰基-胞嘧啶,4-硫代尿苷,5-(羧基羟基甲基)-尿嘧啶,5,6-二氢尿苷,5-氨基烯丙基胞苷,5-氨基烯丙基-脱氧-尿苷,5-溴尿苷,5-羧基甲基氨基甲基-2-硫代-尿嘧啶,5-羧基甲基氨基甲基 -尿嘧啶,5-氯-阿糖-胞嘧啶,5-氟-尿苷,5-碘尿苷,5-甲氧基羰基甲基-尿苷,5-甲氧基-尿苷,5-甲基-2-硫代-尿苷,6-氮杂胞苷,6-氮杂尿苷,6-氯 -7-去氮杂-鸟苷,6-氯嘌呤核糖苷,6-巯基-鸟苷,6-甲基-巯基嘌呤-核糖苷, 7-去氮杂-2′-脱氧-鸟苷,7-去氮杂腺苷,7-甲基-鸟苷,8-氮杂腺苷,8-溴- 腺苷,8-溴-鸟苷,8-巯基-鸟苷,8-氧代鸟苷,苯并咪唑-核糖苷,β-D-甘露糖基-queosine,二氢-尿嘧啶,次黄苷,N1-甲基腺苷,N6-([6-氨基己基] 氨甲酰基甲基)-腺苷,N6-异丙烯基-腺苷,N6-甲基-腺苷,N7-甲基-黄苷,N-尿嘧啶-5-氧基乙酸甲酯,嘌呤霉素,Queosine,尿嘧啶-5-氧基乙酸,尿嘧啶-5-氧基乙酸甲酯,Wybutoxosine,黄苷和木糖(Xylo)-腺苷。本领域技术人员例如从美国专利4,373,071,US 4,401,796,US 4,415,732,US 4,458,066,US 4,500,707,US 4,668,777,US 4,973,679,US 5,047,524,US 5,132,418,US 5,153,319,US 5,262,530和5,700,642知晓所述类似物的制备。在如上文所述的类似物的情况下,特别的偏爱可以根据本发明针对那些增加编码的肽或蛋白的蛋白表达或增加本发明的人工核酸分子的免疫原性和/或不干扰已经引入的人工核酸分子的进一步修饰的类似物的某些实施方案给出。
根据特定实施方案,本发明的人工核酸分子可以还有酯修饰。
在优选的实施方案中,人工核酸分子优选从5’至3’方向包含以下元件:
5’-UTR元件,其延长和/或增加从所述人工核酸分子,优选从根据SEQ ID NO:25至30和SEQ ID NOs:319至382中的任一项的核酸序列的蛋白生产,更优选MP68或NDUFA4的5’-UTR;或另外的5’-UTR,优选 5’-TOP UTR;
至少一个可读框(ORF),其中所述ORF优选包含至少一个关于野生型序列的修饰;
3’-UTR元件,其延长和/或增加从所述人工核酸分子,优选从根据SEQ ID NO:1至24和SEQ ID NOs:49至318中任一项的核酸序列的蛋白生产,更优选GNAS,MORN2,GSTM1,NDUFA1,CBR2,YBX1,NDUFB8,或CNTN1的3’-UTR;或另外的3’-UTR,优选白蛋白73’-UTR;
聚腺苷酸序列,其优选包含64个腺苷酸;
聚胞苷酸序列,其优选包含30个腺苷酸;
组蛋白茎环序列。
在另一优选的实施方案中,人工核酸分子包含这样的核苷酸序列或由这样的核苷酸序列组成,所述核苷酸序列选自由以下各项组成的组:根据 SEQ ID NOs:36至40,SEQ IDNOs:42和43,SEQ ID NOs:45至48,以及SEQ ID NOs:384至388(参见图2至6,图8,9,11,图19至21 和图26至30)的核酸序列或互补DNA序列。
在尤其优选的实施方案中,根据本发明的人工核酸分子还可以包含一种以上以下描述的修饰:
化学修饰:
如本文中使用的就人工核酸分子而言的术语“修饰”可以指包含骨架修饰以及糖修饰或碱基修饰的化学修饰
在该情况下,如本文定义的人工核酸分子,优选RNA分子,可以含有核苷酸类似物/修饰,例如骨架修饰,糖修饰或碱基修饰。与本发明相关的骨架修饰是这样的修饰,其中包含在如本文定义的核酸分子中的核苷酸的骨架的磷酸酯被化学修饰。与本发明相关的糖修饰是如本文定义的核酸分子的核苷酸的糖的化学修饰。此外,与本发明相关的碱基修饰是核酸分子的核酸分子的核苷酸的碱基部分的化学修饰。在该情况下,核苷酸类似物或修饰优选选自可用于转录和/或翻译的核苷酸类似物。
糖修饰:
如本文所述的可以结合入人工核酸分子,优选RNA中的修饰的核苷和核苷酸可以在糖部分中被修饰。例如,RNA分子的2′羟基(OH)可以用很多不同的″氧基″或″脱氧″取代基修饰或替代。″氧基″-2′羟基修饰的实例包括,但不限于,烷氧基或芳氧基(-OR,例如,R=H,烷基,环烷基,芳基,芳烷基,杂芳基或糖);聚乙二醇(PEG),-0(CH2CH2o)nCH2CH2OR;其中2′羟基,例如,通过亚甲基桥连接于相同核糖的4′碳的″锁″核酸 (LNA);并且氨基(-O-氨基,其中氨基,例如,NRR,可以是烷基氨基、二烷基氨基、杂环基、芳基氨基、二芳基氨基、杂芳基氨基、或二杂芳基氨基、乙二胺、聚氨基)或氨基烷氧基.
″脱氧″修饰包括氢,氨基(例如NH2;烷基氨基、二烷基氨基、杂环基、芳基氨基、二芳基氨基、杂芳基氨基、二杂芳基氨基、或氨基酸);或氨基可以通过接头连接于糖,其中所述接头包含一个以上原子C、N和 O。
糖基团还可以含有一个以上与核糖中相应碳相比具有相反立体化学构象的碳。因此,修饰的核酸分子可以包括含有例如阿拉伯糖作为糖的核苷酸。
骨架修饰:
还可以在可以结合入如本文所述的人工核酸分子,优选RNA的修饰的核苷和核苷酸中进一步修饰磷酸骨架。骨架的磷酸基团可以通过用不同取代基替代一个以上氧原子来修饰。此外,修饰的核苷和核苷酸可以包括用如本文所述的修饰的磷酸酯完全替代未修饰磷酸酯部分。修饰的磷酸基团的实例包括,但不限于,硫代磷酸根、硒代磷酸根(phosphoroselenates)、硼代磷酸根(borano phosphates)、硼代磷酸酯、氢磷酸酯、氨基磷酸酯 (phosphoroamidates)、烷基或芳基膦酸酯和磷酸三酯。二硫代磷酸酯的两个未连接氧被硫替代。磷酸酯接头还可以通过用氮(桥接的氨基磷酸酯),硫(桥接的硫代磷酸酯)和碳(桥接的亚甲基-膦酸酯)替代连接的氧而被修饰。
碱基修饰:
如本文所述的可以结合入人工核酸分子,优选RNA分子的修饰的核苷和核苷酸,还可以在核碱基部分被修饰。RNA中发现的核碱基的实例包括,但不限于,腺嘌呤、鸟嘌呤、胞嘧啶和尿嘧啶。例如,本文中所述的核苷和核苷酸可以在主沟表面被化学修饰。在一些实施方案中,主沟化学修饰可以包括氨基、巯基、烷基、或卤代基团。
在本发明的尤其优选的实施方案中,核苷酸类似物/修饰选自碱基修饰,其优选选自2-氨基-6-氯嘌呤核糖苷-5′-三磷酸,2-氨基嘌呤-核糖苷-5′-三磷酸;2-氨基腺苷-5′-三磷酸,2′-氨基-2′-脱氧胞苷-三磷酸,2-硫代胞苷-5′- 三磷酸,2-硫代尿苷-5′-三磷酸,2′-氟胸苷-5′-三磷酸,2′-O-甲基次黄苷-5′- 三磷酸4-硫代尿苷-5′-三磷酸,5-氨基烯丙基胞苷-5′-三磷酸,5-氨基烯丙基尿苷-5′-三磷酸,5-溴胞苷-5′-三磷酸,5-溴尿苷-5′-三磷酸,5-溴-2′-脱氧胞苷-5′-三磷酸,5-溴-2′-脱氧尿苷-5′-三磷酸,5-碘胞苷-5′-三磷酸,5-碘-2′- 脱氧胞苷-5′-三磷酸,5-碘尿苷-5′-三磷酸,5-碘-2′-脱氧尿苷-5′-三磷酸,5- 甲基胞苷-5′-三磷酸,5-甲基尿苷-5′-三磷酸,5-丙炔基-2′-脱氧胞苷-5′-三磷酸,5-丙炔基-2′-脱氧尿苷-5′-三磷酸,6-氮杂胞苷-5′-三磷酸,6-氮杂尿苷 -5′-三磷酸,6-氯嘌呤核糖苷-5′-三磷酸,7-去氮杂腺苷-5′-三磷酸,7-去氮杂鸟苷-5′-三磷酸,8-氮杂腺苷-5′-三磷酸,8-叠氮基腺苷-5′-三磷酸,苯并咪唑-核糖苷-5′-三磷酸,N1-甲基腺苷-5′-三磷酸,N1-甲基鸟苷-5′-三磷酸, N6-甲基腺苷-5′-三磷酸,O6-甲基鸟苷-5′-三磷酸,假尿苷-5′-三磷酸,或嘌呤霉素-5′-三磷酸,黄苷-5′-三磷酸。对核苷酸给出对于选自由5-甲基胞苷 -5′-三磷酸,7-去氮杂鸟苷-5′-三磷酸,5-溴胞苷-5′-三磷酸,和假尿苷-5′- 三磷酸组成的碱基修饰的核苷酸的组的碱基修饰的特别偏爱。
在一些实施方案中,修饰的核苷包括吡啶-4-酮核糖核苷,5-氮杂-尿苷, 2-硫代-5-氮杂-尿苷,2-硫代尿苷,4-硫代-假尿苷,2-硫代-假尿苷,5-羟基尿苷,3-甲基尿苷,5-羧基甲基-尿苷,1-羧基甲基-假尿苷,5-丙炔基-尿苷, 1-丙炔基-假尿苷,5-牛磺酸甲基尿苷,1-牛磺酸甲基-假尿苷,5-牛磺酸甲基-2-硫代-尿苷,1-牛磺酸甲基-4-硫代-尿苷,5-甲基-尿苷,1-甲基-假尿苷,4-硫代-1-甲基-假尿苷,2-硫代-1-甲基-假尿苷,1-甲基-1-去氮杂-假尿苷, 2-硫代-1-甲基-1-去氮杂-假尿苷,二氢尿苷,二氢假尿苷,2-硫代-二氢尿苷,2-硫代-二氢假尿苷,2-甲氧基尿苷,2-甲氧基-4-硫代-尿苷,4-甲氧基-假尿苷,和4-甲氧基-2-硫代-假尿苷。
在一些实施方案中,修饰的核苷包括5-氮杂-胞苷,假异胞苷,3-甲基 -胞苷,N4-乙酰基胞苷,5-甲酰基胞苷,N4-甲基胞苷,5-羟基甲基胞苷, 1-甲基-假异胞苷,吡咯并-胞苷,吡咯并-假异胞苷,2-硫代-胞苷,2-硫代 -5-甲基-胞苷,4-硫代-假异胞苷,4-硫代-1-甲基-假异胞苷,4-硫代-1-甲基-1-去氮杂-假异胞苷,1-甲基-1-去氮杂-假异胞苷,折布拉林 (zebularine),5-氮杂-折布拉林,5-甲基-折布拉林,5-氮杂-2-硫代-折布拉林,2-硫代-折布拉林,2-甲氧基-胞苷,2-甲氧基-5-甲基-胞苷,4-甲氧基- 假异胞苷,和4-甲氧基-1-甲基-假异胞苷。
在其他实施方案中,修饰的核苷包括2-氨基嘌呤,2,6-二氨基嘌呤, 7-去氮杂-腺嘌呤,7-去氮杂-8-氮杂-腺嘌呤,7-去氮杂-2-氨基嘌呤,7-去氮杂-8-氮杂-2-氨基嘌呤,7-去氮杂-2,6-二氨基嘌呤,7-去氮杂-8-氮杂-2,6-二氨基嘌呤,1-甲基腺苷,N6-甲基腺苷,N6-异丙烯基腺苷,N6-(顺式-羟基异丙烯基)腺苷,2-甲基硫代-N6-(顺式-羟基异丙烯基)腺苷,N6-甘氨酰氨甲酰基腺苷,N6-苏氨酰氨甲酰基腺苷,2-甲基硫代-N6-苏氨酰氨甲酰基腺苷,N6,N6-二甲基腺苷,7-甲基腺嘌呤,2-甲基硫代-腺嘌呤,和2-甲氧基 -腺嘌呤。
在其他实施方案中,修饰的核苷包括次黄苷,1-甲基-次黄苷,wyosine,wybutosine,7-去氮杂-鸟苷,7-去氮杂-8-氮杂-鸟苷,6-硫代-鸟苷,6-硫代 -7-去氮杂-鸟苷,6-硫代-7-去氮杂-8-氮杂-鸟苷,7-甲基-鸟苷,6-硫代-7- 甲基-鸟苷,7-甲基次黄苷,6-甲氧基-鸟苷,1-甲基鸟苷,N2-甲基鸟苷, N2,N2-二甲基鸟苷,8-氧代-鸟苷,7-甲基-8-氧代-鸟苷,1-甲基-6-硫代-鸟苷,N2-甲基-6-硫代-鸟苷,和N2,N2-二甲基-6-硫代-鸟苷。
在一些实施方案中,核苷酸可以在主沟表面被修饰,并且可以包括用甲基或卤代基团替代尿嘧啶的C-5上的氢。
在特定实施方案中,修饰的核苷是5′-0-(1-硫代磷酸酯)-腺苷,5′-0-(1- 硫代磷酸)-胞苷,5′-0-(1-硫代磷酸)-鸟苷,5′-0-(1-硫代磷酸)-尿苷或5′-0-(1- 硫代磷酸)-假尿苷。
在进一步特定的实施方案中,人工核酸分子,优选RNA分子,可以包含选自以下各项的核苷修饰:6-氮杂-胞苷,2-硫代-胞苷,α-硫代-胞苷,假-异-胞苷,5-氨基烯丙基-尿苷,5-碘-尿苷,N1-甲基-假尿苷,5,6-二氢尿苷,α-硫代-尿苷,4-硫代-尿苷,6-氮杂-尿苷,5-羟基-尿苷,脱氧-胸苷, 5-甲基-尿苷,吡咯并-胞苷,次黄苷,α-硫代-鸟苷,6-甲基-鸟苷,5-甲基- 胞苷,8-氧代-鸟苷,7-去氮杂-鸟苷,N1-甲基-腺苷,2-氨基-6-氯-嘌呤, N6-甲基-2-氨基-嘌呤,假-异-胞苷,6-氯-嘌呤,N6-甲基-腺苷,α-硫代-腺苷,8-叠氮基-腺苷,7-去氮杂-腺苷。
脂修饰:
根据进一步实施方案,如本文定义的人工核酸分子,优选RNA,可以含有脂修饰。该脂-修饰的RNA典型地包含如本文定义的RNA。如本文定义的该脂-修饰的RNA分子典型地还包含至少一个与该RNA分子共价连接的接头,和至少一个与各自的接头共价连接的脂。备选地,脂-修饰的 RNA分子包含至少一个如本文定义的RNA分子和至少一个与该RNA分子共价连接(无接头)的(双功能)脂。根据第三个备选方案,脂-修饰的RNA 分子包含如本文定义的人工核酸分子,优选RNA分子,至少一个与该RNA 分子共价连接的接头,和至少一个与各自的接头共价连接的脂,并且此外至少一个与该RNA分子共价连接(无接头)的(双功能)脂。在该情况下,尤其优选的是,脂修饰存在于线性RNA序列的末端。
修饰的RNA的5’末端的修饰:
根据本发明的另一优选的实施方案,如本文定义的人工核酸分子,优选RNA分子,可以通过加入所谓的″5′帽″结构来修饰。
5′-帽是实体,通常是修饰的核苷酸实体,其通常在成熟mRNA的5’端“加帽”。5′-帽可以典型地由修饰的核苷酸,尤其是由鸟嘌呤核苷酸的衍生物形成。优选地,5’-帽与5’-末端经由5′-5′-三磷酸连接来连接。5’-帽可以是甲基化的,例如m7GpppN,其中N是携带5’-帽,典型地RNA的 5’-端的核酸的末端5’核苷酸。m7GpppN是由聚合酶II转录的mRNA中天然存在的5’-帽结构并且因此不被认为是包含在根据本发明的修饰的 RNA中的修饰。这意为,根据本发明的人工核酸分子,优选RNA分子,可以包含m7GpppN作为5’-帽,但此外,所述人工核酸分子,优选RNA 分子,包含至少一个如本文定义的进一步修饰。
5’帽结构的进一步实例包括甘油基,反向脱氧非碱性残基(部分),4’,5’亚甲基核苷酸,1-(β-D-赤呋喃糖基)核苷酸,4’-硫代核苷酸,碳环核苷酸, 1,5-失水己糖醇核苷酸,L-核苷酸,α-核苷酸,修饰的碱基核苷酸,苏-戊呋喃糖基核苷酸,无环3’,4’-开环核苷酸,无环3,4-二羟基丁基核苷酸,无环3,5二羟基戊基核苷酸,3’-3’-反向核苷酸部分,3’-3’-反向非碱性部分, 3’-2’-反向核苷酸部分,3’-2’-反向非碱性部分,1,4-丁二醇磷酸酯,3’-氨基磷酸酯,磷酸己酯,磷酸氨基己酯,3’-磷酸脂,3’硫代磷酸酯,二硫代磷酸酯,或桥接或非桥接的膦酸甲酯部分。这些修饰的5’-帽结构被认为是根据本发明的人工核酸分子,优选RNA分子中包含的至少一个修饰。
尤其优选的修饰的5’-帽结构是CAP1(m7G的相邻核苷酸的核糖的甲基化),CAP2(m7G下游第二个核苷酸的核糖甲基化),CAP3(m7G下游第三个核苷酸的核糖甲基化),CAP4(m7G下游第四个核苷酸的核糖甲基化), ARCA(抗逆CAP类似物,修饰的ARCA(例如硫代磷酸酯修饰的ARCA),次黄苷,N1-甲基-鸟苷,2’-氟-鸟苷,7-去氮杂-鸟苷,8-氧代-鸟苷,2-氨基-鸟苷,LNA-鸟苷,和2-叠氮基-鸟苷。
在优选的实施方案中,至少一个可读框编码治疗性蛋白或肽。在另一实施方案中,抗原由至少一个可读框,如致病抗原、肿瘤抗原,致敏抗原或自身免疫抗原编码。其中,编码抗原的人工核酸分子的施用用于针对涉及所述抗原的疾病的基因疫苗接种方法。
在备选实施方案中,抗体或抗原特异性T细胞受体或其片段由根据本发明的人工核酸分子的至少一个可读框编码。
抗原:
致病抗原:
根据本发明的人工核酸分子可以编码这样的蛋白或肽,所述蛋白或肽包含致病抗原或其片段、变体或衍生物。所述致病抗原来源于致病性生物体,特别是细菌、病毒或原生动物(多细胞)致病性生物体,其激发受试者、特别是哺乳动物受试者、更特别是人中的免疫学反应。更特别地,致病抗原优选是表面抗原,例如,位于病毒或细菌或原生动物生物体的表面上的蛋白(或蛋白的片段,例如,表面抗原的外部部分)。
致病抗原是优选来源于与传染病相关的病原体的肽或蛋白抗原,其优选地选自来源于下述病原体的抗原:鲍氏不动杆菌(Acinetobacter baumannii),无形体属(Anaplasmagenus),Anaplasma phagocytophilum,猫钩虫(Ancylostoma braziliense),十二指肠钩虫(Ancylostoma duodenale),溶血隐秘杆菌(Arcanobacterium haemolyticum),人蛔虫(Ascaris lumbricoides),曲霉菌属(Aspergillus genus),星状病毒科(Astroviridae),巴贝虫属(Babesia genus),炭疽芽孢杆菌(Bacillus anthracis),蜡状芽孢杆菌(Bacillus cereus),汉氏巴尔通氏体(Bartonella henselae),BK病毒,人芽囊原虫(Blastocystis hominis),皮炎芽生菌(Blastomyces dermatitidis),百日咳博德特氏菌(Bordetella pertussis),伯氏疏螺旋体(Borrelia burgdorferi),疏螺旋体属(Borreliagenus),疏螺旋体属物种(Borrelia spp),布鲁杆菌属(Brucella genus),马来丝虫(Brugia malayi),布尼亚病毒科 (Bunyaviridae family),洋葱伯克霍尔德氏菌(Burkholderia cepacia)和其他伯克霍尔德氏菌属物种(Burkholderia species),鼻疽伯克霍尔德氏菌 (Burkholderia mallei),类鼻疽伯克霍尔德氏菌(Burkholderiapseudomallei),嵌杯病毒科(Caliciviridae family),弯曲杆菌属 (Campylobactergenus),白色念珠菌(Candida albicans),念珠菌属物种 (Candida spp),砂眼衣原体(Chlamydia trachomatis),肺炎衣原体 (Chlamydophila pneumoniae),鹦鹉热衣原体(Chlamydophila psittaci), CJD朊病毒,华支睾吸虫(Clonorchis sinensis),肉毒梭菌(Clostridium botulinum),艰难梭菌(Clostridium difficile),产气荚膜梭菌(Clostridium perfringens),产气荚膜梭菌,梭菌属物种(Clostridium spp),破伤风梭菌(Clostridium tetani),球孢菌属物种(Coccidioides spp),冠状病毒 (coronaviruses),白喉棒杆菌(Corynebacterium diphtheriae),伯内特考克斯体(Coxiella burnetii),克里米亚-刚果出血热病毒(Crimean-Congo hemorrhagic fever virus),新型隐球菌(Cryptococcus neoformans),隐孢子虫属(Cryptosporidium genus),巨细胞病毒(Cytomegalovirus,CMV),登革热病毒(Dengue viruses)(DEN-1,DEN-2,DEN-3和DEN-4),脆弱双核阿米巴(Dientamoeba fragilis),埃博拉病毒(Ebolavirus,EBOV),棘球属(Echinococcus genus),恰菲埃里希氏体(Ehrlichia chaffeensis),尤氏埃里希氏体(Ehrlichia ewingii),埃里希氏体属(Ehrlichia genus),溶组织内阿米巴(Entamoebahistolytica),肠球菌属(Enterococcus genus),肠道病毒属(Enterovirus genus),肠道病毒(Enteroviruses),主要为柯萨奇病毒A病毒(Coxsackie Avirus)和肠道病毒71(EV71),表皮癣菌属物种(Epidermophyton spp),埃巴病毒(Epstein-Barr Virus,EBV),大肠杆菌(Escherichia coli)O157:H7,O111和O104:H4,肝片形吸虫(Fasciola hepatica)和巨大片形吸虫(Fasciola gigantica),FFI朊病毒,丝虫目超家族(Filarioideasuperfamily),黄病毒(Flaviviruses),土拉热弗朗西丝菌 (Francisella tularensis),梭杆菌属(Fusobacterium genus),白地霉 (Geotrichum candidum),肠贾第虫(Giardiaintestinalis),颚口线虫属物种(Gnathostoma spp),GSS朊病毒,瓜纳里托病毒(Guanarito virus),杜克雷嗜血杆菌(Haemophilus ducreyi),流感嗜血菌(Haemophilusinfluenzae),幽门螺杆菌(Helicobacter pylori),亨尼病毒属(Henipavirus)(亨德拉病毒(Hendra virus)尼帕病毒(Nipah virus)),甲型肝炎病毒(Hepatitis A Virus),乙型肝炎病毒(Hepatitis B Virus,HBV),丙型肝炎病毒(Hepatitis C Virus, HCV),丁型肝炎病毒(Hepatitis D Virus),戊型肝炎病毒(Hepatitis E Virus),单纯疱疹病毒(Herpessimplex virus)1和2(HSV-1和HSV-2),荚膜组织胞浆菌(Histoplasma capsulatum),HIV(人免疫缺陷病毒(Human immunodeficiency virus)),威尼克何德霉(Hortaeawerneckii),人博卡病毒(Human bocavirus,HBoV),人疱疹病毒6(HHV-6)和人疱疹病毒7(HHV-7),人偏肺病毒(Human metapneumovirus,hMPV),人乳头瘤病毒 (Humanpapillomavirus,HPV),人副流感病毒(Human parainfluenza viruses,HPIV),日本脑炎病毒(Japanese encephalitis virus),JC病毒,胡宁病毒(Junin virus),金氏金氏菌(Kingella kingae),肉芽肿杆菌(Klebsiella granulomatis),库鲁朊病毒(Kuru prion),拉沙病毒(Lassa virus),嗜肺军团病杆菌(Legionella pneumophila),利什曼原虫属(Leishmania genus),钩端螺旋体属(Leptospira genus),单核细胞增生利斯特菌(Listeria monocvtogenes),淋巴细胞性脉络丛脑膜炎病毒(Lymphocyticchoriomeningitis virus,LCMV),Machupo病毒,马拉色霉菌属物种(Malassezia spp),马堡病毒(Marburg virus),麻疹病毒(Measles virus),横川后殖吸虫(Metagonimusyokagawai),微孢子虫门(Microsporidia phylum),传染性软疣病毒(Molluscumcontagiosum virus,MCV),腮腺炎病毒(Mumps virus),麻风分枝杆菌(Mycobacteriumleprae)和 Mycobacterium lepromatosis,结核分枝杆菌(Mycobacteriumtuberculosis),溃疡分枝杆菌(Mycobacterium ulcerans),肺炎支原体(Mycoplasmapneumoniae),福氏耐格里原虫(Naegleria fowleri),美洲板口线虫(Necatoramericanus),淋病奈瑟球菌(Neisseria gonorrhoeae),脑膜炎奈瑟球菌 (Neisseriameningitidis),星状诺卡尔菌(Nocardia asteroides),诺卡尔菌属物种(Nocardia spp),旋盘尾丝虫(Onchocerca volvulus),恙虫热立克次体(Orientia tsutsugamushi),正粘病毒科(Orthomyxoviridae family)(流感(Influenza)),巴西副球孢子菌(Paracoccidioides brasiliensis),并殖吸虫属物种(Paragonimus spp),卫斯特曼并殖吸虫(Paragonimus westermani),细小病毒(Parvovirus)B19,巴斯德菌属(Pasteurellagenus),疟原虫属 (Plasmodium genus),杰氏肺囊虫(Pneumocystis jirovecii),脊髓灰质炎病毒(Poliovirus),狂犬病病毒(Rabies virus),呼吸道合胞病毒(respiratorysyncytial virus,RSV),鼻病毒属(Rhinovirus),鼻病毒(rhinoviruses),痘立克次体(Rickettsia akari),立克次体属(Rickettsia genus),普氏立克次体(Rickettsiaprowazekii),立氏立克次体(Rickettsia rickettsii),斑疹伤寒立克次体(Rickettsiatyphi),裂谷热病毒(Rift Valley fever virus),轮状病毒属(Rotavirus),风疹病毒(Rubella virus),萨比亚病毒(Sabia virus),沙门菌属(Salmonella genus),疥螨(Sarcoptes scabiei),SARS冠状病毒 (SARS coronavirus),血吸虫属(Schistosomagenus),志贺菌属(Shigella genus),辛诺柏病毒(Sin Nombre virus),汉坦病毒属(Hantavirus),申克孢子丝菌(Sporothrix schenckii),葡萄球菌属(Staphylococcusgenus),葡萄球菌属,无乳链球菌(Streptococcus agalactiae),肺炎链球菌(Streptococcus pneumoniae),酿脓链球菌(Streptococcus pyogenes),粪类圆线虫(Strongyloides stercoralis),绦虫属(Taenia genus),猪肉绦虫 (Taenia solium),蜱传脑炎病毒(Tick-borne encephalitis virus,TBEV),犬弓蛔线虫(Toxocara canis)或猫弓蛔虫(Toxocara cati),鼠弓形虫(Toxoplasma gondii),苍白密螺旋体(Treponemapallidum),旋毛线虫 (Trichinella spiralis),阴道毛滴虫(Trichomonas vaginalis),发癣菌属物种(Trichophyton spp),鞭形鞭虫(Trichuris trichiura),布鲁斯锥虫(Trypanosoma brucei),克鲁斯锥虫(Trypanosoma cruzi),尿素分解尿素支原体(Ureaplasma urealyticum),水痘-带状疱疹病毒(Varicella zoster virus, VZV),水痘-带状疱疹病毒(VZV),重型天花(Variola major)或类天花 (Variola minor),vCJD朊病毒,委内瑞拉马脑炎病毒(Venezuelan equine encephalitis virus),霍乱弧菌(Vibriocholerae),西尼罗河病毒(West Nile virus),西部马脑炎病毒(Western equineencephalitis virus),班氏吴策线虫(Wuchereria bancrofti),黄热病病毒(Yellowfever virus),小肠结肠炎耶尔森氏菌(Yersinia enterocolitica),鼠疫耶尔森氏菌(Yersinia pestis)和假结核耶尔森氏菌(Yersinia pseudotuberculosis)。
在这一情形中,特别优选的是来自选自下述的病原体的抗原:流感病毒(Influenza virus),呼吸道合胞病毒(RSV),单纯疱疹病毒(HSV),人乳头瘤病毒(HPV),人免疫缺陷病毒(HIV),疟原虫属(Plasmodium),金黄色葡萄球菌(Staphylococcus aureus),登革热病毒,砂眼衣原体(Chlamydia trachomatis),巨细胞病毒(CMV),乙型肝炎病毒(HBV),结核分枝杆菌 (Mycobacterium tuberculosis),狂犬病病毒和黄热病病毒。
肿瘤抗原:
在进一步实施方案中,根据本发明的人工核酸分子可以编码蛋白或肽,其包含包含肿瘤抗原,所述肿瘤抗原的片段、变体或衍生物的肽或蛋白,优选为,其中所述肿瘤抗原是黑素细胞特异的抗原、癌-睾丸抗原或肿瘤特异的抗原,优选为CT-X抗原、非-X CT-抗原、对于CT-X抗原的结合伙伴或对于非-X CT-抗原或肿瘤特异的抗原的结合伙伴,更优选为CT-X抗原、对于非-X CT-抗原或肿瘤特异的抗原的结合伙伴或所述肿瘤抗原的片段、变体或衍生物;并且其中各个核酸序列编码不同肽或蛋白;并且其中至少一个核酸序列编码5T4、707-AP、9D7、AFP、AlbZIP HPG1、o-5-β-1- 整联蛋白、o-5-β-6-整联蛋白、α-辅肌动蛋白-4/m、α-甲基酰基-辅酶A消旋酶、ART-4、ARTC1/m、B7H4、BAGE-1、BCL-2、bcr/abl、β-联蛋白/m、 BING-4、BRCA1/m、BRCA2/m、CA 15-3/CA 27-29、CA 19-9、CA72-4、CA125、钙网蛋白、CAMEL、CASP-8/m、组织蛋白酶B、组织蛋白酶L、 CD19、CD20、CD22、CD25、CDE30、CD33、CD4、CD52、CD55、CD56、 CD80、CDC27/m、CDK4/m、CDKN2A/m、CEA、CLCA2、CML28、CML66、 COA-1/m、coactosin-样蛋白、胶原XXIII、COX-2、CT-9/BRD6、Cten、细胞周期蛋白B1、细胞周期蛋白D1、cyp-B、CYPB1、DAM-10、DAM-6、 DEK-CAN、EFTUD2/m、EGFR、ELF2/m、EMMPRIN、EpCam、EphA2、 EphA3、ErbB3、ETV6-AML1、EZH2、FGF-5、FN、Frau-1、G250、GAGE-1、 GAGE-2、GAGE-3、GAGE-4、GAGE-5、GAGE-6、GAGE7b、GAGE-8、 GDEP、GnT-V、gp100、GPC3、GPNMB/m、HAGE、HAST-2、hepsin、 Her2/neu、HERV-K-MEL、HLA-A*0201-R17I、HLA-A11/m、HLA-A2/m、 HNE、同源框NKX3.1、HOM-TES-14/SCP-1、HOM-TES-85、HPV-E6、 HPV-E7、HSP70-2M、HST-2、hTERT、iCE、IGF-1R、IL-13Ra2、IL-2R、 IL-5、不成熟层粘连蛋白受体、激肽释放酶-2、激肽释放酶-4、Ki67、 KIAA0205、KIAA0205/m、KK-LC-1、K-Ras/m、LAGE-A1、LDLR-FUT、 MAGE-A1、MAGE-A2、MAGE-A3、MAGE-A4、MAGE-A6、MAGE-A9、 MAGE-A10、MAGE-A12、MAGE-B1、MAGE-B2、MAGE-B3、MAGE-B4、 MAGE-B5、MAGE-B6、MAGE-B10、MAGE-B16、MAGE-B17、MAGE-C1、MAGE-C2、MAGE-C3、MAGE-D1、MAGE-D2、MAGE-D4、MAGE-E1、 MAGE-E2、MAGE-F1、MAGE-H1、MAGEL2、乳腺球蛋白A、MART-1/melan-A、MART-2、MART-2/m、基质蛋白22、MC1R、M-CSF、 ME1/m、间皮素(mesothelin)、MG50/PXDN、MMP11、MN/CA IX-抗原、 MRP-3、MUC-1、MUC-2、MUM-1/m、MUM-2/m、MUM-3/m、I型肌球蛋白I/m、NA88-A、N-乙酰基葡糖胺基转移酶-V、Neo-PAP、Neo-PAP/m、NFYC/m、NGEP、NMP22、NPM/ALK、N-Ras/m、NSE、NY-ESO-1、 NY-ESO-B、OA1、OFA-iLRP、OGT、OGT/m、OS-9、OS-9/m、骨钙素、骨桥蛋白、p15、p190小bcr-abl、p53、p53/m、PAGE-4、PAI-1、PAI-2、 PAP、PART-1、PATE、PDEF、Pim-1-激酶、Pin-1、Pml/PARα、POTE、 PRAME、PRDX5/m、prostein、蛋白酶-3、PSA、PSCA、PSGR、PSM、 PSMA、PTPRK/m、RAGE-1、RBAF600/m、RHAMM/CD168、RU1、RU2、 S-100、SAGE、SART-1、SART-2、SART-3、SCC、SIRT2/m、Sp17、SSX-1、SSX-2/HOM-MEL-40、SSX-4、STAMP-1、STEAP-1、存活素、存活素-2B、 SYT-SSX-1、SYT-SSX-2、TA-90、TAG-72、TARP、TEL-AML1、TGFβ、 TGFβRII、TGM-4、TPI/m、TRAG-3、TRG、TRP-1、TRP-2/6b、TRP/INT2、 TRP-p8、酪氨酸酶、UPA、VEGFR1、VEGFR-2/FLK-1、WT1和淋巴血细胞的免疫球蛋白独特型或淋巴血细胞的T细胞受体独特型,或所述肿瘤抗原片段、变体或衍生物;优选为存活素或其类似物,MAGE-家族的抗原或其结合伙伴或所述肿瘤抗原的片段、变体或衍生物。尤其是优选在该情况下是肿瘤抗原NY-ESO-1、5T4、MAGE-C1、MAGE-C2、存活素、Muc-1、 PSA、PSMA、PSCA、STEAP和PAP。
在优选的实施方案中,人工核酸分子编码蛋白或肽,其包含治疗性蛋白或其片段、变体或衍生物。
本文定义的治疗性蛋白是有益于任何遗传或获得性疾病的治疗或改善个体的状况的肽或蛋白。具体地,除其他功能外,治疗性蛋白在产生可以修饰并修复遗传错误、破坏癌细胞或病原体感染的细胞、治疗免疫系统病症、治疗代谢或内分泌病症的治疗剂方面起重要作用。例如,红细胞生成素(EPO)(一种蛋白激素)可以用于治疗患有红细胞缺陷(erythrocyte deficiency)的患者,其是肾脏并发症的常见原因。此外,治疗性蛋白涵盖佐剂蛋白、治疗性抗体,以及例如用于绝经期妇女的治疗中的激素替代疗法。在最近的方法中,利用患者的体细胞来使其重新编程为多能干细胞,所述多能干细胞替代有争议的干细胞疗法。此外,用于使体细胞重新编程或用于使干细胞分化的这些蛋白在本文中定义为治疗性蛋白。此外,治疗性蛋白可以用于其他目的,例如,伤口愈合、组织再生、血管发生等。此外,抗原特异的B细胞受体和其片段和变体在本文中定义为治疗性蛋白。
因此,治疗性蛋白可以用于多种目的,包括多种疾病的治疗,所述疾病如例如,传染病、肿瘤(例如,癌症或肿瘤疾病)、血液和血液形成器官的疾病、内分泌、营养和代谢病、神经系统的疾病、循环系统的疾病、呼吸系统的疾病、消化系统的疾病、皮肤和皮下组织的疾病、肌肉骨骼系统和结缔组织的疾病和生殖泌尿系统的疾病,不管其是遗传的还是获得性的。
在这一情形中,可以用于包括代谢或内分泌病症的治疗的特别优选的治疗性蛋白选自(括号中是在治疗中使用治疗性蛋白的具体的疾病):酸性鞘磷脂酶(尼曼-皮克病(Niemann-Pick disease)),Adipotide(肥胖 (obesity)),Agalsidase-β(人半乳糖苷酶A(human galactosidase A)法布里病(Fabry disease;防止可能导致肾脏和心血管并发症的脂肪累积)), Alglucosidase(庞贝病(Pompe disease)糖原贮积症II型(glycogenstorage disease type II)),α-半乳糖苷酶A(α-GAL A,Agalsidaseα)(法布里病),α- 葡糖苷酶(糖原贮积症(Glycogen storage disease,GSD),Morbus Pompe),α-L-艾杜糖苷酸酶(黏多糖贮积症(mucopolysaccharidoses,MPS),胡尔勒综合征(Hurler syndrome),沙伊综合征(Scheie syndrome)),α-N-乙酰葡糖苷酶(桑菲利波综合征(Sanfilipposyndrome)),双调蛋白(癌症,代谢紊乱(metabolic disorder)),血管生成素((Ang1,Ang2,Ang3,Ang4,ANGPTL2, ANGPTL3,ANGPTL4,ANGPTL5,ANGPTL6,ANGPTL7)(血管发生,稳定血管),β动物纤维素(代谢紊乱(metabolic disorder)),β-葡糖醛酸糖苷酶 (斯赖综合征(Sly syndrome)),骨形态发生蛋白BMP(BMP1,BMP2, BMP3,BMP4,BMP5,BMP6,BMP7,BMP8a,BMP8b,BMP10,BMP15)(再生性作用,骨骼相关的病症,慢性肾病(chronic kidney disease,CKD)), CLN6蛋白(CLN6疾病-非典型性晚期婴儿期,晚期发作的变体,青少年早期,神经元蜡样脂脂褐质沉积症(Neuronal Ceroid Lipofuscinoses, NCL)),表皮生长因子(EGF)(伤口愈合,调节细胞生长、增殖和分化), Epigen(代谢紊乱),表皮调节素(代谢紊乱),成纤维细胞生长因子(FGF, FGF-1,FGF-2,FGF-3,FGF-4,FGF-5,FGF-6,FGF-7,FGF-8,FGF-9,FGF-10, FGF-11,FGF-12,FGF-13,FGF-14,FGF-16,FGF-17,FGF-17,FGF-18, FGF-19,FGF-20,FGF-21,FGF-22,FGF-23)(伤口愈合,血管发生,内分泌紊乱,组织再生),Galsulphase(黏多糖贮积症IV(Mucopolysaccharidosis VI)),葛瑞林(Ghrelin)(肠易激综合征(irritablebowel syndrome,IBS),肥胖,普拉德-威利综合征(Prader-Willi syndrome),II型糖尿病(type II diabetes mellitus)),葡糖脑苷脂酶(戈谢病(Gaucher′s disease)),GM-CSF(再生作用,产生白血细胞,癌症),肝素-结合EGF-样生长因子(HB-EGF) (伤口愈合,心脏肥大(cardiac hypertrophy)和心脏发育与功能),肝细胞生长因子HGF(再生作用,伤口愈合),Hepcidin(铁代谢紊乱(iron metabolism disorders),β-地中海贫血(Beta-thalassemia)),人白蛋白(减少的白蛋白产生(低蛋白血症(hypoproteinaemia)),增加的白蛋白损失(肾病综合征(nephrotic syndrome)),低血容量症(hypovolaemia),高胆红素血症(hyperbilirubinaemia)),艾度硫酸酯酶(Idursulphase)(艾杜糖醛酸 -2-硫酸酯酶)(黏多糖贮积症II(Mucopolysaccharidosis II)(亨特综合征 (Hunter syndrome))),整联蛋白αVβ3,αVβ5和α5β1(结合基质大分子和蛋白酶,血管发生),艾杜糖醛酸硫酸酯酶(亨特综合征(Hunter syndrome)),拉罗尼酶(Laronidase)(胡尔勒和胡尔勒-沙伊形式的黏多糖贮积症I(Hurler and Hurler-Scheie forms of mucopolysaccharidosis I)),N-乙酰半乳糖胺-4- 硫酸酯酶(rhASB;galsulfase,芳基硫酸酯酶A(ARSA),芳基硫酸酯酶B (ARSB))(芳基硫酸酯酶B缺陷,马洛托-拉梅综合征(Maroteaux-Lamy syndrome),黏多糖贮积症VI(mucopolysaccharidosis VI)),N-乙酰葡糖胺-6-硫酸酯酶(桑菲利波综合征(Sanfilipposyndrome)),神经生长因子 (NGF,脑源性神经营养因子(BDNF),神经营养因子-3(NT-3),和神经营养因子4/5(NT-4/5)(再生作用,心血管病(cardiovascular diseases),冠状动脉动脉粥样硬化(coronary atherosclerosis),肥胖,2型糖尿病,代谢综合征,急性冠状动脉综合征(acute coronary syndromes),痴呆(dementia),抑郁(depression),精神分裂症(schizophrenia),孤独症(autism),雷特综合征(Rett syndrome),神经性厌食症(anorexia nervosa),神经性贪食症(bulimia nervosa),伤口愈合,皮肤溃疡(skinulcers),角膜溃疡 (corneal ulcers),阿尔茨海默病(Alzheimer′s disease)),神经调节蛋白 (NRGl,NRG2,NRG3,NRG4)(代谢紊乱,精神分裂症),神经毡蛋白 (NRP-1,NRP-2)(血管发生,轴突导向,细胞存活,迁移),肥胖抑制素 (Obestatin)(肠易激综合征(irritablebowel syndrome,IBS),肥胖,普拉德 -威利综合征(Prader-Willi syndrome),II型糖尿病),血小板衍生生长因子 (PDGF(PDFF-A,PDGF-B,PDGF-C,PDGF-D)(再生作用,伤口愈合,血管发生中的紊乱(disorder in angiogenesis),动脉硬化(Arteriosclerosis),纤维化(Fibrosis),癌症),TGFβ受体(内皮因子,TGF-β1受体,TGF-β2受体, TGF-β3受体)(肾纤维化(renal fibrosis),肾病(kidney disease),糖尿病 (diabetes),终末期肾病(ultimately end-stage renal disease,ESRD),血管发生),血小板生成素(THPO)(巨核细胞生长和发育因子(Megakaryocyte growth and development factor,MGDF))(血小板病症(platelets disorders),献血用血小板(platelets for donation),骨髓抑制性化疗后血小板计数的恢复),转化生长因子(TGF(TGF-α,TGF-β(TGFβ1,TGFβ2和TGFβ3)))(再生作用,伤口愈合,免疫性,癌症,心脏疾病,糖尿病,马方综合征(Marfan syndrome),Loeys-Dietz综合征(Loeys-Dietz syndrome)),VEGF(VEGF-A, VEGF-B,VEGF-C,VEGF-D,VEGF-E,VEGF-F und PIGF)(再生作用,血管发生,伤口愈合,癌症,渗透性),奈西立肽(Nesiritide)(急性代偿失调性充血性心力衰竭(Acute decompensated congestive heart failure)),胰蛋白酶(褥疮溃疡(Decubitus ulcer),静脉曲张性溃疡(varicose ulcer),焦痂清创(debridement of eschar),裂开性伤口(dehiscent wound),晒伤 (sunburn),胎粪性肠梗阻(meconium ileus)),促肾上腺皮质激素 (adrenocorticotrophic hormone,ACTH)(艾迪生病("Addison′s disease),小细胞癌(Small cell carcinoma),肾上腺脑白质营养不良(Adrenoleukodystrophy),先天性肾上腺增生(Congenital adrenal hyperplasia),库欣综合征(Cushing′s syndrome),纳尔逊综合征(Nelson′s syndrome),婴儿痉挛(Infantilespasms)),心房钠尿肽(Atrial-natriuretic peptide,ANP)(内分泌紊乱(endocrinedisorders)),胆囊收缩素 (Cholecystokinin)(不同的),低胃泌素血症(hypogastrinemia),瘦蛋白(糖尿病,高甘油三酯血症(hypertriglyceridemia),肥胖),催产素(刺激人乳喂养,分娩的不进展(non-progression of parturition)),生长抑素(类癌综合征 (carcinoid syndrome)、急性静脉曲张破裂出血(acute variceal bleeding) 和肢端肥大症(acromegaly),肝肾多囊性病(polycystic diseases of the liver andkidney),肢端肥大症和由神经内分泌瘤(neuroendocrine tumors)引起的症状的对症治疗),加压素(Vasopressin)(抗利尿激素)(尿崩症(diabetes insipidus)),降钙素(Calcitonin)(绝经后骨质疏松(Postmenopausal osteoporosis),高钙血症(Hypercalcaemia),佩吉特病(Paget′s disease),骨转移(Bone metastases),幻肢痛(Phantom limb pain),椎管狭窄(Spinal Stenosis)),Exenatide(对二甲双胍(metformin)和磺脲(sulphonylurea) 治疗有耐药性的2型糖尿病),生长激素(Growthhormone,GH),生长素(somatotropin)(由于GH不足(GH deficiency)或慢性肾功能不全(chronic renal insufficiency)、普拉德-威利综合征(Prader-Willi syndrome)、特纳综合征(Turner syndrome)、艾滋消耗(AIDS wasting)或使用抗病毒疗法的恶病质(cachexia)导致的生长不足(Growth failure)),胰岛素(糖尿病,糖尿病酮症酸中毒(diabetic ketoacidosis),高钾血症(hyperkalaemia)),胰岛素样生长因子1IGF-1(具有GH基因缺失或严重的原发性IGF1不足 (severe primary IGF1deficiency)的儿童生长不足,神经变性疾病 (neurodegenerative disease),心血管疾病(cardiovasculardiseases),心力衰竭(heart failure)),Mecasermin rinfabate,IGF-1类似物(具有GH基因缺失或严重的原发性IGF1不足的儿童生长不足,神经变性疾病,心血管疾病,心力衰竭),美卡舍明(Mecasermin),IGF-1类似物(有GH基因缺失或严重的原发性IGF1不足的儿童生长不足,神经变性疾病,心血管疾病,心力衰竭),培维索孟(Pegvisomant)(肢端肥大症),普兰林肽 (Pramlintide)(糖尿病,与胰岛素组合),特立帕肽(Teriparatide)(人甲状旁腺素残基1-34)(严重的骨质疏松症(Severe osteoporosis)),贝卡普勒明 (Becaplermin)(糖尿病性溃疡(diabetic ulcers)辅助性清创术 (Debridement)),Dibotermin-a(骨形态发生蛋白2)(脊柱融合手术(Spinal fusion surgery),骨损伤修复(bone injury repair)),醋酸组氨瑞林(Histrelin acetate)(促性腺素释放激素(gonadotropin releasinghormone;GnRH))(早熟青春期(Precocious puberty)),奥曲肽(Octreotide)(肢端肥大症,VIP- 分泌腺瘤(VIP-secreting adenoma)和转移性类癌肿瘤(metastatic carcinoidtumours)的症状缓和),和帕利夫明(Palifermin)(角质形成细胞生长因子 (keratinocytegrowth factor;KGF))(经历化疗的患者中的严重的口粘膜炎 (Severe oral mucositis),伤口愈合)。
这些和其他的蛋白应该理解为是治疗性的,原因在于其旨在通过以充分的量替代其功能蛋白的缺陷性内源产生而治疗受试者。因此,所述治疗性蛋白典型地是哺乳动物蛋白,特别是人蛋白。
为了治疗血液病症、循环系统的疾病、呼吸系统的疾病、癌症或肿瘤疾病、传染病或免疫缺陷,可以使用下述治疗性蛋白:阿替普酶(Alteplase) (组织型纤溶酶原激活物(tissue plasminogen activator;tPA))(肺栓塞(Pulmonary embolism),心肌梗死(myocardial infarction),急性局部缺血性卒中(acute ischaemic stroke),中央静脉通路装置的阻塞(occlusion of central venous access devices)),阿尼普酶(Anistreplase)(溶栓 (Thrombolysis)),抗凝血酶III(AT-III)(遗传性AT-III不足(Hereditary AT-III deficiency),血栓栓塞(Thromboembolism)),比伐卢定(Bivalirudin)(冠状动脉血管成形术(coronary angioplasty)和肝素诱发的血小板减少症 (heparin-induced thrombocytopaenia)中减少的血液凝结危险),达贝泊汀α(Darbepoetin-α)(治疗患有慢性肾功能不全(chronic renal insufficiency) 和慢性肾衰竭(肾功能不全)(+/-透析)的患者的贫血症(anaemia)),屈曲克凝α(Drotrecogin-α)(活化的蛋白C)(具有高死亡危险的严重败血症 (Severe sepsis)),促红细胞生成素,依泊汀α(Epoetin-α),促血红细胞生长素,红细胞生成素(erthropoyetin)(慢性疾病的贫血症,myleodysplasia,由于肾衰竭或化疗导致的贫血,术前准备),因子IX(血友病B(Haemophilia B)),因子VIIa(患有血友病A或B的患者中的出血和因子VIII或因子IX 的抑制剂),因子VIII(血友病A(HaemophiliaA)),来匹卢定(Lepirudin) (肝素诱发的血小板减少症(Heparin-induced thrombocytopaenia)),蛋白质 C浓缩剂(静脉血栓形成(Venousthrombosis),暴发性紫癜(Purpura fulminans)),瑞替普酶(Reteplase)(tPA的缺失突变蛋白)(急性心肌梗死 (acute myocardial infarction)的管理,心室功能的改善),链激酶(急性进展性透壁性心肌梗死(Acute evolving transmural myocardial infarction),肺栓塞(pulmonary embolism),深静脉血栓形成(deep vein thrombosis),动脉血栓形成(arterial thrombosis)或栓塞(embolism),动静脉插管闭塞 (occlusion ofarteriovenous cannula)),替奈普酶(Tenecteplase)(急性心肌梗死),尿激酶(肺栓塞),血管抑素(癌症),抗-CD22免疫毒素(复发的 CD33+急性髓性白血病(Relapsed CD33+acutemyeloid leukaemia)),地尼白介素-毒素连接物(Denileukin difiitox)(皮肤T细胞淋巴瘤(Cutaneous T-cell lymphoma,CTCL)),Immunocyanin(膀胱和前列腺癌(bladder andprostate cancer)),MPS(Metallopanstimulin)(癌症),Aflibercept(非小细胞肺癌(Non-small cell lung cancer,NSCLC),转移性结直肠癌(metastatic colorectal cancer,mCRC),激素难治性转移性前列腺癌(hormone-refractorv metastatic prostatecancer),湿性黄斑变性(wet macular degeneration)),内皮抑素(Endostatin)(癌症,炎性疾病,如类风湿性关节炎(rheumatoid arthritis)以及克罗恩病(Crohn’s disease),糖尿病视网膜病变(diabetic retinopathy),银屑病(psoriasis)和子宫内膜异位症(endometriosis)),胶原酶(慢性皮肤溃疡(chronic dermal ulcers)和严重烧伤区域(severely burned areas)的清创术,迪皮特朗挛缩(Dupuytren′s contracture),佩罗尼病(Peyronie′s disease)),人脱氧核糖核酸酶I,链道酶(dornase)(囊性纤维化(Cysticfibrosis);减少所选的患有FVC的患者中的呼吸道感染,大于预测的40%),透明质酸酶(用作佐剂以增加注射的药物的吸收和分散,特别是眼科手术中的麻醉剂和特定的成像剂的吸收和分散),木瓜蛋白酶 (坏死组织的清创或急性和慢性损伤中腐肉的软化,诸如压力性溃疡 (pressure ulcers),曲张性和糖尿病性溃疡(varicose and diabetic ulcers),烧伤(burns),术后伤口(postoperative wounds),藏毛囊肿伤口(pilonidal cyst wounds),痈(carbuncles),以及其他伤口),L-天冬酰胺酶(急性淋巴性白血病(Acute lymphocyticleukaemia),其需要外源性天冬酰胺进行增殖),Peg-天冬酰胺酶(急性淋巴性白血病,其需要外源性天冬酰胺进行增殖),拉布立酶(Rasburicase)(患有白血病(1eukaemia)、淋巴瘤(1ymphoma) 和实体瘤的正在进行引起肿瘤溶解综合征(tumour lysis syndrome)的抗癌疗法的儿科患者),人慢性促性腺素(Human chorionic gonadotropin,HCG) (辅助的生殖),人促卵泡激素(follicle-stimulating hormone,FSH)(辅助的生殖),促黄体素-α(Lutropin-α)(具有促黄体激素不足的不育(Infertility with luteinizing hormonedeficiency)),催乳素(低泌乳素血症 (Hypoprolactinemia),血清催乳素不足(serumprolactin deficiency),妇女卵巢功能不全(ovarian dysfunction in women),焦虑(anxiety),动脉生成性勃起功能障碍(arteriogenic erectile dysfunction),早泄(premature ejaculation),精子减少症(oligozoospermia),精子活力不足(asthenospermia),精囊功能不良(hypofunction of seminal vesicles),男性的雄激素缺乏症(hypoandrogenism)),α-1-蛋白酶抑制剂(先天性抗胰蛋白酶缺乏(Congenitalantitrypsin deficiency)),乳糖酶(由于乳糖消化不能(inability to digest lactose)引起的胀气(Gas)、胃气胀(bloating)、痛性痉挛(cramps)和腹泻(diarrhoea)),胰酶(脂肪酶,淀粉酶,蛋白酶 (protease))(囊性纤维化,慢性胰腺炎(chronic pancreatitis),胰腺功能不全(pancreatic insufficiency),Billroth II胃分流术后(post-Billroth IIgastric bypass surgery),胰管阻塞(pancreatic duct obstruction),脂肪泻(steatorrhoea),消化不良(poor digestion),胀气(gas),胃气胀(bloating)),腺苷脱氨酶(牛培加酶(pegademase bovine,PEG-ADA))(由于腺苷脱氨酶不足导致的严重组合性免疫缺陷疾病(Severe combined immunodeficiency disease)),阿巴他塞(Abatacept)(类风湿性关节炎(Rheumatoid arthritis) (尤其是当耐受TNFα抑制时)),阿来法塞(Alefacept)(斑块状银屑病(Plaque Psoriasis)),阿那白滞素(Anakinra)(类风湿性关节炎),依那西普 (Etanercept)(类风湿性关节炎,多关节病程幼年型类风湿关节炎(polyarticular-course juvenile rheumatoid arthritis),银屑病关节炎 (psoriaticarthritis),强直性脊柱炎(ankylosing spondylitis),斑块状银屑病,强直性脊柱炎),白细胞介素-1(IL-1)受体拮抗剂,阿那白滞素 (Anakinra)(与类风湿关节炎相关的炎症和软骨降解(cartilage degradation)),胸腺素(Thymulin)(神经变性病(neurodegenerativediseases),风湿病(rheumatism),神经性厌食症(anorexia nervosa)),TNF-α拮抗剂 (自身免疫病症,诸如类风湿性关节炎,强直性脊柱炎,克罗恩病,银屑病,化脓性汗腺炎(hidradenitis suppurativa),难治性哮喘(refractory asthma)),恩夫韦肽(Enfuvirtide)(HIV-1感染)和胸腺素α1(乙型和丙型肝炎(Hepatitis B和C))。
(括号中是在治疗中使用所述治疗性蛋白的具体的疾病)
在进一步的方面,本发明提供载体,所述载体包含
a.可读框(ORF)和/或例如用于插入可读框或包含可读框的序列克隆位点;和
b.至少一个3’-非翻译区元件(3’-UTR元件)和/或至少一个5’-非翻译区元件(5’-UTR元件),其中所述至少一个3’-UTR元件和/或所述至少一个5’-UTR元件延长和/或增加从所述人工核酸分子的蛋白生产,并且其中所述至少一个3’-UTR元件和/或所述至少一个5’-UTR元件源自稳定 mRNA。
通常,根据本发明的载体可以包含如上文所述的根据本发明的人工核酸分子。尤其是,上述对于根据本发明的人工核酸分子的优选的实施方案也适用于根据本发明的载体包含的根据本发明的人工核酸分子。例如,在本发明的载体中,所述至少一个3’-UTR元件和/或所述至少一个5’-UTR 元件和ORF对于根据本发明的人工核酸分子如上文所述,包括优选的实施方案。例如,在根据本发明的载体中,所述至少一个3’-UTR元件和/或所述至少一个5’-UTR元件源自的稳定mRNA可以优选特征为mRNA降解,其中所述mRNA在第二时间点的量与所述mRNA在第一时间点的量的比率是至少0.5(50%),至少0.6(60%),至少0.7(70%),至少0.75(75%),至少0.8(80%),至少0.85(85%),至少0.9(90%),或至少0.95(95%)。
所述克隆位点可以是适于引入可读框或包含可读框的序列的任何序列,比如一种以上限制位点。因此,包含克隆位点的载体优选适于将可读框插入所述载体,优选适于将可读框插入5′-UTR元件的3′和/或3′-UTR元件的 5′。优选所述克隆位点或所述ORF位于5′-UTR元件的3′和/或3′-UTR元件的5′,优选紧邻5′-UTR元件的3′端和/或3′-UTR元件的5′端。例如,所述克隆位点或所述ORF可以紧接于所述5′-UTR元件的3′端和/或所述 3′-UTR元件的5′端或它们可以通过如上文描述的用于根据本发明的人工核酸分子的一段核苷酸,比如通过一段2,4,6,8,10,20等个核苷酸连接。
优选根据本发明的载体适于例如,通过任选地将可读框或包含可读框的序列插入载体并转录所述载体生产根据本发明的人工核酸分子,优选适于生产根据本发明的人工mRNA。因此,优选地,所述载体包含转录所需的元件,如启动子,例如RNA聚合酶启动子。优选地,所述载体适于使用真核、原核、病毒或噬菌体转录系统,如真核细胞、原核细胞,或真核、原核、病毒或噬菌体体外转录系统转录。因此,例如,所述载体可以包含启动子序列,所述启动子序列被聚合酶,如RNA聚合酶,例如真核、原核、病毒、或噬菌体RNA聚合酶识别。在一个优选的实施方案中,所述载体包含噬菌体RNA聚合酶启动子如SP6、T3或T7,优选T7启动子。优选地,所述载体适于使用基于噬菌体的体外转录系统,如基于T7 RNA聚合酶的体外转录系统体外转录。在另一优选的实施方案中,载体可以直接用于在细胞或组织中表达编码的肽或蛋白。为此,载体包含在那些细胞/组织例如特定启动子序列中所必需的特定元件,如CMV启动子。
所述载体还可以包含如上文对于根据本发明的人工核酸分子描述的聚腺苷酸序列和/或聚腺苷酸化信号。
所述载体可以是RNA载体或DNA载体。优选地,所述载体是DNA 载体。所述载体可以是技术人员已知的任何载体,如病毒载体或质粒载体。优选地,所述载体是质粒载体,优选DNA质粒载体。
在一个优选的实施方案中,根据本发明的载体包含根据本发明的人工核酸分子。
优选地,根据本发明的DNA载体包含与基因的转录本的3’-UTR的核酸序列,如与根据SEQ ID NOs:1至24和SEQ ID NOs:49至318的核酸序列具有至少约1,2,3,4,5,10,15,20,30或40%,优选至少约50%,优选至少约60%,优选至少约70%,更优选至少约80%,更优选至少约 90%,甚至更优选至少约95%,甚至更优选至少约99%,最优选100%的同一性的核酸序列。
优选地,根据本发明的DNA载体包含与基因的转录本的5’-UTR的核酸序列,如与根据SEQ ID NOs:25至30和SEQ ID NOs:319至382 的核酸序列具有至少约1,2,3,4,5,10,15,20,30或40%,优选至少约50%,优选至少约60%,优选至少约70%,更优选至少约80%,更优选至少约90%,甚至更优选至少约95%,甚至更优选至少约99%,最优选 100%同一性的核酸序列。
优选地,根据本发明的DNA载体包含选自由以下各项组成的组的序列:根据SEQ IDNOs.1至30的DNA序列或与根据SEQ ID NOs.1至30 的DNA序列具有至少约40%,优选至少约50%,优选至少约60%,优选至少约70%,更优选至少约80%,更优选至少约90%,甚至更优选至少约 95%;甚至更优选至少约99%序列同一性的序列或其片段(如上文所述的),优选其功能性片段。
优选地,根据本发明的RNA载体包含选自由以下各项组成的组的序列:根据对应于根据SEQ ID NOs:1至30的DNA序列的RNA序列的序列或与对应于根据SEQ ID NOs:1至30的DNA序列的RNA序列具有至少约40%,优选至少约50%,优选至少约60%,优选至少约70%,更优选至少约80%,更优选至少约90%,甚至更优选至少约95%;甚至更优选至少约99%序列同一性的序列或其片段,优选其功能性片段。
优选地,所述载体是环状分子。优选地,所述载体是双链分子,如双链DNA分子。此种环状,优选双链DNA分子对于本发明的人工核酸分子可以作为储存形式方便使用。此外,其可以用于转染细胞,例如,培养的细胞。其还可以用于体外转录以获得根据本发明的人工RNA分子。
优选地,所述载体,优选环状载体是例如,通过限制性酶消化线性化的。在一个优选的实施方案中,所述载体包含切割位点,如限制性位点,优选独特的切割位点,所述切割位点紧位于ORF的3′,或-如果存在-紧位于3′-UTR元件的3′,或-如果存在-位于聚腺苷酸序列或聚腺苷酸化信号的 3′,或-如果存在-位于聚胞苷酸序列的3′,或-如果存在-位于组蛋白茎环的 3′。因此,优选通过线性化载体获得的产物在3′末端以ORF的3′末端,或 -如果存在-以3′-UTR元件的3′端,或-如果存在-以聚腺苷酸序列或聚腺苷酸化信号的3′端,或-如果存在-以聚胞苷酸序列的3′端终止。在该实施方案中,其中根据本发明的载体包含根据本发明的人工核酸分子,限制位点,优选独特限制位点,所述限制位点优选紧位于人工核酸分子的3′端的3′。
在一个进一步地方面,本发明涉及一种细胞,所述细胞包含根据本发明的人工核酸分子或根据本发明的载体。所述细胞可以是任何细胞,如细菌细胞,昆虫细胞,植物细胞,脊椎动物细胞,例如哺乳动物细胞。此种细胞可以,例如,用于本发明的载体的复制,例如,在细菌细胞中。此外,所述细胞可以用于转录根据本发明的人工核酸分子或载体和/或翻译根据本发明的人工核酸分子或载体的可读框。例如,所述细胞可以用于重组蛋白生产。
根据本发明的细胞可,例如,通过标准核酸转移方法,如标准转染、转导或转化方法获得。例如,可以将根据本发明的人工核酸分子或载体通过电穿孔,脂转染,例如基于阳离子脂和/或脂质体,磷酸钙沉淀,基于纳米粒子的转染,基于病毒的转染,或基于阳离子聚合物,如DEAE-葡聚糖或聚乙烯亚胺等转入所述细胞。
优选地,所述细胞是哺乳动物细胞,如人受试者,家畜,实验室动物,如小鼠或大鼠细胞。优选所述细胞是人细胞。所述细胞可以是建立的细胞系的细胞,如CHO,BHK,293T,COS-7,HELA,HEK等,或所述细胞可以是原代细胞,比如人皮肤成纤维细胞(HDF)细胞等,优选分离自生物体的细胞。在一个优选的实施方案中,所述细胞是哺乳动物受试者,优选人受试者的分离的细胞。例如,所述细胞可以是优选哺乳动物受试者,优选人受试者的免疫细胞,如树突细胞,癌症或肿瘤细胞,或任何体细胞等。
在一个进一步地方面,本发明提供一种药物组合物,所述药物组合物包含根据本发明的人工核酸分子,根据本发明的载体,或根据本发明的细胞。根据本发明的药物组合物可以用作,例如疫苗,例如用于基因接种。因此,所述ORF可以,例如,编码将要施用于患者用于疫苗接种的抗原。因此,在一个优选的实施方案中,根据本发明的药物组合物是疫苗。此外,根据本发明的药物组合物可以用于例如基因治疗。
优选地,所述药物组合物还包含一个以上药学可接受载体、稀释剂和/ 或赋形剂和/或一种以上辅剂。在本发明范围内,药学可接受的载体典型地包括对于本发明的药物组合物的液体或非液体基础。在一个实施方案中,以液体形式提供所述药物组合物。在此种情况下,优选地,所述载体基于水,如无热原水,等渗盐水或缓冲的(含水)溶液,例如磷酸盐,柠檬酸盐等缓冲的溶液。所述缓冲液可以就特定参考介质而言是高渗的,等渗的或低渗的,即就特定参考介质而言,所述缓冲液可以具有更高,相同的或更低的含量,其中优选可以使用之前提到的盐的此种浓度,其不导致由于渗透或其他浓度效应的哺乳动物细胞的破坏。参考介质为例如在“体内”方法中存在的液体,如血液,淋巴,细胞内液,或其它液体,或例如可以在“体外”方法中用作参考介质的液体,如常见缓冲液或液体。此种常见缓冲液或液体是技术人员已知的。林格乳酸盐溶液作为液体基础是尤其优选的。
对于本发明的药物组合物,也可以使用适于施用于患者的一种以上相容的固体或液体填充物或稀释剂或形成包封化合物。如本文使用的术语“相容的”优选意为本发明的药物组合物的这些组分能够以无在典型的使用条件下将基本上降低本发明的药物组合物药学有效性的相互作用存在的方式与如本文限定的发明的人工核酸、载体或细胞混合。
根据本发明的药物组合物还可以任选地包含一个以上另外的药学活性组分。在此种情况下,药学活性组分是对治愈,缓解或预防特定适应证或疾病呈现治疗效果的化合物。此种化合物包括,不暗含任何限制,肽或蛋白,核酸,(治疗上活性的)低分子量有机或无机化合物(分子量小于5000,优选小于1000),糖,抗原或抗体,现有技术中已知的治疗剂,抗原细胞,抗原细胞片段,细胞级分,细胞壁组分(例如多糖),修饰的,减毒的或灭活的(例如化学地或通过放射)病原体(病毒,细菌等)。
此外,本发明的药物组合物可以包含用于人工核酸分子或载体(vector) 的载体(carrier)。此种载体可以适于介导生理可接受液体中的溶解,药学活性人工核酸分子或载体的转运和细胞摄取。因此,此种载体可以是可以适于储存和递送根据本发明的人工核酸分子或载体的组分。此种组分可以是,例如,阳离子或聚阳离子载体或可以用作转染或复合剂的化合物。
在此种情况下,尤其优选的转染或复合剂是阳离子或聚阳离子化合物,包括鱼精蛋白,核仁蛋白(nucleoline),精胺或亚精胺,或其它阳离子肽或蛋白,如聚-L-赖氨酸(PLL),聚-精氨酸,碱性多肽,细胞穿透肽(CPP),包括HIV-结合肽,HIV-1Tat(HIV),源自Tat的肽,Penetratin,源自VP22 的或类似物肽,HSV VP22(单纯疱疹),MAP,KALA或蛋白转导结构域 (PTDs),PpT620,富脯氨酸肽,富精氨酸肽,富赖氨酸肽,MPG-肽,Pep-1, L-寡聚物,降钙素肽,源自触角足的肽(尤其源自果蝇触角足),pAntp,pIsl, FGF,乳铁蛋白,Transportan,Buforin-2,Bac715-24,SynB,SynB(1), pVEC,源自hCT的肽,SAP,或组蛋白。
此外,此种阳离子或聚阳离子化合物或载体可以是阳离子或聚阳离子肽或蛋白,其优选包含或另外修饰以包含至少一个SH部分。优选地,阳离子或聚阳离子载体选自具有以下求和公式(I)的阳离子肽:
{(Arg)l;(Lys)m;(His)n;(Orn)o;(Xaa)x}; 公式(I)
其中l+m+n+o+x=3-100,并且假如Arg(精氨酸),Lys(赖氨酸), His(组氨酸)和Orn(鸟氨酸)的总含量代表寡肽的所有氨基酸的至少10%,l,m,n或o相互独立地是选自0,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21-30,31-40,41-50,51-60,61-70,71-80,81-90和91-100的任何数;并且Xaa是选自除了Arg,Lys, His或Orn外的天然(=天然存在的)或非天然氨基酸的任何氨基酸;并且假设Xaa的总含量不超过寡肽的所有氨基酸的90%,x是选自0,1,2, 3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21-30,31-40,41-50,51-60,61-70,71-80,81-90的任何数。氨基酸Arg, Lys,His,Orn和Xaa的任一个可以置于肽的任何位置。在此种情况下,在7-30个氨基酸范围内的阳离子肽或蛋白是特别优选的。
进一步地,当根据公式{(Arg)l;(Lys)m;(His)n;(Orn)o;(Xaa)x}(公式(I))限定的,如上文显示的,并包含或另外修饰以包含至少一个-SH部分的所述阳离子或聚阳离子肽或蛋白,可以,并不限于,选自子公式(Ia):
{(Arg)l;(Lys)m;(His)n;(Orn)o;(Xaa′)x(Cys)y} 子公式(Ia)
其中(Arg)l;(Lys)m;(His)n;(Orn)o;和x为如本文限定的,Xaa′是选自除了Arg,Lys,His,Orn或Cys之外的天然(=天然存在的)或非天然氨基酸的任何氨基酸,并且假如Arg(精氨酸),Lys(赖氨酸),His(组氨酸)和Orn(鸟氨酸)的总含量代表寡肽的所有氨基酸的至少10%,y是选自0,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17, 18,19,20,21-30,31-40,41-50,51-60,61-70,71-80和81-90的任何数。进一步地,所述阳离子或聚阳离子肽可以选自子公式(Ib):
Cys1{(Arg)l;(Lys)m;(His)n;(Orn)o;(Xaa)x}Cys2 子公式(Ib)
其中凭经验的公式{(Arg)l;(Lys)m;(His)n;(Orn)o;(Xaa)x} (公式(III))
为如本文限定的并且形成根据(半经验的)公式(III)的氨基酸序列的核心并且其中Cys1和Cys2是邻近,或位于(Arg)l;(Lys)m;(His)n;(Orn)o;(Xaa)x末端的半胱氨酸。
可以用作转染或复合剂的特别优选的阳离子或聚阳离子化合物可以包括阳离子多糖,例如,壳聚糖,1,5-二甲基-1,5-二氮十一亚甲基聚甲溴化物(polybrene),阳离子聚合物,例如,聚乙烯亚胺(PEI),阳离子脂质,例如,DOTMA:[1-(2,3-二油酰氧基)丙基)]-N,N,N-三甲基氯化铵,DMRIE,二-C14-脒,DOTIM,SAINT,DC-Chol,BGTC,CTAP,DOPC,DODAP,DOPE:二油基磷脂酰乙醇胺,DOSPA,DODAB,DOIC,DMEPC,DOGS:Dioctadecylamidoglicylspermin,DIMRI:二肉豆蔻酰-氧丙基二甲基羟乙基溴化铵,DOTAP:二油基氧基-3-(三甲基铵基)丙烷,DC-6-14:O,O-双十四酰基-N-(α-三甲基铵基乙酰基)二乙醇胺氯化物,CLIP1:外消旋-[(2,3-双十八基氧基丙基)(2-羟乙基)]-二甲基氯化铵,CLIP6:外消旋-[2(2,3-双十六基氧基丙基-氧基甲氧基)乙基]三甲基铵,CLIP9:外消旋-[2(2,3-双十六基氧基丙基-氧基琥珀酰基氧基)乙基]-三甲基铵,oligofectamine,或阳离子或聚阳离子聚合物,例如,修饰的聚氨基酸,诸如β-氨基酸-聚合物或反向聚酰胺(reversed polyamides)等,改性的聚乙烯,诸如PVP(聚(N-乙基-4-乙烯基吡啶溴化物))等,改性的丙烯酸酯,诸如pDMAEMA(聚(二甲基氨基乙基丙烯酸甲酯))等,改性的氨基胺(Amidoamines),诸如pAMAM(聚 (氨基胺))等,改性的聚β氨基酯(PBAE),诸如二胺末端修饰的1,4丁二醇双丙烯酸酯-共-5-氨基-1-戊醇聚合物等,树枝状聚合物(dendrimers),诸如聚丙胺树枝状聚合物或基于pAMAM的树枝状聚合物等,聚亚胺,诸如 PEI:聚(乙烯亚胺),聚(丙烯亚胺)等,聚烯丙基胺,基于糖骨架的聚合物,诸如基于环糊精的聚合物,基于葡聚糖的聚合物,壳聚糖等,基于甲硅烷骨架的聚合物,诸如PMOXA-PDMS共聚物等,由一个或多个阳离子嵌段 (例如选自上文提及的阳离子聚合物)的组合和一个或多个亲水或疏水嵌段(例如,聚乙二醇)的组合组成的嵌段聚合物等。
根据另一实施方案,根据本发明的药物组合物可以包含佐剂以增强药物组合物的免疫刺激性质。在该情况下,佐剂可以理解为任何适于支持根据本发明的药物组合物中包含的组分如人工核酸分子或载体的施用和递送的化合物。此外,所述佐剂可以(但不限于其中)起始或增加先天免疫系统的免疫应答,即非特异性免疫应答。换句话说,当施用时,根据本发明的药物组合物典型地起始针对人工核酸分子编码的抗原的适应性免疫应答。此外,由于将如本文定义的佐剂加入至根据本发明的药物组合物,根据本发明的药物组合物可以产生(支持的)先天免疫应答。
所述佐剂可以选自技术人员已知的和适于目前情形,即支持在哺乳动物中又到免疫反应的佐剂。优选为,佐剂可以是选自但不限于由以下各项组成的组:TDM,MDP,胞壁酰二肽,普流罗尼克(pluronics),明矾溶液,氢氧化铝,ADJUMERTM(聚膦腈);磷酸铝凝胶;来自藻类的葡聚糖类;algammulin;氢氧化铝凝胶(明矾);高蛋白吸附的氢氧化铝凝胶;低粘度氢氧化铝凝胶;AF或SPT(角鲨烷乳液(5%),吐温80(0.2%),普流罗尼克(Pluronic)L121(1.25%),磷酸缓冲盐水,pH 7.4);AVRIDINETM(丙二胺);BAY R1005TM((N-(2-脱氧-2-L-亮氨酰氨基-b-D-吡喃葡糖基)-N- 十八基-十二烷酰-酰胺氢乙酸盐);CALCITRIOLTM(1-α,25-二羟基-维生素 D3);磷酸钙凝胶;CAPTM(磷酸钙纳米颗粒);霍乱全毒素,霍乱-毒素-A1- 蛋白-A-D-片段融合蛋白,霍乱毒素的亚基B;CRL 1005(嵌段共聚物 P1205);含有细胞一找你的脂质体;DDA(溴化二甲基二-十八基铵);DHEA (脱氢表雄酮);DMPC(二肉豆蔻酰磷脂酰胆碱);DMPG(二肉豆蔻酰磷脂酰甘油);DOC/明矾复合物(脱氧胆酸钠盐);完全弗氏佐剂;不完全弗氏佐剂;γ菊糖;Gerbu佐剂(下述的混合物:i)N-乙酰葡糖胺基-(P1-4)-N-乙酰胞壁酰基-L-丙氨酰-D-谷氨酰胺(GMDP),ii)氯化二甲基二-十八基铵 (DDA),iii)锌-L-脯氨酸盐复合物(ZnPro-8);GM-CSF);GMDP(N-乙酰葡糖胺基-(b1-4)-N-乙酰胞壁酰基-L-丙氨酰-D-异谷氨酰胺);咪喹莫特 (imiquimod)(1-(2-甲基丙基)-1H-咪唑并[4,5-c]喹啉-4-胺);ImmTherTM (N-乙酰葡糖胺基-N-乙酰胞壁酰基-L-Ala-D-异Glu-L-Ala-甘油二棕榈酸酯);DRVs(由脱水-再水合囊泡制备的免疫脂质体);干扰素-γ;白介素-1β;白介素-2;白介素-7;白介素-12;ISCOMSTM;ISCOPREP 7.0.3.TM;脂质体;LOXORIBINETM(7-烯丙基-8-氧代鸟苷);LT口服佐剂(大肠杆菌 (E.coli)不稳定的肠毒素-原毒素);任意组成的微球体和微粒;MF59TM; (角鲨烯水乳液);MONTANIDE ISA 51TM(纯化的不完全弗氏佐剂);MONTANIDE ISA 720TM(可代谢的油佐剂);MPLTM(3-Q-脱酰基-4′-单磷酰基脂质A);MTP-PE和MTP-PE脂质体((N-乙酰基-L-丙氨酰-D-异谷氨酰基-L-丙氨酸-2-(1,2-二棕榈酰-sn-甘油-3-(羟基磷酰基氧基))-乙基酰胺,一钠盐);MURAMETIDETM(Nac-Mur-L-Ala-D-Gln-OCH3);MURAPALMITINETM和D-MURAPALMITINETM(Nac-Mur-L-Thr-D-异 GIn-sn-甘油二棕榈酰基);NAGO(神经氨酸酶-半乳糖氧化酶);任意组成的纳米球体或纳米颗粒;NISVs(非离子表面活性剂囊泡);PLEURANTM (-葡聚糖);PLGA,PGA和PLA(乳酸和乙醇酸的均聚体和共聚体;微球体/纳米球体);普流罗尼克(PLURONIC)L121TM;PMMA(聚甲基丙烯酸甲酯);PODDSTM(类的内部微球体);聚乙烯氨基甲酸酯衍生物;聚-rA:聚-rU(聚腺苷酸-多聚尿苷酸复合物);聚山醇酯80(吐温80);蛋白螺旋物 (Avanti Polar Lipids,Inc.,Alabaster,AL);STIMULONTM(QS-21);Quil-A (Quil-A皂苷);S-28463(4-氨基-otec-二甲基-2-乙氧基甲基-1H-咪唑并[4,5-c] 喹啉-1-乙醇);SAF-1TM(″Syntex佐剂制剂″);Sendai蛋白脂质体和Sendai 含脂质基质;Span-85(三油酸脱水山梨酯);Specol(Marcol 52,Span 85和吐温85的乳液);角鲨烯或(2,6,10,15,19,23-六甲基二十四烷和 2,6,10,15,19,23-六甲-2,6,10,14,18,22-二十四碳六烯);硬脂酰酪氨酸(十八基酪氨酸盐酸盐);(N-乙酰葡糖胺基-N-乙酰胞壁酰基 -L-Ala-D-isoGlu-L-Ala-二棕榈酰氧基丙酰胺);苏氨酰-MDP(TermurtideTM 或[thr 1]-MDP;N-乙酰胞壁酰基-L-苏氨酰-D-异谷氨酰胺);Ty颗粒 (Ty-VLP或病毒样颗粒);Walter-Reed脂质体(包含吸附在氢氧化铝上的脂质A的脂质体),和脂肽,包括Pam3Cys,特别是铝盐,如Adju-phos, Alhydrogel,Rehydragel;乳液,包括CFA,SAF,IFA,MF59,Provax, TiterMax,Montanide,Vaxfectin;共聚物,包括Optivax(CRL1005),L121, Poloaxmer4010),等;脂质体,包括Stealth,螺旋物,包括BIORAL;植物来源的佐剂,包括QS21,Quil A,Iscomatrix,ISCOM;适于共刺激的佐剂,包括蕃茄素(Tomatine),生物聚合物,包括PLG,PMM,菊糖;微生物来源的佐剂,包括罗莫肽(Romurtide),DETOX,MPL,CWS,甘露糖,CpG核酸序列,CPG7909,人TLR 1-10的配体,鼠TLR1-13的配体,ISS-1018,IC31,咪唑并喹啉,聚肌胞(Ampligen),Ribi529,IMOxine, IRIVs,VLPs,霍乱毒素,不耐热毒素,Pam3Cys,鞭毛蛋白(Flagellin), GPI锚定子,LNFPIII/LewisX,抗微生物肽,UC-1V150,RSV融合蛋白, cdiGMP;和适于作为拮抗剂的佐剂,包括CGRP神经肽。
合适的辅剂还可以选自阳离子或聚阳离子化合物,其中所述佐剂优选为基于将药物组合物的人工核酸分子或载体与阳离子或聚阳离子化合物复合来制备。将药物组合物的人工核酸分子或载体与如本文定义的阳离子或聚阳离子化合物关联或复合优选提供佐剂性质并且赋予药物组合物的人工核酸分子或载体稳定的效果。尤其是如此优选的,如此阳离子或聚阳离子化合物选自阳离子或聚阳离子肽或蛋白,包括鱼精蛋白,核仁蛋白,精胺或亚精胺,其它阳离子肽或蛋白,如聚-L-赖氨酸(PLL),聚精氨酸,碱性多肽,碱性多肽(CPP),包括HIV-结合肽,Tat,HIV-1Tat(HIV),Tat- 衍生肽,穿透肽(Penetratin),VP22衍生的或类似物肽,HSV VP22(单纯疱疹病毒),MAP,KALA或蛋白转导结构域(PTD,PpT620,富含脯氨酸的肽,富含精氨酸的肽,富含赖氨酸的肽,MPG-肽,Pep-1,L-寡聚物,降钙素肽,触角足-衍生肽(Antennapedia-derived peptides)(尤其是来自 Drosophila antennapedia),pAntp,pIsl,FGF,乳铁蛋白,Transportan, Buforin-2,Bac715-24,SynB,SynB(1),pVEC,hCT-衍生肽,SAP,鱼精蛋白,精胺,亚精胺,或组蛋白。此外优选的阳离子或聚阳离子化合物可以包括阳离子多糖,例如壳聚糖,聚凝胺,阳离子聚合物,例如聚乙烯亚胺(PEI),阳离子脂,例如DOTMA:1-(2,3-二油酰氧基)丙基)-N,N,N-三甲基氯化铵,DMRIE,二-C14-脒,DOTIM,SAINT,DC-Chol,BGTC, CTAP,DOPC,DODAP,DOPE:二油烯基磷脂酰乙醇胺,DOSPA,DODAB, DOIC,DMEPC,DOGS:二(十八烷基)酰氨基甘氨酰精胺(Dioctadecylamidoglicylspermin),DIMRI:二肉豆蔻酰-氧基丙基二甲基羟乙基溴化铵,DOTAP:二油酰氧-3-(三甲基胺基)丙烷,DC-6-14:O,O-二(四癸酰基)-N-(-三甲基胺基乙酰)氯化二乙醇胺,CLIP1:外消旋-[(2,3-双十八烷氧基丙基)(2-羟乙基)]-二甲基氯化铵,CLIP6:外消旋-[2(2,3-双十六烷氧基丙基-氧甲氧基)乙基]三甲基铵,CLIP9:外消旋-[2(2,3-双十六烷氧基丙基-氧琥珀酰氧)乙基]-三甲基铵,阳离子脂质体(oligofectamine),或阳离子或聚阳离子聚合物,例如修饰的聚氨基酸,如-氨基酸-聚合物或反向聚酰胺等,修饰的聚乙烯,如PVP(聚(N-乙基-4-溴化乙烯基吡啶鎓))等,修饰的丙烯酸盐,如pDMAEMA(聚(二甲基氨基乙基甲基丙烯酸盐))等,修饰的酰胺基胺如pAMAM(聚(酰胺基胺))等,修饰的聚β氨基酯(PBAE),如二胺末端修饰的1,4丁二醇二丙烯酸酯-共-5-氨基-1-戊醇聚合物等,树状聚合物,如聚丙基胺树状聚合物或基于pAMAM的树状聚合物等,聚亚胺,如PEI:聚(乙烯亚胺),聚(丙烯亚胺)等,聚丙烯基胺,基于糖骨架的聚合物,如基于环糊精的聚合物,基于葡聚糖的聚合物,壳聚糖等,基于硅烷骨架的聚合物,如PMOXA-PDMS共聚物等,由一个以上阳离子嵌段(例如选自如上文提到的阳离子聚合物)和一个以上亲水或疏水嵌段(如聚乙二醇)的组合组成的嵌段聚合物;等。
此外,可以通过将组合物的人工核酸分子或载体,优选RNA复合而用作佐剂的优选的阳离子或聚阳离子蛋白或肽,可以选自以下具有以下总式(I)的蛋白或肽:(Arg)l;(Lys)m;(His)n;(Orn)o;(Xaa)x,其中l+m+n+o+ x=8-15,并且可以l、m、n或o彼此独立是选自0、1、2、3、4、5、6、 7、8、9、10、11、12、13、14或15的任意数,条件是Arg、Lys、His和 Orn的总含量代表寡肽的所有氨基酸的至少50%;并且Xaa可以是选自除了Arg、Lys、His或Orn的天然(=天然存在)或非天然氨基酸的任何氨基;并且x可以是选自0、1、2、3或4的任意数,条件是Xaa的含量总不超过寡肽的所有氨基酸的50%。在该情况下尤其优选的寡精氨酸是例如 Arg7、Arg8、Arg9、Arg7、H3R9、R9H3、H3R9H3、YSSR9SSY、(RKH)4、 Y(RKH)2R等。
人工核酸或载体与阳离子或聚阳离子化合物的比例可以基于整个核酸复合物的氮/磷比(N/P-比)确定。例如,1μg RNA通常含有约3nmol磷酸酯残基,条件是RNA显示碱基的统计学分布。此外,1μg肽通常含有约 x nmol氮残基,这取决于碱性氨基酸的分子量和数量。当示例性地对(Arg)9 (分子量1424g/mol,9个氮原子)进行计算时,1μg(Arg)9含有约700pmol (Arg)9并且因此700x 9=6300pmol碱性氨基酸=6.3nmol氮原子。对于约 1∶1RNA/(Arg)9的质量比,可以计算N/P比为约2。当利用2μg RNA示例性地计算鱼精蛋白(分子量约4250g/mol,21个氮原子,当使用来自鲑鱼的鱼精蛋白时)具有约2∶1的质量比时,对RNA计算为6nmol磷酸酯; 1μg鱼精蛋白含有约235pmol鱼精蛋白分子并且因此235x 21=4935pmol碱性氮原子=4.9nmol氮原子。对于约2∶1RNA/鱼精蛋白的质量比,可以计算出约0.81的N/P比。对于约8∶1RNA/鱼精蛋白的质量比,可以计算约0.2的N/P比。在本发明的情况下,关于复合物中核酸∶肽的比例,N/P-比优选在约0.1-10的范围内,优选在约0.3-4的范围内,并且最优选在约0.5-2或0.7-2的范围内,并且最优选在约0.7-1.5的范围内。
专利申请WO2010/037539(其公开内容通过引用并入本文),描述了免疫刺激组合物和用于制备免疫刺激组合物的方法。因此,在本发明的优选的实施方案中,以两个分开的步骤获得组合物,从而获得根据本发明的人工核酸分子的有效免疫刺激作用和有效翻译。其中,所谓的“佐剂组分”在第一步骤中将佐剂组分的人工核酸分子或载体,优选RNA与阳离子或聚阳离子化合物以特定比例复合从而形成稳定复合体来制备。在该情况下,重要的是,在复合核酸后,没有游离阳离子或聚阳离子化合物或仅可忽略的小量留存在佐剂组分中。因此,佐剂组分中核酸和阳离子或聚阳离子化合物的比例通常在核酸被整体复合并且在组合物中没有游离阳离子或聚阳离子化合物或仅有可忽略小量残留的范围内选择。优选地,佐剂组分的比例,即核酸与阳离子或聚阳离子化合物的比例选自约6∶1(w/w)至约 0,25∶1(w/w),更优选约5∶1(w/w)至约0,5∶1(w/w),甚至更优选约4∶1(w/w) 至约1∶1(w/w)或约3∶1(w/w)至约1∶1(w/w)的范围内,并且最优选约3∶1 (w/w)至约2∶1(w/w)的比例。
根据优选的实施方案,在第二步,将根据本发明的人工核酸分子或载体,优选RNA分子,加入至佐剂组分的复合的核酸分子,优选RNA中,从而形成本发明的(免疫刺激)组合物。其中,加入本发明的人工核酸分子或载体,优选为RNA为游离核酸,即未与其他化合物复合的核酸。加入之前,游离人工核酸分子或载体未复合并且将优选在加入佐剂组分时不经历任何可检测或显著的复合反应。
合适的辅剂可以此外选自具有式(II)的核酸:GlXmGn,其中:G是鸟苷、尿嘧啶或鸟苷或尿嘧啶的类似物;X是鸟苷、尿嘧啶、腺苷、胸苷、胞嘧啶或上述核苷酸的类似物;l是1至40的整数,其中当l=1时,G 是鸟苷或其类似物,当l>1时,至少50%的核苷酸是鸟苷或其类似物;m 是整数并至少是3;其中当m=3时,X是尿嘧啶或其类似物,当m>3 时,存在至少3个连续的尿嘧啶或尿嘧啶类似物;n是1至40的整数,其中当n=1时,G是鸟苷或其类似物,当n>1时,至少50%的核苷酸是鸟苷或其类似物。
此外其他合适的辅剂可以选自具有式(III)的核酸:ClXmCn,其中:C 是胞嘧啶、尿嘧啶或胞嘧啶或尿嘧啶的类似物;X是鸟苷、尿嘧啶、腺苷、胸苷、胞嘧啶或上述核苷酸的类似物;l是1至40的整数,其中当l=1 时,C是胞嘧啶或其类似物,当l>1时,至少50%的核苷酸是胞嘧啶或其类似物;m是整数并且至少是3;其中当m=3时,X是尿嘧啶或其类似物,当m>3时,存在至少3个连续的尿嘧啶或尿嘧啶的类似物;n是1 至40的整数,其中当n=1时,C是胞嘧啶或其类似物,当n>1时,至少50%的核苷酸是胞嘧啶或其类似物。
根据本发明的药物组合物优选包含“安全和有效量”的药物组合物组分,尤其是如本文限定的本发明的人工核酸分子,载体和/或细胞。如本文使用的,“安全和有效量”意为足以显著诱导如本文限定的疾病或疾病的积极改进的量。然而同时,“安全和有效量”优选避免严重的副作用并且允许益处和风险间的合理关系。这些限制的确定典型地处于合理的医学判断范围中。
在一个进一步地方面,本发明提供(在基因接种中)或在基因治疗中用作药物,例如,用作疫苗的根据本发明的人工核酸分子,根据本发明的载体,根据本发明的细胞,或根据本发明的药物组合物。
根据本发明的人工核酸分子,根据本发明的载体,根据本发明的细胞,或根据本发明的药物组合物尤其适于任何医学应用,其使用肽、多肽或蛋白的治疗作用或效果,或其中需要特定肽或蛋白的补充。因此,本发明提供根据本发明的人工核酸分子,根据本发明的载体,根据本发明的细胞,或根据本发明的药物组合物用于治疗或预防接受通过肽、多肽或蛋白的治疗作用或效果的治疗或接受通过补充特定肽、多肽或蛋白的治疗的疾病或疾病。例如,根据本发明的人工核酸分子,根据本发明的载体,根据本发明的细胞,或根据本发明的药物组合物可以用于例如,通过基因接种或基因治疗治疗或预防遗传病,自身免疫疾病,癌症或肿瘤相关疾病,感染性疾病,慢性病等。
尤其,从在要被治疗的受试者中治疗肽、多肽或蛋白的增加和延长的存在获益的此种治疗性处理尤其适合作为本发明范围内的医学应用,因为本发明的3′-UTR元件提供稳定和延长的本发明的人工核酸分子或载体的编码的肽或蛋白的表达,和/或本发明的5′-UTR元件提供增加的本发明的人工核酸分子或载体的编码的肽或蛋白的表达。因此,根据本发明的人工核酸分子,根据本发明的载体,根据本发明的细胞,或根据本发明的药物组合物的尤其合适的医学应用是疫苗接种。因此,本发明提供用于接种受试者,优选哺乳动物受试者,更优选人受试者的根据本发明的人工核酸分子,根据本发明的载体,根据本发明的细胞,或根据本发明的药物组合物。优选的疫苗接种治疗是针对感染性疾病,如细菌,原虫或病毒感染的接种,和抗肿瘤-接种。此种接种治疗可以是预防性的或治疗性的。
根据要治疗或预防的疾病,可以选择ORF。例如,所述可读框可以编码必须提供给患有完全缺少或至少部分缺失蛋白的功能的患者,如患有遗传病的患者的蛋白。另外,所述可读框可以选自编码有利影响受试者疾病或病状的肽或蛋白的ORF。此外,所述可读框可以编码有效下调天然肽或蛋白的病理过量生产或消除病理表达蛋白或肽的细胞的肽或蛋白。此种功能的缺少、缺失或过量生产可以,例如,发生在肿瘤和瘤形成,自身免疫疾病,过敏,感染,慢性病等的情况下。此外,所述可读框可以编码抗原或免疫原,例如编码病原体的表位或编码肿瘤抗原。因此,在优选的实施方案中,根据本发明的人工核酸分子或载体包含编码包含以下或由以下组成的氨基酸序列的ORF:抗原或免疫原,例如病原体的表位或肿瘤相关抗原,如上文描述的3′-UTR元件和/或上文所述的5′-UTR元件,和任选的进一步组分,例如聚腺苷酸序列等。
在医学应用的情况下,尤其,在接种的情况下,优选根据本发明的人工核酸分子是RNA,优选mRNA,因为DNA含有引起抗DNA免疫应答的风险并且倾向于插入基因组DNA。然而,在一些实施方案中,例如,如果例如,在基因治疗处理的情况下,病毒递送载体,如腺病毒递送载体用于递送根据本发明的人工核酸分子或载体,所述人工核酸分子或所述载体是DNA分子可以是可取的。
根据本发明的人工核酸分子,根据本发明的载体,根据本发明的细胞,或根据本发明的药物组合物可以口服,肠胃外,通过吸入喷雾,局部,直肠,经鼻,经颊,阴道或通过移植的储器施用。如本文使用的术语肠胃外包括皮下,静脉内,肌肉内,关节内,滑膜内,胸骨内,鞘内,肝内,病灶内,颅内,经皮,皮内,肺内,腹膜内,心脏内,动脉内,和舌下注射或输注技术。在优选的实施方案中,根据本发明的人工核酸分子,根据本发明的载体,根据本发明的细胞,或根据本发明的药物组合物经由无针头注射(例如喷雾注射)施用。
优选地,根据本发明的人工核酸分子,根据本发明的载体,根据本发明的细胞,或根据本发明的药物组合物例如通过肠胃外注射,更优选通过皮下,静脉内,肌肉内,关节内,滑膜内,胸骨内,鞘内,肝内,病灶内,颅内,经皮,皮内,肺内,腹膜内,心脏内,动脉内,舌下注射或通过输注技术被肠胃外施用。尤其优选的是皮内和肌肉内注射。本发明的药物组合物无菌可注射形式可以是水质或油质悬液。可以根据本领域已知的技术,使用合适的分散或湿润剂和悬浮剂制备这些悬液。优选为,所述溶液或悬浮液经由无针注射(例如喷雾注射)施用。
根据本发明的人工核酸分子,根据本发明的载体,根据本发明的细胞,或根据本发明的药物组合物可以以任何口服可接受剂型口服施用,所述口服可接受剂型包括但不限于胶囊、片剂、水质悬液或溶液。
尤其当治疗的靶包括容易通过局部应用可到达的区域或器官,例如包括皮肤疾病或任何其它可到达的上皮组织的疾病时,根据本发明的人工核酸分子,根据本发明的载体,根据本发明的细胞,或根据本发明的药物组合物还可以局部施用。对于这些区域或器官中的每个,容易制备合适的局部制剂。为了局部应用,可以以悬浮或溶解在一个以上载体中的合适的软膏制备根据本发明的人工核酸分子,根据本发明的载体,根据本发明的细胞,或根据本发明的药物组合物。
在一个实施方案中,作为药物的使用包括转染哺乳动物细胞,优选体外或活体外转染哺乳动物细胞,更优选体外转染要由所述药物治疗的受试者的分离的细胞的步骤。如果所述使用包括体外转染分离的细胞,作为药物的使用还可以包括向患者再施用转染的细胞。本发明的人工核酸分子或载体作为药物的使用还可以包括选择成功转染的分离的细胞的步骤。因此,如果载体还包含选择标记,可以是有利的。而且,作为药物的使用可以包括体外转染分离的细胞和从这些细胞纯化表达产物,即编码的肽或蛋白。该纯化的肽或蛋白可以随后施用于需要其的受试者。
本发明还提供一种治疗或预防如上文描述的疾病或疾病的方法,所述方法包括向需要其的受试者施用根据本发明的人工核酸分子,根据本发明的载体,根据本发明的细胞,或根据本发明的药物组合物。
此外,本发明提供一种治疗或预防疾病或疾病的方法,所述方法包括用根据本发明的人工核酸分子或用根据本发明的载体转染细胞。所述转染可以在体外、活体外或体内进行。在一个优选的实施方案中,体外进行细胞转染并且将转染的细胞施用于需要其的受试者,优选人患者。优选地,要体外转染的细胞是受试者,优选人患者的分离的细胞。因此,本发明提供一种治疗方法,所述方法包括从受试者,优选从人患者分离细胞,用根据本发明的人工核酸或根据本发明的载体转染所述分离的细胞,并将转染的细胞施用于受试者,优选人患者的步骤。
治疗或预防根据本发明的疾病的方法优选如上文描述的疫苗接种方法或基因治疗方法。
如上文所述的,本发明的3’-UTR元件和/或本发明的5’-UTR元件能够延长和/或增加从mRNA的蛋白生产。由此,在进一步的方面,本发明涉及用于增加和/或延长从人工核酸分子,优选从mRNA分子或载体的蛋白生产的方法,所述方法包括将可读框与3’-UTR元件和/或5’-UTR元件关联的步骤,其中3’-UTR元件和/或5’-UTR元件延长和/或增加从得到的人工核酸分子的蛋白生产,并且其中所述至少一个3’-UTR元件和/或所述至少一个5’-UTR元件源自稳定mRNA,以获得如上文所述的根据本发明的人工核酸分子,优选mRNA分子,或如上文所述的根据本发明的载体。
优选地,在增加和/或延长从人工核酸分子,优选从mRNA分子或载体的蛋白生产的方法中,根据本发明,3’-UTR元件和/或5’-UTR元件包含这样的核酸序列或由这样的核酸序列组成,所述核酸序列源自选自由以下各项组成的组的基因的转录本的3’-UTR和/或5’-UTR:GNAS(鸟嘌呤核苷酸结合蛋白,α刺激复合基因座),MORN2(含有MORN重复2), GSTM1(谷胱甘肽S-转移酶,μl),NDUFA1(NADH脱氢酶(泛醌)1α亚复合体),CBR2(羰基还原酶2),MP68(RIKEN cDNA 2010107E04基因), NDUFA4(NADH脱氢酶(泛醌)1α亚复合体4),LTA4H,SLC38A6, DECR1,PIGK,FAM175A,PHYH,TBC1D19,PIGB,ALG6,CRYZ,BRP44L,ACADSB,SUPT3H,TMEM14A,GRAMD1C,C11orf80,C9orf46, ANXA4,TBCK,IFI6,C2orf34,ALDH6A1,AGTPBP1,CCDC53,LRRC28, CCDC109B,PUS10,CCDC104,CASP1,SNX14,SKAP2,NDUFB6, EFHA1,BCKDHB,BBS2,LMBRD1,ITGA6,HERC5,NT5DC1,RAB7A, AGA,TPK1,MBNL3,HADHB,MCCC2,CAT,ANAPC4,PCCB,PHKB, ABCB7,PGCP,GPD2,TMEM38B,NFU1,OMA1,LOC128322/NUTF2, NUBPL,LANCL1,HHLA3,PIR,ACAA2,CTBS,GSTM4,ALG8, Atp5e,Gstm5,Uqcr11,Ifi27I2a,Anapc13,Atp5I,Tmsb10,Nenf,Ndufa7, Atp5k,1110008P14Rik,Cox4i1,Cox6a1,Ndufs6,Sec61b,Romo1,Snrpd2, Mgst3,Aldh2,Ssr4,Myl6,Prdx4,Ubl5,1110001J03Rik,Ndufa13, Ndufa3,Gstp2,Tmem160,Ergic3,Pgcp,Slpi,Myeov2,Ndufs5, 1810027O10Rik,Atp5o,Shfm1,Tspo,S100a6,Taldo1,Bloc1s1,Hexa, Ndufb11,Map1lc3a,Gpx4,Mif,Cox6b1,RIKENcDNA2900010J23(Swi5), Sec61g,2900010M23Rik,Anapc5,Mars2,Phpt1,Ndufb8,Pfdn5,Arpc3, Ndufb7,Atp5h,Mrpl23,Uba52,Tomm6,Mtch1,Pcbd2,Ecm1,Hrsp12, Mecr,Uqcrq,Gstm3,Lsm4,Park7,Usmg5,Cox8a,Ly6c1,Cox7b, Ppib,Bag1,S100a4,Bcap31,Tecr,Rabac1,Robld3,Sod1,Nedd8, Higd2a,Trappc6a,Ldhb,Nme2,Snrpg,Ndufa2,Serf1,Oaz1,Rps4x, Rps13,Ybx1,Sepp1,Gaa,ACTR10,PIGF,MGST3,SCP2,HPRT1, ACSF2,VPS13A,CTH,NXT2,MGST2,C11orf67,PCCA,GLMN, DHRS1,PON2,NME7,ETFDH,ALG13,DDX60,DYNC2LI1,VPS8, ITFG1,CDK5,C1orf112,IFT52,CLYBL,FAM114A2,NUDT7,AKD1, MAGED2,HRSP12,STX8,ACAT1,IFT74,KIFAP3,CAPN1,COX11, GLT8D4,HACL1,IFT88,NDUFB3,ANO10,ARL6,LPCAT3,ABCD3, COPG2,MIPEP,LEPR,C2orf76,ABCA6,LY96,CROT,ENPP5,SERPINB7,TCP11L2,IRAK1BP1,CDKL2,GHR,KIAA1107,RPS6KA6,CLGN, TMEM45A,TBC1D8B,ACP6,RP6-213H19.1,SNRPN,GLRB,HERC6, CFH,GALC,PDE1A,GSTM5,CADPS2,AASS,TRIM6-TRIM34(通读转录本),SEPP1,PDE5A,SATB1,CCPG1,CNTN1,LMBRD2,TLR3, BCAT1,TOM1L1,SLC35A1,GLYATL2,STAT4,GULP1,EHHADH,NBEAL1,KIAA1598,HFE,KIAA1324L,和MANSC1;优选选自由以下各项组成的组:GNAS(鸟嘌呤核苷酸结合蛋白,α刺激复合基因座), MORN2(含有MORN重复2),GSTM1(谷胱甘肽S-转移酶,μl),NDUFA1 (NADH脱氢酶(泛醌)1α亚复合体),CBR2(羰基还原酶2),MP68 (RIKEN cDNA 2010107E04基因),NDUFA4(NADH脱氢酶(泛醌)1α亚复合体4),Ybx1(Y-Box结合蛋白1),Ndufb8(NADH脱氢酶(泛醌)1β亚复合体8),和CNTN1(接触蛋白1)。
在本发明的情况下,术语“将人工核酸分子或载体与3’-UTR元件和/ 或5’-UTR元件关联”优选意为功能性地将人工核酸分子或载体与3’-UTR 元件和/或与5’-UTR元件关联或功能性地将人工核酸分子或载体与 3’-UTR元件和/或与5’-UTR元件组合。这意为,人工核酸分子或载体以及3’-UTR元件和/或5’-UTR元件,优选如上文所述的3’-UTR元件和/或5’-UTR元件,关联或偶联,从而3’-UTR元件和/或5’-UTR元件的功能,例如,实现RNA和/或蛋白生产延长和/或增加功能。通常,这意为,3’-UTR 元件和/或5’-UTR元件分别在可读框的3’和/或5’,优选可读框的紧3’和/ 或可读框的紧5’,整合入人工核酸分子或载体,优选mRNA分子,优选在可读框和聚腺苷酸序列或聚腺苷酸化信号之间的3’-UTR元件。优选地,3’-UTR元件和/或5’-UTR元件作为3’-UTR和/或作为5’-UTR分别整合入人工核酸分子或载体,优选mRNA,即从而3’-UTR元件和/或5’-UTR元件分别是人工核酸分子或载体,优选mRNA的3’-UTR和/或5’-UTR,即,使得5’-UTR ORF的5’-末端前立即终止并且3’-UTR从可读框的3’-侧延伸到聚腺苷酸序列或聚腺苷酸化信号的5’-侧,任选地通过短接头(如包含一个或多个限制性位点或由一个或多个限制性位点组成的序列)连接。由此,优选地,术语“将人工核酸分子或载体与3’-UTR元件和/或5’-UTR 元件关联”意为功能性地将3’-UTR元件和/或5’-UTR元件与位于人工核酸分子或载体内,优选mRNA分子内的可读框关联。3’-UTR和/或5’-UTR 和ORF是如上文所述用于根据本发明的人工核酸分子的,例如,分别地,优选ORF和3’-UTR是异源的和/或ORF和5’-UTR是异源的,例如源自不同的基因(如上文所述的)。
在进一步的方面中,本发明提供3’-UTR元件和/或5’-UTR元件,优选如上文所述的3’-UTR元件和/或如上文所述的5’-UTR元件用于从人工核酸分子,优选从mRNA分子或载体增加和/或延长蛋白生产的用途,其中3’-UTR元件和/或5’-UTR元件包含这样的核酸序列或由这样的核酸序列组成,所述核酸序列源自选自由以下各项组成的组的基因的转录本的3’-UTR和/或5’-UTR:GNAS(鸟嘌呤核苷酸结合蛋白,α刺激复合基因座), MORN2(含有MORN重复2),GSTM1(谷胱甘肽S-转移酶,μl),NDUFA1 (NADH脱氢酶(泛醌)1α亚复合体),CBR2(羰基还原酶2),MP68 (RIKEN cDNA 2010107E04基因),NDUFA4(NADH脱氢酶(泛醌)1α亚复合体4),LTA4H,SLC38A6,DECR1,PIGK,FAM175A,PHYH,TBC1D19, PIGB,ALG6,CRYZ,BRP44L,ACADSB,SUPT3H,TMEM14A,GRAMD1C, C11orf80,C9orf46,ANXA4,TBCK,IFI6,C2orf34,ALDH6A1,AGTPBP1, CCDC53,LRRC28,CCDC109B,PUS10,CCDC104,CASP1,SNX14, SKAP2,NDUFB6,EFHA1,BCKDHB,BBS2,LMBRD1,ITGA6,HERC5, NT5DC1,RAB7A,AGA,TPK1,MBNL3,HADHB,MCCC2,CAT, ANAPC4,PCCB,PHKB,ABCB7,PGCP,GPD2,TMEM38B,NFU1, OMA1,LOC128322/NUTF2,NUBPL,LANCL1,HHLA3,PIR,ACAA2, CTBS,GSTM4,ALG8,Atp5e,Gstm5,Uqcr11,Ifi27I2a,Anapc13, Atp5I,Tmsb10,Nenf,Ndufa7,Atp5k,1110008P14Rik,Cox4i1,Cox6a1, Ndufs6,Sec61b,Romo1,Snrpd2,Mgst3,Aldh2,Ssr4,Myl6,Prdx4, Ubl5,1110001J03Rik,Ndufa13,Ndufa3,Gstp2,Tmem160,Ergic3,Pgcp, Slpi,Myeov2,Ndufs5,1810027O10Rik,Atp5o,Shfm1,Tspo,S100a6, Taldo1,Bloc1s1,Hexa,Ndufb11,Map1lc3a,Gpx4,Mif,Cox6b1,RIKEN cDNA2900010J23(Swi5),Sec61g,2900010M23Rik,Anapc5,Mars2,Phpt1, Ndufb8,Pfdn5,Arpc3,Ndufb7,Atp5h,Mrpl23,Uba52,Tomm6,Mtch1, Pcbd2,Ecm1,Hrsp12,Mecr,Uqcrq,Gstm3,Lsm4,Park7,Usmg5, Cox8a,Ly6c1,Cox7b,Ppib,Bag1,S100a4,Bcap31,Tecr,Rabac1, Robld3,Sod1,Nedd8,Higd2a,Trappc6a,Ldhb,Nme2,Snrpg,Ndufa2,Serf1,Oaz1,Rps4x,Rps13,Ybx1,Sepp1,Gaa,ACTR10,PIGF,MGST3, SCP2,HPRT1,ACSF2,VPS13A,CTH,NXT2,MGST2,C11orf67, PCCA,GLMN,DHRS1,PON2,NME7,ETFDH,ALG13,DDX60,DYNC2LI1,VPS8,ITFG1,CDK5,C1orf112,IFT52,CLYBL,FAM114A2, NUDT7,AKD1,MAGED2,HRSP12,STX8,ACAT1,IFT74,KIFAP3, CAPN1,COX11,GLT8D4,HACL1,IFT88,NDUFB3,ANO10,ARL6, LPCAT3,ABCD3,COPG2,MIPEP,LEPR,C2orf76,ABCA6,LY96, CROT,ENPP5,SERPINB7,TCP11L2,IRAK1BP1,CDKL2,GHR, KIAA1107,RPS6KA6,CLGN,TMEM45A,TBC1D8B,ACP6, RP6-213H19.1,SNRPN,GLRB,HERC6,CFH,GALC,PDE1A,GSTM5, CADPS2,AASS,TRIM6-TRIM34(通读转录本),SEPP1,PDE5A,SATB1, CCPG1,CNTN1,LMBRD2,TLR3,BCAT1,TOM1L1,SLC35A1,GLYATL2, STAT4,GULP1,EHHADH,NBEAL1,KIAA1598,HFE,KIAA1324L,和MANSC1;优选选自由以下各项组成的组:GNAS(鸟嘌呤核苷酸结合蛋白,α刺激复合基因座),MORN2(含有MORN重复2),GSTM1(谷胱甘肽S-转移酶,μl),NDUFA1(NADH脱氢酶(泛醌)1α亚复合体), CBR2(羰基还原酶2),MP68(RIKEN cDNA 2010107E04基因),NDUFA4 (NADH脱氢酶(泛醌)1α亚复合体4),Ybx1(Y-Box结合蛋白1),Ndufb8 (NADH脱氢酶(泛醌)1β亚复合体8),和CNTN1(接触蛋白1)。
根据本发明的用途优选包括将人工核酸分子,载体,或RNA与如上文所述的3’-UTR元件和/或与如上文所述的5’-UTR元件关联。
还可以彼此分开制造和买卖本发明的药物组合物的化合物和成分。因此,本发明还涉及试剂盒或多部件的试剂盒,其包含根据本发明的人工核酸分子,根据本发明的载体,根据本发明的细胞,和/或根据本发明的药物组合物。优选,此种试剂盒或多部件的试剂盒可以,另外,包含使用说明书,用于转染的细胞,佐剂,用于施用所述药物组合物的工具,药学可接受的载体和/或用于溶解或稀释所述人工核酸分子,所述载体,所述细胞或所述药物组合物的药学可接受的溶液。
在进一步的方面,本发明提供鉴别源自稳定mRNA的3’-非翻译区元件(3’-UTR元件)和/或5’-非翻译区元件(5’-UTR元件)的方法,所述方法包扩以下步骤:
a)分析mRNA的稳定性,包括以下子步骤:
i.确定所述mRNA在所述mRNA的降解过程中在第一时间点的量,
ii.确定所述mRNA在所述mRNA的降解过程中在第二时间点的量,和
iii.计算步骤(i)中确定所述mRNA的量与步骤(ii)中确定的所述mRNA的量的比率;
b)选择在子步骤(iii)中计算的比率为至少0.5(50%),至少0.6 (60%),至少0.7(70%),至少0.75(75%),至少0.8(80%),至少0.85(85%),至少0.9(90%),或至少0.95(95%)的稳定mRNA;和
c)确定所述稳定mRNA的3’-和/或5’-UTR元件的核苷酸序列。
由此,mRNA的稳定性优选在标准条件,例如用于使用的某细胞系或细胞类型的标准条件(标准培养基,孵育等)下评估。
为了分析mRNA的稳定性,通过确定所述mRNA的降解过程中的所述mRNA在第一和第二第二时间点的量或浓度评价该mRNA的降解过程 (参见步骤a)i.和a)ii.)。
为了确定如上文所限定的体内或体外(即体外尤其是指(“活”)细胞和/ 或组织,包括活受试者的组织;细胞尤其包括细胞系,原代细胞,组织或受试者中的细胞,优选是哺乳动物细胞,例如人细胞和小鼠细胞,并且特别优选是使用人细胞系HeLa,和U-937以及小鼠细胞系NIH3T3,JAWSII 和L929;此外原代细胞是特别优选的,尤其是优选的实施方案人皮肤成纤维细胞(HDF))RNA降解过程中mRNA的量或浓度,可以使用技术人员已知的各种方法。所述方法的非限制性实例包括例如利用转录抑制剂如放线菌素D一般性抑制转录,使用诱导型启动子特异性启动瞬时转录,例如c-fos血清-诱导型启动子系统和Tet-off调节性启动子系统,以及动力学标记技术,例如脉冲标记。
例如,如果转录抑制剂-介导的转录停滞用于步骤a)以确定如上文所定义的体内或体外RNA降解过程中mRNA的量或浓度,可以使用转录抑制剂如放线菌素D(ActD),5,6-二氯-1-D-核糖呋喃糖基-苯并咪唑(DRB)或- 鹅膏蕈碱(α-Am)。由此,为了评估mRNA降解,通常将转录抑制剂加入到细胞中并且,由此通常抑制转录并且在不干扰持续中的转录的情况下观察到RNA降解。
备选地,特异性启动瞬时转录的诱导型启动子可以用于步骤a),由此原理是提供激活转录并导致强化mRNA合成的刺激,随后去除刺激以关闭转录并监测mRNA的降解。由此,诱导型启动子使得能够严格控制,从而在狭窄的时间窗口完成转录的诱导和沉默。在哺乳动物细胞中,已知 cfos启动子对于此目的是有价值的,因为其可以响应血清添加而快速和暂时诱导,由此提供可信和简单的实现转录的瞬时加强的方式。Tet-off启动子系统提供另一种选择,其进一步加宽转录脉冲方法的应用来研究哺乳动物细胞中的mRNA逆转。
然而,在本发明中,动力学标记技术在步骤a)中优选用于确定如上文所定义的体内或体外RNA降解过程中mRNA的量。在动力学标记中,通常标记RNA,因此标记特别包括标记的核苷酸和标记的核苷,并且标记的尿苷和标记的尿嘧啶是特别优选。优选的标记的实例包括4-硫尿苷 (4sU),2-硫尿苷,6-硫鸟苷,5-乙炔基尿苷(EU),5-溴-尿苷(BrU),生物素 -16-氨基氨基烯丙基尿苷,5-氨基烯丙基尿苷,5-氨基烯丙基胞苷等,其中 4-硫尿苷(4sU),5-乙炔基尿苷(EU)或5’-溴-尿苷(BrU)是更优选的。特别优选的是4-硫尿苷(4sU)。4-硫尿苷(4sU)优选以100-500μM的浓度使用。此外,还可以使用放射标记的核苷酸,例如利用尿苷-3H。还可以使用上述标记的核苷酸的组合,由此4-硫尿苷和6-硫鸟苷的组合是特别优选的。
在动力学标记中,通常例如通过在转录过程中整合标记的尿苷或尿嘧啶标记出现的RNA。过一会儿,终止提供标记,并且然后可以在通常不抑制转录的情况下通过评估特异标记的RNA观察RNA降解。
为了确定RNA降解过程过程中的mRNA的量,在步骤a)中,脉冲标记是优选的,并且脉冲追踪方法是特别是优选的。如本文中使用的,术语“脉冲标记是指标记,例如上述标记用于测量活细胞内化合物的合成和/或降解的速率的技术。通常,细胞短期暴露于小量的标记,因此术语‘脉冲’。在脉冲追踪方法中,脉冲-标记后,在暴露于标记所需时期后,通常加入与“脉冲”(例如未标记的尿苷,如果标记的尿苷用作脉冲)对应的远大于其的量的未标记的化合物。标记的和未标记的化合物之间的竞争效果降低至可忽略的水平,标记的化合物的进一步摄取,因此术语“追踪”。
为了确定mRNA的量或浓度,通常必需分离mRNA。不同的RNA分离技术是技术人员已知的,例如通过胍盐硫氰酸盐-苯酚-氯仿提取或通过基于二氧化硅柱的提取。此外,可以使用可商购试剂盒,例如Qiagen的 RNeasy试剂盒。
此外,可以需要提取步骤,尤其是如果使用动力学标记(与转录抑制剂相反,其中总RNA代表“降解的”RNA,因为转录通常被抑制)。在提取步骤中,标记的RNA(即代表“降解的”RNA)从总的分离的RNA提取。由此,提取方法可以根据使用的标记选择。例如,对于标记可以使用利用抗体的免疫纯化。
此外,例如,对于硫标记的,例如4-硫尿苷(4sU)-标记的,RNA的提取,HPDP-生物素(通过可裂解的(可逆的)二硫键缀合的吡啶基二巯基-激活的,巯基-反应性生物素化试剂)可以与分离的“总RNA”孵育。该试剂特异性与4-硫尿苷(4sU)-标记的RNA中还原的巯基(-SH)特异性反应,形成可逆二硫键。生物素化允许硫-标记的例如4-硫尿苷(4sU)-标记的RNA与链霉亲和素的结合,并且因此可以通过二硫键与二硫苏糖醇或β-巯基乙醇(或任意其他还原剂)的反应从总RNA提取。
在生物素-标记的核苷酸,例如生物素-16-氨基烯丙基尿苷的情况下,链霉亲和素可以直接用于从总RNA提取标记的RNA。
例如,对于新转录的5-乙炔基尿苷(EU)-标记的细胞RNA从总RNA 中的提取,可以在铜催化的环加成反应(常称为点击化学)中使用EU的生物素化,接着通过链霉亲和素亲和纯化。该方法可作为Click-iT Nascent RNA Capture Kit(目录号C10365,Invitrogen)商购。制造商的该试剂盒的使用说明建议脉冲标记时间对于0.5mM EU剂量是30至60min,或对于 0.1或0.2mM EU剂量是1至24h。
例如,BrU-标记的RNA分子可以通过用抗-溴脱氧尿苷抗体(例如克隆2B1,目录号MI-11-3,MBL)免疫纯化和蛋白G Sepharose提取。
mRNA的量或浓度,即转录本水平,可以随后通过本领域技术人员已知的各种方法测量。所述方法的非限制性实例包括微阵列分析,DNA印记分析,定量PCR或通过下一代测序(高通量测序)。特别优选的是微阵列分析和下一代测序。此外,全基因组方法/全转录组方法是特别优选的,例如在微阵列分析中,全基因组微阵列分析,例如Affymetrix人基因1.0ST 或2.0ST或Affymetrix鼠基因1.0ST或2.0ST或通过下一代测序的全转录组分析。
在步骤a)的子步骤i.和ii.中,在mRNA降解过程中的第一和第二时间点确定mRNA的量。通常,这意为,尤其是在mRNA的降解过程中第一和第二时间点分离mRNA,以确定各个量。因此,“所述第一时间点”和“所述第二时间点”尤其是RNA降解过程中的时间点,在该时间点分离RNA 以确定RNA量。通常,在RNA降解过程中“所述第二时间点”晚于“所述第一时间点”。
优选地,这样选择所述第一时间点,使得仅考虑经历降解过程的mRNA,即忽略新出现的mRNA-例如在持续的转录中。例如,如果使用动力学标记技术,例如脉冲标记,优选这样选择所述第一时间点,使得完成标记在 mRNA中的结合,即没有持续的向mRNA中结合标记发生。由此,如果使用动力学标记,所述第一时间点可以是在实验标记步骤结束后,例如细胞与标记孵育后至少10min,至少20min,至少30min,至少40min,至少50min,至少60min,至少70min,至少80min,或至少90min。
例如,所述第一时间点可以优选是终止转录(例如通过转录抑制剂),在诱导型启动子的情况下终止启动子诱导后或终止脉冲或标记供应后,例如标记结束后0至6h。更优选地,所述第一时间点可以是终止转录(例如通过转录抑制剂),在诱导型启动子的情况下终止启动子诱导或终止脉冲或标记供应后,例如标记结束后30min至5h,甚至更优选1h至4h,并且特别优选约3h。
优选地,在mRNA降解过程中尽可能晚地选择所述第二时间点。然而,如果考虑多种mRNA种类,优选这样选择所述第二时间点,使得仍然有大量的多种mRNA种类,优选至少10%的mRNA种类,以可检测量,即以高于0的量存在。优选地,所述第二时间点是终止转录(例如通过转录抑制剂),在诱导型启动子的情况下终止启动子诱导后或终止脉冲或标记供应后,例如标记结束后至少5h,至少6h,至少7h,至少8h,至少9h,至少10h,至少11h,至少12h,至少13h,至少14h,或至少15h。
例如,所述第二时间点可以优选是终止转录(例如通过转录抑制剂),在诱导型启动子的情况下终止启动子诱导后或终止脉冲或标记供应后,例如标记结束后3至48h。更优选地,所述第二时间点可以是终止转录(例如通过转录抑制剂),在诱导型启动子的情况下终止启动子诱导后或终止脉冲或标记供应后,例如标记结束后6min至36h,甚至更优选10h至24h,并且特别优选约15h。
由此,所述第一时间点和所述第二时间点之间的时间间隔优选在上述极限内尽可能大。因此,所述第一时间点和所述第二时间点之间的时间间隔优选至少4h,至少5h,至少6h,至少7h,至少8h,至少9h,至少 10h,至少11h,或至少12h,其中约12h的时间间隔是特别是优选的。通常,第二较晚时间点比所述第一时间点晚至少10分钟。
在步骤a)的子步骤iii中,计算步骤(i)中确定的mRNA的量与步骤(ii) 中确定的mRNA的量的比率。为此,将如上文所述在所述第二时间点确定的mRNA的量(转录本水平)除以如上文所述在所述第一时间点确定的 mRNA(转录本水平)的量。该比率防止无视在所述第一时间点已近仅以非常低的量存在的稳定mRNA(相对于以高的量存在的mRNA)。
在步骤b)中,选择这样的mRNA,其在步骤a)的子步骤(iii)计算的比率为至少0.5(50%),至少0.6(60%),至少0.7(70%),至少0.75(75%),至少0.8(80%),至少0.85(85%),至少0.9(90%),或至少0.95(95%)。在本发明中所述mRNA被认为是特别稳定的mRNA。
在步骤c)中,确定所述mRNA,即步骤b)中选择的mRNA的3’-和/ 或5’-UTR元件的核苷酸序列。为此,可以利用技术人员已知的不同方法,例如测序或从公众可获得的数据库如例如NCBI(National Center for Biotechnology Information)选择。例如,可以在数据库中检索步骤b)中选择的mRNA的mRNA序列,并且可以随后从数据库中存在的mRNA序列提取3’-和/或5’-UTR。
尤其是,在上述用于鉴别源自稳定mRNA的3’-非翻译区元件 (3’-UTR元件)和/或5’-非翻译区元件(5’-UTR元件)的方法中,术语“mRNA”和/或“稳定mRNA”还分别可以指本文中定义的mRNA种类和/或稳定的 mRNA种类。
此外,本发明中优选的是,与平均mRNA降解相比,“稳定mRNA”可以具有较慢的mRNA降解,优选如上文所定义的体内或体外评估的。由此,“平均mRNA降解”可以通过研究多种mRNA种类的mRNA降解评估。
因此,在进一步的方面,本发明提供鉴别源自稳定mRNA 3’-非翻译区元件(3’-UTR元件)和/或5’-非翻译区元件(5’-UTR元件)的方法,其包括以下步骤:
a)分析多种mRNA种类的稳定性,包括以下子步骤:
i.确定所述多个mRNA种类的每个mRNA种类在所述 mRNA种类的降解过程中的第一时间点的量,
ii.确定所述多个mRNA种类的每个mRNA种类在所述 mRNA种类的降解过程中的第二时间点的量,和
iii.对于所述多种mRNA种类的每个mRNA种类计算步骤(i)中确定的所述mRNA种类的量与步骤(ii)中确定的所述mRNA种类的量的比率;
b)根据子步骤(iii)中对于每个mRNA种类计算的比率将多种 mRNA种类中的mRNA种类排序;
c)选择具有在子步骤(iii)中计算的最高比例的一种或多种mRNA 种类;和
d)确定所述mRNA的3’-和/或5’-UTR元件的核苷酸序列。
“mRNA种类”,如本文中使用的,对应于基因组转录单位,即通常对应于基因。由此,在一个“mRNA种类”中可以出现不同转录本,例如,由于mRNA加工导致。例如,mRNA种类可以由微阵列上的点代表。因此,微阵列提供确定多种mRNA种类,例如在mRNA降解过程中某时间点的量的有利的工具。然而,还可以使用技术人员已知的其他技术,例如 RNA-seq(也称为全转录组鸟枪(Shotgun)测序,其是使用下一代测序在给定时间点从基因组揭示RNA存在和数量的快照的能力的技术),定量PCR 等。
优选地,“多种mRNA种类”,是指至少100,至少300,至少500,至少1000,至少2000,至少3000,至少4000,至少5000,至少6000,至少7000,至少8000,至少9000,至少10000,至少11000,至少12000,至少13000,至少14000,至少15000,至少16000,至少17000,至少18000,至少19000,至少20000,至少21000,至少22000,至少23000,至少24000,至少25000,至少26000,至少27000,至少28000,至少29000,或至少 30000个mRNA种类。特别优选的是,评估全转录组,或转录组的尽可能多的mRNA种类。这可以,例如,通过提供全转录本覆盖的微阵列实现。
该方法的步骤a)以及其子步骤i.至iii.基本上对应于之前所述的本发明的方法的步骤a)以及其子步骤i.至iii.,但区别仅在于在第一和第二时间点确定多种mRNA种类中每个mRNA种类的量以及对于每个mRNA种类计算比例。因此,上文概述的详细方法和优选的实施方案也适用于这里,并且单个mRNA种类(以及每个单个mRNA种类,分别)的比率可以如上文对于“一个mRNA”概述的确定。
然而,与上述方法相反,mRNA的稳定性不通过比例的绝对值评估,而是根据在步骤a)的子步骤(iii)中对于每个mRNA种类计算的比率通过多种mRNA种类的mRNA种类的排名评估。在子步骤c)中,然后选择具有最高比例或步骤a)的子步骤(iii)中计算的最高比例的一种或多种mRNA种类。
在该情况下,特别优选的是在步骤c)中选择0.1%,0.2%,0.3%,0.4%, 0.5%,0.6%,0.7%,0.8%,0.9%,1%,2%,3%,4%,5%,10%,15%, 20%最稳定的mRNA种类。备选地或此外,在步骤c)中,所述mRNA种类可以这样选择,其显示对应于从分析的所有mRNA种类中计算的平均比例的至少100%的在步骤a)的子步骤iii.中计算的比率。更优选选择这样的所述mRNA种类,其显示从分析的所有mRNA种类计算的平均比例的至少150%,甚至更优选至少200%并且最优选至少300%的比率。
在步骤d)中,对于之前所述的本发明的方法的步骤c),如上文所述的确定步骤c)中选择的mRNA的3’-和/或5’-UTR元件的核苷酸序列。
优选地,在两种上述根据本发明的鉴别3’-UTR元件和/或5’-UTR元件的方法中,所述第一时间点和所述第二时间点之间的时期是至少5h,优选至少6h,优选至少7h,更优选至少8h,更优选至少9h,甚至更优选至少10h,甚至更优选至少11h,并且特别优选至少12h。
优选地,在两种上文所述的根据本发明的鉴别3’-UTR元件和/或5’-UTR元件的方法中,通过脉冲标记,优选使用脉冲追踪方法分析mRNA 的稳定性。
在进一步的方面,本发明还提供鉴别延长和/或增加从人工核酸分子的蛋白生产并且源自稳定mRNA的3’-非翻译区元件(3’-UTR元件)和/或5’- 非翻译区元件(5’-UTR元件)的方法,其包括以下步骤:
a)根据上述方法中的任一种通过鉴别3’-UTR元件和/或5’-UTR 元件的方法鉴别源自稳定mRNA的3’-UTR元件和/或5’-UTR 元件;
b)合成人工核酸分子,其包含至少一个可读框和对应于步骤a) 中鉴别的3’-UTR元件和/或5’-UTR元件或步骤a)中鉴别的 3’-UTR元件和/或5’-UTR元件包含的至少一个3’-UTR元件和 /或至少一个5’-UTR元件;
c)分析步骤b)中合成的人工核酸分子的至少一个可读框(ORF) 编码的蛋白的表达;
d)分析缺少3’-UTR元件和/或5’-UTR元件的参比人工核酸分子的至少一个可读框编码的蛋白的表达;
e)将步骤c)中分析的人工核酸分子的蛋白表达与步骤d)中分析的参比人工核酸分子的蛋白表达进行比较;和
f)如果与从步骤d)中分析的参比人工核酸分子的蛋白表达相比,从步骤c)中分析的人工核酸分子的蛋白表达延长和/或增加,则选择所述3’-UTR元件和/或5’-UTR元件。
在该方法中,首先,3’-UTR元件和/或5’-UTR元件可通过如上文所述的根据本发明的方法鉴别。这使得能够通过技术人员已知的方法,例如通过PCR扩增合成3’-和/或5’-UTR元件。用于所述PCR的引物可以优选包含用于克隆的限制性位点。备选地,3’-和/或5’-UTR元件可以例如通过化学合成或寡聚物退火合成。因此,在步骤b)中,合成人工核酸分子,其包含至少一个可读框和对应于步骤a)中鉴别的3’-UTR元件和/或5’-UTR元件或步骤a)中鉴别的3’-UTR元件和/或5’-UTR元件包含的至少一个 3’-UTR元件和/或至少一个5’-UTR元件。尤其是,如果3’-和/或5’-UTR 元件满足各自的需求,即如果它们延长和/或增加蛋白表达,则通常将所述至少一个3’-UTR元件和/或至少一个5’-UTR元件与可读框组合,这产生包含根据本发明的3’-和/或5’-UTR元件的人工核酸。为了测试它,步骤 a)中鉴别的3’-和/或5’-UTR元件,或其PCR片段或合成的序列分别,可以克隆入特定载体,优选表达载体,从而评估从各个ORF的蛋白表达。
随后如本文中所述在步骤c)中评估从包含所述至少一个3’-UTR元件和/或所述至少一个5’-UTR元件的人工核酸分子的蛋白表达,并且与在步骤d)中评估的从如本文所述在步骤e)中的各个缺少3’-UTR元件和/或 5’-UTR元件参比人工核酸分子的蛋白表达相比。
之后,在步骤f)中,选择这样的3’-UTR元件和/或5’-UTR元件,与从步骤d)中分析的参比人工核酸分子的蛋白表达相比,其延长和/或增加步骤c)中分析的人工核酸分子的蛋白表达。本发明的核酸分子与参比核酸分子的蛋白表达的比较如本文中所述进行,尤其是在本发明的情况下的人工核酸分子。
此外,本发明提供鉴别延长和/或增加从人工核酸分子蛋白生产并且源自稳定mRNA的3’-非翻译区元件(3’-UTR元件)和/或5’-非翻译区元件 (5’-UTR元件)的特别优选的方法,其包括以下步骤:
a)为细胞供给标记的核苷酸/将细胞与标记的核苷酸孵育,用于结合入新转录的RNA分子(脉冲追踪标记);
b)在第一时间点和至少一个第二较晚时间点分离细胞的总RNA;
c)从步骤b)中分离的总RNA中提取标记的RNA分子;
d)测量标记的RNA中包含的不同mRNA种类的量/转录本水平;
e)计算在至少一个第二较晚时间点存在的mRNA种类的量/转录本水平与在所述第一时间点存在的mRNA种类的量/转录本水平的比率;
f)根据步骤e)中确定的比率将mRNA种类排名;
g)选择最稳定的mRNA种类;
h)确定步骤g)中选择的最稳定mRNA种类的3’-和/或5’-UTR的核苷酸序列;
i)合成步骤h)中确定的3’-和/或5’-UTR中包含的3’-和/或5’-UTR元件;
j)将步骤i)中合成的3’-和/或5’-UTR元件与可读框组合,得到如本文所述的根据本发明的核酸;和
k)任选地比较本发明的核酸中存在的可读框的表达与没有如本文所述的3’-和/或5’-UTR元件的参比核酸中存在的可读框的表达。
由此,在步骤a)至k)所概述的各个限制内,上文对于本发明的方法所述的详情和优选的实施方案也适用于这里。
尤其是,以下标记的核苷酸优选的用于在本发明的方法的步骤a)中供给细胞:4-硫尿苷(4sU),2-硫尿苷,6-硫鸟苷,5-乙炔基尿苷(EU),5-溴- 尿苷(BrU),生物素-16-氨基烯丙基尿苷,5-氨基烯丙基尿苷,5-氨基烯丙基胞苷等。特别优选的是4-硫尿苷(4sU)。4-硫尿苷优选以100-500μM的浓度使用。备选地,可以使用放射标记的核苷酸,例如尿苷-3H。可以使用上述标记的核苷酸的组合。特别优选的是4-硫尿苷和6-硫鸟苷的组合。
步骤a)中细胞与标记的核苷酸的孵育可以变化。特别优选的是10分钟至24小时的孵育(供给时间)。特别优选的是2至6小时,更优选2至3 小时。
可以用于本发明的方法的细胞,包括尤其是细胞系,原代细胞,组织或受试者中的细胞。在具体实施方案中,允许细胞培养的细胞类型可以适于本发明的方法。特别优选的是哺乳动物细胞,例如人细胞和小鼠细胞。在特别是优选的实施方案中,使用人细胞系HeLa,和U-937以及小鼠细胞系NIH3T3,JAWSII和L929。此外原代细胞是特别优选的;在特别优选的实施方案中,可以特别使用人皮肤成纤维细胞(HDF)。备选地,标记的核苷酸也可以适于受试者的组织,并且孵育时间后,根据步骤c)分离组织的RNA。
为了确定细胞(类型)的最稳定mRNA,在如上文所述的第一时间点,例如标记后0至6h,优选标记后3h,并且在如上文所述的第二较晚时间点,例如标记后3至48h,优选标记后10至24h,最优选15h提取总RNA。第二较晚时间点比第一时间点晚至少10分钟。
在步骤f)中,根据步骤e)中计算的比率将mRNA种类排名。在该情况下,特别优选的是选择0.1%,0.2%,0.3%,0.4%,0.5%,0.6%,0.7%, 0.8%,0.9%,1%,2%,3%,4%,5%,10%,15%,20%最稳定的mRNA 种类。
在该情况下,还优选的是选择与第一时间相比,显示mRNA种类在第二较晚时间的至少50%(0,5倍),至少60%(0,6倍),至少70%(0,7倍),至少90%(0,9倍)或至少95%(0,95倍)转录本水平/量的这些mRNA种类。如果在标记后3小时(第一时间点)和15小时(第二时间点)分离RNA,该实施方案是特别优选的。
备选地或另外,选择这些mRNA种类,其显示对应于从分析的所有mRNA种类计算的平均比例的至少100%的步骤e)中计算的比率。更优选选择这些mRNA种类,其显示从分析的所有mRNA种类计算的平均比例的至少150%,并且更优选至少200%,并且最优选至少300%的比例。
在本发明的方法的进一步的步骤中,确定步骤g)中选择的最稳定 mRNA种类的3’-和/或5’-UTR的核苷酸序列,并且在步骤i)中例如通过 PCR扩增合成3’-和/或5’-UTR元件。用于PCR的引物可以优选包含用于克隆的限制性位点。备选地,3’-和/或5’-UTR元件可以合成(例如通过化学合成或寡聚物退火)。
在本发明的方法的步骤j)中,将得到的PCR片段或合成的序列与可读框组合,得到包含根据本发明的3’-和/或5’-UTR元件的人工核酸。优选地,PCR片段或序列可以克隆入载体。
在特别优选的实施方案中,本发明提供用于鉴别3’-非翻译区元件 (3’-UTR元件)和/或5’-非翻译区元件(5’-UTR元件)的包含步骤a)至k)的方法,其中3’-UTR元件和/或5’-UTR元件延长从包含至少一个所述 3’-UTR元件和/或至少一个所述5’-UTR元件的人工核酸分子的蛋白生产。
在进一步的方面,本发明还提供产生人工核酸分子的方法,其中合成人工核酸分子,所述人工核酸分子包含至少一个可读框和通过如上文所述的根据本发明的鉴别3’-UTR元件和/或5’-UTR元件的方法鉴别的至少一个3’-UTR元件和/或至少一个5’-UTR元件。所述人工核酸分子的合成通常通过技术人员已知的方法进行,例如克隆方法,例如通常已知的或本文中所述的。
优选地,如本文所述的根据本发明的载体用于所述发明的方法,用于产生人工核酸分子。
优选地,通过所述用于产生人工核酸分子的方法产生的人工核酸分子是如本文所述的根据本发明的核酸分子。
此外,本发明还提供可通过用于产生如本文所述的根据本发明的人工核酸分子的方法获得的人工核酸分子。
以下附图、序列和实施例意在进一步说明本发明。它们不意在将本发明的主题限制于其中。
图1至11,19至21和25至30显示可通过体外转录获得的编码mRNA 的序列。使用以下缩写:
●PpLuc(GC):编码萤火虫(Photinus pyralis)荧光素酶的富GC的 mRNA序列
●A64:具有64个腺苷酸的聚腺苷酸-序列
●C30:具有30个胞苷酸的聚胞苷酸-序列
●hSL:从(Cakmakci,Lerner,Wagner,Zheng,&William F Marzluff,2008.Mol.Cell.Biol.28(3):1182-94)获得的组蛋白茎环序列
●32L4:缺少5’末端寡嘧啶束的人核糖体蛋白大32的5’-UTR
●白蛋白7:引入三个点突变以去除T7终止信号以及HindIII和XbaI 限制性位点的人白蛋白的3’-UTR
●gnas:源自鼠gnas;小家鼠GNAS(鸟嘌呤核苷酸结合蛋白,α刺激) 复合基因座(Gnas),mRNA的3’-UTR的3’-UTR元件
●morn2:源自鼠morn2;小家鼠含有MORN重复2(Morn2),mRNA 的3’-UTR的3’-UTR元件
●gstm1:源自鼠gstm1;小家鼠谷胱甘肽S-转移酶,μ1(Gstm1), mRNA的3’-UTR的3’-UTR元件
●ndufa1:源自鼠ndufa1;小家鼠NADH脱氢酶(泛醌)1α亚复合体, (Ndufa1),mRNA的3’-UTR的3’-UTR元件
●cbr2:源自鼠cbr2;小家鼠羰基还原酶2(Cbr2),mRNA的3’-UTR 的3’-UTR元件
●mp68:源自鼠mp68;小家鼠RIKEN cDNA 2010107E04基因 (2010107E04Rik),mRNA的5’-UTR的5’-UTR元件
●ndufa4:源自鼠nudfa4;小家鼠NADH脱氢酶(泛醌)1α亚复合体,4,(Ndufa4),mRNA的5’-UTR的5’-UTR元件
●Ybx1:源自鼠Ybx1(Y-Box结合蛋白1)的3’-UTR的3’-UTR元件
●Ndufb8:源自鼠Ndufb8(NADH脱氢酶(泛醌)1β亚复合体8)的 3’-UTR的3’-UTR元件
●CNTN1:源自人CNTN1(接触蛋白1)的3’-UTR的3’-UTR元件
图1:显示SEQ ID NO.35,即32L4-PpLuc(GC)-A64-C30-hSL. (R2464)的mRNA序列。5’-UTR源自缺少5’末端寡嘧啶束的人核糖体蛋白大32mRNA。PpLuc(GC)ORF以斜体强调。
图2:显示SEQ ID NO.36,即32L4-PpLuc(GC)-gnas-A64-C30-hSL. (R3089)的mRNA序列。PpLuc(GC)ORF以斜体强调。源自小鼠Gnas转录本的3’-UTR元件下划线。
图3:显示SEQ ID NO.37,即32L4-PpLuc(GC)-morn2-A64-C30- hSL.(R3106)的mRNA序列。PpLuc(GC)ORF以斜体强调。源自小鼠morn2 的3’-UTR元件下划线。
图4:显示SEQ ID NO.38,即32L4-PpLuc(GC)-gstm1-A64-C30- hSL.(R3107)的mRNA序列。PpLuc(GC)ORF以斜体强调。源自小鼠gstm1 的3’-UTR元件下划线。
图5:显示SEQ ID NO.39,即32L4-PpLuc(GC)-ndufa1-A64-C30 -hSL.(R3108)的mRNA序列。PpLuc(GC)ORF以斜体强调。源自小鼠 ndufa1的3’-UTR元件下划线。
图6:显示SEQ ID NO.40,即32L4-PpLuc(GC)-cbr2-A64-C30- hSL.(R3109)的mRNA序列。PpLuc(GC)ORF以斜体强调。源自小鼠cbr2 的3’-UTR元件下划线。
图7:显示SEQ ID NO.41,即PpLuc(GC)-白蛋白7-A64-C30-hSL. (R2463)的mRNA序列。3’-UTR源自引入三个单个点突变以去除T7终止信号以及HindIII和XbaI限制性位点的人白蛋白(白蛋白7)。PpLuc(GC) ORF以斜体强调。
图8:显示SEQ ID NO.42,即Mp68-PpLuc(GC)-白蛋白7-A64-C30 -hSL.(R3111)的mRNA序列。PpLuc(GC)ORF以斜体强调。源自小鼠mp68 的5’-UTR元件下划线。
图9:显示SEQ ID NO.43,即Ndufa4-PpLuc(GC)-白蛋白7-A64- C30-hSL.(R3112)的mRNA序列。PpLuc(GC)ORF以斜体强调。源自小鼠Ndufa4的5’-UTR元件下划线。
图10:显示SEQ ID NO.44,即PpLuc(GC)-A64-C30-hSL(R2462) 的mRNA序列。PpLuc(GC)ORF以斜体强调。
图11:显示SEQ ID NO.45,即PpLuc(GC)-gnas-A64-C30-hSL (R3116)的mRNA序列。PpLuc(GC)ORF以斜体强调。源自小鼠Gnas的 3’-UTR元件下划线。
图12:显示不同3’-UTR元件,即源自gnas,morn2,gstm1,ndufa1 和cbr2的3’-UTR元件显著延长从mRNA的蛋白表达。
检查本发明的源自gnas,morn2,gstm1,ndufa1和cbr23’-UTR的 3’-UTR元件对从mRNA的荧光素酶表达的影响(与从缺少3’-UTR的 mRNA的荧光素酶表达相比)。为此,通过脂转染将人HeLa用不同mRNA 转染。在转染后不同时间测量荧光素酶水平。通过共转染的RrLuc的信号校正PpLuc信号的转染效率。在24h的标准化的PpLuc水平设为100%,并且计算对于24h的相对表达。3’-UTR延长荧光素酶表达。显示三次独立实验的平均值。值在实施例7.a中总结。
图13:显示不同3’-UTR元件,即源自gnas,morn2,gstm1,ndufa1 和cbr2的3’-UTR元件显著延长从mRNA的蛋白表达。
检查本发明的源自gnas,morn2,gstm1,ndufa1和cbr23’-UTR的 3’-UTR元件对从mRNA的荧光素酶表达的影响(与从缺少3’-UTR的 mRNA的荧光素酶表达相比)。为此,通过脂转染将HDF(人皮肤成纤维细胞)细胞用不同mRNA转染。在转染后不同时间测量荧光素酶水平。通过共转染的RrLuc的信号校正PpLuc信号的转染效率。在24h的标准化的 PpLuc水平设为100%,并且计算对于24h的相对表达。3’-UTR延长荧光素酶表达。显示三次独立实验的平均值。值在实施例7.a中总结。
图14:显示不同5’-UTR元件,即源自Mp68和ndufa4的5’-UTR元件显著增加从mRNA的总蛋白表达。
检查本发明的源自Mp68和ndufa4的5’-UTR元件对从mRNA的荧光素酶表达的影响。为此,通过脂转染将人HeLa细胞用不同mRNA转染。在转染后6,24,48和72小时测量荧光素酶水平。通过共转染的RrLuc 的信号校正PpLuc信号的转染效率。计算总蛋白表达(曲线下面积)。为了比较含有本发明的5’-UTR元件的mRNA与缺少5’-UTR的mRNA的表达水平,没有5’UTR的对照构建体的表达水平设为1。显示三次独立实验的平均值。值在实施例7.b中总结。
图15:显示不同5’-UTR元件,即源自Mp68和ndufa4的5’-UTR元件显著增加从mRNA的总蛋白表达。
检查本发明的源自Mp68和ndufa4的5’-UTR元件对从mRNA的荧光素酶表达的影响。为此,通过脂转染将HDF细胞用不同mRNA转染。在转染后6,24,48和72小时测量荧光素酶水平。通过共转染的RrLuc的信号校正PpLuc信号的转染效率。计算总蛋白表达(曲线下面积)。为了比较含有本发明的5’-UTR元件的mRNA与缺少5’-UTR的mRNA的表达水平,没有5’UTR的对照构建体的表达水平设为1。显示三次独立实验的平均值。值在实施例7.b中总结。
图16:显示源自gnas的3’-UTR元件显著延长从mRNA的蛋白表达。
检查本发明的源自gnas 3’-UTR的3’-UTR元件对从mRNA的荧光素酶表达的影响(与从缺少3’-UTR的mRNA的荧光素酶表达相比)。为此,通过脂转染将HDF细胞用各mRNA转染。在转染后24,48和72小时测量荧光素酶水平。通过共转染的RrLuc的信号校正PpLuc信号的转染效率。在24h的标准化的PpLuc水平设为100%,并且计算对于24h的相对表达。 gnas3’-UTR延长荧光素酶表达。值在实施例7.c中总结。
图17:显示源自gnas的3’-UTR元件显著延长从mRNA的蛋白表达。
检查本发明的源自gnas 3’-UTR的3’-UTR元件对从mRNA的荧光素酶表达的影响(与从缺少3’-UTR的mRNA的荧光素酶表达相比)。为此,通过脂转染将HeLa细胞用各个mRNA转染。转染后d2和d3测量荧光素酶水平。通过共转染的RrLuc的信号校正PpLuc信号的转染效率。在 24h的标准化的PpLuc水平设为100%,并且计算对于24h的相对表达。 gnas 3’-UTR延长荧光素酶表达。值在实施例7.c中总结。
图18:显示不同3’-UTR元件,即源自ybx1(V2),ndufb8,和cntn1-004(V2)的3’-UTR元件显著延长从mRNA的蛋白表达。
检查本发明的源自ybx1(V2),ndufb8,和cntn1-004(V2)3’-UTR的3’-UTR元件对从mRNA的荧光素酶表达的影响(与从缺少3’-UTR的 mRNA的荧光素酶表达相比)。为此,通过脂转染将HDF细胞用不同 mRNA转染。在转染后不同时间测量荧光素酶水平。通过共转染的RrLuc 的信号校正PpLuc信号的转染效率。在24h的标准化的PpLuc水平设为 100%,并且计算对于24h的相对表达。3’-UTR延长荧光素酶表达。值在实施例7.d中总结。
图19:显示SEQ ID NO.46,即具有突变T128bpG和缺失 del236-237bp的32L4-PpLuc(GC)-Ybx1-001(V2)-A64-C30-hSL(R3623) 小家鼠3′UTR的mRNA序列。PpLuc(GC)ORF以斜体强调。源自小鼠 Ybx1转录本的3’-UTR元件下划线。
图20:显示SEQ ID NO.47,即32L4-PpLuc(GC)- Ndufb8-A64-C30-hSL(R3624)的mRNA序列。PpLuc(GC)ORF以斜体强调。源自小鼠Ndufb8转录本的3’-UTR元件下划线。
图21:显示SEQ ID NO.48,即32L4-PpLuc(GC)- Cntn1-004(V2)-A64-C30-hSL(R3625)+T位置30bp,突变G727bpT, A840bpG的mRNA序列。PpLuc(GC)ORF以斜体强调。源自人Cntn1转录本的3’-UTR元件下划线。
图22:显示不同3’-UTR元件,即源自gnas,morn2,ndufa1(Mm;小家鼠),和NDUFA1(Hs;智人)的3’-UTR元件显著延长从mRNA的蛋白表达。检查本发明的源自gnas,morn2,ndufa1(Mm;小家鼠),和NDUFA1 (Hs;智人)的3’-UTR元件对从mRNA的荧光素酶表达的影响(与从缺少 3’-UTR的mRNA的荧光素酶表达相比)。为此,通过脂转染将人Hela细胞用各个mRNA转染。在转染后不同时间测量荧光素酶水平。通过共转染的RrLuc的信号校正PpLuc信号的转染效率。在24h标准化的PpLuc 水平设为100%并且计算对于24h的相对表达。3’UTR延长荧光素酶表达。显示3次独立实验的平均值。值在表8中总结。
图23:显示不同5’-UTR元件,即源自Mp68和ndufa4的5’-UTR元件显著增加从mRNA的总蛋白表达。检查本发明的源自Mp68和ndufa4 的5’-UTR元件对从mRNA的荧光素酶表达的影响。为此,通过脂转染将人HeLa细胞用不同mRNA转染。在转染后6,24,48和72小时测量荧光素酶水平。通过共转染的RrLuc的信号校正PpLuc信号的转染效率。计算总蛋白表达(曲线下面积)。为了比较含有本发明的5’-UTR元件的 mRNA与缺少5’-UTR的mRNA的表达水平,没有5’UTR的对照构建体的表达水平设为1。显示平均值。值在表9中总结。
图24:显示不同5’-UTR元件,即源自Mp68和ndufa4的5’-UTR元件显著增加从mRNA的总蛋白表达。检查本发明的源自Mp68和ndufa4 的5’-UTR元件对从mRNA的荧光素酶表达的影响。为此,通过脂转染将人HeLa细胞用不同mRNA转染。转染后24,48,和72小时测量荧光素酶水平。通过共转染的RrLuc的信号校正PpLuc信号的转染效率。计算总蛋白表达(曲线下面积)。为了比较含有本发明的5’-UTR元件的mRNA与缺少5’-UTR的mRNA的表达水平,没有5’UTR的对照构建体的表达水平设为1。显示平均值。值在表9中总结。
图25:显示SEQ ID NO.383,即32L4-PpLuc(GC)- A64-C30-hSL(R2462)的mRNA序列。PpLuc(GC)ORF以斜体强调。
图26:显示SEQ ID NO.384,即PpLuc(GC)-morn2-A64-C30-hSL. (R3948)的mRNA序列。PpLuc(GC)ORF以斜体强调。源自鼠morn2的 3’-UTR元件下划线。
图27:显示SEQ ID NO.385,即PpLuc(GC)-ndufa1-A64-C30-hSL. (R4043)的mRNA序列。PpLuc(GC)ORF以斜体强调。源自鼠ndufa1的 3’-UTR元件下划线。
图28:显示SEQ ID NO.386,即PpLuc(GC)-NDFUA1-A64-C30- hSL.(R3948)的mRNA序列。PpLuc(GC)ORF以斜体强调。源自人NDUFA1 的3’-UTR元件下划线。
图29:显示SEQ ID NO.387,即Mp68-PpLuc(GC)-A64-C30-hSL. (R3954)的mRNA序列。PpLuc(GC)ORF以斜体强调。源自鼠mp68的 5’-UTR元件下划线。
图30:显示SEQ ID NO.388,即Ndufa4-PpLuc(GC)-A64-C30-hSL. (R3951)的mRNA序列。PpLuc(GC)ORF以斜体强调。源自鼠ndufa4的5’-UTR元件下划线。
实施例
1.延长和/或增加蛋白生产的3’-非翻译区元件(3’-UTR元件)和/或5’- 非翻译区元件(5’-UTR元件)的鉴别:
通过脉冲追踪方法评估不同人和鼠细胞类型中的mRNA降解。为此,将三种不同人细胞类型(HeLa,HDF和U-937)以及三种不同小鼠细胞类型(NIH3T3,JAWSII和L929)在它们各自的培养基中铺板过夜:HeLa, U-937,L929在RPMI培养基中,JAWSII和NIH3T3在DMEM中并且 HDF在成纤维细胞生长培养基2(Fibroblast Growth Medium 2)中。将细胞与含有200μM 4-硫尿苷(4sU)的相应培养基孵育3h,用于标记新合成的 RNA(“脉冲”)。孵育(标记)后,将细胞洗涤一次并且将培养基用补充有2mM 尿苷(“追踪”)的新鲜培养基替换。将细胞进一步孵育3h(第一时间点)或15 h(第二时间点),之后收获。
因此,在标记结束后3h(第一时间点)和15h(第二时间点)收获细胞。使用RNeasyMini Kit(Qiagen)从这些细胞分离总RNA。
然后将HPDP-生物素(EZ-Link Biotin-HPDP,Thermo Scientific;吡啶基二硫醇-激活的,巯基-反应性生物素化试剂,其通过可裂解(可逆的) 二硫键缀合)与总RNA孵育,以提取4-硫尿苷(4sU)-标记的RNA。HPDP- 生物素与4-硫尿苷(4sU)-标记的RNA中还原的巯基(-SH)特异性反应,形成可逆的二硫键。使用Amicon-30装置将生物素化的RNA超滤,与链霉亲和素-偶联的dynabead(Life Technologies)孵育并通过DTT自链霉亲和素回收。随后,使用RNeasy Mini Kit纯化RNA。对于每个细胞系,进行3 次独立的实验。
将提取的4sU-标记的RNA用于微阵列分析以确定在第一时间点(标记后3h)存在的多种mRNA种类的转录本水平(即mRNA种类的量)和在第二时间点(标记后15h)存在的多种mRNA种类的转录本水平(即 mRNA种类的量)。使用Affymetrix人基因1.0ST和Affymetrix小鼠基因 1.0ST微阵列。Affymetrix人基因1.0ST包含36079个mRNA种类。 Affymetrix小鼠基因1.0ST包含26166个mRNA种类。
因为这些微阵列提供整个转录本覆盖,即它们提供mRNA完整表达特性(profile),因此对于大量mRNA种类确定某mRNA种类在所述第二时间点的转录本水平与相同mRNA种类在所述第一时间点的转录本水平的比例。比例因此反映与所述第一时间点相比,mRNA种类(显示为基因符号)在所述第二时间点的x倍的转录本水平。
这些实验的结果显示在下表1-3中。表1-3中的每一个显示最稳定 mRNA种类的排名,即根据该mRNA种类在所述第二时间点的转录本水平与该mRNA种类在所述第一时间点的转录本水平的比率(表1:人细胞类型(HeLa,HDF和U-937)的组合分析;表2:小鼠细胞系(NIH3T3, JAWSII和L929)的组合分析;表3:人细胞系HDF(人皮肤成纤维细胞))。所述mRNA种类认为是“最稳定mRNA种类”,其显示的在所述第一时间点的转录本水平/在所述第二时间点的转录本水平的比率为至少 0,549943138(大约55%;表1),0,676314425(大约68%,表2)或0,8033973 (大约80%,表3)的值。
此外,计算某mRNA种类的比率与平均比率(即确定的所有mRNA 种类的比率的平均值,其在表中显示为“比率的平均值”)的关系并且以平均值的%给出。
表1:从利用Affymetrix人基因1.0ST微阵列的人细胞类型(HeLa, HDF和U-937)的组合分析得到的稳定mRNA。选择微阵列上36079个 mRNA种类中的113个mRNA种类作为“最稳定的”mRNA种类。这对应于微阵列上存在的mRNA种类的0,31%。
表2:从利用Affymetrix小鼠基因1.0ST微阵列的小鼠细胞系 (NIH3T3,JAWSII和L929)的组合分析得到的稳定mRNA。选择微阵列上 26166个mRNA种类中的99个mRNA种类作为“最稳定的”mRNA种类。这对应于微阵列上存在的mRNA种类的0,38%。
表3:从利用Affymetrix人基因1.0ST微阵列的人细胞系HDF(人皮肤成纤维细胞)的分析得到的稳定mRNA:选择微阵列上36079个mRNA 种类中的46个mRNA种类作为“最稳定的”mRNA种类。这对应于微阵列上存在的mRNA种类的0,13%。
2.克隆稳定表达的mRNA的5’-和3’-UTR元件:
通过数据库检索确定表1-3中显示的mRNA种类的5’-和/或3’-UTR 的核苷酸序列,并且通过PCR扩增或通过寡聚物退火合成。将得到的PCR 片段克隆入载体,如以下实施例3中详述的。将5’-UTR元件克隆入载体 PpLuc(GC)-白蛋白7-A64-C30-hSL(SEQ ID NO.41,图7);并且将 3’-UTR元件克隆入载体32L4-PpLuc(GC)-A64-C30-hSL(SEQ ID NO.35,图1)或载体PpLuc(GC)-A64-C30-hSL(SEQ ID NO.44,图 10)。
3.DNA-模板的制备
构建用于体外转录的载体,其包含T7启动子和编码萤火虫荧光素酶的富GC的序列(PpLuc(GC))。将A64聚腺苷酸序列,接着C30和组蛋白茎环序列,插入PpLuc(GC)的3’。组蛋白茎环序列接着限制性位点,所述限制性位点用于在体外转录前线性化载体。
为了研究不同3’-UTR元件对蛋白表达的影响,使用如上文所述的载体(对照)并且修饰该载体以包括研究的3’-UTR元件。备选地,如上文所述构建载体,由此将32L4(核糖体蛋白大32)的5’非翻译区(5’-UTR)插入PpLuc(GC)的5’。然后将该载体修饰以包括不同3’-UTR元件或没有3’-UTR (对照)。
尤其是,因此通过体外转录从这些载体获得以下mRNA(mRNA序列在图1至6,图10,11和图19至21中描述):
32L4-PpLuc(GC)-A64-C30-hSL(SEQ ID NO.35,图1);
32L4-PpLuc(GC)-gnas-A64-C30-hSL(SEQ ID NO.36,图2);
32L4-PpLuc(GC)-morn2-A64-C30-hSL(SEQ ID NO.37,图3);
32L4-PpLuc(GC)-gstm1-A64-C30-hSL(SEQ ID NO.38,图4);
32L4-PpLuc(GC)-ndufa1-A64-C30-hSL(SEQ ID NO.39,图5);
32L4-PpLuc(GC)-cbr2-A64-C30-hSL(SEQ ID NO.40,图6);
PpLuc(GC)-A64-C30-hSL(SEQ ID NO.44,图10);
PpLuc(GC)-gnas-A64-C30-hSL(SEQ ID NO.45,图11);
32L4-PpLuc(GC)-Ybx1(V2)-A64-C30-hSL(SEQ ID NO.46,图19);
32L4-PpLuc(GC)-Ndufb8-A64-C30-hSL(SEQ ID NO.47,图20);和
32L4-PpLuc(GC)-Cntn1-004(V2)-A64-C30-hSL(SEQ ID NO.48,图 21)。
用于构建体32L4-PpLuc(GC)-A64-C30-hSL的备选序列显示在图 25中(SEQ IDNO.383)。然而,SEQ ID NO.35,图1用于如本文所述的实施例,并且,由此,优选用于构建体32L4-PpLuc(GC)-A64-C30-hSL。
为了研究不同5’-UTR元件对蛋白表达的影响,如上文所述构建载体,其中将白蛋白7的3’非翻译区(3’-UTR)(引入三个单个点突变以去除T7 终止信号以及HindIII和XbaI限制性位点的人白蛋白3’-UTR)插入 PpLuc(GC)的3’。将该载体修饰以包括不同5’-UTR元件或无5’-UTR(对照)。
尤其是,因此通过体外转录从这些载体获得以下mRNA(mRNA序列在图7至9中描述):
PpLuc(GC)-白蛋白7-A64-C30-hSL(SEQ ID NO.41,图7);
Mp68-PpLuc(GC)-白蛋白7-A64-C30-hSL(SEQ ID NO.42,图 8);和
Ndufa4-PpLuc(GC)-白蛋白7-A64-C30-hSL(SEQ ID NO.43,图9);
4.体外转录
将根据实施例2和3的DNA模板线性化,并且使用T7-RNA聚合酶体外转录。然后将DNA模板通过DNA酶处理消化。mRNA转录本含有 5′-帽结构,所述5′-帽结构通过向转录反应加入过量的N7-甲基-鸟苷-5′-三磷酸-5′-鸟苷获得。纯化如此获得的mRNA并且重悬在水中。
5.通过mRNA脂转染的荧光素酶表达
将人皮肤成纤维细胞(HDF)和HeLa细胞以1x104个细胞/孔的密度接种在96孔板中。次日,将细胞在Opti-MEM中洗涤并且随后用12.5ng/ 孔的在Opti-MEM中的Lipofectamine2000-复合的PpLuc-编码mRNA转染。未转染的细胞用作对照。将编码海肾荧光素酶(RrLuc)的mRNA与PpLuc mRNA一起转染以控制转染效率(1ng RrLuc mRNA/孔)。开始转染后90 分钟,将Opti-MEM换成培养基。转染后6,24,48,72小时,吸出培养基,并且将细胞在100μl的被动裂解缓冲液(Passive Lysis buffer)(Promega) 中裂解。将裂解产物在-80℃储存,直到测量荧光素酶活性。
6.荧光素酶测量
在Hidex Chameleon平板读数器中测量荧光素酶活性为相对光单位 (RLU)。在双重荧光素酶测定中从单个样品顺序测量Ppluc和Rrluc的活性。在2秒测量时间使用20μl裂解产物和50μl Beetle汁(pjk GmbH)首先测量 PpLuc活性。1500ms延迟后,利用50μlRenilla汁(pjk GmbH)测量RrLuc 活性。
7.结果
a.从含有根据本发明的3’-UTR元件的mRNA的蛋白表达增加和/或延长。
为了研究各种3’-UTR元件对从mRNA的蛋白表达的影响,将含有不同3’-UTR元件的mRNA与缺少3’-UTR的mRNA相比。
将人HeLa和HDF细胞用荧光素酶编码mRNA转染,并且在转染后 6,24,48和72小时测量荧光素酶水平(以RLU计)。通过共转染的RrLuc 的信号校正PpLuc信号的转染效率。在24h标准化的PpLuc水平设为100%并且计算对24h的相对表达(参见下表4和图12(HeLa细胞)和13(HDF 细胞))。
表4:
表4显示对RrLuc标准化的相对PpLuc表达(给出三次独立实验的平均值)。
从缺少3’-UTR的mRNA表达荧光素酶。然而,本发明的3’-UTR元件gnas,morn2,gstm1,ndufa和cbr2显著延长荧光素酶表达。
b.从含有根据本发明5’-UTR元件的mRNA的蛋白表达增加和/或延长。
为了研究各种5’-UTR元件对从mRNA的蛋白表达的影响,将含有不同5’-UTR的mRNA与缺少5’-UTR mRNA相比。
将人HeLa和HDF细胞用荧光素酶编码mRNA转染并且在转染后6, 24,48和72小时测量荧光素酶水平。通过共转染的RrLuc的信号校正 PpLuc信号的转染效率。计算0至72小时的总蛋白表达,为曲线下面积 (AUC)。没有5’UTR的对照构建体的水平设为1(参见下表5和图14(HeLa 细胞)和15(HDF细胞))。
表5:
mRNA AUC HeLa AUC HDF
PpLuc(GC)-白蛋白7-A64-C30-hSL 1,00 1,07
Mp68-PpLuc(GC)-白蛋白7-A64-C30-hSL 1,79 3,03
Ndufa4-PpLuc(GC)-白蛋白7-A64-C30-hSL 1,92 2,83
表5显示对RrLuc标准化的总PpLuc表达(给出三次独立实验的平均值)。
从缺少5’-UTR的mRNA表达荧光素酶。然而,本发明的5’-UTR元件mp68和ndufa4显著增加荧光素酶表达。
c.从含有根据本发明的3’-UTR元件的mRNA的蛋白表达延长。
为了研究各种3’UTR对从mRNA的蛋白表达的影响,将含有不同 3’UTR的mRNA与缺少3’UTR的mRNA相比。
将人HeLa和HDF细胞用荧光素酶编码mRNA转染并且在转染后24, 48和72小时测量荧光素酶水平(以RLU计)。通过共转染的RrLuc的信号校正PpLuc信号的转染效率。在24h标准化的PpLuc水平设为100%并且计算对24h的相对表达(参见下表6和图16(HeLa细胞)和17(HDF细胞))。
表6:
表6显示对RrLuc标准化的相对PpLuc表达(给出三次独立实验的平均值)。
d.从含有根据本发明的3’-UTR元件的mRNA的蛋白表达延长。
为了研究各种3’UTR对从mRNA的蛋白表达的影响,将含有不同 3’UTR的mRNA与缺少3’UTR的mRNA相比。
将人HeLa和HDF细胞用荧光素酶编码mRNA转染,并且在转染后 6,24,48和72小时测量荧光素酶水平。通过共转染的RrLuc的信号校正 PpLuc信号的转染效率。计算0至72小时的总蛋白表达,为曲线下面积(AUC)。没有5’UTR的对照构建体的水平设为1(参见下表7和图18(HDF 细胞)和17(HeLa细胞))。
将人HeLa和HDF细胞用荧光素酶编码mRNA转染和在转染后24, 48和72小时测量荧光素酶水平(以RLU计)。通过共转染的RrLuc的信号校正PpLuc信号的转染效率。在24h标准化的PpLuc水平设为100%并且计算对24h的相对表达(参见下表7和图18(HDF细胞))。
表7:
表7显示对于RrLuc标准化的相对PpLuc表达(给出三次独立实验的平均值)。
8.另外的3’UTR对蛋白表达的影响
为了研究各种3’UTR对从mRNA的蛋白表达的影响,制备新mRNA 构建体,并且将含有不同3’UTR的那些mRNA与缺少3’UTR的mRNA 相比。
为此,将选择的3’-UTR元件(gnas,morn2,ndufa1和NDUFA1)克隆入载体PpLuc(GC)-A64-C30-hSL(SEQ ID NO.44,图10),其构建为含有T7启动子和编码萤火虫荧光素酶的富GC序列(PpLuc(GC))。将A64 聚腺苷酸序列,接着C30和组蛋白茎环序列,插入PpLuc(GC)的3’。组蛋白茎环序列接着限制性位点,所述限制性位点用于在体外转录前线性化载体。
尤其是,通过体外转录从所述载体获得以下mRNA(mRNA序列显示在图11和26至28中):
PpLuc(GC)-gnas-A64-C30-hSL(SEQ ID NO.45,图11);
PpLuc(GC)-morn2-A64-C30-hSL(SEQ ID NO.384,图26);
PpLuc(GC)-ndufa1-A64-C30-hSL(SEQ ID NO.385,图27);和
PpLuc(GC)-NDUFA1-A64-C30-hSL(SEQ ID NO.386,图28).
将人HeLa细胞用荧光素酶编码mRNA转染并且在转染后24,48,和72小时测量荧光素酶水平。通过共转染的RrLuc的信号校正PpLuc信号的转染效率(参见下表8和图22)。
表8:对RrLuc标准化的相对PpLuc表达(给出3次独立实验的平均值)。
这些数据和图22中显示的数据显示,从含有根据本发明的3’-UTR元件mRNA的蛋白表达延长。
9.另外的5’UTR对蛋白表达的影响
为了进一步研究各种5’UTR对从mRNA的蛋白表达的影响,制备新 mRNA构建体,并且将含有不同5’UTR的那些mRNA与缺少5’UTR的 mRNA相比。
为此,将选择的5’-UTR元件(mp68和ndufa4)克隆入载体PpLuc(GC) -A64-C30-hSL(SEQ ID NO.44,图10),其构建为含有T7启动子和编码萤火虫荧光素酶的富GC序列(PpLuc(GC))。将A64聚腺苷酸序列,接着C30和组蛋白茎环序列,插入PpLuc(GC)的3’。组蛋白茎环序列接着限制性位点,所述限制性位点用于在体外转录前线性化载体。
尤其是,通过体外转录从所述载体获得以下mRNA(mRNA序列显示在图29和30中):
Mp68-PpLuc(GC)-A64-C30-hSL(SEQ ID NO.387,图29);和
Ndufa4-PpLuc(GC)-A64-C30-hSL(SEQ ID NO.388,图30).
将人HDF和HeLa细胞用荧光素酶编码mRNA转染并且在转染后 24,48,和72小时测量荧光素酶水平。通过共转染的RrLuc的信号校正 PpLuc信号的转染效率。计算总蛋白表达(曲线下面积)。没有5’UTR的对照构建体的水平设为1(参见下表9和图23和24)。
mRNA AUC HDF AUC HeLa
PpLuc(GC)-A64-C30-hSL 1,0 1,0
Mp68-PpLuc(GC)-A64-C30-hSL 3,9 2,3
Ndufa4-PpLuc(GC)-A64-C30-hSL 4,0 2,0
表9:对RrLuc标准化的总PpLuc表达(给出平均RLU值)。
这些数据和图23和24中所示数据表明,从含有根据本发明的5’-UTR 元件的mRNA的蛋白表达增加。
序列表
<110> 库瑞瓦格股份公司
<120> 新的人工核酸分子
<130> CU01P167WO1
<150> PCT/EP2014/003479
<151> 2014-12-30
<160> 388
<170> PatentIn version 3.5
<210> 1
<211> 351
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠GNAS 3'-UTR
<400> 1
gaagggaaca cccaaattta attcagcctt aagcacaatt aattaagagt gaaacgtaat 60
gtacaagcag ttggtcaccc accatagggc atgatcaaca ccgcaacctt tcctttttcc 120
cccagtgatt ctgaaaaacc cctcttccct tcagcttgct tagatgttcc aaatttagta 180
agcttaaggc ggcctacaga agaaaaagaa aaaaaaggcc acaaaagttc cctctcactt 240
tcagtaaata aaataaaagc agcaacagaa ataaagaaat aaatgaaatt caaaatgaaa 300
taaatattgt ttgtgcagca ttaaaaaatc aataaaaatt aaaaatgagc a 351
<210> 2
<211> 353
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠GNAS 3'-UTR
<400> 2
gaagggaaca cccaaattta attcagcctt aagcacaatt aattaagagt gaaacgtaat 60
tgtacaagca gttggtcacc caccataggg catgatcaac accgcaacct ttcctttttc 120
ccccagtgat tctgaaaaac ccctcttccc ttcagcttgc ttagatgttc caaatttagt 180
aagcttaagg cggcctacag aagaaaaaga aaaaaaaggc cacaaaagtt ccctctcact 240
ttcagtaaat aaaataaaag cagcaacaga aataaagaaa taaatgaaat tcaaaatgaa 300
ataaatattg tgttgtgcag cattaaaaaa tcaataaaaa ttaaaaatga gca 353
<210> 3
<211> 385
<212> DNA
<213> 人工序列
<220>
<223> 智人GNAS 3'-UTR
<400> 3
gaagggaacc cccaaattta attaaagcct taagcacaat taattaaaag tgaaacgtaa 60
ttgtacaagc agttaatcac ccaccatagg gcatgattaa caaagcaacc tttcccttcc 120
cccgagtgat tttgcgaaac ccccttttcc cttcagcttg cttagatgtt ccaaatttag 180
aaagcttaag gcggcctaca gaaaaaggaa aaaaggccac aaaagttccc tctcactttc 240
agtaaaaata aataaaacag cagcagcaaa caaataaaat gaaataaaag aaacaaatga 300
aataaatatt gtgttgtgca gcattaaaaa aaatcaaaat aaaaattaaa tgtgagcaaa 360
gaatgaaaaa aaaaaaaaaa aaaaa 385
<210> 4
<211> 1476
<212> DNA
<213> 人工序列
<220>
<223> 智人GNAS 3'-UTR
<400> 4
tggaggacgc cgtccagatt ctccttgttt tcatggattc aggtgctgga gaatctggta 60
aaagcaccat tgtgaagcag atgaggatcc tgcatgttaa tgggtttaat ggagagggcg 120
gcgaagagga cccgcaggct gcaaggagca acagcgatgg cagtgagaag gcaaccaaag 180
tgcaggacat caaaaacaac ctgaaagagg cgattgaaac cattgtggcc gccatgagca 240
acctggtgcc ccccgtggag ctggccaacc ccgagaacca gttcagagtg gactacatcc 300
tgagtgtgat gaacgtgcct gactttgact tccctcccga attctatgag catgccaagg 360
ctctgtggga ggatgaagga gtgcgtgcct gctacgaacg ctccaacgag taccagctga 420
ttgactgtgc ccagtacttc ctggacaaga tcgacgtgat caagcaggct gactatgtgc 480
cgagcgatca ggacctgctt cgctgccgtg tcctgacttc tggaatcttt gagaccaagt 540
tccaggtgga caaagtcaac ttccacatgt ttgacgtggg tggccagcgc gatgaacgcc 600
gcaagtggat ccagtgcttc aacgatgtga ctgccatcat cttcgtggtg gccagcagca 660
gctacaacat ggtcatccgg gaggacaacc agaccaaccg cctgcaggag gctctgaacc 720
tcttcaagag catctggaac aacagatggc tgcgcaccat ctctgtgatc ctgttcctca 780
acaagcaaga tctgctcgct gagaaagtcc ttgctgggaa atcgaagatt gaggactact 840
ttccagaatt tgctcgctac actactcctg aggatgctac tcccgagccc ggagaggacc 900
cacgcgtgac ccgggccaag tacttcattc gagatgagtt tctgaggatc agcactgcca 960
gtggagatgg gcgtcactac tgctaccctc atttcacctg cgctgtggac actgagaaca 1020
tccgccgtgt gttcaacgac tgccgtgaca tcattcagcg catgcacctt cgtcagtacg 1080
agctgctcta agaagggaac ccccaaattt aattaaagcc ttaagcacaa ttaattaaaa 1140
gtgaaacgta attgtacaag cagttaatca cccaccatag ggcatgatta acaaagcaac 1200
ctttcccttc ccccgagtga ttttgcgaaa cccccttttc ccttcagctt gcttagatgt 1260
tccaaattta gaaagcttaa ggcggcctac agaaaaagga aaaaaggcca caaaagttcc 1320
ctctcacttt cagtaaaaat aaataaaaca gcagcagcaa acaaataaaa tgaaataaaa 1380
gaaacaaatg aaataaatat tgtgttgtgc agcattaaaa aaaatcaaaa taaaaattaa 1440
atgtgagcaa agaatgaaaa aaaaaaaaaa aaaaaa 1476
<210> 5
<211> 117
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠MORN2 3'-UTR
<400> 5
acctgctgcc ttaacgctga gatgtggcct ctgcaacccc ccttaggcaa agcaactgaa 60
ccttctgcta aagtgacctg ccctcttccg taagtccaat aaagttgtca tgcaccc 117
<210> 6
<211> 135
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠MORN2 3'-UTR
<400> 6
acctgctgcc ttaacgctga gatgtggcct ctgcaacccc ccttaggcaa agcaactgaa 60
ccttctgcta aagtgacctg ccctcttccg taagtccaat aaagttgtca tgcacccaca 120
aaaaaaaaaa aaaaa 135
<210> 7
<211> 210
<212> DNA
<213> 人工序列
<220>
<223> 智人MORN2 3'-UTR
<400> 7
catgtagatg tgatgttaaa ttaaagttga aatgtagtaa ttgaagcttt tagttgtaag 60
gaaagcaact taatctgtta tttgaaatga cttcatacac tacccctata agtttgccaa 120
taaaaccatc acctgcttac acctttttga actttatatt cattgtctta caattagttt 180
aaaataaatg acatgattca aaaaaaaaaa 210
<210> 8
<211> 438
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠GSTM1 3'-UTR
<400> 8
gcccttgcta cacgggcact cactaggagg acctgtccac actggggatc ctgcaggccc 60
tgggtgggga cagcaccctg gccttctgca ctgtggctcc tggttctctc tccttcccgc 120
tcccttctgc agcttggtca gccccatctc ctcaccctct tcccagtcaa gtccacacag 180
ccttcattct ccccagtttc tttcacatgg ccccttcttc attggctccc tgacccaacc 240
tcacagcccg tttctgcgaa ctgaggtctg tcctgaactc acgcttccta gaattacccc 300
gatggtcaac actatcttag tgctagccct ccctagagtt accccgaagg tcaatacttg 360
agtgccagcc tgttcctggt ggagtagcct ccccaggtct gtctcgtcta caataaagtc 420
tgaaacacac ttgccatg 438
<210> 9
<211> 455
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠GSTM1 3'-UTR
<400> 9
gcccttgcta cacgggcact cactaggagg acctgtccac actggggatc ctgcaggccc 60
tgggtgggga cagcaccctg gccttctgca ctgtggctcc tggttctctc tccttcccgc 120
tcccttctgc agcttggtca gccccatctc ctcaccctct tcccagtcaa gtccacacag 180
ccttcattct ccccagtttc tttcacatgg ccccttcttc attggctccc tgacccaacc 240
tcacagcccg tttctgcgaa ctgaggtctg tcctgaactc acgcttccta gaattacccc 300
gatggtcaac actatcttag tgctagccct ccctagagtt accccgaagg tcaatacttg 360
agtgccagcc tgttcctggt ggagtagcct ccccaggtct gtctcgtcta caataaagtc 420
tgaaacacac ttgccatgaa aaaaaaaaaa aaaaa 455
<210> 10
<211> 531
<212> DNA
<213> 人工序列
<220>
<223> 智人GSTM1 3'-UTR
<400> 10
ggccttgaag gccaggaggt gggagtgagg agcccatact cagcctgctg cccaggctgt 60
gcagcgcagc tggactctgc atcccagcac ctgcctcctc gttcctttct cctgtttatt 120
cccatcttta ctcccaagac ttcattgtcc ctcttcactc cccctaaacc cctgtcccat 180
gcaggccctt tgaagcctca gctacccact atccttcgtg aacatcccct cccatcatta 240
cccttccctg cactaaagcc agcctgacct tccttcctgt tagtggttgt gtctgcttta 300
aagggcctgc ctggcccctc gcctgtggag ctcagccccg agctgtcccc gtgttgcatg 360
aaggagcagc attgactggt ttacaggccc tgctcctgca gcatggtccc tgccttaggc 420
ctacctgatg gaagtaaagc ctcaaccaca aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 480
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa a 531
<210> 11
<211> 133
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠NDUFA1 3'-UTR
<400> 11
ggaagcattt tcctggctga ttaaaagaaa ttactcagct atggtcatct gttcctgtta 60
gaaggctatg cagcatatta tatactatgc gcatgttatg aaatgcataa taaaaaattt 120
taaaaaatct aaa 133
<210> 12
<211> 148
<212> DNA
<213> 人工序列
<220>
<223> 智人NDUFA1 3'-UTR
<400> 12
ggaagcattt tcctgattga tgaaaaaaat aactcagtta tggccatcta cccctgctag 60
aaggttacag tgtattatgt agcatgcaat gtgttatgta gtgcttaata aaaataaaat 120
gaaaaaaatg caaaaaaaaa aaaaaaaa 148
<210> 13
<211> 237
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠CBR2 3'-UTR
<400> 13
tctgctcagt tgccgcggac atctgagtgg ccttcttagc cccaccctca gccaaagcat 60
ttactgatct cgtgactccg ccctcatgct acagccacgc ccaccacgca gctcacagtt 120
ccacccccat gttactgtcg atcccacaac cactccaggc gcagaccttg ttctctttgt 180
ccactttgtt gggctcattt gcctaaataa acgggccacc gcgttacctt taactat 237
<210> 14
<211> 416
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠YBX1 3'-UTR
<400> 14
atgccggctt accatctcta ccatcatccg gtttggtcat ccaacaagaa gaaatgaata 60
tgaaattcca gcaataagaa atgaacaaag attggagctg aagaccttaa gtgcttgctt 120
tttgcccgct gaccagataa cattagaact atctgcatta tctatgcagc atggggtttt 180
tattattttt acctaaagat gtctcttttt ggtaatgaca aacgtgtttt ttaagaaaaa 240
aaaaaaaggc ctggtttttc tcaatacacc tttaacggtt tttaaattgt ttcatatctg 300
gtcaagttga gatttttaag aacttcattt ttaatttgta ataaagttta caacttgatt 360
ttttcaaaaa agtcaacaaa ctgcaagcac ctgttaataa aggtcttaaa taataa 416
<210> 15
<211> 418
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠YBX1 3'-UTR
<400> 15
atgccggctt accatctcta ccatcatccg gtttggtcat ccaacaagaa gaaatgaata 60
tgaaattcca gcaataagaa atgaacaaag attggagctg aagaccttaa gtgcttgctt 120
tttgccctct gaccagataa cattagaact atctgcatta tctatgcagc atggggtttt 180
tattattttt acctaaagat gtctcttttt ggtaatgaca aacgtgtttt ttaagaaaaa 240
aaaaaaaaag gcctggtttt tctcaataca cctttaacgg tttttaaatt gtttcatatc 300
tggtcaagtt gagattttta agaacttcat ttttaatttg taataaagtt tacaacttga 360
ttttttcaaa aaagtcaaca aactgcaagc acctgttaat aaaggtctta aataataa 418
<210> 16
<211> 415
<212> DNA
<213> 人工序列
<220>
<223> 智人YBX1 3'-UTR
<400> 16
atgccggctt accatctcta ccatcatccg gtttagtcat ccaacaagaa gaaatatgaa 60
attccagcaa taagaaatga acaaaagatt ggagctgaag acctaaagtg cttgcttttt 120
gcccgttgac cagataaata gaactatctg cattatctat gcagcatggg gtttttatta 180
tttttaccta aagacgtctc tttttggtaa taacaaacgt gttttttaaa aaagcctggt 240
ttttctcaat acgcctttaa aggtttttaa attgtttcat atctggtcaa gttgagattt 300
ttaagaactt catttttaat ttgtaataaa agtttacaac ttgatttttt caaaaaagtc 360
aacaaactgc aagcacctgt taataaaggt cttaaataat aaaaaaaaaa aaaaa 415
<210> 17
<211> 66
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Ndufb8 3'-UTR
<400> 17
ggaggcttga tgggcttttt gccctcgttc ctagaggctt aaccataata aaatccctaa 60
taaagc 66
<210> 18
<211> 125
<212> DNA
<213> 人工序列
<220>
<223> 智人Ndufb8 3'-UTR
<400> 18
ggaggcttcg tgggcttttg ggtcctctaa ctaggactcc ctcattccta gaaatttaac 60
cttaatgaaa tccctaataa aactcagtgc tgtgttattt gtgcctcaaa aaaaaaaaaa 120
aaaaa 125
<210> 19
<211> 377
<212> DNA
<213> 人工序列
<220>
<223> 智人Ndufb8 3'-UTR
<400> 19
gtgaggaaga ggagtgctgt tcctgccttc ctagcccagc tgggtctgac cagaggctac 60
tgtgtaccca tttaccatgc gtgattgtta actcagagtg gggtgtagcc aggtattgac 120
tgaatgtatg ttcttgctga cctgtgtttt tttctgtagg gaccaaagca gtatccttac 180
aataatctgt acctggaacg aggcggtgat ccctccaaag aaccagagcg ggtggttcac 240
tatgagatct gaggaggctt cgtgggcttt tgggtcctct aactaggact ccctcattcc 300
tagaaattta accttaatga aatccctaat aaaactcagt gctgtgttat ttgtgcctca 360
aaaaaaaaaa aaaaaaa 377
<210> 20
<211> 922
<212> DNA
<213> 人工序列
<220>
<223> 智人CNTN1-004 3'-UTR
<400> 20
tcgttgacac tcaccatttc tgtgaaagac tttttttttt tttaacatat tatactagat 60
ttgactaact caatcttgta gcttctgcag ttctccccac ccccaaccta gttcttagag 120
tatgtttccc cttttgaaac atgtaaacat actttgggca taaatatttt ttaaaatata 180
actataatgc ttcactaata ccttaaaaat gcctagtgaa ctaactcagt acattatata 240
atggccaagt gaaagttttg tgttttcatg tcctgttttt ctttgaaatt atatagccca 300
gaaattagct cattatctga aaaacgtata agaactgatg aattgtataa tacaggagta 360
ttgccattga atgtactgtt tgatttattc aagcaggtaa tgaacaatgt tgtcaaactc 420
tctaatgaga catcataatt aggacataag ctaaaagggg cattactccg gcagtctttt 480
tttcttaatc ctagtaccat acatattctt tggcatgaaa gaatgaaaag cattagtaaa 540
caactgaagt cctaccatgg ctctgtaggg tttttggaac aattcctgga attggaaagt 600
gaaaatggat agcatgtggg ggaaaccctc atctgagtag caagatttta gtaaagatga 660
ctaagccatt aacagcatgc attcatattt aattttattg actcctgcca tcagcttttg 720
tagatctttt gggtggaagg ttgtgatttt tactgggagg acttgagtag aagtggatga 780
ttaaaattga ggagtatata attctttctg ggactgctta aatgttattg tttgaaaatg 840
ccttcacttt ccccctttgg tcaaagagat gtgcttaaaa ttcttattcc ttcacaataa 900
ataattttga ttttcttaga ca 922
<210> 21
<211> 922
<212> DNA
<213> 人工序列
<220>
<223> 智人CNTN1-004 3'-UTR
<400> 21
tcgttgacac tcaccatttc tgtgaaagac tttttttttt ttaacatatt atactagatt 60
tgactaactc aatcttgtag cttctgcagt tctccccacc cccaacctag ttcttagagt 120
atgtttcccc ttttgaaaca tgtaaacata ctttgggcat aaatattttt taaaatataa 180
ctataatgct tcactaatac cttaaaaatg cctagtgaac taactcagta cattatataa 240
tggccaagtg aaagttttgt gttttcatgt cctgtttttc tttgaaatta tatagcccag 300
aaattagctc attatctgaa aaacgtatga agaactgatg aattgtataa tacaggagta 360
ttgccattga atgtactgtt tgatttattc aagcaggtaa tgaacaatgt tgtcaaactc 420
tctaatgaga catcataatt aggacataag ctaaaagggg cattactccg gcagtctttt 480
tttcttaatc ctagtaccat acatattctt tggcatgaaa gaatgaaaag cattagtaaa 540
caactgaagt cctaccatgg ctctgtaggg tttttggaac aattcctgga attggaaagt 600
gaaaatggat agcatgtggg ggaaaccctc atctgagtag caagatttta gtaaagatga 660
ctaagccatt aacagcatgc attcatattt aattttattg actcctgcca tcagcttttg 720
tagatcgttt gggtggaagg ttgtgatttt tactgggagg acttgagtag aagtggatga 780
ttaaaattga ggagtatata attctttctg ggactgctta aatgttattg tttgaaaata 840
ccttcacttt ccccctttgg tcaaagagat gtgcttaaaa ttcttattcc ttcacaataa 900
ataattttga ttttcttaga ca 922
<210> 22
<211> 928
<212> DNA
<213> 人工序列
<220>
<223> 智人CNTN1-004 3'-UTR
<400> 22
ttttttcgtt gacactcacc atttctgtga aagacttttt ttttttttaa catattatac 60
tagatttgac taactcaatc ttgtagcttc tgcagttctc cccaccccca acctagttct 120
tagagtatgt ttcccctttt gaaacatgta aacatacttt gggcataaat attttttaaa 180
atataactat aatgcttcac taatacctta aaaatgccta gtgaactaac tcagtacatt 240
atataatggc caagtgaaag ttttgtgttt tcatgtcctg tttttctttg aaattatata 300
gcccagaaat tagctcatta tctgaaaaac gtatgaagaa ctgatgaatt gtataataca 360
ggagtattgc cattgaatgt actgtttgat ttattcaagc aggtaatgaa caatgttgtc 420
aaactctcta atgagacatc ataattagga cataagctaa aaggggcatt actccggcag 480
tctttttttc ttaatcctag taccatacat attctttggc atgaaagaat gaaaagcatt 540
agtaaacaac tgaagtccta ccatggctct gtagggtttt tggaacaatt cctggaattg 600
gaaagtgaaa atggatagca tgtgggggaa accctcatct gagtagcaag attttagtaa 660
agatgactaa gccattaaca gcatgcattc atatttaatt ttattgactc ctgccatcag 720
cttttgtaga tcttttgggt ggaaggttgt gatttttact gggaggactt gagtagaagt 780
ggatgattaa aattgaggag tatataattc tttctgggac tgcttaaatg ttattgtttg 840
aaaatgcctt cactttcccc ctttggtcaa agagatgtgc ttaaaattct tattccttca 900
caataaataa ttttgatttt cttagaca 928
<210> 23
<211> 2380
<212> DNA
<213> 人工序列
<220>
<223> 智人CNTN1-004 3'-UTR
<400> 23
atgtgttgtg acagctgctg ttcccatccc agctcagaag acacccttca accctgggat 60
gaccacaatt ccttccaatt tctgcggctc catcctaagc caaataaatt atactttaac 120
aaactattca actgatttac aacacacatg atgactgagg cattcgggaa ccccttcatc 180
caaaagaata aacttttaaa tggatataaa tgatttttaa ctcgttccaa tatgccttat 240
aaaccactta acctgattct gtgacagttg catgatttaa cccaatggga caagttacag 300
tgttcaattc aatactatag gctgtagagt gaaagtcaaa tcaccatata caggtgcttt 360
aaatttaata acaagttgtg aaatataata gagattgaaa tgttggttgt atgtggtaaa 420
tgtaagagta atacagtctc ttgtactttc ctcactgttt tgggtactgc atattattga 480
atggccccta tcattcatga catcttgagt tttcttgaaa agacaataga gtgtaacaaa 540
tattttgtca gaaatcccat tatcaaatca tgagttgaaa gattttgact attgaaaacc 600
aaattctaga acttactatc agtattctta ttttcaaagg aaataatttt ctaaatattt 660
gattttcaga atcagttttt taatagtaaa gttaacatac catatagatt tttttttact 720
tttatattct actctgaagt tattttatgc ttttcttatc aatttcaaat ctcaaaaatc 780
acagctctta tctagagtat cataatattg ctatatttgt tcatatgtgg agtgacaaat 840
tttgaaaagt agagtgcttc cttttttatt gagatgtgac agtctttaca tggttaggaa 900
taagtgacag ttaagtgaat atcacaatta ctagtatgtt ggtttttctg cttcattcct 960
aagtattacg tttctttatt gcagatgtca gatcaaaaag tcacctgtag gttgaaaaag 1020
ctaccgtatt ccattttgta aaaataacaa taataataat aataataatt agttttaagc 1080
tcatttccca cttcaatgca atactgaaaa ctggctaaaa ataccaaatc aatatactgc 1140
taatggtact ttgaagagta tgcaaaactg gaaggccagg aggaggcaaa taatatgtct 1200
ttccgatggt gtctcccaag tgttggtgct ttgggttttt ataagttgtg aaaaggaaga 1260
tgcacatttc ttcattctcc atggtgtgca tggaaatgtg tttgagtgtg gatgtaaaag 1320
aaatcgagta ataaagaatt agctggcttg tgaaatagtg cagtgttgga tgcttcaaga 1380
ggtataatcc tattttatta gcacaaactt gctagctaat tagagtttat ctttttagaa 1440
aggacaccgt ataggttcgt aaaaaatatt tacaggaagc aaaatagatc tattactact 1500
ttaccgactt tacccccttt ctttaatttg tataattttt gtactatata tcgatgtgta 1560
aatgtttaga gtcttcatta tgaaaatatc aataaatatt tcattagttt acatttaact 1620
ctggtataaa atgaaacttt taaaaataag tgaaatggat gatttcccag tggaagtatg 1680
tcaacagtct taagatcatt gccagatttc ataaaatatt taagtatttg aaaaagaaac 1740
aaaatgtctt catactttag ggaaacgaat accctgtata ccttctgtac aaatgtttgt 1800
gttttcattg ttacactttg gggttttact tttgcaatgt gacccatgtt gggcattttt 1860
atataatcaa caactaaatc ttttgccaaa tgcatgcttg ccttttattt tctaatatat 1920
gataataacg agcaaaactg gttagatttt gcatgaaatg gttctgaaag gtaagaggaa 1980
aacagacttt ggaggttgtt tagttttgaa tttctgacag agataaagta gtttaaaatc 2040
tctcgtacac tgataactca agcttttcat tttctcatac agttgtacag atttaactgg 2100
gaccatcagt tttaaactgt tgtcaagcta actaataatc atctgcttta agacgcaaga 2160
ttctgaatta aactttatat aggtatagat acatctgttg tttctttgta tttcaggaaa 2220
ggtgatagta gttttatttg atactgataa atattgaatt gattttttag ttatttttta 2280
tcattttttc aatggagtag tataggactg tgctttgtcc tttttatgaa tgaaaaaatt 2340
agtataaagt aataaatgtc ttatgttacc caagaaaaaa 2380
<210> 24
<211> 1204
<212> DNA
<213> 人工序列
<220>
<223> 智人CNTN1-004 3'-UTR
<400> 24
tcgttgacac tcaccatttc tgtgaaagac tttttttttt ttaacatatt atactagatt 60
tgactaactc aatcttgtag cttctgcagt tctccccacc cccaacctag ttcttagagt 120
atgtttcccc ttttgaaaca tgtaaacata ctttgggcat aaatattttt taaaatataa 180
ctataatgct tcactaatac cttaaaaatg cctagtgaac taactcagta cattatataa 240
tggccaagtg aaagttttgt gttttcatgt cctgtttttc tttgaaatta tatagcccag 300
aaattagctc attatctgaa aaacgtatga agaactgatg aattgtataa tacaggagta 360
ttgccattga atgtactgtt tgatttattc aagcaggtaa tgaacaatgt tgtcaaactc 420
tctaatgaga catcataatt aggacataag ctaaaagggg cattactccg gcagtctttt 480
tttcttaatc ctagtaccat acatattctt tggcatgaaa gaatgaaaag cattagtaaa 540
caactgaagt cctaccatgg ctctgtaggg tttttggaac aattcctgga attggaaagt 600
gaaaatggat agcatgtggg ggaaaccctc atctgagtag caagatttta gtaaagatga 660
ctaagccatt aacagcatgc attcatattt aattttattg actcctgcca tcagcttttg 720
tagatcgttt gggtggaagg ttgtgatttt tactgggagg acttgagtag aagtggatga 780
ttaaaattga ggagtatata attctttctg ggactgctta aatgttattg tttgaaaata 840
ccttcacttt ccccctttgg tcaaagagat gtgcttaaaa ttcttattcc ttcacaataa 900
ataattttga ttttcttaga caggtttgtg tttaggtatg agtttctctt ttacttcatc 960
tagcaattct ctctgtggtc agaagaactc tgaagaaagc tttgagggaa atgaatataa 1020
ctcttaaatt attatatgtg tgtgtatata tatagtttaa ctttaaaaat aatttattag 1080
tcatcataaa gaaataaatg tctctggctc aagatgttac ttatttcctt cttttatatt 1140
ttctagtctc aattactgtt ccaaaaggag ctatcttaga acttagacta gagatccaga 1200
ttaa 1204
<210> 25
<211> 54
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠MP68 5'-UTR
<400> 25
ctttcccatt ctgtagcaga atttggtgtt gcctgtggtc ttggtcccgc ggag 54
<210> 26
<211> 97
<212> DNA
<213> 人工序列
<220>
<223> 智人MP68 5'-UTR
<400> 26
cttcccggca tcccctgcgc gcgcctgcgc gctcggtgac ctttccgagt tggctgcaga 60
tttgtggtgc gttctgagcc gtctgtcctg cgccaag 97
<210> 27
<211> 315
<212> DNA
<213> 人工序列
<220>
<223> 智人MP68 5'-UTR
<400> 27
cttcccggca tcccctgcgc gcgcctgcgc gctcggtgac ctttccgagt tggctgcaga 60
tttgtggtgc gttctgagcc gtctgtcctg cgccaaggga gcgtaccttg gccttgagag 120
gttcagctgc ctaacccaga ggctacgcag agttagagaa gccagagtcc aagccaagaa 180
ctctgactcc acatccagtc ccttctctcc tttataactc aagtttcctt gcgccacact 240
gccctccacg ttatgctgta catgacaact tgggtgaggc aacagggaag ctgaaaagag 300
atcatacggt gctga 315
<210> 28
<211> 81
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠NDUFA4 5'-UTR
<400> 28
gtccgctcag ccaggttgca gaagcggctt agcgtgtgtc ctaatcttct ctctgcgtgt 60
aggtaggcct gtgccgcaaa c 81
<210> 29
<211> 81
<212> DNA
<213> 人工序列
<220>
<223> 智人NDUFA4 5'-UTR
<400> 29
guccgcucag ccagguugca gaagcggcuu agcguguguc cuaaucuucu cucugcgugu 60
agguaggccu gugccgcaaa c 81
<210> 30
<211> 129
<212> DNA
<213> 人工序列
<220>
<223> 智人NDUFA4 5'-UTR
<400> 30
gggtccttca ggtaggaggt cctgggtgac tttggaagtc cgtagtgtct cattgcagat 60
aatttttagc ttagggcctg gtggctaggt cggttctctc ctttccagtc ggagacctct 120
gccgcaaac 129
<210> 31
<211> 186
<212> DNA
<213> 人工序列
<220>
<223> 人白蛋白3'-UTR
<400> 31
catcacattt aaaagcatct cagcctacca tgagaataag agaaagaaaa tgaagatcaa 60
aagcttattc atctgttttt ctttttcgtt ggtgtaaagc caacaccctg tctaaaaaac 120
ataaatttct ttaatcattt tgcctctttt ctctgtgctt caattaataa aaaatggaaa 180
gaatct 186
<210> 32
<211> 186
<212> DNA
<213> 人工序列
<220>
<223> 白蛋白7 3'-UTR
<400> 32
catcacattt aaaagcatct cagcctacca tgagaataag agaaagaaaa tgaagatcaa 60
tagcttattc atctcttttt ctttttcgtt ggtgtaaagc caacaccctg tctaaaaaac 120
ataaatttct ttaatcattt tgcctctttt ctctgtgctt caattaataa aaaatggaaa 180
gaacct 186
<210> 33
<211> 42
<212> DNA
<213> 人工序列
<220>
<223> 缺少5'末端寡嘧啶束的人核糖体蛋白大32的5'-UTR
<400> 33
ggcgctgcct acggaggtgg cagccatctc cttctcggca tc 42
<210> 34
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> histone stem-loop
<400> 34
caaaggctct tttcagagcc acca 24
<210> 35
<211> 1848
<212> RNA
<213> 人工序列
<220>
<223> 32L4 - PpLuc(GC) - A64 - C30 - hSL
<400> 35
ggggcgcugc cuacggaggu ggcagccauc uccuucucgg caucaagcuu gaggauggag 60
gacgccaaga acaucaagaa gggcccggcg cccuucuacc cgcuggagga cgggaccgcc 120
ggcgagcagc uccacaaggc caugaagcgg uacgcccugg ugccgggcac gaucgccuuc 180
accgacgccc acaucgaggu cgacaucacc uacgcggagu acuucgagau gagcgugcgc 240
cuggccgagg ccaugaagcg guacggccug aacaccaacc accggaucgu ggugugcucg 300
gagaacagcc ugcaguucuu caugccggug cugggcgccc ucuucaucgg cguggccguc 360
gccccggcga acgacaucua caacgagcgg gagcugcuga acagcauggg gaucagccag 420
ccgaccgugg uguucgugag caagaagggc cugcagaaga uccugaacgu gcagaagaag 480
cugcccauca uccagaagau caucaucaug gacagcaaga ccgacuacca gggcuuccag 540
ucgauguaca cguucgugac cagccaccuc ccgccgggcu ucaacgagua cgacuucguc 600
ccggagagcu ucgaccggga caagaccauc gcccugauca ugaacagcag cggcagcacc 660
ggccugccga aggggguggc ccugccgcac cggaccgccu gcgugcgcuu cucgcacgcc 720
cgggacccca ucuucggcaa ccagaucauc ccggacaccg ccauccugag cguggugccg 780
uuccaccacg gcuucggcau guucacgacc cugggcuacc ucaucugcgg cuuccgggug 840
guccugaugu accgguucga ggaggagcug uuccugcgga gccugcagga cuacaagauc 900
cagagcgcgc ugcucgugcc gacccuguuc agcuucuucg ccaagagcac ccugaucgac 960
aaguacgacc ugucgaaccu gcacgagauc gccagcgggg gcgccccgcu gagcaaggag 1020
gugggcgagg ccguggccaa gcgguuccac cucccgggca uccgccaggg cuacggccug 1080
accgagacca cgagcgcgau ccugaucacc cccgaggggg acgacaagcc gggcgccgug 1140
ggcaaggugg ucccguucuu cgaggccaag gugguggacc uggacaccgg caagacccug 1200
ggcgugaacc agcggggcga gcugugcgug cgggggccga ugaucaugag cggcuacgug 1260
aacaacccgg aggccaccaa cgcccucauc gacaaggacg gcuggcugca cagcggcgac 1320
aucgccuacu gggacgagga cgagcacuuc uucaucgucg accggcugaa gucgcugauc 1380
aaguacaagg gcuaccaggu ggcgccggcc gagcuggaga gcauccugcu ccagcacccc 1440
aacaucuucg acgccggcgu ggccgggcug ccggacgacg acgccggcga gcugccggcc 1500
gcgguggugg ugcuggagca cggcaagacc augacggaga aggagaucgu cgacuacgug 1560
gccagccagg ugaccaccgc caagaagcug cggggcggcg ugguguucgu ggacgagguc 1620
ccgaagggcc ugaccgggaa gcucgacgcc cggaagaucc gcgagauccu gaucaaggcc 1680
aagaagggcg gcaagaucgc cguguaagac uaguagaucu aaaaaaaaaa aaaaaaaaaa 1740
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaugcauc cccccccccc 1800
cccccccccc cccccccccc aaaggcucuu uucagagcca ccagaauu 1848
<210> 36
<211> 2201
<212> RNA
<213> 人工序列
<220>
<223> 32L4 - PpLuc(GC) - gnas-A64-C30-hSL
<400> 36
ggggcgcugc cuacggaggu ggcagccauc uccuucucgg caucaagcuu gaggauggag 60
gacgccaaga acaucaagaa gggcccggcg cccuucuacc cgcuggagga cgggaccgcc 120
ggcgagcagc uccacaaggc caugaagcgg uacgcccugg ugccgggcac gaucgccuuc 180
accgacgccc acaucgaggu cgacaucacc uacgcggagu acuucgagau gagcgugcgc 240
cuggccgagg ccaugaagcg guacggccug aacaccaacc accggaucgu ggugugcucg 300
gagaacagcc ugcaguucuu caugccggug cugggcgccc ucuucaucgg cguggccguc 360
gccccggcga acgacaucua caacgagcgg gagcugcuga acagcauggg gaucagccag 420
ccgaccgugg uguucgugag caagaagggc cugcagaaga uccugaacgu gcagaagaag 480
cugcccauca uccagaagau caucaucaug gacagcaaga ccgacuacca gggcuuccag 540
ucgauguaca cguucgugac cagccaccuc ccgccgggcu ucaacgagua cgacuucguc 600
ccggagagcu ucgaccggga caagaccauc gcccugauca ugaacagcag cggcagcacc 660
ggccugccga aggggguggc ccugccgcac cggaccgccu gcgugcgcuu cucgcacgcc 720
cgggacccca ucuucggcaa ccagaucauc ccggacaccg ccauccugag cguggugccg 780
uuccaccacg gcuucggcau guucacgacc cugggcuacc ucaucugcgg cuuccgggug 840
guccugaugu accgguucga ggaggagcug uuccugcgga gccugcagga cuacaagauc 900
cagagcgcgc ugcucgugcc gacccuguuc agcuucuucg ccaagagcac ccugaucgac 960
aaguacgacc ugucgaaccu gcacgagauc gccagcgggg gcgccccgcu gagcaaggag 1020
gugggcgagg ccguggccaa gcgguuccac cucccgggca uccgccaggg cuacggccug 1080
accgagacca cgagcgcgau ccugaucacc cccgaggggg acgacaagcc gggcgccgug 1140
ggcaaggugg ucccguucuu cgaggccaag gugguggacc uggacaccgg caagacccug 1200
ggcgugaacc agcggggcga gcugugcgug cgggggccga ugaucaugag cggcuacgug 1260
aacaacccgg aggccaccaa cgcccucauc gacaaggacg gcuggcugca cagcggcgac 1320
aucgccuacu gggacgagga cgagcacuuc uucaucgucg accggcugaa gucgcugauc 1380
aaguacaagg gcuaccaggu ggcgccggcc gagcuggaga gcauccugcu ccagcacccc 1440
aacaucuucg acgccggcgu ggccgggcug ccggacgacg acgccggcga gcugccggcc 1500
gcgguggugg ugcuggagca cggcaagacc augacggaga aggagaucgu cgacuacgug 1560
gccagccagg ugaccaccgc caagaagcug cggggcggcg ugguguucgu ggacgagguc 1620
ccgaagggcc ugaccgggaa gcucgacgcc cggaagaucc gcgagauccu gaucaaggcc 1680
aagaagggcg gcaagaucgc cguguaagac uagugaaggg aacacccaaa uuuaauucag 1740
ccuuaagcac aauuaauuaa gagugaaacg uaauuguaca agcaguuggu cacccaccau 1800
agggcaugau caacaccgca accuuuccuu uuucccccag ugauucugaa aaaccccucu 1860
ucccuucagc uugcuuagau guuccaaauu uaguaagcuu aaggcggccu acagaagaaa 1920
aagaaaaaaa aggccacaaa aguucccucu cacuuucagu aaauaaaaua aaagcagcaa 1980
cagaaauaaa gaaauaaaug aaauucaaaa ugaaauaaau auuguguugu gcagcauuaa 2040
aaaaucaaua aaaauuaaaa augagcaaga ucuaaaaaaa aaaaaaaaaa aaaaaaaaaa 2100
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaugc aucccccccc cccccccccc 2160
cccccccccc cccaaaggcu cuuuucagag ccaccagaau u 2201
<210> 37
<211> 1965
<212> RNA
<213> 人工序列
<220>
<223> 32L4 - PpLuc(GC) - morn2- A64 - C30 - hSL
<400> 37
ggggcgcugc cuacggaggu ggcagccauc uccuucucgg caucaagcuu gaggauggag 60
gacgccaaga acaucaagaa gggcccggcg cccuucuacc cgcuggagga cgggaccgcc 120
ggcgagcagc uccacaaggc caugaagcgg uacgcccugg ugccgggcac gaucgccuuc 180
accgacgccc acaucgaggu cgacaucacc uacgcggagu acuucgagau gagcgugcgc 240
cuggccgagg ccaugaagcg guacggccug aacaccaacc accggaucgu ggugugcucg 300
gagaacagcc ugcaguucuu caugccggug cugggcgccc ucuucaucgg cguggccguc 360
gccccggcga acgacaucua caacgagcgg gagcugcuga acagcauggg gaucagccag 420
ccgaccgugg uguucgugag caagaagggc cugcagaaga uccugaacgu gcagaagaag 480
cugcccauca uccagaagau caucaucaug gacagcaaga ccgacuacca gggcuuccag 540
ucgauguaca cguucgugac cagccaccuc ccgccgggcu ucaacgagua cgacuucguc 600
ccggagagcu ucgaccggga caagaccauc gcccugauca ugaacagcag cggcagcacc 660
ggccugccga aggggguggc ccugccgcac cggaccgccu gcgugcgcuu cucgcacgcc 720
cgggacccca ucuucggcaa ccagaucauc ccggacaccg ccauccugag cguggugccg 780
uuccaccacg gcuucggcau guucacgacc cugggcuacc ucaucugcgg cuuccgggug 840
guccugaugu accgguucga ggaggagcug uuccugcgga gccugcagga cuacaagauc 900
cagagcgcgc ugcucgugcc gacccuguuc agcuucuucg ccaagagcac ccugaucgac 960
aaguacgacc ugucgaaccu gcacgagauc gccagcgggg gcgccccgcu gagcaaggag 1020
gugggcgagg ccguggccaa gcgguuccac cucccgggca uccgccaggg cuacggccug 1080
accgagacca cgagcgcgau ccugaucacc cccgaggggg acgacaagcc gggcgccgug 1140
ggcaaggugg ucccguucuu cgaggccaag gugguggacc uggacaccgg caagacccug 1200
ggcgugaacc agcggggcga gcugugcgug cgggggccga ugaucaugag cggcuacgug 1260
aacaacccgg aggccaccaa cgcccucauc gacaaggacg gcuggcugca cagcggcgac 1320
aucgccuacu gggacgagga cgagcacuuc uucaucgucg accggcugaa gucgcugauc 1380
aaguacaagg gcuaccaggu ggcgccggcc gagcuggaga gcauccugcu ccagcacccc 1440
aacaucuucg acgccggcgu ggccgggcug ccggacgacg acgccggcga gcugccggcc 1500
gcgguggugg ugcuggagca cggcaagacc augacggaga aggagaucgu cgacuacgug 1560
gccagccagg ugaccaccgc caagaagcug cggggcggcg ugguguucgu ggacgagguc 1620
ccgaagggcc ugaccgggaa gcucgacgcc cggaagaucc gcgagauccu gaucaaggcc 1680
aagaagggcg gcaagaucgc cguguaagac uaguaccugc ugccuuaacg cugagaugug 1740
gccucugcaa ccccccuuag gcaaagcaac ugaaccuucu gcuaaaguga ccugcccucu 1800
uccguaaguc caauaaaguu gucaugcacc cagaucuaaa aaaaaaaaaa aaaaaaaaaa 1860
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa augcaucccc cccccccccc 1920
cccccccccc cccccccaaa ggcucuuuuc agagccacca gaauu 1965
<210> 38
<211> 2286
<212> RNA
<213> 人工序列
<220>
<223> 32L4 - PpLuc(GC) - gstm1- A64 - C30 - hSL
<400> 38
ggggcgcugc cuacggaggu ggcagccauc uccuucucgg caucaagcuu gaggauggag 60
gacgccaaga acaucaagaa gggcccggcg cccuucuacc cgcuggagga cgggaccgcc 120
ggcgagcagc uccacaaggc caugaagcgg uacgcccugg ugccgggcac gaucgccuuc 180
accgacgccc acaucgaggu cgacaucacc uacgcggagu acuucgagau gagcgugcgc 240
cuggccgagg ccaugaagcg guacggccug aacaccaacc accggaucgu ggugugcucg 300
gagaacagcc ugcaguucuu caugccggug cugggcgccc ucuucaucgg cguggccguc 360
gccccggcga acgacaucua caacgagcgg gagcugcuga acagcauggg gaucagccag 420
ccgaccgugg uguucgugag caagaagggc cugcagaaga uccugaacgu gcagaagaag 480
cugcccauca uccagaagau caucaucaug gacagcaaga ccgacuacca gggcuuccag 540
ucgauguaca cguucgugac cagccaccuc ccgccgggcu ucaacgagua cgacuucguc 600
ccggagagcu ucgaccggga caagaccauc gcccugauca ugaacagcag cggcagcacc 660
ggccugccga aggggguggc ccugccgcac cggaccgccu gcgugcgcuu cucgcacgcc 720
cgggacccca ucuucggcaa ccagaucauc ccggacaccg ccauccugag cguggugccg 780
uuccaccacg gcuucggcau guucacgacc cugggcuacc ucaucugcgg cuuccgggug 840
guccugaugu accgguucga ggaggagcug uuccugcgga gccugcagga cuacaagauc 900
cagagcgcgc ugcucgugcc gacccuguuc agcuucuucg ccaagagcac ccugaucgac 960
aaguacgacc ugucgaaccu gcacgagauc gccagcgggg gcgccccgcu gagcaaggag 1020
gugggcgagg ccguggccaa gcgguuccac cucccgggca uccgccaggg cuacggccug 1080
accgagacca cgagcgcgau ccugaucacc cccgaggggg acgacaagcc gggcgccgug 1140
ggcaaggugg ucccguucuu cgaggccaag gugguggacc uggacaccgg caagacccug 1200
ggcgugaacc agcggggcga gcugugcgug cgggggccga ugaucaugag cggcuacgug 1260
aacaacccgg aggccaccaa cgcccucauc gacaaggacg gcuggcugca cagcggcgac 1320
aucgccuacu gggacgagga cgagcacuuc uucaucgucg accggcugaa gucgcugauc 1380
aaguacaagg gcuaccaggu ggcgccggcc gagcuggaga gcauccugcu ccagcacccc 1440
aacaucuucg acgccggcgu ggccgggcug ccggacgacg acgccggcga gcugccggcc 1500
gcgguggugg ugcuggagca cggcaagacc augacggaga aggagaucgu cgacuacgug 1560
gccagccagg ugaccaccgc caagaagcug cggggcggcg ugguguucgu ggacgagguc 1620
ccgaagggcc ugaccgggaa gcucgacgcc cggaagaucc gcgagauccu gaucaaggcc 1680
aagaagggcg gcaagaucgc cguguaagac uagugcccuu gcuacacggg cacucacuag 1740
gaggaccugu ccacacuggg gauccugcag gcccugggug gggacagcac ccuggccuuc 1800
ugcacugugg cuccugguuc ucucuccuuc ccgcucccuu cugcagcuug gucagcccca 1860
ucuccucacc cucuucccag ucaaguccac acagccuuca uucuccccag uuucuuucac 1920
auggccccuu cuucauuggc ucccugaccc aaccucacag cccguuucug cgaacugagg 1980
ucuguccuga acucacgcuu ccuagaauua ccccgauggu caacacuauc uuagugcuag 2040
cccucccuag aguuaccccg aaggucaaua cuugagugcc agccuguucc ugguggagua 2100
gccuccccag gucugucucg ucuacaauaa agucugaaac acacuugcca ugagaucuaa 2160
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2220
aaugcauccc cccccccccc cccccccccc ccccccccaa aggcucuuuu cagagccacc 2280
agaauu 2286
<210> 39
<211> 1981
<212> RNA
<213> 人工序列
<220>
<223> 32L4 - PpLuc(GC) - ndufa1 - A64 - C30 - hSL
<400> 39
ggggcgcugc cuacggaggu ggcagccauc uccuucucgg caucaagcuu gaggauggag 60
gacgccaaga acaucaagaa gggcccggcg cccuucuacc cgcuggagga cgggaccgcc 120
ggcgagcagc uccacaaggc caugaagcgg uacgcccugg ugccgggcac gaucgccuuc 180
accgacgccc acaucgaggu cgacaucacc uacgcggagu acuucgagau gagcgugcgc 240
cuggccgagg ccaugaagcg guacggccug aacaccaacc accggaucgu ggugugcucg 300
gagaacagcc ugcaguucuu caugccggug cugggcgccc ucuucaucgg cguggccguc 360
gccccggcga acgacaucua caacgagcgg gagcugcuga acagcauggg gaucagccag 420
ccgaccgugg uguucgugag caagaagggc cugcagaaga uccugaacgu gcagaagaag 480
cugcccauca uccagaagau caucaucaug gacagcaaga ccgacuacca gggcuuccag 540
ucgauguaca cguucgugac cagccaccuc ccgccgggcu ucaacgagua cgacuucguc 600
ccggagagcu ucgaccggga caagaccauc gcccugauca ugaacagcag cggcagcacc 660
ggccugccga aggggguggc ccugccgcac cggaccgccu gcgugcgcuu cucgcacgcc 720
cgggacccca ucuucggcaa ccagaucauc ccggacaccg ccauccugag cguggugccg 780
uuccaccacg gcuucggcau guucacgacc cugggcuacc ucaucugcgg cuuccgggug 840
guccugaugu accgguucga ggaggagcug uuccugcgga gccugcagga cuacaagauc 900
cagagcgcgc ugcucgugcc gacccuguuc agcuucuucg ccaagagcac ccugaucgac 960
aaguacgacc ugucgaaccu gcacgagauc gccagcgggg gcgccccgcu gagcaaggag 1020
gugggcgagg ccguggccaa gcgguuccac cucccgggca uccgccaggg cuacggccug 1080
accgagacca cgagcgcgau ccugaucacc cccgaggggg acgacaagcc gggcgccgug 1140
ggcaaggugg ucccguucuu cgaggccaag gugguggacc uggacaccgg caagacccug 1200
ggcgugaacc agcggggcga gcugugcgug cgggggccga ugaucaugag cggcuacgug 1260
aacaacccgg aggccaccaa cgcccucauc gacaaggacg gcuggcugca cagcggcgac 1320
aucgccuacu gggacgagga cgagcacuuc uucaucgucg accggcugaa gucgcugauc 1380
aaguacaagg gcuaccaggu ggcgccggcc gagcuggaga gcauccugcu ccagcacccc 1440
aacaucuucg acgccggcgu ggccgggcug ccggacgacg acgccggcga gcugccggcc 1500
gcgguggugg ugcuggagca cggcaagacc augacggaga aggagaucgu cgacuacgug 1560
gccagccagg ugaccaccgc caagaagcug cggggcggcg ugguguucgu ggacgagguc 1620
ccgaagggcc ugaccgggaa gcucgacgcc cggaagaucc gcgagauccu gaucaaggcc 1680
aagaagggcg gcaagaucgc cguguaagac uaguggaagc auuuuccugg cugauuaaaa 1740
gaaauuacuc agcuaugguc aucuguuccu guuagaaggc uaugcagcau auuauauacu 1800
augcgcaugu uaugaaaugc auaauaaaaa auuuuaaaaa aucuaaaaga ucuaaaaaaa 1860
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaugc 1920
aucccccccc cccccccccc cccccccccc cccaaaggcu cuuuucagag ccaccagaau 1980
u 1981
<210> 40
<211> 2085
<212> RNA
<213> 人工序列
<220>
<223> 32L4 - PpLuc(GC) - cbr2 - A64 - C30 - hSL
<400> 40
ggggcgcugc cuacggaggu ggcagccauc uccuucucgg caucaagcuu gaggauggag 60
gacgccaaga acaucaagaa gggcccggcg cccuucuacc cgcuggagga cgggaccgcc 120
ggcgagcagc uccacaaggc caugaagcgg uacgcccugg ugccgggcac gaucgccuuc 180
accgacgccc acaucgaggu cgacaucacc uacgcggagu acuucgagau gagcgugcgc 240
cuggccgagg ccaugaagcg guacggccug aacaccaacc accggaucgu ggugugcucg 300
gagaacagcc ugcaguucuu caugccggug cugggcgccc ucuucaucgg cguggccguc 360
gccccggcga acgacaucua caacgagcgg gagcugcuga acagcauggg gaucagccag 420
ccgaccgugg uguucgugag caagaagggc cugcagaaga uccugaacgu gcagaagaag 480
cugcccauca uccagaagau caucaucaug gacagcaaga ccgacuacca gggcuuccag 540
ucgauguaca cguucgugac cagccaccuc ccgccgggcu ucaacgagua cgacuucguc 600
ccggagagcu ucgaccggga caagaccauc gcccugauca ugaacagcag cggcagcacc 660
ggccugccga aggggguggc ccugccgcac cggaccgccu gcgugcgcuu cucgcacgcc 720
cgggacccca ucuucggcaa ccagaucauc ccggacaccg ccauccugag cguggugccg 780
uuccaccacg gcuucggcau guucacgacc cugggcuacc ucaucugcgg cuuccgggug 840
guccugaugu accgguucga ggaggagcug uuccugcgga gccugcagga cuacaagauc 900
cagagcgcgc ugcucgugcc gacccuguuc agcuucuucg ccaagagcac ccugaucgac 960
aaguacgacc ugucgaaccu gcacgagauc gccagcgggg gcgccccgcu gagcaaggag 1020
gugggcgagg ccguggccaa gcgguuccac cucccgggca uccgccaggg cuacggccug 1080
accgagacca cgagcgcgau ccugaucacc cccgaggggg acgacaagcc gggcgccgug 1140
ggcaaggugg ucccguucuu cgaggccaag gugguggacc uggacaccgg caagacccug 1200
ggcgugaacc agcggggcga gcugugcgug cgggggccga ugaucaugag cggcuacgug 1260
aacaacccgg aggccaccaa cgcccucauc gacaaggacg gcuggcugca cagcggcgac 1320
aucgccuacu gggacgagga cgagcacuuc uucaucgucg accggcugaa gucgcugauc 1380
aaguacaagg gcuaccaggu ggcgccggcc gagcuggaga gcauccugcu ccagcacccc 1440
aacaucuucg acgccggcgu ggccgggcug ccggacgacg acgccggcga gcugccggcc 1500
gcgguggugg ugcuggagca cggcaagacc augacggaga aggagaucgu cgacuacgug 1560
gccagccagg ugaccaccgc caagaagcug cggggcggcg ugguguucgu ggacgagguc 1620
ccgaagggcc ugaccgggaa gcucgacgcc cggaagaucc gcgagauccu gaucaaggcc 1680
aagaagggcg gcaagaucgc cguguaagac uaguucugcu caguugccgc ggacaucuga 1740
guggccuucu uagccccacc cucagccaaa gcauuuacug aucucgugac uccgcccuca 1800
ugcuacagcc acgcccacca cgcagcucac aguuccaccc ccauguuacu gucgauccca 1860
caaccacucc aggcgcagac cuuguucucu uuguccacuu uguugggcuc auuugccuaa 1920
auaaacgggc caccgcguua ccuuuaacua uagaucuaaa aaaaaaaaaa aaaaaaaaaa 1980
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa augcaucccc cccccccccc 2040
cccccccccc cccccccaaa ggcucuuuuc agagccacca gaauu 2085
<210> 41
<211> 1997
<212> RNA
<213> 人工序列
<220>
<223> PpLuc(GC) - 白蛋白7- A64 - C30 - hSL
<400> 41
gggagaaagc uugaggaugg aggacgccaa gaacaucaag aagggcccgg cgcccuucua 60
cccgcuggag gacgggaccg ccggcgagca gcuccacaag gccaugaagc gguacgcccu 120
ggugccgggc acgaucgccu ucaccgacgc ccacaucgag gucgacauca ccuacgcgga 180
guacuucgag augagcgugc gccuggccga ggccaugaag cgguacggcc ugaacaccaa 240
ccaccggauc guggugugcu cggagaacag ccugcaguuc uucaugccgg ugcugggcgc 300
ccucuucauc ggcguggccg ucgccccggc gaacgacauc uacaacgagc gggagcugcu 360
gaacagcaug gggaucagcc agccgaccgu gguguucgug agcaagaagg gccugcagaa 420
gauccugaac gugcagaaga agcugcccau cauccagaag aucaucauca uggacagcaa 480
gaccgacuac cagggcuucc agucgaugua cacguucgug accagccacc ucccgccggg 540
cuucaacgag uacgacuucg ucccggagag cuucgaccgg gacaagacca ucgcccugau 600
caugaacagc agcggcagca ccggccugcc gaagggggug gcccugccgc accggaccgc 660
cugcgugcgc uucucgcacg cccgggaccc caucuucggc aaccagauca ucccggacac 720
cgccauccug agcguggugc cguuccacca cggcuucggc auguucacga cccugggcua 780
ccucaucugc ggcuuccggg ugguccugau guaccgguuc gaggaggagc uguuccugcg 840
gagccugcag gacuacaaga uccagagcgc gcugcucgug ccgacccugu ucagcuucuu 900
cgccaagagc acccugaucg acaaguacga ccugucgaac cugcacgaga ucgccagcgg 960
gggcgccccg cugagcaagg aggugggcga ggccguggcc aagcgguucc accucccggg 1020
cauccgccag ggcuacggcc ugaccgagac cacgagcgcg auccugauca cccccgaggg 1080
ggacgacaag ccgggcgccg ugggcaaggu ggucccguuc uucgaggcca agguggugga 1140
ccuggacacc ggcaagaccc ugggcgugaa ccagcggggc gagcugugcg ugcgggggcc 1200
gaugaucaug agcggcuacg ugaacaaccc ggaggccacc aacgcccuca ucgacaagga 1260
cggcuggcug cacagcggcg acaucgccua cugggacgag gacgagcacu ucuucaucgu 1320
cgaccggcug aagucgcuga ucaaguacaa gggcuaccag guggcgccgg ccgagcugga 1380
gagcauccug cuccagcacc ccaacaucuu cgacgccggc guggccgggc ugccggacga 1440
cgacgccggc gagcugccgg ccgcgguggu ggugcuggag cacggcaaga ccaugacgga 1500
gaaggagauc gucgacuacg uggccagcca ggugaccacc gccaagaagc ugcggggcgg 1560
cgugguguuc guggacgagg ucccgaaggg ccugaccggg aagcucgacg cccggaagau 1620
ccgcgagauc cugaucaagg ccaagaaggg cggcaagauc gccguguaag acuagugcau 1680
cacauuuaaa agcaucucag ccuaccauga gaauaagaga aagaaaauga agaucaauag 1740
cuuauucauc ucuuuuucuu uuucguuggu guaaagccaa cacccugucu aaaaaacaua 1800
aauuucuuua aucauuuugc cucuuuucuc ugugcuucaa uuaauaaaaa auggaaagaa 1860
ccuagaucua aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1920
aaaaaaaaaa aaaugcaucc cccccccccc cccccccccc ccccccccca aaggcucuuu 1980
ucagagccac cagaauu 1997
<210> 42
<211> 2048
<212> RNA
<213> 人工序列
<220>
<223> Mp68 - PpLuc(GC) - 白蛋白7- A64 - C30 - hSL
<400> 42
gggcuuuccc auucuguagc agaauuuggu guugccugug gucuuggucc cgcggagaag 60
cuugaggaug gaggacgcca agaacaucaa gaagggcccg gcgcccuucu acccgcugga 120
ggacgggacc gccggcgagc agcuccacaa ggccaugaag cgguacgccc uggugccggg 180
cacgaucgcc uucaccgacg cccacaucga ggucgacauc accuacgcgg aguacuucga 240
gaugagcgug cgccuggccg aggccaugaa gcgguacggc cugaacacca accaccggau 300
cguggugugc ucggagaaca gccugcaguu cuucaugccg gugcugggcg cccucuucau 360
cggcguggcc gucgccccgg cgaacgacau cuacaacgag cgggagcugc ugaacagcau 420
ggggaucagc cagccgaccg ugguguucgu gagcaagaag ggccugcaga agauccugaa 480
cgugcagaag aagcugccca ucauccagaa gaucaucauc auggacagca agaccgacua 540
ccagggcuuc cagucgaugu acacguucgu gaccagccac cucccgccgg gcuucaacga 600
guacgacuuc gucccggaga gcuucgaccg ggacaagacc aucgcccuga ucaugaacag 660
cagcggcagc accggccugc cgaagggggu ggcccugccg caccggaccg ccugcgugcg 720
cuucucgcac gcccgggacc ccaucuucgg caaccagauc aucccggaca ccgccauccu 780
gagcguggug ccguuccacc acggcuucgg cauguucacg acccugggcu accucaucug 840
cggcuuccgg gugguccuga uguaccgguu cgaggaggag cuguuccugc ggagccugca 900
ggacuacaag auccagagcg cgcugcucgu gccgacccug uucagcuucu ucgccaagag 960
cacccugauc gacaaguacg accugucgaa ccugcacgag aucgccagcg ggggcgcccc 1020
gcugagcaag gaggugggcg aggccguggc caagcgguuc caccucccgg gcauccgcca 1080
gggcuacggc cugaccgaga ccacgagcgc gauccugauc acccccgagg gggacgacaa 1140
gccgggcgcc gugggcaagg uggucccguu cuucgaggcc aagguggugg accuggacac 1200
cggcaagacc cugggcguga accagcgggg cgagcugugc gugcgggggc cgaugaucau 1260
gagcggcuac gugaacaacc cggaggccac caacgcccuc aucgacaagg acggcuggcu 1320
gcacagcggc gacaucgccu acugggacga ggacgagcac uucuucaucg ucgaccggcu 1380
gaagucgcug aucaaguaca agggcuacca gguggcgccg gccgagcugg agagcauccu 1440
gcuccagcac cccaacaucu ucgacgccgg cguggccggg cugccggacg acgacgccgg 1500
cgagcugccg gccgcggugg uggugcugga gcacggcaag accaugacgg agaaggagau 1560
cgucgacuac guggccagcc aggugaccac cgccaagaag cugcggggcg gcgugguguu 1620
cguggacgag gucccgaagg gccugaccgg gaagcucgac gcccggaaga uccgcgagau 1680
ccugaucaag gccaagaagg gcggcaagau cgccguguaa gacuagugca ucacauuuaa 1740
aagcaucuca gccuaccaug agaauaagag aaagaaaaug aagaucaaua gcuuauucau 1800
cucuuuuucu uuuucguugg uguaaagcca acacccuguc uaaaaaacau aaauuucuuu 1860
aaucauuuug ccucuuuucu cugugcuuca auuaauaaaa aauggaaaga accuagaucu 1920
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1980
aaaaugcauc cccccccccc cccccccccc cccccccccc aaaggcucuu uucagagcca 2040
ccagaauu 2048
<210> 43
<211> 2075
<212> RNA
<213> 人工序列
<220>
<223> Ndufa4 - PpLuc(GC) - 白蛋白7- A64 - C30 - hSL
<400> 43
gggguccgcu cagccagguu gcagaagcgg cuuagcgugu guccuaaucu ucucucugcg 60
uguagguagg ccugugccgc aaacaagcuu gaggauggag gacgccaaga acaucaagaa 120
gggcccggcg cccuucuacc cgcuggagga cgggaccgcc ggcgagcagc uccacaaggc 180
caugaagcgg uacgcccugg ugccgggcac gaucgccuuc accgacgccc acaucgaggu 240
cgacaucacc uacgcggagu acuucgagau gagcgugcgc cuggccgagg ccaugaagcg 300
guacggccug aacaccaacc accggaucgu ggugugcucg gagaacagcc ugcaguucuu 360
caugccggug cugggcgccc ucuucaucgg cguggccguc gccccggcga acgacaucua 420
caacgagcgg gagcugcuga acagcauggg gaucagccag ccgaccgugg uguucgugag 480
caagaagggc cugcagaaga uccugaacgu gcagaagaag cugcccauca uccagaagau 540
caucaucaug gacagcaaga ccgacuacca gggcuuccag ucgauguaca cguucgugac 600
cagccaccuc ccgccgggcu ucaacgagua cgacuucguc ccggagagcu ucgaccggga 660
caagaccauc gcccugauca ugaacagcag cggcagcacc ggccugccga aggggguggc 720
ccugccgcac cggaccgccu gcgugcgcuu cucgcacgcc cgggacccca ucuucggcaa 780
ccagaucauc ccggacaccg ccauccugag cguggugccg uuccaccacg gcuucggcau 840
guucacgacc cugggcuacc ucaucugcgg cuuccgggug guccugaugu accgguucga 900
ggaggagcug uuccugcgga gccugcagga cuacaagauc cagagcgcgc ugcucgugcc 960
gacccuguuc agcuucuucg ccaagagcac ccugaucgac aaguacgacc ugucgaaccu 1020
gcacgagauc gccagcgggg gcgccccgcu gagcaaggag gugggcgagg ccguggccaa 1080
gcgguuccac cucccgggca uccgccaggg cuacggccug accgagacca cgagcgcgau 1140
ccugaucacc cccgaggggg acgacaagcc gggcgccgug ggcaaggugg ucccguucuu 1200
cgaggccaag gugguggacc uggacaccgg caagacccug ggcgugaacc agcggggcga 1260
gcugugcgug cgggggccga ugaucaugag cggcuacgug aacaacccgg aggccaccaa 1320
cgcccucauc gacaaggacg gcuggcugca cagcggcgac aucgccuacu gggacgagga 1380
cgagcacuuc uucaucgucg accggcugaa gucgcugauc aaguacaagg gcuaccaggu 1440
ggcgccggcc gagcuggaga gcauccugcu ccagcacccc aacaucuucg acgccggcgu 1500
ggccgggcug ccggacgacg acgccggcga gcugccggcc gcgguggugg ugcuggagca 1560
cggcaagacc augacggaga aggagaucgu cgacuacgug gccagccagg ugaccaccgc 1620
caagaagcug cggggcggcg ugguguucgu ggacgagguc ccgaagggcc ugaccgggaa 1680
gcucgacgcc cggaagaucc gcgagauccu gaucaaggcc aagaagggcg gcaagaucgc 1740
cguguaagac uagugcauca cauuuaaaag caucucagcc uaccaugaga auaagagaaa 1800
gaaaaugaag aucaauagcu uauucaucuc uuuuucuuuu ucguuggugu aaagccaaca 1860
cccugucuaa aaaacauaaa uuucuuuaau cauuuugccu cuuuucucug ugcuucaauu 1920
aauaaaaaau ggaaagaacc uagaucuaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1980
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa augcaucccc cccccccccc cccccccccc 2040
cccccccaaa ggcucuuuuc agagccacca gaauu 2075
<210> 44
<211> 1810
<212> DNA
<213> 人工序列
<220>
<223> PpLuc(GC) - A64 - C30 - hSL
<400> 44
gggagaaagc ttgaggatgg aggacgccaa gaacatcaag aagggcccgg cgcccttcta 60
cccgctggag gacgggaccg ccggcgagca gctccacaag gccatgaagc ggtacgccct 120
ggtgccgggc acgatcgcct tcaccgacgc ccacatcgag gtcgacatca cctacgcgga 180
gtacttcgag atgagcgtgc gcctggccga ggccatgaag cggtacggcc tgaacaccaa 240
ccaccggatc gtggtgtgct cggagaacag cctgcagttc ttcatgccgg tgctgggcgc 300
cctcttcatc ggcgtggccg tcgccccggc gaacgacatc tacaacgagc gggagctgct 360
gaacagcatg gggatcagcc agccgaccgt ggtgttcgtg agcaagaagg gcctgcagaa 420
gatcctgaac gtgcagaaga agctgcccat catccagaag atcatcatca tggacagcaa 480
gaccgactac cagggcttcc agtcgatgta cacgttcgtg accagccacc tcccgccggg 540
cttcaacgag tacgacttcg tcccggagag cttcgaccgg gacaagacca tcgccctgat 600
catgaacagc agcggcagca ccggcctgcc gaagggggtg gccctgccgc accggaccgc 660
ctgcgtgcgc ttctcgcacg cccgggaccc catcttcggc aaccagatca tcccggacac 720
cgccatcctg agcgtggtgc cgttccacca cggcttcggc atgttcacga ccctgggcta 780
cctcatctgc ggcttccggg tggtcctgat gtaccggttc gaggaggagc tgttcctgcg 840
gagcctgcag gactacaaga tccagagcgc gctgctcgtg ccgaccctgt tcagcttctt 900
cgccaagagc accctgatcg acaagtacga cctgtcgaac ctgcacgaga tcgccagcgg 960
gggcgccccg ctgagcaagg aggtgggcga ggccgtggcc aagcggttcc acctcccggg 1020
catccgccag ggctacggcc tgaccgagac cacgagcgcg atcctgatca cccccgaggg 1080
ggacgacaag ccgggcgccg tgggcaaggt ggtcccgttc ttcgaggcca aggtggtgga 1140
cctggacacc ggcaagaccc tgggcgtgaa ccagcggggc gagctgtgcg tgcgggggcc 1200
gatgatcatg agcggctacg tgaacaaccc ggaggccacc aacgccctca tcgacaagga 1260
cggctggctg cacagcggcg acatcgccta ctgggacgag gacgagcact tcttcatcgt 1320
cgaccggctg aagtcgctga tcaagtacaa gggctaccag gtggcgccgg ccgagctgga 1380
gagcatcctg ctccagcacc ccaacatctt cgacgccggc gtggccgggc tgccggacga 1440
cgacgccggc gagctgccgg ccgcggtggt ggtgctggag cacggcaaga ccatgacgga 1500
gaaggagatc gtcgactacg tggccagcca ggtgaccacc gccaagaagc tgcggggcgg 1560
cgtggtgttc gtggacgagg tcccgaaggg cctgaccggg aagctcgacg cccggaagat 1620
ccgcgagatc ctgatcaagg ccaagaaggg cggcaagatc gccgtgtaag actagtagat 1680
ctaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1740
aaaaaatgca tccccccccc cccccccccc cccccccccc ccaaaggctc ttttcagagc 1800
caccagaatt 1810
<210> 45
<211> 2163
<212> RNA
<213> 人工序列
<220>
<223> PpLuc(GC) - gnas- A64 - C30 - hSL
<400> 45
gggagaaagc uugaggaugg aggacgccaa gaacaucaag aagggcccgg cgcccuucua 60
cccgcuggag gacgggaccg ccggcgagca gcuccacaag gccaugaagc gguacgcccu 120
ggugccgggc acgaucgccu ucaccgacgc ccacaucgag gucgacauca ccuacgcgga 180
guacuucgag augagcgugc gccuggccga ggccaugaag cgguacggcc ugaacaccaa 240
ccaccggauc guggugugcu cggagaacag ccugcaguuc uucaugccgg ugcugggcgc 300
ccucuucauc ggcguggccg ucgccccggc gaacgacauc uacaacgagc gggagcugcu 360
gaacagcaug gggaucagcc agccgaccgu gguguucgug agcaagaagg gccugcagaa 420
gauccugaac gugcagaaga agcugcccau cauccagaag aucaucauca uggacagcaa 480
gaccgacuac cagggcuucc agucgaugua cacguucgug accagccacc ucccgccggg 540
cuucaacgag uacgacuucg ucccggagag cuucgaccgg gacaagacca ucgcccugau 600
caugaacagc agcggcagca ccggccugcc gaagggggug gcccugccgc accggaccgc 660
cugcgugcgc uucucgcacg cccgggaccc caucuucggc aaccagauca ucccggacac 720
cgccauccug agcguggugc cguuccacca cggcuucggc auguucacga cccugggcua 780
ccucaucugc ggcuuccggg ugguccugau guaccgguuc gaggaggagc uguuccugcg 840
gagccugcag gacuacaaga uccagagcgc gcugcucgug ccgacccugu ucagcuucuu 900
cgccaagagc acccugaucg acaaguacga ccugucgaac cugcacgaga ucgccagcgg 960
gggcgccccg cugagcaagg aggugggcga ggccguggcc aagcgguucc accucccggg 1020
cauccgccag ggcuacggcc ugaccgagac cacgagcgcg auccugauca cccccgaggg 1080
ggacgacaag ccgggcgccg ugggcaaggu ggucccguuc uucgaggcca agguggugga 1140
ccuggacacc ggcaagaccc ugggcgugaa ccagcggggc gagcugugcg ugcgggggcc 1200
gaugaucaug agcggcuacg ugaacaaccc ggaggccacc aacgcccuca ucgacaagga 1260
cggcuggcug cacagcggcg acaucgccua cugggacgag gacgagcacu ucuucaucgu 1320
cgaccggcug aagucgcuga ucaaguacaa gggcuaccag guggcgccgg ccgagcugga 1380
gagcauccug cuccagcacc ccaacaucuu cgacgccggc guggccgggc ugccggacga 1440
cgacgccggc gagcugccgg ccgcgguggu ggugcuggag cacggcaaga ccaugacgga 1500
gaaggagauc gucgacuacg uggccagcca ggugaccacc gccaagaagc ugcggggcgg 1560
cgugguguuc guggacgagg ucccgaaggg ccugaccggg aagcucgacg cccggaagau 1620
ccgcgagauc cugaucaagg ccaagaaggg cggcaagauc gccguguaag acuagugaag 1680
ggaacaccca aauuuaauuc agccuuaagc acaauuaauu aagagugaaa cguaauugua 1740
caagcaguug gucacccacc auagggcaug aucaacaccg caaccuuucc uuuuuccccc 1800
agugauucug aaaaaccccu cuucccuuca gcuugcuuag auguuccaaa uuuaguaagc 1860
uuaaggcggc cuacagaaga aaaagaaaaa aaaggccaca aaaguucccu cucacuuuca 1920
guaaauaaaa uaaaagcagc aacagaaaua aagaaauaaa ugaaauucaa aaugaaauaa 1980
auauuguguu gugcagcauu aaaaaaucaa uaaaaauuaa aaaugagcaa gaucuaaaaa 2040
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaau 2100
gcaucccccc cccccccccc cccccccccc cccccaaagg cucuuuucag agccaccaga 2160
auu 2163
<210> 46
<211> 2264
<212> RNA
<213> 人工序列
<220>
<223> 32L4 - PpLuc(GC) - Ybx1(V2)-A64-C30-hSL
<400> 46
ggggcgcugc cuacggaggu ggcagccauc uccuucucgg caucaagcuu gaggauggag 60
gacgccaaga acaucaagaa gggcccggcg cccuucuacc cgcuggagga cgggaccgcc 120
ggcgagcagc uccacaaggc caugaagcgg uacgcccugg ugccgggcac gaucgccuuc 180
accgacgccc acaucgaggu cgacaucacc uacgcggagu acuucgagau gagcgugcgc 240
cuggccgagg ccaugaagcg guacggccug aacaccaacc accggaucgu ggugugcucg 300
gagaacagcc ugcaguucuu caugccggug cugggcgccc ucuucaucgg cguggccguc 360
gccccggcga acgacaucua caacgagcgg gagcugcuga acagcauggg gaucagccag 420
ccgaccgugg uguucgugag caagaagggc cugcagaaga uccugaacgu gcagaagaag 480
cugcccauca uccagaagau caucaucaug gacagcaaga ccgacuacca gggcuuccag 540
ucgauguaca cguucgugac cagccaccuc ccgccgggcu ucaacgagua cgacuucguc 600
ccggagagcu ucgaccggga caagaccauc gcccugauca ugaacagcag cggcagcacc 660
ggccugccga aggggguggc ccugccgcac cggaccgccu gcgugcgcuu cucgcacgcc 720
cgggacccca ucuucggcaa ccagaucauc ccggacaccg ccauccugag cguggugccg 780
uuccaccacg gcuucggcau guucacgacc cugggcuacc ucaucugcgg cuuccgggug 840
guccugaugu accgguucga ggaggagcug uuccugcgga gccugcagga cuacaagauc 900
cagagcgcgc ugcucgugcc gacccuguuc agcuucuucg ccaagagcac ccugaucgac 960
aaguacgacc ugucgaaccu gcacgagauc gccagcgggg gcgccccgcu gagcaaggag 1020
gugggcgagg ccguggccaa gcgguuccac cucccgggca uccgccaggg cuacggccug 1080
accgagacca cgagcgcgau ccugaucacc cccgaggggg acgacaagcc gggcgccgug 1140
ggcaaggugg ucccguucuu cgaggccaag gugguggacc uggacaccgg caagacccug 1200
ggcgugaacc agcggggcga gcugugcgug cgggggccga ugaucaugag cggcuacgug 1260
aacaacccgg aggccaccaa cgcccucauc gacaaggacg gcuggcugca cagcggcgac 1320
aucgccuacu gggacgagga cgagcacuuc uucaucgucg accggcugaa gucgcugauc 1380
aaguacaagg gcuaccaggu ggcgccggcc gagcuggaga gcauccugcu ccagcacccc 1440
aacaucuucg acgccggcgu ggccgggcug ccggacgacg acgccggcga gcugccggcc 1500
gcgguggugg ugcuggagca cggcaagacc augacggaga aggagaucgu cgacuacgug 1560
gccagccagg ugaccaccgc caagaagcug cggggcggcg ugguguucgu ggacgagguc 1620
ccgaagggcc ugaccgggaa gcucgacgcc cggaagaucc gcgagauccu gaucaaggcc 1680
aagaagggcg gcaagaucgc cguguaagac uaguaugccg gcuuaccauc ucuaccauca 1740
uccgguuugg ucauccaaca agaagaaaug aauaugaaau uccagcaaua agaaaugaac 1800
aaagauugga gcugaagacc uuaagugcuu gcuuuuugcc cgcugaccag auaacauuag 1860
aacuaucugc auuaucuaug cagcaugggg uuuuuauuau uuuuaccuaa agaugucucu 1920
uuuugguaau gacaaacgug uuuuuuaaga aaaaaaaaaa aggccugguu uuucucaaua 1980
caccuuuaac gguuuuuaaa uuguuucaua ucuggucaag uugagauuuu uaagaacuuc 2040
auuuuuaauu uguaauaaag uuuacaacuu gauuuuuuca aaaaagucaa caaacugcaa 2100
gcaccuguua auaaaggucu uaaauaauaa agaucuaaaa aaaaaaaaaa aaaaaaaaaa 2160
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa ugcauccccc cccccccccc 2220
cccccccccc ccccccaaag gcucuuuuca gagccaccag aauu 2264
<210> 47
<211> 1914
<212> RNA
<213> 人工序列
<220>
<223> 32L4 - PpLuc(GC) - Ndufb8-A64-C30-hSL
<400> 47
ggggcgcugc cuacggaggu ggcagccauc uccuucucgg caucaagcuu gaggauggag 60
gacgccaaga acaucaagaa gggcccggcg cccuucuacc cgcuggagga cgggaccgcc 120
ggcgagcagc uccacaaggc caugaagcgg uacgcccugg ugccgggcac gaucgccuuc 180
accgacgccc acaucgaggu cgacaucacc uacgcggagu acuucgagau gagcgugcgc 240
cuggccgagg ccaugaagcg guacggccug aacaccaacc accggaucgu ggugugcucg 300
gagaacagcc ugcaguucuu caugccggug cugggcgccc ucuucaucgg cguggccguc 360
gccccggcga acgacaucua caacgagcgg gagcugcuga acagcauggg gaucagccag 420
ccgaccgugg uguucgugag caagaagggc cugcagaaga uccugaacgu gcagaagaag 480
cugcccauca uccagaagau caucaucaug gacagcaaga ccgacuacca gggcuuccag 540
ucgauguaca cguucgugac cagccaccuc ccgccgggcu ucaacgagua cgacuucguc 600
ccggagagcu ucgaccggga caagaccauc gcccugauca ugaacagcag cggcagcacc 660
ggccugccga aggggguggc ccugccgcac cggaccgccu gcgugcgcuu cucgcacgcc 720
cgggacccca ucuucggcaa ccagaucauc ccggacaccg ccauccugag cguggugccg 780
uuccaccacg gcuucggcau guucacgacc cugggcuacc ucaucugcgg cuuccgggug 840
guccugaugu accgguucga ggaggagcug uuccugcgga gccugcagga cuacaagauc 900
cagagcgcgc ugcucgugcc gacccuguuc agcuucuucg ccaagagcac ccugaucgac 960
aaguacgacc ugucgaaccu gcacgagauc gccagcgggg gcgccccgcu gagcaaggag 1020
gugggcgagg ccguggccaa gcgguuccac cucccgggca uccgccaggg cuacggccug 1080
accgagacca cgagcgcgau ccugaucacc cccgaggggg acgacaagcc gggcgccgug 1140
ggcaaggugg ucccguucuu cgaggccaag gugguggacc uggacaccgg caagacccug 1200
ggcgugaacc agcggggcga gcugugcgug cgggggccga ugaucaugag cggcuacgug 1260
aacaacccgg aggccaccaa cgcccucauc gacaaggacg gcuggcugca cagcggcgac 1320
aucgccuacu gggacgagga cgagcacuuc uucaucgucg accggcugaa gucgcugauc 1380
aaguacaagg gcuaccaggu ggcgccggcc gagcuggaga gcauccugcu ccagcacccc 1440
aacaucuucg acgccggcgu ggccgggcug ccggacgacg acgccggcga gcugccggcc 1500
gcgguggugg ugcuggagca cggcaagacc augacggaga aggagaucgu cgacuacgug 1560
gccagccagg ugaccaccgc caagaagcug cggggcggcg ugguguucgu ggacgagguc 1620
ccgaagggcc ugaccgggaa gcucgacgcc cggaagaucc gcgagauccu gaucaaggcc 1680
aagaagggcg gcaagaucgc cguguaagac uaguggaggc uugaugggcu uuuugcccuc 1740
guuccuagag gcuuaaccau aauaaaaucc cuaauaaagc agaucuaaaa aaaaaaaaaa 1800
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa ugcauccccc 1860
cccccccccc cccccccccc ccccccaaag gcucuuuuca gagccaccag aauu 1914
<210> 48
<211> 2771
<212> RNA
<213> 人工序列
<220>
<223> 32L4 - PpLuc(GC) - Cntn1-004(V2)-A64-C30-hSL
<400> 48
ggggcgcugc cuacggaggu ggcagccauc uccuucucgg caucaagcuu gaggauggag 60
gacgccaaga acaucaagaa gggcccggcg cccuucuacc cgcuggagga cgggaccgcc 120
ggcgagcagc uccacaaggc caugaagcgg uacgcccugg ugccgggcac gaucgccuuc 180
accgacgccc acaucgaggu cgacaucacc uacgcggagu acuucgagau gagcgugcgc 240
cuggccgagg ccaugaagcg guacggccug aacaccaacc accggaucgu ggugugcucg 300
gagaacagcc ugcaguucuu caugccggug cugggcgccc ucuucaucgg cguggccguc 360
gccccggcga acgacaucua caacgagcgg gagcugcuga acagcauggg gaucagccag 420
ccgaccgugg uguucgugag caagaagggc cugcagaaga uccugaacgu gcagaagaag 480
cugcccauca uccagaagau caucaucaug gacagcaaga ccgacuacca gggcuuccag 540
ucgauguaca cguucgugac cagccaccuc ccgccgggcu ucaacgagua cgacuucguc 600
ccggagagcu ucgaccggga caagaccauc gcccugauca ugaacagcag cggcagcacc 660
ggccugccga aggggguggc ccugccgcac cggaccgccu gcgugcgcuu cucgcacgcc 720
cgggacccca ucuucggcaa ccagaucauc ccggacaccg ccauccugag cguggugccg 780
uuccaccacg gcuucggcau guucacgacc cugggcuacc ucaucugcgg cuuccgggug 840
guccugaugu accgguucga ggaggagcug uuccugcgga gccugcagga cuacaagauc 900
cagagcgcgc ugcucgugcc gacccuguuc agcuucuucg ccaagagcac ccugaucgac 960
aaguacgacc ugucgaaccu gcacgagauc gccagcgggg gcgccccgcu gagcaaggag 1020
gugggcgagg ccguggccaa gcgguuccac cucccgggca uccgccaggg cuacggccug 1080
accgagacca cgagcgcgau ccugaucacc cccgaggggg acgacaagcc gggcgccgug 1140
ggcaaggugg ucccguucuu cgaggccaag gugguggacc uggacaccgg caagacccug 1200
ggcgugaacc agcggggcga gcugugcgug cgggggccga ugaucaugag cggcuacgug 1260
aacaacccgg aggccaccaa cgcccucauc gacaaggacg gcuggcugca cagcggcgac 1320
aucgccuacu gggacgagga cgagcacuuc uucaucgucg accggcugaa gucgcugauc 1380
aaguacaagg gcuaccaggu ggcgccggcc gagcuggaga gcauccugcu ccagcacccc 1440
aacaucuucg acgccggcgu ggccgggcug ccggacgacg acgccggcga gcugccggcc 1500
gcgguggugg ugcuggagca cggcaagacc augacggaga aggagaucgu cgacuacgug 1560
gccagccagg ugaccaccgc caagaagcug cggggcggcg ugguguucgu ggacgagguc 1620
ccgaagggcc ugaccgggaa gcucgacgcc cggaagaucc gcgagauccu gaucaaggcc 1680
aagaagggcg gcaagaucgc cguguaagac uaguucguug acacucacca uuucugugaa 1740
agacuuuuuu uuuuuuuaac auauuauacu agauuugacu aacucaaucu uguagcuucu 1800
gcaguucucc ccacccccaa ccuaguucuu agaguauguu uccccuuuug aaacauguaa 1860
acauacuuug ggcauaaaua uuuuuuaaaa uauaacuaua augcuucacu aauaccuuaa 1920
aaaugccuag ugaacuaacu caguacauua uauaauggcc aagugaaagu uuuguguuuu 1980
cauguccugu uuuucuuuga aauuauauag cccagaaauu agcucauuau cugaaaaacg 2040
uaugaagaac ugaugaauug uauaauacag gaguauugcc auugaaugua cuguuugauu 2100
uauucaagca gguaaugaac aauguuguca aacucucuaa ugagacauca uaauuaggac 2160
auaagcuaaa aggggcauua cuccggcagu cuuuuuuucu uaauccuagu accauacaua 2220
uucuuuggca ugaaagaaug aaaagcauua guaaacaacu gaaguccuac cauggcucug 2280
uaggguuuuu ggaacaauuc cuggaauugg aaagugaaaa uggauagcau gugggggaaa 2340
cccucaucug aguagcaaga uuuuaguaaa gaugacuaag ccauuaacag caugcauuca 2400
uauuuaauuu uauugacucc ugccaucagc uuuuguagau cuuuugggug gaagguugug 2460
auuuuuacug ggaggacuug aguagaagug gaugauuaaa auugaggagu auauaauucu 2520
uucugggacu gcuuaaaugu uauuguuuga aaaugccuuc acuuuccccc uuuggucaaa 2580
gagaugugcu uaaaauucuu auuccuucac aauaaauaau uuugauuuuc uuagacaaga 2640
ucuaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2700
aaaaaaaugc aucccccccc cccccccccc cccccccccc cccaaaggcu cuuuucagag 2760
ccaccagaau u 2771
<210> 49
<211> 201
<212> DNA
<213> 人工序列
<220>
<223> 智人SLC38A6 3'-UTR
SLC38A6-001 ENST00000267488
<400> 49
aagaaatatt ttcctacttc ttacaagaat aatatacccc tagttgcaag aatgaattat 60
tccggaagac accctggatg aaaaataaca ttttaataaa aattattaac agaaaagcag 120
aacaaaatgg cagtgggtat ggggaagtaa gagtgtggca gttttaatca aaaaaagaaa 180
caaactcgaa atgctcttaa a 201
<210> 50
<211> 102
<212> DNA
<213> 人工序列
<220>
<223> 智人DECR1 3'-UTR
NM_001359.1
<400> 50
gaccactttg gccttcatct tggttacaga aaagggaata gaaatgaaac aaattatctc 60
tcatcttttg actatttcaa gtctaataaa ttcttaatta ac 102
<210> 51
<211> 369
<212> DNA
<213> 人工序列
<220>
<223> 智人PIGK 3'-UTR
<400> 51
acttgatgat gaatgaagaa tgcatggagg actgcaaact tggataataa tttatgtcat 60
tatatatttt taaaaatgtg tttctcttgt atgaattgga aataagtata aggaaactaa 120
atttgaatca actattaatt ttataactta aagaaaaata attgttaatg caactgctta 180
atggcactaa atatattcca gttttgtatt ttgtgtatta taaaagcgaa tgagacagag 240
atcagaatac attgactgtt tttgaaaata gtaatttccc cttatcccct tttcatttgg 300
aaaagaaaca attgtgaaga cattaaattc tcactaacag aagtaacttt ggttaattat 360
tttttgtat 369
<210> 52
<211> 460
<212> DNA
<213> 人工序列
<220>
<223> 智人FAM175A 3'-UTR
FAM175A-009 ENST00000506553
<400> 52
tccttttaac cttacaagga gattttttta tttggctgat gggtaaagcc aaacatttct 60
attgttttta ctatgttgag ctacttgcag taagttcatt tgtttttact atgttcacct 120
gtttgcagta atacacagat aactcttagt gcatttactt cacaaagtac tttttcaaac 180
atcagatgct tttatttcca aacctttttt tcacctttca ctaagttgtt gaggggaagg 240
cttacacaga cacattcttt agaattggaa aagtgagacc aggcacagtg gctcacacct 300
gtaatcccag cacttaggga agacaagtca ggaggattga ttgaagttag gagttagaga 360
ccagcctggg caacgtattg agaccatgtc tattaaaaaa taaaatggaa aagcaagaat 420
agccttattt tcaaaatatg gaaagaaatt tatatgaaaa 460
<210> 53
<211> 505
<212> DNA
<213> 人工序列
<220>
<223> 智人PHYH 3'-UTR
PHYH-002 ENST00000396913
<400> 53
aatagccatc tgctataact ctttcaacag aaaaccaaaa ccaaacgaaa tgtctaagga 60
aaatgttttc ttaatgagat gatgtaacct tttctatcac ttgttaaaag cagaaaacat 120
gtatcaggta cttaattgca tagagttagt tttgcagcac aatggtgttg ctttaatgga 180
aaaaaaaaac agtaaaagtg aaatattact gttttaagga aaactaattt agggtggcag 240
ccaataaagg tggttggtgt ctaatttaag tgttaaatca atttctttca ttcagttagc 300
tctttaccca agaagaagtg aatgatttgg agcttagggt atgttttgta tcccctttct 360
gataaaccca ttccctacca attttatgtc ataagagatt tttttccccc aaatctagaa 420
caatgtataa tacattcaca tctagtcaag ggcataggaa cggtgtcatg gagtccaaat 480
aaagtggata ttcctgctcg gacaa 505
<210> 54
<211> 404
<212> DNA
<213> 人工序列
<220>
<223> 智人TBC1D19 3'-UTR
TBC1D19-001 ENST00000264866
<400> 54
tcttcttcac agtcactggc aacacatcta gtttttcatt agaaacaaat catgaactat 60
gcaaactctg cataaaacca aaatgaaact ttgcatataa gccaataaag atcatgttcc 120
ctcttcagtt aaacctaagt agtttctcac tttttgaaac aataactctg caccaaatat 180
tgcatcgcat gctgctgatt ttcaagagag aagcaataaa cacaacttct gctaaattga 240
gcattatata tataatatta taatatatat ataatcctga cttgtcaatg gcatgtaata 300
atatatgcaa taagaactaa agatactgta ataaacttca agaggtaatg tagcttcttg 360
gataattctt ttatgtcagt ttataaattt atctctagat aatg 404
<210> 55
<211> 353
<212> DNA
<213> 人工序列
<220>
<223> 智人TBC1D19 NM_018317.2 3'-UTR
<400> 55
tcttcttcac agtcactggc aacacatcta gtttttcatt agaaacaaat catgaactat 60
gcaaactctg cataaaacca aaatgaaact ttgcatataa gccaataaag atcatgttcc 120
ctcttcagtt aaacctaagt agtttctcac tttttgaaac aataactctg caccaaatat 180
tgcatcgcat gctgctgatt ttcaagagag aagcaataaa cacaacttct gctaaattga 240
gcattatata tataatatta taatatatat ataatcctga cttgtcaatg gcatgtaata 300
atatatgcaa taagaactaa agatactgta ataaacttca agaggtaaaa aaa 353
<210> 56
<211> 242
<212> DNA
<213> 人工序列
<220>
<223> 智人PIGB 3'-UTR
PIGB-201 ENST00000539642
<400> 56
aaattcaaca tgaagatgaa attctgaact ttcctagata aattaacatt gctgggtgga 60
aatattcaga tgctgcttaa atacttcggt aaacactggg taagattcat ggaacttaga 120
aaaaagctgt atgaactgct ttaccaaata tcactactga ggaaatgtat aaaataccac 180
atagtataaa attacatgtt aatacaatgc cagattttaa ataaagacct ttagttttcc 240
tc 242
<210> 57
<211> 157
<212> DNA
<213> 人工序列
<220>
<223> 智人ALG6 3'-UTR
ALG6-006 ENST00000263440
<400> 57
ctgtattcct aaacaaattg tttcctaaac aaatgtgaaa atgtgaacag tgctgaaagg 60
ttttgtgaac tttttgctat gtataaatga aattaccatt ttgagaacca tggaaccaca 120
ggaaaggaaa tggtgaaaag tcattgttgt ctacaca 157
<210> 58
<211> 324
<212> DNA
<213> 人工序列
<220>
<223> 智人CRYZ 3'-UTR
CRYZ-005 ENST00000370871
<400> 58
tgattaattc tttcatggat ttcctatgta attagaggta ctgtctttcc cccagttgta 60
cttaccctat cttttcttta attaacattc gattccatga gcttcttatg tgaaaaaata 120
agatttttct ttagagagca gaagcagaag agtaaaattt attgtatagc tagcaatatt 180
tttttatgcc atctgtctca aatcaaagag tcatcatagt aggaaataac atgttagttg 240
tcatttggca tgagtgtgca ttccagtaat tcttaattga tatttgatta attccatacc 300
tttgattaaa acatgctagt tcaa 324
<210> 59
<211> 510
<212> DNA
<213> 人工序列
<220>
<223> 智人BRP44L 3'-UTR
BRP44L-001 ENST00000360961
<400> 59
caatggaaaa ggaagaacaa ggtcttgaag ggacagcatt gccagctgct gctgagtcac 60
agatttcatt ataaatagcc tccctaagga aaatacactg aatgctattt ttactaacca 120
ttctattttt atagaaatag ctgagagttt ctaaaccaac tctctgctgc cttacaagta 180
ttaaatattt tacttctttc cataaagagt agctcaaaat atgcaattaa tttaataatt 240
tctgatgatg gttttatctg cagtaatatg tatatcatct attagaattt acttaatgaa 300
aaactgaaga gaacaaaatt tgtaaccact agcacttaag tactcctgat tcttaacatt 360
gtctttaatg accacaagac aaccaacagc tggccacgta cttaaaattt tgtccccact 420
gtttaaaaat gttacctgtg tatttccatg cagtgtatat attgagatgc tgtaacttaa 480
tggcaataaa tgatttaaat atttgttaaa 510
<210> 60
<211> 354
<212> DNA
<213> 人工序列
<220>
<223> 智人ACADSB 3'-UTR
ACADSB-004
<400> 60
cgtctatagg agtgggaccc ctccctggtg tcactgctgt aaaattttaa acggttgtgt 60
cttgttggga gtaagtgcct tgcgtgggaa taaacttcca cagcattcga atattttaat 120
gaagccctta gtcagggtcc tggtgttggc ctttttggtt ttctcttttc aggctgttta 180
acttaggcac aggagatcca cttttaaact tgggaaataa gcacctgtat ttttttccaa 240
aactgttttt aaagctgtat acgcatacat atatatattt ttactctgtc ttactctgtc 300
acccaggcta gagtgcagtg gcgcgatctc agctcactgc agccttgacc tcct 354
<210> 61
<211> 539
<212> DNA
<213> 人工序列
<220>
<223> 智人TMEM14A 3'-UTR
NM_014051.3
<400> 61
gcatctggag gaacagaaaa ctaagttcat gtcatcctgc tgtaatgggc agagcatatt 60
ttttttgtat ttaaaagata aacttcaata tggaatgcta gaaacacaaa tagcactgtc 120
acctctaata tgaacattag tttgaggtag tttttttcta aagcaaaaat tttaactgtt 180
ttctaattgt caagcactat tttcattaaa agtgtctaat gaatcatgat atactcttcc 240
atttgttgtg tctatttttt atatatttgg tattttttga aaattccaaa tactcatgtc 300
tcaagtaagc ttaaactaca acttgtcaca taaaggaagt cttaagtgga gttcacagaa 360
tgataatgta tctatttgtc atttgtgtta tatttgaaat tattagaaat tatgcttttt 420
ccattttaat tgtattgctg ccagtgctat ttttttcttt aaaaaatttt attcttagca 480
cactgttatg tcctaactga atgtattcag tattcaaata aaagacattt tggttcaaa 539
<210> 62
<211> 292
<212> DNA
<213> 人工序列
<220>
<223> 智人GRAMD1C 3'-UTR
GRAMD1C-005 ENST00000472026
<400> 62
tgatctgaag gactaaaacc gcagagatac ttggaactta aagaaaatac ctggaagaaa 60
accagacgaa tgaaggattt tggcatagaa catttctatg ttttttcatt attgagattt 120
ctaatatgaa catttctttc agtaacattt atttgataat tagtttctgc tggccttaat 180
aatccatcct ttcacttctt atagatattt ttaagctgtg aatttcttca gtgaaccatg 240
aaatatatta tagaactgaa tttctctgat acaaaaagaa aatgacacac cc 292
<210> 63
<211> 94
<212> DNA
<213> 人工序列
<220>
<223> 智人C11orf80 3'-UTR
C11orf80-201 ENST00000360962
<400> 63
gccgggtccc cttccgcaag cgcccaccga tccggaggct gcgggcagcc gttatcccgt 60
ggtttaataa agctgccgcg cgctcaccaa gtcc 94
<210> 64
<211> 266
<212> DNA
<213> 人工序列
<220>
<223> 智人ANXA4 3'-UTR
ANXA4-002 ENST00000409920
<400> 64
aataaaaatc ccagaaggac aggaggattc tcaacacttt gaattttttt aacttcattt 60
ttctacactg ctattatcat tatctcagaa tgcttatttc caattaaaac gcctacagct 120
gcctcctaga atatagactg tctgtattat tattcaccta taattagtca ttatgatgct 180
ttaaagctgt acttgcattt caaagcttat aagatataaa tggagatttt aaagtagaaa 240
taaatatgta ttccatgttt ttaaaa 266
<210> 65
<211> 490
<212> DNA
<213> 人工序列
<220>
<223> 智人TBCK 3'-UTR
TBCK-002 ENST00000361687
<400> 65
agaaccaaga gtgtgactgc caaaacttag tgtggcatca gcaccaacag cacagttctt 60
catatccacg ccactctcag acaaaactag atgtccagat tgttgcattt ccgtaaagtt 120
tgtcacgaga cattttttaa aatctcataa cccacatgtt cagttatcca tgcaagaaac 180
ttgactctac atgtattgct gaaagaattt tcttaacagt gaaatctgat catatatttt 240
taccacactg ccacataaag cccaagaaat tcagctgaca agacagattt agcattatca 300
agaaatccca tttgccctga aaaagctgtc ctccattgta ctgaacagac agtcctgtcg 360
attgtgttat ttagaaacat acactgaatg tgggctgaaa tcatcatctt tccataatga 420
aaactgagaa actattcaca atgcattcct tataaataaa tgctacattt agtaactcat 480
ttcacccaaa 490
<210> 66
<211> 320
<212> DNA
<213> 人工序列
<220>
<223> 智人IFI6 3'-UTR
IFI6-001 ENST00000361157
<400> 66
ccagcagctc ccagaacctc ttcttccttc ttggcctaac tcttccagtt aggatctaga 60
actttgcctt tttttttttt tttttttttt tgagatgggt tctcactata ttgtccaggc 120
tagagtgcag tggctattca cagatgcgaa catagtacac tgcagcctcc aactcctagc 180
ctcaagtgat cctcctgtct caacctccca agtaggatta caagcatgcg ccgacgatgc 240
ccagaatcca gaactttgtc tatcactctc cccaacaacc tagatgtgaa aacagaataa 300
acttcaccca gaaaacactt 320
<210> 67
<211> 479
<212> DNA
<213> 人工序列
<220>
<223> 智人CAMKMT 3'-UTR
(synonym C2orf34) ENST00000378494
<400> 67
aagattaagc ttctcaaaga cgaagaaacg tatcaagtgc atagggaata tttttacaaa 60
aacggaaatc tgtaaggggt ataatcgcct gcctgcgccc tttgcagcat ttcacgtgtg 120
ggctatggac tccacctgtc ctcacccacg ttattcccca gctgccctct ccagctccct 180
ccccgcctct ttttacactc tgcttgttgc tcgtcctgcc ctaaaccttt gtttgtcttt 240
aaatgtgtat aagctgcctg tctgtgactt gaatttgact ggtgaacaaa ctaaatattt 300
ttccctgtaa ttgagacaga atttcttttg atgataccca tccctccttc attttttttt 360
tttttttggt ctttgttctg ttttggtggt ggtagttttt aatcagtaaa cccagcaaat 420
atcatgattc tttcctggtt agaaaaataa ataaagtgta tctttttatc tccctccaa 479
<210> 68
<211> 476
<212> DNA
<213> 人工序列
<220>
<223> 智人ALDH6A1 3'-UTR
NM_005589.2
<400> 68
aaacaagttt gtttaagact gactccatcc tgagtaatct ccctttattt ttgaccagct 60
tcatttgtca gctttgctca gatcagatcg atgggattgg aatacattgt aactaaaatc 120
ttcctcagga ctattaaccc ccgcaaagtt tctataggga actgcctagt gtaacaatga 180
aaccagattt ctcacttgct cttcatactt ctattttgag gtaactgttg taactatgaa 240
atgcttatct gaaagtagtg cttaaacctg atttctaaaa attatcccat tttctgatga 300
tttgaagggg agaaaagcca gtgtatgtaa agaaaatgtt ccagccaggc gcggtggctc 360
acgcctgtaa ttccatcatt ttgggaggcc acagtgggca gattgcttga gcccaggagt 420
tgaagaacgt ggcgaaaccc cgtatctatt atttaaaaaa attgaaaaag taaaaa 476
<210> 69
<211> 567
<212> DNA
<213> 人工序列
<220>
<223> 智人AGTPBP1 3'-UTR
AGTPBP1-004 ENST00000357081
<400> 69
gcccgctgcc atctcttgtt aactgcaaag aataaatgaa atatcttggt ttttatttcc 60
caggaagctt gagagaaatg agtttataca gagctgactc aaaaagacaa aaagtaactt 120
gggccagttt ggtttcaaga taataaatgt gttattaatt aatgataaaa ttggcgcttg 180
ttttattttc gatattcaat gcactttatg tagcattgaa tgatcaaata ttggatttac 240
ctttaaaaaa aaaacctgag tatcattgca tgaattttta tctccctatg gttatatcct 300
gcatcaagtg gataattttg aagtgtgttc agaatataaa attgaaattt tagagttgtt 360
gaaaatcctg acttgttgaa aactaatata tatgtacatg gatttctata gatgtgtttg 420
tttagaagtg ggtagatatt gcagataaga ctgttcttca gaatcatgtt aactattggg 480
ttgtgactga agtagtccag ggtttgcctt gaaaccatta cattctacat ttaccaaatt 540
aaacaaataa aaactgtatt aaatgtt 567
<210> 70
<211> 169
<212> DNA
<213> 人工序列
<220>
<223> 智人CCDC53 3'-UTR
CCDC53-001 ENST00000240079
<400> 70
gcttaatttt gataagaatt acatatgcat gcataggggt acatttacat tctgtaagag 60
attgagcctg aactctctta gtcataaaaa catcaaatgg ccacatgtcc actaccaagc 120
ttcttctatg ttaaaaaaat aataataaag cagttttaac ctgccagta 169
<210> 71
<211> 194
<212> DNA
<213> 人工序列
<220>
<223> 智人LRRC28 3'-UTR
LRRC28-002 ENST00000331450
<400> 71
taaacactca agaacctcag gagcgctgcc agcttgacac tggggaatcc agccagtcca 60
gcacactctt ccatcctgtc ctgtccaatg cgggggcact gcagaactct ctagaaatgt 120
catgattgag cttcagagct aaaatgcctt cacccttccc ccaagttgga atatatcctc 180
ccccaaatta agga 194
<210> 72
<211> 120
<212> DNA
<213> 人工序列
<220>
<223> 智人CCDC109B 3'-UTR
NM_017918.4
<400> 72
tcttacagtt ttaaatgtcg tcagattttc cattatgtat tgattttgca acttaggatg 60
tttttgagtc ccatggttca ttttgattgt ttaatctttg ttattaaatt cttgtaaaac 120
<210> 73
<211> 426
<212> DNA
<213> 人工序列
<220>
<223> 智人PUS10 3'-UTR
PUS10-001 ENST00000316752
<400> 73
ctttcaaatt tggagacaaa gagtatggtt ttcctggcat gatgtggaca tccatggagc 60
acatgccgta aaatggctgt ttacccacca taacggtgtc ttgaaaacta tttggatcat 120
gttgatctat ataattgtta atttgttgta acatctcagg atctatatat gtgtatattt 180
tgtgttaaat tgttccaagg atgtcttagg atttttctca ttccctcttt cacccccaca 240
aaccaaacta tgaataatga aataattctc cttaattctt tcatttagag aggtgcacaa 300
acaggacaca ttctctgtta acctaagaag ctgtaatttc agcaagattt ccctccacaa 360
gagatatacc acctttaaaa tcatgttcta atttttgtaa attatctgaa taaaagttat 420
atctag 426
<210> 74
<211> 71
<212> DNA
<213> 人工序列
<220>
<223> 智人CCDC104 3'-UTR
CCDC104-002 ENST00000339012
<400> 74
taattaagaa caatttaaca aaatggaagt tcaaattgtc ttaaaaataa attatttagt 60
ccttacactg a 71
<210> 75
<211> 125
<212> DNA
<213> 人工序列
<220>
<223> 智人CASP1 3'-UTR
CASP1-007 ENST00000527979
<400> 75
aataaggaaa ctgtatgaat gtctgtgggc aggaagtgaa gagatccttc tgtaaaggtt 60
tttggaatta tgtctgctga ataataaact tttttgaaat aataaatctg gtagaaaaat 120
gaaaa 125
<210> 76
<211> 174
<212> DNA
<213> 人工序列
<220>
<223> 智人SNX14 3'-UTR
SNX14-007 ENST00000513865
<400> 76
acacttggat ttggtataga ataacccatt gaaatttctg ctgtgcgagg gtggtagaaa 60
tttacttttt tgggtatatt cttatatata ttatgtacat cgctgtctga aattttagtt 120
attttttgtt tttaataaag actaacacaa acttaatgat taaaagtgat tgag 174
<210> 77
<211> 237
<212> DNA
<213> 人工序列
<220>
<223> 智人SKAP2 3'-UTR
SKAP2-201 (SKAP2.001 ENST00000345317的部分)
<400> 77
gagtcctgga aaaggaaaat tcttctgctt gtctgcaaat gctttggatt tagaagcgtc 60
atgaaagcac gagtgacagc tcctaacctc tccttgtttt attaaacatt acttatcttt 120
gactgttatt ttatgcagtc gctcattaaa atattcctct gatgtgaaat taaatgaagg 180
atattaatgt aaattagatg caaccagtta agttatacct gttgctattt tgcaaag 237
<210> 78
<211> 362
<212> DNA
<213> 人工序列
<220>
<223> 智人NDUFB6 3'-UTR
NM_182739.2
<400> 78
agattatgta aaaagttaaa aggcttatga gcctaagttt gttcctatat taccatattt 60
actgaatttt ctggaaaagt aactttaata aagtttaatc tcagaaattg tcatatctgt 120
tttcaagcat tgtacaattt gagactgagt aatttaacaa taagtaaaaa gtggacatgc 180
taaacaaata tgagagacta cctacttttt ctggtcattc ttgacttgga aaacggtatg 240
gaaaagtatt tagttacatg tttgtttgtt tttttcttac acagtactta cactaatttg 300
gtatcagggt atgcaacagt gaaatatcac aataaacaaa tgtaagaaca aaaaaaaaaa 360
aa 362
<210> 79
<211> 549
<212> DNA
<213> 人工序列
<220>
<223> 智人EFHA1 3'-UTR
EFHA1-001 ENST00000382374
<400> 79
taaaagatat aatagtatgg caattatatt gttccaaatg tcaaaatttg tgatttttta 60
gaagtacttg ctatttatct tcttaagtct tcattgatat tctgtgtgaa ataagcatgt 120
cttgtacttg ctttctgatt cataatttta ttaaagaact tagtagaaag aaaagtaagt 180
ataaaaatag atattggatt ctgtcagaag gcctagattt gaaataatgt tttgtacttc 240
ggtaagatgg aaaacttagt gattcactga tttcttagac actctaatat gatatgcttt 300
ctggaaggat aaaacaaata catatgggaa aaagtacttg agaccaaggc cagcatcaat 360
tccagacatc ttcatgttcc taataggcta aatgaagtta aaaacttatt tcagattttt 420
ctcatctgta ccttatatct cataaattta ttgcatattt tatgtcagta gcttagctgt 480
ttattgtctt taaaataaca tgtaaacttc aatgttctat ctggaagcag aataaaatat 540
ttacataga 549
<210> 80
<211> 288
<212> DNA
<213> 人工序列
<220>
<223> 智人BCKDHB 3'-UTR
BCKDHB-005 ENST00000356489
<400> 80
ccatatagaa aagctggaag attatgacta gatatggaaa tattttttct gaattttttt 60
ttatatttcc tccgacttac ctctttttga aaagagagtt tttattaagt gaaccatcac 120
gatattggct gaaaagttct acattctatt attgtattgt aacacacatg tattgatgat 180
tttcattaag agtttcagat taactttgaa aaatattcca catggtaatc ttataaattc 240
tgtttaatta catctgtaaa tattatgtgt gtgatagtat tcaataaa 288
<210> 81
<211> 414
<212> DNA
<213> 人工序列
<220>
<223> 智人BCKDHB 3'-UTR
NM_001164783.1
<400> 81
gacctgctca gcccaccccc acccatcctc agctaccccg agaggtagcc ccactctaag 60
gggagcaggg ggacctgaca gcacaccact gtcttcccca gtcagctccc tctaaaatac 120
tcagcggcca gggcggctgc cactcttcac ccctgctcct cccggctgtt acattgtcag 180
gggacagcat ctgcagcagt tgctgaggct ccgtcagccc cctcttcacc tgttgttaca 240
gtgccttctc ccaggggctg ggtgagggca cattcaggac tagaagcccc tctgggcatg 300
gggtggacat ggcaggtcag cctgtggaac ttgcgcaggt gcgagtggcc agcagaggtc 360
acgaataaac tgcatctctg cgcctggctc tctaccaaaa aaaaaaaaaa aaaa 414
<210> 82
<211> 414
<212> DNA
<213> 人工序列
<220>
<223> 智人BBS2 3'-UTR
NM_031885.3
<400> 82
gtgaggaaaa tacaggtcat gaagttcctg gcaaagattt tctgttaaaa acctatgctg 60
gtttgctttg gatcacaccc tggtgaaccc cgggtgctaa gaatgaaaat aaccttggtg 120
agttgtacaa attaaagaca aagaactaca tgtgaagata gacttgcttt ctatttttaa 180
atcagtagta gtactgttgc tgaataatac taggttttta tggaatagga tgaatgcttt 240
tgaagtatta gggcttcaga gtccaatttt gcttatttat ggtatataaa tacatatttt 300
tttcttgaaa ttgcaattga gtttgtactt ttcaaataga ttatctactt tttcattaaa 360
atgtaaagat gttaaacttt gtgttgattg attataaaat caccaccaaa tcag 414
<210> 83
<211> 409
<212> DNA
<213> 人工序列
<220>
<223> 智人LMBRD1 3'UTR
NM_018368.3
<400> 83
cagccttctg tcttaaaggt tttataatgc tgactgaata tctgttatgc atttttaaag 60
tattaaacta acattaggat ttgctaacta gctttcatca aaaatgggag catggctata 120
agacaactat attttattat atgttttctg aagtaacatt gtatcataga ttaacatttt 180
aaattaccat aatcatgcta tgtaaatata agactactgg ctttgtgagg gaatgtttgt 240
gcaaaatttt ttcctctaat gtataatagt gttaaattga ttaaaaatct tccagaatta 300
atattccctt ttgtcacttt ttgaaaacat aataaatcat ctgtatctgt gccttaggtt 360
ctccagagtg atgtggaatt ttaaagtgtc tctctctgat tgcctccaa 409
<210> 84
<211> 466
<212> DNA
<213> 人工序列
<220>
<223> 智人ITGA6 3'-UTR
ITGA6-003 ENST00000409532
<400> 84
tattgatcta cttctgtaat tgtgtggatt ctttaaacgc tctaggtacg atgacagtgt 60
tccccgatac catgctgtaa ggatccggaa agaagagcga gagatcaaag atgaaaagta 120
tattgataac cttgaaaaaa aacagtggat cacaaagtgg aacgaaaatg aaagctactc 180
atagcggggg cctaaaaaaa aaaagcttca cagtacccaa actgcttttt ccaactcaga 240
aattcaattt ggatttaaaa gcctgctcaa tccctgagga ctgatttcag agtgactaca 300
cacagtacga acctacagtt ttaactgtgg atattgttac gtagcctaag gctcctgttt 360
tgcacagcca aatttaaaac tgttggaatg gatttttctt taactgccgt aatttaactt 420
tctgggttgc ctttattttt ggcgtggctg acttacatca tgtgtt 466
<210> 85
<211> 285
<212> DNA
<213> 人工序列
<220>
<223> 智人HERC5 3'-UTR
HERC5-001 ENST00000264350
<400> 85
ccagcttgct tgtccaacag ccttattttg ttgttgttat cgttgttgtt gttgttgttg 60
ttgttgtttc tctactttgt tttgttttag gcttttagca gcctgaagcc atggtttttc 120
atttctgtct ctagtgataa gcaggaaaga gggatgaaga agagggttta ctggccggtt 180
agaacccgtg actgtattct ctcccttgga tacccctatg cctacatcat attccttacc 240
tcttttggga aatatttttc aaaaataaaa taaccgaaaa attaa 285
<210> 86
<211> 515
<212> DNA
<213> 人工序列
<220>
<223> 智人HADHB 3'-UTR
HADHB-001 ENST00000317799
<400> 86
tagatccaga agaagtgacc tgaagtttct gtgcaacact cacactaggc aatgccattt 60
caatgcatta ctaaatgaca tttgtagttc ctagctcctc ttaggaaaac agttcttgtg 120
gccttctatt aaatagtttg cacttaagcc ttgccagtgt tctgagcttt tcaataatca 180
gtttactgct ctttcaggga tttctaagcc accagaatct cacatgagat gtgtgggtgg 240
ttgtttttgg tctctgttgt cactaaagac taaatgaggg tttgcagttg ggaaagaggt 300
caactgagat ttggaaatca tctttgtaat atttgcaaat tatacttgtt cttatctgtg 360
tcctaaagat gtgttctcta taaaatacaa accaacgtgc ctaattaatt atggaaaaat 420
aattcagaat ctaaacacca ctgaaaactt ataaaaaatg tttagataca taaatatggt 480
ggtcagcgtt aataaagtgg agaaatattg gagaa 515
<210> 87
<211> 116
<212> DNA
<213> 人工序列
<220>
<223> 智人ANAPC4 3'-UTR
ANAPC4-001 ENST00000315368
<400> 87
tctagcttgc cattattgtg tgtgtaatta tggccaaaag gacataggag atggactaag 60
atgtcttgga ccacctttgt gtaacaaaga aataaacagt aaattttatt ttttca 116
<210> 88
<211> 154
<212> DNA
<213> 人工序列
<220>
<223> 智人PCCB 3'-UTR
NM_000532.4
<400> 88
acaaatcaaa ggaaaagaaa ccaagaactg aattactgtc tgcccattca catcccattc 60
ctgccttttg caatcatgaa acctgggaat ccaaatagtt ggataactta gaataactaa 120
gtttattaaa ttctagaaag atctcaaaaa aaaa 154
<210> 89
<211> 90
<212> DNA
<213> 人工序列
<220>
<223> 智人ABCB7 3'-UTR
ABCB7-001 ENST00000253577
<400> 89
gtcacataag acattttctt tttttgttgt tttggactac atatttgcac tgaagcagaa 60
ttgttttatt aaaaaaatca tacattccca 90
<210> 90
<211> 318
<212> DNA
<213> 人工序列
<220>
<223> 智人PGCP 3'-UTR
CPQ-001 ENST00000220763
<400> 90
aaacagtaag aaagaaacgt tttcatgctt ctggccagga atcctgggtc tgcaactttg 60
gaaaactcct cttcacataa caatttcatc caattcatct tcaaagcaca actctatttc 120
atgctttctg ttattatctt tcttgatact ttccaaattc tctgattcta gaaaaaggaa 180
tcattctccc ctccctccca ccacatagaa tcaacatatg gtagggatta cagtgggggc 240
atttctttat atcacctctt aaaaacattg tttccacttt aaaagtaaac acttaataaa 300
tttttggaag atctctga 318
<210> 91
<211> 133
<212> DNA
<213> 人工序列
<220>
<223> 智人NFU1 3'-UTR
NM_001002755.2
<400> 91
aataatctgg attttctttg ggcataacag tcagacttgt tgataatata tatcaagttt 60
ttattattaa tatgctgagg aacttgaaga ttaataaaat atgctcttca gagaatgata 120
tataaatatt gca 133
<210> 92
<211> 246
<212> DNA
<213> 人工序列
<220>
<223> 智人OMA1 3'-UTR
OMA1-001 ENST00000371226
<400> 92
attaaaattt atgagacaca agatatatga agaatgttgc agtccttatc attttatgtt 60
actttttaaa aaatgatgtt tgaagtgaaa aaaaaaagga tattcagggt caaatcatgt 120
acattacaga tattatctaa attcttctag aatttatttt tcatgaaata ttgatgtatt 180
ttaatctatg ttaaaatatc ttcaatgagg aaaatgtcac agaataaatt tatattacac 240
atttta 246
<210> 93
<211> 423
<212> DNA
<213> 人工序列
<220>
<223> 智人HHLA3 3'-UTR
NM_001036646.1
<400> 93
ggcgaatcca tagagtaagc ttagtgatgt gtgtcagacc tctgagccca agcaaagcca 60
tcatatcccc tgtgacctgc atgtatacat ccagatggcc tgaagcaagt gaagaatcac 120
aaaagaagtg aaaagggccg gttcctgcct taactgatga cattccacca ttgtgatttg 180
ttcctgcccc accttaactg agcgattaac ctgtgaactt ccttctcctg gctcagaagc 240
ttccccactg agcaccttgt gacccccgcc cctgcctgcc atagaacaac cccctttgat 300
tgtaattttc ctttacctac ccaaatccta taaaacggcc ccacccctat ctcccttcgc 360
tgacactctc tttggactca gcctgcctgc acctaggtga ttaaaaagct ttattgctca 420
cgc 423
<210> 94
<211> 292
<212> DNA
<213> 人工序列
<220>
<223> 智人HHLA3 3'-UTR
NM_001031693.2
<400> 94
aaagggccgg ttcctgcctt aactgatgac attccaccat tgtgatttgt tcctgcccca 60
ccttaactga gcgattaacc tgtgaacttc cttctcctgg ctcagaagct tccccactga 120
gcaccttgtg acccccgccc ctgcctgcca tagaacaacc ccctttgatt gtaattttcc 180
tttacctacc caaatcctat aaaacggccc cacccctatc tcccttcgct gacactctct 240
ttggactcag cctgcctgca cctaggtgat taaaaagctt tattgctcac gc 292
<210> 95
<211> 342
<212> DNA
<213> 人工序列
<220>
<223> 智人ACAA2 3'-UTR
NM_006111.2
<400> 95
agagaccagt gagctcactg tgacccatcc ttactctact tggccaggcc acagtaaaac 60
aagtgacctt cagagcagct gccacaactg gccatgccct gccattgaaa cagtgattaa 120
gtttgatcaa gccatggtga cacaaaaatg cattgatcat gaataggagc ccatgctaga 180
agtacattct ctcagatttg aaccagtgaa atatgatgta tttctgagct aaaactcaac 240
tatagaagac attaaaagaa atcgtattct tgccaagtaa ccaccacttc tgccttagat 300
aatatgatta taaggaaatc aaataaatgt tgccttaact tc 342
<210> 96
<211> 446
<212> DNA
<213> 人工序列
<220>
<223> 智人GSTM4 3'-UTR
GSTM4-001 ENST00000369836
<400> 96
tgccttgaag gccaggaggt gggagtgagg agcccatact cagcctgctg cccaggctgt 60
gcagcgcagc tggactctgc atcccagcac ctgcctcctc gttcctttct cctgtttatt 120
cccatcttta cccccaagac tttattgggc ctcttcactt cccctaaacc cctgtcccat 180
gcaggccctt tgaagcctca gctacccact ttccttcatg aacatccccc tcccaacact 240
acccttccct gcactaaagc cagcctgacc ttccttcctg ttagtggttg tatctgcttt 300
gaagggccta cctggcccct cgcctgtgga gctcagccct gagctgtccc cgtgttgcat 360
gacagcattg actggtttac aggccctgct cctgcagcat ggcccctgcc ttaggcctac 420
ctgatcaaaa taaagcctca gccaca 446
<210> 97
<211> 465
<212> DNA
<213> 人工序列
<220>
<223> 智人GSTM4 3'-UTR
GSTM4-003 ENST00000326729
<400> 97
tggtcaattt tctgcatcaa cttgactggg ctaagggatg ctcagatggc aggtaaaatc 60
attgtgcttg tgagggtgtt tccagaagag atttgccttt gaatcagaag acagcaaaga 120
tttccttcag caatgaagga ggcatccacc aaactgtcag ggcccagaga gaagaaaaag 180
acaggaaggg tgaatttgac ctctctgact gggacatcca tctctgccta tcctgggacc 240
tccacactcc tggttctctg gccttcagac ttgatcaggg actaacacca tcgcctccca 300
cccccacctt tgttctgagg cctttagcct ctgaatgata ccactggctt tcctgcttct 360
ctatcctgca gtcggcagat catgggactt cttcactcca aaattgtgtg agccaattcc 420
cataacagat agataaattt ataaataaac acacaaattt cctac 465
<210> 98
<211> 274
<212> DNA
<213> 人工序列
<220>
<223> 智人ALG8 3'-UTR
NM_001007027.2
<400> 98
ctgaaacctc cgcctcccag aaaagaaaaa cctcttttta attggatgga aactttctac 60
ctgcttggcc tggggcctct ggaagtctgc tgtgaatttg tattcccttt cacctcctgg 120
aaggtgaagt accccttcat ccctttgtta ctaacctcag tgtattgtgc agtaggcatc 180
acatatgctt ggttcaaact gtatgtttca gtattgattg actctgctat tggcaagaca 240
aagaaacaat gaataaagga actgcttaga tatg 274
<210> 99
<211> 122
<212> DNA
<213> 人工序列
<220>
<223> 智人C11orf74 3'UTR
<400> 99
ttcacagagg cattttgtgt gtgtgtgctt attttaattt tgttcttatt ctagcaacat 60
tagaataaaa gataaaccta ctataattcc ctttgtggaa atttaaaaaa aaaaaaaaaa 120
aa 122
<210> 100
<211> 133
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Ndufa1 3'-UTR
Ndufa1-001 ENSMUST00000016571
<400> 100
ggaagcattt tcctggctga ttaaaagaaa ttactcagct atggtcatct gttcctgtta 60
gaaggctatg cagcatatta tatactatgc gcatgttatg aaatgcataa taaaaaattt 120
taaaaaatct aaa 133
<210> 101
<211> 155
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Atp5e 3'-UTR
NM_025983
<400> 101
ctgaatctga agcctgaagt gctgagtctt gaaggtgaag catgtgggcc cctgttctgg 60
cagatggaaa tcaacctcac ctcctggggg acaggctgcc catctcgttg ataaattgac 120
tatgccaata aattaacatg gttcactttc aaaaa 155
<210> 102
<211> 136
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Gstm5 3'-UTR
NM_010360
<400> 102
gccagagctc gctgctgctg agccatcttg ccctgagggg cccacactct tagctcactg 60
tcagtcttgt tccatcctgt cctgagggcc cccactctgt ctcctctgct ctttctaata 120
aacagcagtt gcatta 136
<210> 103
<211> 189
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Uqcr11 3'-UTR
NM_025650
<400> 103
gcagcccctc ccccaccaca ggcctcgatg gtaccatgtg ccgaggcctc agacacagcg 60
tagtcctgtg gaagacactg aggaagctgg acactggaga ggtctgcacc gctcagggag 120
cttccatgtt gacagacact agggctgcct tgatgggtgc agcattaaac cttattctta 180
tgccttgga 189
<210> 104
<211> 143
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠IFi27I2a 3'-UTR
IFi27I2a-001 ENSMUST00000055071; NM_029803
<400> 104
gcttaggaga tgacacttct atcagctcaa ctcaaagcct gtacagacta cgcaggagat 60
gaagttccaa aaggcacctt cagaaccctc actgatgtca aagaatgatg aaaacaacaa 120
agtatatggg ctggtgttcc taa 143
<210> 105
<211> 237
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Cbr2 3'-UTR
NM_007621
<400> 105
tctgctcagt tgccgcggac atctgagtgg ccttcttagc cccaccctca gccaaagcat 60
ttactgatct cgtgactccg ccctcatgct acagccacgc ccaccacgca gctcacagtt 120
ccacccccat gttactgtcg atcccacaac cactccaggc gcagaccttg ttctctttgt 180
ccactttgtt gggctcattt gcctaaataa acgggccacc gcgttacctt taactat 237
<210> 106
<211> 118
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Atp5l 3'-UTR
Atp5l-201 ENSMUST00000043675
<400> 106
agaccaatct ttaacttctg atttgagttc ttatttgaat gttcttggac catgtgtaac 60
aggactgcta tctgaataaa atactaggtg ttgaaaacac tgctgtgttt tctctgtc 118
<210> 107
<211> 271
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Tmsb10 3'-UTR
NM_025284
<400> 107
aagcctagga agatttcccc accccacccc accccgcccc atcatctcca agaccccctc 60
gtgatgtgga ggaagagcca cctgcaagat ggacgcgagc cacaagctgc actgtgaaac 120
ccgggcactc cgagccgatg ccaccggccc gcgggtctct gaaggggacc cctccactaa 180
tcggactgcc aaatttcacc ggtttgccct gggatattat agaaaattat ttgtatgatt 240
gatgaaaata aaaacacctc gtggcatggt t 271
<210> 108
<211> 116
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Nenf 3'-UTR
NM_025424
<400> 108
tgtctagctg agaagcagcc ggttctaggg agaagtgagg ggacaggagt taagtgtccc 60
tcggaacaag cggaggaagc ctccgagtgc cctgcagctg aataaagcga atgttt 116
<210> 109
<211> 123
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Atp5k 3'-UTR
NM_007507
<400> 109
ggcgtcagcg agcttgcttt tctctagtcg ttgagaacga ataaagcttc attgtgtgaa 60
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 120
aaa 123
<210> 110
<211> 260
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠1110008P14Rik 3'-UTR
1110008P14Rik-001 ENSMUST00000048792
<400> 110
gtgccgggag cccccatcca ggccctaccc tcacctctct aggccatgtt ctggcctggg 60
tagatactac ttggcttaga caccatctcg ggtactggcc tccagatcct agtgggtcta 120
ccagcctgga ccagtcccca ttcactgccc atcacccttc ctggagtcag gtgcaatcct 180
acagttctcc cacttgtctg tcttctttcc cctccatcca gactgagagt ccgaattaaa 240
gatgtctccc acaccactgc 260
<210> 111
<211> 102
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Cox4i1 3'-UTR
NM_009941
<400> 111
gagcccgctg cctgccggct ccctgcctcc ctcactccct cggcatgctg gaagctgccg 60
tatccaatgg tccatgctaa taaaagacca gtttacgtgg tg 102
<210> 112
<211> 189
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Cox6a1 3'-UTR
NM_007748
<400> 112
agagaacctg gcctccccca ggcaacaaag ggaccacagc actggttttg gacccttact 60
ctgtgtggac cacgaaaacc ctttggatgc taagctcgtg tctcctttcc tcagatggcg 120
accattactc tgatcttcca tcccttctgc ttgtaagagg agatgcctta aataaataac 180
ttaaactca 189
<210> 113
<211> 139
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Ndufs6 3'-UTR
NM_010888
<400> 113
tgtgggctgt gtcctggtcc tctgactcct atggaacatc tccacgctgg gtgttctgtg 60
tgaggccact gctctgtgaa tggtgtccct tgttttgaat aaaggatgct cccaccatga 120
aaaaaaaaaa aaaaaaaaa 139
<210> 114
<211> 171
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Sec61b 3'-UTR
NM_024171
<400> 114
attgggctac atccatctgt catctgaaga agaagaagaa ggaaaaaaac ccaacatatc 60
ttggaccaaa agtgtagtga ttttctgttc acgtgtatta ttttacagag aataagaatt 120
gactttgaga aatcagtttt ttctatggct aataaacttt ggaattgctt t 171
<210> 115
<211> 101
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Romo1 3'-UTR
NM_025946
<400> 115
ttagggctag gatgccctgc aatacctaaa cttccccatc catttcgacc cttgtacaat 60
aataaagttg ttttcttctc gttaaaaaaa aaaaaaaaaa a 101
<210> 116
<211> 370
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Gnas 3'-UTR
NM_010309
<400> 116
gaagggaaca cccaaattta attcagcctt aagcacaatt aattaagagt gaaacgtaat 60
tgtacaagca gttggtcacc caccataggg catgatcaac accgcaacct ttcctttttc 120
ccccagtgat tctgaaaaac ccctcttccc ttcagcttgc ttagatgttc caaatttagt 180
aagcttaagg cggcctacag aagaaaaaga aaaaaaaggc cacaaaagtt ccctctcact 240
ttcagtaaat aaaataaaag cagcaacaga aataaagaaa taaatgaaat tcaaaatgaa 300
ataaatattg tgttgtgcag cattaaaaaa tcaataaaaa ttaaaaatga gcaaaaaaaa 360
aaaaaaaaaa 370
<210> 117
<211> 96
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Snrpd2 3'-UTR
NM_026943
<400> 117
agcctgctcc ctgccctgcg aaggcctgca gaaccctgcc cagtgggcga gaaataaaac 60
cctgtgcttt ttggttaaaa aaaaaaaaaa aaaaaa 96
<210> 118
<211> 119
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Mgst3 3'-UTR
NM_025569
<400> 118
ggtgtggagg gccttccgac tctcactcac ctccagcgac tcaccctgat ttccagttgc 60
actggttttt tttttttttt taatataata aaaacttatc tggcatcagc ctcatacct 119
<210> 119
<211> 304
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Aldh2 3'-UTR
NM_009656
<400> 119
agcggcatgc ctgcttcctc agcccgcacc cgaaaaccca acaagatata ctgagaaaaa 60
ccgccacaca cactgcgcct ccaaagagaa accccttcac caaagtgtct tgggtcaaga 120
aagaatttta taaacagggc ggggctggtg ggggggaaag ctcctgataa actgggtagg 180
ggatgaagct caatgcagac cgatcacgcg tccagatgtg caggatgctg ccttcaacct 240
gcagtcccta agcagcaaat gagcaataaa aatcagcaga tcaaagccac ggggtcagtt 300
ctct 304
<210> 120
<211> 134
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Mp68 (2010107E04Rik) 3'-UTR
NM_027360
<400> 120
ctgctccgaa tccacaagat gaagacgtcg gctaaacttg agcaagcttt gttagatggg 60
aacatggaac atcactgtac acttatctaa gtaccattta taatgtggca ttaataaatg 120
tatctgtgaa tacc 134
<210> 121
<211> 87
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Ssr4 3'-UTR
NM_001166480
<400> 121
gggcagcaac ttcagccgtc cattgcttct ttcaataaac agtcactatt tgacatgagt 60
acattcaaga aaaaaaaaaa aaaaaaa 87
<210> 122
<211> 186
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Myl6 3'-UTR
NM_010860
<400> 122
ggacattctg tatcccgagt ctgttccttg cccagtgtga tttctgtgtg gctccagagg 60
ctcccctgtc acagcacctt gcccatttgg tttcttttgg atgatgtttg ccttccccaa 120
ataaaatttg ctctctttgc cctccaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 180
aaaaaa 186
<210> 123
<211> 58
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Prdx4 3'-UTR
Prdx4-001, NM_016764
<400> 123
aaagtacttc agttatgatg tttggacctt ctcaataaag gtcattgtgt tattacca 58
<210> 124
<211> 130
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Ubl5 3'-UTR
NM_025401
<400> 124
agggggattc cttctcctcc tcgccctgct ctgccctgcc ctcctctccc atcctcatct 60
gacactggtg tagatggtca tttttaacag ttcacatgaa taaaaacttg gctgctgctt 120
tgctgctgtc 130
<210> 125
<211> 87
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠1110001J03Rik 3'-UTR
NM_025363
<400> 125
tgcagagagt cctcagatgt tccttcattc aagagtttaa ccatttctaa caatatgtag 60
ttatcattaa atctttttta aagtgtg 87
<210> 126
<211> 33
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Ndufa13 3'-UTR
Ndufa13-201 ENSMUST00000110167
<400> 126
ggcctgagcc aacgcacata ataaagagtg gtc 33
<210> 127
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Ndufa3 3'-UTR
NM_025348
<400> 127
atgcctctgc tgatggaaga ggccccttcc ctgttgctct ccaataaaaa tgtgaaaact 60
aataacccc 69
<210> 128
<211> 96
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Gstp2 3'-UTR
NM_181796
<400> 128
tggactgaag agacaagagc ttcttgtccc cgttttccca gcactaataa agtttgtaag 60
acaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaa 96
<210> 129
<211> 89
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Tmem160 3'-UTR
NM_026938
<400> 129
acaacagggc tgtggggact ggctgggcct gacgactggg acattaaaac ctgacccttc 60
cgcaaaaaaa aaaaaaaaaa aaaaaaaaa 89
<210> 130
<211> 129
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Ergic3 3'-UTR
NM_025516
<400> 130
ctctctccct tccccacagc ttgtcctgcc ctctcttccc ctgtgggttt accctccagc 60
ctgtcaacta cccatatcct ctcctcagcc agcccagccc agggcaataa atatgaattg 120
tgataggaa 129
<210> 131
<211> 295
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Pgcp 3'-UTR
NM_018755
<400> 131
ggagaacaag aagagaggac cttgttctct gtagttggga atcccaactc tgaatcttta 60
caacatccat cgtcacaaaa gagtgttata catttaatcc acagggcata gttttcttta 120
taccttctgt taatcatctt tccttaatac tttcttatct gtttctagaa taaatcatga 180
tccctactgc accaccttga aaatgttgtt tccagtttta aaataagcaa taaatatttg 240
aaatgcttct gatttttcat tttcatttaa aaacattaaa ttaaatgtaa tgaga 295
<210> 132
<211> 263
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Slpi 3'-UTR
NM_011414
<400> 132
gcctgatccc tgacattggc gccggctctg gactcgtgct cggtgtgctc tggaaactac 60
ttccctgctc ccaggcgtcc ctgctccggg ttccatggct cccggctccc tgtatcccag 120
gcttggatcc tgtggaccag ggttactgtt ttaccactaa catctccttt tggctcagca 180
ttcaccgatc tttagggaaa tgctgttgga gagcaaataa ataaacgcat tcatttctct 240
atgcaaaaaa aaaaaaaaaa aaa 263
<210> 133
<211> 241
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Myeov2 3'-UTR
NM_001163425
<400> 133
ggccgcccgg tcctatgtgc tccatgtctg tgatgtgtct ggagtctctc gggacacgac 60
cagctgattg tagacaccgt gttgatatca ctagaaatga agaccttgtc aaccaataga 120
ggaactgtct gaaccaactg ggtactgatg tctctgggaa tgccagcccg tgtccttgtt 180
taagttaata aagaacactg taacacgcag ggtgatttta aaaaaaaaaa aaaaaaaaaa 240
a 241
<210> 134
<211> 162
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Ndufa4 3'-UTR
NM_010886
<400> 134
actatgaagt tcactgtaaa gctgctgata atgaaggtct ttcagaagcc atccgcacaa 60
ttttccactt aagcaggaaa tatgtctctg aatgcatgaa atcatgttga tttttttttt 120
ttttggagtt tattacactg atgaataaat ctctgaaact tg 162
<210> 135
<211> 143
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Ndufs5 3'-UTR
NM_001030274
<400> 135
gcggggcagc tggaggccgc tgtcatgctc tgttttcccc tggagagaat atttaaggaa 60
agctccttca ttaagtatta agtatgtgga aataaagaat tactcagtct taaaaaaaaa 120
aaaaaaaaaa aaaaaaaaaa aaa 143
<210> 136
<211> 455
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Gstm1 3'-UTR
NM_010358
<400> 136
gcccttgcta cacgggcact cactaggagg acctgtccac actggggatc ctgcaggccc 60
tgggtgggga cagcaccctg gccttctgca ctgtggctcc tggttctctc tccttcccgc 120
tcccttctgc agcttggtca gccccatctc ctcaccctct tcccagtcaa gtccacacag 180
ccttcattct ccccagtttc tttcacatgg ccccttcttc attggctccc tgacccaacc 240
tcacagcccg tttctgcgaa ctgaggtctg tcctgaactc acgcttccta gaattacccc 300
gatggtcaac actatcttag tgctagccct ccctagagtt accccgaagg tcaatacttg 360
agtgccagcc tgttcctggt ggagtagcct ccccaggtct gtctcgtcta caataaagtc 420
tgaaacacac ttgccatgaa aaaaaaaaaa aaaaa 455
<210> 137
<211> 109
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠1810027O10Rik 3'-UTR
1810027O10Rik-001 ENSMUST00000094065
<400> 137
agtctcttgt ttaagcgccc agtcctggcc tttctgggta attgggcgca gagggaagga 60
gccaatgttg aagcagaaaa gaaattaaaa gaaaaaggca tataaagaa 109
<210> 138
<211> 49
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠1810027O10Rik 3'-UTR
BC117077
<400> 138
agtctcttgt ttaagcgccc agtcctggcc tttctgggta attgggcgc 49
<210> 139
<211> 55
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Atp5o 3'-UTR
NM_138597
<400> 139
gagactgtca cctgtgtgag ctcttgtcct tggagcaaca ataaaatgct tcctg 55
<210> 140
<211> 174
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Shfm1 3'-UTR
NM_009169
<400> 140
catctgggaa tgtcccagga acctcaatca tggactctac cacagtctag gacagagaaa 60
gcaggacggg atactttaaa gaacatgttt atttcattat ctgcttcaat ttatttttgt 120
tttataacaa aaaaaataag taaataaatg ttttgattta atctttttgg ttca 174
<210> 141
<211> 260
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Tspo 3'-UTR
NM_009775
<400> 141
aggcacccag ccatcaggaa tgcagccctg ccagccaggc accatgggtg gcagccatca 60
tgcttttatg accattgggc ctgctggtct acctggtctt agcccaggaa gccaccaggt 120
aggttagggt ggtcagtgcc gagtctcctg cagacacagt tatacctgcc tttctgcact 180
gctccaggca tgcccttaga gcatggtgtt ttaaagctaa ataaagtctc taacttcatg 240
tgtaaaaaaa aaaaaaaaaa 260
<210> 142
<211> 92
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠S100a6 3'-UTR
NM_011313
<400> 142
aatgggaccg ttgagatgac ttccgggggc ctctctcggt caaatccagt ggtgggtagt 60
tatacaataa atatttcgtt tttgttatgc ct 92
<210> 143
<211> 200
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Taldo1 3'-UTR
NM_011528
<400> 143
tgcaacaccc gaggccccag tcctgcaccg aggctgaccc cagacctgca ctgcctttga 60
gctgggtcct aattgcacat ggcttgtgac gaatgaatct tgcatttttt agtgatcgga 120
gaagggatgg atcataggat tctgatttta tgtgaaattt tgtctaattc attaaagcag 180
ttgcttttcc tatgctgttt 200
<210> 144
<211> 83
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Bloc1s1 3'-UTR
NM_015740
<400> 144
actaaaaccc acccctctta cttcaccctc ctggacagga gggaaactgg tgagccacga 60
ataaaaacac aagcttccat tct 83
<210> 145
<211> 93
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Ndufb11 3'-UTR
NM_019435
<400> 145
tggcttaccg agcagggcct aagaagcatt actcatccgc tgcttgttat ttacctggtt 60
cctcagaaca ccttattaaa ggaattgaaa gta 93
<210> 146
<211> 454
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Map1lc3a 3'-UTR
NM_025735
<400> 146
gtcaagagga ggggaggggg gtggctggga gttctggtca ggttctcccc agggaggtcc 60
tggctcctaa actaagctat ttcagtcccc agtggattag gcagagatgt gacacccact 120
ccccccccca ggtaggggcc accagccagc ctaccacatc ctgggtaggt cctgggccag 180
tcatgttcgg gttgctcttt tgggtgctgg ctgggttggg agtgggtggg gagcagcatc 240
cctgctctgt ggggtttgtc attttgttag gcccttgcct gtctgcccat cttgcccctc 300
atccacctga ggctttgcct cctgccagga cctgccccac ccctgaaagg ctggctcccc 360
ttgtcctgac tcggtgtatg gatctgtggt catttcctct gcagaaagaa taaagactgc 420
tcaggcctgc ctggccaaaa aaaaaaaaaa aaaa 454
<210> 147
<211> 135
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Morn2 3'-UTR
NM_194269
<400> 147
acctgctgcc ttaacgctga gatgtggcct ctgcaacccc ccttaggcaa agcaactgaa 60
ccttctgcta aagtgacctg ccctcttccg taagtccaat aaagttgtca tgcacccaca 120
aaaaaaaaaa aaaaa 135
<210> 148
<211> 238
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Gpx4 3'-UTR
NM_008162.2
<400> 148
ctagccctac aagtgtgtgc ccctacaccg agcccccctg ccctgtgacc cctggagcct 60
tccaccccgg cactcatgaa ggtctgcctg aaaaccagcc tgctggtggg gcagtcctga 120
ggacctggcg tgcatccctg ccggaggaag gtccagaggc ctgtggccct gggctcgagc 180
ttcaccctgg ctgccttgtg ggaataaaat gtagaaatgt gaaaaaaaaa aaaaaaaa 238
<210> 149
<211> 124
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Mif 3'-UTR
NM_010798.2
<400> 149
gtcctggccc cacttacctg caccgctgtt ctttgagcct cgctccacgt agtgttctgt 60
gtttatccac cggtagcgat gcccaccttc cagccgggag aaataaatgg tttataagag 120
acca 124
<210> 150
<211> 135
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Cox6b1 3'-UTR
NM_025628
<400> 150
cctggctccg cccacctctc ctctgttctt tgtctttctc cccggataga aaagggggac 60
ctcagcatat gatggtcctt accctgggac cctgaatcat gatgcaacta ctaataaaaa 120
ctcactggaa aagtt 135
<210> 151
<211> 267
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠RIKEN cDNA2900010J23 (Swi5) 3'-UTR
NM_175190
<400> 151
gcagcttctt ggagattttc atctacagcc cacagggaca ggaggatggg ggcataaaag 60
gcagagtcta gacagtatgt tcatatggtt ttcagatttt aaaagatgct agaagccctc 120
caaagtttgg ggtgggttct agagaagagg agtattggga ggggtgggta ttgtcaatgt 180
taaggttcct aaacatactt gtgagtaggt gtgtgtggtt gtcccttttg ttaataaaca 240
tatgagcagt caaaaaaaaa aaaaaaa 267
<210> 152
<211> 160
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Sec61g 3'-UTR
NM_011343.3
<400> 152
gtccttctca tcatgggacg agtgagccag agcgggggaa agggcatgaa gtaaagcgtt 60
gcctgaatgc tgtgtggtgt tttgtttctt cctccttcct atgaggtttt ctacttctca 120
attaaaataa tttcaaaata aacacttttt ccataacaga 160
<210> 153
<211> 62
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠2900010M23Rik 3'-UTR
BC_030629
<400> 153
ccgtggggtc tgatactcat caataaaact gcctggtttc tcccacaaaa aaaaaaaaaa 60
aa 62
<210> 154
<211> 338
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Anapc5 3'-UTR
Anapc5-201 ENSMUST00000086216
<400> 154
ccaggactcc ctgcttgatg gtgtgcattt aggggtgggt cattacatgc tatcttgtca 60
ataaactgtt ctgatcagtt tgtctgaagt gggttttttt ttatttttct gggttgaatt 120
gtcagtatct ttgttaagaa ctgtgtatct aggggctgga gagatggctt agcagttaag 180
agcactaact gttcttctaa aggacctggg ttcaattcct agcaccctca tgacagctca 240
cagctgtctg taactcctgt tccagggact ctgacaccct caggcagaca taaaagcagt 300
caaaacaccg atgtacataa aattaaaata aattattt 338
<210> 155
<211> 71
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Mars2 3'-UTR
BC132343.1
<400> 155
gaactcagct cttactgact ggtagtaaaa gatcaaatgt attctttttg cgtttttaag 60
taaagtcatg c 71
<210> 156
<211> 176
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Phpt1 3'-UTR
NM_029293
<400> 156
agctctgccc caccccccac cccccggact aagtcaggtc tctgctcttg ctgtgttctg 60
ttttgagggg ctggccctgt gctttccttt tgtaccttag gcagcatagc acctgccagg 120
ccttagaggc cagaccaatc tggtccatag gaattaaaag cattgatatg cctact 176
<210> 157
<211> 66
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Ndufb8 3'-UTR
NM_026061
<400> 157
ggaggcttga tgggcttttt gccctcgttc ctagaggctt aaccataata aaatccctaa 60
taaagc 66
<210> 158
<211> 170
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Pfdn5 3'-UTR
NM_027044
<400> 158
gagtgcactg cagaaatgaa gcagagtgag ggacccttct tcaaggggcc tgggactttt 60
tccggcaatg gcctcctggg aaagtggcct gggaagagag tgttttgtgt ttaatgttaa 120
taaatgtgac cgctgcgcaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 170
<210> 159
<211> 278
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Arpc3 3'-UTR
NM_019824
<400> 159
gaggagcctg ggcagcacca tcacgtggag acacatcata ggacacacag gccaatgtgt 60
ctgttcatac ctaccgtatc aaggagagaa gagagcctgt ctttgctgga aaagctcttg 120
gtcaagaatt gggagggtgg gtgttgggcg atttcgattt ttggcagttt taagctggta 180
cttaatatat aataaatgtc actgcttatg ttagacattg aattaaaaca tttttgagaa 240
aaagctttaa aaaaaaaaaa aaaaaaaaaa aaaaaaaa 278
<210> 160
<211> 58
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Ndufb7 3'-UTR
NM_025843
<400> 160
ggattacccg ccagcctgtg gacctatcag tgaaataaaa gctttgggtc acctgcct 58
<210> 161
<211> 51
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Atp5h 3'-UTR
NM_027862
<400> 161
agcagcctgg gacggagccc cggccgacat gaaataaaac atttaaatag t 51
<210> 162
<211> 80
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Mrpl23 3'-UTR
NM_011288
<400> 162
cctatgacag caggatttgg accacagacc ctagtgagca cagtggttct gacaagccca 60
aataaaaatt ctttgtggag 80
<210> 163
<211> 387
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Tomm6 3'-UTR
NM_025365.3
<400> 163
ccagagaatg gaactcctgt gtattcagac tttccaaaga cagcctactg tctgtgacca 60
caagatccta cctgagtggc agctgaagtt gactccctct ccttgcctga accccccccc 120
actgcccccc catcccccag tgtcggctga gatgttgcct ctgcacggtt ctgtgtgcag 180
ttcccaactt tctgcagaag atggtccttg cccttgtcct gaagagtagt aatggttctt 240
gaaaaagatt tcaaataaag cctgcacata aaagacaggt attttattct tttaataaga 300
aacttattac aaaaacaagg tgtaaaaagt ccgcttacaa aaatcaaata aacatgactt 360
gtatttcaaa aaaaaaaaaa aaaaaaa 387
<210> 164
<211> 327
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Tomm6 3'-UTR
Tomm6-002 ENSMUST00000113301
<400> 164
ccaggtgaga gcagttctcc tgtgtttccc cgtttctgat gctgttatct gcttacagag 60
aatggaactc ctgtgtattc agactttcca aagacagcct actgtctgtg accacaagat 120
cctacctgag tggcagctga agttgactcc ctctccttgc ctgaaccccc ccccactgcc 180
cccccatccc ccagtgtcgg ctgagatgtt gcctctgcac ggttctgtgt gcagttccca 240
actttctgca gaagatggtc cttgcccttg tcctgaagag tagtaatggt tcttgaaaaa 300
gatttcaaat aaagcctgca cataaaa 327
<210> 165
<211> 273
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Tomm6 3'-UTR
<400> 165
ccagagaatg gaactcctgt gtattcagac tttccaaaga cagcctactg tctgtgacca 60
caagatccta cctgagtggc agctgaagtt gactccctct ccttgcctga accccccccc 120
actgcccccc catcccccag tgtcggctga gatgttgcct ctgcacggtt ctgtgtgcag 180
ttcccaactt tctgcagaag atggtccttg cccttgtcct gaagagtagt aatggttctt 240
gaaaaagatt tcaaataaag cctgcacata aaa 273
<210> 166
<211> 631
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Mtch1 3'-UTR
NM_019880
<400> 166
cctaagctgc ccgaccaaac atttatgggg tcttagccta cccctggtga ggacccatca 60
tctcagatgc ccaagggtga ctccagccca gcctggcttc atgtccatat ttgccatgtg 120
tctgtccaga tgtgggctgg tggaggtggg tcacctggga cctggggaag cctgggggag 180
cagtgttggg gtggcatccc cttcctgcct agaggtactg gagtccatct tgtactcagg 240
cagaggcagg ctgcagaggc aaacgtcact cagtggcaag gcttccctgc acctctagcc 300
cagctcatcc tgccagtcag ccagaagcac ccccgccccc cacttcctgc tttgtaaatt 360
gggcgccatc acacctgggc catgggaggc tggagctatg ttcccaacac taattttctt 420
atacaagggt ggtgccttct cctgaatagg aaatcatgtt ctcctcagac catcccctca 480
tctgcttgtc tgtgctggtg acgccaggtg tgagggttca gtcactgtgc tgggtgcgaa 540
tacgcacagg ttacataggc cgacatctag tcctcccctc gtggtaagat agacccatct 600
cctcgaataa atgtattggt ggtgatttgg a 631
<210> 167
<211> 158
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Pcbd2 3'-UTR
NM_028281
<400> 167
tctgcgcctg ccttgtctgc agcgttgttt gcaagccact tatgttaata aattgtcata 60
aagtagttca tagttacatg tatacattgt tgtatgattg atgctcaaat acagaatgat 120
ttgaagccaa aaaaaaaaaa aaaaaaaaaa aaaaaaaa 158
<210> 168
<211> 93
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Ecm1 3'-UTR
NM_007899
<400> 168
gtcaccctga gcctcagagg attagatggg ggaactccgc cctactccac cctcctcgaa 60
cactcattac aataaatgcc tcttggattt ggc 93
<210> 169
<211> 458
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Hrsp12 3'-UTR
Hrsp12-001 ENSMUST00000022946
<400> 169
ctataagtag ccatgctgat gttgactccg gaggttttag aatgtctttc acactttaat 60
ttttacaaat gatgctggga agtataaaaa tgaccagagt ggttgaagtt attgtggaag 120
tgatcaaata tgtggagatt tgacattaat tggagattat tcagtatagt gactgatgtt 180
ctaatttcac ttatgttgct gggtgtgaga gaagaggtgc acagctactg agatgggaag 240
cagaaggaaa gatgggctgt tgtacatgag aaatagtaag gagcacatct acttaaatca 300
tattaatttg ctcatgtgaa atacttagtt cttatgttag atataagaaa ctaaattgaa 360
atattcaaac ttgaatagta ccaggagaac aagtggacca aaatcttata cagataatat 420
tactttaatt gaaataaaaa atagatgtgt aactttcc 458
<210> 170
<211> 183
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Mecr 3'-UTR
NM_025297
<400> 170
ttgctccaga ggaccaggag gaaagcagga gaggcaagac tggctgtctg ctggcccctc 60
catgagaacc ccagccttcc cagactgcct cacccatatt gtctcttcct accaggaggg 120
tgggggacca actctaggct ccctaataaa cccttaactt cccgagtgga ggatgaagag 180
tac 183
<210> 171
<211> 120
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Uqcrq 3'-UTR
NM_025352
<400> 171
acggcctgca cctgggtgac agtcccctgc ctctgaaaga cccttctctg ggagaggaat 60
ccacactgta gtcttgaaga caataaacta cttatggact tccctttgaa aaaaaaaaaa 120
<210> 172
<211> 511
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Gstm3 3'-UTR
NM_010359
<400> 172
gcccctgcca tgctgtcact cagagtgggg gacctgtcca tactgcggat cctgcaggct 60
ctgggtgggg acagcaccct ggccttctgc actgtggctc ccggttctct ctccttcccg 120
ctcccttctg cagcttggtc agccccatct cctcatcctc accccagtca agcccatgca 180
gcctttattc tccccatttt tttttcacat ggccccttct tcattggtgc ccagacccaa 240
cctcacagcc cttttctgca atctgaggtc tgtcctgaac tcaggctccc tagagttacc 300
ccaatggtca acactatctt agtgccagcc ctccctagag ataccctgat ggtcaatact 360
atcttagtga cggccctccc tagagttacc ctgaaggtca atactcgagt gccagcctgt 420
tcctgtttaa ggagctgccc caggcctgtc tcatgtacaa taaagcctga aacacacttg 480
aaacacaata aacactgaac acttgctgtg a 511
<210> 173
<211> 312
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Lsm4 3'-UTR
NM_015816
<400> 173
tcactccctg cctgagccga gcccagaacg gtgggtgagg cctcagggca cctttgtgtg 60
aagccccact tggcgtctgg tccagtgaag tccctcgctg gccactgact cagtttctgg 120
aaggttccga gtctgaggtg cctgtggagc cttagatgcc ctttgaaggg ctgacttctt 180
ccaggcatgt ttgagtttca gttggagctg caggctcagc ccatggcggc tcacctgtcc 240
tttaccagcc ataccctgta catcttctgt ttgaaaaata aaagcaaaca ccatagaaag 300
aaaaaaaaaa aa 312
<210> 174
<211> 195
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Park7 3'-UTR
NM_020569
<400> 174
agcccaagcc ctgggcccca cgcttgagca ggcattggaa gcccactggt gtgtccagag 60
cccagggaac ctcagcagta gtatgtgaag cagccgccac acggggctct catcccgggt 120
ctgtatgttt ctgaaccttg ctagtagaat aaacagttta ccaagctcct gccagctaaa 180
aaaaaaaaaa aaaaa 195
<210> 175
<211> 131
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Usmg5 3'-UTR
NM_023211
<400> 175
atggattttg aaatgtctga cctcacctgt taagtcccat gcctgaagaa gctgatgtga 60
actcatcatg taatactcaa tttgtacaat aaattatgaa cccaaaaaaa aaaaaaaaaa 120
aaaaaaaaaa a 131
<210> 176
<211> 231
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Cox8a 3'-UTR
NM_007750
<400> 176
agggagcagt cttccctcat cctttgacta gaccactttt gccagcccac cttgatcatg 60
ttgcctgcat tcctggctgg ccttccccgg gatcatgtta ttcaattcca gtcacctctt 120
ctgcaatcat gacctctcga tgtctccatg gtgacaactg ggaccacatg tattggctct 180
gcttggtggg gtcccccttt gtaacaataa agtctattta aaccttgctc c 231
<210> 177
<211> 403
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Ly6c1 3'-UTR
NM_010741
<400> 177
tggtccttcc aatgaccccc acccttttcc ttttatcttc atgtgcaacc actctttcct 60
ggagtcctct agtgacaaat tatatgttat agaaggtcca atgtggggat agtgtgtgga 120
acaccctgtt tcacctttat agcccctgct gggtaagtgc ccgactcctc tctagggctt 180
tcaaatctgt acttcttgca atgccattta gttgtggatt tctattcttg gccctggagg 240
catgtggcca gcacatgcaa caggcagtat tccaaggtat tatagtatca ccatccacac 300
ataagtatct ggggtcctgc agggttccca tgtatgcctg tcaatgaccc ctgttgagtc 360
caataaaagc tttgttctcc cagccaaaaa aaaaaaaaaa aaa 403
<210> 178
<211> 309
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Ly6c1 3'-UTR
NM_001252058.1
<400> 178
actcataaaa atgctcctgc ctcggtcttc caagttctag gattgcaagt ctgacttcaa 60
catgccttac agacaactct gggacatcca ggcctagtgg catgttgccc agatatgggg 120
atgctctgtg gcccctgcat aagaagtgag tcactccctg atttcttgca gactctcaaa 180
gaaggaaact aaagacccgt cagtgccttt ctttctgccc tgctggtgtg ccaatcaggg 240
atcctaacat cagggagagg acttcctgtt gcagcgaaga cctctgcaat gcagcagttc 300
ccactgcag 309
<210> 179
<211> 802
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Cox7b 3'-UTR
NM_025379
<400> 179
tcgtgccagc tggtacaata atcaaggaat tgtttaaaac caacttataa gtgaatgcca 60
agtcaaagaa tcatgtactc attatactat ggcagattga agaacaaata aagaaataaa 120
gtaccttaac cttcattcta ggctttgttt ttttcctttg taaatgaagc ccaagcatgg 180
tgacttctca tttatttaag ctgtattgtc tcttaaaatg gctttttacc ctatgaggtg 240
gtatgaggga aatctatgat caggagggca cctttatagt aagctgaaat tacagagaat 300
gaagaaataa gcacagagct gttttaggag cccactgggt cattggccat ataggttatg 360
cttactgccc tctacctcgt ggttatattt ggaattgcca ttagctccct tctgcttaga 420
gactggactg tcaccaaacc caaggggata gtgatcctgt aatgatcctg tgtgaactag 480
gtttgctaaa gactaccacc tccttacact gtatggcata ttcatctgaa ataggtgcta 540
atttttcagc ataatcctta atctttagga tctgtcatac ttcctagtaa tttaactgtt 600
gctgaagaaa taaaggctat ctgttaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 660
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 720
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 780
aaaaaaaaaa aaaaaaaaaa aa 802
<210> 180
<211> 231
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Ppib 3'-UTR
NM_011149
<400> 180
agagcctggg ggacctcatc cctctaagca gctgtctgtg tgggtcctgt caatccccac 60
acagacgaag gtagccagtc acaaggttct gtgccaccct ggccctagtg cttccatctg 120
atggggtgac cacacccctc acattccaca ggcctgattt ttataaaaaa ctaccaatgc 180
tgatcaataa agtgggtttt ttttatagct tgaaaaaaaa aaaaaaaaaa a 231
<210> 181
<211> 205
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Bag1 3'-UTR
NM_009736
<400> 181
agtgcagtgg agagtggctg tactggcctg aagagcagct ttacagccct gccctctctg 60
gaacagaagt cgcctgtttc tccatggctg ccaggggcaa ctagccaaat gtcaatttcc 120
ctgctcctcc gtcggttctc aatgaaaaag tcctgtcttt gcaacctgaa ttagacttgt 180
gttttctcaa aaaaaaaaaa aaaaa 205
<210> 182
<211> 140
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠S100a4 3'-UTR
S100a4-201 ENSMUST00000001046
<400> 182
agactcctca gatgaagtgt tggggtgtag tttgccagtg ggggatcttc cctgttggct 60
gtgagcatag tgccttactc tggcttcttc gcacatgtgc acagtgctga gcaaattcaa 120
taaaaggttt tgaaactatt 140
<210> 183
<211> 374
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Bcap31 3'-UTR
NM_012060
<400> 183
aggcttggtg tttccctgcc tgccgctggc ttctacctga cccatgctta ctgcttcctt 60
ggagcccaga ctatccctct ggtacttggg tttattccct acttccccaa ttttcttcca 120
tggcttatag atcattattt tggcaccatt acacatactg ctcttatacc aaaagggacc 180
tgattgttgt ttattcagag tacttttgcc actgttctgc ctggctaggg cactttccac 240
tcctggaagt gtagaaaagc actggtgacc tggcctgcag tttgaacccc tttttatttt 300
gcaatgtacc ctaaaggagg ctgctgtgaa gcaggtcaac tgttttatcc tgaggggaat 360
aaatgttgtt atgt 374
<210> 184
<211> 126
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Tecr 3'-UTR
NM_134118
<400> 184
gcagctcctc acggctctgc ccagtaatac tctccacccc tcactgcccc tgtcctgatg 60
tgtggctggc catggctctc cagcagcaac aataaaacct gcttacccaa aaaaaaaaaa 120
aaaaaa 126
<210> 185
<211> 171
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Rabac1 3'-UTR
NM_010261
<400> 185
agtgtcctcc aggacctgcc ggcctctcct gccggccggc tgtcccatct ctgtctgttc 60
tcgtcctacc tggccttgct gctcagctcc gagccttcca cctgaggcct caaacccagg 120
gaggggcttt tgtctttgga aataaagctg ttacaattgc tatttggcca a 171
<210> 186
<211> 144
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Robld3 3'-UTR
NM_031248 (Lamtor2)
<400> 186
cagcgtgatg gaggctggag tagaaaaggg atgatgatct ggagggaggg gcggggccct 60
agaaacgcca tatcgggcga ggtacaggaa gggggggttg cttttttctg aataaatttt 120
caactcttaa aaaaaaaaaa aaaa 144
<210> 187
<211> 80
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Sod1 3'-UTR
NM_011434
<400> 187
acattccctg tgtggtctga gtctcagact catctgctac cctcaaacca ttaaactgta 60
atctgaaaaa aaaaaaaaaa 80
<210> 188
<211> 262
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Nedd8 3'-UTR
NM_008683
<400> 188
agaaacttgg ttccgtttac ctccttgccc tgccaatcat aatgtggcat cacatatcct 60
ctcactctct gggacaccag agccactgcc ccctctcttg gatgcccaat cttgtgtgtc 120
tactggtggg agaatgtgag gaccccaggg tgcagtgttc ctggcccaga tggcccctgc 180
tggctattgg gttttagttt gcagtcatgt gtgcttccct gtcttatggc tgtatccttg 240
gttatcaata aaatatttcc tg 262
<210> 189
<211> 257
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Higd2a 3'-UTR
NM_025933
<400> 189
gtatagccgg gtcttaaagc gccatggaaa ccattacaaa acccaggaac aacagacatc 60
cctgtcagac ttgctccctc cgtttcagac cggaccttat tgtcatttgg gtgaggaagt 120
ggccgatttt gtaactgatt tgcgcttcca ccgctgcccc ctcccgctcc caaaatccca 180
ggttcatttc agttgggttg catgcttcta tttgtgatgc gtccccttaa ttacttaata 240
aaagcttatt acacttg 257
<210> 190
<211> 268
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Trappc6a 3'-UTR
Trappc6a-001 ENSMUST00000002112
<400> 190
ggaccccaga ccccaggctt gcccttccct aagcttagcc tcggaatgtg gcacctgacc 60
ctgcctcact gctcaccttt gcaggtcgcc ttgaagctgg agctcacagg ctctggggag 120
gtcacatgtg cttcagacaa gggaatgaaa gggccgggag ggtcccggga ggtgggacca 180
tcccctgagt tccaagtcag catggaggga cattagggca tcacccagat gacagatgtt 240
cagtaaaggt tctttatgtg caaacaga 268
<210> 191
<211> 188
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Ldhb 3'-UTR
Ldhb-001 ENSMUST00000032373
<400> 191
ctgccagtct ctaggctgta gaacacaaac ctccaatgtg accatgaacc tttagtcttc 60
agccatgtat gtaggtcaca gtttgcttct tccctgacat gtgatatgag ctcacagatc 120
aaagcccagg cttgtttgat gtttgcacta ggagctcctg atcaaataaa gttagcaatt 180
gcagcata 188
<210> 192
<211> 112
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Nme2 3'-UTR
Nme2-001 ENSMUST00000021217
<400> 192
acatgaagaa accagaatcc ttttcagcac tactgatggg tttctggaca gagctcttca 60
tcccactgac aggatggatc atcttttcta aaacaataaa gactttggaa ct 112
<210> 193
<211> 119
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Snrpg 3'-UTR
NM_026506
<400> 193
cctgtgctca gcaagcagtg tccacatccc tccccaaagg cctgtttgat tgtgatgtag 60
aattaggtca tgtacatttt catatggaac tttttactaa ataaactttt gtgatactc 119
<210> 194
<211> 235
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Ndufa2 3'-UTR
NM_010885
<400> 194
aggtctccac tgaggactgt gagcgagagc agctgaacct gctggactga agacagtgtg 60
gggaaatgtg tgctttgggt ccttataaag cttacgctgt acagtgtccc ttcagaatgt 120
cctcttcatt accttctccc tcttactgcg caacactgag gcaaagtagt tttatataaa 180
aatactcctt tatttctcct caaaaaaaaa aaaaaaaaaa acccaccagg tgcca 235
<210> 195
<211> 196
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Serf1 3'-UTR
Serf1-003 ENSMUST00000142155
<400> 195
tgactggctt tttggaaaac ctgggtgcta ttgccagtgg gtgcatcata cgctctaaga 60
ttaaaatttc acagtgacta atcattatat gtgttataac ttgtccttat aaaactattt 120
taaactttac tcttcagcct atcttaatgt gatgttttaa gaccatcaaa aaataaagta 180
ctgaccttgc atgtaa 196
<210> 196
<211> 286
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Oaz1 3'-UTR
Oaz1-001 ENSMUST00000180036
<400> 196
gtgccagccc tgcccagtgt ccctgtgccc tctcctgggt tagtccacat gtcgtgattg 60
tgcagaataa acgctcactc cattagcggg gtgcttcttc gagctgaatg ctgtgtttgt 120
cacactcaag tgttggcttt aattctaaat aaaggtttct attttacttt tttattgctg 180
tttaagatgg tcaggtgacc tatgctatag cagtctcctt tgaagtctgg aaaaatagtg 240
tcacctcccc tggctcaaat ccaataaagt gatctcgttc attggc 286
<210> 197
<211> 418
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Ybx1 3'-UTR
Ybx1-001 ENSMUST00000079644
<400> 197
atgccggctt accatctcta ccatcatccg gtttggtcat ccaacaagaa gaaatgaata 60
tgaaattcca gcaataagaa atgaacaaag attggagctg aagaccttaa gtgcttgctt 120
tttgccctct gaccagataa cattagaact atctgcatta tctatgcagc atggggtttt 180
tattattttt acctaaagat gtctcttttt ggtaatgaca aacgtgtttt ttaagaaaaa 240
aaaaaaaaag gcctggtttt tctcaataca cctttaacgg tttttaaatt gtttcatatc 300
tggtcaagtt gagattttta agaacttcat ttttaatttg taataaagtt tacaacttga 360
ttttttcaaa aaagtcaaca aactgcaagc acctgttaat aaaggtctta aataataa 418
<210> 198
<211> 421
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Ybx1(v2) 3'-UTR
具有突变T128bpG和缺失del236-237bp
<400> 198
tttttatgcc ggcttaccat ctctaccatc atccggtttg gtcatccaac aagaagaaat 60
gaatatgaaa ttccagcaat aagaaatgaa caaagattgg agctgaagac cttaagtgct 120
tgctttttgc ccgctgacca gataacatta gaactatctg cattatctat gcagcatggg 180
gtttttatta tttttaccta aagatgtctc tttttggtaa tgacaaacgt gttttttaag 240
aaaaaaaaaa aaggcctggt ttttctcaat acacctttaa cggtttttaa attgtttcat 300
atctggtcaa gttgagattt ttaagaactt catttttaat ttgtaataaa gtttacaact 360
tgattttttc aaaaaagtca acaaactgca agcacctgtt aataaaggtc ttaaataata 420
a 421
<210> 199
<211> 798
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Sepp1 3'-UTR
NM_009155
<400> 199
attatttaaa acaaggcata cctctcccca actcagtcta aagacacaat ttcattttga 60
gaatgtttac agcccattta attaatcagt gaactaaaag tcatagaaat tggatttgtg 120
caaatgtaga gaaatctacc atattggctt ccaaaattta aaaattttat gccacagaac 180
atttcatcca aatcagattt gtacaatagg gcacctgaaa agtgactgca gcctttggtt 240
aatatgtctt tctttttcct ttttccagtg ttctagttac attaatgaga acagaaacat 300
aaactatgac ctaggggttt ctgttggata gcttgtaatt aagaacggag aaagaacaac 360
aaagacatat tttccagttt tttttttctt tacttaaact ctgaaaacaa cagaaacttt 420
gtcttcctac tcttacattc taaaccgatg aaatctttaa cagattacac tttaaatatc 480
tactcatcat tttctctctc agagtcctag cttgagttgc actgcatgta tctgtgcatc 540
ttgttctctt catttaatgc tgtactgttc tgctgagctc tgagggacta tcttgagaga 600
tgtaatggaa ggaaagcgtg gtgttaatct gcgtactgct taagacagta tttccataat 660
caatgatggt ttcatagaga aactaagtcc tatgaacctg acctctttta tggctaatac 720
gactaagcaa gaatggagta cagaattaag tggctacagt acacacttat caaaataaat 780
gcaattttaa aacctttc 798
<210> 200
<211> 390
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Gaa 3'-UTR
Gaa-001 ENSMUST00000106259
<400> 200
gagagtccgt cgtttacaga ggcctccagg gaggcagagg gagcttgagc tggctctggc 60
tggtggctcc tgtaaggacc tgcgtcctgc tctcctgaca catctttgag cttttcccac 120
cgtgttactg catgcgcccc tgaagctctg tgttcttagg agagtgaggc tcgcctcacc 180
tgccccaccc cagctgtctg tccctcacct ggcactagag aatgtggagc tcggcgtggg 240
gacatcgtgt ctgcaccaac atcaggctgt gcagccactg cagccgcaac cctgcagaga 300
cagagctggt gccttcacca ggttcccaag actcgagaaa cttactgtga agtgtactta 360
cttttaataa aaaggatatt gtttggaagc 390
<210> 201
<211> 481
<212> DNA
<213> 人工序列
<220>
<223> 智人ACTR10 3'-UTR
ACTR10-002 ENST00000254286
<400> 201
aagtttgatt aaaaatcaac cttgcttcat atcaaatatt taaccaatta taagcaaatt 60
gtacaaagta tgtaggatgt tttgttatag aggactatag tggaagtgaa agcattctgt 120
gtttactctt tgcattaata tataattctt ttgactttgt ttctcttgtg tagtggtaaa 180
atggtagctg gtgcttattg agatttgctg tatttatatc aataaagtat agtaaagcag 240
tttgattttg gaagtttgtt atgtggcttt tttttttttt ttttttttga gacggagtct 300
cgctctgtca cttaggctgg agtgcagtgg cacaatctct actcattgca agctccgcct 360
cccgggttta cgccattctg tctcagcctc ctgagtagct gggactatag gcatacgcca 420
ccccgcccgg ctaatttttt gtatatttag tagagacggg gtttcaccat gttagccagg 480
a 481
<210> 202
<211> 347
<212> DNA
<213> 人工序列
<220>
<223> 智人PIGF 3'-UTR
NM_173074
<400> 202
gtaacttaat cctgacaacc gtagtgcaag gtatggccca tctcctgtac gcttggagcg 60
acctttggct acgtggctgg ccttgttatt tcaccactct ggatatactg gaatagaaag 120
caacttacat acaagaacaa ttaactggag caaagggaga tatttctttg tgcagattct 180
gtaagggctg ggcagaaatg tgtatggtca aagccaagca gttccattta cagctctgtt 240
ttttacgtag ttacaacatg atgtgattgt agctttttaa actatgaaac ccctgagaga 300
ttgtaccttc tagttgaaat aaagtattta taatagattg tggcttc 347
<210> 203
<211> 233
<212> DNA
<213> 人工序列
<220>
<223> 智人PIGF 3'-UTR
NM_002643.3
<400> 203
ctggagcaaa gggagatatt tctttgtgca gattctgtaa gggctgggca gaaatgtgta 60
tggtcaaagc caagcagttc catttacagc tctgtttttt acgtagttac aacatgatgt 120
gattgtagct ttttaaacta tgaaacccct gagagattgt accttctagt tgaaataaag 180
tatttataat agattgtggc ttcaaaaaaa aaaaaaaaaa aaaaaaaaaa aaa 233
<210> 204
<211> 116
<212> DNA
<213> 人工序列
<220>
<223> 智人MGST3 3'-UTR
MGST3-001 ENST00000367889
<400> 204
agaattatag gggtttaaaa actctcattc attttaaatg acttaccttt atttccagtt 60
acattttttt tctaaatata ataaaaactt acctggcatc agcctcatac ctaaaa 116
<210> 205
<211> 913
<212> DNA
<213> 人工序列
<220>
<223> 智人SCP2 3'-UTR
NM_001193599
<400> 205
agaactccct ttggctactt ttgaaaatca agatgagata tatagatata tatccataca 60
ttttattgtc agaatttaga ctgaaactac acattggcaa atagcgtggg atagatttgt 120
ttcttaatgg gtgtgaccaa tcctgttttt cctatgctct gggtgaatag agcctgatgg 180
tatactactg ctttgcggaa ttgcatacaa ctgtgcatta caaagttaat atggtaatta 240
tggtctgggg taaaattgag tttcagaata aaattaggaa cagtaaaatc caaagaacta 300
tgtaaacaaa aaagcttttg ttttgcttac aaagtatatt taaggattat tctgctgaag 360
attcagttta agagttttcc ttgggagaac taagtaagaa acacaatgcc aacagctggc 420
cagtaattag tgttgtgcac ttcatgtcat taatcaattt ctcaatagtt cttaaaatta 480
gtgagattaa aaatctaaaa attttgcatt tcatgctatc agaaacagta ttttcttccc 540
aaatcaaaat aaaagaaata tgatcagagc ttgaacacag gcttattttt aaaataaaaa 600
tatttttaac atgggtttcc ttattgaaaa atcagtgtat tagtcataaa acaccatcat 660
taagaataat tgaacaataa agtttgcttt cagatgcagt tttcaaatta taatctcatt 720
tcaatttata acgttctcag tcctttgtta taattttcct ttttcatgta agtttaatta 780
tctgcattta tcttttttcc tagtttttct aatactaatg ttatttctta aaattcagtg 840
agatatagga taaaataatg ctttgagaag aatgtttaat agaaaattaa aataactttt 900
tctggcctct ctt 913
<210> 206
<211> 409
<212> DNA
<213> 人工序列
<220>
<223> 智人SCP2 3'-UTR
SCP2-015 ENST00000435345
<400> 206
agaactccct ttggctactt ttgaaaatca agatgagata tatagatata tatccataca 60
ttttattgtc agaatttaga ctgaaactac acattggcaa atagcgtggg atagatttgt 120
ttcttaatgg gtgtgaccaa tcctgttttt cctatgctct gggtgaatag agcctgatgg 180
tatactactg ctttgcggaa ttgcatacaa ctgtgcatta caaagttaat atggtaatta 240
tggtctgggg taaaattgag tttcagaata aaattaggaa cagtaaaatc caaagaacta 300
tgtaaacaaa aaagcttttg ttttgcttac aaagtatatt taaggattat tctgctgaag 360
attcagttta agagttttcc ttgggagaac taagtaagaa acacaatgc 409
<210> 207
<211> 591
<212> DNA
<213> 人工序列
<220>
<223> 智人HPRT1 3'-UTR
HPRT1-001 ENST00000298556
<400> 207
gatgagagtt caagttgagt ttggaaacat ctggagtcct attgacatcg ccagtaaaat 60
tatcaatgtt ctagttctgt ggccatctgc ttagtagagc tttttgcatg tatcttctaa 120
gaattttatc tgttttgtac tttagaaatg tcagttgctg cattcctaaa ctgtttattt 180
gcactatgag cctatagact atcagttccc tttgggcgga ttgttgttta acttgtaaat 240
gaaaaaattc tcttaaacca cagcactatt gagtgaaaca ttgaactcat atctgtaaga 300
aataaagaga agatatatta gttttttaat tggtatttta atttttatat atgcaggaaa 360
gaatagaagt gattgaatat tgttaattat accaccgtgt gttagaaaag taagaagcag 420
tcaattttca catcaaagac agcatctaag aagttttgtt ctgtcctgga attattttag 480
tagtgtttca gtaatgttga ctgtattttc caacttgttc aaattattac cagtgaatct 540
ttgtcagcag ttccctttta aatgcaaatc aataaattcc caaaaattta a 591
<210> 208
<211> 283
<212> DNA
<213> 人工序列
<220>
<223> ACSF2
Homo sapiens
<400> 208
ataaagcagc aggcctgtcc tggccggttg gcttgactct ctcctgtcag aatgcaacct 60
ggctttatgc acctagatgt ccccagcacc cagttctgag ccaggcacat caaatgtcaa 120
ggaattgact gaacgaacta agagctcctg gatgggtccg ggaactcgcc tgggcacaag 180
gtgccaaaag gcaggcagcc tgcccaggcc ctccctcctg tccatccccc acattcccct 240
gtctgtcctt gtgatttggc ataaagagct tctgttttct ttg 283
<210> 209
<211> 555
<212> DNA
<213> 人工序列
<220>
<223> 智人VPS13A 3'-UTR
NM_033305
<400> 209
aattcatatg ttctttattt tacttggaat gtttcattaa catgttttgt atgacttata 60
ccataatgcc catatgtcca tttataggga ggtaaaacac attttctttt aaaatgtttt 120
cctacacatt ttcataaagc aaaataattg tattatttaa gcacagaaaa aaatgtatct 180
tacatccaaa gtagggaggg catccaacat attatagatt tgcttttata tattttatag 240
ctttgtattg catagtttgt ctttaagagt tcaagttaga cttaaatata attttgatgt 300
tcactggttt tattttaaat tgccttctta tttgttagca aaatgccttt ttttaatggt 360
ctctgtaaat tttctgggct ttaatgtaat gccactgtgt aaaaaaaaag gaagaaaata 420
gtaatagcca tttaatgttt tatatttatc attttaaaga tatttttgtc aaatttcttt 480
taataataat aaacatatgt aatctaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 540
aaaaaaaaaa aaaaa 555
<210> 210
<211> 724
<212> DNA
<213> 人工序列
<220>
<223> 智人CTH 3'-UTR
NM_001190463.1
<400> 210
tattccagag ctgctattag aagctgcttc ctgtgaagat caaatcttcc tgagtaatta 60
aatggaccaa caatgagcct ttgcaaaatt ttcaagcgga aattttaagg cacctcatta 120
tctttcataa ctgtaatttt cttagggatc atctctgtta aaaagttttc tgtatgtcat 180
gttataatta caggtcaatt ctgttaatat ctttttgtta attttgctct atgtttgcct 240
ctgaaggagg tgagatttgt gctactttgg gagattatgt tcttttttca tgtctaagat 300
ttattttgat catgtttata atataatggt aattcatttt tgatgttttg tgaagaattt 360
aaatttaaac gaatgttctt aaatcaagtg tgattttttt gcatatcatt gaaaagaaca 420
ttaaaagcaa tggtttacac ttagttacca taagccgaaa atcaaatact tgaaaagttt 480
actgtgaaat tctactgatt taagactata cttaatattt ttaaaaaaat aaatcagctg 540
ggcgcggtgg ctcacgcatg taatgccagc acttttggag gataaggcgg gcggatcacg 600
aggtcaggag attgagacca tcctggctag cgcagtgaaa cccccatctc tactaaaaat 660
gcaaaaaaaa ttagacggac gtggtggcgg gtgcctgtag tcccagctac ttgggaggct 720
gagg 724
<210> 211
<211> 443
<212> DNA
<213> 人工序列
<220>
<223> 智人CTH 3'-UTR
CTH-001 ENST00000370938
<400> 211
tattccagag ctgctattag aagctgcttc ctgtgaagat caaatcttcc tgagtaatta 60
aatggaccaa caatgagcct ttgcaaaatt ttcaagcgga aattttaagg cacctcatta 120
tctttcataa ctgtaatttt cttagggatc atctctgtta aaaagttttc tgtatgtcat 180
gttataatta caggtcaatt ctgttaatat ctttttgtta attttgctct atgtttgcct 240
ctgaaggagg tgagatttgt gctactttgg gagattatgt tcttttttca tgtctaagat 300
ttattttgat catgtttata atataatggt aattcatttt tgatgttttg tgaagaattt 360
aaatttaaac gaatgttctt aaatcaagtg tgattttttt gcatatcatt gaaaagaaca 420
ttaaaagcaa tggtttacac tta 443
<210> 212
<211> 77
<212> DNA
<213> 人工序列
<220>
<223> 智人CTH 3'-UTR
CTH-002 ENST00000346806
<400> 212
tattccagag ctgctattag aagctgcttc ctgtgaagat caaatcttcc tgagtaatta 60
aatggaccaa caatgag 77
<210> 213
<211> 286
<212> DNA
<213> 人工序列
<220>
<223> 智人NXT2 3'-UTR
NXT2-004 ENST00000372107
<400> 213
aggggcaaaa gtccattctc atttggtcca ttagttccag caattgaaat ttatgtgaat 60
tattttgatt gtagaagcac tataatatgt gctgaaacta aatttcttta atattttcta 120
ttcctgtcag caccttttct agcagctgcc agtttggagc attgccctct aagagcttta 180
aaactatttt tttacatgcc ttatatacat tccactaatg acattcttat aataatatta 240
aacacatgat cttggtacta acatactcac tgtgaaccca gcctat 286
<210> 214
<211> 121
<212> DNA
<213> 人工序列
<220>
<223> 智人MGST2 3'-UTR
NM_002413
<400> 214
ctttttctct tccctttaat gcttgcagaa gctgttccca ccatgaaggt aatatggtat 60
catttgttaa ataaaaataa agtctttatt ctgtttttct tgaaaaaaaa aaaaaaaaaa 120
a 121
<210> 215
<211> 582
<212> DNA
<213> 人工序列
<220>
<223> 智人MGST2 3'-UTR
NM_001204366.1
<400> 215
ctttttctct tccctttaat gcttgcagaa gctgttccca ccatgaaggc ttgaagccac 60
agtgcatggc cagaaccagc cagacctttg gagttcaaga actcgagagg tgggtgaaaa 120
ctgccattgc ctccacagac tgtcttctcc gtggaaagaa gacctgagtc accagggctg 180
ggaaacctgc accactgaga cgagcacagc ctctgccggc atgcaagtgg ccgctgtcag 240
gacacatgga ctgaaagtgg tttgtcagct gctccattag gtttttttta cccatatgtt 300
tgctaccttt ctttccttga tttaaaaata gggaggggga gcagtctcag ctgtcttcag 360
ctgctaggga gatttttttc cccctcctga gctactgttt cccccaaccc gagcctttct 420
ctcttattgt acccaccctt tctgatgaag tcatcaaagc aaagattgca taactgatgc 480
ataggcctat cttgtgttat actgggagac aggccaatgt ttccattaat agacaagagc 540
accaccacgc tgccaaatgg agctctctgc tgcaaccact ac 582
<210> 216
<211> 37
<212> DNA
<213> 人工序列
<220>
<223> 智人C11orf67 3'-UTR
AAMDC-005 ENST00000526415
<400> 216
tggagcctta agaggagaat aaatcactaa gtgccta 37
<210> 217
<211> 266
<212> DNA
<213> 人工序列
<220>
<223> 智人PCCA 3'-UTR
NM_000282
<400> 217
aggatttata acctttcagt catcacccaa tttaattagc catttgcatg atgctttcac 60
acacaattga ttcaagcatt atacaggaac acccctgtgc agctacgttt acgtcgtcat 120
ttattccaca gagtcaagac caatattctg ccaaaaaatc accaatggaa attttcattg 180
atataaatac ttgtacatat gatttgtact tctgctgtga gattccctag tgtcaaaatt 240
aaatcaataa aactgagcat ttgtct 266
<210> 218
<211> 142
<212> DNA
<213> 人工序列
<220>
<223> 智人GLMN 3'-UTR
NM_053274
<400> 218
aagttccatt tcctaaataa aaactaataa aatatagtac tttccattat gattcattta 60
atacctttat aaaaaatttt tctgtaaaaa tttactgctt gaaaaataaa tgtagctttt 120
ctcatttatc aaaaaaaaaa aa 142
<210> 219
<211> 276
<212> DNA
<213> 人工序列
<220>
<223> 智人DHRS1 3'-UTR
NM_001136050
<400> 219
ccctcctggt ctgacactac gtctctgctt gtcttctcat ttggacttgg tggttcgtcc 60
tgtctcagtg aaacagcagc ctttcttgtt tacccatacc cttgatatga agagaagccc 120
tctgctgtgt gtccgtggtg agttctgggg tgcgcctagg tcccttcttt gtgccttggt 180
tttccttgtc cttcttttta ctttttgcct tagtattgaa aaatgctctt ggagctaata 240
aaagtctcat ttctctttca aaaaaaaaaa aaaaaa 276
<210> 220
<211> 450
<212> DNA
<213> 人工序列
<220>
<223> 智人PON2 3'-UTR
PON2-001 ENST00000433091
<400> 220
attgtacttt tggcatgaaa gtgcgataac ttaacaatta attttctatg aattgctaat 60
tctgagggaa tttaaccagc aacattgacc cagaaatgta tggcatgtgt agttaatttt 120
attccagtaa ggaacggccc ttttagttct tagagcactt ttaacaaaaa aggaaaatga 180
acaggttctt taaaatgcca agcaagggac agaaaagaaa gctgctttcg aataaagtga 240
atacattttg cacaaagtaa gcctcacctt tgccttccaa ctgccagaac atggattcca 300
ctgaaataga gtgaattata tttccttaaa atgtgagtga cctcacttct ggcactgtga 360
ctactatggc tgtttagaac tactgataac gtattttgat gttttgtact tacatctttg 420
tttaccatta aaaagttgga gttatattaa 450
<210> 221
<211> 277
<212> DNA
<213> 人工序列
<220>
<223> 智人NME7 3'-UTR
NM_013330
<400> 221
tggtgtggaa agtaaagaag tcacaggttg ggacatttag acaagagtga atcacacacg 60
aggaatgtgt tcattctttt attgtccgtt gttttaacct gactgaatac aagatcaaca 120
agagcactgt actcctggca attattacat atgttagaac atggattttg cactgtagac 180
aacatttaac accagtctat ggggtactgc attgcttttt ataaagttca aaataaagat 240
ttattttcaa acaaaaaaaa aaaaaaaaaa aaaaaaa 277
<210> 222
<211> 163
<212> DNA
<213> 人工序列
<220>
<223> 智人ETFDH 3'-UTR
NM_004453
<400> 222
actgcagcta gccagtttct ttcaagtatg gcaagctaac gttaaaatgt ttagagatta 60
acagatttca gaatgtcttt ctgcatatta ctgaacagaa tagtcacaaa atgattatca 120
aataaaaatt ttatactata tgtaagattg tcccataaag aaa 163
<210> 223
<211> 275
<212> DNA
<213> 人工序列
<220>
<223> 智人ALG13 3'-UTR
BC117377
<400> 223
gatccagcag tatgaagtat tcttgcactg ccattttctt gctgtttttg tttttaaaaa 60
gtattttatg ttagtggtta aatgatttag gtgattagtg tttactattg tatttgtctt 120
taaaattatt ttatcttttg atttaaaata gtactttaaa attaaggggt attattttgg 180
gctgtgacta aggaaattga gatggatgta caactagccc catattgagc atacttcatt 240
gtattcagct gttttcctgt cagccatttg tcagc 275
<210> 224
<211> 664
<212> DNA
<213> 人工序列
<220>
<223> 智人ALG13 3'-UTR
NM_001099922.2
<400> 224
gatccagcag tatgaagtat tcttgcactg ccattttctt gctgtttttg tttttaaaaa 60
gtattttatg ttagtggtta aatgatttag gtgattagtg tttactattg tatttgtctt 120
taaaattatt ttatcttttg atttaaaata gtactttaaa attaaggggt attattttgg 180
gctgtgacta aggaaattga gatggatgta caactagccc catattgagc atacttcatt 240
gtattcagct gttttcctgt cagccatttg tcagctttat attagctgat ggtaccaatt 300
gataaaatga atataaagta tttcattggt tcaaaaatca cacatcatat taaaccatgc 360
agaattggag taacttccac ttttttctag aaagtaaaac caagagcctt tgcttctgga 420
taactcactt aatattaaat taaagagctc ttcacgtttc ttgagaatta tctgaagcca 480
gttgcattct gtgatatcag ttttgaaggc acatggttct ctgctttaga tttatcccat 540
atgctattgt ttaatactgg atgtatgtaa gtgttttact gcactgtatt gaattggtgt 600
cttttgcaca gttagcagta aataaaaatt agcatttaaa attgccaaaa aaaaaaaaaa 660
aaaa 664
<210> 225
<211> 640
<212> DNA
<213> 人工序列
<220>
<223> 智人DDX60 3'-UTR
DDX60-001 ENST00000393743
<400> 225
aaacaaagtc tatgcaaacc acttaaaaat aattccatag tagtttttca ggtcacgttt 60
ttgattctta tgcttcttgc cagaaataca ttatgataaa gtggaaatac attacgatga 120
agtggaaaga gcaaacactt tggaatcaaa cagagttgca atcaaacctg ccatgttctg 180
tcatgaatac tcacaaatta tttagtatac ctgaatcttg gtttcttttt ataactgagt 240
aataatggtt acatctcagg tagtttgagg attgactaaa aaaatgcgag aatgttgtat 300
gtgactgaat aacaattttt actctgcgaa gccaaagtaa atataatatt atcagtaact 360
ttatccccag tgtcagtatt tataaaatgt ttattaaggc tagaaaaaat gaatacaata 420
tcctgaaggt gaaatatatt ctcttcaatt agcataaata tgatttacat aagttagcta 480
tacagctatt gagatagtac tttctagtaa acttaaacta ctttttaaac atacattttg 540
tgatgattta acaaaaatat agagaatgat ttgctttatt gtaattgtat ataagtgact 600
ggaaaagcac aaagaaataa agtgggttcg atctgtttac 640
<210> 226
<211> 451
<212> DNA
<213> 人工序列
<220>
<223> 智人DYNC2LI1 3'-UTR
NM_015522.3
<400> 226
aattcatttg atgtagatga acctgttcac tggaaaatta cagcaattta ttaaaacctc 60
agtaagagca aaacaaggaa gaagattcct tatatcttct tgttagacat cttctgtgat 120
tgttatggca tattacacca atcagagaaa tagagtttta aagtagtggt ttgatattga 180
ttttataatc tctgtaaaaa tgaagataaa aagccagatt gtacaaaagt cacctgacaa 240
agactagatg aagctacaac tttaagcaag gggtagagtt gtaatagcct tcaccatcac 300
tctgtatttt acattcattt cgtttctgtc acttattcag tatcttttta tcatctgaca 360
gctaattaaa ttataaagtt gctatgatgg taacacaagt tcttcaaata caataataaa 420
tatcatcatc tggaaaaaaa aaaaaaaaaa a 451
<210> 227
<211> 606
<212> DNA
<213> 人工序列
<220>
<223> 智人VPS8 3'-UTR
NM_001009921, NM_015303
<400> 227
tgactccatg gagcctggcc caggagaacc agagatgatc ccgaggcagc tggggagagg 60
ccccgcctct ggtgggcttg gcctccacca cctcccacgc ttctgagaag aggttccaaa 120
ttgggcttct gtgcccagag cgtccacagc accattccca gtgtagactc ccagtcttct 180
ccacattgct gtcatggcgt cagttcacca gactcattga ttttgttttg cttgttaagc 240
aaaggaatgt cacatacctc tgtccagctt tttaggaaat acatttcgcc tattgcgact 300
ttttccattt accctgaagc ctagaaagta ggtggaactc acacaaatgg cattccagag 360
tctgccatac tccgtctcct ccagctgctg gataatacag aggaacttca acttctacag 420
ggaacagtgg ttggccaggc tgcagtataa ctgaagcatg ccttggagag agcagacact 480
gtgggggcca gggccatctc cctttaatgt gttcatgtta aaacctattt gagtgtaaga 540
cttgcccttt ctaacaataa atgctccgtg tttaagttct gcaggtctca aaaaaaaaaa 600
aaaaaa 606
<210> 228
<211> 360
<212> DNA
<213> 人工序列
<220>
<223> 智人ITFG1 3'-UTR
NM_030790
<400> 228
cttgccttta atattacata atggaatggc tgttcacttg attagttgaa acacaaattc 60
tggcttgaaa aaatagggga gattaaatat tatttataaa tgatgtatcc catggtaatt 120
attggaaagt attcaaataa atatggtttg aatatgtcac aaggtctttt tttttaaagc 180
actttgtata taaaaatttg ggttctctat tctgtagtgc tgtacatttt tgttcctttg 240
tggaatgtgt tgcatgtact ccagtgtttg tgtatttata atcttatttg catcatgatg 300
atggaaaaag ttgtgtaaat aaaaataatt aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 360
<210> 229
<211> 215
<212> DNA
<213> 人工序列
<220>
<223> 智人CDK5 3'-UTR
NM_004935
<400> 229
gccccgggac ccccggcctc caggctgggg cctggcctat ttaagccccc tcttgagagg 60
ggtgagacag tgggggtgcc tggtgcgctg tgctccagca gtgctgggcc cagccggggt 120
ggggtgcctg agcccgaatt tctcactccc tttgtggact ttatttaatt tcataaattg 180
gctcctttcc cacagtcaaa aaaaaaaaaa aaaaa 215
<210> 230
<211> 146
<212> DNA
<213> 人工序列
<220>
<223> 智人C1orf112 3'-UTR
BC091516
<400> 230
aacttatcac taggcagaac tgggtttgat gctttgtcaa ctgaaaatac ttatgtctgt 60
acattttcta acagatataa aacaaatttt gtaaagttga aaaaaaaaaa aaaaaaaaaa 120
aaaaaaaaaa aaaaaaaaaa aaaaaa 146
<210> 231
<211> 239
<212> DNA
<213> 人工序列
<220>
<223> 智人IFT52 3'-UTR
NM_016004
<400> 231
agaccatgcc tcttgaagct ttttctgcct cctgattctc tctttgtaaa ctattttcaa 60
attgtttttc aactccttat caaaattgtt tatacactct ttcctccatg agctctggaa 120
ggtatatgca tcttctgtaa tactcagata ggtataagat ttttcacaaa atccttatgt 180
aagatacatt ccatttttaa aaattaaatg tatggttgca tctgtctttt tatacccta 239
<210> 232
<211> 146
<212> DNA
<213> 人工序列
<220>
<223> 智人CLYBL 3'-UTR
CLYBL-003 ENST00000339105
<400> 232
tctgttaaat gaagctgtca tcaggctaaa gggtattgaa gctgcagagg gatcaacttg 60
tgcttgccag aggacgccaa tgaagtttga aacaccaaca atcagagatt ttgtttctgt 120
tcctcattaa atcatgagct tttgtg 146
<210> 233
<211> 477
<212> DNA
<213> 人工序列
<220>
<223> 智人FAM114A2 3'-UTR
FAM114A2-006 ENST00000520667
<400> 233
agaatggaga cgttttgacc tgggacttgt gacggccaag gaatgccacc ttattctggc 60
tactcctgca gaaatgaagg agtggggtta ttttagtata taaaaattca ggcaggagag 120
atggtttaaa gaggaagatt gttgccttca gtgtttgatt gaagtattca ggttctcaca 180
gtattctttc cagttgttgt aattcataaa ttatttgaaa agaaactttt gtagaaagtc 240
caagaataat aactctagat aaagattagt gggacactca ggcaaaaatg ttggtctttc 300
tttgacatgt tgcaaaatgt tatcaatttt gtcatggata taatttgcag cccatggata 360
taactggttg ataagccaga gaaaaataat ttagtgttct aaaattcatg gcatgtgtgg 420
tttattaatg ccatgtactt tctcctttct ggaataaaat ctatggcttt aagaaaa 477
<210> 234
<211> 310
<212> DNA
<213> 人工序列
<220>
<223> 智人NUDT7 3'-UTR
NM_001243661
<400> 234
tttactagag caagagacaa agaactattc acgaggattc tgtgtgtgct tattcgtaga 60
acaacaacaa tgccagctgt tggaatttga caggtgtgaa tattttttct gcagtatgta 120
gttagaatcc ttgcctcttt tccagttgcc ttctattgtc tgaaaaagta aaagccattc 180
aaaaatgaaa actatgttca tagtgttgca tattttcacc cacaatatgt taataatatt 240
tttcttacac atataataaa gaatatctgg cacatactag gcccttaata aagatttttt 300
gaatatataa 310
<210> 235
<211> 513
<212> DNA
<213> 人工序列
<220>
<223> 智人AKD1 3'-UTR
NM_001145128
<400> 235
tttacttagg tgatagcagc ctgaatctca agagttatct gaaagtgata gagggaaact 60
gagagaagta gattgaaaat ctgggcctct tggaagtact tttgcctcct gagcaaggta 120
ccatggctgc cagacttcag gtgaactcaa aggtctgcca gccaggaagg agcactctta 180
tggaaacaag ttttaataca attttaaaat gtattgctct ttgcctgaac tttgatgctt 240
taacaaaata aacattctat ttataattcc atatagaaaa gttaagtgac ttatttaata 300
aatgtattat tttccttttt aacattttca gtagaaaagt cagtctctgt taaaattact 360
cattaaatgt tagaaagctt taagacattt aacattgtta taaatgaaac caaaatatgg 420
gttatacatt ttacatacaa aactgtttgt gaactttgtg aacataagat actatcattt 480
tcccaataaa ataaatggat tttgcaacaa ctt 513
<210> 236
<211> 160
<212> DNA
<213> 人工序列
<220>
<223> 智人MAGED2 3'-UTR
NM_014599
<400> 236
gattttagat attgttaatc ctgccagtct ttctcttcaa gccagggtgc atcctcagaa 60
acctactcaa cacagcactc taggcagcca ctatcaatca attgaagttg acactctgca 120
ttaaatctat ttgccatttc aaaaaaaaaa aaaaaaaaaa 160
<210> 237
<211> 498
<212> DNA
<213> 人工序列
<220>
<223> 智人HRSP12 3'-UTR
HRSP12-001 ENST00000254878
<400> 237
gtgggcccag tgctgtgtag tctggaattg ttaacatttt aatttttaca attgatgtaa 60
catcttaatt aaccttttaa ttttcacaat tgatgacagt gtgagtttga tgaaaatatc 120
tgaagctatt atggaaatac catgtaatag ggagagttga acatgaatat tagagaagga 180
atccagttac ttttttaaat tacacctgtg tgcacctgta ttactgaata taggaaagag 240
atacccatta catagttact cagtaaacaa aagagaaata ccaggtagga aagaagagtt 300
actattcctg agaaataatc aagaacatat ttaatttaaa ctaatgatgt gaactattta 360
gttttgatgt ccgttatgtg attctgcttt tacttgagta aaattaaagt gtttaaattt 420
gagatcaagg agaagatagt ggaacaaaat gttatataga taatattttt ctaatggaaa 480
taaaataggc agatttcc 498
<210> 238
<211> 127
<212> DNA
<213> 人工序列
<220>
<223> 智人STX8 NM_004853 3'-UTR
<400> 238
tggcagtaaa gagaccacca gcagtgacac ctgccaatga cagatgcaag cccaacaccc 60
ttttggtacg caaaacctgc tctcaataaa ttcccccaaa gctctgaaaa aaaaaaaaaa 120
aaaaaaa 127
<210> 239
<211> 386
<212> DNA
<213> 人工序列
<220>
<223> 智人ACAT1 3'-UTR
ACAT1-001 ENST00000265838
<400> 239
acaacctctg ctatttaagg agacaaccct atgtgaccag aaggcctgct gtaatcagtg 60
tgactactgt gggtcagctt atattcagat aagctgtttc attttttatt attttctatg 120
ttaactttta aaaatcaaaa tgatgaaatc ccaaaacatt ttgaaattaa aaataaattt 180
cttcttctgc ttttttcttg gtaaccttga aaagtttgat acatttttgc attctgagtc 240
tatacttatc gaaatatggt agaaatacca atgtgtaata ttagtgactt acataagtag 300
ctagaagttt ccatttgtga gaacacattt atatttttga ggattgttaa aggtcaagtg 360
aatgctcttt ataggtaatt tacatt 386
<210> 240
<211> 189
<212> DNA
<213> 人工序列
<220>
<223> 智人IFT74 3'-UTR
IFT74-201 ENST00000433700
<400> 240
gtttaagtcc actgaaagtc tctaaggaag tatcctcttg ctgctaaact tggtacaagt 60
tgactaccaa aaaaaaaaaa agcttacttt tggagtttac ctaaaatttc tgaatgttat 120
aatttttgtg gcctctttta agaatgatat tttaaaatag taaatagttc aataaatggt 180
ttgcatatt 189
<210> 241
<211> 361
<212> DNA
<213> 人工序列
<220>
<223> 智人KIFAP3 3'-UTR
NM_014970
<400> 241
taaagtatct gtttccatgt gtaatctcag cttagaagaa atctgtgtgg gttgggttaa 60
ttttggatct ttgcctaata atgcatgttg atgttattgt gggtctgtgt ttgtttttat 120
ttttatatgt tgttagctgc agattaaccc cagcccctct gtcttctgtt aagtacagtt 180
gatactgaca ttgttcactc atcaaaccac atcttgatgc taagtaacat ttcccatgag 240
ccacaaaact gaatgctgaa aagctactag actggaaaac aaacactgca ttatgtatgt 300
taagtgacta atttaatttc aattaaaaag cgtaaagtga aaatgaaaaa aaaaaaaaaa 360
a 361
<210> 242
<211> 783
<212> DNA
<213> 人工序列
<220>
<223> 智人CAPN1 3'-UTR
NM_005186
<400> 242
ggcagggact cggtccccct tgccgtgctc ccctccctcc tcgtctgcca agcctcgcct 60
cctaccacac cacaccaggc caccccagct gcaagtgcct tccttggagc agagaggcag 120
cctcgtcctc ctgtcccctc tcctcccagc caccatcgtt catctgctcc gggcagaact 180
gtgtggcccc tgcctgtgcc agccatgggc tcgggatgga ctccctgggc cccacccatt 240
gccaagccag gaaggcagct ttcgcttgtt cctgcctcgg gacagccccg ggtttcccca 300
gcatcctgat gtgtcccctc tccccacttc agaggccacc cactcagcac caccggcctg 360
gccttgcctg cagactataa actataacca ctagctcgac acagtctgca gtccaggcgt 420
gtggagccgc ctcccggctc ggggaggccc cggggctggg aacgcctgtg ccttcctgcg 480
ccgaagccaa cgccccctct gtccttccct ggccctgctg ccgaccagga gctgcccagc 540
ctgtgggcgg tcggccttcc ctccttcgct ccttttttat attagtgatt ttaaagggga 600
ctcttcaggg acttgtgtac tggttatggg ggtgccagag gcactaggct tggggtgggg 660
aggtcccgtg ttccatatag aggaacccca aataataaaa ggccccacat ctgtctgtga 720
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 780
aaa 783
<210> 243
<211> 88
<212> DNA
<213> 人工序列
<220>
<223> 智人COX11 3'-UTR
NM_001162861
<400> 243
agagttggca cctttgatgt ggtagtgagc tgatcatcca ctttcttcta aaataaagag 60
aagaaaatgg ccagtaaaaa aaaaaaaa 88
<210> 244
<211> 77
<212> DNA
<213> 人工序列
<220>
<223> 智人GLT8D4 3'-UTR
BC127733
<400> 244
atattttgtc ttgttgcaag tcaattaggt gtcttgtgaa caaggaaata ctaatctcta 60
agctgcctgg gtctttt 77
<210> 245
<211> 215
<212> DNA
<213> 人工序列
<220>
<223> 智人GLT8D4 3'-UTR
NM_001080393
<400> 245
atattttgtc ttgttgcaag tcaattaggt gtcttgtgac caaggaaata ctaatctcta 60
agctgcctgg gtctttttgt gtgaatattt aatggtgctc catgactgtt gagttttaaa 120
aacctcgtta aattttgcca aatcagttgc ccccaaaagg gaatatgctt ttccttattt 180
ttttttctaa aatgctattt atctctaagg aaaaa 215
<210> 246
<211> 140
<212> DNA
<213> 人工序列
<220>
<223> 智人HACL1 3'-UTR
NM_012260
<400> 246
ataaagacgc cagttggtgg tcttgagttt tctctttctt gcaagatgaa attttatttt 60
ccacagcaaa attactctac tgttaaaatt gtgcaaaata aaataaacat ttaaaatgac 120
attttacagt aaaaaaaaaa 140
<210> 247
<211> 273
<212> DNA
<213> 人工序列
<220>
<223> 智人IFT88 3'-UTR
NM_175605
<400> 247
tattcacttt aatatttatt aaaggaaaga aattgcctta tgagatcatc ctcatgttaa 60
accttggatt aaatatctaa cctgtaatta ttttttttca ctgtcaaaac ttaagtaagt 120
gtattctatt ctgtatgtat gcatttaagt tgtttttttc ttttaaggaa taaaaacagg 180
taaaactaat actttaggcc agtgacttcc ttagcttttt gaaaacattg acacacagga 240
agaaataaat ttcataacac aaaaaaaaaa aaa 273
<210> 248
<211> 187
<212> DNA
<213> 人工序列
<220>
<223> 智人IFT88 3'-UTR
IFT88-001 ENST00000351808
<400> 248
tattcacttt aatatttatt aaaggaaaga aattgcctta tgagatcatc ctcatgttaa 60
accttggatt aaatatctaa cctgtaatta ttttttttca ctgtcaaaac ttaagtaagt 120
gtattctatt ctgtatgtat gcatttaagt tgtttttttc ttttaaggaa taaaaacagg 180
taaaact 187
<210> 249
<211> 150
<212> DNA
<213> 人工序列
<220>
<223> 智人NDUFB3 3'-UTR
NM_002491
<400> 249
agataatacc tggaagcatc atagtggttt cttaactctc caaaataaga tttcttctct 60
gtagcctact tgtctggttt atcccttaca gaatattagt aagatttaat caattaaaat 120
atatatatat gccaaaaaaa aaaaaaaaaa 150
<210> 250
<211> 589
<212> DNA
<213> 人工序列
<220>
<223> 智人ANO10 3'-UTR
NM_018075
<400> 250
gtgcccagcg tgcccagctg ccctgttggc agaggcctgt gtctgtgcca cacctgccac 60
ggtggcaggg ggggtacccg gggcagcatc gtggctcctg aacccagacc caatgcttag 120
ccaaacgaag tggctcccat gtggcaagca cccttctcag tttcgcagtg gcttggctcg 180
ggatccttgg cagttccccc agccccaccc tgtctgctcc ttcccagttc cttcccgggc 240
cccacacgct gctccagctg ccaactttgc tgcagagcca ctgccgccct tgagcctctc 300
accatgagtg agccaccagc tctccacgtt cccctcatag cagtgtcact cccaacccca 360
ccatggccca gggacccgtg gacaggttgg ggatggggtg tgtgcccact gtgctcatca 420
caggagcctc agttgagagt gagcggggta cagtaaggca gtgcttccca cactggacct 480
ctttcctggt tctcttttgc aatacattaa cagacccttt atcaacataa acaatagtaa 540
ctgagctatt aaaggcaacc tctctgactc cttctgccta aaaaaaaaa 589
<210> 251
<211> 263
<212> DNA
<213> 人工序列
<220>
<223> 智人ANO10 3'-UTR
ANO10-005 ENST00000451430
<400> 251
gtgcccagcg tgcccagctg ccctgttggc agaggcctgt gtctgtgcca cacctgccac 60
ggtggcaggg ggggtacccg gggcagcatc gtggctcctg aacccagacc caatgcttag 120
ccaaacgaag tggctcccat gtggcaagca cccttctcag tttcgcagtg gcttggctcg 180
ggatccttgg cagttccccc agccccaccc tgtctgctcc ttcccagttc cttcccgggc 240
cccacacgct gctccagctg cca 263
<210> 252
<211> 486
<212> DNA
<213> 人工序列
<220>
<223> 智人ARL6 3'-UTR
NM_032146
<400> 252
aaagataata gttggaaacc tcagcaattt tcaattcaag gaatctatct aagacaaata 60
gaatacattt tgtaaaagat gtttatgcat caaaaaatat aattttctgc ttgcatttat 120
ggactctgac ctttttaaga acataggact tcaggtatgc taatttggcc attaattatt 180
taaaaactaa atattccctc aaaagggctc cctagaatta tcaagttctt agtgaaggtc 240
tacatttgat tgtacgtaga atgtttaaaa gtcagttata agccatctca tcccatcata 300
atttatgata tgtttaatat attttatttt ttaattgtct ttttaaaaaa tttagtttat 360
gactttgcag tatgaattgt gcttgtgaaa aagaacttta aatatttata agggaccatg 420
ggtaattaat atatattcaa tttttactat gtgtcactgt caataaaatg taaaatataa 480
tgtgcc 486
<210> 253
<211> 719
<212> DNA
<213> 人工序列
<220>
<223> 智人LPCAT3 3'-UTR
NM_005768
<400> 253
tccatttccc tggtggcctg tgcgggactg gtgcagaaac tactcgtctc ccttttcaca 60
gcactccttt gccccagagc agagaatgga aaagccaggg aggtggaaga tcgatgcttc 120
cagctgtgcc tctgctgcca gccaagtctt catttggggc caaaggggaa actttttttt 180
ggagaaggcg tcttgctttg tcacccacgc tggaatgcag tggcgggatc tcagctcacc 240
gcaacctcca cctcctgggt tcaagtgatt ttcctgcctc agcctcccaa gtagctggga 300
atacaggcac gccaccatgc ccagctaatt tttgtatttt cagtagaaac gggatttcac 360
cacgttggcc aggctggtct cgaactcctg accgcaagtg atccacccgc ctccgcctcc 420
caaagtgctg ggattacagg cgtgagccac cgtgcccggc ccaaagggga aactcttgtg 480
ggaggagcag aggggctcac atctcccctc tgattccccc atgcacattg ccttatctct 540
ccccatctag ccaggaatct attgtgtttt tcttctgcca atttactatg attgtgtatg 600
tgccgctacc accacccccc ccatgggggg gtggagaggg gtgcaaggcc ctgcctgctc 660
cactttttct accttggaac tgtattagat aaaatcactt ctgtttgttc agtttttca 719
<210> 254
<211> 154
<212> DNA
<213> 人工序列
<220>
<223> 智人ABCD3 3'-UTR
NM_001122674
<400> 254
aaaccagaca aatgtattgg ccaggcgtgg tggctcatgc ctgtaatccc agcactttgg 60
gaggctgaga tgggaggatc gcttgaatcc aggagttcga gacaagcctg gacaaaaagc 120
gagacccgct tctttaaaaa ataataataa aaca 154
<210> 255
<211> 448
<212> DNA
<213> 人工序列
<220>
<223> 智人COPG2 3'-UTR
NM_012133
<400> 255
atgcttactg gacaagagga aactgatgca cactacatgg tcagtgggct tttaggctag 60
tggcatcagt ttcccagaat cagacttttg aagatgaatg actttggaga agcaaattaa 120
acatttggcc ctgagccagc agatcaagca aatgtctatc tttgcgcatg ggttgttttt 180
tttttttttc tttttattct acttggtcag ctttgggacg atagtgcagc tttgggtgat 240
cttgaaaatc aaatactatc ctatactcca gctgcttaac ttcattttat tctttaatgt 300
gtacctgaaa gctcctggca atgctggaaa atttttatcc cagaggggtg ggggggaggg 360
gggaggggaa gccagagtcc acttttgtca caattcattt ttattaatag aaaataaaca 420
cttattccag tttcaaaaaa aaaaaaaa 448
<210> 256
<211> 176
<212> DNA
<213> 人工序列
<220>
<223> 智人MIPEP 3'-UTR
NM_005932
<400> 256
aagaaacact ctacacctct taaatcaagg tcatgtagat aatgactttg ttataaatgc 60
tacagctgtg agagcttgtt tctgatttca ttgttcgctt ctgtaattct gaaaaacttt 120
aaactggtag aacttggaat aaataatttg ttttaattaa aaaaaaaaaa aaaaaa 176
<210> 257
<211> 478
<212> DNA
<213> 人工序列
<220>
<223> 智人LEPR 3'-UTR
NM_002303
<400> 257
tttcactgaa gaaaccttca gatttgtgtt ataatgggta atataaagtg taatagatta 60
tagttgtggg tgggagagag aaaagaaacc agagtcaaat ttgaaaataa ttgttccaaa 120
tgaatgttgt ctgtttgttc tctcttagta acatagacaa aaaatttgag aaagccttca 180
taagcctacc aatgtagaca cgctcttcta ttttattccc aagctctagt gggaaggtcc 240
cttgtttcca gctagaaata agcccaacag acaccatctt ttgtgagatg taattgtttt 300
ttcagagggc gtgttgtttt acctcaagtt tttgttttgt accaacacac acacacacac 360
acattcttaa cacatgtcct tgtgtgtttt gagagtatat tatgtattta tattttgtgc 420
tatcagactg taggatttga agtaggactt tcctaaatgt ttaagataaa cagaattc 478
<210> 258
<211> 64
<212> DNA
<213> 人工序列
<220>
<223> 智人LEPR 3'-UTR
NM_001198688
<400> 258
gaaatgcttg tagactacgt cctacctcgc tgccgcacct gctctccctg aggtgtgcac 60
aatg 64
<210> 259
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 智人C2orf76 3'-UTR
NM_001017927
<400> 259
aaacatctcg agggcttcct ttttgcat 28
<210> 260
<211> 244
<212> DNA
<213> 人工序列
<220>
<223> 智人C2orf76 3'-UTR
C2orf76-001 ENST00000409466
<400> 260
aaacatctcg agggcttcct ttttgcatac ctgtattaag ctctttattc cactgctgaa 60
tttttgaaat tgacaaacaa atcttaaaaa attaatccca ggctatactc tttgagctaa 120
aatctggtta tttctttctc ttcaggtctt tccttctctc tttctttttc tttgttgttg 180
taaaataata tattatgaga aaaacatttg atctttttaa agggaaataa attgttatta 240
aaaa 244
<210> 261
<211> 267
<212> DNA
<213> 人工序列
<220>
<223> 智人ABCA6 3'-UTR
NM_080284.2
<400> 261
aacctcaaac ctagtaattt tttgttgatc tcctataaac tcatgtttta tgtaataatt 60
aatagtatgt ttaattttaa agatcattta aaattaacat caggtatatt ttgtaaattt 120
agttaacaaa tacataaatt ttaaaattat tcttcctctc aaacataggg gtgatagcaa 180
acctgtgata aaggcaatac aaaatattag taaagtcacc caaagagtca ggcactgggt 240
attgtggaaa taaaactata taaactt 267
<210> 262
<211> 45
<212> DNA
<213> 人工序列
<220>
<223> 智人LY96 3'-UTR
NM_015364.4
<400> 262
aataaattga gtatttaaaa aaaaaaaaaa aaaaaaaaaa aaaaa 45
<210> 263
<211> 755
<212> DNA
<213> 人工序列
<220>
<223> 智人CROT 3'-UTR
NM_ 001243745.1
<400> 263
tgatgatgtt taaagaatga taaataaaaa gtgcatagtt tttattttta aattattgct 60
gtaaaaattt ttacagttat tattgttatt ttcataatcc aaaagaagga atgaatcact 120
taactttggg agttttcagt gggtggattc gggaacttgt taaaatgcag atttgctggg 180
ataagtgatt ctgattcaca tggctggaat gaggcccaga gattcttatt ttaacaatca 240
cttcatgtgg tttggctgca ggtaatctgt agaccatgct gaaggaaaac attttgtcca 300
ggtgactagc ttgaaaaatc agaaacacta aaatagacat gtcacatagg tggcatagaa 360
atattttcgt agtacaatgg agaaagggaa tcattaaaaa tcagagtgga gaatggttat 420
gtatattgta tatttcagtt agataaattg aggaagctag tataataatt attgaaggtc 480
tcaataattt tccacaaaat tctttaactt cttcagctca accatttctg tacttctcta 540
ctatgaatca gaggatgagg ttgtataatt caaaagcatt gccttagtct agaaataatt 600
attgtaccta tcatttagtt ttagaaataa aaagcaagct gatttttttt gatgaaccat 660
ttatatctgt gatggaataa taaaatttca cacttccgga ttcctttgtt ctcaattttg 720
agccttgagt tgttttaatt aaagaggggt aaagg 755
<210> 264
<211> 911
<212> DNA
<213> 人工序列
<220>
<223> 智人ENPP5 3'-UTR
ENPP5-002 ENST00000230565
<400> 264
tgttactttg aagtggattt gcatattgaa gtggagattc cataattatg tcagtgttta 60
aaggtttcaa attctgggaa accagttcca aacatttgca gaaaccatta agcagttaca 120
tatttaggta tacacacaca cacacacaca catacacaca cacggaccaa aatacttaca 180
cctgcaaagg aataaagatg tgagagtatg tctccattgt tcactgtagc atagggatag 240
ataagatcct gctttatttg gacttggcgc agataatgta tatatttagc aactttgcac 300
tatgtaaagt accttatgta ttgcacttta aatttctctc ctgatgggta ctttaatttg 360
aaatgcactt tatgcacagt tatgtcttat aacttgattg aaaatgacaa ctttttgcac 420
ccatgtcaca gaatacttgt tacgcattgt tcaaactgaa ggaaatttct aataatcccg 480
aataatgaac gtagaaatct atctccataa attgagagaa gaagaaggtg ataagtgttg 540
aaaattaaat gtgataacct ttgaaccttg aattttggag atgtattccc aacagcagaa 600
tgcaactgtg ggcatttctt gtcttatttc tttccagaga acgtggtttt catttatttt 660
tccctcaaaa gagagtcaaa tactgacaga ttcgttctaa atatattgtt tctgtcataa 720
aattattgtg atttcctgat gagtcatatt actgtgattt tcataataat gaagacacca 780
tgaatatact ttttttctat atagttcagc aatggcctga atagaagcaa ccaggcacca 840
tctcagcaat gttttctctt gtttgtaatt atttgctcct ttgaaaatta aatcactatt 900
aattacatta a 911
<210> 265
<211> 300
<212> DNA
<213> 人工序列
<220>
<223> 智人SERPINB7 3'-UTR
SERPINB7-203 ENST00000546027
<400> 265
aaatccaatt ggtttctgtt atagcagtcc ccacaacatc aaagaaccac cacaagtcaa 60
tagatttgag tttaattgga aaaatgtggt gtttcctttg agtttatttc ttcctaacat 120
tggtcagcag atgacactgg tgacttgacc cttcctagac acctggttga ttgtcctgat 180
ccctgctctt agcattctac caccatgtgt ctcacccatt tctaatttca ttgtctttct 240
tcccacgctc atttctatca ttctccccca tgacccgtct ggaaattatg gagagtgctc 300
<210> 266
<211> 509
<212> DNA
<213> 人工序列
<220>
<223> 智人TCP11L2 3'-UTR
NM_152772
<400> 266
agaagaactg acattggacg agagattgga aatccagtac tttggtatcc agtccacttc 60
cattgatggc attagagatc cagcacattc tcagtactgt ggtgcagtat tagcccaaat 120
ctgtgtaatg ggtaatatta gcattacaga agacacacac atcacataga ccctcagaag 180
acgtaaacat cacatagacc ctatttgtgc atcattttca agtttaaaac agatatttgt 240
aatgaacaga aaacaatttg taattaatta tattacctat ataatacttg taaatgtttt 300
cttaaccatt tatatttggc ttatgacatt taacccctaa ggagttgttt ttctcacttg 360
ttattatcaa acctaatggt ttttaatttt ggtacaactc cttaaagggt tgaaggttgt 420
gacaataact gagggaactg atgttctgaa taaatgatgt gaagtaaaca caattgtatt 480
tgaaaaaaaa aaaaaaaaaa aaaaaaaaa 509
<210> 267
<211> 84
<212> DNA
<213> 人工序列
<220>
<223> 智人IRAK1BP1 3'-UTR
NM_001010844
<400> 267
aattccaaac aaattatatt gtacttgtat ctttttacct atttttatac tttttataat 60
gtttacgttt gtcctgaata tata 84
<210> 268
<211> 338
<212> DNA
<213> 人工序列
<220>
<223> 智人CDKL2 3'-UTR
CDKL2-002 ENST00000307465
<400> 268
gaaccatttt ggttctgaac tggatgatgc tcttgcactt gagatgacat cttcttgcag 60
caagagtgct gatatcccaa gaggagagat tcatggtttt gatcatttcc ttctgaactg 120
cctgcatttt ctgaggaagg ccttctagaa gaaggaaaga caaagacttc caaatgtttc 180
aaaggaagat tgaacaaatg gccctcccca actgttatcc cattaccttt cacgtccacc 240
gatgctattt caagacatat ccagtggaat aacagtgata tggttcttgt tacatgaatg 300
tgtatttact gttaggagat tgtatatttt aagttacc 338
<210> 269
<211> 367
<212> DNA
<213> 人工序列
<220>
<223> 智人GHR 3'-UTR
GHR-202 ENST00000537449
<400> 269
cctttctttg gtttcccaag agctacgtat ttaatagcaa agaattgact ggggcaataa 60
cgtttaagcc aaaacaatgt ttaaaccttt tttgggggag tgacaggatg gggtatggat 120
tctaaaatgc cttttcccaa aatgttgaaa tatgatgtta aaaaaataag aagaatgctt 180
aatcagatag atattcctat tgtgcaatgt aaatatttta aagaattgtg tcagactgtt 240
tagtagcagt gattgtctta atattgtggg tgttaatttt tgatactaag cattgaatgg 300
ctatgttttt aatgtatagt aaatcacgct ttttgaaaaa gcgaaaaaat caggtggctt 360
ttgcggt 367
<210> 270
<211> 406
<212> DNA
<213> 人工序列
<220>
<223> 智人KIAA1107 3'-UTR
NM_015237
<400> 270
gtgttaacat tttggaaaaa tttatgccac tcctttattt tttgatgcct atattatatc 60
caaatgataa ttgcattagc cggatataaa ctttctttaa tattgagtct ttccaattta 120
atgaggtaaa catagtttat ttattaatat atcacatata gaaaaatgtt tttctaaagt 180
ttttgagcat gttttctcta attattagag aaattagaag acttataagg aaaccctagc 240
ttcagttttc ctttcctagc tgatgatttg ttcacttaat cattattcaa gaatttaaaa 300
tgtgaatgca gaagtagatc agtcccttta ctttttgctc tgcatagggt aacatagtaa 360
tttaacaata aaaacttacc gtgcttgtgt ccaaaaaaaa aaaaaa 406
<210> 271
<211> 301
<212> DNA
<213> 人工序列
<220>
<223> 智人RPS6KA6 3'-UTR
RPS6KA6-001 ENST00000262752
<400> 271
gatttgtggt gttcctaggc caaactggat gaagatgaaa ttaaatgtgt ggcttttttc 60
ctattcttat caaaggcatc gttgtctgct aaattacttg aatattaagt aatattaaat 120
ccccattttt aggggaagtg agatttaaaa aaccattcac aggtccacaa tattcatact 180
atgtgtttgc agtagtgttc aagtgtttat ttaagcatat aattggtgtc caccaggtcc 240
tcacaacttc tctgcacaca agcttctaaa attcctttca aataaagtta ctttaatatt 300
t 301
<210> 272
<211> 777
<212> DNA
<213> 人工序列
<220>
<223> 智人CLGN 3'-UTR
NM_004362, NM_001130675
<400> 272
actagattga aatattttta attcccgaga gggatgtttg gcattgtaaa aatcagcatg 60
ccagacctga actttaatca gtctgcacat cctgtttcta atatctagca acattatatt 120
ctttcagaca tttattttag tccttcattt cagaggaaaa agaagcaact ttgaagttac 180
ctcatctttg aatttagaat aaaagtggca cattacatat cggatctaag agattaatac 240
cattagaagt tacacagttt tagttgtttg gagatagttt tggtttgtac agaacaaaat 300
aatatgtagc agcttcattg ctattggaaa aatcagttat tggaatttcc acttaaatgg 360
ctatacaaca atataactgg tagttctata ataaaaatga gcatatgttc tgttgtgaag 420
agctaaatgc aataaagttt ctgtatggtt gtttgattct atcaacaatt gaaagtgttg 480
tatatgaccc acatttacct agtttgtgtc aaattatagt tacagtgagt tgtttgctta 540
aattatagat tcctttaagg acatgccttg ttcataaaat cactggatta tattgcagca 600
tattttacat ttgaatacaa ggataatggg ttttatcaaa acaaaatgat gtacagattt 660
tttttcaagt ttttatagtt gctttatgcc agagtggttt accccattca caaaatttct 720
tatgcataca ttgctattga aaataaaatt taaatatttt ttcatcctga aaaaaaa 777
<210> 273
<211> 466
<212> DNA
<213> 人工序列
<220>
<223> 智人CLGN-202 3'-UTR
NM_004362, NM_001130675
ENST00000325617
<400> 273
actagattga aatattttta attcccgaga gggatgtttg gcattgtaaa aatcagcatg 60
ccagacctga actttaatca gtctgcacat cctgtttcta atatctagca acattatatt 120
ctttcagaca tttattttag tccttcattt cagaggaaaa agaagcaact ttgaagttac 180
ctcatctttg aatttagaat aaaagtggca cattacatat cggatctaag agattaatac 240
cattagaagt tacacagttt tagttgtttg gagatagttt tggtttgtac agaacaaaat 300
aatatgtagc agcttcattg ctattggaaa aatcagttat tggaatttcc acttaaatgg 360
ctatacaaca atataactgg tagttctata ataaaaatga gcatatgttc tgttgtgaag 420
agctaaatgc aataaagttt ctgtatggtt gtttgattct atcaac 466
<210> 274
<211> 423
<212> DNA
<213> 人工序列
<220>
<223> 智人TMEM45A 3'-UTR
NM_018004
<400> 274
ctttgatgag cttccagttt ttctagataa accttttctt ttttacattg ttcttggttt 60
tgtttctcga tcttttgttt ggagaacagc tggctaagga tgactctaag tgtactgttt 120
gcatttccaa tttggttaaa gtatttgaat ttaaatattt tctttttagc tttgaaaata 180
ttttgggtga tactttcatt ttgcacatca tgcacatcat ggtattcagg ggctagagtg 240
atttttttcc agattatcta aagttggatg cccacactat gaaagaaata tttgttttat 300
ttgccttata gatatgctca aggttactgg gcttgctact atttgtaact ccttgaccat 360
ggaattatac ttgtttatct tgttgctgca atgagaaata aatgaatgta tgtattttgg 420
tgc 423
<210> 275
<211> 152
<212> DNA
<213> 人工序列
<220>
<223> 智人TBC1D8B 3'-UTR
TBC1D8B-007 ENST00000276175
<400> 275
atccctagga attgcctatc atagacaagt ttactaacat tcctgtagct gtcagtttga 60
ttcctgtgag tagggctcag ggatttatct tgttaccaat gtgtctgaag gccaaaatat 120
atatccagaa gcacaatgca tcattccttt gt 152
<210> 276
<211> 81
<212> DNA
<213> 人工序列
<220>
<223> 智人ACP6 3'-UTR
NM_016361
<400> 276
ctgatttata aaagcaggat gtgttgattt taaaataaag tgcctttata caatgccaaa 60
aaaaaaaaaa aaaaaaaaaa a 81
<210> 277
<211> 111
<212> DNA
<213> 人工序列
<220>
<223> 智人RP6-213H19.1 3'-UTR
MST4-003 (RBM4B-003 ENST00000496850)
<400> 277
gaaacttatt attggcttct gtttcatatg gacccagaga gccccaccaa acctacgtca 60
agattaacaa tgcttaaccc atgagctcca tgtgcctttt ggatctttgc a 111
<210> 278
<211> 138
<212> DNA
<213> 人工序列
<220>
<223> 智人SNRPN 3'-UTR
NM_022807
<400> 278
catactgttg atccatctca gtcacttttt cccctgcaat gcgtcttgtg aaattgtgta 60
gagtgtttgt gagctttttg ttccctcatt ctgcattaat aatagctaat aataaatgca 120
tagagcaatt aaactgtg 138
<210> 279
<211> 425
<212> DNA
<213> 人工序列
<220>
<223> 智人GLRB 3'-UTR
GLRB-005 ENST00000512619
<400> 279
gatctaatga cttcagcatt gttggaagct taccaagaga ttttgaacta tccaattatg 60
actgctatgg aaaacccatt gaagttaaca acggacttgg gaaatctcag gctaagaaca 120
acaagaagcc tccccctgcg aaacctgtta ttccaacagc agcaaagcga attgatcttt 180
atgcaagagc attgtttcct ttctgcttct tgttcttcaa tgttatatat tggtctatat 240
atttatgata aatcttttcc atttgtacaa aataaaattc catttcattg tgacctactc 300
ctttcataaa tgccaatctg tgagaacttt tgaattttca tagcaacatt gcattttgga 360
tgccatttga ttgtaataaa actgtggcac cttaattttg aatggcagca tgatcatgta 420
atatc 425
<210> 280
<211> 651
<212> DNA
<213> 人工序列
<220>
<223> 智人HERC6 3'-UTR
NM_017912
<400> 280
tcacctctga gagactcagg gtgggctttc tcacacttgg atccttctgt tcttccttac 60
acctaaataa tacaagagat taatgaatag tggttagaag tagttgaggg agagattggg 120
ggaatgggga gatgatgatg atggtcaaag ggtgcaaaat ctcacacaag actgaggcag 180
gagaataggg tacagagata gggatctaag gatgacttgg acacactccc tggcactgaa 240
gagtctgaac actggcctgt gattggtcca ttccaggacc ttcatttgca taaggtatca 300
aaccacatca gcctctgatt ggccatgggc cagacctgca ctctggccaa tgattggttc 360
attccaggac attcatttgc ataaggagtc aaaccacacc agtcttggat tggctgtgag 420
ccaattcacc tcagtctcta attggctgtg agtcagtctt tcatttacat agggtgtaac 480
catcaagaaa cctctacagg gtacttaagc cccagaagat tttgctacca gggctcttga 540
gccacttgct ctagcccact cccaccctgt ggaatgtact ttcacttttg ctgcttcact 600
gccttgtgct ccaataaatc cactccttca ccacccaaaa aaaaaaaaaa a 651
<210> 281
<211> 264
<212> DNA
<213> 人工序列
<220>
<223> 智人CFH 3'-UTR
NM_000186
<400> 281
aatcaatcat aaagtgcaca cctttattca gaactttagt attaaatcag ttctcaattt 60
cattttttat gtattgtttt actccttttt attcatacgt aaaattttgg attaatttgt 120
gaaaatgtaa ttataagctg agaccggtgg ctctcttctt aaaagcacca tattaaatcc 180
tggaaaacta aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 240
aaaaaaaaaa aaaaaaaaaa aaaa 264
<210> 282
<211> 401
<212> DNA
<213> 人工序列
<220>
<223> 智人GALC 3'-UTR
GALC-002 ENST00000393569
<400> 282
tacttaacag ggcatcatag aatactctgg attttcttcc cttctttttg gttttggttc 60
agagccaatt cttgtttcat tggaacagta tatgaggctt ttgagactaa aaataatgaa 120
gagtaaaagg ggagagaaat ttatttttaa tttaccctgt ggaagatttt attagaatta 180
attccaaggg gaaaactggt gaatctttaa cattacctgg tgtgttccct aacattcaaa 240
ctgtgcattg gccataccct taggagtggt ttgagtagta cagacctcga agccttgctg 300
ctaacactga ggtagctctc ttcatcttat ttgcaagcgg tcctgtagat ggcagtaact 360
tgatcatcac tgagatgtat ttatgcatgc tgaccgtgtg t 401
<210> 283
<211> 51
<212> DNA
<213> 人工序列
<220>
<223> 智人GALC 3'-UTR
GALC-005 ENST00000393568
<400> 283
tacttaacag ggcatcatag aatactctgg attttcttcc cttctttttg g 51
<210> 284
<211> 360
<212> DNA
<213> 人工序列
<220>
<223> 智人PDE1A 3'-UTR
NM_001003683.2
<400> 284
acacctttaa gtaaaacctc gtgcatggtg gcagctctaa tttgaccaaa agacttggag 60
attttgatta tgcttgctgg aaatctaccc tgtcctgtgt gagacaggaa atctattttt 120
gcagattgct caataagcat catgagccac ataaataaca gctgtaaact ccttaattca 180
ccgggctcaa ctgctaccga acagattcat ctagtggcta catcagcacc ttgtgctttc 240
agatatctgt ttcaatggca ttttgtggca tttgtcttta ccgagtgcca ataaattttc 300
tttgagcagc taattgctaa ttttgtcatt tctacaataa agcttggtcc acctgttttc 360
<210> 285
<211> 308
<212> DNA
<213> 人工序列
<220>
<223> 智人PDE1A 3'-UTR
PDE1A-003 ENST00000410103
<400> 285
acacctttaa gtaaaacctc gtgcatggtg gcagctctaa tttgaccaaa agacttggag 60
attttgatta tgcttgctgg aaatctaccc tgtcctgtgt gagacaggaa atctattttt 120
gcagattgct caataagcat catgagccac ataaataaca gctgtaaact ccttaattca 180
ccgggctcaa ctgctaccga acagattcat ctagtggcta catcagcacc ttgtgctttc 240
agatatctgt ttcaatggca ttttgtggca tttgtcttta ccgagtgcca ataaattttc 300
tttgagca 308
<210> 286
<211> 855
<212> DNA
<213> 人工序列
<220>
<223> 智人GSTM5 3'-UTR
NM_000851
<400> 286
ggcccagtga tgccagaaga tgggagggag gagccaacct tgctgcctgc gaccctggag 60
gacagcctga ctccctggac ctgccttctt cctttttcct tctttctact ctcttctctt 120
ccccaaggcc tcattggctt cctttcttct aacatcatcc ctccccgcat cgaggctctt 180
taaagcttca gctccccact gtcctccatc aaagtccccc tcctaacgtc ttcctttccc 240
tgcactaacg ccaacctgac tgcttttcct gtcagtgctt ttctcttctt tgagaagcca 300
gactgatctc tgagctccct agcactgtcc tcaaagacca tctgtatgcc ctgctccctt 360
tgctgggtcc ctaccccagc tccgtgtgat gcccagtaaa gcctgaacca tgcctgccat 420
gtcttgtctt attccctgag gctcccttga ctcaggactg tgctcgaatt gtgggtggtt 480
ttttgtcttc tgttgtccac agccagagct tagtggatgg gtgtgtgtgt gtgtgtgttg 540
ggggtggtga tcaggcaggt tcataaattt ccttggtcat ttctgccctc tagccacatc 600
cctctgttcc tcactgtggg gattactaca gaaaggtgct ctgtgccaag ttcctcactc 660
attcgcgctc ctgtaggccg tctagaactg gcatggttca aagaggggct aggctgatgg 720
ggaagggggc tgagcagctc ccaggcagac tgccttcttt caccctgtcc tgatagactt 780
ccctgatcta gatatccttc gtcatgacac ttctcaataa aacgtatccc accgtattgt 840
aaaaaaaaaa aaaaa 855
<210> 287
<211> 419
<212> DNA
<213> 人工序列
<220>
<223> 智人CADPS2 3'-UTR
CADPS2-002 ENST00000412584
<400> 287
tatcacacag ctttgcagaa ggaaggaaga ccttgatcga cattgttttt tattttttta 60
accttgtcct tgtaattaca ttcattgttt gttttggcca aataaaaatg cttgtatttc 120
tttaaaaagt aagcctgaat gtagagtaaa aggggaaatg ccaagatttt ggggtttttt 180
tgtttccttt ttttgtttgt ttgtttgttt gtttttttgg agaagagcat cctcttttgt 240
gtagtttgac ctaaaaatga accttggctc tgcttgtgat cagaacatga actttttttt 300
ttaaagaaga tttgagcatt tttctgtaat cacatcaaaa tgatgttttc tgtgtaaagc 360
gagatacata tttctcataa tgcagcattg tgagaagtca gttcggacca ctgcaccaa 419
<210> 288
<211> 162
<212> DNA
<213> 人工序列
<220>
<223> 智人CADPS2 3'-UTR
CADPS2-001 ENST00000449022
<400> 288
tatcacacag ctttgcagaa ggaaggaaga ccttgatcga cattgttttt tattttttta 60
accttgtcct tgtaattaca ttcattgttt gttttggcca aataaaaatg cttgtatttc 120
tttaaaaagt aagcctgaat gtagagtaaa aggggaaatg cc 162
<210> 289
<211> 247
<212> DNA
<213> 人工序列
<220>
<223> 智人AASS 3'-UTR
AASS-001 ENST00000417368
<400> 289
ttgggaatta tattttgttt ttttcttccc aggcaataca cctctgaaca tgtgtgtgat 60
aaatgggttt gctaatgtgc tgttttaaag tataaagcat aatatgtttt ggttaacaca 120
atgtactttt tgaactataa atctttattt taatatggaa atgtttggaa caggagatgc 180
aagccactaa cagagaactt taataattct accctgtatt ttataaatac gtatgtgaaa 240
gtgatga 247
<210> 290
<211> 695
<212> DNA
<213> 人工序列
<220>
<223> 智人TRIM6-TRIM34 3'-UTR
NM_001003819
<400> 290
attttctcat ttcttcacct acaacccttt gtcttgactt atctcctgca actgactcat 60
ctgcaacatt cacaccattg cttccttgtg gtttcccttc tttagaactt ttactcatcc 120
ttgagatgta tggtgtattt ggcttgagtt atgagagatg cttatttatt catttactct 180
ttttcatatt ttcagagaaa gttacctaat ccctcctaaa gacacagcag tatgggtata 240
acatccttgc cttcccattt atccatgttt cactttatca ctgatatgaa gaggcccaaa 300
gcctgttagc caccatccat gctacctagg tagtccatag gaaccacccc catgaccacc 360
accaacatca actaaaggtt cttggagggt atgtcagtgt gttgctcagg ataccccagg 420
tacatcaagg aatcaaggag aggaaaatat gagcaatatg tgtattcaga gtgaagattt 480
tatgtccaga gtatttgagc tcaaaccttg cctgttgttt tctaatcatg atgaatactt 540
tctcagtttc tttttcctga aatataaatt gggatttaag actgtaccta actattaaga 600
tcactgtgta aaactaagtg tctctaaatg taatgcatcg atttagtgtc tggaacataa 660
taaatatttg ctctcatgat tgctaaaaaa aaaaa 695
<210> 291
<211> 918
<212> DNA
<213> 人工序列
<220>
<223> 智人SEPP1 3'-UTR
NM_005410
<400> 291
atatttaaaa taggacatac tccccaattt agtctagaca caatttcatt tccagcattt 60
ttataaacta ccaaattagt gaaccaaaaa tagaaattag atttgtgcaa acatggagaa 120
atctactgaa ttggcttcca gattttaaat tttatgtcat agaaatattg actcaaacca 180
tattttttat gatggagcaa ctgaaaggtg attgcagctt ttggttaata tgtctttttt 240
tttctttttc cagtgttcta tttgctttaa tgagaataga aacgtaaact atgacctagg 300
ggtttctgtt ggataattag cagtttagaa tggaggaaga acaacaaaga catgctttcc 360
atttttttct ttacttatct ctcaaaacaa tattactttg tcttttcaat cttctacttt 420
taactaataa aataagtgga ttttgtattt taagatccag aaatacttaa cacgtgaata 480
ttttgctaaa aaagcatata taactatttt aaatatccat ttatcttttg tatatctaag 540
actcatcctg atttttacta tcacacatga ataaagcctt tgtatctttc tttctctaat 600
gttgtatcat actcttctaa aacttgagtg gctgtcttaa aagatataag gggaaagata 660
atattgtctg tctctatatt gcttagtaag tatttccata gtcaatgatg gtttaatagg 720
taaaccaaac cctataaacc tgacctcctt tatggttaat actattaagc aagaatgcag 780
tacagaattg gatacagtac ggatttgtcc aaataaattc aataaaaacc ttaaagctga 840
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 900
aaaaaaaaaa aaaaaaaa 918
<210> 292
<211> 589
<212> DNA
<213> 人工序列
<220>
<223> 智人SEPP1 3'-UTR
SEPP1-004 ENST00000506577
<400> 292
atatttaaaa taggacatac tccccaattt agtctagaca caatttcatt tccagcattt 60
ttataaacta ccaaattagt gaaccaaaaa tagaaattag atttgtgcaa acatggagaa 120
atctactgaa ttggcttcca gattttaaat tttatgtcat agaaatattg actcaaacca 180
tattttttat gatggagcaa ctgaaaggtg attgcagctt ttggttaata tgtctttttt 240
tttctttttc cagtgttcta tttgctttaa tgagaataga aacgtaaact atgacctagg 300
ggtttctgtt ggataattag cagtttagaa tggaggaaga acaacaaaga catgctttcc 360
atttttttct ttacttatct ctcaaaacaa tattactttg tcttttcaat cttctacttt 420
taactaataa aataagtgga ttttgtattt taagatccag aaatacttaa cacgtgaata 480
ttttgctaaa aaagcatata taactatttt aaatatccat ttatcttttg tatatctaag 540
actcatcctg atttttacta tcacacatga ataaagcctt tgtatcttt 589
<210> 293
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 智人PDE5A 3'-UTR
PDE5A-002 ENST00000264805
<400> 293
gtggcctatt tcatgcagag ttgaagttta cagagatggt gtgttctgca atatgcctag 60
<210> 294
<211> 422
<212> DNA
<213> 人工序列
<220>
<223> 智人SATB1 3'-UTR
SATB1-004 ENST00000417717
<400> 294
gataaaagta tttgtttcgt tcaacagtgc cactggtatt tactaacaaa atgaaaagtc 60
caccttgtct tctctcagaa aacctttgtt gttcattgtt tggccaatga atcttcaaaa 120
acttgcacaa acagaaaagt tggaaaagga taatacagac tgcactaaat gttttcctct 180
gttttacaaa ctgcttggca gccccaggtg aagcatcaag gattgtttgg tattaaaatt 240
tgtgttcacg ggatgcacca aagtgtgtac cccgtaagca tgaaaccagt gttttttgtt 300
ttttttttag ttcttattcc ggagcctcaa acaagcatta taccttctgt gattatgatt 360
tcctctccta taattatttc tgtagcactc cacactgatc tttggaaact tgccccttat 420
tt 422
<210> 295
<211> 981
<212> DNA
<213> 人工序列
<220>
<223> 智人CCPG1 3'-UTR
CCPG1-002 ENST00000442196
<400> 295
ttcacaattg agttaaatta gacaactgta agagaaaaat ttatgctttg tataatgttt 60
ggtattgaaa ctaatgaaat taccaagatg acaatgtctt ttcttttgtt tctaagtatc 120
agtttgataa ctttatatta ttcctcagaa gcattagtta aaagtctact aacctgcatt 180
ttcctgtagt ttagcttcgt tgaatttttt ttgacactgg aaatgttcaa ctgtagtttt 240
attaaggaag ccaggcatgc aacagatttt gtgcatgaaa tgagacttcc tttcagtgta 300
agagcttaaa gcaagctcag tcatacatga caaagtgtaa ttaacactga tgtttgtgtt 360
aaatttgcag cagagcttga gaaaagtaca ttgttctgga atttcatcat taacatttta 420
taatcttaca ctcacttctt gtctttttgt gggttcaaga gccctctgac ttgtgaagaa 480
tttgctgccc tcttaagagc ttgctgactt gttttcttgt gaaatttttt gcacatctga 540
atatcgtgga agaaacaata aaactacacc atgaggaaaa ctaaaggtct ttatttaaaa 600
tctggcattg tattaacatg taattttata ctatgtggta ttttatacat ttcctcagta 660
gtgatatttg gtaaagcagt tcatacagct tttttctaag ttccatgaat cttacccagt 720
gtttaccgaa gtatttaagc agcatctgaa tatttccacc cagcaatgtt aatttatcta 780
ggaaagttca gaatttcatc ttcatgttga atttcccttt taacttccgt tcatagacat 840
atatgtgact tccaattcga ccctctggca agtgagtgtg gaagaaaaca gcagttcttt 900
tataattgct tgaaattagg aaagcgctta tttcctagaa gcaaataaat gtttaagtaa 960
ataaaggcta cattttgctg a 981
<210> 296
<211> 575
<212> DNA
<213> 人工序列
<220>
<223> 智人CCPG1 3'-UTR
CCPG1-004 ENST00000425574
<400> 296
ttcacaattg agttaaatta gacaactgta agagaaaaat ttatgctttg tataatgttt 60
ggtattgaaa ctaatgaaat taccaagatg acaatgtctt ttcttttgtt tctaagtatc 120
agtttgataa ctttatatta ttcctcagaa gcattagtta aaagtctact aacctgcatt 180
ttcctgtagt ttagcttcgt tgaatttttt ttgacactgg aaatgttcaa ctgtagtttt 240
attaaggaag ccaggcatgc aacagatttt gtgcatgaaa tgagacttcc tttcagtgta 300
agagcttaaa gcaagctcag tcatacatga caaagtgtaa ttaacactga tgtttgtgtt 360
aaatttgcag cagagcttga gaaaagtaca ttgttctgga atttcatcat taacatttta 420
taatcttaca ctcacttctt gtctttttgt gggttcaaga gccctctgac ttgtgaagaa 480
tttgctgccc tcttaagagc ttgctgactt gttttcttgt gaaatttttt gcacatctga 540
atatcgtgga agaaacaata aaactacacc atgag 575
<210> 297
<211> 230
<212> DNA
<213> 人工序列
<220>
<223> 智人CNTN1 3'-UTR
CNTN1-002 ENST00000348761
<400> 297
atgtgttgtg acagctgctg ttcccatccc agctcagaag acacccttca accctgggat 60
gaccacaatt ccttccaatt tctgcggctc catcctaagc caaataaatt atactttaac 120
aaactattca actgatttac aacacacatg atgactgagg cattcgggaa ccccttcatc 180
caaaagaata aacttttaaa tggatataaa tgatttttaa ctcgttccaa 230
<210> 298
<211> 922
<212> DNA
<213> 人工序列
<220>
<223> 智人CNTN1 3'-UTR
CNTN1-004 ENST00000547849
<400> 298
tcgttgacac tcaccatttc tgtgaaagac tttttttttt ttaacatatt atactagatt 60
tgactaactc aatcttgtag cttctgcagt tctccccacc cccaacctag ttcttagagt 120
atgtttcccc ttttgaaaca tgtaaacata ctttgggcat aaatattttt taaaatataa 180
ctataatgct tcactaatac cttaaaaatg cctagtgaac taactcagta cattatataa 240
tggccaagtg aaagttttgt gttttcatgt cctgtttttc tttgaaatta tatagcccag 300
aaattagctc attatctgaa aaacgtatga agaactgatg aattgtataa tacaggagta 360
ttgccattga atgtactgtt tgatttattc aagcaggtaa tgaacaatgt tgtcaaactc 420
tctaatgaga catcataatt aggacataag ctaaaagggg cattactccg gcagtctttt 480
tttcttaatc ctagtaccat acatattctt tggcatgaaa gaatgaaaag cattagtaaa 540
caactgaagt cctaccatgg ctctgtaggg tttttggaac aattcctgga attggaaagt 600
gaaaatggat agcatgtggg ggaaaccctc atctgagtag caagatttta gtaaagatga 660
ctaagccatt aacagcatgc attcatattt aattttattg actcctgcca tcagcttttg 720
tagatcgttt gggtggaagg ttgtgatttt tactgggagg acttgagtag aagtggatga 780
ttaaaattga ggagtatata attctttctg ggactgctta aatgttattg tttgaaaata 840
ccttcacttt ccccctttgg tcaaagagat gtgcttaaaa ttcttattcc ttcacaataa 900
ataattttga ttttcttaga ca 922
<210> 299
<211> 928
<212> DNA
<213> 人工序列
<220>
<223> 智人CNTN1 3'-UTR
CNTN1-004 ENST00000547849
+T,在位置30bp, 突变G727bpT, A840bpG
<400> 299
ttttttcgtt gacactcacc atttctgtga aagacttttt ttttttttaa catattatac 60
tagatttgac taactcaatc ttgtagcttc tgcagttctc cccaccccca acctagttct 120
tagagtatgt ttcccctttt gaaacatgta aacatacttt gggcataaat attttttaaa 180
atataactat aatgcttcac taatacctta aaaatgccta gtgaactaac tcagtacatt 240
atataatggc caagtgaaag ttttgtgttt tcatgtcctg tttttctttg aaattatata 300
gcccagaaat tagctcatta tctgaaaaac gtatgaagaa ctgatgaatt gtataataca 360
ggagtattgc cattgaatgt actgtttgat ttattcaagc aggtaatgaa caatgttgtc 420
aaactctcta atgagacatc ataattagga cataagctaa aaggggcatt actccggcag 480
tctttttttc ttaatcctag taccatacat attctttggc atgaaagaat gaaaagcatt 540
agtaaacaac tgaagtccta ccatggctct gtagggtttt tggaacaatt cctggaattg 600
gaaagtgaaa atggatagca tgtgggggaa accctcatct gagtagcaag attttagtaa 660
agatgactaa gccattaaca gcatgcattc atatttaatt ttattgactc ctgccatcag 720
cttttgtaga tcttttgggt ggaaggttgt gatttttact gggaggactt gagtagaagt 780
ggatgattaa aattgaggag tatataattc tttctgggac tgcttaaatg ttattgtttg 840
aaaatgcctt cactttcccc ctttggtcaa agagatgtgc ttaaaattct tattccttca 900
caataaataa ttttgatttt cttagaca 928
<210> 300
<211> 734
<212> DNA
<213> 人工序列
<220>
<223> 智人LMBRD2 3'-UTR
<400> 300
agtctgaaaa agtttgtggg accactaacc aaggtcaaca catcagttca gtcttgatga 60
acatctgtgt accctagaat ttcctctata cacagtgaaa agtgtcaaga taacaaaaaa 120
ggcactgaga attaattata tcttaggaat aatagtttaa tgtgcattga atagagtatc 180
acctttttca acaagattta ttacatatca tttcctaagc atctgcctta gaaatacagt 240
tacagtggaa ggactttaag aaagatcaac atatgttaag aacatgcagt tcagtttgtt 300
tcagattaat tttttttcaa gagagttatt ttaaagattc aaggaagcca taagtcatac 360
taaataatat tatatacagt tttgttattg tgacttacat ttttgttact tctaaaaagt 420
atattcaacc tgtatttccc aaagaaatgt aagtgaatgg agacctcaaa taataactgt 480
attcataaaa ctcgtgtctt aaaacaaggc ttacttacta gacataactg aatgtaaaaa 540
gtgctttttc aaatctgttt gcaaactcgt gggggatttt tgcatgtata agattaagat 600
tatacttcaa gtgatgcgtg tctgtgtatt tagcatgtgt actataatca ggtgatatag 660
tattccttca gtctttgtag taactggatt tttttatgct tctggtattg ctttataaaa 720
gattttcatt tcag 734
<210> 301
<211> 241
<212> DNA
<213> 人工序列
<220>
<223> 智人TLR3 3'-UTR
NM_003265
<400> 301
atttatttaa atattcaatt agcaaaggag aaactttctc aatttaaaaa gttctatggc 60
aaatttaagt tttccataaa ggtgttataa tttgtttatt catatttgta aatgattata 120
ttctatcaca attacatctc ttctaggaaa atgtgtctcc ttatttcagg cctatttttg 180
acaattgact taattttacc caaaataaaa catataagca cgtaaaaaaa aaaaaaaaaa 240
a 241
<210> 302
<211> 527
<212> DNA
<213> 人工序列
<220>
<223> 智人BCAT1 3'-UTR
BCAT1-002 ENST00000342945
<400> 302
atggaaaata gaggatacaa tggaaaatag aggataccaa ctgtatgcta ctgggacaga 60
ctgttgcatt tgaattgtga tagatttctt tggctacctg tgcataatgt agtttgtagt 120
atcaatgtgt tacaagagtg attgtttctt catgccagag aaaatgaatt gcaatcatca 180
aatggtgttt cataacttgg tagtagtaac ttaccttacc ttacctagaa aaacattaat 240
gtaagccata taacatggga ttttcctcaa tgattttagt gcctcctttt gtacttcact 300
cagatactaa atagtagttt attctttaat ataagttaca ttctgctcct caaacaaatg 360
caattttttg tgtgtgtttg aaagctaatt tgagaaaatt tcataggtta catttcctgc 420
agcctatctt tatccacaga aagtgttttc ttttttttaa atcaagactt ttaaaactgg 480
atttcctccc atcactgttt tttgaaggtc ctccaagtcc gtgttaa 527
<210> 303
<211> 199
<212> DNA
<213> 人工序列
<220>
<223> 智人BCAT1 3'-UTR
<400> 303
atggaaaata gaggatacaa tggaaaatag aggataccaa ctgtatgcta ctgggacaga 60
ctgttgcatt tgaattgtga tagatttctt tggctacctg tgcataatgt agtttgtagt 120
atcaatgtgt tacaagagtg attgtttctt catgccagag aaaatgaatt gcaatcatca 180
aatggtgttt cataacttg 199
<210> 304
<211> 716
<212> DNA
<213> 人工序列
<220>
<223> 智人TOM1L1 3'-UTR
TOM1L1-001 ENST00000575882
<400> 304
gaagaaagtg gatgatcagc tcactaccac atcaaaggtg ccaactctct aaaacgtaga 60
ctctgtgcag ctttgaagcc tggaagacaa tacctaccaa catgtcaaag ccatggtggc 120
acatttctgc tataatgaag attaaataga ataacagttc caggataaca ctgattcctg 180
acaacagcgt gagatttcaa cagaacttgt ttggaacaaa tactcactta aaacttcagc 240
agaagaaaaa ttacttagtc cttaggccaa ccaatttaac tgcagtgtca tgtttcacag 300
gccttcctac atttagaaat cgtcacacag ctgtgataag agtagattat tttactatga 360
aataattctg aatagatgaa agcataaaat gtgagaaact gaatgtatta ttcaggaaga 420
atactgagtg ccttcattta actaaagttg aatgtaaaag tcaatttgca cttctttata 480
atcctctggt ttagaattat aaattgttaa aaccttgata attgtcattt aattatattt 540
caggtgtcct gaacaggtca ctagactcta cattgggcag cctttaaata tgattctttg 600
taatgctaaa tagccttttt ttctcttttt actgcaactt aatatttcta tttagaacac 660
agaaaatgaa aatatttaga ataagttgta catttgatga caaataaatc actatt 716
<210> 305
<211> 804
<212> DNA
<213> 人工序列
<220>
<223> 智人SLC35A1 3'-UTR
SLC35A1-201 ENST00000369556
<400> 305
ttttagcctc acgtgagact ccttttaaga ctaaaccatt tgcattaaac tagagcctta 60
agtcaatctc agaaggtagc ataaacaaat aaaaattaac tgtatggcat gatcagtgcg 120
gttatgtgga aacaacaaca aacaaacgaa gctatctgag tgaactgcta atacagaaac 180
ttaatgtaga cctgtttggg gtctactatt gttttagaat gaaggaattg tattattgtg 240
tgtatatata atttgtaaat aaaaagtatg gagatgatac ggtgttaaaa aaaatcatgg 300
taaggctaca atactcaagt aacaaggttt gggacaatgt ctaagggtta aagtgccaaa 360
gccatttctg tactaactgt tctcttgttc cggtaccggg gagaaggatg acccctcctt 420
attctccaat tcatgtacag tattttgtcc tagcagcata aagacctagc tcttttctta 480
caagaggcag aaacaagaca ggctagttca taaacaaact gtgtaacttc tcaaaatgaa 540
tctatttcat aactcggaca atttctgggt ggtgactgag taccccttta gtgagtaccc 600
ctttagtgct atatttgtgc cattcattat ctggttcata tttcttttct gttagatgat 660
acacatttct tcaaaaaaat ttctaatgtc acttttgtac ttttttaaat aaagtatgtt 720
taactgttgg gctctcaata atttgtgaaa tttcagtgtt ttctataatg ttaatgggga 780
aattcagcaa taaactttat ttgt 804
<210> 306
<211> 332
<212> DNA
<213> 人工序列
<220>
<223> 智人GLYATL2 3'-UTR
GLYATL2-003 ENST00000532258
<400> 306
ttgattccac tgtccatttc aaatctttct tatcagtaaa aaaacattaa ttcaaacaca 60
agcattgtga tctacattag cacaaaatgc aactgattat ctaggatctg tgtattactt 120
aagctcaccc ttaacagttt taccttcctt ctcctctgta ttcttacaga aaattagaag 180
ctcaatttta tggtctcata atttccttta tgacagacat ctcagaatta aaatcaccca 240
aagccaatca ttagtgccaa gataaccctt taacggcaac actttcttaa atgaagacta 300
tttctttcat gaaaaaattc acttttatga ct 332
<210> 307
<211> 260
<212> DNA
<213> 人工序列
<220>
<223> 智人STAT4 3'-UTR
STAT4-002 ENST00000392320
<400> 307
caggataaac tctgacgcac caagaaagga agcaaatgaa aaagtttaaa gactgttctt 60
tgcccaataa ccacatttta tttcttcagc tttgtaaata ccaggttcta ggaaatgttt 120
gacatctgaa gctctcttca cactcccgtg gcactcctca attgggagtg ttgtgactga 180
aatgcttgaa accaaagctt cagataaact tgcaagataa gacaacttta agaaaccagt 240
gttaataaca atattaacag 260
<210> 308
<211> 270
<212> DNA
<213> 人工序列
<220>
<223> 智人GULP1 3'-UTR
GULP1-002 ENST00000409609
<400> 308
catcaagaac aagaaatcct gattcatgtt aaatgtgttt gtatacacat gtcatttatt 60
attattactt taagataggt attattcatg tgtcaatgtt tttgaatatt ttaatatttt 120
gaaaattttc tcagttaaat ttcctcacct tcactattga tctgtaattt ttattttaaa 180
aacagcttac tgtaaagtag atcatacttt tatgttcctt tctgtttcta ctgtagatga 240
atttgtaatt gaaagacata ttatacaaat 270
<210> 309
<211> 79
<212> DNA
<213> 人工序列
<220>
<223> 智人GULP1 3'-UTR
GULP1-010 ENST00000409805
<400> 309
catcaagaac aagaaatcct gattcatgtt aaatgtgttt gtatacacat gtcatttatt 60
attattactt taagatagg 79
<210> 310
<211> 256
<212> DNA
<213> 人工序列
<220>
<223> 智人EHHADH 3'-UTR
EHHADH-002 ENST00000456310
<400> 310
ttcagtcttc cagattatgc ctcacatgct agcatcaggt aatgctgact gaatttcagt 60
gaaattaaat caaaaatcca aagtaagatt gttctgaaat acaaagcaaa ataaataatc 120
attagaatct tctgtgtaac gactctaatg gtcaaatctt taggaatgtg cttcctatgc 180
ctctgaatct gtccttatca gataaattca atgcatgaac ttgtgtgaat ataataccat 240
aatagctaat gaaaga 256
<210> 311
<211> 640
<212> DNA
<213> 人工序列
<220>
<223> 智人NBEAL1 3'-UTR
NM_001114132.1
<400> 311
ttgttatttc cattttctgt tatgattact gaaacctgat ttattgcttt gtcactttaa 60
ccacatctct caactctctg caatgttgca aggcttttat ccctgaaaat catttacaga 120
taaccacaat ttgctgtggt atataaacta attcttggtc tatactaaga tgtatttgag 180
aaaatacatt tgatttgatt ttgtggccca ttcctaaagg tcattgtatc catttttaaa 240
acaaactaaa atgagaacat taggttcaat tttcttatta ttccaaatga taaaatttaa 300
gatttttcta ataaaagagt acagataatg ggacagttga gagagatggc tttaaataca 360
ttcttaagta atcattttcc tatttactga ccactgtaat gaaaatatat caatttattt 420
atggaactcc tgattgggga taatatttta aaggtatctg ttgcacactt ggattttcaa 480
aactcggtga aagttacaag tttgcatggt aagaataaaa taagaatatt gaaactggta 540
cattagctaa ttctattact acttagcgtg tttctaatga gaagttactg aaatctatta 600
ctgtccttaa taaaaattga gtagaaaaaa gtggaactag 640
<210> 312
<211> 225
<212> DNA
<213> 人工序列
<220>
<223> 智人KIAA1598 3'-UTR
NM_001258299.1
<400> 312
tctgaatcag aaaatactgc aactccttcc tccttttgtc tgccttttgt tctccaaaag 60
taagtggaaa ttacatttcc aagaaaggaa atgaaataat tgcaggccca aggtctgcaa 120
aatatgtgtt gaattgacag tgaaaaggat ccatgtgttg acagacacag ttgttagatg 180
ccataaaggc agatgtgaag ctcaatttat ttctcatctt gcttg 225
<210> 313
<211> 991
<212> DNA
<213> 人工序列
<220>
<223> 智人HFE 3'-UTR
HFE-006 ENST00000317896
<400> 313
cacgcagcct gcagactcac tgtgggaagg agacaaaact agagactcaa agagggagtg 60
catttatgag ctcttcatgt ttcaggagag agttgaacct aaacatagaa attgcctgac 120
gaactccttg attttagcct tctctgttca tttcctcaaa aagatttccc catttaggtt 180
tctgagttcc tgcatgccgg tgatccctag ctgtgacctc tcccctggaa ctgtctctca 240
tgaacctcaa gctgcatcta gaggcttcct tcatttcctc cgtcacctca gagacataca 300
cctatgtcat ttcatttcct atttttggaa gaggactcct taaatttggg ggacttacat 360
gattcatttt aacatctgag aaaagctttg aaccctggga cgtggctagt cataacctta 420
ccagattttt acacatgtat ctatgcattt tctggacccg ttcaactttt cctttgaatc 480
ctctctctgt gttacccagt aactcatctg tcaccaagcc ttggggattc ttccatctga 540
ttgtgatgtg agttgcacag ctatgaaggc tgtacactgc acgaatggaa gaggcacctg 600
tcccagaaaa agcatcatgg ctatctgtgg gtagtatgat gggtgttttt agcaggtagg 660
aggcaaatat cttgaaaggg gttgtgaaga ggtgtttttt ctaattggca tgaaggtgtc 720
atacagattt gcaaagttta atggtgcctt catttgggat gctactctag tattccagac 780
ctgaagaatc acaataattt tctacctggt ctctccttgt tctgataatg aaaattatga 840
taaggatgat aaaagcactt acttcgtgtc cgactcttct gagcacctac ttacatgcat 900
tactgcatgc acttcttaca ataattctat gagataggta ctattatccc catttctttt 960
ttaaatgaag aaagtgaagt aggccgggca c 991
<210> 314
<211> 761
<212> DNA
<213> 人工序列
<220>
<223> 智人HFE 3'-UTR
HFE-004 ENST00000349999
<400> 314
cacgcagcct gcagactcac tgtgggaagg agacaaaact agagactcaa agagggagtg 60
catttatgag ctcttcatgt ttcaggagag agttgaacct aaacatagaa attgcctgac 120
gaactccttg attttagcct tctctgttca tttcctcaaa aagatttccc catttaggtt 180
tctgagttcc tgcatgccgg tgatccctag ctgtgacctc tcccctggaa ctgtctctca 240
tgaacctcaa gctgcatcta gaggcttcct tcatttcctc cgtcacctca gagacataca 300
cctatgtcat ttcatttcct atttttggaa gaggactcct taaatttggg ggacttacat 360
gattcatttt aacatctgag aaaagctttg aaccctggga cgtggctagt cataacctta 420
ccagattttt acacatgtat ctatgcattt tctggacccg ttcaactttt cctttgaatc 480
ctctctctgt gttacccagt aactcatctg tcaccaagcc ttggggattc ttccatctga 540
ttgtgatgtg agttgcacag ctatgaaggc tgtacactgc acgaatggaa gaggcacctg 600
tcccagaaaa agcatcatgg ctatctgtgg gtagtatgat gggtgttttt agcaggtagg 660
aggcaaatat cttgaaaggg gttgtgaaga ggtgtttttt ctaattggca tgaaggtgtc 720
atacagattt gcaaagttta atggtgcctt catttgggat g 761
<210> 315
<211> 142
<212> DNA
<213> 人工序列
<220>
<223> 智人HFE 3'-UTR
HFE-005 ENST00000397022
<400> 315
cacgcagcct gcagactcac tgtgggaagg agacaaaact agagactcaa agagggagtg 60
catttatgag ctcttcatgt ttcaggagag agttgaacct aaacatagaa attgcctgac 120
gaactccttg attttagcct tc 142
<210> 316
<211> 31
<212> DNA
<213> 人工序列
<220>
<223> 智人HFE 3'-UTR
HFE-012 ENST00000336625
<400> 316
cacgcagcct gcagactcac tgtgggaagg a 31
<210> 317
<211> 394
<212> DNA
<213> 人工序列
<220>
<223> 智人KIAA1324L 3'-UTR
KIAA1324L-005 ENST00000416314
<400> 317
agagacagtg ctgtagcctt gagactaatg aacaaagaaa cctgctctag ttttacagga 60
ccatatttta gggtctgtcc tcatacctgt cacattggtg atctcacaga ggagggccat 120
gccgctgaaa agggaaggag attgaaacat ttgattgcct tatcacatgg tcaagtacct 180
tgccaaataa aggaaagcaa atgatttggg tctcaactga agatgaagct caactcagga 240
agagatttat ctgtatatac acataactga aaaccaagtt taagcccacc aatgcactgc 300
tgatgcatgc catataatta atgggtaact tttattcttt atgatgtcta cataacaagt 360
gtgatttgga aggcacatgt gagcatatgc atta 394
<210> 318
<211> 743
<212> DNA
<213> 人工序列
<220>
<223> 智人MANSC1 NM_018050 3'-UTR
<400> 318
ggatggaact cggtgtctct taattcattt agtaaccaga agcccaaatg caatgagttt 60
ctgctgactt gctagtctta gcaggaggtt gtattttgaa gacaggaaaa tgcccccttc 120
tgctttcctt tttttttttt ggagacagag tcttgctttg ttgcccaggc tggagtgcag 180
tagcacgatc tcggctctca ccgcaacctc cgtctcctgg gttcaagcga ttctcctgcc 240
tcagcctcct aagtatctgg gattacaggc atgtgccacc acacctgggt gatttttgta 300
tttttagtag agacggggtt tcaccatgtt ggtcaggctg gtctcaaact cctgacctag 360
tgatccaccc tcctcggcct cccaaagtgc tgggattaca ggcatgagcc accacagctg 420
gcccccttct gttttatgtt tggtttttga gaaggaatga agtgggaacc aaattaggta 480
attttgggta atctgtctct aaaatattag ctaaaaacaa agctctatgt aaagtaataa 540
agtataattg ccatataaat ttcaaaattc aactggcttt tatgcaaaga aacaggttag 600
gacatctagg ttccaattca ttcacattct tggttccaga taaaatcaac tgtttatatc 660
aatttctaat ggatttgctt ttctttttat atggattcct ttaaaactta ttccagatgt 720
agttccttcc aattaaatat ttg 743
<210> 319
<211> 142
<212> DNA
<213> 人工序列
<220>
<223> 智人LTA4H 5'-UTR
LTA4H-001 ENST00000228740
<400> 319
aagaaacttc ctttcccggc gtgcaccgcg aatccctcct cctcttcttt acctctctcc 60
ctcctcctca ggttctctat cgacgagtct ggtagctgag cgttgggctg taggtcgctg 120
tgctgtgtga tcccccagag cc 142
<210> 320
<211> 88
<212> DNA
<213> 人工序列
<220>
<223> 智人DECR1 5'-UTR
DECR1-001 ENST00000220764
<400> 320
tccagccccg agaactttgt tctttttgtc ccgccccctg cgcccaaccg cctgcgccgc 60
cttccggccc gagttctgga gactcaac 88
<210> 321
<211> 45
<212> DNA
<213> 人工序列
<220>
<223> 智人PIGK 5'-UTR
<400> 321
actgcctccg ccccttcagg tgcgggaagt ctgaagccgg taaac 45
<210> 322
<211> 122
<212> DNA
<213> 人工序列
<220>
<223> 智人BRP44L 5'-UTR
BRP44L-001
<400> 322
gtcgtgaggc gggccttcgg gctggctcgc cgtcggctgc cggggggttg gccggggtgt 60
cattggctct gggaagcggc agcagaggca gggaccactc ggggtctggt gtcggcacag 120
cc 122
<210> 323
<211> 117
<212> DNA
<213> 人工序列
<220>
<223> 智人ACADSB 5'-UTR
ACADSB-004 NM_001609.3 ENST00000368869
<400> 323
agggattaag ggggggtgtg tgcggggcgg gtactgagtg ggcggggcct tgctcgggta 60
actcccaggg gctggctaga gacccagagg cgcagagcgg agaggcctgc ggcgagg 117
<210> 324
<211> 166
<212> DNA
<213> 人工序列
<220>
<223> 智人SUPT3H 5'-UTR
SUPT3H-006 ENST00000371459
<400> 324
cacagccgag tcaccttttc cctttctaca ctccacactc tcagtccccc accccgcccc 60
tttccaagcg tgtcccgggc cgcagcagca gaaaccgcac catctccacc cccacattct 120
cctcgcggga agcgcagcag tgcctccaag ggttcttaaa gcagag 166
<210> 325
<211> 176
<212> DNA
<213> 人工序列
<220>
<223> 智人TMEM14A 5'-UTR
NM_014051.3
<400> 325
gtttccagga gggagcggcc tttgctcagc gcgagacggc tgggcgccga gtgggacagc 60
gctggtgcgg agactgcttc cggactccag gtaccgcgct tggcggcagc tggccccaga 120
cttctgtctt ttcagctgca gtgaaggctc ggggctgcag aattgcaacc ttgcca 176
<210> 326
<211> 222
<212> DNA
<213> 人工序列
<220>
<223> 智人C9orf46 5'-UTR
AF225420.1
<400> 326
gagcgaggcc cggtccctgc agcgggcgaa aggagcccgg gcctggaggt ttgcgtaccg 60
gtcgcctggt cccggcacca gcgccgccca gtgtggtttc ccataaggaa gctcttcttc 120
ctgcttggct tccaccttta acccttccac ctgggagcgt cctctaacac attcagacta 180
caagtccaga cccaggagag caaggcccag aaagaggtca aa 222
<210> 327
<211> 227
<212> DNA
<213> 人工序列
<220>
<223> 智人ANXA4 5'-UTR
NM_001153.3
<400> 327
gccccaggtg cgcttcccct agagagggat tttccggtct cgtgggcaga ggaacaacca 60
ggaacttggg ctcagtctcc accccacagt ggggcggatc cgtcccggat aagacccgct 120
gtctggccct gagtagggtg tgacctccgc agccgcagag gaggagcgca gcccggcctc 180
gaagaacttc tgcttgggtg gctgaactct gatcttgacc tagagtc 227
<210> 328
<211> 123
<212> DNA
<213> 人工序列
<220>
<223> 智人IFI6 5'-UTR
NM_022873.2
<400> 328
ccagccttca gccggagaac cgtttactcg ctgctgtgcc catctatcag caggctccgg 60
gctgaagatt gcttctcttc tctcctccaa ggtctagtga cggagcccgc gcgcggcgcc 120
acc 123
<210> 329
<211> 58
<212> DNA
<213> 人工序列
<220>
<223> 智人C2orf34 5'-UTR
CAMKMT -008 ENST00000402247
<400> 329
tcctggcagg ggacgagctg cggcggtggc acctccgggt gtggaaggct ccagtgag 58
<210> 330
<211> 104
<212> DNA
<213> 人工序列
<220>
<223> 智人C2orf34 5'-UTR
NM_024766.3
<400> 330
gagggtgccg ggcgtcacag gtcctgacag ggaagaagtt ggcaggtcct ggcaggggac 60
gagctgcggc ggtggcacct ccgggtgtgg aaggctccag tgag 104
<210> 331
<211> 53
<212> DNA
<213> 人工序列
<220>
<223> 智人ALDH6A1 5'-UTR
ALDH6A1-002 ENST00000350259
<400> 331
agtgcttctg ggcagtagag gcgcggggtg cggagctagg gcggccgaga gcc 53
<210> 332
<211> 117
<212> DNA
<213> 人工序列
<220>
<223> 智人CCDC53 5'-UTR
CCDC53-002 ENST00000545679
<400> 332
ggaagggccc cggaggcggg cacttggggg gaaagttgag acgtgattac cgggttgggc 60
gggccccatc tgggaggggt ttgtgggtga actcggggtc caccgcccgc tgaggag 117
<210> 333
<211> 44
<212> DNA
<213> 人工序列
<220>
<223> 智人CASP1 5'-UTR
NM_001257119.1
<400> 333
atactttcag tttcagtcac acaagaaggg aggagagaaa agcc 44
<210> 334
<211> 124
<212> DNA
<213> 人工序列
<220>
<223> 智人NDUFB6 5'-UTR
NM_182739.2
<400> 334
gtaataaccg cgcgcggcgc tcggcgttcc cgcaaggtcg ctttgcagag cgggagcgcg 60
cttaagtaac tagtccgtag ttcgagggtg cgccgtgtcc ttttgcgttg gtaccagcgg 120
cgac 124
<210> 335
<211> 47
<212> DNA
<213> 人工序列
<220>
<223> 智人BCKDHB 5'-UTR
BCKDHB-002 ENST00000369760
<400> 335
aggcggcgtg cggctgcata gcctgagaat cccggtggtg agcgggg 47
<210> 336
<211> 39
<212> DNA
<213> 人工序列
<220>
<223> 智人BCKDHB 5'-UTR
NM_001164783.1
<400> 336
ctacgtgagt gccggaccgc tgagtggttg ttagccaag 39
<210> 337
<211> 234
<212> DNA
<213> 人工序列
<220>
<223> 智人BBS2 5'-UTR
NM_031885.3
<400> 337
cacagaaggc gccgaggctc caccgcgcag ccgcaaaaag agcggacggg tctgcgccgc 60
cgcaggagga gcaggcggta cctggacggg ttcgtcccgg gctgtttcgc gtccggcctg 120
aggcggctgg ggccgcgcag gtagtgtccc tgcacttctt gcccgggcgc gtgaggccag 180
ctccgctgcg cttgtctcca gcttccagcc ctcctcccct aagccgccgc catc 234
<210> 338
<211> 153
<212> DNA
<213> 人工序列
<220>
<223> 智人HERC5 5'-UTR
HERC5-001 ENST00000264350
<400> 338
tcagtagctg aggctgcggt tccccgacgc cacgcagctg cgcgcagctg gttcccgctc 60
tgcagcgcaa cgcctgaggc agtgggcgcg ctcagtcccg ggaccaggcg ttctctcctc 120
tcgcctctgg gcctgggacc ccgcaaagcg gcg 153
<210> 339
<211> 65
<212> DNA
<213> 人工序列
<220>
<223> 智人FAM175A 5'-UTR
NM_139076.2
<400> 339
accacagggt cttgcctccg cgcgccccgc cctcgtcctc ttgtgtagcc tgaggcggcg 60
gtagc 65
<210> 340
<211> 82
<212> DNA
<213> 人工序列
<220>
<223> 智人NT5DC1 5'-UTR
NT5DC1-002 ENST00000319550
<400> 340
cggtcctgtc ccgcagcgtc ccgccagcca gctccttgca cccttcgcgg ccgaggcgct 60
ccctggtgct ccccgcgcag cc 82
<210> 341
<211> 246
<212> DNA
<213> 人工序列
<220>
<223> 智人RAB7A 5'-UTR
RAB7A-001 ENST00000265062
<400> 341
gtctcgtgac aggtacttcc gctcggggcg gcggcggtgg cggaagtggg agcgggcctg 60
gagtcttggc cataaagcct gaggcggcgg cagcggcgga gttggcggct tggagagctc 120
gggagagttc cctggaacca gaacttggac cttctcgctt ctgtcctccg tttagtctcc 180
tcctcggcgg gagccctcgc gacgcgcccg gcccggagcc cccagcgcag cggccgcgtt 240
tgaagg 246
<210> 342
<211> 128
<212> DNA
<213> 人工序列
<220>
<223> 智人AGA 5'-UTR
AGA-001 ENST00000264595
<400> 342
agggacgcct gagcgaaccc ccgagagagc gggcgtgggc gccaggcggg cggggcactg 60
gggattaatt gttcggcgat cgctggctgc cgggactttt ctcgcgctgg tctcttcggt 120
ggtcaggg 128
<210> 343
<211> 103
<212> DNA
<213> 人工序列
<220>
<223> 智人TPK1 5'-UTR
TPK1-001 ENST00000360057
<400> 343
aaggctcctc agccgagcgc cgagcggtcg atcgccgtag ctcccgcagc ctgcgatctc 60
cagtctgtgg ctcctaccag ccattgtagg ccaataatcc gtt 103
<210> 344
<211> 79
<212> DNA
<213> 人工序列
<220>
<223> 智人MBNL3 5'-UTR
MBNL3-001 ENST00000370839
<400> 344
aattcatttt taatccttta atagtccaca gtaatattgt cctaaagagg gtacattgga 60
ttttaatttt gctttcaat 79
<210> 345
<211> 129
<212> DNA
<213> 人工序列
<220>
<223> 智人MCCC2 5'-UTR
MCCC2-001 ENST00000340941
<400> 345
agaatcagag aaaccttctc tggggctgca aggacctgag ctcagcttcc gccccagcca 60
gggaagcggc aggggaaagc accggctcca ggccagcgtg ggccgctctc tcgctcggtg 120
cccgccgcc 129
<210> 346
<211> 89
<212> DNA
<213> 人工序列
<220>
<223> 智人CAT 5'-UTR
CAT-001 ENST00000241052
<400> 346
actcggggca acaggcagat ttgcctgctg agggtggaga cccacgagcc gaggcctcct 60
gcagtgttct gcacagcaaa ccgcacgct 89
<210> 347
<211> 142
<212> DNA
<213> 人工序列
<220>
<223> 智人ANAPC4 5'-UTR
ANAPC4-001 ENST00000315368
<400> 347
cccgacgccg gaagtgcctg gagcgcgcga cagcggcggg gcggggcggc ctggaggctg 60
tggcgcgcgg ccggcagagg gaggggagag gccactgggg ccgtgttagt ctgccggtgg 120
ggactcttgc agggccgtcc cc 142
<210> 348
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 智人PHKB 5'-UTR
PHKB-002 ENST00000323584
<400> 348
ggccaaggcg gcgaccggag cgcg 24
<210> 349
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 智人ABCB7 5'-UTR
ABCB7-001 ENST00000253577
<400> 349
ctcggttcct ctttcctcgc tcaag 25
<210> 350
<211> 133
<212> DNA
<213> 人工序列
<220>
<223> 智人GPD2 5'-UTR
GPD2-002 ENST00000438166
<400> 350
cccgcgcgcc tcgctgggag cacccgggcc gaggctctga ttctgggggg aggccgactc 60
caccctggct ggaggaactg ggtgctcctg cccgctggcc cctcgcgcgt gaggatctat 120
ctcaggctaa gaa 133
<210> 351
<211> 117
<212> DNA
<213> 人工序列
<220>
<223> 智人TMEM38B 5'-UTR
TMEM38B-001 ENST00000374692
<400> 351
gctggagccg gcgcggagga gcgggcggcc gcggctgtgc cctctcctac tcctcaccgc 60
gcgagcgcgg ggaaccagta gccgcggctg cttcggttgc cgcggtcggt ggtcgtt 117
<210> 352
<211> 206
<212> DNA
<213> 人工序列
<220>
<223> 智人NFU1 5'-UTR
NM_001002755.2
<400> 352
gggaaaggtt ccccggcctc tcttggtcag ggtgacgcag tagcctgcaa acctcggcgc 60
gtaggccacc gcacttatcc gcagcaggac cgcccgcagc cggtagggtg ggctcttccc 120
agtgcccgcc cagctaccgg ccagcctgcg gctgcgcaga tctttcgtgg ttctgtcagg 180
gagaccctta ggcactccgg actaag 206
<210> 353
<211> 99
<212> DNA
<213> 人工序列
<220>
<223> 智人LOC128322/NUTF2 5'-UTR
NM_005796.1
<400> 353
ggaagggaca gtcggccgca gaccgcgctg ggttgccgct gccgctgccg ccatcgtgcc 60
agcccctcgg gtctccgtga ggccgggtga cgctccaga 99
<210> 354
<211> 55
<212> DNA
<213> 人工序列
<220>
<223> 智人NUBPL 5'-UTR
NM_025152.2
<400> 354
actccgcgcc acccgcgaca gtttcccagc agggctcaca gcagcgttcc gcgtc 55
<210> 355
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 智人LANCL1 5'-UTR
LANCL1-004 ENST00000233714
<400> 355
gagaagggct tcaggacgcg ggaggcgcac ttgcttcaag tcgcgggcgt gggaacgggg 60
cttgcttccg gcgtc 75
<210> 356
<211> 204
<212> DNA
<213> 人工序列
<220>
<223> 智人PIR 5'-UTR
PIR-002 ENST00000380420
<400> 356
cctcccgcct cctctaggcc gccggccgcg aagcgctgag tcacggtgag gctactggac 60
ccacactctc ttaacctgcc ctccctgcac tcgctcccgg cggctcttcg cgtcaccccc 120
gccgctaagg ctccaggtgc cgctaccgca gcccctccat cctctacagc tcagcatcag 180
aacactctct ttttagactc cgat 204
<210> 357
<211> 65
<212> DNA
<213> 人工序列
<220>
<223> 智人CTBS 5'-UTR
NM_004388.2
<400> 357
gacgcgcagc aggccccgcc cacccaggcg gtaggaaccc actccggccc gctagacctg 60
ctgct 65
<210> 358
<211> 314
<212> DNA
<213> 人工序列
<220>
<223> 智人GSTM4 5'-UTR
NM_000850.4
<400> 358
aagctggcga ggccgagccc ctcctagtgc ttccggacct tgctccctga acactcggag 60
gtggcggtgg atcttactcc ttccagccag tgaggatcca gcaacctgct ccgtgcctcc 120
cgcgcctgtt ggttggaagt gacgaccttg aagatcggcc ggttggaagt gacgaccttg 180
aagatcggcg ggcgcagcgg ggccgagggg gcgggtctgg cgctaggtcc agcccctgcg 240
tgccgggaac cccagaggag gtcgcagttc agcccagctg aggcctgtct gcagaatcga 300
caccaaccag catc 314
<210> 359
<211> 73
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Ndufa1 5'-UTR
Ndufa1-001 ENSMUST00000016571
<400> 359
gccggaagag aggtaaagcc gggtcacctc tgaggagccg gtgacgggtt ggcgtgcgag 60
taacggtgcg gag 73
<210> 360
<211> 105
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Atp5e 5'-UTR
NM_025983
<400> 360
cccacccctt ccgctactca ggcctgacct tcctgctgcc gggccggttt gaggctactc 60
tgaagcgacc cagcggttct gcccgacgcg cccgctcgag acacc 105
<210> 361
<211> 100
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Gstm5 5'-UTR
NM_010360
<400> 361
gagacagttc ggtcgcgtca gcccggccca cagcgtccag tataaagtta gccgcccaca 60
gtccatcgct gtatccccga aggggctaag atcgcccaaa 100
<210> 362
<211> 49
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Cbr2 5'-UTR
NM_007621
<400> 362
ataaaagctg agcccatctc ttgcttcgga agaagctggt gtcagcagc 49
<210> 363
<211> 78
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Anapc13 5'-UTR
NM_181394
<400> 363
gtgacccaga agaagggcgg ggccgggagg aagccgacgc gcgcgcagtg ggcctgacaa 60
gatcaaagct gcaggagg 78
<210> 364
<211> 16
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Ndufa7 5'-UTR
NM_023202
<400> 364
tcggagcgga aggaat 16
<210> 365
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Atp5k 5'-UTR
NM_007507
<400> 365
cgaaggtcac ggacaaa 17
<210> 366
<211> 67
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Cox4i1 5'-UTR
NM_009941
<400> 366
cttccggtcg cgagcacccc agggtgtaga gggcggtcgc ggcggtcgcc tgggcagcgg 60
tggcaga 67
<210> 367
<211> 36
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Ndufs6 5'-UTR
NM_010888
<400> 367
ttggtacgac gcgtggggtc aagggtcacc ggcaag 36
<210> 368
<211> 90
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Sec61b 5'-UTR
NM_024171
<400> 368
agagcctgta tctacgagag ttctgagtgc tcggcaactt cacgacttcc ctcttcctgc 60
ctcctgtgcc caccgttctt aggcatcagc 90
<210> 369
<211> 55
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Snrpd2 5'-UTR
NM_026943
<400> 369
aaggctggag caacgcgctt ggaggcggga gtgatctgcg agcgaaacct acacc 55
<210> 370
<211> 54
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Mgst3 5'-UTR
NM_025569
<400> 370
actgctgtgc ttctcaggtc tgtaccaggc gcacgaaggt gagccagagc caag 54
<210> 371
<211> 54
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Mp68 (2010107E04Rik) 5'-UTR
NM_027360
<400> 371
ctttcccatt ctgtagcaga atttggtgtt gcctgtggtc ttggtcccgc ggag 54
<210> 372
<211> 92
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Prdx4-001, 5'-UTR
NM_016764
<400> 372
gcgcggtctc cagcgcgccg ttttagctgg ctgcctggcg gcaggggact ctgtgcttta 60
gcagagggac gtgttttcgc gcttgcttgg tc 92
<210> 373
<211> 215
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Pgcp 5'-UTR
NM_176073
<400> 373
gctgtcctgg cacacaaaga agccaggcct gcagactact ggggctccgg gctgttcctg 60
aggcctctgg aggcccgccc tgtggctcca gtgcgctctg aggaccttcc tggtcccgcc 120
cccgaacgtg cctgtggtct gcaggcctca ccgggtgttg tggccgctgc tgctccgcag 180
agcctcgtga tcaggaagaa aagcaactag gaaca 215
<210> 374
<211> 43
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Myeov2 5'-UTR
NM_001163425
<400> 374
agaaggggct ggccggaagt gagcgcaacg ccgccttgtc gag 43
<210> 375
<211> 81
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Ndufa4 5'-UTR
NM_010886
<400> 375
gtccgctcag ccaggttgca gaagcggctt agcgtgtgtc ctaatcttct ctctgcgtgt 60
aggtaggcct gtgccgcaaa c 81
<210> 376
<211> 76
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Ndufs5 5'-UTR
NM_001030274
<400> 376
acggcaggcg tctgcgtcct cccgcagccg gcggtcggga attgcaccag ggacctgaca 60
agggcactgc agagcc 76
<210> 377
<211> 198
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Gstm1 5'-UTR
NM_010358
<400> 377
ctgccttccg ctttagggtc tgctgctctg gttacagacc taggaagggg agtgcctaat 60
tgggattggt gcagggttgg gagggacccg ctgttttgtc ctgcccacgt ttctctagta 120
gtctgtataa agtcacaact ccaaacacac aggtcagtcc tgctgaagcc agtttgagaa 180
gaccacagca ccagcacc 198
<210> 378
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Atp5o 5'-UTR
NM_138597
<400> 378
ctggcgcgcg cgcgtgcgct ctggcgccag tagtctcttt tcatttgggt ttgacctaca 60
gccgcccggg aaaag 75
<210> 379
<211> 101
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Tspo 5'-UTR
NM_009775
<400> 379
gtcagcggct accaacctct gtgcgcagtg tccttcacgg aacaaccagc gactgcgtga 60
gcggggctgt ggatctttcc agaacatcag ttgcaatcac c 101
<210> 380
<211> 62
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Taldo1 5'-UTR
NM_011528
<400> 380
gacgcgcggg gcattgtggg ttagcacgca ccggctaccg cctcagctgt tcgcgtttcg 60
cc 62
<210> 381
<211> 89
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Bloc1s1 5'-UTR
NM_015740
<400> 381
gtgacgcctt ccgggtgagc caaggcatag tccagttcct gcagccttag ggaggggtcc 60
gccgtgccca cacccagcca gactcgacc 89
<210> 382
<211> 57
<212> DNA
<213> 人工序列
<220>
<223> 小家鼠Hexa 5'-UTR
NM_010421
<400> 382
agctgaccgg ggctcacgtg ggctcagcct gctggaaggg gagctggccg gtgggcc 57
<210> 383
<211> 1810
<212> RNA
<213> 人工序列
<220>
<223> 32L4 - PpLuc(GC) - A64-C30-hSL
<400> 383
gggagaaagc uugaggaugg aggacgccaa gaacaucaag aagggcccgg cgcccuucua 60
cccgcuggag gacgggaccg ccggcgagca gcuccacaag gccaugaagc gguacgcccu 120
ggugccgggc acgaucgccu ucaccgacgc ccacaucgag gucgacauca ccuacgcgga 180
guacuucgag augagcgugc gccuggccga ggccaugaag cgguacggcc ugaacaccaa 240
ccaccggauc guggugugcu cggagaacag ccugcaguuc uucaugccgg ugcugggcgc 300
ccucuucauc ggcguggccg ucgccccggc gaacgacauc uacaacgagc gggagcugcu 360
gaacagcaug gggaucagcc agccgaccgu gguguucgug agcaagaagg gccugcagaa 420
gauccugaac gugcagaaga agcugcccau cauccagaag aucaucauca uggacagcaa 480
gaccgacuac cagggcuucc agucgaugua cacguucgug accagccacc ucccgccggg 540
cuucaacgag uacgacuucg ucccggagag cuucgaccgg gacaagacca ucgcccugau 600
caugaacagc agcggcagca ccggccugcc gaagggggug gcccugccgc accggaccgc 660
cugcgugcgc uucucgcacg cccgggaccc caucuucggc aaccagauca ucccggacac 720
cgccauccug agcguggugc cguuccacca cggcuucggc auguucacga cccugggcua 780
ccucaucugc ggcuuccggg ugguccugau guaccgguuc gaggaggagc uguuccugcg 840
gagccugcag gacuacaaga uccagagcgc gcugcucgug ccgacccugu ucagcuucuu 900
cgccaagagc acccugaucg acaaguacga ccugucgaac cugcacgaga ucgccagcgg 960
gggcgccccg cugagcaagg aggugggcga ggccguggcc aagcgguucc accucccggg 1020
cauccgccag ggcuacggcc ugaccgagac cacgagcgcg auccugauca cccccgaggg 1080
ggacgacaag ccgggcgccg ugggcaaggu ggucccguuc uucgaggcca agguggugga 1140
ccuggacacc ggcaagaccc ugggcgugaa ccagcggggc gagcugugcg ugcgggggcc 1200
gaugaucaug agcggcuacg ugaacaaccc ggaggccacc aacgcccuca ucgacaagga 1260
cggcuggcug cacagcggcg acaucgccua cugggacgag gacgagcacu ucuucaucgu 1320
cgaccggcug aagucgcuga ucaaguacaa gggcuaccag guggcgccgg ccgagcugga 1380
gagcauccug cuccagcacc ccaacaucuu cgacgccggc guggccgggc ugccggacga 1440
cgacgccggc gagcugccgg ccgcgguggu ggugcuggag cacggcaaga ccaugacgga 1500
gaaggagauc gucgacuacg uggccagcca ggugaccacc gccaagaagc ugcggggcgg 1560
cgugguguuc guggacgagg ucccgaaggg ccugaccggg aagcucgacg cccggaagau 1620
ccgcgagauc cugaucaagg ccaagaaggg cggcaagauc gccguguaag acuaguagau 1680
cuaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1740
aaaaaaugca uccccccccc cccccccccc cccccccccc ccaaaggcuc uuuucagagc 1800
caccagaauu 1810
<210> 384
<211> 1927
<212> RNA
<213> 人工序列
<220>
<223> PpLuc(GC) - morn2- A64 - C30 - hSL
<400> 384
gggagaaagc uugaggaugg aggacgccaa gaacaucaag aagggcccgg cgcccuucua 60
cccgcuggag gacgggaccg ccggcgagca gcuccacaag gccaugaagc gguacgcccu 120
ggugccgggc acgaucgccu ucaccgacgc ccacaucgag gucgacauca ccuacgcgga 180
guacuucgag augagcgugc gccuggccga ggccaugaag cgguacggcc ugaacaccaa 240
ccaccggauc guggugugcu cggagaacag ccugcaguuc uucaugccgg ugcugggcgc 300
ccucuucauc ggcguggccg ucgccccggc gaacgacauc uacaacgagc gggagcugcu 360
gaacagcaug gggaucagcc agccgaccgu gguguucgug agcaagaagg gccugcagaa 420
gauccugaac gugcagaaga agcugcccau cauccagaag aucaucauca uggacagcaa 480
gaccgacuac cagggcuucc agucgaugua cacguucgug accagccacc ucccgccggg 540
cuucaacgag uacgacuucg ucccggagag cuucgaccgg gacaagacca ucgcccugau 600
caugaacagc agcggcagca ccggccugcc gaagggggug gcccugccgc accggaccgc 660
cugcgugcgc uucucgcacg cccgggaccc caucuucggc aaccagauca ucccggacac 720
cgccauccug agcguggugc cguuccacca cggcuucggc auguucacga cccugggcua 780
ccucaucugc ggcuuccggg ugguccugau guaccgguuc gaggaggagc uguuccugcg 840
gagccugcag gacuacaaga uccagagcgc gcugcucgug ccgacccugu ucagcuucuu 900
cgccaagagc acccugaucg acaaguacga ccugucgaac cugcacgaga ucgccagcgg 960
gggcgccccg cugagcaagg aggugggcga ggccguggcc aagcgguucc accucccggg 1020
cauccgccag ggcuacggcc ugaccgagac cacgagcgcg auccugauca cccccgaggg 1080
ggacgacaag ccgggcgccg ugggcaaggu ggucccguuc uucgaggcca agguggugga 1140
ccuggacacc ggcaagaccc ugggcgugaa ccagcggggc gagcugugcg ugcgggggcc 1200
gaugaucaug agcggcuacg ugaacaaccc ggaggccacc aacgcccuca ucgacaagga 1260
cggcuggcug cacagcggcg acaucgccua cugggacgag gacgagcacu ucuucaucgu 1320
cgaccggcug aagucgcuga ucaaguacaa gggcuaccag guggcgccgg ccgagcugga 1380
gagcauccug cuccagcacc ccaacaucuu cgacgccggc guggccgggc ugccggacga 1440
cgacgccggc gagcugccgg ccgcgguggu ggugcuggag cacggcaaga ccaugacgga 1500
gaaggagauc gucgacuacg uggccagcca ggugaccacc gccaagaagc ugcggggcgg 1560
cgugguguuc guggacgagg ucccgaaggg ccugaccggg aagcucgacg cccggaagau 1620
ccgcgagauc cugaucaagg ccaagaaggg cggcaagauc gccguguaag acuaguaccu 1680
gcugccuuaa cgcugagaug uggccucugc aaccccccuu aggcaaagca acugaaccuu 1740
cugcuaaagu gaccugcccu cuuccguaag uccaauaaag uugucaugca cccagaucua 1800
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1860
aaaugcaucc cccccccccc cccccccccc ccccccccca aaggcucuuu ucagagccac 1920
cagaauu 1927
<210> 385
<211> 1943
<212> RNA
<213> 人工序列
<220>
<223> PpLuc(GC) - ndufa1- A64 - C30 - hSL
<400> 385
gggagaaagc uugaggaugg aggacgccaa gaacaucaag aagggcccgg cgcccuucua 60
cccgcuggag gacgggaccg ccggcgagca gcuccacaag gccaugaagc gguacgcccu 120
ggugccgggc acgaucgccu ucaccgacgc ccacaucgag gucgacauca ccuacgcgga 180
guacuucgag augagcgugc gccuggccga ggccaugaag cgguacggcc ugaacaccaa 240
ccaccggauc guggugugcu cggagaacag ccugcaguuc uucaugccgg ugcugggcgc 300
ccucuucauc ggcguggccg ucgccccggc gaacgacauc uacaacgagc gggagcugcu 360
gaacagcaug gggaucagcc agccgaccgu gguguucgug agcaagaagg gccugcagaa 420
gauccugaac gugcagaaga agcugcccau cauccagaag aucaucauca uggacagcaa 480
gaccgacuac cagggcuucc agucgaugua cacguucgug accagccacc ucccgccggg 540
cuucaacgag uacgacuucg ucccggagag cuucgaccgg gacaagacca ucgcccugau 600
caugaacagc agcggcagca ccggccugcc gaagggggug gcccugccgc accggaccgc 660
cugcgugcgc uucucgcacg cccgggaccc caucuucggc aaccagauca ucccggacac 720
cgccauccug agcguggugc cguuccacca cggcuucggc auguucacga cccugggcua 780
ccucaucugc ggcuuccggg ugguccugau guaccgguuc gaggaggagc uguuccugcg 840
gagccugcag gacuacaaga uccagagcgc gcugcucgug ccgacccugu ucagcuucuu 900
cgccaagagc acccugaucg acaaguacga ccugucgaac cugcacgaga ucgccagcgg 960
gggcgccccg cugagcaagg aggugggcga ggccguggcc aagcgguucc accucccggg 1020
cauccgccag ggcuacggcc ugaccgagac cacgagcgcg auccugauca cccccgaggg 1080
ggacgacaag ccgggcgccg ugggcaaggu ggucccguuc uucgaggcca agguggugga 1140
ccuggacacc ggcaagaccc ugggcgugaa ccagcggggc gagcugugcg ugcgggggcc 1200
gaugaucaug agcggcuacg ugaacaaccc ggaggccacc aacgcccuca ucgacaagga 1260
cggcuggcug cacagcggcg acaucgccua cugggacgag gacgagcacu ucuucaucgu 1320
cgaccggcug aagucgcuga ucaaguacaa gggcuaccag guggcgccgg ccgagcugga 1380
gagcauccug cuccagcacc ccaacaucuu cgacgccggc guggccgggc ugccggacga 1440
cgacgccggc gagcugccgg ccgcgguggu ggugcuggag cacggcaaga ccaugacgga 1500
gaaggagauc gucgacuacg uggccagcca ggugaccacc gccaagaagc ugcggggcgg 1560
cgugguguuc guggacgagg ucccgaaggg ccugaccggg aagcucgacg cccggaagau 1620
ccgcgagauc cugaucaagg ccaagaaggg cggcaagauc gccguguaag acuaguggaa 1680
gcauuuuccu ggcugauuaa aagaaauuac ucagcuaugg ucaucuguuc cuguuagaag 1740
gcuaugcagc auauuauaua cuaugcgcau guuaugaaau gcauaauaaa aaauuuuaaa 1800
aaaucuaaaa gaucuaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1860
aaaaaaaaaa aaaaaaaaau gcaucccccc cccccccccc cccccccccc cccccaaagg 1920
cucuuuucag agccaccaga auu 1943
<210> 386
<211> 1941
<212> RNA
<213> 人工序列
<220>
<223> PpLuc(GC) - NDUFA1- A64 - C30 - hSL
<400> 386
gggagaaagc uugaggaugg aggacgccaa gaacaucaag aagggcccgg cgcccuucua 60
cccgcuggag gacgggaccg ccggcgagca gcuccacaag gccaugaagc gguacgcccu 120
ggugccgggc acgaucgccu ucaccgacgc ccacaucgag gucgacauca ccuacgcgga 180
guacuucgag augagcgugc gccuggccga ggccaugaag cgguacggcc ugaacaccaa 240
ccaccggauc guggugugcu cggagaacag ccugcaguuc uucaugccgg ugcugggcgc 300
ccucuucauc ggcguggccg ucgccccggc gaacgacauc uacaacgagc gggagcugcu 360
gaacagcaug gggaucagcc agccgaccgu gguguucgug agcaagaagg gccugcagaa 420
gauccugaac gugcagaaga agcugcccau cauccagaag aucaucauca uggacagcaa 480
gaccgacuac cagggcuucc agucgaugua cacguucgug accagccacc ucccgccggg 540
cuucaacgag uacgacuucg ucccggagag cuucgaccgg gacaagacca ucgcccugau 600
caugaacagc agcggcagca ccggccugcc gaagggggug gcccugccgc accggaccgc 660
cugcgugcgc uucucgcacg cccgggaccc caucuucggc aaccagauca ucccggacac 720
cgccauccug agcguggugc cguuccacca cggcuucggc auguucacga cccugggcua 780
ccucaucugc ggcuuccggg ugguccugau guaccgguuc gaggaggagc uguuccugcg 840
gagccugcag gacuacaaga uccagagcgc gcugcucgug ccgacccugu ucagcuucuu 900
cgccaagagc acccugaucg acaaguacga ccugucgaac cugcacgaga ucgccagcgg 960
gggcgccccg cugagcaagg aggugggcga ggccguggcc aagcgguucc accucccggg 1020
cauccgccag ggcuacggcc ugaccgagac cacgagcgcg auccugauca cccccgaggg 1080
ggacgacaag ccgggcgccg ugggcaaggu ggucccguuc uucgaggcca agguggugga 1140
ccuggacacc ggcaagaccc ugggcgugaa ccagcggggc gagcugugcg ugcgggggcc 1200
gaugaucaug agcggcuacg ugaacaaccc ggaggccacc aacgcccuca ucgacaagga 1260
cggcuggcug cacagcggcg acaucgccua cugggacgag gacgagcacu ucuucaucgu 1320
cgaccggcug aagucgcuga ucaaguacaa gggcuaccag guggcgccgg ccgagcugga 1380
gagcauccug cuccagcacc ccaacaucuu cgacgccggc guggccgggc ugccggacga 1440
cgacgccggc gagcugccgg ccgcgguggu ggugcuggag cacggcaaga ccaugacgga 1500
gaaggagauc gucgacuacg uggccagcca ggugaccacc gccaagaagc ugcggggcgg 1560
cgugguguuc guggacgagg ucccgaaggg ccugaccggg aagcucgacg cccggaagau 1620
ccgcgagauc cugaucaagg ccaagaaggg cggcaagauc gccguguaag acuaguggaa 1680
gcauuuuccu gauugaugaa aaaaauaacu caguuauggc caucuacccc ugcuagaagg 1740
uuacagugua uuauguagca ugcaaugugu uauguagugc uuaauaaaaa uaaaaugaaa 1800
aaaaugcaga ucuaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1860
aaaaaaaaaa aaaaaaaugc aucccccccc cccccccccc cccccccccc cccaaaggcu 1920
cuuuucagag ccaccagaau u 1941
<210> 387
<211> 1861
<212> RNA
<213> 人工序列
<220>
<223> Mp68 - PpLuc(GC) - A64 - C30 - hSL
<400> 387
gggcuuuccc auucuguagc agaauuuggu guugccugug gucuuggucc cgcggagaag 60
cuugaggaug gaggacgcca agaacaucaa gaagggcccg gcgcccuucu acccgcugga 120
ggacgggacc gccggcgagc agcuccacaa ggccaugaag cgguacgccc uggugccggg 180
cacgaucgcc uucaccgacg cccacaucga ggucgacauc accuacgcgg aguacuucga 240
gaugagcgug cgccuggccg aggccaugaa gcgguacggc cugaacacca accaccggau 300
cguggugugc ucggagaaca gccugcaguu cuucaugccg gugcugggcg cccucuucau 360
cggcguggcc gucgccccgg cgaacgacau cuacaacgag cgggagcugc ugaacagcau 420
ggggaucagc cagccgaccg ugguguucgu gagcaagaag ggccugcaga agauccugaa 480
cgugcagaag aagcugccca ucauccagaa gaucaucauc auggacagca agaccgacua 540
ccagggcuuc cagucgaugu acacguucgu gaccagccac cucccgccgg gcuucaacga 600
guacgacuuc gucccggaga gcuucgaccg ggacaagacc aucgcccuga ucaugaacag 660
cagcggcagc accggccugc cgaagggggu ggcccugccg caccggaccg ccugcgugcg 720
cuucucgcac gcccgggacc ccaucuucgg caaccagauc aucccggaca ccgccauccu 780
gagcguggug ccguuccacc acggcuucgg cauguucacg acccugggcu accucaucug 840
cggcuuccgg gugguccuga uguaccgguu cgaggaggag cuguuccugc ggagccugca 900
ggacuacaag auccagagcg cgcugcucgu gccgacccug uucagcuucu ucgccaagag 960
cacccugauc gacaaguacg accugucgaa ccugcacgag aucgccagcg ggggcgcccc 1020
gcugagcaag gaggugggcg aggccguggc caagcgguuc caccucccgg gcauccgcca 1080
gggcuacggc cugaccgaga ccacgagcgc gauccugauc acccccgagg gggacgacaa 1140
gccgggcgcc gugggcaagg uggucccguu cuucgaggcc aagguggugg accuggacac 1200
cggcaagacc cugggcguga accagcgggg cgagcugugc gugcgggggc cgaugaucau 1260
gagcggcuac gugaacaacc cggaggccac caacgcccuc aucgacaagg acggcuggcu 1320
gcacagcggc gacaucgccu acugggacga ggacgagcac uucuucaucg ucgaccggcu 1380
gaagucgcug aucaaguaca agggcuacca gguggcgccg gccgagcugg agagcauccu 1440
gcuccagcac cccaacaucu ucgacgccgg cguggccggg cugccggacg acgacgccgg 1500
cgagcugccg gccgcggugg uggugcugga gcacggcaag accaugacgg agaaggagau 1560
cgucgacuac guggccagcc aggugaccac cgccaagaag cugcggggcg gcgugguguu 1620
cguggacgag gucccgaagg gccugaccgg gaagcucgac gcccggaaga uccgcgagau 1680
ccugaucaag gccaagaagg gcggcaagau cgccguguaa gacuaguaga ucuaaaaaaa 1740
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaugc 1800
aucccccccc cccccccccc cccccccccc cccaaaggcu cuuuucagag ccaccagaau 1860
u 1861
<210> 388
<211> 1888
<212> RNA
<213> 人工序列
<220>
<223> Ndufa4 - PpLuc(GC) - A64 - C30 - hSL
<400> 388
gggguccgcu cagccagguu gcagaagcgg cuuagcgugu guccuaaucu ucucucugcg 60
uguagguagg ccugugccgc aaacaagcuu gaggauggag gacgccaaga acaucaagaa 120
gggcccggcg cccuucuacc cgcuggagga cgggaccgcc ggcgagcagc uccacaaggc 180
caugaagcgg uacgcccugg ugccgggcac gaucgccuuc accgacgccc acaucgaggu 240
cgacaucacc uacgcggagu acuucgagau gagcgugcgc cuggccgagg ccaugaagcg 300
guacggccug aacaccaacc accggaucgu ggugugcucg gagaacagcc ugcaguucuu 360
caugccggug cugggcgccc ucuucaucgg cguggccguc gccccggcga acgacaucua 420
caacgagcgg gagcugcuga acagcauggg gaucagccag ccgaccgugg uguucgugag 480
caagaagggc cugcagaaga uccugaacgu gcagaagaag cugcccauca uccagaagau 540
caucaucaug gacagcaaga ccgacuacca gggcuuccag ucgauguaca cguucgugac 600
cagccaccuc ccgccgggcu ucaacgagua cgacuucguc ccggagagcu ucgaccggga 660
caagaccauc gcccugauca ugaacagcag cggcagcacc ggccugccga aggggguggc 720
ccugccgcac cggaccgccu gcgugcgcuu cucgcacgcc cgggacccca ucuucggcaa 780
ccagaucauc ccggacaccg ccauccugag cguggugccg uuccaccacg gcuucggcau 840
guucacgacc cugggcuacc ucaucugcgg cuuccgggug guccugaugu accgguucga 900
ggaggagcug uuccugcgga gccugcagga cuacaagauc cagagcgcgc ugcucgugcc 960
gacccuguuc agcuucuucg ccaagagcac ccugaucgac aaguacgacc ugucgaaccu 1020
gcacgagauc gccagcgggg gcgccccgcu gagcaaggag gugggcgagg ccguggccaa 1080
gcgguuccac cucccgggca uccgccaggg cuacggccug accgagacca cgagcgcgau 1140
ccugaucacc cccgaggggg acgacaagcc gggcgccgug ggcaaggugg ucccguucuu 1200
cgaggccaag gugguggacc uggacaccgg caagacccug ggcgugaacc agcggggcga 1260
gcugugcgug cgggggccga ugaucaugag cggcuacgug aacaacccgg aggccaccaa 1320
cgcccucauc gacaaggacg gcuggcugca cagcggcgac aucgccuacu gggacgagga 1380
cgagcacuuc uucaucgucg accggcugaa gucgcugauc aaguacaagg gcuaccaggu 1440
ggcgccggcc gagcuggaga gcauccugcu ccagcacccc aacaucuucg acgccggcgu 1500
ggccgggcug ccggacgacg acgccggcga gcugccggcc gcgguggugg ugcuggagca 1560
cggcaagacc augacggaga aggagaucgu cgacuacgug gccagccagg ugaccaccgc 1620
caagaagcug cggggcggcg ugguguucgu ggacgagguc ccgaagggcc ugaccgggaa 1680
gcucgacgcc cggaagaucc gcgagauccu gaucaaggcc aagaagggcg gcaagaucgc 1740
cguguaagac uaguagaucu aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1800
aaaaaaaaaa aaaaaaaaaa aaaaugcauc cccccccccc cccccccccc cccccccccc 1860
aaaggcucuu uucagagcca ccagaauu 1888

Claims (80)

1.一种人工核酸分子,其包含
a.至少一个可读框(ORF);和
b.至少一个3’-非翻译区元件(3’-UTR元件)和/或至少一个5’-非翻译区元件(5’-UTR元件),其中所述至少一个3’-UTR元件和/或所述至少一个5’-UTR元件延长和/或增加从所述人工核酸分子的蛋白生产,并且其中所述至少一个3’-UTR元件和/或所述至少一个5’-UTR元件源自稳定mRNA。
2.根据权利要求1所述的人工核酸分子,其中所述可读框源自与所述至少一个3’-UTR元件和/或所述至少一个5’-UTR元件源自的基因不同的基因。
3.根据权利要求1或2所述的人工核酸分子,其包含至少一个3’-UTR元件和至少一个5’-UTR元件。
4.根据权利要求3所述的人工核酸分子,其中所述至少一个可读框,所述至少一个3’-UTR元件和所述至少一个5’-UTR元件中的每个彼此是异源的。
5.根据权利要求1至4中任一项所述的人工核酸分子,其中所述至少一个3’-UTR元件和/或所述至少一个5’-UTR元件源自的稳定mRNA特征在于mRNA降解,其中所述mRNA在第二时间点的量与所述mRNA在第一时间点的量的比是至少0.5(50%),至少0.6(60%),至少0.7(70%),至少0.75(75%),至少0.8(80%),至少0.85(85%),至少0.9(90%),或至少0.95(95%)。
6.根据权利要求1至5中任一项所述的人工核酸分子,其中所述人工核酸分子不包含核糖体蛋白S6、RPL36AL、rps16或核糖体蛋白L9的3’-UTR和/或5’-UTR,并且其中所述人工核酸分子的可读框不编码GFP蛋白。
7.根据权利要求6所述的人工核酸分子,其中所述人工核酸分子的可读框不编码报告蛋白。
8.根据权利要求1至7中任一项所述的人工核酸分子,其中所述至少一个3’-UTR元件和/或所述至少一个5’-UTR元件包含这样的核酸序列或由这样的核酸序列组成:所述核酸序列源自真核蛋白编码基因的3’-UTR和/或5’-UTR,优选源自脊椎动物蛋白编码基因的3’-UTR和/或5’-UTR,更优选源自哺乳动物蛋白编码基因的3’-UTR和/或5’-UTR,甚至更优选源自灵长类蛋白编码基因的3’-UTR和/或5’-UTR。
9.根据权利要求8所述的人工核酸分子,其中所述至少一个3’-UTR元件和/或所述至少一个5’-UTR元件包含源自人或鼠蛋白编码基因的3’-UTR和/或5’-UTR的核酸序列或由源自人或鼠蛋白编码基因的3’-UTR和/或5’-UTR的核酸序列组成。
10.根据权利要求8或9所述的人工核酸分子,其中:
(i)所述核酸分子包含至少一个3’-UTR元件和至少一个5’-UTR元件;
(ii)所述至少一个3’-UTR元件,所述至少一个5’-UTR元件和所述至少一个可读框彼此全部是异源的;
(iii)所述至少一个3’UTR元件源自选自由以下各项组成的组的基因:看家基因,编码膜蛋白的基因,参与细胞代谢的基因,参与转录、翻译和复制过程的基因,参与蛋白修饰的基因和参与细胞分裂的基因;和
(iv)所述3’UTR不源自编码核糖体蛋白的基因或Fig4基因。
11.根据权利要求8至10中任一项所述的人工核酸分子,其中:
(i)所述核酸分子包含至少一个3’-UTR元件和至少一个5’-UTR元件;
(ii)所述至少一个3’-UTR元件,所述至少一个5’-UTR元件和所述至少一个可读框彼此全部是异源的;
(iii)所述至少一个5’-UTR元件源自选自由以下各项组成的组的基因:看家基因,编码膜蛋白的基因,参与细胞代谢的基因,参与转录、翻译和复制过程的基因,参与蛋白修饰的基因和参与细胞分裂的基因;
(iv)所述5’-UTR优选不是5’TOP UTR;并且
(v)所述3’-UTR优选不源自编码核糖体蛋白或白蛋白的基因或Fig4基因。
12.根据权利要求10或11所述的人工核酸分子,其中:
(i)所述核酸分子包含至少一个3’-UTR元件和至少一个5’-UTR元件;
(ii)所述至少一个3’-UTR元件,所述至少一个5’-UTR元件和所述至少一个可读框彼此全部是异源的;
(iii)所述至少一个3’UTR元件源自选自由以下各项组成的组的人或鼠基因:看家基因,编码膜蛋白的基因,参与细胞代谢的基因,参与转录、翻译和复制过程的基因,参与蛋白修饰的基因和参与细胞分裂的基因;
(iv)所述3’UTR不源自编码核糖体蛋白或白蛋白的基因或Fig4基因;
(v)所述至少一个5’-UTR元件源自选自由以下各项组成的组的人或鼠基因:看家基因,编码膜蛋白的基因,参与细胞代谢的基因,参与转录、翻译和复制过程的基因,参与蛋白修饰的基因和参与细胞分裂的基因;并且
(vi)所述5’-UTR不是5’TOP UTR。
13.根据权利要求10至12中任一项所述的人工核酸分子,其中所述3’-UTR和所述5’-UTR源自人或鼠看家基因。
14.根据权利要求12所述的人工核酸分子,其中所述3’-UTR和所述5’-UTR源自选自由以下各项组成的组的人或鼠基因:编码膜蛋白的基因,参与细胞代谢的基因,参与转录、翻译和复制过程的基因,参与蛋白修饰的基因和参与细胞分裂的基因,并且其中所述3’-UTR和所述5’-UTR选自不同的基因类型。
15.根据权利要求1至14中任一项所述的人工核酸分子,其中与从分别缺少3’-UTR和/或所述至少一个5’-UTR的参比核酸分子的蛋白生产相比,所述至少一个3’-UTR元件和/或所述至少一个5’-UTR元件至少1.2倍,优选至少1.5倍,更优选至少2倍,甚至更优选至少2.5倍延长从所述人工核酸分子的蛋白生产,和/或其中与从分别缺少3’-UTR和/或所述至少一个5’-UTR的参比核酸分子的蛋白生产相比,所述至少一个3’-UTR元件和/或所述至少一个5’-UTR元件至少1.5倍,优选至少2倍,更优选至少2.5倍增加从所述人工核酸分子的蛋白生产。
16.根据权利要求1至15中任一项所述的人工核酸分子,其中所述至少一个3’-UTR元件和/或所述至少一个5’-UTR元件包含源自选自由以下各项组成的组的基因的转录本的3’-UTR和/或5’-UTR的核酸序列或由源自选自由以下各项组成的组的基因的转录本的3’-UTR和/或5’-UTR的核酸序列组成:NDUFA1(NADH脱氢酶(泛醌)1α亚复合体),GNAS(鸟嘌呤核苷酸结合蛋白,α刺激复合基因座),MORN2(含有MORN重复2),GSTM1(谷胱甘肽S-转移酶,μ1),CBR2(羰基还原酶2),MP68(RIKEN cDNA 2010107E04基因),NDUFA4(NADH脱氢酶(泛醌)1α亚复合体4),LTA4H,SLC38A6,DECR1,PIGK,FAM175A,PHYH,TBC1D19,PIGB,ALG6,CRYZ,BRP44L,ACADSB,SUPT3H,TMEM14A,GRAMD1C,C11orf80,C9orf46,ANXA4,TBCK,IFI6,C2orf34,ALDH6A1,AGTPBP1,CCDC53,LRRC28,CCDC109B,PUS10,CCDC104,CASP1,SNX14,SKAP2,NDUFB6,EFHA1,BCKDHB,BBS2,LMBRD1,ITGA6,HERC5,NT5DC1,RAB7A,AGA,TPK1,MBNL3,HADHB,MCCC2,CAT,ANAPC4,PCCB,PHKB,ABCB7,PGCP,GPD2,TMEM38B,NFU1,OMA1,LOC128322/NUTF2,NUBPL,LANCL1,HHLA3,PIR,ACAA2,CTBS,GSTM4,ALG8,Ndufa1,Atp5e,Gstm5,Uqcr11,Ifi27I2a,Cbr2,Anapc13,Atp5I,Tmsb10,Nenf,Ndufa7,Atp5k,1110008P14Rik,Cox4i1,Cox6a1,Ndufs6,Sec61b,Romo1,Gnas,Snrpd2,Mgst3,Aldh2,Ssr4,Myl6,Prdx4,Ubl5,1110001J03Rik,Ndufa13,Ndufa3,Gstp2,Tmem160,Ergic3,Pgcp,Slpi,Myeov2,Ndufa4,Ndufs5,Gstm1,1810027O10Rik,Atp5o,Shfm1,Tspo,S100a6,Taldo1,Bloc1s1,Hexa,Ndufb11,Map1lc3a,Morn2,Gpx4,Mif,Cox6b1,RIKEN cDNA2900010J23(Swi5),Sec61g,2900010M23Rik,Anapc5,Mars2,Phpt1,Ndufb8,Pfdn5,Arpc3,Ndufb7,Atp5h,Mrpl23,Uba52,Tomm6,Mtch1,Pcbd2,Ecm1,Hrsp12,Mecr,Uqcrq,Gstm3,Lsm4,Park7,Usmg5,Cox8a,Ly6c1,Cox7b,Ppib,Bag1,S100a4,Bcap31,Tecr,Rabac1,Robld3,Sod1,Nedd8,Higd2a,Trappc6a,Ldhb,Nme2,Snrpg,Ndufa2,Serf1,Oaz1,Rps4x,Rps13,Ybx1,Sepp1,Gaa,ACTR10,PIGF,MGST3,SCP2,HPRT1,ACSF2,VPS13A,CTH,NXT2,MGST2,C11orf67,PCCA,GLMN,DHRS1,PON2,NME7,ETFDH,ALG13,DDX60,DYNC2LI1,VPS8,ITFG1,CDK5,C1orf112,IFT52,CLYBL,FAM114A2,NUDT7,AKD1,MAGED2,HRSP12,STX8,ACAT1,IFT74,KIFAP3,CAPN1,COX11,GLT8D4,HACL1,IFT88,NDUFB3,ANO10,ARL6,LPCAT3,ABCD3,COPG2,MIPEP,LEPR,C2orf76,ABCA6,LY96,CROT,ENPP5,SERPINB7,TCP11L2,IRAK1BP1,CDKL2,GHR,KIAA1107,RPS6KA6,CLGN,TMEM45A,TBC1D8B,ACP6,RP6-213H19.1,SNRPN,GLRB,HERC6,CFH,GALC,PDE1A,GSTM5,CADPS2,AASS,TRIM6-TRIM34(通读转录本),SEPP1,PDE5A,SATB1,CCPG1,CNTN1,LMBRD2,TLR3,BCAT1,TOM1L1,SLC35A1,GLYATL2,STAT4,GULP1,EHHADH,NBEAL1,KIAA1598,HFE,KIAA1324L,和MANSC1;所述基因优选选自由以下各项组成的组:NDUFA1(NADH脱氢酶(泛醌)1α亚复合体),GNAS(鸟嘌呤核苷酸结合蛋白,α刺激复合基因座),MORN2(含有MORN重复2),GSTM1(谷胱甘肽S-转移酶,μ1),CBR2(羰基还原酶2),MP68(RIKEN cDNA 2010107E04基因),NDUFA4(NADH脱氢酶(泛醌)1α亚复合体4),Ybx1(Y-Box结合蛋白1),Ndufb8(NADH脱氢酶(泛醌)1β亚复合体8),和CNTN1(接触蛋白1)。
17.根据权利要求16所述的人工核酸分子,其中所述至少一个3’-UTR元件和/或所述至少一个5’-UTR元件包含源自选自由以下各项组成的组的人基因的转录本的3’-UTR和/或5’-UTR的核酸序列:NDUFA1(NADH脱氢酶(泛醌)1α亚复合体),GNAS(鸟嘌呤核苷酸结合蛋白,α刺激复合基因座),MORN2(含有MORN重复2),GSTM1(谷胱甘肽S-转移酶,μ1),CBR2(羰基还原酶2),MP68(RIKEN cDNA 2010107E04基因),NDUFA4(NADH脱氢酶(泛醌)1α亚复合体4),Ybx1(Y-Box结合蛋白1),Ndufb8(NADH脱氢酶(泛醌)1β亚复合体8),CNTN1(接触蛋白1),LTA4H,SLC38A6,DECR1,PIGK,FAM175A,PHYH,TBC1D19,PIGB,ALG6,CRYZ,BRP44L,ACADSB,SUPT3H,TMEM14A,GRAMD1C,C11orf80,C9orf46,ANXA4,TBCK,IFI6,C2orf34,ALDH6A1,AGTPBP1,CCDC53,LRRC28,CCDC109B,PUS10,CCDC104,CASP1,SNX14,SKAP2,NDUFB6,EFHA1,BCKDHB,BBS2,LMBRD1,ITGA6,HERC5,NT5DC1,RAB7A,AGA,TPK1,MBNL3,HADHB,MCCC2,CAT,ANAPC4,PCCB,PHKB,ABCB7,PGCP,GPD2,TMEM38B,NFU1,OMA1,LOC128322/NUTF2,NUBPL,LANCL1,HHLA3,,PIR,ACAA2,CTBS,GSTM4,ALG8,ACTR10,PIGF,MGST3,SCP2,HPRT1,ACSF2,VPS13A,CTH,NXT2,MGST2,C11orf67,PCCA,GLMN,DHRS1,PON2,NME7,ETFDH,ALG13,DDX60,DYNC2LI1,VPS8,ITFG1,CDK5,C1orf112,IFT52,CLYBL,FAM114A2,NUDT7,AKD1,MAGED2,HRSP12,STX8,ACAT1,IFT74,KIFAP3,CAPN1,COX11,GLT8D4,HACL1,IFT88,NDUFB3,ANO10,ARL6,LPCAT3,ABCD3,COPG2,MIPEP,LEPR,C2orf76,ABCA6,LY96,CROT,ENPP5,SERPINB7,TCP11L2,IRAK1BP1,CDKL2,GHR,KIAA1107,RPS6KA6,CLGN,TMEM45A,TBC1D8B,ACP6,RP6-213H19.1,SNRPN,GLRB,HERC6,CFH,GALC,PDE1A,GSTM5,CADPS2,AASS,TRIM6-TRIM34(通读转录本),SEPP1,PDE5A,SATB1,CCPG1,LMBRD2,TLR3,BCAT1,TOM1L1,SLC35A1,GLYATL2,STAT4,GULP1,EHHADH,NBEAL1,KIAA1598,HFE,KIAA1324L,和MANSC1。
18.根据权利要求16所述的人工核酸分子,其中所述至少一个3’-UTR元件和/或所述至少一个5’-UTR元件包含源自选自由以下各项组成的组的鼠基因的转录本的3’-UTR和/或5’-UTR的核酸序列:NDUFA1(NADH脱氢酶(泛醌)1α亚复合体),GNAS(鸟嘌呤核苷酸结合蛋白,α刺激复合基因座),MORN2(含有MORN重复2),GSTM1(谷胱甘肽S-转移酶,μ1),CBR2(羰基还原酶2),MP68(RIKEN cDNA 2010107E04基因),NDUFA4(NADH脱氢酶(泛醌)1α亚复合体4),Ybx1(Y-Box结合蛋白1),Ndufb8(NADH脱氢酶(泛醌)1β亚复合体8),CNTN1(接触蛋白1),Atp5e,Gstm5,Uqcr11,Ifi27I2a,Anapc13,Atp5I,Tmsb10,Nenf,Ndufa7,Atp5k,1110008P14Rik,Cox4i1,Cox6a1,Ndufs6,Sec61b,Romo1,Snrpd2,Mgst3,Aldh2,Ssr4,Myl6,Prdx4,Ubl5,1110001J03Rik,Ndufa13,Ndufa3,Gstp2,Tmem160,Ergic3,Pgcp,Slpi,Myeov2,Ndufs5,1810027O10Rik,Atp5o,Shfm1,Tspo,S100a6,Taldo1,Bloc1s1,Hexa,Ndufb11,Map1lc3a,Gpx4,Mif,Cox6b1,RIKEN cDNA2900010J23(Swi5),Sec61g,2900010M23Rik,Anapc5,Mars2,Phpt1,Pfdn5,Arpc3,Ndufb7,Atp5h,Mrpl23,Uba52,Tomm6,Mtch1,Pcbd2,Ecm1,Hrsp12,Mecr,Uqcrq,Gstm3,Lsm4,Park7,Usmg5,Cox8a,Ly6c1,Cox7b,Ppib,Bag1,S100a4,Bcap31,Tecr,Rabac1,Robld3,Sod1,Nedd8,Higd2a,Trappc6a,Ldhb,Nme2,Snrpg,Ndufa2,Serf1,Oaz1,Rps4x,Rps13,Sepp1,和Gaa。
19.根据权利要求16至18中任一项所述的人工核酸分子,其中所述至少一个3’-UTR元件包含源自选自由以下各项组成的组的基因的转录本的3’-UTR的核酸序列:NDUFA1(NADH脱氢酶(泛醌)1α亚复合体),GNAS(鸟嘌呤核苷酸结合蛋白,α刺激复合基因座),MORN2(含有MORN重复2),GSTM1(谷胱甘肽S-转移酶,μ1),CBR2(羰基还原酶2),SLC38A6,DECR1,PIGK,FAM175A,PHYH,TBC1D19,PIGB,ALG6,CRYZ,BRP44L,ACADSB,TMEM14A,GRAMD1C,C11orf80,ANXA4,TBCK,IFI6,C2orf34,ALDH6A1,AGTPBP1,CCDC53,LRRC28,CCDC109B,PUS10,CCDC104,CASP1,SNX14,SKAP2,NDUFB6,EFHA1,BCKDHB,BBS2,LMBRD1,ITGA6,HERC5,HADHB,ANAPC4,PCCB,ABCB7,PGCP,NFU1,OMA1,HHLA3,ACAA2,GSTM4,ALG8,Ndufa1,Atp5e,Gstm5,Uqcr11,Ifi27I2a,Cbr2,Atp5I,Tmsb10,Nenf,Atp5k,1110008P14Rik,Cox4i1,Cox6a1,Ndufs6,Sec61b,Romo1,Gnas,Snrpd2,Mgst3,Aldh2,Ssr4,Myl6,Prdx4,Ubl5,1110001J03Rik,Ndufa13,Ndufa3,Gstp2,Tmem160,Ergic3,Pgcp,Slpi,Myeov2,Ndufa4,Ndufs5,Gstm1,1810027O10Rik,Atp5o,Shfm1,Tspo,S100a6,Taldo1,Bloc1s1,Ndufb11,Map1lc3a,Morn2,Gpx4,Mif,Cox6b1,RIKEN cDNA2900010J23(Swi5),Sec61g,2900010M23Rik,Anapc5,Mars2,Phpt1,Ndufb8,Pfdn5,Arpc3,Ndufb7,Atp5h,Mrpl23,Uba52,Tomm6,Mtch1,Pcbd2,Ecm1,Hrsp12,Mecr,Uqcrq,Gstm3,Lsm4,Park7,Usmg5,Cox8a,Ly6c1,Cox7b,Ppib,Bag1,S100a4,Bcap31,Tecr,Rabac1,Robld3,Sod1,Nedd8,Higd2a,Trappc6a,Ldhb,Nme2,Snrpg,Ndufa2,Serf1,Oaz1,Rps4x,Rps13,Ybx1,Sepp1,Gaa,ACTR10,PIGF,MGST3,SCP2,HPRT1,ACSF2,VPS13A,CTH,NXT2,MGST2,C11orf67,PCCA,GLMN,DHRS1,PON2,NME7,ETFDH,ALG13,DDX60,DYNC2LI1,VPS8,ITFG1,CDK5,C1orf112,IFT52,CLYBL,FAM114A2,NUDT7,AKD1,MAGED2,HRSP12,STX8,ACAT1,IFT74,KIFAP3,CAPN1,COX11,GLT8D4,HACL1,IFT88,NDUFB3,ANO10,ARL6,LPCAT3,ABCD3,COPG2,MIPEP,LEPR,C2orf76,ABCA6,LY96,CROT,ENPP5,SERPINB7,TCP11L2,IRAK1BP1,CDKL2,GHR,KIAA1107,RPS6KA6,CLGN,TMEM45A,TBC1D8B,ACP6,RP6-213H19.1,SNRPN,GLRB,HERC6,CFH,GALC,PDE1A,GSTM5,CADPS2,AASS,TRIM6-TRIM34(通读转录本),SEPP1,PDE5A,SATB1,CCPG1,CNTN1,LMBRD2,TLR3,BCAT1,TOM1L1,SLC35A1,GLYATL2,STAT4,GULP1,EHHADH,NBEAL1,KIAA1598,HFE,KIAA1324L,和MANSC1;优选地,所述至少一个3’-UTR元件包含源自选自由以下各项组成的组的基因的转录本的3’-UTR的核酸序列或由源自选自由以下各项组成的组的基因的转录本的3’-UTR的核酸序列组成:NDUFA1(NADH脱氢酶(泛醌)1α亚复合体),GNAS(鸟嘌呤核苷酸结合蛋白,α刺激复合基因座),MORN2(含有MORN重复2),GSTM1(谷胱甘肽S-转移酶,μ1),CBR2(羰基还原酶2),Ybx1(Y-Box结合蛋白1),Ndufb8(NADH脱氢酶(泛醌)1β亚复合体8),和CNTN1(接触蛋白1)。
20.根据权利要求19所述的人工核酸分子,其中所述至少一个3’-UTR元件包含源自选自由以下各项组成的组的人基因的转录本的3’-UTR的核酸序列:NDUFA1(NADH脱氢酶(泛醌)1α亚复合体),GNAS(鸟嘌呤核苷酸结合蛋白,α刺激复合基因座),MORN2(含有MORN重复2),GSTM1(谷胱甘肽S-转移酶,μ1),CBR2(羰基还原酶2),SLC38A6,DECR1,PIGK,FAM175A,PHYH,TBC1D19,PIGB,ALG6,CRYZ,BRP44L,ACADSB,TMEM14A,GRAMD1C,C11orf80,ANXA4,TBCK,IFI6,C2orf34,ALDH6A1,AGTPBP1,CCDC53,LRRC28,CCDC109B,PUS10,CCDC104,CASP1,SNX14,SKAP2,NDUFB6,EFHA1,BCKDHB,BBS2,LMBRD1,ITGA6,HERC5,HADHB,ANAPC4,PCCB,ABCB7,PGCP,NFU1,OMA1,HHLA3,ACAA2,GSTM4,ALG8,ACTR10,PIGF,MGST3,SCP2,HPRT1,ACSF2,VPS13A,CTH,NXT2,MGST2,C11orf67,PCCA,GLMN,DHRS1,PON2,NME7,ETFDH,ALG13,DDX60,DYNC2LI1,VPS8,ITFG1,CDK5,C1orf112,IFT52,CLYBL,FAM114A2,NUDT7,AKD1,MAGED2,HRSP12,STX8,ACAT1,IFT74,KIFAP3,CAPN1,COX11,GLT8D4,HACL1,IFT88,NDUFB3,ANO10,ARL6,LPCAT3,ABCD3,COPG2,MIPEP,LEPR,C2orf76,ABCA6,LY96,CROT,ENPP5,SERPINB7,TCP11L2,IRAK1BP1,CDKL2,GHR,KIAA1107,RPS6KA6,CLGN,TMEM45A,TBC1D8B,ACP6,RP6-213H19.1,SNRPN,GLRB,HERC6,CFH,GALC,PDE1A,GSTM5,CADPS2,AASS,TRIM6-TRIM34(通读转录本),SEPP1,PDE5A,SATB1,CCPG1,CNTN1,LMBRD2,TLR3,BCAT1,TOM1L1,SLC35A1,GLYATL2,STAT4,GULP1,EHHADH,NBEAL1,KIAA1598,HFE,KIAA1324L,和MANSC1;优选地,所述至少一个3’-UTR元件包含源自选自由以下各项组成的组的人基因的转录本的3’-UTR的核酸序列或由源自选自由以下各项组成的组的人基因的转录本的3’-UTR的核酸序列组成:NDUFA1(NADH脱氢酶(泛醌)1α亚复合体),GNAS(鸟嘌呤核苷酸结合蛋白,α刺激复合基因座),MORN2(含有MORN重复2),GSTM1(谷胱甘肽S-转移酶,μ1),CBR2(羰基还原酶2),Ybx1(Y-Box结合蛋白1),Ndufb8(NADH脱氢酶(泛醌)1β亚复合体8),和CNTN1(接触蛋白1)。
21.根据权利要求19所述的人工核酸分子,其中所述至少一个3’-UTR元件包含源自选自由以下各项组成的组的鼠基因的转录本的3’-UTR的核酸序列:NDUFA1(NADH脱氢酶(泛醌)1α亚复合体),GNAS(鸟嘌呤核苷酸结合蛋白,α刺激复合基因座),MORN2(含有MORN重复2),GSTM1(谷胱甘肽S-转移酶,μ1),CBR2(羰基还原酶2),Ybx1(Y-Box结合蛋白1),Ndufb8(NADH脱氢酶(泛醌)1β亚复合体8),和CNTN1(接触蛋白1),Ndufa1,Atp5e,Gstm5,Uqcr11,Ifi27I2a,Cbr2,Atp5I,Tmsb10,Nenf,Atp5k,1110008P14Rik,Cox4i1,Cox6a1,Ndufs6,Sec61b,Romo1,Gnas,Snrpd2,Mgst3,Aldh2,Ssr4,Myl6,Prdx4,Ubl5,1110001J03Rik,Ndufa13,Ndufa3,Gstp2,Tmem160,Ergic3,Pgcp,Slpi,Myeov2,Ndufa4,Ndufs5,Gstm1,1810027O10Rik,Atp5o,Shfm1,Tspo,S100a6,Taldo1,Bloc1s1,Ndufb11,Map1lc3a,Morn2,Gpx4,Mif,Cox6b1,RIKEN cDNA2900010J23(Swi5),Sec61g,2900010M23Rik,Anapc5,Mars2,Phpt1,Ndufb8,Pfdn5,Arpc3,Ndufb7,Atp5h,Mrpl23,Uba52,Tomm6,Mtch1,Pcbd2,Ecm1,Hrsp12,Mecr,Uqcrq,Gstm3,Lsm4,Park7,Usmg5,Cox8a,Ly6c1,Cox7b,Ppib,Bag1,S100a4,Bcap31,Tecr,Rabac1,Robld3,Sod1,Nedd8,Higd2a,Trappc6a,Ldhb,Nme2,Snrpg,Ndufa2,Serf1,Oaz1,Rps4x,Rps13,Ybx1,Sepp1,和Gaa;优选地,所述至少一个3’-UTR元件包含源自选自由以下各项组成的组的鼠基因的转录本的3’-UTR的核酸序列或由源自选自由以下各项组成的组的鼠基因的转录本的3’-UTR的核酸序列组成:NDUFA1(NADH脱氢酶(泛醌)1α亚复合体),GNAS(鸟嘌呤核苷酸结合蛋白,α刺激复合基因座),MORN2(含有MORN重复2),GSTM1(谷胱甘肽S-转移酶,μ1),CBR2(羰基还原酶2),Ybx1(Y-Box结合蛋白1),Ndufb8(NADH脱氢酶(泛醌)1β亚复合体8),和CNTN1(接触蛋白1)。
22.根据权利要求16至18中任一项所述的人工核酸分子,其中所述至少一个5’-UTR元件包含源自选自由以下各项组成的组的基因的转录本的5’-UTR的核酸序列:MP68(RIKENcDNA 2010107E04基因),NDUFA4(NADH脱氢酶(泛醌)1α亚复合体4),LTA4H,DECR1,PIGK,TBC1D19,BRP44L,ACADSB,SUPT3H,TMEM14A,C9orf46,ANXA4,IFI6,C2orf34,ALDH6A1,CCDC53,CCDC104,CASP1,NDUFB6,BCKDHB,BBS2,HERC5,FAM175A,NT5DC1,RAB7A,AGA,TPK1,MBNL3,MCCC2,CAT,ANAPC4,PHKB,ABCB7,GPD2,TMEM38B,NFU1,LOC128322/NUTF2,NUBPL,LANCL1,PIR,CTBS,GSTM4,Ndufa1,Atp5e,Gstm5,Cbr2,Anapc13,Ndufa7,Atp5k,1110008P14Rik,Cox4i1,Ndufs6,Sec61b,Snrpd2,Mgst3,Prdx4;Pgcp;Myeov2;Ndufa4;Ndufs5;Gstm1;Atp5o;Tspo;Taldo1;Bloc1s1;和Hexa;优选地,所述至少一个5’-UTR元件包含源自MP68(RIKEN cDNA 2010107E04基因)或NDUFA4(NADH脱氢酶(泛醌)1α亚复合体4)的转录本的5’-UTR的核酸序列或由源自MP68(RIKEN cDNA 2010107E04基因)或NDUFA4(NADH脱氢酶(泛醌)1α亚复合体4)的转录本的5’-UTR的核酸序列组成。
23.根据权利要求22所述的人工核酸分子,其中所述至少一个5’-UTR元件包含源自选自由以下各项组成的组的人基因的转录本的5’-UTR的核酸序列:MP68(RIKEN cDNA2010107E04基因),NDUFA4(NADH脱氢酶(泛醌)1α亚复合体4),LTA4H,DECR1,PIGK,TBC1D19,BRP44L,ACADSB,SUPT3H,TMEM14A,C9orf46,ANXA4,IFI6,C2orf34,ALDH6A1,CCDC53,CCDC104,CASP1,NDUFB6,BCKDHB,BBS2,HERC5,FAM175A,NT5DC1,RAB7A,AGA,TPK1,MBNL3,MCCC2,CAT,ANAPC4,PHKB,ABCB7,GPD2,TMEM38B,NFU1,LOC128322/NUTF2,NUBPL,LANCL1,PIR,CTBS,和GSTM4;优选地,所述至少一个5’-UTR元件包含源自MP68(RIKEN cDNA2010107E04基因)或NDUFA4(NADH脱氢酶(泛醌)1α亚复合体4)的人转录本的5’-UTR的核酸序列或由源自MP68(RIKEN cDNA 2010107E04基因)或NDUFA4(NADH脱氢酶(泛醌)1α亚复合体4)的人转录本的5’-UTR的核酸序列组成。
24.根据权利要求22所述的人工核酸分子,其中所述至少一个5’-UTR元件包含源自选自由以下各项组成的组的鼠基因的转录本的5’-UTR的核酸序列:MP68(RIKEN cDNA2010107E04基因),NDUFA4(NADH脱氢酶(泛醌)1α亚复合体4),Ndufa1,Atp5e,Gstm5,Cbr2,Anapc13,Ndufa7,Atp5k,1110008P14Rik,Cox4i1,Ndufs6,Sec61b,Snrpd2,Mgst3,Prdx4;Pgcp;Myeov2;Ndufa4;Ndufs5;Gstm1;Atp5o;Tspo;Taldo1;Bloc1s1;和Hexa;优选地,所述至少一个5’-UTR元件包含源自MP68(RIKEN cDNA 2010107E04基因)或NDUFA4(NADH脱氢酶(泛醌)1α亚复合体4)的鼠转录本的5’-UTR的核酸序列或由源自MP68(RIKEN cDNA2010107E04基因)或NDUFA4(NADH脱氢酶(泛醌)1α亚复合体4)的鼠转录本的5’-UTR的核酸序列组成。
25.根据权利要求1–21中任一项所述的人工核酸分子,其中所述至少一个3’-UTR元件包含这样的核酸序列或由这样的核酸序列组成,所述核酸序列与选自由SEQ ID NOs:1至24和SEQ ID NOs:49至318组成的组的核酸序列具有至少约50%,优选至少约60%,优选至少约70%,更优选至少约80%,更优选至少约90%,甚至更优选至少约95%,甚至更优选至少约99%的同一性,或其中所述至少一个3’-UTR元件包含这样的核酸序列的片段或由这样的核酸序列的片段组成,所述核酸序列的片段与选自由SEQ ID NOs:1至24和SEQ ID NOs:49至318组成的组的核酸序列的片段具有至少约40%,优选至少约50%,优选至少约60%,优选至少约70%,更优选至少约80%,更优选至少约90%,甚至更优选至少约95%,甚至更优选至少约99%的同一性。
26.根据权利要求1–18和22至24中任一项所述的人工核酸分子,其中所述至少一个5’-UTR元件包含这样的核酸序列或由这样的核酸序列组成,所述核酸序列与选自由SEQ IDNOs:25至30和SEQ ID NOs:319至382组成的组的核酸序列具有至少约50%,优选至少约60%,优选至少约70%,更优选至少约80%,更优选至少约90%,甚至更优选至少约95%,甚至更优选至少约99%的同一性,或其中所述至少一个5’-UTR元件包含这样的核酸序列的片段或由这样的核酸序列的片段组成,所述这核酸序列的片段与选自由SEQ ID NOs:25至30和SEQ ID NOs:319至382组成的组的核酸序列具有至少约40%,优选至少约50%,优选至少约60%,优选至少约70%,更优选至少约80%,更优选至少约90%,甚至更优选至少约95%,甚至更优选至少约99%的同一性。
27.根据权利要求25或26所述的人工核酸分子,其中所述片段呈现3至约500个核苷酸之间,优选5至约150个核苷酸之间,更优选10至100个核苷酸之间,甚至更优选15至90个之间,最优选20至70个之间的长度。
28.根据权利要求1–27中任一项所述的人工核酸分子,其中所述至少一个3’-UTR元件和/或所述至少一个5’-UTR元件呈现3至约500个核苷酸之间,优选5至约150个核苷酸之间,更优选10至100个核苷酸之间,甚至更优选15至90个之间,最优选20至70个之间的长度。
29.根据权利要求1–28中任一项所述的人工核酸分子,其还包含
c.聚腺苷酸序列和/或聚腺苷酸化信号。
30.根据权利要求29所述的人工核酸分子,其中所述聚腺苷酸序列或所述聚腺苷酸化信号位于3’-UTR元件的3’。
31.根据权利要求29或30所述的人工核酸分子,其中所述聚腺苷酸化信号包含共有序列NN(U/T)ANA,其中N=A或U,优选AA(U/T)AAA或A(U/T)(U/T)AAA。
32.根据权利要求29–31中任一项所述的人工核酸分子,其中所述聚腺苷酸化信号,优选所述共有序列NNUANA,位于所述3’-UTR元件的3’-末端下游少于约50个核苷酸处。
33.根据权利要求29–32中任一项所述的人工核酸分子,其中所述聚腺苷酸序列具有约20至约300个腺嘌呤核苷酸,优选约40至约200个腺嘌呤核苷酸,更优选约50至约100个腺嘌呤核苷酸,甚至更优选约60至约70个腺嘌呤核苷酸的长度。
34.根据权利要求1–33中任一项所述的人工核酸分子,其还包括5’-帽结构,聚胞苷酸序列,组蛋白茎环,和/或IRES-基序。
35.根据权利要求1–34中任一项所述的人工核酸分子,其中所述组蛋白茎环包含根据SEQ ID NO:34的序列。
36.根据权利要求1–35中任一项所述的人工核酸分子,其中所述核酸包含启动子。
37.根据权利要求1–36中任一项所述的人工核酸分子,其中所述核酸包含5’-TOP UTR。
38.根据权利要求1–37中任一项所述的人工核酸分子,其中所述核酸包含3’-UTR,所述3’-UTR包含源自白蛋白基因的3’-UTR的核酸序列或由源自白蛋白基因的3’-UTR的核酸序列组成。
39.根据权利要求1–38中任一项所述的人工核酸分子,其中所述人工核酸分子,优选可读框,是至少部分G/C修饰的,优选其中与野生型可读框相比,可读框的G/C含量增加。
40.根据权利要求1–39中任一项所述的人工核酸分子,其中所述可读框包含密码子优化的区域,优选地,其中所述可读框是密码子优化的。
41.根据权利要求1–40中任一项所述的人工核酸分子,其是RNA,优选mRNA分子。
42.一种载体,其包含根据权利要求1–41中任一项所述的人工核酸分子。
43.根据权利要求42所述的载体,其是DNA载体。
44.根据权利要求42或43所述的载体,其是质粒载体或病毒载体,优选质粒载体。
45.根据权利要求42–44中任一项所述的载体,其是环状分子。
46.根据权利要求42所述的载体,其中在5’→3’方向上在编码链的聚腺苷酸序列,聚胞苷酸序列,组蛋白茎环或3’-UTR元件之后的是用于线性化所述环状载体分子的限制性位点。
47.一种细胞,其包含根据权利要求1–39中任一项所述的人工核酸分子或根据权利要求42–46中任一项所述的载体。
48.根据权利要求47所述的细胞,其是哺乳动物细胞。
49.根据权利要求47或48所述的细胞,其是哺乳动物受试者的细胞,优选哺乳动物受试者的,优选人受试者的分离的细胞。
50.一种药物组合物,其包含根据权利要求1–41中任一项所述的人工核酸分子,根据权利要求42–46中任一项所述的载体,或根据权利要求47–49中任一项所述的细胞。
51.根据权利要求50所述的药物组合物,其还包含一种或多种药用媒介物,稀释剂和/或赋形剂和/或一种或多种辅剂。
52.根据权利要求1–41中任一项所述的人工核酸分子,根据权利要求42–46中任一项所述的载体,根据权利要求47–49中任一项所述的细胞,或根据权利要求50或51所述的药物组合物,其用作药物。
53.根据权利要求1–41中任一项所述的人工核酸分子,根据权利要求42-46中任一项所述的载体,根据权利要求47–49中任一项所述的细胞,或根据权利要求50或51所述的药物组合物,其用作疫苗或用于基因治疗。
54.一种治疗或预防病症的方法,所述方法包括向有此需要的受试者施用根据权利要求1–41中任一项所述的人工核酸分子,根据权利要求42–46中任一项所述的载体,根据权利要求47–49中任一项所述的细胞,或根据权利要求50或51所述的药物组合物。
55.一种治疗或预防病症的方法,所述方法包括用根据权利要求1–41中任一项所述的人工核酸分子或根据权利要求42–46中任一项所述的载体转染细胞。
56.根据权利要求55所述的方法,其中细胞的转染在体外/活体外进行,并且将转染的细胞施用给有此需要的受试者,优选施用给人患者。
57.根据权利要求56所述的方法,其中被体外转染的细胞是受试者,优选人患者的分离的细胞。
58.根据权利要求54–57中任一项所述的方法,所述方法是免疫接种方法或基因治疗方法。
59.一种用于增加和/或延长从人工核酸分子,优选从mRNA分子或载体的蛋白生产的方法,所述方法包括将可读框与3’-UTR元件和/或5’-UTR元件关联的步骤,其中所述3’-UTR元件和/或所述5’-UTR元件延长和/或增加从得到的人工核酸分子的蛋白生产,并且其中所述至少一个3’-UTR元件和/或所述至少一个5’-UTR元件源自稳定mRNA,从而获得根据权利要求1–41中任一项所述的人工核酸分子,优选mRNA分子,或根据权利要求42–46中任一项所述的载体。
60.根据权利要求59所述的用于增加和/或延长从人工核酸分子,优选从mRNA分子或载体的蛋白生产的方法,其中所述3’-UTR元件和/或所述5’-UTR元件包含源自选自由以下各项组成的组的基因的转录本的3’-UTR和/或5’-UTR的核酸序列或由源自选自由以下各项组成的组的基因的转录本的3’-UTR和/或5’-UTR的核酸序列组成:NDUFA1(NADH脱氢酶(泛醌)1α亚复合体),GNAS(鸟嘌呤核苷酸结合蛋白,α刺激复合基因座),MORN2(含有MORN重复2),GSTM1(谷胱甘肽S-转移酶,μ1),CBR2(羰基还原酶2),MP68(RIKEN cDNA 2010107E04基因),NDUFA4(NADH脱氢酶(泛醌)1α亚复合体4),LTA4H,SLC38A6,DECR1,PIGK,FAM175A,PHYH,TBC1D19,PIGB,ALG6,CRYZ,BRP44L,ACADSB,SUPT3H,TMEM14A,GRAMD1C,C11orf80,C9orf46,ANXA4,TBCK,IFI6,C2orf34,ALDH6A1,AGTPBP1,CCDC53,LRRC28,CCDC109B,PUS10,CCDC104,CASP1,SNX14,SKAP2,NDUFB6,EFHA1,BCKDHB,BBS2,LMBRD1,ITGA6,HERC5,NT5DC1,RAB7A,AGA,TPK1,MBNL3,HADHB,MCCC2,CAT,ANAPC4,PCCB,PHKB,ABCB7,PGCP,GPD2,TMEM38B,NFU1,OMA1,LOC128322/NUTF2,NUBPL,LANCL1,HHLA3,PIR,ACAA2,CTBS,GSTM4,ALG8,Atp5e,Gstm5,Uqcr11,Ifi27I2a,Anapc13,Atp5I,Tmsb10,Nenf,Ndufa7,Atp5k,1110008P14Rik,Cox4i1,Cox6a1,Ndufs6,Sec61b,Romo1,Snrpd2,Mgst3,Aldh2,,Ssr4,Myl6,Prdx4,Ubl5,1110001J03Rik,Ndufa13,Ndufa3,Gstp2,Tmem160,Ergic3,Pgcp,Slpi,Myeov2,Ndufs5,1810027O10Rik,Atp5o,Shfm1,Tspo,S100a6,Taldo1,Bloc1s1,Hexa,Ndufb11,Map1lc3a,Gpx4,Mif,Cox6b1,RIKEN cDNA2900010J23(Swi5),Sec61g,2900010M23Rik,Anapc5,Mars2,Phpt1,Ndufb8,Pfdn5,Arpc3,Ndufb7,Atp5h,Mrpl23,Uba52,Tomm6,Mtch1,Pcbd2,Ecm1,Hrsp12,Mecr,Uqcrq,Gstm3,Lsm4,Park7,Usmg5,Cox8a,Ly6c1,Cox7b,Ppib,Bag1,S100a4,Bcap31,Tecr,Rabac1,Robld3,Sod1,Nedd8,Higd2a,Trappc6a,Ldhb,Nme2,Snrpg,Ndufa2,Serf1,Oaz1,Rps4x,Rps13,Ybx1,Sepp1,Gaa,ACTR10,PIGF,MGST3,SCP2,HPRT1,ACSF2,VPS13A,CTH,NXT2,MGST2,C11orf67,PCCA,GLMN,DHRS1,PON2,NME7,ETFDH,ALG13,DDX60,DYNC2LI1,VPS8,ITFG1,CDK5,C1orf112,IFT52,CLYBL,FAM114A2,NUDT7,AKD1,MAGED2,HRSP12,STX8,ACAT1,IFT74,KIFAP3,CAPN1,COX11,GLT8D4,HACL1,IFT88,NDUFB3,ANO10,ARL6,LPCAT3,ABCD3,COPG2,MIPEP,LEPR,C2orf76,ABCA6,LY96,CROT,ENPP5,SERPINB7,TCP11L2,IRAK1BP1,CDKL2,GHR,KIAA1107,RPS6KA6,CLGN,TMEM45A,TBC1D8B,ACP6,RP6-213H19.1,SNRPN,GLRB,HERC6,CFH,GALC,PDE1A,GSTM5,CADPS2,AASS,TRIM6-TRIM34(通读转录本),SEPP1,PDE5A,SATB1,CCPG1,CNTN1,LMBRD2,TLR3,BCAT1,TOM1L1,SLC35A1,GLYATL2,STAT4,GULP1,EHHADH,NBEAL1,KIAA1598,HFE,KIAA1324L,和MANSC1;所述基因优选选自由以下各项组成的组:NDUFA1(NADH脱氢酶(泛醌)1α亚复合体),GNAS(鸟嘌呤核苷酸结合蛋白,α刺激复合基因座),MORN2(含有MORN重复2),GSTM1(谷胱甘肽S-转移酶,μ1),CBR2(羰基还原酶2),MP68(RIKEN cDNA 2010107E04基因),NDUFA4(NADH脱氢酶(泛醌)1α亚复合体4),Ybx1(Y-Box结合蛋白1),Ndufb8(NADH脱氢酶(泛醌)1β亚复合体8),和CNTN1(接触蛋白1)。
61.3’-UTR元件和/或5’-UTR元件用于增加和/或延长从人工核酸分子,优选从mRNA分子或载体的蛋白生产的用途,其中所述3’-UTR元件和/或所述5’-UTR元件包含源自选自由以下各项组成的组的基因的转录本的3’-UTR和/或5’-UTR的核酸序列或由源自选自由以下各项组成的组的基因的转录本的3’-UTR和/或5’-UTR的核酸序列组成:NDUFA1(NADH脱氢酶(泛醌)1α亚复合体),GNAS(鸟嘌呤核苷酸结合蛋白,α刺激复合基因座),MORN2(含有MORN重复2),GSTM1(谷胱甘肽S-转移酶,μ1),CBR2(羰基还原酶2),MP68(RIKEN cDNA 2010107E04基因),NDUFA4(NADH脱氢酶(泛醌)1α亚复合体4),LTA4H,SLC38A6,DECR1,PIGK,FAM175A,PHYH,TBC1D19,PIGB,ALG6,CRYZ,BRP44L,ACADSB,SUPT3H,TMEM14A,GRAMD1C,C11orf80,C9orf46,ANXA4,TBCK,IFI6,C2orf34,ALDH6A1,AGTPBP1,CCDC53,LRRC28,CCDC109B,PUS10,CCDC104,CASP1,SNX14,SKAP2,NDUFB6,EFHA1,BCKDHB,BBS2,LMBRD1,ITGA6,HERC5,NT5DC1,RAB7A,AGA,TPK1,MBNL3,HADHB,MCCC2,CAT,ANAPC4,PCCB,PHKB,ABCB7,PGCP,GPD2,TMEM38B,NFU1,OMA1,LOC128322/NUTF2,NUBPL,LANCL1,HHLA3,PIR,ACAA2,CTBS,GSTM4,ALG8,Atp5e,Gstm5,Uqcr11,Ifi27I2a,Anapc13,Atp5I,Tmsb10,Nenf,Ndufa7,Atp5k,1110008P14Rik,Cox4i1,Cox6a1,Ndufs6,Sec61b,Romo1,Snrpd2,Mgst3,Aldh2,Ssr4,Myl6,Prdx4,Ubl5,1110001J03Rik,Ndufa13,Ndufa3,Gstp2,Tmem160,Ergic3,Pgcp,Slpi,Myeov2,Ndufs5,1810027O10Rik,Atp5o,Shfm1,Tspo,S100a6,Taldo1,Bloc1s1,Hexa,Ndufb11,Map1lc3a,Gpx4,Mif,Cox6b1,RIKEN cDNA2900010J23(Swi5),Sec61g,2900010M23Rik,Anapc5,Mars2,Phpt1,Ndufb8,Pfdn5,Arpc3,Ndufb7,Atp5h,Mrpl23,Uba52,Tomm6,Mtch1,Pcbd2,Ecm1,Hrsp12,Mecr,Uqcrq,Gstm3,Lsm4,Park7,Usmg5,Cox8a,Ly6c1,Cox7b,Ppib,Bag1,S100a4,Bcap31,Tecr,Rabac1,Robld3,Sod1,Nedd8,Higd2a,Trappc6a,Ldhb,Nme2,Snrpg,Ndufa2,Serf1,Oaz1,Rps4x,Rps13,Ybx1,Sepp1,Gaa,ACTR10,PIGF,MGST3,SCP2,HPRT1,ACSF2,VPS13A,CTH,NXT2,MGST2,C11orf67,PCCA,GLMN,DHRS1,PON2,NME7,ETFDH,ALG13,DDX60,DYNC2LI1,VPS8,ITFG1,CDK5,C1orf112,IFT52,CLYBL,FAM114A2,NUDT7,AKD1,MAGED2,HRSP12,STX8,ACAT1,IFT74,KIFAP3,CAPN1,COX11,GLT8D4,HACL1,IFT88,NDUFB3,ANO10,ARL6,LPCAT3,ABCD3,COPG2,MIPEP,LEPR,C2orf76,ABCA6,LY96,CROT,ENPP5,SERPINB7,TCP11L2,IRAK1BP1,CDKL2,GHR,KIAA1107,RPS6KA6,CLGN,TMEM45A,TBC1D8B,ACP6,RP6-213H19.1,SNRPN,GLRB,HERC6,CFH,GALC,PDE1A,GSTM5,CADPS2,AASS,TRIM6-TRIM34(通读转录本),SEPP1,PDE5A,SATB1,CCPG1,CNTN1,LMBRD2,TLR3,BCAT1,TOM1L1,SLC35A1,GLYATL2,STAT4,GULP1,EHHADH,NBEAL1,KIAA1598,HFE,KIAA1324L,和MANSC1;所述基因优选选自由以下各项组成的组:NDUFA1(NADH脱氢酶(泛醌)1α亚复合体),GNAS(鸟嘌呤核苷酸结合蛋白,α刺激复合基因座),MORN2(含有MORN重复2),GSTM1(谷胱甘肽S-转移酶,μ1),CBR2(羰基还原酶2),MP68(RIKEN cDNA 2010107E04基因),NDUFA4(NADH脱氢酶(泛醌)1α亚复合体4),Ybx1(Y-Box结合蛋白1),Ndufb8(NADH脱氢酶(泛醌)1β亚复合体8),和CNTN1(接触蛋白1)。
62.根据权利要求60所述的方法或根据权利要求61所述的用途,其中所述至少一个3’-UTR元件和/或所述至少一个5’-UTR元件包含源自选自由以下各项组成的组的人基因的转录本的3’-UTR和/或5’-UTR的核酸序列:NDUFA1(NADH脱氢酶(泛醌)1α亚复合体),GNAS(鸟嘌呤核苷酸结合蛋白,α刺激复合基因座),MORN2(含有MORN重复2),GSTM1(谷胱甘肽S-转移酶,μ1),CBR2(羰基还原酶2),MP68(RIKEN cDNA 2010107E04基因),NDUFA4(NADH脱氢酶(泛醌)1α亚复合体4),Ybx1(Y-Box结合蛋白1),Ndufb8(NADH脱氢酶(泛醌)1β亚复合体8),CNTN1(接触蛋白1),LTA4H,SLC38A6,DECR1,PIGK,FAM175A,PHYH,TBC1D19,PIGB,ALG6,CRYZ,BRP44L,ACADSB,SUPT3H,TMEM14A,GRAMD1C,C11orf80,C9orf46,ANXA4,TBCK,IFI6,C2orf34,ALDH6A1,AGTPBP1,CCDC53,LRRC28,CCDC109B,PUS10,CCDC104,CASP1,SNX14,SKAP2,NDUFB6,EFHA1,BCKDHB,BBS2,LMBRD1,ITGA6,HERC5,NT5DC1,RAB7A,AGA,TPK1,MBNL3,HADHB,MCCC2,CAT,ANAPC4,PCCB,PHKB,ABCB7,PGCP,GPD2,TMEM38B,NFU1,OMA1,LOC128322/NUTF2,NUBPL,LANCL1,HHLA3,PIR,ACAA2,CTBS,GSTM4,ALG8,ACTR10,PIGF,MGST3,SCP2,HPRT1,ACSF2,VPS13A,CTH,NXT2,MGST2,C11orf67,PCCA,GLMN,DHRS1,PON2,NME7,ETFDH,ALG13,DDX60,DYNC2LI1,VPS8,ITFG1,CDK5,C1orf112,IFT52,CLYBL,FAM114A2,NUDT7,AKD1,MAGED2,HRSP12,STX8,ACAT1,IFT74,KIFAP3,CAPN1,COX11,GLT8D4,HACL1,IFT88,NDUFB3,ANO10,ARL6,LPCAT3,ABCD3,COPG2,MIPEP,LEPR,C2orf76,ABCA6,LY96,CROT,ENPP5,SERPINB7,TCP11L2,IRAK1BP1,CDKL2,GHR,KIAA1107,RPS6KA6,CLGN,TMEM45A,TBC1D8B,ACP6,RP6-213H19.1,SNRPN,GLRB,HERC6,CFH,GALC,PDE1A,GSTM5,CADPS2,AASS,TRIM6-TRIM34(通读转录本),SEPP1,PDE5A,SATB1,CCPG1,LMBRD2,TLR3,BCAT1,TOM1L1,SLC35A1,GLYATL2,STAT4,GULP1,EHHADH,NBEAL1,KIAA1598,HFE,KIAA1324L,和MANSC1。
63.根据权利要求60所述的方法或根据权利要求61所述的用途,其中所述至少一个3’-UTR元件和/或所述至少一个5’-UTR元件包含源自选自由以下各项组成的组的鼠基因的转录本的3’-UTR和/或5’-UTR的核酸序列:NDUFA1(NADH脱氢酶(泛醌)1α亚复合体),GNAS(鸟嘌呤核苷酸结合蛋白,α刺激复合基因座),MORN2(含有MORN重复2),GSTM1(谷胱甘肽S-转移酶,μ1),CBR2(羰基还原酶2),MP68(RIKEN cDNA 2010107E04基因),NDUFA4(NADH脱氢酶(泛醌)1α亚复合体4),Ybx1(Y-Box结合蛋白1),Ndufb8(NADH脱氢酶(泛醌)1β亚复合体8),CNTN1(接触蛋白1),Atp5e,Gstm5,Uqcr11,Ifi27I2a,Anapc13,Atp5I,Tmsb10,Nenf,Ndufa7,Atp5k,1110008P14Rik,Cox4i1,Cox6a1,Ndufs6,Sec61b,Romo1,Snrpd2,Mgst3,Aldh2,Ssr4,Myl6,Prdx4,Ubl5,1110001J03Rik,Ndufa13,Ndufa3,Gstp2,Tmem160,Ergic3,Pgcp,Slpi,Myeov2,Ndufs5,1810027O10Rik,Atp5o,Shfm1,Tspo,S100a6,Taldo1,Bloc1s1,Hexa,Ndufb11,Map1lc3a,Gpx4,Mif,Cox6b1,RIKEN cDNA2900010J23(Swi5),Sec61g,2900010M23Rik,Anapc5,Mars2,Phpt1,Pfdn5,Arpc3,Ndufb7,Atp5h,Mrpl23,Uba52,Tomm6,Mtch1,Pcbd2,Ecm1,Hrsp12,Mecr,Uqcrq,Gstm3,Lsm4,Park7,Usmg5,Cox8a,Ly6c1,Cox7b,Ppib,Bag1,S100a4,Bcap31,Tecr,Rabac1,Robld3,Sod1,Nedd8,Higd2a,Trappc6a,Ldhb,Nme2,Snrpg,Ndufa2,Serf1,Oaz1,Rps4x,Rps13,Sepp1,和Gaa。
64.根据权利要求60–63中任一项所述的方法或用途,其中所述至少一个3’-UTR元件包含源自选自由以下各项组成的组的基因的转录本的3’-UTR的核酸序列:NDUFA1(NADH脱氢酶(泛醌)1α亚复合体),GNAS(鸟嘌呤核苷酸结合蛋白,α刺激复合基因座),MORN2(含有MORN重复2),GSTM1(谷胱甘肽S-转移酶,μ1),CBR2(羰基还原酶2),SLC38A6,DECR1,PIGK,FAM175A,PHYH,TBC1D19,PIGB,ALG6,CRYZ,BRP44L,ACADSB,TMEM14A,GRAMD1C,C11orf80,ANXA4,TBCK,IFI6,C2orf34,ALDH6A1,AGTPBP1,CCDC53,LRRC28,CCDC109B,PUS10,CCDC104,CASP1,SNX14,SKAP2,NDUFB6,EFHA1,BCKDHB,BBS2,LMBRD1,ITGA6,HERC5,HADHB,ANAPC4,PCCB,ABCB7,PGCP,NFU1,OMA1,HHLA3,ACAA2,GSTM4,ALG8,Ndufa1,Atp5e,Gstm5,Uqcr11,Ifi27I2a,Cbr2,Atp5I,Tmsb10,Nenf,Atp5k,1110008P14Rik,Cox4i1,Cox6a1,Ndufs6,Sec61b,Romo1,Gnas,Snrpd2,Mgst3,Aldh2,Ssr4,Myl6,Prdx4,Ubl5,1110001J03Rik,Ndufa13,Ndufa3,Gstp2,Tmem160,Ergic3,Pgcp,Slpi,Myeov2,Ndufa4,Ndufs5,Gstm1,1810027O10Rik,Atp5o,Shfm1,Tspo,S100a6,Taldo1,Bloc1s1,Ndufb11,Map1lc3a,Morn2,Gpx4,Mif,Cox6b1,RIKEN cDNA2900010J23(Swi5),Sec61g,2900010M23Rik,Anapc5,Mars2,Phpt1,Ndufb8,Pfdn5,Arpc3,Ndufb7,Atp5h,Mrpl23,Uba52,Tomm6,Mtch1,Pcbd2,Ecm1,Hrsp12,Mecr,Uqcrq,Gstm3,Lsm4,Park7,Usmg5,Cox8a,Ly6c1,Cox7b,Ppib,Bag1,S100a4,Bcap31,Tecr,Rabac1,Robld3,Sod1,Nedd8,Higd2a,Trappc6a,Ldhb,Nme2,Snrpg,Ndufa2,Serf1,Oaz1,Rps4x,Rps13,Ybx1,Sepp1,Gaa,ACTR10,PIGF,MGST3,SCP2,HPRT1,ACSF2,VPS13A,CTH,NXT2,MGST2,C11orf67,PCCA,GLMN,DHRS1,PON2,NME7,ETFDH,ALG13,DDX60,DYNC2LI1,VPS8,ITFG1,CDK5,C1orf112,IFT52,CLYBL,FAM114A2,NUDT7,AKD1,MAGED2,HRSP12,STX8,ACAT1,IFT74,KIFAP3,CAPN1,COX11,GLT8D4,HACL1,IFT88,NDUFB3,ANO10,ARL6,LPCAT3,ABCD3,COPG2,MIPEP,LEPR,C2orf76,ABCA6,LY96,CROT,ENPP5,SERPINB7,TCP11L2,IRAK1BP1,CDKL2,GHR,KIAA1107,RPS6KA6,CLGN,TMEM45A,TBC1D8B,ACP6,RP6-213H19.1,SNRPN,GLRB,HERC6,CFH,GALC,PDE1A,GSTM5,CADPS2,AASS,TRIM6-TRIM34(通读转录本),SEPP1,PDE5A,SATB1,CCPG1,CNTN1,LMBRD2,TLR3,BCAT1,TOM1L1,SLC35A1,GLYATL2,STAT4,GULP1,EHHADH,NBEAL1,KIAA1598,HFE,KIAA1324L,和MANSC1;优选地,所述至少一个3’-UTR元件包含源自选自由以下各项组成的组的基因的转录本的3’-UTR的核酸序列或由源自选自由以下各项组成的组的基因的转录本的3’-UTR的核酸序列组成:NDUFA1(NADH脱氢酶(泛醌)1α亚复合体),GNAS(鸟嘌呤核苷酸结合蛋白,α刺激复合基因座),MORN2(含有MORN重复2),GSTM1(谷胱甘肽S-转移酶,μ1),CBR2(羰基还原酶2),Ybx1(Y-Box结合蛋白1),Ndufb8(NADH脱氢酶(泛醌)1β亚复合体8),和CNTN1(接触蛋白1)。
65.根据权利要求60–63中任一项所述的方法或用途,其中所述至少一个5’-UTR元件包含源自选自由以下各项组成的组的基因的转录本的5’-UTR的核酸序列:MP68(RIKEN cDNA2010107E04基因),NDUFA4(NADH脱氢酶(泛醌)1α亚复合体4),LTA4H,DECR1,PIGK,TBC1D19,BRP44L,ACADSB,SUPT3H,TMEM14A,C9orf46,ANXA4,IFI6,C2orf34,ALDH6A1,CCDC53,CCDC104,CASP1,NDUFB6,BCKDHB,BBS2,HERC5,FAM175A,NT5DC1,RAB7A,AGA,TPK1,MBNL3,MCCC2,CAT,ANAPC4,PHKB,ABCB7,GPD2,TMEM38B,NFU1,LOC128322/NUTF2,NUBPL,LANCL1,PIR,CTBS,GSTM4,Ndufa1,Atp5e,Gstm5,Cbr2,Anapc13,Ndufa7,Atp5k,1110008P14Rik,Cox4i1,Ndufs6,Sec61b,Snrpd2,Mgst3,,Prdx4;Pgcp;Myeov2;Ndufa4;Ndufs5;Gstm1;Atp5o;Tspo;Taldo1;Bloc1s1;和Hexa;优选地,所述至少一个5’-UTR元件包含源自MP68(RIKEN cDNA 2010107E04基因)或NDUFA4(NADH脱氢酶(泛醌)1α亚复合体4)的转录本的5’-UTR的核酸序列或由源自MP68(RIKEN cDNA 2010107E04基因)或NDUFA4(NADH脱氢酶(泛醌)1α亚复合体4)的转录本的5’-UTR的核酸序列组成。
66.根据权利要求60–64中任一项所述的方法或用途,其中所述3’-UTR元件包含这样的核酸序列或由这样的核酸序列组成,所述核酸序列与选自由SEQ ID NOs:1至24和SEQ IDNOs:49至318组成的组的序列具有至少约40%,优选至少约50%,优选至少约60%,优选至少约70%,更优选至少约80%,更优选至少约90%,甚至更优选至少约95%,甚至更优选至少约99%的同一性,或其中所述3’-UTR元件包含这样的核酸序列的片段或由这样的核酸序列的片段组成,所述核酸序列的片段与选自由SEQ ID NOs:1至24和SEQ ID NOs:49至318组成的组的序列具有至少约40%,优选至少约50%,优选至少约60%,优选至少约70%,更优选至少约80%,更优选至少约90%,甚至更优选至少约95%,甚至更优选至少约99%的同一性。
67.根据权利要求60–63和65中任一项所述的方法或用途,其中所述5’-UTR元件包含这样的核酸序列或由这样的核酸序列组成,所述核酸序列与选自由SEQ ID NOs:25至30和SEQID NOs:319至382组成的组的序列具有至少约40%,优选至少约50%,优选至少约60%,优选至少约70%,更优选至少约80%,更优选至少约90%,甚至更优选至少约95%,甚至更优选至少约99%的同一性,或其中所述5’-UTR元件包含这样的核酸序列的片段或由这样的核酸序列的片段组成,所述核酸序列的片段与选自由SEQ ID NOs:25至30和SEQ ID NOs:319至382组成的组的序列具有至少约40%,优选至少约50%,优选至少约60%,优选至少约70%,更优选至少约80%,更优选至少约90%,甚至更优选至少约95%,甚至更优选至少约99%的同一性。
68.根据权利要求66或67所述的方法或用途,其中所述片段呈现3至约500个核苷酸之间,优选5至约150个核苷酸之间,更优选10至100个核苷酸之间,甚至更优选15至90个之间,最优选20至70个之间的长度。
69.根据权利要求60–68中任一项所述的方法或用途,其中所述3’-UTR元件和/或所述5’-UTR元件呈现3至约500个核苷酸之间,优选5至约150个核苷酸之间,更优选10至100个核苷酸之间,甚至更优选15至90个之间,最优选20至70个之间的长度。
70.一种试剂盒或成套组件,其包含根据权利要求1–41中任一项所述的人工核酸分子,根据权利要求42–46中任一项所述的载体,根据权利要求47–49中任一项所述的细胞,和/或根据权利要求50或51所述的药物组合物。
71.根据权利要求70所述的试剂盒,其还包含使用说明,用于转染的细胞,辅剂,用于施用所述药物组合物的工具,用于溶解或稀释所述人工核酸分子、所述载体、所述细胞或所述药物组合物的药用载体和/或药用溶液。
72.一种用于鉴别源自稳定mRNA的3’-非翻译区元件(3’-UTR元件)和/或5’-非翻译区元件(5’-UTR元件)的方法,其包括以下步骤:
a)分析mRNA的稳定性,其包括以下子步骤:
i.确定在所述mRNA的降解过程中,所述mRNA在第一时间点的量,
ii.确定在所述mRNA的降解过程中,所述mRNA在第二时间点的量,和
iii.计算步骤(i)中确定的所述mRNA的量与步骤(ii)中确定的所述mRNA的量的比率;
b)选择子步骤(iii)中计算的比率为至少0.5(50%),至少0.6(60%),至少0.7(70%),至少0.75(75%),至少0.8(80%),至少0.85(85%),至少0.9(90%),或至少0.95(95%)的稳定mRNA;和
c)确定所述稳定mRNA的3’-和/或5’-UTR元件的核苷酸序列。
73.一种用于鉴别源自稳定mRNA的3’-非翻译区元件(3’-UTR元件)和/或5’-非翻译区元件(5’-UTR元件)的方法,所述方法包括以下步骤:
a)分析多种mRNA种类的稳定性,其包括以下子步骤:
i.确定在所述mRNA种类的降解过程中,所述多种mRNA种类中的每种mRNA种类在第一时间点的量,
ii.确定在所述mRNA种类的降解过程中,所述多种mRNA种类中的每种mRNA种类在第二时间点的量,和
iii.对于所述多种mRNA种类中的每种mRNA种类计算步骤(i)中确定的所述mRNA种类的量与步骤(ii)中确定的所述mRNA种类的量的比率;
b)根据子步骤(iii)中对于每种mRNA种类计算的比率,将所述多种mRNA种类的mRNA种类进行排序;
c)选择具有子步骤(iii)中计算的最高的一个或多个比例的一种或多种mRNA种类;和
d)确定所述mRNA的3’-和/或5’-UTR元件的核苷酸序列。
74.根据权利要求72或73所述的用于鉴别3’-UTR元件和/或5’-UTR元件的方法,其中所述第一时间点和所述第二时间点之间的时间是至少5h,优选至少6h,优选至少7h,更优选至少8h,更优选至少9h,甚至更优选至少10h,甚至更优选至少11h,并且特别优选至少12h。
75.根据权利要求72–74中任一项所述的用于鉴别3’-UTR元件和/或5’-UTR元件的方法,其中通过脉冲标记,优选使用脉冲追踪方法分析mRNA的稳定性。
76.一种用于鉴别3’-非翻译区元件(3’-UTR元件)和/或5’-非翻译区元件(5’-UTR元件)的方法,所述3’-非翻译区元件(3’-UTR元件)和/或5’-非翻译区元件(5’-UTR元件)延长和/或增加从人工核酸分子的蛋白生产并且源自稳定mRNA,所述方法包括以下步骤:
a)通过根据权利要求72–75中任一项所述的用于鉴别3’-UTR元件和/或5’-UTR元件的方法鉴别源自稳定mRNA的3’-UTR元件和/或5’-UTR元件;
b)合成人工核酸分子,所述人工核酸分子包含至少一个可读框和与步骤a)中鉴别的3’-UTR元件和/或5’-UTR元件对应或由步骤a)中鉴别的3’-UTR元件和/或5’-UTR元件包含的至少一个3’-UTR元件和/或至少一个5’-UTR元件;
c)分析由步骤b)中合成的人工核酸分子的所述至少一个可读框编码的蛋白的表达;
d)分析由缺少3’-UTR元件和/或5’-UTR元件的参比人工核酸分子的至少一个可读框(ORF)编码的蛋白的表达;
e)将步骤c)中分析的从所述人工核酸分子的蛋白表达与步骤d)中分析的从所述参比人工核酸分子的蛋白表达相比较;和
f)如果与步骤d)中分析的从所述参比人工核酸分子的蛋白表达相比,步骤c)中分析的从所述人工核酸分子的蛋白表达延长和/或增加,则选择所述3’-UTR元件和/或所述5’-UTR元件。
77.一种用于产生人工核酸分子的方法,其中合成包含至少一个可读框和通过根据权利要求72–76中任一项所述的用于鉴别3’-UTR元件和/或5’-UTR元件的方法鉴别的至少一个3’-UTR元件和/或至少一个5’-UTR元件的人工核酸分子。
78.根据权利要求77所述的用于产生人工核酸分子的方法,其中根据权利要求42–46中任一项所述的载体被用于合成所述人工核酸分子。
79.根据权利要求77或78所述的用于产生人工核酸分子的方法,其中所述人工核酸分子是根据权利要求1至41中任一项所述的人工核酸分子。
80.通过根据权利要求77–79中任一项所述的用于产生人工核酸分子的方法可获得的人工核酸分子。
CN201580070984.3A 2014-12-30 2015-12-29 人工核酸分子 Pending CN107124889A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EPPCT/EP2014/003479 2014-12-30
EP2014003479 2014-12-30
PCT/EP2015/081366 WO2016107877A1 (en) 2014-12-30 2015-12-29 Artificial nucleic acid molecules

Publications (1)

Publication Number Publication Date
CN107124889A true CN107124889A (zh) 2017-09-01

Family

ID=52814040

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201580070984.3A Pending CN107124889A (zh) 2014-12-30 2015-12-29 人工核酸分子

Country Status (12)

Country Link
US (2) US20180148727A1 (zh)
EP (2) EP3240558A1 (zh)
JP (2) JP6907116B2 (zh)
KR (1) KR102580696B1 (zh)
CN (1) CN107124889A (zh)
AU (1) AU2015373404B2 (zh)
BR (1) BR112017009835A2 (zh)
CA (1) CA2966092A1 (zh)
MX (1) MX2017008670A (zh)
RU (1) RU2757675C2 (zh)
SG (2) SG11201704681QA (zh)
WO (1) WO2016107877A1 (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108026537A (zh) * 2015-08-28 2018-05-11 库瑞瓦格股份公司 人工核酸分子
CN109985230A (zh) * 2018-01-02 2019-07-09 上海清流生物医药科技有限公司 一种蛋白在制备预防和治疗肾病药物中的应用
CN110699367A (zh) * 2018-07-09 2020-01-17 武汉纽福斯生物科技有限公司 编码人nadh脱氢酶亚单位4蛋白的核酸及其应用
CN112368382A (zh) * 2018-05-25 2021-02-12 柏业公司 用于预防和治疗纤维化相关疾病和呼吸系统疾病的双调蛋白基因特异性双链寡核苷酸和包含其的组合物
CN112673106A (zh) * 2017-12-21 2021-04-16 贝瑟克里科有限公司 点击修饰的mRNA

Families Citing this family (96)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE10347710B4 (de) 2003-10-14 2006-03-30 Johannes-Gutenberg-Universität Mainz Rekombinante Impfstoffe und deren Verwendung
DE102005046490A1 (de) 2005-09-28 2007-03-29 Johannes-Gutenberg-Universität Mainz Modifikationen von RNA, die zu einer erhöhten Transkriptstabilität und Translationseffizienz führen
RS64230B1 (sr) 2011-05-24 2023-06-30 BioNTech SE Individualizovane vakcine protiv kancera
WO2013120497A1 (en) 2012-02-15 2013-08-22 Curevac Gmbh Nucleic acid comprising or coding for a histone stem-loop and a poly(a) sequence or a polyadenylation signal for increasing the expression of an encoded therapeutic protein
WO2013143555A1 (en) 2012-03-26 2013-10-03 Biontech Ag Rna formulation for immunotherapy
WO2014082729A1 (en) 2012-11-28 2014-06-05 Biontech Ag Individualized vaccines for cancer
WO2014127917A1 (en) 2013-02-22 2014-08-28 Curevac Gmbh Combination of vaccination and inhibition of the pd-1 pathway
WO2014180490A1 (en) 2013-05-10 2014-11-13 Biontech Ag Predicting immunogenicity of t cell epitopes
WO2015024668A2 (en) 2013-08-21 2015-02-26 Curevac Gmbh Respiratory syncytial virus (rsv) vaccine
WO2015062738A1 (en) 2013-11-01 2015-05-07 Curevac Gmbh Modified rna with decreased immunostimulatory properties
SG11201604198YA (en) 2013-12-30 2016-07-28 Curevac Ag Methods for rna analysis
JP6584414B2 (ja) 2013-12-30 2019-10-02 キュアバック アーゲー 人工核酸分子
EP3129050A2 (en) 2014-04-01 2017-02-15 CureVac AG Polymeric carrier cargo complex for use as an immunostimulating agent or as an adjuvant
EP3521456B1 (en) 2014-06-10 2023-01-04 CureVac Manufacturing GmbH Methods and means for enhancing rna production
PT3766916T (pt) 2014-06-25 2022-11-28 Acuitas Therapeutics Inc Novos lípidos e formulações de nanopartículas lipídicas para distribuição de ácidos nucleicos
WO2016045732A1 (en) 2014-09-25 2016-03-31 Biontech Rna Pharmaceuticals Gmbh Stable formulations of lipids and liposomes
EP4023755B1 (en) 2014-12-12 2023-04-26 CureVac SE Artificial nucleic acid molecules for improved protein expression
WO2016128060A1 (en) 2015-02-12 2016-08-18 Biontech Ag Predicting t cell epitopes useful for vaccination
EP4353257A2 (en) 2015-04-13 2024-04-17 CureVac Manufacturing GmbH Method for producing rna compositions
EP4026568A1 (en) 2015-04-17 2022-07-13 CureVac Real Estate GmbH Lyophilization of rna
CN107889503A (zh) 2015-04-30 2018-04-06 库瑞瓦格股份公司 固定化的聚(n)聚合酶
WO2016180430A1 (en) 2015-05-08 2016-11-17 Curevac Ag Method for producing rna
GB201508025D0 (en) 2015-05-11 2015-06-24 Ucl Business Plc Fabry disease gene therapy
DK3294326T3 (da) 2015-05-15 2021-05-31 Curevac Ag Prime-boost-regimer indbefattende indgivelse af mindst én mrna-konstruktion
WO2016184576A2 (en) 2015-05-20 2016-11-24 Curevac Ag Dry powder composition comprising long-chain rna
WO2016184575A1 (en) 2015-05-20 2016-11-24 Curevac Ag Dry powder composition comprising long-chain rna
EP4098743A1 (en) 2015-05-29 2022-12-07 CureVac AG Method for adding cap structures to rna using immobilized enzymes
CN107873055B (zh) 2015-05-29 2021-09-17 库瑞瓦格房地产有限公司 包括至少一个切向流过滤步骤的产生和纯化rna的方法
US10221127B2 (en) 2015-06-29 2019-03-05 Acuitas Therapeutics, Inc. Lipids and lipid nanoparticle formulations for delivery of nucleic acids
WO2017009376A1 (en) 2015-07-13 2017-01-19 Curevac Ag Method of producing rna from circular dna and corresponding template dna
CN105112552B (zh) * 2015-09-28 2018-02-27 北京泱深生物信息技术有限公司 Ift52基因在骨质疏松症诊断中的应用
WO2017059902A1 (en) 2015-10-07 2017-04-13 Biontech Rna Pharmaceuticals Gmbh 3' utr sequences for stabilization of rna
US11225682B2 (en) 2015-10-12 2022-01-18 Curevac Ag Automated method for isolation, selection and/or detection of microorganisms or cells comprised in a solution
IL286515B2 (en) 2015-10-28 2024-02-01 Acuitas Therapeutics Inc Novel lipids and nanoparticle formulations of lipids for delivery of nucleic acids
WO2017081110A1 (en) 2015-11-09 2017-05-18 Curevac Ag Rotavirus vaccines
CN108778308A (zh) 2015-12-22 2018-11-09 库瑞瓦格股份公司 生产rna分子组合物的方法
EP3394280A1 (en) 2015-12-23 2018-10-31 CureVac AG Method of rna in vitro transcription using a buffer containing a dicarboxylic acid or tricarboxylic acid or a salt thereof
SG10201913630YA (en) 2016-02-17 2020-03-30 Curevac Ag Zika virus vaccine
US11920174B2 (en) 2016-03-03 2024-03-05 CureVac SE RNA analysis by total hydrolysis and quantification of released nucleosides
WO2017186928A1 (en) 2016-04-29 2017-11-02 Curevac Ag Rna encoding an antibody
WO2017191264A1 (en) 2016-05-04 2017-11-09 Curevac Ag Nucleic acid molecules and uses thereof
US11078247B2 (en) 2016-05-04 2021-08-03 Curevac Ag RNA encoding a therapeutic protein
KR20190029576A (ko) 2016-06-09 2019-03-20 큐어백 아게 핵산 카고용 하이브리드 담체
CA3030701A1 (en) 2016-07-11 2018-01-18 Translate Bio Ma, Inc. Nucleic acid conjugates and uses thereof
SG10201913631TA (en) 2016-08-19 2020-03-30 Curevac Ag Rna for cancer therapy
WO2018096179A1 (en) 2016-11-28 2018-05-31 Curevac Ag Method for purifying rna
WO2018102397A1 (en) 2016-11-29 2018-06-07 PureTech Health LLC Exosomes for delivery of therapeutic agents
CN110582304A (zh) * 2016-12-08 2019-12-17 库尔维科公司 用于治疗或预防肝脏疾病的rna
WO2018104540A1 (en) 2016-12-08 2018-06-14 Curevac Ag Rnas for wound healing
WO2018115525A1 (en) 2016-12-23 2018-06-28 Curevac Ag Lassa virus vaccine
US11141476B2 (en) 2016-12-23 2021-10-12 Curevac Ag MERS coronavirus vaccine
US11524066B2 (en) 2016-12-23 2022-12-13 CureVac SE Henipavirus vaccine
CN110392577A (zh) 2017-03-17 2019-10-29 库尔维科公司 用于组合抗癌疗法的rna疫苗和免疫检查点抑制剂
CA3050616A1 (en) * 2017-03-24 2018-09-27 Curevac Ag Nucleic acids encoding crispr-associated proteins and uses thereof
WO2018191657A1 (en) 2017-04-13 2018-10-18 Acuitas Therapeutics, Inc. Lipids for delivery of active agents
WO2018200975A1 (en) 2017-04-27 2018-11-01 Vanderbilt University Hepatitis c virus gene sequences and methods of use therefor
WO2018200943A1 (en) 2017-04-28 2018-11-01 Acuitas Therapeutics, Inc. Novel carbonyl lipids and lipid nanoparticle formulations for delivery of nucleic acids
CN111328287A (zh) 2017-07-04 2020-06-23 库瑞瓦格股份公司 新型核酸分子
WO2019036008A1 (en) 2017-08-16 2019-02-21 Acuitas Therapeutics, Inc. LIPIDS FOR USE IN LIPID NANOPARTICULAR FORMULATIONS
US11542225B2 (en) 2017-08-17 2023-01-03 Acuitas Therapeutics, Inc. Lipids for use in lipid nanoparticle formulations
WO2019036030A1 (en) 2017-08-17 2019-02-21 Acuitas Therapeutics, Inc. LIPIDS FOR USE IN LIPID NANOPARTICLE FORMULATIONS
US11602557B2 (en) 2017-08-22 2023-03-14 Cure Vac SE Bunyavirales vaccine
MX2020003995A (es) * 2017-10-19 2020-07-22 Curevac Ag Nuevas moleculas de acido nucleico artificiales.
RU2020117848A (ru) 2017-11-08 2021-12-08 Куревак Аг Адаптиция последовательности phk
WO2019115635A1 (en) 2017-12-13 2019-06-20 Curevac Ag Flavivirus vaccine
WO2019122371A1 (en) 2017-12-21 2019-06-27 Curevac Ag Linear double stranded dna coupled to a single support or a tag and methods for producing said linear double stranded dna
US20210361761A1 (en) 2018-04-05 2021-11-25 Curevac Ag Novel yellow fever nucleic acid molecules for vaccination
BR112020020933A2 (pt) 2018-04-17 2021-04-06 Curevac Ag Moléculas de rna de rsv inovadoras e composições para vacinação
US20210260178A1 (en) 2018-06-27 2021-08-26 Curevac Ag Novel lassa virus rna molecules and compositions for vaccination
EP3897702A2 (en) 2018-12-21 2021-10-27 CureVac AG Rna for malaria vaccines
WO2020161342A1 (en) 2019-02-08 2020-08-13 Curevac Ag Coding rna administered into the suprachoroidal space in the treatment of ophtalmic diseases
WO2020254535A1 (en) 2019-06-18 2020-12-24 Curevac Ag Rotavirus mrna vaccine
CA3144902A1 (en) 2019-08-14 2022-01-19 Andreas Thess Rna combinations and compositions with decreased immunostimulatory properties
EP4022068A1 (en) * 2019-08-29 2022-07-06 Universität Zürich Minimal messenger rnas and uses thereof
IL293571A (en) 2020-02-04 2022-08-01 Curevac Ag Corona virus vaccine
US11576966B2 (en) 2020-02-04 2023-02-14 CureVac SE Coronavirus vaccine
US11241493B2 (en) 2020-02-04 2022-02-08 Curevac Ag Coronavirus vaccine
CN116322758A (zh) 2020-05-29 2023-06-23 库尔维科欧洲股份公司 基于核酸的组合疫苗
US20230272052A1 (en) 2020-07-31 2023-08-31 CureVac SE Nucleic acid encoded antibody mixtures
CA3170743A1 (en) 2020-08-31 2022-03-03 Susanne RAUCH Multivalent nucleic acid based coronavirus vaccines
CA3171051A1 (en) 2020-12-22 2022-06-30 Curevac Ag Pharmaceutical composition comprising lipid-based carriers encapsulating rna for multidose administration
WO2022137133A1 (en) 2020-12-22 2022-06-30 Curevac Ag Rna vaccine against sars-cov-2 variants
KR20230164648A (ko) 2020-12-22 2023-12-04 큐어백 에스이 SARS-CoV-2 변이체에 대한 RNA 백신
CN114717230A (zh) * 2021-01-05 2022-07-08 麦塞拿治疗(香港)有限公司 成纤维细胞生长因子mRNA的无细胞和无载体体外RNA转录方法和核酸分子
CA3170747A1 (en) 2021-01-27 2022-08-04 Moritz THRAN Method of reducing the immunostimulatory properties of in vitro transcribed rna
CA3210763A1 (en) 2021-02-12 2022-08-18 Alnylam Pharmaceuticals, Inc. Superoxide dismutase 1 (sod1) irna compositions and methods of use thereof for treating or preventing superoxide dismutase 1- (sod1-) associated neurodegenerative diseases
JP2024511206A (ja) 2021-03-26 2024-03-12 グラクソスミスクライン バイオロジカルズ ソシエテ アノニム 免疫原性組成物
CA3171429A1 (en) 2021-03-31 2022-09-30 Alexander SCHWENGER Syringes containing pharmaceutical compositions comprising rna
CA3171589A1 (en) 2021-05-03 2022-11-03 Moritz THRAN Improved nucleic acid sequence for cell type specific expression
AU2022284878A1 (en) 2021-06-04 2024-01-18 Translate Bio, Inc. Assay for quantitative assessment of mrna capping efficiency
AU2021461416A1 (en) 2021-08-24 2024-02-22 BioNTech SE In vitro transcription technologies
KR20230083893A (ko) * 2021-12-03 2023-06-12 고려대학교 산학협력단 번역 효율이 향상된 5'-utr, 이를 포함하는 합성 핵산 분자 및 이를 포함하는 백신 또는 치료제 조성물
WO2023144330A1 (en) 2022-01-28 2023-08-03 CureVac SE Nucleic acid encoded transcription factor inhibitors
WO2023225360A2 (en) * 2022-05-20 2023-11-23 The University Of South Alabama Capless and tailless therapeutic exogenous mrna and method to produce the same
WO2023227608A1 (en) 2022-05-25 2023-11-30 Glaxosmithkline Biologicals Sa Nucleic acid based vaccine encoding an escherichia coli fimh antigenic polypeptide
WO2024068545A1 (en) 2022-09-26 2024-04-04 Glaxosmithkline Biologicals Sa Influenza virus vaccines

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013120629A1 (en) * 2012-02-15 2013-08-22 Curevac Gmbh Nucleic acid comprising or coding for a histone stem-loop and a poly(a) sequence or a polyadenylation signal for increasing the expression of an encoded therapeutic protein
WO2013143700A2 (en) * 2012-03-27 2013-10-03 Curevac Gmbh Artificial nucleic acid molecules comprising a 5'top utr
WO2013143698A1 (en) * 2012-03-27 2013-10-03 Curevac Gmbh Artificial nucleic acid molecules

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5132418A (en) 1980-02-29 1992-07-21 University Patents, Inc. Process for preparing polynucleotides
US4500707A (en) 1980-02-29 1985-02-19 University Patents, Inc. Nucleosides useful in the preparation of polynucleotides
US4458066A (en) 1980-02-29 1984-07-03 University Patents, Inc. Process for preparing polynucleotides
US4668777A (en) 1981-03-27 1987-05-26 University Patents, Inc. Phosphoramidite nucleoside compounds
US4973679A (en) 1981-03-27 1990-11-27 University Patents, Inc. Process for oligonucleo tide synthesis using phosphormidite intermediates
US4415732A (en) 1981-03-27 1983-11-15 University Patents, Inc. Phosphoramidite compounds and processes
US4401796A (en) 1981-04-30 1983-08-30 City Of Hope Research Institute Solid-phase synthesis of polynucleotides
US4373071A (en) 1981-04-30 1983-02-08 City Of Hope Research Institute Solid-phase synthesis of polynucleotides
US5153319A (en) 1986-03-31 1992-10-06 University Patents, Inc. Process for preparing polynucleotides
US5047524A (en) 1988-12-21 1991-09-10 Applied Biosystems, Inc. Automated system for polynucleotide synthesis and purification
US5262530A (en) 1988-12-21 1993-11-16 Applied Biosystems, Inc. Automated system for polynucleotide synthesis and purification
US5700642A (en) 1995-05-22 1997-12-23 Sri International Oligonucleotide sizing using immobilized cleavable primers
EP2842964A1 (de) 2001-06-05 2015-03-04 Curevac GmbH Virtuelles Verfahren zur Ermittlung einer modifzierten mRNA-Sequenz
CA2632900A1 (en) * 2005-12-12 2007-06-21 Research Corporation Technologies, Inc. Hybrid 3' untranslated regions suitable for efficient protein expression in mammalian cells
JP2009181427A (ja) * 2008-01-31 2009-08-13 Toshiba Corp アクセス管理システム及びアクセス管理方法
WO2010037408A1 (en) 2008-09-30 2010-04-08 Curevac Gmbh Composition comprising a complexed (m)rna and a naked mrna for providing or enhancing an immunostimulatory response in a mammal and uses thereof
WO2012019630A1 (en) 2010-08-13 2012-02-16 Curevac Gmbh Nucleic acid comprising or coding for a histone stem-loop and a poly(a) sequence or a polyadenylation signal for increasing the expression of an encoded protein
ES2742473T3 (es) * 2012-03-27 2020-02-14 Curevac Ag Moléculas artificiales de ácido nucleico para la expresión mejorada de proteínas o péptidos
JP6584414B2 (ja) * 2013-12-30 2019-10-02 キュアバック アーゲー 人工核酸分子
RU2717986C2 (ru) * 2013-12-30 2020-03-27 Куревак Аг Искусственные молекулы нуклеиновой кислоты

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013120629A1 (en) * 2012-02-15 2013-08-22 Curevac Gmbh Nucleic acid comprising or coding for a histone stem-loop and a poly(a) sequence or a polyadenylation signal for increasing the expression of an encoded therapeutic protein
WO2013143700A2 (en) * 2012-03-27 2013-10-03 Curevac Gmbh Artificial nucleic acid molecules comprising a 5'top utr
WO2013143698A1 (en) * 2012-03-27 2013-10-03 Curevac Gmbh Artificial nucleic acid molecules

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108026537A (zh) * 2015-08-28 2018-05-11 库瑞瓦格股份公司 人工核酸分子
CN108026537B (zh) * 2015-08-28 2022-02-08 库瑞瓦格股份公司 人工核酸分子
CN112673106A (zh) * 2017-12-21 2021-04-16 贝瑟克里科有限公司 点击修饰的mRNA
CN109985230A (zh) * 2018-01-02 2019-07-09 上海清流生物医药科技有限公司 一种蛋白在制备预防和治疗肾病药物中的应用
CN109985230B (zh) * 2018-01-02 2023-10-17 上海普佑生物医药有限公司 一种蛋白在制备预防和治疗肾病药物中的应用
CN112368382A (zh) * 2018-05-25 2021-02-12 柏业公司 用于预防和治疗纤维化相关疾病和呼吸系统疾病的双调蛋白基因特异性双链寡核苷酸和包含其的组合物
CN110699367A (zh) * 2018-07-09 2020-01-17 武汉纽福斯生物科技有限公司 编码人nadh脱氢酶亚单位4蛋白的核酸及其应用

Also Published As

Publication number Publication date
AU2015373404A1 (en) 2017-05-25
KR20170100660A (ko) 2017-09-04
EP3240558A1 (en) 2017-11-08
WO2016107877A1 (en) 2016-07-07
RU2017127203A3 (zh) 2020-01-10
MX2017008670A (es) 2017-10-11
EP3494982A1 (en) 2019-06-12
US20180148727A1 (en) 2018-05-31
KR102580696B1 (ko) 2023-09-19
RU2757675C2 (ru) 2021-10-20
SG10201906673WA (en) 2019-09-27
CA2966092A1 (en) 2016-07-07
AU2015373404B2 (en) 2021-09-09
RU2017127203A (ru) 2019-02-01
SG11201704681QA (en) 2017-07-28
JP2021168664A (ja) 2021-10-28
US20190345504A1 (en) 2019-11-14
BR112017009835A2 (pt) 2017-12-26
JP6907116B2 (ja) 2021-07-21
JP2018501802A (ja) 2018-01-25

Similar Documents

Publication Publication Date Title
RU2757675C2 (ru) Молекулы новых искусственных нуклеиновых кислот
CN108026537B (zh) 人工核酸分子
RU2717986C2 (ru) Искусственные молекулы нуклеиновой кислоты
JP6648019B2 (ja) Rnaコードされたタンパク質の発現を促進するための医薬的組成物、医薬的組成物の製造のための修飾rnaの使用、および、医薬的組成物を含むパーツキット
KR101999410B1 (ko) 염색체 랜딩 패드 및 관련된 용도
TW202317767A (zh) 環狀rna組合物及方法
CN111440244A (zh) 靶向vegfr2的转移性癌疫苗
CN111542610A (zh) 精确基因组编辑的新策略
CN114630909A (zh) 环状rna、包含环状rna的疫苗及用于检测新型冠状病毒中和抗体的试剂盒
RU2774415C1 (ru) Искусственные молекулы нуклеиновой кислоты
CN115043947B (zh) 一种克里米亚-刚果出血热病毒Zera-Gn蛋白纳米颗粒、制备方法及其用途
CN114644686B (zh) 一种用于dna疫苗递送系统及其应用和dna疫苗
RU2772349C2 (ru) Искусственные молекулы нуклеиновой кислоты
CN115073612A (zh) 一种结核分枝杆菌Zera-71cA蛋白纳米颗粒、制备方法及其用途
KR20230148824A (ko) 핵산을 전달하기 위한 조성물 및 방법
On Molecular cloning of growth hormone and growth hormone receptor in lower vertebrates

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination