CN116194151A - 包含具有延长的半衰期的mRNA治疗剂的LNP组合物 - Google Patents

包含具有延长的半衰期的mRNA治疗剂的LNP组合物 Download PDF

Info

Publication number
CN116194151A
CN116194151A CN202180051902.6A CN202180051902A CN116194151A CN 116194151 A CN116194151 A CN 116194151A CN 202180051902 A CN202180051902 A CN 202180051902A CN 116194151 A CN116194151 A CN 116194151A
Authority
CN
China
Prior art keywords
seq
polynucleotide
sequence
utr
fragment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180051902.6A
Other languages
English (en)
Inventor
D·里德
R·杰恩
A·比克内尔
C·科勒
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ModernaTx Inc
Original Assignee
ModernaTx Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ModernaTx Inc filed Critical ModernaTx Inc
Publication of CN116194151A publication Critical patent/CN116194151A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/88Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation using microencapsulation, e.g. using amphiphile liposome vesicle
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • A61K48/0066Manipulation of the nucleic acid to modify its expression pattern, e.g. enhance its duration of expression, achieved by the presence of particular introns in the delivered nucleic acid
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K9/00Medicinal preparations characterised by special physical form
    • A61K9/14Particulate form, e.g. powders, Processes for size reducing of pure drugs or the resulting products, Pure drug nanoparticles
    • A61K9/16Agglomerates; Granulates; Microbeadlets ; Microspheres; Pellets; Solid products obtained by spray drying, spray freeze drying, spray congealing,(multiple) emulsion solvent evaporation or extraction
    • A61K9/1605Excipients; Inactive ingredients
    • A61K9/1617Organic compounds, e.g. phospholipids, fats
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/67General methods for enhancing the expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/50Vector systems having a special element relevant for transcription regulating RNA stability, not being an intron, e.g. poly A signal

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Medicinal Chemistry (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Animal Behavior & Ethology (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Epidemiology (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Medicinal Preparation (AREA)
  • Immunology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Nanotechnology (AREA)
  • Optics & Photonics (AREA)
  • Dispersion Chemistry (AREA)

Abstract

本公开的特征在于一种编码多肽的多核苷酸,所述多核苷酸包含:本文所描述的5'UTR;包含本文所描述的有效载荷和终止元件的编码区;和本文所描述的3'UTR,以及包含所述多核苷酸的LNP组合物。本公开的多核苷酸和/或LNP组合物能够:通过增加编码有效载荷的多核苷酸或有效载荷多肽的半衰期和/或表达持续时间来提高所述有效载荷的水平和/或活性。本文还公开了使用本公开的LNP组合物治疗受试者的疾病或病症的方法。

Description

包含具有延长的半衰期的mRNA治疗剂的LNP组合物
相关申请的交叉引用
本申请要求2020年6月23日提交的美国临时申请号63/042,822、2021年3月23日提交的美国临时申请号63/165,094和2021年3月24日提交的美国临时申请号63/165,469的权益。前述申请的内容特此以全文引用的方式并入。
序列表
本申请含有序列表,所述序列表按ASCII格式以电子方式提交并且特此以全文引用的方式并入。2021年6月23日创建的所述ASCII副本命名为M2180-7007WO_SL.txt并且大小为45,216字节。
发明背景
提高mRNA效力的努力已经致力于产生具有开放阅读框(ORF)的最佳序列设计的mRNA。然而,就mRNA表达的效力和持久性来说,没有迹象表明通过这些努力已经达成了最大效力。在mRNA治疗剂的情况下尤其如此。因此,需要通过利用RNA生物学来进一步提高mRNA表达的效力和持久性。
发明内容
本公开尤其提供了编码多肽的多核苷酸,其中所述多核苷酸包含:(a)5'-UTR(例如,如本文所描述);(b)编码区,所述编码区包含终止元件(例如,如本文所描述);以及(c)3'-UTR(例如,如本文所描述),以及包含所述多核苷酸的LNP组合物。在一个实施方案中,编码区包含多核苷酸序列,例如mRNA,例如编码肽或多肽有效载荷,例如治疗性有效载荷或预防性有效载荷的开放阅读框(ORF)。在一个实施方案中,多核苷酸,例如mRNA,或由多核苷酸编码的多肽相比缺乏本文所描述的5'-UTR、3'-UTR或终止元件的型式具有增加的水平和/或活性,例如表达或半衰期。在一个实施方案中,多核苷酸,例如mRNA的水平和/或活性增加。在一个实施方案中,由多核苷酸编码的多肽的水平、活性和/或表达持续时间增加。本文还公开了使用包含本文所公开的多核苷酸的LNP组合物用于治疗疾病或病症或用于促进受试者中的所需生物作用的方法。将了解,任何ORF可以与所公开的元件组合,例如,编码无论是例如细胞内的、跨膜的还是分泌的多肽或肽的ORF。本公开的额外方面在下文进一步详细描述。
5'UTR和包含3'UTR和/或终止元件的组合
在一个方面,本文提供了一种编码多肽(例如,mRNA)的多核苷酸,其中所述多核苷酸包含:(a)5'-UTR,所述5'-UTR包含SEQ ID NO:1的序列或其变体或片段;(b)编码区,所述编码区包含终止元件(例如,如本文所描述);以及(c)3'-UTR(例如,如本文所描述)。
在一个实施方案中,5'UTR包含式A的核酸序列:
G G A A A U C G C A A A A(N2)X(N3)X C U(N4)X(N5)X C G C G U U A G A U UU C U U U U A G U U U U C U N6 N7 C A A C U A G C A A G C U U U U U G U U C UC G C C(N8 C C)x(SEQ ID NO:46),其中:
(N2)x是尿嘧啶并且x是0至5的整数,例如,其中x=3或4;(N3)x是鸟嘌呤并且x是0至1的整数;(N4)x是胞嘧啶并且x是0至1的整数;(N5)x是尿嘧啶并且x是0至5的整数,例如,其中x=2或3;N6是尿嘧啶或胞嘧啶;N7是尿嘧啶或鸟嘌呤;和/或N8是腺嘌呤或鸟嘌呤并且x是0至1的整数。
在一个实施方案中,SEQ ID NO:1的变体包含与SEQ ID NO:1或SEQ ID NO:1的核苷酸2-75、3-75、4-75、5-75、6-75或7-75具有至少50%、60%、70%、80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。在一个实施方案中,SEQ ID NO:1的变体包含与SEQ ID NO:1或SEQ ID NO:1的核苷酸2-75、3-75、4-75、5-75、6-75或7-75具有至少50%同一性的序列。在一个实施方案中,SEQ ID NO:1的变体包含与SEQ ID NO:1或SEQ ID NO:1的核苷酸2-75、3-75、4-75、5-75、6-75或7-75具有至少60%同一性的序列。在一个实施方案中,SEQ ID NO:1的变体包含与SEQ ID NO:1或SEQ ID NO:1的核苷酸2-75、3-75、4-75、5-75、6-75或7-75具有至少70%同一性的序列。在一个实施方案中,SEQ ID NO:1的变体包含与SEQ ID NO:1或SEQ ID NO:1的核苷酸2-75、3-75、4-75、5-75、6-75或7-75具有至少80%同一性的序列。在一个实施方案中,SEQ ID NO:1的变体包含与SEQ ID NO:1或SEQ ID NO:1的核苷酸2-75、3-75、4-75、5-75、6-75或7-75具有至少90%同一性的序列。在一个实施方案中,SEQ ID NO:1的变体包含与SEQ ID NO:1或SEQ ID NO:1的核苷酸2-75、3-75、4-75、5-75、6-75或7-75具有至少95%同一性的序列。在一个实施方案中,SEQ ID NO:1的变体包含与SEQ ID NO:1或SEQ ID NO:1的核苷酸2-75、3-75、4-75、5-75、6-75或7-75具有至少96%同一性的序列。在一个实施方案中,SEQ ID NO:1的变体包含与SEQ ID NO:1或SEQ ID NO:1的核苷酸2-75、3-75、4-75、5-75、6-75或7-75具有至少97%同一性的序列。在一个实施方案中,SEQ ID NO:1的变体包含与SEQ ID NO:1或SEQ ID NO:1的核苷酸2-75、3-75、4-75、5-75、6-75或7-75具有至少98%同一性的序列。在一个实施方案中,SEQ ID NO:1的变体包含与SEQ ID NO:1或SEQ ID NO:1的核苷酸2-75、3-75、4-75、5-75、6-75或7-75具有至少99%同一性的序列。在一个实施方案中,SEQ ID NO:1的变体包含与SEQ ID NO:1或SEQ ID NO:1的核苷酸2-75、3-75、4-75、5-75、6-75或7-75具有至少100%同一性的序列。
在一个实施方案中,SEQ ID NO:1的变体包含至少30%、40%、50%、60%、70%或80%的尿苷含量。在一个实施方案中,SEQ ID NO:1的变体包含至少30%的尿苷含量。在一个实施方案中,SEQ ID NO:1的变体包含至少40%的尿苷含量。在一个实施方案中,SEQ IDNO:1的变体包含至少50%的尿苷含量。在一个实施方案中,SEQ ID NO:1的变体包含至少60%的尿苷含量。在一个实施方案中,SEQ ID NO:1的变体包含至少70%的尿苷含量。在一个实施方案中,SEQ ID NO:1的变体包含至少80%的尿苷含量。
在一个实施方案中,SEQ ID NO:1的变体包含至少2、3、4、5、6、7、8、9、10、11或12个连续尿苷(例如,聚尿苷序列段)。在一个实施方案中,SEQ ID NO:1的变体包含至少2个连续尿苷。在一个实施方案中,SEQ ID NO:1的变体包含至少3个连续尿苷。在一个实施方案中,SEQ ID NO:1的变体包含至少4个连续尿苷。在一个实施方案中,SEQ ID NO:1的变体包含至少5个连续尿苷。在一个实施方案中,SEQ ID NO:1的变体包含至少6个连续尿苷。在一个实施方案中,SEQ ID NO:1的变体包含至少7个连续尿苷。在一个实施方案中,SEQ ID NO:1的变体包含至少8个连续尿苷。在一个实施方案中,SEQ ID NO:1的变体包含至少9个连续尿苷。在一个实施方案中,SEQ ID NO:1的变体包含至少10个连续尿苷。在一个实施方案中,SEQ ID NO:1的变体包含至少11个连续尿苷。在一个实施方案中,SEQ ID NO:1的变体包含至少12个连续尿苷。
在一个实施方案中,SEQ ID NO:1的变体中的聚尿苷序列段包含至少2-12、2-11、2-10、2-9、2-8、2-7、2-6、2-5、2-4、2-3、3-12、4-12、5-12、6-12、7-12、8-12、9-12、10-12、11-12、2-6或3-5个连续尿苷。在一个实施方案中,SEQ ID NO:1的变体中的聚尿苷序列段包含至少2-6个连续尿苷。在一个实施方案中,SEQ ID NO:1的变体中的聚尿苷序列段包含至少2-5个连续尿苷。在一个实施方案中,SEQ ID NO:1的变体中的聚尿苷序列段包含至少2-4个连续尿苷。在一个实施方案中,SEQ ID NO:1的变体中的聚尿苷序列段包含至少3-4个连续尿苷。在一个实施方案中,SEQ ID NO:1的变体中的聚尿苷序列段包含至少3-5个连续尿苷。在一个实施方案中,SEQ ID NO:1的变体中的聚尿苷序列段包含至少4-5个连续尿苷。
在一个实施方案中,SEQ ID NO:1的变体包含2个连续尿苷。在一个实施方案中,SEQ ID NO:1的变体包含3个连续尿苷。在一个实施方案中,SEQ ID NO:1的变体包含4个连续尿苷。在一个实施方案中,SEQ ID NO:1的变体包含5个连续尿苷。在一个实施方案中,SEQID NO:1的变体包含6个连续尿苷。在一个实施方案中,SEQ ID NO:1的变体包含7个连续尿苷。在一个实施方案中,SEQ ID NO:1的变体包含8个连续尿苷。在一个实施方案中,SEQ IDNO:1的变体包含9个连续尿苷。在一个实施方案中,SEQ ID NO:1的变体包含10个连续尿苷。在一个实施方案中,SEQ ID NO:1的变体包含11个连续尿苷。在一个实施方案中,SEQ IDNO:1的变体包含12个连续尿苷。
在一个实施方案中,SEQ ID NO:1的变体包含1、2、3、4、5、6、7、8、9、10、11、12、13、14或15个聚尿苷序列段。在一个实施方案中,SEQ ID NO:1的变体包含1个聚尿苷序列段。在一个实施方案中,SEQ ID NO:1的变体包含2个聚尿苷序列段。在一个实施方案中,SEQ IDNO:1的变体包含3个聚尿苷序列段。在一个实施方案中,SEQ ID NO:1的变体包含4个聚尿苷序列段。在一个实施方案中,SEQ ID NO:1的变体包含5个聚尿苷序列段。在一个实施方案中,SEQ ID NO:1的变体包含6个聚尿苷序列段。在一个实施方案中,SEQ ID NO:1的变体包含7个聚尿苷序列段。在一个实施方案中,SEQ ID NO:1的变体包含8个聚尿苷序列段。
在一个实施方案中,聚尿苷序列段中的一者或多者与不同聚尿苷序列段相邻。在一个实施方案中,聚尿苷序列段中的每一者,例如全部彼此相邻,例如,聚尿苷序列段全部是相连的。在一个实施方案中,聚尿苷序列段中的一者或多者由1、2、3、4、5、6、7、8、9、10、11、2、13、14、15、16、17、18、19、20、30、40、50或60个核苷酸隔开。在一个实施方案中,聚尿苷序列段中的每一者,例如全部由1、2、3、4、5、6、7、8、9、10、11、2、13、14、15、16、17、18、19、20、30、40、50或60个核苷酸隔开。在一个实施方案中,第一聚尿苷序列段和第二聚尿苷序列段彼此相邻。
在一个实施方案中,5'UTR包含Kozak序列,例如,GCCRCC核苷酸序列(SEQ ID NO:43),其中R是腺嘌呤或鸟嘌呤。
在一个实施方案中,5'UTR包含SEQ ID NO:1的序列或与SEQID NO:1或SEQ ID NO:1的核苷酸2-75、3-75、4-75、5-75、6-75或7-75具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。在一个实施方案中,5'UTR包含SEQ ID NO:1的序列或SEQID NO:1的核苷酸2-75、3-75、4-75、5-75、6-75或7-75。
在一个实施方案中,5'UTR包含SEQ ID NO:41的序列或与SEQID NO:41或SEQ IDNO:41的核苷酸2-81、3-81、4-81、5-81、6-81或7-81具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。在一个实施方案中,5'UTR包含SEQ ID NO:41的序列或SEQ ID NO:41的核苷酸2-81、3-81、4-81、5-81、6-81或7-81。
在一个实施方案中,5'UTR包含SEQ ID NO:42的序列或与SEQID NO:42或SEQ IDNO:42的核苷酸2-81、3-81、4-81、5-81、6-81或7-81具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。在一个实施方案中,5'UTR包含SEQ ID NO:42的序列或SEQ ID NO:42的核苷酸2-81、3-81、4-81、5-81、6-81或7-81。
在一个实施方案中,5'UTR使得多核苷酸的半衰期增加,例如,多核苷酸的半衰期增加约1.5-20倍。在一个实施方案中,将多核苷酸的半衰期的增加与不具有5'UTR、具有不同5'UTR或不具有本文所公开的5'UTR的在其它方面类似的多核苷酸进行比较。在一个实施方案中,根据测量多核苷酸的半衰期的测定,例如本文实施例中的任一者中所描述的测定来测量多核苷酸的半衰期的增加。
在一个实施方案中,5'UTR使得由多核苷酸编码的多肽的水平和/或活性,例如输出增加。在一个实施方案中,5'UTR使得由多核苷酸编码的多肽的水平和/或活性,例如输出增加约1.5-20倍。在一个实施方案中,将活性的增加与不具有5'UTR、具有不同5'UTR或不具有本文所公开的5'UTR的在其它方面类似的多核苷酸进行比较。
在一个实施方案中,(b)的编码区包含选自表3中所提供的终止元件的终止元件,例如,SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ IDNO:31、SEQ ID NO:32、SEQ ID NO:33、SEQ ID NO:34、SEQ ID NO:35、SEQ ID NO:36、SEQ IDNO:37、SEQ ID NO:56、SEQ ID NO:57、SEQ ID NO:62、SEQ ID NO:93或SEQ ID NO:96。
在一个实施方案中,(c)的3'UTR包含表2中所提供的3'UTR序列或与表2中所提供的3'UTR序列或其片段(例如,缺少表2中所提供的3'UTR序列的初始(即,5'最末端)一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。在一个实施方案中,3'UTR包含与SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ IDNO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:45、SEQ ID NO:79、SEQ ID NO:80、SEQ IDNO:81、SEQ ID NO:82、SEQ ID NO:83、SEQ ID NO:84、SEQ ID NO:85、SEQ ID NO:86、SEQ IDNO:87、SEQ ID NO:94或SEQ ID NO:95或其片段(例如,缺少前述序列中的任一者的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。在一个实施方案中,3'UTR包含微RNA(miRNA)结合位点,例如,如本文所描述,例如SEQ ID NO:38-40中的任一者的序列。
在一个实施方案中,3'UTR包含本文所描述的TENT募集序列中的一者或多者(例如,2者或3者)。在一个实施方案中,3'UTR包含与SEQ ID NO:91或92具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
在一个实施方案中,(i)(b)的编码区包含选自表3中所提供的终止元件的终止元件,例如,SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32、SEQ ID NO:33、SEQ ID NO:34、SEQ ID NO:35、SEQ ID NO:36、SEQ ID NO:37、SEQ ID NO:56、SEQ ID NO:57、SEQ ID NO:62、SEQ ID NO:93或SEQ IDNO:96;以及(ii)(c)的3'UTR包含表2中所提供的3'UTR序列或与表2中所提供的3'UTR序列或其片段(例如,缺少表2中所提供的3'UTR序列的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
在一个实施方案中,3'UTR包含与SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ IDNO:25、SEQ ID NO:45、SEQ ID NO:79、SEQ ID NO:80、SEQ ID NO:81、SEQ ID NO:82、SEQ IDNO:83、SEQ ID NO:84、SEQ ID NO:85、SEQ ID NO:86、SEQ ID NO:87、SEQ ID NO:94或SEQID NO:95或其片段(例如,缺少前述序列中的任一者的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。在一个实施方案中,3'UTR包含微RNA结合位点,例如,如本文所描述,例如SEQ ID NO:38-40中的任一者的序列。
在一个实施方案中,3'UTR包含本文所描述的TENT募集序列中的一者或多者(例如,2者或3者)。在一个实施方案中,3'UTR包含与SEQ ID NO:91或92具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
3'UTR和包含5'UTR和/或终止元件的组合
在一个方面,本文公开了一种编码多肽的多核苷酸,其中所述多核苷酸包含:(a)5'-UTR(例如,如本文所描述);(b)编码区,所述编码区包含终止元件(例如,如本文所描述);以及(c)3'UTR,所述3'UTR包含与SEQ ID NO:11或其片段具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的核心序列。
在一个实施方案中,3'UTR核心序列位于紧邻(b)的终止元件的下游。在一个实施方案中,3'UTR核心序列位于多核苷酸的C末端。
在一个实施方案中,包含核心序列的3'UTR包含第一侧翼序列。在一个实施方案中,包含核心序列的3'UTR包含第二侧翼序列。在一个实施方案中,包含核心序列的3'UTR包含第一侧翼序列和第二侧翼序列。
在一个实施方案中,第一侧翼序列包含约5-25、约5-20、约5-15、约5-10、约10-25、约15-25、约20-25个核苷酸的序列。在一个实施方案中,第一侧翼序列包含约5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24或25个核苷酸,例如11个核苷酸的序列。
在一个实施方案中,第二侧翼序列包含约20-80、约20-75、约20-70、约20-65、约20-60、约20-55、约20-50、约20-45、约20-40、约20-35、约20-30、约20-25、约25-80、约30-80、约35-80、约40-80、约45-80、约50-80、约55-80、约60-80、约65-80、约70-80或约75-80个核苷酸的序列。在一个实施方案中,第二侧翼序列包含约20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、55、60、65、70、75或80个核苷酸,例如39个核苷酸的序列。
在一个实施方案中,第一侧翼序列处于核心序列的上游或下游。在一个实施方案中,第二侧翼序列处于核心序列的上游或下游。
在一个实施方案中,3'UTR包含SEQ ID NO:11的片段,例如,SEQ ID NO:11的5个核苷酸(nt)、10nt、15nt、20nt、25nt、30nt、35nt、40nt、45nt、50nt、55nt、60nt、65nt或70nt片段。在一个实施方案中,3'UTR包含15-25nt片段,所述片段构成SEQ ID NO:11的60nt片段。
在一个实施方案中,3'UTR包含SEQ ID NO:45的序列或其片段。在一个实施方案中,3'UTR包含SEQ ID NO:11的序列或其片段。
在一个实施方案中,3'UTR使得多核苷酸的半衰期增加,例如,多核苷酸的半衰期增加约1.5-10倍,例如,如通过测量多核苷酸的半衰期的测定,例如本文所公开的实施例中的任一者的测定所测量。
在一个实施方案中,3'UTR产生平均半衰期评分大于10的多核苷酸。在一个实施方案中,3'UTR使得由多核苷酸编码的多肽的水平和/或活性,例如输出增加。在一个实施方案中,将增加与不具有3'UTR、具有不同3'UTR或不具有本文所公开的3'UTR的在其它方面类似的多核苷酸进行比较。
在一个实施方案中,3'UTR包含微RNA(miRNA)结合位点,例如,如本文所描述。在一个实施方案中,3'UTR包含SEQ ID NO:38、SEQ ID NO:39、SEQ ID NO:40或它们的组合的miRNA结合位点。在一个实施方案中,3'UTR包含多个miRNA结合位点,例如,2、3、4、5、6、7或8个miRNA结合位点。在一个实施方案中,多个miRNA结合位点包含相同或不同miRNA结合位点。
在一个实施方案中,(a)的5'UTR包含表1中所提供的5'UTR序列或与表1中所提供的5'UTR序列或其片段(例如,缺少表1中所提供的5'UTR序列的初始(即,5'最末端)一个、两个、三个、四个、五个或六个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。在一个实施方案中,5'UTR包含与SEQ ID NO:1、SEQ IDNO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:41、SEQ ID NO:42、SEQ ID NO:63、SEQ ID NO:64、SEQ ID NO:65、SEQ ID NO:66、SEQ IDNO:67、SEQ ID NO:68、SEQ ID NO:69、SEQ ID NO:70、SEQ ID NO:71、SEQ ID NO:72、SEQ IDNO:73、SEQ ID NO:74、SEQ ID NO:75、SEQ ID NO:76、SEQ ID NO:77、SEQ ID NO:78、SEQ IDNO:88、SEQ ID NO:89或SEQ ID NO:90或其片段(例如,缺少前述序列中的任一者的初始一个、两个、三个、四个、五个或六个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
在一个实施方案中,(b)的编码区包含表3中所提供的终止元件序列。在一个实施方案中,(b)的编码区包含选自表3中所提供的终止元件的终止元件,例如,SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32、SEQ ID NO:33、SEQ ID NO:34、SEQ ID NO:35、SEQ ID NO:36、SEQ ID NO:37、SEQ IDNO:56、SEQ ID NO:57、SEQ ID NO:62、SEQ ID NO:93或SEQ ID NO:96。
在一个实施方案中,(i)(a)的5'UTR包含表1中所提供的5'UTR序列或与表1中所提供的5'UTR序列或其片段(例如,缺少表1中所提供的5'UTR序列的初始一个、两个、三个、四个、五个或六个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列;以及(ii)(b)的终止元件包含表3中所提供的终止元件序列。
在一个实施方案中,5'UTR包含与SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:41、SEQ ID NO:42、SEQ IDNO:63、SEQ ID NO:64、SEQ ID NO:65、SEQ ID NO:66、SEQ ID NO:67、SEQ ID NO:68、SEQ IDNO:69、SEQ ID NO:70、SEQ ID NO:71、SEQ ID NO:72、SEQ ID NO:73、SEQ ID NO:74、SEQ IDNO:75、SEQ ID NO:76、SEQ ID NO:77、SEQ ID NO:78、SEQ ID NO:88、SEQ ID NO:89或SEQID NO:90或其片段(例如,缺少前述序列中的任一者的初始一个、两个、三个、四个、五个或六个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
在一个实施方案中,(b)的编码区包含选自表3中所提供的终止元件的终止元件,例如,SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ IDNO:31、SEQ ID NO:32、SEQ ID NO:33、SEQ ID NO:34、SEQ ID NO:35、SEQ ID NO:36、SEQ IDNO:56、SEQ ID NO:57、SEQ ID NO:62、SEQ ID NO:93或SEQ ID NO:96。
终止元件和包含5'UTR和/或终止元件的组合
在另一个方面,本文提供了一种编码多肽的多核苷酸,其中所述多核苷酸包含:(a)5'-UTR(例如,如本文所描述);(b)编码区,所述编码区包含选自表3中所提供的终止元件的终止元件;以及(c)3'-UTR(例如,如本文所描述)。
在一个实施方案中,终止元件包含SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32、SEQ ID NO:33、SEQ ID NO:34、SEQ ID NO:35、SEQ ID NO:36、SEQ ID NO:93或SEQ ID NO:96的序列。
在一个实施方案中,(b)的编码区包含终止元件,所述终止元件包含式B的共有序列:
X-3-X-2-X-1-U-A-A-X1-X2-X3-X4-X5-X6-X7-X8-X9-X10-X11-X12(SEQ ID NO:37)
其中:
X1是G或A;
X2、X4、X5、X6或X7各自独立地是C或U;
X3是C或A;
X8、X10、X11、X12、X-1或X-3各自独立地是C或G;
X9是G或U;和/或
X-2是A或U。
在一个实施方案中,(b)的编码区包含终止元件,所述终止元件包含式C的共有序列:
X-3-X-2-X-1-U-G-A-X1-X2-X3-X4-X5-X6-X7-X8-X9-X10-X11-X12(SEQ ID NO:56)
其中:
X-3、X-1、X2、X5、X6、X7、X8、X9或X12各自独立地是G或C;
X-2、X3或X4各自独立地是A或C;
X1是A或G;和/或
X10或X11各自独立地是C或U。
在一个实施方案中,(b)的编码区包含终止元件,所述终止元件包含式D的共有序列
X-3-X-2-X-1-U-A-G-X1-X2-X3-X4-X5-X6-X7-X8-X9-X10-X11-X12(SEQ ID NO:57)
其中:
X-3、X-1、X2、X3、X10各自独立地是G或C;
X-2或X9各自独立地是A或U;
X1或X4各自独立地是A或G;
X5或X8各自独立地是A或C;和/或
X6、X7、X11或X12各自独立地是C或U。
在一个实施方案中,共有序列具有高GC含量,例如,约50%、60%、70%、80%、90%或99%的GC含量。
在一个实施方案中,终止元件使得多核苷酸的半衰期增加,例如,多核苷酸的半衰期增加约1.5-20倍。在一个实施方案中,将多核苷酸的半衰期的增加与不具有终止元件、具有不同终止元件或不具有本文所公开的终止元件的在其它方面类似的多核苷酸进行比较。在一个实施方案中,根据测量多核苷酸的半衰期的测定,例如本文所公开的实施例中的任一者中所描述的测定来测量多核苷酸的半衰期的增加。
在一个实施方案中,终止元件使得由多核苷酸编码的多肽的水平和/或活性,例如输出或表达持续时间增加。在一个实施方案中,根据测量多肽的水平和/或活性,例如输出或表达持续时间的测定,例如本文所公开的实施例中的任一者中所描述的测定来测量多肽的水平和/或活性,例如输出或表达持续时间的增加。在一个实施方案中,终止元件使得由多核苷酸编码的多肽的水平和/或活性,例如输出增加约1.5-20倍。在一个实施方案中,终止元件使得由多核苷酸编码的多肽的水平和/或活性,例如可检测水平或活性增加约1.5-20倍,持续约1、2、3、4、5、6、7、8、9、10或14天。在一个实施方案中,终止元件使得由多核苷酸编码的多肽的可检测水平或活性持续约1、2、3、4、5、6、7、8、9、10或14天。
在一个实施方案中,将增加与不具有终止元件、具有不同终止元件或不具有本文所公开的终止元件的在其它方面类似的多核苷酸进行比较。
在一个实施方案中,(a)的5'UTR包含表1中所提供的5'UTR序列或与表1中所提供的5'UTR序列或其变体或片段(例如,缺少表1中所提供的5'UTR序列的初始一个、两个、三个、四个、五个或六个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。在一个实施方案中,5'UTR包含与SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:41、SEQID NO:42、SEQ ID NO:63、SEQ ID NO:64、SEQ ID NO:65、SEQ ID NO:66、SEQ ID NO:67、SEQID NO:68、SEQ ID NO:69、SEQ ID NO:70、SEQ ID NO:71、SEQ ID NO:72、SEQ ID NO:73、SEQID NO:74、SEQ ID NO:75、SEQ ID NO:76、SEQ ID NO:77、SEQ ID NO:78、SEQ ID NO:88、SEQID NO:89或SEQ ID NO:90或其片段(例如,缺少前述序列中的任一者的初始一个、两个、三个、四个、五个或六个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
在一个实施方案中,(c)的3'UTR包含表2中所提供的3'UTR序列或与表2中所提供的3'UTR序列或其片段(例如,缺少表2中所提供的3'UTR序列的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。在一个实施方案中,3'UTR包含与SEQ ID NO:11、SEQ ID NO:12、SEQID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQID NO:25、SEQ ID NO:45、SEQ ID NO:79、SEQ ID NO:80、SEQ ID NO:81、SEQ ID NO:82、SEQID NO:83、SEQ ID NO:84、SEQ ID NO:85、SEQ ID NO:86、SEQ ID NO:87、SEQ ID NO:94或SEQ ID NO:95或其片段(例如,缺少前述序列中的任一者的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。在一个实施方案中,3'UTR包含微RNA结合位点,例如,如本文所描述,例如SEQ ID NO:38-40中的任一者的序列。
在一个实施方案中,3'UTR包含本文所描述的TENT募集序列中的一者或多者(例如,2者或3者)。在一个实施方案中,3'UTR包含与SEQ ID NO:91或92具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
在一个实施方案中,(i)(a)的5'UTR包含表1中所提供的5'UTR序列或与表1中所提供的3'UTR序列或其片段(例如,缺少表1中所提供的5'UTR序列的初始一个、两个、三个、四个、五个或六个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列;以及(ii)(c)的3'UTR包含表2中所提供的3'UTR序列或与表2中所提供的3'UTR序列或其片段(例如,缺少表2中所提供的3'UTR序列的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
在一个实施方案中,5'UTR包含与SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:41、SEQ ID NO:42、SEQ IDNO:63、SEQ ID NO:64、SEQ ID NO:65、SEQ ID NO:66、SEQ ID NO:67、SEQ ID NO:68、SEQ IDNO:69、SEQ ID NO:70、SEQ ID NO:71、SEQ ID NO:72、SEQ ID NO:73、SEQ ID NO:74、SEQ IDNO:75、SEQ ID NO:76、SEQ ID NO:77、SEQ ID NO:78、SEQ ID NO:88、SEQ ID NO:89或SEQID NO:90或其片段(例如,缺少前述序列中的任一者的初始一个、两个、三个、四个、五个或六个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
在一个实施方案中,3'UTR包含与SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ IDNO:25、SEQ ID NO:45、SEQ ID NO:79、SEQ ID NO:80、SEQ ID NO:81、SEQ ID NO:82、SEQ IDNO:83、SEQ ID NO:84、SEQ ID NO:85、SEQ ID NO:86、SEQ ID NO:87、SEQ ID NO:94或SEQID NO:95或其片段(例如,缺少前述序列中的任一者的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。在一个实施方案中,3'UTR包含微RNA结合位点,例如,如本文所描述,例如SEQ ID NO:38-40中的任一者的序列。
在一个实施方案中,3'UTR包含本文所描述的TENT募集序列中的一者或多者(例如,2者或3者)。在一个实施方案中,3'UTR包含与SEQ ID NO:91或92具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
本文所公开的mRNA构建体的任选特征
在一个实施方案中,多核苷酸的编码区包含编码治疗性有效载荷或预防性有效载荷的序列。
在一个实施方案中,治疗性有效载荷或预防性有效载荷包含分泌蛋白、膜结合蛋白或细胞间蛋白。
在一个实施方案中,治疗性有效载荷或预防性有效载荷选自细胞因子、抗体、疫苗(例如,抗原、免疫原性表位)、受体、酶、激素、转录因子、配体、膜转运体、结构蛋白、核酸酶或其组分、变体或片段(例如,生物活性片段)。在一个实施方案中,治疗性有效载荷或预防性有效载荷包含蛋白质或肽。
在一个实施方案中,多核苷酸还包含至少一个5'帽结构,例如,如本文所描述,和/或多聚A尾,例如,如本文所描述。
在一个实施方案中,5'帽结构包含GG、GA或GGA的序列,其中带下划线的斜体G是反向G核苷酸,继之以5'-5'-三磷酸基团。
在一个实施方案中,多核苷酸还包含3'稳定区,例如稳定的尾,例如,如本文所描述。在一个实施方案中,3'稳定区包含多聚A尾,例如,包含80-150个,例如120个腺嘌呤的多聚A尾(SEQ ID NO:123)。在一个实施方案中,多聚A尾包含一个或多个非腺苷残基,例如一个或多个鸟苷,例如,如本文所描述。在一个实施方案中,多聚A尾包含UCUAG序列(SEQ IDNO:44)。在一个实施方案中,多聚A尾在SEQ ID NO:44的上游包含约80-120个,例如100个腺嘌呤。在一个实施方案中,多聚A尾在SEQ ID NO:44的下游包含约1-40个,例如20个腺嘌呤。
在一个实施方案中,3'稳定区包含至少一个替代性核苷,任选地其中替代性核苷是反向胸苷(idT)。
在一个实施方案中,3'稳定区包含式VII的结构:
Figure BDA0004090383130000181
或其盐,其中每个X独立地是O或S,并且A代表腺嘌呤并且T代表胸腺嘧啶。
在一个实施方案中,多核苷酸包含mRNA。
LNP组合物和使用方法
在另一个方面,本文公开了一种包含本文所公开的多核苷酸的脂质纳米颗粒(LNP)组合物。
在一个方面,本文公开了一种包含LNP组合物的药物组合物,所述LNP组合物包含本文所公开的多核苷酸。
在一个方面,本公开提供了一种包含LNP组合物的细胞,所述LNP组合物包含本文所公开的多核苷酸。
在又一个方面,本文提供了一种增加细胞中有效载荷,例如治疗性有效载荷或预防性有效载荷的表达的方法,所述方法包括向所述细胞施用包含本文所公开的多核苷酸的LNP组合物。
在一个相关方面,本文提供了一种包含LNP组合物的组合物,所述LNP组合物包含本文所公开的多核苷酸,所述组合物用于增加细胞中有效载荷,例如治疗性有效载荷或预防性有效载荷的表达的方法。
在一个方面,本文提供了一种递送包含本文所公开的多核苷酸的LNP组合物的方法。在一个实施方案中,所述方法包括使细胞在体外、体内或离体与LNP组合物接触。
在一个方面,本文提供了一种将包含本文所公开的多核苷酸的LNP组合物递送至患有例如本文所描述的疾病或病症的受试者的方法。
在另一个方面,本文提供了一种调节受试者的免疫反应的方法,所述方法包括向有需要的受试者施用有效量的包含本文所公开的多核苷酸的LNP组合物。
在一个相关方面,本公开提供了一种包含LNP组合物的组合物,所述LNP组合物包含本文所公开的多核苷酸,所述组合物用于调节受试者的免疫反应的方法。
在一个方面,本文提供了一种治疗、预防疾病或病症或预防疾病或病症的症状的方法,所述方法包括向有需要的受试者施用有效量的包含本文所公开的多核苷酸的LNP组合物。
在一个相关方面,本公开提供了一种包含LNP组合物的组合物,所述LNP组合物包含本文所公开的多核苷酸,所述组合物用于治疗、预防疾病或病症或预防疾病或病症的症状的方法。
在本文所公开的使用方法或组合物中的任一者的一个实施方案中,LNP被配制成用于静脉内、皮下、肌肉内、鼻内、眼内、经直肠、经肺或经口递送。
在本文所公开的使用方法或组合物中的任一者的一个实施方案中,受试者是哺乳动物,例如,人类。
在本文所公开的使用方法或组合物中的任一者的一个实施方案中,受试者患有本文所公开的疾病或病症。
本文所公开的组合物和方法的额外特征
本文所公开的LNP组合物、包含所述LNP的药物组合物、使用方法或组合物中的任一者的额外特征包括以下实施方案。
在本文所公开的方法或组合物中的任一者的一些实施方案中,LNP组合物包含:(i)可电离脂质,例如,氨基脂质;(ii)固醇或其它结构脂质;(iii)非阳离子辅助脂质或磷脂;以及(iv)PEG-脂质。在一些实施方案中,可电离脂质包含式(IIa)化合物。在一些实施方案中,可电离脂质包含式(IIe)化合物。
在本文所公开的LNP组合物、方法或用途中的任一者的一些实施方案中,多核苷酸的编码区包含编码以下的序列:分泌蛋白、膜结合蛋白或细胞间蛋白。
在一些实施方案中,治疗性有效载荷或预防性有效载荷选自细胞因子、抗体、疫苗(例如,抗原、免疫原性表位)、受体、酶、激素、转录因子、配体、膜转运体、结构蛋白、核酸酶或其组分、变体或片段(例如,生物活性片段)。
在一些实施方案中,治疗性有效载荷或预防性有效载荷包含细胞因子或其变体或片段(例如,生物活性片段)。
在一些实施方案中,治疗性有效载荷或预防性有效载荷包含抗体或其变体或片段(例如,生物活性片段)。
在一些实施方案中,治疗性有效载荷或预防性有效载荷包含疫苗(例如,抗原、免疫原性表位)或其组分、变体或片段(例如,生物活性片段)。
在一些实施方案中,治疗性有效载荷或预防性有效载荷包含蛋白质或肽。
在本文所公开的LNP组合物、方法或用途中的任一者的一些实施方案中,多核苷酸包含mRNA。在一些实施方案中,mRNA包含至少一个化学修饰,例如,如本文所描述。在一个实施方案中,化学修饰选自由以下组成的组:假尿苷、N1-甲基假尿苷、2-硫代尿苷、4'-硫代尿苷、5-甲基胞嘧啶、2-硫代-1-甲基-1-脱氮-假尿苷、2-硫代-1-甲基-假尿苷、2-硫代-5-氮杂-尿苷、2-硫代-二氢假尿苷、2-硫代-二氢尿苷、2-硫代-假尿苷、4-甲氧基-2-硫代-假尿苷、4-甲氧基-假尿苷、4-硫代-1-甲基-假尿苷、4-硫代-假尿苷、5-氮杂-尿苷、二氢假尿苷、5-甲基尿苷、5-甲基尿苷、5-甲氧基尿苷和2'-O-甲基尿苷。在一个实施方案中,化学修饰选自由假尿苷、N1-甲基假尿苷、5-甲基胞嘧啶、5-甲氧基尿苷和它们的组合组成的组。在一个实施方案中,化学修饰是N1-甲基假尿苷。在一个实施方案中,脂质纳米颗粒中的每个mRNA包含完全修饰的N1-甲基假尿苷。
在本文所公开的LNP组合物、方法或用途中的任一者的一些实施方案中,LNP被配制成用于静脉内、皮下、肌肉内、鼻内、眼内、经直肠、经肺或经口递送。在一些实施方案中,LNP被配制成用于静脉内递送。在一些实施方案中,LNP被配制成用于皮下递送。在一些实施方案中,LNP被配制成用于肌肉内递送。在一些实施方案中,LNP被配制成用于鼻内递送。在一些实施方案中,LNP被配制成用于眼内递送。在一些实施方案中,LNP被配制成用于经直肠递送。在一些实施方案中,LNP被配制成用于经肺递送。在一些实施方案中,LNP被配制成用于经口递送。
在本文所公开的LNP组合物、方法或用途中的任一者的一些实施方案中,LNP还包含药学上可接受的载体或赋形剂。
在本文所公开的LNP组合物、使用方法或组合物中的任一者的一个实施方案中,LNP组合物包含:(i)可电离脂质,例如,氨基脂质;(ii)固醇或其它结构脂质;(iii)非阳离子辅助脂质或磷脂;以及任选地(iv)PEG-脂质。
在本文所公开的LNP组合物、使用方法或组合物中的任一者的一个实施方案中,LNP组合物包含可电离脂质,所述可电离脂质包含氨基脂质。在一个实施方案中,可电离脂质包含式(I)、(IA)、(IB)、(II)、(IIa)、(IIb)、(IIc)、(IId)、(IIe)、(IIf)、(IIg)、(III)、(IIIa1)、(IIIa2)、(IIIa3)、(IIIa4)、(IIIa5)、(IIIa6)、(IIIa7)或(IIIa8)中的任一者的化合物。在一个实施方案中,可电离脂质包含式(I)化合物。在一个实施方案中,可电离脂质包含式(IIa)化合物。在一个实施方案中,可电离脂质包含式(IIe)化合物。
在本文所公开的LNP组合物、使用方法或组合物中的任一者的一个实施方案中,LNP组合物包含非阳离子辅助脂质或磷脂,所述非阳离子辅助脂质或磷脂包含选自由以下组成的组的化合物:1,2-二硬脂酰基-sn-甘油-3-磷酸胆碱(DSPC)、1,2-二硬脂酰基-sn-甘油-磷酸乙醇胺(DSPE)、1,2-二油酰基-sn-甘油-3-磷酸乙醇胺(DOPE)、1,2-二亚油酰基-sn-甘油-3-磷酸胆碱(DLPC)、1,2-二肉豆蔻酰基-sn-甘油-磷酸胆碱(DMPC)、1,2-二油酰基-sn-甘油-3-磷酸胆碱(DOPC)、1,2-二棕榈酰基-sn-甘油-3-磷酸胆碱(DPPC)、1,2-二(十一烷酰基)-sn-甘油-磷酸胆碱(DUPC)、1-棕榈酰基-2-油酰基-sn-甘油-3-磷酸胆碱(POPC)、1,2-二-O-十八烯基-sn-甘油-3-磷酸胆碱(18:0二醚PC)、1-油酰基-2-胆固醇基半琥珀酰基-sn-甘油-3-磷酸胆碱(OChemsPC)、1-十六烷基-sn-甘油-3-磷酸胆碱(C16 LysoPC)、1,2-二亚麻酰基-sn-甘油-3-磷酸胆碱、1,2-二花生四烯酰基-sn-甘油-3-磷酸胆碱、1,2-二(二十二碳六烯酰基)-sn-甘油-3-磷酸胆碱、1,2-二植烷酰基-sn-甘油-3-磷酸乙醇胺(ME 16.0PE)、1,2-二硬脂酰基-sn-甘油-3-磷酸乙醇胺、1,2-二亚油酰基-sn-甘油-3-磷酸乙醇胺、1,2-二亚麻酰基-sn-甘油-3-磷酸乙醇胺、1,2-二花生四烯酰基-sn-甘油-3-磷酸乙醇胺、1,2-二(二十二碳六烯酰基)-sn-甘油-3-磷酸乙醇胺、1,2-二油酰基-sn-甘油-3-磷酸-外消旋-(1-甘油)钠盐(DOPG)、鞘磷脂和它们的混合物。在一个实施方案中,磷脂是DSPC,例如DSPC的变体,例如式(IV)化合物。
在本文所公开的LNP组合物、使用方法或组合物中的任一者的一个实施方案中,LNP组合物包含结构脂质。在一个实施方案中,结构脂质是植物固醇或植物固醇与胆固醇的组合。在一个实施方案中,植物固醇选自由β-谷固醇、豆固醇、β-谷烷醇、菜油固醇、菜籽固醇和它们的组合组成的组。
在一个实施方案中,结构脂质可以选自下组:包括但不限于胆固醇、粪固醇、谷固醇、麦角固醇、菜油固醇、豆固醇、菜籽固醇、番茄碱、番茄苷、熊果酸、α-生育酚、藿烷、植物固醇、类固醇和它们的混合物。在一些实施方案中,结构脂质是固醇。如本文所定义,“固醇”是由类固醇组成的类固醇子组。在某些实施方案中,结构脂质是类固醇。在某些实施方案中,结构脂质是胆固醇。在某些实施方案中,结构脂质是胆固醇的类似物。在某些实施方案中,结构脂质是α-生育酚。
在一个实施方案中,结构脂质选自β-谷固醇和胆固醇。在一个实施方案中,结构脂质是β-谷固醇。在一个实施方案中,结构脂质是胆固醇。
在本文所公开的LNP组合物、使用方法或组合物中的任一者的一个实施方案中,LNP组合物包含PEG脂质。在一个实施方案中,PEG-脂质选自由PEG修饰的磷脂酰乙醇胺、PEG修饰的磷脂酸、PEG修饰的神经酰胺、PEG修饰的二烷基胺、PEG修饰的二酰基甘油、PEG修饰的二烷基甘油和它们的混合物组成的组。
在一个实施方案中,PEG脂质选自由PEG修饰的磷脂酰乙醇胺、PEG修饰的磷脂酸、PEG修饰的神经酰胺、PEG修饰的二烷基胺、PEG修饰的二酰基甘油、PEG修饰的二烷基甘油和它们的混合物组成的组。在一个实施方案中,PEG脂质选自由PEG-c-DOMG、PEG-DMG、PEG-DLPE、PEG-DMPE、PEG-DPPC和PEG-DSPE脂质组成的组。在一个实施方案中,PEG-脂质是PEG-DMG。
在一个实施方案中,PEG脂质选自以下化合物:式(V)、式(VI-A)、式(VI-B)、式(VI-C)或式(VI-D)。在一个实施方案中,PEG-脂质是式(VI-A)化合物。在一个实施方案中,PEG-脂质是式(VI-B)化合物。在一个实施方案中,PEG-脂质是式(VI-C)化合物。在一个实施方案中,PEG-脂质是式(VI-D)化合物。
在本文所公开的LNP组合物、使用方法或组合物中的任一者的一个实施方案中,LNP包含约20摩尔%至约60摩尔%可电离脂质、约5摩尔%至约25摩尔%非阳离子辅助脂质或磷脂、约25摩尔%至约55摩尔%固醇或其它结构脂质以及约0.5摩尔%至约15摩尔%PEG脂质。在本公开的LNP或方法的一个实施方案中,LNP包含约35摩尔%至约55摩尔%可电离脂质、约5摩尔%至约25摩尔%非阳离子辅助脂质或磷脂、约30摩尔%至约40摩尔%固醇或其它结构脂质以及约0摩尔%至约10摩尔%PEG脂质。在本公开的LNP或方法的一个实施方案中,LNP包含约50摩尔%可电离脂质、约10摩尔%非阳离子辅助脂质或磷脂、约38.5摩尔%固醇或其它结构脂质以及约1.5摩尔%PEG脂质。在本公开的LNP或方法的一个实施方案中,LNP包含约49.83摩尔%可电离脂质、约9.83摩尔%非阳离子辅助脂质或磷脂、约30.33摩尔%固醇或其它结构脂质以及约2.0摩尔%PEG脂质。
在本文所公开的LNP组合物、使用方法或组合物中的任一者的一个实施方案中,LNP包含约45摩尔%至约50摩尔%可电离脂质。在本公开的LNP或方法的一个实施方案中,LNP包含约45.5摩尔%至约49.5摩尔%可电离脂质。在本公开的LNP或方法的一个实施方案中,LNP包含约46摩尔%至约49摩尔%可电离脂质。在本公开的LNP或方法的一个实施方案中,LNP包含约46.5摩尔%至约48.5摩尔%可电离脂质。在本公开的LNP或方法的一个实施方案中,LNP包含约47摩尔%至约48摩尔%可电离脂质。
在本文所公开的LNP组合物、使用方法或组合物中的任一者的一个实施方案中,LNP包含约45摩尔%至约49.5摩尔%可电离脂质。在本公开的LNP或方法的一个实施方案中,LNP包含约45摩尔%至约49摩尔%可电离脂质。在本公开的LNP或方法的一个实施方案中,LNP包含约45摩尔%至约48.5摩尔%可电离脂质。在本公开的LNP或方法的一个实施方案中,LNP包含约45摩尔%至约48摩尔%可电离脂质。在本公开的LNP或方法的一个实施方案中,LNP包含约45摩尔%至约47.5摩尔%可电离脂质。在本公开的LNP或方法的一个实施方案中,LNP包含约45摩尔%至约47摩尔%可电离脂质。在本公开的LNP或方法的一个实施方案中,LNP包含约45摩尔%至约46.5摩尔%可电离脂质。在本公开的LNP或方法的一个实施方案中,LNP包含约45摩尔%至约46摩尔%可电离脂质。在本公开的LNP或方法的一个实施方案中,LNP包含约45摩尔%至约45.5摩尔%可电离脂质。
在本文所公开的LNP组合物、使用方法或组合物中的任一者的一个实施方案中,LNP包含约45.5摩尔%至约50摩尔%可电离脂质。在本公开的LNP或方法的一个实施方案中,LNP包含约46摩尔%至约50摩尔%可电离脂质。在本公开的LNP或方法的一个实施方案中,LNP包含约46.5摩尔%至约50摩尔%可电离脂质。在本公开的LNP或方法的一个实施方案中,LNP包含约47摩尔%至约50摩尔%可电离脂质。在本公开的LNP或方法的一个实施方案中,LNP包含约47.5摩尔%至约50摩尔%可电离脂质。在本公开的LNP或方法的一个实施方案中,LNP包含约48摩尔%至约50摩尔%可电离脂质。在本公开的LNP或方法的一个实施方案中,LNP包含约48.5摩尔%至约50摩尔%可电离脂质。在本公开的LNP或方法的一个实施方案中,LNP包含约49摩尔%至约50摩尔%可电离脂质。在本公开的LNP或方法的一个实施方案中,LNP包含约49.5摩尔%至约50摩尔%可电离脂质。
在本文所公开的LNP组合物、使用方法或组合物中的任一者的一个实施方案中,LNP包含约45摩尔%至约46摩尔%可电离脂质。在本公开的LNP或方法的一个实施方案中,LNP包含约45.5摩尔%至约46.5摩尔%可电离脂质。在本公开的LNP或方法的一个实施方案中,LNP包含约46摩尔%至约47摩尔%可电离脂质。在本公开的LNP或方法的一个实施方案中,LNP包含约46.5摩尔%至约47.5摩尔%可电离脂质。在本公开的LNP或方法的一个实施方案中,LNP包含约47摩尔%至约48摩尔%可电离脂质。在本公开的LNP或方法的一个实施方案中,LNP包含约47.5摩尔%至约48.5摩尔%可电离脂质。在本公开的LNP或方法的一个实施方案中,LNP包含约48摩尔%至约49摩尔%可电离脂质。在本公开的LNP或方法的一个实施方案中,LNP包含约48.5摩尔%至约49.5摩尔%可电离脂质。在本公开的LNP或方法的一个实施方案中,LNP包含约49摩尔%至约50摩尔%可电离脂质。
在本文所公开的LNP组合物、使用方法或组合物中的任一者的一个实施方案中,LNP包含约45摩尔%可电离脂质。在本公开的LNP或方法的一个实施方案中,LNP包含约45.5摩尔%可电离脂质。在本公开的LNP或方法的一个实施方案中,LNP包含约46摩尔%可电离脂质。在本公开的LNP或方法的一个实施方案中,LNP包含约46.5摩尔%可电离脂质。在本公开的LNP或方法的一个实施方案中,LNP包含约47摩尔%可电离脂质。在本公开的LNP或方法的一个实施方案中,LNP包含约47.5摩尔%可电离脂质。在本公开的LNP或方法的一个实施方案中,LNP包含约48摩尔%可电离脂质。在本公开的LNP或方法的一个实施方案中,LNP包含约48.5摩尔%可电离脂质。在本公开的LNP或方法的一个实施方案中,LNP包含约49摩尔%可电离脂质。在本公开的LNP或方法的一个实施方案中,LNP包含约49.5摩尔%可电离脂质。在本公开的LNP或方法的一个实施方案中,LNP包含约50摩尔%可电离脂质。
在本文所公开的LNP组合物、使用方法或组合物中的任一者的一个实施方案中,LNP包含约1摩尔%至约5摩尔%PEG脂质。在本公开的LNP或方法的一个实施方案中,LNP包含约1.5摩尔%至约4.5摩尔%PEG脂质。在本公开的LNP或方法的一个实施方案中,LNP包含约2摩尔%至约4摩尔%PEG脂质。在本公开的LNP或方法的一个实施方案中,LNP包含约2.5摩尔%至约3.5摩尔%PEG脂质。
在本文所公开的LNP组合物、使用方法或组合物中的任一者的一个实施方案中,LNP包含约1摩尔%至约4.5摩尔%PEG脂质。在本公开的LNP或方法的一个实施方案中,LNP包含约1摩尔%至约4摩尔%PEG脂质。在本公开的LNP或方法的一个实施方案中,LNP包含约1摩尔%至约3.5摩尔%PEG脂质。在本公开的LNP或方法的一个实施方案中,LNP包含约1摩尔%至约3摩尔%PEG脂质。在本公开的LNP或方法的一个实施方案中,LNP包含约1摩尔%至约2.5摩尔%PEG脂质。在本公开的LNP或方法的一个实施方案中,LNP包含约1摩尔%至约2摩尔%PEG脂质。在本公开的LNP或方法的一个实施方案中,LNP包含约1摩尔%至约1.5摩尔%PEG脂质。
在本文所公开的LNP组合物、使用方法或组合物中的任一者的一个实施方案中,LNP包含约1.5摩尔%至约5摩尔%PEG脂质。在本公开的LNP或方法的一个实施方案中,LNP包含约2摩尔%至约5摩尔%PEG脂质。在本公开的LNP或方法的一个实施方案中,LNP包含约2.5摩尔%至约5摩尔%PEG脂质。在本公开的LNP或方法的一个实施方案中,LNP包含约3摩尔%至约5摩尔%PEG脂质。在本公开的LNP或方法的一个实施方案中,LNP包含约3.5摩尔%至约5摩尔%PEG脂质。在本公开的LNP或方法的一个实施方案中,LNP包含约4摩尔%至约5摩尔%PEG脂质。在本公开的LNP或方法的一个实施方案中,LNP包含约4.5摩尔%至约5摩尔%PEG脂质。
在本公开的LNP或方法的一个实施方案中,LNP包含约1摩尔%至约2摩尔%PEG脂质。在本公开的LNP或方法的一个实施方案中,LNP包含约1.5摩尔%至约2.5摩尔%PEG脂质。在本公开的LNP或方法的一个实施方案中,LNP包含约2摩尔%至约3摩尔%PEG脂质。在本公开的LNP或方法的一个实施方案中,LNP包含约3.5摩尔%至约4.5摩尔%PEG脂质。在本公开的LNP或方法的一个实施方案中,LNP包含约4摩尔%至约5摩尔%PEG脂质。
在本文所公开的LNP组合物、使用方法或组合物中的任一者的一个实施方案中,LNP包含约1摩尔%PEG脂质。在本公开的LNP或方法的一个实施方案中,LNP包含约1.5摩尔%PEG脂质。在本公开的LNP或方法的一个实施方案中,LNP包含约2摩尔%PEG脂质。在本公开的LNP或方法的一个实施方案中,LNP包含约2.5摩尔%PEG脂质。在本公开的LNP或方法的一个实施方案中,LNP包含约3摩尔%PEG脂质。在本公开的LNP或方法的一个实施方案中,LNP包含约3.5摩尔%PEG脂质。在本公开的LNP或方法的一个实施方案中,LNP包含约4摩尔%PEG脂质。在本公开的LNP或方法的一个实施方案中,LNP包含约4.5摩尔%PEG脂质。在本公开的LNP或方法的一个实施方案中,LNP包含约5摩尔%PEG脂质。
在一个实施方案中,摩尔%固醇或其它结构脂质是18.5%植物固醇并且总摩尔%结构脂质是38.5%。在一个实施方案中,摩尔%固醇或其它结构脂质是28.5%植物固醇并且总摩尔%结构脂质是38.5%。
在本公开的LNP或方法的一个实施方案中,LNP包含约50摩尔%式(IIa)化合物和约10摩尔%非阳离子辅助脂质或磷脂。在本公开的LNP或方法的一个实施方案中,LNP包含50摩尔%式(IIa)化合物和约10摩尔%非阳离子辅助脂质或磷脂。在本公开的LNP或方法的一个实施方案中,LNP包含约50摩尔%式(IIa)化合物和10摩尔%非阳离子辅助脂质或磷脂。在本公开的LNP或方法的一个实施方案中,LNP包含50摩尔%式(IIa)化合物和10摩尔%非阳离子辅助脂质或磷脂。在本公开的LNP或方法的一个实施方案中,LNP包含约49.83摩尔%式(IIa)化合物、约9.83摩尔%非阳离子辅助脂质或磷脂、约30.33摩尔%固醇或其它结构脂质以及约2.0摩尔%PEG脂质。
在本公开的LNP或方法的一个实施方案中,LNP包含约50摩尔%式(IIe)化合物和约10摩尔%非阳离子辅助脂质或磷脂。在本公开的LNP或方法的一个实施方案中,LNP包含50摩尔%式(IIe)化合物和约10摩尔%非阳离子辅助脂质或磷脂。在本公开的LNP或方法的一个实施方案中,LNP包含约50摩尔%式(IIe)化合物和10摩尔%非阳离子辅助脂质或磷脂。在本公开的LNP或方法的一个实施方案中,LNP包含50摩尔%式(IIe)化合物和10摩尔%非阳离子辅助脂质或磷脂。在本公开的LNP或方法的一个实施方案中,LNP包含约49.83摩尔%式(IIe)化合物、约9.83摩尔%非阳离子辅助脂质或磷脂、约30.33摩尔%固醇或其它结构脂质以及约2.0摩尔%PEG脂质。
在本文所公开的LNP组合物、使用方法或组合物中的任一者的一个实施方案中,LNP被配制成用于静脉内、皮下、肌肉内、眼内、鼻内、经直肠、经肺或经口递送。在一个实施方案中,LNP被配制成用于静脉内递送。在一个实施方案中,LNP被配制成用于皮下递送。在一个实施方案中,LNP被配制成用于肌肉内递送。在一个实施方案中,LNP被配制成用于眼内递送。在一个实施方案中,LNP被配制成用于鼻内递送。在一个实施方案中,LNP被配制成用于经直肠递送。在一个实施方案中,LNP被配制成用于经肺递送。在一个实施方案中,LNP被配制成用于经口递送。
在本文所公开的使用方法或组合物中的任一者的一个实施方案中,受试者是哺乳动物,例如,人类。
前述LNP组合物或使用所述LNP组合物的方法中的任一者的额外特征包括以下列举的实施方案中的一者或多者。本领域技术人员仅仅使用常规实验将认识到或能够确定本文所描述的本发明的具体实施方案的许多等效方案。此类等效方案意图由以下列举的实施方案所涵盖。
本公开的其它实施方案
1.一种编码多肽的多核苷酸,其中所述多核苷酸包含:
(a)5'-UTR,所述5'-UTR包含SEQ ID NO:1的序列或其变体或片段;
(b)编码区,所述编码区包含终止元件(例如,如本文所描述);以及
(c)3'-UTR(例如,如本文所描述)。
2.如实施方案1所述的多核苷酸,其中所述5'UTR包含式A的核酸序列:
G G A A A U C G C A A A A(N2)X(N3)X C U(N4)X(N5)X C G C G U U A G A U UU C U U U U A G U U U U C U N6 N7 C A A C U A G C A A G C U U U U U G U U C UC G C C(N8 C C)x(SEQ ID NO:46),其中:
(N2)x是尿嘧啶并且x是0至5的整数,例如,其中x=3或4;
(N3)x是鸟嘌呤并且x是0至1的整数;
(N4)x是胞嘧啶并且x是0至1的整数;
(N5)x是尿嘧啶并且x是0至5的整数,例如,其中x=2或3;
N6是尿嘧啶或胞嘧啶;
N7是尿嘧啶或鸟嘌呤;和/或
N8是腺嘌呤或鸟嘌呤并且x是0至1的整数。
3.如实施方案1所述的多核苷酸,其中SEQ ID NO:1的变体包含与SEQ ID NO:1或其片段(例如,缺少SEQ ID NO:1的初始一个、两个、三个、四个、五个或六个核苷酸的片段)具有至少50%、60%、70%、80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
4.如实施方案1或3所述的多核苷酸,其中SEQ ID NO:1的变体包含至少30%、40%、50%、60%、70%或80%的尿苷含量。
5.如实施方案1或3-4中任一项所述的多核苷酸,其中SEQ ID NO:1的变体包含至少2、3、4、5、6、7、8、9、10、11或12个连续尿苷(例如,聚尿苷序列段)。
6.如实施方案5所述的多核苷酸,其中SEQ ID NO:1的变体中的所述聚尿苷序列段包含至少2-12、2-11、2-10、2-9、2-8、2-7、2-6、2-5、2-4、2-3、3-12、4-12、5-12、6-12、7-12、8-12、9-12、10-12、11-12、2-6或3-5个连续尿苷。
7.如实施方案1或3-6中任一项所述的多核苷酸,其中SEQ ID NO:1的变体中的所述聚尿苷序列段包含4个连续尿苷。
8.如实施方案1或3-7中任一项所述的多核苷酸,其中SEQ ID NO:1的变体中的所述聚尿苷序列段包含5个连续尿苷。
9.如实施方案1或3-8中任一项所述的多核苷酸,其中SEQ ID NO:1的变体包含1、2、3、4、5、6、7、8、9、10、11、12、13、14或15个聚尿苷序列段。
10.如实施方案9所述的多核苷酸,其中SEQ ID NO:1的变体包含3个聚尿苷序列段。
11.如实施方案9所述的多核苷酸,其中SEQ ID NO:1的变体包含4个聚尿苷序列段。
12.如实施方案9所述的多核苷酸,其中SEQ ID NO:1的变体包含5个聚尿苷序列段。
13.如实施方案1或3-12中任一项所述的多核苷酸,其中所述聚尿苷序列段中的一者或多者与不同聚尿苷序列段相邻。
14.如实施方案1或3-13中任一项所述的多核苷酸,其中所述聚尿苷序列段中的每一者,例如全部彼此相邻,例如,所述聚尿苷序列段全部是相连的。
15.如实施方案1或3-14中任一项所述的多核苷酸,其中所述聚尿苷序列段中的一者或多者由1、2、3、4、5、6、7、8、9、10、11、2、13、14、15、16、17、18、19、20、30、40、50或60个核苷酸隔开。
16.如实施方案1或3-15中任一项所述的多核苷酸,其中所述聚尿苷序列段中的每一者,例如全部由1、2、3、4、5、6、7、8、9、10、11、2、13、14、15、16、17、18、19、20、30、40、50或60个核苷酸隔开。
17.如实施方案1或3-16中任一项所述的多核苷酸,其中第一聚尿苷序列段和第二聚尿苷序列段彼此相邻。
18.如实施方案17所述的多核苷酸,其中后续的,例如第三、第四、第五、第六或第七、第八、第九或第十聚尿苷序列段由1、2、3、4、5、6、7、8、9、10、11、2、13、14、15、16、17、18、19、20、30、40、50或60个核苷酸与所述第一聚尿苷序列段、所述第二聚尿苷序列段或所述后续聚尿苷序列段中的任一者隔开。
19.如实施方案1或3-18中任一项所述的多核苷酸,其中第一聚尿苷序列段由1、2、3、4、5、6、7、8、9、10、11、2、13、14、15、16、17、18、19、20、30、40、50或60个核苷酸与后续聚尿苷序列段,例如第二、第三、第四、第五、第六或第七、第八、第九或第十聚尿苷序列段隔开。
20.如实施方案19所述的多核苷酸,其中所述后续聚尿苷序列段中的一者或多者与不同聚尿苷序列段相邻。
21.如前述实施方案中任一项所述的多核苷酸,其中所述5'UTR包含Kozak序列,例如,GCCRCC核苷酸序列(SEQ ID NO:43),其中R是腺嘌呤或鸟嘌呤。
22.如实施方案21所述的多核苷酸,其中所述Kozak序列位于所述5'UTR序列的3'端。
23.如前述实施方案中任一项所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:1的序列,或与SEQ ID NO:1或其片段具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
24.如实施方案23所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:1的序列。
25.如前述实施方案中任一项所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:41的序列,或与SEQ ID NO:41或其片段(例如,缺少SEQ ID NO:41的初始一个、两个、三个、四个、五个或六个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
26.如实施方案25所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:41的序列或其缺少SEQ ID NO:41的初始一个、两个、三个、四个、五个或六个核苷酸的片段。
27.如前述实施方案中任一项所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:42的序列,或与SEQ ID NO:42或其片段(例如,缺少SEQ ID NO:42的初始一个、两个、三个、四个、五个或六个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
28.如实施方案27所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:42的序列或其缺少SEQ ID NO:42的初始一个、两个、三个、四个、五个或六个核苷酸的片段。
29.如前述实施方案中任一项所述的多核苷酸,其中所述5'UTR使得所述多核苷酸的半衰期增加,例如,所述多核苷酸的半衰期增加约1.5-20倍。
30.如实施方案29所述的多核苷酸,其中将所述多核苷酸的半衰期的增加与不具有5'UTR、具有不同5'UTR或不具有实施方案1-28中任一项所述的5'UTR的在其它方面类似的多核苷酸进行比较。
31.如实施方案29-30中任一项所述的多核苷酸,其中根据测量多核苷酸的半衰期的测定,例如本文所公开的实施例中的任一者中所描述的测定来测量所述多核苷酸的半衰期的增加。
32.如前述实施方案中任一项所述的多核苷酸,其中所述5'UTR使得由所述多核苷酸编码的所述多肽的水平和/或活性,例如输出增加。
33.如实施方案32所述的多核苷酸,其中所述5'UTR使得由所述多核苷酸编码的所述多肽的水平和/或活性,例如输出增加约1.5-20倍。
34.如实施方案32或33所述的多核苷酸,其中将由所述多核苷酸编码的所述多肽的水平和/或活性,例如输出的增加与不具有5'UTR、具有不同5'UTR或不具有实施方案1-28中任一项所述的5'UTR的在其它方面类似的多核苷酸进行比较。
35.如实施方案32-34中任一项所述的多核苷酸,其中根据测量多肽的水平和/或活性的测定,例如本文所公开的实施例中的任一者中所描述的测定来测量由所述多核苷酸编码的所述多肽的水平和/或活性,例如输出的增加。
36.如实施方案35所述的多核苷酸,其中所述5'UTR使得由所述多核苷酸编码的所述多肽的活性增加,例如,增加约1.2-10倍。
37.如实施方案36所述的多核苷酸,其中将活性的增加与不具有5'UTR、具有不同5'UTR或不具有实施方案1-28中任一项所述的5'UTR的在其它方面类似的多核苷酸进行比较。
38.如实施方案36或37所述的多核苷酸,其中根据测量多肽的水平的测定,例如本文所公开的实施例中的任一者中所描述的测定来测量由所述多核苷酸编码的所述多肽的水平的增加。
39.一种编码多肽的多核苷酸,其中所述多核苷酸包含:
(a)5'-UTR,所述5'-UTR包含SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ IDNO:5、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:41、SEQ ID NO:42、SEQ ID NO:63、SEQ IDNO:64、SEQ ID NO:65、SEQ ID NO:66、SEQ ID NO:67、SEQ ID NO:68、SEQ ID NO:69、SEQ IDNO:70、SEQ ID NO:71、SEQ ID NO:72、SEQ ID NO:73、SEQ ID NO:74、SEQ ID NO:75、SEQ IDNO:76、SEQ ID NO:77、SEQ ID NO:78、SEQ ID NO:88、SEQ ID NO:89或SEQ ID NO:90的序列,或其变体或片段(例如,缺少前述序列中的任一者的初始一个、两个、三个、四个、五个或六个核苷酸的片段);
(b)编码区,所述编码区包含终止元件;以及
(c)3'-UTR,
其中所述5'UTR包含至少2、3、4、5、6、7、8、9、10、11或12个连续尿苷(例如,聚尿苷序列段)。
40.如实施方案39所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6或SEQ ID NO:8、SEQ ID NO:41、SEQ ID NO:42、SEQ ID NO:63、SEQ ID NO:64、SEQ ID NO:65、SEQ ID NO:66、SEQ ID NO:67、SEQ ID NO:68、SEQ ID NO:69、SEQ ID NO:70、SEQ ID NO:71、SEQ ID NO:72、SEQ ID NO:73、SEQ IDNO:74、SEQ ID NO:75、SEQ ID NO:76、SEQ ID NO:77、SEQ ID NO:78、SEQ ID NO:88、SEQ IDNO:89或SEQ ID NO:90的变体。
41.如实施方案40所述的多核苷酸,其中所述5'UTR变体包含与SEQ ID NO:2、SEQID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6或SEQ ID NO:8、SEQ ID NO:41、SEQ IDNO:42、SEQ ID NO:63、SEQ ID NO:64、SEQ ID NO:65、SEQ ID NO:66、SEQ ID NO:67、SEQ IDNO:68、SEQ ID NO:69、SEQ ID NO:70、SEQ ID NO:71、SEQ ID NO:72、SEQ ID NO:73、SEQ IDNO:74、SEQ ID NO:75、SEQ ID NO:76、SEQ ID NO:77、SEQ ID NO:78、SEQ ID NO:88、SEQ IDNO:89或SEQ ID NO:90或其片段(例如,缺少前述序列中的任一者的初始一个、两个、三个、四个、五个或六个核苷酸的片段)具有至少50%、60%、70%、80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
42.如实施方案40或41所述的多核苷酸,其中所述5'UTR变体包含至少30%、40%、50%、60%、70%或80%的尿苷含量。
43.如实施方案40-42中任一项所述的多核苷酸,其中所述5'UTR变体包含至少2、3、4、5、6、7、8、9、10、11或12个连续尿苷(例如,聚尿苷序列段)。
44.如实施方案43所述的多核苷酸,其中所述5'UTR变体中的所述聚尿苷序列段包含至少2-12、2-11、2-10、2-9、2-8、2-7、2-6、2-5、2-4、2-3、3-12、4-12、5-12、6-12、7-12、8-12、9-12、10-12、11-12、2-6或3-5个连续尿苷。
45.如实施方案40-44中任一项所述的多核苷酸,其中所述5'UTR变体中的所述聚尿苷序列段包含4个连续尿苷。
46.如实施方案40-44中任一项所述的多核苷酸,其中所述5'UTR变体中的所述聚尿苷序列段包含5个连续尿苷。
47.如实施方案40-46中任一项所述的多核苷酸,其中所述5'UTR变体包含1、2、3、4、5、6、7、8、9、10、11、12、13、14或15个聚尿苷序列段。
48.如实施方案47所述的多核苷酸,其中所述5'UTR变体包含3个聚尿苷序列段。
49.如实施方案47所述的多核苷酸,其中所述5'UTR变体包含4个聚尿苷序列段。
50.如实施方案47所述的多核苷酸,其中所述5'UTR变体包含5个聚尿苷序列段。
51.如实施方案40-50中任一项所述的多核苷酸,其中所述聚尿苷序列段中的一者或多者与不同聚尿苷序列段相邻。
52.如实施方案40-51中任一项所述的多核苷酸,其中所述聚尿苷序列段中的每一者,例如全部彼此相邻,例如,所述聚尿苷序列段全部是相连的。
53.如实施方案40-52中任一项所述的多核苷酸,其中所述聚尿苷序列段中的一者或多者由1、2、3、4、5、6、7、8、9、10、11、2、13、14、15、16、17、18、19、20、30、40、50或60个核苷酸隔开。
54.如实施方案40-53中任一项所述的多核苷酸,其中所述聚尿苷序列段中的每一者,例如全部由1、2、3、4、5、6、7、8、9、10、11、2、13、14、15、16、17、18、19、20、30、40、50或60个核苷酸隔开。
55.如实施方案40-54中任一项所述的多核苷酸,其中第一聚尿苷序列段和第二聚尿苷序列段彼此相邻。
56.如实施方案55所述的多核苷酸,其中后续的,例如第三、第四、第五、第六或第七、第八、第九或第十聚尿苷序列段由1、2、3、4、5、6、7、8、9、10、11、2、13、14、15、16、17、18、19、20、30、40、50或60个核苷酸与所述第一聚尿苷序列段、所述第二聚尿苷序列段或所述后续聚尿苷序列段中的任一者隔开。
57.如实施方案40-56中任一项所述的多核苷酸,其中第一聚尿苷序列段由1、2、3、4、5、6、7、8、9、10、11、2、13、14、15、16、17、18、19、20、30、40、50或60个核苷酸与后续聚尿苷序列段,例如第二、第三、第四、第五、第六或第七、第八、第九或第十聚尿苷序列段隔开。
58.如实施方案57所述的多核苷酸,其中所述后续聚尿苷序列段中的一者或多者与不同聚尿苷序列段相邻。
59.如实施方案39-58中任一项所述的多核苷酸,其中所述5'UTR包含Kozak序列,例如,GCCRCC核苷酸序列(SEQ ID NO:43),其中R是腺嘌呤或鸟嘌呤。
60.如实施方案59所述的多核苷酸,其中所述Kozak序列位于所述5'UTR序列的3'端。
61.如实施方案39-60中任一项所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:2的序列或其片段(例如,缺少SEQ ID NO:2的初始一个、两个、三个、四个、五个或六个核苷酸的片段)。
62.如实施方案39-60中任一项所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:3的序列或其片段(例如,缺少SEQ ID NO:3的初始一个、两个、三个、四个、五个或六个核苷酸的片段)。
63.如实施方案39-60中任一项所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:4的序列或其片段(例如,缺少SEQ ID NO:4的初始一个、两个、三个、四个、五个或六个核苷酸的片段)。
64.如实施方案39-60中任一项所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:5的序列或其片段(例如,缺少SEQ ID NO:5的初始一个、两个、三个、四个、五个或六个核苷酸的片段)。
65.如实施方案39-60中任一项所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:6的序列或其片段(例如,缺少SEQ ID NO:6的初始一个、两个、三个、四个、五个或六个核苷酸的片段)。
66.如实施方案39-60中任一项所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:8的序列或其片段(例如,缺少SEQ ID NO:8的初始一个、两个、三个、四个、五个或六个核苷酸的片段)。
67.如实施方案39-60中任一项所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:41的序列或其片段(例如,缺少SEQ ID NO:41的初始一个、两个、三个、四个、五个或六个核苷酸的片段)。
68.如实施方案39-60中任一项所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:42的序列或其片段(例如,缺少SEQ ID NO:42的初始一个、两个、三个、四个、五个或六个核苷酸的片段)。
69.如实施方案39-60中任一项所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:63的序列或其片段(例如,缺少SEQ ID NO:63的初始一个、两个、三个、四个、五个或六个核苷酸的片段)。
70.如实施方案39-60中任一项所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:64的序列或其片段(例如,缺少SEQ ID NO:64的初始一个、两个、三个、四个、五个或六个核苷酸的片段)。
71.如实施方案39-60中任一项所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:65的序列或其片段(例如,缺少SEQ ID NO:65的初始一个、两个、三个、四个、五个或六个核苷酸的片段)。
72.如实施方案39-60中任一项所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:66的序列或其片段(例如,缺少SEQ ID NO:66的初始一个、两个、三个、四个、五个或六个核苷酸的片段)。
73.如实施方案39-60中任一项所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:67的序列或其片段(例如,缺少SEQ ID NO:67的初始一个、两个、三个、四个、五个或六个核苷酸的片段)。
74.如实施方案39-60中任一项所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:68的序列或其片段(例如,缺少SEQ ID NO:68的初始一个、两个、三个、四个、五个或六个核苷酸的片段)。
75.如实施方案39-60中任一项所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:69的序列或其片段(例如,缺少SEQ ID NO:69的初始一个、两个、三个、四个、五个或六个核苷酸的片段)。
76.如实施方案39-60中任一项所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:70的序列或其片段(例如,缺少SEQ ID NO:70的初始一个、两个、三个、四个、五个或六个核苷酸的片段)。
77.如实施方案39-60中任一项所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:70的序列或其片段(例如,缺少SEQ ID NO:70的初始一个、两个、三个、四个、五个或六个核苷酸的片段)。
78.如实施方案39-60中任一项所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:71的序列或其片段(例如,缺少SEQ ID NO:71的初始一个、两个、三个、四个、五个或六个核苷酸的片段)。
79.如实施方案39-60中任一项所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:72的序列或其片段(例如,缺少SEQ ID NO:72的初始一个、两个、三个、四个、五个或六个核苷酸的片段)。
80.如实施方案39-60中任一项所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:73的序列或其片段(例如,缺少SEQ ID NO:73的初始一个、两个、三个、四个、五个或六个核苷酸的片段)。
81.如实施方案39-60中任一项所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:74的序列或其片段(例如,缺少SEQ ID NO:74的初始一个、两个、三个、四个、五个或六个核苷酸的片段)。
82.如实施方案39-60中任一项所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:75的序列或其片段(例如,缺少SEQ ID NO:75的初始一个、两个、三个、四个、五个或六个核苷酸的片段)。
83.如实施方案39-60中任一项所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:76的序列或其片段(例如,缺少SEQ ID NO:76的初始一个、两个、三个、四个、五个或六个核苷酸的片段)。
84.如实施方案39-60中任一项所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:77的序列或其片段(例如,缺少SEQ ID NO:77的初始一个、两个、三个、四个、五个或六个核苷酸的片段)。
85.如实施方案39-60中任一项所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:78的序列或其片段(例如,缺少SEQ ID NO:78的初始一个、两个、三个、四个、五个或六个核苷酸的片段)。
86.如实施方案39-60中任一项所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:88的序列或其片段(例如,缺少SEQ ID NO:88的初始一个、两个、三个、四个、五个或六个核苷酸的片段)。
87.如实施方案39-60中任一项所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:89的序列或其片段(例如,缺少SEQ ID NO:89的初始一个、两个、三个、四个、五个或六个核苷酸的片段)。
88.如实施方案39-60中任一项所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:90的序列或其片段(例如,缺少SEQ ID NO:90的初始一个、两个、三个、四个、五个或六个核苷酸的片段)。
89.如实施方案39-88中任一项所述的多核苷酸,其中所述5'UTR使得所述多核苷酸的半衰期增加约1.5-20倍。
90.如实施方案89所述的多核苷酸,其中所述5'UTR使得由所述多核苷酸编码的所述多肽的水平和/或活性,例如输出增加。
91.如前述实施方案中任一项所述的多核苷酸,其中(b)的所述编码区包含选自表3中所提供的终止元件的终止元件,例如,SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32、SEQ ID NO:33、SEQ ID NO:34、SEQID NO:35、SEQ ID NO:36、SEQ ID NO;62、SEQ ID NO:93或SEQ ID NO:96。
92.如实施方案91所述的多核苷酸,其中所述终止元件包含SEQ ID NO:26的序列。
93.如实施方案91所述的多核苷酸,其中所述终止元件包含SEQ ID NO:27的序列。
94.如实施方案91所述的多核苷酸,其中所述终止元件包含SEQ ID NO:28的序列。
95.如实施方案91所述的多核苷酸,其中所述终止元件包含SEQ ID NO:29的序列。
96.如实施方案91所述的多核苷酸,其中所述终止元件包含SEQ ID NO:30的序列。
97.如实施方案91所述的多核苷酸,其中所述终止元件包含SEQ ID NO:31的序列。
98.如实施方案91所述的多核苷酸,其中所述终止元件包含SEQ ID NO:32的序列。
99.如实施方案91所述的多核苷酸,其中所述终止元件包含SEQ ID NO:33的序列。
100.如实施方案91所述的多核苷酸,其中所述终止元件包含SEQ ID NO:34的序列。
101.如实施方案91所述的多核苷酸,其中所述终止元件包含SEQ ID NO:35的序列。
102.如实施方案91所述的多核苷酸,其中所述终止元件包含SEQ ID NO:36的序列。
103.如实施方案91所述的多核苷酸,其中所述终止元件包含SEQ ID NO:62的序列。
104.如实施方案91所述的多核苷酸,其中所述终止元件包含SEQ ID NO:93的序列。
105.如实施方案91所述的多核苷酸,其中所述终止元件包含SEQ ID NO:96的序列。
106.如实施方案91所述的多核苷酸,其中(b)的所述编码区包含终止元件,所述终止元件包含SEQ ID NO:37、SEQ ID NO:56或SEQ ID NO:57的共有序列。
107.如实施方案1-90中任一项所述的多核苷酸,其中(c)的所述3'UTR包含表2中所提供的3'UTR序列或与表2中所提供的3'UTR序列或其片段(例如,缺少表2中所提供的3'UTR序列的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列,
任选地其中所述多核苷酸包含与表4中所提供的序列具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
108.如实施方案107所述的多核苷酸,其中所述3'UTR包含与SEQ ID NO:11、SEQID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQID NO:24、SEQ ID NO:25、SEQ ID NO:45、SEQ ID NO:79、SEQ ID NO:80、SEQ ID NO:81、SEQID NO:82、SEQ ID NO:83、SEQ ID NO:84、SEQ ID NO:85、SEQ ID NO:86、SEQ ID NO:87、SEQID NO:94或SEQ ID NO:95或其片段(例如,缺少前述序列中的任一者的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列,
任选地其中所述多核苷酸包含与SEQ ID NO:47、48、49、50、122、52、53、54、55、59、60、61、126、127、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119或120中的任一者或其变体或片段具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
109.如实施方案107或108所述的多核苷酸,其中所述3'UTR包含SEQ ID NO:11的序列,或与SEQ ID NO:11或其片段(例如,缺少SEQ ID NO:11的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
110.如实施方案107或108所述的多核苷酸,其中所述3'UTR包含SEQ ID NO:12的序列,或与SEQ ID NO:12或其片段(例如,缺少SEQ ID NO:12的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
111.如实施方案107或108所述的多核苷酸,其中所述3'UTR包含SEQ ID NO:13的序列,或与SEQ ID NO:13或其片段(例如,缺少SEQ ID NO:13的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
112.如实施方案107或108所述的多核苷酸,其中所述3'UTR包含SEQ ID NO:14的序列,或与SEQ ID NO:14或其片段(例如,缺少SEQ ID NO:14的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
113.如实施方案107或108所述的多核苷酸,其中所述3'UTR包含SEQ ID NO:15的序列,或与SEQ ID NO:15或其片段(例如,缺少SEQ ID NO:15的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
114.如实施方案107或108所述的多核苷酸,其中所述3'UTR包含SEQ ID NO:16的序列,或与SEQ ID NO:16或其片段(例如,缺少SEQ ID NO:16的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
115.如实施方案107或108所述的多核苷酸,其中所述3'UTR包含SEQ ID NO:17的序列,或与SEQ ID NO:17或其片段(例如,缺少SEQ ID NO:17的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
116.如实施方案107或108所述的多核苷酸,其中所述3'UTR包含SEQ ID NO:18的序列,或与SEQ ID NO:18或其片段(例如,缺少SEQ ID NO:18的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
117.如实施方案107或108所述的多核苷酸,其中所述3'UTR包含SEQ ID NO:19的序列,或与SEQ ID NO:19或其片段(例如,缺少SEQ ID NO:19的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
118.如实施方案107或108所述的多核苷酸,其中所述3'UTR包含SEQ ID NO:21的序列,或与SEQ ID NO:20或其片段(例如,缺少SEQ ID NO:20的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
119.如实施方案107或108所述的多核苷酸,其中所述3'UTR包含SEQ ID NO:21的序列,或与SEQ ID NO:21或其片段(例如,缺少SEQ ID NO:21的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
120.如实施方案107或108所述的多核苷酸,其中所述3'UTR包含SEQ ID NO:22的序列,或与SEQ ID NO:22或其片段(例如,缺少SEQ ID NO:22的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
121.如实施方案107或108所述的多核苷酸,其中所述3'UTR包含SEQ ID NO:23的序列,或与SEQ ID NO:23或其片段(例如,缺少SEQ ID NO:23的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
122.如实施方案107或108所述的多核苷酸,其中所述3'UTR包含SEQ ID NO:24的序列,或与SEQ ID NO:24或其片段(例如,缺少SEQ ID NO:24的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
123.如实施方案107或108所述的多核苷酸,其中所述3'UTR包含SEQ ID NO:25的序列,或与SEQ ID NO:25或其片段(例如,缺少SEQ ID NO:25的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
124.如实施方案107或108所述的多核苷酸,其中所述3'UTR包含SEQ ID NO:45的序列,或与SEQ ID NO:45或其片段(例如,缺少SEQ ID NO:45的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
125.如实施方案107或108所述的多核苷酸,其中所述3'UTR包含SEQ ID NO:79的序列,或与SEQ ID NO:79或其片段(例如,缺少SEQ ID NO:79的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
126.如实施方案107或108所述的多核苷酸,其中所述3'UTR包含SEQ ID NO:80的序列,或与SEQ ID NO:80或其片段(例如,缺少SEQ ID NO:80的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
127.如实施方案107或108所述的多核苷酸,其中所述3'UTR包含SEQ ID NO:81的序列,或与SEQ ID NO:81或其片段(例如,缺少SEQ ID NO:81的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
128.如实施方案107或108所述的多核苷酸,其中所述3'UTR包含SEQ ID NO:82的序列,或与SEQ ID NO:82或其片段(例如,缺少SEQ ID NO:82的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
129.如实施方案107或108所述的多核苷酸,其中所述3'UTR包含SEQ ID NO:83的序列,或与SEQ ID NO:83或其片段(例如,缺少SEQ ID NO:83的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
130.如实施方案107或108所述的多核苷酸,其中所述3'UTR包含SEQ ID NO:84的序列,或与SEQ ID NO:84或其片段(例如,缺少SEQ ID NO:84的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
131.如实施方案107或108所述的多核苷酸,其中所述3'UTR包含SEQ ID NO:85的序列,或与SEQ ID NO:85或其片段(例如,缺少SEQ ID NO:85的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
132.如实施方案107或108所述的多核苷酸,其中所述3'UTR包含SEQ ID NO:86的序列,或与SEQ ID NO:86或其片段(例如,缺少SEQ ID NO:86的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
133.如实施方案107或108所述的多核苷酸,其中所述3'UTR包含SEQ ID NO:87的序列,或与SEQ ID NO:87或其片段(例如,缺少SEQ ID NO:87的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
134.如实施方案107或108所述的多核苷酸,其中所述3'UTR包含SEQ ID NO:94的序列,或与SEQ ID NO:94或其片段(例如,缺少SEQ ID NO:94的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
135.如实施方案107或108所述的多核苷酸,其中所述3'UTR包含SEQ ID NO:95的序列,或与SEQ ID NO:95或其片段(例如,缺少SEQ ID NO:95的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
136.如实施方案107或108所述的多核苷酸,其中所述3'UTR包含微RNA(miRNA)结合位点,例如,如本文所描述;和/或TENT募集序列,例如,如本文所描述。
137.如实施方案136所述的多核苷酸,其中所述miRNA结合位点包含SEQ ID NO:38-40中的任一者的序列;和/或其中所述TENT募集序列包含SEQ ID NO:91或92的序列。
138.如实施方案1-90中任一项所述的多核苷酸,其中:
(i)(b)的所述编码区包含选自表3中所提供的终止元件的终止元件,例如,SEQ IDNO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ IDNO:32、SEQ ID NO:33、SEQ ID NO:34、SEQ ID NO:35、SEQ ID NO:36、SEQ ID NO:37、SEQ IDNO:56、SEQ ID NO:57、SEQ ID NO:62、SEQ ID NO:93或SEQ ID NO:96;以及
(ii)(c)的所述3'UTR包含表2中所提供的3'UTR序列或与表2中所提供的3'UTR序列或其片段(例如,缺少表2中所提供的3'UTR序列的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列,
任选地其中所述多核苷酸包含与表4中所提供的序列,例如SEQ ID NO:47、48、49、50、122、52、53、54、55、59、60、61、126、127、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119或120中的任一者或其变体或片段具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
139.如实施方案138所述的多核苷酸,其中所述终止元件包含SEQ ID NO:26的序列。
140.如实施方案138所述的多核苷酸,其中所述终止元件包含SEQ ID NO:27的序列。
141.如实施方案138所述的多核苷酸,其中所述终止元件包含SEQ ID NO:28的序列。
142.如实施方案138所述的多核苷酸,其中所述终止元件包含SEQ ID NO:29的序列。
143.如实施方案138所述的多核苷酸,其中所述终止元件包含SEQ ID NO:30的序列。
144.如实施方案138所述的多核苷酸,其中所述终止元件包含SEQ ID NO:31的序列。
145.如实施方案138所述的多核苷酸,其中所述终止元件包含SEQ ID NO:32的序列。
146.如实施方案138所述的多核苷酸,其中所述终止元件包含SEQ ID NO:33的序列。
147.如实施方案138所述的多核苷酸,其中所述终止元件包含SEQ ID NO:34的序列。
148.如实施方案138所述的多核苷酸,其中所述终止元件包含SEQ ID NO:35的序列。
149.如实施方案138所述的多核苷酸,其中所述终止元件包含SEQ ID NO:36的序列。
150.如实施方案138所述的多核苷酸,其中所述终止元件包含SEQ ID NO:37的序列。
151.如实施方案138所述的多核苷酸,其中所述终止元件包含SEQ ID NO:56的序列。
152.如实施方案138所述的多核苷酸,其中所述终止元件包含SEQ ID NO:57的序列。
153.如实施方案138所述的多核苷酸,其中所述终止元件包含SEQ ID NO:62的序列。
154.如实施方案138所述的多核苷酸,其中所述终止元件包含SEQ ID NO:93的序列。
155.如实施方案138所述的多核苷酸,其中所述终止元件包含SEQ ID NO:96的序列。
156.如实施方案139所述的多核苷酸,其中(b)的所述编码区包含终止元件,所述终止元件包含SEQ ID NO:37的共有序列。
157.如实施方案139-156中任一项所述的多核苷酸,其中所述3'UTR包含SEQ IDNO:11的序列,或与SEQ ID NO:11或其片段(例如,缺少SEQ ID NO:11的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
158.如实施方案139-156中任一项所述的多核苷酸,其中所述3'UTR包含SEQ IDNO:12的序列,或与SEQ ID NO:12或其片段(例如,缺少SEQ ID NO:12的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
159.如实施方案139-156中任一项所述的多核苷酸,其中所述3'UTR包含SEQ IDNO:13的序列,或与SEQ ID NO:13或其片段(例如,缺少SEQ ID NO:13的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
160.如实施方案139-156中任一项所述的多核苷酸,其中所述3'UTR包含SEQ IDNO:14的序列,或与SEQ ID NO:14或其片段(例如,缺少SEQ ID NO:14的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
161.如实施方案139-156中任一项所述的多核苷酸,其中所述3'UTR包含SEQ IDNO:15的序列,或与SEQ ID NO:15或其片段(例如,缺少SEQ ID NO:15的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
162.如实施方案139-156中任一项所述的多核苷酸,其中所述3'UTR包含SEQ IDNO:16的序列,或与SEQ ID NO:16或其片段(例如,缺少SEQ ID NO:16的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
163.如实施方案139-156中任一项所述的多核苷酸,其中所述3'UTR包含SEQ IDNO:17的序列,或与SEQ ID NO:17或其片段(例如,缺少SEQ ID NO:17的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
164.如实施方案139-156中任一项所述的多核苷酸,其中所述3'UTR包含SEQ IDNO:18的序列,或与SEQ ID NO:18或其片段(例如,缺少SEQ ID NO:18的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
165.如实施方案139-156中任一项所述的多核苷酸,其中所述3'UTR包含SEQ IDNO:19的序列,或与SEQ ID NO:19或其片段(例如,缺少SEQ ID NO:19的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
166.如实施方案139-156中任一项所述的多核苷酸,其中所述3'UTR包含SEQ IDNO:21的序列,或与SEQ ID NO:20或其片段(例如,缺少SEQ ID NO:20的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
167.如实施方案139-156中任一项所述的多核苷酸,其中所述3'UTR包含SEQ IDNO:21的序列,或与SEQ ID NO:21或其片段(例如,缺少SEQ ID NO:21的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
168.如实施方案139-156中任一项所述的多核苷酸,其中所述3'UTR包含SEQ IDNO:22的序列,或与SEQ ID NO:22或其片段(例如,缺少SEQ ID NO:22的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
169.如实施方案139-156中任一项所述的多核苷酸,其中所述3'UTR包含SEQ IDNO:23的序列,或与SEQ ID NO:23或其片段(例如,缺少SEQ ID NO:23的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
170.如实施方案139-156中任一项所述的多核苷酸,其中所述3'UTR包含SEQ IDNO:24的序列,或与SEQ ID NO:24或其片段(例如,缺少SEQ ID NO:24的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
171.如实施方案139-156中任一项所述的多核苷酸,其中所述3'UTR包含SEQ IDNO:25的序列,或与SEQ ID NO:25或其片段(例如,缺少SEQ ID NO:25的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
172.如实施方案139-156中任一项所述的多核苷酸,其中所述3'UTR包含SEQ IDNO:45的序列,或与SEQ ID NO:45或其片段(例如,缺少SEQ ID NO:45的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
173.如实施方案139-156中任一项所述的多核苷酸,其中所述3'UTR包含SEQ IDNO:79的序列,或与SEQ ID NO:79或其片段(例如,缺少SEQ ID NO:79的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
174.如实施方案139-156中任一项所述的多核苷酸,其中所述3'UTR包含SEQ IDNO:80的序列,或与SEQ ID NO:80或其片段(例如,缺少SEQ ID NO:80的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
175.如实施方案139-156中任一项所述的多核苷酸,其中所述3'UTR包含SEQ IDNO:81的序列,或与SEQ ID NO:81或其片段(例如,缺少SEQ ID NO:81的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
176.如实施方案139-156中任一项所述的多核苷酸,其中所述3'UTR包含SEQ IDNO:82的序列,或与SEQ ID NO:82或其片段(例如,缺少SEQ ID NO:82的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
177.如实施方案139-156中任一项所述的多核苷酸,其中所述3'UTR包含SEQ IDNO:83的序列,或与SEQ ID NO:83或其片段(例如,缺少SEQ ID NO:83的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
178.如实施方案139-156中任一项所述的多核苷酸,其中所述3'UTR包含SEQ IDNO:84的序列,或与SEQ ID NO:84或其片段(例如,缺少SEQ ID NO:84的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
179.如实施方案139-156中任一项所述的多核苷酸,其中所述3'UTR包含SEQ IDNO:85的序列,或与SEQ ID NO:85或其片段(例如,缺少SEQ ID NO:85的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
180.如实施方案139-156中任一项所述的多核苷酸,其中所述3'UTR包含SEQ IDNO:86的序列,或与SEQ ID NO:86或其片段(例如,缺少SEQ ID NO:86的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
181.如实施方案139-156中任一项所述的多核苷酸,其中所述3'UTR包含SEQ IDNO:87的序列,或与SEQ ID NO:87或其片段(例如,缺少SEQ ID NO:87的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
182.如实施方案139-156中任一项所述的多核苷酸,其中所述3'UTR包含SEQ IDNO:94的序列,或与SEQ ID NO:94或其片段(例如,缺少SEQ ID NO:94的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
183.如实施方案139-156中任一项所述的多核苷酸,其中所述3'UTR包含SEQ IDNO:95的序列,或与SEQ ID NO:95或其片段(例如,缺少SEQ ID NO:95的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
184.如实施方案139-156中任一项所述的多核苷酸,其中所述3'UTR包含微RNA结合位点,例如,如本文所描述;和/或TENT募集序列,例如,如本文所描述。
185.如实施方案184所述的多核苷酸,其中所述miRNA结合位点包含SEQ ID NO:38-40中的任一者的序列;和/或其中所述TENT募集序列包含SEQ ID NO:91或92的序列。
186.一种编码多肽的多核苷酸,其中所述多核苷酸包含:
(a)5'-UTR(例如,如本文所描述);
(b)编码区,所述编码区包含选自表3中所提供的终止元件的终止元件;以及
(c)3'-UTR(例如,如本文所描述)。
187.如实施方案186所述的多核苷酸,其中所述终止元件包含SEQ ID NO:26、SEQID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32、SEQID NO:33、SEQ ID NO:34、SEQ ID NO:35、SEQ ID NO:36、SEQ ID NO;62、SEQ ID NO:93或SEQ ID NO:96的序列。
188.如实施方案186所述的多核苷酸,其中所述终止元件包含SEQ ID NO:26的序列。
189.如实施方案186所述的多核苷酸,其中所述终止元件包含SEQ ID NO:27的序列。
190.如实施方案186所述的多核苷酸,其中所述终止元件包含SEQ ID NO:28的序列。
191.如实施方案186所述的多核苷酸,其中所述终止元件包含SEQ ID NO:29的序列。
192.如实施方案186所述的多核苷酸,其中所述终止元件包含SEQ ID NO:30的序列。
193.如实施方案186所述的多核苷酸,其中所述终止元件包含SEQ ID NO:31的序列。
194.如实施方案186所述的多核苷酸,其中所述终止元件包含SEQ ID NO:32的序列。
195.如实施方案186所述的多核苷酸,其中所述终止元件包含SEQ ID NO:33的序列。
196.如实施方案186所述的多核苷酸,其中所述终止元件包含SEQ ID NO:34的序列。
197.如实施方案186所述的多核苷酸,其中所述终止元件包含SEQ ID NO:35的序列。
198.如实施方案186所述的多核苷酸,其中所述终止元件包含SEQ ID NO:36的序列。
199.如实施方案186所述的多核苷酸,其中所述终止元件包含SEQ ID NO:62的序列。
200.如实施方案186所述的多核苷酸,其中所述终止元件包含SEQ ID NO:93的序列。
201.如实施方案186所述的多核苷酸,其中所述终止元件包含SEQ ID NO:96的序列。
202.如实施方案186所述的多核苷酸,其中(b)的所述编码区包含终止元件,所述终止元件包含式B的共有序列:
X-3-X-2-X-1-U-A-A-X1-X2-X3-X4-X5-X6-X7-X8-X9-X10-X11-X12(SEQ ID NO:37)
其中:
X1是G或A;
X2、X4、X5、X6或X7各自独立地是C或U;
X3是C或A;
X8、X10、X11、X12、X-1或X-3各自独立地是C或G;
X9是G或U;和/或
X-2是A或U。
203.如实施方案186所述的多核苷酸,其中(b)的所述编码区包含终止元件,所述终止元件包含式C的共有序列
X-3-X-2-X-1-U-G-A-X1-X2-X3-X4-X5-X6-X7-X8-X9-X10-X11-X12(SEQ ID NO:56)
其中:
X-3、X-1、X2、X5、X6、X7、X8、X9或X12各自独立地是G或C;
X-2、X3或X4各自独立地是A或C;
X1是A或G;和/或
X10或X11各自独立地是C或U。
204.如实施方案186所述的多核苷酸,其中(b)的所述编码区包含终止元件,所述终止元件包含式D的共有序列
X-3-X-2-X-1-U-A-G-X1-X2-X3-X4-X5-X6-X7-X8-X9-X10-X11-X12(SEQ ID NO:57)
其中:
X-3、X-1、X2、X3、X10各自独立地是G或C;
X-2或X9各自独立地是A或U;
X1或X4各自独立地是A或G;
X5或X8各自独立地是A或C;和/或
X6、X7、X11或X12各自独立地是C或U。
205.如实施方案202-204中任一项所述的多核苷酸,其中所述共有序列具有高GC含量,例如,约50%、60%、70%、80%、90%或99%的GC含量。
206.如实施方案202-205中任一项所述的多核苷酸,其使得所述多核苷酸的半衰期增加或由所述多核苷酸编码的所述多肽的水平和/或活性,例如输出增加。
207.如实施方案202-206中任一项所述的多核苷酸,其中所述多核苷酸的半衰期增加约1.2-10倍。
208.如实施方案207所述的多核苷酸,其中使用测量多核苷酸的半衰期的测定,例如本文所公开的实施例中的任一者中所描述的测定来测量半衰期的增加。
209.如实施方案207所述的多核苷酸,其中将半衰期的增加与包含不具有实施方案199所述的终止元件的编码区的在其它方面类似的多核苷酸进行比较。
210.如实施方案202所述的多核苷酸,其中位置X-1是密码子的第三个位置,例如,指定氨基酸的密码子。
211.如实施方案210所述的多核苷酸,其中在位置X-1处的核苷酸不改变并入多肽中的氨基酸。
212.如实施方案202所述的多核苷酸,其中在位置X-1处的C使得所述多核苷酸的半衰期增加或由所述多核苷酸编码的所述多肽的水平和/或活性,例如输出增加。
213.如实施方案212所述的多核苷酸,其中通过测量多核苷酸的半衰期的测定,例如本文所公开的实施例中的任一者中所描述的测定来测量所述多核苷酸的增加的半衰期。
214.如实施方案186-213中任一项所述的多核苷酸,其中所述终止元件使得所述多核苷酸的半衰期增加,例如,所述多核苷酸的半衰期增加约1.5-20倍。
215.如实施方案214所述的多核苷酸,其中将所述多核苷酸的半衰期的增加与不具有终止元件、具有不同终止元件或不具有实施方案186所述的终止元件的在其它方面类似的多核苷酸进行比较。
216.如实施方案214或215所述的多核苷酸,其中根据测量多核苷酸的半衰期的测定,例如本文所公开的实施例中的任一者中所描述的测定来测量所述多核苷酸的半衰期的增加。
217.如实施方案186-216中任一项所述的多核苷酸,其中所述终止元件使得由所述多核苷酸编码的所述多肽的水平和/或活性,例如输出或表达持续时间增加。
218.如实施方案217所述的多核苷酸,其中根据测量多肽的水平和/或活性,例如输出或表达持续时间的测定,例如本文所公开的实施例中的任一者中所描述的测定来测量所述多肽的水平和/或活性,例如输出或表达持续时间的增加。
219.如实施方案218所述的多核苷酸,其中所述终止元件使得由所述多核苷酸编码的所述多肽的水平和/或活性,例如输出增加约1.5-20倍。
220.如实施方案218所述的多核苷酸,其中所述终止元件使得由所述多核苷酸编码的所述多肽的水平和/或活性,例如可检测水平或活性增加约1.5-20倍,持续约1、2、3、4、5、6、7、8、9、10或14天。
221.如实施方案220所述的多核苷酸,其中所述终止元件使得由所述多核苷酸编码的所述多肽的可检测水平或活性持续约1、2、3、4、5、6、7、8、9、10或14天。
222.如实施方案217-221中任一项所述的多核苷酸,其中将由所述多核苷酸编码的所述多肽的水平和/或活性,例如输出或表达持续时间的增加与不具有终止元件、具有不同终止元件或不具有实施方案186所述的终止元件的在其它方面类似的多核苷酸进行比较。
223.如实施方案186-222中任一项所述的多核苷酸,其中(a)的所述5'UTR包含表1中所提供的5'UTR序列或与表1中所提供的5'UTR序列或其变体或片段(例如,缺少表1中所提供的5'UTR序列的初始一个、两个、三个、四个、五个或六个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
224.如实施方案223所述的多核苷酸,其中所述5'UTR包含与SEQ ID NO:1、SEQ IDNO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:41、SEQ ID NO:42、SEQ ID NO:63、SEQ ID NO:64、SEQ ID NO:65、SEQ ID NO:66、SEQ IDNO:67、SEQ ID NO:68、SEQ ID NO:69、SEQ ID NO:70、SEQ ID NO:71、SEQ ID NO:72、SEQ IDNO:73、SEQ ID NO:74、SEQ ID NO:75、SEQ ID NO:76、SEQ ID NO:77、SEQ ID NO:78、SEQ IDNO:88、SEQ ID NO:89或SEQ ID NO:90或其片段(例如,缺少前述序列中的任一者的初始一个、两个、三个、四个、五个或六个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
225.如实施方案223所述的多核苷酸,其中所述5'UTR包含与SEQ ID NO:1或其片段(例如,缺少SEQ ID NO:1的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
226.如实施方案223所述的多核苷酸,其中所述5'UTR包含与SEQ ID NO:2或其片段(例如,缺少SEQ ID NO:2的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
227.如实施方案223所述的多核苷酸,其中所述5'UTR包含与SEQ ID NO:3或其片段(例如,缺少SEQ ID NO:3的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
228.如实施方案223所述的多核苷酸,其中所述5'UTR包含与SEQ ID NO:4或其片段(例如,缺少SEQ ID NO:4的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
229.如实施方案223所述的多核苷酸,其中所述5'UTR包含与SEQ ID NO:5或其片段(例如,缺少SEQ ID NO:5的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
230.如实施方案223所述的多核苷酸,其中所述5'UTR包含与SEQ ID NO:6或其片段(例如,缺少SEQ ID NO:6的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
231.如实施方案223所述的多核苷酸,其中所述5'UTR包含与SEQ ID NO:8或其片段(例如,缺少SEQ ID NO:8的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
232.如实施方案223所述的多核苷酸,其中所述5'UTR包含与SEQ ID NO:41或其片段(例如,缺少SEQ ID NO:41的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
233.如实施方案223所述的多核苷酸,其中所述5'UTR包含与SEQ ID NO:42或其片段(例如,缺少SEQ ID NO:42的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
234.如实施方案223所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:63或其片段(例如,缺少SEQ ID NO:63的初始一个、两个、三个、四个、五个或六个核苷酸的片段)的序列。
235.如实施方案223所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:64或其片段(例如,缺少SEQ ID NO:64的初始一个、两个、三个、四个、五个或六个核苷酸的片段)的序列。
236.如实施方案223所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:65或其片段(例如,缺少SEQ ID NO:65的初始一个、两个、三个、四个、五个或六个核苷酸的片段)的序列。
237.如实施方案223所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:66或其片段(例如,缺少SEQ ID NO:66的初始一个、两个、三个、四个、五个或六个核苷酸的片段)的序列。
238.如实施方案223所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:67或其片段(例如,缺少SEQ ID NO:67的初始一个、两个、三个、四个、五个或六个核苷酸的片段)的序列。
239.如实施方案223所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:68或其片段(例如,缺少SEQ ID NO:68的初始一个、两个、三个、四个、五个或六个核苷酸的片段)的序列。
240.如实施方案223所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:69或其片段(例如,缺少SEQ ID NO:69的初始一个、两个、三个、四个、五个或六个核苷酸的片段)的序列。
241.如实施方案223所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:70或其片段(例如,缺少SEQ ID NO:70的初始一个、两个、三个、四个、五个或六个核苷酸的片段)的序列。
242.如实施方案223所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:70或其片段(例如,缺少SEQ ID NO:70的初始一个、两个、三个、四个、五个或六个核苷酸的片段)的序列。
243.如实施方案223所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:71或其片段(例如,缺少SEQ ID NO:71的初始一个、两个、三个、四个、五个或六个核苷酸的片段)的序列。
244.如实施方案223所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:72或其片段(例如,缺少SEQ ID NO:72的初始一个、两个、三个、四个、五个或六个核苷酸的片段)的序列。
245.如实施方案223所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:73或其片段(例如,缺少SEQ ID NO:73的初始一个、两个、三个、四个、五个或六个核苷酸的片段)的序列。
246.如实施方案223所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:74或其片段(例如,缺少SEQ ID NO:74的初始一个、两个、三个、四个、五个或六个核苷酸的片段)的序列。
247.如实施方案223所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:75或其片段(例如,缺少SEQ ID NO:75的初始一个、两个、三个、四个、五个或六个核苷酸的片段)的序列。
248.如实施方案223所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:76或其片段(例如,缺少SEQ ID NO:76的初始一个、两个、三个、四个、五个或六个核苷酸的片段)的序列。
249.如实施方案223所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:77或其片段(例如,缺少SEQ ID NO:77的初始一个、两个、三个、四个、五个或六个核苷酸的片段)的序列。
250.如实施方案223所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:78或其片段(例如,缺少SEQ ID NO:78的初始一个、两个、三个、四个、五个或六个核苷酸的片段)的序列。
251.如实施方案223所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:88或其片段(例如,缺少SEQ ID NO:88的初始一个、两个、三个、四个、五个或六个核苷酸的片段)的序列。
252.如实施方案223所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:89或其片段(例如,缺少SEQ ID NO:89的初始一个、两个、三个、四个、五个或六个核苷酸的片段)的序列。
253.如实施方案223所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:90或其片段(例如,缺少SEQ ID NO:90的初始一个、两个、三个、四个、五个或六个核苷酸的片段)的序列。
254.如实施方案186-222中任一项所述的多核苷酸,其中(c)的所述3'UTR包含表2中所提供的3'UTR序列或与表2中所提供的3'UTR序列或其片段(例如,缺少表2中所提供的3'UTR序列的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列
任选地其中所述多核苷酸包含与表4中所提供的序列具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
255.如实施方案254所述的多核苷酸,其中所述3'UTR包含与SEQ ID NO:11、SEQID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQID NO:24、SEQ ID NO:25、SEQ ID NO:45、SEQ ID NO:79、SEQ ID NO:80、SEQ ID NO:81、SEQID NO:82、SEQ ID NO:83、SEQ ID NO:84、SEQ ID NO:85、SEQ ID NO:86、SEQ ID NO:87、SEQID NO:94或SEQ ID NO:95或其片段(例如,缺少前述序列中的任一者的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列
任选地其中所述多核苷酸包含与SEQ ID NO:47、48、49、50、122、52、53、54、55、59、60、61、126、127、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119或120中的任一者或其变体或片段具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
256.如实施方案254所述的多核苷酸,其中所述3'UTR包含SEQ ID NO:11的序列,或与SEQ ID NO:11或其片段(例如,缺少SEQ ID NO:11的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
257.如实施方案254所述的多核苷酸,其中所述3'UTR包含SEQ ID NO:12的序列,或与SEQ ID NO:12或其片段(例如,缺少SEQ ID NO:12的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
258.如实施方案254所述的多核苷酸,其中所述3'UTR包含SEQ ID NO:13的序列,或与SEQ ID NO:13或其片段(例如,缺少SEQ ID NO:13的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
259.如实施方案254所述的多核苷酸,其中所述3'UTR包含SEQ ID NO:14的序列,或与SEQ ID NO:14或其片段(例如,缺少SEQ ID NO:14的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
260.如实施方案254所述的多核苷酸,其中所述3'UTR包含SEQ ID NO:15的序列,或与SEQ ID NO:15或其片段(例如,缺少SEQ ID NO:15的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
261.如实施方案254所述的多核苷酸,其中所述3'UTR包含SEQ ID NO:16的序列,或与SEQ ID NO:16或其片段(例如,缺少SEQ ID NO:16的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
262.如实施方案254所述的多核苷酸,其中所述3'UTR包含SEQ ID NO:17的序列,或与SEQ ID NO:17或其片段(例如,缺少SEQ ID NO:17的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
263.如实施方案254所述的多核苷酸,其中所述3'UTR包含SEQ ID NO:18的序列,或与SEQ ID NO:18或其片段(例如,缺少SEQ ID NO:18的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
264.如实施方案254所述的多核苷酸,其中所述3'UTR包含SEQ ID NO:19的序列,或与SEQ ID NO:19或其片段(例如,缺少SEQ ID NO:19的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
265.如实施方案254所述的多核苷酸,其中所述3'UTR包含SEQ ID NO:21的序列,或与SEQ ID NO:20或其片段(例如,缺少前述序列中的任一者的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
266.如实施方案254所述的多核苷酸,其中所述3'UTR包含SEQ ID NO:21的序列,或与SEQ ID NO:21或其片段(例如,缺少SEQ ID NO:21的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
267.如实施方案254所述的多核苷酸,其中所述3'UTR包含SEQ ID NO:22的序列,或与SEQ ID NO:22或其片段(例如,缺少SEQ ID NO:22的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
268.如实施方案254所述的多核苷酸,其中所述3'UTR包含SEQ ID NO:23的序列,或与SEQ ID NO:23或其片段(例如,缺少SEQ ID NO:23的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
269.如实施方案254所述的多核苷酸,其中所述3'UTR包含SEQ ID NO:24的序列,或与SEQ ID NO:24或其片段(例如,缺少SEQ ID NO:24的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
270.如实施方案254所述的多核苷酸,其中所述3'UTR包含SEQ ID NO:25的序列,或与SEQ ID NO:25或其片段(例如,缺少SEQ ID NO:25的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
271.如权利要求254所述的多核苷酸,其中所述3'UTR包含SEQ ID NO:45的序列,或与SEQ ID NO:45或其片段(例如,缺少SEQ ID NO:45的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
272.如权利要求254所述的多核苷酸,其中所述3'UTR包含SEQ ID NO:79的序列,或与SEQ ID NO:79或其片段(例如,缺少SEQ ID NO:79的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
273.如权利要求254所述的多核苷酸,其中所述3'UTR包含SEQ ID NO:80的序列,或与SEQ ID NO:80或其片段(例如,缺少SEQ ID NO:80的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
274.如权利要求254所述的多核苷酸,其中所述3'UTR包含SEQ ID NO:81的序列,或与SEQ ID NO:81或其片段(例如,缺少SEQ ID NO:81的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
275.如权利要求254所述的多核苷酸,其中所述3'UTR包含SEQ ID NO:82的序列,或与SEQ ID NO:82或其片段(例如,缺少SEQ ID NO:82的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
276.如权利要求254所述的多核苷酸,其中所述3'UTR包含SEQ ID NO:83的序列,或与SEQ ID NO:83或其片段(例如,缺少SEQ ID NO:83的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
277.如权利要求254所述的多核苷酸,其中所述3'UTR包含SEQ ID NO:84的序列,或与SEQ ID NO:84或其片段(例如,缺少SEQ ID NO:84的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
278.如权利要求254所述的多核苷酸,其中所述3'UTR包含SEQ ID NO:85的序列,或与SEQ ID NO:85或其片段(例如,缺少SEQ ID NO:85的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
279.如权利要求254所述的多核苷酸,其中所述3'UTR包含SEQ ID NO:86的序列,或与SEQ ID NO:86或其片段(例如,缺少SEQ ID NO:86的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
280.如权利要求254所述的多核苷酸,其中所述3'UTR包含SEQ ID NO:87的序列,或与SEQ ID NO:87或其片段(例如,缺少SEQ ID NO:87的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
281.如权利要求254所述的多核苷酸,其中所述3'UTR包含SEQ ID NO:94的序列,或与SEQ ID NO:94或其片段(例如,缺少SEQ ID NO:94的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
282.如权利要求254所述的多核苷酸,其中所述3'UTR包含SEQ ID NO:95的序列,或与SEQ ID NO:95或其片段(例如,缺少SEQ ID NO:95的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
283.如实施方案254所述的多核苷酸,其中所述3'UTR包含微RNA结合位点,例如,如本文所描述;和/或TENT募集序列,例如,如本文所描述。
284.如实施方案254所述的多核苷酸,其中所述miRNA结合位点包含SEQ ID NO:38-40中的任一者的序列;或其中所述TENT募集序列包含SEQ ID NO:91或92的序列。
285.如实施方案186-222中任一项所述的多核苷酸,其中:
(i)(a)的所述5'UTR包含表1中所提供的5'UTR序列或与表1中所提供的3'UTR序列或其片段(例如,缺少表1中所提供的5'UTR序列的初始一个、两个、三个、四个、五个或六个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列;以及
(ii)(c)的所述3'UTR包含表2中所提供的3'UTR序列或与表2中所提供的3'UTR序列或其片段(例如,缺少表2中所提供的3'UTR序列的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列
任选地其中所述多核苷酸包含与表4中所提供的序列,例如SEQ ID NO:47、48、49、50、122、52、53、54、55、59、60、61、126、127、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119或120中的任一者或其变体或片段具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
286.如实施方案285所述的多核苷酸,其中所述5'UTR包含与SEQ ID NO:1、SEQ IDNO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:41、SEQ ID NO:42、SEQ ID NO:63、SEQ ID NO:64、SEQ ID NO:65、SEQ ID NO:66、SEQ IDNO:67、SEQ ID NO:68、SEQ ID NO:69、SEQ ID NO:70、SEQ ID NO:71、SEQ ID NO:72、SEQ IDNO:73、SEQ ID NO:74、SEQ ID NO:75、SEQ ID NO:76、SEQ ID NO:77、SEQ ID NO:78、SEQ IDNO:88、SEQ ID NO:89或SEQ ID NO:90或其片段(例如,缺少前述序列中的任一者的初始一个、两个、三个、四个、五个或六个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
287.如实施方案285所述的多核苷酸,其中所述5'UTR包含与SEQ ID NO:1或其片段(例如,缺少SEQ ID NO:1的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
288.如实施方案285所述的多核苷酸,其中所述5'UTR包含与SEQ ID NO:2或其片段(例如,缺少SEQ ID NO:2的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
289.如实施方案285所述的多核苷酸,其中所述5'UTR包含与SEQ ID NO:3或其片段(例如,缺少SEQ ID NO:3的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
290.如实施方案285所述的多核苷酸,其中所述5'UTR包含与SEQ ID NO:4或其片段(例如,缺少SEQ ID NO:4的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
291.如实施方案285所述的多核苷酸,其中所述5'UTR包含与SEQ ID NO:5或其片段(例如,缺少SEQ ID NO:5的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
292.如实施方案285所述的多核苷酸,其中所述5'UTR包含与SEQ ID NO:6或其片段(例如,缺少SEQ ID NO:6的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
293.如实施方案285所述的多核苷酸,其中所述5'UTR包含与SEQ ID NO:8或其片段(例如,缺少SEQ ID NO:8的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
294.如实施方案285所述的多核苷酸,其中所述5'UTR包含与SEQ ID NO:41或其片段(例如,缺少SEQ ID NO:41的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
295.如实施方案285所述的多核苷酸,其中所述5'UTR包含与SEQ ID NO:42或其片段(例如,缺少SEQ ID NO:42的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
296.如实施方案285所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:63或其片段(例如,缺少SEQ ID NO:63的初始一个、两个、三个、四个、五个或六个核苷酸的片段)的序列。
297.如实施方案285所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:64或其片段(例如,缺少SEQ ID NO:64的初始一个、两个、三个、四个、五个或六个核苷酸的片段)的序列。
298.如实施方案285所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:65或其片段(例如,缺少SEQ ID NO:65的初始一个、两个、三个、四个、五个或六个核苷酸的片段)的序列。
299.如实施方案285所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:66或其片段(例如,缺少SEQ ID NO:66的初始一个、两个、三个、四个、五个或六个核苷酸的片段)的序列。
300.如实施方案285所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:67或其片段(例如,缺少SEQ ID NO:67的初始一个、两个、三个、四个、五个或六个核苷酸的片段)的序列。
301.如实施方案285所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:68或其片段(例如,缺少SEQ ID NO:68的初始一个、两个、三个、四个、五个或六个核苷酸的片段)的序列。
302.如实施方案285所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:69或其片段(例如,缺少SEQ ID NO:69的初始一个、两个、三个、四个、五个或六个核苷酸的片段)的序列。
303.如实施方案285所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:70或其片段(例如,缺少SEQ ID NO:70的初始一个、两个、三个、四个、五个或六个核苷酸的片段)的序列。
304.如实施方案285所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:70或其片段(例如,缺少SEQ ID NO:70的初始一个、两个、三个、四个、五个或六个核苷酸的片段)的序列。
305.如实施方案285所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:71或其片段(例如,缺少SEQ ID NO:71的初始一个、两个、三个、四个、五个或六个核苷酸的片段)的序列。
306.如实施方案285所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:72或其片段(例如,缺少SEQ ID NO:72的初始一个、两个、三个、四个、五个或六个核苷酸的片段)的序列。
307.如实施方案285所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:73或其片段(例如,缺少SEQ ID NO:73的初始一个、两个、三个、四个、五个或六个核苷酸的片段)的序列。
308.如实施方案285所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:74或其片段(例如,缺少SEQ ID NO:74的初始一个、两个、三个、四个、五个或六个核苷酸的片段)的序列。
309.如实施方案285所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:75或其片段(例如,缺少SEQ ID NO:75的初始一个、两个、三个、四个、五个或六个核苷酸的片段)的序列。
310.如实施方案285所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:76或其片段(例如,缺少SEQ ID NO:76的初始一个、两个、三个、四个、五个或六个核苷酸的片段)的序列。
311.如实施方案285所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:77或其片段(例如,缺少SEQ ID NO:77的初始一个、两个、三个、四个、五个或六个核苷酸的片段)的序列。
312.如实施方案285所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:78或其片段(例如,缺少SEQ ID NO:78的初始一个、两个、三个、四个、五个或六个核苷酸的片段)的序列。
313.如实施方案285所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:88或其片段(例如,缺少SEQ ID NO:88的初始一个、两个、三个、四个、五个或六个核苷酸的片段)的序列。
314.如实施方案285所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:89或其片段(例如,缺少SEQ ID NO:89的初始一个、两个、三个、四个、五个或六个核苷酸的片段)的序列。
315.如实施方案285所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:90或其片段(例如,缺少SEQ ID NO:90的初始一个、两个、三个、四个、五个或六个核苷酸的片段)的序列。
316.如实施方案285-315中任一项所述的多核苷酸,其中所述3'UTR包含与SEQ IDNO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ IDNO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ IDNO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:45、SEQ ID NO:79、SEQ ID NO:80、SEQ IDNO:81、SEQ ID NO:82、SEQ ID NO:83、SEQ ID NO:84、SEQ ID NO:85、SEQ ID NO:86、SEQ IDNO:87、SEQ ID NO:94或SEQ ID NO:95或其片段(例如,缺少前述序列中的任一者的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
317.如实施方案285-315中任一项所述的多核苷酸,其中所述3'UTR包含SEQ IDNO:11的序列,或与SEQ ID NO:11或其片段(例如,缺少SEQ ID NO:11的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
318.如实施方案285-315中任一项所述的多核苷酸,其中所述3'UTR包含SEQ IDNO:12的序列,或与SEQ ID NO:12或其片段(例如,缺少SEQ ID NO:12的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
319.如实施方案285-315中任一项所述的多核苷酸,其中所述3'UTR包含SEQ IDNO:13的序列,或与SEQ ID NO:13或其片段(例如,缺少SEQ ID NO:13的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
320.如实施方案285-315中任一项所述的多核苷酸,其中所述3'UTR包含SEQ IDNO:14的序列,或与SEQ ID NO:14或其片段(例如,缺少SEQ ID NO:14的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
321.如实施方案285-315中任一项所述的多核苷酸,其中所述3'UTR包含SEQ IDNO:15的序列,或与SEQ ID NO:15或其片段(例如,缺少SEQ ID NO:15的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
322.如实施方案285-315中任一项所述的多核苷酸,其中所述3'UTR包含SEQ IDNO:16的序列,或与SEQ ID NO:16或其片段(例如,缺少SEQ ID NO:16的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
323.如实施方案285-315中任一项所述的多核苷酸,其中所述3'UTR包含SEQ IDNO:17的序列,或与SEQ ID NO:17或其片段(例如,缺少SEQ ID NO:17的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
324.如实施方案285-315中任一项所述的多核苷酸,其中所述3'UTR包含SEQ IDNO:18的序列,或与SEQ ID NO:18或其片段(例如,缺少SEQ ID NO:18的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
325.如实施方案285-315中任一项所述的多核苷酸,其中所述3'UTR包含SEQ IDNO:19的序列,或与SEQ ID NO:19或其片段(例如,缺少SEQ ID NO:19的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
326.如实施方案285-315中任一项所述的多核苷酸,其中所述3'UTR包含SEQ IDNO:20的序列,或与SEQ ID NO:20或其片段(例如,缺少SEQ ID NO:20的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
327.如实施方案285-315中任一项所述的多核苷酸,其中所述3'UTR包含SEQ IDNO:21的序列,或与SEQ ID NO:21或其片段(例如,缺少SEQ ID NO:21的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
328.如实施方案285-315中任一项所述的多核苷酸,其中所述3'UTR包含SEQ IDNO:22的序列,或与SEQ ID NO:22或其片段(例如,缺少SEQ ID NO:22的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
329.如实施方案285-315中任一项所述的多核苷酸,其中所述3'UTR包含SEQ IDNO:23的序列,或与SEQ ID NO:23或其片段(例如,缺少SEQ ID NO:23的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
330.如实施方案285-315中任一项所述的多核苷酸,其中所述3'UTR包含SEQ IDNO:24的序列,或与SEQ ID NO:24或其片段(例如,缺少SEQ ID NO:24的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
331.如实施方案285-315中任一项所述的多核苷酸,其中所述3'UTR包含SEQ IDNO:25的序列,或与SEQ ID NO:25或其片段(例如,缺少SEQ ID NO:25的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
332.如实施方案285-315中任一项所述的多核苷酸,其中所述3'UTR包含SEQ IDNO:45的序列,或与SEQ ID NO:45或其片段(例如,缺少SEQ ID NO:45的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
333.如实施方案285-315中任一项所述的多核苷酸,其中所述3'UTR包含SEQ IDNO:79的序列,或与SEQ ID NO:79或其片段(例如,缺少SEQ ID NO:79的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
334.如实施方案285-315中任一项所述的多核苷酸,其中所述3'UTR包含SEQ IDNO:80的序列,或与SEQ ID NO:80或其片段(例如,缺少SEQ ID NO:80的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
335.如实施方案285-315中任一项所述的多核苷酸,其中所述3'UTR包含SEQ IDNO:81的序列,或与SEQ ID NO:81或其片段(例如,缺少SEQ ID NO:81的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
336.如实施方案285-315中任一项所述的多核苷酸,其中所述3'UTR包含SEQ IDNO:82的序列,或与SEQ ID NO:82或其片段(例如,缺少SEQ ID NO:82的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
337.如实施方案285-315中任一项所述的多核苷酸,其中所述3'UTR包含SEQ IDNO:83的序列,或与SEQ ID NO:83或其片段(例如,缺少SEQ ID NO:83的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
338.如实施方案285-315中任一项所述的多核苷酸,其中所述3'UTR包含SEQ IDNO:84的序列,或与SEQ ID NO:84或其片段(例如,缺少SEQ ID NO:84的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
339.如实施方案285-315中任一项所述的多核苷酸,其中所述3'UTR包含SEQ IDNO:85的序列,或与SEQ ID NO:85或其片段(例如,缺少SEQ ID NO:85的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
340.如实施方案285-315中任一项所述的多核苷酸,其中所述3'UTR包含SEQ IDNO:86的序列,或与SEQ ID NO:86或其片段(例如,缺少SEQ ID NO:86的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
341.如实施方案285-315中任一项所述的多核苷酸,其中所述3'UTR包含SEQ IDNO:87的序列,或与SEQ ID NO:87或其片段(例如,缺少SEQ ID NO:87的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
342.如实施方案285-315中任一项所述的多核苷酸,其中所述3'UTR包含SEQ IDNO:94的序列,或与SEQ ID NO:94或其片段(例如,缺少SEQ ID NO:94的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
343.如实施方案285-315中任一项所述的多核苷酸,其中所述3'UTR包含SEQ IDNO:95的序列,或与SEQ ID NO:95或其片段(例如,缺少SEQ ID NO:95的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
344.如实施方案285-315中任一项所述的多核苷酸,其中所述3'UTR包含微RNA结合位点,例如,如本文所描述;和/或TENT募集序列,例如,如本文所描述。
345.如实施方案344所述的多核苷酸,其中所述miRNA结合位点包含SEQ ID NO:38-40中的任一者的序列;或其中所述TENT募集序列包含SEQ ID NO:91或92的序列。
346.一种编码多肽的多核苷酸,其中所述多核苷酸包含:
(a)5'-UTR(例如,如本文所描述);
(b)编码区,所述编码区包含终止元件(例如,如本文所描述);以及
(c)3'UTR,所述3'UTR包含与SEQ ID NO:11或其变体或片段具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的核心序列。
347.如实施方案346所述的多核苷酸,其中所述3'UTR核心序列位于紧邻(b)的所述终止元件的下游。
348.如实施方案347所述的多核苷酸,其中所述3'UTR核心序列位于所述多核苷酸的C末端。
349.如实施方案346-348中任一项所述的多核苷酸,其中所述包含核心序列的3'UTR包含第一侧翼序列。
350.如实施方案346-349中任一项所述的多核苷酸,其中所述包含核心序列的3'UTR包含第二侧翼序列。
351.如实施方案349或350所述的多核苷酸,其中所述包含核心序列的3'UTR包含第一侧翼序列和第二侧翼序列。
352.如实施方案349-351中任一项所述的多核苷酸,其中所述第一侧翼序列包含约5-25、约5-20、约5-15、约5-10、约10-25、约15-25、约20-25个核苷酸的序列。
353.如实施方案349-351中任一项所述的多核苷酸,其中所述第一侧翼序列包含约5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24或25个核苷酸,例如11个核苷酸的序列。
354.如实施方案349-351中任一项所述的多核苷酸,其中所述第二侧翼序列包含约20-80、约20-75、约20-70、约20-65、约20-60、约20-55、约20-50、约20-45、约20-40、约20-35、约20-30、约20-25、约25-80、约30-80、约35-80、约40-80、约45-80、约50-80、约55-80、约60-80、约65-80、约70-80或约75-80个核苷酸的序列。
355.如实施方案349-351中任一项所述的多核苷酸,其中所述第二侧翼序列包含约20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、55、60、65、70、75或80个核苷酸,例如39个核苷酸的序列。
356.如实施方案349-351中任一项所述的多核苷酸,其中所述第一侧翼序列处于所述核心序列的上游。
357.如实施方案349-351中任一项所述的多核苷酸,其中所述第一侧翼序列处于所述核心序列的下游。
358.如实施方案349-351中任一项所述的多核苷酸,其中所述第二侧翼序列处于所述核心序列的上游。
359.如实施方案349-351中任一项所述的多核苷酸,其中所述第二侧翼序列处于所述核心序列的下游。
360.如实施方案346-359中任一项所述的多核苷酸,其中所述3'UTR包含SEQ IDNO:11的片段,例如,SEQ ID NO:11的5个核苷酸(nt)、10nt、15nt、20nt、25nt、30nt、35nt、40nt、45nt、50nt、55nt、60nt、65nt或70nt片段。
361.如实施方案346-360中任一项所述的多核苷酸,其中所述3'UTR包含15-25nt片段,所述片段构成SEQ ID NO:11的60nt片段。
362.如实施方案346-361中任一项所述的多核苷酸,其中所述3'UTR包含SEQ IDNO:45的序列。
363.如实施方案346-361中任一项所述的多核苷酸,其中所述3'UTR包含SEQ IDNO:11的序列。
364.如实施方案346-363中任一项所述的多核苷酸,其中所述3'UTR使得所述多核苷酸的半衰期增加,例如,所述多核苷酸的半衰期增加约1.5-10倍,例如,如通过测量多核苷酸的半衰期的测定,例如本文所公开的实施例中的任一者的测定所测量。
365.如实施方案364所述的多核苷酸,其中所述3'UTR产生平均半衰期评分大于10的多核苷酸。
366.如实施方案346-365中任一项所述的多核苷酸,其中将所述多核苷酸的半衰期的增加与不具有3'UTR、具有不同3'UTR或不具有实施方案346-244中任一项所述的3'UTR的在其它方面类似的多核苷酸进行比较。
367.如实施方案346-363中任一项所述的多核苷酸,其中所述3'UTR使得由所述多核苷酸编码的所述多肽的水平和/或活性,例如输出增加。
368.如实施方案248所述的多核苷酸,其中将由所述多核苷酸编码的所述多肽的水平和/或活性,例如输出的增加与不具有3'UTR、具有不同3'UTR或不具有实施方案346-363中任一项所述的3'UTR的在其它方面类似的多核苷酸进行比较。
369.如实施方案346-368中任一项所述的多核苷酸,其中所述3'UTR包含微RNA(miRNA)结合位点,例如,如本文所描述;和/或TENT募集序列,例如,如本文所描述。
370.如实施方案369所述的多核苷酸,其中所述3'UTR包含SEQ ID NO:38、SEQ IDNO:39、SEQ ID NO:40或它们的组合的miRNA结合位点;和/或其中所述TENT募集序列包含SEQ ID NO:91或92的序列。
371.如实施方案369或370所述的多核苷酸,其中所述3'UTR包含多个miRNA结合位点,例如,2、3、4、5、6、7或8个miRNA结合位点。
372.如实施方案371所述的多核苷酸,其中所述多个miRNA结合位点包含相同或不同miRNA结合位点。
373.如实施方案346-372中任一项所述的多核苷酸,其中(a)的所述5'UTR包含表1中所提供的5'UTR序列或与表1中所提供的5'UTR序列或其片段(例如,缺少表1中所提供的5'UTR序列的初始一个、两个、三个、四个、五个或六个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
374.如实施方案373所述的多核苷酸,其中所述5'UTR包含与SEQ ID NO:1、SEQ IDNO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:41、SEQ ID NO:42、SEQ ID NO:63、SEQ ID NO:64、SEQ ID NO:65、SEQ ID NO:66、SEQ IDNO:67、SEQ ID NO:68、SEQ ID NO:69、SEQ ID NO:70、SEQ ID NO:71、SEQ ID NO:72、SEQ IDNO:73、SEQ ID NO:74、SEQ ID NO:75、SEQ ID NO:76、SEQ ID NO:77、SEQ ID NO:78、SEQ IDNO:88、SEQ ID NO:89或SEQ ID NO:90或其片段(例如,缺少前述序列中的任一者的初始一个、两个、三个、四个、五个或六个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
375.如实施方案373所述的多核苷酸,其中所述5'UTR包含与SEQ ID NO:1或其片段(例如,缺少SEQ ID NO:2的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
376.如实施方案373所述的多核苷酸,其中所述5'UTR包含与SEQ ID NO:2或其片段(例如,缺少SEQ ID NO:2的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
377.如实施方案373所述的多核苷酸,其中所述5'UTR包含与SEQ ID NO:3或其片段(例如,缺少SEQ ID NO:3的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
378.如实施方案373所述的多核苷酸,其中所述5'UTR包含与SEQ ID NO:4或其片段(例如,缺少SEQ ID NO:4的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
379.如实施方案373所述的多核苷酸,其中所述5'UTR包含与SEQ ID NO:5或其片段(例如,缺少SEQ ID NO:5的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
380.如实施方案373所述的多核苷酸,其中所述5'UTR包含与SEQ ID NO:6或其片段(例如,缺少SEQ ID NO:6的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
381.如实施方案373所述的多核苷酸,其中所述5'UTR包含与SEQ ID NO:8或其片段(例如,缺少SEQ ID NO:8的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
382.如实施方案373所述的多核苷酸,其中所述5'UTR包含与SEQ ID NO:41或其片段(例如,缺少SEQ ID NO:41的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
383.如实施方案373所述的多核苷酸,其中所述5'UTR包含与SEQ ID NO:42或其片段(例如,缺少SEQ ID NO:42的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
384.如实施方案373所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:63或其片段(例如,缺少SEQ ID NO:63的初始一个、两个、三个、四个、五个或六个核苷酸的片段)的序列。
385.如实施方案373所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:64或其片段(例如,缺少SEQ ID NO:64的初始一个、两个、三个、四个、五个或六个核苷酸的片段)的序列。
386.如实施方案373所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:65或其片段(例如,缺少SEQ ID NO:65的初始一个、两个、三个、四个、五个或六个核苷酸的片段)的序列。
387.如实施方案373所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:66或其片段(例如,缺少SEQ ID NO:66的初始一个、两个、三个、四个、五个或六个核苷酸的片段)的序列。
388.如实施方案373所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:67或其片段(例如,缺少SEQ ID NO:67的初始一个、两个、三个、四个、五个或六个核苷酸的片段)的序列。
389.如实施方案373所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:68或其片段(例如,缺少SEQ ID NO:68的初始一个、两个、三个、四个、五个或六个核苷酸的片段)的序列。
390.如实施方案373所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:69或其片段(例如,缺少SEQ ID NO:69的初始一个、两个、三个、四个、五个或六个核苷酸的片段)的序列。
391.如实施方案373所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:70或其片段(例如,缺少SEQ ID NO:70的初始一个、两个、三个、四个、五个或六个核苷酸的片段)的序列。
392.如实施方案373所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:70或其片段(例如,缺少SEQ ID NO:70的初始一个、两个、三个、四个、五个或六个核苷酸的片段)的序列。
393.如实施方案373所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:71或其片段(例如,缺少SEQ ID NO:71的初始一个、两个、三个、四个、五个或六个核苷酸的片段)的序列。
394.如实施方案373所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:72或其片段(例如,缺少SEQ ID NO:72的初始一个、两个、三个、四个、五个或六个核苷酸的片段)的序列。
395.如实施方案373所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:73或其片段(例如,缺少SEQ ID NO:73的初始一个、两个、三个、四个、五个或六个核苷酸的片段)的序列。
396.如实施方案373所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:74或其片段(例如,缺少SEQ ID NO:74的初始一个、两个、三个、四个、五个或六个核苷酸的片段)的序列。
397.如实施方案373所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:75或其片段(例如,缺少SEQ ID NO:75的初始一个、两个、三个、四个、五个或六个核苷酸的片段)的序列。
398.如实施方案373所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:76或其片段(例如,缺少SEQ ID NO:76的初始一个、两个、三个、四个、五个或六个核苷酸的片段)的序列。
399.如实施方案373所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:77或其片段(例如,缺少SEQ ID NO:77的初始一个、两个、三个、四个、五个或六个核苷酸的片段)的序列。
400.如实施方案373所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:78或其片段(例如,缺少SEQ ID NO:78的初始一个、两个、三个、四个、五个或六个核苷酸的片段)的序列。
401.如实施方案373所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:88或其片段(例如,缺少SEQ ID NO:88的初始一个、两个、三个、四个、五个或六个核苷酸的片段)的序列。
402.如实施方案373所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:89或其片段(例如,缺少SEQ ID NO:89的初始一个、两个、三个、四个、五个或六个核苷酸的片段)的序列。
403.如实施方案373所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:90或其片段(例如,缺少SEQ ID NO:90的初始一个、两个、三个、四个、五个或六个核苷酸的片段)的序列。
404.如实施方案346-372中任一项所述的多核苷酸,其中(b)的所述终止元件包含表3中所提供的终止元件序列。
405.如实施方案404所述的多核苷酸,其中(b)的所述编码区包含选自表3中所提供的终止元件的终止元件,例如,SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32、SEQ ID NO:33、SEQ ID NO:34、SEQ IDNO:35、SEQ ID NO:36、SEQ ID NO;62、SEQ ID NO:93或SEQ ID NO:96。
406.如实施方案404所述的多核苷酸,其中所述终止元件包含SEQ ID NO:26的序列。
407.如实施方案404所述的多核苷酸,其中所述终止元件包含SEQ ID NO:27的序列。
408.如实施方案404所述的多核苷酸,其中所述终止元件包含SEQ ID NO:28的序列。
409.如实施方案404所述的多核苷酸,其中所述终止元件包含SEQ ID NO:29的序列。
410.如实施方案404所述的多核苷酸,其中所述终止元件包含SEQ ID NO:30的序列。
411.如实施方案404所述的多核苷酸,其中所述终止元件包含SEQ ID NO:31的序列。
412.如实施方案404所述的多核苷酸,其中所述终止元件包含SEQ ID NO:32的序列。
413.如实施方案404所述的多核苷酸,其中所述终止元件包含SEQ ID NO:33的序列。
414.如实施方案404所述的多核苷酸,其中所述终止元件包含SEQ ID NO:34的序列。
415.如实施方案404所述的多核苷酸,其中所述终止元件包含SEQ ID NO:35的序列。
416.如实施方案404所述的多核苷酸,其中所述终止元件包含SEQ ID NO:36的序列。
417.如实施方案404所述的多核苷酸,其中所述终止元件包含SEQ ID NO:62的序列。
418.如实施方案404所述的多核苷酸,其中所述终止元件包含SEQ ID NO:93的序列。
419.如实施方案404所述的多核苷酸,其中所述终止元件包含SEQ ID NO:96的序列。
420.如实施方案404所述的多核苷酸,其中(b)的所述编码区包含终止元件,所述终止元件包含SEQ ID NO:37的共有序列。
421.如实施方案346-372中任一项所述的多核苷酸,其中:
(i)(a)的所述5'UTR包含表1中所提供的5'UTR序列或与表1中所提供的5'UTR序列或其片段(例如,缺少表1中所提供的5'UTR序列的初始一个、两个、三个、四个、五个或六个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列;以及
(ii)(b)的所述终止元件包含表3中所提供的终止元件。
422.如实施方案421所述的多核苷酸,其中所述5'UTR包含与SEQ ID NO:1、SEQ IDNO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:41、SEQ ID NO:42、SEQ ID NO:63、SEQ ID NO:64、SEQ ID NO:65、SEQ ID NO:66、SEQ IDNO:67、SEQ ID NO:68、SEQ ID NO:69、SEQ ID NO:70、SEQ ID NO:71、SEQ ID NO:72、SEQ IDNO:73、SEQ ID NO:74、SEQ ID NO:75、SEQ ID NO:76、SEQ ID NO:77、SEQ ID NO:78、SEQ IDNO:88、SEQ ID NO:89或SEQ ID NO:90或其片段(例如,缺少前述序列中的任一者的初始一个、两个、三个、四个、五个或六个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
423.如实施方案421所述的多核苷酸,其中所述5'UTR包含与SEQ ID NO:1或其片段(例如,缺少SEQ ID NO:2的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
424.如实施方案421所述的多核苷酸,其中所述5'UTR包含与SEQ ID NO:2或其片段(例如,缺少SEQ ID NO:2的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
425.如实施方案421所述的多核苷酸,其中所述5'UTR包含与SEQ ID NO:3或其片段(例如,缺少SEQ ID NO:3的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
426.如实施方案421所述的多核苷酸,其中所述5'UTR包含与SEQ ID NO:4或其片段(例如,缺少SEQ ID NO:4的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
427.如实施方案421所述的多核苷酸,其中所述5'UTR包含与SEQ ID NO:5或其片段(例如,缺少SEQ ID NO:5的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
428.如实施方案421所述的多核苷酸,其中所述5'UTR包含与SEQ ID NO:6或其片段(例如,缺少SEQ ID NO:6的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
429.如实施方案421所述的多核苷酸,其中所述5'UTR包含与SEQ ID NO:8或其片段(例如,缺少SEQ ID NO:8的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
430.如实施方案421所述的多核苷酸,其中所述5'UTR包含与SEQ ID NO:41或其片段(例如,缺少SEQ ID NO:41的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
431.如实施方案421所述的多核苷酸,其中所述5'UTR包含与SEQ ID NO:42或其片段(例如,缺少SEQ ID NO:42的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
432.如实施方案421所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:63或其片段(例如,缺少SEQ ID NO:63的初始一个、两个、三个、四个、五个或六个核苷酸的片段)的序列。
433.如实施方案421所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:64或其片段(例如,缺少SEQ ID NO:64的初始一个、两个、三个、四个、五个或六个核苷酸的片段)的序列。
434.如实施方案421所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:65或其片段(例如,缺少SEQ ID NO:65的初始一个、两个、三个、四个、五个或六个核苷酸的片段)的序列。
435.如实施方案421所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:66或其片段(例如,缺少SEQ ID NO:66的初始一个、两个、三个、四个、五个或六个核苷酸的片段)的序列。
436.如实施方案421所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:67或其片段(例如,缺少SEQ ID NO:67的初始一个、两个、三个、四个、五个或六个核苷酸的片段)的序列。
437.如实施方案421所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:68或其片段(例如,缺少SEQ ID NO:68的初始一个、两个、三个、四个、五个或六个核苷酸的片段)的序列。
438.如实施方案421所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:69或其片段(例如,缺少SEQ ID NO:69的初始一个、两个、三个、四个、五个或六个核苷酸的片段)的序列。
439.如实施方案421所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:70或其片段(例如,缺少SEQ ID NO:70的初始一个、两个、三个、四个、五个或六个核苷酸的片段)的序列。
440.如实施方案421所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:70或其片段(例如,缺少SEQ ID NO:70的初始一个、两个、三个、四个、五个或六个核苷酸的片段)的序列。
441.如实施方案421所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:71或其片段(例如,缺少SEQ ID NO:71的初始一个、两个、三个、四个、五个或六个核苷酸的片段)的序列。
442.如实施方案421所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:72或其片段(例如,缺少SEQ ID NO:72的初始一个、两个、三个、四个、五个或六个核苷酸的片段)的序列。
443.如实施方案421所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:73或其片段(例如,缺少SEQ ID NO:73的初始一个、两个、三个、四个、五个或六个核苷酸的片段)的序列。
444.如实施方案421所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:74或其片段(例如,缺少SEQ ID NO:74的初始一个、两个、三个、四个、五个或六个核苷酸的片段)的序列。
445.如实施方案421所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:75或其片段(例如,缺少SEQ ID NO:75的初始一个、两个、三个、四个、五个或六个核苷酸的片段)的序列。
446.如实施方案421所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:76或其片段(例如,缺少SEQ ID NO:76的初始一个、两个、三个、四个、五个或六个核苷酸的片段)的序列。
447.如实施方案421所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:77或其片段(例如,缺少SEQ ID NO:77的初始一个、两个、三个、四个、五个或六个核苷酸的片段)的序列。
448.如实施方案421所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:78或其片段(例如,缺少SEQ ID NO:78的初始一个、两个、三个、四个、五个或六个核苷酸的片段)的序列。
449.如实施方案421所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:88或其片段(例如,缺少SEQ ID NO:88的初始一个、两个、三个、四个、五个或六个核苷酸的片段)的序列。
450.如实施方案421所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:89或其片段(例如,缺少SEQ ID NO:89的初始一个、两个、三个、四个、五个或六个核苷酸的片段)的序列。
451.如实施方案421所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:90或其片段(例如,缺少SEQ ID NO:90的初始一个、两个、三个、四个、五个或六个核苷酸的片段)的序列。
452.如实施方案421-451中任一项所述的多核苷酸,其中(b)的所述编码区包含选自表3中所提供的终止元件的终止元件,例如,SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32、SEQ ID NO:33、SEQ IDNO:34、SEQ ID NO:35、SEQ ID NO:36、SEQ ID NO:37、SEQ ID NO:56、SEQ ID NO:57、SEQ IDNO:62、SEQ ID NO:93或SEQ ID NO:96。
453.如实施方案452所述的多核苷酸,其中所述终止元件包含SEQ ID NO:26的序列。
454.如实施方案452所述的多核苷酸,其中所述终止元件包含SEQ ID NO:27的序列。
455.如实施方案452所述的多核苷酸,其中所述终止元件包含SEQ ID NO:28的序列。
456.如实施方案452所述的多核苷酸,其中所述终止元件包含SEQ ID NO:29的序列。
457.如实施方案452所述的多核苷酸,其中所述终止元件包含SEQ ID NO:30的序列。
458.如实施方案452所述的多核苷酸,其中所述终止元件包含SEQ ID NO:31的序列。
459.如实施方案452所述的多核苷酸,其中所述终止元件包含SEQ ID NO:32的序列。
460.如实施方案452所述的多核苷酸,其中所述终止元件包含SEQ ID NO:33的序列。
461.如实施方案452所述的多核苷酸,其中所述终止元件包含SEQ ID NO:34的序列。
462.如实施方案452所述的多核苷酸,其中所述终止元件包含SEQ ID NO:35的序列。
463.如实施方案452所述的多核苷酸,其中所述终止元件包含SEQ ID NO:36的序列。
464.如实施方案452所述的多核苷酸,其中所述终止元件包含SEQ ID NO:62的序列。
465.如实施方案452所述的多核苷酸,其中所述终止元件包含SEQ ID NO:93的序列。
466.如实施方案452所述的多核苷酸,其中所述终止元件包含SEQ ID NO:96的序列。
467.如实施方案452所述的多核苷酸,其中(b)的所述编码区包含终止元件,所述终止元件包含SEQ ID NO:37、SEQ ID NO:56或SEQ ID NO:57的共有序列。
468.如前述实施方案中任一项所述的多核苷酸,其中所述多核苷酸的所述编码区包含编码治疗性有效载荷或预防性有效载荷的序列。
469.如实施方案468所述的多核苷酸,其中所述治疗性有效载荷或预防性有效载荷包含分泌蛋白、膜结合蛋白或细胞间蛋白。
470.如实施方案469所述的多核苷酸,其中所述治疗性有效载荷或预防性有效载荷选自细胞因子、抗体、疫苗(例如,抗原、免疫原性表位)、受体、酶、激素、转录因子、配体、膜转运体、结构蛋白、核酸酶或其组分、变体或片段(例如,生物活性片段)。
471.如实施方案469所述的多核苷酸,其中所述治疗性有效载荷或预防性有效载荷包含细胞因子或其变体或片段(例如,生物活性片段)。
472.如实施方案469所述的多核苷酸,其中所述治疗性有效载荷或预防性有效载荷包含抗体或其变体或片段(例如,生物活性片段)。
473.如实施方案469所述的多核苷酸,其中所述治疗性有效载荷或预防性有效载荷包含疫苗(例如,抗原、免疫原性表位)或其组分、变体或片段(例如,生物活性片段)。
474.如实施方案468-473中任一项所述的多核苷酸,其中所述治疗性有效载荷或预防性有效载荷包含蛋白质或肽。
475.如前述实施方案中任一项所述的多核苷酸,其中包含SEQ ID NO:1的5'UTR、包含SEQ ID NO:28的终止元件的编码区和SEQ ID NO:11的3'UTR的多核苷酸使得由所述多核苷酸编码的所述多肽的水平和/或活性增加。
476.如实施方案475所述的多核苷酸,其中所述多肽的水平和/或活性增加约1.2-10倍。
477.如实施方案475或476所述的多核苷酸,其中通过测量多肽活性的测定,例如实施例18的测定来测量所述多肽的水平和/或活性的增加。
478.如实施方案1-474中任一项所述的多核苷酸,其中包含SEQ ID NO:1、SEQ IDNO:41或SEQ ID NO:42的5'UTR和包含反向胸苷(idT)的3'稳定区的多核苷酸使得由所述多核苷酸编码的多肽的水平和/或活性,例如表达增加。
479.如实施方案478所述的多核苷酸,其中所述多肽的表达增加约1.2-10倍,例如,如通过测量多肽表达的测定所测量,例如免疫印迹、ELISA或流式细胞术,例如本文所公开的实施例中的任一者中所描述的测定。
480.如实施方案478所述的多核苷酸,其中所述多肽的活性增加约1.2-10倍,例如,如通过测量多肽活性的测定所测量,例如追踪代谢物形成的动力学的测定。
481.如实施方案479或480所述的多核苷酸,其中将所述多肽的水平和/或活性的增加与由不具有本文所描述的5'UTR、3'UTR、终止元件和/或3'稳定区的多核苷酸编码的在其它方面类似的多肽进行比较。
482.如前述实施方案中任一项所述的多核苷酸,所述多核苷酸还包含至少一个5'帽结构,例如,如本文所描述。
483.如实施方案482所述的多核苷酸,其中所述5'帽结构包含序列GG,其中带下划线的斜体G是反向G核苷酸,继之以5'-5'-三磷酸基团。
484.如实施方案483所述的多核苷酸,其中所述5'帽结构包含序列GA,其中带下划线的斜体G是反向G核苷酸,继之以5'-5'-三磷酸基团。
485.如实施方案483所述的多核苷酸,其中所述5'帽结构包含序列GGA,其中带下划线的斜体G是反向G核苷酸,继之以5'-5'-三磷酸基团。
486.如前述实施方案中任一项所述的多核苷酸,所述多核苷酸还包含3'稳定区,例如稳定的尾,例如,如本文所描述。
487.如实施方案486所述的多核苷酸,其中所述3'稳定区包含多聚A尾,例如,包含80-150个,例如120个腺嘌呤的多聚A尾(SEQ ID NO:123),任选地其中所述多聚A尾包含一个或多个非腺苷残基,例如一个或多个鸟苷。
488.如实施方案486或487所述的多核苷酸,其中所述多聚A尾包含UCUAG序列(SEQID NO:44)。
489.如实施方案488所述的多核苷酸,其中所述多聚A尾在SEQ ID NO:44的上游包含约80-120个,例如100个腺嘌呤。
490.如实施方案488或489所述的多核苷酸,其中所述多聚A尾在SEQ ID NO:44的下游包含约1-40个,例如20个腺嘌呤。
491.如实施方案486-490中任一项所述的多核苷酸,其中所述3'稳定区包含至少一个替代性核苷。
492.如实施方案491所述的多核苷酸,其中所述替代性核苷是反向胸苷(idT)。
493.如实施方案491或492所述的多核苷酸,其中替代性核苷位于所述3'稳定区的3'端。
494.如实施方案486-493中任一项所述的多核苷酸,其中所述3'稳定区包含式VII的结构:
Figure BDA0004090383130001031
或其盐,其中每个X独立地是O或S,并且A代表腺嘌呤并且T代表胸腺嘧啶。
495.如前述实施方案中任一项所述的多核苷酸,其中所述多核苷酸包含mRNA。
496.如实施方案495所述的多核苷酸,其中所述mRNA包含至少一个化学修饰。
497.如实施方案495或496所述的多核苷酸,其中所述化学修饰选自由以下组成的组:假尿苷、N1-甲基假尿苷、2-硫代尿苷、4'-硫代尿苷、5-甲基胞嘧啶、2-硫代-1-甲基-1-脱氮-假尿苷、2-硫代-1-甲基-假尿苷、2-硫代-5-氮杂-尿苷、2-硫代-二氢假尿苷、2-硫代-二氢尿苷、2-硫代-假尿苷、4-甲氧基-2-硫代-假尿苷、4-甲氧基-假尿苷、4-硫代-1-甲基-假尿苷、4-硫代-假尿苷、5-氮杂-尿苷、二氢假尿苷、5-甲基尿苷、5-甲基尿苷、5-甲氧基尿苷和2'-O-甲基尿苷。
498.如实施方案497所述的多核苷酸,其中所述化学修饰选自由假尿苷、N1-甲基假尿苷、5-甲基胞嘧啶、5-甲氧基尿苷和它们的组合组成的组。
499.如实施方案497所述的多核苷酸,其中所述化学修饰是N1-甲基假尿苷。
500.如实施方案497所述的多核苷酸,其中所述mRNA包含完全修饰的N1-甲基假尿苷。
501.一种脂质纳米颗粒(LNP)组合物,所述脂质纳米颗粒组合物包含前述实施方案中任一项所述的多核苷酸。
502.一种药物组合物,所述药物组合物包含实施方案501所述的LNP组合物。
503.一种细胞,其包含实施方案501或502所述的LNP组合物。
504.如实施方案503所述的细胞,其已与所述LNP组合物接触。
505.如实施方案503或504所述的细胞,其维持于足以允许所述多核苷酸或由所述多核苷酸编码的多肽表达的条件下。
506.一种增加细胞中有效载荷,例如治疗性有效载荷或预防性有效载荷的表达的方法,所述方法包括向所述细胞施用实施方案501或502所述的LNP组合物。
507.一种将实施方案501或502所述的LNP组合物递送至细胞的方法。
508.如实施方案507所述的方法,所述方法包括使所述细胞在体外、体内或离体与所述LNP组合物接触。
509.一种将实施方案501或502所述的LNP组合物递送至患有例如本文所描述的疾病或病症的受试者的方法。
510.一种调节受试者的免疫反应的方法,所述方法包括向有需要的所述受试者施用有效量的实施方案501或502所述的LNP组合物。
511.一种治疗、预防疾病或病症或预防疾病或病症的症状的方法,所述方法包括向有需要的受试者施用有效量的实施方案501或502所述的LNP组合物。
512.如实施方案501-511中任一项所述的方法或LNP组合物,其中所述LNP组合物包含:(i)可电离脂质,例如,氨基脂质;(ii)固醇或其它结构脂质;(iii)非阳离子辅助脂质或磷脂;以及(iv)PEG-脂质,例如,如本文所描述。
513.如实施方案512所述的方法或LNP组合物,其中所述可电离脂质包含氨基脂质。
514.如实施方案512或513所述的方法或LNP组合物,其中所述可电离脂质包含本文所描述的式中的任一者的化合物,例如,式(I)、(IA)、(IB)、(IC)、(II)、(IIa)、(IIb)、(IIc)、(IId)、(IIe)、(IIf)、(IIg)、(III)、(IIIa1)、(IIIa2)、(IIIa3)、(IIIa4)、(IIIa5)、(IIIa6)、(IIIa7)或(IIIa8)。
515.如实施方案512-514中任一项所述的方法或LNP组合物,其中所述可电离脂质包含式(I)化合物。
516.如实施方案512-514中任一项所述的方法或LNP组合物,其中所述可电离脂质包含式(IC)化合物。
517.如实施方案512-514中任一项所述的方法或LNP组合物,其中所述可电离脂质包含式(IIa)化合物。
518.如实施方案512-514中任一项所述的方法或LNP组合物,其中所述可电离脂质包含式(IIe)化合物。
519.如实施方案512-518中任一项所述的方法或LNP组合物,其中所述非阳离子辅助脂质或磷脂包含选自由DSPC、DPPC或DOPC组成的组的化合物。
520.如实施方案512-519中任一项所述的方法或LNP组合物,其中所述磷脂是DSPC,例如DSPC的变体,例如式(IV)化合物。
521.如实施方案512-519中任一项所述的方法或LNP组合物,其中所述结构脂质选自α-生育酚、β-谷固醇或胆固醇。
522.如实施方案512-520中任一项所述的方法或LNP组合物,其中所述结构脂质是α-生育酚。
523.如实施方案512-520中任一项所述的方法或LNP组合物,其中所述结构脂质是β-谷固醇。
524.如实施方案512-521中任一项所述的方法或LNP组合物,其中所述结构脂质是胆固醇。
525.如实施方案512-524中任一项所述的方法或LNP组合物,其中所述PEG脂质选自由PEG修饰的磷脂酰乙醇胺、PEG修饰的磷脂酸、PEG修饰的神经酰胺、PEG修饰的二烷基胺、PEG修饰的二酰基甘油、PEG修饰的二烷基甘油和它们的混合物组成的组。
526.如实施方案512-525中任一项所述的方法或LNP组合物,其中所述PEG脂质选自由PEG-c-DOMG、PEG-DMG、PEG-DLPE、PEG-DMPE、PEG-DPPC和PEG-DSPE脂质组成的组。
527.如实施方案512-525中任一项所述的方法或LNP组合物,其中所述PEG-脂质是PEG-DMG。
528.如实施方案512-525中任一项所述的方法或LNP组合物,其中所述PEG脂质是选自以下的化合物:式(V)、式(VI-A)、式(VI-B)、式(VI-C)或式(VI-D)。
529.如实施方案512-525或528中任一项所述的方法或LNP组合物,其中所述PEG-脂质是式(VI-A)化合物。
530.如实施方案512-525或528中任一项所述的方法或LNP组合物,其中所述PEG-脂质是式(VI-B)化合物。
531.如实施方案512-530中任一项所述的方法或LNP组合物,其中所述LNP包含摩尔比为约20-60%的可电离脂质:5-25%的磷脂:25-55%的胆固醇;和0.5-15%的PEG脂质。
532.如实施方案512-531中任一项所述的方法或LNP组合物,其中所述LNP包含摩尔比为约50%的可电离脂质:约10%的磷脂:约38.5%的胆固醇;和约1.5%的PEG脂质。
533.如实施方案512-532中任一项所述的方法或LNP组合物,其中所述LNP包含摩尔比为约49.83%的可电离脂质:约9.83%的磷脂:约30.33%的胆固醇;和约2.0%的PEG脂质。
534.如实施方案501-533中任一项所述的方法或LNP组合物,其中所述LNP或系统被配制成用于静脉内、皮下、肌肉内、鼻内、眼内、经直肠、经肺或经口递送。
535.如实施方案501-534中任一项所述的方法或LNP组合物,其中所述受试者是哺乳动物,例如,人类。
536.如实施方案501-535中任一项所述的方法或LNP组合物,其中所述受试者患有本文所公开的疾病或病症。
附图说明
图1是显示来自由具有A11参考5'UTR或A1 5'UTR的mRNA构建体编码的GFP蛋白的GFP荧光的图。
图2A-2C描绘了施用LNP配制的ffLuc mRNA的小鼠体内的ffLuc活性。mRNA构建体具有A11参考5'UTR或A1 5'UTR。图2A显示了施用后6小时的总通量。图2B显示了施用后48小时的总通量。图2C显示了在两个时间点观察到的组合ffLuc活性。
图3A-3B是描绘施用LNP配制的具有指定5'UTR的靶mRNA的大鼠中的靶蛋白表达的图。图3A显示了在指定时间点的靶蛋白表达。图3B显示了通过曲线下面积(AUC)测量的总靶蛋白表达。
图4A-4C是描绘接种有来自大鼠(图4A)、恒河猴(图4B)或人类原代肝细胞(图4C)的肝细胞的HepatoPac中的中值靶蛋白表达的图。
图5A-5D是显示来自人类PBMC的B细胞或T细胞中的靶蛋白的表达的图。使人类PBMC与LNP配制的编码靶蛋白的mRNA接触。mRNA构建体具有A11参考5'UTR或A1 5'UTR。图5A-5B显示了T细胞中的靶蛋白表达。图5C-5D显示了B细胞中的靶蛋白表达。
图6是显示与罕见疾病相关的靶蛋白的表达的图。用编码靶蛋白的mRNA构建体转染Hep3B细胞。使用包含两种型式(v1、v2)的ORF序列的mRNA构建体。mRNA构建体具有A1 5'UTR或A11参考5'UTR。
图7是显示来自具有修饰的A1 5'UTR序列(A3)的构建体或具有参考A11 5'UTR的构建体的体内蛋白质表达的图。
图8显示了用于mRNA半衰期延长的体外高通量3'UTR筛选的输出。左图显示了在评估的时程中3'UTR序列的相对丰度的变化。数据点代表所有ORF和细胞类型的平均值和标准差。在所有评估的序列中,B1序列具有最高半衰期评分。右图显示了半衰期评分的直方图。突出的左侧尾部指示有更多的3'UTR序列使延长的半衰期缩短。蓝色和橙色记号代表B10参考3'UTR和B1 3'UTR。
图9显示了3'UTR分段(bakeoff)的轮廓以及所用的ORF和细胞类型。图9A公开了“KDEL”作为SEQ ID NO:130。
图10A-10C显示了3'UTR分段的结果。图10A是显示推断的mRNA半衰期与编码带有不同3'UTR的绿色荧光蛋白的胞质mRNA的总体表达之间的关系的图;红色点使用源自用于半衰期延长的高通量3'UTR筛选的3'UTR。所有值都针对板内v1.1 3'UTR对照归一化。图10B显示了与图10A中类似的数据,但将推断的翻译效率与AUC表达进行比较。图10C是显示来自编码带有B10参考3'UTR或B13'UTR的绿色荧光蛋白的mRNA的IncuCyte表达实验的数据的图。
图11A-11F显示了具有不同终止元件的mRNA的mRNA半衰期。图11A显示了带有不同终止密码子加上上下文的2个下游核苷酸的mRNA的中值天然mRNA半衰期的分布。每个点代表不同的5nt序列(例如UAAGC,其中终止密码子本身带下划线)。图11B显示了具有不同终止密码子盒的mRNA的中值mRNA半衰期的实例。图11C显示了来自编码红色荧光蛋白的mRNA的IncuCyte表达实验的数据,所述数据将带有具有C1终止元件(见黑线)的B10参考3'UTR的mRNA与具有C4终止元件(SEQ ID NO:29,UAAAGCUAA;见红线)的mRNA进行比较。注意图例和表格中的密码子是基于DNA命名法并且使用“T”而不是“U”。图11D显示了在相对于UAA终止密码子的几个位置处含有每个潜在核苷酸的mRNA在HeLa细胞中的中值天然mRNA半衰期。这种分析方法用于产生表3中的终止元件C7和C6。图11D公开了SEQ ID NO:129。图11E显示了与图11D中类似,但对于UAG终止密码子的数据。图11F显示了与图11D中类似,但对于UGA终止密码子的数据。
图12显示了Hep G2细胞中与罕见疾病相关的靶蛋白的表达。靶蛋白由具有以下不同终止元件的mRNA构建体编码:C5、C4、C11、C3,或参考终止元件(C1)。用免疫印迹评价靶蛋白表达并且随时间作图。
图13是显示由在3'UTR中具有各种终止元件的mRNA构建体编码的靶蛋白的表达的图。所用的mRNA构建体包含以下3'UTR和终止元件序列:SEQ ID NO:25(B16对照)、SEQ IDNO:59(具有C10终止元件的3'UTR)、SEQ ID NO:60(具有C7终止元件的3'UTR)和SEQ ID NO:61(具有C8终止元件的3'UTR)。
图14A-14B显示了由具有图中的指定mRNA元件的mRNA构建体编码的免疫检查点蛋白的体内表达。图14A显示了静脉内注射0.5mg/kg LNP配制的编码免疫检查点蛋白的mRNA的小鼠的脾脏中的免疫检查点蛋白的水平。图14B显示了静脉内注射0.5mg/kg LNP配制的编码免疫检查点蛋白的mRNA的小鼠的肝脏中的免疫检查点蛋白的水平。
图15显示了来自施用0.5mg/kg LNP配制的编码免疫检查点蛋白并具有指定mRNA元件的mRNA的小鼠的CD11c+MHCII+细胞中的%免疫检查点蛋白+细胞。
图16A-16C是描绘由具有A1 5'UTR(连同包含序列GA的帽)、B1 3'UTR或两者的mRNA构建体编码的荧光素酶或靶蛋白表达的图。图16A显示了脾脏中的表达并且图16B显示了肝脏中的表达。图16C显示了血清中的靶蛋白表达。
图17描述了人类支气管上皮细胞中的靶蛋白的表达。靶蛋白由具有图中所示的各种元件的mRNA编码。本实验中使用两种不同的编码靶蛋白的开放阅读框(ORF)。用mRNA转染细胞并且测量靶蛋白的活性。
图18A是本文所描述的示例性mRNA构建体的设计的示意性绘图。
图18B是显示Hela细胞中的红色荧光蛋白的表达的图。靶蛋白由具有以下不同终止元件的mRNA构建体编码:C1、C5、C7和C9。
图18C-18D是显示Hela细胞中的绿色荧光蛋白的表达的图。靶蛋白由具有以下不同终止元件的mRNA构建体编码:C1、C5、C7和C9。
图18E是显示HEK293细胞中的红色荧光蛋白的表达的图。靶蛋白由具有以下不同终止元件的mRNA构建体编码:C1、C5、C7和C9。
图18F-18G是显示HEK293细胞中的绿色荧光蛋白的表达的图。靶蛋白由具有以下不同终止元件的mRNA构建体编码:C1、C5、C7和C9。
图18H和18I是分别描绘HeLa和HEK293细胞中的绿色荧光蛋白的通读百分率的图。靶蛋白由具有以下不同终止元件的mRNA构建体编码:C1、C3、C5、C7和C9。
图19A-19C是描绘在24和48小时HeLa细胞中的靶蛋白的表达的图。靶蛋白由具有以下不同终止元件的mRNA构建体编码:C1、C5、C10、C7、C8和C9。
图19D-19F是描绘在24和48小时HEK293细胞中的靶蛋白的表达的图。靶蛋白由具有以下不同终止元件的mRNA构建体编码:C1、C5、C10、C7、C8和C9。
图20A-20B是描绘在24和48小时HeLa和Hep3b细胞中的靶蛋白的表达的图。靶蛋白由具有以下不同终止元件的mRNA构建体编码:C1、C5、C10、C7、C8和C9。
图21A是描绘由具有以下不同终止密码子元件的mRNA构建体编码的靶蛋白的体内表达的图:C1、C5、C10、C7、C8和C9。
图21B-21D是描绘由具有以下不同终止密码子元件的mRNA构建体编码的靶蛋白的体内表达的图:C1、C5、C10、C7、C8和C9。
图21E是描绘由具有以下不同终止密码子元件的mRNA构建体编码的靶蛋白的体内表达时程的图:C1、C5、C10、C7、C8和C9。
图22A是描绘由具有以下不同终止密码子元件的mRNA构建体编码的靶蛋白的体内表达的图:C1、C10、C7、C8和C9。
图22B是描绘由具有以下不同终止密码子元件的mRNA构建体编码的靶蛋白的体内表达时程的图:C1、C10、C7和C8。
图22C是描绘肝细胞中由具有以下不同终止密码子元件的mRNA构建体编码的靶蛋白的表达的图:C1、C10、C7、C8和C9。
图22D是描绘脾细胞中由具有以下不同终止密码子元件的mRNA构建体编码的靶蛋白的表达的图:C1、C10、C7、C8和C9。
图22E是描绘由具有以下不同终止密码子元件的mRNA构建体编码的靶蛋白的体内表达的图:C1、C10、C7、C8和C9。
图23A-23D是描绘肝细胞岛中由具有以下不同终止密码子元件的mRNA构建体编码的靶蛋白的表达的图:C1、C5、C10、C7、C8和C9。
图24A-24D是描绘肝细胞岛中由具有以下不同终止密码子元件的mRNA构建体编码的靶蛋白的表达的图:C1、C5、C10、C7、C8和C9。
图25A-25C是描绘大鼠、食蟹猴和人类肝细胞岛中的靶蛋白的体内表达时程的图。靶蛋白由具有以下不同终止密码子元件的mRNA构建体编码:C1、C5、C10、C7、C8和C9。
图25D-25F是描绘大鼠、食蟹猴和人类肝细胞岛中的靶蛋白的体内表达时程的图。靶蛋白由具有以下不同终止密码子元件的mRNA构建体编码:C1、C5、C10、C7、C8和C9。
图26A-26B是描绘在给与具有和不具有3'稳定区的mRNA构建体后24和72小时CD11c+MHCII+细胞中的免疫检查点蛋白的表达的图。
图27A-27C是描绘给与具有和不具有3'稳定区的mRNA构建体的小鼠的肝脏、脾脏和血浆中的免疫检查点蛋白的表达的图。
图28A-28B是描绘在给与具有和不具有3'稳定区的mRNA构建体后72和120小时CD11c+MHCII+细胞中的免疫检查点蛋白的表达的图。
图29A-29D是描绘在给与具有和不具有3'稳定区的mRNA构建体后72和120小时小鼠的肝脏和脾脏中的免疫检查点蛋白的表达的图。
图30A-30C是描绘大鼠、食蟹猴和人类肝细胞中的免疫检查点蛋白的表达的图。靶蛋白构建体由具有以下不同终止密码子的mRNA编码:C1、C5和C7,各自具有和不具有3'稳定区。
图31A-31C是描绘来自个别供体的树突状细胞中的免疫检查点蛋白的表达的图。靶蛋白构建体由具有3'稳定区和以下不同终止密码子的mRNA编码:C1、C5和C7。
图32A是描绘小鼠中的靶蛋白的表达的图。靶蛋白构建体由具有以下不同5'UTR和终止密码子对的mRNA编码:A11/C1、A1/C1、A11/C8和A1/C8。
图32B是描绘小鼠中的靶蛋白的表达时程的图。靶蛋白构建体由具有以下不同5'UTR和终止密码子对的mRNA编码:A11/C1、A1/C1、A3/C1、A11/C8、A1/C8和A3/C8。
图32C-32D是描绘小鼠肝和脾细胞中的靶蛋白的表达的图。靶蛋白构建体由具有以下不同5'UTR和终止密码子对的mRNA编码:A11/C1、A1/C1、A11/C8和A1/C8。
图32E是描绘小鼠中的靶蛋白的表达的图。靶蛋白构建体由具有以下不同5'UTR和终止密码子对的mRNA编码:A11/C1、A1/C1、A11/C8和A1/C8。
图32F是描绘小鼠中的靶蛋白的表达时程的图。靶蛋白构建体由具有以下不同5'UTR和终止密码子对的mRNA编码:A11/C1、A1/C1、A3/C1、A11/C8、A1/C8和A3/C8。
图33A-33B是描绘HeLa细胞中的绿色荧光蛋白的蛋白质表达的图。靶蛋白构建体由具有以下不同3'UTR的mRNA编码:B10和B18。在60小时的时程中评估靶蛋白水平。
图33C-33D是描绘HeLa细胞中的绿色荧光蛋白的蛋白质表达的图。靶蛋白构建体由具有以下不同3'UTR的mRNA编码:B10和B18。在60小时的时程中评估靶蛋白水平。
图34A-34B是描绘小鼠中的靶蛋白的蛋白质表达的图。靶蛋白构建体由具有以下不同3'UTR的mRNA编码:B10和B18。在72小时的时程中评估靶蛋白水平。
图35A-35B是描绘在120小时的时程中小鼠中的靶蛋白的表达的图。靶蛋白构建体由具有以下不同5'UTR的mRNA编码:A12、A14、A15、A18、A20、A26、A27和A11(参考)。
图36A-36B是分别描绘在给与mRNA构建体后2天和4天小鼠中的靶蛋白的表达的图。靶蛋白构建体由具有以下不同5'UTR的mRNA编码:A12、A14、A20、A26、A27、A15和A11。
图36C-36D是分别描绘在给与mRNA构建体后5天从小鼠收集的肝和脾细胞中的靶蛋白的表达的图。靶蛋白构建体由具有以下不同5'UTR的mRNA编码:A12、A14、A20、A26、A27、A15和A11。
具体实施方式
可以通过以下方式优化mRNA的效力和持久性:(1)确保递送至细胞质的mRNA与核糖体适当且有效地缔合;以及(2)最大化mRNA主动产生所需蛋白质产物所耗费的时间。mRNA的序列是在这些方面的性能的重要决定因素。
除其它外,本文公开了以下发现:可以优化mRNA的5'非翻译区(UTR)、3'UTR和/或终止元件的序列以增加所述mRNA的效力和/或持久性。在一些实施方案中,本公开提供了包含可以增加mRNA或由mRNA编码的多肽的功效(例如,水平和/或活性)的优化的5'UTR、3'UTR和/或终止元件的多核苷酸和LNP组合物。
本文所公开的mRNA构建体对mRNA和/或编码的蛋白质表达的示例性影响在实施例1-13和14-18中提供。实施例1-8显示了由具有A1 5'UTR或其变体(A2 5'UTR或A3 5'UTR)的mRNA编码的靶蛋白的增加的水平和/或活性(例如,增加的蛋白质表达、增加的活性和/或蛋白质表达持续时间)。实施例9公开了延长mRNA构建体的半衰期的B1 3'UTR的发现和用途。实施例10-13显示了由具有选自终止元件C2-C11的终止元件的mRNA编码的靶蛋白的增加的水平和/或活性(例如,增加的蛋白质表达、增加的活性和/或蛋白质表达持续时间)。具有本文所公开的5'UTR、3'UTR和/或终止元件的组合的mRNA构建体的体内作用在实施例15-18中提供。跨细胞类型、物种和靶蛋白观察到靶蛋白的增加的水平和/或活性。
因此,本文公开了编码多肽的多核苷酸,其中所述多核苷酸包含:(a)5'-UTR(例如,如本文所描述);(b)编码区,所述编码区包含终止元件(例如,如本文所描述);以及(c)3'-UTR(例如,如本文所描述),以及包含所述多核苷酸的LNP组合物。在一个实施方案中,编码区包含编码有效载荷,例如治疗性有效载荷或预防性有效载荷的多核苷酸序列,例如mRNA。在一个实施方案中,多核苷酸,例如mRNA,或由多核苷酸编码的多肽具有增加的水平和/或活性,例如表达或半衰期。在一个实施方案中,多核苷酸,例如mRNA的水平和/或活性增加。在一个实施方案中,由多核苷酸编码的多肽的水平和/或活性或表达持续时间增加。本文还公开了使用包含本文所公开的多核苷酸的LNP组合物用于治疗疾病或病症或用于促进受试者中的所需生物作用的方法。
定义
聚尿苷序列段.“聚尿苷序列段”或“聚尿嘧啶序列段”在本文中可互换使用并且是指核酸序列中2个或更多个尿苷或尿嘧啶的连续段。聚尿苷序列段可以存在于核酸序列的任何位置或部分。在一个实施方案中,聚尿苷序列段存在于核酸序列的5'UTR中。在一个实施方案中,聚尿苷序列段包含至少2、3、4、5、6、7、8、9、10、11或12个连续尿苷。在一个实施方案中,核酸序列可以包含多于1个聚尿苷序列段。在一个实施方案中,多于一个聚尿苷序列段可以彼此相邻定位或由一个或多个核苷酸隔开。
尿苷含量:术语“尿苷含量”或“尿嘧啶含量”是可互换的并且是指存在于某个核酸序列中的尿嘧啶或尿苷的量。尿苷含量或尿嘧啶含量可以表示为绝对值(序列中尿苷或尿嘧啶的总数)或相对值(相对于核酸序列中核碱基总数的尿苷或尿嘧啶百分比)。
终止元件.如本文所用的术语“终止元件”是指包含终止密码子的核酸序列。在DNA的情况下,终止密码子可以选自TGA、TAA和TAG;或在RNA的情况下,选自UGA、UAA和UAG。在一个实施方案中,终止元件包含两个连续的终止密码子。在一个实施方案中,终止元件包含三个连续的终止密码子。在一个实施方案中,终止元件包含四个连续的终止密码子。在一个实施方案中,终止元件包含五个连续的终止密码子。在一个实施方案中,终止元件在一个或多个终止密码子的上游和/或下游还包含至少1、2、3、4、5、6、7、8、9、10、11或12个核苷酸。
3'稳定区.如本文所用的术语“3'稳定区”是指形成或变得稳定的区域。3'稳定区可以存在于核酸序列的3'末端。在一个实施方案中,3'稳定区包含多聚A尾,例如,如本文所描述。在一个实施方案中,3'稳定区包含替代性核苷,例如,反向胸苷。
序列同一性:序列之间的序列同一性的计算可以如下进行。为了确定两个核苷酸序列的同一性百分比,出于最佳比较目的将序列进行比对(例如,可以在第一核苷酸序列和第二核苷酸序列的一者或两者中引入空位以供最佳比对)。在一些实施方案中,为比较目的而比对的参考序列的长度为参考序列长度的至少50%,例如,至少60%、70%、80%、90%或100%。比较相应核苷酸位置处的核苷酸。当第一个序列中的一个位置被与第二个序列中相应位置处相同的核苷酸占据时,则分子在那个位置处是相同的。两个序列之间的同一性百分比是序列共享的相同位置数的函数,这考虑到空位数和每个空位的长度,需要引入空位以供两个序列的最佳比对。同一性百分比通常是指匹配残基数与比对总长度的比率。可以使用数学算法实现序列的比较和两个序列之间的同一性百分比的确定。在一些实施方案中,使用成对序列比对程序或多序列比对程序确定两个核苷酸序列之间的同一性百分比。示例性序列比对程序包括但不限于lalign程序(embnet.vital-it.ch;Huang和Miller,(1991)Adv.Appl.Math.12:337-357);Clustal Omega程序(www.ebi.ac.uk;Sievers等(2011)Mol.Syst.Biol.7:539)。在一些实施方案中,使用程序的默认参数。本文所描述的核苷酸序列可以用作“查询序列”以针对公共数据库执行搜索以例如鉴定其它家族成员或相关序列。可以使用
Figure BDA0004090383130001171
程序(blast.ncbi.nlm.nhi.gov;Altschul等,(1990)J.Mol.Biol.215:403-10)执行此类搜索。举例来说,可以用blastn程序执行BLAST核苷酸搜索以获得与本文所描述的核苷酸序列相同或相似的核苷酸序列。在一些实施方案中,使用程序的默认参数。
替代性核苷.如本文所用的术语“替代性核苷”在提及核苷酸、核苷或多核苷酸(诸如本发明的多核苷酸,例如mRNA分子)时,是指关于A、G、U或C核糖核苷酸的改变。一般来说,在本文中,这些术语并非旨在指代天然存在的5'末端mRNA帽部分中的核糖核苷酸改变。改变可以是各种不同的改变。在一些实施方案中,在多核苷酸是mRNA的情况下,编码区、侧翼区和/或末端区(例如,3'-稳定区)可以含有一个、两个或更多个(任选不同的)核苷或核苷酸改变。在一些实施方案中,与未改变的多核苷酸相比,引入细胞中的替代性多核苷酸可以展现出细胞中减少的降解。
施用:如本文所用,“施用”是指将组合物递送至受试者或患者的方法。可以选择施用方法以靶向递送(例如,特异性地递送)至身体的特定区域或系统。举例来说,施用可以是肠道外(例如,皮下、皮内、静脉内、腹膜内、肌肉内、关节内、动脉内、滑膜内、胸骨内、鞘内、病灶内或颅内注射,以及任何适合的输注技术)、经口、经皮或皮内、皮间、经直肠、阴道内、局部(例如,通过粉末、软膏、乳膏、凝胶、洗剂和/或滴剂)、经粘膜、经鼻、经颊、经肠、玻璃体、肿瘤内、舌下、鼻内;通过气管内滴注、支气管滴注和/或吸入;作为口腔喷雾和/或粉末、鼻喷雾和/或气雾剂,和/或经由门静脉导管。优选的施用方式是静脉内或皮下。
抗体分子:在一个实施方案中,抗体分子可以用于靶向所需的细胞类型。如本文所用,“抗体分子”是指天然存在的抗体、工程化抗体或其片段,例如,天然存在的抗体或工程化抗体的抗原结合部分。抗体分子可以包括例如抗体或其抗原结合片段(例如,Fab、Fab'、F(ab')2、Fv片段、scFv抗体片段、二硫键连接的Fv(sdFv)、由VH和CH1结构域组成的Fd片段、线性抗体、单结构域抗体(诸如sdAb(VL或VH))、纳米抗体或骆驼科VHH结构域)、抗原结合纤连蛋白III型(Fn3)支架(诸如纤连蛋白多肽微抗体)、配体、细胞因子、趋化因子或T细胞受体(TCR)。示例性抗体分子包括但不限于人源化抗体分子;完整IgA、IgG、IgE或IgM抗体;双特异性或多特异性抗体(例如,
Figure BDA0004090383130001181
等);抗体片段,诸如Fab片段、Fab'片段、F(ab')2片段、Fd'片段、Fd片段和分离的CDR或它们的集合;单链Fv;多肽-Fc融合体;单结构域抗体(例如鲨鱼单结构域抗体,诸如IgNAR或其片段);骆驼抗体;掩蔽抗体(例如,/>
Figure BDA0004090383130001182
);小型模块化免疫药物(“SMIPsTM”);单链或串联双抗体/>
Figure BDA0004090383130001183
VHH;
Figure BDA0004090383130001184
微抗体;/>
Figure BDA0004090383130001185
锚蛋白重复蛋白或
Figure BDA0004090383130001186
DART;类TCR抗体;
Figure BDA0004090383130001187
Figure BDA0004090383130001191
MicroProteins;/>
Figure BDA0004090383130001192
和/>
Figure BDA0004090383130001193
近似、约:如本文所用,如应用于一个或多个所关注值的术语“近似”或“约”是指类似于所陈述的参考值的值。在某些实施方案中,除非另外规定或在其它方面从上下文显而易见(除了此数字将超过可能值的100%的情况),否则术语“近似”或“约”是指值的范围,所述范围处于所陈述的参考值在任一方向(大于或小于)的25%、20%、19%、18%、17%、16%、15%、14%、13%、12%、11%、10%、9%、8%、7%、6%、5%、4%、3%、2%、1%或更小以内。举例来说,当在LNP的脂质组分中的给定化合物的量的情形中使用时,“约”可以意指所陈述的值+/-5%。举例来说,包含具有约40%的给定化合物的脂质组分的LNP可以包含30-50%的化合物。
缀合:如本文所用,术语“缀合”当关于两个或更多个部分使用时,是指这些部分直接或经由一个或多个用作连接剂的额外部分物理缔合或彼此连接,以形成足够稳定的结构,以使这些部分在使用这种结构的条件,例如生理条件下保持物理缔合。在一些实施方案中,两个或更多个部分可以通过直接共价化学键结来缀合。在其它实施方案中,两个或更多个部分可以通过离子键结或氢键结来缀合。
接触:如本文所用,术语“接触”意指在两个或更多个实体之间建立物理连接。举例来说,使细胞与mRNA或脂质纳米颗粒组合物接触意味着使细胞和mRNA或脂质纳米颗粒共享物理连接。体内、体外和离体使细胞与外部实体接触的方法是生物学领域中众所周知的。在本公开的示例性实施方案中,使哺乳动物细胞与组合物(例如,本公开的纳米颗粒或药物组合物)接触的步骤在体内进行。举例来说,可以通过任何适合的施用途径(例如,肠道外施用于生物体,包括静脉内、肌肉内、皮内和皮下施用)使脂质纳米颗粒组合物和可以位于生物体(例如,哺乳动物)内的细胞(例如,哺乳动物细胞)接触。对于存在于体外的细胞,可以例如通过将组合物添加至细胞的培养基中使组合物(例如,脂质纳米颗粒)和细胞接触,并且可以涉及或引起转染。此外,纳米颗粒组合物可以接触多于一个细胞。
递送:如本文所用,术语“递送”意指向标的物提供实体。举例来说,将治疗剂和/或预防剂递送至受试者可以涉及向所述受试者施用包括所述治疗剂和/或预防剂的LNP(例如,通过静脉内、肌肉内、皮内、经肺或皮下途径)。向哺乳动物或哺乳动物细胞施用LNP可以涉及使一个或多个细胞与脂质纳米颗粒接触。
囊封:如本文所用,术语“囊封”是指包封、包围或封装。在一些实施方案中,化合物、多核苷酸(例如,mRNA)或其它组合物可以被完全囊封、部分囊封或基本上囊封。举例来说,在一些实施方案中,本公开的mRNA可以囊封于脂质纳米颗粒,例如脂质体中。
囊封效率:如本文所用,“囊封效率”是指相对于用于制备LNP的治疗剂和/或预防剂的初始总量,变成LNP的一部分的治疗剂和/或预防剂的量。举例来说,如果在最初提供给组合物的总计100mg治疗剂和/或预防剂中有97mg治疗剂和/或预防剂囊封于LNP中,则囊封效率可以给定为97%。如本文所用,“囊封”可以指完全、实质性或部分包封、封闭、包围或封装。
有效量:如本文所用,剂的术语“有效量”是足以实现有益或期望的结果,例如临床结果的量,并且因此“有效量”取决于所应用的情形。举例来说,在本公开的脂质组合物(例如,LNP)中靶细胞递送增强脂质的量的情形中,靶细胞递送增强脂质的有效量是足以实现与缺乏靶细胞递送增强脂质的脂质组合物(例如,LNP)相比有益或期望结果的量。由脂质组合物(例如,LNP)实现的有益或期望结果的非限制性实例包括增加转染细胞的百分比和/或增加由与脂质组合物(例如,LNP)相关/由脂质组合物(例如,LNP)囊封的核酸编码的蛋白质的表达水平。在施用含靶细胞递送增强脂质的脂质纳米颗粒以使有效量的脂质纳米颗粒被受试者中的靶细胞摄取的情形中,含靶细胞递送增强脂质的LNP的有效量是足以实现与缺乏靶细胞递送增强脂质的LNP相比有益或期望结果的量。受试者中的有益或期望结果的非限制性实例包括与缺乏靶细胞递送增强脂质的LNP相比,增加转染细胞的百分比,增加由与含靶细胞递送增强脂质的LNP相关/由所述LNP囊封的核酸编码的蛋白质的表达水平,和/或增加与含靶细胞递送增强脂质的LNP相关和/或由所述LNP囊封的核酸或其编码的蛋白质在体内的预防或治疗作用。在一些实施方案中,当向罹患或易患感染、疾病、病症和/或疾患的受试者施用时,含靶细胞递送增强脂质的LNP的治疗有效量足以治疗所述感染、疾病、病症和/或疾患,改善其症状,诊断、预防所述感染、疾病、病症和/或疾患,和/或延迟其发作。在另一个实施方案中,脂质纳米颗粒的有效量足以使所需蛋白质在至少约5%、10%、15%、20%、25%或更多的靶细胞中表达。举例来说,含靶细胞递送增强脂质的LNP的有效量可以是在单次静脉注射后使至少5%、10%、15%、20%、25%、30%或35%的靶细胞转染的量。
表达:如本文所用,核酸序列的“表达”是指以下事件中的一者或多者:(1)从DNA序列产生RNA模板(例如,通过转录);(2)RNA转录物的加工(例如,通过剪接、编辑、5'帽形成和/或3'端加工);(3)将RNA翻译成多肽或蛋白质;以及(4)多肽或蛋白质的翻译后修饰。
离体:如本文所用,术语“离体”是指事件在生物体(例如,动物、植物或微生物或其细胞或组织)外部发生。离体事件可以在从天然(例如,体内)环境最低程度地改变的环境中发生。
片段:如本文所用,“片段”是指一部分。举例来说,蛋白质的片段可以包括通过消化从培养细胞中分离的全长蛋白质获得或通过重组DNA技术获得的多肽。蛋白质的片段可以是例如蛋白质的一部分,包括一个或多个功能结构域,使得蛋白质的片段保留蛋白质的功能活性。
富含GC:如本文所用,术语“富含GC”是指包含鸟嘌呤(G)和/或胞嘧啶(C)核碱基或其衍生物或类似物的多核苷酸(例如,mRNA)或其任何部分(例如,RNA元件)的核碱基组合物,其中GC含量大于约50%。术语“富含GC”是指多核苷酸的全部或一部分,包括但不限于基因、非编码区、5'UTR、3'UTR、开放阅读框、RNA元件、序列基序或其任何离散序列、片段或区段,其包含约50%的GC含量。在本公开的一些实施方案中,富含GC的多核苷酸或其任何部分仅由鸟嘌呤(G)和/或胞嘧啶(C)核碱基组成。
GC含量:如本文所用,术语“GC含量”是指多核苷酸(例如,mRNA)或其部分(例如,RNA元件)中的核碱基的百分比,所述核碱基是鸟嘌呤(G)和胞嘧啶(C)核碱基或其衍生物或类似物(来自DNA和RNA中的可能的核碱基总数,包括腺嘌呤(A)和胸腺嘧啶(T)或尿嘧啶(U)及其衍生物或类似物)。术语“GC含量”是指多核苷酸的全部或一部分,包括但不限于基因、非编码区、5'或3'UTR、开放阅读框、RNA元件、序列基序或其任何离散序列、片段或区段。
异源:如本文所用,“异源”指示序列(例如,氨基酸序列或编码氨基酸序列的多核苷酸)通常不存在于给定的多肽或多核苷酸中。举例来说,对应于一种蛋白质的结构域或基序的氨基酸序列可能与第二种蛋白质异源。
分离的:如本文所用,术语“分离的”是指已经与至少一些与其相关的组分(无论是在自然界中还是在实验环境中)分离的物质或实体。相对于与其相关的物质,分离的物质可能具有不同水平的纯度。分离的物质和/或实体可以与至少约10%、约20%、约30%、约40%、约50%、约60%、约70%、约80%、约90%或更多的最初与其相关的其它组分分离。在一些实施方案中,分离的剂是超过约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%、约99%或超过约99%纯的。如本文所用,如果物质基本上不含其它组分,则这种物质是“纯的”。
Kozak序列:术语“Kozak序列”(也称作“Kozak共有序列”)是指用于增强基因或开放阅读框的表达并且在真核生物中位于5'UTR中的翻译起始增强子元件。在分析起始密码子(AUG)周围的单个突变对前胰岛素原基因翻译的影响(Kozak(1986)Cell 44:283-292)之后,将Kozak共有序列最初定义为序列GCCRCC(SEQ ID NO:43),其中R=嘌呤。本文所公开的多核苷酸包含Kozak共有序列或其衍生物或修饰。(翻译增强子组合物及其使用方法的实例,参见Andrews等的美国专利号5,807,707,以全文引用的方式并入本文中;Chernajovsky的美国专利号5,723,332,以全文引用的方式并入本文中;Wilson的美国专利号5,891,665,以全文引用的方式并入本文中。)
遗漏扫描:可能会发生一种称为“遗漏扫描”的现象,借此PIC绕过起始密码子,而是继续向下游扫描,直到识别出替代的或替代性起始密码子。取决于发生频率,PIC绕过起始密码子可能导致翻译效率降低。此外,可能会发生来自这种下游AUG密码子的翻译,这将导致产生可能无法引发所需治疗反应的非期望的异常翻译产物。在一些情况下,异常的翻译产物实际上可能会导致有害的反应(Kracht等,(2017)Nat Med 23(4):501-507)。
脂质体:如本文所用,“脂质体”意指包括包封水性内部的含脂质膜的结构。脂质体可以具有一个或多个脂质膜。脂质体包括单层脂质体(在本领域中也称为单室脂质体)和多层脂质体(在本领域中也称为多室脂质体)。
修饰的:如本文所用,“修饰的”是指本公开的分子的改变的状态或结构,例如,多核苷酸(例如,mRNA)的组成或结构的改变。分子,例如多核苷酸,可以按各种方式进行修饰,包括化学上、结构上和/或功能上。举例来说,分子,例如多核苷酸,可以通过并入一个或多个RNA元件在结构上进行修饰,其中RNA元件包含提供一种或多种功能(例如,翻译调控活性)的序列和/或一个或多个RNA二级结构。因此,本公开的分子,例如多核苷酸,可以由一个或多个修饰组成(例如,可以包括一个或多个化学、结构或功能修饰,包括它们的任何组合)。在一个实施方案中,通过引入非天然核苷和/或核苷酸来修饰本公开的多核苷酸,例如mRNA分子,例如,因为它与天然核糖核苷酸A、U、G和C相关。非规范核苷酸(诸如帽结构)不应视为“修饰的”,尽管它们与A、C、G、U核糖核苷酸的化学结构不同。
mRNA:如本文所用,“mRNA”是指信使核糖核酸。mRNA可以是天然或非天然存在的。举例来说,mRNA可以包括修饰的和/或非天然存在的组分,诸如一种或多种核碱基、核苷、核苷酸或连接子。mRNA可以包括帽结构、链终止核苷、茎环、多聚A序列和/或多聚腺苷酸化信号。mRNA可以具有编码多肽的核苷酸序列。mRNA的翻译,例如哺乳动物细胞内的mRNA的体内翻译,可以产生多肽。传统上,mRNA分子的基本组分至少包括编码区、5'-非翻译区(5'-UTR)、3'UTR、5'帽和多聚A序列。在一个实施方案中,mRNA是环状mRNA。
纳米颗粒:如本文所用,“纳米颗粒”是指在小于约1000nm的标度上具有任何一种结构特征的颗粒,所述颗粒与相同材料的大块样品相比展现出新颖特性。常规地,纳米颗粒在小于约500nm、小于约200nm或约100nm的标度上具有任何一种结构特征。同样常规地,纳米颗粒在约50nm至约500nm、约50nm至约200nm或约70至约120nm的标度上具有任何一种结构特征。在示例性实施方案中,纳米颗粒是具有约1-1000nm量级的一个或多个尺寸的颗粒。在其它示例性实施方案中,纳米颗粒是具有约10-500nm量级的一个或多个尺寸的颗粒。在其它示例性实施方案中,纳米颗粒是具有约50-200nm量级的一个或多个尺寸的颗粒。球形纳米颗粒将具有例如介于约50-100或70-120纳米之间的直径。就其转运和特性来说,纳米颗粒最常表现为一个单元。值得注意的是,将纳米颗粒与相应的大块材料相区分的新颖特性通常以1000nm以下的尺寸标度或以约100nm的尺寸发展,但纳米颗粒可以具有更大的尺寸,例如,对于长椭圆形、管状等颗粒。尽管大多数分子的尺寸将符合上述概况,但个别分子通常不被称作纳米颗粒。
核酸:如本文所用,术语“核酸”以其最广泛的含义使用并且涵盖包括核苷酸聚合物的任何化合物和/或物质。这些聚合物通常被称作多核苷酸。本公开的示例性核酸或多核苷酸包括但不限于核糖核酸(RNA)、脱氧核糖核酸(DNA)、DNA-RNA杂合体、RNAi诱导剂、RNAi剂、siRNA、shRNA、miRNA、反义RNA、核酶、催化DNA、诱导三螺旋形成的RNA、苏糖核酸(TNA)、乙二醇核酸(GNA)、肽核酸(PNA)、锁核酸(LNA,包括具有β-D-核糖构型的LNA、具有α-L-核糖构型的α-LNA(LNA的非对映异构体)、具有2'-氨基官能化的2'-氨基-LNA和具有2'-氨基官能化的2'-氨基-α-LNA)或它们的杂合体。
核酸结构:如本文所用,术语“核酸结构”(与“多核苷酸结构”可互换使用)是指包含核酸(例如,mRNA)的连接核苷酸或其衍生物或类似物的原子、化学成分、元件、基序和/或序列的排列或组织。所述术语还指核酸的二维或三维状态。因此,术语“RNA结构”是指包含RNA分子(例如,mRNA)的连接核苷酸或其衍生物或类似物的原子、化学成分、元件、基序和/或序列的排列或组织,和/或是指RNA分子的二维和/或三维状态。基于增加的组织复杂性,核酸结构可以进一步划分为本文中称作“分子结构”、“一级结构”、“二级结构”和“三级结构”的四个组织类别。
核碱基:如本文所用,术语“核碱基”(或者“核苷酸碱基”或“含氮碱基”)是指在核酸中发现的嘌呤或嘧啶杂环化合物,包括向核酸或其部分或区段赋予改善的特性(例如,结合亲和力、核酸酶抗性、化学稳定性)的天然存在的嘌呤和嘧啶的任何衍生物或类似物。腺嘌呤、胞嘧啶、鸟嘌呤、胸腺嘧啶和尿嘧啶是主要在天然核酸中发现的核碱基。如本领域中已知和/或本文所描述的其它天然、非天然和/或合成核碱基可以并入核酸中。
核苷/核苷酸:如本文所用,术语“核苷”是指含有共价连接至核碱基(例如,嘌呤或嘧啶)或其衍生物或类似物(本文中也称作“核碱基”),但缺少核苷间连接基团(例如,磷酸基团)的糖分子(例如,RNA中的核糖或DNA中的脱氧核糖)或其衍生物或类似物的化合物。如本文所用,术语“核苷酸”是指共价键结至核苷间连接基团(例如,磷酸基团)的核苷或其任何衍生物、类似物或修饰,它向核酸或其部分或区段赋予改善的化学和/或功能特性(例如,结合亲和力、核酸酶抗性、化学稳定性)。
开放阅读框:如本文所用,术语“开放阅读框”,缩写为“ORF”,是指编码多肽的mRNA分子的区段或区域。ORF包含不重叠的框内密码子的连续段,从起始密码子开始并且以终止密码子结束,并且由核糖体翻译。
患者:如本文所用,“患者”是指可以寻求或需要治疗、要求治疗、正在接受治疗、将接受治疗的受试者,或处于针对特定疾病或疾患受过训练的专业人员的护理下的受试者。在特定实施方案中,患者是人类患者。在一些实施方案中,患者是罹患自身免疫疾病(例如,如本文所描述)的患者。
药学上可接受:短语“药学上可接受”在本文中用于指在合理医学判断的范围内适合与人类和动物组织接触使用而无过度毒性、刺激、过敏反应或其它问题或并发症,与合理的效益/风险比相称的那些化合物、材料、组合物和/或剂型。
药学上可接受的赋形剂:如本文所用,短语“药学上可接受的赋形剂”是指除本文所描述的化合物以外(例如,能够悬浮或溶解活性化合物的媒剂)并且具有在患者中基本上无毒且非炎性的特性的任何成分。赋形剂可以包括例如:抗粘剂、抗氧化剂、粘合剂、包衣、压缩助剂、崩解剂、染料(着色剂)、软化剂、乳化剂、填充剂(稀释剂)、成膜剂或包衣、调味剂、芳香剂、助流剂(流动增强剂)、润滑剂、防腐剂、印刷油墨、吸附剂、悬浮或分散剂、甜味剂和水合水。示例性赋形剂包括但不限于:丁基化羟基甲苯(BHT)、碳酸钙、磷酸钙(二碱式)、硬脂酸钙、交联羧甲纤维素、交联聚乙烯吡咯烷酮、柠檬酸、交联聚维酮、半胱氨酸、乙基纤维素、明胶、羟丙基纤维素、羟丙基甲基纤维素、乳糖、硬脂酸镁、麦芽糖醇、甘露糖醇、甲硫氨酸、甲基纤维素、对羟基苯甲酸甲酯、微晶纤维素、聚乙二醇、聚乙烯吡咯烷酮、聚维酮、预胶凝淀粉、对羟基苯甲酸丙酯、棕榈酸视黄酯、虫胶、二氧化硅、羧甲基纤维素钠、柠檬酸钠、乙醇酸淀粉钠、山梨糖醇、淀粉(玉米)、硬脂酸、蔗糖、滑石、二氧化钛、维生素A、维生素E、维生素C和木糖醇。
药学上可接受的盐:如本文所用,“药学上可接受的盐”是指所公开化合物的衍生物,其中母体化合物通过将现有酸或碱部分转化为其盐形式(例如,通过使游离碱基团与适合的有机酸反应)而进行修饰。药学上可接受的盐的实例包括但不限于诸如胺的碱性残基的无机或有机酸盐;诸如羧酸的酸性残基的碱金属或有机盐;等等。代表性酸加成盐包括乙酸盐、乙酸、己二酸盐、海藻酸盐、抗坏血酸盐、天冬氨酸盐、苯磺酸盐、苯磺酸、苯甲酸盐、硫酸氢盐、硼酸盐、丁酸盐、樟脑酸盐、樟脑磺酸盐、柠檬酸盐、环戊烷丙酸盐、二葡糖酸盐、十二烷基硫酸盐、乙磺酸盐、富马酸盐、葡庚糖酸盐、甘油磷酸盐、半硫酸盐、庚酸盐、己酸盐、氢溴酸盐、盐酸盐、氢碘酸盐、2-羟基-乙磺酸盐、乳糖酸盐、乳酸盐、月桂酸盐、月桂基硫酸盐、苹果酸盐、马来酸盐、丙二酸盐、甲磺酸盐、2-萘磺酸盐、烟酸盐、硝酸盐、油酸盐、草酸盐、棕榈酸盐、双羟萘酸盐、果胶酸盐、过硫酸盐、3-苯基丙酸盐、磷酸盐、苦味酸盐、特戊酸盐、丙酸盐、硬脂酸盐、琥珀酸盐、硫酸盐、酒石酸盐、硫氰酸盐、甲苯磺酸盐、十一烷酸盐、戊酸盐等。代表性碱金属或碱土金属盐包括钠、锂、钾、钙、镁等;以及无毒铵、季铵和胺阳离子,包括但不限于铵、四甲基铵、四乙基铵、甲胺、二甲胺、三甲胺、三乙胺、乙胺等。本公开的药学上可接受的盐包括例如由无毒无机或有机酸形成的母体化合物的常规无毒盐。本公开的药学上可接受的盐可以通过常规化学方法由含有碱性或酸性部分的母体化合物合成。一般来说,此类盐可以通过使游离酸或碱形式的这些化合物与化学计算量的适当碱或酸在水中或有机溶剂中或两者的混合物中反应来制备;一般优选非水性介质,如乙醚、乙酸乙酯、乙醇、异丙醇或乙腈。适合盐的清单见于Remington's Pharmaceutical Sciences,第17版,Mack Publishing Company,Easton,Pa.,1985,第1418页,Pharmaceutical Salts:Properties,Selection,and Use,P.H.Stahl和C.G.Wermuth(编),Wiley-VCH,2008,以及Berge等,Journal of Pharmaceutical Science,66,1-19(1977)中,所述文献中的每一者以全文引用的方式并入本文中。
多肽:如本文所用,术语“多肽”或“所关注的多肽”是指通常由肽键接合的氨基酸残基的聚合物,所述聚合物可以天然地(例如,分离或纯化)或以合成方式产生。
RNA:如本文所用,“RNA”是指可以天然或非天然存在的核糖核酸。举例来说,RNA可以包括修饰的和/或非天然存在的组分,诸如一种或多种核碱基、核苷、核苷酸或连接子。RNA可以包括帽结构、链终止核苷、茎环、多聚A序列和/或多聚腺苷酸化信号。RNA可以具有编码所关注多肽的核苷酸序列。举例来说,RNA可以是信使RNA(mRNA)。编码特定多肽的mRNA的翻译(例如,哺乳动物细胞内的mRNA的体内翻译)可以产生编码的多肽。RNA可以选自由小干扰RNA(siRNA)、不对称干扰RNA(aiRNA)、微RNA(miRNA)、Dicer-底物RNA(dsRNA)、小发夹RNA(shRNA)、mRNA、长链非编码RNA(lncRNA)和它们的混合物组成的非限制性组。
RNA元件:如本文所用,术语“RNA元件”是指提供生物功能和/或具有生物活性(例如,翻译调控活性)的RNA分子的部分、片段或区段。通过并入一个或多个RNA元件(诸如本文所描述的那些)对多核苷酸进行修饰,为修饰的多核苷酸提供了一种或多种所需的功能特性。如本文所描述,RNA元件可以是天然存在的、非天然存在的、合成的、工程改造的或它们的任何组合。举例来说,提供调控活性的天然存在的RNA元件包括在病毒、原核和真核生物体(例如,人类)的整个转录组中发现的元件。RNA元件,特别是真核mRNA和翻译的病毒RNA,已经显示参与介导细胞中的许多功能。示例性天然RNA元件包括但不限于翻译起始元件(例如,内部核糖体进入位点(IRES),参见Kieft等,(2001)RNA 7(2):194-206)、翻译增强子元件(例如,APP mRNA翻译增强子元件,参见Rogers等,(1999)J Biol Chem274(10):6421-6431)、mRNA稳定性元件(例如,富含AU的元件(ARE),参见Garneau等,(2007)Nat Rev MolCell Biol 8(2):113-126)、翻译抑制元件(参见例如Blumer等,(2002)Mech Dev 110(1-2):97-112)、蛋白质结合RNA元件(例如,铁反应元件,参见Selezneva等,(2013)J Mol Biol425(18):3301-3310)、细胞质多聚腺苷酸化元件(Villalba等,(2011)Curr Opin GenetDev 21(4):452-457)和催化RNA元件(例如,核酶,参见Scott等,(2009)Biochim BiophysActa 1789(9-10):634-641)。
特异性递送:如本文所用,术语“特异性递送”、“特异性地递送”或“以特异性方式递送”意指与脱靶细胞(例如,非靶细胞)相比,由纳米颗粒向所关注的靶细胞(例如,哺乳动物靶细胞)递送更多(例如,至少多10%、至少多20%、至少多30%、至少多40%、至少多50%、至少多1.5倍、至少多2倍、至少多3倍、至少多4倍、至少多5倍、至少多6倍、至少多7倍、至少多8倍、至少多9倍、至少多10倍)治疗剂和/或预防剂。纳米颗粒向特定细胞的递送水平可以通过以下方式测量:比较靶细胞对比非靶细胞中产生的蛋白质的量(例如,通过使用流式细胞术的平均荧光强度),比较表达蛋白质的靶细胞对比非靶细胞的%(例如,通过定量流式细胞术),比较靶细胞对比非靶细胞中产生的蛋白质的量与所述靶细胞对比非靶细胞中总蛋白质的量,或比较靶细胞对比非靶细胞中治疗剂和/或预防剂的量与所述靶细胞对比非靶细胞中总治疗剂和/或预防剂的量。将了解,纳米颗粒特异性地递送至靶细胞的能力无需在所治疗的受试者中确定,其可以在诸如动物模型(例如,小鼠或NHP模型)的替代物中确定。
基本上:如本文所用,术语“基本上”是指展现出所关注的特征或特性的全部或接近全部范围或程度的定性条件。生物学领域的普通技术人员将了解,生物和化学现象很少(如果有的话)完成和/或继续完成或者达到或避免绝对结果。因此,术语“基本上”在本文中用于捕获许多生物和化学现象中固有的潜在完整性缺乏。
罹患:“罹患”疾病、病症和/或疾患的个体已经被诊断出患有或表现出疾病、病症和/或疾患的一种或多种症状。
靶向部分:如本文所用,“靶向部分”是可以将纳米颗粒靶向特定细胞、组织和/或器官类型的化合物或剂。
治疗剂:术语“治疗剂”是指当向受试者施用时,具有治疗、诊断和/或预防作用和/或引发所需的生物和/或药理作用的任何剂。在一些实施方案中,治疗剂包含或是治疗性有效载荷。在一些实施方案中,治疗剂包含或是小分子或生物剂(例如,抗体分子)。
转染:如本文所用,术语“转染”是指将物质(例如多核苷酸,诸如mRNA)引入细胞中的方法。
翻译调控活性:如本文所用,术语“翻译调控活性”(与“翻译调控功能”可互换使用)是指调节(例如,调控、影响、控制、改变)翻译装置的活性,包括PIC和/或核糖体的活性的生物功能、机制或过程。在一些方面,所需的翻译调控活性促进和/或提高mRNA翻译的翻译保真度。在一些方面,所需的翻译调控活性减少和/或抑制遗漏扫描。
受试者:如本文所用,术语“受试者”是指可以例如出于实验、诊断、预防和/或治疗目的施用根据本公开的组合物的任何生物体。典型的受试者包括动物(例如哺乳动物,诸如小鼠、大鼠、兔、非人类灵长类动物和人类)和/或植物。在一些实施方案中,受试者可以是患者。
治疗:如本文所用,术语“治疗”是指部分地或完全地缓解、改善、改进、减轻特定感染、疾病、病症和/或疾患,延迟其发作,抑制其进展,降低其严重度,和/或降低其一种或多种症状或特征的发生率。举例来说,“治疗”癌症可以指抑制肿瘤的存活、生长和/或扩散。出于降低发展与疾病、病症和/或疾患相关的病理的风险的目的,治疗可以向未展现疾病、病症和/或疾患的征象的受试者施用,和/或向仅展现疾病、病症和/或疾患的早期征象的受试者施用。
预防:如本文所用,术语“预防”是指部分地或完全地抑制特定感染、疾病、病症和/或疾患的一种或多种症状或特征的发作。
未修饰:如本文所用,“未修饰”是指在以任何方式改变之前的任何物质、化合物或分子。未修饰可以但不总是指生物分子的野生型或原生形式。分子可以经历一系列修饰,借此每个修饰的分子可以充当“未修饰的”起始分子以供后续修饰。
尿苷含量:术语“尿苷含量”或“尿嘧啶含量”是可互换的并且是指存在于某个核酸序列中的尿嘧啶或尿苷的量。尿苷含量或尿嘧啶含量可以表示为绝对值(序列中尿苷或尿嘧啶的总数)或相对值(相对于核酸序列中核碱基总数的尿苷或尿嘧啶百分比)。
尿苷修饰的序列:术语“尿苷修饰的序列”是指相对于候选核酸序列的尿苷含量和/或尿苷模式,具有不同整体或局部尿苷含量(较高或较低尿苷含量)或具有不同尿苷模式(例如,梯度分布或聚类)的序列优化的核酸(例如,合成的mRNA序列)。在本公开的内容中,术语“尿苷修饰的序列”和“尿嘧啶修饰的序列”应视为等同的和可互换的。
“高尿苷密码子”定义为包含两个或三个尿苷的密码子,“低尿苷密码子”定义为包含一个尿苷的密码子,并且“无尿苷密码子”是不含任何尿苷的密码子。在一些实施方案中,尿苷修饰的序列包括用低尿苷密码子取代高尿苷密码子、用无尿苷密码子取代高尿苷密码子、用高尿苷密码子取代低尿苷密码子、用无尿苷密码子取代低尿苷密码子、用低尿苷密码子取代无尿苷密码子、用高尿苷密码子取代无尿苷密码子,以及它们的组合。在一些实施方案中,可以用另一个高尿苷密码子置换高尿苷密码子。在一些实施方案中,可以用另一个低尿苷密码子置换低尿苷密码子。在一些实施方案中,可以用另一个无尿苷密码子置换无尿苷密码子。尿苷修饰的序列可以是尿苷富集的或尿苷稀化的。
尿苷富集的:如本文所用,术语“尿苷富集的”和语法变型是指序列优化的核酸(例如,合成的mRNA序列)中的尿苷含量(以绝对值或百分比值表示)相对于相应候选核酸序列的尿苷含量的增加。可以通过用含有较少尿苷核碱基的同义密码子取代候选核酸序列中的密码子来实施尿苷富集。尿苷富集可以是全局的(即,相对于候选核酸序列的全长)或局部的(即,相对于候选核酸序列的子序列或区域)。
尿苷稀化的:如本文所用,术语“尿苷稀化的”和语法变型是指序列优化的核酸(例如,合成的mRNA序列)中的尿苷含量(以绝对值或百分比值表示)相对于相应候选核酸序列的尿苷含量的降低。可以通过用含有较少尿苷核碱基的同义密码子取代候选核酸序列中的密码子来实施尿苷稀化。尿苷稀化可以是全局的(即,相对于候选核酸序列的全长)或局部的(即,相对于候选核酸序列的子序列或区域)。
变体:如本文所用,术语“变体”是指具有野生型分子的至少50%、60%、70%、80%、85%、90%、95%、96%、97%、98%、99%或100%活性或结构相似性的分子,例如,如通过本领域公认的测定所测量。
5'UTR序列
5”UTR序列对于核糖体募集至mRNA很重要,并且已报道在翻译中起作用(Hinnebusch A等,(2016)Science,352:6292:1413-6)。
除其它外,本文公开了一种编码多肽的多核苷酸,所述多核苷酸具有5'UTR,所述5'UTR向由所述多核苷酸编码的多肽或多核苷酸本身赋予增加的半衰期、增加的表达和/或增加的活性。在一个实施方案中,本文所公开的多核苷酸包含:(a)5'-UTR(例如,如表1中所提供或其变体或片段);(b)编码区,所述编码区包含终止元件(例如,如本文所描述);以及(c)3'-UTR(例如,如本文所描述),以及包含所述多核苷酸的LNP组合物。在一个实施方案中,多核苷酸包含5'-UTR,所述5'-UTR包含表1中所提供的序列或其变体或片段(例如,其功能变体或片段)。将了解,此类5'UTR并入自然界中未发现的构建体中,例如,此类5'UTR是合成的,在序列中从天然存在的5'UTR改变,是在自然界中发现的那些的截短或加长形式,包含化学修饰的碱基,处于不同于自然界中可能发现的那些的ORF序列的5',等等。
在一个实施方案中,表1中所提供的序列的片段缺少表1中所提供的序列的至少初始(即,5'最末端)一个、两个、三个、四个、五个或六个核苷酸。在一个实施方案中,表1中所提供的序列的片段缺少表1中所提供的序列的第一个核苷酸。在一个实施方案中,表1中所提供的序列的片段缺少表1中所提供的序列的初始两个核苷酸。在一个实施方案中,表1中所提供的序列的片段缺少表1中所提供的序列的初始三个核苷酸。在一个实施方案中,表1中所提供的序列的片段缺少表1中所提供的序列的初始四个核苷酸。在一个实施方案中,表1中所提供的序列的片段缺少表1中所提供的序列的初始五个核苷酸。在一个实施方案中,表1中所提供的序列的片段缺少表1中所提供的序列的初始六个核苷酸。
在一个实施方案中,多核苷酸包含5'UTR,所述5'UTR包含缺少表1中所提供的序列的至少初始一个、两个、三个、四个、五个或六个核苷酸,但在其它方面与表1中所提供的序列至少50%(例如,至少60%、70%、80%、90%、95%、96%、98%、99%或100%)相同的序列。在一个实施方案中,多核苷酸包含5'UTR,所述5'UTR包含缺少表1中所提供的序列的第一个核苷酸,但在其它方面与表1中所提供的序列至少50%(例如,至少60%、70%、80%、90%、95%、96%、98%、99%或100%)相同的序列。在一个实施方案中,多核苷酸包含5'UTR,所述5'UTR包含缺少表1中所提供的序列的初始两个核苷酸,但在其它方面与表1中所提供的序列至少50%(例如,至少60%、70%、80%、90%、95%、96%、98%、99%或100%)相同的序列。在一个实施方案中,多核苷酸包含5'UTR,所述5'UTR包含缺少表1中所提供的序列的初始三个核苷酸,但在其它方面与表1中所提供的序列至少50%(例如,至少60%、70%、80%、90%、95%、96%、98%、99%或100%)相同的序列。在一个实施方案中,多核苷酸包含5'UTR,所述5'UTR包含缺少表1中所提供的序列的初始四个核苷酸,但在其它方面与表1中所提供的序列至少50%(例如,至少60%、70%、80%、90%、95%、96%、98%、99%或100%)相同的序列。在一个实施方案中,多核苷酸包含5'UTR,所述5'UTR包含缺少表1中所提供的序列的初始五个核苷酸,但在其它方面与表1中所提供的序列至少50%(例如,至少60%、70%、80%、90%、95%、96%、98%、99%或100%)相同的序列。在一个实施方案中,多核苷酸包含5'UTR,所述5'UTR包含缺少表1中所提供的序列的初始六个核苷酸,但在其它方面与表1中所提供的序列至少50%(例如,至少60%、70%、80%、90%、95%、96%、98%、99%或100%)相同的序列。
在一个实施方案中,具有表1中所提供的5'UTR序列或其变体或片段的多核苷酸具有增加的多核苷酸的半衰期,例如,多核苷酸的半衰期增加约1.5-20倍。在一个实施方案中,半衰期增加约1.5、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20倍或更多。在一个实施方案中,半衰期增加约1.5倍或更多。在一个实施方案中,半衰期增加约2倍或更多。在一个实施方案中,半衰期增加约3倍或更多。在一个实施方案中,半衰期增加约4倍或更多。在一个实施方案中,半衰期增加约5倍或更多。
在一个实施方案中,具有表1中所提供的5'UTR序列或其变体或片段的多核苷酸使得由多核苷酸编码的多肽的水平和/或活性,例如输出增加。在一个实施方案中,5'UTR使得由多核苷酸编码的多肽的水平和/或活性,例如输出增加约1.5-20倍。在一个实施方案中,水平和/或活性增加约1.5、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20倍或更多。在一个实施方案中,水平和/或活性增加约1.5倍或更多。在一个实施方案中,水平和/或活性增加约2倍或更多。在一个实施方案中,水平和/或活性增加约3倍或更多。在一个实施方案中,水平和/或活性增加约4倍或更多。在一个实施方案中,水平和/或活性增加约5倍或更多。
在一个实施方案中,将增加与不具有5'UTR、具有不同5'UTR或不具有表1中所描述的5'UTR或其变体或片段的在其它方面类似的多核苷酸进行比较。
在一个实施方案中,根据测量多核苷酸的半衰期的测定,例如本文所公开的实施例中的任一者中所描述的测定来测量多核苷酸的半衰期的增加。
在一个实施方案中,根据测量多肽的水平和/或活性的测定,例如本文所公开的实施例中的任一者中所描述的测定来测量由多核苷酸编码的多肽的水平和/或活性,例如输出的增加。
在一个实施方案中,5'UTR包含表1中所提供的序列或与表1中所提供的5'UTR序列或其变体或片段(例如,缺少表1中所提供的5'UTR序列的初始一个、两个、三个、四个、五个或六个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。在一个实施方案中,5'UTR包含与SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:41、SEQ ID NO:42、SEQ IDNO:63、SEQ ID NO:64、SEQ ID NO:65、SEQ ID NO:66、SEQ ID NO:67、SEQ ID NO:68、SEQ IDNO:69、SEQ ID NO:70、SEQ ID NO:71、SEQ ID NO:72、SEQ ID NO:73、SEQ ID NO:74、SEQ IDNO:75、SEQ ID NO:76、SEQ ID NO:77、SEQ ID NO:78、SEQ ID NO:88、SEQ ID NO:89或SEQID NO:90具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
在一个实施方案中,5'UTR包含与表1中所提供的5'UTR序列,例如SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:8、SEQID NO:41、SEQ ID NO:42、SEQ ID NO:63、SEQ ID NO:64、SEQ ID NO:65、SEQ ID NO:66、SEQID NO:67、SEQ ID NO:68、SEQ ID NO:69、SEQ ID NO:70、SEQ ID NO:71、SEQ ID NO:72、SEQID NO:73、SEQ ID NO:74、SEQ ID NO:75、SEQ ID NO:76、SEQ ID NO:77、SEQ ID NO:78、SEQID NO:88、SEQ ID NO:89或SEQ ID NO:90的片段具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列,其中所述片段缺少表1中所提供的5'UTR序列的至少初始一个、两个、三个、四个、五个或六个核苷酸,例如,缺少SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:41、SEQID NO:42、SEQ ID NO:63、SEQ ID NO:64、SEQ ID NO:65、SEQ ID NO:66、SEQ ID NO:67、SEQID NO:68、SEQ ID NO:69、SEQ ID NO:70、SEQ ID NO:71、SEQ ID NO:72、SEQ ID NO:73、SEQID NO:74、SEQ ID NO:75、SEQ ID NO:76、SEQ ID NO:77、SEQ ID NO:78、SEQ ID NO:88、SEQID NO:89或SEQ ID NO:90中的任一者的核苷酸1、核苷酸1-2、核苷酸1-3、核苷酸1-4或核苷酸1-5。
在一个实施方案中,5'UTR包含与SEQ ID NO:1或其缺少SEQ ID NO:1的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。在一个实施方案中,5'UTR包含与SEQ ID NO:2或其缺少SEQ ID NO:2的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。在一个实施方案中,5'UTR包含与SEQ ID NO:3或其缺少SEQ ID NO:3的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。在一个实施方案中,5'UTR包含与SEQ ID NO:4或其缺少SEQ ID NO:4的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。在一个实施方案中,5'UTR包含与SEQ ID NO:5或其缺少SEQ ID NO:5的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。在一个实施方案中,5'UTR包含与SEQ ID NO:6或其缺少SEQ ID NO:6的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。在一个实施方案中,5'UTR包含与SEQ ID NO:8或其缺少SEQ ID NO:8的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。在一个实施方案中,5'UTR包含与SEQ ID NO:41或其缺少SEQ ID NO:41的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。在一个实施方案中,5'UTR包含与SEQ ID NO:42或其缺少SEQ ID NO:42的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。在一个实施方案中,5'UTR包含与SEQ ID NO:63或其缺少SEQ ID NO:63的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。在一个实施方案中,5'UTR包含与SEQ ID NO:64或其缺少SEQ ID NO:64的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。在一个实施方案中,5'UTR包含与SEQ ID NO:65或其缺少SEQ ID NO:65的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。在一个实施方案中,5'UTR包含与SEQID NO:66或其缺少SEQ ID NO:66的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。在一个实施方案中,5'UTR包含与SEQ ID NO:67或其缺少SEQ ID NO:67的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。在一个实施方案中,5'UTR包含与SEQ ID NO:68或其缺少SEQID NO:68的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。在一个实施方案中,5'UTR包含与SEQ ID NO:69或其缺少SEQ ID NO:69的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。在一个实施方案中,5'UTR包含与SEQ ID NO:70或其缺少SEQ ID NO:70的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。在一个实施方案中,5'UTR包含与SEQ ID NO:71或其缺少SEQ ID NO:71的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。在一个实施方案中,5'UTR包含与SEQ ID NO:72或其缺少SEQ ID NO:72的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。在一个实施方案中,5'UTR包含与SEQ ID NO:73或其缺少SEQ IDNO:73的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。在一个实施方案中,5'UTR包含与SEQ ID NO:74或其缺少SEQ ID NO:74的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。在一个实施方案中,5'UTR包含与SEQ ID NO:75或其缺少SEQ ID NO:75的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。在一个实施方案中,5'UTR包含与SEQ ID NO:76或其缺少SEQ ID NO:76的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。在一个实施方案中,5'UTR包含与SEQ ID NO:77或其缺少SEQ ID NO:77的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。在一个实施方案中,5'UTR包含与SEQ ID NO:78或其缺少SEQ IDNO:78的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。在一个实施方案中,5'UTR包含与SEQ ID NO:88或其缺少SEQ ID NO:88的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。在一个实施方案中,5'UTR包含与SEQ ID NO:89或其缺少SEQ ID NO:89的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。在一个实施方案中,5'UTR包含与SEQ ID NO:90或其缺少SEQ ID NO:90的第一个、两个、三个、四个、五个、六个或更多个核苷酸的片段具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
表1:5'UTR序列
Figure BDA0004090383130001391
/>
Figure BDA0004090383130001401
/>
Figure BDA0004090383130001411
/>
Figure BDA0004090383130001421
在一个实施方案中,5'UTR包含SEQ ID NO:1的变体。在一个实施方案中,SEQ IDNO:1的变体包含式A的核酸序列:
G G A A A U C G C A A A A(N2)X(N3)X C U(N4)X(N5)X C G C G U U A G A U UU C U U U U A G U U U U C U N6 N7 C A A C U A G C A A G C U U U U U G U U C UC G C C(N8 C C)x(SEQ ID NO:46),
其中:
(N2)x是尿嘧啶并且x是0至5的整数,例如,其中x=3或4;
(N3)x是鸟嘌呤并且x是0至1的整数;
(N4)x是胞嘧啶并且x是0至1的整数;
(N5)x是尿嘧啶并且x是0至5的整数,例如,其中x=2或3;
N6是尿嘧啶或胞嘧啶;
N7是尿嘧啶或鸟嘌呤;
N8是腺嘌呤或鸟嘌呤并且x是0至1的整数。
在一个实施方案中,(N2)x是尿嘧啶并且x是0。在一个实施方案中,(N2)x是尿嘧啶并且x是1。在一个实施方案中,(N2)x是尿嘧啶并且x是2。在一个实施方案中,(N2)x是尿嘧啶并且x是3。在一个实施方案中,(N2)x是尿嘧啶并且x是4。在一个实施方案中,(N2)x是尿嘧啶并且x是5。
在一个实施方案中,(N3)x是鸟嘌呤并且x是0。在一个实施方案中,(N3)x是鸟嘌呤并且x是1。
在一个实施方案中,(N4)x是胞嘧啶并且x是0。在一个实施方案中,(N4)x是胞嘧啶并且x是1。
在一个实施方案中,(N5)x是尿嘧啶并且x是0。在一个实施方案中,(N5)x是尿嘧啶并且x是1。在一个实施方案中,(N5)x是尿嘧啶并且x是2。在一个实施方案中,(N5)x是尿嘧啶并且x是3。在一个实施方案中,(N5)x是尿嘧啶并且x是4。在一个实施方案中,(N5)x是尿嘧啶并且x是5。
在一个实施方案中,N6是尿嘧啶。在一个实施方案中,N6是胞嘧啶。
在一个实施方案中,N7是尿嘧啶。在一个实施方案中,N7是鸟嘌呤。
在一个实施方案中,N8是腺嘌呤并且x是0。在一个实施方案中,N8是腺嘌呤并且x是1。
在一个实施方案中,N8是鸟嘌呤并且x是0。在一个实施方案中,N8是鸟嘌呤并且x是1。
在一个实施方案中,5'UTR包含SEQ ID NO:1的变体。在一个实施方案中,SEQ IDNO:1的变体包含与SEQ ID NO:1或其片段具有至少50%、60%、70%、80%、85%、90%、95%、96%、97%、98%或99%同一性的序列。在一个实施方案中,SEQ ID NO:1的变体包含与SEQ ID NO:1或其片段具有至少50%同一性的序列。在一个实施方案中,SEQ ID NO:1的变体包含与SEQ ID NO:1或其片段具有至少60%同一性的序列。在一个实施方案中,SEQ IDNO:1的变体包含与SEQ ID NO:1或其片段具有至少70%同一性的序列。在一个实施方案中,SEQ ID NO:1的变体包含与SEQ ID NO:1或其片段具有至少80%同一性的序列。在一个实施方案中,SEQ ID NO:1的变体包含与SEQ ID NO:1或其片段具有至少90%同一性的序列。在一个实施方案中,SEQ ID NO:1的变体包含与SEQ ID NO:1或其片段具有至少95%同一性的序列。在一个实施方案中,SEQ ID NO:1的变体包含与SEQ ID NO:1或其片段具有至少96%同一性的序列。在一个实施方案中,SEQ ID NO:1的变体包含与SEQ ID NO:1或其片段具有至少97%同一性的序列。在一个实施方案中,SEQ ID NO:1的变体包含与SEQ ID NO:1或其片段具有至少98%同一性的序列。在一个实施方案中,SEQ ID NO:1的变体包含与SEQ IDNO:1或其片段具有至少99%同一性的序列。在一个实施方案中,SEQ ID NO:1的片段包含SEQ ID NO:1的核苷酸2-75。在一个实施方案中,SEQ ID NO:1的片段包含SEQ ID NO:1的核苷酸3-75。在一个实施方案中,SEQ ID NO:1的片段包含SEQ ID NO:1的核苷酸4-75。在一个实施方案中,SEQ ID NO:1的片段包含SEQ ID NO:1的核苷酸5-75。
在一个实施方案中,SEQ ID NO:1的变体包含至少5%、10%、20%、30%、40%、50%、60%、70%或80%的尿苷含量。在一个实施方案中,SEQ ID NO:1的变体包含至少5%的尿苷含量。在一个实施方案中,SEQ ID NO:1的变体包含至少10%的尿苷含量。在一个实施方案中,SEQ ID NO:1的变体包含至少20%的尿苷含量。在一个实施方案中,SEQ ID NO:1的变体包含至少30%的尿苷含量。在一个实施方案中,SEQ ID NO:1的变体包含至少40%的尿苷含量。在一个实施方案中,SEQ ID NO:1的变体包含至少50%的尿苷含量。在一个实施方案中,SEQ ID NO:1的变体包含至少60%的尿苷含量。在一个实施方案中,SEQ ID NO:1的变体包含至少70%的尿苷含量。在一个实施方案中,SEQ ID NO:1的变体包含至少80%的尿苷含量。
在一个实施方案中,SEQ ID NO:1的变体包含至少2、3、4、5、6或7个连续尿苷(例如,聚尿苷序列段)。在一个实施方案中,SEQ ID NO:1的变体中的聚尿苷序列段包含至少1-7、2-7、3-7、4-7、5-7、6-7、1-6、1-5、1-4、1-3、1-2、2-6或3-5个连续尿苷。在一个实施方案中,SEQ ID NO:1的变体中的聚尿苷序列段包含4个连续尿苷。在一个实施方案中,SEQ IDNO:1的变体中的聚尿苷序列段包含5个连续尿苷。
在一个实施方案中,SEQ ID NO:1的变体包含1、2、3、4、5、6、7、8、9、10、11、12、13、14或15个聚尿苷序列段。在一个实施方案中,SEQ ID NO:1的变体包含3个聚尿苷序列段。在一个实施方案中,SEQ ID NO:1的变体包含4个聚尿苷序列段。在一个实施方案中,SEQ IDNO:1的变体包含5个聚尿苷序列段。
在一个实施方案中,聚尿苷序列段中的一者或多者与不同聚尿苷序列段相邻。在一个实施方案中,聚尿苷序列段中的每一者,例如全部彼此相邻,例如,聚尿苷序列段全部是相连的。
在一个实施方案中,聚尿苷序列段中的一者或多者由1、2、3、4、5、6、7、8、9、10、11、2、13、14、15、16、17、18、19、20、30、40、50或60个核苷酸隔开。在一个实施方案中,聚尿苷序列段中的每一者,例如全部由1、2、3、4、5、6、7、8、9、10、11、2、13、14、15、16、17、18、19、20、30、40、50或60个核苷酸隔开。
在一个实施方案中,第一聚尿苷序列段和第二聚尿苷序列段彼此相邻。
在一个实施方案中,后续的,例如第三、第四、第五、第六或第七、第八、第九或第十聚尿苷序列段由1、2、3、4、5、6、7、8、9、10、11、2、13、14、15、16、17、18、19、20、30、40、50或60个核苷酸与第一聚尿苷序列段、第二聚尿苷序列段或后续聚尿苷序列段中的任一者隔开。
在一个实施方案中,第一聚尿苷序列段由1、2、3、4、5、6、7、8、9、10、11、2、13、14、15、16、17、18、19、20、30、40、50或60个核苷酸与后续聚尿苷序列段,例如第二、第三、第四、第五、第六或第七、第八、第九或第十聚尿苷序列段隔开。在一个实施方案中,后续聚尿苷序列段中的一者或多者与不同聚尿苷序列段相邻。
在一个实施方案中,5'UTR包含Kozak序列,例如,GCCRCC核苷酸序列(SEQ ID NO:43),其中R是腺嘌呤或鸟嘌呤。在一个实施方案中,Kozak序列位于5'UTR序列的3'端。
在一个实施方案中,本文所公开的包含5'UTR序列的多核苷酸包含编码有效载荷,例如治疗性或预防性有效载荷的编码区。
在一个方面,本文所公开的包含5'UTR序列的多核苷酸(例如,mRNA)被配制成LNP。在一个实施方案中,LNP组合物包含:(i)可电离脂质,例如,氨基脂质;(ii)固醇或其它结构脂质;(iii)非阳离子辅助脂质或磷脂;以及(iv)PEG-脂质。
在另一个方面,本公开的LNP组合物用于治疗疾病或病症的方法中,或用于抑制受试者的免疫反应的方法中。
在一个方面,包含本文所公开的编码治疗性有效载荷或预防性有效载荷(例如,如本文所描述)的多核苷酸的LNP组合物可以与额外剂(例如,如本文所描述)一起施用。
3'UTR序列
3'UTR序列已经显示影响mRNA的翻译、半衰期和亚细胞定位(Mayr C.,ColdSpring Harb Persp Biol 2019年10月1日;11(10):a034728)。
除其它外,本文公开了一种编码多肽的多核苷酸,所述多核苷酸具有3'UTR,所述3'UTR向由所述多核苷酸编码的多肽或多核苷酸本身赋予增加的半衰期、增加的表达和/或增加的活性。在一个实施方案中,本文所公开的多核苷酸包含:(a)5'-UTR(例如,如本文所描述);(b)编码区,所述编码区包含终止元件(例如,如本文所描述);以及(c)3'-UTR(例如,如表2中所提供或其变体或片段),以及包含所述多核苷酸的LNP组合物。在一个实施方案中,多核苷酸包含3'-UTR,所述3'-UTR包含表2中所提供的序列或其变体或片段。
在一个实施方案中,具有表2中所提供的3'UTR序列或其变体或片段的多核苷酸使得多核苷酸的半衰期增加,例如,多核苷酸的半衰期增加约1.5-10倍。在一个实施方案中,半衰期增加约1.5、2、3、4、5、6、7、8、9或10倍或更多。在一个实施方案中,半衰期增加约1.5倍或更多。在一个实施方案中,半衰期增加约2倍或更多。在一个实施方案中,半衰期增加约3倍或更多。在一个实施方案中,半衰期增加约4倍或更多。在一个实施方案中,半衰期增加约5倍或更多。在一个实施方案中,半衰期增加约6倍或更多。在一个实施方案中,半衰期增加约7倍或更多。在一个实施方案中,半衰期增加约8倍。在一个实施方案中,半衰期增加约9倍或更多。在一个实施方案中,半衰期增加约10倍或更多。
在一个实施方案中,具有表2中所提供的3'UTR序列或其变体或片段的多核苷酸使得多核苷酸具有大于10的平均半衰期评分。
在一个实施方案中,具有表2中所提供的3'UTR序列或其变体或片段的多核苷酸使得由多核苷酸编码的多肽的水平和/或活性,例如输出增加。
在一个实施方案中,将增加与不具有3'UTR、具有不同3'UTR或不具有表2的3'UTR或其变体或片段的在其它方面类似的多核苷酸进行比较。
在一个实施方案中,多核苷酸包含表2中所提供的3'UTR序列或与表2中所提供的3'UTR序列或其片段(例如,缺少表2中所提供的3'UTR序列的初始(即,5'最末端)一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。在一个实施方案中,3'UTR包含与SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ IDNO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:45、SEQ ID NO:79、SEQ ID NO:80、SEQ IDNO:81、SEQ ID NO:82、SEQ ID NO:83、SEQ ID NO:84、SEQ ID NO:85、SEQ ID NO:86、SEQ IDNO:87、SEQ ID NO:94或SEQ ID NO:95或其片段(例如,缺少前述序列中的任一者的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。在一个实施方案中,片段缺少前述序列中的任一者的第一个核苷酸。在一个实施方案中,片段缺少前述序列中的任一者的初始两个核苷酸。在一个实施方案中,片段缺少前述序列中的任一者的初始三个核苷酸。在一个实施方案中,片段缺少前述序列中的任一者的初始四个核苷酸。在一个实施方案中,片段缺少前述序列中的任一者的初始五个核苷酸。在一个实施方案中,片段缺少前述序列中的任一者的初始六个核苷酸。在一个实施方案中,片段缺少前述序列中的任一者的初始七个或更多个(例如,八个、九个、十个或更多个)核苷酸。
在一个实施方案中,3'UTR包含表2中所提供的3'UTR序列的片段,使得组合的终止元件(例如,本文所描述的终止元件)和3'UTR的长度具有恒定长度。举例来说,假设具有X个核苷酸的终止元件与具有Y个核苷酸的3'UTR序列组合使用,则组合长度为X+Y个核苷酸。在一个实施方案中,当使用具有X+N个核苷酸的不同终止元件时,3'UTR序列的长度将缩短为Y-N个核苷酸(例如,通过删除3'UTR序列的初始N个核苷酸),以保持组合长度恒定(即,X+Y)。在一个实施方案中,X=3、6、9、12或15。在一个实施方案中,N==-15、-12、-9、-6、-3、3、6、9、12或15。在一个实施方案中,X=3、6、9、12或15,并且N=-15、-12、-9、-6、-3、3、6、9、12或15。在一个实施方案中,X=9并且N=6。在一个实施方案中,X=15并且N=-6。在一个实施方案中,3'UTR包含SEQ ID NO:11的序列,或与SEQ ID NO:11或其片段(例如,缺少SEQ IDNO:11的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。在一个实施方案中,3'UTR包含SEQ ID NO:12的序列,或与SEQ ID NO:12或其片段(例如,缺少SEQ ID NO:12的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。在一个实施方案中,3'UTR包含SEQ ID NO:13的序列,或与SEQ ID NO:13或其片段(例如,缺少SEQ ID NO:13的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。在一个实施方案中,3'UTR包含SEQ ID NO:14的序列,或与SEQID NO:14或其片段(例如,缺少SEQ ID NO:14的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。在一个实施方案中,3'UTR包含SEQ ID NO:15的序列,或与SEQ ID NO:15或其片段(例如,缺少SEQ ID NO:15的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。在一个实施方案中,3'UTR包含SEQ ID NO:16的序列,或与SEQ ID NO:16或其片段(例如,缺少SEQID NO:16的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。在一个实施方案中,3'UTR包含SEQ ID NO:17的序列,或与SEQ ID NO:17或其片段(例如,缺少SEQ ID NO:17的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。在一个实施方案中,3'UTR包含SEQ ID NO:18的序列,或与SEQ ID NO:18或其片段(例如,缺少SEQ ID NO:18的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。在一个实施方案中,3'UTR包含SEQ ID NO:19的序列,或与SEQID NO:19或其片段(例如,缺少SEQ ID NO:19的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。在一个实施方案中,3'UTR包含SEQ ID NO:20的序列,或与SEQ ID NO:20或其片段(例如,缺少SEQ ID NO:20的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。在一个实施方案中,3'UTR包含SEQ ID NO:21的序列,或与SEQ ID NO:21或其片段(例如,缺少SEQID NO:21的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。在一个实施方案中,3'UTR包含SEQ ID NO:22的序列,或与SEQ ID NO:22或其片段(例如,缺少SEQ ID NO:22的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。在一个实施方案中,3'UTR包含SEQ ID NO:23的序列,或与SEQ ID NO:23或其片段(例如,缺少SEQ ID NO:23的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。在一个实施方案中,3'UTR包含SEQ ID NO:24的序列,或与SEQID NO:24或其片段(例如,缺少SEQ ID NO:24的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。在一个实施方案中,3'UTR包含SEQ ID NO:25的序列,或与SEQ ID NO:25或其片段(例如,缺少SEQ ID NO:25的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。在一个实施方案中,3'UTR包含SEQ ID NO:45的序列,或与SEQ ID NO:45或其片段(例如,缺少SEQID NO:45的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。在一个实施方案中,3'UTR包含SEQ ID NO:79的序列,或与SEQ ID NO:79或其片段(例如,缺少SEQ ID NO:79的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。在一个实施方案中,3'UTR包含SEQ ID NO:80的序列,或与SEQ ID NO:80或其片段(例如,缺少SEQ ID NO:80的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。在一个实施方案中,3'UTR包含SEQ ID NO:81的序列,或与SEQID NO:81或其片段(例如,缺少SEQ ID NO:81的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。在一个实施方案中,3'UTR包含SEQ ID NO:82的序列,或与SEQ ID NO:82或其片段(例如,缺少SEQ ID NO:82的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。在一个实施方案中,3'UTR包含SEQ ID NO:83的序列,或与SEQ ID NO:83或其片段(例如,缺少SEQID NO:83的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。在一个实施方案中,3'UTR包含SEQ ID NO:84的序列,或与SEQ ID NO:84或其片段(例如,缺少SEQ ID NO:84的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。在一个实施方案中,3'UTR包含SEQ ID NO:85的序列,或与SEQ ID NO:85或其片段(例如,缺少SEQ ID NO:85的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。在一个实施方案中,3'UTR包含SEQ ID NO:86的序列,或与SEQID NO:86或其片段(例如,缺少SEQ ID NO:86的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。在一个实施方案中,3'UTR包含SEQ ID NO:87的序列,或与SEQ ID NO:87或其片段(例如,缺少SEQ ID NO:87的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
在一个实施方案中,3'UTR包含SEQ ID NO:87的序列,或与SEQ ID NO:60的核苷酸16-188或其片段(例如,缺少SEQ ID NO:60的核苷酸16-188的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
在一个实施方案中,3'UTR包含SEQ ID NO:87的序列,或与SEQ ID NO:61的核苷酸16-188或其片段(例如,缺少SEQ ID NO:61的核苷酸16-188的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。将了解,此类3'UTR并入自然界中未发现的构建体中,例如,此类3'UTR是合成的,在序列中从天然存在的3'UTR改变,是在自然界中发现的那些的截短或加长形式,包含化学修饰的碱基,处于不同于自然界中可能发现的那些的ORF序列的3',等等。
表2:3'UTR序列
Figure BDA0004090383130001531
/>
Figure BDA0004090383130001541
/>
Figure BDA0004090383130001551
/>
Figure BDA0004090383130001561
在一个实施方案中,3'UTR包含微RNA(miRNA)结合位点,例如,如本文所描述,其结合至存在于人类细胞中的miR。在一个实施方案中,3'UTR包含SEQ ID NO:38、SEQ ID NO:39、SEQ ID NO:40或它们的组合的miRNA结合位点。在一个实施方案中,3'UTR包含多个miRNA结合位点,例如,2、3、4、5、6、7或8个miRNA结合位点。在一个实施方案中,多个miRNA结合位点包含相同或不同miRNA结合位点。
miR122 bs=CAAACACCAUUGUCACACUCCA(SEQ ID NO:38)
miR-142-3p bs=UCCAUAAAGUAGGAAACACUACA(SEQ ID NO:39)
miR-126bs=CGCAUUAUUACUCACGGUACGA(SEQ ID NO:40)
在一个实施方案中,3'UTR包含TENT募集序列,例如,如本文所描述,其将一种或多种末端核苷酸转移酶(TENT)募集至包含3'UTR的多核苷酸。在一个实施方案中,TENT是TENT4,例如,TENT4A和/或TENT4B。不希望受理论束缚,据信在一些实施方案中,一个或多个TENT(例如,TENT4A和/或TENT4B)产生具有间断非腺苷残基(例如,鸟苷)的混合多聚A尾,其保护mRNA免于快速脱腺苷酸化。
示例性TENT募集序列包括但不限于
CACCGCGUUAUCCGUUCCUCGUAGGCUGGUCCUGGGGAA CGGGUCGGCGG(SEQ ID NO:91)和
CCACCCCCAGCGCCACCACCGCUGCCGUCGCCACCGCGUU AUCCGUUCCUCGUAGGCUGGUCCUGGGGAACGGGUCGGCGGC CGGUCGGCUUCUGUUUUA(SEQ ID NO:92)
在一个实施方案中,TENT募集序列包含SEQ ID NO:91的核苷酸序列,或与其具有至少80%、85%、90%、95%、96%、97%、98%或99%同一性,或与其相差不超过1、2、3、4、5、6、7、8、9或10个核苷酸的核苷酸序列。在一个实施方案中,TENT募集序列包含SEQ ID NO:91的核苷酸序列。
在一个实施方案中,TENT募集序列包含SEQ ID NO:92的核苷酸序列,或与其具有至少80%、85%、90%、95%、96%、97%、98%或99%同一性,或与其相差不超过1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸的核苷酸序列。在一个实施方案中,TENT募集序列包含SEQ ID NO:92的核苷酸序列。
在一个实施方案中,3'UTR包含一个或多个(例如,2、3、4、5个或更多个)TENT募集序列,例如,一个或多个本文所描述的TENT募集序列。在一个实施方案中,3'UTR包含一个TENT募集序列。在一个实施方案中,3'UTR包含两个TENT募集序列。在一个实施方案中,3'UTR包含三个TENT募集序列。在一个实施方案中,3'UTR包含四个TENT募集序列。在一个实施方案中,3'UTR包含五个TENT募集序列。举例来说,3'UTR中的多个TENT募集序列可以相同或不同。
在一个实施方案中,3'UTR包含TENT募集序列,所述TENT募集序列包含SEQ ID NO:91的核苷酸序列,或与其具有至少80%、85%、90%、95%、96%、97%、98%或99%同一性,或与其相差不超过1、2、3、4、5、6、7、8、9或10个核苷酸的核苷酸序列。在一个实施方案中,3'UTR包含TENT募集序列,所述TENT募集序列包含SEQ ID NO:91的核苷酸序列。
在一个实施方案中,3'UTR包含一个或多个(例如,2、3、4、5个或更多个)TENT募集序列,所述TENT募集序列包含SEQ ID NO:91的核苷酸序列,或与其具有至少80%、85%、90%、95%、96%、97%、98%或99%同一性,或与其相差不超过1、2、3、4、5、6、7、8、9或10个核苷酸的核苷酸序列。在一个实施方案中,3'UTR包含一个TENT募集序列,所述TENT募集序列包含SEQ ID NO:91的核苷酸序列,或与其具有至少80%、85%、90%、95%、96%、97%、98%或99%同一性,或与其相差不超过1、2、3、4、5、6、7、8、9或10个核苷酸的核苷酸序列。在一个实施方案中,3'UTR包含两个TENT募集序列,所述TENT募集序列各自包含SEQ ID NO:91的核苷酸序列,或与其具有至少80%、85%、90%、95%、96%、97%、98%或99%同一性,或与其相差不超过1、2、3、4、5、6、7、8、9或10个核苷酸的核苷酸序列。在一个实施方案中,3'UTR包含三个TENT募集序列,所述TENT募集序列各自包含SEQ ID NO:91的核苷酸序列,或与其具有至少80%、85%、90%、95%、96%、97%、98%或99%同一性,或与其相差不超过1、2、3、4、5、6、7、8、9或10个核苷酸的核苷酸序列。在一个实施方案中,3'UTR包含四个TENT募集序列,所述TENT募集序列各自包含SEQ ID NO:91的核苷酸序列,或与其具有至少80%、85%、90%、95%、96%、97%、98%或99%同一性,或与其相差不超过1、2、3、4、5、6、7、8、9或10个核苷酸的核苷酸序列。在一个实施方案中,3'UTR包含五个TENT募集序列,所述TENT募集序列各自包含SEQ ID NO:91的核苷酸序列,或与其具有至少80%、85%、90%、95%、96%、97%、98%或99%同一性,或与其相差不超过1、2、3、4、5、6、7、8、9或10个核苷酸的核苷酸序列。
在一个实施方案中,3'UTR包含一个或多个(例如,2、3、4、5个或更多个)TENT募集序列,所述TENT募集序列包含SEQ ID NO:91的核苷酸序列。在一个实施方案中,3'UTR包含两个TENT募集序列,所述TENT募集序列各自包含SEQ ID NO:91的核苷酸序列。在一个实施方案中,3'UTR包含三个TENT募集序列,所述TENT募集序列各自包含SEQ ID NO:91的核苷酸序列。在一个实施方案中,3'UTR包含四个TENT募集序列,所述TENT募集序列各自包含SEQID NO:91的核苷酸序列。在一个实施方案中,3'UTR包含五个TENT募集序列,所述TENT募集序列各自包含SEQ ID NO:91的核苷酸序列。
在一个实施方案中,3'UTR包含SEQ ID NO:80的核苷酸序列,或与其具有至少80%、85%、90%、95%、96%、97%、98%或99%同一性,或与其相差不超过1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸的核苷酸序列。在一个实施方案中,3'UTR包含SEQ ID NO:80的核苷酸序列。
在一个实施方案中,3'UTR包含SEQ ID NO:94的核苷酸序列,或与其具有至少80%、85%、90%、95%、96%、97%、98%或99%同一性,或与其相差不超过1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸的核苷酸序列。在一个实施方案中,3'UTR包含SEQ ID NO:94的核苷酸序列。
在一个实施方案中,3'UTR包含SEQ ID NO:95的核苷酸序列,或与其具有至少80%、85%、90%、95%、96%、97%、98%或99%同一性,或与其相差不超过1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸的核苷酸序列。在一个实施方案中,3'UTR包含SEQ ID NO:95的核苷酸序列。
在一个方面,本文公开了一种编码多肽的多核苷酸,其中所述多核苷酸包含:(a)5'-UTR,例如,如本文所描述;(b)编码区,所述编码区包含终止元件(例如,如本文所描述);以及(c)3'-UTR(例如,如本文所描述)。
在一个方面,包含本文所公开的包含3'UTR的多核苷酸的LNP组合物包含:(i)可电离脂质,例如,氨基脂质;(ii)固醇或其它结构脂质;(iii)非阳离子辅助脂质或磷脂;以及(iv)PEG-脂质。
在另一个方面,本公开的LNP组合物用于治疗疾病或病症的方法中,或用于抑制受试者的免疫反应的方法中。
在一个方面,包含本文所公开的编码治疗性有效载荷或预防性有效载荷(例如,如本文所描述)的多核苷酸的LNP组合物可以与额外剂(例如,如本文所描述)一起施用。
终止元件
翻译终止密码子UAA、UAG和UGA是遗传密码的重要组分并且是mRNA翻译终止的信号。在蛋白质合成期间,终止密码子与蛋白质释放因子相互作用并且这种相互作用可以调节核糖体活性,由此对翻译具有影响(Tate WP等,(2018)Biochem Soc Trans,46(6):1615-162)。
除其它外,本文公开了一种编码多肽的多核苷酸,所述多核苷酸具有包含终止元件的编码区,所述编码区向由所述多核苷酸编码的多肽或多核苷酸本身赋予增加的半衰期、增加的表达和/或增加的活性。在一个实施方案中,多核苷酸包含:(a)5'-UTR(例如,如本文所描述);(b)编码区,所述编码区包含终止元件(例如,如本文所描述);以及(c)3'-UTR(例如,如本文所描述),以及包含所述多核苷酸的LNP组合物。在一个实施方案中,多核苷酸包含编码区,所述编码区包含表3中所提供的终止元件。
如本文所用的终止元件是指包含终止密码子的核酸序列。在DNA的情况下,终止密码子可以选自TGA、TAA和TAG;或在RNA的情况下,选自UGA、UAA和UAG。在一个实施方案中,终止元件包含两个连续的终止密码子。在一个实施方案中,终止元件包含三个连续的终止密码子。在一个实施方案中,终止元件包含四个连续的终止密码子。在一个实施方案中,终止元件包含五个连续的终止密码子。
在一个实施方案中,终止元件包含多个相同的终止密码子。在一个实施方案中,终止元件包含多个不同的终止密码子。
在一个实施方案中,终止元件在一个或多个终止密码子的上游和/或下游还包含至少1、2、3、4、5或10个核苷酸。在一个实施方案中,终止元件在一个或多个终止密码子的上游还包含至少1、2、3、4、5或10个核苷酸。在一个实施方案中,终止元件在一个或多个终止密码子的下游还包含至少1、2、3、4、5或10个核苷酸。
本发明还包括一种包含终止密码子元件和本文所描述的多核苷酸两者的多核苷酸。在一些实施方案中,终止密码子元件包含终止密码子区域。在一些实施方案中,多核苷酸的编码区包含终止元件。在一些实施方案中,终止元件处于多核苷酸中的3'UTR序列的上游,例如,在其之前。
在一些实施方案中,本发明的多核苷酸可以在3'非翻译区(UTR)之前包括至少两个终止密码子。在DNA的情况下,终止密码子可以选自TGA、TAA和TAG;或在RNA的情况下,选自UGA、UAA和UAG。在一些实施方案中,本发明的多核苷酸在DNA的情况下包括终止密码子TGA,或在RNA的情况下包括终止密码子UGA,以及一个额外的终止密码子。在又一个实施方案中,添加终止密码子可以是TAA或UAA。在另一个实施方案中,本发明的多核苷酸包括三个连续的终止密码子、四个终止密码子或更多。
已经观察到包含表3中所提供的序列的终止元件可以使得多核苷酸的半衰期增加和/或由多核苷酸编码的多肽的水平或活性增加。
在一个实施方案中,具有表3中所提供的终止元件的多核苷酸使得多核苷酸的半衰期增加或由多核苷酸编码的多肽的水平和/或活性,例如输出增加。在一个实施方案中,半衰期增加约1.5-20倍。在一个实施方案中,半衰期增加约1.5、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20倍或更多。在一个实施方案中,半衰期增加约1.5倍或更多。在一个实施方案中,半衰期增加约2倍或更多。在一个实施方案中,半衰期增加约3倍或更多。在一个实施方案中,半衰期增加约4倍。在一个实施方案中,半衰期增加约5倍或更多。
在一个实施方案中,具有表3中所提供的终止元件的多核苷酸使得由多核苷酸编码的多肽的水平和/或活性,例如输出或表达持续时间增加。在一个实施方案中,终止元件使得由多核苷酸编码的多肽的水平和/或活性,例如可检测水平或活性增加约1.5-20倍,持续约1、2、3、4、5、6、7、8、9、10或14天。在一个实施方案中,终止元件使得由多核苷酸编码的多肽的可检测水平或活性持续约1、2、3、4、5、6、7、8、9、10或14天。
在一个实施方案中,活性增加约1.5、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20倍或更多。在一个实施方案中,活性增加约1.5倍或更多。在一个实施方案中,活性增加约2倍或更多。在一个实施方案中,活性增加约3倍或更多。在一个实施方案中,活性增加约4倍或更多。在一个实施方案中,活性增加约5倍或更多。
在一个实施方案中,将增加与不具有终止元件、具有不同终止元件或不具有表3中所提供的终止元件的在其它方面类似的多核苷酸进行比较。
在一个实施方案中,终止元件包含表3中所提供的序列。在一个实施方案中,终止元件包含SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQID NO:31、SEQ ID NO:32、SEQ ID NO:33、SEQ ID NO:34、SEQ ID NO:35或SEQ ID NO:36、SEQ ID NO;62、SEQ ID NO:93或SEQ ID NO:96的序列。在一个实施方案中,终止元件包含SEQ ID NO:26的序列。在一个实施方案中,终止元件包含SEQ ID NO:27的序列。在一个实施方案中,终止元件包含SEQ ID NO:28的序列。在一个实施方案中,终止元件包含SEQ ID NO:29的序列。在一个实施方案中,终止元件包含SEQ ID NO:30的序列。在一个实施方案中,终止元件包含SEQ ID NO:31的序列。在一个实施方案中,终止元件包含SEQ ID NO:32的序列。在一个实施方案中,终止元件包含SEQ ID NO:33的序列。在一个实施方案中,终止元件包含SEQ ID NO:34的序列。在一个实施方案中,终止元件包含SEQ ID NO:35的序列。在一个实施方案中,终止元件包含SEQ ID NO:36的序列。在一个实施方案中,终止元件包含SEQ ID NO:62的序列。在一个实施方案中,终止元件包含SEQ ID NO:93的序列。在一个实施方案中,终止元件包含SEQ ID NO;96的序列。
在一个实施方案中,(b)的编码区包含终止元件,所述终止元件包含式B的共有序列:
X-3-X-2-X-1-U-A-A-X1-X2-X3-X4-X5-X6-X7-X8-X9-X10-X11-X12(SEQ ID NO:37)
其中:
X1是G或A;
X2、X4、X5、X6或X7各自独立地是C或U;
X3是C或A;
X8、X10、X11、X12、X-1或X-3各自独立地是C或G;
X9是G或U;和/或
X-2是A或U。
在一个实施方案中,X1是G。在一个实施方案中,X1是A。
在一个实施方案中,X2是C。在一个实施方案中,X2是U。
在一个实施方案中,X4是C。在一个实施方案中,X4是U。
在一个实施方案中,X5是C。在一个实施方案中,X5是U。
在一个实施方案中,X6是C。在一个实施方案中,X6是U。
在一个实施方案中,X7是C。在一个实施方案中,X7是U。
在一个实施方案中,X3是C。在一个实施方案中,X3是A。
在一个实施方案中,X8是C。在一个实施方案中,X8是G。
在一个实施方案中,X10是C。在一个实施方案中,X10是G。
在一个实施方案中,X11是C。在一个实施方案中,X11是G。
在一个实施方案中,X12是C。在一个实施方案中,X12是G。
在一个实施方案中,X-1是C。在一个实施方案中,X-1是G。
在一个实施方案中,X-3是C。在一个实施方案中,X-3是G。
在一个实施方案中,X9是G。在一个实施方案中,X9是U。
在一个实施方案中,X-2是A。在一个实施方案中,X-2是U。
在一个实施方案中,式B(SEQ ID NO:37)的共有序列具有高GC含量,例如,约50%、60%、70%、80%、90%或99%的GC含量。在一个实施方案中,GC含量为约50%。在一个实施方案中,GC含量为约60%。在一个实施方案中,GC含量为约70%。在一个实施方案中,GC含量为约80%。在一个实施方案中,GC含量为约90%。在一个实施方案中,GC含量为约99%。
在一个实施方案中,(b)的编码区包含终止元件,所述终止元件包含式C的共有序列:
X-3-X-2-X-1-U-G-A-X1-X2-X3-X4-X5-X6-X7-X8-X9-X10-X11-X12(SEQ ID NO:56)
其中:
X-3、X-1、X2、X5、X6、X7、X8、X9或X12各自独立地是G或C;
X-2、X3或X4各自独立地是A或C;
X1是A或G;和/或
X10或X11各自独立地是C或U。
在一个实施方案中,X-3是G。在一个实施方案中,X-3是C。
在一个实施方案中,X-1是G。在一个实施方案中,X-1是C。
在一个实施方案中,X2是G。在一个实施方案中,X2是C。
在一个实施方案中,X5是G。在一个实施方案中,X5是C。
在一个实施方案中,X6是G。在一个实施方案中,X6是C。
在一个实施方案中,X7是G。在一个实施方案中,X7是C。
在一个实施方案中,X8是G。在一个实施方案中,X8是C。
在一个实施方案中,X9是G。在一个实施方案中,X9是C。
在一个实施方案中,X12是G。在一个实施方案中,X12是C。
在一个实施方案中,X-2是A。在一个实施方案中,X-2是C。
在一个实施方案中,X3是A。在一个实施方案中,X3是C。
在一个实施方案中,X4是A。在一个实施方案中,X4是C。
在一个实施方案中,X1是A。在一个实施方案中,X1是G。
在一个实施方案中,X10是C。在一个实施方案中,X10是U。
在一个实施方案中,X11是C。在一个实施方案中,X11是U。
在一个实施方案中,式C(SEQ ID NO:56)的共有序列具有高GC含量,例如,约50%、60%、70%、80%、90%或99%的GC含量。在一个实施方案中,GC含量为约50%。在一个实施方案中,GC含量为约60%。在一个实施方案中,GC含量为约70%。在一个实施方案中,GC含量为约80%。在一个实施方案中,GC含量为约90%。在一个实施方案中,GC含量为约99%。
在一个实施方案中,(b)的编码区包含终止元件,所述终止元件包含式D的共有序列:
X-3-X-2-X-1-U-A-G-X1-X2-X3-X4-X5-X6-X7-X8-X9-X10-X11-X12(SEQ ID NO:57)
其中:
X-3、X-1、X2、X3、X10各自独立地是G或C;
X-2或X9各自独立地是A或U;
X1或X4各自独立地是A或G;
X5或X8各自独立地是A或C;和/或
X6、X7、X11或X12各自独立地是C或U。
在一个实施方案中,X-3是G。在一个实施方案中,X-3是C。
在一个实施方案中,X-1是G。在一个实施方案中,X-1是C。
在一个实施方案中,X2是G。在一个实施方案中,X2是C。
在一个实施方案中,X3是G。在一个实施方案中,X3是C。
在一个实施方案中,X10是G。在一个实施方案中,X10是C。
在一个实施方案中,X-2是A。在一个实施方案中,X-2是U。
在一个实施方案中,X9是A。在一个实施方案中,X9是U。
在一个实施方案中,X1是A。在一个实施方案中,X1是G。
在一个实施方案中,X4是A。在一个实施方案中,X4是G。
在一个实施方案中,X5是A。在一个实施方案中,X5是C。
在一个实施方案中,X8是A。在一个实施方案中,X8是C。
在一个实施方案中,X6是C。在一个实施方案中,X6是U。
在一个实施方案中,X7是C。在一个实施方案中,X7是U。
在一个实施方案中,X11是C。在一个实施方案中,X11是U。
在一个实施方案中,X12是C。在一个实施方案中,X12是U。
在一个实施方案中,式D(SEQ ID NO:57)的共有序列具有高GC含量,例如,约50%、60%、70%、80%、90%或99%的GC含量。在一个实施方案中,GC含量为约50%。在一个实施方案中,GC含量为约60%。在一个实施方案中,GC含量为约70%。在一个实施方案中,GC含量为约80%。在一个实施方案中,GC含量为约90%。在一个实施方案中,GC含量为约99%。
表3:终止元件
Figure BDA0004090383130001691
/>
Figure BDA0004090383130001701
在一个方面,本文公开了一种编码多肽的多核苷酸,其中所述多核苷酸包含:(a)5'-UTR,例如,如本文所描述;(b)编码区,所述编码区包含终止元件(例如,如表3中所提供);以及(c)3'-UTR(例如,如本文所描述)。
在一个方面,包含本文所公开的包含终止元件的多核苷酸的LNP组合物包含:(i)可电离脂质,例如,氨基脂质;(ii)固醇或其它结构脂质;(iii)非阳离子辅助脂质或磷脂;以及(iv)PEG-脂质。
在另一个方面,本公开的LNP组合物用于治疗疾病或病症的方法中,或用于抑制受试者的免疫反应的方法中。
在一个方面,包含本文所公开的编码治疗性有效载荷或预防性有效载荷(例如,如本文所描述)的多核苷酸的LNP组合物可以与额外剂(例如,如本文所描述)一起施用。
3'稳定区
除其它外,本文公开了一种编码多肽的多核苷酸,其中所述多核苷酸包含:(a)5'-UTR(例如,如本文所描述);(b)编码区,所述编码区包含终止元件(例如,如本文所描述);(c)3'-UTR(例如,如本文所描述);以及(d)3'稳定区。本文还公开了包含所述多核苷酸的LNP组合物。
在一个实施方案中,多核苷酸包含3'稳定区,例如稳定的尾,例如,如本文所描述。含有3'-稳定区(例如,包括替代性核碱基、糖和/或主链的3'-稳定区)的多核苷酸可能特别有效地用于治疗性组合物中,这是因为它们可能受益于增加的稳定性、高表达水平。实施例14中描述了制备具有3'稳定区的多核苷酸的示例性方法。
在一个实施方案中,3'稳定区包含多聚A尾,例如,包含80-150个,例如120个腺嘌呤的多聚A尾(SEQ ID NO:123)。在一个实施方案中,多聚A尾包含一个或多个非腺苷残基,例如一个或多个鸟苷,例如,如本文所描述。在一个实施方案中,多聚A尾包含UCUAG序列(SEQ ID NO:44)。在一个实施方案中,多聚A尾在SEQ ID NO:44的上游包含约80-120个,例如100个腺嘌呤。在一个实施方案中,多聚A尾在SEQ ID NO:44的下游包含约1-40个,例如20个腺嘌呤。
在一个实施方案中,3'稳定区包含至少一个替代性核苷。在一个实施方案中,替代性核苷是反向胸苷(idT)。在一个实施方案中,替代性核苷位于3'稳定区的3'端。
在一个实施方案中,3'稳定区包含式VII的结构:
Figure BDA0004090383130001711
或其盐,其中每个X独立地是O或S,并且A代表腺嘌呤并且T代表胸腺嘧啶。
在一个方面,本文公开了一种编码多肽的多核苷酸,其中所述多核苷酸包含:(a)5'-UTR,例如,如本文所描述;(b)编码区,所述编码区包含终止元件(例如,如本文所描述);(c)3'-UTR(例如,如本文所描述);以及(d)3'稳定区,例如,如本文所描述。
在一个方面,包含本文所公开的包含稳定区的多核苷酸的LNP组合物包含:(i)可电离脂质,例如,氨基脂质;(ii)固醇或其它结构脂质;(iii)非阳离子辅助脂质或磷脂;以及(iv)PEG-脂质。
在另一个方面,本公开的LNP组合物用于治疗疾病或病症的方法中,或用于抑制受试者的免疫反应的方法中。
在一个方面,包含本文所公开的编码治疗性有效载荷或预防性有效载荷(例如,如本文所描述)的多核苷酸的LNP组合物可以与额外剂(例如,如本文所描述)一起施用。
包含mRNA元件的构建体
将了解,本文所公开的调控元件(例如,5'UTR、终止元件、3'UTR、稳定区(例如,idT或修饰的多聚A尾)可以与编码所关注的任何肽或蛋白质的ORF一起使用,所述肽或蛋白质如治疗性或预防性蛋白质,无论是例如细胞内的、跨膜的还是分泌的。将进一步了解,本文所公开的调控元件可以按模块化方式使用,即,可以在与来自本领域的其它调控元件组合的mRNA构建体中使用(例如,本发明的5'UTR与ORF和来自本领域的其它调控区组合),或可以与本文所公开的其它调控元件(例如,本发明的5'UTR和本发明的3'UTR等)组合使用。将进一步了解,本发明的终止元件可以与缺少终止密码子的所需ORF组合使用。还将了解,当所需ORF包含终止密码子时,额外的终止密码子或终止元件将不包括于最终构建体中。在一些实施方案中,所需ORF中的终止密码子可以用本文所描述的终止元件置换。
mRNA元件的组合
本文所公开的多核苷酸中的任一者可以包含以下元件中的一者、两者、三者或全部:(a)5'-UTR,例如,如本文所描述;(b)编码区,所述编码区包含终止元件(例如,如本文所描述);(c)3'-UTR(例如,如本文所描述);以及任选地(d)3'稳定区,例如,如本文所描述。本文还公开了包含所述多核苷酸的LNP组合物。
在一个实施方案中,本公开的多核苷酸包含(a)表1中所描述的5'UTR或其变体或片段,以及(b)包含表3中所提供的终止元件的编码区。在一个实施方案中,多核苷酸还包含帽结构,例如,如本文所描述,或多聚A尾,例如,如本文所描述。在一个实施方案中,多核苷酸还包含3'稳定区,例如,如本文所描述。
在一个实施方案中,多核苷酸包含(a)5'UTR,所述5'UTR包含SEQ ID NO:8的序列或其变体或片段;以及(b)编码区,所述编码区包括包含SEQ ID NO:26的序列的终止元件。
在一个实施方案中,多核苷酸包含(a)5'UTR,所述5'UTR包含SEQ ID NO:1的序列或其变体或片段;以及(b)编码区,所述编码区包括包含SEQ ID NO:26的序列的终止元件。
在一个实施方案中,多核苷酸包含(a)5'UTR,所述5'UTR包含SEQ ID NO:42的序列或其变体或片段;以及(b)编码区,所述编码区包括包含SEQ ID NO:26的序列的终止元件。
在一个实施方案中,多核苷酸包含(a)5'UTR,所述5'UTR包含SEQ ID NO:8的序列或其变体或片段;以及(b)编码区,所述编码区包括包含SEQ ID NO:33的序列的终止元件。
在一个实施方案中,多核苷酸包含(a)5'UTR,所述5'UTR包含SEQ ID NO:1的序列或其变体或片段;以及(b)编码区,所述编码区包括包含SEQ ID NO:33的序列的终止元件。
在一个实施方案中,多核苷酸包含(a)5'UTR,所述5'UTR包含SEQ ID NO:42的序列或其变体或片段;以及(b)编码区,所述编码区包括包含SEQ ID NO:33的序列的终止元件。
在一个实施方案中,多核苷酸包含(a)5'UTR,所述5'UTR包含SEQ ID NO:8的序列或其变体或片段;(b)编码区,所述编码区包括包含SEQ ID NO:26的序列的终止元件;(c)3'UTR,所述3'UTR包含SEQ ID NO:19的序列;以及(d)多聚A尾,例如,包含SEQ ID NO:50的序列的多聚A尾。
在一个实施方案中,多核苷酸包含(a)5'UTR,所述5'UTR包含SEQ ID NO:1的序列或其变体或片段;(b)编码区,所述编码区包括包含SEQ ID NO:26的序列的终止元件;(c)3'UTR,所述3'UTR包含SEQ ID NO:19的序列;以及(d)多聚A尾,例如,包含SEQ ID NO:50的序列的多聚A尾。
在一个实施方案中,多核苷酸包含(a)5'UTR,所述5'UTR包含SEQ ID NO:1的序列或其变体或片段;(b)编码区,所述编码区包括包含SEQ ID NO:26的序列的终止元件;(c)3'UTR,所述3'UTR包含SEQ ID NO:19的序列;以及(d)多聚A尾,例如,包含SEQ ID NO:50的序列的多聚A尾。
在一个实施方案中,多核苷酸包含(a)5'UTR,所述5'UTR包含SEQ ID NO:8的序列或其变体或片段;(b)编码区,所述编码区包括包含SEQ ID NO:33的序列的终止元件;(c)3'UTR,所述3'UTR包含SEQ ID NO:19的序列;以及(d)多聚A尾,例如,包含SEQ ID NO:50的序列的多聚A尾。
在一个实施方案中,多核苷酸包含(a)5'UTR,所述5'UTR包含SEQ ID NO:1的序列或其变体或片段;(b)编码区,所述编码区包括包含SEQ ID NO:33的序列的终止元件;(c)3'UTR,所述3'UTR包含SEQ ID NO:19的序列;以及(d)多聚A尾,例如,包含SEQ ID NO:50的序列的多聚A尾。
在一个实施方案中,多核苷酸包含(a)5'UTR,所述5'UTR包含SEQ ID NO:1的序列或其变体或片段;(b)编码区,所述编码区包括包含SEQ ID NO:33的序列的终止元件;(c)3'UTR,所述3'UTR包含SEQ ID NO:19的序列;以及(d)多聚A尾,例如,包含SEQ ID NO:50的序列的多聚A尾。
在一个实施方案中,多核苷酸包含(a)5'UTR,所述5'UTR包含SEQ ID NO:1的序列或其变体或片段;(b)编码区,所述编码区包括包含SEQ ID NO:26的序列的终止元件;(c)3'UTR,所述3'UTR包含TENT募集元件(例如,SEQ ID NO:91或92的序列),例如,包含SEQ IDNO:80的序列的3'UTR;以及(d)多聚A尾,例如,包含一个或多个鸟苷残基的多聚A尾,任选地其中所述多聚A尾的长度为100个核苷酸。
在一个实施方案中,多核苷酸包含(a)5'UTR,所述5'UTR包含SEQ ID NO:1的序列或其变体或片段;(b)编码区,所述编码区包括包含SEQ ID NO:26的序列的终止元件;(c)3'UTR,所述3'UTR包含TENT募集元件(例如,SEQ ID NO:91或92的序列)的三个拷贝;以及(d)多聚A尾,例如,包含一个或多个鸟苷残基的多聚A尾,任选地其中所述多聚A尾的长度为100个核苷酸。
在一个实施方案中,多核苷酸包含(a)5'UTR,所述5'UTR包含SEQ ID NO:1的序列或其变体或片段;(b)编码区,所述编码区包括包含SEQ ID NO:33的序列的终止元件;(c)3'UTR,所述3'UTR包含TENT募集元件(例如,SEQ ID NO:91或92的序列),例如,包含SEQ IDNO:80的序列的3'UTR;以及(d)多聚A尾,例如,包含一个或多个鸟苷残基的多聚A尾,任选地其中所述多聚A尾的长度为100个核苷酸。
在一个实施方案中,多核苷酸包含(a)5'UTR,所述5'UTR包含SEQ ID NO:66的序列或其变体或片段;(b)编码区,所述编码区包括包含SEQ ID NO:33的序列的终止元件;(c)3'UTR,所述3'UTR包含TENT募集元件(例如,SEQ ID NO:91或92的序列),例如,包含SEQ IDNO:94的序列的3'UTR;以及(d)多聚A尾,例如,包含一个或多个鸟苷残基的多聚A尾,任选地其中所述多聚A尾的长度为100个核苷酸。
在一个实施方案中,多核苷酸包含(a)5'UTR,所述5'UTR包含SEQ ID NO:66的序列或其变体或片段;(b)编码区,所述编码区包括包含SEQ ID NO:33的序列的终止元件;(c)3'UTR,所述3'UTR包含TENT募集元件(例如,SEQ ID NO:91或92的序列),例如,包含SEQ IDNO:94的序列的3'UTR;以及(d)多聚A尾,例如,包含一个或多个鸟苷残基的多聚A尾,任选地其中所述多聚A尾的长度为100个核苷酸。
在一个实施方案中,多核苷酸包含(a)5'UTR,所述5'UTR包含SEQ ID NO:1的序列或其变体或片段;(b)编码区,所述编码区包括包含SEQ ID NO:26的序列的终止元件;(c)3'UTR,所述3'UTR包含SEQ ID NO:19的序列;以及(d)多聚A尾,例如,包括包含反向胸苷(idT)的3'稳定区的多聚A尾。
在一个实施方案中,多核苷酸包含(a)5'UTR,所述5'UTR包含SEQ ID NO:1的序列或其变体或片段;(b)编码区,所述编码区包括包含SEQ ID NO:26的序列的终止元件;(c)3'UTR,所述3'UTR包含TENT募集元件(例如,SEQ ID NO:91或92的序列),例如,包含SEQ IDNO:80的序列的3'UTR;以及(d)多聚A尾,例如,包含一个或多个鸟苷残基和包含反向胸苷(idT)的3'稳定区的多聚A尾,任选地其中所述多聚A尾的长度为100个核苷酸。
在一个实施方案中,多核苷酸包含(a)5'UTR,所述5'UTR包含SEQ ID NO:66的序列或其变体或片段;(b)编码区,所述编码区包括包含SEQ ID NO:33的序列的终止元件;(c)3'UTR,所述3'UTR包含TENT募集元件(例如,SEQ ID NO:91或92的序列),例如,包含SEQ IDNO:94的序列的3'UTR;以及(d)多聚A尾,例如,包含一个或多个鸟苷残基和包含反向胸苷(idT)的3'稳定区的多聚A尾,任选地其中所述多聚A尾的长度为100个核苷酸。
在一个实施方案中,多核苷酸包含(a)5'UTR,所述5'UTR包含SEQ ID NO:1的序列或其变体或片段;以及(b)3'UTR,所述3'UTR包含SEQ ID NO:11的序列或其变体或片段。
在一个实施方案中,多核苷酸包含(a)5'UTR,所述5'UTR包含SEQ ID NO:1的序列或其变体或片段;以及(b)编码区,所述编码区包括包含SEQ ID NO:26的序列的终止元件。
在一个实施方案中,多核苷酸包含(a)5'UTR,所述5'UTR包含SEQ ID NO:1的序列或其变体或片段;以及(b)编码区,所述编码区包括包含SEQ ID NO:29的序列的终止元件。
在一个实施方案中,多核苷酸包含(a)5'UTR,所述5'UTR包含SEQ ID NO:1的序列或其变体或片段;以及(b)编码区,所述编码区包括包含SEQ ID NO:30的序列的终止元件。
在一个实施方案中,多核苷酸包含(a)5'UTR,所述5'UTR包含SEQ ID NO:1的序列或其变体或片段;以及(b)编码区,所述编码区包括包含SEQ ID NO:32的序列的终止元件。
在一个实施方案中,多核苷酸包含(a)5'UTR,所述5'UTR包含SEQ ID NO:1的序列或其变体或片段;以及(b)编码区,所述编码区包括包含SEQ ID NO:33的序列的终止元件。
在一个实施方案中,多核苷酸包含(a)5'UTR,所述5'UTR包含SEQ ID NO:8的序列或其变体或片段;以及(b)编码区,所述编码区包括包含SEQ ID NO:26的序列的终止元件。
在一个实施方案中,多核苷酸包含(a)5'UTR,所述5'UTR包含SEQ ID NO:8的序列或其变体或片段;以及(b)编码区,所述编码区包括包含SEQ ID NO:29的序列的终止元件。
在一个实施方案中,多核苷酸包含(a)5'UTR,所述5'UTR包含SEQ ID NO:8的序列或其变体或片段;以及(b)编码区,所述编码区包括包含SEQ ID NO:30的序列的终止元件。
在一个实施方案中,多核苷酸包含(a)5'UTR,所述5'UTR包含SEQ ID NO:8的序列或其变体或片段;以及(b)编码区,所述编码区包括包含SEQ ID NO:32的序列的终止元件。
在一个实施方案中,多核苷酸包含(a)5'UTR,所述5'UTR包含SEQ ID NO:8的序列或其变体或片段;以及(b)编码区,所述编码区包括包含SEQ ID NO:33的序列的终止元件。
在一个实施方案中,多核苷酸包含(a)5'UTR,所述5'UTR包含SEQ ID NO:42的序列或其变体或片段;以及(b)编码区,所述编码区包括包含SEQ ID NO:26的序列的终止元件。
在一个实施方案中,多核苷酸包含(a)5'UTR,所述5'UTR包含SEQ ID NO:42的序列或其变体或片段;以及(b)编码区,所述编码区包括包含SEQ ID NO:29的序列的终止元件。
在一个实施方案中,多核苷酸包含(a)5'UTR,所述5'UTR包含SEQ ID NO:42的序列或其变体或片段;以及(b)编码区,所述编码区包括包含SEQ ID NO:30的序列的终止元件。
在一个实施方案中,多核苷酸包含(a)5'UTR,所述5'UTR包含SEQ ID NO:42的序列或其变体或片段;以及(b)编码区,所述编码区包括包含SEQ ID NO:32的序列的终止元件。
在一个实施方案中,多核苷酸包含(a)5'UTR,所述5'UTR包含SEQ ID NO:42的序列或其变体或片段;以及(b)编码区,所述编码区包括包含SEQ ID NO:33的序列的终止元件。
在一个实施方案中,本公开的多核苷酸包含(a)表1中所描述的5'UTR或其变体或片段,以及(c)表2中所描述的3'UTR或其变体或片段。在一个实施方案中,多核苷酸还包含帽结构,例如,如本文所描述,或多聚A尾,例如,如本文所描述。在一个实施方案中,多核苷酸还包含3'稳定区,例如,如本文所描述。
在一个实施方案中,本公开的多核苷酸包含(c)表2中所描述的3'UTR或其变体或片段,以及(b)包含表3中所提供的终止元件的编码区。在一个实施方案中,多核苷酸包含表4中所提供的序列。在一个实施方案中,多核苷酸包含具有如表4中所描述的终止元件的3'UTR。在一个实施方案中,多核苷酸包含与SEQ ID NO:47、48、49、50、122、52、53、54、55、59、60、61、126、127、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119或120中的任一者或其变体或片段具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。在一个实施方案中,多核苷酸还包含帽结构,例如,如本文所描述,或多聚A尾,例如,如本文所描述。在一个实施方案中,多核苷酸还包含3'稳定区,例如,如本文所描述。
在一个实施方案中,本公开的多核苷酸包含(a)表1中所描述的5'UTR或其变体或片段;(b)包含表3中所提供的终止元件的编码区;以及(c)表2中所描述的3'UTR或其变体或片段。在一个实施方案中,多核苷酸还包含帽结构,例如,如本文所描述,或多聚A尾,例如,如本文所描述。在一个实施方案中,多核苷酸还包含3'稳定区,例如,如本文所描述。
表4:示例性3'UTR和终止元件序列
Figure BDA0004090383130001791
/>
Figure BDA0004090383130001801
/>
Figure BDA0004090383130001811
/>
Figure BDA0004090383130001821
/>
Figure BDA0004090383130001831
/>
Figure BDA0004090383130001841
/>
Figure BDA0004090383130001851
在一个实施方案中,多核苷酸包含(a)编码区,所述编码区包括包含SEQ ID NO:36的序列的终止元件;以及(b)3'UTR,所述3'UTR包含SEQ ID NO:19的序列或其变体或片段。在一个实施方案中,多核苷酸包含SEQ ID NO:47的序列或其变体或片段。
在一个实施方案中,多核苷酸包含(a)编码区,所述编码区包括包含SEQ ID NO:35的序列的终止元件;以及(b)3'UTR,所述3'UTR包含SEQ ID NO:19的序列或其变体或片段。在一个实施方案中,多核苷酸包含SEQ ID NO:48的序列或其变体或片段。
在一个实施方案中,多核苷酸包含(a)编码区,所述编码区包括包含SEQ ID NO:34的序列的终止元件;以及(b)3'UTR,所述3'UTR包含SEQ ID NO:19的序列或其变体或片段。在一个实施方案中,多核苷酸包含SEQ ID NO:49的序列或其变体或片段。
在一个实施方案中,多核苷酸包含(a)编码区,所述编码区包括包含SEQ ID NO:33的序列的终止元件;以及(b)3'UTR,所述3'UTR包含SEQ ID NO:19的序列或其变体或片段。在一个实施方案中,多核苷酸包含SEQ ID NO:50的序列或其变体或片段。
在一个实施方案中,多核苷酸包含(a)编码区,所述编码区包括包含SEQ ID NO:32的序列的终止元件;以及(b)3'UTR,所述3'UTR包含SEQ ID NO:19的序列或其变体或片段。在一个实施方案中,多核苷酸包含SEQ ID NO:122的序列或其变体或片段。
在一个实施方案中,多核苷酸包含(a)编码区,所述编码区包括包含SEQ ID NO:31的序列的终止元件;以及(b)3'UTR,所述3'UTR包含SEQ ID NO:19的序列或其变体或片段。在一个实施方案中,多核苷酸包含SEQ ID NO:52的序列或其变体或片段。
在一个实施方案中,多核苷酸包含(a)编码区,所述编码区包括包含SEQ ID NO:30的序列的终止元件;以及(b)3'UTR,所述3'UTR包含SEQ ID NO:19的序列或其变体或片段。在一个实施方案中,多核苷酸包含SEQ ID NO:53的序列或其变体或片段。
在一个实施方案中,多核苷酸包含(a)编码区,所述编码区包括包含SEQ ID NO:29的序列的终止元件;以及(b)3'UTR,所述3'UTR包含SEQ ID NO:19的序列或其变体或片段。在一个实施方案中,多核苷酸包含SEQ ID NO:54的序列或其变体或片段。
在一个实施方案中,多核苷酸包含(a)编码区,所述编码区包括包含SEQ ID NO:28的序列的终止元件;以及(b)3'UTR,所述3'UTR包含SEQ ID NO:19的序列或其变体或片段。在一个实施方案中,多核苷酸包含SEQ ID NO:55的序列或其变体或片段。
在一个实施方案中,多核苷酸包含(a)编码区,所述编码区包括包含SEQ ID NO:35的序列的终止元件;以及(b)3'UTR,所述3'UTR包含SEQ ID NO:19的序列或其变体或片段。在一个实施方案中,多核苷酸包含SEQ ID NO:59的序列或其变体或片段。
在一个实施方案中,多核苷酸包含(a)编码区,所述编码区包括包含SEQ ID NO:32的序列的终止元件;以及(b)3'UTR,所述3'UTR包含SEQ ID NO:60的核苷酸16-188或其变体或片段。在一个实施方案中,多核苷酸包含SEQ ID NO:60的序列或其变体或片段。
在一个实施方案中,多核苷酸包含(a)编码区,所述编码区包括包含SEQ ID NO:33的序列的终止元件;以及(b)3'UTR,所述3'UTR包含SEQ ID NO:61的核苷酸16-188或其变体或片段。在一个实施方案中,多核苷酸包含SEQ ID NO:61的序列。
在一个实施方案中,多核苷酸包含(a)编码区,所述编码区包括包含SEQ ID NO:33的序列的终止元件;以及(b)3'UTR,所述3'UTR包含SEQ ID NO:94的序列或其变体或片段。在一个实施方案中,多核苷酸包含SEQ ID NO:126的序列。
在一个实施方案中,多核苷酸包含(a)编码区,所述编码区包括包含SEQ ID NO:33的序列的终止元件;以及(b)3'UTR,所述3'UTR包含SEQ ID NO:95的序列或其变体或片段。在一个实施方案中,多核苷酸包含SEQ ID NO:127的序列。
在一个实施方案中,多核苷酸包含(a)编码区,所述编码区包括包含SEQ ID NO:27的序列的终止元件;以及(b)3'UTR,所述3'UTR包含SEQ ID NO:11的序列或其变体或片段。在一个实施方案中,多核苷酸包含SEQ ID NO:97的序列。
在一个实施方案中,多核苷酸包含(a)编码区,所述编码区包括包含SEQ ID NO:27的序列的终止元件;以及(b)3'UTR,所述3'UTR包含SEQ ID NO:12的序列或其变体或片段。在一个实施方案中,多核苷酸包含SEQ ID NO:98的序列。
在一个实施方案中,多核苷酸包含(a)编码区,所述编码区包括包含SEQ ID NO:25的序列的终止元件;以及(b)3'UTR,所述3'UTR包含SEQ ID NO:13的序列或其变体或片段。在一个实施方案中,多核苷酸包含SEQ ID NO:99的序列。
在一个实施方案中,多核苷酸包含(a)编码区,所述编码区包括包含SEQ ID NO:25的序列的终止元件;以及(b)3'UTR,所述3'UTR包含SEQ ID NO:14的序列或其变体或片段。在一个实施方案中,多核苷酸包含SEQ ID NO:100的序列。
在一个实施方案中,多核苷酸包含(a)编码区,所述编码区包括包含SEQ ID NO:25的序列的终止元件;以及(b)3'UTR,所述3'UTR包含SEQ ID NO:15的序列或其变体或片段。在一个实施方案中,多核苷酸包含SEQ ID NO:101的序列。
在一个实施方案中,多核苷酸包含(a)编码区,所述编码区包括包含SEQ ID NO:27的序列的终止元件;以及(b)3'UTR,所述3'UTR包含SEQ ID NO:16的序列或其变体或片段。在一个实施方案中,多核苷酸包含SEQ ID NO:102的序列。
在一个实施方案中,多核苷酸包含(a)编码区,所述编码区包括包含SEQ ID NO:27的序列的终止元件;以及(b)3'UTR,所述3'UTR包含SEQ ID NO:17的序列或其变体或片段。在一个实施方案中,多核苷酸包含SEQ ID NO:103的序列。
在一个实施方案中,多核苷酸包含(a)编码区,所述编码区包括包含SEQ ID NO:26的序列的终止元件;以及(b)3'UTR,所述3'UTR包含SEQ ID NO:18的序列或其变体或片段。在一个实施方案中,多核苷酸包含SEQ ID NO:104的序列。
在一个实施方案中,多核苷酸包含(a)编码区,所述编码区包括包含SEQ ID NO:26的序列的终止元件;以及(b)3'UTR,所述3'UTR包含SEQ ID NO:19的序列或其变体或片段。在一个实施方案中,多核苷酸包含SEQ ID NO:105的序列。
在一个实施方案中,多核苷酸包含(a)编码区,所述编码区包括包含SEQ ID NO:26的序列的终止元件;以及(b)3'UTR,所述3'UTR包含SEQ ID NO:20的序列或其变体或片段。在一个实施方案中,多核苷酸包含SEQ ID NO:106的序列。
在一个实施方案中,多核苷酸包含(a)编码区,所述编码区包括包含SEQ ID NO:26的序列的终止元件;以及(b)3'UTR,所述3'UTR包含SEQ ID NO:21的序列或其变体或片段。在一个实施方案中,多核苷酸包含SEQ ID NO:107的序列。
在一个实施方案中,多核苷酸包含(a)编码区,所述编码区包括包含SEQ ID NO:26的序列的终止元件;以及(b)3'UTR,所述3'UTR包含SEQ ID NO:22的序列或其变体或片段。在一个实施方案中,多核苷酸包含SEQ ID NO:108的序列。
在一个实施方案中,多核苷酸包含(a)编码区,所述编码区包括包含SEQ ID NO:26的序列的终止元件;以及(b)3'UTR,所述3'UTR包含SEQ ID NO:23的序列或其变体或片段。在一个实施方案中,多核苷酸包含SEQ ID NO:109的序列。
在一个实施方案中,多核苷酸包含(a)编码区,所述编码区包括包含SEQ ID NO:26的序列的终止元件;以及(b)3'UTR,所述3'UTR包含SEQ ID NO:24的序列或其变体或片段。在一个实施方案中,多核苷酸包含SEQ ID NO:110的序列。
在一个实施方案中,多核苷酸包含(a)编码区,所述编码区包括包含SEQ ID NO:26的序列的终止元件;以及(b)3'UTR,所述3'UTR包含SEQ ID NO:25的序列或其变体或片段。在一个实施方案中,多核苷酸包含SEQ ID NO:111的序列。
在一个实施方案中,多核苷酸包含(a)编码区,所述编码区包括包含SEQ ID NO:26的序列的终止元件;以及(b)3'UTR,所述3'UTR包含SEQ ID NO:79的序列或其变体或片段。在一个实施方案中,多核苷酸包含SEQ ID NO:112的序列。
在一个实施方案中,多核苷酸包含(a)编码区,所述编码区包括包含SEQ ID NO:26的序列的终止元件;以及(b)3'UTR,所述3'UTR包含SEQ ID NO:80的序列或其变体或片段。在一个实施方案中,多核苷酸包含SEQ ID NO:113的序列。
在一个实施方案中,多核苷酸包含(a)编码区,所述编码区包括包含SEQ ID NO:26的序列的终止元件;以及(b)3'UTR,所述3'UTR包含SEQ ID NO:81的序列或其变体或片段。在一个实施方案中,多核苷酸包含SEQ ID NO:114的序列。
在一个实施方案中,多核苷酸包含(a)编码区,所述编码区包括包含SEQ ID NO:26的序列的终止元件;以及(b)3'UTR,所述3'UTR包含SEQ ID NO:82的序列或其变体或片段。在一个实施方案中,多核苷酸包含SEQ ID NO:115的序列。
在一个实施方案中,多核苷酸包含(a)编码区,所述编码区包括包含SEQ ID NO:26的序列的终止元件;以及(b)3'UTR,所述3'UTR包含SEQ ID NO:83的序列或其变体或片段。在一个实施方案中,多核苷酸包含SEQ ID NO:116的序列。
在一个实施方案中,多核苷酸包含(a)编码区,所述编码区包括包含SEQ ID NO:30的序列的终止元件;以及(b)3'UTR,所述3'UTR包含SEQ ID NO:84的序列或其变体或片段。在一个实施方案中,多核苷酸包含SEQ ID NO:117的序列。
在一个实施方案中,多核苷酸包含(a)编码区,所述编码区包括包含SEQ ID NO:96的序列的终止元件;以及(b)3'UTR,所述3'UTR包含SEQ ID NO:22的序列或其变体或片段。在一个实施方案中,多核苷酸包含SEQ ID NO:118的序列。
在一个实施方案中,多核苷酸包含(a)编码区,所述编码区包括包含SEQ ID NO:33的序列的终止元件;以及(b)3'UTR,所述3'UTR包含SEQ ID NO:86的序列或其变体或片段。在一个实施方案中,多核苷酸包含SEQ ID NO:119的序列。
在一个实施方案中,多核苷酸包含(a)编码区,所述编码区包括包含SEQ ID NO:27的序列的终止元件;以及(b)3'UTR,所述3'UTR包含SEQ ID NO:87的序列或其变体或片段。在一个实施方案中,多核苷酸包含SEQ ID NO:120的序列。
治疗性有效载荷或预防性有效载荷
除其它外,本文公开了一种具有本文所描述的5'UTR、本文所描述的3'UTR和/或包含终止元件的编码区的多核苷酸,所述编码区还包含编码有效载荷,例如治疗性有效载荷或预防性有效载荷的序列。在一个实施方案中,编码区编码一个有效载荷。在一个实施方案中,编码区编码多于一个有效载荷,例如2、3、4、5、6个或更多个有效载荷,例如相同或不同的有效载荷。在一个实施方案中,编码每个有效载荷的序列在多核苷酸中是连续的。在一个实施方案中,编码每个有效载荷的序列由至少1-1000个核苷酸隔开。在一些实施方案中,治疗性有效载荷或预防性有效载荷包含编码以下的mRNA:分泌蛋白;膜结合蛋白;或细胞间蛋白,或肽、多肽或其生物活性片段。
本文还公开了一种包含多核苷酸的LNP,所述多核苷酸包含编码有效载荷,例如治疗性有效载荷或预防性有效载荷的编码区。在一些实施方案中,治疗性有效载荷或预防性有效载荷包含编码以下的mRNA:分泌蛋白;膜结合蛋白;或细胞间蛋白,或肽、多肽或其生物活性片段。
在一些实施方案中,治疗性有效载荷或预防性有效载荷包含编码分泌蛋白或肽、多肽或其生物活性片段的mRNA。在一些实施方案中,分泌蛋白包含细胞因子或其变体或片段(例如,生物活性片段)。在一些实施方案中,分泌蛋白包含抗体或其变体或片段(例如,生物活性片段)。在一些实施方案中,分泌蛋白包含酶或其变体或片段(例如,生物活性片段)。在一些实施方案中,分泌蛋白包含激素或其变体或片段(例如,生物活性片段)。在一些实施方案中,分泌蛋白包含配体或其变体或片段(例如,生物活性片段)。在一些实施方案中,分泌蛋白包含疫苗(例如,抗原、免疫原性表位)或其组分、变体或片段(例如,生物活性片段)。在一些实施方案中,疫苗是预防性疫苗。在一些实施方案中,疫苗是治疗性疫苗,例如,癌症疫苗。在一些实施方案中,分泌蛋白包含生长因子或其组分、变体或片段(例如,生物活性片段)。在一些实施方案中,分泌蛋白包含免疫调节剂,例如,免疫检查点激动剂或拮抗剂。
在一些实施方案中,治疗性有效载荷或预防性有效载荷包含编码膜结合蛋白或肽、多肽或其生物活性片段的mRNA。在一些实施方案中,膜结合蛋白包含疫苗(例如,抗原、免疫原性表位)或其组分、变体或片段(例如,生物活性片段)。在一些实施方案中,疫苗是预防性疫苗。在一些实施方案中,疫苗是治疗性疫苗,例如,癌症疫苗。在一些实施方案中,膜结合蛋白包含配体、其变体或片段(例如,生物活性片段)。在一些实施方案中,膜结合蛋白包含膜转运体、其变体或片段(例如,生物活性片段)。在一些实施方案中,膜结合蛋白包含结构蛋白、其变体或片段(例如,生物活性片段)。在一些实施方案中,膜结合蛋白包含免疫调节剂,例如,免疫检查点激动剂或拮抗剂。
在一些实施方案中,治疗性有效载荷或预防性有效载荷包含编码细胞内蛋白或肽、多肽或其生物活性片段的mRNA。在一些实施方案中,细胞内蛋白包含酶或其变体或片段(例如,生物活性片段)。在一些实施方案中,细胞内蛋白包含转录因子或其变体或片段(例如,生物活性片段)。在一些实施方案中,细胞内蛋白包含核酸酶或其变体或片段(例如,生物活性片段)。在一些实施方案中,细胞内蛋白包含结构蛋白或其变体或片段(例如,生物活性片段)。
在一些实施方案中,治疗性有效载荷或预防性有效载荷选自细胞因子、抗体、疫苗(例如,抗原、免疫原性表位)、受体、酶、激素、转录因子、配体、膜转运体、结构蛋白、核酸酶、生长因子、免疫调节剂或其组分、变体或片段(例如,生物活性片段)。
在一些实施方案中,治疗性有效载荷或预防性有效载荷包含蛋白质或肽。
将了解,本文所公开的调控元件(例如,5'UTR、终止元件、3'UTR、稳定区(例如,idT或修饰的多聚A尾)可以与编码本文所描述的有效载荷的ORF一起使用。将进一步了解,本文所公开的调控元件可以按模块化方式使用,即,可以在与来自本领域的其它调控元件组合的mRNA构建体中使用(例如,本发明的5'UTR与ORF和来自本领域的其它调控区组合),或可以与本文所公开的其它调控元件(例如,本发明的5'UTR和本发明的3'UTR等)组合使用。将进一步了解,本发明的终止元件可以与缺少终止密码子的所需ORF组合使用。还将了解,当所需ORF包含终止密码子时,额外的终止密码子或终止元件将不包括于最终构建体中。在一些实施方案中,所需ORF中的终止密码子可以用本文所描述的终止元件置换。
微RNA(miRNA)结合位点
本公开的核酸分子(例如RNA,例如mRNA)可以包括调控元件,例如,微RNA(miRNA)结合位点、转录因子结合位点、结构化mRNA序列和/或基序、经工程改造以充当内源核酸结合分子的假受体的人工结合位点以及它们的组合。
在一些实施方案中,本公开的核酸分子(例如RNA,例如mRNA)包含编码所关注的多肽的开放阅读框(ORF)并且还包含一个或多个miRNA结合位点。基于天然存在的miRNA的组织特异性和/或细胞类型特异性表达,包含或并入一个或多个miRNA结合位点提供了对本公开的核酸分子(例如RNA,例如mRNA)的调控,进而提供了对由其编码的多肽的调控。
miRNA,例如天然存在的miRNA是19-25个核苷酸长的非编码RNA,其结合至核酸分子(例如RNA,例如mRNA)并且通过降低多核苷酸的稳定性或通过抑制其翻译来下调基因表达。miRNA序列包含“种子”区,即,成熟miRNA的位置2-8的区域中的序列。miRNA种子可以包含成熟miRNA的位置2-8或2-7。在一些实施方案中,miRNA种子可以包含7个核苷酸(例如,成熟miRNA的核苷酸2-8),其中相应miRNA结合位点中的种子互补位点侧接有与miRNA位置1相对的腺苷(A)。在一些实施方案中,miRNA种子可以包含6个核苷酸(例如,成熟miRNA的核苷酸2-7),其中相应miRNA结合位点中的种子互补位点侧接有与miRNA位置1相对的腺苷(A)。参见例如Grimson A,Farh KK,Johnston WK,Garrett-Engele P,Lim LP,Bartel DP;MolCell.2007年7月6日;27(1):91-105。可以对靶细胞或组织的miRNA进行谱分析,以确定细胞或组织中miRNA的存在或不存在。在一些实施方案中,本公开的核酸分子(例如RNA,例如mRNA)包含一个或多个微RNA结合位点、微RNA靶序列、微RNA互补序列或微RNA种子互补序列。此类序列可以对应于任何已知的微RNA,诸如美国公布US2005/0261218和美国公布US2005/0059005中教示的那些,例如与所述微RNA具有互补性,这些公布中的每一者的内容以全文引用的方式并入本文中。
如本文所用,术语“微RNA(miRNA或miR)结合位点”是指核酸分子内(例如DNA内或RNA转录物内,包括5′UTR和/或3′UTR中)的序列,其与全部miRNA或其区域具有充足互补性以与miRNA相互作用、缔合或结合。在一些实施方案中,本公开的核酸分子(例如RNA,例如mRNA)包含编码所关注的多肽的ORF并且还包含一个或多个miRNA结合位点。在示例性实施方案中,核酸分子(例如RNA,例如mRNA)的5'UTR和/或3'UTR包含一个或多个miRNA结合位点。
与miRNA具有充足互补性的miRNA结合位点是指互补程度足以促进miRNA介导的核酸分子(例如RNA,例如mRNA)调控,例如,miRNA介导的核酸分子(例如RNA,例如mRNA)的翻译抑制或降解。在本公开的示例性方面,与miRNA具有充足互补性的miRNA结合位点是指互补程度足以促进miRNA介导的核酸分子(例如RNA,例如mRNA)降解,例如,miRNA指导的RNA诱导的沉默复合物(RISC)介导的mRNA裂解。miRNA结合位点可以与例如19-25个核苷酸的miRNA序列、19-23个核苷酸的miRNA序列或22个核苷酸的miRNA序列具有互补性。miRNA结合位点可以仅与miRNA的一部分互补,例如,与天然存在的miRNA序列的全长的小于1、2、3或4个核苷酸的部分互补。当所需调控是mRNA降解时,充分或完全互补性(例如,在天然存在的miRNA的长度的全部或大部分上充分互补或完全互补)是优选的。
在一些实施方案中,miRNA结合位点包括与miRNA种子序列具有互补性(例如,部分或完全互补性)的序列。在一些实施方案中,miRNA结合位点包括与miRNA种子序列具有完全互补性的序列。在一些实施方案中,miRNA结合位点包括与miRNA序列具有互补性(例如,部分或完全互补性)的序列。在一些实施方案中,miRNA结合位点包括与miRNA序列具有完全互补性的序列。在一些实施方案中,miRNA结合位点与miRNA序列具有完全互补性,但具有1、2或3个核苷酸取代、末端添加和/或截短。
在一些实施方案中,miRNA结合位点的长度与相应miRNA相同。在其它实施方案中,在5'末端、3'末端或两个末端处,miRNA结合位点比相应miRNA短一个、两个、三个、四个、五个、六个、七个、八个、九个、十个、十一个或十二个核苷酸。在其它实施方案中,在5'末端、3'末端或两个末端处,微RNA结合位点比相应微RNA短两个核苷酸。比相应miRNA短的miRNA结合位点仍然能够使并入一个或多个miRNA结合位点的mRNA降解或防止mRNA翻译。
在一些实施方案中,miRNA结合位点结合相应成熟miRNA,所述成熟miRNA是含有Dicer的活性RISC的一部分。在另一个实施方案中,miRNA结合位点与RISC中的相应miRNA的结合使含有miRNA结合位点的mRNA降解或防止mRNA翻译。在一些实施方案中,miRNA结合位点与miRNA具有充足互补性,使得包含miRNA的RISC复合物使包含miRNA结合位点的核酸分子(例如RNA,例如mRNA)裂解。在其它实施方案中,miRNA结合位点具有不完美互补性,使得包含miRNA的RISC复合物诱导包含miRNA结合位点的核酸分子(例如RNA,例如mRNA)中的不稳定性。在另一个实施方案中,miRNA结合位点具有不完美互补性,使得包含miRNA的RISC复合物抑制包含miRNA结合位点的核酸分子(例如RNA,例如mRNA)的转录。
在一些实施方案中,miRNA结合位点与相应miRNA具有一个、两个、三个、四个、五个、六个、七个、八个、九个、十个、十一个或十二个错配。
在一些实施方案中,miRNA结合位点具有分别与相应miRNA的至少约十个、至少约十一个、至少约十二个、至少约十三个、至少约十四个、至少约十五个、至少约十六个、至少约十七个、至少约十八个、至少约十九个、至少约二十个或至少约二十一个连续核苷酸互补的至少约十个、至少约十一个、至少约十二个、至少约十三个、至少约十四个、至少约十五个、至少约十六个、至少约十七个、至少约十八个、至少约十九个、至少约二十个或至少约二十一个连续核苷酸。
通过将一个或多个miRNA结合位点工程改造至本公开的核酸分子(例如RNA,例如mRNA)中,所述核酸分子(例如RNA,例如mRNA)可以被靶向用于降解或减少的翻译,前提条件是可获得所讨论的miRNA。这可以减少核酸分子(例如RNA,例如mRNA)递送时的脱靶效应。举例来说,如果本公开的核酸分子(例如RNA,例如mRNA)不欲递送至组织或细胞,而是终止于所述组织或细胞,则如果将miRNA的一个或多个结合位点工程改造至所述核酸分子(例如RNA,例如mRNA)的5'UTR和/或3'UTR中,则所述组织或细胞中丰富的miRNA可以抑制所关注基因的表达。
举例来说,本领域技术人员将了解一个或多个miR结合位点可以包括于核酸分子(例如RNA,例如mRNA)中以使除淋巴样细胞以外的细胞类型中的表达最小化。在一个实施方案中,可以使用miR122结合位点。在另一个实施方案中,可以使用miR126结合位点。在又一个实施方案中,可以使用这些miR结合位点或组合的多个拷贝。
相反地,miRNA结合位点可从其中天然存在这些结合位点的核酸分子(例如RNA,例如mRNA)序列中去除,以增加特定组织中的蛋白质表达。举例来说,针对特定miRNA的结合位点可以从核酸分子(例如RNA,例如mRNA)中去除以改善含有miRNA的组织或细胞中的蛋白质表达。
对多种组织中的表达的调控可以通过引入或去除一个或多个miRNA结合位点,例如一个或多个不同miRNA结合位点来实现。可以基于发育和/或疾病中的组织和/或细胞中的miRNA表达模式和/或其谱分析来决定是否去除或插入miRNA结合位点。已经报告了对miRNA、miRNA结合位点及其表达模式和在生物学中的作用的鉴定(例如,Bonauer等,CurrDrug Targets 2010 11:943-949;Anand和Cheresh Curr Opin Hematol 2011 18:171-176;Contreras和Rao Leukemia 2012 26:404-413(2011年12月20日.doi:10.1038/leu.2011.356);Bartel Cell 2009 136:215-233;Landgraf等,Cell,2007 129:1401-1414;Gentner和Naldini,Tissue Antigens.201280:393-403以及其中所有参考文献;所述文献中的每一者以全文引用的方式并入本文中)。
miRNA和miRNA结合位点可以对应于任何已知序列,包括美国公布号2014/0200261、2005/0261218和2005/0059005中所描述的非限制性实例,所述公布中的每一者以全文引用的方式并入本文中。
其中已知miRNA调控mRNA并且由此调控蛋白质表达的组织的实例包括但不限于肝脏(miR-122)、肌肉(miR-133、miR-206、miR-208)、内皮细胞(miR-17-92、miR-126)、骨髓细胞(miR-142-3p、miR-142-5p、miR-16、miR-21、miR-223、miR-24、miR-27)、脂肪组织(let-7、miR-30c)、心脏(miR-1d、miR-149)、肾(miR-192、miR-194、miR-204)和肺上皮细胞(let-7、miR-133、miR-126)。
具体来说,已知miRNA在免疫细胞(也称为造血细胞),诸如抗原呈递细胞(APC)(例如,树突状细胞和单核细胞)、单核细胞、单核细胞、B淋巴细胞、T淋巴细胞、粒细胞、自然杀伤细胞等中差异性地表达。免疫细胞特异性miRNA涉及于免疫原性、自身免疫性、对感染的免疫反应、炎症以及在基因疗法和组织/器官移植之后的非所需免疫反应中。免疫细胞特异性miRNA还调控造血细胞(免疫细胞)的发育、增殖、分化和凋亡的许多方面。举例来说,miR-142和miR-146仅在免疫细胞中表达,尤其在骨髓树突状细胞中很丰富。已经证明了对核酸分子(例如RNA,例如mRNA)的免疫反应可以通过向多核苷酸的3'-UTR中添加miR-142结合位点来关闭,使得能够在组织和细胞中进行更稳定的基因转移。miR-142有效地使抗原呈递细胞中的外源核酸分子(例如RNA,例如mRNA)降解并且抑制转导的细胞的细胞毒性消除(例如,Annoni A等,blood,2009,114,5152-5161;Brown BD等,Nat med.2006,12(5),585-591;Brown BD等,blood,2007,110(13):4144-4152,所述文献中的每一者以全文引用的方式并入本文中)。
抗原介导的免疫反应可以指由外来抗原触发的免疫反应,这些外来抗原在进入生物体时由抗原呈递细胞处理并且呈现于抗原呈递细胞的表面上。T细胞可以识别呈递的抗原并且诱导表达所述抗原的细胞的细胞毒性消除。
将miR-142结合位点引入本公开的核酸分子的5'UTR和/或3'UTR中可以通过miR-142介导的降解选择性地抑制抗原呈递细胞中的基因表达,从而限制抗原呈递细胞(例如,树突状细胞)中的抗原呈递并且由此防止在递送核酸分子(例如RNA,例如mRNA)之后出现抗原介导的免疫反应。核酸分子(例如RNA,例如mRNA)然后在靶组织或细胞中稳定表达而不会触发细胞毒性消除。
在一个实施方案中,可以将已知在免疫细胞、尤其抗原呈递细胞中表达的miRNA的结合位点工程改造至本公开的核酸分子(例如RNA,例如mRNA)中,以通过miRNA介导的RNA降解来抑制抗原呈递细胞中核酸分子(例如RNA,例如mRNA)的表达,从而抑制抗原介导的免疫反应。核酸分子(例如RNA,例如mRNA)在其中未表达免疫细胞特异性miRNA的非免疫细胞中维持表达。举例来说,在一些实施方案中,为了防止针对肝脏特异性蛋白的免疫原性反应,可以去除任何miR-122结合位点并且可以将miR-142(和/或mirR-146)结合位点工程改造至本公开的核酸分子的5'UTR和/或3'UTR中。
为了进一步驱动APC和巨噬细胞中的选择性降解和抑制,本公开的核酸分子(例如RNA,例如mRNA)可以在5'UTR和/或3'UTR中包括另一负调控元件,单独或与miR-142和/或miR-146结合位点组合。作为一个非限制性实例,另一负调控元件是组成性衰减元件(CDE)。
免疫细胞特异性miRNA包括但不限于hsa-let-7a-2-3p、hsa-let-7a-3p、hsa-7a-5p、hsa-let-7c、hsa-let-7e-3p、hsa-let-7e-5p、hsa-let-7g-3p、hsa-let-7g-5p、hsa-let-7i-3p、hsa-let-7i-5p、miR-10a-3p、miR-10a-5p、miR-1184、hsa-let-7f-1--3p、hsa-let-7f-2--5p、hsa-let-7f-5p、miR-125b-1-3p、miR-125b-2-3p、miR-125b-5p、miR-1279、miR-130a-3p、miR-130a-5p、miR-132-3p、miR-132-5p、miR-142-3p、miR-142-5p、miR-143-3p、miR-143-5p、miR-146a-3p、miR-146a-5p、miR-146b-3p、miR-146b-5p、miR-147a、miR-147b、miR-148a-5p、miR-148a-3p、miR-150-3p、miR-150-5p、miR-151b、miR-155-3p、miR-155-5p、miR-15a-3p、miR-15a-5p、miR-15b-5p、miR-15b-3p、miR-16-1-3p、miR-16-2-3p、miR-16-5p、miR-17-5p、miR-181a-3p、miR-181a-5p、miR-181a-2-3p、miR-182-3p、miR-182-5p、miR-197-3p、miR-197-5p、miR-21-5p、miR-21-3p、miR-214-3p、miR-214-5p、miR-223-3p、miR-223-5p、miR-221-3p、miR-221-5p、miR-23b-3p、miR-23b-5p、miR-24-1-5p、miR-24-2-5p、miR-24-3p、miR-26a-1-3p、miR-26a-2-3p、miR-26a-5p、miR-26b-3p、miR-26b-5p、miR-27a-3p、miR-27a-5p、miR-27b-3p、miR-27b-5p、miR-28-3p、miR-28-5p、miR-2909、miR-29a-3p、miR-29a-5p、miR-29b-1-5p、miR-29b-2-5p、miR-29c-3p、miR-29c-5p、miR-30e-3p、miR-30e-5p、miR-331-5p、miR-339-3p、miR-339-5p、miR-345-3p、miR-345-5p、miR-346、miR-34a-3p、miR-34a-5p、miR-363-3p、miR-363-5p、miR-372、miR-377-3p、miR-377-5p、miR-493-3p、miR-493-5p、miR-542、miR-548b-5p、miR548c-5p、miR-548i、miR-548j、miR-548n、miR-574-3p、miR-598、miR-718、miR-935、miR-99a-3p、miR-99a-5p、miR-99b-3p和miR-99b-5p。此外,可以通过微阵列杂交和切片机分析在免疫细胞中鉴定新颖miRNA(例如,Jima DD等,Blood,2010,116:e118-e127;Vaz C等,BMC Genomics,2010,11,288,所述文献中的每一者的内容以全文引用的方式并入本文中)。
在一些实施方案中,将miRNA结合位点在核酸分子(例如RNA,例如mRNA)的任何位置(例如,5'UTR和/或3'UTR)处插入本公开的核酸分子(例如RNA,例如mRNA)中。在一些实施方案中,5'UTR包含miRNA结合位点。在一些实施方案中,3'UTR包含miRNA结合位点。在一些实施方案中,5'UTR和3'UTR包含miRNA结合位点。核酸分子(例如RNA,例如mRNA)中的插入位点可以在核酸分子(例如RNA,例如mRNA)中的任何位置,只要在不存在相应miRNA的情况下,在核酸分子(例如RNA,例如mRNA)中插入miRNA结合位点不干扰功能性多肽的翻译;并且在存在miRNA的情况下,在核酸分子(例如RNA,例如mRNA)中插入miRNA结合位点以及miRNA结合位点与相应miRNA的结合能够使多核苷酸降解或防止核酸分子(例如RNA,例如mRNA)翻译。
在一些实施方案中,将miRNA结合位点插入本公开的包含ORF的核酸分子(例如RNA,例如mRNA)中ORF的终止密码子下游的至少约30个核苷酸中。在一些实施方案中,将miRNA结合位点插入本公开的多核苷酸中ORF的终止密码子下游的至少约10个核苷酸、至少约15个核苷酸、至少约20个核苷酸、至少约25个核苷酸、至少约30个核苷酸、至少约35个核苷酸、至少约40个核苷酸、至少约45个核苷酸、至少约50个核苷酸、至少约55个核苷酸、至少约60个核苷酸、至少约65个核苷酸、至少约70个核苷酸、至少约75个核苷酸、至少约80个核苷酸、至少约85个核苷酸、至少约90个核苷酸、至少约95个核苷酸或至少约100个核苷酸中。在一些实施方案中,将miRNA结合位点插入本公开的核酸分子(例如RNA,例如mRNA)中ORF的终止密码子下游的约10个核苷酸至约100个核苷酸、约20个核苷酸至约90个核苷酸、约30个核苷酸至约80个核苷酸、约40个核苷酸至约70个核苷酸、约50个核苷酸至约60个核苷酸、约45个核苷酸至约65个核苷酸中。
miRNA基因调控可能受miRNA周围的序列影响,诸如但不限于周围序列的种类、序列的类型(例如异源、同源、外源、内源或人工)、周围序列中的调控元件和/或周围序列中的结构元件。miRNA可能受5'UTR和/或3'UTR影响。作为一个非限制性实例,与相同序列类型的人类3'UTR相比,非人类3'UTR可以增加miRNA序列对所关注多肽的表达的调控作用。
在一个实施方案中,5'UTR的其它调控元件和/或结构元件可能影响miRNA介导的基因调控。调控元件和/或结构元件的一个实例是5'UTR中的结构化IRES(内部核糖体进入位点),它是结合翻译延伸因子以启动蛋白质翻译所必需的。EIF4A2与5'-UTR中的这种二级结构化元件的结合是miRNA介导的基因表达所必需的(Meijer HA等,Science,2013,340,82-85,以全文引用的方式并入本文中)。本公开的核酸分子(例如RNA,例如mRNA)还可以包括这种结构化5'UTR以增强微RNA介导的基因调控。
可以将至少一个miRNA结合位点工程改造至本公开的多核苷酸的3'UTR中。在这种情形中,可以将至少两个、至少三个、至少四个、至少五个、至少六个、至少七个、至少八个、至少九个、至少十个或更多个miRNA结合位点工程改造至本公开的核酸分子(例如RNA,例如mRNA)的3'UTR中。举例来说,可以将1至10个、1至9个、1至8个、1至7个、1至6个、1至5个、1至4个、1至3个、2个或1个miRNA结合位点工程改造至本公开的核酸分子(例如RNA,例如mRNA)的3'UTR中。在一个实施方案中,并入本公开的核酸分子(例如RNA,例如mRNA)中的miRNA结合位点可以是相同的或可以是不同的miRNA位点。并入本公开的核酸分子(例如RNA,例如mRNA)中的不同miRNA结合位点的组合可以包括其中并入不同miRNA位点中的任一者的多于一个拷贝的组合。在另一个实施方案中,并入本公开的核酸分子(例如RNA,例如mRNA)中的miRNA结合位点可以靶向体内相同或不同的组织。作为一个非限制性实例,通过在本公开的核酸分子(例如RNA,例如mRNA)的3'-UTR中引入组织、细胞类型或疾病特异性miRNA结合位点,可以降低特定细胞类型(例如,肝细胞、骨髓细胞、内皮细胞、癌细胞等)中的表达程度。
在一个实施方案中,可以将miRNA结合位点工程改造至本公开的核酸分子(例如RNA,例如mRNA)中的3'UTR的5'末端附近、3'UTR的5'末端与3'末端之间约一半处和/或3'UTR的3'末端附近。作为一个非限制性实例,可以将miRNA结合位点工程改造至3'UTR的5'末端附近和3'UTR的5'末端与3'末端之间约一半处。作为另一个非限制性实例,可以将miRNA结合位点工程改造至3'UTR的3'末端附近和3'UTR的5'末端与3'末端之间约一半处。作为又一个非限制性实例,可以miRNA结合位点工程改造至3'UTR的5'末端附近和3'UTR的3'末端附近。
在另一个实施方案中,3'UTR可以包含1、2、3、4、5、6、7、8、9或10个miRNA结合位点。miRNA结合位点可以与miRNA、miRNA种子序列和/或侧接种子序列的miRNA序列互补。
可以对本公开的核酸分子(例如RNA,例如mRNA)进行工程改造以基于不同组织、细胞类型或生物条件中miRNA的表达模式在特定组织、细胞类型或生物条件中进行更具靶向性的表达。通过引入组织特异性miRNA结合位点,可以设计本公开的核酸分子(例如RNA,例如mRNA)以在组织或细胞中或在生物条件的情形中进行最佳蛋白质表达。
在一些实施方案中,本公开的核酸分子(例如RNA,例如mRNA)可以在3'UTR中包含至少一个miRNA结合位点,以选择性地使免疫细胞中的mRNA治疗剂降解以抑制由治疗性递送引起的不需要的免疫原性反应。作为一个非限制性实例,miRNA结合位点可以使本公开的核酸分子(例如RNA,例如mRNA)在抗原呈递细胞中更不稳定。这些miRNA的非限制性实例包括mir-142-5p、mir-142-3p、mir-146a-5p和mir-146-3p。
5'UTR和3'UTR的额外特征
UTR可以与多核苷酸中的编码区同源或异源。在一些实施方案中,UTR与编码治疗性有效载荷或预防性有效载荷的ORF同源。在一些实施方案中,UTR与编码治疗性有效载荷或预防性有效载荷的ORF异源。
在一些实施方案中,多核苷酸包含两个或更多个5'UTR或其功能片段,各自具有相同或不同的核苷酸序列。在一些实施方案中,多核苷酸包含两个或更多个3'UTR或其功能片段,各自具有相同或不同的核苷酸序列。
在一些实施方案中,对5'UTR或其功能片段、3'UTR或其功能片段或它们的任何组合进行序列优化。
在一些实施方案中,5'UTR或其功能片段、3'UTR或其功能片段或它们的任何组合包含至少一个化学修饰的核碱基,例如,N1-甲基假尿嘧啶或5-甲氧基尿嘧啶。
UTR可以具有提供调控作用的特征,例如,增加或减少的稳定性、定位和/或翻译效率。可以向细胞、组织或生物体施用包含UTR的多核苷酸,并且可以使用常规方法测量一个或多个调控特征。在一些实施方案中,5'UTR或3'UTR的功能片段分别包含全长5'或3'UTR的一个或多个调控特征。
天然5'UTR具有在翻译起始中起作用的特征。它们具有像Kozak序列这样的特征,通常已知这些特征涉及于核糖体启动许多基因翻译的过程中。Kozak序列具有共有CCR(A/G)CCAUGG(SEQ ID NO:125),其中R是起始密码子(AUG)上游三个碱基的嘌呤(腺嘌呤或鸟嘌呤),其后是另一个‘G’。还已知5'UTR形成涉及于延伸因子结合中的二级结构。
通过对特定靶器官的大量表达的基因中通常发现的特征进行工程改造,可以增强多核苷酸的稳定性和蛋白质产量。举例来说,引入肝脏表达的mRNA,诸如白蛋白、血清淀粉样蛋白A、载脂蛋白A/B/E、转铁蛋白、α胎蛋白、促红细胞生成素或因子VIII的5'UTR可以增强肝细胞系或肝脏中多核苷酸的表达。同样地,对于肌肉(例如,MyoD、肌球蛋白、肌红蛋白、肌细胞生成素、棒状花椒酰胺(Herculin))、对于内皮细胞(例如,Tie-1、CD36)、对于骨髓细胞(例如,C/EBP、AML1、G-CSF、GM-CSF、CD11b、MSR、Fr-1、i-NOS)、对于白细胞(例如,CD45、CD18)、对于脂肪组织(例如,CD36、GLUT4、ACRP30、脂联素)以及对于肺上皮细胞(例如,SP-A/B/C/D),使用来自其它组织特异性mRNA的5'UTR改善那个组织中的表达是可能的。
在一些实施方案中,UTR选自其蛋白质共享共同功能、结构、特征或特性的转录物家族。举例来说,编码的多肽可以属于在特定细胞、组织中或在发育期间的特定时间表达的蛋白质家族(即,共享至少一种功能、结构、特征、定位、起源或表达模式)。来自基因或mRNA中的任一者的UTR可以与相同或不同蛋白质家族的其它UTR中的任一者交换,以产生新的多核苷酸。在一些实施方案中,5'UTR和3'UTR可以是异源的。在一些实施方案中,5'UTR可以源自与3'UTR不同的种类。在一些实施方案中,3'UTR可以源自与5'UTR不同的种类。
共同拥有的国际专利申请号PCT/US2014/021522(公开号WO/2014/164253,以全文引用的方式并入本文中)提供了可以在本发明的多核苷酸中用作ORF的侧翼区的示例性UTR的清单。
本申请的额外示例性UTR包括但不限于一个或多个源自以下核酸序列的5'UTR和/或3'UTR:球蛋白,诸如α-球蛋白或β-球蛋白(例如,爪蟾、小鼠、兔或人类球蛋白);强Kozak翻译起始信号;CYBA(例如,人类细胞色素b-245α多肽);白蛋白(例如,人类白蛋白7);HSD17B4(羟基类固醇(17-β)脱氢酶);病毒(例如,烟草蚀纹病毒(TEV)、委内瑞拉马脑炎病毒(VEEV)、登革热病毒、巨细胞病毒(CMV)(例如,CMV立即早期1(IE1))、肝炎病毒(例如,乙型肝炎病毒)、辛德毕斯病毒(sindbis virus)或PAV大麦黄矮病毒);热休克蛋白(例如,hsp70);翻译起始因子(例如,elF4G);葡萄糖转运体(例如,hGLUT1(人类葡萄糖转运体1));肌动蛋白(例如,人类α或β肌动蛋白);GAPDH;微管蛋白;组蛋白;柠檬酸循环酶;拓扑异构酶(例如,缺少5'TOP基序(寡嘧啶序列段)的TOP基因的5'UTR);核糖体蛋白大32(L32);核糖体蛋白(例如人类或小鼠核糖体蛋白,诸如rps9);ATP合酶(例如,ATP5A1或线粒体H+-ATP合酶的β亚基);生长激素e(例如,牛(bGH)或人类(hGH));廷伸因子(例如,廷伸因子1α1(EEF1A1));锰超氧化物歧化酶(MnSOD);肌细胞增强因子2A(MEF2A);β-F1-ATPase、肌酸激酶、肌红蛋白、粒细胞集落刺激因子(G-CSF);胶原蛋白(例如,I型胶原蛋白α2(Col1A2)、I型胶原蛋白α1(Col1A1)、VI型胶原蛋白α2(Col6A2)、VI型胶原蛋白α1(Col6A1));核糖体结合蛋白(例如,核糖体结合蛋白I(RPNI));低密度脂蛋白受体相关蛋白(例如,LRP1);心肌营养素样细胞因子(例如,Nnt1);钙网蛋白(Calr);前胶原-赖氨酸2-氧代戊二酸5-双加氧酶1(Plod1);以及核连蛋白(例如,Nucb1)。
在一些实施方案中,5'UTR选自由以下组成的组:β球蛋白5'UTR;含有强Kozak翻译起始信号的5'UTR;细胞色素b-245α多肽(CYBA)5'UTR;羟基类固醇(17-β)脱氢酶(HSD17B4)5'UTR;烟草蚀纹病毒(TEV)5'UTR;委内瑞拉马脑炎病毒(TEEV)5'UTR;编码非结构蛋白的风疹病毒(RV)RNA的5'近端开放阅读框;登革热病毒(DEN)5'UTR;热休克蛋白70(Hsp70)5'UTR;eIF4G 5'UTR;GLUT15'UTR;其功能片段,以及它们的任何组合。
在一些实施方案中,3'UTR选自由以下组成的组:β球蛋白3'UTR;CYBA 3'UTR;白蛋白3'UTR;生长激素(GH)3'UTR;VEEV 3'UTR;乙型肝炎病毒(HBV)3'UTR;α-球蛋白3'UTR;DEN3'UTR;PAV大麦黄矮病毒(BYDV-PAV)3'UTR;延伸因子1α1(EEF1A1)3'UTR;锰超氧化物歧化酶(MnSOD)3'UTR;线粒体H(+)-ATP合酶(β-mRNA)3'UTR的β亚基;GLUT1 3'UTR;MEF2A 3'UTR;β-F1-ATPase 3'UTR;其功能片段,以及它们的组合。
可以将源自任何基因或mRNA的野生型UTR并入本发明的多核苷酸中。在一些实施方案中,可以相对于野生型或原生UTR改变UTR以产生变体UTR,例如,通过改变UTR相对于ORF的方向或位置;或通过包含额外的核苷酸、核苷酸的缺失、核苷酸的交换或转座。在一些实施方案中,可以利用5'或3'UTR的变体,例如,野生型UTR的突变体,或其中一个或多个核苷酸添加至UTR的末端或从UTR的末端去除的变体。
另外,一个或多个合成UTR可以与一个或多个非合成UTR组合使用。参见例如Mandal和Rossi,Nat.Protoc.2013 8(3):568-82,其内容以全文引用的方式并入本文中。
UTR或其部分可以放置在与从中选择它们的转录物中相同的方向上,或者可以改变方向或位置。因此,5'和/或3'UTR可以是反向的、缩短的、加长的或与一个或多个其它5'UTR或3'UTR组合。
在一些实施方案中,多核苷酸包含多个UTR,例如,双重、三重或四重5'UTR或3'UTR。举例来说,双重UTR包括串联或基本串联的相同UTR的两个拷贝。举例来说,可以使用双重β-球蛋白3'UTR(参见US2010/0129877,其内容以全文引用的方式并入本文中)。
本发明的多核苷酸可以包含特征的组合。举例来说,ORF可以侧接有包含强Kozak翻译起始信号的5'UTR和/或包含寡聚(dT)序列用于模板化添加多聚A尾的3'UTR。5'UTR可以包含来自相同和/或不同UTR的第一多核苷酸片段和第二多核苷酸片段(参见例如US2010/0293625,以全文引用的方式并入本文中)。
其它非UTR序列可以用作本发明的多核苷酸内的区域或亚区域。举例来说,内含子或内含子序列的部分可以并入本发明的多核苷酸中。内含子序列的并入可以增加蛋白质产量以及多核苷酸表达水平。在一些实施方案中,本发明的多核苷酸包含代替UTR或除UTR之外的内部核糖体进入位点(IRES)(参见例如Yakubov等,Biochem.Biophys.Res.Commun.2010 394(1):189-193,其内容以全文引用的方式并入本文中)。在一些实施方案中,多核苷酸包含代替5'UTR序列的IRES。在一些实施方案中,多核苷酸包含ORF和病毒衣壳序列。在一些实施方案中,多核苷酸包含合成5'UTR与非合成3'UTR的组合。
在一些实施方案中,UTR还可以包括至少一个翻译增强子多核苷酸、翻译增强子元件或翻译性增强子元件(统称为“TEE”,它是指增加从多核苷酸产生的多肽或蛋白质的量的核酸序列)。作为一个非限制性实例,TEE可以位于转录启动子与起始密码子之间。在一些实施方案中,5'UTR包含TEE。
在一个方面,TEE是UTR中的保守元件,所述元件可以促进核酸的翻译活性,诸如但不限于帽依赖性或帽非依赖性翻译。
核苷酸帽
本公开还包括一种包含5'帽和本发明的多核苷酸(例如,包含编码待表达的多肽的核苷酸序列的多核苷酸)两者的多核苷酸。
天然mRNA的5'帽结构涉及于核输出中,增加mRNA稳定性并结合mRNA帽结合蛋白(CBP),后者通过CBP与多聚(A)结合蛋白的缔合而负责细胞中的mRNA稳定性和翻译能力以形成成熟环状mRNA种类。所述帽进一步有助于在mRNA剪接期间去除5'近端内含子。
内源mRNA分子可以在5'端加帽,从而在mRNA分子的末端鸟苷帽残基与5'-末端转录的有义核苷酸之间产生5'-ppp-5'-三磷酸键。然后可以将这种5'-鸟苷酸帽甲基化以产生N7-甲基-鸟苷酸残基。mRNA的5'端的末端和/或末端前转录核苷酸的核糖也可以任选地被2'-O-甲基化。通过鸟苷酸帽结构的水解和裂解使5'-脱帽可以靶向核酸分子,诸如mRNA分子,以进行降解。
在一些实施方案中,本发明的多核苷酸(例如,包含编码多肽的核苷酸序列的多核苷酸)并入帽部分。
在一些实施方案中,本发明的多核苷酸包含防止脱帽并因此增加mRNA半衰期的不可水解帽结构。因为帽结构水解需要5'-ppp-5'磷酸二酯键裂解,所以可以在加帽反应期间使用修饰的核苷酸。举例来说,来自New England Biolabs(Ipswich,MA)的牛痘加帽酶可以根据制造商的说明书与α-硫代-鸟苷核苷酸一起使用,以在5'-ppp-5'帽中产生硫代磷酸酯键。可以使用额外修饰的鸟苷核苷酸,诸如α-甲基-膦酸和硒代-磷酸核苷酸。
额外的修饰包括但不限于多核苷酸(如上文所提及)的5'-末端和/或5'-末端前核苷酸的核糖在糖环的2'-羟基上的2'-O-甲基化。多个不同的5'-帽结构可以用于产生核酸分子的5'-帽,诸如用作mRNA分子的多核苷酸。帽类似物,在本文中也称作合成帽类似物、化学帽、化学帽类似物或结构或功能帽类似物,其化学结构不同于天然(即,内源、野生型或生理)5'-帽,同时保留帽功能。帽类似物可以是化学(即,非酶促)或酶促合成的和/或连接至本发明的多核苷酸。
举例来说,抗反向帽类似物(ARCA)帽含有两个由5'-5'-三磷酸基团连接的鸟嘌呤,其中一个鸟嘌呤含有N7甲基以及3'-O-甲基(即,N7,3'-O-二甲基-鸟苷-5'-三磷酸-5'-鸟苷(m7G-3'mppp-G;可以等效地命名为3′O-Me-m7G(5′)ppp(5′)G)。另一个未修饰的鸟嘌呤的3'-O原子变成连接至加帽多核苷酸的5'-末端核苷酸。N7-和3'-O-甲基化鸟嘌呤提供了加帽多核苷酸的末端部分。
另一个示例性帽是mCAP,它类似于ARCA,但在鸟苷上具有2'-O-甲基(即,N7,2'-O-二甲基-鸟苷-5'-三磷酸-5'-鸟苷,m7Gm-ppp-G)。
另一个示例性帽是m7G-ppp-Gm-A(即,N7,鸟苷-5'-三磷酸-2'-O-二甲基-鸟苷-腺苷)。
在一些实施方案中,帽是二核苷酸帽类似物。作为一个非限制性实例,二核苷酸帽类似物可以在不同的磷酸位置用硼代磷酸基团或硒代磷酸基团进行修饰,诸如美国专利号US 8,519,110中所描述的二核苷酸帽类似物,所述专利的内容以全文引用的方式并入本文中。
在另一个实施方案中,帽是帽类似物,是本领域中已知和/或本文所描述的帽类似物的N7-(4-氯苯氧基乙基)取代的二核苷酸形式。帽类似物的N7-(4-氯苯氧基乙基)取代的二核苷酸形式的非限制性实例包括N7-(4-氯苯氧基乙基)-G(5')ppp(5')G和N7-(4-氯苯氧基乙基)-m3′-OG(5′)ppp(5′)G帽类似物(参见例如Kore等Bioorganic&MedicinalChemistry 2013 21:4570-4574中所描述的各种帽类似物和合成帽类似物的方法;所述文献的内容以全文引用的方式并入本文中)。在另一个实施方案中,本发明的帽类似物是4-氯/溴苯氧基乙基类似物。
本发明的多核苷酸也可以在制造后(无论是IVT还是化学合成)使用酶加帽,以产生更真实的5'-帽结构。如本文所用,短语“更真实”是指在结构上或功能上密切反映或模仿内源或野生型特征的特征。也就是说,“更真实”的特征与现有技术的合成特征或类似物等相比更能代表内源、野生型、天然或生理细胞功能和/或结构,或在一个或多个方面优于相应的内源、野生型、天然或生理特征。本发明的更真实的5'帽结构的非限制性实例是那些帽结构,它们与本领域中已知的合成5'帽结构(或野生型、天然或生理性5'帽结构)相比具有增强的帽结合蛋白结合、增加的半衰期、降低的对5'核酸内切酶的敏感性和/或减少的5'脱帽等。举例来说,重组牛痘病毒加帽酶和重组2'-O-甲基转移酶可以在多核苷酸的5'-末端核苷酸与鸟嘌呤帽核苷酸之间产生规范的5'-5'-三磷酸键,其中帽鸟嘌呤含有N7甲基化并且mRNA的5'-末端核苷酸含有2'-O-甲基。此种结构称为帽1结构。与例如本领域中已知的其它5'帽类似物结构相比,这种帽使得翻译能力和细胞稳定性更高以及细胞促炎细胞因子的活化减少。帽结构包括但不限于7mG(5′)ppp(5′)N1pN2p(帽0)、7mG(5′)ppp(5′)N1mpNp(帽1)和7mG(5′)-ppp(5′)N1mpN2mp(帽2)。
作为一个非限制性实例,制造后对嵌合多核苷酸加帽可能更有效,因为几乎100%的嵌合多核苷酸可以被加帽。这与当在体外转录反应过程中帽类似物连接至嵌合多核苷酸时约80%成对比。
根据本发明,5'末端帽可以包括内源帽或帽类似物。根据本发明,5'末端帽可以包含鸟嘌呤类似物。可用的鸟嘌呤类似物包括但不限于肌苷、N1-甲基-鸟苷、2'氟-鸟苷、7-脱氮-鸟苷、8-氧代-鸟苷、2-氨基-鸟苷、LNA-鸟苷和2-叠氮基-鸟苷。
本文还提供了示例性帽,所述帽包括可以用于核糖核酸(RNA)合成的共转录加帽方法中的那些帽,所述合成使用RNA聚合酶,例如野生型RNA聚合酶或其变体,诸如本文所描述的那些变体。在一个实施方案中,当在“一锅”反应中产生RNA时可以添加帽,而不需要单独的加帽反应。因此,在一些实施方案中,所述方法包括使多核苷酸模板与RNA聚合酶变体、三磷酸核苷和帽类似物在体外转录反应条件下反应以产生RNA转录物。
如本文所用,术语“帽”包括反向G核苷酸并且可以包含反向G核苷酸3'的一个或多个额外核苷酸,例如,反向G核苷酸3'和5'UTR(例如,本文所描述的5'UTR)5'的1、2、3个或更多个核苷酸。
示例性帽包含GG、GA或GGA的序列,其中带下划线的斜体G是反向G核苷酸,其后是5'-5'-三磷酸基团。
在一个实施方案中,帽包含式(I)化合物
Figure BDA0004090383130002121
或其立体异构体、互变异构体或盐,其中/>
Figure BDA0004090383130002122
是/>
Figure BDA0004090383130002123
环B1是修饰或未修饰的鸟嘌呤;
环B2和环B3各自独立地是核碱基或修饰的核碱基;
X2是O、S(O)p、NR24或CR25R26,其中p是0、1或2;
Y0是O或CR6R7
Y1是O、S(O)n、CR6R7或NR8,其中n是0、1或2;
每个---是单键或不存在,其中当每个---是单键时,Yi是O、S(O)n、CR6R7或NR8;并且当每个---不存在时,Y1是缺失的;
Y2是(OP(O)R4)m,其中m是0、1或2,或-O-(CR40R41)u-Q0-(CR 42R43)v-,其中Q0是键、O、S(O)r、NR44或CR45R46,r是0、1或2,并且u和v中的每一者独立地是1、2、3或4;
每个R2和R2'独立地是卤基、LNA或OR3
每个R3独立地是H、C1-C6烷基、C2-C6烯基或C2-C6炔基,并且当R3是C1-C6烷基、C2-C6烯基或C2-C6炔基时任选地被以下一者或多者取代:卤基、OH和任选地被一个或多个OH或OC(O)-C1-C6烷基取代的C1-C6烷氧基;
每个R4和R4'独立地是H、卤基、C1-C6烷基、OH、SH、SeH或BH3 -
R6、R7和R8中的每一者独立地是-Q1-T1,其中Q1是键或任选地被卤基、氰基、OH和C1-C6烷氧基中的一者或多者取代的C1-C3烷基连接子,并且T1是H、卤基、OH、COOH、氰基或Rs1,其中Rs1是C1-C3烷基、C2-C6烯基、C2-C6炔基、C1-C6烷氧基、C(O)O-C1-C6烷基、C3-C8环烷基、C6-C10芳基、NR31R32、(NR31R32R33)+、4元至12元杂环烷基或5元或6元杂芳基,并且Rs1任选地被一个或多个选自由以下组成的组的取代基取代:卤基、OH、氧代、C1-C6烷基、COOH、C(O)O-C1-C6烷基、氰基、C1-C6烷氧基、NR31R32、(NR31R32R33)+、C3-C8环烷基、C6-C10芳基、4员至12员杂环烷基和5元或6元杂芳基;
R10、R11、R12、R13、R14和R15中的每一者独立地是-Q2-T2,其中Q2是键或视情况被卤基、氰基、OH和C1-C6烷氧基中的一者或多者取代的C1-C3烷基连接子,并且T2是H、卤基、OH、NH2、氰基、NO2、N3、Rs2或ORs2,其中Rs2是C1-C6烷基、C2-C6烯基、C2-C6炔基、C3-C8环烷基、C6-C10芳基、NHC(O)-C1-C6烷基、NR31R32、(NR31R32R33)+、4元至12元杂环烷基或5元或6元杂芳基,并且Rs2任选地被一个或多个选自由以下组成的组的取代基取代:卤基、OH、氧代、C1-C6烷基、COOH、C(O)O-C1-C6烷基、氰基、C1-C6烷氧基、NR31R32、(NR31R32R33)+、C3-C8环烷基、C6-C10芳基、4元至12元杂环烷基和5元或6元杂芳基;或替代地,R12与R14一起是氧代,或R13与R15一起是氧代,
R20、R21、R22和R23中的每一者独立地是-Q3-T3,其中Q3是键或任选地被卤基、氰基、OH和C1-C6烷氧基中的一者或多者取代的C1-C3烷基连接子,并且T3是H、卤基、OH、NH2、氰基、NO2、N3、RS3或ORS3,其中RS3是C1-C6烷基、C2-C6烯基、C2-C6炔基、C3-C8环烷基、C6-C10芳基、NHC(O)-C1-C6烷基、单C1-C6烷基氨基、二C1-C6烷基氨基、4元至12元杂环烷基或5元或6元杂芳基,并且Rs3任选地被一个或多个选自由以下组成的组的取代基取代:卤基、OH、氧代、C1-C6烷基、COOH、C(O)O-C1-C6烷基、氰基、C1-C6烷氧基、氨基、单C1-C6烷基氨基、二C1-C6烷基氨基、C3-C8环烷基、C6-C10芳基、4元至12元杂环烷基和5元或6元杂芳基;
R24、R25和R26中的每一者独立地是H或C1-C6烷基;
R27和R28中的每一者独立地是H或OR29;或R27与R28一起形成OR30-O;每个R29独立地是H、C1-C6烷基、C2-C6烯基或C2-C6炔基,并且当R29是C1-C6烷基、C2-C6烯基或C2-C6炔基时任选地被以下一者或多者取代:卤基、OH和任选地被一个或多个OH或OC(O)-C1-C6烷基取代的C1-C6烷氧基;
R30是任选地被卤基、OH和C1-C6烷氧基中的一者或多者取代的C1-C6亚烷基;
R31、R32和R33中的每一者独立地是H、C1-C6烷基、C3-C8环烷基、C6-C10芳基、4元至12元杂环烷基或5元或6元杂芳基;
R40、R41、R42和R43中的每一者独立地是H、卤基、OH、氰基、N3、OP(O)R47R48或任选地被一个或多个OP(O)R47R48取代的C1-C6烷基,或一个R41和一个R43与它们所连接的碳原子和Q0一起形成C4-C10环烷基、4元至14元杂环烷基、C6-C10芳基或5元至14元杂芳基,并且所述环烷基、杂环烷基、苯基或5元至6元杂芳基中的每一者任选地被以下一者或多者取代:OH、卤基、氰基、N3、氧代、OP(O)R47R48、C1-C6烷基、C1-C6卤烷基、COOH、C(O)O-C1-C6烷基、C1-C6烷氧基、C1-C6卤烷氧基、氨基、单C1-C6烷基氨基和二C1-C6烷基氨基;
R44是H、C1-C6烷基或胺保护基;
R45和R46中的每一者独立地是H、OP(O)R47R48或任选地被一个或多个OP(O)R47R48取代的C1-C6烷基,并且
R47和R48中的每一者独立地是H、卤基、C1-C6烷基、OH、SH、SeH或BH3
应了解,如本文所提供的帽类似物可以包括2017年4月20日公布的国际公布WO2017/066797中所描述的帽类似物中的任一者,所述公布以全文引用的方式并入本文中。
在一些实施方案中,B2中间位置可以是非核糖分子,诸如阿拉伯糖。
在一些实施方案中,R2是基于乙基的。
因此,在一些实施方案中,帽包括以下结构:
Figure BDA0004090383130002151
在其它实施方案中,帽包括以下结构:
Figure BDA0004090383130002161
在其它实施方案中,帽包括以下结构:
Figure BDA0004090383130002162
在其它实施方案中,帽包括以下结构:
Figure BDA0004090383130002171
在一些实施方案中,R是烷基(例如,C1-C6烷基)。在一些实施方案中,R是甲基(例如,C1烷基)。在一些实施方案中,R是乙基(例如,C2烷基)。
在一些实施方案中,帽包含选自以下序列的序列:GAA、GAC、GAG、GAU、GCA、GCC、GCG、GCU、GGA、GGC、GGG、GGU、GUA、GUC、GUG和GUU。在一些实施方案中,帽包含GAA。在一些实施方案中,帽包含GAC。在一些实施方案中,帽包含GAG。在一些实施方案中,帽包含GAU。在一些实施方案中,帽包含GCA。在一些实施方案中,帽包含GCC。在一些实施方案中,帽包含GCG。在一些实施方案中,帽包含GCU。在一些实施方案中,帽包含GGA。在一些实施方案中,帽包含GGC。在一些实施方案中,帽包含GGG。在一些实施方案中,帽包含GGU。在一些实施方案中,帽包含GUA。
在一些实施方案中,帽包含GUC。在一些实施方案中,帽包含GUG。
在一些实施方案中,帽包含GUU。
在一些实施方案中,帽包含选自以下序列的序列:m7GpppApA、m7GpppApC、m7GpppApG、m7GpppApU、m7GpppCpA、m7GpppCpC、m7GpppCpG、m7GpppCpU、m7GpppGpA、m7GpppGpC、m7GpppGpG、m7GpppGpU、m7GpppUpA、m7GpppUpC、m7GpppUpG和m7GpppUpU。
在一些实施方案中,帽包含m7GpppApA。在一些实施方案中,帽包含m7GpppApC。在一些实施方案中,帽包含m7GpppApG。在一些实施方案中,帽包含m7GpppApU。在一些实施方案中,帽包含m7GpppCpA。在一些实施方案中,帽包含m7GpppCpC。在一些实施方案中,帽包含m7GpppCpG。在一些实施方案中,帽包含m7GpppCpU。在一些实施方案中,帽包含m7GpppGpA。在一些实施方案中,帽包含m7GpppGpC。在一些实施方案中,帽包含m7GpppGpG。在一些实施方案中,帽包含m7GpppGpU。在一些实施方案中,帽包含m7GpppUpA。在一些实施方案中,帽包含m7GpppUpC。在一些实施方案中,帽包含m7GpppUpG。在一些实施方案中,帽包含m7GpppUpU。
在一些实施方案中,帽包含选自以下序列的序列:m7G3′OMepppApA、m7G3′OMepppApC、m7G3′OMepppApG、m7G3′OMepppApU、m7G3′OMepppCpA、m7G3′OMepppCpC、m7G3′OMepppCpG、m7G3′ OMepppCpU、m7G3′OMepppGpA、m7G3′OMepppGpC、m7G3′OMepppGpG、m7G3′OMepppGpU、m7G3′OMepppUpA、m7G3′OMepppUpC、m7G3′OMepppUpG和m7G3′OMepppUpU。
在一些实施方案中,帽包含m7G3′OMepppApA。在一些实施方案中,帽包含m7G3′ OMepppApC。在一些实施方案中,帽包含m7G3′OMepppApG。在一些实施方案中,帽包含m7G3′ OMepppApU。在一些实施方案中,帽包含m7G3′OMepppCpA。在一些实施方案中,帽包含m7G3′ OMepppCpC。在一些实施方案中,帽包含m7G3′OMepppCpG。在一些实施方案中,帽包含m7G3′ OMepppCpU。在一些实施方案中,帽包含m7G3′OMepppGpA。在一些实施方案中,帽包含m7G3′ OMepppGpC。在一些实施方案中,帽包含m7G3′OMepppGpG。在一些实施方案中,帽包含m7G3′ OMepppGpU。在一些实施方案中,帽包含m7G3′OMepppUpA。在一些实施方案中,帽包含m7G3′ OMepppUpC。在一些实施方案中,帽包含m7G3′OMepppUpG。在一些实施方案中,帽包含m7G3′ OMepppUpU。
在其它实施方案中,帽包含选自以下序列的序列:m7G3′OMepppA2′OMepA、m7G3′ OMepppA2′OMepC、m7G3′OMepppA2′OMepG、m7G3′OMepppA2′OMepU、m7G3′OMepppC2′OMepA、m7G3′OMepppC2′ OMepC、m7G3′OMepppC2′OMepG、m7G3′OMepppC2′OMepU、m7G3′OMepppG2′OMepA、m7G3′OMepppG2′OMepC、m7G3′ OMepppG2′OMepG、m7G3′OMepppG2′OMepU、m7G3′OMepppU2′OMepA、m7G3′OMepppU2′OMepC、m7G3′OMepppU2′OMepG和m7G3′OMepppU2′OMepU。
在一些实施方案中,帽包含m7G3′OMepppA2′OMepA。在一些实施方案中,帽包含m7G3′ OMepppA2′OMepC。在一些实施方案中,帽包含m7G3′OMepppA2′OMepG。在一些实施方案中,帽包含m7G3′OMepppA2′OMepU。在一些实施方案中,帽包含m7G3′OMepppC2′OMepA。在一些实施方案中,帽包含m7G3′OMepppC2′OMepC。在一些实施方案中,帽包含m7G3′OMepppC2′OMepG。在一些实施方案中,帽包含m7G3′OMepppC2′OMepU。在一些实施方案中,帽包含m7G3′OMepppG2′OMepA。在一些实施方案中,帽包含m7G3′OMepppG2′OMepC。在一些实施方案中,帽包含m7G3′OMepppG2′OMepG。在一些实施方案中,帽包含m7G3′OMepppG2′OMepU。在一些实施方案中,帽包含m7G3′OMepppU2′OMepA。在一些实施方案中,帽包含m7G3′OMepppU2′OMepC。在一些实施方案中,帽包含m7G3′OMepppU2′OMepG。在一些实施方案中,帽包含m7G3′OMepppU2′OMepU。
在其它实施方案中,帽包含选自以下序列的序列:m7GpppA2′OMepA、m7GpppA2′OMepC、m7GpppA2′OMepG、m7GpppA2′OMepU、m7GpppC2′OMepA、m7GpppC2′OMepC、m7GpppC2′OMepG、m7GpppC2′ OMepU、m7GpppG2′OMepA、m7GpppG2′OMepC、m7GpppG2′OMepG、m7GpppG2′OMepU、m7GpppU2′OMepA、m7GpppU2′OMepC、m7GpppU2′OMepG和m7GpppU2′OMepU。
在一些实施方案中,帽包含m7GpppA2′OMepA。在一些实施方案中,帽包含m7GpppA2′ OMepC。在一些实施方案中,帽包含m7GpppA2′OMepG。在一些实施方案中,帽包含m7GpppA2′OMepU。在一些实施方案中,帽包含m7GpppC2′OMepA。在一些实施方案中,帽包含m7GpppC2′OMepC。在一些实施方案中,帽包含m7GpppC2′OMepG。在一些实施方案中,帽包含m7GpppC2′OMepU。在一些实施方案中,帽包含m7GpppG2′OMepA。在一些实施方案中,帽包含m7GpppG2′OMepC。在一些实施方案中,帽包含m7GpppG2′OMepG。在一些实施方案中,帽包含m7GpppG2′OMepU。在一些实施方案中,帽包含m7GpppU2′OMepA。在一些实施方案中,帽包含m7GpppU2′OMepC。在一些实施方案中,帽包含m7GpppU2′OMepG。在一些实施方案中,帽包含m7GpppU2′OMepU。
在一些实施方案中,帽包含m7Gpppm6A2'OmepG。在一些实施方案中,帽包含m7Gpppe6A2'OmepG。
在一些实施方案中,帽包含GAG。在一些实施方案中,帽包含GCG。在一些实施方案中,帽包含GUG。在一些实施方案中,帽包含GGG。
在一些实施方案中,帽包括以下结构中的任一者:
Figure BDA0004090383130002201
/>
Figure BDA0004090383130002211
在一些实施方案中,帽包含m7GpppN1N2N3,其中N1、N2和N3是任选的(即,可以不存在或一者或多者可以存在)并且独立地是天然的、修饰的或非天然的核苷碱基。在一些实施方案中,m7G被进一步甲基化,例如,在3'位置处。在一些实施方案中,m7G在3'位置处包含O-甲基。在一些实施方案中,N1、N2和N3,如果存在的话,任选地独立地是腺嘌呤、尿嘧啶、胍、胸腺嘧啶或胞嘧啶。在一些实施方案中,N1、N2和N3中的一者或多者(或全部),如果存在的话,例如在2'位置处被甲基化。在一些实施方案中,N1、N2和N3中的一者或多者(或全部),如果存在的话,在2'位置处具有O-甲基。
在一些实施方案中,帽包括以下结构:
Figure BDA0004090383130002212
其中B1、B2和B3独立地是天然的、修饰的或非天然的核苷碱基;并且R1、R2、R3和R4独立地是OH或O-甲基。在一些实施方案中,R3是O-甲基并且R4是OH。在一些实施方案中,R3和R4是O-甲基。在一些实施方案中,R4是O-甲基。在一些实施方案中,R1是OH,R2是OH,R3是O-甲基,并且R4是OH。在一些实施方案中,R1是OH,R2是OH,R3是O-甲基,并且R4是O-甲基。在一些实施方案中,R1和R2中的至少一者是O-甲基,R3是O-甲基,并且R4是OH。在一些实施方案中,R1和R2中的至少一者是O-甲基,R3是O-甲基,并且R4是O-甲基。
在一些实施方案中,B1、B3和B3是天然核苷碱基。在一些实施方案中,B1、B2和B3中的至少一者是修饰的或非天然的碱基。在一些实施方案中,B1、B2和B3中的至少一者是N6-甲基腺嘌呤。在一些实施方案中,B1是腺嘌呤、胞嘧啶、胸腺嘧啶或尿嘧啶。在一些实施方案中,B1是腺嘌呤,B2是尿嘧啶,并且B3是腺嘌呤。在一些实施方案中,R1和R2是OH,R3和R4是O-甲基,B1是腺嘌呤,B2是尿嘧啶,并且B3是腺嘌呤。
在一些实施方案中,帽包含选自以下序列的序列:GAAA、GACA、GAGA、GAUA、GCAA、GCCA、GCGA、GCUA、GGAA、GGCA、GGGA、GGUA、GUCA和GUUA。在一些实施方案中,帽包含选自以下序列的序列:GAAG、GACG、GAGG、GAUG、GCAG、GCCG、GCGG、GCUG、GGAG、GGCG、GGGG、GGUG、GUCG、GUGG和GUUG。在一些实施方案中,帽包含选自以下序列的序列:GAAU、GACU、GAGU、GAUU、GCAU、GCCU、GCGU、GCUU、GGAU、GGCU、GGGU、GGUU、GUAU、GUCU、GUGU和GUUU。在一些实施方案中,帽包含选自以下序列的序列:GAAC、GACC、GAGC、GAUC、GCAC、GCCC、GCGC、GCUC、GGAC、GGCC、GGGC、GGUC、GUAC、GUCC、GUGC和GUUC。
在一些实施方案中,帽包含选自以下序列的序列:m7G3′OMepppApApN、m7G3′ OMepppApCpN、m7G3′OMepppApGpN、m7G3′OMepppApUpN、m7G3′OMepppCpApN、m7G3′OMepppCpCpN、m7G3′ OMepppCpGpN、m7G3′OMepppCpUpN、m7G3′OMepppGpApN、m7G3′OMepppGpCpN、m7G3′OMepppGpGpN、m7G3′ OMepppGpUpN、m7G3′OMepppUpApN、m7G3′OMepppUpCpN、m7G3′OMepppUpGpN和m7G3′OMepppUpUpN,其中N是天然的、修饰的或非天然的核苷碱基。
在其它实施方案中,帽包含选自以下序列的序列:m7G3′OMepppA2′OMepApN、m7G3′ OMepppA2′OMepCpN、m7G3′OMepppA2′OMepGpN、m7G3′OMepppA2′OMepUpN、m7G3′OMepppC2′OMepApN、m7G3′ OMepppC2′OMepCpN、m7G3′OMepppC2′OMepGpN、m7G3′OMepppC2′OMepUpN、m7G3′OMepppG2′OMepApN、m7G3′ OMepppG2′OMepCpN、m7G3′OMepppG2′OMepGpN、m7G3′OMepppG2′OMepUpN、m7G3′OMepppU2′OMepApN、m7G3′ OMepppU2′OMepCpN、m7G3′OMepppU2′OMepGpN和m7G3′OMepppU2′OMepUpN,其中N是天然的、修饰的或非天然的核苷碱基。
在其它实施方案中,帽包含选自以下序列的序列:m7GpppA2′OMepApN、m7GpppA2′ OMepCpN、m7GpppA2′OMepGpN、m7GpppA2′OMepUpN、m7GpppC2′OMepApN、m7GpppC2′OMepCpN、m7GpppC2′ OMepGpN、m7GpppC2′OMepUpN、m7GpppG2′OMepApN、m7GpppG2′OMepCpN、m7GpppG2′OMepGpN、m7GpppG2′ OMepUpN、m7GpppU2′OMepApN、m7GpppU2′OMepCpN、m7GpppU2′OMepGpN和m7GpppU2′OMepUpN,其中N是天然的、修饰的或非天然的核苷碱基。
在其它实施方案中,帽包含选自以下序列的序列:m7G3′OMepppA2′OMepA2′OMepN、m7G3′OMepppA2′OMepC2′OMepN、m7G3′OMepppA2′OMepG2′OMepN、m7G3′OMepppA2′OMepU2′OMepN、m7G3′ OMepppC2′OMepA2′OMepN、m7G3′OMepppC2′OMepC2′OMepN、m7G3′OMepppC2′OMepG2′OMepN、m7G3′OMepppC2′ OMepU2′OMepN、m7G3′OMepppG2′OMepA2′OMepN、m7G3′OMepppG2′OMepC2′OMepN、m7G3′OMepppG2′OMepG2′OMepN、m7G3′OMepppG2′OMepU2′OMepN、m7G3′OMepppU2′OMepA2′OMepN、m7G3′OMepppU2′OMepC2′OMepN、m7G3′ OMepppU2′OMepG2′OMepN和m7G3′OMepppU2′OMepU2′OMepN,其中N是天然的、修饰的或非天然的核苷碱基。
在其它实施方案中,帽包含选自以下序列的序列:m7GpppA2′OMepA2′OMepN、m7GpppA2′OMepC2′OMepN、m7GpppA2′OMepG2′OMepN、m7GpppA2′OMepU2′OMepN、m7GpppC2′OMepA2′OMepN、m7GpppC2′OMepC2′OMepN、m7GpppC2′OMepG2′OMepN、m7GpppC2′OMepU2′OMepN、m7GpppG2′OMepA2′OMepN、m7GpppG2′OMepC2′OMepN、m7GpppG2′OMepG2′OMepN、m7GpppG2′OMepU2′OMepN、m7GpppU2′OMepA2′OMepN、m7GpppU2′OMepC2′OMepN、m7GpppU2′OMepG2′OMepN和m7GpppU2′OMepU2′OMepN,其中N是天然的、修饰的或非天然的核苷碱基。
在一些实施方案中,帽包含GGAG。在一些实施方案中,帽包括以下结构:
Figure BDA0004090383130002241
多聚A尾
在一些实施方案中,本公开的多核苷酸还包含多聚A尾。在其它实施方案中,可以在多聚A尾上并入末端基团以用于稳定化。在其它实施方案中,多聚A尾包含脱3'羟基尾。
在RNA加工期间,可以将长链腺嘌呤核苷酸(多聚A尾)添加至多核苷酸(诸如mRNA分子)中以增加稳定性。转录后随即,可以使转录物的3'端裂解以释放3'羟基。然后多聚A聚合酶将腺嘌呤核苷酸链添加至RNA中。所述过程,称为多聚腺苷酸化,添加多聚A尾,其长度可以介于例如约80个至约250个残基之间,包括约80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240或250个残基的长度。在一个实施方案中,多聚A尾的长度为100个核苷酸(SEQ ID NO:121)。
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaa aaaaaaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa(SEQ ID NO:121)
也可以在构建体从细胞核中导出后添加多聚A尾。
根据本发明,可以在多聚A尾上并入末端基团以用于稳定化。本发明的多核苷酸可以包括脱3'羟基尾。它们还可以包括Junjie Li等(Current Biology,第15卷,1501-1507,2005年8月23日,其内容以全文引用的方式并入本文中)教示的结构部分或2'-O甲基修饰。
本发明的多核苷酸可以被设计成编码具有包括组蛋白mRNA的替代性多聚A尾结构的转录物。根据Norbury,在人类复制依赖的组蛋白mRNA上也检测到末端尿苷酸化。这些mRNA的周转被认为对于在完成或抑制染色体DNA复制后防止潜在的毒性组蛋白积累很重要。这些mRNA的特点是缺少3'多聚(A)尾,其功能替代地由稳定的茎环结构及其同源茎环结合蛋白(SLBP)承担;后者在多聚腺苷酸化mRNA上执行与PABP相同的功能(Norbury,"Cytoplasmic RNA:a case of the tail wagging the dog,"Nature Reviews MolecularCell Biology;AOP,2013年8月29日在线公布;doi:10.1038/nrm3645),其内容以全文引用的方式并入本文中。
独特的多聚A尾长度为本发明的多核苷酸提供了某些优势。一般来说,当存在时,多聚A尾的长度大于30个核苷酸长度。在另一个实施方案中,多聚A尾的长度大于35个核苷酸(例如,至少或大于约35、40、45、50、55、60、70、80、90、100、120、140、160、180、200、250、300、350、400、450、500、600、700、800、900、1,000、1,100、1,200、1,300、1,400、1,500、1,600、1,700、1,800、1,900、2,000、2,500和3,000个核苷酸)。
在一些实施方案中,多核苷酸或其区域包括约30个至约3,000个核苷酸(例如,30至50、30至100、30至250、30至500、30至750、30至1,000、30至1,500、30至2,000、30至2,500、50至100、50至250、50至500、50至750、50至1,000、50至1,500、50至2,000、50至2,500、50至3,000、100至500、100至750、100至1,000、100至1,500、100至2,000、100至2,500、100至3,000、500至750、500至1,000、500至1,500、500至2,000、500至2,500、500至3,000、1,000至1,500、1,000至2,000、1,000至2,500、1,000至3,000、1,500至2,000、1,500至2,500、1,500至3,000、2,000至3,000、2,000至2,500以及2,500至3,000)。
在一些实施方案中,多聚A尾是相对于整个多核苷酸的长度或多核苷酸的特定区域的长度而设计的。这种设计可以基于编码区的长度、特定特征或区域的长度或基于从多核苷酸表达的最终产物的长度。
在这种情形中,多聚A尾的长度可以比多核苷酸或其特征长10、20、30、40、50、60、70、80、90或100%。多聚A尾也可以被设计成它所属的多核苷酸的一部分。在这种情形中,多聚A尾可以是构建体总长度、构建体区域或构建体总长度减去多聚A尾的10、20、30、40、50、60、70、80或90%或更多。此外,多聚A结合蛋白的工程化结合位点和多核苷酸缀合可以增强表达。
另外,多个不同的多核苷酸可以经由PABP(多聚A结合蛋白)通过3'端在多聚A尾的3'末端使用修饰的核苷酸连接在一起。转染实验可以在相关细胞系中进行,并且可以在转染后12小时、24小时、48小时、72小时和第7天通过ELISA测定蛋白质产量。
在一些实施方案中,本发明的多核苷酸被设计成包括多聚A-G四联体区。G-四联体是四个鸟嘌呤核苷酸的环状氢键阵列,所述阵列可以由DNA和RNA中富含G的序列形成。在这个实施方案中,G-四联体被并入多聚A尾的末端。测定所得多核苷酸的稳定性、蛋白质产量和其它参数,包括各个时间点的半衰期。已经发现,多聚A-G四联体使得来自mRNA的蛋白质产量相当于单独使用120个核苷酸的多聚A尾(SEQ ID NO:51)所见的至少75%。
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaa aaaaaaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaa aaaa(SEQ ID NO:51)
在一些实施方案中,多聚A尾是具有间断非腺苷残基(例如,鸟苷)的混合多聚A尾。在一些实施方案中,多聚A尾是鸟苷酸化的。在一些实施方案中,混合多聚A尾是一种或多种TENT(例如,TENT4A和/或TENT4B)募集的结果。不希望受理论束缚,据信在一些实施方案中,混合多聚A尾可以保护mRNA免于快速脱腺苷酸化。
在一些实施方案中,多聚A尾包含一个或多个非腺苷残基。在一些实施方案中,非腺苷残基是鸟苷。在一些实施方案中,多聚A尾包含1-20,例如1-15、1-10、1-5、15-20、10-20、5-20、2-15、5-10、1-5、2-10或5-15个非腺苷残基(例如,鸟苷)。举例来说,多聚A尾可以包含1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个或更多个非腺苷残基(例如,鸟苷)。在一些实施方案中,多聚A尾中至少1%,例如至少2%、5%、10%、15%、20%或25%的残基是非腺苷残基(例如,鸟苷)。在一些实施方案中,多聚A尾是鸟苷酸化的,例如,包含一个或多个鸟苷残基。
在一个实施方案中,包含一个或多个非腺苷残基的多聚A尾是化学合成的。
起始密码子区域
本发明还包括一种包含起始密码子区域和本文所描述的多核苷酸两者的多核苷酸。在一些实施方案中,本发明的多核苷酸可以具有与起始密码子区域类似或功能类似的区域。
在一些实施方案中,多核苷酸的翻译可以在不是起始密码子AUG的密码子上开始。多核苷酸的翻译可以在替代性起始密码子上开始,诸如但不限于ACG、AGG、AAG、CTG/CUG、GTG/GUG、ATA/AUA、ATT/AUU、TTG/UUG(参见Touriol等Biology of the Cell95(2003)169-178以及Matsuda和Mauro PLoS ONE,2010 5:11;所述文献中每一者的内容以全文引用的方式并入本文中)。
作为一个非限制性实例,多核苷酸的翻译始于替代性起始密码子ACG。作为另一个非限制性实例,多核苷酸的翻译始于替代性起始密码子CTG或CUG。作为另一个非限制性实例,多核苷酸的翻译始于替代性起始密码子GTG或GUG。
已知位于启动翻译的密码子(诸如但不限于起始密码子或替代性起始密码子)侧翼的核苷酸会影响多核苷酸的翻译效率、长度和/或结构。(参见例如Matsuda和Mauro PLoSONE,2010 5:11;其内容以全文引用的方式并入本文中)。掩蔽位于启动翻译的密码子侧翼的核苷酸中的任一者可以用于改变翻译起始的位置、多核苷酸的翻译效率、长度和/或结构。
在一些实施方案中,可以在起始密码子或替代性起始密码子附近使用掩蔽剂来掩蔽或隐藏密码子以降低在掩蔽的起始密码子或替代性起始密码子处翻译起始的概率。掩蔽剂的非限制性实例包括反义锁核酸(LNA)多核苷酸和外显子连接复合物(EJC)(参见例如Matsuda和Mauro描述了掩蔽剂LNA多核苷酸和EJC(PLoS ONE,2010 5:11);其内容以全文引用的方式并入本文中)。
在另一个实施方案中,可以使用掩蔽剂来掩蔽多核苷酸的起始密码子以增加翻译将在替代性起始密码子上开始的可能性。在一些实施方案中,可以使用掩蔽剂来掩蔽第一起始密码子或替代性起始密码子,以增加翻译在掩蔽的起始密码子或替代性起始密码子下游的起始密码子或替代性起始密码子上开始的机会。
在一些实施方案中,起始密码子或替代性起始密码子可以位于miRNA结合位点的完美补体内。miRNA结合位点的完美补体可以类似于掩蔽剂来帮助控制多核苷酸的翻译、长度和/或结构。作为一个非限制性实例,起始密码子或替代性起始密码子可以位于miRNA结合位点的完美补体的中间。起始密码子或替代性起始密码子可以位于第一个核苷酸、第二个核苷酸、第三个核苷酸、第四个核苷酸、第五个核苷酸、第六个核苷酸、第七个核苷酸、第八个核苷酸、第九个核苷酸、第十个核苷酸、第十一个核苷酸、第十二个核苷酸、第十三个核苷酸、第十四个核苷酸、第十五个核苷酸、第十六个核苷酸、第十七个核苷酸、第十八个核苷酸、第十九个核苷酸、第二十个核苷酸或第二十一个核苷酸之后。
在另一个实施方案中,可以从多核苷酸序列中去除多核苷酸的起始密码子,以使多核苷酸的翻译在不是起始密码子的密码子上开始。多核苷酸的翻译可以在去除的起始密码子之后的密码子上或在下游起始密码子或替代性起始密码子上开始。在一个非限制性实例中,起始密码子ATG或AUG作为多核苷酸序列的初始3个核苷酸被去除以在下游起始密码子或替代性起始密码子上开始翻译。去除起始密码子的多核苷酸序列还可以包含至少一种用于下游起始密码子和/或替代性起始密码子的掩蔽剂,以控制或试图控制翻译的起始、多核苷酸的长度和/或多核苷酸的结构。
制备多核苷酸的方法
本公开还提供了用于制备本文所公开的多核苷酸或其补体的方法。在一些方面,本文所公开的多核苷酸(例如,mRNA)可以使用体外转录来构建。
在其它方面,本文所公开的多核苷酸(例如,mRNA)可以通过使用寡核苷酸合成仪进行化学合成来构建。在其它方面,本文所公开的多核苷酸(例如,mRNA)通过使用宿主细胞来制备。在某些方面,本文所公开的多核苷酸(例如,mRNA)通过IVT、化学合成、宿主细胞表达或本领域中已知的任何其它方法的一种或多种组合来制备。
天然存在的核苷、非天然存在的核苷或它们的组合可以完全地或部分地置换存在于候选核苷酸序列中的天然存在的核苷,并且可以并入编码治疗性有效载荷或预防性有效载荷的序列优化的核苷酸序列(例如,mRNA)中。然后可以检查所得mRNA产生蛋白质和/或产生治疗结果的能力。
虽然可以使用本领域中熟知的方法以合成方式制备RNA,但在一个实施方案中,通过在会产生RNA转录物的条件下使DNA模板与RNA聚合酶(例如,T7 RNA聚合酶或T7 RNA聚合酶变体)接触来合成RNA转录物(例如,mRNA转录物)。
在一些方面,本公开提供了进行IVT(体外转录)反应的方法,所述方法包括在三磷酸核苷和缓冲液存在下在会产生RNA转录物的条件下使DNA模板与RNA聚合酶(例如T7 RNA聚合酶,诸如T7 RNA聚合酶变体)接触。
本公开的其它方面提供了加帽方法,例如,共转录加帽方法或本领域中已知的其它方法。在一个实施方案中,加帽方法包括在体外转录反应条件下使多核苷酸模板与T7RNA聚合酶变体、三磷酸核苷和帽类似物反应以产生RNA转录物。
IVT条件通常需要纯化的线性DNA模板,所述模板含有启动子、三磷酸核苷、包含二硫苏糖醇(DTT)和镁离子的缓冲系统以及RNA聚合酶。转录反应中使用的确切条件取决于特定应用所需的RNA量。典型的IVT反应通过在转录缓冲液中孵育DNA模板与RNA聚合酶和三磷酸核苷来进行,所述三磷酸核苷包括GTP、ATP、CTP和UTP(或核苷酸类似物)。由这种反应产生具有5'末端三磷酸鸟苷的RNA转录物。
脱氧核糖核酸(DNA)仅仅是RNA聚合酶的核酸模板。DNA模板可以包括编码所关注的多肽(例如,抗原性多肽)的多核苷酸。在一些实施方案中,DNA模板包括RNA聚合酶启动子(例如,T7 RNA聚合酶启动子),所述启动子位于编码所关注多肽的多核苷酸的5'并且可操作地连接至所述多核苷酸。DNA模板还可以包括编码位于所关注基因的3'端的多聚腺苷酸化(多聚A)尾的核苷酸序列。
所关注的多肽包括但不限于生物剂、抗体、抗原(疫苗)和治疗性蛋白质。术语“蛋白质”涵盖肽。
在一些实施方案中,RNA转录物是IVT反应的产物,并且如本领域普通技术人员将了解,用于制备RNA分子的DNA模板是基于碱基互补性而已知的。在一些实施方案中,RNA转录物是信使RNA(mRNA),其包括编码连接至多聚A尾的所关注多肽的核苷酸序列。在一些实施方案中,mRNA是修饰的mRNA(mmRNA),其包括至少一个修饰的核苷酸。
核苷酸包括含氮碱基、五碳糖(核糖或脱氧核糖)和至少一个磷酸基团。核苷酸包括单磷酸核苷、二磷酸核苷和三磷酸核苷。单磷酸核苷(NMP)包括连接至核糖和单个磷酸的核碱基;二磷酸核苷(NDP)包括连接至核糖和两个磷酸的核碱基;并且三磷酸核苷(NTP)包括连接至核糖和三个磷酸的核碱基。核苷酸类似物是具有核苷酸的一般结构或在结构上类似于核苷酸的化合物。举例来说,核苷酸类似物包括核碱基的类似物、糖的类似物和/或核苷酸的一个或多个磷酸基团的类似物。
核苷包括含氮碱基和5碳糖。因此,核苷加上磷酸基团产生核苷酸。核苷类似物是具有核苷的一般结构或在结构上类似于核苷的化合物。举例来说,核苷类似物包括核碱基的类似物和/或核苷糖的类似物。
应了解,除非另有指示,否则术语“核苷酸”包括天然存在的核苷酸、合成核苷酸和修饰的核苷酸。如本文所提供,用于产生RNA(例如,在IVT反应中)的天然存在的核苷酸的实例包括三磷酸腺苷(ATP)、三磷酸鸟苷(GTP)、三磷酸胞苷(CTP)、三磷酸尿苷(UTP)和三磷酸5-甲基尿苷(m5UTP)。在一些实施方案中,使用二磷酸腺苷(ADP)、二磷酸鸟苷(GDP)、二磷酸胞苷(CDP)和/或二磷酸尿苷(UDP)。
核苷酸类似物的实例包括但不限于抗病毒核苷酸类似物、磷酸类似物(可溶的或固定的、可水解的或不可水解的)、二核苷酸、三核苷酸、四核苷酸,例如,帽类似物,或用于酶加帽(牛痘或连接酶)的前体/底物,用官能团标记以促进帽或5'部分(IRES)的连接/缀合的核苷酸,用5'PO4标记以促进帽或5'部分的连接的核苷酸,或用可以化学或酶促裂解的官能团/保护基标记的核苷酸。抗病毒核苷酸/核苷类似物的实例包括但不限于更昔洛韦(Ganciclovir)、恩替卡韦(Entecavir)、替比夫定(Telbivudine)、阿糖腺苷(Vidarabine)和西多福韦(Cidofovir)。
修饰的核苷酸可以包括修饰的核碱基。举例来说,本公开的RNA转录物(例如,mRNA转录物)可以包括选自以下的修饰的核碱基:假尿苷(ψ)、1-甲基假尿苷(m1ψ)、1-乙基假尿苷、2-硫代尿苷、4'-硫代尿苷、2-硫代-1-甲基-1-脱氮-假尿苷、2-硫代-1-甲基-假尿苷、2-硫代-5-氮杂-尿苷、2-硫代-二氢假尿苷、2-硫代-二氢尿苷、2-硫代-假尿苷、4-甲氧基-2-硫代-假尿苷、4-甲氧基-假尿苷、4-硫代-1-甲基-假尿苷、4-硫代-假尿苷、5-氮杂-尿苷、二氢假尿苷、5-甲基尿苷、5-甲氧基尿苷(mo5U)和2'-O-甲基尿苷。在一些实施方案中,RNA转录物(例如,mRNA转录物)包括至少两种(例如,2种、3种、4种或更多种)前述修饰的核碱基的组合。
如本文所提供的三磷酸核苷(NTP)可以包含未修饰或修饰的ATP、修饰或未修饰的UTP、修饰或未修饰的GTP和/或修饰或未修饰的CTP。在一些实施方案中,IVT反应的NTP包含未修饰的ATP。在一些实施方案中,IVT反应的NTP包含修饰的ATP。在一些实施方案中,IVT反应的NTP包含未修饰的UTP。在一些实施方案中,IVT反应的NTP包含修饰的UTP。在一些实施方案中,IVT反应的NTP包含未修饰的GTP。在一些实施方案中,IVT反应的NTP包含修饰的GTP。在一些实施方案中,IVT反应的NTP包含未修饰的CTP。在一些实施方案中,IVT反应的NTP包含修饰的CTP。
存在于IVT反应中的三磷酸核苷和帽类似物的浓度可能有变化。在一些实施方案中,NTP和帽类似物以等摩尔浓度存在于反应中。在一些实施方案中,反应中帽类似物(例如,三核苷酸帽)与三磷酸核苷的摩尔比大于1:1。举例来说,反应中帽类似物与三磷酸核苷的摩尔比可以为2:1、3:1、4:1、5:1、6:1、7:1、8:1、9:1、10:1、15:1、20:1、25:1、50:1或100:1。在一些实施方案中,反应中帽类似物(例如,三核苷酸帽)与三磷酸核苷的摩尔比小于1:1。举例来说,反应中帽类似物(例如,三核苷酸帽)与三磷酸核苷的摩尔比可以为1:2、1:3、1:4、1:5、1:6、1:7、1:8、1:9、1:10、1:15、1:20、1:25、1:50或1:100。
IVT反应中NTP的组成也可能有变化。举例来说,ATP可以在过量GTP、CTP和UTP下使用。作为一个非限制性实例,IVT反应可以包括7.5毫摩尔GTP、7.5毫摩尔CTP、7.5毫摩尔UTP和3.75毫摩尔ATP。相同的IVT反应可以包括3.75毫摩尔帽类似物(例如,三核苷酸帽)。在一些实施方案中,G:C:U:A:帽的摩尔比为1:1:1:0.5:0.5。在一些实施方案中,G:C:U:A:帽的摩尔比为1:1:0.5:1:0.5。在一些实施方案中,G:C:U:A:帽的摩尔比为1:0.5:1:1:0.5。在一些实施方案中,G:C:U:A:帽的摩尔比为0.5:1:1:1:0.5。
在一些实施方案中,RNA转录物(例如,mRNA转录物)包括选自以下的修饰的核碱基:假尿苷(ψ)、1-甲基假尿苷(m1ψ)、5-甲氧基尿苷(mo5U)、5-甲基胞苷(m5C)、α-硫代-鸟苷或α-硫代-腺苷。在一些实施方案中,RNA转录物(例如,mRNA转录物)包括至少两种(例如,2种、3种、4种或更多种)前述修饰的核碱基的组合。
在一些实施方案中,RNA转录物(例如,mRNA转录物)包括假尿苷(ψ)。在一些实施方案中,RNA转录物(例如,mRNA转录物)包括1-甲基假尿苷(m1ψ)。在一些实施方案中,RNA转录物(例如,mRNA转录物)包括5-甲氧基尿苷(mo5U)。在一些实施方案中,RNA转录物(例如,mRNA转录物)包括5-甲基胞苷(m5C)。在一些实施方案中,RNA转录物(例如,mRNA转录物)包括α-硫代-鸟苷。在一些实施方案中,RNA转录物(例如,mRNA转录物)包括α-硫代-腺苷。
在一些实施方案中,多核苷酸(例如RNA多核苷酸,诸如mRNA多核苷酸)被统一修饰(例如,完全修饰,遍及整个序列进行修饰)以用于特定修饰。举例来说,多核苷酸可以统一被1-甲基假尿苷(m1ψ)修饰,意指mRNA序列中的所有尿苷残基均被1-甲基假尿苷(m1ψ)置换。类似地,多核苷酸可以通过用修饰的残基(诸如上文所阐述的那些残基中的任一者)置换而针对存在于序列中的任何类型的核苷残基进行统一修饰。或者,多核苷酸(例如RNA多核苷酸,诸如mRNA多核苷酸)可以不被统一修饰(例如,部分修饰,序列的一部分被修饰)。每种可能性代表本发明的独立实施方案。
在一些实施方案中,缓冲系统含有tris。举例来说,IVT反应中使用的tris的浓度可以为至少10mM、至少20mM、至少30mM、至少40mM、至少50mM、至少60mM、至少70mM、至少80mM、至少90mM、至少100mM或至少110mM磷酸盐。在一些实施方案中,磷酸盐的浓度为20-60mM或10-100mM。
在一些实施方案中,缓冲系统含有二硫苏糖醇(DTT)。举例来说,IVT反应中使用的DTT的浓度可以为至少1mM、至少5mM或至少50mM。在一些实施方案中,IVT反应中使用的DTT的浓度为1-50mM或5-50mM。在一些实施方案中,IVT反应中使用的DTT的浓度为5mM。
在一些实施方案中,缓冲系统含有镁。在一些实施方案中,存在于IVT反应中的NTP与镁离子(Mg2+;例如,MgCl2)的摩尔比为1:1至1:5。举例来说,NTP与镁离子的摩尔比可以为1:1、1:2、1:3、1:4或1:5。
在一些实施方案中,存在于IVT反应中的NTP加上帽类似物(例如三核苷酸帽,诸如GAG)与镁离子(Mg2+;例如,MgCl2)的摩尔比为1:1至1:5。举例来说,NTP+三核苷酸帽(例如,GAG)与镁离子的摩尔比可以为1:1、1:2、1:3、1:4或1:5。
在一些实施方案中,缓冲系统含有Tris-HCl、亚精胺(例如,浓度为1-30mM)、
Figure BDA0004090383130002351
X-100(聚乙二醇对(1,1,3,3-四甲基丁基)-苯基醚)和/或聚乙二醇(PEG)。/>
将三磷酸核苷(NTP)添加至生长的RNA链的3'端是由聚合酶催化的,诸如T7 RNA聚合酶,例如,本公开的T7 RNA聚合酶变体(例如,G47A)中的任何一者或多者。在一些实施方案中,RNA聚合酶(例如,T7 RNA聚合酶变体)以0.01mg/ml至1mg/ml的浓度存在于反应(例如,IVT反应)中。举例来说,RNA聚合酶可能以0.01mg/mL、0.05mg/ml、0.1mg/ml、0.5mg/ml或1.0mg/ml的浓度存在于反应中。
在一些实施方案中,本公开的多核苷酸是IVT多核苷酸。传统上,mRNA分子的基本组分至少包括编码区、5'UTR、3'UTR、5'帽和多聚A尾。本公开的IVT多核苷酸可以作为mRNA发挥作用,但在它们的功能和/或结构设计特征上不同于野生型mRNA,这些特征用于例如克服使用基于核酸的治疗剂有效产生多肽的现有问题。
IVT多核苷酸的初级构建体包含连接的核苷酸的第一区,其侧接有第一侧翼区和第二侧翼区。这个第一区可以包括但不限于编码的治疗性有效载荷或预防性有效载荷。第一侧翼区可以包括作为5'非翻译区(UTR)发挥作用的连接核苷的序列,诸如编码多肽的原生5'UTR或非原生5'UTR的核酸中的任一者的5'UTR,诸如但不限于异源5'UTR或合成5'UTR。编码治疗性有效载荷或预防性有效载荷的IVT可以在其5末端包含编码一个或多个信号序列的信号序列区。侧翼区可以包含连接的核苷酸的区域,所述连接的核苷酸包含一个或多个完整或不完整的5'UTR序列。侧翼区还可以包括5'末端帽。第二侧翼区可以包含连接的核苷酸的区域,所述连接的核苷酸包含一个或多个完整或不完整的3'UTR,其可以编码治疗性有效载荷或预防性有效载荷的原生3'UTR,或非原生3'UTR,诸如但不限于异源3'UTR或合成3'UTR。侧翼区还可以包含3'加尾序列。3'加尾序列可以是但不限于多聚A尾、多聚A-G四联体和/或茎环序列。
IVT多核苷酸架构的额外和示例性特征以及制备多核苷酸的方法在2017年5月18日提交的国际PCT申请WO 2017/201325中公开,所述申请的全部内容特此以引用的方式并入。
纯化
在其它方面,可以纯化本文所公开的多核苷酸(例如,mRNA)。本文所描述的多核苷酸(例如,mRNA)的纯化可以包括但不限于多核苷酸清理、质量保证和质量控制。可以通过本领域中已知的方法进行清理,诸如但不限于
Figure BDA0004090383130002361
珠粒(Beckman CoulterGenomics,Danvers,MA)、多聚T珠粒、LNATM寡聚T捕获探针(/>
Figure BDA0004090383130002362
Inc,Vedbaek,Denmark)或基于HPLC的纯化方法,诸如但不限于强阴离子交换HPLC、弱阴离子交换HPLC、反相HPLC(RP-HPLC)和疏水相互作用HPLC(HIC-HPLC)。术语“纯化的”当关于多核苷酸,诸如“纯化的多核苷酸”使用时,是指与至少一种污染物分离的多核苷酸。如本文所用,“污染物”是使另一种物质不适合、不纯或劣等的任何物质。因此,纯化的多核苷酸(例如,DNA和RNA)以不同于其在自然界中发现的形式或配置存在,或以不同于对其进行处理或纯化方法之前存在的形式或配置存在。
在一些实施方案中,本公开的多核苷酸(例如,mRNA)的纯化去除了杂质,这可以减少或去除不想要的免疫反应,例如,降低细胞因子活性。
在一些实施方案中,本公开的多核苷酸(例如,mRNA)在施用之前使用柱色谱法(例如,强阴离子交换HPLC、弱阴离子交换HPLC、反相HPLC(RP-HPLC)和疏水相互作用HPLC(HIC-HPLC)或(LCMS))进行纯化。在一些实施方案中,柱色谱法(例如,强阴离子交换HPLC、弱阴离子交换HPLC、反相HPLC(RP-HPLC)和疏水相互作用HPLC(HIC-HPLC)或(LCMS))纯化的多核苷酸,其编码本文所公开的治疗性有效载荷或预防性有效载荷,与通过不同纯化方法纯化的编码治疗性有效载荷或预防性有效载荷的多核苷酸相比,增加了治疗性有效载荷或预防性有效载荷的表达。
在一些实施方案中,柱色谱法(例如,强阴离子交换HPLC、弱阴离子交换HPLC、反相HPLC(RP-HPLC)和疏水相互作用HPLC(HIC-HPLC)或(LCMS))纯化的多核苷酸编码治疗性有效载荷或预防性有效载荷。在一些实施方案中,纯化的多核苷酸编码治疗性有效载荷或预防性有效载荷。
在一些实施方案中,纯化的多核苷酸为至少约80%纯的、至少约85%纯的、至少约90%纯的、至少约95%纯的、至少约96%纯的、至少约97%纯的、至少约98%纯的、至少约99%纯的或约100%纯的。
质量保证和/或质量控制检查可以使用诸如但不限于凝胶电泳、UV吸光度或分析型HPLC的方法进行。
在另一个实施方案中,可以通过包括但不限于逆转录酶-PCR的方法对多核苷酸进行测序。
多核苷酸的化学修饰
如上文所描述,核酸(例如RNA核酸,诸如mRNA核酸)的修饰的核苷和核苷酸可以包括于本发明的多核苷酸中。“核苷”是指含有与有机碱(例如,嘌呤或嘧啶)或其衍生物(本文中也称作“核碱基”)组合的糖分子(例如,戊糖或核糖)或其衍生物的化合物。“核苷酸”是指核苷,包括磷酸基团。修饰的核苷酸可以通过诸如化学、酶促或重组的任何有用方法合成,以包括一个或多个修饰的或非天然的核苷。核酸可以包含连接的核苷的一个或多个区域。此类区域可能具有可变的主链键联。键联可以是标准的磷酸二酯键联,在这种情况下,核酸将包含核苷酸区域。
修饰的核苷酸碱基配对不仅涵盖标准的腺苷-胸腺嘧啶、腺苷-尿嘧啶或鸟苷-胞嘧啶碱基对,而且涵盖核苷酸和/或包含非标准或修饰碱基的修饰核苷酸之间形成的碱基对,其中氢键供体和氢键接受体的排列允许非标准碱基与标准碱基之间或两个互补的非标准碱基结构之间的氢键结,例如,在具有至少一个化学修饰的那些核酸中。此种非标准碱基配对的一个实例是修饰的核苷酸肌苷与腺嘌呤、胞嘧啶或尿嘧啶之间的碱基配对。碱基/糖或连接子的任何组合可以并入本公开的核酸中。
在一些实施方案中,核酸(例如RNA核酸,诸如mRNA核酸)中的修饰核碱基包括N1-甲基-假尿苷(m1ψ)、1-乙基-假尿苷(e1ψ)、5-甲氧基-尿苷(mo5U)、5-甲基-胞苷(m5C)和/或假尿苷(ψ)。在一些实施方案中,核酸(例如RNA核酸,诸如mRNA核酸)中的修饰核碱基包括5-甲氧基甲基尿苷、5-甲硫基尿苷、1-甲氧基甲基假尿苷、5-甲基胞苷和/或5-甲氧基胞苷。在一些实施方案中,多核糖核苷酸包括至少两种(例如,2种、3种、4种或更多种)任何上述修饰的核碱基的组合,包括但不限于化学修饰。
在一些实施方案中,本公开的RNA核酸在核酸的一个或多个或所有尿苷位置处包含N1-甲基-假尿苷(m1ψ)取代。
在一些实施方案中,本公开的RNA核酸在核酸的一个或多个或所有尿苷位置处包含N1-甲基-假尿苷(m1ψ)取代并且在核酸的一个或多个或所有胞苷位置处包含5-甲基胞苷取代。
在一些实施方案中,本公开的RNA核酸在核酸的一个或多个或所有尿苷位置处包含假尿苷(ψ)取代。
在一些实施方案中,本公开的RNA核酸在核酸的一个或多个或所有尿苷位置处包含假尿苷(ψ)取代并且在核酸的一个或多个或所有胞苷位置处包含5-甲基胞苷取代。
在一些实施方案中,本公开的RNA核酸在核酸的一个或多个或所有尿苷位置处包含尿苷。
在一些实施方案中,核酸(例如RNA核酸,诸如mRNA核酸)被统一修饰(例如,完全修饰,遍及整个序列进行修饰)以用于特定修饰。举例来说,核酸可以统一被N1-甲基-假尿苷修饰,意指mRNA序列中的所有尿苷残基均被N1-甲基-假尿苷置换。类似地,核酸可以通过用修饰的残基(诸如上文所阐述的那些残基)置换而针对存在于序列中的任何类型的核苷残基进行统一修饰。
本公开的核酸可以沿着分子的整个长度被部分或完全修饰。举例来说,一种或多种或所有或给定类型的核苷酸(例如,嘌呤或嘧啶,或A、G、U、C中的任何一者或多者或全部)可以在本公开的核酸中或在其预定序列区域中(例如,在包括或不包括多聚A尾的mRNA中)被统一修饰。在一些实施方案中,本公开的核酸中(或其序列区域中)的所有核苷酸X都是修饰的核苷酸,其中X可以是核苷酸A、G、U、C中的任一者,或组合A+G、A+U、A+C、G+U、G+C、U+C、A+G+U、A+G+C、G+U+C或A+G+C中的任一者。
核酸可以含有约1%至约100%的修饰核苷酸(相对于总核苷酸含量,或相对于一种或多种类型的核苷酸,即,A、G、U或C中的任何一者或多者)或任何中间百分比(例如,1%至20%、1%至25%、1%至50%、1%至60%、1%至70%、1%至80%、1%至90%、1%至95%、10%至20%、10%至25%、10%至50%、10%至60%、10%至70%、10%至80%、10%至90%、10%至95%、10%至100%、20%至25%、20%至50%、20%至60%、20%至70%、20%至80%、20%至90%、20%至95%、20%至100%、50%至60%、50%至70%、50%至80%、50%至90%、50%至95%、50%至100%、70%至80%、70%至90%、70%至95%、70%至100%、80%至90%、80%至95%、80%至100%、90%至95%、90%至100%及95%至100%)。将了解,任何剩余百分比均由未修饰的A、G、U或C的存在来解释。
核酸可以含有最少1%和最多100%的修饰核苷酸,或任何中间百分比,诸如至少5%的修饰核苷酸、至少10%的修饰核苷酸、至少25%的修饰核苷酸、至少50%的修饰核苷酸、至少80%的修饰核苷酸或至少90%的修饰核苷酸。举例来说,核酸可以含有修饰的嘧啶,例如修饰的尿嘧啶或胞嘧啶。在一些实施方案中,核酸中至少5%、至少10%、至少25%、至少50%、至少80%、至少90%或100%的尿嘧啶被修饰的尿嘧啶(例如,5-取代的尿嘧啶)置换。修饰的尿嘧啶可以被具有单一独特结构的化合物置换,或者可以被具有不同结构(例如,2个、3个、4个或更多个独特结构)的多种化合物置换。在一些实施方案中,核酸中至少5%、至少10%、至少25%、至少50%、至少80%、至少90%或100%的胞嘧啶被修饰的胞嘧啶(例如,5-取代的胞嘧啶)置换。修饰的胞嘧啶可以被具有单一独特结构的化合物置换,或者可以被具有不同结构(例如,2个、3个、4个或更多个独特结构)的多种化合物置换。
序列优化及其方法
在一些实施方案中,本公开的多核苷酸包含编码本文所公开的多肽的序列优化的核苷酸序列,例如,编码治疗性有效载荷或预防性有效载荷的多核苷酸。在一些实施方案中,本公开的多核苷酸包含编码治疗性有效载荷或预防性有效载荷的开放阅读框(ORF),其中ORF已经进行序列优化。
本文所公开的序列优化的核苷酸序列不同于相应的野生型核苷酸序列和其它已知的序列优化的核苷酸序列,例如,这些序列优化的核酸具有独特的组成特征。
在一些实施方案中,相对于参考野生型核苷酸序列中的尿嘧啶或胸腺嘧啶核碱基的百分比,序列优化的核苷酸序列中的尿嘧啶或胸腺嘧啶核碱基的百分比被修饰(例如,降低)。此种序列被称作尿嘧啶修饰的或胸腺嘧啶修饰的序列。核苷酸序列中尿嘧啶或胸腺嘧啶含量的百分比可以通过将序列中尿嘧啶或胸腺嘧啶的数目除以核苷酸总数并乘以100来确定。在一些实施方案中,序列优化的核苷酸序列具有比参考野生型序列中的尿嘧啶或胸腺嘧啶含量更低的尿嘧啶或胸腺嘧啶含量。在一些实施方案中,本公开的序列优化的核苷酸序列中的尿嘧啶或胸腺嘧啶含量大于参考野生型序列中的尿嘧啶或胸腺嘧啶含量并且仍维持有益作用,例如,与参考野生型序列相比时增加的表达和/或信号响应。
在一些实施方案中,本公开的优化序列在序列中含有独特范围的尿嘧啶或胸腺嘧啶(如果是DNA的话)。优化序列的尿嘧啶或胸腺嘧啶含量可以按多种方式表示,例如,相对于理论最小值(%UTM或%TTM)、相对于野生型(%UWT或%TWT)以及相对于总核苷酸含量(%UTL或%TTL)的优化序列的尿嘧啶或胸腺嘧啶含量。对于DNA,认识到胸腺嘧啶(T)代替尿嘧啶(U)存在,并且在U出现之处用T取代。对于RNA,认识到尿嘧啶(U)代替胸腺嘧啶(T)存在。当通过将DNA序列中的胸腺嘧啶替换为尿嘧啶来提供DNA序列时,本领域技术人员可以容易地获得RNA序列。因此,与例如%UTM、%UWT或%UTL(关于RNA)有关的所有公开内容同样适用于%TTM、%TWT或%TTL(关于DNA)。
相对于尿嘧啶或胸腺嘧啶理论最小值的尿嘧啶或胸腺嘧啶含量是指通过将序列优化的核苷酸序列中的尿嘧啶或胸腺嘧啶的数目除以假设核苷酸序列中的尿嘧啶或胸腺嘧啶的总数并乘以100而确定的参数,其中假设序列中的所有密码子都被具有尽可能低的尿嘧啶或胸腺嘧啶含量的同义密码子置换。这个参数在本文中缩写为%UTM或%TTM。
在一些实施方案中,本公开的尿嘧啶修饰的序列相对于相应的野生型核酸序列具有数目减少的连续尿嘧啶。举例来说,两个连续亮氨酸可以由序列CUUUUG编码,所述序列包括四尿嘧啶簇。此种子序列可以例如用CUGCUC替代,所述序列去除尿嘧啶簇。苯丙氨酸可以由UUC或UUU编码。因此,即使由UUU编码的苯丙氨酸被UUC替代,同义密码子仍然含有尿嘧啶对(UU)。因此,序列中苯丙氨酸的数目确立了在不改变编码的多肽中苯丙氨酸数目的情况下不能消除的尿嘧啶对(UU)的最小数目。
在一些实施方案中,本公开的尿嘧啶修饰的序列相对于野生型核酸序列具有数目减少的尿嘧啶三联体(UUU)。在一些实施方案中,相对于野生型核酸序列中尿嘧啶对(UU)的数目,尿嘧啶修饰的序列具有数目减少的尿嘧啶对(UU)。在一些实施方案中,本公开的尿嘧啶修饰的序列具有对应于野生型核酸序列中的最小可能数目的尿嘧啶对(UU)的尿嘧啶对(UU)的数目。
短语“相对于野生型核酸序列中的尿嘧啶对(UU)的尿嘧啶对(UU)”是指通过将序列优化的核苷酸序列中尿嘧啶对(UU)的数目除以相应野生型核苷酸序列中尿嘧啶对(UU)的总数并乘以100而确定的参数。这个参数在本文中缩写为%UUwt。在一些实施方案中,尿嘧啶修饰的序列具有低于100%的%UUwt。
在一些实施方案中,本公开的多核苷酸包含尿嘧啶修饰的序列。在一些实施方案中,尿嘧啶修饰的序列包含至少一个化学修饰的核碱基,例如,5-甲氧基尿嘧啶。在一些实施方案中,本公开的尿嘧啶修饰的序列中至少95%的核碱基(例如,尿嘧啶)是修饰的核碱基。在一些实施方案中,尿嘧啶修饰的序列中至少95%的尿嘧啶是5-甲氧基尿嘧啶。
在一些实施方案中,本公开的多核苷酸是序列优化的。
序列优化的核苷酸序列(核苷酸序列在本文中也称作“核酸”)包含相对于参考序列(例如,编码治疗性有效载荷或预防性有效载荷的野生型序列)的至少一个密码子修饰。因此,在序列优化的核酸中,至少一个密码子不同于参考序列(例如,野生型序列)中的相应密码子。
一般来说,序列优化的核酸通过至少一个步骤产生,所述步骤包括用同义密码子(即,编码相同氨基酸的密码子)取代参考序列中的密码子。举例来说,可以通过应用密码子取代图(即,提供将编码密码子优化序列中的每个氨基酸的密码子的表)或通过应用一组规则(例如,如果甘氨酸紧接在中性氨基酸之后,则甘氨酸将由某个密码子编码,但如果紧接在极性氨基酸之后,则它将由另一个密码子编码)来实现此类取代。除了密码子取代(即,“密码子优化”)之外,本文所公开的序列优化方法包括不严格针对密码子优化的额外优化步骤,诸如去除有害基序(去稳定基序取代)。可以向有需要的受试者施用包含这些序列优化的核酸(例如RNA,例如mRNA)的组合物和制剂,以促进编码治疗性有效载荷或预防性有效载荷的功能活性物质的体内表达。
额外和示例性序列优化方法在2017年5月18日提交的国际PCT申请WO 2017/201325中公开,所述申请的全部内容特此以引用的方式并入。
LNP的脂质含量
如上文所阐述,关于脂质,用作本文所公开的递送运载体的LNP包含(i)可电离脂质;(ii)固醇或其它结构脂质;(iii)非阳离子辅助脂质或磷脂;以及任选地(iv)PEG脂质。这些类别的脂质在下文更详细地阐述。
在一些实施方案中,本发明的核酸被配制成脂质纳米颗粒(LNP)组合物。脂质纳米颗粒通常包含氨基脂质、磷脂、结构脂质和PEG脂质组分以及所关注的核酸货物。本发明的脂质纳米颗粒可以使用本领域中一般已知的组分、组合物和方法产生,参见例如PCT/US2016/052352;PCT/US2016/068300;PCT/US2017/037551;PCT/US2015/027400;PCT/US2016/047406;PCT/US2016000129;PCT/US2016/014280;PCT/US2016/014280;PCT/US2017/038426;PCT/US2014/027077;PCT/US2014/055394;PCT/US2016/52117;PCT/US2012/069610;PCT/US2017/027492;PCT/US2016/059575;PCT/US2016/069491;PCT/US2016/069493;和PCT/US2014/66242,全部以全文引用的方式并入本文中。
在一些实施方案中,脂质纳米颗粒包含相对于其它脂质组分,摩尔比为20-60%的氨基脂质。举例来说,脂质纳米颗粒可以包含摩尔比为20-50%、20-40%、20-30%、30-60%、30-50%、30-40%、40-60%、40-50%或50-60%的氨基脂质。在一些实施方案中,脂质纳米颗粒包含摩尔比为20%、30%、40%、50或60%的氨基脂质。
在一些实施方案中,脂质纳米颗粒包含相对于其它脂质组分,摩尔比为5-25%的磷脂。举例来说,脂质纳米颗粒可以包含摩尔比为5-30%、5-15%、5-10%、10-25%、10-20%、10-25%、15-25%、15-20%、20-25%或25-30%的磷脂。在一些实施方案中,脂质纳米颗粒包含摩尔比为5%、10%、15%、20%、25%或30%的非阳离子脂质。
在一些实施方案中,脂质纳米颗粒包含相对于其它脂质组分,摩尔比为25-55%的结构脂质。举例来说,脂质纳米颗粒可以包含摩尔比为10-55%、25-50%、25-45%、25-40%、25-35%、25-30%、30-55%、30-50%、30-45%、30-40%、30-35%、35-55%、35-50%、35-45%、35-40%、40-55%、40-50%、40-45%、45-55%、45-50%或50-55%的结构脂质。在一些实施方案中,脂质纳米颗粒包含摩尔比为10%、15%、20%、25%、30%、35%、40%、45%、50%或55%的结构脂质。
在一些实施方案中,脂质纳米颗粒包含相对于其它脂质组分,摩尔比为0.5-15%的PEG脂质。举例来说,脂质纳米颗粒可以包含摩尔比为0.5-10%、0.5-5%、1-15%、1-10%、1-5%、2-15%、2-10%、2-5%、5-15%、5-10%或10-15%的PEG脂质。在一些实施方案中,脂质纳米颗粒包含摩尔比为0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%或15%的PEG-脂质。
在一些实施方案中,脂质纳米颗粒包含摩尔比为20-60%的氨基脂质、5-25%的磷脂、25-55%的结构脂质和0.5-15%的PEG脂质。
在一些实施方案中,脂质纳米颗粒包含摩尔比为20-60%的氨基脂质、5-30%的磷脂、10-55%的结构脂质和0.5-15%的PEG脂质。
氨基脂质
在一些方面,本公开的氨基脂质可以是式(I)化合物中的一者或多者:
Figure BDA0004090383130002451
或其N-氧化物,或其盐或异构体,其中:
R1选自由C5-30烷基、C5-20烯基、-R*YR"、-YR"和-R"M'R'组成的组;
R2和R3独立地选自由H、C1-14烷基、C2-14烯基、-R*YR"、-YR"和-R*OR"组成的组,或R2和R3与它们所连接的原子一起形成杂环或碳环;
R4选自由氢、C3-6碳环、-(CH2)nQ、-(CH2)nCHQR、-CHQR、-C Q(R)2和未取代的C1-6烷基组成的组,其中Q选自碳环、杂环、-OR、-O(CH2)nN(R)2、-C(O)OR、-OC(O)R、-CX3、-CX2H、-CXH2、-CN、-N(R)2、-C(O)N(R)2、-N(R)C(O)R、-N(R)S(O)2R、-N(R)C(O)N(R)2、-N(R)C(S)N(R)2、-N(R)R8、-N(R)S(O)2R8、-O(CH2)nOR、-N(R)C(=N R9)N(R)2、-N(R)C(=CHR9)N(R)2、-OC(O)N(R)2、-N(R)C(O)OR、-N(O R)C(O)R、-N(OR)S(O)2R、-N(OR)C(O)OR、-N(OR)C(O)N(R)2、-N(O R)C(S)N(R)2、-N(OR)C(=NR9)N(R)2、-N(OR)C(=CHR9)N(R)2、-C(=N R9)N(R)2、-C(=NR9)R、-C(O)N(R)OR和-C(R)N(R)2C(O)OR,并且每个n独立地选自1、2、3、4和5;
每个R5独立地选自由C1-3烷基、C2-3烯基和H组成的组;
每个R6独立地选自由C1-3烷基、C2-3烯基和H组成的组;
M和M'独立地选自-C(O)O-、-OC(O)-、-OC(O)-M"-C(O)O-、-C(O)N(R')-、-N(R')C(O)-、-C(O)-、-C(S)-、-C(S)S-、-SC(S)-、-CH(OH)-、-P(O)(OR')O-、-S(O)2-、-S-S-、芳基和杂芳基,其中M"是键、C1-13烷基或C2-13烯基;
R7选自由C1-3烷基、C2-3烯基和H组成的组;
R8选自由C3-6碳环和杂环组成的组;
R9选自由H、CN、NO2、C1-6烷基、-OR、-S(O)2R、-S(O)2N(R)2、C2-6烯基、C3-6碳环和杂环组成的组;
每个R独立地选自由C1-3烷基、C2-3烯基和H组成的组;
每个R'独立地选自由C1-18烷基、C2-18烯基、-R*YR"、-YR"和H组成的组;
每个R"独立地选自由C3-15烷基和C3-15烯基组成的组;
每个R*独立地选自由C1-12烷基和C2-12烯基组成的组;
每个Y独立地是C3-6碳环;
每个X独立地选自由F、Cl、Br和I组成的组;并且
m选自5、6、7、8、9、10、11、12和13;并且其中当R4是-(CH2)nQ、-(CH2)nCHQR、-CHQR或-CQ(R)2时,则(i)当n是1、2、3、4或5时,Q不是-N(R)2,或(ii)当n是1或2时,Q不是5元、6元或7元杂环烷基。
在某些实施方案中,式(I)化合物的子集包括式(IA)的那些:
Figure BDA0004090383130002471
或其N-氧化物,或其盐或异构体,其中l选自1、2、3、4和5;m选自5、6、7、8和9;M1是键或M';R4是氢、未取代的C1-3烷基或-(CH2)nQ,其中Q是OH、-NHC(S)N(R)2、-NHC(O)N(R)2、-N(R)C(O)R、-N(R)S(O)2R、-N(R)R8、-NHC(=NR9)N(R)2、-NHC(=CHR9)N(R)2、-OC(O)N(R)2、-N(R)C(O)OR、杂芳基或杂环烷基;M和M'独立地选自-C(O)O-、-OC(O)-、-OC(O)-M"-C(O)O-、-C(O)N(R')-、-P(O)(OR')O-、-S-S-、芳基和杂芳基;并且R2和R3独立地选自由H、C1-14烷基和C2-14烯基组成的组。举例来说,m是5、7或9。举例来说,Q是OH、-NHC(S)N(R)2或-NHC(O)N(R)2。举例来说,Q是-N(R)C(O)R或-N(R)S(O)2R。
在某些实施方案中,式(I)化合物的子集包括式(IB)的那些:
Figure BDA0004090383130002472
或其N-氧化物,或其盐或异构体,其中所有变量如本文所定义。举例来说,m选自5、6、7、8和9;R4是氢、未取代的C1-3烷基或-(CH2)nQ,其中Q是OH、-NHC(S)N(R)2、-NHC(O)N(R)2、-N(R)C(O)R、-N(R)S(O)2R、-N(R)R8、-NHC(=NR9)N(R)2、-NHC(=CHR9)N(R)2、-OC(O)N(R)2、-N(R)C(O)OR、杂芳基或杂环烷基;M和M'独立地选自-C(O)O-、-OC(O)-、-OC(O)-M"-C(O)O-、-C(O)N(R')-、-P(O)(OR')O-、-S-S-、芳基和杂芳基;并且R2和R3独立地选自由H、C1-14烷基和C2-14烯基组成的组。举例来说,m是5、7或9。举例来说,Q是OH、-NHC(S)N(R)2或-NHC(O)N(R)2。举例来说,Q是-N(R)C(O)R或-N(R)S(O)2R。
在某些实施方案中,式(I)化合物的子集包括式(IC)的那些:
Figure BDA0004090383130002481
或其N-氧化物,或其盐或异构体,其中所有变量如本文所定义。举例来说,R'选自由支链C1-18烷基和支链C2-18烯基组成的组;R2和R3各自独立地选自由C1-14烷基和C2-14烯基组成的组;R4选自由以下组成的组:-(CH2)nOH,其中n选自由1、2、3、4和5组成的组,和
Figure BDA0004090383130002482
其中/>
Figure BDA0004090383130002483
表示连接点;其中R10是N(R)2;每个R独立地选自由C1-6烷基、C2-3烯基和H组成的组;并且n2选自由1、2、3、4、5、6、7、8、9和10组成的组;每个R5独立地选自由C1-3烷基、C2-3烯基和H组成的组;每个R6独立地选自由C1-3烷基、C2-3烯基和H组成的组;M和M1各自独立地选自由-C(O)O-和-OC(O)-组成的组;l选自由1、2、3、4和5组成的组;并且m选自由5、6、7、8、9、10、11、12和13组成的组。
在式(IC)化合物的一些实施方案中,R'是
Figure BDA0004090383130002484
其中/>
Figure BDA0004090383130002485
表示连接点;其中R、R、R和R各自独立地选自由H、C2-12烷基和C2-12烯基组成的组并且Rb是C1-12烷基或C2-12烯基。在式(IC)化合物的一些实施方案中,R'是/>
Figure BDA0004090383130002486
其中/>
Figure BDA0004090383130002487
表示连接点;其中R、R、R和R各自是H;R2和R3各自是C1-14烷基;R4是-(CH2)nOH;n是2;每个R5是H;每个R6是H;M和M'各自是-C(O)O-;Rb是C1-12烷基;l是5;并且m是7。在式(IC)的一些实施方案中,R'是/>
Figure BDA0004090383130002491
其中/>
Figure BDA0004090383130002492
表示连接点;R、R、R和R各自是H;R2和R3各自是C1-14烷基;R4是-(CH2)nOH;n是2;每个R5是H;每个R6是H;M和M'各自是-C(O)O-;R'是C1-12烷基;l是3;并且m是7。
在式(IC)化合物的一些实施方案中,R'是
Figure BDA0004090383130002493
其中/>
Figure BDA0004090383130002494
表示连接点;R是C2-12烷基;R、R和R各自是H;R2和R3各自是C1-14烷基;R4是/>
Figure BDA0004090383130002495
R10是NH(C1-6烷基);n2是2;R5是H;每个R6是H;M和M'各自是-C(O)O-;R'是C1-12烷基;l是5;并且m是7。
在式(IC)化合物的一些实施方案中,R'是
Figure BDA0004090383130002496
其中/>
Figure BDA0004090383130002497
表示连接点;R、R和R各自是H;R是C2-12烷基;R2和R3各自是C1-14烷基;R4是-(CH2)nOH;n是2;每个R5是H;每个R6是H;M和M'各自是-C(O)O-;R'是C1-12烷基;l是5;并且m是7。
在式(IC)化合物的一些实施方案中,R'是
Figure BDA0004090383130002498
其中/>
Figure BDA0004090383130002499
表示连接点;其中R、R和R各自独立地选自由H、C2-12烷基和C2-12烯基组成的组并且Rb是C1-12烷基或C2-12烯基。在式(IC)化合物的一些实施方案中,R'是/>
Figure BDA00040903831300024910
其中R、R和R各自独立地选自由H、C2-12烷基和C2-12烯基组成的组;R2和R3各自独立地选自由C1-14烷基和C2-14烯基组成的组;R4选自由以下组成的组:-(CH2)nOH,其中n选自由1、2、3、4和5组成的组,和
Figure BDA0004090383130002501
其中/>
Figure BDA0004090383130002502
表示连接点;其中R10是N(R)2;每个R独立地选自由C1-6烷基、C2-3烯基和H组成的组;并且n2选自由1、2、3、4、5、6、7、8、9和10组成的组;每个R5独立地选自由C1-3烷基、C2-3烯基和H组成的组;每个R6独立地选自由C1-3烷基、C2-3烯基和H组成的组;M和M'各自独立地选自由-C(O)O-和-OC(O)-组成的组;Rb是C1-12烷基或C2-12烯基;l选自由1、2、3、4和5组成的组;并且m选自由5、6、7、8、9、10、11、12和13组成的组。
在式(IC)化合物的一些实施方案中,R'是
Figure BDA0004090383130002503
其中/>
Figure BDA0004090383130002504
表示连接点;其中R、R、R和R各自独立地选自由H、C2-12烷基和C2-12烯基组成的组;R2和R3各自独立地选自由C1-14烷基和C2-14烯基组成的组;R4是-(CH2)nOH,其中n选自由1、2、3、4和5组成的组;每个R5独立地选自由C1-3烷基、C2-3烯基和H组成的组;每个R6独立地选自由C1-3烷基、C2-3烯基和H组成的组;M和M'各自独立地选自由-C(O)O-和-OC(O)-组成的组;Rb是C1-12烷基或C2-12烯基;l选自由1、2、3、4和5组成的组;并且m选自由5、6、7、8、9、10、11、12和13组成的组。
在式(IC)化合物的一些实施方案中,R'是
Figure BDA0004090383130002505
其中/>
Figure BDA0004090383130002506
表示连接点;R、R和R各自是H;R2和R3各自是C1-14烷基;R4是-(CH2)nOH;n是2;每个R5是H;每个R6是H;M和M'各自是-C(O)O-;Rb是C1-12烷基;l是5;并且m是7。
在式(IC)化合物的一些实施方案中,R'是
Figure BDA0004090383130002507
其中/>
Figure BDA0004090383130002508
表示连接点;R、R和R各自是H;R2和R3各自是C1-14烷基;R4是-(CH2)nOH;n是2;每个R5是H;每个R6是H;M和M'各自是-C(O)O-;Rb是C1-12烷基;l是3;并且m是7。
在式(IC)化合物的一些实施方案中,R'是
Figure BDA0004090383130002511
其中/>
Figure BDA0004090383130002512
表示连接点;R和R各自是H;R是C2-12烷基;R2和R3各自是C1-14烷基;R4是-(CH2)nOH;n是2;每个R5是H;每个R6是H;M和M'各自是-C(O)O-;Rb是C1-12烷基;l是5;并且m是7。
在式(IC)化合物的一些实施方案中,R'是
Figure BDA0004090383130002513
其中/>
Figure BDA0004090383130002514
表示连接点;其中R、R、R和R各自独立地选自由H、C2-12烷基和C2-12烯基组成的组;R2和R3各自独立地选自由C1-14烷基和C2-14烯基组成的组;R4是/>
Figure BDA0004090383130002515
其中/>
Figure BDA0004090383130002516
表示连接点;其中R10是N(R)2;每个R独立地选自由C1-6烷基、C2-3烯基和H组成的组;n2选自由1、2、3、4、5、6、7、8、9和10组成的组;每个R5独立地选自由C1-3烷基、C2-3烯基和H组成的组;每个R6独立地选自由C1-3烷基、C2-3烯基和H组成的组;M和M'各自独立地选自由-C(O)O-和-OC(O)-组成的组;Rb是C1-12烷基或C2-12烯基;l选自由1、2、3、4和5组成的组;并且m选自由5、6、7、8、9、10、11、12和13组成的组。
在式(IC)化合物的一些实施方案中,R'是
Figure BDA0004090383130002517
其中/>
Figure BDA0004090383130002518
表示连接点;R、R和R各自是H;R是C2-12烷基;R2和R3各自是C1-14烷基;R4是/>
Figure BDA0004090383130002519
Figure BDA00040903831300025110
表示连接点;R10是NH(C1-6烷基);n2是2;每个R5是H;每个R6是H;M和M'各自是-C(O)O-;Rb是C1-12烷基;l是5;并且m是7。
在一些实施方案中,式(IC)化合物是:
Figure BDA00040903831300025111
/>
在某些实施方案中,式(I)化合物的子集包括式(II)的那些:
Figure BDA0004090383130002521
或其N-氧化物,或其盐或异构体,其中l选自1、2、3、4和5;M1是键或M';R4是氢、未取代的C1-3烷基或-(CH2)nQ,其中n是2、3或4,并且Q是OH、-NHC(S)N(R)2、-NHC(O)N(R)2、-N(R)C(O)R、-N(R)S(O)2R、-N(R)R8、-NHC(=NR9)N(R)2、-NHC(=CHR9)N(R)2、-OC(O)N(R)2、-N(R)C(O)OR、杂芳基或杂环烷基;M和M'独立地选自-C(O)O-、-OC(O)-、-OC(O)-M"-C(O)O-、-C(O)N(R')-、-P(O)(OR')O-、-S-S-、芳基和杂芳基;并且R2和R3独立地选自由H、C1-14烷基和C2-14烯基组成的组。
在一个实施方案中,式(I)化合物具有式(IIa),
Figure BDA0004090383130002522
或其N-氧化物,或其盐或异构体,其中R4如本文所描述。
在另一个实施方案中,式(I)化合物具有式(IIb),
Figure BDA0004090383130002523
或其N-氧化物,或其盐或异构体,其中R4如本文所描述。
在另一个实施方案中,式(I)化合物具有式(IIc)或(IIe),
Figure BDA0004090383130002531
或其N-氧化物,或其盐或异构体,其中R4如本文所描述。
在另一个实施方案中,式(I)化合物具有式(IIf):
Figure BDA0004090383130002532
或其N-氧化物,或其盐或异构体,
其中M是-C(O)O-或-OC(O)-,M"是C1-6烷基或C2-6烯基,R2和R3独立地选自由C5-14烷基和C5-14烯基组成的组,并且n选自2、3和4。
在又一个实施方案中,式(I)化合物具有式(IId),
Figure BDA0004090383130002533
或其N-氧化物,或其盐或异构体,其中n是2、3或4;并且m、R'、R"和R2至R6如本文所描述。举例来说,R2和R3中的每一者可以独立地选自由C5-14烷基和C5-14烯基组成的组。
在又一个实施方案中,式(I)化合物具有式(IIg),
Figure BDA0004090383130002541
或其N-氧化物,或其盐或异构体,其中l选自1、2、3、4和5;m选自5、6、7、8和9;M1是键或M';M和M'独立地选自-C(O)O-、-OC(O)-、-OC(O)-M"-C(O)O-、-C(O)N(R')-、-P(O)(OR')O-、-S-S-、芳基和杂芳基;并且R2和R3独立地选自由H、C1-14烷基和C2-14烯基组成的组。举例来说,M"是C1-6烷基(例如,C1-4烷基)或C2-6烯基(例如,C2-4烯基)。在一些实施方案中,R2和R3独立地选自由C5-14烷基和C5-14烯基组成的组。
在又一个实施方案中,式(I)化合物具有式(IIh):
Figure BDA0004090383130002542
或其N-氧化物,或其盐或异构体,
其中R'a是R'支链或R'环状
其中R'支链是:
Figure BDA0004090383130002543
并且R'环状是:/>
Figure BDA0004090383130002544
并且
R'b是:
Figure BDA0004090383130002545
其中
Figure BDA0004090383130002546
表示连接点;
R和R各自独立地选自由H、C1-12烷基和C2-12烯基组成的组,其中R和R中的至少一者选自由C1-12烷基和C2-12烯基组成的组;
R和R各自独立地选自由H、C1-12烷基和C2-12烯基组成的组,其中R和R中的至少一者选自由C1-12烷基和C2-12烯基组成的组;
R2和R3各自独立地选自由C1-14烷基和C2-14烯基组成的组;
R4选自由以下组成的组:-(CH2)nOH,其中n选自由1、2、3、4和5组成的组,和
Figure BDA0004090383130002551
其中
Figure BDA0004090383130002552
表示连接点;其中
R10是N(R)2;每个R独立地选自由C1-6烷基、C2-3烯基和H组成的组;并且n2选自由1、2、3、4、5、6、7、8、9和10组成的组;
每个R'独立地是C1-12烷基或C2-12烯基;
Ya是C3-6碳环;
R*"a选自由C1-15烷基和C2-15烯基组成的组;并且
s是2或3;
m选自1、2、3、4、5、6、7、8和9;
l选自1、2、3、4、5、6、7、8和9。
在一些实施方案中,式(I)化合物具有式(IIh):
Figure BDA0004090383130002553
或其N-氧化物,或其盐或异构体,其中R'a是R'支链;其中
R'支链是:
Figure BDA0004090383130002561
并且R'b是:/>
Figure BDA0004090383130002562
/>
其中
Figure BDA0004090383130002563
表示连接点;
R和R各自独立地选自由H、C1-12烷基和C2-12烯基组成的组,其中R和R中的至少一者选自由C1-12烷基和C2-12烯基组成的组;
R和R各自独立地选自由H、C1-12烷基和C2-12烯基组成的组,其中R和R中的至少一者选自由C1-12烷基和C2-12烯基组成的组;
R2和R3各自独立地选自由C1-14烷基和C2-14烯基组成的组;
R4选自由以下组成的组:-(CH2)nOH,其中n选自由1、2、3、4和5组成的组,和
Figure BDA0004090383130002564
其中
Figure BDA0004090383130002565
表示连接点;其中
R10是N(R)2;每个R独立地选自由C1-6烷基、C2-3烯基和H组成的组;并且n2选自由1、2、3、4、5、6、7、8、9和10组成的组;
每个R'独立地是C1-12烷基或C2-12烯基;
m选自1、2、3、4、5、6、7、8和9;
l选自1、2、3、4、5、6、7、8和9。
在一些实施方案中,式(I)化合物具有式(IIh):
Figure BDA0004090383130002566
或其N-氧化物,或其盐或异构体,其中R'a是R'支链;其中
R'支链是:
Figure BDA0004090383130002571
并且R'b是:/>
Figure BDA0004090383130002572
其中
Figure BDA0004090383130002573
表示连接点;
R和R各自独立地选自由C1-12烷基和C2-12烯基组成的组;
R2和R3各自独立地选自由C1-14烷基和C2-14烯基组成的组;
R4选自由以下组成的组:-(CH2)nOH,其中n选自由1、2、3、4和5组成的组,和
Figure BDA0004090383130002574
其中
Figure BDA0004090383130002575
表示连接点;其中
R10是N(R)2;每个R独立地选自由C1-6烷基、C2-3烯基和H组成的组;并且n2选自由1、2、3、4、5、6、7、8、9和10组成的组;
每个R'独立地是C1-12烷基或C2-12烯基;
m选自1、2、3、4、5、6、7、8和9;
l选自1、2、3、4、5、6、7、8和9。
在一些实施方案中,式(I)化合物具有式(IIh):
Figure BDA0004090383130002576
或其N-氧化物,或其盐或异构体,其中R'a是R'支链;其中
R'支链是:
Figure BDA0004090383130002581
并且R'b是:/>
Figure BDA0004090383130002582
其中
Figure BDA0004090383130002583
表示连接点;
其中R选自由C1-12烷基和C2-12烯基组成的组;
R2和R3各自独立地选自由C1-14烷基和C2-14烯基组成的组;
R4选自由以下组成的组:-(CH2)nOH,其中n选自由1、2、3、4和5组成的组,和
Figure BDA0004090383130002584
其中
Figure BDA0004090383130002585
表示连接点;其中
R10是N(R)2;每个R独立地选自由C1-6烷基、C2-3烯基和H组成的组;并且n2选自由1、2、3、4、5、6、7、8、9和10组成的组;
R'是C1-12烷基或C2-12烯基;
m选自1、2、3、4、5、6、7、8和9;
l选自1、2、3、4、5、6、7、8和9。
在一些实施方案中,式(I)化合物具有式(IIh):
Figure BDA0004090383130002586
或其N-氧化物,或其盐或异构体,其中R'a是R'支链;其中
R'支链是:
Figure BDA0004090383130002587
并且R'b是:/>
Figure BDA0004090383130002588
其中
Figure BDA0004090383130002591
表示连接点;
其中R和R各自独立地选自由C1-12烷基和C2-12烯基组成的组;
R4选自由以下组成的组:-(CH2)nOH,其中n选自由1、2、3、4和5组成的组,和
Figure BDA0004090383130002592
其中
Figure BDA0004090383130002593
表示连接点;其中
R10是N(R)2;每个R独立地选自由C1-6烷基、C2-3烯基和H组成的组;并且n2选自由1、2、3、4、5、6、7、8、9和10组成的组;
每个R'独立地是C1-12烷基或C2-12烯基;
m选自1、2、3、4、5、6、7、8和9;
l选自1、2、3、4、5、6、7、8和9。
在一些实施方案中,式(I)化合物具有式(IIh):
Figure BDA0004090383130002594
或其N-氧化物,或其盐或异构体,其中R'a是R'支链;其中
R'支链是:
Figure BDA0004090383130002595
并且R'b是:/>
Figure BDA0004090383130002596
其中
Figure BDA0004090383130002597
表示连接点;
其中R选自由C1-12烷基和C2-12烯基组成的组;
R2和R3各自独立地选自由C1-14烷基和C2-14烯基组成的组;
R4是-(CH2)nOH,其中n选自由1、2、3、4和5组成的组;
R'是C1-12烷基或C2-12烯基;
m选自1、2、3、4、5、6、7、8和9;
l选自1、2、3、4、5、6、7、8和9。
在式(IIh)化合物的一些实施方案中,m和l各自独立地选自4、5和6。在式(IIh)化合物的一些实施方案中,m和l各自是5。
在式(IIh)化合物的一些实施方案中,每个R'独立地是C1-12烷基。在式(IIh)化合物的一些实施方案中,每个R'独立地是C2-5烷基。
在式(IIh)化合物的一些实施方案中,R'b是:
Figure BDA0004090383130002601
并且R2和R3各自独立地是C1-14烷基。在式(IIh)化合物的一些实施方案中,R'b是:/>
Figure BDA0004090383130002602
并且R2和R3各自独立地是C6-10烷基。在式(IIh)化合物的一些实施方案中,R'b是:/>
Figure BDA0004090383130002603
并且R2和R3各自是C8烷基。
在式(IIh)化合物的一些实施方案中,R'支链是:
Figure BDA0004090383130002604
并且R'b是:/>
Figure BDA0004090383130002605
R是C1-12烷基并且R2和R3各自独立地是C6-10烷基。在式(IIh)化合物的一些实施方案中,R'支链是:/>
Figure BDA0004090383130002606
并且R'b是:/>
Figure BDA0004090383130002607
R是C2-6烷基并且R2和R3各自独立地是C6-10烷基。在式(IIh)化合物的一些实施方案中,R'支链是:/>
Figure BDA0004090383130002608
并且R'b是:
Figure BDA0004090383130002609
R是C2-6烷基,并且R2和R3各自是C8烷基。
在式(IIh)化合物的一些实施方案中,R'支链是:
Figure BDA00040903831300026010
R'b是:
Figure BDA0004090383130002611
并且R和R各自是C1-12烷基。在式(IIh)化合物的一些实施方案中,R'支链是:/>
Figure BDA0004090383130002612
R'b是:/>
Figure BDA0004090383130002613
并且R和R各自是C2-6烷基。
在式(IIh)化合物的一些实施方案中,m和l各自独立地选自4、5和6并且每个R'独立地是C1-12烷基。在式(IIh)化合物的一些实施方案中,m和l各自是5并且每个R'独立地是C2-5烷基。
在式(IIh)化合物的一些实施方案中,R'支链是:
Figure BDA0004090383130002614
R'b是:
Figure BDA0004090383130002615
m和l各自独立地选自4、5和6,每个R'独立地是C1-12烷基,并且R和R各自是C1-12烷基。在式(IIh)化合物的一些实施方案中,R'支链是:/>
Figure BDA0004090383130002616
R'b是:
Figure BDA0004090383130002617
m和l各自是5,每个R'独立地是C2-5烷基,并且R和R各自是C2-6烷基。
在式(IIh)化合物的一些实施方案中,R'支链是:
Figure BDA0004090383130002618
并且R'b是:
Figure BDA0004090383130002619
m和l各自独立地选自4、5和6,R'是C1-12烷基,R是C1-12烷基并且R2和R3各自独立地是C6-10烷基。在式(IIh)化合物的一些实施方案中,R'支链是:/>
Figure BDA00040903831300026110
并且R'b是:/>
Figure BDA00040903831300026111
m和l各自是5,R'是C2-5烷基,R是C2-6烷基,并且R2和R3各自是C8烷基。
在式(IIh)化合物的一些实施方案中,R4
Figure BDA00040903831300026112
其中R10是NH(C1-6烷基)并且n2是2。在式(IIh)化合物的一些实施方案中,R4是/>
Figure BDA0004090383130002621
其中R10是NH(CH3)并且n2是2。
在式(IIh)化合物的一些实施方案中,R'支链是:
Figure BDA0004090383130002622
R'b是:
Figure BDA0004090383130002623
m和l各自独立地选自4、5和6,每个R'独立地是C1-12烷基,R和R各自是C1-12烷基,并且R4是/>
Figure BDA0004090383130002624
其中R10是NH(C1-6烷基),并且n2是2。在式(IIh)化合物的一些实施方案中,R'支链是:/>
Figure BDA0004090383130002625
R'b是:/>
Figure BDA0004090383130002626
m和l各自是5,每个R'独立地是C2-5烷基,R和R各自是C2-6烷基,并且R4是/>
Figure BDA0004090383130002627
其中R10是NH(CH3)并且n2是2。
在式(IIh)化合物的一些实施方案中,R'支链是:
Figure BDA0004090383130002628
并且R'b是:
Figure BDA0004090383130002629
m和l各自独立地选自4、5和6,R'是C1-12烷基,R2和R3各自独立地是C6-10烷基,R是C1-12烷基,并且R4是/>
Figure BDA00040903831300026210
其中R10是NH(C1-6烷基)并且n2是2。在式(IIh)化合物的一些实施方案中,R'支链是:/>
Figure BDA00040903831300026211
并且R'b是:/>
Figure BDA00040903831300026212
m和l各自是5,R'是C2-5烷基,R是C2-6烷基,R2和R3各自是C8烷基,并且R4是/>
Figure BDA00040903831300026213
其中R10是NH(CH3)并且n2是2。/>
在式(IIh)化合物的一些实施方案中,R4是-(CH2)nOH并且n是2、3或4。在式(IIh)化合物的一些实施方案中,R4是-(CH2)nOH并且n是2。
在式(IIh)化合物的一些实施方案中,R'支链是:
Figure BDA0004090383130002631
R'b是:
Figure BDA0004090383130002632
m和l各自独立地选自4、5和6,每个R'独立地是C1-12烷基,R和R各自是C1-12烷基,R4是-(CH2)nOH,并且n是2、3或4。在式(IIh)化合物的一些实施方案中,R'支链是:
Figure BDA0004090383130002633
R'b是:/>
Figure BDA0004090383130002634
m和l各自是5,每个R'独立地是C2-5烷基,R和R各自是C2-6烷基,R4是-(CH2)nOH,并且n是2。
在一些实施方案中,式(I)化合物具有式(IIh):
Figure BDA0004090383130002635
或其N-氧化物,或其盐或异构体,其中R'a是R'支链;其中
R'支链是:
Figure BDA0004090383130002636
并且R'b是:/>
Figure BDA0004090383130002637
其中
Figure BDA0004090383130002638
表示连接点;
R是C1-12烷基;
R2和R3各自独立地是C1-14烷基;
R4是-(CH2)nOH,其中n选自由1、2、3、4和5组成的组;
R'是C1-12烷基;
m选自4、5和6;并且
l选自4、5和6。
在式(IIh)化合物的一些实施方案中,m和l各自是5,并且n是2、3或4。
在式(IIh)化合物的一些实施方案中,R'是C2-5烷基,R是C2-6烷基,并且R2和R3各自是C6-10烷基。
在式(IIh)化合物的一些实施方案中,m和l各自是5,n是2、3或4,R'是C2-5烷基,R是C2-6烷基,并且R2和R3各自是C6-10烷基。
在一些实施方案中,式(I)化合物具有式(IIi):
Figure BDA0004090383130002641
或其N-氧化物,或其盐或异构体,其中
R是C2-6烷基;
R'是C2-5烷基;并且
R4选自由以下组成的组:-(CH2)nOH,其中n选自由3、4和5组成的组,和
Figure BDA0004090383130002642
其中
Figure BDA0004090383130002643
表示连接点,R10是NH(C1-6烷基),并且n2选自由1、2和3组成的组。
在一些实施方案中,式(I)化合物具有式(IIj):
Figure BDA0004090383130002651
其中
R和R各自独立地是C2-6烷基;
每个R'独立地是C2-5烷基;并且
R4选自由以下组成的组:-(CH2)nOH,其中n选自由3、4和5组成的组,和
Figure BDA0004090383130002652
其中
Figure BDA0004090383130002653
表示连接点,R10是NH(C1-6烷基),并且n2选自由1、2和3组成的组。
在式(IIi)或(IIj)化合物的一些实施方案中,R4
Figure BDA0004090383130002654
其中
R10是NH(CH3)并且n2是2。
在式(IIi)或(IIj)化合物的一些实施方案中,R4是-(CH2)2OH。
在一些实施方案中,氨基脂质是美国申请号62/220,091、62/252,316、62/253,433、62/266,460、62/333,557、62/382,740、62/393,940、62/471,937、62/471,949、62/475,140和62/475,166以及PCT申请号PCT/US2016/052352中所描述的化合物中的一者或多者。
在一些实施方案中,式(I)化合物选自:
Figure BDA0004090383130002655
Figure BDA0004090383130002661
或其N-氧化物,或其盐或异构体。在一些实施方案中,式(I)化合物是:
Figure BDA0004090383130002662
或其N-氧化物,或其盐或异构体。在一些实施方案中,式(I)化合物是:
Figure BDA0004090383130002671
或其N-氧化物,或其盐或异构体。在一些实施方案中,式(I)化合物是:
Figure BDA0004090383130002672
或其N-氧化物,或其盐或异构体。在一些实施方案中,式(I)化合物是:
Figure BDA0004090383130002673
或其N-氧化物,或其盐或异构体。在一些实施方案中,式(I)化合物是:
Figure BDA0004090383130002674
或其N-氧化物,或其盐或异构体。在一些实施方案中,式(I)化合物是:
Figure BDA0004090383130002681
或其N-氧化物,或其盐或异构体。
在一些实施方案中,式(I)化合物是:
Figure BDA0004090383130002682
或其N-氧化物,或其盐或异构体。
在一些实施方案中,氨基脂质是
Figure BDA0004090383130002683
或其盐。/>
在一些实施方案中,氨基脂质是
Figure BDA0004090383130002684
或其盐。
根据式(I)、(IA)、(IB)、(IC)、(II)、(IIa)、(IIb)、(IIc)、(IId)、(IIe)、(IIf)或(IIg)的脂质的中心胺部分可以在生理pH下质子化。因此,脂质在生理pH下可以具有正电荷或部分正电荷。此类氨基脂质可以被称作阳离子脂质、可电离脂质、阳离子氨基脂质或可电离氨基脂质。氨基脂质还可以是两性离子的,即,具有正电荷和负电荷两者的中性分子。
在一些方面,本公开的氨基脂质可以是式(III)化合物中的一者或多者,
Figure BDA0004090383130002691
或其盐或异构体,其中
W是
Figure BDA0004090383130002692
环A是
Figure BDA0004090383130002693
t是1或2;
A1和A2各自独立地选自CH或N;
Z是CH2或不存在,其中当Z是CH2时,虚线(1)和(2)各自表示单键;并且当Z不存在时,虚线(1)和(2)均不存在;
R1、R2、R3、R4和R5独立地选自由C5-20烷基、C5-20烯基、-R"MR'、-R*YR"、-YR"和-R*OR"组成的组;
RX1和RX2各自独立地是H或C1-3烷基;
每个M独立地选自由-C(O)O-、-OC(O)-、-OC(O)O-、-C(O)N(R')-、-N(R')C(O)-、-C(O)-、-C(S)-、-C(S)S-、-SC(S)-、-CH(OH)-、-P(O)(OR')O-、-S(O)2-、-C(O)S-、-SC(O)-、芳基和杂芳基组成的组;
M*是C1-C6烷基,
W1和W2各自独立地选自由-O-和-N(R6)-组成的组;
每个R6独立地选自由H和C1-5烷基组成的组;
X1、X2和X3独立地选自由键、-CH2-、-(CH2)2-、-CHR-、-CHY-、-C(O)-、-C(O)O-、-OC(O)-、-(CH2)n-C(O)-、-C(O)-(CH2)n-、-(CH2)n-C(O)O-、-OC(O)-(CH2)n-、-(CH2)n-OC(O)-、-C(O)O-(CH2)n-、-CH(OH)-、-C(S)-和-CH(SH)-组成的组;
每个Y独立地是C3-6碳环;
每个R*独立地选自由C1-12烷基和C2-12烯基组成的组;
每个R独立地选自由C1-3烷基和C3-6碳环组成的组;
每个R'独立地选自由C1-12烷基、C2-12烯基和H组成的组;
每个R"独立地选自由C3-12烷基、C3-12烯基和-R*MR'组成的组;并且
n是1-6的整数;
其中当环A为
Figure BDA0004090383130002701
时,则
i)X1、X2和X3中的至少一者不是-CH2-;和/或
ii)R1、R2、R3、R4和R5中的至少一者是-R"MR'。
在一些实施方案中,化合物具有式(IIIa1)-(IIIa8)中的任一者:
Figure BDA0004090383130002711
在一些实施方案中,氨基脂质是
Figure BDA0004090383130002721
或其盐。
式(III)、(IIIa1)、(IIIa2)、(IIIa3)、(IIIa4)、(IIIa5)、(IIIa6)、(IIIa7)或(IIIa8)的脂质的中心胺部分可以在生理pH下质子化。因此,脂质在生理pH值下可以具有正电荷或部分正电荷。
磷脂
本文所公开的脂质纳米颗粒组合物的脂质组合物可以包含一种或多种磷脂,例如,一种或多种饱和或(多)不饱和磷脂或它们的组合。一般来说,磷脂包含磷脂部分和一个或多个脂肪酸部分。
磷脂部分可以选自例如由磷脂酰胆碱、磷脂酰乙醇胺、磷脂酰甘油、磷脂酰丝氨酸、磷脂酸、2-溶血磷脂酰胆碱和鞘磷脂组成的非限制性组。
脂肪酸部分可以选自例如由月桂酸、肉豆蔻酸、肉豆蔻烯酸、棕榈酸、棕榈烯酸、硬脂酸、油酸、亚麻油酸、α-次亚麻油酸、芥子酸、植烷酸、花生酸、花生四烯酸、二十碳五烯酸、山嵛酸、二十二碳五烯酸和二十二碳六烯酸组成的非限制性组。
特定磷脂可以促进与膜的融合。举例来说,阳离子磷脂可以与膜(例如,细胞膜或细胞内膜)的一种或多种带负电荷的磷脂相互作用。磷脂与膜的融合可以允许含脂质的组合物(例如,LNP)的一种或多种要素(例如,治疗剂)通过膜,从而允许例如将所述一种或多种要素递送至靶组织。
还预期非天然磷脂物质,包括具有包括分支、氧化、环化和炔烃在内的修饰和取代的天然物质。举例来说,磷脂可以被一种或多种炔烃(例如,其中一个或多个双键被三键置换的烯基)官能化或与所述一种或多种炔烃交联。在适当反应条件下,炔烃基团可以在暴露于叠氮化物后经历铜催化的环加成。此类反应可用于将纳米颗粒组合物的脂质双层官能化以促进膜渗透或细胞识别,或者可用于使纳米颗粒组合物缀合至可用组分,诸如靶向或成像部分(例如,染料)。
磷脂包括但不限于甘油磷脂,诸如磷脂酰胆碱、磷脂酰乙醇胺、磷脂酰丝氨酸、磷脂酰肌醇、磷脂酰甘油和磷脂酸。磷脂还包括磷酸鞘脂,诸如鞘磷脂。
在一些实施方案中,本发明的磷脂包含1,2-二硬脂酰基-sn-甘油-3-磷酸胆碱(DSPC)、1,2-二硬脂酰基-sn-甘油-3-磷酸乙醇胺(DSPE)、1,2-二油酰基-sn-甘油-3-磷酸乙醇胺(DOPE)、1,2-二亚油酰基-sn-甘油-3-磷酸胆碱(DLPC)、1,2-二肉豆蔻酰基-sn-甘油-磷酸胆碱(DMPC)、1,2-二油酰基-sn-甘油-3-磷酸胆碱(DOPC)、1,2-二棕榈酰基-sn-甘油-3-磷酸胆碱(DPPC)、1,2-二(十一烷酰基)-sn-甘油-磷酸胆碱(DUPC)、1-棕榈酰基-2-油酰基-sn-甘油-3-磷酸胆碱(POPC)、1,2-二-O-十八烯基-sn-甘油-3-磷酸胆碱(18:0二醚PC)、1-油酰基-2-胆固醇基半琥珀酰基-sn-甘油-3-磷酸胆碱(OChemsPC)、1-十六烷基-sn-甘油-3-磷酸胆碱(C16 Lyso PC)、1,2-二亚麻酰基-sn-甘油-3-磷酸胆碱、1,2-二花生四烯酰基-sn-甘油-3-磷酸胆碱、1,2-二(二十二碳六烯酰基)-sn-甘油-3-磷酸胆碱、1,2-二植烷酰基-sn-甘油-3-磷酸乙醇胺(ME 16.0PE)、1,2-二硬脂酰基-sn-甘油-3-磷酸乙醇胺、1,2-二亚油酰基-sn-甘油-3-磷酸乙醇胺、1,2-二亚麻酰基-sn-甘油-3-磷酸乙醇胺、1,2-二花生四烯酰基-sn-甘油-3-磷酸乙醇胺、1,2-二(二十二碳六烯酰基)-sn-甘油-3-磷酸乙醇胺、1,2-二油酰基-sn-甘油-3-磷酸-外消旋-(1-甘油)钠盐(DOPG)、鞘磷脂和它们的混合物。
在某些实施方案中,可用于或潜在可用于本发明的磷脂是DSPC的类似物或变体。在某些实施方案中,可用于或潜在可用于本发明的磷脂是式(IV)化合物:
Figure BDA0004090383130002741
或其盐,其中:
每个R1独立地是任选取代的烷基;或者任选地两个R1与间插原子连接在一起以形成任选取代的单环碳环基或任选取代的单环杂环基;或者任选地三个R1与间插原子连接在一起以形成任选取代的双环碳环基或任选取代的双环杂环基;
n是1、2、3、4、5、6、7、8、9或10;
m是0、1、2、3、4、5、6、7、8、9或10;
A具有下式:
Figure BDA0004090383130002742
L2在每种情况下独立地是键或任选取代的C1-6亚烷基,其中任选取代的C1-6亚烷基的一个亚甲基单元任选地被O、N(RN)、S、C(O)、C(O)N(RN)、NRNC(O)、C(O)O、OC(O)、OC(O)O、OC(O)N(RN)、NRNC(O)O或NRNC(O)N(RN)置换;
R2在每种情况下独立地是任选取代的C1-30烷基、任选取代的C1-30烯基或任选取代的C1-30炔基;任选地其中R2的一个或多个亚甲基单元独立地被任选取代的亚碳环基、任选取代的亚杂环基、任选取代的亚芳基、任选取代的亚杂芳基、N(RN)、O、S、C(O)、C(O)N(RN)、NRNC(O)、NRNC(O)N(RN)、C(O)O、OC(O)、OC(O)O、OC(O)N(RN)、NRNC(O)O、C(O)S、SC(O)、C(=NRN)、C(=NRN)N(RN)、NRNC(=NRN)、NRNC(=NRN)N(RN)、C(S)、C(S)N(RN)、NRNC(S)、NRNC(S)N(RN)、S(O)、OS(O)、S(O)O、OS(O)O、OS(O)2、S(O)2O、OS(O)2O、N(RN)S(O)、S(O)N(RN)、N(RN)S(O)N(RN)、OS(O)N(RN)、N(RN)S(O)O、S(O)2、N(RN)S(O)2、S(O)2N(RN)、N(RN)S(O)2N(RN)、OS(O)2N(RN)或N(RN)S(O)2O置换;
RN在每种情况下独立地是氢、任选取代的烷基或氮保护基;
环B是任选取代的碳环基、任选取代的杂环基、任选取代的芳基或任选取代的杂芳基;并且
p是1或2;
前提条件是所述化合物不具有下式:
Figure BDA0004090383130002751
其中R2在每种情况下独立地是未取代的烷基、未取代的烯基或未取代的炔基。
在一些实施方案中,磷脂可以是美国申请号62/520,530中或2018年6月15日提交的国际申请PCT/US2018/037922中所描述的一种或多种磷脂,所述申请中每一者的全部内容特此以全文引用的方式并入。
结构脂质
本文所公开的药物组合物的脂质组合物可以包含一种或多种结构脂质。如本文所用,术语“结构脂质”是指固醇并且还指含有固醇部分的脂质。
在脂质纳米颗粒中并入结构脂质可以帮助减轻颗粒中的其它脂质的聚集。结构脂质可以选自下组:包括但不限于胆固醇、粪固醇、谷固醇、麦角固醇、菜油固醇、豆固醇、菜籽固醇、番茄碱、番茄苷、熊果酸、α-生育酚、藿烷、植物固醇、类固醇和它们的混合物。在一些实施方案中,结构脂质是固醇。如本文所定义,“固醇”是由类固醇组成的类固醇子组。在某些实施方案中,结构脂质是类固醇。在某些实施方案中,结构脂质是胆固醇。在某些实施方案中,结构脂质是胆固醇的类似物。在某些实施方案中,结构脂质是α-生育酚。
在一些实施方案中,结构脂质可以是美国申请号16/493,814中所描述的一种或多种结构脂质。
聚乙二醇(PEG)-脂质
本文所公开的药物组合物的脂质组合物可以包含一种或多种聚乙二醇(PEG)脂质。
如本文所用,术语“PEG-脂质”是指聚乙二醇(PEG)修饰的脂质。PEG-脂质的非限制性实例包括PEG修饰的磷脂酰乙醇胺和磷脂酸、PEG-神经酰胺缀合物(例如,PEG-CerC14或PEG-CerC20)、PEG修饰的二烷基胺和PEG修饰的1,2-二酰氧基丙-3-胺。此类脂质也被称作聚乙二醇化脂质。举例来说,PEG脂质可以是PEG-c-DOMG、PEG-DMG、PEG-DLPE、PEG-DMPE、PEG-DPPC或PEG-DSPE脂质。
在一些实施方案中,PEG-脂质包括但不限于1,2-二肉豆蔻酰基-sn-甘油甲氧基聚乙二醇(PEG-DMG)、1,2-二硬脂酰基-sn-甘油-3-磷酸乙醇胺-N-[氨基(聚乙二醇)](PEG-DSPE)、PEG-二硬脂基甘油(PEG-DSG)、PEG-二棕榈油烯基、PEG-二油烯基、PEG-二硬脂基、PEG-二酰基甘酰胺(PEG-DAG)、PEG-二棕榈酰基磷脂酰乙醇胺(PEG-DPPE)或PEG-1,2-二肉豆蔻基氧基丙基-3-胺(PEG-c-DMA)。
在一个实施方案中,PEG-脂质选自由PEG修饰的磷脂酰乙醇胺、PEG修饰的磷脂酸、PEG修饰的神经酰胺、PEG修饰的二烷基胺、PEG修饰的二酰基甘油、PEG修饰的二烷基甘油和它们的混合物组成的组。在一些实施方案中,PEG修饰的脂质是PEG-DMG、PEG-c-DOMG(也称作PEG-DOMG)、PEG-DSG和/或PEG-DPG。
在一些实施方案中,PEG-脂质的脂质部分包括长度为约C14至约C22、优选约C14至约C16的那些。在一些实施方案中,PEG部分(例如,mPEG-NH2)的大小为约1000、2000、5000、10,000、15,000或20,000道尔顿。在一个实施方案中,PEG-脂质是PEG2k-DMG。
在一个实施方案中,本文所描述的脂质纳米颗粒可以包含PEG脂质,其为不可扩散PEG。不可扩散PEG的非限制性实例包括PEG-DSG和PEG-DSPE。
PEG-脂质是本领域中已知的,诸如美国专利号8158601和国际公布号WO 2015/130584 A2中所描述的那些,所述文献以全文引用的方式并入本文中。
一般来说,本文所描述的各式的一些其它脂质组分(例如,PEG脂质)可以如2016年12月10日提交的标题为“Compositions and Methods for Delivery of TherapeuticAgents”的国际专利申请号PCT/US2016/000129中所描述来合成,所述专利申请以全文引用的方式并入。
脂质纳米颗粒组合物的脂质组分可以包括一种或多种包含聚乙二醇的分子,诸如PEG或PEG修饰的脂质。此类物质可以替代地被称作聚乙二醇化脂质。PEG脂质是聚乙二醇修饰的脂质。PEG脂质可以选自包括PEG修饰的磷脂酰乙醇胺、PEG修饰的磷脂酸、PEG修饰的神经酰胺、PEG修饰的二烷基胺、PEG修饰的二酰基甘油、PEG修饰的二烷基甘油和它们的混合物的非限制性组。举例来说,PEG脂质可以是PEG-c-DOMG、PEG-DMG、PEG-DLPE、PEG-DMPE、PEG-DPPC或PEG-DSPE脂质。
在一些实施方案中,PEG修饰的脂质是PEG DMG的修饰形式。PEG-DMG具有以下结构:
Figure BDA0004090383130002781
在一个实施方案中,可用于本发明的PEG脂质可以是国际公布号WO2012099755中所描述的聚乙二醇化脂质,所述公布的内容以全文引用的方式并入本文中。可以对本文所描述的这些示例性PEG脂质中的任一者进行修饰以在PEG链上包含羟基。在某些实施方案中,PEG脂质是PEG-OH脂质。如本文一般所定义,“PEG-OH脂质”(在本文中也称作“羟基-聚乙二醇化脂质”)是在脂质上具有一个或多个羟基(-OH)基团的聚乙二醇化脂质。在某些实施方案中,PEG-OH脂质在PEG链上包括一个或多个羟基。在某些实施方案中,PEG-OH或羟基-聚乙二醇化脂质在PEG链的末端包含-OH基团。每种可能性代表本发明的独立实施方案。
在某些实施方案中,可用于本发明的PEG脂质是式(V)化合物。本文提供了式(V)化合物:
Figure BDA0004090383130002782
或其盐,其中:
R3是-ORO
RO是氢、任选取代的烷基或氧保护基;
r是介于1与100之间的整数,首尾包括在内;
L1是任选取代的C1-10亚烷基,其中任选取代的C1-10亚烷基的至少一个亚甲基独立地被任选取代的亚碳环基、任选取代的亚杂环基、任选取代的亚芳基、任选取代的亚杂芳基、O、N(RN)、S、C(O)、C(O)N(RN)、NRNC(O)、C(O)O、OC(O)、OC(O)O、OC(O)N(RN)、NRNC(O)O或NRNC(O)N(RN)置换;
D是通过点击化学获得的部分或在生理条件下可裂解的部分;
m是0、1、2、3、4、5、6、7、8、9或10;
A具有下式:
Figure BDA0004090383130002791
L2在每种情况下独立地是键或任选取代的C1-6亚烷基,其中任选取代的C1-6亚烷基的一个亚甲基单元任选地被O、N(RN)、S、C(O)、C(O)N(RN)、NRNC(O)、C(O)O、OC(O)、OC(O)O、OC(O)N(RN)、NRNC(O)O或NRNC(O)N(RN)置换;
R2在每种情况下独立地是任选取代的C1-30烷基、任选取代的C1-30烯基或任选取代的C1-30炔基;任选地其中R2的一个或多个亚甲基单元独立地被任选取代的亚碳环基、任选取代的亚杂环基、任选取代的亚芳基、任选取代的亚杂芳基、N(RN)、O、S、C(O)、C(O)N(RN)、NRNC(O)、NRNC(O)N(RN)、C(O)O、OC(O)、OC(O)O、OC(O)N(RN)、NRNC(O)O、C(O)S、SC(O)、C(=NRN)、C(=NRN)N(RN)、NRNC(=NRN)、NRNC(=NRN)N(RN)、C(S)、C(S)N(RN)、NRNC(S)、NRNC(S)N(RN)、S(O)、OS(O)、S(O)O、OS(O)O、OS(O)2、S(O)2O、OS(O)2O、N(RN)S(O)、S(O)N(RN)、N(RN)S(O)N(RN)、OS(O)N(RN)、N(RN)S(O)O、S(O)2、N(RN)S(O)2、S(O)2N(RN)、N(RN)S(O)2N(RN)、OS(O)2N(RN)或N(RN)S(O)2O置换;
RN在每种情况下独立地是氢、任选取代的烷基或氮保护基;
环B是任选取代的碳环基、任选取代的杂环基、任选取代的芳基或任选取代的杂芳基;并且
p是1或2。
在某些实施方案中,式(V)化合物是PEG-OH脂质(即,R3是-ORO,并且RO是氢)。在某些实施方案中,式(V)化合物具有式(V-OH):
Figure BDA0004090383130002801
或其盐。
在某些实施方案中,可用于本发明的PEG脂质是聚乙二醇化脂肪酸。在某些实施方案中,可用于本发明的PEG脂质是式(VI)化合物。本文提供了式(VI-A)化合物:
Figure BDA0004090383130002802
或其盐,其中:
R3是-ORO
RO是氢、任选取代的烷基或氧保护基;
r是介于1与100之间的整数,首尾包括在内;
R5是任选取代的C10-40烷基、任选取代的C10-40烯基或任选取代的C10-40炔基;并且任选地R5的一个或多个亚甲基被任选取代的亚碳环基、任选取代的亚杂环基、任选取代的亚芳基、任选取代的亚杂芳基、N(RN)、O、S、C(O)、C(O)N(RN)、NRNC(O)、NRNC(O)N(RN)、C(O)O、OC(O)、OC(O)O、OC(O)N(RN)、NRNC(O)O、C(O)S、SC(O)、C(=NRN)、C(=NRN)N(RN)、NRNC(=NRN)、NRNC(=NRN)N(RN)、C(S)、C(S)N(RN)、NRNC(S)、NRNC(S)N(RN)、S(O)、OS(O)、S(O)O、OS(O)O、OS(O)2、S(O)2O、OS(O)2O、N(RN)S(O)、S(O)N(RN)、N(RN)S(O)N(RN)、OS(O)N(RN)、N(RN)S(O)O、S(O)2、N(RN)S(O)2、S(O)2N(RN)、N(RN)S(O)2N(RN)、OS(O)2N(RN)或N(RN)S(O)2O置换;并且
RN在每种情况下独立地是氢、任选取代的烷基或氮保护基。
在某些实施方案中,式(VI)化合物具有式(VI-OH):
Figure BDA0004090383130002811
也称作(VI-B),
或其盐。在一些实施方案中,r是40-50。
在其它实施方案中,式(VI-C)化合物是:
Figure BDA0004090383130002812
或其盐。
在一个实施方案中,式(VI-D)的化合物是
Figure BDA0004090383130002813
在一些方面,本文所公开的药物组合物的脂质组合物不包含PEG-脂质。
在一些实施方案中,PEG-脂质可以是美国申请号US15/674,872中所描述的一种或多种PEG脂质。
在一些实施方案中,本发明的LNP包含式I、II或III中任一者的氨基脂质、包含DSPC的磷脂、结构脂质和包含PEG-DMG的PEG脂质。
在一些实施方案中,本发明的LNP包含式I、II或III中任一者的氨基脂质、包含DSPC的磷脂、结构脂质和包含具有式VI的化合物的PEG脂质。
在一些实施方案中,本发明的LNP包含式I、II或III的氨基脂质、包含具有式IV的化合物的磷脂、结构脂质和包含具有式V或VI的化合物的PEG脂质。
在一些实施方案中,本发明的LNP包含式I、II或III的氨基脂质、包含具有式IV的化合物的磷脂、结构脂质和包含具有式V或VI的化合物的PEG脂质。
在一些实施方案中,本发明的LNP包含式I、II或III的氨基脂质、具有式IV的磷脂、结构脂质和包含具有式VI的化合物的PEG脂质。
在一些实施方案中,本发明的LNP包含约2:1至约30:1的N:P比率。
在一些实施方案中,本发明的LNP包含约6:1的N:P比率。
在一些实施方案中,本发明的LNP包含约3:1、4:1或5:1的N:P比率。
在一些实施方案中,本发明的LNP包含约10:1至约100:1的氨基脂质组分与RNA的wt/wt比率。
在一些实施方案中,本发明的LNP包含约20:1的氨基脂质组分与RNA的wt/wt比率。
在一些实施方案中,本发明的LNP包含约10:1的氨基脂质组分与RNA的wt/wt比率。
在一些实施方案中,本发明的LNP具有约30nm至约150nm的平均直径。
在一些实施方案中,本发明的LNP具有约60nm至约120nm的平均直径。
示例性额外LNP组分
表面活性剂
在某些实施方案中,本公开的脂质纳米颗粒任选地包括一种或多种表面活性剂。
在某些实施方案中,表面活性剂是两亲性聚合物。如本文所用,两亲性“聚合物”是包含寡聚物或聚合物的两亲性化合物。举例来说,两亲性聚合物可以包含寡聚物片段,诸如两个或更多个PEG单体单元。举例来说,本文所描述的两亲性聚合物可以是PS 20。
举例来说,两亲性聚合物是嵌段共聚物。
举例来说,两亲性聚合物是冻干保护剂。
举例来说,两亲性聚合物在约30℃和大气压下于水中具有小于2x10-4 M的临界胶束浓度(CMC)。
举例来说,两亲性聚合物在约30℃和大气压下于水中具有范围介于约0.1x10-4 M与约1.3x10-4 M之间的临界胶束浓度(CMC)。
举例来说,制剂中两亲性聚合物的浓度范围介于约其CMC与CMC的约30倍之间(例如,高达其CMC的约25倍、约20倍、约15倍、约10倍、约5倍或约3倍),例如,在冷冻或冻干之前。
举例来说,两亲性聚合物选自泊洛沙姆(poloxamer,
Figure BDA0004090383130002831
)、泊洛沙胺(poloxamine,/>
Figure BDA0004090383130002832
)、聚氧乙二醇脱水山梨糖醇烷基酯(聚山梨醇酯)和聚乙烯吡咯烷酮(PVP)。
举例来说,两亲性聚合物是泊洛沙姆。举例来说,两亲性聚合物具有以下结构:
Figure BDA0004090383130002833
其中a是介于10与150之间的整数并且b是介于20与60之间的整数。举例来说,a为约12并且b为约20,或a为约80并且b为约27,或a为约64并且b为约37,或a为约141并且b为约44,或a为约101并且b为约56。
举例来说,两亲性聚合物是P124、P188、P237、P338或P407。
举例来说,两亲性聚合物是P188(例如,泊洛沙姆188,CAS编号9003-11-6,也称为Kolliphor P188)。
举例来说,两亲性聚合物是泊洛沙胺,例如,tetronic 304或tetronic904。
举例来说,两亲性聚合物是聚乙烯吡咯烷酮(PVP),诸如分子量为3kDa、10kDa或29kDa的PVP。
举例来说,两亲性聚合物是聚山梨醇酯,诸如PS 20。
在某些实施方案中,表面活性剂是非离子表面活性剂。
在一些实施方案中,脂质纳米颗粒包含表面活性剂。在一些实施方案中,表面活性剂是两亲性聚合物。在一些实施方案中,表面活性剂是非离子表面活性剂。
举例来说,非离子表面活性剂选自由聚乙二醇醚(Brij)、泊洛沙姆、聚山梨醇酯、脱水山梨糖醇及其衍生物组成的组。
举例来说,聚乙二醇醚是式(VIII)化合物:
Figure BDA0004090383130002841
或其盐或异构体,其中:
t是介于1与100之间的整数;
R1BRIJ独立地是C10-40烷基、C10-40烯基或C10-40炔基;并且任选地R5PEG的一个或多个亚甲基独立地被C3-10亚碳环基、4至10元亚杂环基、C6-10亚芳基、4至10元亚杂芳基、-N(RN)-、-O-、-S-、-C(O)-、-C(O)N(RN)-、-NRNC(O)-、-NRNC(O)N(RN)-、-C(O)O-、-OC(O)-、-OC(O)O-、-OC(O)N(RN)-、-NRNC(O)O-、-C(O)S-、-SC(O)-、-C(=NRN)-、-C(=NRN)N(RN)-、-NRNC(=NRN)-、-NRNC(=NRN)N(RN)-、-C(S)-、-C(S)N(RN)-、-NRNC(S)-、-NRNC(S)N(RN)-、-S(O)-、-OS(O)-、-S(O)O-、-OS(O)O-、-OS(O)2-、-S(O)2O-、-OS(O)2O-、-N(RN)S(O)-、-S(O)N(RN)-、-N(RN)S(O)N(RN)-、-OS(O)N(RN)-、-N(RN)S(O)O-、-S(O)2-、-N(RN)S(O)2-、-S(O)2N(RN)-、-N(RN)S(O)2N(RN)-、-OS(O)2N(RN)-或-N(RN)S(O)2O-置换;并且
RN在每种情况下独立地是氢、C1-6烷基或氮保护基。
在某个实施方案中,R1BRIJ是C18烷基。举例来说,聚乙二醇醚是式(VIII-a)化合物:
Figure BDA0004090383130002851
或其盐或异构体。
在一些实施方案中,R1BRIJ是C18烯基。举例来说,聚乙二醇醚是式(VIII-b)化合物:
Figure BDA0004090383130002852
或其盐或异构体。
在一些实施方案中,泊洛沙姆选自由泊洛沙姆101、泊洛沙姆105、泊洛沙姆108、泊洛沙姆122、泊洛沙姆123、泊洛沙姆124、泊洛沙姆181、泊洛沙姆182、泊洛沙姆183、泊洛沙姆184、泊洛沙姆185、泊洛沙姆188、泊洛沙姆212、泊洛沙姆215、泊洛沙姆217、泊洛沙姆231、泊洛沙姆234、泊洛沙姆235、泊洛沙姆237、泊洛沙姆238、泊洛沙姆282、泊洛沙姆284、泊洛沙姆288、泊洛沙姆331、泊洛沙姆333、泊洛沙姆334、泊洛沙姆335、泊洛沙姆338、泊洛沙姆401、泊洛沙姆402、泊洛沙姆403和泊洛沙姆407组成的组。
在一些实施方案中,聚山梨醇酯是
Figure BDA0004090383130002861
20、/>
Figure BDA0004090383130002862
40、/>
Figure BDA0004090383130002863
60或
Figure BDA0004090383130002864
80。
在一些实施方案中,脱水山梨糖醇的衍生物是
Figure BDA0004090383130002865
20、/>
Figure BDA0004090383130002866
60、/>
Figure BDA0004090383130002867
65、
Figure BDA0004090383130002868
80或/>
Figure BDA0004090383130002869
85。
在一些实施方案中,脂质纳米颗粒中非离子表面活性剂的浓度在约0.00001%w/v至约1%w/v的范围内,例如,约0.00005%w/v至约0.5%w/v,或约0.0001%w/v至约0.1%w/v。
在一些实施方案中,脂质纳米颗粒中非离子表面活性剂的浓度在约0.000001重量%至约1重量%的范围内,例如,约0.000002重量%至约0.8重量%,或约0.000005重量%至约0.5重量%。
在一些实施方案中,脂质纳米颗粒中PEG脂质的浓度在约0.01莫耳%至约50莫耳%的范围内,例如,约0.05莫耳%至约20莫耳%,约0.07莫耳%至约10莫耳%,约0.1莫耳%至约8莫耳%,约0.2莫耳%至约5莫耳%,或约0.25莫耳%至约3莫耳%。
佐剂
在一些实施方案中,本发明的LNP任选地包括一种或多种佐剂,例如,吡喃葡萄糖基脂质佐剂(GLA)、CpG寡脱氧核苷酸(例如,A类或B类)、多聚(I:C)、氢氧化铝和Pam3CSK4。
其它组分
除了前述章节中所描述的那些以外,本发明的LNP可以任选地包括一种或多种组分。举例来说,脂质纳米颗粒可以包括一种或多种小疏水性分子,诸如维生素(例如,维生素A或维生素E)或固醇。
脂质纳米颗粒还可以包括一种或多种渗透性增强剂分子、碳水化合物、聚合物、表面改变剂或其它组分。渗透性增强剂分子可以是例如美国专利申请公布号2005/0222064所描述的分子。碳水化合物可以包括单糖(例如,葡萄糖)和多糖(例如,糖原及其衍生物和类似物)。
聚合物可以包括于脂质纳米颗粒中和/或用于囊封或部分地囊封脂质纳米颗粒。聚合物可以是生物可降解的和/或生物相容性的。聚合物可以选自但不限于聚胺、聚醚、聚酰胺、聚酯、聚氨基甲酸酯、聚脲、聚碳酸酯、聚苯乙烯、聚酰亚胺、聚砜、聚氨酯、聚乙炔、聚乙烯、聚乙烯亚胺、聚异氰酸酯、聚丙烯酸酯、聚甲基丙烯酸酯、聚丙烯腈和聚丙烯酸酯。举例来说,聚合物可以包括聚(己内酯)(PCL)、乙烯乙酸乙烯酯聚合物(EVA)、聚(乳酸)(PLA)、聚(L-乳酸)(PLLA)、聚(乙醇酸)(PGA)、聚(乳酸-共-乙醇酸)(PLGA)、聚(L-乳酸-共-乙醇酸)(PLLGA)、聚(D,L-丙交酯)(PDLA)、聚(L-丙交酯)(PLLA)、聚(D,L-丙交酯-共-己内酯)、聚(D,L-丙交酯-共-己内酯-共-乙交酯)、聚(D,L-丙交酯-共-PEO-共-D,L-丙交酯)、聚(D,L-丙交酯-共-PPO-共-D,L-丙交酯)、聚氰基丙烯酸烷酯、聚氨酯、聚-L-赖氨酸(PLL)、甲基丙烯酸羟丙酯(HPMA)、聚乙二醇、聚-L-谷氨酸、聚(羟基酸)、聚酸酐、聚原酸酯、聚(酯酰胺)、聚酰胺、聚(酯醚)、聚碳酸酯、聚烯(诸如聚乙烯和聚丙烯)、聚烷二醇(诸如聚(乙二醇)(PEG))、聚氧化烯(PEO)、聚对苯二甲酸烷二酯(诸如聚(对苯二甲酸乙二酯))、聚乙烯醇(PVA)、聚乙烯醚、聚乙烯酯(诸如聚(乙酸乙烯酯))、聚卤化乙烯(诸如聚(氯乙烯)(PVC))、聚乙烯吡咯烷酮(PVP)、聚硅氧烷、聚苯乙烯、聚氨酯、衍生化纤维素(诸如烷基纤维素、羟烷基纤维素、纤维素醚、纤维素酯、硝基纤维素、羟丙基纤维素、羧甲基纤维素)、丙烯酸聚合物(诸如聚((甲基)丙烯酸甲酯)(PMMA)、聚((甲基)丙烯酸乙酯)、聚((甲基)丙烯酸丁酯)、聚((甲基)丙烯酸异丁酯)、聚((甲基)丙烯酸己酯)、聚((甲基)丙烯酸异癸酯)、聚((甲基)丙烯酸月桂酯)、聚((甲基)丙烯酸苯酯)、聚(丙烯酸甲酯)、聚(丙烯酸异丙酯)、聚(丙烯酸异丁酯)、聚(丙烯酸十八烷酯)及其共聚物和混合物)、聚二噁烷酮及其共聚物、聚羟基烷酸酯、聚富马酸丙二醇酯、聚甲醛、泊洛沙姆、聚氧胺、聚(原酸)酯、聚(丁酸)、聚(戊酸)、聚(丙交酯-共-己内酯)、三亚甲基碳酸酯、聚(N-丙烯酰基吗啉)(PAcM)、聚(2-甲基-2-噁唑啉)(PMOX)、聚(2-乙基-2-噁唑啉)(PEOZ)和聚甘油。
表面改变剂可以包括但不限于阴离子蛋白(例如,牛血清白蛋白)、表面活性剂(例如,阳离子表面活性剂,诸如二甲基二(十八烷基)-溴化铵)、糖或糖衍生物(例如,环糊精)、核酸、聚合物(例如,肝素、聚乙二醇和泊洛沙姆)、粘液溶解剂(例如,乙酰基半胱氨酸、艾蒿、菠罗蛋白酶、木瓜蛋白酶、大青属(clerodendrum)、溴己新(bromhexine)、羧甲司坦(carbocisteine)、依普拉酮(eprazinone)、美司钠(mesna)、胺溴索(ambroxol)、索布瑞醇(sobrerol)、多米奥醇(domiodol)、来托司坦(letosteine)、司替罗宁(stepronin)、硫普罗宁(tiopronin)、凝溶胶蛋白、胸腺素β4、阿法链道酶(dornase alfa)、奈替克新(neltenexine)和厄多司坦(erdosteine))和DNase(例如,rhDNase)。表面改变剂可以安置于纳米颗粒内和/或LNP的表面上(例如,通过涂布、吸附、共价键联或其它工艺)。
脂质纳米颗粒还可以包含一种或多种官能化脂质。举例来说,脂质可以经炔烃基团官能化,所述炔烃基团当在适当反应条件下暴露于叠氮化物时可以经历环加成反应。特别地,脂质双层可以按这种方式经可用于促进膜渗透、细胞识别或成像的一种或多种基团官能化。LNP的表面还可以与一种或多种可用的抗体缀合。可用于靶向细胞递送、成像和膜渗透的官能团和缀合物在本领域中是众所周知的。
除了这些组分以外,脂质纳米颗粒还可以包括可用于药物组合物的任何物质。举例来说,脂质纳米颗粒可以包括一种或多种药学上可接受的赋形剂或辅助成分,诸如但不限于一种或多种溶剂、分散介质、稀释剂、分散助剂、悬浮助剂、造粒助剂、崩解剂、填充剂、助流剂、液体媒剂、粘合剂、表面活性剂、等渗剂、增稠剂或乳化剂、缓冲剂、润滑剂、油、防腐剂和其它物质。还可以包括诸如蜡、黄油、着色剂、涂布剂、调味剂和芳香剂的赋形剂。药学上可接受的赋形剂在本领域中是众所周知的(参见例如Remington's The Science andPractice of Pharmacy,第21版,A.R.Gennaro;Lippincott,Williams&Wilkins,Baltimore,MD,2006)。
稀释剂的实例可以包括但不限于碳酸钙、碳酸钠、磷酸钙、磷酸二钙、硫酸钙、磷酸氢钙、磷酸钠、乳糖、蔗糖、纤维素、微晶纤维素、高岭土、甘露糖醇、山梨糖醇、肌醇、氯化钠、干淀粉、玉米淀粉、糖粉和/或它们的组合。造粒剂和分散剂可以选自由马铃薯淀粉、玉米淀粉、木薯淀粉、乙醇酸淀粉钠、粘土、海藻酸、瓜尔胶、柑橘渣、琼脂、膨润土、纤维素和木制品、天然海绵、阳离子交换树脂、碳酸钙、硅酸盐、碳酸钠、交联聚(乙烯-吡咯烷酮)(交联聚维酮)、羧甲基淀粉钠(乙醇酸淀粉钠)、羧甲基纤维素、交联羧甲基纤维素钠(交联羧甲纤维素)、甲基纤维素、预胶凝淀粉(淀粉1500)、微晶淀粉、水不溶性淀粉、羧甲基纤维素钙、硅酸镁铝
Figure BDA0004090383130002893
月桂基硫酸钠、季铵化合物和/或它们的组合组成的非限制性清单。
表面活性剂和/或乳化剂可以包括但不限于天然乳化剂(例如,阿拉伯胶、琼脂、海藻酸、海藻酸钠、黄蓍胶、角叉菜(chondrux)、胆固醇、黄原胶、果胶、明胶、蛋黄、酪蛋白、羊毛脂、胆固醇、蜡和卵磷脂)、胶质粘土(例如,膨润土[硅酸铝]和
Figure BDA0004090383130002891
[硅酸镁铝])、长链氨基酸衍生物、高分子量醇(例如,硬脂醇、鲸蜡醇、油醇、三乙酸甘油酯单硬脂酸酯、乙二醇二硬脂酸酯、甘油单硬脂酸酯和丙二醇单硬脂酸酯、聚乙烯醇)、卡波姆(carbomer)(例如,羧聚乙烯、聚丙烯酸、丙烯酸聚合物和羧乙烯基聚合物)、角叉菜胶、纤维素衍生物(例如,羧甲基纤维素钠、粉状纤维素、羟甲基纤维素、羟丙基纤维素、羟丙基甲基纤维素、甲基纤维素)、脱水山梨糖醇脂肪酸酯(例如,聚氧乙烯脱水山梨糖醇单月桂酸酯[
Figure BDA0004090383130002892
20]、聚氧乙烯脱水山梨糖醇[/>
Figure BDA0004090383130002901
60]、聚氧乙烯脱水山梨糖醇单油酸酯[/>
Figure BDA0004090383130002902
80]、脱水山梨糖醇单棕榈酸酯[/>
Figure BDA0004090383130002903
40]、脱水山梨糖醇单硬脂酸酯[/>
Figure BDA0004090383130002904
60]、脱水山梨糖醇三硬脂酸酯[/>
Figure BDA0004090383130002905
65]、甘油单油酸酯、脱水山梨糖醇单油酸酯[/>
Figure BDA0004090383130002906
80])、聚氧乙烯酯(例如,聚氧乙烯单硬脂酸酯[/>
Figure BDA0004090383130002907
45]、聚氧乙烯氢化蓖麻油、聚乙氧基化蓖麻油、聚氧亚甲基硬脂酸酯和/>
Figure BDA0004090383130002908
)、蔗糖脂肪酸酯、聚乙二醇脂肪酸酯(例如,/>
Figure BDA0004090383130002909
)、聚氧乙烯醚(例如,聚氧乙烯月桂基醚[/>
Figure BDA00040903831300029010
30])、聚(乙烯-吡咯烷酮)、二乙二醇单月桂酸酯、三乙醇胺油酸酯、油酸钠、油酸钾、油酸乙酯、油酸、月桂酸乙酯、月桂基硫酸钠、/>
Figure BDA00040903831300029011
F 68、/>
Figure BDA00040903831300029012
188、西曲溴铵(cetrimonium bromide)、西吡氯铵(cetylpyridinium chloride)、苯扎氯铵(benzalkonium chloride)、多库酯钠(docusate sodium)和/或它们的组合。
粘合剂可以是淀粉(例如,玉米淀粉和淀粉糊);明胶;糖(例如,蔗糖、葡萄糖、右旋糖、糊精、糖蜜、乳糖、乳糖醇、甘露糖醇);天然和合成胶(例如,阿拉伯胶、海藻酸钠、爱尔兰苔提取物、潘瓦尔胶(panwar gum)、茄替胶(ghatti gum)、伊莎珀尔果壳(isapol husk)的粘液、羧甲基纤维素、甲基纤维素、乙基纤维素、羟乙基纤维素、羟丙基纤维素、羟丙基甲基纤维素、微晶纤维素、乙酸纤维素、聚(乙烯-吡咯烷酮)、硅酸镁铝
Figure BDA00040903831300029013
和落叶松阿拉伯半乳聚糖);海藻酸盐;聚氧化乙烯;聚乙二醇;无机钙盐;硅酸;聚甲基丙烯酸酯;蜡;水;醇;和它们的组合,或任何其它适合的粘合剂。
防腐剂的实例可以包括但不限于抗氧化剂、螯合剂、抗微生物防腐剂、抗真菌防腐剂、醇防腐剂、酸性防腐剂和/或其它防腐剂。抗氧化剂的实例包括但不限于α生育酚、抗坏血酸、抗坏血酸棕榈酸酯、丁基化羟基茴香醚、丁基化羟基甲苯、单硫代甘油、偏亚硫酸氢钾、丙酸、没食子酸丙酯、抗坏血酸钠、亚硫酸氢钠、偏亚硫酸氢钠和/或亚硫酸钠。螯合剂的实例包括乙二胺四乙酸(EDTA)、单水合柠檬酸、依地酸二钠、依地酸二钾、依地酸、富马酸、苹果酸、磷酸、依地酸钠、酒石酸和/或依地酸三钠。抗微生物防腐剂的实例包括但不限于苯扎氯铵、苄索氯铵(benzethonium chloride)、苯甲醇、布罗波尔(bronopol)、西曲溴铵(cetrimide)、西吡氯铵、氯己定(chlorhexidine)、氯丁醇、氯甲酚、氯二甲苯酚、甲酚、乙醇、甘油、海克替啶(hexetidine)、咪脲、苯酚、苯氧乙醇、苯乙醇、硝酸苯汞、丙二醇和/或硫柳汞(thimerosal)。抗真菌防腐剂的实例包括但不限于对羟基苯甲酸丁酯、对羟基苯甲酸甲酯、对羟基苯甲酸乙酯、对羟基苯甲酸丙酯、苯甲酸、羟基苯甲酸、苯甲酸钾、山梨酸钾、苯甲酸钠、丙酸钠和/或山梨酸。醇防腐剂的实例包括但不限于乙醇、聚乙二醇、苯甲醇、苯酚、酚类化合物、双酚、氯丁醇、羟基苯甲酸酯和/或苯乙醇。酸性防腐剂的实例包括但不限于维生素A、维生素C、维生素E、β-胡萝卜素、柠檬酸、乙酸、去氢抗坏血酸、抗坏血酸、山梨酸和/或植酸。其它防腐剂包括但不限于生育酚、乙酸生育酚、甲磺酸去铁胺、西曲溴铵、丁基化羟基茴香醚(BHA)、丁基化羟基甲苯(BHT)、乙二胺、月桂基硫酸钠(SLS)、月桂基醚硫酸钠(SLES)、亚硫酸氢钠、偏亚硫酸氢钠、亚硫酸钾、偏亚硫酸氢钾、GLYDANT
Figure BDA0004090383130002911
Figure BDA0004090383130002912
对羟基苯甲酸甲酯、/>
Figure BDA0004090383130002913
115、/>
Figure BDA0004090383130002914
II、NEOLONETM、KATHONTM和/或/>
Figure BDA0004090383130002915
缓冲剂的实例包括但不限于柠檬酸盐缓冲溶液、乙酸盐缓冲溶液、磷酸盐缓冲溶液、氯化铵、碳酸钙、氯化钙、柠檬酸钙、葡乳醛酸钙、葡庚糖酸钙、葡萄糖酸钙、d-葡萄糖酸、甘油磷酸钙、乳酸钙、乳糖酸钙、丙酸、乙酰丙酸钙、戊酸、磷酸氢钙、磷酸、磷酸三钙、磷酸氢氧化钙、乙酸钾、氯化钾、葡萄糖酸钾、钾混合物、磷酸氢二钾、磷酸二氢钾、磷酸钾混合物、乙酸钠、碳酸氢钠、氯化钠、柠檬酸钠、乳酸钠、磷酸氢二钠、磷酸二氢钠、磷酸钠混合物、缓血酸胺(tromethamine)、氨基-磺酸盐缓冲液(例如,HEPES)、氢氧化镁、氢氧化铝、海藻酸、无热原质水、等渗盐水、林格氏溶液(Ringer's solution)、乙醇和/或它们的组合。润滑剂可以选自由硬脂酸镁、硬脂酸钙、硬脂酸、二氧化硅、滑石、麦芽、甘油山嵛酸酯、氢化植物油、聚乙二醇、苯甲酸钠、乙酸钠、氯化钠、亮氨酸、月桂基硫酸镁、月桂基硫酸钠和它们的组合组成的非限制性组。
油的实例包括但不限于扁桃仁、杏仁、鳄梨、巴西棕榈、佛手柑、黑加仑籽、琉璃苣、刺桧、甘菊、芥花、香菜、巴西棕榈、蓖麻、肉桂、可可脂、椰子、鱼肝、咖啡、玉米、棉籽、鸸鹋、桉树、月见草、鱼、亚麻仁、香草醇、葫芦、葡萄籽、榛子、海索草、肉豆蔻酸异丙酯、荷荷巴、夏威夷核果、熏衣草花、熏衣草、柠檬、山苍子、澳洲坚果、锦葵、芒果核、池花籽、貂、肉豆蔻、橄榄、橙、橙鲷、棕榈、棕榈仁、桃仁、花生、罂粟籽、南瓜籽、油菜籽、米糠、迷迭香、红花、白檀、山茶花、欧洲薄荷、沙棘、芝麻、乳木果油、硅酮、大豆、向日葵、茶树、蓟、椿花、香根草、胡桃和小麦胚芽油以及硬脂酸丁酯、辛酸三酸甘油酯、癸酸三酸甘油酯、环甲基硅酮、癸二酸二乙酯、二甲硅油360(dimethicone 360)、西甲硅油(simethicone)、肉豆蔻酸异丙酯、矿物油、辛基十二醇、油醇、硅酮油和/或它们的组合。
额外的和示例性脂质纳米颗粒和化合物公开于2020年9月18日提交的国际申请号PCT/US2020/051609中,其全部内容特此以引用的方式并入。
使用LNP组合物的方法
本公开提供了LNP组合物,所述组合物可以例如体外或体内递送至细胞,例如靶细胞。对于体外蛋白质表达,通过离体孵育LNP和细胞使细胞与LNP接触。随后可将此类细胞引入体内。对于体内蛋白质表达,通过向受试者施用LNP使细胞与LNP接触,从而增加或诱导受试者内的细胞中或细胞上的蛋白质表达。举例来说,在一个实施方案中,静脉内施用LNP。在另一个实施方案中,肌肉内施用LNP。在又一个实施方案中,通过选自由皮下、结内和瘤内组成的组的途径施用LNP。
对于体外递送,在一个实施方案中,通过离体孵育LNP和靶细胞使细胞与LNP接触。在一个实施方案中,细胞是人类细胞。已经证明各种类型的细胞可被LNP转染。
在另一个实施方案中,细胞与LNP接触例如至少30分钟、至少1小时、至少2小时、至少3小时、至少4小时、至少5小时、至少6小时、至少12小时或至少24小时。
在一个实施方案中,细胞与LNP接触持续单次治疗/转染。在另一个实施方案中,细胞与LNP接触持续多次治疗/转染(例如,相同细胞之两次、三次、四次或更多次治疗/转染)。
在另一个实施方案中,对于体内递送,通过向受试者施用LNP使细胞与LNP接触,从而将核酸递送至受试者内的细胞。举例来说,在一个实施方案中,静脉内施用LNP。在另一个实施方案中,肌肉内施用LNP。在又一个实施方案中,通过选自由皮下、结内和瘤内组成的组的途径施用LNP。
在一个方面,本文提供了一种增加细胞中的治疗性有效载荷或预防性有效载荷的表达的方法,所述方法包括向所述细胞施用本文所公开的LNP组合物。
在一个相关方面,本文提供了一种LNP组合物,所述组合物用于增加细胞中的治疗性有效载荷或预防性有效载荷的表达的方法中。
在另一个方面,本公开提供了一种增加受试者中的治疗性有效载荷或预防性有效载荷的表达的方法,所述方法包括向所述受试者施用有效量的本文所公开的LNP组合物。
在一个相关方面,本文提供了一种LNP组合物,所述组合物用于增加受试者中的治疗性有效载荷或预防性有效载荷的表达的方法中。
在又一个方面,本文提供了一种递送本文所公开的LNP组合物的方法。
在一个相关方面,本文提供了一种LNP组合物,所述组合物用于将LNP组合物递送至细胞的方法中。
在一个实施方案中,方法或用途包括体外、体内或离体使细胞与LNP组合物接触。
在一个实施方案中,本公开的LNP组合物与细胞例如离体或体内接触,并且可以用于将分泌多肽、细胞内多肽或跨膜多肽递送至受试者。
在一个方面,本公开提供了一种将本文所公开的LNP组合物递送至患有例如本文所描述的疾病或病症的受试者的方法。
在一个相关方面,本文提供了一种LNP组合物,所述组合物用于将LNP组合物递送至患有例如本文所描述的疾病或病症的受试者的方法中。
在另一个方面,本文提供了一种调节受试者的免疫反应的方法,所述方法包括向有需要的受试者施用有效量的本文所公开的LNP组合物。
在一个相关方面,本文提供了一种LNP组合物,所述组合物用于调节受试者中的免疫反应的方法中,所述方法包括向所述受试者施用有效量的LNP组合物。
在另一个方面,本文提供了一种将分泌多肽、细胞内多肽或跨膜多肽递送至受试者的方法。
在一个方面,本文提供了一种治疗、预防疾病或病症或预防疾病或病症的症状的方法,所述方法包括向有需要的受试者施用有效量的本文所公开的LNP组合物。
在一个相关方面,本文提供了一种LNP组合物,所述组合物用于治疗、预防受试者的疾病或病症或预防疾病或病症的症状的方法中,所述方法包括向有需要的受试者施用有效量的LNP组合物。
在一些实施方案中,供使用的方法或组合物使得编码治疗性有效载荷或预防性有效载荷的mRNA的表达和/或水平增加。
在一些实施方案中,供使用的方法或组合物使得编码治疗性有效载荷或预防性有效载荷的mRNA的表达和/或水平持续。
在一些实施方案中,供使用的方法或组合物使得治疗性有效载荷或预防性有效载荷的表达和/或水平增加。
在一些实施方案中,供使用的方法或组合物使得治疗性有效载荷或预防性有效载荷的表达和/或水平持续。
在一些实施方案中,将本文所描述的功能效应中的任一者与以下细胞进行比较:
(a)尚未与本文所公开的LNP组合物接触;或者
(b)尚未与包含多核苷酸的LNP接触,所述多核苷酸包含本文所描述的5'UTR、本文所描述的3'UTR和/或包含本文所描述的终止元件的编码区。
组合疗法
在一些实施方案中,本文所公开的供使用的治疗方法或组合物包括施用本文所公开的LNP与额外剂的组合。在一个实施方案中,额外剂是疾病或病症,例如自身免疫疾病的标准护理。在一个实施方案中,额外剂是mRNA。
在一些方面,本发明方法或组合物的受试者已经用一种或多种标准护理疗法治疗。在其它方面,本发明方法或组合物的受试者对一种或多种标准护理疗法或抗癌疗法没有反应。
药物组合物
本公开提供了包含本文所公开的LNP组合物中的任一者的药物制剂。
在本公开的一些实施方案中,多核苷酸与一种或多种药学上可接受的赋形剂组合配制于组合物和复合物中。药物组合物可以任选地包含一种或多种额外的活性物质,例如,治疗和/或预防活性物质。本公开的药物组合物可以是无菌的和/或无热原的。药剂的配制和/或制造的一般准则可以见于例如Remington:The Science and Practice ofPharmacy,第21版,Lippincott Williams&Wilkins,2005中。
在一些实施方案中,向人类、人类患者或受试者施用组合物。出于本公开的目的,短语“活性成分”一般是指如本文所描述而递送的多核苷酸。
尽管本文所提供的药物组合物的描述主要针对适合于向人类施用的药物组合物,但熟练的技术人员将了解,此类组合物一般适合于向任何其它动物,例如非人类动物,例如非人类哺乳动物施用。充分了解到对适合于向人类施用的药物组合物进行修饰以使所述组合物适合于向各种动物施用,并且普通兽医药理学家可以设计和/或仅通过普通实验(如果有的话)进行此种修饰。药物组合物预期施用的受试者包括但不限于人类和/或其它灵长类动物;哺乳动物。
在一些实施方案中,本公开的多核苷酸被配制成用于皮下、静脉内、腹膜内、肌肉内、关节内、滑膜内、胸骨内、鞘内、肝内、病灶内、颅内、心室内、经口、吸入喷雾、经肺、局部、经直肠、经鼻、经颊、经阴道或植入式储库肌肉内、皮下或皮内递送。在其它实施方案中,多核苷酸被配制成用于皮下或静脉内递送。
本文所描述的药物组合物的制剂可以通过药理学领域中已知的或以后开发的任何方法来制备。一般来说,此类制备方法包括以下步骤:使活性成分与赋形剂和/或一种或多种其它辅助成分缔合,然后必要或需要时,将产物分割、成形和/或包装成所需的单剂量或多剂量单位。
根据本公开的药物组合物中的活性成分、药学上可接受的赋形剂和/或任何额外成分的相对量将取决于所治疗的受试者的身份、体型和/或状况并且进一步取决于组合物的施用途径而变化。举例来说,组合物可以包含介于0.1%与100%之间,例如介于0.5%与50%之间、介于1%与30%之间、介于5%与80%之间或至少80%(w/w)的活性成分。
制剂和递送
可以使用一种或多种赋形剂来配制包含本公开的mRNA的多核苷酸。
一种或多种赋形剂的功能是例如:(1)增加稳定性;(2)增加细胞转染;(3)允许持续或延迟释放(例如,从多核苷酸的贮库制剂中);(4)改变生物分布(例如,将多核苷酸靶向特定组织或细胞类型);(5)增加体内编码蛋白的翻译;和/或(6)改变体内编码蛋白的释放型态。除了诸如任何和所有溶剂、分散介质、稀释剂或其它液体媒剂、分散或悬浮助剂、表面活性剂、等渗剂、增稠剂或乳化剂、防腐剂的传统赋形剂以外,本公开的赋形剂还可以包括但不限于类脂质、脂质体、脂质纳米颗粒、聚合物、脂质复合物、核-壳纳米颗粒、肽、蛋白质、用多核苷酸转染的细胞(例如,用于移植至受试者中)、透明质酸酶、纳米颗粒模拟物和它们的组合。因此,本公开的制剂可以包括一种或多种赋形剂,每种赋形剂的量共同增加多核苷酸的稳定性,增加多核苷酸的细胞转染,增加多核苷酸编码的蛋白质的表达,和/或改变多核苷酸编码的蛋白质的释放型态。此外,本公开的多核苷酸可以使用自组装的核酸纳米颗粒来配制。
本文所描述的药物组合物的制剂可以通过药理学领域中已知的或以后开发的任何方法来制备。一般来说,此类制备方法包括将活性成分与赋形剂和/或一种或多种其它辅助成分缔合的步骤。
根据本公开的药物组合物可以大批、作为单一单位剂量和/或作为多个单一单位剂量来制备、包装和/或销售。如本文所用,“单位剂量”是指包含预定量的活性成分的药物组合物的个别量。活性成分的量一般等于将向受试者使用的活性成分的剂量,和/或此种剂量的适宜分率,诸如此种剂量的一半或三分之一。
根据本公开的药物组合物中的活性成分、药学上可接受的赋形剂和/或任何额外成分的相对量可以取决于所治疗的受试者的身份、体型和/或状况并且进一步取决于组合物的施用途径而变化。举例来说,组合物可以包含介于0.1%与99%(w/w)之间的活性成分。举例来说,组合物可以包含介于0.1%与100%之间,例如介于0.5%与50%之间、介于1-30%之间、介于5-80%之间、至少80%(w/w)的活性成分。
在一些实施方案中,本文所描述的制剂含有至少一种多核苷酸。作为一个非限制性实例,制剂含有1、2、3、4或5种多核苷酸。
药物制剂另外可以包含药学上可接受的赋形剂,如本文所用的赋形剂包括但不限于对所需特定剂型适合的任何和所有的溶剂、分散介质、稀释剂或其它液体媒剂、分散或悬浮助剂、表面活性剂、等渗剂、增稠剂或乳化剂、防腐剂等。用于配制药物组合物的各种赋形剂和用于制备组合物的技术在本领域中是已知的(参见Remington:The Science andPractice of Pharmacy,第21版,A.R.Gennaro,Lippincott,Williams&Wilkins,Baltimore,MD,2006)。除非任何常规赋形剂介质可能与物质或其衍生物不相容,诸如通过产生任何不合需要的生物作用或在其它方面以有害方式与药物组合物的任何其它组分相互作用,否则可以预期常规赋形剂介质的使用处于本公开的范围内。
在一些实施方案中,脂质纳米颗粒的粒度增加和/或减小。粒度的变化能够帮助对抗生物反应,诸如但不限于炎症,或者可以增加递送至哺乳动物的修饰mRNA的生物作用。
用于制造药物组合物的药学上可接受的赋形剂包括但不限于惰性稀释剂、表面活性剂和/或乳化剂、防腐剂、缓冲剂、润滑剂和/或油。此类赋形剂可以任选地包含于本公开的药物制剂中。
在一些实施方案中,多核苷酸在纳米结构中施用或与纳米结构一起施用,配制于纳米结构中或与纳米结构一起递送,所述纳米结构可以螯合诸如胆固醇的分子。这些纳米结构的非限制性实例和制造这些纳米结构的方法描述于美国专利公布号US20130195759中。这些纳米结构的示例性结构示于美国专利公布号US20130195759中,并且可以包括核和包围核的壳。
可以使用本领域中已知的任何方法将包含本公开的mRNA的多核苷酸递送至细胞。举例来说,包含本公开的mRNA的多核苷酸可以通过基于脂质的递送(例如,转染)或通过电穿孔而递送至细胞。
等效物和范围
本领域技术人员将认识到或能够仅使用常规实验确定根据本文所描述的公开内容的特定实施方案的许多等效方案。本公开的范围不旨在局限于以下描述,而是如所附权利要求书中所阐述。
除非相反指示或从上下文另外显而易见,否则在权利要求书中,诸如“一个”、“一种”和“所述”的冠词可以意指一个(种)或超过一个(种)。除非相反指示或从上下文另外显而易见,否则在组的一个或多个成员之间包括“或”的权利要求或描述在组成员中的一者、超过一者或全部存在于、用于给定产物或工艺中或以其它方式与给定产物或工艺相关时被视为满足条件的。本公开包括如下实施方案,其中确切地组的一个成员存在于、用于给定产物或工艺中或以其它方式与给定产物或工艺相关。本公开包括如下实施方案,其中组成员中的超过一者或全部存在于、用于给定产物或工艺中或以其它方式与给定产物或工艺相关。
还应注意,术语“包含”旨在是开放性的并且允许但不需要包括额外的要素或步骤。当术语“包含”在本文中使用时,因此还预期并公开术语“由......组成”。
在给出范围的情况下,包括端点。此外,应了解,除非另外指示或从上下文和本领域普通技术人员的理解另外显而易见,否则以范围表述的值可以在本公开的不同实施方案中假设所陈述的范围内的任何特定值或子范围,除非上下文另外清楚地指示,否则达到所述范围的下限的单位的十分之一。
所有引用的来源(例如,参考文献、公布、数据库、数据库条目和本文所引用的技术)以引用的方式并入本申请中,即使在引用中未明确陈述。在引用的来源与本申请的陈述有冲突的情况下,应以本申请中的陈述为准。
实施例
通过参考以下实施例将更充分地理解本公开。然而,它们不应被解释为限制本公开的范围。应了解,本文所描述的实施例和实施方案仅为了说明的目的,并且鉴于其的各种修改或变化将被本领域技术人员所想到并且包括于本申请的精神和权限以及所附权利要求书的范围内。
实施例内容的表格
Figure BDA0004090383130003001
/>
Figure BDA0004090383130003011
/>
Figure BDA0004090383130003021
实施例1:A1 5'UTR的鉴定
本实施例描述了将A1 5'UTR鉴定为来自5'UTR筛选的候选者。对于5'UTR筛选,包括来自广泛来源的序列和它们的组合。对每个5'UTR候选者测量两个参数:(1)通过eGFP-degron IncuCyte测量的表达和(2)通过Wes遗漏扫描测定的起始保真度。作为比较,将两种测定中的5'UTR性能与A11参考5'UTR进行比较。在本实施例中使用包含GG序列的帽。
来自筛选的几个5'UTR序列与相对于参考5'UTR的表达增加相关。大多数与表达显著增加相关的5'UTR具有一定属性,这阻碍了它们的广泛用途。A1在所测试的ORF和细胞类型中表现出色。A1 5'UTR包含源自小鼠Hist1h1b基因的76个核苷酸的5'UTR序列(SEQ IDNO:1)。通过包含T7转录前导序列,这个序列从天然序列修饰。A1序列基于以下而包括于筛选中:高核糖体密度(通过核糖体足迹;小鼠胚胎成纤维细胞;Reid DW等(2014)Cell 158(6):1362-74);在第一AUG处小核糖体亚基的高度富集(通过小亚基映射);它的长度适中及序列中不存在AUG。
图1显示了来自具有参考5'UTR或A1 5'UTR的mRNA构建体的蛋白质表达。用编码具有指定5'UTR的eGFP-degron的mRNA构建体转染Hela细胞。通过成像(Incucyte S3)评价eGFP蛋白质表达。与具有参考5'UTR的构建体相比,A1 5'UTR使得蛋白质表达增加约2.4倍(表5)。基于具有A1 5'UTR的eGFP荧光的动力学(如Mauger DM等(2019)PNAS 116(48):24075-83中所述),推断与含有参考5'UTR的构建体的半衰期为约1.9小时相比,相应mRNA的半衰期为约6.9小时。总之,A1 5'UTR增加了由mRNA编码的蛋白质的表达。在一个实施方案中,这种效应是由于mRNA本身的半衰期增加。
表5:蛋白质表达和mRNA半衰期
Figure BDA0004090383130003031
Figure BDA0004090383130003041
实施例2:使用LNP配制的具有A1 5'UTR的mRNA的蛋白质表达的体内增加
本实施例描述了A1 5'UTR在小鼠和大鼠动物模型中体内蛋白质表达的增加。
为了评价A1在小鼠体内的作用,向BALB/c小鼠静脉内给与0.5mg/kg LNP配制的ffLuc mRNA。mRNA构建体具有A11参考5'UTR或A1 5'UTR。使用包含GG序列的帽。在给药后6小时和48小时对动物进行成像。每组有8只动物。
图2A-2C中的数据显示了A1赋予小鼠体内ffLuc活性的显著增加(例如,增加约1.2-2倍)。图2A显示了施用后6小时的总通量并且图2B显示了LNP施用后48小时的总通量。在所测试的两种LNP制剂(各自包含由式IC涵盖的可电离氨基脂质、磷脂、胆固醇和PEG脂质)中观察到影响。
进行类似的实验以评价A1在大鼠中的作用。向史-道二氏大鼠(Sprague-Dawleyrat)静脉内给与0.5mg/kg LNP配制的靶mRNA。在指定的时间点,从动物获得血清用于评价靶蛋白水平。使用ELISA评估靶蛋白的水平。每组有11只小鼠。
如图3中所示,与参考5'UTR相比,A1 5'UTR赋予大鼠中靶表达的显著增加(例如,增加约2.7倍)。
实施例3:在原代肝细胞中使用LNP配制的具有A1 5'UTR的mRNA的靶蛋白表达的增加
本实施例描述了由具有A1 5'UTR的mRNA编码的靶蛋白在大鼠、恒河猴和人类原代肝细胞中的表达增加。
简单地说,将LNP配制的编码靶蛋白的mRNA递送至接种有来自大鼠、恒河猴或人类肝脏的肝细胞的HepatoPacs。mRNA构建体具有A11参考5'UTR或A1 5'UTR。使用包含GG序列的帽。将细胞在1%匹配血清中培养并且每孔递送200ng LNP配制的m RNA。
图4A-4C显示了在大鼠(图4A)、食蟹猴(图4B)和人类(图4C)原代肝细胞中细胞培养基中分泌的靶蛋白表达的显著增加,其中LNP配制的mRNA构建体与参考5'UTR相比具有A15'UTR。
实施例4:在小鼠免疫细胞中使用LNP配制的具有A1 5'UTR的mRNA的靶蛋白表达的增加
本实施例描述了靶蛋白在体内各种免疫细胞中的表达增加。
向BALB/c小鼠静脉内给与0.5mg/kg LNP配制的编码靶蛋白的mRNA。mRNA构建体具有A11参考5'UTR或A1 5'UTR。使用包含GG序列的帽。在施用后24小时,处死小鼠,且通过流式细胞术评价脾脏和血液的靶蛋白表达/水平。每组有6只动物。
数据汇总于表6-7中。发现A1始终与脾脏和血液中广泛小鼠免疫细胞中的靶蛋白表达的表达增加相关。作用的量级在细胞类型之间不同,并且对平均荧光强度(MFI)的影响类似于阳性细胞百分比。
表6:脾脏(靶蛋白+百分比)
Figure BDA0004090383130003051
表7:血液(靶蛋白+百分比)
Figure BDA0004090383130003061
实施例5.在人类PBMC中使用LNP配制的具有A1 5'UTR的mRNA的靶蛋白表达的增加
本实施例描述了靶蛋白在人类外周血单核细胞(PBMC)中的表达增加。
使人类PBMC与LNP配制的编码靶蛋白的mRNA接触。mRNA构建体具有参考5'UTR或A15'UTR。使用包含GG序列的帽。在人类血清存在下培养PBMC细胞。本实验中使用来自3个供体的细胞。与LNP一起孵育24、48或72小时后,收集细胞并加工以用于流式细胞术。
如图5A-5B中所示,与对照相比,LNP配制的具有A1的mRNA使得T细胞中的靶蛋白的表达增加。在B细胞中观察到类似作用(图5C-5D)。这个数据显示mRNA构建体中A1的存在使得人类PBMC中编码蛋白的表达增加。
实施例6:在罕见疾病模型中具有A1 5'UTR的mRNA的体外作用
本实施例描述了与Hep3B细胞中罕见疾病相关的靶蛋白水平。靶蛋白由具有A1 5'UTR或A11参考5'UTR的mRNA编码。
对于本实验,用编码靶蛋白的mRNA构建体转染Hep3B细胞。使用包含两种型式的ORF序列并编码靶蛋白的mRNA构建体。mRNA构建体具有A1 5'UTR或参考5'UTR。使用包含GG序列的帽。在37℃下于补充有10%胎牛血清的DMEM中培养细胞。转染后24小时,收集细胞并加工以用于蛋白质印迹法。
如图6中所示,具有任一型式的ORF序列与A1 5'UTR的mRNA构建体使得与罕见疾病相关的编码靶蛋白的表达增加。
实施例7.来自A1变体的蛋白质表达
本实施例描述了来自具有不同A1 5'UTR序列的构建体的蛋白质表达。使用以下5'UTR序列产生编码绿色荧光蛋白的mRNA序列:A1、A2或A3。使用包含GG序列的帽。使用脂转染胺2000(Lipofectamine 2000)将mRNA转染至Hep3B细胞中且使用IncuCyte监测荧光。将总荧光信号在一段时程内求和。
结果在表8中提供。所有编码绿色荧光蛋白的mRNA序列都显示出类似水平的蛋白质表达。数据显示A1 5'UTR及其两种衍生物具有类似水平的蛋白质表达。
表8
5'UTR Greencyto_Hep3b_AUC
A3 1.25
A2 1.23
A1 1.22
实施例8:来自A1变体的体内蛋白质表达
本实施例描述了来自具有修饰的A1 5'UTR序列的构建体的体内蛋白质表达。
向小鼠给与带有参考5'UTR的mRNA或带有额外尿苷和改进的Kozak序列的修饰A1序列。使用包含GG序列的帽。在给药后2天和8天通过免疫印迹测量肝脏中编码蛋白的表达。将表达针对加载对照并针对编码蛋白的内源性表达归一化。
本实验的结果示于图7中。在给药后第2天和第8天,与对照相比,来自具有修饰的A1 5'UTR的构建体的体内蛋白质表达更高。
实施例9:用于延长mRNA半衰期的3'UTR序列的发现和应用
本实施例描述了3'UTR筛选以鉴定可能增加mRNA半衰期的3'UTR。
生成了对于以下3个ORF中的每一者具有120,000个独特3'UTR序列的mRNA库:GFP-degron(细胞质)、GLuc(分泌)和膜蛋白。为了鉴定可能增加mRNA半衰期的3'UTR,将这些库电穿孔至Hep3b、HeLa、AML-12和JAWSII细胞中,然后在一段时程内通过扩增子测序评估每个3'UTR序列的相对丰度。在本实验中,3'UTR序列的相对丰度的增加可能指示mRNA半衰期增加,并且如所示进行定量(图8)。
将与高半衰期评分相关的几个3'UTR序列纳入3'UTR筛选中,所述筛选使用荧光报告子评估几类3'UTR序列的性能(图9)。在这个筛选中,计算建模(Mauger DM等(2019)PNAS116(48):24075-83)用于推断与每个mRNA相关的翻译效率和mRNA半衰期。3'UTR的性能在ORF(R=0.4)和细胞类型(R=0.7)中相当一致。
根据计算模型,从高通量半衰期筛选中选择的3'UTR序列中的每一者与相对于参考3'UTR增加的mRNA半衰期相关(图10A-10C)。然而,效应量很小-观察到的最高半衰期相对于参考仅增加50%(图10A)。翻译效率在这些3'UTR序列之间也不同,其中具有高推断半衰期和翻译效率的mRNA赋予最高的总体表达(图10A-10B)。与延长的半衰期最一致相关的序列来源于B1基因;显示了表达型态的一个实例(图10C)。有趣的是,天然B1 mRNA本身不具有异常高的半衰期(t1/2=5.5h;Tani H等(2012)Genome Research 22(5):947-956)。这个序列在高通量3'UTR筛选中也具有最高的半衰期评分。基于这些观察结果,B1 3'UTR用于后续研究中以进一步评价其对mRNA半衰期和蛋白质表达的影响。
实施例10:终止元件的工程改造
本实施例描述了包含连续终止密码子的终止元件的工程改造。
鉴于与终止密码子背景及其对终止密码子功能的影响相关的大量文献(评述于Dabrowski M.等,(2015)RNA Biol 12(9):950-958中),据推测终止密码子盒-定义为终止密码子及其核苷酸背景-也可能影响mRNA半衰期。为了评估这种可能性,计算了带有不同终止元件的mRNA的中值mRNA半衰期(Tani H等(2012)Genome Research22(5):947-956)。具有不同终止元件的mRNA在中值半衰期方面存在实质性和显著差异,与连续终止密码子相关的那些与最低中值半衰期相关(图11A-11B)。基于这些数据,在来自实施例9中所描述的3'UTR筛选的荧光报告子中测试了几个新的终止密码子元件。
在几个报告子和细胞类型中,观察到根据计算建模由mRNA半衰期的增加驱动的总体表达的适度(约1.5倍)但一致增加(图11C中所示的实例)。表9概述了这些新的终止元件。这个表中还包括了来源于单独的生物信息学分析的终止密码子盒,其中单独评估相对于终止密码子的每个位置处的单个核苷酸与mRNA半衰期的相关性(C7、C9;图11D-11F)。
表9:示例性终止元件
Figure BDA0004090383130003091
Figure BDA0004090383130003101
实施例11:由具有不同终止元件的mRNA编码的靶蛋白的表达增加
本实施例描述了由具有不同终止元件的mRNA编码的靶标的蛋白质表达增加。本实施例中使用的靶蛋白与罕见疾病相关。本实施例中使用的终止元件是C5、C4、C11、C3、参考终止元件(C1)和对照。将所有终止元件并入具有靶蛋白开放阅读框的mRNA中并转染至HepG2细胞中。在指定的时间点通过免疫印迹评估靶蛋白水平。
如图12中所示,在HepG2细胞中,每个测试终止元件相对于参考终止元件与体外蛋白质水平的适度增加相关。
实施例12:由具有不同终止元件的mRNA编码的靶蛋白的体内表达
本实施例描述了由具有不同终止元件的mRNA编码的靶标的蛋白质表达增加。本实施例中使用的靶蛋白与罕见疾病相关。简单地说,向小鼠给与带有三重终止元件(α)或图例中所指示的修饰终止元件的mRNA。在给药后2天和8天通过免疫印迹测量肝脏中编码蛋白的表达,针对加载对照并针对编码蛋白的内源性表达归一化。本实施例中使用的终止元件是C7、C10、C8或参考终止元件。
如图13中所示,在小鼠肝脏中,每个测试终止元件相对于参考终止元件与第2天和第8天蛋白质水平的体内增加相关。
实施例13:由具有不同终止元件的mRNA编码的报告蛋白的表达
本实施例描述了由具有编码绿色荧光蛋白和不同终止元件的序列的mRNA构建体编码的绿色荧光蛋白的表达。
用具有参考终止元件、C6终止元件、C4终止元件或C3终止元件的mRNA构建体转染Hep3B细胞(使用脂转染胺2000),并且通过Incucyte每小时监测荧光,最终表达值是在所有时间点的荧光的总和。表10显示了本实验的结果。所有值都相对于参考终止元件。
表10
绿色表达(Hep3B细胞)
参考 1.00
C6 1.02
C4 1.44
C3 1.58
荧光报告蛋白的表达随着测试的所有终止元件而增加,具有C4或C3终止元件的mRNA构建体的表达最高。
实施例14.稳定的尾和蛋白质变体表达
靶蛋白以全长和截短形式中的每一者表达并且在24和96小时进行体外表达筛选。通过接合修饰所选择的mRNA构建体以稳定聚(A)尾。使用0.5-1.5mg/mL mRNA(5'帽1,3'A100)、50mM Tris-HCl pH 7.5、10mM MgCl2、1mM TCEP、1000个单位/毫升的T4 RNA接合酶1、1mM ATP、20%w/v聚乙二醇8000和5:1摩尔比的修饰寡核苷酸与mRNA进行接合。修饰寡核苷酸具有5'-磷酸-AAAAAAAAAAAAAAAAAAAA-(反向脱氧胸苷(idT))序列(SEQ ID NO;128)(见下文)。混合接合反应物并在室温(约22℃)下孵育4小时。通过dT纯化、反相纯化、羟基磷灰石纯化、超滤至水中和无菌过滤纯化稳定的尾mRNA。如通过接合和未接合的mRNA的UPLC分离所评估,每个mRNA的接合效率>80%。所得稳定的含尾mRNA在3'末端含有以下结构,以聚A区起始:A100-UCUAGAAAAAAAAAAAAAAAAAAAA(SEQ ID NO:124)-反向脱氧胸苷。
修饰寡核苷酸以稳定尾(5'-磷酸-AAAAAAAAAAAAAAAAAAAA-(反向脱氧胸苷(SEQID NO:128)):
Figure BDA0004090383130003121
以0.1ug/mL的浓度转染编码mRNA构建体的靶蛋白中的每一者,并且在转染后24和96小时检查蛋白质表达并与对照转染产生的表达进行比较。
实施例15:LNP配制的编码免疫检查点蛋白并具有本文所公开的mRNA元件的mRNA的体内作用
本实施例描述了由本文所公开的具有5'UTR和/或稳定尾的mRNA构建体编码的免疫检查点蛋白的体内表达。
简单地说,向小鼠静脉内注射0.5mg/kg LNP配制的编码免疫检查点蛋白并具有图14A-14B中指定的mRNA元件的mRNA。对于本实验,编码免疫检查点蛋白的ORF是WT ORF或其变体(v1)。作为对照,使用具有参考5'UTR或无稳定尾的mRNA。在给药后24小时和72小时,处死小鼠并加工脾脏和肝脏以通过ELISA评价蛋白质水平。使用包含GG序列的帽。
图14A-14B描绘了本实验的结果。在给与LNP配制的具有单独的A1 5'UTR、单独的稳定尾或两者的mRNA的小鼠的脾脏(图14A)和肝脏(图14B)中观察到免疫检查点蛋白的表达增加。给与具有A1 5'UTR和稳定尾的mRNA的小鼠显示出蛋白质表达的进一步增加。在脾脏中,在两个时间点都观察到蛋白质表达增加。在肝脏中,这种作用在24小时时间点更为明显。
总之,这个数据显示A1 5'UTR使得免疫检查点蛋白的体内表达增加。这个数据还支持A1 5'UTR与稳定尾之间进一步增加蛋白质表达的协同作用。
实施例16:在树突状细胞中由具有各种mRNA元件的mRNA编码的免疫检查点蛋白的体内表达
本实施例描述了在来自施用本文所公开的LNP配制的编码免疫检查点蛋白并具有5'UTR和/或稳定尾的mRNA的小鼠的树突状细胞中免疫检查点蛋白的表达。
简单地说,向小鼠静脉内注射0.5mg/kg LNP配制的编码免疫检查点蛋白并具有图15中指定的mRNA元件的mRNA。对于本实验,编码免疫检查点蛋白的ORF是WT ORF或其变体。作为对照,使用具有参考5'UTR或无稳定尾的mRNA。在给药后24小时和72小时,处死小鼠并分离树突状细胞以用于流式细胞术分析。使用包含GG序列的帽。
如图15中所示,在给药后24小时和72小时在施用LNP配制的具有单独的A1 5'UTR、单独的稳定尾或两者的mRNA的小鼠中观察到免疫检查点蛋白的表达增加。来自给与具有A15'UTR和稳定尾的mRNA的小鼠的树突状细胞显示出蛋白质表达的进一步增加。
总之,这个数据显示A1 5'UTR使得鼠类树突状细胞中免疫检查点蛋白的表达与对照相比增加。这个数据还支持A1 5'UTR与稳定尾之间进一步增加蛋白质表达的协同作用。
实施例17.具有A1 5'UTR(连同包含序列GA的帽一起)和/或B13'UTR的mRNA的体内作用
本实施例描述了萤火虫荧光素酶发光和/或由具有A1 5'UTR(连同包含序列GA的帽一起)、包含B1的3'UTR(“B1 3'UTR”)或两者的mRNA编码的靶蛋白的体内评估。
对于本实验,向小鼠共同给与编码靶蛋白和萤火虫荧光素酶的mRNA。mRNA构建体具有A1 5'UTR(连同包含序列GA的帽一起)、B1 3'UTR或两者或参考UTR。在24小时,收集血清并通过ELISA分析靶蛋白水平。随后解剖肝脏和脾脏并分析发光。
本实验的结果示于图16A-16C中。施用具有A1 5'UTR(连同包含序列GA的帽一起)、B1 3'UTR或两者的mRNA的小鼠的脾脏和肝脏与对照相比显示出增加的发光。具有A1 5'UTR(连同包含序列GA的帽一起)和B1 3'UTR两者的mRNA构建体在脾脏(图16A)和肝脏(图16B)中产生最高的发光,这支持两个元件的累加效应。对于血清中的靶蛋白表达观察到类似作用(图16C)。
实施例18:在肺病模型中LNP配制的具有各种mRNA元件的mRNA的作用
本实施例描述了靶蛋白在人类支气管上皮细胞中的活性,所述靶蛋白由具有图17中所示的各种元件的mRNA编码。
简单地说,将LNP配制的编码靶蛋白并具有指定mRNA元件的mRNA给与人类CF支气管上皮细胞。本实验中使用两个不同的编码靶蛋白的ORF:v1和v2。在给药后十八小时,测量靶蛋白的活性。作为对照,用两种标准护理药物处理细胞:阳性对照1和阳性对照2。本实施例中使用包含GG序列的帽。
如图17中所示,具有包含B1的3'UTR(“B1 3'UTR”)和A1 5'UTR的mRNA构建体与对照相比使得靶蛋白功能增加。使用具有A15'UTR的mRNA构建体也观察到靶蛋白功能的增加。总之,这个数据证明A1 5'UTR和B1 3'UTR在增加靶蛋白表达方面的联合作用。
实施例19:具有不同终止元件的mRNA中终止密码子通读的作用
本实施例描述了终止密码子通读在具有不同终止元件的mRNA中的作用。mRNA构建体的设计示于图18A中。本实施例中使用的终止元件是C1(参考)、C5、C7、C9和C3。mRNA构建体具有红色荧光蛋白开放阅读框和绿色荧光蛋白开放阅读框,由3'UTR和编码T2A的序列隔开。将所有测试的终止元件并入红色荧光蛋白开放阅读框中。不具有并入红色荧光蛋白开放阅读框中的终止密码子的mRNA构建体用作对照。通过脂转染胺2000将mRNA构建体转染至HeLa细胞和HEK293中。通过实时Incucyte监测分别由红色和绿色荧光蛋白的表达产生的红色和绿色荧光信号。
如图18B中所示,对于所有测试的终止元件,红色荧光蛋白在Hela细胞中以可比较的水平表达,而如图18C-18D中所示,绿色荧光蛋白在Hela细胞中的表达显著很低。类似地,如图18E中所示,对于所有测试的终止元件,红色荧光蛋白在HEK293细胞中以可比较的水平表达,而如图18F-18G中所示,绿色荧光蛋白在HEK293细胞中的表达显著很低。HeLa和HEK293细胞中通读率的估计值分别示于图18H-18G中。在具有测试的终止元件的mRNA构建体中的任一者中在背景中检测到绿色荧光信号的缺乏指示没有终止密码子通读的证据。
实施例20:由具有不同终止元件的mRNA编码的靶蛋白的表达
本实施例描述了由具有不同终止元件的mRNA编码的靶蛋白的蛋白质表达增加。本实施例中使用的靶蛋白是人类促红细胞生成素(hEPO)。本实施例中使用的终止元件是C1(参考)、C5、C10、C7、C8和C9。将所有终止元件并入具有靶蛋白开放阅读框的mRNA中并转染至HeLa细胞和HEK293细胞中。在转染后24小时和48小时通过ELISA评估靶蛋白水平。
如图19A-19C中所示,在HeLa细胞中,每个测试终止元件与相对于参考终止元件可比较的体外蛋白质水平相关。类似地,如图19D-19F中所示,在HEK293细胞中,每个测试终止元件与相对于参考终止元件可比较的体外蛋白质水平相关。
实施例21:由具有不同终止元件的mRNA编码的靶蛋白的表达
本实施例描述了由具有不同终止元件的mRNA编码的靶蛋白的蛋白质表达增加。本实施例中使用的靶蛋白是萤火虫荧光素酶(ffLuc)。本实施例中使用的终止元件是C1(参考)、C5、C10、C7、C8和C9。将所有终止元件并入具有靶蛋白开放阅读框的mRNA中并转染至HeLa细胞和Hep3b细胞中。在转染后24小时和48小时通过荧光素酶测定评估靶蛋白水平。
如图20A中所示,在HeLa细胞中,每个测试终止元件与相对于参考终止元件可比较的体外蛋白质水平相关。类似地,如图20B中所示,在Hep3b细胞中,每个测试终止元件与相对于参考终止元件可比较的体外蛋白质水平相关。
实施例22:由具有不同终止元件的mRNA编码的靶蛋白的体内表达
本实施例描述了由本文所公开的具有终止元件的mRNA编码的靶标的蛋白质表达增加。
本实施例中使用的靶蛋白是萤火虫荧光素酶(ffLuc)和人类促红细胞生成素(hEPO)。简单地说,向小鼠静脉内给与0.5mg/kg LNP配制的带有测试的终止元件的mRNA。本实施例中使用的终止元件是C1(参考)、C5、C10、C7、C8和C9。将所有终止元件并入具有靶蛋白开放阅读框的mRNA中。在给药后24小时通过全身发光成像测量编码的ffLuc蛋白的表达。在给药后1天、3天和7天通过ELISA测量编码的hEPO蛋白的表达。
如图21A中所示,每个测试终止元件在24小时与相对于参考终止元件可比较或增加的体内ffLuc蛋白水平相关。如图21B-21E中所示,每个测试终止元件在1天、3天和7天与相对于参考终止元件可比较或增加的体内血清hEPO蛋白水平相关。
实施例23:由具有不同终止元件的mRNA编码的靶蛋白的体内表达
本实施例描述了由本文所公开的具有终止元件的mRNA编码的靶标的蛋白质表达增加。
本实施例中使用的靶蛋白是萤火虫荧光素酶(ffLuc)和人类促红细胞生成素(hEPO)。本实施例中使用的终止元件是C1(参考)、C10、C7、C8和C9。将所有终止元件并入具有靶蛋白开放阅读框的mRNA中。用于hEPO的3'UTR含有3x mIR-142结合位点。
简单地说,向小鼠静脉内给与0.25mg/kg LNP配制的带有图22A-22E中指示的测试终止元件的mRNA。在给药后1天、2天、3天、4天和5天通过全身发光成像并且在给药后5天通过离体(脾脏和肝脏)发光成像来测量编码的ffLuc蛋白的表达。在给药后4天通过ELISA测量编码的hEPO蛋白的表达。
如图22A-22B中所示,每个测试终止元件在给药后1天、2天、3天、4天和5天与相对于参考终止元件可比较或增加的体内ffLuc蛋白水平相关。如图22C-22D中所示,每个测试终止元件在给药后5天在肝脏和脾脏中与相对于参考终止元件可比较或增加的离体ffLuc蛋白水平相关。如图22E中所示,每个测试终止元件在4天与相对于参考终止元件可比较或增加的体内血清hEPO蛋白水平相关。
实施例24:由具有不同终止元件的mRNA编码的靶蛋白的表达
本实施例描述了由具有不同终止元件的mRNA编码的靶蛋白的蛋白质表达增加。本实施例中使用的靶蛋白是萤火虫荧光素酶(ffLuc)。本实施例中使用的终止元件是C1(参考)、C5、C10、C7、C8和C9。将所有终止元件并入具有靶蛋白开放阅读框的mRNA中。将LNP配制的mRNA转染至与3T3成纤维细胞一起共培养的肝细胞岛或单独的3T3成纤维细胞中。在转染后24小时、72小时和96小时通过荧光素酶测定评估靶蛋白水平。
如图23A-23D中所示,每个测试终止元件在体外肝细胞岛中与相对于参考终止元件可比较或增加的蛋白质水平相关。
实施例25:由具有不同终止元件的mRNA编码的靶蛋白的表达
本实施例描述了由具有不同终止元件的mRNA编码的靶蛋白的蛋白质表达增加。本实施例中使用的靶蛋白是人类促红细胞生成素(hEPO)。本实施例中使用的终止元件是C1(参考)、C5、C10、C7、C8和C9。将所有终止元件并入具有靶蛋白开放阅读框的mRNA中。将LNP配制的mRNA转染至与3T3成纤维细胞一起共培养的肝细胞岛或单独的3T3成纤维细胞中。在转染后24小时、72小时和96小时通过荧光素酶测定评估靶蛋白水平。
如图24A-24D中所示,每个测试终止元件在体外肝细胞岛中与相对于参考终止元件可比较或增加的蛋白质水平相关。
实施例26:由具有不同终止元件的mRNA编码的靶蛋白的表达
本实施例描述了由具有不同终止元件的mRNA编码的靶蛋白的蛋白质表达增加。本实施例中使用的靶蛋白是萤火虫荧光素酶(ffLuc)和人类促红细胞生成素(hEPO)。本实施例中使用的终止元件是C1(参考)、C5、C10、C7、C8和C9。将所有终止元件并入具有靶蛋白开放阅读框的mRNA中。将LNP配制的mRNA转染至与3T3成纤维细胞一起共培养的肝细胞岛或单独的3T3成纤维细胞中。在转染后24小时、48小时、72小时和96小时,通过荧光素酶测定测量编码的ffLuc的表达并且通过ELISA测量编码的EPO蛋白。
如图25A-25C中所示,在食蟹猴和人类HepatoPac中,每个测试终止元件与相对于参考终止元件增加的体外荧光素酶表达相关。如图25D-25E中所示,在食蟹猴和人类HepatoPac中,大多数测试终止元件与相对于参考终止元件增加的体外hEPO蛋白表达相关。特别地,C8终止元件与相较于参考终止元件更长的半衰期(ffLuc)和更高的表达(hEPO)相关。
实施例27:LNP配制的编码免疫检查点蛋白并具有不同mRNA元件的mRNA的体内作用
本实施例描述了由本文所公开的具有5'UTR、终止元件和任选的3'稳定区的mRNA构建体编码的免疫检查点蛋白的体内表达。
简单地说,向小鼠静脉内注射0.5mg/kg LNP配制的编码免疫检查点蛋白并具有图26A-27C中指定的mRNA元件的mRNA。本实施例中使用的5'UTR是A1。本实施例中使用的终止元件是C1。将终止元件并入具有靶蛋白开放阅读框的mRNA中。本实施例中使用的3'稳定区包括反向胸苷(idT)。测试了两种LNP制剂(各自包含由式IC涵盖的可电离氨基脂质、磷脂、胆固醇和PEG脂质)。在给药后6小时、24小时和72小时,处死小鼠,并且分离树突状细胞以用于流式细胞术分析并加工脾脏和肝脏以通过ELISA评价蛋白质水平。
如图26A-26B中所示,在给药后24小时和72小时在施用LNP配制的具有3'稳定区(idT)的mRNA的小鼠中观察到CD11c+MHCII+细胞(树突状细胞)当中免疫检查点蛋白的表达增加。在给药后6小时、24小时和72小时在给与LNP配制的具有3'稳定区(idT)的mRNA的小鼠的肝脏(图27A)、脾脏(图27B)和血浆(图27C)中观察到免疫检查点蛋白的表达增加。
实施例28:LNP配制的编码免疫检查点蛋白并具有不同mRNA元件的mRNA的体内作用
本实施例描述了由本文所公开的具有5'UTR、终止元件和最佳的3'稳定区的mRNA构建体编码的免疫检查点蛋白的体内表达。
简单地说,向小鼠静脉内注射0.5mg/kg LNP配制的编码免疫检查点蛋白并具有图28A-29D中指定的mRNA元件的mRNA。本实施例中使用的5'UTR是A11和A1。本实施例中使用的终止元件是C1(参考)、C4、C5和C7。将所有终止元件并入具有免疫检查点蛋白开放阅读框的mRNA中。本实施例中使用的3'稳定区包括反向胸苷(idT)。在给药后72小时和120小时,处死小鼠,并且分离树突状细胞以用于流式细胞术分析并加工脾脏和肝脏以通过ELISA评价蛋白质水平。
如图28A-28B中所示,C5和C7终止元件与给药后72小时和120小时小鼠中免疫检查点蛋白的表达增加相关。亦如图28A-28B中所示,在给药后72小时和120小时在施用LNP配制的具有稳定尾的mRNA的小鼠中观察到免疫检查点蛋白的表达增加。
在给药后72小时和120小时在给与LNP配制的具有C5或C7终止元件的mRNA的小鼠的肝脏(图29A-29B)和脾脏(图29C-29D)中观察到相对于参考终止元件可比较或增加的免疫检查点蛋白表达。在给药后72小时和120小时在给与LNP配制的具有3'稳定区(idT)的mRNA的小鼠的肝脏(图29A-29B)和脾脏(图29C-29D)中观察到免疫检查点蛋白的表达增加。
实施例29:由具有不同终止元件的mRNA编码的免疫检查点蛋白的表达
本实施例描述了由本文所公开的具有终止元件和任选的3'稳定区的mRNA编码的免疫检查点蛋白的蛋白质表达增加。
本实施例中使用的终止元件是C1(参考)、C5和C7。将所有终止元件并入具有免疫检查点蛋白开放阅读框的mRNA中。本实施例中使用的3'稳定区包括反向胸苷(idT)。将LNP配制的mRNA转染至与3T3成纤维细胞一起共培养的肝细胞岛或单独的3T3成纤维细胞中。在转染后24小时、48小时、72小时和96小时通过ELISA测量编码的免疫检查点蛋白的表达。
如图30A-30C中所示,在大鼠、食蟹猴和人类HepatoPac中,C5和C7终止元件与相对于参考终止元件增加的体外免疫检查点蛋白表达相关。亦如图30A-30C中所示,具有3'稳定区的mRNA显示出免疫检查点蛋白表达的进一步增加。
实施例30:由具有不同终止元件的mRNA编码的免疫检查点蛋白的表达
本实施例描述了人类外周血单核细胞(hPBMC)中由本文所公开的具有5'UTR、终止元件和任选的3'稳定区的mRNA编码的免疫检查点蛋白的表达。
用LNP配制的编码免疫检查点蛋白的mRNA转染来自四个供体的新鲜解冻的hPBMC。本实施例中使用的5'UTR是A11和A1。本实施例中使用的终止元件是C1(参考)、C5和C7。将所有终止元件并入具有免疫检查点蛋白开放阅读框的mRNA中。本实施例中使用的3'稳定区包括反向胸苷(idT)。在转染后24小时、48小时和72小时通过流式细胞术测量免疫检查点蛋白的表达。
如图31A-31C中所示,在HLA-DR+CD11c+细胞(树突状细胞)当中C5和C7终止元件与相对于参考终止元件增加的体外免疫检查点蛋白表达相关。亦如图30A-30C中所示,具有3'稳定区的mRNA显示出免疫检查点蛋白表达的进一步增加。
实施例31:LNP配制的编码靶蛋白并具有不同mRNA元件的mRNA的体内作用
本实施例描述了由本文所公开的具有5'UTR和终止元件的mRNA构建体编码的靶蛋白的体内表达。
本实施例中使用的靶蛋白是萤火虫荧光素酶(ffLuc)和人类促红细胞生成素(hEPO)。本实施例中使用的5'UTR是A11(参考)、A1和A3。实施例中使用的终止元件是C1(参考)和C8。将所有终止元件并入具有靶蛋白开放阅读框的mRNA中。简单地说,向小鼠静脉内注射0.25mg/kg LNP配制的编码靶蛋白并具有图32A-32F中指定的mRNA元件的mRNA。在给药后6小时、2天和4天通过全身发光成像并且在给药后4天通过离体(脾脏和肝脏)发光成像来测量编码的ffLuc蛋白的表达。在给药后6小时、2天和4天通过ELISA测量编码的hEPO蛋白的表达。
如图32A-32B中所示,测试的5'UTR/终止元件组合在给药后6小时、2天和4天与相对于参考5'UTR/终止元件组合可比较或增加的体内ffLuc蛋白水平相关。亦如图32C-32D中所示,测试的5'UTR/终止元件组合在给药后4天在肝脏和脾脏中与相对于参考5'UTR/终止元件组合可比较或增加的离体ffLuc蛋白水平相关。如图32E-32F中所示,测试的5'UTR/终止元件组合在给药后6小时、2天和4天与相对于参考5'UTR/终止元件组合可比较或增加的体内血清hEPO蛋白水平相关。
实施例32:由具有不同3'UTR的mRNA编码的靶蛋白的表达
本实施例描述了由本文所公开的具有3'UTR的mRNA编码的靶蛋白的蛋白质表达增加。
本实施例中使用的靶蛋白是两种绿色荧光蛋白。本实施例中使用的3'UTR是包含B10的3'UTR(“B10 3'UTR”;参考)和包含B18的3'UTR(“B18 3'UTR”)。将3'UTR并入编码靶蛋白的mRNA中并转染至HeLa细胞中。在60小时的时程中评估靶蛋白水平。
如图33A-33D中所示,在HeLa细胞中,B18 3'UTR与相对于参考3'UTR增加的体外蛋白质水平相关。
实施例33:由具有不同3'UTR的mRNA编码的靶蛋白的体内表达
本实施例描述了由本文所公开的具有3'UTR的mRNA编码的靶蛋白的蛋白质表达增加。
本实施例中使用的靶蛋白是萤火虫荧光素酶(ffLuc)和人类促红细胞生成素(hEPO)。本实施例中使用的3'UTR是包含B10的3'UTR(“B10 3'UTR”;参考)和包含B18的3'UTR(“B18 3'UTR”)。向小鼠静脉内注射0.25mg/kg LNP配制的具有图34A-34B中指定的3'UTR的mRNA。在给药后6小时、1天、2天和4天通过全身发光成像测量编码的ffLuc蛋白的表达。在给药后6小时、1天、2天和4天通过ELISA测量编码的hEPO蛋白的表达。
如图34A中所示,在给药后6小时、1天、2天和4天,B18 3'UTR与相对于参考3'UTR增加的体内ffLuc蛋白水平相关。类似地,如图34B中所示,在给药后6小时、1天、2天和4天,B183'UTR与相对于参考3'UTR增加的体内血清hEPO蛋白水平相关。
实施例34:由具有不同5'UTR的mRNA编码的靶蛋白的表达
本实施例描述了由具有不同5'UTR元件的mRNA编码的靶蛋白的蛋白质表达增加。
本实施例中使用的靶蛋白是萤火虫荧光素酶(ffLuc)。本实施例中使用的5'UTR是A12、A14、A15、A18、A20、A26、A27和A11(参考)。将5'UTR并入编码靶蛋白的mRNA中并转染至HEK293和HeLa细胞中。在施用后5小时、24小时、30小时、48小时、72小时、96小时和120小时通过荧光素酶测定评估靶蛋白水平。
如图35A-35B中所示,在HEK293和HeLa细胞中,至少A20、A26、A15和A18 5'UTR与相对于参考5'UTR增加的体外ffLuc蛋白水平相关。
实施例35:由具有不同5'UTR的mRNA编码的靶蛋白的体内表达
本实施例描述了由本文所公开的具有5'UTR的mRNA编码的靶蛋白的蛋白质表达增加。本实施例中使用的靶蛋白是萤火虫荧光素酶(ffLuc)。本实施例中使用的5'UTR是A12、A14、A20、A26、A27、A15和A11(参考)。
向小鼠静脉内注射0.5mg/kg LNP配制的具有图36A-36D中指定的5'UTR的mRNA。在给药后2天和4天通过全身发光成像测量编码的ffLuc蛋白的表达。
如图36A中所示,在给药后2天,几乎所有测试的5'UTR与相对于参考5'UTR增加的体内ffLuc蛋白水平相关。如图36B中所示,在给药后4天,所有测试的5'UTR与相对于参考5'UTR增加的体内ffLuc蛋白水平相关。第5天,收集肝脏和脾脏用于离体发光成像。图36C中的图描绘了与各种5'UTR相关的肝细胞中的表达相对于参考5'UTR增加。类似地,图36D中的图描绘了与各种5'UTR相关的脾细胞中的表达相对于参考5'UTR增加。
实施例36:LNP组合物的生产
A.纳米颗粒组合物的生产
为了研究用于将治疗剂和/或预防剂递送至细胞的安全有效的纳米颗粒组合物,制备和测试一系列制剂。特定地,优化了纳米颗粒组合物的脂质组分中的特定要素及其比率。
纳米颗粒可以通过混合工艺制成,诸如两种流体流的微流体和T形结混合,其中一者含有治疗剂和/或预防剂并且另一者具有脂质组分。
通过将根据式(I)、(IA)、(IB)、(IC)、(II)、(IIa)、(IIb)、(IIc)、(IId)、(IIe)、(IIf)、(IIg)、(III)、(IIIa1)、(IIIa2)、(IIIa3)、(IIIa4)、(IIIa5)、(IIIa6)、(IIIa7)或(IIIa8)的脂质或非阳离子辅助脂质(诸如DOPE或DSPC,可获自Avanti Polar Lipids,Alabaster,AL)、PEG脂质(诸如1,2-二肉豆蔻酰基-sn-甘油甲氧基聚乙二醇,也称为PEG-DMG,可获自Avanti Polar Lipids,Alabaster,AL)和植物固醇(任选地包括结构脂质,诸如胆固醇)在溶剂(例如,乙醇)中以约例如50mM的浓度组合来制备脂质组合物。溶液应在例如-20℃下冷藏储存。将脂质组合以得到所需的摩尔比(参见例如下表11)并且用水和乙醇稀释至例如介于约5.5mM与约25mM之间的最终脂质浓度。表11中的植物固醇*是指植物固醇或任选地是指植物固醇和结构脂质,诸如β-植物固醇和胆固醇的组合。
表11:LNP组合物的示例性制剂
Figure BDA0004090383130003251
/>
Figure BDA0004090383130003261
通过将脂质溶液与包含治疗剂和/或预防剂的溶液以介于约5:1与约50:1之间的脂质组分与治疗剂和/或预防剂wt:wt比率组合来制备包含治疗剂和/或预防剂和脂质组分的纳米颗粒组合物。使用基于NanoAssemblr微流体的系统以介于约10ml/min与约18ml/min之间的流速将脂质溶液快速注射至治疗剂和/或预防剂溶液中以产生水与乙醇比率介于约1:1与约4:1之间的悬浮液。
对于包含RNA的纳米颗粒组合物,将浓度为0.1mg/ml的RNA于去离子水中的溶液在缓冲液,例如pH介于3与4之间的50mM柠檬酸钠缓冲液中稀释以形成储备溶液。
可以通过透析加工纳米颗粒组合物以去除乙醇并实现缓冲液交换。使用具有10kDa截留分子量的Slide-A-Lyzer盒(Thermo Fisher Scientific Inc.,Rockford,IL)将制剂针对pH 7.4的磷酸盐缓冲盐水(PBS)透析两次,体积是初级产品的200倍。第一次透析在室温下进行3小时。然后将制剂在4℃下透析过夜。将所得纳米颗粒悬浮液通过0.2μm无菌过滤器(Sarstedt,Nümbrecht,Germany)过滤至玻璃小瓶中并用卷边封口密封。一般获得0.01mg/ml至0.10mg/ml的纳米颗粒组合物溶液。
上文所描述的方法诱导纳米沉淀和颗粒形成。包括但不限于T形结和直接注射的替代性工艺可以用于实现相同的纳米沉淀。
B.纳米颗粒组合物的表征
Zetasizer Nano ZS(Malvern Instruments Ltd,Malvern,Worcest ershire,UK)可以用于确定1×PBS(用以确定粒度)和15mM PBS(用以确定ζ电位)中纳米颗粒组合物的粒度、多分散指数(PDI)和ζ电位。
紫外-可见光谱可以用于确定纳米颗粒组合物中治疗剂和/或预防剂(例如,RNA)的浓度。将100μL在1×PBS中稀释的制剂添加至900μL的4:1(v/v)甲醇和氯仿的混合物中。混合后,在DU 800分光光度计(Beckman Coulter,Beckman Coulter,Inc.,Brea,CA)上记录溶液的吸收光谱,例如,在230nm与330nm之间。可以基于组合物中使用的治疗剂和/或预防剂的消光系数以及在例如260nm波长处的吸光度与在例如330nm波长处的基线值之间的差异来计算纳米颗粒组合物中治疗剂和/或预防剂的浓度。
对于包含RNA的纳米颗粒组合物,QUANT-ITTM
Figure BDA0004090383130003271
RNA测定(Invitrogen Corporation Carlsbad,CA)可以用于评价纳米颗粒组合物对RNA的囊封。将样品在TE缓冲溶液(10mM Tris-HCl,1mM EDTA,pH 7.5)中稀释至约5μg/mL的浓度。将50μL稀释的样品转移至聚苯乙烯96孔板中并且将50μL TE缓冲液或50μL 2%Triton X-100溶液添加至孔中。将板在37℃的温度下孵育15分钟。将/>
Figure BDA0004090383130003281
试剂在TE缓冲液中以1:100稀释,并且将100μL这种溶液添加至每个孔中。可以使用荧光板读取器(WallacVictor1420多标记计数器;Perkin Elmer,Waltham,MA)在例如约480nm的激发波长和例如约520nm的发射波长下测量荧光强度。从每个样品的荧光值中减去试剂空白的荧光值,并且通过将完整样品(未添加Triton X-100)的荧光强度除以破碎样品(因添加Triton X-100所致)的荧光值来确定游离RNA的百分比。
C.体内制剂研究
为了监测各种纳米颗粒组合物如何有效地将治疗剂和/或预防剂递送至靶向细胞,制备包含特定治疗剂和/或预防剂(例如,修饰或天然存在的RNA,如mRNA)的不同纳米颗粒组合物并且向啮齿动物种群施用。向小鼠静脉内、肌肉内、皮下、动脉内或瘤内施用单剂量,所述剂量包含具有脂质纳米颗粒制剂的纳米颗粒组合物。在一些情况下,可以使小鼠吸入剂量。剂量大小可以在0.001mg/kg至10mg/kg的范围内,其中10mg/kg描述了对于每1kg体重的小鼠,包含纳米颗粒组合物中的10mg治疗剂和/或预防剂的剂量。还可以采用包含PBS的对照组合物。
向小鼠施用纳米颗粒组合物之后,可以通过酶联免疫吸附测定(ELISA)、生物发光成像或其它方法测量特定制剂及其剂量的剂量递送型态、剂量反应和毒性。对于包含mRNA的纳米颗粒组合物,还可以评价蛋白质表达的时程。从啮齿动物收集的用于评价的样品可以包括血液、血清和组织(例如,来自肌肉内注射部位的肌肉组织和内部组织);样品收集可能涉及处死动物。
包含mRNA的纳米颗粒组合物可用于评价用于递送治疗剂和/或预防剂的各种制剂的功效和有用性。通过施用包含mRNA的组合物诱导的更高水平的蛋白质表达将指示更高的mRNA翻译和/或纳米颗粒组合物mRNA递送效率。由于并不认为非RNA组分会影响翻译机器本身,因此更高水平的蛋白质表达可能指示相对于其它纳米颗粒组合物或其不存在,由给定的纳米颗粒组合物对治疗剂和/或预防剂的递送效率更高。
实施例37:式(I)的示例性化合物的合成
8-溴辛酸3-丁基庚酯
步骤1:3-丁基庚-2-烯酸乙酯的合成
Figure BDA0004090383130003291
在20分钟内将膦酰基乙酸三乙酯(9.07mL,45.7mmol)逐滴添加至氢化钠(1.83g,45.7mmol)于THF(14mL)中的悬浮液中,并且在室温下搅拌混合物直至气体逸出停止(约30分钟)。将反应混合物冷却至0℃并且逐份添加5-壬酮(6.05mL,35.2mmol)。将反应物逐渐升温至室温并且在回流下搅拌24小时。将反应物冷却至室温,随后用饱和碳酸氢钠水溶液淬灭。用乙醚萃取水相,并且用盐水洗涤有机萃取物,干燥(MgSO4)并浓缩,得到残余物。通过硅胶色谱法(0-20%EtOAc:己烷)纯化残余物,得到呈油状之3-丁基庚-2-烯酸乙酯(5.27g,24.8mmol,71%)。1H NMR(300MHz,CDCl3)δ:ppm 5.62(s,1H);4.14(q,2H,J=6.0Hz);2.59(t,2H,J=6.0Hz);2.14(t,2H,J=6.0Hz);1.50-1.23(m,11H);0.99-0.82(m,6H)。
步骤2:3-丁基庚酸乙酯的合成
Figure BDA0004090383130003301
向配备有搅拌棒的钢制帕尔反应器(Parr reactor)中装入含3-丁基庚-2-烯酸乙酯(10.5g,49.5mmol)的乙醇(50mL)。添加碳载氢氧化钯(1.04g,7.42mmol)并且将容器密封、抽真空、再填充H2气体(3x),并且将压力设定为200psi。在200psi H2气体、室温下以500rpm搅拌反应物2小时。然后将容器抽真空,再填充N2气体,并且打开。将粗反应混合物通过硅藻土垫过滤。用EtOH洗涤硅藻土垫并且浓缩粗物质,得到呈油状的3-丁基庚酸乙酯(9.69g,45.2mmol,91%)。化合物未经进一步纯化即用于下一步骤。1H NMR(300MHz,CDCl3)δ:ppm 4.12(q,2H,J=9.0Hz);2.22(d,2H,J=6.0Hz);1.90-1.76(m,1H);1.38-1.19(m,15H);0.88(br.t,6H,J=6.0Hz)。
步骤3:3-丁基庚烷-1-醇的合成
Figure BDA0004090383130003302
在N2、0℃下向氢化铝锂(850mg,22.4mmol)于无水乙醚(23mL)中的混合物中逐滴添加含3-丁基庚酸乙酯(4.00g,18.7mmol)的无水乙醚(15mL)。在室温下搅拌混合物2.5小时,随后冷却至0℃。将水(1mL/g LiAlH4)逐滴添加至溶液中,继而缓慢添加15%氢氧化钠(1mL/g LiAlH4)和水(3mL/g LiAlH4)。在室温下搅拌溶液几分钟并且通过硅藻土垫过滤。用乙醚洗涤硅藻土垫并且浓缩滤液。通过硅胶色谱法(0-40%EtOAc:己烷)纯化粗物质,得到呈油状的3-丁基庚烷-1-醇(3.19g,18.5mmol,99%)。1H NMR(300MHz,CDCl3)δ:ppm 3.66(t,2H,J=6.0Hz);1.53(q,2H,J=6.0Hz);1.46-1.36(m,1H);1.35-1.21(m,12H);1.18(br.s,1H);0.89(br.t,6H,J=6.0Hz)。
步骤4:8-溴辛酸3-丁基庚酯的合成
Figure BDA0004090383130003311
在0℃下向3-丁基庚烷-1-醇(3.19g,18.5mmol)、8-溴辛酸(4.96g,22.2mmol)和DMAP(453mg,3.71mmol)于二氯甲烷(32mL)中的溶液中添加EDCI(5.33g,27.8mmol)并且在室温下搅拌反应混合物过夜。然后将反应混合物冷却至0℃并且在20分钟内缓慢添加10%盐酸溶液(150mL)。分离各层,并且在真空中浓缩有机层,得到粗油状物。将油状物溶解于己烷(150mL)中并且用乙腈(150mL)和5%碳酸氢钠(150mL)的混合物洗涤。分离己烷层,干燥(MgSO4)并过滤。在真空下去除溶剂,得到呈油状的8-溴辛酸3-丁基庚酯(6.90g,18.3mmol,99%)。化合物未经进一步纯化即用于下一步骤。1H NMR(300MHz,CDCl3)δ:ppm 4.08(t,2H,J=6.0Hz);3.40(t,2H,J=6.0Hz);2.29(t,2H,J=6.0Hz);1.85(五重峰,2H,J=6.0Hz);1.69-1.52(m,4H);1.49-1.20(m,19H);0.89(br.t,6H,J=6.0Hz)。
8-溴辛酸十七烷-9-基酯
8-溴辛酸十七烷-9-基酯的合成
Figure BDA0004090383130003321
/>
向十七烷-9-醇、8-溴辛酸和DMAP于二氯甲烷中的溶液中添加EDC,得到8-溴辛酸十七烷-9-基酯。
8-溴辛酸3-戊基辛酯
步骤1:3-戊基辛-2-烯酸乙酯的合成
Figure BDA0004090383130003322
在20分钟内将膦酰基乙酸三乙酯(10.6mL,53.4mmol)逐滴添加至氢化钠(2.13g,53.4mmol)于THF(16mL)中的悬浮液中,并且在室温下搅拌混合物直至气体逸出停止(约30分钟)。将反应混合物冷却至0℃并且逐份添加6-十一烷酮(8.42mL,41.1mmol)。将反应物逐渐升温至室温并且在回流下搅拌60小时。将反应物冷却至室温,随后用饱和碳酸氢钠水溶液淬灭。用乙醚萃取水相,并且用盐水洗涤有机萃取物,干燥(MgSO4)并浓缩。通过硅胶色谱法(0-20%EtOAc:己烷)纯化粗物质,得到呈油状的3-戊基辛-2-烯酸乙酯(8.76g,36.5mmol,89%)。1H NMR(300MHz,CDCl3)δ:ppm 5.61(s,1H);4.14(q,2H,J=6.0Hz);2.58(ddd,2H,J=9.0,9.0,6.0Hz);2.13(ddd,2H,J=6.0,6.0,3.0Hz);1.52-1.38(m,3H);1.38-1.23(m,12H);0.93-0.86(m,6H)。
步骤2:3-戊基辛酸乙酯的合成
Figure BDA0004090383130003331
向配备有搅拌棒的钢制帕尔反应器中装入含3-戊基辛-2-烯酸乙酯(8.76g,36.5mmol)的乙醇(37mL)。添加碳载氢氧化钯(768mg,5.47mmol)并且将容器密封、抽真空、再填充H2气体(3x),并且将压力设定为200psi。在200psi H2气体、室温下以500rpm搅拌反应物2小时。然后将容器抽真空,再填充N2气体,并且打开。将粗反应混合物通过硅藻土垫过滤。用EtOH洗涤硅藻土垫并且浓缩粗物质,得到呈油状的3-戊基辛酸乙酯(8.45g,34.9mmol,96%)。化合物未经进一步纯化即用于下一步骤。1H NMR(300MHz,CDCl3)δ:ppm4.12(q,2H,J=6.0Hz);2.22(d,2H,J=6.0Hz);1.92-1.77(br.m,1H);1.37-1.19(m,19H);0.88(t,6H,J=6.0Hz)。
步骤3:3-戊基辛烷-1-醇的合成
Figure BDA0004090383130003341
在N2、0℃下向氢化铝锂(1.59g,41.8mmol)于无水乙醚(42mL)中的混合物中逐滴添加含3-戊基辛酸乙酯(8.45g,34.9mmol)的无水乙醚(28mL)。在室温下搅拌混合物2.5小时,随后冷却至0℃。将水(1mL/g LiAlH4)逐滴添加至溶液中,继而缓慢添加15%氢氧化钠(1mL/g LiAlH4)和水(3mL/g LiAlH4)。在室温下搅拌溶液几分钟并且通过硅藻土垫过滤。用乙醚洗涤硅藻土垫并且浓缩滤液。通过硅胶色谱法(0-40%EtOAc:己烷)纯化粗物质,得到呈油状的3-戊基辛烷-1-醇(6.98g,34.9mmol,100%)。1H NMR(300MHz,CDCl3)δ:ppm 3.66(t,2H,J=6.0Hz);1.53(q,2H,J=6.0Hz);1.47-1.37(br.s,1H);1.36-1.15(m,17H);0.88(t,6H,J=6.0Hz)。
步骤4:8-溴辛酸3-戊基辛酯的合成
Figure BDA0004090383130003342
在0℃下向3-戊基辛烷-1-醇(2.00g,9.98mmol)、8-溴辛酸(2.67g,12.0mmol)和DMAP(244mg,2.00mmol)于二氯甲烷(18mL)中的溶液中添加EDCI(2.87g,15.0mmol)并且在室温下搅拌反应混合物过夜。然后将反应混合物冷却至0℃并且在20分钟内缓慢添加10%盐酸溶液(70mL)。分离各层,并且在真空中浓缩有机层,得到粗油状物。将油状物溶解于己烷(70mL)中并且用乙腈(70mL)和5%碳酸氢钠(70mL)的混合物洗涤。分离己烷层,干燥(MgSO4)并过滤。在真空下去除溶剂,得到呈油状的8-溴辛酸3-戊基辛酯(3.94g,9.72mmol,97%)。化合物未经进一步纯化即用于下一步骤。1H NMR(300MHz,CDCl3)δ:ppm 4.08(t,2H,J=6.0Hz);3.40(t,2H,J=6.0Hz);3.29(t,2H,J=6.0Hz);1.85(五重峰,2H,J=6.0Hz);1.68-1.52(m,4H);1.49-1.19(m,23H);0.88(t,6H,J=6.0Hz)。
8-((3-((叔丁氧基羰基)氨基)丙基)氨基)辛酸3-戊基辛酯
8-((3-((叔丁氧基羰基)氨基)丙基)氨基)辛酸3-戊基辛酯的合成
Figure BDA0004090383130003351
在20分钟的过程中向N-(3-氨基丙基)氨基甲酸叔丁酯(15.5g,88.8mmol)于EtOH(38mL)中的溶液中添加含8-溴辛酸3-戊基辛酯(6.00g,14.8mmol)的EtOH(36mL)。将反应物加热至60℃并且在此温度下搅拌16小时。冷却后,蒸发溶剂并且用乙酸乙酯稀释残余物,并且用饱和NaHCO3水溶液和盐水(5X)洗涤,直至在水层中观察不到白色沉淀物。分离有机层,用盐水洗涤,干燥(MgSO4),过滤并浓缩。通过快速色谱法(0-5-10-25-50-100%(1%NH4OH、20%MeOH于二氯甲烷中的混合物)/二氯甲烷)纯化残余物,得到呈油状的8-((3-((叔丁氧基羰基)氨基)丙基)氨基)辛酸3-戊基辛酯(4.23g,8.49mmol,57%)。1H NMR(300MHz,CDCl3)δ:ppm 5.17(br.s,1H);4.07(t,2H,J=6.0Hz);3.19(br.q,2H,J=6.0Hz);2.66(t,2H,J=6.0Hz);2.56(t,2H,J=6.0Hz);2.28(t,2H,J=6.0Hz);1.70-1.52(m,6H);1.51-1.39(m,3H);1.44(s,9H);1.36-1.19(m,22H);0.88(t,6H,J=6.0Hz)。
3-甲氧基-4-(甲基氨基)环丁-3-烯-1,2-二酮
3-甲氧基-4-(甲基氨基)环丁-3-烯-1,2-二酮的合成
Figure BDA0004090383130003361
向3,4-二甲氧基-3-环丁烯-1,2-二酮(1g,7mmol)于100mL乙醚中的溶液中添加2M甲胺于THF中的溶液(3.8mL,7.6mmol)并且几乎立即形成沉淀物。在室温下搅拌混合物24小时,然后过滤,用乙醚洗涤过滤的固体并风干。将过滤的固体溶解于热EtOAc中,过滤,使滤液冷却至室温,然后冷却至0℃,得到沉淀物。经由过滤分离此物,用冷EtOAc洗涤,风干,然后在真空下干燥,得到呈固体状的3-甲氧基-4-(甲基氨基)环丁-3-烯-1,2-二酮(0.70g,5mmol,73%)。1H NMR(300MHz,DMSO-d6)δ:ppm 8.50(br.d,1H,J=69Hz);4.27(s,3H);3.02(sdd,3H,J=42Hz,4.5Hz)。
8-((8-(十七烷-9-基氧基)-8-氧代辛基)(2-羟乙基)氨基)辛酸3-丁基庚酯
步骤1:8-((2-羟乙基)氨基)辛酸十七烷-9-基酯的合成
Figure BDA0004090383130003362
将8-溴辛酸十七烷-9-基酯(10g,21.67mmol)和乙醇胺(39.70g,649.96mmol)于EtOH(5mL)中的溶液加热至65℃持续16小时。将反应物冷却至室温并且溶解于乙酸乙酯中并用水(4X)萃取。分离有机层,用盐水洗涤,经Na2SO4干燥,过滤并且在真空下蒸发。通过快速色谱法(ISCO),用0-100%(20%MeOH、80%DCM、1%NH4OH的溶液)/DCM纯化残余物,得到8-((2-羟乙基)氨基)辛酸十七烷-9-基酯(7.85g,82%)。
UPLC/ELSD:RT=2.06分钟。C27H55NO3的MS(ES):m/z(MH+)442.689。1H NMR(300MHz,CDCl3)δ:ppm 4.89(p,1H);3.66(t,2H);2.79(t,2H);2.63(m,2H);2.30(t,2H);1.77-1.20(m,40H);0.90(m,6H)。
步骤2:化合物22:8-((8-(十七烷-9-基氧基)-8-氧代辛基)(2-羟乙基)氨基)辛酸3-丁基庚酯的合成
Figure BDA0004090383130003371
向8-溴辛酸3-丁基庚酯(6.15g,16.31mmol)和8-((2-羟乙基)氨基)辛酸十七烷-9-基酯(6.86g,15.53mmol)于CPME(15mL)和乙腈(6mL)的混合物中的溶液中添加碳酸钾(8.59g,62.12mmol)和碘化钾(2.84g,17.08mmol)。在77℃下搅拌反应物16小时。冷却反应物并过滤,并且在真空下蒸发挥发物。通过快速色谱法(ISCO),用0-100%(20%MeOH、80%DCM、1%NH4OH的溶液)/DCM纯化残余物,得到8-((8-(十七烷-9-基氧基)-8-氧代辛基)(2-羟乙基)氨基)辛酸3-丁基庚酯(4.53g,37.8%)。UPLC/ELSD:RT=3.04分钟。C46H91NO5的MS(ES):m/z(MH+)739.464。1H NMR(300MHz,CDCl3)δ:ppm 4.89(p,1H);4.11(m,2H),3.57(bm,2H);2.73-2.39(m,6H);2.30(m,4H);1.72-1.17(m,64H);0.92(m,12H)。
8-((8-(十七烷-9-基氧基)-8-氧代辛基)(3-((2-(甲基氨基)-3,4-二氧代环丁-1-烯-1-基)氨基)丙基)氨基)辛酸3-丁基庚酯
步骤1:8-((3-((叔丁氧羰基)氨基)丙基)氨基)辛酸十七烷-9-基酯的合成
Figure BDA0004090383130003381
将N-(3-氨基丙基)氨基甲酸叔丁酯(34.35g,197.15mmol)于EtOH(200mL)中的溶液加热至65℃,并且在3小时内添加8-溴辛酸十七烷-9-基酯(26g,56.33mmol)于EtOH(90mL)中的溶液。在65℃下加热反应物3小时。将反应物冷却至<50℃并且在真空下蒸发EtOH并与庚烷(4X)共沸。向粗产物于2-MeTHF(150mL)中的溶液中添加5%K2CO3(150mL)并且搅拌所得混合物10分钟。形成两层。去除水层并且用100mL水(x3)洗涤2-MeTHF层。分离有机层,用盐水洗涤,经Na2SO4干燥,过滤并且在真空下蒸发。通过快速色谱法(ISCO),用0-100%(20%MeOH、80%DCM、1%NH4OH的溶液)/DCM纯化残余物,得到8-((3-((叔丁氧基羰基)氨基)丙基)氨基)辛酸十七烷-9-基酯(20g,63.9%)。UPLC/ELSD:RT=2.34分钟。C33H66N2O4的MS(ES):m/z(MH+)555.319。1H NMR(300MHz,CDCl3)δ:ppm 5.18(bs,1H);4.89(p,1H);3.22(m,2H);2.64(t,2H);2.59(t,2H);2.30(t,2H);1.73-1.21(m,50H);0.90(m,6H)。
步骤2:8-((3-((叔丁氧基羰基)氨基)丙基)(8-(十七烷-9-基氧基)-8-氧代辛基)氨基)辛酸3-丁基庚酯的合成
Figure BDA0004090383130003382
向8-((3-((叔丁氧基羰基)氨基)丙基)氨基)辛酸十七烷-9-基酯(11.76g,21.19mmol)和8-溴辛酸3-丁基庚酯(9.2g,24.37mmol)于丙腈(52mL)中的溶液中添加碳酸钾(4.39g,31.79mmol)和碘化钾(0.53g,3.18mmol)。将反应物加热至80℃持续16小时。冷却反应物并过滤,并且在真空下蒸发挥发物。通过快速色谱法(ISCO),用0-100%(20%MeOH、80%DCM、1%NH4OH的溶液)/DCM纯化残余物,得到8-((3-((叔丁氧基羰基)氨基)丙基)(8-(十七烷-9-基氧基)-8-氧代辛基)氨基)辛酸3-丁基庚酯(9.68g,53.6%)。UPLC/ELSD:RT=3.07分钟。C52H102N2O6的MS(ES):m/z(MH+)851.216。1H NMR(300MHz,CDCl3)δ:ppm 5.68(bs,1H);4.90(p,1H);4.11(t,2H);3.20(m,2H);2.52-2.24(m,10H);1.76-1.20(m,74H);0.90(m,12H)。
步骤3:8-((3-氨基丙基)(8-(十七烷-9-基氧基)-8-氧代辛基)氨基)辛酸3-丁基庚酯的合成
Figure BDA0004090383130003391
向8-((3-((叔丁氧基羰基)氨基)丙基)(8-(十七烷-9-基氧基)-8-氧代辛基)氨基)辛酸3-丁基庚酯(7g,8.22mmol)于DCM(25mL)中的溶液中添加三氟乙酸(9.4mL,123.32mmol)。在室温下搅拌反应物2小时。在真空下蒸发反应物。将残余物溶解于甲基THF/庚烷(1:9)的混合物中并且用饱和碳酸氢钠(3X)萃取。分离有机层,用盐水洗涤,经Na2SO4干燥,过滤并且在真空下蒸发,获得8-((3-氨基丙基)(8-(十七烷-9-基氧基)-8-氧代辛基)氨基)辛酸3-丁基庚酯。此物未经进一步纯化即以粗物质形式用于下一步骤。UPLC/ELSD:RT=2.63分钟。C47H94N2O4的MS(ES):m/z(MH+)751.305。
步骤4:化合物27:8-((8-(十七烷-9-基氧基)-8-氧代辛基)(3-((2-(甲基氨基)-3,4-二氧代环丁-1-烯-1-基)氨基)丙基)氨基)辛酸3-丁基庚酯的合成
Figure BDA0004090383130003401
/>
向8-((3-氨基丙基)(8-(十七烷-9-基氧基)-8-氧代辛基)氨基)辛酸3-丁基庚酯(7g,9.32mmol)于甲基THF(31mL)中的溶液中添加3-甲氧基-4-(甲基氨基)环丁-3-烯-1,2-二酮(1.71g,12.11mmol)和10%碳酸氢钠水溶液(8.6mL,10.25mmol)。在50℃下搅拌反应物2.5小时。将反应物冷却至室温并且用庚烷稀释并用水萃取。分离有机层,用盐水洗涤,经Na2SO4干燥,过滤并且在真空下蒸发。通过快速色谱法(ISCO),用0-100%(20%MeOH、80%DCM、1%NH4OH的溶液)/DCM纯化残余物,得到8-((8-(十七烷-9-基氧基)-8-氧代辛基)(3-((2-(甲基氨基)-3,4-二氧代环丁-1-烯-1-基)氨基)丙基)氨基)辛酸3-丁基庚酯(5.4g,63%)。UPLC/ELSD:RT=2.98分钟。C52H97N3O6的MS(ES):m/z(MH+)861.714。1H NMR(300MHz,CDCl3)δ:ppm 4.89(p,1H);4.10(t,2H);3.75(m,2H);3.39-3.20(m,5H);3.08(m,4H);2.31(m,4H);2.12(bm,2H);1.81-1.20(m,65H);0.90(m,12H)。
8,8'-((3-((2-(甲基氨基)-3,4-二氧代环丁-1-烯-1-基)氨基)丙基)氮烷二基)二辛酸双(3-戊基辛基)酯
步骤1:8,8'-((3-((叔丁氧基羰基)氨基)丙基)氮烷二基)二辛酸双(3-戊基辛基)酯的合成
Figure BDA0004090383130003411
向8-溴辛酸3-戊基辛酯(5.61g,13.8mmol)和8-((3-((叔丁氧基羰基)氨基)丙基)氨基)辛酸3-戊基辛酯(6.00g,12.0mmol)于丙腈(30mL)中的溶液中添加碳酸钾(2.49g,18.0mmol)和碘钾(300mg,1.80mmol)。在80℃下搅拌反应物16小时。冷却至室温后,经由真空过滤过滤反应混合物。将容器中的残余物和漏斗上的滤饼用丙腈洗涤两次。然后在40℃下真空中浓缩滤液。通过硅胶色谱法(0-5-10-20-25-30-35-40-50-80-100%(1%NH4OH,20%MeOH,于二氯甲烷中)/二氯甲烷)纯化粗残余物,得到呈油状的8,8'-((3-((叔丁氧基羰基)氨基)丙基)氮烷二基)二辛酸双(3-戊基辛基)酯(7.37g,8.95mmol,74%)。1H NMR(300MHz,CDCl3)δ:ppm 5.66(br.s,1H);4.08(t,4H,J=6.0Hz);3.17(br.q,2H,J=6.0Hz);2.43(t,2H,J=6.0Hz);2.34(br.t,4H,J=6.0Hz);2.28(t,4H,J=9.0Hz);1.67-1.52(m,10H);1.48-1.37(m,14H);1.35-1.17(m,45H);0.88(t,12H,J=6.0Hz)。
步骤2:8,8'-((3-氨基丙基)氮烷二基)二辛酸双(3-戊基辛基)酯的合成
Figure BDA0004090383130003421
向配备有搅拌棒的圆底烧瓶中添加8,8'-((3-((叔丁氧基羰基)氨基)丙基)氮烷二基)二辛酸双(3-戊基辛基)酯(3.00g,3.64mmol)。将油状物溶解于环戊基甲基醚(8mL)中并且搅拌5分钟。逐滴添加含3M HCl的环戊基甲基醚(6.07mL,18.2mmol)。添加完成后,将反应物加热至40℃持续1小时并且通过TLC/LCMS分析监测反应完成。将反应物冷却至室温,然后冷却至0℃。然后将10%K2CO3溶液逐滴添加至反应混合物中。添加完成后,用EtOAc稀释水性/环戊基甲基醚乳液并且搅拌所得混合物10分钟。将溶液转移至分液漏斗并且分离各层。将有机层干燥(MgSO4),过滤并浓缩。将残余物再溶解于庚烷中并且用MeCN洗涤两次。将庚烷层干燥(MgSO4),过滤并浓缩,得到呈油状的粗物质8,8'-((3-氨基丙基)氮烷二基)二辛酸双(3-戊基辛基)酯(2.43g,3.36mmol,92%)。粗物质未经进一步纯化即用于下一步骤。1HNMR(300MHz,CDCl3)δ:ppm 4.08(t,4H,J=6.0Hz);2.98(t,2H,J=6.0Hz);2.71(t,2H,J=6.0Hz);2.54(br.t,4H,J=6.0Hz);2.28(t,6H,J=6.0Hz);1.76(宽五重峰,2H,J=2.0Hz);1.66-1.52(m,9H);1.52-1.43(m,4H);1.37-1.18(m,45H);0.88(t,12H,J=6.0Hz)。
步骤3:化合物30:8,8'-((3-((2-(甲基氨基)-3,4-二氧代环丁-1-烯-1-基)氨基)丙基)氮烷二基)二辛酸双(3-戊基辛基)酯的合成
Figure BDA0004090383130003431
向配备有搅拌棒的圆底烧瓶中添加8,8'-((3-氨基丙基)氮烷二基)二辛酸双(3-戊基辛基)酯(2.43g,3.36mmol)、3-甲氧基-4-(甲基氨基)环丁-3-烯-1,2-二酮(616mg,4.36mmol)和2-甲基THF(10mL)。添加10%K2CO3溶液(10mL),并且将所得两相混合物加热至45℃并剧烈搅拌3小时。通过TLC/LCMS分析监测反应完成。完成后,使混合物冷却至室温。用水稀释反应物,分离各层,并且将水层用庚烷萃取两次。合并有机物,用水(3x)、盐水和1:1乙腈/水混合物洗涤。然后将合并的有机物干燥(Na2SO4),过滤并浓缩。将粗残余物与DCM和MeOH共沸并浓缩3次,得到淡黄色粗蜡状油。通过硅胶色谱法(0-100%(1%NH4OH、20%MeOH于二氯甲烷中的混合物)/二氯甲烷)纯化粗残余物,得到呈固体状的8,8'-((3-((2-(甲基氨基)-3,4-二氧代环丁-1-烯-1-基)氨基)丙基)氮烷二基)二辛酸双(3-戊基辛基)酯(2.11g,2.54mmol,76%)。UPLC/ELSD:RT=2.79分钟。C50H93N3O6的MS(ES):m/z(MH+)832.34。1H NMR(300MHz,CDCl3)δ:ppm 7.83(br.s,1H);7.61(br.s,1H);4.03(t,4H,J=9.0Hz);3.64(br.s,2H);3.28(br.d,3H,J=6.0Hz);2.46(t,2H,J=9.0Hz);2.33(br.t,4H,J=6.0Hz);2.33(t,4H,J=9.0Hz);1.74(宽五重峰,2H,J=6.0Hz);1.62-1.47(m,8H);1.41-1.12(m,50H);0.83(t,12H,J=9.0Hz)。
8-((3-((2-(甲基氨基)-3,4-二氧代环丁-1-烯-1-基)氨基)丙基)(8-氧代-8-((3-戊基辛基)氧基)辛基)氨基)辛酸3-丁基庚酯
步骤1:8-((3-((叔丁氧基羰基)氨基)丙基)(8-氧代-8-((3-戊基辛基)氧基)辛基)氨基)辛酸3-丁基庚酯的合成
Figure BDA0004090383130003441
将8-溴辛酸3-丁基庚酯(794mg,2.11mmol)和8-((3-((叔丁氧基羰基)氨基)丙基)氨基)辛酸3-戊基辛酯(1.00g,2.01mmol)于环戊基甲基醚(9mL)和乙腈(9mL)中的溶液中添加碳酸钾(1.66g,12.0mmol)和碘钾(366mg,2.21mmol)。在80℃下搅拌反应物16小时。冷却后,在真空下蒸发挥发物。用二氯甲烷稀释残余物并且用水洗涤。分离有机层,用盐水洗涤,干燥(MgSO4),过滤并浓缩。通过硅胶色谱法(0-5-10-25-50-100%(1%NH4OH、20%MeOH于二氯甲烷中的混合物)/二氯甲烷)纯化粗残余物,得到呈油状的8-((3-((叔丁氧基羰基)氨基)丙基)(8-氧代-8-((3-戊基辛基)氧基)辛基)氨基)辛酸3-丁基庚酯(896mg,1.13mmol,56%)。UPLC/ELSD:RT=2.95分钟。C48H94N2O6的MS(ES):m/z(MH+)795.59。
步骤2:8-((3-氨基丙基)(8-氧代-8-((3-戊基辛基)氧基)辛基)氨基)辛酸3-丁基庚酯的合成
Figure BDA0004090383130003442
向8-((3-((叔丁氧基羰基)氨基)丙基)(8-氧代-8-((3-戊基辛基)氧基)辛基)氨基)辛酸3-丁基庚酯(896mg,1.13mmol)于二氯甲烷(23mL)中的溶液中添加三氟乙酸(1.72mL,22.5mmol)。在室温下搅拌反应物4小时。用饱和NaHCO3水溶液淬灭反应物并且用二氯甲烷萃取。分离有机层,用盐水洗涤,干燥(MgSO4),过滤并浓缩。通过硅胶色谱法(0-5-10-25-50-100%(1%NH4OH、20%MeOH于二氯甲烷中的混合物)/二氯甲烷)纯化粗物质,得到呈油状的8-((3-氨基丙基)(8-氧代-8-((3-戊基辛基)氧基)辛基)氨基)辛酸3-丁基庚酯(632mg,0.91mmol,81%)。UPLC/ELSD:RT=2.47分钟。C43H86N2O4的MS(ES):m/z(MH+)695.68。
步骤3:化合物54:8-((3-((2-(甲基氨基)-3,4-二氧代环丁-1-烯-1-基)氨基)丙基)(8-氧代-8-((3-戊基辛基)氧基)辛基)氨基)辛酸3-丁基庚酯的合成
Figure BDA0004090383130003451
向8-((3-氨基丙基)(8-氧代-8-((3-戊基辛基)氧基)辛基)氨基)辛酸3-丁基庚酯(632mg,0.91mmol)于乙醇(8mL)中的溶液中添加3-甲氧基-4-(甲基氨基)环丁-3-烯-1,2-二酮(192mg,1.36mmol)。在67℃下搅拌反应物20小时。20小时后,将反应物冷却至室温并且用乙醚稀释。用盐水洗涤有机物,干燥(MgSO4),过滤并浓缩。通过硅胶色谱法(0-5-10-25-50-100%(1%NH4OH、20%MeOH于二氯甲烷中的混合物)/二氯甲烷)纯化粗残余物,得到呈固体状的8-((3-((2-(甲基氨基)-3,4-二氧代环丁-1-烯-1-基)氨基)丙基)(8-氧代-8-((3-戊基辛基)氧基)辛基)氨基)辛酸3-丁基庚酯(240mg,0.30mmol,33%)。UPLC/ELSD:RT=2.67分钟。C48H89N3O6的MS(ES):m/z(MH+)804.22。1H NMR(300MHz,CDCl3)δ:ppm 7.38(br.s,1H);7.03(br.s,1H);4.07(t,4H,J=6.0Hz);3.65(br.s,2H,J=6.0Hz);3.27(d,3H,J=6.0Hz);2.52(br.t,2H,J=6.0Hz);2.40(br.t,4H,J=6.0Hz);2.28(t,4H,J=6.0Hz);1.75(宽五重峰,2H,J=6.0Hz);1.67-1.51(m,8H);1.47-1.17(m,46H);0.93-0.82(m,12H)。
其它实施方案
将了解,虽然本公开已经结合其详细描述进行了描述,但前述描述旨在说明而不是限制由所附权利要求书的范围限定的本公开的范围。其它方面、优点和改变在以下权利要求书的范围内。本文所描述的所有参考文献都以全文引用的方式并入。
<110> 莫德纳有限公司(MODERNATX, INC.)
<120> 包含具有延长的半衰期的mRNA治疗剂的LNP组合物
<130> M2180-7007WO
<140>
<141>
<150> 63/165,469
<151> 2021-03-24
<150> 63/165,094
<151> 2021-03-23
<150> 63/042,822
<151> 2020-06-23
<160> 130
<170> PatentIn version 3.5
<210> 1
<211> 75
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成寡核苷酸"
<400> 1
ggaaaucgca aaauuugcuc uucgcguuag auuucuuuua guuuucucgc aacuagcaag 60
cuuuuuguuc ucgcc 75
<210> 2
<211> 203
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成多核苷酸"
<400> 2
ggaaaucccc acaaccgccu cauauccagg cucaagaaua gagcucagug uuuuguuguu 60
uaaucauucc gacguguuuu gcgauauucg cgcaaagcag ccagucgcgc gcuugcuuuu 120
aaguagaguu guuuuuccac ccguuugcca ggcaucuuua auuuaacaua uuuuuauuuu 180
ucaggcuaac cuacgccgcc acc 203
<210> 3
<211> 76
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成寡核苷酸"
<400> 3
ggaaauaaga gagaaaagaa gaguaagaag aaauauaaga ucucccugag cuucagggag 60
ccccggcgcc gccacc 76
<210> 4
<211> 89
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成寡核苷酸"
<400> 4
ggaaaccccc cacccccgua agagagaaaa gaagaguaag aagaaauaua agaucucccu 60
gagcuucagg gagccccggc gccgccacc 89
<210> 5
<211> 59
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成寡核苷酸"
<400> 5
ggagaacuuc cgcuuccguu ggcgcaagcg cuuucauuuu uucugcuacc gugacuaag 59
<210> 6
<211> 46
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成寡核苷酸"
<400> 6
ggaaauaaga gagaaaagaa gaguaagaag aaauauaaga gccacc 46
<210> 7
<400> 7
000
<210> 8
<211> 56
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成寡核苷酸"
<400> 8
ggaaauaaga gagaaaagaa gaguaagaag aaauauaaga ccccggcgcc gccacc 56
<210> 9
<400> 9
000
<210> 10
<400> 10
000
<210> 11
<211> 110
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成多核苷酸"
<400> 11
gcuggagccu ccugagagac cugugugaac uauugagaag aucggaacag cuccuuacuc 60
ugaggaaguu gguacccccg uggucuuuga auaaagucug agugggcggc 110
<210> 12
<211> 110
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成多核苷酸"
<400> 12
gcuggagccu cacucuccuc uccaucccgu auccaggcug ugaauuuuuc aaggaauaua 60
aagaucggga uguacccccg uggucuuuga auaaagucug agugggcggc 110
<210> 13
<211> 110
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成多核苷酸"
<400> 13
gcuggagccu cuagugacgg caacagggcu ugguuuuucc uuguugugaa aucgacaucu 60
cugaagacag gguacccccg uggucuuuga auaaagucug agugggcggc 110
<210> 14
<211> 110
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成多核苷酸"
<400> 14
gcuggagccu ccuuccaucu agucacaaag acuccuucgu ccccaguugc cgucuaggau 60
ugggccuccc aguacccccg uggucuuuga auaaagucug agugggcggc 110
<210> 15
<211> 110
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成多核苷酸"
<400> 15
gcuggagccu cccauaacau gacauaucug gauuuugugc uuagaaccuu aaauuggaag 60
cauucuuaau uguacccccg uggucuuuga auaaagucug agugggcggc 110
<210> 16
<211> 110
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成多核苷酸"
<400> 16
gcuggagccu ccggaaaacu aaaauagaga uauuucaaga uuuuauaauu uucaaagacc 60
uuugaaauau uguacccccg uggucuuuga auaaagucug agugggcggc 110
<210> 17
<211> 110
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成多核苷酸"
<400> 17
gcuggagccu cuacacauug cuucuaguug gcagaaauaa uugauuaaaa gaccagaaac 60
ugugauaacu gguacccccg uggucuuuaa auaaagucua agugggcggc 110
<210> 18
<211> 110
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成多核苷酸"
<400> 18
gcuggagccu cgguggccau gcuucuugcc ccuugggccu ccccccagcc ccuccucccc 60
uuccugcacc cguacccccg uggucuuuga auaaagucug agugggcggc 110
<210> 19
<211> 110
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成多核苷酸"
<400> 19
gcuggagccu cgguggccua gcuucuugcc ccuugggccu ccccccagcc ccuccucccc 60
uuccugcacc cguacccccg uggucuuuga auaaagucug agugggcggc 110
<210> 20
<211> 132
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成多核苷酸"
<400> 20
gcuggagccu cgguggccau gcuucuugcc ccuugggccu ccccccagcc ccuccucccc 60
uuccugcacc cguacccccc aaacaccauu gucacacucc aguggucuuu gaauaaaguc 120
ugagugggcg gc 132
<210> 21
<211> 132
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成多核苷酸"
<400> 21
gcuggagccu cgguggccua gcuucuugcc ccuugggccu ccccccagcc ccuccucccc 60
uuccugcacc cguacccccc aaacaccauu gucacacucc aguggucuuu gaauaaaguc 120
ugagugggcg gc 132
<210> 22
<211> 133
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成多核苷酸"
<400> 22
gcuggagccu cgguggccua gcuucuugcc ccuugggccu ccccccagcc ccuccucccc 60
uuccugcacc cguacccccu ccauaaagua ggaaacacua caguggucuu ugaauaaagu 120
cugagugggc ggc 133
<210> 23
<211> 132
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成多核苷酸"
<400> 23
gcuggagccu cgguggccua gcuucuugcc ccuugggccu ccccccagcc ccuccucccc 60
uuccugcacc cguacccccc gcauuauuac ucacgguacg aguggucuuu gaauaaaguc 120
ugagugggcg gc 132
<210> 24
<211> 155
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成多核苷酸"
<400> 24
uccauaaagu aggaaacacu acagcuggag ccucgguggc caugcuucuu gccccuuggg 60
ccucccccca gccccuccuc cccuuccugc acccguaccc cccgcauuau uacucacggu 120
acgagugguc uuugaauaaa gucugagugg gcggc 155
<210> 25
<211> 179
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成多核苷酸"
<400> 25
uccauaaagu aggaaacacu acagcuggag ccucgguggc cuagcuucuu gccccuuggg 60
ccuccauaaa guaggaaaca cuacaucccc ccagccccuc cuccccuucc ugcacccgua 120
cccccuccau aaaguaggaa acacuacagu ggucuuugaa uaaagucuga gugggcggc 179
<210> 26
<211> 9
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成寡核苷酸"
<400> 26
ugauaauag 9
<210> 27
<211> 9
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成寡核苷酸"
<400> 27
uaauaguaa 9
<210> 28
<211> 9
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成寡核苷酸"
<400> 28
uaagucuaa 9
<210> 29
<211> 9
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成寡核苷酸"
<400> 29
uaaagcuaa 9
<210> 30
<211> 9
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成寡核苷酸"
<400> 30
uaagucucc 9
<210> 31
<211> 9
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成寡核苷酸"
<400> 31
uaaggcuaa 9
<210> 32
<211> 15
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成寡核苷酸"
<400> 32
uaagccccuc cgggg 15
<210> 33
<211> 15
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成寡核苷酸"
<400> 33
uaaagcuccc cgggg 15
<210> 34
<211> 9
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成寡核苷酸"
<400> 34
uaagccccu 9
<210> 35
<211> 9
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成寡核苷酸"
<400> 35
uaaagcucc 9
<210> 36
<211> 9
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成寡核苷酸"
<400> 36
uaggguuaa 9
<210> 37
<211> 18
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成寡核苷酸"
<400> 37
swsuaarymy yyysksss 18
<210> 38
<211> 22
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成寡核苷酸"
<400> 38
caaacaccau ugucacacuc ca 22
<210> 39
<211> 23
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成寡核苷酸"
<400> 39
uccauaaagu aggaaacacu aca 23
<210> 40
<211> 22
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成寡核苷酸"
<400> 40
cgcauuauua cucacgguac ga 22
<210> 41
<211> 81
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成寡核苷酸"
<400> 41
ggaaaucgca aaauuugcuc uucgcguuag auuucuuuua guuuucucgc aacuagcaag 60
cuuuuuguuc ucgccgccgc c 81
<210> 42
<211> 81
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成寡核苷酸"
<400> 42
ggaaaucgca aaauuuucuu uucgcguuag auuucuuuua guuuucuuuc aacuagcaag 60
cuuuuuguuc ucgccgccgc c 81
<210> 43
<211> 6
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成寡核苷酸"
<400> 43
gccrcc 6
<210> 44
<211> 5
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成寡核苷酸"
<400> 44
ucuag 5
<210> 45
<211> 60
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成寡核苷酸"
<400> 45
cugagagacc ugugugaacu auugagaaga ucggaacagc uccuuacucu gaggaaguug 60
<210> 46
<211> 83
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成寡核苷酸"
<220>
<221> misc_feature
<222> (14)..(18)
<223> /注释="此区域可涵盖0至5个核苷酸"
<220>
<221> misc_feature
<222> (19)..(19)
<223> /注释="可能存在或可能不存在"
<220>
<221> misc_feature
<222> (22)..(22)
<223> /注释="可能存在或可能不存在"
<220>
<221> misc_feature
<222> (23)..(27)
<223> /注释="此区域可涵盖0至5个核苷酸"
<220>
<221> misc_feature
<222> (81)..(83)
<223> /注释="可能存在或可能不存在"
<400> 46
ggaaaucgca aaauuuuugc ucuuuuucgc guuagauuuc uuuuaguuuu cuykcaacua 60
gcaagcuuuu uguucucgcc rcc 83
<210> 47
<211> 119
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成多核苷酸"
<400> 47
uaggguuaag cuggagccuc gguggccuag cuucuugccc cuugggccuc cccccagccc 60
cuccuccccu uccugcaccc guacccccgu ggucuuugaa uaaagucuga gugggcggc 119
<210> 48
<211> 119
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成多核苷酸"
<400> 48
uaaagcuccg cuggagccuc gguggccuag cuucuugccc cuugggccuc cccccagccc 60
cuccuccccu uccugcaccc guacccccgu ggucuuugaa uaaagucuga gugggcggc 119
<210> 49
<211> 119
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成多核苷酸"
<400> 49
uaagccccug cuggagccuc gguggccuag cuucuugccc cuugggccuc cccccagccc 60
cuccuccccu uccugcaccc guacccccgu ggucuuugaa uaaagucuga gugggcggc 119
<210> 50
<211> 119
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成多核苷酸"
<400> 50
uaagcacccg cuggagccuc gguggccuag cuucuugccc cuugggccuc cccccagccc 60
cuccuccccu uccugcaccc guacccccgu ggucuuugaa uaaagucuga gugggcggc 119
<210> 51
<211> 120
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成多核苷酸"
<400> 51
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 60
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 120
<210> 52
<211> 119
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成多核苷酸"
<400> 52
uaaggcuaag cuggagccuc gguggccuag cuucuugccc cuugggccuc cccccagccc 60
cuccuccccu uccugcaccc guacccccgu ggucuuugaa uaaagucuga gugggcggc 119
<210> 53
<211> 119
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成多核苷酸"
<400> 53
uaagucuccg cuggagccuc gguggccuag cuucuugccc cuugggccuc cccccagccc 60
cuccuccccu uccugcaccc guacccccgu ggucuuugaa uaaagucuga gugggcggc 119
<210> 54
<211> 119
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成多核苷酸"
<400> 54
uaaagcuaag cuggagccuc gguggccuag cuucuugccc cuugggccuc cccccagccc 60
cuccuccccu uccugcaccc guacccccgu ggucuuugaa uaaagucuga gugggcggc 119
<210> 55
<211> 119
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成多核苷酸"
<400> 55
uaagucuaag cuggagccuc gguggccuag cuucuugccc cuugggccuc cccccagccc 60
cuccuccccu uccugcaccc guacccccgu ggucuuugaa uaaagucuga gugggcggc 119
<210> 56
<211> 18
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成寡核苷酸"
<400> 56
smsugarsmm sssssyys 18
<210> 57
<211> 18
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成寡核苷酸"
<400> 57
swsuagrssr myymwsyy 18
<210> 58
<400> 58
000
<210> 59
<211> 185
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成多核苷酸"
<400> 59
uaaagcucca uaaaguagga aacacuacag cuggagccuc gguggccuag cuucuugccc 60
cuugggccuc cauaaaguag gaaacacuac auccccccag ccccuccucc ccuuccugca 120
cccguacccc cuccauaaag uaggaaacac uacagugguc uuugaauaaa gucugagugg 180
gcggc 185
<210> 60
<211> 188
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成多核苷酸"
<400> 60
uaagccccuc cgggguccau aaaguaggaa acacuacagc cucgguggcc uagcuucuug 60
ccccuugggc cuccauaaag uaggaaacac uacauccccc cagccccucc uccccuuccu 120
gcacccguac ccccuccaua aaguaggaaa cacuacagug gucuuugaau aaagucugag 180
ugggcggc 188
<210> 61
<211> 188
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成多核苷酸"
<400> 61
uaaagcuccc cgggguccau aaaguaggaa acacuacagc cucgguggcc uagcuucuug 60
ccccuugggc cuccauaaag uaggaaacac uacauccccc cagccccucc uccccuuccu 120
gcacccguac ccccuccaua aaguaggaaa cacuacagug gucuuugaau aaagucugag 180
ugggcggc 188
<210> 62
<211> 9
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成寡核苷酸"
<400> 62
uaagcaccc 9
<210> 63
<211> 79
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成寡核苷酸"
<400> 63
ggaaacuuua uuuaguguua cuuuauuuuc uguuuauuug uguuucuuca guggguuugu 60
ucuaauuucc uuggccgcc 79
<210> 64
<211> 79
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成寡核苷酸"
<400> 64
ggaaaaucug uauuagguug gcguguucuu uggucgguug uuaguauugu uguugauucg 60
uuuguggucg guugccgcc 79
<210> 65
<211> 79
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成寡核苷酸"
<400> 65
ggaaaauuau uaacaucuug guauucucga uaaccauucg uuggauuuua uuguauucgu 60
aguuuggguu ccugccgcc 79
<210> 66
<211> 79
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成寡核苷酸"
<400> 66
ggaaauuauu auuauuucua gcuacaauuu aucauuguau uauuuuagcu auucaucauu 60
auuuacuugg ugaucaaca 79
<210> 67
<211> 79
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成寡核苷酸"
<400> 67
ggaaauaggu uguuaaccaa guucaagccu aauaagcuug gauucuggug acuugcuuca 60
ccguuggcgg gcaccgauc 79
<210> 68
<211> 74
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成寡核苷酸"
<400> 68
ggaaaucgua gagagucgua cuuaguacau aucgacuauc gguggacacc aucaagauua 60
uaaaccaggc caga 74
<210> 69
<211> 79
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成寡核苷酸"
<400> 69
ggaaacccgc ccaagcgacc ccaacauauc agcaguugcc caaucccaac ucccaacaca 60
auccccaagc aacgccgcc 79
<210> 70
<211> 79
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成寡核苷酸"
<400> 70
ggaaagcgau ugaaggcguc uuuucaacua cucgauuaag guuggguauc gucgugggac 60
uuggaaauuu guuguuucc 79
<210> 71
<211> 79
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成寡核苷酸"
<400> 71
ggaaacuaau cgaaauaaaa gagccccgua cucuuuuauu ucuauuaggu uaggagccuu 60
agcauuugua ucuuaggua 79
<210> 72
<211> 79
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成寡核苷酸"
<400> 72
ggaaauguga uuuccagcaa cuucuuuuga auauauugaa uuccuaauuc aaagcgaaca 60
aaucuacaag ccauauacc 79
<210> 73
<211> 74
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成寡核苷酸"
<400> 73
ggaaaucgua gagagucgua cuuacguggu cgccauugca uagcgcgcga aagcaacagg 60
aacaagaacg cgcc 74
<210> 74
<211> 74
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成寡核苷酸"
<400> 74
ggaaaucgua gagagucgua cuuagaauaa acagagucgg gucgacuugu cucugauacu 60
acgacgucac aauc 74
<210> 75
<211> 79
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成寡核苷酸"
<400> 75
ggaaaauuug ccuucggagu ugcguauccu gaacugccca gccuccugau auacaacugu 60
uccgcuuauu cgggccgcc 79
<210> 76
<211> 79
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成寡核苷酸"
<400> 76
ggaaaucuga gcaggaaucc uuugugcauu gaagacuuua gauuccucuc ugcgguagac 60
gugcacuuau aaguauuug 79
<210> 77
<211> 79
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成寡核苷酸"
<400> 77
ggaaagcgau ugaaggcguc uuuucaacua cucgauuaag guuggguauc gucgugggac 60
uuggaaauuu guugccacc 79
<210> 78
<211> 79
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成寡核苷酸"
<400> 78
ggaaaauuuu agccuggaac guuagauaac uguccuguug ucuuuauaua cuuggucccc 60
aaguaguuug ucuuccaaa 79
<210> 79
<211> 110
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成多核苷酸"
<400> 79
gcuggagccu cucacacacc ucugccccuu gggccuccca cucccauggc ucugggcggu 60
ccagaaggag cguacccccg uggucuuuga auaaagucug agugggcggc 110
<210> 80
<211> 100
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成多核苷酸"
<400> 80
gcuggagccu ccaccgcguu auccguuccu cguaggcugg uccuggggaa cgggucggcg 60
gguacccccg uggucuuuga auaaagucug agugggcggc 100
<210> 81
<211> 248
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成多核苷酸"
<400> 81
gcuggagccu cugcccggca acggccaggu cugugccaag uguuugcuga cgcaaccccc 60
acuggcuggg gcuuggucau gggccaucag cgcgugcgug gaaccuuuuc ggcuccucug 120
ccgauccaua cugcggaacu ccuagccgcu uguuuugcuc gcagcagguc uggagcaaac 180
auuaucggga cugauaacuc uguuguccug uacccccgug gucuuugaau aaagucugag 240
ugggcggc 248
<210> 82
<211> 210
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成多核苷酸"
<400> 82
gcuggagccu cgguggccua gcuucuugcc ccuugggccu ccccccagcc ccuccucccc 60
uuccugcacc cguacccuuu uuuuuuuuuu uuuuuucuuc uuuucuuuuu uuucuuuuuu 120
uuuuuucuuu cuuuuuuucu uuuuuuuucu uuucuuuuuu cuuuuuuuuu uuuuuuuccg 180
uggucuuuga auaaagucug agugggcggc 210
<210> 83
<211> 210
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成多核苷酸"
<400> 83
gcuggagccu cgguggccua gcuucuugcc ccuugggccu ccccccagcc ccuccucccc 60
uuccugcacc cguacccuuu uuuuuuuuuu uuuuuuuuuu uuuuuuuuuu uuuuuuuuuu 120
uuuuuuuuuu uuuuuuuuuu uuuuuuuuuu uuuuuuuuuu uuuuuuuuuu uuuuuuuccg 180
uggucuuuga auaaagucug agugggcggc 210
<210> 84
<211> 176
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成多核苷酸"
<400> 84
auaaaguagg aaacacuaca gcuggagccu cgguggccua gcuucuugcc ccuugggccu 60
ccauaaagua ggaaacacua caucccccca gccccuccuc cccuuccugc acccguaccc 120
ccuccauaaa guaggaaaca cuacaguggu cuuugaauaa agucugagug ggcggc 176
<210> 85
<211> 130
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成多核苷酸"
<400> 85
ggagccucgg uggccuagcu ucuugccccu ugggccuccc cccagccccu ccuccccuuc 60
cugcacccgu acccccucca uaaaguagga aacacuacag uggucuuuga auaaagucug 120
agugggcggc 130
<210> 86
<211> 179
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成多核苷酸"
<400> 86
uccauaaagu aggaaacacu acagcuggag ccuccugaga gaccugugug aacuauugag 60
aagaucggaa cagcuccuua cucugaggaa guuguccaua aaguaggaaa cacuacagua 120
cccccuccau aaaguaggaa acacuacagu ggucuuugaa uaaagucuga gugggcggc 179
<210> 87
<211> 232
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成多核苷酸"
<400> 87
accucacuca cggccacauu gagugccagg cuccgggcug guuuauagua guguagagca 60
uugcagcacu uagacugggg ugcuguaguc uuuauuguag ucuuuccaca uaccugauaa 120
uucuuagaua auuucuuauu uuaauuccau aaaguaggaa acacuacaua aaucuccaua 180
aaguaggaaa cacuacauau ucuuccauaa aguaggaaac acuacauagg cu 232
<210> 88
<211> 104
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成多核苷酸"
<400> 88
ggaaauuuuu uuuugauauu auaagaguuu uuuuuugaua uuaagaaaau uuuuuuuuga 60
uauuagaaga guaagaagaa auauaagacc ccggcgccgc cacc 104
<210> 89
<211> 57
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成寡核苷酸"
<400> 89
ggaaauaaga gagaaaagaa gaguaagaag aaauauaaga gccaaaaaaa aaaaacc 57
<210> 90
<211> 76
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成寡核苷酸"
<400> 90
ggaaaucucc cugagcuuca gggaguaaga gagaaaagaa gaguaagaag aaauauaaga 60
ccccggcgcc gccacc 76
<210> 91
<211> 50
<212> RNA
<213> 人类β疱疹病毒5 (Human betaherpesvirus 5)
<400> 91
caccgcguua uccguuccuc guaggcuggu ccuggggaac gggucggcgg 50
<210> 92
<211> 100
<212> RNA
<213> 人类β疱疹病毒5 (Human betaherpesvirus 5)
<400> 92
ccacccccag cgccaccacc gcugccgucg ccaccgcguu auccguuccu cguaggcugg 60
uccuggggaa cgggucggcg gccggucggc uucuguuuua 100
<210> 93
<211> 9
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成寡核苷酸"
<400> 93
ugauaguaa 9
<210> 94
<211> 94
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成寡核苷酸"
<400> 94
gccuccaccg cguuauccgu uccucguagg cugguccugg ggaacggguc ggcggguacc 60
cccguggucu uugaauaaag ucugaguggg cggc 94
<210> 95
<211> 254
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成多核苷酸"
<400> 95
caccgcguua uccguuccuc guaggcuggu ccuggggaac gggucggcgg gccucggugg 60
ccuagcuucu ugccccuugg gcccaccgcg uuauccguuc cucguaggcu gguccugggg 120
aacgggucgg cggucccccc agccccuccu ccccuuccug cacccguacc ccccaccgcg 180
uuauccguuc cucguaggcu gguccugggg aacgggucgg cggguggucu uugaauaaag 240
ucugaguggg cggc 254
<210> 96
<211> 9
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成寡核苷酸"
<400> 96
uaaagcgcu 9
<210> 97
<211> 119
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成多核苷酸"
<400> 97
uaauaguaag cuggagccuc cugagagacc ugugugaacu auugagaaga ucggaacagc 60
uccuuacucu gaggaaguug guacccccgu ggucuuugaa uaaagucuga gugggcggc 119
<210> 98
<211> 119
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成多核苷酸"
<400> 98
uaauaguaag cuggagccuc acucuccucu ccaucccgua uccaggcugu gaauuuuuca 60
aggaauauaa agaucgggau guacccccgu ggucuuugaa uaaagucuga gugggcggc 119
<210> 99
<211> 119
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成多核苷酸"
<400> 99
ugauaguaag cuggagccuc uagugacggc aacagggcuu gguuuuuccu uguugugaaa 60
ucgacaucuc ugaagacagg guacccccgu ggucuuugaa uaaagucuga gugggcggc 119
<210> 100
<211> 119
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成多核苷酸"
<400> 100
ugauaguaag cuggagccuc cuuccaucua gucacaaaga cuccuucguc cccaguugcc 60
gucuaggauu gggccuccca guacccccgu ggucuuugaa uaaagucuga gugggcggc 119
<210> 101
<211> 119
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成多核苷酸"
<400> 101
ugauaguaag cuggagccuc ccauaacaug acauaucugg auuuugugcu uagaaccuua 60
aauuggaagc auucuuaauu guacccccgu ggucuuugaa uaaagucuga gugggcggc 119
<210> 102
<211> 119
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成多核苷酸"
<400> 102
uaauaguaag cuggagccuc cggaaaacua aaauagagau auuucaagau uuuauaauuu 60
ucaaagaccu uugaaauauu guacccccgu ggucuuugaa uaaagucuga gugggcggc 119
<210> 103
<211> 119
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成多核苷酸"
<400> 103
uaauaguaag cuggagccuc uacacauugc uucuaguugg cagaaauaau ugauuaaaag 60
accagaaacu gugauaacug guacccccgu ggucuuuaaa uaaagucuaa gugggcggc 119
<210> 104
<211> 119
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成多核苷酸"
<400> 104
ugauaauagg cuggagccuc gguggccaug cuucuugccc cuugggccuc cccccagccc 60
cuccuccccu uccugcaccc guacccccgu ggucuuugaa uaaagucuga gugggcggc 119
<210> 105
<211> 119
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成多核苷酸"
<400> 105
ugauaauagg cuggagccuc gguggccuag cuucuugccc cuugggccuc cccccagccc 60
cuccuccccu uccugcaccc guacccccgu ggucuuugaa uaaagucuga gugggcggc 119
<210> 106
<211> 141
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成多核苷酸"
<400> 106
ugauaauagg cuggagccuc gguggccaug cuucuugccc cuugggccuc cccccagccc 60
cuccuccccu uccugcaccc guacccccca aacaccauug ucacacucca guggucuuug 120
aauaaagucu gagugggcgg c 141
<210> 107
<211> 141
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成多核苷酸"
<400> 107
ugauaauagg cuggagccuc gguggccuag cuucuugccc cuugggccuc cccccagccc 60
cuccuccccu uccugcaccc guacccccca aacaccauug ucacacucca guggucuuug 120
aauaaagucu gagugggcgg c 141
<210> 108
<211> 142
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成多核苷酸"
<400> 108
ugauaauagg cuggagccuc gguggccuag cuucuugccc cuugggccuc cccccagccc 60
cuccuccccu uccugcaccc guacccccuc cauaaaguag gaaacacuac aguggucuuu 120
gaauaaaguc ugagugggcg gc 142
<210> 109
<211> 141
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成多核苷酸"
<400> 109
ugauaauagg cuggagccuc gguggccuag cuucuugccc cuugggccuc cccccagccc 60
cuccuccccu uccugcaccc guaccccccg cauuauuacu cacgguacga guggucuuug 120
aauaaagucu gagugggcgg c 141
<210> 110
<211> 164
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成多核苷酸"
<400> 110
ugauaauagu ccauaaagua ggaaacacua cagcuggagc cucgguggcc augcuucuug 60
ccccuugggc cuccccccag ccccuccucc ccuuccugca cccguacccc ccgcauuauu 120
acucacggua cgaguggucu uugaauaaag ucugaguggg cggc 164
<210> 111
<211> 188
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成多核苷酸"
<400> 111
ugauaauagu ccauaaagua ggaaacacua cagcuggagc cucgguggcc uagcuucuug 60
ccccuugggc cuccauaaag uaggaaacac uacauccccc cagccccucc uccccuuccu 120
gcacccguac ccccuccaua aaguaggaaa cacuacagug gucuuugaau aaagucugag 180
ugggcggc 188
<210> 112
<211> 119
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成多核苷酸"
<400> 112
ugauaauagg cuggagccuc ucacacaccu cugccccuug ggccucccac ucccauggcu 60
cugggcgguc cagaaggagc guacccccgu ggucuuugaa uaaagucuga gugggcggc 119
<210> 113
<211> 109
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成多核苷酸"
<400> 113
ugauaauagg cuggagccuc caccgcguua uccguuccuc guaggcuggu ccuggggaac 60
gggucggcgg guacccccgu ggucuuugaa uaaagucuga gugggcggc 109
<210> 114
<211> 257
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成多核苷酸"
<400> 114
ugauaauagg cuggagccuc ugcccggcaa cggccagguc ugugccaagu guuugcugac 60
gcaaccccca cuggcugggg cuuggucaug ggccaucagc gcgugcgugg aaccuuuucg 120
gcuccucugc cgauccauac ugcggaacuc cuagccgcuu guuuugcucg cagcaggucu 180
ggagcaaaca uuaucgggac ugauaacucu guuguccugu acccccgugg ucuuugaaua 240
aagucugagu gggcggc 257
<210> 115
<211> 219
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成多核苷酸"
<400> 115
ugauaauagg cuggagccuc gguggccuag cuucuugccc cuugggccuc cccccagccc 60
cuccuccccu uccugcaccc guacccuuuu uuuuuuuuuu uuuuucuucu uuucuuuuuu 120
uucuuuuuuu uuuuucuuuc uuuuuuucuu uuuuuuucuu uucuuuuuuc uuuuuuuuuu 180
uuuuuuccgu ggucuuugaa uaaagucuga gugggcggc 219
<210> 116
<211> 219
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成多核苷酸"
<400> 116
ugauaauagg cuggagccuc gguggccuag cuucuugccc cuugggccuc cccccagccc 60
cuccuccccu uccugcaccc guacccuuuu uuuuuuuuuu uuuuuuuuuu uuuuuuuuuu 120
uuuuuuuuuu uuuuuuuuuu uuuuuuuuuu uuuuuuuuuu uuuuuuuuuu uuuuuuuuuu 180
uuuuuuccgu ggucuuugaa uaaagucuga gugggcggc 219
<210> 117
<211> 185
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成多核苷酸"
<400> 117
uaagucucca uaaaguagga aacacuacag cuggagccuc gguggccuag cuucuugccc 60
cuugggccuc cauaaaguag gaaacacuac auccccccag ccccuccucc ccuuccugca 120
cccguacccc cuccauaaag uaggaaacac uacagugguc uuugaauaaa gucugagugg 180
gcggc 185
<210> 118
<211> 139
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成多核苷酸"
<400> 118
uaaagcgcug gagccucggu ggccuagcuu cuugccccuu gggccucccc ccagccccuc 60
cuccccuucc ugcacccgua cccccuccau aaaguaggaa acacuacagu ggucuuugaa 120
uaaagucuga gugggcggc 139
<210> 119
<211> 194
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成多核苷酸"
<400> 119
uaaagcuccc cgggguccau aaaguaggaa acacuacagc uggagccucc ugagagaccu 60
gugugaacua uugagaagau cggaacagcu ccuuacucug aggaaguugu ccauaaagua 120
ggaaacacua caguaccccc uccauaaagu aggaaacacu acaguggucu uugaauaaag 180
ucugaguggg cggc 194
<210> 120
<211> 241
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成多核苷酸"
<400> 120
uaauaguaaa ccucacucac ggccacauug agugccaggc uccgggcugg uuuauaguag 60
uguagagcau ugcagcacuu agacuggggu gcuguagucu uuauuguagu cuuuccacau 120
accugauaau ucuuagauaa uuucuuauuu uaauuccaua aaguaggaaa cacuacauaa 180
aucuccauaa aguaggaaac acuacauauu cuuccauaaa guaggaaaca cuacauaggc 240
u 241
<210> 121
<211> 100
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成多核苷酸"
<400> 121
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 60
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 100
<210> 122
<211> 119
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成多核苷酸"
<400> 122
uaagccccuc cgggggccuc gguggccuag cuucuugccc cuugggccuc cccccagccc 60
cuccuccccu uccugcaccc guacccccgu ggucuuugaa uaaagucuga gugggcggc 119
<210> 123
<211> 150
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成多核苷酸"
<220>
<221> misc_feature
<222> (1)..(150)
<223> /注释="此序列可涵盖80-150个核苷酸"
<400> 123
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 60
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 120
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 150
<210> 124
<211> 126
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成寡核苷酸"
<220>
<221> 来源
<223> /注释="组合的DNA/RNA分子的描述:合成寡核苷酸"
<220>
<221> 经修饰的_碱基
<222> (126)..(126)
<223> 反向脱氧胸苷
<400> 124
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 60
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa ucuagaaaaa aaaaaaaaaa 120
aaaaat 126
<210> 125
<211> 9
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成寡核苷酸"
<400> 125
ccrccaugg 9
<210> 126
<211> 109
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成多核苷酸"
<400> 126
uaaagcuccc cgggggccuc caccgcguua uccguuccuc guaggcuggu ccuggggaac 60
gggucggcgg guacccccgu ggucuuugaa uaaagucuga gugggcggc 109
<210> 127
<211> 269
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成多核苷酸"
<400> 127
uaaagcuccc cggggcaccg cguuauccgu uccucguagg cugguccugg ggaacggguc 60
ggcgggccuc gguggccuag cuucuugccc cuugggccca ccgcguuauc cguuccucgu 120
aggcuggucc uggggaacgg gucggcgguc cccccagccc cuccuccccu uccugcaccc 180
guacccccca ccgcguuauc cguuccucgu aggcuggucc uggggaacgg gucggcgggu 240
ggucuuugaa uaaagucuga gugggcggc 269
<210> 128
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成寡核苷酸"
<220>
<221> 经修饰的_碱基
<222> (21)..(21)
<223> 反向脱氧胸苷
<400> 128
aaaaaaaaaa aaaaaaaaaa t 21
<210> 129
<211> 31
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成寡核苷酸"
<400> 129
cgagguggac uaagccccuc cggggccacc g 31
<210> 130
<211> 4
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<221> 来源
<223> /注释="人工序列的描述:合成肽"
<400> 130
Lys Asp Glu Leu
1

Claims (127)

1.一种编码多肽的多核苷酸(例如,mRNA),其中所述多核苷酸包含:
(a)5'-UTR,所述5'-UTR包含SEQ ID NO:1的序列或其变体或片段;
(b)编码区,所述编码区包含终止元件(例如,如本文所描述);以及
(c)3'-UTR(例如,如本文所描述)。
2.如权利要求1所述的多核苷酸,其中所述5'UTR包含式A的核酸序列:
G G A A A U C G C A A A A(N2)X(N3)X C U(N4)X(N5)X C G C GU U A G A U U U C UU U U A G U U U U C U N6 N7 C A A C U A GC A A G C U U U U U G U U C U C G C C(N8 C C)x(SEQ ID NO:46),
其中:
(N2)x是尿嘧啶并且x是0至5的整数,例如,其中x=3或4;
(N3)x是鸟嘌呤并且x是0至1的整数;
(N4)x是胞嘧啶并且x是0至1的整数;
(N5)x是尿嘧啶并且x是0至5的整数,例如,其中x=2或3;
N6是尿嘧啶或胞嘧啶;
N7是尿嘧啶或鸟嘌呤;和/或
N8是腺嘌呤或鸟嘌呤并且x是0至1的整数。
3.如权利要求1所述的多核苷酸,其中SEQ ID NO:1的所述变体包含与SEQ ID NO:1或其片段(例如,缺少SEQ ID NO:1的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少50%、60%、70%、80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
4.如权利要求1或3所述的多核苷酸,其中SEQ ID NO:1的所述变体包含至少5%、10%、20%、30%、40%、50%、60%、70%或80%的尿苷含量。
5.如权利要求1或3-4中任一项所述的多核苷酸,其中SEQ ID NO:1的所述变体包含至少2、3、4、5、6、7、8、9、10、11或12个连续尿苷(例如,聚尿苷序列段)。
6.如权利要求5所述的多核苷酸,其中SEQ ID NO:1的所述变体中的所述聚尿苷序列段包含至少2-12、2-11、2-10、2-9、2-8、2-7、2-6、2-5、2-4、2-3、3-12、4-12、5-12、6-12、7-12、8-12、9-12、10-12、11-12、2-6或3-5个连续尿苷。
7.如权利要求1或3-6中任一项所述的多核苷酸,其中SEQ ID NO:1的所述变体中的所述聚尿苷序列段包含4个连续尿苷。
8.如权利要求1或3-7中任一项所述的多核苷酸,其中SEQ ID NO:1的所述变体中的所述聚尿苷序列段包含5个连续尿苷。
9.如权利要求1或3-8中任一项所述的多核苷酸,其中SEQ ID NO:1的所述变体包含1、2、3、4、5、6、7、8、9、10、11、12、13、14或15个聚尿苷序列段。
10.如权利要求9所述的多核苷酸,其中SEQ ID NO:1的所述变体包含3个聚尿苷序列段。
11.如权利要求9所述的多核苷酸,其中SEQ ID NO:1的所述变体包含4个聚尿苷序列段。
12.如权利要求9所述的多核苷酸,其中SEQ ID NO:1的所述变体包含5个聚尿苷序列段。
13.如权利要求1或3-12中任一项所述的多核苷酸,其中所述聚尿苷序列段中的一者或多者与不同聚尿苷序列段相邻。
14.如权利要求1或3-13中任一项所述的多核苷酸,其中所述聚尿苷序列段中的每一者,例如全部彼此相邻,例如,所述聚尿苷序列段全部是相连的。
15.如权利要求1或3-14中任一项所述的多核苷酸,其中所述聚尿苷序列段中的一者或多者由1、2、3、4、5、6、7、8、9、10、11、2、13、14、15、16、17、18、19、20、30、40、50或60个核苷酸隔开。
16.如权利要求1或3-15中任一项所述的多核苷酸,其中所述聚尿苷序列段中的每一者,例如全部由1、2、3、4、5、6、7、8、9、10、11、2、13、14、15、16、17、18、19、20、30、40、50或60个核苷酸隔开。
17.如权利要求1或3-16中任一项所述的多核苷酸,其中第一聚尿苷序列段和第二聚尿苷序列段彼此相邻。
18.如前述权利要求中任一项所述的多核苷酸,其中所述5'UTR包含Kozak序列,例如,GCCRCC核苷酸序列(SEQ ID NO:43),其中R是腺嘌呤或鸟嘌呤。
19.如前述权利要求中任一项所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:1的序列,或与SEQ ID NO:1具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
20.如前述权利要求中任一项所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:41的序列,或与SEQ ID NO:41或其片段(例如,缺少SEQ ID NO:41的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
21.如前述权利要求中任一项所述的多核苷酸,其中所述5'UTR包含SEQ ID NO:42的序列,或与SEQ ID NO:42或其片段(例如,缺少SEQ ID NO:42的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
22.如前述权利要求中任一项所述的多核苷酸,其中所述5'UTR使得所述多核苷酸的半衰期增加,例如,所述多核苷酸的半衰期增加约1.5-20倍。
23.如权利要求22所述的多核苷酸,其中将所述多核苷酸的半衰期的所述增加与不具有5'UTR、具有不同5'UTR或不具有权利要求1-21中任一项所述的5'UTR的在其它方面类似的多核苷酸进行比较。
24.如权利要求22-23中任一项所述的多核苷酸,其中根据测量多核苷酸的半衰期的测定,例如本文所公开的实施例中的任一者中所描述的测定来测量所述多核苷酸的半衰期的所述增加。
25.如前述权利要求中任一项所述的多核苷酸,其中所述5'UTR使得由所述多核苷酸编码的所述多肽的水平和/或活性,例如输出增加。
26.如权利要求25所述的多核苷酸,其中所述5'UTR使得由所述多核苷酸编码的所述多肽的水平和/或活性,例如输出增加约1.5-20倍。
27.如权利要求26所述的多核苷酸,其中将活性的所述增加与不具有5'UTR、具有不同5'UTR或不具有权利要求1所述的5'UTR的在其它方面类似的多核苷酸进行比较。
28.如前述权利要求中任一项所述的多核苷酸,其中(b)的所述编码区包含选自表3中所提供的终止元件的终止元件,例如,SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ IDNO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32、SEQ ID NO:33、SEQ ID NO:34、SEQ IDNO:35、SEQ ID NO:36、SEQ ID NO:37、SEQ ID NO:56、SEQ ID NO:57、SEQ ID NO:62、SEQ IDNO:93或SEQ ID NO:96。
29.如前述权利要求中任一项所述的多核苷酸,其中(c)的所述3'UTR包含表2中所提供的3'UTR序列或与表2中所提供的3'UTR序列或其片段(例如,缺少表2中所提供的3'UTR序列的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列
任选地其中所述多核苷酸包含与表4中所提供的序列具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
30.如权利要求29所述的多核苷酸,其中所述3'UTR包含与SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ IDNO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ IDNO:24、SEQ ID NO:25、SEQ ID NO:45、SEQ ID NO:79、SEQ ID NO:80、SEQ ID NO:81、SEQ IDNO:82、SEQ ID NO:83、SEQ ID NO:84、SEQ ID NO:85、SEQ ID NO:86、SEQ ID NO:87、SEQ IDNO:94或SEQ ID NO:95或其片段(例如,缺少前述序列中的任一者的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列,任选地其中所述3'UTR包含微RNA(miRNA)结合位点,例如,如本文所描述,例如SEQ ID NO:38-40中的任一者的序列,任选地其中所述3'UTR包含TENT募集序列,例如,如本文所描述,例如SEQ ID NO:91或92的序列,
任选地其中所述多核苷酸包含与SEQ ID NO:47、48、49、50、122、52、53、54、55、59、60、61、126、127、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119或120中的任一者或其变体或片段具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
31.如权利要求1-27中任一项所述的多核苷酸,其中:
(i)(b)的所述编码区包含选自表3中所提供的终止元件的终止元件,例如,SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ IDNO:32、SEQ ID NO:33、SEQ ID NO:34、SEQ ID NO:35、SEQ ID NO:36、SEQ ID NO:37、SEQ IDNO:56、SEQ ID NO:57、SEQ ID NO:62、SEQ ID NO:93或SEQ ID NO:96;以及
(ii)(c)的所述3'UTR包含表2中所提供的3'UTR序列或与表2中所提供的3'UTR序列或其片段(例如,缺少表2中所提供的3'UTR序列的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列
任选地其中所述多核苷酸包含与表4中所提供的序列,例如SEQ ID NO:47、48、49、50、122、52、53、54、55、59、60、61、126、127、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119或120中的任一者或其变体或片段具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
32.如权利要求31所述的多核苷酸,其中所述3'UTR包含与SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ IDNO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ IDNO:24、SEQ ID NO:25、SEQ ID NO:45、SEQ ID NO:79、SEQ ID NO:80、SEQ ID NO:81、SEQ IDNO:82、SEQ ID NO:83、SEQ ID NO:84、SEQ ID NO:85、SEQ ID NO:86、SEQ ID NO:87、SEQ IDNO:94或SEQ ID NO:95或其片段(例如,缺少前述序列中的任一者的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
33.如权利要求32或33所述的多核苷酸,其中所述3'UTR包含微RNA结合位点,例如,如本文所描述,例如SEQ ID NO:38-40中的任一者的序列,和/或其中所述3'UTR包含TENT募集序列,例如,如本文所描述,例如SEQ ID NO:91或92的序列。
34.一种编码多肽的多核苷酸,其中所述多核苷酸包含:
(a)5'-UTR(例如,如本文所描述);
(b)编码区,所述编码区包含选自表3中所提供的终止元件的终止元件;以及
(c)3'-UTR(例如,如本文所描述)。
35.如权利要求34所述的多核苷酸,其中所述终止元件包含SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32、SEQ IDNO:33、SEQ ID NO:34、SEQ ID NO:35、SEQ ID NO:36、SEQ ID NO;62、SEQ ID NO:93或SEQID NO:96的序列。
36.如权利要求34所述的多核苷酸,其中(b)的所述编码区包含终止元件,所述终止元件包含式B的共有序列:
X-3-X-2-X-1-U-A-A-X1-X2-X3-X4-X5-X6-X7-X8-X9-X10-X11-X12(SEQ ID NO:37)
其中:
X1是G或A;
X2、X4、X5、X6或X7各自独立地是C或U;
X3是C或A;
X8、X10、X11、X12、X-1或X-3各自独立地是C或G;
X9是G或U;和/或
X-2是A或U。
37.如权利要求34所述的多核苷酸,其中(b)的所述编码区包含终止元件,所述终止元件包含式C的共有序列:
X-3-X-2-X-1-U-G-A-X1-X2-X3-X4-X5-X6-X7-X8-X9-X10-X11-X12(SEQ ID NO:56)
其中:
X-3、X-1、X2、X5、X6、X7、X8、X9或X12各自独立地是G或C;
X-2、X3或X4各自独立地是A或C;
X1是A或G;和/或
X10或X11各自独立地是C或U。
38.如权利要求34所述的多核苷酸,其中(b)的所述编码区包含终止元件,所述终止元件包含式D的共有序列:
X-3-X-2-X-1-U-A-G-X1-X2-X3-X4-X5-X6-X7-X8-X9-X10-X11-X12(SEQ ID NO:57)
其中:
X-3、X-1、X2、X3、X10各自独立地是G或C;
X-2或X9各自独立地是A或U;
X1或X4各自独立地是A或G;
X5或X8各自独立地是A或C;和/或
X6、X7、X11或X12各自独立地是C或U。
39.如权利要求36-39中任一项所述的多核苷酸,其中所述共有序列具有高GC含量,例如,约50%、60%、70%、80%、90%或99%的GC含量。
40.如权利要求34-39中任一项所述的多核苷酸,其中所述终止元件使得所述多核苷酸的半衰期增加,例如,所述多核苷酸的半衰期增加约1.5-20倍。
41.如权利要求40所述的多核苷酸,其中将所述多核苷酸的半衰期的所述增加与不具有终止元件、具有不同终止元件或不具有权利要求34-37中任一项所述的终止元件的在其它方面类似的多核苷酸进行比较。
42.如权利要求40或41所述的多核苷酸,其中根据测量多核苷酸的半衰期的测定,例如本文所公开的实施例中的任一者中所描述的测定来测量所述多核苷酸的半衰期的所述增加。
43.如权利要求34-42中任一项所述的多核苷酸,其中所述终止元件使得由所述多核苷酸编码的所述多肽的水平和/或活性,例如输出或表达持续时间增加。
44.如权利要求43所述的多核苷酸,其中根据测量多肽的水平和/或活性,例如输出或表达持续时间的测定,例如本文所公开的实施例中的任一者中所描述的测定来测量所述多肽的水平和/或活性,例如输出或表达持续时间的所述增加。
45.如权利要求44所述的多核苷酸,其中所述终止元件使得由所述多核苷酸编码的所述多肽的水平和/或活性,例如输出增加约1.5-20倍。
46.如权利要求44所述的多核苷酸,其中所述终止元件使得由所述多核苷酸编码的所述多肽的水平和/或活性,例如可检测水平或活性增加约1.5-20倍,持续约1、2、3、4、5、6、7、8、9、10或14天。
47.如权利要求46所述的多核苷酸,其中所述终止元件使得由所述多核苷酸编码的所述多肽的可检测水平或活性持续约1、2、3、4、5、6、7、8、9、10或14天。
48.如权利要求38-47中任一项所述的多核苷酸,其中将所述增加与不具有终止元件、具有不同终止元件或不具有权利要求34-39中任一项所述的终止元件的在其它方面类似的多核苷酸进行比较。
49.如权利要求34-48中任一项所述的多核苷酸,其中(a)的所述5'UTR包含表1中所提供的5'UTR序列或与表1中所提供的5'UTR序列或其变体或片段(例如,缺少表1中所提供的5'UTR序列的初始一个、两个、三个、四个、五个或六个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
50.如权利要求49所述的多核苷酸,其中所述5'UTR包含与SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ IDNO:5、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:41、SEQID NO:42、SEQ ID NO:63、SEQ ID NO:64、SEQ ID NO:65、SEQ ID NO:66、SEQ ID NO:67、SEQID NO:68、SEQ ID NO:69、SEQ ID NO:70、SEQ ID NO:71、SEQ ID NO:72、SEQ ID NO:73、SEQID NO:74、SEQ ID NO:75、SEQ ID NO:76、SEQ ID NO:77、SEQ ID NO:78、SEQ ID NO:88、SEQID NO:89或SEQ ID NO:90或其片段(例如,缺少前述序列中的任一者的初始一个、两个、三个、四个、五个或六个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
51.如权利要求34-50中任一项所述的多核苷酸,其中(c)的所述3'UTR包含表2中所提供的3'UTR序列或与表2中所提供的3'UTR序列或其片段(例如,缺少表2中所提供的3'UTR序列的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列,任选地其中所述多核苷酸包含与表4中所提供的序列具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
52.如权利要求51所述的多核苷酸,其中所述3'UTR包含与SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ IDNO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ IDNO:24、SEQ ID NO:25、SEQ ID NO:45、SEQ ID NO:79、SEQ ID NO:80、SEQ ID NO:81、SEQ IDNO:82、SEQ ID NO:83、SEQ ID NO:84、SEQ ID NO:85、SEQ ID NO:86、SEQ ID NO:87、SEQ IDNO:94或SEQ ID NO:95或其片段(例如,缺少前述序列中的任一者的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列,
任选地其中所述多核苷酸包含与SEQ ID NO:47、48、49、50、122、52、53、54、55、59、60、61、126、127、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119或120中的任一者或其变体或片段具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
53.如权利要求52所述的多核苷酸,其中所述3'UTR包含微RNA结合位点,例如,如本文所描述,例如SEQ ID NO:38-40中的任一者的序列,和/或其中所述3'UTR包含TENT募集序列,例如,如本文所描述,例如SEQ ID NO:91或92的序列。
54.如权利要求34-53中任一项所述的多核苷酸,其中:
(i)(a)的所述5'UTR包含表1中所提供的5'UTR序列或与表1中所提供的3'UTR序列或其片段(例如,缺少表1中所提供的5'UTR序列的初始一个、两个、三个、四个、五个或六个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列;以及
(ii)(c)的所述3'UTR包含表2中所提供的3'UTR序列或与表2中所提供的3'UTR序列或其片段(例如,缺少表2中所提供的3'UTR序列的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列
任选地其中所述多核苷酸包含与表4中所提供的序列具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
55.如权利要求54所述的多核苷酸,其中所述5'UTR包含与SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ IDNO:5、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:41、SEQID NO:42、SEQ ID NO:63、SEQ ID NO:64、SEQ ID NO:65、SEQ ID NO:66、SEQ ID NO:67、SEQID NO:68、SEQ ID NO:69、SEQ ID NO:70、SEQ ID NO:71、SEQ ID NO:72、SEQ ID NO:73、SEQID NO:74、SEQ ID NO:75、SEQ ID NO:76、SEQ ID NO:77、SEQ ID NO:78、SEQ ID NO:88、SEQID NO:89或SEQ ID NO:90或其片段(例如,缺少前述序列中的任一者的初始一个、两个、三个、四个、五个或六个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列,
任选地其中所述多核苷酸包含与SEQ ID NO:47、48、49、50、122、52、53、54、55、59、60、61、126、127、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119或120中的任一者或其变体或片段具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
56.如权利要求54或55所述的多核苷酸,其中所述3'UTR包含与SEQ ID NO:11、SEQ IDNO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ IDNO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ IDNO:24、SEQ ID NO:25、SEQ ID NO:45、SEQ ID NO:79、SEQ ID NO:80、SEQ ID NO:81、SEQ IDNO:82、SEQ ID NO:83、SEQ ID NO:84、SEQ ID NO:85、SEQ ID NO:86、SEQ ID NO:87、SEQ IDNO:94或SEQ ID NO:95或其片段(例如,缺少前述序列中的任一者的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
57.如权利要求56所述的多核苷酸,其中所述3'UTR包含微RNA结合位点,例如,如本文所描述,例如SEQ ID NO:38-40中的任一者的序列,和/或其中所述3'UTR包含TENT募集序列,例如,如本文所描述,例如SEQ ID NO:91或92的序列。
58.一种编码多肽的多核苷酸,其中所述多核苷酸包含:
(a)5'-UTR(例如,如本文所描述);
(b)编码区,所述编码区包含终止元件(例如,如本文所描述);以及
(c)3'UTR,所述3'UTR包含与SEQ ID NO:11或其片段具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的核心序列。
59.如权利要求58所述的多核苷酸,其中所述3'UTR核心序列位于紧邻(b)的所述终止元件的下游。
60.如权利要求58所述的多核苷酸,其中所述3'UTR核心序列位于所述多核苷酸的C末端。
61.如权利要求58-60中任一项所述的多核苷酸,其中所述包含核心序列的3'UTR包含第一侧翼序列。
62.如权利要求58-61中任一项所述的多核苷酸,其中所述包含核心序列的3'UTR包含第二侧翼序列。
63.如权利要求61或62所述的多核苷酸,其中所述包含核心序列的3'UTR包含第一侧翼序列和第二侧翼序列。
64.如权利要求61-63中任一项所述的多核苷酸,其中所述第一侧翼序列包含约5-25、约5-20、约5-15、约5-10、约10-25、约15-25、约20-25个核苷酸的序列。
65.如权利要求61-64中任一项所述的多核苷酸,其中所述第一侧翼序列包含约5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24或25个核苷酸,例如11个核苷酸的序列。
66.如权利要求61-65中任一项所述的多核苷酸,其中所述第二侧翼序列包含约20-80、约20-75、约20-70、约20-65、约20-60、约20-55、约20-50、约20-45、约20-40、约20-35、约20-30、约20-25、约25-80、约30-80、约35-80、约40-80、约45-80、约50-80、约55-80、约60-80、约65-80、约70-80或约75-80个核苷酸的序列。
67.如权利要求61-66中任一项所述的多核苷酸,其中所述第二侧翼序列包含约20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、55、60、65、70、75或80个核苷酸,例如39个核苷酸的序列。
68.如权利要求61-67中任一项所述的多核苷酸,其中所述第一侧翼序列处于所述核心序列的上游或下游。
69.如权利要求61-67中任一项所述的多核苷酸,其中所述第二侧翼序列处于所述核心序列的上游或下游。
70.如权利要求58-69中任一项所述的多核苷酸,其中所述3'UTR包含SEQ ID NO:11的片段,例如,SEQ ID NO:11的5个核苷酸(nt)、10nt、15nt、20nt、25nt、30nt、35nt、40nt、45nt、50nt、55nt、60nt、65nt或70nt片段。
71.如权利要求58-70中任一项所述的多核苷酸,其中所述3'UTR包含15-25nt片段,所述片段构成SEQ ID NO:11的60nt片段。
72.如权利要求58-71中任一项所述的多核苷酸,其中所述3'UTR包含SEQ ID NO:45的序列或其片段(例如,缺少SEQ ID NO:45的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)。
73.如权利要求58-71中任一项所述的多核苷酸,其中所述3'UTR包含SEQ ID NO:11的序列或其片段(例如,缺少SEQ ID NO:11的初始一个、两个、三个、四个、五个、六个或更多个核苷酸的片段)。
74.如权利要求58-73中任一项所述的多核苷酸,其中所述3'UTR使得所述多核苷酸的半衰期增加,例如,所述多核苷酸的半衰期增加约1.5-10倍,例如,如通过测量多核苷酸的半衰期的测定,例如本文所公开的实施例中的任一者的测定所测量。
75.如权利要求74所述的多核苷酸,其中所述3'UTR产生平均半衰期评分大于10的多核苷酸。
76.如权利要求58-73中任一项所述的多核苷酸,其中所述3'UTR使得由所述多核苷酸编码的所述多肽的水平和/或活性,例如输出增加。
77.如权利要求74-76中任一项所述的多核苷酸,其中将所述增加与不具有3'UTR、具有不同3'UTR或不具有权利要求76所述的3'UTR的在其它方面类似的多核苷酸进行比较。
78.如权利要求58-77中任一项所述的多核苷酸,其中所述3'UTR包含微RNA(miRNA)结合位点,例如,如本文所描述,和/或TENT募集序列,例如,如本文所描述。
79.如权利要求78所述的多核苷酸,其中所述3'UTR包含SEQ ID NO:38、SEQ ID NO:39、SEQ ID NO:40或它们的组合的miRNA结合位点,和/或包含SEQ ID NO:91或92的序列的TENT募集序列。
80.如权利要求78或79所述的多核苷酸,其中所述3'UTR包含多个miRNA结合位点,例如,2、3、4、5、6、7或8个miRNA结合位点。
81.如权利要求80所述的多核苷酸,其中所述多个miRNA结合位点包含相同或不同miRNA结合位点。
82.如权利要求58-81中任一项所述的多核苷酸,其中(a)的所述5'UTR包含表1中所提供的5'UTR序列或与表1中所提供的5'UTR序列或其片段(例如,缺少表1中所提供的5'UTR序列的初始一个、两个、三个、四个、五个或六个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
83.如权利要求82所述的多核苷酸,其中所述5'UTR包含与SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:41、SEQID NO:42、SEQ ID NO:63、SEQ ID NO:64、SEQ ID NO:65、SEQ ID NO:66、SEQ ID NO:67、SEQID NO:68、SEQ ID NO:69、SEQ ID NO:70、SEQ ID NO:71、SEQ ID NO:72、SEQ ID NO:73、SEQID NO:74、SEQ ID NO:75、SEQ ID NO:76、SEQ ID NO:77、SEQ ID NO:78、SEQ ID NO:88、SEQID NO:89或SEQ ID NO:90或其片段(例如,缺少前述序列中的任一者的初始一个、两个、三个、四个、五个或六个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
84.如权利要求58-83中任一项所述的多核苷酸,其中(b)的所述编码区包含表3中所提供的终止元件序列。
85.如权利要求84所述的多核苷酸,其中(b)的所述编码区包含选自表3中所提供的终止元件的终止元件,例如,SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQID NO:30、SEQ ID NO:31、SEQ ID NO:32、SEQ ID NO:33、SEQ ID NO:34、SEQ ID NO:35、SEQID NO:36或SEQ ID NO:37。
86.如权利要求58-81中任一项所述的多核苷酸,其中:
(i)(a)的所述5'UTR包含表1中所提供的5'UTR序列或与表1中所提供的3'UTR序列或其片段(例如,缺少表1中所提供的5'UTR序列的初始一个、两个、三个、四个、五个或六个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列;以及
(ii)(b)的所述终止元件包含表3中所提供的终止元件序列。
87.如权利要求86所述的多核苷酸,其中所述5'UTR包含与SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:41、SEQID NO:42、SEQ ID NO:63、SEQ ID NO:64、SEQ ID NO:65、SEQ ID NO:66、SEQ ID NO:67、SEQID NO:68、SEQ ID NO:69、SEQ ID NO:70、SEQ ID NO:71、SEQ ID NO:72、SEQ ID NO:73、SEQID NO:74、SEQ ID NO:75、SEQ ID NO:76、SEQ ID NO:77、SEQ ID NO:78、SEQ ID NO:88、SEQID NO:89或SEQ ID NO:90或其片段(例如,缺少前述序列中的任一者的初始一个、两个、三个、四个、五个或六个核苷酸的片段)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的序列。
88.如权利要求58-81或86中任一项所述的多核苷酸,其中(b)的所述编码区包含选自表3中所提供的终止元件的终止元件,例如,SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32、SEQ ID NO:33、SEQ ID NO:34、SEQ ID NO:35、SEQ ID NO:36、SEQ ID NO:37、SEQ ID NO:56、SEQ ID NO:57、SEQ IDNO;62、SEQ ID NO:93或SEQ ID NO:96。
89.如前述权利要求中任一项所述的多核苷酸,其中所述多核苷酸的所述编码区包含编码治疗性有效载荷或预防性有效载荷的序列。
90.如权利要求89所述的多核苷酸,其中所述治疗性有效载荷或预防性有效载荷包含分泌蛋白、膜结合蛋白或细胞间蛋白。
91.如权利要求90所述的多核苷酸,其中所述治疗性有效载荷或预防性有效载荷选自细胞因子、抗体、疫苗(例如,抗原、免疫原性表位)、受体、酶、激素、转录因子、配体、膜转运体、结构蛋白、核酸酶或其组分、变体或片段(例如,生物活性片段)。
92.如权利要求89-91中任一项所述的多核苷酸,其中所述治疗性有效载荷或预防性有效载荷包含蛋白质或肽。
93.如前述权利要求中任一项所述的多核苷酸,所述多核苷酸还包含至少一个5'帽结构,例如,如本文所描述,和/或多聚A尾,例如,如本文所描述,任选地其中所述多聚A尾包含一个或多个非腺苷残基,例如,一个或多个鸟苷。
94.如权利要求93所述的多核苷酸,其中所述5'帽结构包含GG、GA或GGA的序列,其中带下划线的斜体G是反向G核苷酸,继之以5'-5'-三磷酸基团。
95.如前述权利要求中任一项所述的多核苷酸,所述多核苷酸还包含3'稳定区,例如稳定的尾,例如,如本文所描述。
96.如权利要求95所述的多核苷酸,其中所述3'稳定区包含多聚A尾,例如,包含80-150个,例如120个腺嘌呤的多聚A尾(SEQ ID NO:123),任选地其中所述多聚A尾包含一个或多个非腺苷残基,例如一个或多个鸟苷。
97.如权利要求95或96所述的多核苷酸,其中所述多聚A尾包含UCUAG序列(SEQ ID NO:44)。
98.如权利要求97所述的多核苷酸,其中所述多聚A尾在SEQ ID NO:44的上游包含约80-120个,例如100个腺嘌呤。
99.如权利要求97或98所述的多核苷酸,其中所述多聚A尾在SEQ ID NO:44的下游包含约1-40个,例如20个腺嘌呤。
100.如权利要求95-99中任一项所述的多核苷酸,其中所述3'稳定区包含至少一个替代性核苷,任选地其中所述替代性核苷是反向胸苷(idT)。
101.如权利要求95-100中任一项所述的多核苷酸,其中所述3'稳定区包含式VII的结构:
Figure FDA0004090383120000201
或其盐,其中每个X独立地是O或S,并且A代表腺嘌呤并且T代表胸腺嘧啶。
102.如前述权利要求中任一项所述的多核苷酸,其中所述多核苷酸包含mRNA。
103.如权利要求102所述的多核苷酸,其中所述mRNA包含至少一个化学修饰。
104.如权利要求102或103所述的多核苷酸,其中所述化学修饰选自由以下组成的组:假尿苷、N1-甲基假尿苷、2-硫代尿苷、4'-硫代尿苷、5-甲基胞嘧啶、2-硫代-1-甲基-1-脱氮-假尿苷、2-硫代-1-甲基-假尿苷、2-硫代-5-氮杂-尿苷、2-硫代-二氢假尿苷、2-硫代-二氢尿苷、2-硫代-假尿苷、4-甲氧基-2-硫代-假尿苷、4-甲氧基-假尿苷、4-硫代-1-甲基-假尿苷、4-硫代-假尿苷、5-氮杂-尿苷、二氢假尿苷、5-甲基尿苷、5-甲基尿苷、5-甲氧基尿苷和2'-O-甲基尿苷。
105.一种脂质纳米颗粒(LNP)组合物,所述脂质纳米颗粒组合物包含前述权利要求中任一项所述的多核苷酸。
106.一种药物组合物,所述药物组合物包含权利要求105所述的LNP组合物。
107.一种细胞,所述细胞包含权利要求105或106所述的LNP组合物。
108.一种增加细胞中有效载荷,例如治疗性有效载荷或预防性有效载荷的表达的方法,所述方法包括向所述细胞施用权利要求105或106所述的LNP组合物。
109.一种将权利要求105或106所述的LNP组合物递送至细胞的方法。
110.如权利要求109所述的方法,所述方法包括使所述细胞在体外、体内或离体与所述LNP组合物接触。
111.一种将权利要求105或106所述的LNP组合物递送至患有例如本文所描述的疾病或病症的受试者的方法。
112.一种调节受试者的免疫反应的方法,所述方法包括向有需要的所述受试者施用有效量的权利要求105或106所述的LNP组合物。
113.一种治疗、预防疾病或病症或预防疾病或病症的症状的方法,所述方法包括向有需要的受试者施用有效量的权利要求105或106所述的LNP组合物。
114.如权利要求105-113中任一项所述的方法或LNP组合物,其中所述LNP组合物包含:(i)可电离脂质,例如,氨基脂质;(ii)固醇或其它结构脂质;(iii)非阳离子辅助脂质或磷脂;以及(iv)PEG-脂质。
115.如权利要求114所述的方法或LNP组合物,其中所述可电离脂质包含氨基脂质。
116.如权利要求114或115所述的方法或LNP组合物,其中所述可电离脂质包含式(I)、(IA)、(IB)、(IC)、(II)、(IIa)、(IIb)、(IIc)、(IId)、(IIe)、(IIf)、(IIg)、(III)、(IIIa1)、(IIIa2)、(IIIa3)、(IIIa4)、(IIIa5)、(IIIa6)、(IIIa7)或(IIIa8)中的任一者的化合物。
117.如权利要求105-116中任一项所述的方法或LNP组合物,其中所述可电离脂质包括式(I)化合物、式(IIa)化合物或式(IIe)化合物。
118.如权利要求105-117中任一项所述的方法或LNP组合物,其中所述非阳离子辅助脂质或磷脂包含选自由DSPC、DPPC或DOPC组成的组的化合物。
119.如权利要求105-118中任一项所述的方法或LNP组合物,其中所述磷脂是DSPC,例如DSPC的变体,例如式(IV)化合物。
120.如权利要求105-119中任一项所述的方法或LNP组合物,其中所述结构脂质选自α-生育酚、β-谷固醇或胆固醇。
121.如权利要求105-120中任一项所述的方法或LNP组合物,其中所述PEG脂质选自由PEG修饰的磷脂酰乙醇胺、PEG修饰的磷脂酸、PEG修饰的神经酰胺、PEG修饰的二烷基胺、PEG修饰的二酰基甘油、PEG修饰的二烷基甘油和它们的混合物组成的组。
122.如权利要求105-121中任一项所述的方法或LNP组合物,其中所述PEG脂质选自由PEG-c-DOMG、PEG-DMG、PEG-DLPE、PEG-DMPE、PEG-DPPC和PEG-DSPE脂质组成的组。
123.如权利要求105-121中任一项所述的方法或LNP组合物,其中所述PEG脂质是选自以下的化合物:式(V)、式(VI-A)、式(VI-B)、式(VI-C)或式(VI-D)。
124.如权利要求105-123中任一项所述的方法或LNP组合物,其中所述LNP包含摩尔比为约20-60%的可电离脂质:5-25%的磷脂:25-55%的胆固醇;和0.5-15%的PEG脂质。
125.如权利要求105-124中任一项所述的方法或LNP组合物,其中所述LNP被配制成用于静脉内、皮下、肌肉内、鼻内、眼内、经直肠、经肺或经口递送。
126.如权利要求105-125中任一项所述的方法或LNP组合物,其中所述受试者是哺乳动物,例如,人类。
127.如权利要求105-126中任一项所述的方法或LNP组合物,其中所述受试者患有本文所公开的疾病或病症。
CN202180051902.6A 2020-06-23 2021-06-23 包含具有延长的半衰期的mRNA治疗剂的LNP组合物 Pending CN116194151A (zh)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US202063042822P 2020-06-23 2020-06-23
US63/042822 2020-06-23
US202163165094P 2021-03-23 2021-03-23
US63/165094 2021-03-23
US202163165469P 2021-03-24 2021-03-24
US63/165469 2021-03-24
PCT/US2021/038780 WO2021262909A2 (en) 2020-06-23 2021-06-23 Lnp compositions comprising mrna therapeutics with extended half-life

Publications (1)

Publication Number Publication Date
CN116194151A true CN116194151A (zh) 2023-05-30

Family

ID=77155849

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180051902.6A Pending CN116194151A (zh) 2020-06-23 2021-06-23 包含具有延长的半衰期的mRNA治疗剂的LNP组合物

Country Status (11)

Country Link
US (1) US20230242908A1 (zh)
EP (1) EP4168556A2 (zh)
JP (1) JP2023531511A (zh)
KR (1) KR20230042005A (zh)
CN (1) CN116194151A (zh)
AU (1) AU2021297248A1 (zh)
BR (1) BR112022025991A2 (zh)
CA (1) CA3187261A1 (zh)
IL (1) IL299196A (zh)
MX (1) MX2022016550A (zh)
WO (1) WO2021262909A2 (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023183550A2 (en) * 2022-03-25 2023-09-28 Modernatx, Inc. Messenger ribonucleic acids with extended half-life
WO2023183909A2 (en) * 2022-03-25 2023-09-28 Modernatx, Inc. Polynucleotides encoding fanconi anemia, complementation group proteins for the treatment of fanconi anemia
WO2023196399A1 (en) * 2022-04-06 2023-10-12 Modernatx, Inc. Lipid nanoparticles and polynucleotides encoding argininosuccinate lyase for the treatment of argininosuccinic aciduria
WO2023215498A2 (en) * 2022-05-05 2023-11-09 Modernatx, Inc. Compositions and methods for cd28 antagonism

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB8613481D0 (en) 1986-06-04 1986-07-09 Diatech Ltd Translation of mrna
US5723332A (en) 1993-11-26 1998-03-03 British Technology Group Limited Translational enhancer DNA
US5824497A (en) 1995-02-10 1998-10-20 Mcmaster University High efficiency translation of mRNA molecules
EP2428569B1 (en) 2001-09-28 2018-05-23 Max-Planck-Gesellschaft zur Förderung der Wissenschaften e.V. Microrna molecules
US20050222064A1 (en) 2002-02-20 2005-10-06 Sirna Therapeutics, Inc. Polycationic compositions for cellular delivery of polynucleotides
US7683036B2 (en) 2003-07-31 2010-03-23 Regulus Therapeutics Inc. Oligomeric compounds and compositions for use in modulation of small non-coding RNAs
DE102005046490A1 (de) 2005-09-28 2007-03-29 Johannes-Gutenberg-Universität Mainz Modifikationen von RNA, die zu einer erhöhten Transkriptstabilität und Translationseffizienz führen
KR101541935B1 (ko) 2007-09-26 2015-08-05 인트렉손 코포레이션 합성 5'utr, 발현 벡터, 및 전이유전자 발현의 증가방법
CA3013503A1 (en) 2008-04-25 2009-10-29 Northwestern University Nanostructures suitable for sequestering cholesterol and other molecules
PL215513B1 (pl) 2008-06-06 2013-12-31 Univ Warszawski Nowe boranofosforanowe analogi dinukleotydów, ich zastosowanie, czasteczka RNA, sposób otrzymywania RNA oraz sposób otrzymywania peptydów lub bialka
EA028860B1 (ru) 2009-06-10 2018-01-31 Арбутус Биофарма Корпорэйшн Улучшенная липидная композиция
AU2012207606B2 (en) 2011-01-11 2017-02-23 Alnylam Pharmaceuticals, Inc. Pegylated lipids and their use for drug delivery
EP3434774A1 (en) 2013-01-17 2019-01-30 ModernaTX, Inc. Signal-sensor polynucleotides for the alteration of cellular phenotypes
WO2014164253A1 (en) 2013-03-09 2014-10-09 Moderna Therapeutics, Inc. Heterologous untranslated regions for mrna
EP3556353A3 (en) 2014-02-25 2020-03-18 Merck Sharp & Dohme Corp. Lipid nanoparticle vaccine adjuvants and antigen delivery systems
WO2017066797A1 (en) 2015-10-16 2017-04-20 Modernatx, Inc. Trinucleotide mrna cap analogs
CA3024917A1 (en) 2016-05-18 2017-11-23 Modernatx, Inc. Combinations of mrnas encoding immune modulating polypeptides and uses thereof
AU2019337637A1 (en) * 2018-09-13 2021-04-22 Modernatx, Inc. Polynucleotides encoding glucose-6-phosphatase for the treatment of glycogen storage disease
JP2022500444A (ja) * 2018-09-14 2022-01-04 モダーナティエックス・インコーポレイテッドModernaTX, Inc. クリグラー−ナジャー症候群の治療のためのウリジン二リン酸グリコシルトランスフェラーゼ1ファミリー、ポリペプチドa1をコードするポリヌクレオチド
AU2021205337A1 (en) * 2020-01-10 2022-07-21 Modernatx, Inc. Methods of making tolerogenic dendritic cells
EP4096720A2 (en) * 2020-01-30 2022-12-07 ModernaTX, Inc. Mrnas encoding metabolic reprogramming polypeptides and uses thereof

Also Published As

Publication number Publication date
WO2021262909A2 (en) 2021-12-30
CA3187261A1 (en) 2021-12-30
EP4168556A2 (en) 2023-04-26
WO2021262909A3 (en) 2022-04-21
IL299196A (en) 2023-02-01
BR112022025991A2 (pt) 2023-03-14
US20230242908A1 (en) 2023-08-03
JP2023531511A (ja) 2023-07-24
KR20230042005A (ko) 2023-03-27
MX2022016550A (es) 2023-04-10
AU2021297248A1 (en) 2023-02-02

Similar Documents

Publication Publication Date Title
US20220296517A1 (en) Compositions and methods for enhanced delivery of agents
JP7210287B2 (ja) Ii型シトルリン血症の治療のためのシトリンをコードするポリヌクレオチド
EP3736261B1 (en) Compounds and compositions for intracellular delivery of therapeutic agents
JP7065036B2 (ja) メチルマロニルCoAムターゼをコードするポリヌクレオチド
JP2022519557A (ja) 脂質ナノ粒子の調製方法
CA3113651A1 (en) Preparation of lipid nanoparticles and methods of administration thereof
AU2018234828A1 (en) Lipid nanoparticle formulation
CN116194151A (zh) 包含具有延长的半衰期的mRNA治疗剂的LNP组合物
JP2018529738A (ja) メッセンジャーリボ核酸薬物の治療投与のための方法
US11802146B2 (en) Polynucleotides encoding anti-chikungunya virus antibodies
WO2022266083A2 (en) Engineered polynucleotides for cell-type or microenvironment-specific expression
US20240123034A1 (en) Mrnas encoding granulocyte-macrophage colony stimulating factor for treating parkinson&#39;s disease
EP4041400A1 (en) Compositions, methods and uses of messenger rna
TW202345870A (zh) 具有延長半衰期之信使核糖核酸
TW202345864A (zh) 編碼檢查點癌症疫苗之mRNA及其用途
WO2024026257A2 (en) Engineered polynucleotides for cell selective expression
TW202417019A (zh) 用於細胞選擇性表現之經工程化多核苷酸
WO2023015261A1 (en) Mrnas encoding chimeric metabolic reprogramming polypeptides and uses thereof
JP2024506908A (ja) インビボ療法のためのペイロードを含むlnp組成物
WO2023077170A1 (en) Polynucleotides encoding integrin beta-6 and methods of use thereof

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination