CN117980481A - 用于基因表达调节的多核苷酸组合物和方法 - Google Patents

用于基因表达调节的多核苷酸组合物和方法 Download PDF

Info

Publication number
CN117980481A
CN117980481A CN202280062767.XA CN202280062767A CN117980481A CN 117980481 A CN117980481 A CN 117980481A CN 202280062767 A CN202280062767 A CN 202280062767A CN 117980481 A CN117980481 A CN 117980481A
Authority
CN
China
Prior art keywords
engineered polynucleotide
sequence
engineered
nucleotides
stem
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202280062767.XA
Other languages
English (en)
Inventor
卡约·布鲁诺昆塔德索萨利尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Apta Biotech
Original Assignee
Apta Biotech
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Apta Biotech filed Critical Apta Biotech
Publication of CN117980481A publication Critical patent/CN117980481A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/111General methods applicable to biologically active non-coding nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/67General methods for enhancing the expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/11Antisense
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/31Chemical structure of the backbone
    • C12N2310/315Phosphorothioates
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/32Chemical structure of the sugar
    • C12N2310/3212'-O-R Modification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/35Nature of the modification
    • C12N2310/351Conjugate
    • C12N2310/3519Fusion with another nucleic acid
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/50Physical structure
    • C12N2310/53Physical structure partially self-complementary or closed
    • C12N2310/531Stem-loop; Hairpin
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2320/00Applications; Uses
    • C12N2320/30Special therapeutic applications
    • C12N2320/33Alteration of splicing

Landscapes

  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Wood Science & Technology (AREA)
  • Organic Chemistry (AREA)
  • Chemical & Material Sciences (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Mycology (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)

Abstract

本公开涉及与mRNA前体和剪接体相互作用以调节基因表达的工程化多核苷酸。该工程化多核苷酸可以具有募集剪接体和在外显子‑内含子剪接点处与靶序列互补的靶向序列的茎环结构,并且可以包括具有2'修饰和硫代磷酸酯键合的核苷酸。

Description

用于基因表达调节的多核苷酸组合物和方法
交叉引用
本申请要求于2021年7月16日提交的美国临时申请号63/222,741的权益,该申请的全部内容均通过引用并入本文用于所有目的。
背景技术
使用成簇规律间隔短回文重复序列(CRISPR)技术进行基因编辑可以引入永久性脱氧核糖核酸(DNA)突变,且因此存在例如在治疗应用中的脱靶问题。核糖核酸(RNA)水平的基因调节效率仍然有限。因此,有开发用于例如在治疗有效且安全的水平下调节基因表达和活性的多核苷酸组合物和方法的需求。
发明内容
在一些方面,本文描述了一种工程化多核苷酸,所述工程化多核苷酸包含:一个或多个靶向部分,所述一个或多个靶向部分被配置为在信使核糖核酸前体(mRNA前体)中的靶序列处特异性地结合所述mRNA前体;和募集部分,所述募集部分被配置为募集转录后调节部分(例如,剪接体部分),其中当与所述mRNA前体和所述工程化多核苷酸相关联时,所述转录后调节部分在所述靶序列中或附近处改变所述mRNA前体。在一些实施方案中,所述一个或多个靶向部分中的靶向部分与靶基因的所述靶序列中的共有序列足够相同或互补。在一些实施方案中,所述一个或多个靶向部分包含第一靶向部分,所述第一靶向部分被配置为特异性地结合所述mRNA前体的所述靶序列中的第一靶标序列;和第二靶向部分,所述第二靶向部分被配置为特异性地结合所述mRNA前体的所述靶序列中的第二靶标序列。在一些实施方案中,所述第一靶标序列包含所述靶序列中的共有序列。在一些实施方案中,所述第二靶标序列包含所述靶序列中的共有序列。在一些实施方案中,所述第一和第二靶标序列在所述靶序列中相隔不超过5个核苷酸(例如,一个或两个核苷酸)的间隔序列。在一些实施方案中,所述靶序列包含所述mRNA前体中的外显子-内含子边界。在一些实施方案中,所述第一和第二靶标序列均位于所述外显子-内含子边界的5'或3'。在一些实施方案中,所述第一和第二靶标序列中的一个位于所述外显子-内含子边界的5';并且其中所述第一和第二靶标序列中的另一个位于所述外显子-内含子边界的3'。在一些实施方案中,所述靶序列包含所述mRNA前体中的剪接位点。在一些实施方案中,所述第一或第二靶标序列包含所述mRNA前体中的剪接位点(例如,5'ss)。在一些实施方案中,所述第一和第二靶向部分中的一个位于所述募集部分的5',并且所述第一和第二靶向部分中的另一个位于所述募集部分的3'。在一些实施方案中,所述第一靶向部分或所述第二靶向部分包含与表1中列出的序列相同或互补的序列。在一些实施方案中,所述第一靶向部分包含与选自表1的5'-靶向部分序列栏的序列相同或互补的序列;并且其中所述第二靶向部分包含与表1的3'-靶向部分序列栏中列出的序列相同或互补的序列。在一些实施方案中,所述第一靶向部分包含与表1的3'-靶向部分序列栏中列出的序列相同或互补的序列;并且其中所述第二靶向部分包含与表1的5'-靶向部分序列栏中列出的序列相同或互补的序列。在一些实施方案中,所述第一靶向部分或所述第二靶向部分包含与内含子供体位点(例如,选自GU、GT、GC和CA)的共有序列相同或互补的序列。在一些实施方案中,所述第一靶向部分或所述第二靶向部分包含与外显子供体位点(例如,G)的共有序列相同或互补的序列。在一些实施方案中,所述第一靶向部分或所述第二靶向部分包含与选自GU、GC、G和CA的共有序列相同或互补的序列。在一些实施方案中,所述剪接体部分选自剪接体核糖核蛋白复合物、剪接体小核核糖核酸(snRNA)、剪接体蛋白、其功能变体或其功能片段。在一些实施方案中,所述剪接体部分包含U1 snRNA和剪接体蛋白。在一些实施方案中,所述剪接体snRNA选自U1、U2、U4、U5、U6、U11、U12、U14atac、U6atac及其组合。在一些实施方案中,所述剪接体蛋白选自Sm、U1-70k、U1A、U1C及其组合。在一些实施方案中,所述募集部分包含与表2-3中列出的序列至少70%、80%、85%或90%相同或互补的核苷酸序列。在一些实施方案中,所述募集部分包含与表2-3中列出的序列相同或互补的核苷酸序列。在一些实施方案中,所述工程化多核苷酸包含(例如,二级的)结构特点。在一些实施方案中,所述工程化多核苷酸包含顶环、上茎、内环、下茎或其组合。在一些实施方案中,所述工程化多核苷酸包含与茎(例如,下茎或上茎)相邻的环(例如,内环),所述茎包含两个互补的茎序列。在一些实施方案中,所述茎(例如,所述下茎或所述上茎)的茎序列包含不超过约五个、四个或三个核苷酸。在一些实施方案中,所述环为与所述茎(例如,所述下茎)和另一茎(例如,上茎)相邻的内环,所述另一茎包含两个互补的茎序列。在一些实施方案中,所述内环包含具有不超过10、9或8个核苷酸的核酸序列。在一些实施方案中,所述另一茎(例如,所述上茎)的茎序列包含不超过约五个、四个或三个核苷酸。在一些实施方案中,所述工程化多核苷酸还包含顶环。在一些实施方案中,所述顶环包含具有不超过10、9、8、7、6或5个核苷酸的核酸序列。在一些实施方案中,所述工程化多核苷酸不包含任何分子内二硫键。在一些实施方案中,工程化多核苷酸当与所述剪接体部分相关联时,所述mRNA前体实质上不表现出与U1 snRNA的RNA结合结构域(RBD)的碱基配对。在一些实施方案中,所述工程化多核苷酸当与所述剪接体部分相关联时,所述mRNA前体实质上不表现出与U1-C蛋白的碱基特异性相互作用。在一些实施方案中,所述工程化多核苷酸被配置为与U1-C蛋白的锌指特异性地相互作用。在一些实施方案中,所述工程化多核苷酸的5'-靶向部分被配置为与U1-C蛋白的锌指特异性地相互作用。在一些实施方案中,所述工程化多核苷酸被配置为与U1-C蛋白的锌指共价地相互作用(例如,通过二硫键)。在一些实施方案中,所述工程化多核苷酸被配置为与U1-C蛋白的锌指非共价地相互作用(例如,通过氢键)。在一些实施方案中,所述工程化多核苷酸包含与U1 snRNA的茎环II(SL2)的部分序列互补的核苷酸序列。在一些实施方案中,所述工程化多核苷酸的茎环结构的一侧包含与U1snRNA的茎环II(SL2)的部分序列互补的核苷酸序列。在一些实施方案中,所述部分序列包含与U1 snRNA的SL2的5’-GGCCU-3’对应的序列。在一些实施方案中,所述部分序列不包含与U1 snRNA的SL2的5’-CACGUUA-3’对应的序列。在一些实施方案中,所述工程化多核苷酸实质上不表现出与U1 snRNA的SL2的锚定序列的碱基配对。在一些实施方案中,所述工程化多核苷酸的内环实质上不表现出与U1 snRNA的所述SL2的所述锚定序列的碱基配对。在一些实施方案中,所述工程化多核苷酸的下茎实质上不表现出与U1 snRNA的所述SL2的所述锚定序列的碱基配对。在一些实施方案中,所述锚定序列包含对应于5'-CACGUUA-3'的序列。在一些实施方案中,所述工程化多核苷酸实质上不表现出与U1 snRNA的H螺旋的碱基配对。在一些实施方案中,所述工程化多核苷酸包含至少一种化学修饰。在一些实施方案中,所述工程化多核苷酸包含至少一个2'-修饰的(例如,2'-甲氧基、2'-甲氧基甲基或2'-甲氧基乙基)核苷酸。在一些实施方案中,所述工程化多核苷酸的至少约50%、60%、70%、80%或90%核苷酸为化学修饰的核苷酸。在一些实施方案中,所述工程化多核苷酸的至少约50%、60%、70%、80%或90%核苷酸为2'-修饰的(例如,2'-甲氧基、2'-甲氧基甲基或2'-甲氧基乙基)核苷酸。在一些实施方案中,所述工程化多核苷酸包含至少一个硫代磷酸酯核苷酸间键。在一些实施方案中,所述工程化多核苷酸的至少约50%、60%、70%、80%或90%核苷酸间键合被化学修饰。在一些实施方案中,至少约50%、60%、70%、80%或90%核苷酸间键合为硫代磷酸酯。在一些实施方案中,所述工程化多核苷酸包含约10至约40个核苷酸、约10至约35个核苷酸、约10至约30个核苷酸、或约10至约25个核苷酸。在一些实施方案中,所述募集部分包含约10至约30个核苷酸或约10至约20个核苷酸。在一些实施方案中,所述一个或多个靶向部分各自独立地包含约2至约15个核苷酸、约2个核苷酸至约10个核苷酸、或约2个核苷酸至约8个核苷酸。在一些实施方案中,所述第一和第二靶向部分中的一个包含约2个核苷酸,并且所述第一和第二靶向部分中的另一个包含约5或6个核苷酸。在一些实施方案中,当与所述工程化多核苷酸和所述mRNA前体相关联时,所述剪接体部分切割或剪接所述靶序列中的所述mRNA前体。在一些实施方案中,所述剪接体部分还促进切割的mRNA前体的修饰。
在一些方面,本文描述了一种工程化多核苷酸,所述工程化多核苷酸包含与表2-3中列出的序列至少70%、80%、85%或90%相同或互补的核苷酸序列,该工程化多核苷酸的特征在于(例如,二级的)结构特点。在一些实施方案中,所述核苷酸序列与表2-3中列出的序列相同或互补。在一些实施方案中,所述结构特点包含一种或多种茎环结构。在一些实施方案中,所述结构特点包含顶环、上茎、内环、下茎或其组合。在一些实施方案中,所述工程化多核苷酸包含与茎(例如,下茎或上茎)相邻的环(例如,内环),所述茎包含两个互补的茎序列。在一些实施方案中,所述茎(例如,所述下茎或所述上茎)的茎序列包含不超过约五个、四个或三个核苷酸。在一些实施方案中,所述环为与所述茎(例如,所述下茎)和另一茎(例如,上茎)相邻的内环,所述另一茎包含两个互补的茎序列。在一些实施方案中,所述内环包含具有不超过10、9或8个核苷酸的核酸序列。在一些实施方案中,所述另一茎(例如,所述上茎)的茎序列包含不超过约五个、四个或三个核苷酸。在一些实施方案中,所述工程化多核苷酸还包含顶环。在一些实施方案中,所述顶环包含具有不超过10、9、8、7、6或5个核苷酸的核酸序列。在一些实施方案中,所述工程化多核苷酸还包含一个或多个靶向部分,所述一个或多个靶向部分与靶基因的靶序列足够相同或互补。在一些实施方案中,所述一个或多个靶向部分的靶向部分与所述靶基因的所述靶序列中的共有序列足够相同或互补。在一些实施方案中,所述靶基因为微管相关蛋白tau(MAPT)。在一些实施方案中,所述工程化多核苷酸包含至少一种化学修饰。在一些实施方案中,所述工程化多核苷酸包含至少一个硫代磷酸酯核苷酸间键。在一些实施方案中,所述工程化多核苷酸的至少约50%、60%、70%、80%或90%核苷酸间键合被化学修饰。在一些实施方案中,至少约50%、60%、70%、80%或90%核苷酸间键合为硫代磷酸酯。在一些实施方案中,所述工程化多核苷酸包含至少一个2'-修饰的(例如,2'-甲氧基、2'-甲氧基甲基或2'-甲氧基乙基)核苷酸。在一些实施方案中,所述工程化多核苷酸的至少约50%、60%、70%、80%或90%核苷酸为化学修饰的核苷酸。在一些实施方案中,所述工程化多核苷酸的至少约50%、60%、70%、80%或90%核苷酸为2'-修饰的(例如,2'-甲氧基、2'-甲氧基甲基或2'-甲氧基乙基)核苷酸。在一些实施方案中,所述工程化多核苷酸包含约10至约40个核苷酸、约10至约35个核苷酸、约10至约30个核苷酸、或约10至约25个核苷酸。
在一些方面,本文描述了一种用于改变细胞中信使核糖核酸前体(mRNA前体)的方法,所述方法包括使所述细胞与工程化多核苷酸接触,所述工程化多核苷酸包含一个或多个靶向部分和募集部分,其中所述一个或多个靶向部分在所述mRNA前体中的靶序列处结合至所述mRNA前体,并且所述募集部分在所述mRNA前体的所述靶序列附近内募集转录后调节部分(例如,剪接体部分)以改变所述细胞中的所述mRNA前体,从而产生一种或多种改变的mRNA前体。在一些实施方案中,所述一个或多个靶向部分中的靶向部分与靶基因的所述靶序列中的共有序列足够相同或互补。在一些实施方案中,所述mRNA前体对应于靶基因。在一些实施方案中,所述靶基因为微管相关蛋白tau(MAPT)。在一些实施方案中,所述方法改变所述靶基因的表达或活性。在一些实施方案中,在所述接触之前,所述细胞表现出对应于所述靶基因的异常信使核糖核酸(mRNA)或蛋白质。
在一些方面,本文描述的是工程化多核苷酸组,其各自独立地包含:一个或多个靶向部分,所述一个或多个靶向部分被配置为在靶序列处结合信使核糖核酸前体(mRNA前体),和募集部分,所述募集部分被配置为募集转录后调节部分(例如,剪接体部分),其中该工程化多核苷酸组被配置为在包含所述靶序列的多个靶序列处特异性地结合所述mRNA前体。
本文所述的另一个实施方案是一种工程化多核苷酸,所述工程化多核苷酸包含第一靶向部分,所述第一靶向部分被配置为在信使核糖核酸前体(mRNA前体)中的第一靶标序列处特异性地结合所述mRNA前体;募集部分,所述募集部分被配置为募集剪接体部分;以及第二靶向部分,所述第二靶向部分被配置为在mRNA前体中的第二靶标序列处特异性地结合所述mRNA前体;其中所述募集部分包含顶环、与所述顶环相邻的上茎、下茎、以及位于所述上茎和所述下茎之间的内环,并且其中所述剪接体部分改变靶序列中的所述mRNA前体,当与所述mRNA前体和所述工程化多核苷酸相关联时,所述靶序列包含所述第一靶标序列和所述第二靶标序列。在一些方面,所述第一靶标序列和第二靶标序列在所述靶序列中相隔不超过5个核苷酸的间隔序列。在一些方面,所述靶序列包含所述mRNA前体中的外显子-内含子边界。在一些方面,所述第一靶标序列为所述外显子-内含子边界的5'并且所述第二靶标序列为所述外显子-内含子边界的3'。在一些方面,所述第一靶向部分包含与表1的外显子序列栏中列出的序列相同或互补的序列;且所述第二靶向部分包含与表1的内含子序列栏中列出的序列相同或互补的序列。在一些方面,所述剪接体部分包含U1 snRNA和U1-C蛋白。在一些方面,所述上茎或所述下茎包含两个互补的序列且所述两个互补序列中的每一个包含不超过5个核苷酸;所述内环包含两个核酸序列,且所述两个核酸序列中的每一个包含不超过5个核苷酸;并且所述顶环包含不超过8个核苷酸的核酸序列。在其他方面,当与所述工程化多核苷酸相关联时,所述mRNA前体实质上不表现出与U1 snRNA的RNA结合结构域(RBD)的碱基配对,并且当与所述工程化多核苷酸和所述剪接体部分相关联时,所述剪接体部分实质上不表现出与U1-C蛋白的碱基特异性相互作用。在另一个方面,所述工程化多核苷酸的5'-靶向部分被配置为与U1-C蛋白的锌指特异性地相互作用。在另一个方面,所述募集部分包含与U1 snRNA的茎环II(SL2)序列的至少4个核苷酸互补的核苷酸序列。在另一个方面,U1 snRNA的SL2序列包含5'-GGCCU-3'。所述工程化多核苷酸可以具有2'-修饰的核苷酸。所述工程化多核苷酸至少50%的核苷酸可以为2'-修饰的核苷酸。所述2'-修饰的核苷酸可以为2'-甲氧基核苷酸。在另一个方面,所述工程化多核苷酸包含通过核苷酸间键合连接的核苷酸,且至少一个所述核苷酸间键合不包含磷酸酯。至少一个或50%、60%、70%、80%或90%的核苷酸间键合可以为硫代磷酸酯。
援引并入
本说明书中提及的所有出版物、专利和专利申请均通过引用并入本文,其程度如同具体地和单独地指出通过引用而并入每个单独的出版物、专利或专利申请。在通过引用并入的出版物和专利或专利申请与说明书中包含的公开内容相矛盾的范围内,说明书旨在取代和/或优先于任何此类矛盾的材料。
附图说明
专利或申请文件包含至少一幅彩色附图。专利局将根据请求和收到的必要费用来提供带有彩色附图的本专利或专利申请的副本。
图1示出了用于鉴定剪接供体和剪接受体位点的示意图。动物和植物中信使核糖核酸(mRNA)剪接的示例共有序列为“GU_AG”,其中“GU”为示例剪接供体序列,并且“AG”为示例剪接受体序列。哺乳动物中较长的剪接供体共有序列可以为“GUrAGU”,其中“r”代表“G”或“A”。通常,“GU_AG”的表达意味着该序列的仅5'和3'末端两个核苷酸分别不变地为“GU”和“AG”,并且下划线表示的序列可以是任意序列。然而,本文所述的这种表达表示由下划线表示的序列可以是除与任何其他共有序列不匹配的序列之外的任意序列。剪接受体共有序列之前为分支点序列,其包含腺嘌呤,其连接至5'剪接位点核糖核苷酸以形成内含子套索;以及多嘧啶束(C或U),其在分支点与剪接受体序列之间。虽然内含子的短GU_AG共有序列显然不足以区分众多的选择性剪接事件,令人惊讶的是,我们对RNA剪接选择性调节需要什么其他序列信息知之甚少。位于内含子两侧侧翼的一个或两个核苷酸也通常是保守的,且它们包含在我们的补充表中,但本文不会进一步讨论它们,如此我们可以将分析关注于在内含子端部的共有序列上。从这个意义上说,工程化多核苷酸的合理设计在逻辑上鉴定了剪接的内含子共有序列(GU_AG)。然后,使得确定供体位点(5'外显子和内含子下游)和受体(3'外显子和内含子下游)的保守区域成为可能。值得注意的是,保守和共有区域位于组成型剪接供体或受体的同一位点内。共有区域的识别决定了5'剪接位点,即外显子与内含子之间的连接界限。同时,对保守区域的识别鉴定了选择用于调谐的转录本的身份。
图2A-2B示出了本文所述的示例工程化多核苷酸,包含:(1)3'-靶向部分:3'-GC-5';(2)下茎:3'-GA-5'/5'-CT3';(3)内环:3'-CC-5'/5'-AA-3';(4)上茎:3'-GGA-5'/5'-CCT-3';(5)顶环:3'-CTT-5';和(6)5'-靶向部分:5'-GTCCA-3'。图2C示出了示例工程化多核苷酸与靶mRNA前体序列的相互作用。图2D示出了示例工程化多核苷酸与U1 RNP复合物的多种组分的相互作用。
图3A-3B示出了通过工程化多核苷酸“茎5'/3'”(又名,5'-靶向部分或/和3'-靶向部分)发生的锚定,该工程化多核苷酸被设计为与存在于组成型供体位点中的保守部分相互作用。图3A。茎5'/3'(GTCCA和CG),诸如硫代磷酸酯核苷酸间键和2'O-甲基(2'O-ME)对分子糖的取代增加了对核酸内切酶的抗性,并增加了茎5'/3'的碱基与来自组成型供体的保守区域之间相互作用的分子强度。图3B。本文所述的工程化多核苷酸与组成型供体的相互作用,U1 snRNA的RNA结合部分(RBD)通过组成型供体剪接-外显子的剪接和沉默。
图4示出了人U1 snRNP的示意图。U1 snRNP由1个U1 snRNA、7个常见Sm蛋白和3个U1 snRNP特异性蛋白(U1-70K、U1A和U1C)组成。U1 snRNA的二级结构由四个茎环(SL)和突出显示的H螺旋组成。显示了形成H螺旋的核苷酸。此外,还给出了与RNA:蛋白质或RNA:5'ss相互作用相关的U1 snRNA序列。SL1的环部分是根据晶体结构绘制的。它由A29和A36之间形成的反式WC/Hoogsteen碱基对封闭。还显示了U1 snRNP的蛋白质组分、它们的大小和它们的大致位置。由显示为绿色圆圈的Sm蛋白形成的Sm环与框出的Sm位点结合。显示为红色的U1-70K识别SL1。显示为黄色的U1A结合SL2。显示为蓝色的U1C通过与U1-70K和Sm蛋白的蛋白质:蛋白质相互作用被募集至U1 snRNP。标注表示U1C与Sm环之间的相互作用。
图5示出U1 snRNP与mRNA前体的5'外显子-内含子连接点结合,且因此在mRNA前体剪接的早期阶段发挥关键作用。显示了工程化U1子结构的两个晶体结构,它们共同以原子分辨率揭示了U1 snRNP内几乎完整的蛋白质-蛋白质和RNA-蛋白质相互作用网络,并显示了通过U1 snRNP如何识别mRNA前体的5'剪接位点。U1-C的锌指与mRNA前体和U1 snRNA 5'端之间的双链体相互作用。RNA双链体的结合通过U1-C和剪接点周围的RNA主链之间的氢键和静电相互作用来稳定,但U1-C与mRNA前体没有碱基特异性接触。该结构与RNA结合测定一起显示,由U1 snRNP对5'-剪接位点核苷酸的选择主要是通过与U1 snRNA的碱基配对来实现的,而U1-C则微调不匹配的5'-剪接位点的相对亲和力。图5A。U1-70k与U1 snRNA茎环复合以及U1-A RRM与茎环2复合。图5B。U1 snRNA茎环1和2(55-MER)。图5C。U1小核核糖核蛋白A和70kDa。
图6示出了U1-70k与U1 snRNA茎环复合以及U1-A RRM与茎环2复合,通过U1-C锌指稳定化。
图7示出了由本文所述的工程化多核苷酸(ASMO1)对剪接体机制的调谐的示意图。靶向部分(“茎5'/3'”)(5'-GTCCA-3'和5'-CG-3')的锚定允许通过沉默U1 snRNA的RNA结合部分(RBD)与组成型供体的保守位点相互作用。U1 snRNP复合物的稳定化可以通过U1-C锌指的强离子吸引力观察到,这是由ASMO1茎5'/3'的硫醇的二硫桥诱导的。mRNA前体/ASMO1双链体键通过U1-C与缝接点周围的mRNA前体主链之间的氢键和静电相互作用来稳定,但U1-C不会与mRNA前体进行碱基特异性接触。该结构表明,由U1 snRNP对5'-剪接核苷酸的选择主要是通过茎5'/3'与mRNA前体之间的相互作用来实现的。同时,U1-C通过U1-70KDa和Sm环之间的相互作用桥调整5'-剪接不相容位点的相对亲和力并稳定剪接体机制的中央核心。可以观察到茎环II与上茎(又名“发夹-2”;见图2B)(3'-GGA-5'/5'-CCT-3')的特定碱基(5'-AGGCC-3')的静电相互作用和氢桥以及内环:(3'-mCC-5'/5'-AA-3'),与U1-A的聚腺苷酸化信号和乙酰化调谐有关。值得注意的是,茎环II(5'-CAACGUUA-3')中U1-A的锚定部分不会被上茎沉默,从而诱导基因表达和乙酰化水平的调谐。此外,2'-OME基团的存在诱导介质分子动力学的变化,促进U1-snRNA的构象改变以及茎环II与ASMO1的近似,其中ASMO1靶向或募集部分不同于U1-A蛋白,从而通过聚腺苷酸化信号失调来减少阅读框过早中断的可能性。
图8示出U1-70K与U1 snRNA茎环的复合,以及U1-A RRM与茎环2的复合,通过U1-C锌指稳定。可以观察到,茎环II与上茎(3'-GGA-5'/5'-CCT-3')的特定碱基(3'-CCGGA-5')和内环:(3'-mCC-5'/5'-AA-3')的静电相互作用和氢桥,与U1-A的聚腺苷酸化信号和乙酰化调谐有关。值得注意的是,茎环II(5'-CAACGUUA-3')中U1-A的锚定部分不会被上茎沉默,诱导基因表达和乙酰化水平的调谐。此外,此外,2'-OME基团的存在诱导介质分子动力学的变化,促进U1-snRNA的构象改变以及茎环II与本文所述的工程化多核苷酸(ASMO1)的近似。
图9A示出了位于SmD3上的U1-C并且其结合可以通过U1-70k的N末端来稳定化。图9B示出了U1-C与糖-磷酸酯主链原子形成氢键但不与RNA碱基接触。在5'SS链上,外显子序列的核苷酸着色为青色,内含子序列为黄褐色。图9C示出了5'-剪接位点识别的图示。红色虚线:由U1-C锌指氨基酸侧链形成的氢键。蓝色虚线:由U1-C锌指主链原子形成的氢键。绿色虚线:由U1-C锌指的氨基酸侧链形成的二硫键。橙色虚线:由U1-C锌指主链中的原子形成的二硫键。5'SS核苷酸由如图9B中的核编码。
图10A示出了指纹Z1 U1-C snRNP,由蓝色的36个氨基酸残基表示。图10B示出了U1-C snRNP的Z1指部分,呈现与5'组成型供体区域中的mRNA前体/ASMO1双链体相互作用的主要残基。图10C示出了含有145-aa的U1-C snRNP的代表性序列,其中以绿色突出显示的36-aa指的是锌指部分。
图11示出了示例工程化多核苷酸(ASMO2),其包含具有硫代磷酸酯型核苷酸间键和针对糖分子的2'-甲基(2'O-ME)取代的经修饰反义调谐寡核苷酸。ASMO2工程化多核苷酸可以与U1 snRNA互补并结合以用于调谐编码靶基因的靶序列的表达和活性。
本公开的新颖特征在所附权利要求中特别阐述。通过参考以下阐述说明性实施方案的详细描述,将会获得对本公开的特征和优点的更好理解。
具体实施方案
本文描述了(例如,工程化)多核苷酸和(例如,药物)组合物以及其使用方法,例如,用于调谐基因表达或活性。
工程化多核苷酸
在本文所述的一些实施方案中,工程化多核苷酸包含:(i)一个或多个靶向部分,所述一个或多个靶向部分被配置为在核糖核酸(RNA)(例如,信使核糖核酸(mRNA),诸如信使核糖核酸前体(mRNA前体))中的靶序列处(例如,特异性地)结合该核糖核酸。工程化多核苷酸还可包含(ii)募集部分,所述募集部分被配置为募集转录后调节部分(例如,剪接体部分),使得当与RNA(例如,mRNA,诸如mRNA前体)和工程化多核苷酸相关联时,转录后调节部分改变靶序列中或附近处的RNA(例如,mRNA,诸如mRNA前体)。在一些实施方案中,RNA(例如,mRNA,诸如mRNA前体)编码靶基因。
工程化多核苷酸或本文所述的工程化多核苷酸可以包括多种部分。“部分”可以指工程化多核苷酸的区域。在一些情况下,部分可以根据部分的功能来描述。例如,“靶向部分”可以指工程化多核苷酸的可以与靶RNA至少部分互补的区域;“募集部分”可以指可以募集本文所述的任一个调节部分的部分;且“间隔序列”可以指在其他部分之间提供空间的部分。在一些情况下,部分名称的叙述并不将该部分限制为特定功能。例如,可以与靶RNA至少部分互补的“靶向部分”在一些情况下可以募集调节部分。
靶向部分
在本文所述的工程化多核苷酸的一些实施方案中,一个或多个靶向部分的靶向部分与靶基因的靶序列中的共有序列足够相同或互补。靶向部分可以在工程化多核苷酸的5'端和3'端找到,且也被称为下茎或腿。不希望受理论束缚,一个或两个靶向部分与靶mRNA前体的组成型供体5'的稳定结合允许与组成型供体的保守位点相互作用并沉默U1 snRNARNA结合结构域。
可以根据未知意义的遗传变异(VUS)的鉴定来确定共有序列。任何外显子或内含子VUS都可以通过破坏顺式DNA序列来产生剪接,这些顺式DNA序列定义用于正确RNA剪接过程所需的外显子、内含子和调节序列。顺式DNA元件可以包括:外显子-内含子边界核心共有核苷酸(例如,5'供体位点的+1和+2处的GT以及3'受体位点的-1和-2处的AG);或与这些不变核苷酸相邻的内含子的和外显子的核苷酸,它们也高度保守并且已发现参与剪接位点选择(例如,供体位点中的CAG/GUAAGU和受体位点中的NYAG/G)。这些元件中的任何一个核苷酸变化都可导致错误的剪接位点识别,从而产生新的剪接位点或激活隐秘的剪接位点,导致与疾病或病况相关的异常转录本或非功能性蛋白质。在一些实施方案中,一个或多个靶向部分中的至少一个靶向部分与靶基因的靶序列中的共有序列足够相同或互补。在一些实施方案中,共有序列包含约2至约15个核苷酸、约2个核苷酸至约10个核苷酸或约2个核苷酸至约8个核苷酸。在一些实施方案中,一个或多个靶向部分中的至少两个靶向部分与靶基因的靶序列中的至少两个共有序列足够相同或互补。在一些实施方案中,一个或多个靶向部分各自独立地与靶基因的靶序列中的共有序列足够相同或互补。
在本文所述的工程化多核苷酸的一些实施方案中,一个或多个靶向部分各自独立地包含约2至约15个核苷酸、约2个核苷酸至约10个核苷酸或约2个核苷酸至约8个核苷酸。在本文所述的工程化多核苷酸的一些实施方案中,一个或多个靶向部分各自独立地包含2、3、4、5、6、7、8、9或10个核苷酸。
在本文所述的工程化多核苷酸的一些实施方案中,一个或多个靶向部分包含(1)第一靶向部分,所述第一靶向部分被配置成特异性地结合RNA(例如,mRNA,诸如mRNA前体)的靶序列中的第一靶标序列,和(2)第二靶向部分,所述第二靶向部分被配置为特异性地结合RNA(例如,mRNA,诸如mRNA前体)的靶序列中的第二靶标序列。在一些实施方案中,第一靶标序列包含靶序列中的共有序列。在一些实施方案中,第一靶标序列的共有序列包含约2至约15个核苷酸、约2个核苷酸至约10个核苷酸、或约2个核苷酸至约8个核苷酸。在一些实施方案中,第一靶标序列的共有序列包含2-3、3-4、4-5、5-6、6-7、7-8或8-10个核苷酸。在一些实施方案中,第二靶标序列包含靶序列中的共有序列。在一些实施方案中,第二靶标序列的共有序列包含约2至约15个核苷酸、约2个核苷酸至约10个核苷酸或约2个核苷酸至约8个核苷酸。在一些实施方案中,第二靶标序列的共有序列包含2-3、3-4、4-5、5-6、6-7、7-8或8-10个核苷酸。在一些实施方案中,第一靶标序列的共有序列和第二靶标序列的共有序列具有不同的核苷酸长度。在一些实施方案中,第一和第二靶标序列的共有序列中的一个包含约1至约5个核苷酸,并且第一和第二靶标序列的共有序列中的另一个包含约4至约8个核苷酸。在一些实施方案中,第一和第二靶标序列的共有序列中的一个包含至少约2个核苷酸,并且第一和第二靶标序列的共有序列中的另一个包含至少约5或6个核苷酸。在一些实施方案中,第一和第二靶标序列的共有序列中的一个包含约2个核苷酸,并且第一和第二靶标序列的共有序列中的另一个包含约5或6个核苷酸。
在本文所述的工程化多核苷酸的一些实施方案中,第一靶向部分和第二靶向部分具有不同的核苷酸长度。在一些实施方案中,第一靶向部分和第二靶向部分中的一个包含约1至约5个核苷酸,并且第一靶向部分和第二靶向部分中的另一个包含约4至约8个核苷酸。在一些实施方案中,第一靶向部分和第二靶向部分中的一个包含至少约2个核苷酸,并且第一靶向部分和第二靶向部分中的另一个包含至少约5或6个核苷酸。在一些实施方案中,第一靶向部分和第二靶向部分中的一个包含约2个核苷酸,并且第一靶向部分和第二靶向部分中的另一个包含约5或6个核苷酸。
在一些实施方案中,(例如,第一或第二)靶向部分包含具有至少一个、两个、三个、四个、五个、六个、七个、八个、九个、十个或更多个核苷酸的核酸序列。在一些实施方案中,(例如,第一或第二)靶向部分包含具有至多十个、九个、八个、七个、六个、五个、四个、三个或两个核苷酸的核酸序列。在一些实施方案中,(例如,第一或第二)靶向部分包含具有一个、两个、三个、四个、五个、六个、七个、八个、九个或十个核苷酸、或任何两个前述数值之间的范围的核酸序列。
在一些实施方案中,(例如,第一或第二)靶向部分包含靶向外显子中的核苷酸的核酸序列。在一些实施方案中,(例如,第一或第二)靶向部分包含靶向外显子中紧邻内含子的核苷酸的核酸序列。在一些实施方案中,(例如,第一或第二)靶向部分包含靶向外显子中相邻或紧邻在外显子3'端的内含子的核苷酸的核酸序列。在一些实施方案中,(例如,第一或第二)靶向部分包含靶向外显子中相邻或紧邻在外显子5'端的内含子的核苷酸的核酸序列。在一些实施方案中,(例如,第一或第二)靶向部分包含靶向外显子中的核苷酸的核酸序列,该核酸序列包含5'-AA-3'、5'-AT-3'、5'-AC-3'、5'-AG-3'、5'-TA-3'、5'-TT-3'、5'-TC-3'、5'-TG-3'、5'-CA-3'、5'-CT-3'、5'-CC-3'、5'-CG-3'、5'-GA-3'、5'-GT-3'、5'-GC-3'或5'-GG-3'。在一些实施方案中,(例如,第一或第二)靶向部分包含靶向外显子中紧邻在外显子5'端的内含子的核苷酸的核酸序列。在一些实施方案中,(例如,第一或第二)靶向部分包含靶向外显子中与内含子相邻的核苷酸的核酸序列,该核酸序列包含5'-AA-3'、5'-AT-3'、5'-AC-3'、5'-AG-3'、5'-TA-3'、5'-TT-3'、5'-TC-3'、5'-TG-3'、5'-CA-3'、5'-CT-3'、5'-CC-3'、5'-CG-3'、5'-GA-3'、5'-GT-3'、5'-GC-3'或5'-GG-3'。在一些实施方案中,(例如,第一或第二)靶向部分包含靶向外显子中紧邻在外显子5'端的内含子的核苷酸的核酸序列。在一些实施方案中,(例如,第一或第二)靶向部分包含靶向外显子中在内含子5'的核苷酸的核酸序列,该核酸序列包含5'-AA-3'、5'-AT-3'、5'-AC-3'、5'-AG-3'、5'-TA-3'、5'-TT-3'、5'-TC-3'、5'-TG-3'、5'-CA-3'、5'-CT-3'、5'-CC-3'、5'-CG-3'、5'-GA-3'、5'-GT-3'、5'-GC-3'或5'-GG-3'。在一些实施方案中,(例如,第一或第二)靶向部分包含靶向外显子中在内含子3'的核苷酸的核酸序列,该核酸序列包含5'-AA-3'、5'-AT-3'、5'-AC-3'、5'-AG-3'、5'-TA-3'、5'-TT-3'、5'-TC-3'、5'-TG-3'、5'-CA-3'、5'-CT-3'、5'-CC-3'、5'-CG-3'、5'-GA-3'、5'-GT-3'、5'-GC-3'或5'-GG-3'。在一些实施方案中,(例如,第一或第二)靶向部分包含靶向外显子中不紧邻内含子的核苷酸的核酸序列,该核酸序列包含5'-AA-3'、5'-AT-3'、5'-AC-3'、5'-AG-3'、5'-TA-3'、5'-TT-3'、5'-TC-3'、5'-TG-3'、5'-CA-3'、5'-CT-3'、5'-CC-3'、5'-CG-3'、5'-GA-3'、5'-GT-3'、5'-GC-3'或5'-GG-3'。
在一些实施方案中,(例如,第一或第二)靶向部分包含靶向内含子中的核苷酸的核酸序列。在一些实施方案中,(例如,第一或第二)靶向部分包含靶向内含子中邻近或紧邻外显子的核苷酸的核酸序列。在一些实施方案中,(例如,第一或第二)靶向部分包含靶向内含子中邻近或紧邻在内含子5'端的外显子的核苷酸的核酸序列。在一些实施方案中,(例如,第一或第二)靶向部分包含靶向内含子中邻近或紧邻在内含子5'端的外显子的核苷酸的核酸序列。在一些实施方案中,(例如,第一或第二)靶向部分包含靶向完全位于内含子内的核苷酸的核酸序列。在一些实施方案中,(例如,第一或第二)靶向部分包含靶向内含子中与外显子相邻的核苷酸的核酸序列,该核酸序列包含5'-AA-3'、5'-AT-3'、5'-AC-3'、5'-AG-3'、5'-TA-3'、5'-TT-3'、5'-TC-3'、5'-TG-3'、5'-CA-3'、5'-CT-3'、5'-CC-3'、5'-CG-3'、5'-GA-3'、5'-GT-3'、5'-GC-3'或5'-GG-3'。在一些实施方案中,(例如,第一或第二)靶向部分包含靶向内含子中且紧邻在内含子5'端的外显子的核苷酸的核酸序列,该核酸序列包含5'-AA-3'、5'-AT-3'、5'-AC-3'、5'-AG-3'、5'-TA-3'、5'-TT-3'、5'-TC-3'、5'-TG-3'、5'-CA-3'、5'-CT-3'、5'-CC-3'、5'-CG-3'、5'-GA-3'、5'-GT-3'、5'-GC-3'或5'-GG-3'。在一些实施方案中,(例如,第一或第二)靶向部分包含靶向内含子中且紧邻在内含子3'端的外显子的核苷酸的核酸序列,该核酸序列包含5'-AA-3'、5'-AT-3'、5'-AC-3'、5'-AG-3'、5'-TA-3'、5'-TT-3'、5'-TC-3'、5'-TG-3'、5'-CA-3'、5'-CT-3'、5'-CC-3'、5'-CG-3'、5'-GA-3'、5'-GT-3'、5'-GC-3'或5'-GG-3'。在一些实施方案中,(例如,第一或第二)靶向部分包含靶向内含子中不与外显子相邻的核苷酸的核酸序列,该核酸序列包含5'-AA-3'、5'-AT-3'、5'-AC-3'、5'-AG-3'、5'-TA-3'、5'-TT-3'、5'-TC-3'、5'-TG-3'、5'-CA-3'、5'-CT-3'、5'-CC-3'、5'-CG-3'、5'-GA-3'、5'-GT-3'、5'-GC-3'或5'-GG-3'。
在本文所述的工程化多核苷酸的一些实施方案中,(例如,第一或第二)靶向部分包含与表1中列出的序列至少70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同或互补的序列。在本文所述的工程化多核苷酸的一些实施方案中,(例如,第一或第二)靶向部分包含与表1中列出的序列相同或互补的序列。在一些实施方案中,(例如,第一或第二)靶向部分包含与选自表1的5'-靶向部分序列栏和表1的3'-靶向部分序列栏的序列至少70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同或互补的序列。在一些实施方案中,(例如,第一或第二)靶向部分包含与选自表1的5'-靶向部分序列栏和表1的3'-靶向部分序列栏的序列相同或互补的序列。
在一些实施方案中,第一靶向部分包含与选自表1的5'-靶向部分序列栏的序列至少70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%相同或互补的序列;且第二靶向部分包含与表1列出的3'-靶向部分序列栏中列出的序列至少70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同或互补的序列。在一些实施方案中,第一靶向部分包含与选自表1的5'-靶向部分序列栏的序列相同或互补的序列;第二靶向部分包含与表1的3'-靶向部分序列栏中列出的序列相同或互补的序列。在一些实施方案中,第一靶向部分包含与表1的3'-靶向部分序列栏中列出的序列至少70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%相同或互补的序列;且第二靶向部分包含与表1的5'-靶向部分序列栏中列出的序列至少70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同或互补的序列。在一些实施方案中,第一靶向部分包含与表1的3'-靶向部分序列栏中列出的序列相同或互补的序列;并且第二靶向部分包含与表1的5'-靶向部分序列栏中列出的序列相同或互补的序列。在一些实施方案中,(例如,第一或第二)靶向部分包含与内含子供体位点(例如,选自GU、GT、GC和CA)的共有序列相同或互补的序列。在一些实施方案中,(例如,第一或第二)靶向部分包含与外显子供体位点(例如,G)的共有序列相同或互补的序列。在一些实施方案中,(例如,第一或第二)靶向部分包含与选自GU、GC、G和CA的共有序列相同或互补的序列。
表1.由工程化多核苷酸的5'和3'-靶向部分所靶向的MAPT基因外显子-内含子连接序列的示例以及两个靶序列之间的距离
示例共有序列包括:(例如,5'-)内含子供体位点#1:GU;(例如,5'-)内含子供体位点#2:GC;(例如,5'-)外显子供体位点#1:G;和(例如,5'-)内含子供体位点#3:CA。
靶序列
在本文所述的工程化多核苷酸的一些实施方案中,第一靶标序列和第二靶标序列在靶序列中相隔不超过五个、四个或三个核苷酸(例如,一个或两个核苷酸)的间隔序列。
在本文所述的工程化多核苷酸的一些实施方案中,第一靶标序列和第二靶标序列彼此连续或相邻。
在一些实施方案中,当靶序列中的间隔序列与靶序列的靶标序列的5'-或3'-端相邻时,间隔序列可以不与工程化多核苷酸的靶向部分互补。在一些实施方案中,当靶序列中的间隔序列与靶序列的靶标序列的5'-或3'-端相邻时,间隔序列可以不与工程化多核苷酸的任何靶向部分互补。
在一些实施方案中,间隔序列将本文所述的第一靶标序列和第二靶向序列隔开。在一些实施方案中,间隔序列与工程化多核苷酸的靶向部分不互补也不结合。在一些实施方案中,间隔序列与工程化多核苷酸的所有靶向部分不互补也不结合。
在本文所述的工程化多核苷酸的一些实施方案中,靶序列可包含RNA(例如,mRNA,诸如mRNA前体)中的外显子-内含子边界。在一些实施方案中,第一靶标序列和第二靶标序列均位于外显子-内含子边界的5'或3'。在一些实施方案中,第一靶标序列和第二靶标序列中的一个位于外显子-内含子边界的5',且第一靶标序列和第二靶标序列中的另一个位于外显子-内含子边界的3'。
在本文所述的工程化多核苷酸的一些实施方案中,靶序列包含RNA(例如,mRNA,诸如mRNA前体)中的剪接位点。在一些实施方案中,(例如,第一或第二)靶标序列包含RNA(例如,mRNA,诸如mRNA前体)中的剪接位点(例如,5'ss)。
在一些实施方案中,两个靶标序列(例如,第一靶标序列和第二靶标序列)为单个核酸分子(即,RNA,例如,mRNA,诸如mRNA前体)的一部分。在一些实施方案中,第一和第二靶标序列在单个核酸分子上跨越隔开。在一些实施方案中,第一和第二靶标序列跨越单个核酸分子的外显子-内含子边界。在一些实施方案中,第一和第二靶标序列不跨越单个核酸分子的外显子-内含子边界。在一些实施方案中,第一和第二靶标序列与单个核酸分子的外显子-内含子边界相邻。在一些实施方案中,第一和第二靶标序列均靶向单个核酸分子的内含子。在一些实施方案中,第一和第二靶标序列跨越单个核酸分子中的剪接位点。在一些实施方案中,第一和第二靶标核酸序列不跨越单个核酸分子中的剪接位点。
在本文所述的工程化多核苷酸的一些实施方案中,靶序列中的共有序列包含约2至约15个核苷酸、约2个核苷酸至约10个核苷酸或约2个核苷酸至约8个核苷酸。
在一些实施方案中,工程化多核与靶序列互补且结合。在一些实施方案中,工程化多核苷酸的至少一部分结合靶序列。在一些实施方案中,靶序列编码靶基因。靶基因的非限制性示例可以包括微管相关蛋白tau(MAPT)。
在一些实施方案中,靶序列包括RNA序列。在一些实施方案中,RNA为核RNA、细胞质RNA或线粒体RNA。在一些实施方案中,靶RNA序列包括信使RNA(mRNA)、信使RNA前体(mRNA前体)、转运RNA(tRNA)、核糖体RNA(rRNA)、核酶、重组多核苷酸、分支多核苷酸、分离的RNA、指导RNA、寡核苷酸、核酸探针、引物、snRNA、长非编码RNA、小RNA、snoRNA、siRNA、miRNA、tRNA衍生的小RNA(tsRNA)、反义RNA、shRNA或小rDNA衍生的RNA(srRNA)。在一些实施方案中,靶RNA序列为mRNA前体。在一些实施方案中,工程化多核苷酸不是反义寡核苷酸。
在一些实施方案中,靶RNA序列包含至少一个外显子。在一些实施方案中,靶RNA序列包含至少一个内含子。在一些实施方案中,靶RNA序列包含至少一个外显子或至少一个内含子。在一些实施方案中,靶RNA序列包含至少一个外显子-内含子边界。
在一些实施方案中,靶序列为内源核酸分子。在一些实施方案中,工程化多核苷酸通过碱基配对诸如Watson-Crick碱基配对与靶序列结合。
募集部分
募集部分包含发夹结构。发夹可以是完整的发夹或者可以由内环间插。发夹结构可由13至17个核苷酸组成。募集部分可以与U1 snRNA的茎环II相互作用。U1-A还可以结合U1 snRNA的茎环II。茎环II与发夹/内环区域的氢桥可以间接调谐U1-A的聚腺苷酸化和乙酰化信号传导。募集部分可以不沉默茎环II中U1-A的锚定结构域。这种相互作用可以调谐基因表达和乙酰化。
在本文所述的工程化多核苷酸的一些实施方案中,募集部分包含与表2中列出的序列至少70%、80%、85%或90%相同或互补的核苷酸序列。在一些实施方案中,募集部分包含与表2中列出的序列相同或互补的核苷酸序列。在一些实施方案中,工程化多核苷酸包含与选自SEQ ID NO:1-4的任意序列至少70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同或互补的核苷酸序列。在一些实施方案中,工程化多核苷酸包含与选自SEQ ID NO:1-4的任意序列至少70%、80%、85%或90%相同或互补的核苷酸序列。在一些实施方案中,工程化多核苷酸包含与选自SEQ ID NO:1-4的任意序列相同或互补的核苷酸序列。
表2.本文所述的工程化多核苷酸的示例募集部分
在本文所述的一些实施方案中,工程化多核苷酸(例如,募集部分)包含(例如,二级的)结构特点(见图2A-2D)。在一些实施方案中,工程化多核苷酸(例如,募集部分)包含顶环、上茎、内环、下茎或其组合。在一些实施方案中,工程化多核苷酸(例如,募集部分)包含与茎(例如,下茎或上茎)相邻的环(例如,内环),所述茎包含两个互补的茎序列。在一些实施方案中,茎(例如,下茎或上茎)的茎序列包含不超过约五个、四个或三个核苷酸。在一些实施方案中,环为与茎(例如,下茎)和另一茎(例如,上茎)相邻的内环,另一茎包含两个互补的茎序列。在一些实施方案中,内环包含具有不超过10、9或8个核苷酸的核酸序列。在一些实施方案中,另一茎(例如,上茎)的茎序列包含不超过约五个、四个或三个核苷酸。在一些实施方案中,工程化多核苷酸(例如,募集部分)还包含顶环。在一些实施方案中,顶环包含具有不超过10、9、8、7、6或5个核苷酸的核酸序列。
在本文所述的工程化多核苷酸的一些实施方案中,募集部分包含约10至约30个核苷酸、约10至约25个核苷酸、或约10至约20个核苷酸。
在一些实施方案中,募集部分与转录后调节部分(或调节部分)(例如,剪接体部分)部分地互补,所述转录后调节部分包含核糖核蛋白复合物。例如,募集部分可以与包含剪接体核糖核蛋白复合物的调节部分部分地互补,其中剪接体核糖核蛋白复合物包含小核核糖核酸(snRNA)。在一些实施方案中,募集部分与本文所述的靶序列不互补也不结合。例如,募集部分与本文所述的mRNA前体不互补也不结合。
结构配置
在本文所述的工程化多核苷酸的一些实施方案中,第一和第二靶向部分中的一个位于募集部分的5',且第一和第二靶向部分中的另一个位于募集部分的3'。
在一些实施方案中,工程化多核苷酸具有从5'-末端到3'-末端如下的结构排列:第一靶向部分、募集部分和第二靶向部分。在一些实施方案中,工程化多核苷酸具有从5'-末端到3'-末端如下的结构排列:第二靶向部分、募集部分和第一靶向部分。
示例多核苷酸
在本文所述的工程化多核苷酸的一些实施方案中,工程化多核苷酸包含约10至约40个核苷酸、约10至约35个核苷酸、约10至约30个核苷酸或约10至约25个核苷酸。在一些实施方案中,工程化多核苷酸包含至少约5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、45、50或更多个核苷酸的长度。在一些实施方案中,工程化多核苷酸包含至少约5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、45、50或更少个核苷酸的长度。在一些实施方案中,工程化多核苷酸包含至少约5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、45、50个核苷酸或任意两个前述数值之间的范围的长度。
在本文所述的工程化多核苷酸的一些实施方案中,募集部分包含与表3中列出的序列至少70%、80%、85%或90%相同或互补的核苷酸序列。在一些实施方案中,募集部分包含与表3中列出的序列相同或互补的核苷酸序列。
表3.包含募集部分和靶向部分的工程化多核苷酸的示例序列
序列号 序列 核苷酸长度
5 gtccactaacctttcaggccagcg 24nt_ ASMO1
6 guccacuaaccuuucaggccagcg 24nt_ ASMO1
7 gcatcgtcagcttaccttgg 20nt ASMO2
8 gcaucgucagcuuaccuugg 20nt ASMO2
在一些实施方案中,工程化多核苷酸可以由工程化多核苷酸的前体产生。在一些情况下,工程化多核苷酸的前体可以为线性的。例如,工程化多核苷酸的前体可以为从质粒转录的线性多核苷酸。在另一个示例中,工程化多核苷酸的前体可被构建为具有允许工程化多核苷酸在细胞中环化的部分诸如核酶部分和连接部分的线性多核苷酸。具有连接和核酶部分的线性工程化多核苷酸可以转染到细胞中,在细胞中它可以被环化。在一些情况下,工程化多核苷酸可以为环状的。在一些情况下,工程化多核苷酸包含DNA、RNA或两者。在一些情况下,工程化多核苷酸的前体包含工程化多核苷酸的前体。在一些情况下,工程化多核苷酸的前体可用于产生工程化多核苷酸。
在一些实施方案中,工程化多核苷酸包含至少一种二级结构(诸如本文任何地方描述的那些)。例如,工程化多核苷酸包含至少一种、两种、三种、四种或更多种二级结构,其中二级结构可以为顶环、茎、茎环或内环中的任一种或任意组合。在一些实施方案中,多核苷酸的募集部分包含至少一种、两种、三种、四种或更多种二级结构。在一些实施方案中,靶向部分不具有二级结构。在一些实施方案中,二级结构为包含至少两个、三个、四个、五个、六个、七个、八个、九个、10个或更多个核苷酸的顶环。在一些实施方案中,顶环与调节部分互补且结合。在一些实施方案中,顶环与调节部分不互补也不结合。在一些实施方案中,二级结构为至少一个茎。在一些实施方案中,工程化多核苷酸包含两个茎,其中一个为靠近顶环的上茎,而另一个为更靠近靶向部分的下茎。在一些实施方案中,上茎包含至少两个、四个、六个、八个、10个或更多个核苷酸,其中核苷酸配对以形成上茎。在一些实施方案中,上茎与调节部分互补且结合。在一些实施方案中,上茎与调节部分不互补也不结合。在一些实施方案中,二级结构为下茎,其中下茎包含至少两个、四个、六个、八个、10个或更多个核苷酸,其中核苷酸配对以形成下茎。在一些实施方案中,下茎与调节部分互补且结合。在一些实施方案中,下茎与调节部分不互补也不结合。在一些实施方案中,工程化多核苷酸包含上茎和下茎之间的内环。在一些实施方案中,内环包含至少两个、三个、四个、五个、六个、七个、八个、九个、10个或更多个核苷酸。在一些实施方案中,内环与调节部分互补且结合。在一些实施方案中,内环与调节部分不互补也不结合。在一些实施方案中,工程化多核苷酸包含二级结构,该二级结构包含顶环、上茎、内环和下茎,其中上茎和内环与调节部分至少部分地互补且结合。在一些实施方案中,上茎和内环与包含snRNA的调节部分互补且结合。在一些实施方案中,snRNA为U1 snRNA,诸如US-A snRNA。在一些实施方案中,snRNA为U2snRNA。
在一些实施方案中,至少一种二级结构的核酸序列与包含核糖核蛋白复合物的调节部分部分地互补。在一些实施方案中,至少一种二级结构的核酸序列与靶标核酸序列为不互补的。在一些实施方案中,工程化多核苷酸包含至少一种核酸的二级结构。在一些实施方案中,工程化多核苷酸包含核酸的至少一种、两种、三种、四种或更多种二级结构。在一些实施方案中,至少一种二级结构增加募集部分和调节部分之间的结合。在一些实施方案中,至少一种二级结构使调节部分的装配稳定化。在一些实施方案中,至少一种二级结构使调节部分与其他附加部分的装配稳定化。在一些实施方案中,至少一种二级结构增加由靶序列编码的基因的表达或活性的调谐效率。在一些实施方案中,至少一种二级结构增加由靶序列编码的基因的表达或活性的调谐特异性。在一些实施方案中,至少一种二级结构增加工程化多核苷酸对水解降解的抗性。在一些实施方案中,至少一种二级结构增加工程化多核苷酸对核酸酶消化降解的抗性。在一些实施方案中,至少一种二级结构增加工程化多核苷酸的半衰期。在一些实施方案中,至少一种二级结构减少由工程化多核苷酸诱导的免疫原性。
在一些实施方案中,工程化多核苷酸的特征在于二级结构。在一些实施方案中,二级结构包含一种或多种茎环结构。在一些实施方案中,二级结构包括顶环、上茎、内环和下茎。在一些实施方案中,工程化多核苷酸包含至少一种二级结构。在一些实施方案中,第一或第二靶向部分不是二级结构的一部分。在一些实施方案中,工程化多核苷酸包含至少一种、两种、三种、四种或更多种二级结构。在一些实施方案中,工程化多核苷酸包含二级结构,所述二级结构包含茎环、十字形、趾部(toe hold)、错配凸起或其任何组合。在一些实施方案中,工程化多核苷酸包含二级结构,所述二级结构包含顶环、上茎、内环或下茎。在一些实施方案中,工程化多核苷酸包含二级结构,所述二级结构包含顶环、上茎、内环和下茎。在一些情况下,二级结构可包含茎、发夹环、假结、凸起、内环、多环、G-四联体、或其任何组合。在一些实施方案中,工程化多核苷酸可以采用A-形式、B-形式、Z-形式或其任何组合。在一些实施方案中,二级结构至少部分地基于工程化多核苷酸的核苷酸序列形成。在一些实施方案中,二级结构在工程化多核苷酸的核苷酸序列内形成。
在一些实施方案中,至少一种二级结构增加募集部分和调节部分之间的结合。在一些实施方案中,与没有二级结构的募集部分与调节部分之间的结合相比,至少一种二级结构使募集部分和调节部分之间的结合增加至少10%、20%、30%、40%、50%、60%、70%、80%、90%、增加至2倍、3倍、4倍、5倍、10倍或更多。
在一些实施方案中,至少一种化学修饰增加募集部分和调节部分之间的结合。在一些实施方案中,与没有对调节部分进行化学修饰的募集部分之间的结合相比,至少一种化学修饰使募集部分和调节部分之间的结合增加至少10%、20%、30%、40%、50%、60%、70%、80%、90%,增加至2倍、3倍、4倍、5倍、10倍或更多。
在一些实施方案中,当调节部分与靶序列相关联时,工程化多核苷酸的至少一种化学修饰使包含调节部分的剪接体的装配稳定化。在一些实施方案中,与没有化学修饰的可比多核苷酸相比,由包含化学修饰的工程化多核苷酸对包含调节部分的剪接体的装配稳定化至少10%、20%、30%、40%、50%、60%、70%、80%、90%、增加至2倍、3倍、4倍、5倍、10倍或更多。在一些实施方案中,调节部分为剪接体的U1(U1SNP)、U2(U2SNP)、U4、U5、U6、U11、U12、U14或U16。在一些实施方案中,调节部分为剪接体的U1SNP。在一些实施方案中,调节部分为剪接体的U1-A。在一些实施方案中,调节部分为剪接体的U2SNP。在一些实施方案中,工程化多核苷酸的至少一种化学修饰使包含调节部分和至少一种附加部分的剪接体的装配稳定化。例如,工程化多核苷酸的至少一种化学修饰稳定剪接体的装配,所述剪接体包含含有U1-A的调节部分和至少一种含有U1-70K、UC-1、SmD1、SmD2、SmD3、SmE、SmF或SmG的附加部分。在一些实施方案中,至少一个附加部分为剪接体的U4、U5、U6、U11、U12、U14或U16。
在一些实施方案中,与没有化学修饰的可比多核苷酸相比,至少一种化学修饰提高工程化多核苷酸调谐由靶序列编码的基因的表达或活性的效率。在一些实施方案中,与没有化学修饰的可比多核苷酸调谐由靶序列编码的基因的表达或活性的效率相比,工程化多核苷酸调谐由靶序列编码的基因的表达或活性的效率增加至少10%、20%、30%、40%、50%、60%、70%、80%、90%、增加至2倍、3倍、4倍、5倍、10倍或更多。
在一些实施方案中,与没有化学修饰的可比多核苷酸相比,至少一种化学修饰增加工程化多核苷酸调谐由靶序列编码的基因的表达或活性的特异性。在一些实施方案中,与没有化学修饰的可比多核苷酸调谐由靶序列编码的基因的表达或活性的效率相比,工程化多核苷酸调谐由靶序列编码的基因的表达或活性的特异性增加至少10%、20%、30%、40%、50%、60%、70%、80%、90%、增加至2倍、3倍、4倍、5倍、10倍或更多。
在一些实施方案中,至少一种化学修饰增加工程化多核苷酸对水解降解的抗性。在一些实施方案中,与没有化学修饰的可比工程化多核苷酸的抗性相比,至少一种化学修饰增加工程化多核苷酸对水解降解的抗性。在一些实施方案中,与没有化学修饰的可比工程化多核苷酸的抗性相比,包含至少一种化学修饰的工程化多核苷酸对水解降解的抗性增加至少10%、20%、30%、40%、50%、60%、70%、80%、90%、增加至2倍、3倍、4倍、5倍、10倍或更多。
在一些实施方案中,至少一种化学修饰增加工程化多核苷酸对核酸酶消化降解的抗性。在一些实施方案中,与没有化学修饰的可比工程化多核苷酸的抗性相比,至少一种化学修饰增加工程化多核苷酸对核酸酶消化降解的抗性。在一些实施方案中,与没有化学修饰的可比工程化多核苷酸的抗性相比,包含至少一种化学修饰的工程化多核苷酸对核酸酶消化降解的抗性增加至少10%、20%、30%、40%、50%、60%、70%、80%、90%、增加至2倍、3倍、4倍、5倍、10倍或更多。
在一些实施方案中,与没有化学修饰的可比工程化多核苷酸的半衰期相比,至少一种化学修饰增加工程化多核苷酸的半衰期。在一些实施方案中,与没有化学修饰的可比工程化多核苷酸的半衰期相比,包含至少一种化学修饰的工程化多核苷酸的半衰期增加至少10%、20%、30%、40%、50%、60%、70%、80%、90%、增加至2倍、3倍、4倍、5倍、10倍或更多。化学修饰增加工程化多核苷酸的半衰期。
在一些实施方案中,至少一种化学修饰减少由工程化多核苷酸诱导的免疫原性。在一些实施方案中,与没有化学修饰的可比工程化多核苷酸的免疫原性相比,至少一种化学修饰减少由工程化多核苷酸诱导的免疫原性。在一些实施方案中,与没有化学修饰的可比工程化多核苷酸的免疫原性相比,包含至少一种化学修饰的工程化多核苷酸的免疫原性减少至少10%、20%、30%、40%、50%、60%、70%、80%、90%、减少至1/2、1/3、1/4、1/5、1/10或更少。
化学修饰
在本文所述的一些实施方案中,工程化多核苷酸包含至少一种化学修饰。
在一些实施方案中,靶向部分的所有核苷酸均通过硫代磷酸酯键连接。在一些实施方案中,靶向部分的所有核苷酸均包含2'O-甲基修饰。2'修饰可以预防核酸酶降解并且/或者增加靶向部分与mRNA前体靶标的亲和力。
在一些实施方案中,募集部分的所有核苷酸均通过硫代磷酸酯键连接。在一些实施方案中,募集部分的三个核苷酸包含2'O-甲基修饰。2'修饰可以诱导募集部分的分子动力学变化,从而促进U1-snRNA的茎环II的构象改变以及募集部分与U1-snRNA的结合。
在一些实施方案中,工程化多核苷酸包含至少一个2'-修饰的(例如,2'-甲氧基、2'-甲氧基甲基或2'-甲氧基乙基)核苷酸。在一些实施方案中,工程化多核苷酸的至少约50%、60%、70%、80%或90%核苷酸为化学修饰的核苷酸。在一些实施方案中,工程化多核苷酸的至少约50%、60%、70%、80%或90%核苷酸为2'-修饰的(例如,2'-甲氧基、2'-甲氧基甲基或2'-甲氧基乙基)核苷酸。在一些实施方案中,工程化多核苷酸包含至少一个硫代磷酸酯核苷酸间键。在一些实施方案中,工程化多核苷酸的至少约50%、60%、70%、80%或90%的核苷酸间键合被化学修饰。在一些实施方案中,至少约50%、60%、70%、80%或90%核苷酸间键合为硫代磷酸酯。
在一些实施方案中,工程化多核苷酸包含核酸的至少一种化学修饰。在一些实施方案中,工程化多核苷酸包含核酸的至少一种、两种、三种、四种或更多种化学修饰。在一些实施方案中,至少一种化学修饰增加募集部分与调节部分之间的结合。在一些实施方案中,至少一种化学修饰使调节部分的装配稳定化。在一些实施方案中,至少一种化学修饰使调节部分与其他附加部分的装配稳定化。在一些实施方案中,至少一种化学修饰增加调谐由靶序列编码的基因的表达或活性的效率。在一些实施方案中,至少一种化学修饰增加调谐由靶序列编码的基因的表达或活性的特异性。在一些实施方案中,至少一种化学修饰增加工程化多核苷酸对水解降解的抗性。在一些实施方案中,至少一种化学修饰增加工程化多核苷酸对核酸酶消化降解的抗性。在一些实施方案中,至少一种化学修饰增加工程化多核苷酸的半衰期。在一些实施方案中,至少一种化学修饰减少由工程化多核苷酸诱导的免疫原性。
在一些实施方案中,工程化多核苷酸的化学修饰包括工程化多核苷酸的磷酸二酯主链键合中的一个或两个非连接磷酸酯氧原子的至少一个取代。在一些实施方案中,工程化多核苷酸的至少一种化学修饰包括工程化多核苷酸的磷酸二酯主链键合中的一个或多个连接的磷酸酯氧原子的取代。磷酸酯氧原子的化学修饰的非限制性示例为硫原子。附加的非限制性示例包括在表3中。在一些实施方案中,工程化多核苷酸的化学修饰包括对工程化多核苷酸的核苷酸的糖的至少一种化学修饰。在一些实施方案中,工程化多核苷酸的化学修饰包括对核苷酸的糖的至少一种化学修饰,其中化学修饰包括至少一种锁核酸(LNA)。在一些实施方案中,工程化多核苷酸的化学修饰包括对包含至少一种解锁核酸(UNA)的工程化多核苷酸的核苷酸的糖的至少一种化学修饰。在一些实施方案中,工程化多核苷酸的化学修饰包括对糖的至少一种化学修饰,包括对糖的成分的修饰,其中糖为核糖的糖。在一些实施方案中,工程化多核苷酸的化学修饰包括对包含2'-O-甲基基团的工程化多核苷酸的核苷酸的核糖糖成分的至少一种化学修饰。在一些实施方案中,化学修饰包含2'-F-RNA,而不是2'-O-甲基修饰。在这种情况下,2'-F-RNA和mRNA前体双链体不激活RNAse H(通过核酸酶消化降解),并且通过比2'-O-甲基-RNA和mRNA前体双链体更高的解链温度(Tm)来确定其更稳定。
在一些实施方案中,工程化多核苷酸的化学修饰包括至少一种化学修饰,所述化学修饰包括用去磷酸接头置换工程化多核苷酸的磷酸部分。在一些实施方案中,工程化多核苷酸的化学修饰包括工程化多核苷酸的磷酸酯主链的至少一种化学修饰。在一些实施方案中,工程化多核苷酸包含硫代磷酸酯基团。在一些实施方案中,工程化多核苷酸的化学修饰包括至少一种化学修饰,所述化学修饰包括对工程化多核苷酸的核苷酸碱基的修饰。在一些实施方案中,工程化多核苷酸的化学修饰包括至少一种化学修饰,所述化学修饰包含核苷酸的非天然碱基。在一些实施方案中,工程化多核苷酸的化学修饰包括至少一种化学修饰,所述化学修饰包含吗啉代基团、环丁基基团、吡咯烷基团或肽核酸(PNA)核苷替代物。在一些实施方案中,工程化多核苷酸的化学修饰包括至少一种化学修饰,所述化学修饰包含至少一种立体纯核酸。在一些实施方案中,至少一种化学修饰可以位于工程化多核苷酸的5'端附近。在一些实施方案中,至少一种化学修饰可以位于工程化多核苷酸的3'端附近。在一些实施方案中,至少一种化学修饰可以位于工程化多核苷酸的5'和3'端二者附近。
在一些实施方案中,工程化多核苷酸的至少一种化学修饰包括任一项或任意组合的修饰:磷酸二酯主链键合中的一个或两个非连接磷酸酯氧的修饰;磷酸二酯主链键合中的一个或多个连接的磷酸酯氧的修饰;核糖糖成分的修饰;用“去磷酸”接头置换磷酸部分;天然存在的核碱基的修饰或置换;核糖-磷酸酯主链的修饰;多核苷酸5'端的修饰;多核苷酸3'端的修饰;脱氧核糖磷酸酯主链的修饰;磷酸酯基团的取代;核糖磷酸酯主链的修饰;对核苷酸糖的修饰;对核苷酸碱基的修饰;或核苷酸的立体纯。对工程化多核苷酸的示例化学修饰可见于表4。
表4.示例化学修饰
磷酸酯主链的修饰
在一些实施方案中,化学修饰包括磷酸二酯主链键合中的一个或两个非连接磷酸酯氧的修饰或磷酸二酯主链键合中的一个或多个连接的磷酸酯氧的修饰。如本文所用,“烷基”意指直链或支链的饱和烃基。烷基基团示例包括甲基(Me)、乙基(Et)、丙基(例如,正丙基或异丙基)、丁基(例如,正丁基、异丁基或叔丁基)或戊基(例如,正戊基、异戊基或新戊基)。烷基基团可含有从1至约20、从2至约20、从1至约12、从1至约8、从1至约6、从1至约4、或从1至约3个碳原子。如本文所用,“芳基”是指单环或多环(例如,具有2、3或4个稠合环)芳族烃,例如苯基、萘基、蒽基、菲基、茚满基或茚基。在一些实施方案中,芳基基团具有从6至约20个碳原子。如本文所用,“烯基”是指含有至少一个双键的脂族基团。如本文所用,“炔基”是指含有2-12个碳原子的直链或支链烃链,其特征在于具有一个或多个三键。炔基基团的示例可以包括乙炔基、炔丙基或3-己炔基。“芳基烷基”或“芳烷基”是指其中烷基氢原子被芳基基团置换的烷基部分。芳烷基包括其中多于一个氢原子被芳基基团置换的基团。“芳基烷基”或“芳烷基”的示例包括苄基、2-苯基乙基、3-苯基丙基、9-芴基、二苯甲基和三苯甲基。“环烷基”是指具有3至12个碳的环状、双环、三环或多环非芳族烃基。环烷基部分的示例包括但不限于环丙基、环戊基和环己基。“杂环基”是指杂环系统的一价基团。代表性杂环基包括但不限于四氢呋喃基、四氢噻吩基、吡咯烷基、吡咯烷酮基、哌啶基、吡咯啉基、哌嗪基、二噁烷基、二氧戊环基、二氮杂卓基、氧氮杂卓基、硫氮杂卓基和吗啉代。“杂芳基”是指杂芳环系统的一价基团。杂芳基部分的示例可以包括咪唑基、噁唑基、噻唑基、三唑基、吡咯基、呋喃基、吲哚基、噻吩基、吡唑基、吡啶基、吡嗪基、哒嗪基、嘧啶基、吲嗪基、嘌呤基、萘啶基、喹啉基和蝶啶基。
在一些实施方案中,化学修饰的核苷酸的磷酸酯基团可以通过用不同的取代基置换一个或多个氧来修饰。在一些实施方案中,化学修饰的核苷酸可以包括用如本文所述的修饰的磷酸酯置换未修饰的磷酸酯部分。在一些实施方案中,磷酸酯主链的修饰可以包括导致不带电荷的接头或具有不对称电荷分布的带电荷接头的改变。修饰的磷酸酯基团的示例可以包括硫代磷酸酯、硫代乙酸膦酸酯、硒代磷酸酯、硼烷磷酸酯、硼烷磷酸酯酯类、氢膦酸酯、氨基磷酸酯、烷基或芳基膦酸酯和磷酸三酯。在一些实施方案中,磷酸酯主链部分中的非桥连磷酸酯氧原子的一个可以被以下任意基团置换:硫(S)、硒(Se)、BR3(其中R可以为,例如,氢、烷基或芳基)、C(例如烷基、芳基等)、H、NR2(其中R可以为,例如,氢、烷基或芳基)或OR(其中R可以为,例如,烷基或芳基)。未修饰的磷酸酯基团中的磷原子可以为非手性的。然而,用上述原子或原子基团的一个置换非桥连氧的一个可以使磷原子具有手性。以这种方式修饰的磷酸酯基团中的磷原子为立体中心。立体异构磷原子可以具有“R”构型(本文中Rp)或“S”构型(本文中Sp)。在一些情况下,工程化多核苷酸包含立体纯核苷酸,所述立体纯核苷酸包含硫代磷酸酯的S构象或硫代磷酸酯的R构象。在一些实施方案中,手性磷酸酯产物以50%、60%、70%、80%、90%或更多的非对映体过量存在。在一些实施方案中,手性磷酸酯产物以95%的非对映体过量存在。在一些实施方案中,手性磷酸酯产物以96%的非对映体过量存在。在一些实施方案中,手性磷酸酯产物以97%的非对映体过量存在。在一些实施方案中,手性磷酸酯产物以98%的非对映体过量存在。在一些实施方案中,手性磷酸酯产物以99%的非对映体过量存在。在一些实施方案中,二硫代磷酸酯的两个非桥连氧均可被硫置换。二硫代磷酸酯中的磷中心可以是非手性的,这阻止寡核糖核苷酸非对映异构体的形成。在一些实施方案中,对一个或两个非桥连氧的修饰还可以包括用独立地选自S、Se、B、C、H、N和OR(R可以为,例如,烷基或芳基)的基团置换非桥连氧。在一些实施方案中,还可以通过用氮(桥连的氨基磷酸酯)、硫(桥连的硫代磷酸酯)和碳(桥连的亚甲基膦酸酯)置换桥连氧(即,将磷酸酯连接至核苷的氧)来修饰磷酸酯接头。置换可以发生在一个或两个连接的氧上。
在某些实施方案中,核酸包含连接的核酸。核酸可以使用任何核酸间键合连接在一起。核酸间连接基团的两类主要由磷原子的存在或不存在来定义。代表性的含磷核酸间键合包括但不限于磷酸二酯、磷酸三酯、甲基膦酸酯、氨基磷酸酯和硫代磷酸酯(P=S)。代表性的不含磷的核酸间连接基团包括但不限于亚甲基甲基亚氨基(-CH2-N(CH3)-O-CH2-)、硫代二酯(-OC(O)-S-)、硫代氨基甲酸酯(-OC(O)(NH)-S-);硅氧烷(-O-Si(H)2-O-);和N,N'-二甲基肼(-CH2-N(CH3)-N(CH3))。在某些实施方案中,具有手性原子的核酸间键合可以制备为外消旋混合物、分开的对映体,例如,烷基膦酸酯和硫代磷酸酯。非天然核酸可以含有单一修饰。非天然核酸可以在一个部分内或不同部分之间含有多种修饰。
对核酸的主链磷酸酯修饰包括但不限于甲基膦酸酯、硫代磷酸酯、氨基磷酸酯(桥连或非桥连)、磷酸三酯、二硫代磷酸酯、二硫代磷酸酯和硼烷磷酸酯,并且可以以任何组合使用。也可以使用其他非磷酸键合。
在一些实施方案中,主链修饰(例如,甲基膦酸酯、硫代磷酸酯、氨基磷酸酯和二硫代磷酸酯核苷酸间键合)可以赋予修饰的核酸免疫以调节活性和/或增强其体内稳定性。
在一些情况下,磷衍生物(或修饰的磷酸酯基团)附接至糖或糖类似物部分,且可以为单磷酸酯、二磷酸酯、三磷酸酯、烷基膦酸酯、硫代磷酸酯、二硫代磷酸酯、氨基磷酸酯等。
在一些情况下,主链修饰包括用替代部分诸如阴离子、中性或阳离子基团置换磷酸二酯键合。此类修饰的示例包括:阴离子型核苷酸间键合;N3'至P5'氨基磷酸酯修饰;硼烷磷酸酯DNA;寡核苷酸原;中性核苷酸间键合,诸如甲基膦酸酯;酰胺连接的DNA;亚甲基(甲基亚氨基)键合;甲缩醛和硫代甲缩醛键合;含有磺酰基基团的主链;吗啉代寡聚体;肽核酸(PNA);和带正电荷的脱氧核糖核酸胍(DNG)寡聚体。修饰的核酸可以包含嵌合或混合主链,所述嵌合或混合主链包含一种或多种修饰,例如磷酸酯键合的组合,诸如磷酸二酯和硫代磷酸酯键合的组合。
磷酸酯的替代物包括,例如,短链烷基或环烷基核苷酸间键合、混合的杂原子和烷基或环烷基核苷酸间键合、或一个或多个短链杂原子或杂环核苷酸间键合。这些替代物包括具有吗啉代键合的那些(部分由核苷的糖部分形成);硅氧烷主链;硫化物、亚砜和砜主链;甲乙酰基和硫代甲乙酰基主链;亚甲基甲乙酰基和硫代甲乙酰基主链;含有烯烃的主链;氨基磺酸酯主链;亚甲基亚氨基和亚甲基肼基主链;磺酸酯和磺酰胺主链;酰胺主链;以及具有混合的N、O、S和CH2组分的其他项。还应当理解,在核苷酸替代物中,核苷酸的糖和磷酸酯部分两者都可以被例如酰胺型键合(氨基乙基甘氨酸)(PNA)所置换。还可以将其他类型的分子(缀合物)连接至核苷酸或核苷酸类似物以增强例如细胞摄取。缀合物可以化学地与核苷酸或核苷酸类似物连接。此类缀合物包括但不限于脂质部分诸如胆固醇部分、硫醚例如己基-S-三苯甲基硫醇、硫代胆固醇、脂族链例如十二烷二醇或十一烷基残基、磷脂例如二-十六烷基-外消旋-甘油或三乙基铵1-二-O-十六烷基-外消旋-甘油-S-H-膦酸酯、多胺或聚乙二醇链、或金刚烷乙酸、棕榈基部分、或十八胺或己基氨基-羰基-氧基胆固醇部分。
在一些实施方案中,本文所述的化学修饰包括磷酸酯主链的修饰。在一些实施方案中,本文所述的工程化多核苷酸包含至少一种化学修饰的磷酸酯主链。磷酸酯基团或主链的示例化学修饰可以包括用不同的取代基置换一个或多个氧。此外,存在于工程化多核苷酸中的修饰的核苷酸可以包括用本文所述的修饰的磷酸酯置换未修饰的磷酸酯部分。在一些实施方案中,磷酸酯主链的修饰可以包括导致不带电荷的接头或具有不对称电荷分布的带电荷接头的改变。修饰的磷酸酯基团示例可以包括硫代磷酸酯、硫代乙酸膦酸酯、硒代磷酸酯、硼烷磷酸酯、硼烷磷酸酯酯类、氢膦酸酯、氨基磷酸酯、烷基或芳基膦酸酯和磷酸三酯。在一些实施方案中,磷酸酯主链部分中的非桥连磷酸酯氧原子的一个可以被任何以下基团置换:硫(S)、硒(Se)、BR3(其中R可以为,例如,氢、烷基或芳基)、C(例如烷基基团、芳基基团等)、H、NR2(其中R可以是例如氢、烷基或芳基)或OR(其中R可以为,例如,烷基或芳基)。未修饰的磷酸酯基团中的磷原子是非手性的。然而,用上述原子或原子基团中的一个置换非桥连氧的一个可以使磷原子具有手性;也就是说,以这种方式修饰的磷酸酯基团中的磷原子为立体中心。立体异构磷原子可以具有“R”构型(本文中Rp)或“S”构型(本文中Sp)。在这种情况下,化学修饰的工程化多核苷酸可以是立体纯的(例如S或R确认)。在一些情况下,化学修饰的工程化多核苷酸包含立体纯的磷酸酯修饰。例如,化学修饰的工程化多核苷酸包含硫代磷酸酯的S构象或硫代磷酸酯的R构象。
硫代磷酸酯的两个非桥连氧均被硫置换。二硫代磷酸酯中的磷中心是非手性的,这阻止寡核糖核苷酸非对映体的形成。在一些实施方案中,对一个或两个非桥连氧的修饰还可以包括用独立地选自S、Se、B、C、H、N和OR(R可以为,例如,烷基或芳基)的基团置换非桥连氧。
磷酸酯接头也可以通过用氮(桥连的氨基磷酸酯)、硫(桥连的硫代磷酸酯)和碳(桥连的亚甲基膦酸酯)置换桥连氧(即,将磷酸酯连接至核苷的氧)来修饰磷酸酯接头。置换可发生在任一连接氧处或两个连接氧处。
磷酸酯部分的置换
在一些实施方案中,工程化多核苷酸的至少一个磷酸酯基团可以被化学修饰。在一些实施方案中,磷酸酯基团可以被不含磷的连接体置换。在一些实施方案中,磷酸酯部分可以被去磷酸接头置换。在一些实施方案中,带电荷的磷酸酯基团可以被中性基团置换。在一些情况下,磷酸酯基团可以被甲基膦酸酯、羟基氨基、硅氧烷、碳酸酯、羧甲基、氨基甲酸酯、酰胺、硫醚、环氧乙烷接头、磺酸酯、磺酰胺、硫代甲缩醛、甲缩醛、肟、亚甲基亚氨基、亚甲基甲基亚氨基、亚甲基亚肼基、亚甲基二甲基亚肼基、和亚甲基氧基甲基亚氨基置换。在一些实施方案中,本文所述的核苷酸类似物还可在磷酸酯基团处被修饰。修饰的磷酸酯基团可以包括用硫代磷酸酯、手性硫代磷酸酯、二硫代磷酸酯、磷酸三酯、氨基烷基磷酸三酯、甲基和其他烷基膦酸酯(包括3'-亚烷基膦酸酯)和手性膦酸酯、次膦酸酯、氨基磷酸酯(例如3'-氨基氨基磷酸酯和氨基烷基氨基磷酸酯)、硫代氨基磷酸酯、硫代烷基膦酸酯、硫代烷基磷酸三酯和硼烷磷酸酯的在两个核苷酸之间的键合处的修饰。两个核苷酸之间的磷酸酯或修饰的磷酸酯键合可以是通过3'-5'键合或2'-5'键合,并且该键合包含反向极性,如3'-5'至5'-3'或2'-5'至5'-2'。
磷酸酯基团的取代
在一些实施方案中,本文所述的化学修饰包括通过磷酸酯基团的置换进行的修饰。在一些实施方案中,本文所述的工程化多核苷酸包含至少一种化学修饰,该化学修饰包括磷酸酯基团取代或置换。示例磷酸酯基团置换可以包括不含磷的连接体。在一些实施方案中,磷酸酯基团取代或置换可以包括用中性部分置换带电荷的磷酸酯基团。可以置换磷酸酯基团的示例部分可以包括甲基膦酸酯、羟基胺基、硅氧烷、碳酸酯、羧甲基、氨基甲酸酯、酰胺、硫醚、环氧乙烷接头、磺酸酯、磺酰胺、硫代甲缩醛、甲缩醛、肟、亚甲基亚氨基、亚甲基甲基亚氨基、亚甲基亚肼基、亚甲基二甲基亚肼基和亚甲基氧基甲基亚氨基。
核糖磷酸酯主链的修饰
在一些实施方案中,本文所述的化学修饰包括修饰工程化多核苷酸的核糖磷酸酯主链。在一些实施方案中,本文所述的工程化多核苷酸包含至少一种化学修饰的核糖磷酸酯主链。化学修饰的示例核糖磷酸酯主链可以包括可以模拟核酸也可以被构建的支架,其中磷酸酯接头和核糖糖被核酸酶抗性核苷或核苷酸替代物置换。在一些实施方案中,核碱基可以由替代主链束缚。示例可以包括吗啉代、环丁基、吡咯烷和肽核酸(PNA)核苷替代物。
糖的修饰
在一些实施方案中,本文所述的化学修饰包括糖的修饰。在一些实施方案中,本文所述的工程化多核苷酸包含至少一种化学修饰的糖。示例化学修饰的糖可以包括用许多不同的“氧”或“脱氧”取代基修饰或置换的2'羟基基团(OH)。在一些实施方案中,对2'羟基基团的修饰可以增强核酸的稳定性,因为羟基不再能够被去质子化以形成2'-醇盐离子。2'-醇盐可以通过对接头磷原子的分子内亲核攻击来催化降解。“氧基”-2'羟基基团修饰的示例可以包括烷氧基或芳氧基(OR,其中“R”可以为,例如,烷基、环烷基、芳基、芳烷基、杂芳基或糖);聚乙二醇(PEG)、O(CH2CH2O)nCH2CH2OR,其中R可以为,例如,H或任选取代的烷基,并且n可以为从0至20(例如,从0至4、从0至8、从0至10、从0至16、从1至4、从1至8、从1至10、从1至16、从1至20、从2至4、从2至8、从2至10、从2至16、从2至20、从4至8、从4至10、从4至16和从4至20)。在一些实施方案中,“氧基”-2'羟基基团修饰可以包括(LNA,其中2'羟基可以例如通过Ci-6亚烷基或Cj-6杂亚烷基桥连接至相同的核糖糖的4'碳,其中示例桥可以包括亚甲基、亚丙基、醚或氨基桥;O-氨基(其中氨基可以为,例如NH2;烷基氨基、二烷基氨基、杂环基、芳基氨基、二芳基氨基、杂芳基氨基或二杂芳基氨基、乙二胺或多氨基)和氨基烷氧基、O(CH2)n-氨基(其中氨基可以为,例如,NH2;烷基氨基、二烷基氨基、杂环基、芳基氨基、二芳基氨基、杂芳基氨基或二杂芳基氨基、乙二胺或多氨基)。在一些实施方案中,“氧基”-2'羟基基团修饰可以包括甲氧基乙基(MOE)(OCH2CH2OCH3,例如,PEG衍生物)。在一些情况下,脱氧修饰可以包括氢(即脱氧核糖,例如,在部分dsRNA的突出部分);卤代(例如,溴、氯、氟或碘);氨基(其中氨基可以为,例如,NH2;烷基氨基、二烷基氨基、杂环基、芳基氨基、二芳基氨基、杂芳基氨基、二杂芳基氨基或氨基酸);NH(CH2CH2NH)nCH2CH2-氨基(其中氨基可以为,例如,如本文所述的)、NHC(O)R(其中R可以为,例如,烷基、环烷基、芳基、芳烷基、杂芳基或糖)、氰基;巯基;烷基-硫代-烷基;硫代烷氧基;以及烷基、环烷基、芳基、烯基和炔基,其可以任选地被例如本文所述的氨基取代。在一些情况下,糖基还可以含有一个或多个具有与核糖中相应碳相反的立体化学构型的碳。因此,修饰的核酸可以包括含有例如阿拉伯糖作为糖的核苷酸。核苷酸“单体”可以在糖上的Γ位处具有α键合,例如α-核苷。修饰的核酸还可以包括“脱碱基”糖,其在C-处缺乏核碱基。脱碱基糖还可以在一个或多个组成糖原子处被进一步修饰。修饰的核酸还可以包括一种或多种L形式的糖,例如L-核苷。在一些方面,本文所述的工程化多核苷酸包括糖基核糖,其是具有氧的5元环。示例修饰的核苷和修饰的核苷酸可以包括核糖中的氧的置换(例如用硫(S)、硒(Se)或亚烷基,例如亚甲基或亚乙基);添加双键(例如,用环戊烯基或环己烯基置换核糖);核糖的环收缩(例如,形成环丁烷或氧杂环丁烷的4元环);核糖的环扩展(例如,形成具有另外的碳或杂原子的6元或7元环,例如脱水己糖醇、阿糖醇、甘露醇、环己基、环己烯基和还具有氨基磷酸酯主链的吗啉代)。在一些实施方案中,修饰的核苷酸可以包括多环形式(例如,三环)和“解锁”形式,例如二醇核酸(GNA)(例如,R-GNA或S-GNA,其中核糖被附接到磷酸二酯键的二醇单元置换)、苏糖核酸。在一些实施方案中,对工程化多核苷酸的糖的修饰包括修饰工程化多核苷酸以包括锁核酸(LNA)、解锁核酸(UNA)或桥连核酸(BNA)。
核糖糖成分的修饰
在一些实施方案中,本文所述的工程化多核苷酸包含核糖糖成分的至少一种化学修饰。在一些实施方案中,核糖糖成分的化学修饰可以包括2'-O-甲基、2'-O-甲氧基-乙基(2'-MOE)、2'-氟、2'-氨基乙基、2'-脱氧-2'-氟代阿拉伯核酸、2'-脱氧、2'-O-甲基、3'-硫代磷酸酯、3'-膦酰基乙酸酯(PACE)或3'-膦酰基硫代乙酸酯(thioPACE)。在一些实施方案中,核糖糖成分的化学修饰包含非天然核酸。在一些情况下,非天然核酸包括在糖环的5'-位和2'-位处的修饰,例如5'-CH2-取代的2'-O-保护的核苷。在一些情况下,非天然核酸包括已制备用于掺入寡核苷酸中的酰胺连接的核苷二聚体,其中二聚体中的3'连接核苷(5'至3')包含2'-OCH3和5'-(S)-CH3。非天然核酸可以包括2'-取代的5'-CH2(或O)修饰的核苷。非天然核酸可以包括5'-亚甲基膦酸酯DNA和RNA单体和二聚体。非天然核酸可以包括具有2'-取代的5'-膦酸酯单体和其他修饰的5'-膦酸酯单体。非天然核酸可以包括5'-修饰的亚甲基膦酸酯单体。非天然核酸可以包括在5'和/或6'-位包含羟基基团的5'或6'-膦酸核糖核苷的类似物。非天然核酸可以包括具有5'-磷酸酯基团的5'-膦酸酯脱氧核糖核苷单体和二聚体。非天然核酸可以包括具有6'-膦酸酯基团的核苷,其中5'或/和6'-位未被取代或被硫代叔丁基基团(SC(CH3)3)(及其类似物);亚甲基氨基基团(CH2NH2)(及其类似物)或氰基基团(CN)(及其类似物)取代。
在一些实施方案中,非天然核酸还包括糖部分的修饰。在一些情况下,核酸含有一种或多种核苷,其中糖基已被修饰。这种糖修饰的核苷可以赋予增强的核酸酶稳定性、增加的结合亲和力或一些其他有益的生物学特性。在某些实施方案中,核酸包含化学修饰的呋喃核糖环部分。化学修饰的呋喃核糖环的示例包括但不限于添加取代基(包括5'和/或2'取代基;桥连两个环原子以形成双环核酸;用S、N(R)、或C(R1)(R2)(R=H、C1-C12烷基或保护基)置换核糖基环氧原子;及其组合。
在一些情况下,本文所述的工程化多核苷酸包含修饰的糖或糖类似物。因此,除了核糖和脱氧核糖之外,糖部分可以是戊糖、脱氧戊糖、己糖、脱氧己糖、葡萄糖、阿拉伯糖、木糖、来苏糖或糖“类似物”环戊基基团。糖可以是吡喃糖基或呋喃糖基形式。糖部分可以是核糖、脱氧核糖、阿拉伯糖或2'-O-烷基核糖的呋喃糖苷,并且糖可以以[α]或[β]异头构型附接至各自的杂环碱基。糖修饰包括但不限于2'-烷氧基-RNA类似物、2'-氨基-RNA类似物、2'-氟-DNA和2'-烷氧基-或氨基-RNA/DNA嵌合体。例如,糖修饰可以包括2'-O-甲基-尿苷或2'-O-甲基-胞苷。糖修饰包括2'-O-烷基取代的脱氧核糖核苷和2'-O-乙二醇样核糖核苷。
对糖部分的修饰包括核糖和脱氧核糖的天然修饰以及非天然修饰。糖修饰包括但不限于2'位的以下修饰:OH;F;O-、S-或N-烷基;O-、S-或N-烯基;O-、S-或N-炔基;或O-烷基-O-烷基,其中烷基、烯基和炔基可以是取代或未取代的C1至C10烷基或C2至C10烯基和炔基。2'糖修饰还包括但不限于-O[(CH2)nO]mCH3、-O(CH2)nOCH3、-O(CH2)nNH2、-O(CH2)nCH3、-O(CH2)nONH2和-O(CH2)nON[(CH2)nCH3)]2,其中n和m为从1至约10。在2’位处的其他化学修饰包括但不限于:C1至C10低级烷基、取代的低级烷基、烷芳基、芳烷基、O-烷芳基、O-芳烷基、SH、SCH3、OCN、Cl、Br、CN、CF3、OCF3、SOCH3、SO2CH3、ONO2、NO2、N3、NH2、杂环烷基、杂环烷芳基、氨基烷基氨基、多烷基氨基、取代甲硅烷基、RNA切割基团、报道基团、嵌入剂、用于改善寡核苷酸的药代动力学性质的基团,或用于改善寡核苷酸的药效学性质的基团,以及具有类似性质的其他取代基。类似的修饰也可以在糖上的其他位置进行,特别是3'末端核苷酸上或2'-5'连接的寡核苷酸中的糖的3'位以及5'末端核苷酸的5'位。化学修饰的糖还包括在桥环氧处含有修饰例如CH2和S的糖。核苷酸糖类似物也可以具有糖模拟物如代替呋喃戊糖基糖的环丁基部分。具有修饰的糖部分的核酸的示例包括但不限于包含5'-乙烯基、5'-甲基(R或S)、4'-S、2'-F、2'-OCH3和2'-O(CH2)2OCH3取代基的核酸。在2'位处的取代基还可以选自烯丙基、氨基、叠氮基、硫代、O-烯丙基、O-(C1-C10烷基)、OCF3、O(CH2)2SCH3、O(CH2)2-ON(Rm)(Rn)和O-CH2-C(=O)-N(Rm)(Rn),其中每个Rm和Rn独立地为H或取代的或未取代的C1-C10烷基。
在某些实施方案中,本文所述的核酸包括一种或多种双环核酸。在某些此类实施方案中,双环核酸包含4'和2'核糖基环原子之间的桥。在某些实施方案中,本文提供的核酸包括一种或多种双环核酸,其中桥包括4'至2'双环核酸。此类4'至2'双环核酸的示例包括但不限于下式之一:4'-(CH2)-O-2'(LNA);4'-(CH2)-S-2';4'-(CH2)2-O-2'(ENA);4'-CH(CH3)-O-2'和4'-CH(CH2OCH3)-O-2'及其类似物;4'-C(CH3)(CH3)-O-2'及其类似物。
对核苷酸碱基的修饰
在一些实施方案中,本文所述的化学修饰包括核苷酸碱基(例如,核碱基)的修饰。示例核碱基可以包括腺嘌呤(A)、胸腺嘧啶(T)、鸟嘌呤(G)、胞嘧啶(C)和尿嘧啶(U)。这些核碱基可以在本文所述的工程化多核苷酸中被修饰或置换。核苷酸的核碱基可以独立地选自嘌呤、嘧啶、嘌呤或嘧啶类似物。在一些实施方案中,核碱基可以为碱基的天然存在的或合成的衍生物。
在一些实施方案中,本文所述的化学修饰包括修饰尿嘧啶。在一些实施方案中,本文所述的工程化多核苷酸包含至少一种化学修饰的尿嘧啶。示例化学修饰的尿嘧啶的可以包括假尿苷、吡啶-4-酮核糖核苷、5-氮杂-尿苷、6-氮杂-尿苷、2-硫代-5-氮杂-尿苷、2-硫代-尿苷、4-硫代-尿苷、4-硫代-假尿苷、2-硫代-假尿苷、5-羟基-尿苷、5-氨基烯丙基-尿苷、5-卤代-尿苷(例如,5-碘-尿苷或5-溴-尿苷)、3-甲基-尿苷、5-甲氧基-尿苷、尿苷5-氧基乙酸、尿苷5-氧基乙酸甲酯、5-羧甲基-尿苷、1-羧甲基-假尿苷、5-羧基羟甲基-尿苷、5-羧基羟甲基-尿苷甲酯、5-甲氧基羰基甲基-尿苷、5-甲氧基羰基甲基-2-硫代-尿苷、5-氨基甲基-2-硫代-尿苷、5-甲基氨基甲基-尿苷、5-甲基氨基甲基-2-硫代-尿苷、5-甲基氨基甲基-2-硒代-尿苷、5-氨基甲酰甲基-尿苷、5-羧甲基氨基甲基-尿苷、5-羧甲基氨基甲基-2-硫代-尿苷、5-丙炔基-尿苷、1-丙炔基-假尿苷、5-牛磺酸甲基-尿苷、1-牛磺酸甲基-假尿苷、5-牛磺酸甲基-2-硫代-尿苷、l-牛磺酸甲基-4-硫代-假尿苷、5-甲基-尿苷、1-甲基-假尿苷、5-甲基-2-硫代-尿苷、l-甲基-4-硫代-假尿苷、4-硫代-1-甲基-假尿苷、3-甲基-假尿苷、2-硫代-1-甲基-假尿苷、1-甲基-1-脱氮-假尿苷、2-硫代-1-甲基-1-脱氮-假尿苷、二氢尿苷、二氢假尿苷、5,6-二氢尿苷、5-甲基-二氢尿苷、2-硫代-二氢尿苷、2-硫代-二氢假尿苷、2-甲氧基-尿苷、2-甲氧基-4-硫代-尿苷、4-甲氧基-假尿苷、4-甲氧基-2-硫代-假尿苷、N1-甲基-假尿苷、3-(3-氨基-3-羧丙基)尿苷、1-甲基-3-(3-氨基-3-羧基丙基)假尿苷、5-(异戊烯基氨基甲基)尿苷、5-(异戊烯基氨基甲基])-2-硫代-尿苷、a-硫代-尿苷、2'-O-甲基-尿苷、5,2'-O-二甲基-尿苷、2'-O-甲基-假尿苷、2-硫代-2'-O-甲基-尿苷、5-甲氧基羰基甲基-2'-O-甲基-尿苷、5-氨基甲酰基甲基-2'-O-甲基-尿苷、5-羧甲基氨基甲基-2'-O-甲基-尿苷、3,2'-O-二甲基-尿苷、5-(异戊烯基氨基甲基)-2'-O-甲基-尿苷、l-硫代-尿苷、脱氧胸腺嘧啶、2'-F-ara-尿苷、2'-F-尿苷、2'-OH-ara-尿苷、5-(2-甲氧羰基乙烯基)-尿苷、5-[3-(1E-丙烯基氨基)]尿苷、吡唑并[3,4-d]嘧啶、黄嘌呤和次黄嘌呤。
在一些实施方案中,本文所述的化学修饰包括修饰胞苷。在一些实施方案中,本文所述的工程化多核苷酸包含至少一种化学修饰的胞苷。示例化学修饰的胞苷可以包括5-氮杂-胞苷、6-氮杂-胞苷、假异胞苷、3-甲基-胞苷、N4-乙酰基-胞苷、5-甲酰基-胞苷、N4-甲基-胞苷、5-甲基-胞苷、5-卤代-胞苷、5-羟甲基-胞苷、1-甲基-假异胞苷、吡咯-胞苷、吡咯-假异胞苷、2-硫代-胞苷、2-硫代-5-甲基-胞苷、4-硫代-假异胞苷、4-硫代-1-甲基-假异胞苷、4-硫代-1-甲基-1-脱氮-假异胞苷、1-甲基-1-脱氮-假异胞苷、泽布拉林(zebularine)、5-氮杂-泽布拉林、5-甲基-泽布拉林、5-氮杂-2-硫代-泽布拉林、2-硫代-泽布拉林、2-甲氧基-胞苷、2-甲氧基-5-甲基-胞苷、4-甲氧基-假异胞苷、4-甲氧基-1-甲基-假异胞苷、赖氨酸、a-硫代-胞苷、2'-O-甲基-胞苷、5,2'-O-二甲基-胞苷、N4-乙酰基-2'-O-甲基-胞苷、N4,2'-O-二甲基-胞苷、5-甲酰基-2'-O-甲基-胞苷、N4,N4,2'-O-三甲基-胞苷、1-硫代-胞苷、2'-F-ara-胞苷、2'-F-胞苷和2'-OH-ara-胞苷。
在一些实施方案中,本文所述的化学修饰包括修饰腺嘌呤。在一些实施方案中,本文所述的工程化多核苷酸包含至少一种化学修饰的腺嘌呤。示例化学修饰的腺嘌呤可以包括2-氨基-嘌呤、2,6-二氨基嘌呤、2-氨基-6-卤代-嘌呤(例如,2-氨基-6-氯-嘌呤)、6-卤代-嘌呤(例如,6-氯-嘌呤)、2-氨基-6-甲基-嘌呤、8-叠氮基-腺苷、7-脱氮-腺嘌呤、7-脱氮-8-氮杂-腺嘌呤、7-脱氮-2-氨基-嘌呤、7-脱氮-8-氮杂-2-氨基-嘌呤、7-脱氮-2,6-二氨基嘌呤、7-脱氮-8-氮杂-2,6-二氨基嘌呤、1-甲基-腺苷、2-甲基-腺嘌呤、N6-甲基-腺苷、2-甲硫基-N6-甲基-腺苷、N6-异戊烯基-腺苷、2-甲硫基-N6-异戊烯基-腺苷、N6-(顺-羟基异戊烯基)腺苷、2-甲硫基-N6-(顺-羟基异戊烯基)腺苷、N6-甘氨酰氨基甲酰基-腺苷、N6-苏氨酰氨基甲酰基-腺苷、N6-甲基-N6-苏氨酰氨基甲酰基-腺苷、2-甲硫基-N6-苏氨酰氨基甲酰基-腺苷、N6,N6-二甲基-腺苷、N6-羟基正缬氨酰基氨基甲酰基-腺苷、2-甲硫基-N6-羟基正缬氨酰基氨基甲酰基-腺苷、N6-乙酰基-腺苷、7-甲基-腺嘌呤、2-甲硫基-腺嘌呤、2-甲氧基-腺嘌呤、a-硫代-腺苷、2'-O-甲基-腺苷、N6,2'-O-二甲基-腺苷、N6-甲基-2'-脱氧腺苷、N6,N6,2'-O-三甲基-腺苷、l,2'-O-二甲基-腺苷、2'-O-核糖基腺苷(磷酸盐)(Ar(p))、2-氨基-N6-甲基-嘌呤、1-硫代-腺苷、8-叠氮基-腺苷、2'-F-ara-腺苷、2'-F-腺苷、2'-OH-ara-腺苷和N6-(19-氨基-五氧杂十九烷基)-腺苷。
在一些实施方案中,本文所述的化学修饰包括修饰鸟嘌呤。在一些实施方案中,本文所述的工程化多核苷酸包含至少一种化学修饰的鸟嘌呤。示例化学修饰的鸟嘌呤可以包括肌苷、1-甲基-肌苷、怀俄苷、甲基怀俄苷、4-去甲基-怀俄苷、异怀俄苷、怀丁苷、过氧怀丁苷、羟基怀丁苷、未脱碘的羟基怀丁苷、7-脱氮-鸟苷、辫苷、环氧辫苷、半乳糖基-辫苷、甘露糖基-辫苷、7-氰基-7-脱氮-鸟苷、7-氨基甲基-7-脱氮-鸟苷、古嘌苷、7-脱氮-8-氮杂-鸟苷、6-硫代-鸟苷、6-硫代-7-脱氮-鸟苷、6-硫代-7-脱氮-8-氮杂-鸟苷、7-甲基-鸟苷、6-硫代-7-甲基-鸟苷、7-甲基-肌苷、6-甲氧基-鸟苷、1-甲基-鸟苷、N2-甲基-鸟苷、N2,N2-二甲基-鸟苷、N2,7-二甲基-鸟苷、N2,N2,7-二甲基-鸟苷、8-氧代-鸟苷、7-甲基-8-氧代-鸟苷、1-甲硫基-鸟苷、N2-甲基-6-硫代-鸟苷、N2,N2-二甲基-6-硫代-鸟苷、a-硫代-鸟苷、2'-O-甲基-鸟苷、N2-甲基-2'-O-甲基-鸟苷、N2,N2-二甲基-2'-O-甲基-鸟苷、1-甲基-2'-O-甲基-鸟苷、N2,7-二甲基-2'-O-甲基-鸟苷、2'-O-甲基-肌苷、l,2'-O-二甲基-肌苷、6-O-苯基-2'-脱氧肌苷、2'-O-核糖基鸟苷、1-硫代-鸟苷、6-O-甲基鸟苷、O6-甲基-2'-脱氧鸟苷、2'-F-ara-鸟苷和2'-F-鸟苷。
在一些情况下,工程化多核苷酸的化学修饰可以包括将核酸类似物或非天然核酸引入或取代到工程化多核苷酸中。在一些实施方案中,核酸类似物可以是本文所述的任何一种化学修饰的核酸。示例核酸类似物可见于PCT/US2015/025175、PCT/US2014/050423、PCT/US2016/067353、PCT/US2018/041503、PCT/US18/041509、PCT/US2004/011786或PCT/US2004/011833,所有这些都明确地通过引用整体并入。本文所述的化学修饰的核苷酸可以包括鸟苷、尿苷、腺苷、胸苷和胞嘧啶的变体,包括已被化学改变(例如通过乙酰化、甲基化、羟基化)的任何天然存在的或非天然存在的鸟苷、尿苷、腺苷、胸苷或胞苷。示例化学修饰的核苷酸可以包括1-甲基-腺苷、1-甲基-鸟苷、1-甲基-肌苷、2,2-二甲基-鸟苷、2,6-二氨基嘌呤、2'-氨基-2'-脱氧腺苷、2'-氨基-2'-脱氧胞苷、2'-氨基-2'-脱氧鸟苷、2'-氨基-2'-脱氧尿苷、2-氨基-6-氯嘌呤核糖苷、2-氨基嘌呤-核糖苷、2'-ara腺苷、2'-ara胞苷、2'-ara尿苷、2'-叠氮基-2'-脱氧腺苷、2'-叠氮基-2'-脱氧胞苷、2'-叠氮基-2'-脱氧鸟苷、2'-叠氮基-2'-脱氧尿苷、2-氯腺苷、2'-氟-2'-脱氧腺苷、2'-氟-2'-脱氧胞苷、2'-氟-2'-脱氧鸟苷、2'-氟-2'-脱氧尿苷、2'-氟胸苷、2-甲基-腺苷、2-甲基-鸟苷、2-甲基-硫代-N6-异戊烯基-腺苷、2'-O-甲基-2-氨基腺苷、2'-O-甲基-2'-脱氧腺苷、2'-O-甲基-2'-脱氧胞苷、2'-O-甲基-2'-脱氧鸟苷、2,-O-甲基-2'-脱氧尿苷、2'-O-甲基-5-甲基尿苷、2'-O-甲基肌苷、2'-O-甲基假尿苷、2-硫代胞苷、2-硫代-胞苷、3-甲基-胞苷、4-乙酰基-胞苷、4-硫代尿苷、5-(羧基羟基甲基)-尿苷、5,6-二氢尿苷、5-氨基烯丙基胞苷、5-氨基烯丙基脱氧尿苷、5-溴尿苷、5-羧甲基氨基甲基-2-硫代-尿嘧啶、5-羧甲基氨基甲基-尿嘧啶、5-氯-ara胞苷、5-氟-尿苷、5-碘尿苷、5-甲氧基羰基甲基-尿苷、5-甲氧基-尿苷、5-甲基-2-硫代-尿苷、6-氮杂胞苷、6-氮杂尿苷、6-氯-7-脱氮-鸟苷、6-氯嘌呤核糖苷、6-巯基-鸟苷、6-甲基-巯基嘌呤-核糖苷、7-脱氮-2'-脱氧鸟苷、7-脱氮腺苷、7-甲基-鸟苷、8-氮杂腺苷、8-溴-腺苷、8-溴-鸟苷、8-巯基-鸟苷、8-氧代鸟苷、苯并咪唑-核糖苷、β-D-甘露糖基-辫苷、二氢-尿苷、肌苷、N1-甲基腺苷、N6-([6-氨基己基]氨基甲酰甲基)-腺苷、N6-异戊烯基-腺苷、N6-甲基-腺苷、N7-甲基-黄苷、N-尿嘧啶-5-氧基乙酸甲酯、嘌呤霉素、辫苷、尿嘧啶-5-氧基乙酸、尿嘧啶-5-氧基乙酸甲酯、怀丁苷、黄苷和木糖-腺苷。在一些实施方案中,本文所述的化学修饰的核酸包含选自以下的至少一种化学修饰的核苷酸:2-氨基-6-氯嘌呤核糖苷-5'-三磷酸、2-氨基嘌呤-核糖苷-5'-三磷酸、2-氨基腺苷-5'-三磷酸、2'-氨基-2'-脱氧胞苷-三磷酸、2-硫胞苷-5'-三磷酸、2-硫尿苷-5'-三磷酸、2'-氟胸苷-5'-三磷酸、2'-O-甲基-肌苷-5'-三磷酸、4-硫尿苷-5'-三磷酸、5-氨基烯丙基胞苷-5'-三磷酸、5-氨基烯丙基尿苷-5'-三磷酸、5-溴胞苷-5'-三磷酸、5-溴尿苷-5'-三磷酸、5-溴-2'-脱氧胞苷-5'-三磷酸、5-溴-2'-脱氧尿苷-5'-三磷酸、5-碘胞苷-5'-三磷酸、5-碘-2'-脱氧胞苷-5'-三磷酸、5-碘尿苷-5'-三磷酸、5-碘-2'-脱氧尿苷-5'-三磷酸、5-甲基胞苷-5'-三磷酸、5-甲基尿苷-5'-三磷酸、5-丙炔基-2'-脱氧胞苷-5'-三磷酸、5-丙炔基-2'-脱氧尿苷-5'-三磷酸、6-氮杂胞苷-5'-三磷酸、6-氮杂尿苷-5'-三磷酸、6-氯嘌呤核糖苷-5'-三磷酸、7-脱氮腺苷-5'-三磷酸、7-脱氮鸟苷-5'-三磷酸、8-氮杂腺苷-5'-三磷酸、8-叠氮腺苷-5'-三磷酸、苯并咪唑-核糖苷-5'-三磷酸、N1-甲基腺苷-5'-三磷酸、N1-甲基鸟苷-5'-三磷酸、N6-甲基腺苷-5'-三磷酸、6-甲基鸟苷-5'-三磷酸、假尿苷-5'-三磷酸、嘌呤霉素-5'-三磷酸或黄苷-5'-三磷酸。在一些实施方案中,本文所述的化学修饰的核酸包含选自以下的至少一种化学修饰的核苷酸:吡啶-4-酮核糖核苷、5-氮杂-尿苷、2-硫代-5-氮杂-尿苷、2-硫代尿苷、4-硫代-假尿苷、2-硫代-假尿苷、5-羟基尿苷、3-甲基尿苷、5-羧甲基-尿苷、1-羧甲基-假尿苷、5-丙炔基-尿苷、1-丙炔基-假尿苷、5-牛磺酸甲基尿苷、1-牛磺酸甲基-假尿苷、5-牛磺酸甲基-2-硫代-尿苷、1-牛磺酸甲基-4-硫代-尿苷、5-甲基-尿苷、1-甲基-假尿苷、4-硫代-1-甲基-假尿苷、2-硫代-1-甲基-假尿苷、1-甲基-1-脱氮-假尿苷、2-硫代-1-甲基-1-脱氮-假尿苷、二氢尿苷、二氢假尿苷、2-硫代-二氢尿苷、2-硫代-二氢假尿苷、2-甲氧基尿苷、2-甲氧基-4-硫代-尿苷、4-甲氧基-假尿苷和4-甲氧基-2-硫代-假尿苷。在一些实施方案中,本文所述的人工核酸包含选自以下的至少一种化学修饰的核苷酸:5-氮杂-胞苷、假异胞苷、3-甲基-胞苷、N4-乙酰基胞苷、5-甲酰基胞苷、N4-甲基胞苷、5-羟甲基胞苷、1-甲基-假异胞苷、吡咯并-胞苷、吡咯并-假异胞苷、2-硫代-胞苷、2-硫代-5-甲基-胞苷、4-硫代-假异胞苷、4-硫代-1-甲基-假异胞苷、4-硫代-1-甲基-1-脱氮-假异胞苷、1-甲基-1-脱氮-假异胞苷、泽布拉林、5-氮杂-泽布拉林、5-甲基-泽布拉林、5-氮杂-2-硫代-泽布拉林、2-硫代-泽布拉林、2-甲氧基-胞苷、2-甲氧基-5-甲基-胞苷、4-甲氧基-假异胞苷和4-甲氧基-1-甲基-假异胞苷。在一些实施方案中,本文所述的化学修饰的核酸包含选自以下的至少一种化学修饰的核苷酸:2-氨基嘌呤、2,6-二氨基嘌呤、7-脱氮-腺嘌呤、7-脱氮-8-氮杂-腺嘌呤、7-脱氮-2-氨基嘌呤、7-脱氮-8-氮杂-2-氨基嘌呤、7-脱氮-2,6-二氨基嘌呤、7-脱氮-8-氮杂-2,6-二氨基嘌呤、1-甲基腺苷、N6-甲基腺苷、N6-异戊烯基腺苷、N6-(顺-羟基异戊烯基)腺苷、2-甲硫基-N6-(顺-羟基异戊烯基)腺苷、N6-甘氨酰氨甲酰腺苷、N6-苏氨酰氨甲酰腺苷、2-甲硫基-N6-苏氨酰氨甲酰腺苷、N6,N6-二甲基腺苷、7-甲基腺嘌呤、2-甲硫基-腺嘌呤和2-甲氧基-腺嘌呤。在其他实施方案中,本文所述的化学修饰的核酸包含选自以下的至少一种化学修饰的核苷酸:肌苷、1-甲基-肌苷、怀俄苷、怀丁苷、7-脱氮-鸟苷、7-脱氮-8-氮杂-鸟苷、6-硫代-鸟苷、6-硫代-7-脱氮-鸟苷、6-硫代-7-脱氮-8-氮杂-鸟苷、7-甲基-鸟苷、6-硫代-7-甲基-鸟苷、7-甲基肌苷、6-甲氧基-鸟苷、1-甲基鸟苷、N2-甲基鸟苷、N2,N2-二甲基鸟苷、8-氧代-鸟苷、7-甲基-8-氧代-鸟苷、1-甲基-6-硫代-鸟苷、N2-甲基-6-硫代-鸟苷和N2,N2-二甲基-6-硫代-鸟苷。在某些实施方案中,本文所述的化学修饰的核酸包含选自以下的至少一种化学修饰的核苷酸:6-氮杂-胞苷、2-硫代-胞苷、α-硫代-胞苷、假-异-胞苷、5-氨基烯丙基-尿苷、5-碘-尿苷、N1-甲基-假尿苷、5,6-二氢尿苷、α-硫代-尿苷、4-硫代-尿苷、6-氮杂-尿苷、5-羟基-尿苷、脱氧-胸苷、5-甲基-尿苷、吡咯并-胞苷、肌苷、α-硫代-鸟苷、6-甲基-鸟苷、5-甲基-胞苷、8-氧代-鸟苷、7-脱氮-鸟苷、N1-甲基-腺苷、2-氨基-6-氯-嘌呤、N6-甲基-2-氨基-嘌呤、假-异-胞苷、6-氯-嘌呤、N6-甲基-腺苷、α-硫代-腺苷、8-叠氮基-腺苷、7-脱氮-腺苷。
非天然核酸的修饰碱基包括但不限于尿嘧啶-5-基、次黄嘌呤-9-基(I)、2-氨基腺嘌呤-9-基、5-甲基胞嘧啶(5-me-C)、5-羟甲基胞嘧啶、黄嘌呤、次黄嘌呤、2-氨基腺嘌呤、腺嘌呤和鸟嘌呤的6-甲基和其他烷基衍生物、腺嘌呤和鸟嘌呤的2-丙基和其他烷基衍生物、2-硫尿嘧啶、2-硫胸腺嘧啶和2-硫胞嘧啶、5-卤尿嘧啶和胞嘧啶、5-丙炔尿嘧啶和胞嘧啶、6-偶氮尿嘧啶、胞嘧啶和胸腺嘧啶、5-尿嘧啶(假尿嘧啶)、4-硫尿嘧啶、8-卤代、8-氨基、8-硫醇、8-硫代烷基、8-羟基和其他8-取代的腺嘌呤和鸟嘌呤、5-卤素特别是5-溴、5-三氟甲基和其他5-取代的尿嘧啶和胞嘧啶,7-甲基鸟嘌呤和7-甲基腺嘌呤,8-氮杂鸟嘌呤和8-氮杂腺嘌呤、7-脱氮鸟嘌呤和7-脱氮腺嘌呤和3-脱氮鸟嘌呤和3-脱氮腺嘌呤。某些非天然核酸,如5-取代的嘧啶、6-氮杂嘧啶和N-2取代的嘌呤、N-6取代的嘌呤、O-6取代的嘌呤、2-氨基丙基腺嘌呤、5-丙炔基尿嘧啶、5-丙炔基胞嘧啶、5-甲基胞嘧啶、那些增加双链体形成稳定性的核酸、通用核酸、疏水性核酸、混杂核酸、尺寸扩展的核酸、氟化核酸、5-取代的嘧啶、6-氮杂嘧啶和N-2、N-6和O-6取代的嘌呤,包括2-氨基丙基腺嘌呤、5-丙炔基尿嘧啶和5-丙炔基胞嘧啶、5-甲基胞嘧啶(5-me-C)、5-羟甲基胞嘧啶、黄嘌呤、次黄嘌呤、2-氨基腺嘌呤、腺嘌呤和鸟嘌呤的6-甲基、其他烷基衍生物、腺嘌呤和鸟嘌呤的2-丙基以及其他烷基衍生物、2-硫尿嘧啶、2-硫胸腺嘧啶和2-硫胞嘧啶、5-卤代尿嘧啶、5-卤代胞嘧啶、5-丙炔基(-C≡C-CH3)尿嘧啶、5-丙炔基胞嘧啶、嘧啶核酸的其他炔基衍生物、6-偶氮尿嘧啶、6-偶氮胞嘧啶、6-偶氮胸腺嘧啶、5-尿嘧啶(假尿嘧啶)、4-硫尿嘧啶、8-卤代、8-氨基、8-硫醇、8-硫烷基、8-羟基和其他8-取代的腺嘌呤和鸟嘌呤、5-卤素特别是5-溴、5-三氟甲基、其他5-取代的尿嘧啶和胞嘧啶、7-甲基鸟嘌呤、7-甲基腺嘌呤、2-F-腺嘌呤、2-氨基-腺嘌呤、8-氮杂鸟嘌呤、8-氮杂腺嘌呤、7-脱氮鸟嘌呤、7-脱氮腺嘌呤、3-脱氮鸟嘌呤、3-脱氮腺嘌呤、三环嘧啶、吩噁嗪胞苷([5,4-b][l,4]苯并噁嗪-2(3H)-酮)、吩噻嗪胞苷(1H-嘧啶并[5,4-b][l,4]苯并噻嗪-2(3H)-酮)、G-夹、吩噁嗪胞苷(例如9-(2-氨基乙氧基)-H-嘧啶并[5,4-b][l,4]苯并噁嗪-2(3H)-酮)、咔唑胞苷(2H-嘧啶并[4,5-b]吲哚-2-酮)、吡啶并吲哚胞苷(H-吡啶并[3',2':4,5]吡咯并[2,3-d]嘧啶-2-酮)、其中嘌呤或嘧啶碱基被其他杂环置换的那些核酸、7-脱氮-腺嘌呤、7-脱氮鸟苷、2-氨基吡啶、2-吡啶酮、氮杂胞嘧啶、5-溴胞嘧啶、溴尿嘧啶、5-氯胞嘧啶、氯化胞嘧啶、环胞嘧啶、胞嘧啶阿拉伯糖苷、5-氟胞嘧啶、氟嘧啶、氟尿嘧啶、5,6-二氢胞嘧啶、5-碘胞嘧啶、羟基脲、碘尿嘧啶、5-硝基胞嘧啶、5-溴尿嘧啶、5-氯尿嘧啶、5-氟尿嘧啶和5-碘尿嘧啶、2-氨基-腺嘌呤、6-硫代-鸟嘌呤、2-硫代-胸腺嘧啶、4-硫代-胸腺嘧啶、5-丙炔基-尿嘧啶、4-硫代-尿嘧啶、N4-乙基胞嘧啶、7-脱氮鸟嘌呤、7-脱氮-8-氮鸟嘌呤、5-羟基胞嘧啶、2'-脱氧尿苷或2-氨基-2'-脱氧腺苷。
在一些情况下,至少一种化学修饰可以包括化学修饰工程化多核苷酸的5'或3'端,例如5'帽或3'尾。在一些实施方案中,工程化多核苷酸包含含有3'核苷酸的化学修饰,其可以例如通过掺入本文所述的一种或多种修饰的核苷酸而稳定以防止降解。在这个实施方案中,尿苷可以被修饰的尿苷例如5-(2-氨基)丙基尿苷和5-溴尿苷或本文所述的任何修饰的尿苷置换;腺苷和鸟苷可以被修饰的腺苷和鸟苷置换,例如具有在8位处的修饰,例如8-溴鸟苷,或用本文所述的任何修饰的腺苷或鸟苷置换。在一些实施方案中,脱氮核苷酸,例如7-脱氮-腺苷,可以掺入gRNA中。在一些实施方案中,O-和N-烷基化核苷酸,例如N6-甲基腺苷,可以掺入gRNA中。在一些实施方案中,可以掺入糖修饰的核糖核苷酸,例如,其中2'OH-基团被选自H、-OR、-R(其中R可以是,例如,烷基、环烷基、芳基、芳烷基、杂芳基或糖)、卤素、-SH、-SR(其中R可以是,例如,烷基、环烷基、芳基、芳烷基、杂芳基或糖)、氨基(其中氨基可以是,例如,NH2;烷基氨基、二烷基氨基、杂环基、芳基氨基、二芳基氨基、杂芳基氨基、二杂芳基氨基或氨基酸);或氰基(-CN)的基团置换。在一些实施方案中,磷酸酯主链可以如本文所述被修饰,例如用硫代磷酸酯基团修饰。在一些实施方案中,gRNA突出端区中的核苷酸可以各自独立地为修饰的或未修饰的核苷酸,包括但不限于2'-糖修饰,诸如2-F 2'-O-甲基、胸苷(T)、2'-O-甲氧基乙基-5-甲基尿苷(Teo)、2'-O-甲氧基乙基腺苷(Aeo)、2'-O-甲氧基乙基-5-甲基胞苷(m5Ceo)或其任何组合。
在一些实施方案中,靶向部分的所有核苷酸都具有2'O-甲基修饰。2'O-甲基修饰被认为增加工程化多核苷酸对其mRNA前体靶标的亲和力和/或防止工程化多核苷酸被核酸酶降解。在一些实施方案中,靶向部分的所有核苷酸均具有硫代磷酸酯修饰。
调节部分
在本文所述的工程化多核苷酸的一些实施方案中,转录后调节部分(或调节部分)(例如,剪接体部分)选自剪接体核糖核蛋白复合物、剪接体小核核糖核酸(snRNA)、剪接体蛋白、其功能变体或其功能片段。在一些实施方案中,剪接体部分包含U1 snRNA和剪接体蛋白。在一些实施方案中,剪接体部分包含U2 snRNA和剪接体蛋白。在一些实施方案中,剪接体snRNA选自U1、U2、U4、U5、U6、U11、U12、U14atac、U6atac及其组合。在一些实施方案中,剪接体snRNA为U1或U2。在一些实施方案中,剪接体蛋白选自Sm、U1-70k、U1A、U1C及其组合。剪接体部分的非限制性示例包括SmD1、SmD2、SmD3、SmE、SmF、SmG、U1、U2、U4、U5、U6、U11、U12、U14或U16。
在本文所述的一些实施方案中,当与工程化多核苷酸和RNA(例如,mRNA,诸如mRNA前体)相关联时,剪接体部分切割或剪接在靶序列中的RNA(例如,mRNA,诸如mRNA前体)。在一些实施方案中,剪接体部分还促进切割的RNA(例如,切割的mRNA,诸如切割的mRNA前体)的修饰。
在一些实施方案中,工程化多核苷酸通过碱基配对诸如Watson-Crick碱基配对与靶序列结合。工程化多核苷酸与本文提供的募集部分的结合可用于调谐靶基因的表达或活性。在一些实施方案中,工程化多核苷酸与募集部分的结合使得募集部分能够以增加的特异性剪接编码靶基因的mRNA前体,从而调谐靶基因。在一些实施方案中,工程化多核苷酸与募集部分的结合使得募集部分能够以增加的效率剪接编码靶基因的mRNA前体,从而调谐靶基因。调谐可以指增加或减少靶基因的表达或活性。靶基因的非限制性示例可以包括微管相关蛋白tau(MAPT)。在一些实施方案中,与不存在与募集部分结合的工程化多核苷酸的情况下靶基因的表达或活性相比,当工程化多核苷酸与募集部分结合时,靶基因的表达或活性增加至少10%、20%、30%、40%、50%、60%、70%、80%、90%、增加至2倍、3倍、4倍、5倍、10倍或更多。在一些实施方案中,与不存在与募集部分结合的工程化多核苷酸的情况下靶基因的表达或活性相比,当工程化多核苷酸与募集部分结合时,靶基因的表达或活性减少至少10%、20%、30%、40%、50%、60%、70%、80%、90%、减少至1/2、1/3、1/4、1/5、1/10或更少。
在一些实施方案中,靶标的表达或活性的调谐包括纠正由于剪接变体导致的靶基因的异常表达。在一些实施方案中,与不存在与募集部分结合的工程化多核苷酸的情况下由于异常剪接变体导致的错误折叠靶基因或蛋白质的表达或活性相比,当工程化多核苷酸与募集部分结合时,由于异常剪接变体导致的错误折叠靶基因或蛋白质的表达或活性减少至少10%、20%、30%、40%、50%、60%、70%、80%、90%、减少至1/2、1/3、1/4、1/5、1/10或更少。在一些实施方案中,与不存在与募集部分结合的工程化多核苷酸的情况下由于异常剪接变体导致的错误折叠蛋白质聚集体的量相比,当工程化多核苷酸与募集部分结合时,由于异常剪接变体导致的错误折叠蛋白质聚集体的量减少至少10%、20%、30%、40%、50%、60%、70%、80%、90%、减少至1/2、1/3、1/4、1/5、1/10或更少。在一些实施方案中,与不存在与募集部分结合的工程化多核苷酸的情况下由于异常剪接变体导致的包含错误折叠蛋白质的噬斑的量相比,当工程化多核苷酸与募集部分结合时,由于异常剪接变体导致的包含错误折叠蛋白质的噬斑的量减少至少10%、20%、30%、40%、50%、60%、70%、80%、90%、减少至1/2、1/3、1/4、1/5、1/10或更少。
分子相互作用
在本文所述的一些实施方案中,靶向部分包含与组成型剪接供体的保守位点相互作用的游离5'和3'端。这种相互作用可以沉默U1 snRNA RNA结合结构域。在一些实施方案中,靶向部分包含增加对mRNA前体靶标的亲和力的2'修饰的核苷酸。
在一些实施方案中,靶向部分与mRNA前体的结合通过U1-C与mRNA前体剪接接合区域周围的mRNA前体主链之间的氢键和静电相互作用来稳定。在这些实施方案中,U1-C可以不与mRNA前体进行特异性碱基接触。2'核苷酸修饰可以有利于靶向部分与U1-C之间的氢键结合。因此,靶向部分(游离5'和3'端)与mRNA前体双链体的结合使得U1-C的靶向相互作用能够识别和稳定化。
U1-C可以稳定剪接体中央核心。U1-C通过U1-70KD与Sm环之间的相互作用桥增强不相容5'-剪接的亲和力并稳定剪接体机制的中央核心。
在一些实施方案中,靶向部分可以与U1-C的锌指的相互作用。靶向部分中的硫代磷酸酯核苷酸间键合有利于靶向部分和锌指的相互作用。
在一些实施方案中,募集部分与U1-A的茎环II形成氢桥。这种相互作用可以调谐U1-A的聚腺苷酸化和乙酰化信号传导,因为U1-A的茎环II不能被募集部分沉默。
在本文所述的一些实施方案中,工程化多核苷酸不包含任何分子内二硫键。
在本文所述的工程化多核苷酸的一些实施方案中,当与工程化多核苷酸和剪接体部分相关联时,RNA(例如,mRNA,诸如mRNA前体)实质上不表现出与U1 snRNA的RNA结合结构域(RBD)的碱基配对。
在本文所述的工程化多核苷酸的一些实施方案中,当与工程化多核苷酸和剪接体部分相关联时,RNA(例如,mRNA,诸如mRNA前体)实质上不表现出与U1-C蛋白的碱基特异性相互作用。
在本文所述的工程化多核苷酸的一些实施方案中,工程化多核苷酸被配置为与U1-C蛋白的锌指(例如,包含氨基酸序列:YYCDYCDTYLTHDSPSVRKTHCTGRKHRDNVKF(SEQ IDNO:9))特异性地相互作用。在一些实施方案中,工程化多核苷酸的5'-靶向部分被配置为与U1-C蛋白的锌指特异性地相互作用。在一些实施方案中,工程化多核苷酸(例如,其5'-靶向部分)被配置为与U1-C蛋白的锌指共价地相互作用(例如,通过二硫键)。在一些实施方案中,工程化多核苷酸(例如,其5'-靶向部分)被配置为与U1-C蛋白的锌指非共价地相互作用(例如,通过氢键)。
在一些实施方案中,工程化多核苷酸(例如,本文所述的ASMO1或ASMO2)包含与U1snRNA互补的核苷酸序列。在本文所述的工程化多核苷酸的一些实施方案中,工程化多核苷酸包含与U1 snRNA的茎环II(SL2)的部分序列互补的核苷酸序列。在一些实施方案中,工程化多核苷酸的茎环结构的一侧包含与U1 snRNA的茎环II(SL2)的部分序列互补的核苷酸序列。在一些实施方案中,部分序列包含与U1 snRNA的SL2的5’-GGCCU-3’对应的序列。在一些实施方案中,部分序列不包含与U1 snRNA的SL2的5’-CACGUUA-3’对应的序列。
在本文所述的工程化多核苷酸的一些实施方案中,工程化多核苷酸实质上不表现出与U1 snRNA的SL2的锚定序列的碱基配对。在一些实施方案中,锚定序列包含对应于5'-CACGUUA-3'的序列。在一些实施方案中,工程化多核苷酸的内环实质上不表现出与U1snRNA的SL2的锚定序列的碱基配对。在一些实施方案中,工程化多核苷酸的下茎实质上不表现出与U1 snRNA的SL2的锚定序列的碱基配对。
在本文所述的工程化多核苷酸的一些实施方案中,工程化多核苷酸实质上不表现出与U1 snRNA的H螺旋的碱基配对。
在一些实施方案中,工程化多核苷酸不包含任何分子内二硫键。在一些实施方案中,当将所描述的剪接体部分募集至靶序列(诸如靶mRNA前体)时,工程化多核苷酸不表现出与剪接体部分(诸如U1snRNA)的RNA结合结构域(RBD)的碱基配对。图4示出了工程化多核苷酸和剪接体部分的RBD之间碱基配对的这种缺乏,其中U1snRNA的RBD位点具有以下序列:3'-GUCCAUCAUA-5'并与靶序列形成碱基配对。在一些情况下,当工程化多核苷酸和剪接体部分结合时,工程化多核苷酸实质上不表现出与U1-C剪接体部分的碱基特异性相互作用。在一些实施方案中,工程化多核苷酸被配置为与U1-C蛋白的锌指或U1-1剪接体部分特异性地相互作用。图10C示出了含有145个氨基酸的U1-C snRNP的代表性序列,其中突出显示的36个氨基酸(YYCDYCDTYLTHDSPSVRKTHCTGRKHRDNVKF(SEQ ID NO:9))包含锌指结构域。
在一些实施方案中,工程化多核苷酸被配置为与U1-C蛋白的锌指或U1-1剪接体部分共价地相互作用(例如,通过二硫键)。在一些实施方案中,工程化多核苷酸被配置为与U1-C蛋白的锌指或U1-1剪接体部分非共价地相互作用(例如,通过氢键)。在一些实施方案中,工程化多核苷酸(例如,本文所述的ASMO1或ASMO2)包含与U1 snRNA互补的核苷酸序列。在一些实施方案中,工程化多核苷酸包含与U1 snRNA的茎环II(SL2)的部分序列互补的核苷酸序列。在一些实施方案中,工程化多核苷酸的茎环二级结构的一侧包含与U1 snRNA的茎环II(SL2)的部分序列互补的核苷酸序列。在一些实施方案中,部分序列包含与U1 snRNA的SL2的5’-GGCCU-3’对应的序列。在一些实施方案中,部分序列不包含与U1 snRNA的SL2的5’-CACGUUA-3’对应的序列。在一些实施方案中,工程化多核苷酸实质上不表现出与U1snRNA的SL2的锚定序列的碱基配对。在一些情况下,所述工程化多核苷酸的内环实质上不表现出与U1 snRNA的所述SL2的所述锚定序列的碱基配对。在一些方面,所述工程化多核苷酸的下茎实质上不表现出与U1 snRNA的所述SL2的所述锚定序列的碱基配对。在一些方面,锚定序列包含对应于5'-CACGUUA-3'的序列。在一些情况下,工程化多核苷酸实质上不表现出与U1 snRNA的H螺旋的碱基配对,其中工程化多核苷酸不包含任何分子内二硫键。例如,图2A示出了由于采用硫代磷酸酯型核苷酸间键的化学修饰的存在而导致分子内二硫键的缺乏。U1 snRNP复合物的稳定化可以通过U1-C锌指的强离子吸引力观察到,这是由在5'-或/和3'-端处的工程化多核苷酸(ASMO)靶向部分的硫醇的二硫桥诱导的。mRNA前体/工程化多核苷酸(ASMO)双链体键可以通过U1-C与缝接点周围的mRNA前体主链之间的氢键和静电相互作用来稳定,但U1-C不会与mRNA前体碱基特异性接触。该结构表明,由U1 snRNP对5'-剪接核苷酸的选择主要是通过茎5'/3'与mRNA前体之间的相互作用来实现的。同时,U1-C通过U1-70KDa与Sm环之间的相互作用桥调整5'-剪接不相容位点的相对亲和力并稳定剪接体机制的中央核心(参见图7-9)。在U1 snRNP特异性蛋白中,U1-70K和U1-C在帮助识别mRNA前体转录本方面发挥着重要作用。U1-70K具有虽然高度保守但预计为非结构化的N末端(残基约2-60);介导其与U1 snRNA茎环的相互作用的RNA结合结构域(或RBD)(残基92-202);以及富含精氨酸和丝氨酸残基(RS“结构域”)以及R-(D/E)残基重复序列的C末端。尽管该C末端结构域并不保守,但RS“结构域”对于与非snRNP剪接因子(诸如ASF/SF2)的相互作用非常重要。该区域的丝氨酸经受翻译后修饰(磷酸化)且对于剪接活性非常重要。U1-C由N末端锌指结构域和富含RG残基重复序列的C末端区域组成。U1-C的该区域中的精氨酸经受翻译后修饰(甲基化)。与U1-70K相比,U1-C不与游离U1 snRNA结合,但需要Sm蛋白与U1-70K事先结合。U1-C锌指区域中的突变对U1 snRNP识别5'剪接位点具有显著影响,表明该蛋白在此活性中发挥直接作用。U1 snRNP的装配和功能最初通过冷冻电子显微镜研究以及最近通过X射线晶体学阐明其三维结构而得到极大增强。此前,七个Sm蛋白中的四个的晶体结构导致了对其余三个(Sm-F、Sm-E和Sm-G)的建模,并提出了它们将会相互作用以形成七元环。完全重组的人U1 snRNP的晶体结构揭示,Sm蛋白确实形成七聚环,该环由每个Sm蛋白的单个拷贝组成,穿过其中心的是U1 snRNA的Sm位点。在晶体结构中,U1-C所处的位置能够识别当U1 snRNA的5'端与5'剪接位点碱基配对时形成的双链体。U1-70K的N末端从RBD延伸并包裹Sm环的一个面,穿过Sm-D2和Sm-D3/B,这一发现因此可以确保用于与U1snRNA:5'剪接位点双链体相互作用的U1-C的正确结构和定位(图9)。
在一些实施方案中,工程化多核苷酸当与本文所述的剪接体部分相关联时,mRNA前体实质上不表现出与U1 snRNA的RNA结合结构域(RBD)的碱基配对。在一些情况下,工程化多核苷酸当与剪接体部分相关联时,mRNA前体实质上不表现出与U1-C蛋白碱基特异性的相互作用。图4示出了在不存在工程化多核苷酸的情况下,U1snRNA的RBD结合在组成型供体的保守区域中。同时,在存在工程化多核苷酸的情况下,茎5'/3'阻断U1 snRNA与mRNA前体的RBD相互作用(图3和图6)。
在一些实施方案中,工程化多核苷酸被配置为与U1-C蛋白的锌指特异性地相互作用。在一些实施方案中,工程化多核苷酸的5'-靶向部分被配置为与U1-C蛋白的锌指特异性地相互作用。在一些实施方案中,工程化多核苷酸被配置为与U1-C蛋白的锌指共价地相互作用(例如,通过二硫键)。在一些实施方案中,工程化多核苷酸被配置为与U1-C蛋白的锌指非共价地相互作用(例如,通过氢键)。与U1-C锌指的氨基酸残基相互作用的mRNA前体/工程化多核苷酸(ASMO)双链体的形成稳定了5;区域(图9)。然后,可以观察到通过由U1-C锌指的主链和侧链中的原子与工程化多核苷酸的茎5'形成的二硫键的形成的有利分子动力学。当ASMO与U1-C锌指中存在的所有半胱氨酸相互作用时,也可以形成强离子键(图9和图10)。在存在或不存在本文所述的工程化多核苷酸的情况下U1-C与mRNA前体之间的附加相互作用示例显示在表5中。
表5.由工程化多核苷酸的存在介导的U1-C与mRNA前体之间的示例相互作用
在一些实施方案中,工程化多核苷酸(例如,本文所述的ASMO1或ASMO2)包含与U1snRNA互补的核苷酸序列。在一些方面,工程化多核苷酸包含与U1 snRNA的茎环II(SL2)的部分序列互补的核苷酸序列。在其他方面,本文描述的为所述工程化多核苷酸的茎环结构的一侧包含与U1 snRNA的茎环II(SL2)的部分序列互补的核苷酸序列。在一些情况下,部分序列包含与U1 snRNA的SL2的5’-GGCCU-3’对应的序列,其中部分序列不包含与U1 snRNA的SL2的5’-CACGUUA-3’对应的序列,并且其中工程化多核苷酸实质上不表现出与U1 snRNA的SL2的锚定序列的碱基配对。在一些方面,工程化多核苷酸包含所述工程化多核苷酸的内环,其实质上不表现出与U1 snRNA的所述SL2的所述锚定序列的碱基配对。在一些实施方案中,工程化多核苷酸包含所述工程化多核苷酸的下茎,其实质上不表现出与U1 snRNA的所述SL2的所述锚定序列的碱基配对。在一些实施方案中,锚定序列包含对应于5'-CACGUUA-3'的序列,其中工程化多核苷酸实质上不表现出与U1 snRNA的H螺旋的碱基配对。
工程化多核苷酸组
在一些实施方案中,本文所述包括各自独立地本文所述的工程化多核苷酸组。例如,该多核苷酸组可独立地包含:(i)一个或多个靶向部分(诸如本文所述),所述靶向部分被配置为在靶序列(诸如本文所述)处结合核糖核酸(RNA)(诸如本文所述)(例如,信使核糖核酸(mRNA),诸如信使核糖核酸前体(mRNA前体)),和(ii)募集部分(诸如本文所述),所述募集部分被配置为募集转录后调节部分(例如,剪接体部分)(诸如本文所述),其中该工程化多核苷酸组被配置为在包含靶序列(诸如本文所述)的多个靶序列处特异性地结合RNA(例如,mRNA,诸如mRNA前体)。
载体
本文所述的一些实施方案中包括包含编码本文所述的工程化多核苷酸的核酸序列的载体或质粒。
本文所述的一些实施方案中包括多个载体或多个质粒,其包含各自编码本文所述的工程化多核苷酸的多个核酸序列。在一些实施方案中,多个载体或多个质粒包含编码多于一种本文所述的工程化多核苷酸的多个核酸序列。在一些实施方案中,多个载体或多个质粒包含编码多个工程化多核苷酸(各自独立地在本文中描述)的多个核酸序列。
药物组合物
在一些实施方案中,本文描述的是药物组合物,其包含本文所述的工程化多核苷酸、或质粒、载体或编码其序列的分离DNA。如本文所用的药物组合物是指至少一种工程化多核苷酸或编码至少一种工程化多核苷酸的载体与其他化学组分(即药学上可接受的非活性成分)的混合物,该其他化学组分是诸如例如载剂、赋形剂、黏合剂、填充剂、混悬剂、矫味剂、甜味剂、崩解剂、分散剂、表面活性剂、润滑剂、着色剂、稀释剂、增溶剂、润湿剂、增塑剂、稳定剂、渗透促进剂、湿润剂、消泡剂、抗氧化剂、防腐剂或其一种或多种组合。任选地,组合物包括两种或更多种本文讨论的药物组合物。在实施本文提供的治疗或用途的方法中,将治疗有效量的本文所述的药物组合物以药物组合物形式施用于患有待治疗的疾病、病症或病况的哺乳动物。在一些实施方案中,哺乳动物为人类。治疗有效量可以根据疾病的严重程度、对象的年龄和相对健康状况、所用药物组合物的效力和其他因素而广泛变化。药物组合物可以单独使用或与一种或多种作为混合物组分的药物组合物组合使用。本文所述的药物组合包括工程化多核苷酸、组合物、与工程化多核苷酸接触的细胞或与包含工程化多核苷酸的组合物接触的细胞、或其组合。
本文所述的药物制剂通过适当的施用途径施用于对象,包括但不限于静脉内、动脉内、口服、肠胃外、口腔、局部、透皮、直肠、肌内、皮下、骨内、透粘膜、吸入或腹膜内施用途径。本文所述的药物制剂包括但不限于水性液体分散体、自乳化分散体、固体溶液、脂质体分散体、气雾剂、固体剂型、粉剂、即释制剂、控释制剂、速溶制剂、片剂、胶囊、丸剂、延迟释放制剂、延长释放制剂、脉冲释放制剂、多颗粒制剂以及即时和控释混合制剂。
包括药物组合物的药物组合物以常规方式制造,诸如,仅作为示例,通过常规混合、溶解、制粒、糖衣丸制造、磨细、乳化、包封、包埋或压缩工艺。
试剂盒
在一些实施方案中,本文描述的是用于使用本文所述的工程化多核苷酸、组合物或药物组合物的试剂盒。在一些实施方案中,本文公开的试剂盒可用于治疗对象的疾病或病况。在一些实施方案中,试剂盒包含除工程化多核苷酸、组合物或药物组合物之外的材料或组分的集合。在一些实施方案中,试剂盒包含用于测定和选择用于治疗疾病或病况的合适寡核苷酸的组分。在一些实施方案中,试剂盒包含用于进行诸如酶联免疫吸附测定(ELISA)、单分子阵列(Simoa)、PCR或qPCR等测定的组分。试剂盒中配置的组分的确切性质取决于其预期用途。例如,一些实施方案被配置用于治疗对象中本文公开的疾病或病况的目的。在一些实施方案中,试剂盒被特别地配置用于治疗哺乳动物对象的目的。在一些实施方案中,试剂盒被特别配置用于治疗人类对象的目的。
试剂盒中可包含使用说明。在一些实施方案中,试剂盒包含用于向有需要的对象施用组合物的说明书。在一些实施方案中,试剂盒包含用于进一步对工程化多核苷酸进行工程化的说明书。在一些实施方案中,试剂盒包含解冻或以其他方式恢复工程化多核苷酸的生物活性的说明书,该工程化多核苷酸可以在储存或运输期间被冷冻保存或冻干。在一些实施方案中,试剂盒包含用于测量其预期目的功效的说明书(例如,如果用于治疗对象,则为治疗功效)。
任选地,试剂盒还包含其他有用的组分,诸如稀释剂、缓冲剂、药学上可接受的载剂、注射器、导管、涂药器、移液或测量工具、绷带材料或其他有用的用具。组装在试剂盒中的材料或组分可以以保持它们的可操作性和实用性的任何方便且合适的方式存储来提供给从业者。例如,工程化多核苷酸、组合物或药物组合物可为溶解的、脱水的或冻干的形式。这些组分通常包含在合适的包装材料中。
方法
本文描述的是利用工程化多核苷酸(诸如本文所述)的方法,诸如用于改变在细胞中的核糖核酸(RNA)(例如,信使核糖核酸(mRNA),诸如信使核糖核酸前体(mRNA前体))的方法。方法可以包括使细胞与包含一个或多个靶向部分和募集部分的工程化多核苷酸(诸如本文所述)接触。一个或多个靶向部分可与RNA(例如,mRNA,诸如mRNA前体)(诸如本文所述)中的靶序列(诸如本文所述)处与RNA结合,并且募集部分募集在RNA(例如,mRNA,例如mRNA前体)的靶序列附近内的转录后调节部分(例如,剪接体部分)(诸如本文所述)以改变细胞中的RNA(例如,mRNA,诸如mRNA前体),从而产生一种或多种改变的RNA(例如,一种或多种改变的mRNA,诸如一种或多种改变的mRNA前体)。在一些实施方案中,改变靶基因的表达或活性的方法。在一些实施方案中,在接触之前,细胞表现出对应于靶基因的异常信使核糖核酸(mRNA)或蛋白质。在一些实施方案中,一个或多个靶向部分的靶向部分与靶基因(例如,微管相关蛋白tau(MAPT))的靶序列中的共有序列足够相同或互补。
本文的描述包括用于改变在细胞中多个位置处的核糖核酸(RNA)(例如,信使核糖核酸(mRNA),诸如信使核糖核酸前体(mRNA前体))的方法。方法可以包括使细胞与工程化多核苷酸组(诸如各自独立地在本文中描述)接触。工程化多核苷酸可包含一个或多个靶向部分和募集部分。一个或多个靶向部分可在RNA(例如,mRNA,诸如mRNA前体)(诸如本文所述)中的多个靶序列(诸如本文所述)处结合至RNA。每个募集部分可以募集RNA(例如,mRNA,诸如mRNA前体)靶序列附近内的转录后调节部分(例如,剪接体部分)(诸如本文所述的)以改变细胞中的RNA(例如,mRNA,诸如mRNA前体),从而产生一种或多种改变的RNA(例如,一种或多种改变的mRNA,诸如一种或多种改变的mRNA前体)。在一些实施方案中,该方法通过在多个位置处改变(例如,切割或/和化学修饰)RNA(例如,mRNA,诸如mRNA前体)来改变靶基因的表达或活性。在一些实施方案中,在接触之前,细胞表现出对应于靶基因的异常信使核糖核酸(mRNA)或蛋白质。在一些实施方案中,一个或多个靶向部分中的一个或每个靶向部分与靶基因(例如,微管相关蛋白tau(MAPT))的靶序列中的共有序列足够相同或互补。
在一些实施方案中,方法包括将工程化多核苷酸递送至细胞中。在一些实施方案中,该方法包括将编码工程化多核苷酸的多核苷酸递送至细胞中并随后表达工程化多核苷酸以调谐由本文所述的靶序列编码的基因的表达或活性。在一些实施方案中,方法包括使用工程化多核苷酸来治疗有需要的对象的疾病或病况。疾病或病况可与由RNA(例如mRNA,诸如mRNA前体)编码的靶基因的异常表达或活性相关。在一些实施方案中,RNA(例如,mRNA,诸如mRNA前体)对应于靶基因(例如,微管相关蛋白tau(MAPT))。
图1示出了用于鉴定剪接供体和受体以设计工程化多核苷酸的核苷酸序列的示意图,其中本文所述的工程化多核苷酸或方法呈现出相对于目前可用的用于调谐基因的表达或活性以治疗疾病或病况的方法的改进。在一些实施方案中,本文所述的方法通过靶向造成疾病或病况的基因的转录本的工程化多核苷酸来调谐基因的表达或活性。在一些实施方案中,本文所述的方法包括向有需要的对象施用本文所述的工程化多核苷酸。在一些情况下,本文所述的方法包括利用工程化多核苷酸来募集调节部分来调谐造成疾病或病况的基因的表达或活性,从而治疗疾病或病况。在一些方面,本文所述的方法包括利用工程化多核苷酸来稳定调节部分的装配,以调谐造成疾病或病况的基因的表达或活性,从而治疗疾病或病况。
在一些实施方案中,本文描述了将本文所述的工程化多核苷酸递送至细胞的方法。在一些实施方案中,该方法包括将工程化多核苷酸直接或间接递送至细胞。在一些实施方案中,该方法包括使细胞与包含本文所述的工程化多核苷酸的组合物接触。在一些实施方案中,该方法包括在细胞中表达本文所述的工程化多核苷酸。在一些实施方案中,工程化多核苷酸或编码工程化多核苷酸的载体可以通过本文所述的任何转染方法递送至细胞中。在一些实施方案中,可以通过使用表达载体将工程化多核苷酸递送至细胞中。在表达载体的情况下,可以通过本领域的任何方法容易地将载体引入本文所述的细胞中。例如,可以通过物理、化学或生物手段将表达载体转移至细胞中。
用于将工程化多核苷酸或编码工程化多核苷酸的载体引入细胞的物理方法可以包括磷酸钙沉淀、脂质转染、粒子轰击、显微注射、基因枪、电穿孔等。用于产生包含载体和/或外源核酸的细胞的方法适用于本文的方法。用于将工程化多核苷酸或编码工程化多核苷酸的载体引入宿主细胞的一种方法是磷酸钙转染。
用于将工程化多核苷酸或编码工程化多核苷酸的载体引入细胞的化学方法可以包括胶体分散系统,如大分子复合物、纳米胶囊、微球、珠粒和基于脂质的系统,包括水包油乳液、胶束、混合胶束、球形核酸(SNA)、脂质体或脂质纳米颗粒。用作体外和体内递送载体的示例胶体系统是脂质体(例如,人工膜囊泡)。其他最先进的核酸靶向递送方法是可用的,例如用靶标纳米颗粒递送工程化多核苷酸或编码工程化多核苷酸的载体。
在利用非病毒递送系统的情况下,递送载体示例是脂质体。考虑使用脂质制剂将工程化多核苷酸或编码工程化多核苷酸的载体引入细胞中(体外、离体或体内)。在另一方面,工程化多核苷酸或编码工程化多核苷酸的载体可以与脂质相关联。与脂质相关联的工程化多核苷酸或编码与脂质相关联的工程化多核苷酸的载体可以封装在脂质体的水性内部中,散布在脂质体的脂双层内,通过与脂质体和工程化多核苷酸两者相关联的连接分子附接至脂质体,包埋在脂质体中,与脂质体复合,分散在含有脂质的溶液中,与脂质混合,与脂质组合,作为悬浮液包含在脂质中,含有胶束或与胶束复合,或以其他方式与脂质相关联。脂质、脂质/DNA或脂质/表达载体相关联组合物不限于在溶液中的任何特定结构。例如,在一些实施方案中,它们以双层结构存在,如胶束,或具有“塌陷”结构。或者,它们只是散布在溶液中,可以形成尺寸或形状不均匀的聚集体。脂质是脂肪物质,其在一些实施方案中是天然存在的或合成的脂质。例如,脂质包括天然存在于细胞质中的脂肪滴,以及含有长链脂肪族烃及其衍生物的一类化合物,例如脂肪酸、醇、胺、氨基醇和醛。
适合使用的脂质是从商业来源获得的。脂质在氯仿或氯仿/甲醇中的储备溶液通常储存在约-20℃。氯仿被用作唯一的溶剂,因为它比甲醇更容易蒸发。“脂质体”是一个通用术语,涵盖通过生成封闭的脂质双层或聚集体而形成的各种单层和多层脂质载体。脂质体通常特征在于具有带有磷脂双层膜和内部水介质的囊泡结构。多层脂质体具有由水介质分隔的多个脂质层。当磷脂悬浮在过量的水溶液中时,它们会自发形成。脂质组分在形成封闭结构之前经历自我重排,并在脂质双层之间截留水和溶解的溶质。然而,也包括在溶液中具有与正常囊泡结构不同的结构的组合物。例如,在一些实施方案中,脂质呈现胶束结构或仅作为脂质分子的不均匀聚集体存在。还考虑脂转染试剂-核酸复合物。
在一些情况下,非病毒递送方法包括脂质转染、核转染、显微注射、生物射弹、病毒体、脂质体、免疫脂质体、外泌体、聚阳离子或脂质:货物缀合物(或聚集体)、裸多肽(例如,重组多肽)、裸DNA、人工病毒颗粒,以及多肽或DNA的药物增强摄取。在一些实施方案中,递送方法包括将本文所述的组合物或工程化多核苷酸与至少一种聚合物如天然聚合物或合成材料缀合或封装。该聚合物可以是生物相容的或可生物降解的。合适的生物相容性、可生物降解的合成聚合物的非限制性示例可以包括脂族聚酯、聚(氨基酸)、共聚(醚-酯)、聚亚烷基草酸酯、聚酰胺、聚(亚氨基碳酸酯)、聚原酸酯、聚氧杂酯、聚酰胺酯、含有胺基团的聚氧杂酯和聚(酸酐)。此类合成聚合物可以是多种不同单体的均聚物或共聚物(例如无规则的、区段、片段、移植物),例如,两个或多个乳酸、丙交酯、乙醇酸、乙交酯、ε-己内酯、三亚甲基碳酸酯、p-二噁烷酮等。在示例中,支架可以由包含乙醇酸和乳酸的聚合物组成,诸如乙醇酸与乳酸的比例为90/10或5/95的那些。天然存在的生物相容性、可生物降解聚合物的非限制性示例可以包括糖蛋白、蛋白多糖、多糖、糖胺聚糖(GAG)和衍生自这些组分的片段、弹性蛋白、层粘连蛋白、decrorin、纤维蛋白原/纤维蛋白、纤连蛋白、骨桥蛋白、腱蛋白、透明质酸、胶原蛋白、硫酸软骨素、肝素、硫酸乙酰肝素、ORC、羧甲基纤维素和几丁质。
在一些情况下,本文所述的工程化多核苷酸或编码工程化多核苷酸的载体可被包装并经由细胞外囊泡递送至细胞。细胞外囊泡可以是任何膜结合颗粒。在一些实施方案中,细胞外囊泡可以是由至少一种细胞分泌的任何膜结合颗粒。在一些情况下,细胞外囊泡可以是体外合成的任何膜结合颗粒。在一些情况下,细胞外囊泡可以是无需细胞合成的任何膜结合颗粒。在一些情况下,细胞外囊泡可以是外来体、微囊泡、逆转录病毒样颗粒、凋亡小体、凋亡体、癌小体、exopher、包膜病毒、exomeres或其他非常大的细胞外囊泡。
在一些方面,本文描述了用于调谐或改变由细胞中的靶序列编码的基因的表达或活性的方法。在一些实施方案中,靶序列是细胞中的信使核糖核酸前体(mRNA前体)。在一些实施方案中,该方法包括使细胞与包含一个或多个靶向部分和募集部分的工程化多核苷酸接触。在一些实施方案中,一个或多个靶向部分在所述mRNA前体中的靶序列处结合至所述mRNA前体。在一些实施方案中,募集部分募集所述mRNA前体的所述靶序列附近内的转录后调节部分(例如,剪接体部分)以改变所述细胞中的所述mRNA前体,从而产生一种或多种改变的mRNA前体。在一些实施方案中,mRNA前体对应于靶基因,例如微管相关蛋白Tau(MAPT)。在一些实施方案中,当工程化多核苷酸结合剪接体部分并将其募集至靶序列时,该方法增加靶基因的表达或活性。在一些实施方案中,当工程化多核苷酸结合剪接体部分并将其募集至靶序列时,该方法减少靶基因的表达或活性。在一些实施方案中,当工程化多核苷酸结合并将其募集至靶序列时,该方法纠正对应于所述靶基因的异常信使核糖核酸(mRNA)或蛋白质。
在一些实施方案中,方法包括将两个或更多个工程化多核苷酸接触或递送到单个细胞中,其中工程化多核苷酸各自包含一个或多个被配置为结合两个或更多个靶序列的靶向部分。两个或更多个靶序列可以位于编码靶基因的mRNA前体的同一链上。两个或更多个靶序列可以位于编码相同靶基因的mRNA前体的不同链上。两个或更多个靶序列可以位于mRNA前体的不同链上,其中mRNA前体的每条链可以编码不同的靶基因。在一些实施方案中,方法包括两个或更多个工程化多核苷酸,其被配置为在包含所述靶序列的多个靶序列处特异性地结合所述mRNA前体。
在一些实施方案中,本文公开了通过调谐细胞中靶基因的表达或活性来治疗疾病或病况的方法,从而治疗疾病或病况。在一些实施方案中,方法包括通过纠正对应于所述靶基因的异常信使核糖核酸(mRNA)或蛋白质来治疗疾病或病况。在一些实施方案中,疾病或病况与本文所述的任一靶基因的表达或活性增加相关。在一些实施方案中,疾病或病况与本文所述的任一靶基因的表达或活性减少相关。在一些实施方案中,疾病或病况与对应于本文所述的任一靶基因的异常信使核糖核酸(mRNA)或蛋白质的剪接相关。
在一些实施方案中,工程化多核苷酸或包含工程化多核苷酸的药物组合物可以单独施用于对象(例如,独立治疗)。在一些实施方案中,工程化多核苷酸或包含工程化多核苷酸的药物组合物与附加药剂组合施用。在一些情况下,本文所用的附加药剂单独施用。工程化多核苷酸或包含工程化多核苷酸和附加药剂的药物组合物可以一起或顺序施用。组合疗法可以在同一天内施用,或者可以间隔一天或多天、周、月或年施用。
在一些实施方案中,工程化多核苷酸或包含工程化多核苷酸的药物组合物是疾病或病况的一线治疗。在一些实施方案中,工程化多核苷酸或包含工程化多核苷酸的药物组合物是二线、三线或四线治疗。在一些实施方案中,工程化多核苷酸或包含工程化多核苷酸的药物组合物包含至少一种、两种、三种、四种、五种、六种、七种、八种、九种、10种、20种、30种或更多种寡核苷酸。一般而言,本文公开的方法包括通过口服施用来施用工程化多核苷酸或包含工程化多核苷酸的药物组合物。然而,在一些情况下,方法包括通过腹膜内注射施用工程化多核苷酸或包含工程化多核苷酸的药物组合物。在一些情况下,该方法包括通过静脉内(“iv”)施用来施用工程化多核苷酸或包含工程化多核苷酸的药物组合物。可以想象的是,还可以通过其他途径施用本文公开的工程化多核苷酸或包含工程化多核苷酸的药物组合物,例如皮下注射、肌内注射、皮内注射、经皮注射、透皮施用、鼻内施用、淋巴内注射、直肠施用、胃内施用、或任何其他合适的肠胃外施用。在一些实施方案中,与全身途径相比,优选更接近损伤或炎症部位的局部递送途径。可以调整施用治疗的途径、剂量、时间点和持续时间。在一些实施方案中,治疗剂的施用是在疾病或病况的急性和慢性症状之一或两者发作之前或之后。
施用于对象的合适剂量和给药频率由包括但不限于以下的因素确定:具体的工程化多核苷酸、组合物或药物组合物、疾病状况及其严重程度、需要治疗的对象的身份(例如体重、性别、年龄),并且可以根据病例周围的具体情况来确定,包括,例如,所施用的具体药剂、施用途径、所治疗的病况和所治疗的对象。
使用绝对或者顺序的术语,例如,“将(will)”、“将不(will not)”、“会(shall)”、“不会(shall)”、“必须(must)”、“必须不是(must not)”、“第一(first),”、“最初(initially)”、“下一个(next)”、“随后(subsequently)”、“之前(before)”、“之后(after)”、“最后(lastly)”和“最终(finally)”,并不意味着限制本文所公开的本实施实施方案的范围,而是作为示例。
如本文所用的,除非上下文清楚地另有说明,单数形式“一个”、“一种”和“该”也旨在包括复数形式。此外,就详细描述和/或权利要求中使用的术语“包括”、“包含”、“具有”或其变体而言,这些术语旨在是包容性的方式,类似于术语“包含”。
如本文所用的,短语“至少一个”、“一个或多个”和“和/或”为开放式表达,其在操作中既是合取的又是析取的。例如,表述“A、B和C中的至少一个”、“A、B或C中的至少一个”、“A、B和C中的一个或多个”、“A、B或C中的一个或多个”和“A、B和/或C”是指单独的A、单独的B、单独的C、A和B一起、A和C一起、B和C一起、或者A、B和C一起。
如本文所用的,“或”可以指“和”、“或”或“和/或”且均可以排他地和包含地使用。例如,术语“A或B”可以指“A或B”、“A但不是B”、“B但不是A”以及“A和B”。在一些情况下,上下文可以决定特定的含义。
本文所述的任何系统、方法、软件和平台都是模块化的。因此,诸如“第一”和“第二”的术语不一定意味着优先级、重要性顺序或行为顺序。
当提及数字或数值范围时,术语“约”意味着所提及的数字或数值范围是实验变异性内(或统计实验误差内)的近似值,并且该数字或数值范围可以在例如规定数字或数值范围的1%至15%变化。在示例中,术语“约”是指规定数字或值的±10%。
如本文所用的,术语“增加”通常意指静态显著量的增加。在一些方面,术语“增加”意指与参考水平相比增加至少10%,例如与参考水平、标准或对照相比增加至少约10%、至少约20%、或至少约30%、或至少约40%、或至少约50%、或至少约60%、或至少约70%、或至少约80%、或至少约90%,或高达并包括100%的增加或10-100%之间的任何增加。“增加”的其他示例包括与参考水平相比增加至少2倍、至少5倍、至少10倍、至少20倍、至少50倍、至少100倍、至少1000倍或更多。
如本文所用的,术语“减少”通常意指统计地显著量的减少。在一些方面,“减少”意指与参考水平相比减少至少10%,例如与参考水平相比减少至少约20%、或至少约30%、或至少约40%、或至少约50%、或至少约60%、或至少约70%、或至少约80%、或至少约90%或高达并包括100%的减少(例如,不存在水平或与参考水平相比不可检测的水平),或10-100%之间的任何减少。在标志物或症状的背景下,这些术语意味着这种水平的统计地显著减少。减少可以是,例如,至少10%、至少20%、至少30%、至少40%或更多,并且优选减少至对于没有给定疾病的个体的正常范围内所接受的水平。
尽管本文已经示出和描述了本发明的优选实施方案,但对于本领域技术人员来说显而易见的是,这些实施方案仅作为示例提供。本发明并不意在受说明书中提供的具体示例的限制。尽管已经参照前述说明书描述了本发明,但本文中实施方案的描述和说明并不意味着被解释为限制意义。在不背离本发明的情况下,本领域技术人员现在将会想到许多变化、改变和替换。此外,应当理解,本发明的所有方面不限于本文阐述的具体描述、配置或相对比例,其取决于各种条件和变量。应当理解,在实施本发明时可以采用对本文描述的本发明实施方式的各种替代方案。因此设想到本发明还应涵盖任何这样的替代、修改、变化或等价物。所附权利要求旨在限定本发明的范围,并且由此覆盖这些权利要求范围内的方法和结构及其等同物。
神经退行性疾病中的剪接
阿尔茨海默病(AD)和其他Tau蛋白病代表神经退行性病症。AD的特征在于大脑中神经原纤维缠结、神经纤维丝和神经炎斑块中存在β淀粉样蛋白斑块和过度磷酸化的Tau蛋白聚集。还观察到显示Tau病理的区域中白质逐渐丧失(Kneynsberg等人,2017)。此外,文献数据表明,AD的特征也在于在细胞质中的U1 snRNP核耗竭、积累和聚集以及剪接障碍(Bai等人,2013、2014、2018;Zhu等人,2020)。此外,U1-70K的碱性-酸性二肽结构域被证明与来自AD大脑的Tau相互作用,并且U1-70K和Tau二者在晚发性散发性和家族性AD病例中共同定位于神经原纤维缠结(Bishof等人,2018)。
在一项整合来自人类死后脑组织和黑腹果蝇(Drosophila melanogaster)模型的数据的研究中,Hsieh及其合作者表明,AD Tau神经原纤维缠结病理学破坏了剪接体活性,导致转录组失败并最终导致CNS功能障碍和神经变性。他们假设Tau参与剪接体细胞质隔离并破坏snRNP装配和/或稳定性。他们还表明,一些剪接体组分(包括U1-70K)与具有AD病理学的人类大脑中的Tau有物理相关性,而在果蝇中,这些因子的基因操作增强了Tau的神经毒性。他们证实,具有Tau病理学的人类死后大脑中隐秘剪接负荷有所增加(Hsieh等人,2019)。
参考文献
Bai,B.,Chen,P.C.,Hales,C.M.,Wu,Z.,Pagala,V.,High,A.A.,Levey,A.I.,Lah,J.J.,&Peng,J.(2014).Integrated Approaches for Analyzing U1-70K CleavageinAlzheimer’s Disease.Journal of Proteome Research,13(11),4526.https://doi.org/10.1021/PR5003593
Bai,B.,Hales,C.M.,Chen,P.C.,Gozal,Y.,Dammer,E.B.,Fritz,J.J.,Wang,X.,Xia,Q.,Duong,D.M.,Street,C.,Cantero,G.,Cheng,D.,Jones,D.R.,Wu,Z.,Li,Y.,Diner,I.,Heilman,C.J.,Rees,H.D.,Wu,H.,…Peng,J.(2013).U1 small nuclearribonucleoprotein complex and RNA splicing alterations in Alzheimer’sdisease.Proceedings of the National Academy of Sciences of the United Statesof America,110(41),16562–16567.https://doi.org/10.1073/pnas.1310249110
Bai,B.,Wang,S.,Chen,Y.,Jia,J.,Tian,X.,Liu,C.,Xia,Y.,&Xie,H.(2018).Effects of RNA Splicing Inhibitors on Amyloid PrecursorProteinExpression.ACS Omega,3(3),2798.https://doi.org/10.1021/ACSOMEGA.7B02073
Bishof,I.,Dammer,E.B.,Duong,D.M.,Kundinger,S.R.,Gearing,M.,Lah,J.J.,Levey,A.I.,&Seyfried,N.T.(2018).RNA-binding proteins with basic-acidicdipeptide(BAD)domains self-assemble and aggregate in Alzheimer’s disease.TheJournal of Biological Chemistry,293(28),11047.https://doi.org/10.1074/JBC.RA118.001747
Hsieh,Y.C.,Guo,C.,Yalamanchili,H.K.,Abreha,M.,Al-Ouran,R.,Li,Y.,Dammer,E.B.,Lah,J.J.,Levey,A.I.,Bennett,D.A.,De Jager,P.L.,Seyfried,N.T.,Liu,Z.,&Shulman,J.M.(2019).Tau-Mediated Disruption of the Spliceosome TriggersCryptic RNA Splicing and Neurodegeneration in Alzheimer’s Disease.CellReports,29(2),301-316.e10.https://doi.org/10.1016/J.CELREP.2019.08.104
Kneynsberg,A.,Combs,B.,Christensen,K.,Morfini,G.,&Kanaan,N.M.(2017).Axonal degeneration in tauopathies:Disease relevance and underlyingmechanisms.Frontiers in Neuroscience,11(OCT),1–14.https://doi.org/10.3389/fnins.2017.00572
Zhu,W.,Wei,X.,Wang,Y.,Li,J.,Peng,L.,Zhang,K.,&Bai,B.(2020).Effects ofU1 Small Nuclear Ribonucleoprotein Inhibition on the Expression of GenesInvolved in Alzheimer’s Disease.ACS Omega,5(39),25306–25311.https://doi.org/10.1021/acsomega.0c03568
实施例
以下说明性实施例代表本文所述的刺激、系统和方法的实施方案,且不意味着以任何方式进行限制。
实施例1.用工程化多核苷酸调谐靶基因的表达
将从细胞样(例如,HEK293细胞系)获得的细胞培养并维持在细胞培养基中。然后可以将细胞与工程化多核苷酸或编码工程化多核苷酸的载体接触,以通过本文所述的任意一种递送方法将工程化多核苷酸或编码工程化多核苷酸的载体递送至细胞中。在将工程化多核苷酸递送至细胞中后,可以将细胞培养一段时间以使工程化多核苷酸调谐靶基因的表达或活性。然后可以收获并裂解细胞以测量靶基因的表达或活性。例如,可以收获并裂解细胞并用于检查由工程化多核苷酸调谐的靶基因的mRNA前体、mRNA或蛋白质的丰度。在其他情况下,可以将细胞固定并准备用于显微镜检查。例如,针对与本文所述的任意一个靶基因相关的包含体或淀粉样斑块(例如,由MAPT靶基因编码的tau斑块)的存在或丰度变化,可以在显微镜下检查细胞。
实施例2.通过编辑RNA治疗神经系统疾病
对象被诊断患有阿尔茨海默病,其起因是由靶基因MAPT编码的tau蛋白剪接异常。向对象开具药物组合物的给药方案,该药物组合物包含本文公开的化学修饰的工程化多核苷酸,用于募集和稳定靶MAPT mRNA前体的至少一个调节部分。化学修饰的工程化多核苷酸在与MAPT mRNA前体结合时募集并稳定至少一个用于正确剪接MAPT mRNA前体的调节部分。在一些实施方案中,化学修饰的工程化多核苷酸增加了募集和稳定至少一种调节部分RNA编辑实体的特异性或效率。由工程化多核苷酸对MAPT mRNA前体的调谐减少了对象中tau斑块的量,从而治疗或减少对象中阿尔茨海默的症状。
尽管出于清楚和理解的目的已经对前述公开内容进行了一些详细的描述,但对于本领域技术人员通过阅读本公开内容将清楚的是,在不背离本公开内容的真实范围的情况下,可以做出形式和细节上的多种改变。例如,上述所有技术和装置可以以多种组合来使用。本申请中引用的所有出版物、专利、专利申请和/或其他文件均通过引用将其全部内容并入本文用于所有目的,其程度如同每个单独的出版物、专利、专利申请和/或其他文件单独地且分别地通过引用并入用于所有目的。
实施例3.通过工程化多核苷酸的剪接体调谐
本文所述的化学修饰的工程化多核苷酸对剪接的影响将通过RNA-Seq来确定。
RNA-Seq方案将由对来自健康患者(HDC-健康供体细胞)和阿尔茨海默病患者(ADC-阿尔茨海默病供体细胞)的iPSC(诱导多能干细胞)的兴奋性神经元的十六天培养组成。培养六天后,用两种不同浓度的包含靶向部分和募集部分的工程化多核苷酸(例如ASMO-1、ASMO-2)处理HDC和ADC神经元10天。HDC和ADC二者的阴性对照将由在无化合物处理的培养基中培养10天组成。十六天的细胞培养和处理后,将会进行RNA提取、文库制备和RNA测序,每种情况靶向1亿个读段。该实验将一式三份地进行,并且仅重复一次。
生物信息学分析将使用RNA seq生成的原始数据进行,并将由以下步骤组成:(i)原始读取数据的质量控制;(ii)在人类参考基因组上映射;(iii)转录本定量和差异表达分析以确定差异表达基因;(iv)基因本体论富集分析;(v)关键通路分析(如与TAU和阿尔茨海默病相关的通路);(vi)来自RNA-seq的差异表达基因和计算机预测的ASMO-1的候选靶标的比较。
HDC和ADC阴性对照的RNA seq数据分析将鉴定健康和阿尔茨海默病细胞之间的基因表达差异和相关通路。预计在HDC和ADC对照中观察到的这些差异将突出阿尔茨海默病的重要标志和生物标志物。
此外,在测试的处理条件下,RNA seq数据将证明ASMO-1(例如)通过差异基因表达分析增强了预测的靶标候选物如MAPT mRNA前体的剪接,证实了在AD处理的细胞中的这些候选物的表达水平被挽救回与HDC对照可比的健康水平。ADC对照中与HDC相关的异常上调基因将在AD处理的细胞中下调,且反之亦然。此外,通过在处理的AD细胞中由ASMO-1进行的这些有益表达调谐(预计由例如TAU表达调谐代表)将触发下游效应的间接级联,使基因表达模式总体上更类似于HD未处理细胞的表达模式,而不太相似于AD未处理细胞及其标志通路(NFT积累、β淀粉样蛋白切割、β淀粉样蛋白降解、APOE-胆固醇通路等)。
在药物安全的背景下,我们预计对用ASMO-1处理的HDC的RNA seq数据分析确保通过在至少一种评估浓度下的处理不会表现出有害的基因表达谱。

Claims (91)

1.一种工程化多核苷酸,包含:
(i)一个或多个靶向部分,所述一个或多个靶向部分被配置为在信使核糖核酸前体(mRNA前体)中的靶序列处特异性地结合所述mRNA前体;和
(ii)募集部分,所述募集部分被配置为募集转录后调节部分(例如,剪接体部分),
其中当与所述mRNA前体和所述工程化多核苷酸相关联时,所述转录后调节部分在所述靶序列中或附近处改变所述mRNA前体。
2.根据权利要求1所述的工程化多核苷酸,其中所述一个或多个靶向部分中的靶向部分与靶基因的所述靶序列中的共有序列足够相同或互补。
3.根据权利要求1或2所述的工程化多核苷酸,其中所述一个或多个靶向部分包含(1)第一靶向部分,所述第一靶向部分被配置为特异性地结合所述mRNA前体的所述靶序列中的第一靶标序列,和(2)第二靶向部分,所述第二靶向部分被配置为特异性地结合所述mRNA前体的所述靶序列中的第二靶标序列。
4.根据权利要求3所述的工程化多核苷酸,其中所述第一靶标序列包含所述靶序列中的共有序列。
5.根据权利要求3或4所述的工程化多核苷酸,其中所述第二靶标序列包含所述靶序列中的共有序列。
6.根据权利要求3至5中任一项所述的工程化多核苷酸,其中所述第一和第二靶标序列在所述靶序列中相隔不超过5个核苷酸(例如,一个或两个核苷酸)的间隔序列。
7.根据权利要求1至6中任一项所述的工程化多核苷酸,其中所述靶序列包含所述mRNA前体中的外显子-内含子边界。
8.根据权利要求7所述的工程化多核苷酸,其中所述第一和第二靶标序列均位于所述外显子-内含子边界的5'或3'。
9.根据权利要求7所述的工程化多核苷酸,其中所述第一和第二靶标序列中的一个位于所述外显子-内含子边界的5';并且其中所述第一和第二靶标序列中的另一个位于所述外显子-内含子边界的3'。
10.根据权利要求1至9中任一项所述的工程化多核苷酸,其中所述靶序列包含所述mRNA前体中的剪接位点。
11.根据权利要求10所述的工程化多核苷酸,其中所述第一或第二靶标序列包含所述mRNA前体中的剪接位点(例如,5'ss)。
12.根据权利要求1至11中任一项所述的工程化多核苷酸,其中所述第一和第二靶向部分中的一个位于所述募集部分的5',并且所述第一和第二靶向部分中的另一个位于所述募集部分的3'。
13.根据权利要求12所述的工程化多核苷酸,其中所述第一靶向部分或所述第二靶向部分包含与表1中列出的序列相同或互补的序列。
14.根据权利要求12所述的工程化多核苷酸,其中所述第一靶向部分包含与选自表1的外显子序列栏中的序列相同或互补的序列;并且其中所述第二靶向部分包含与表1的内含子序列栏中列出的序列相同或互补的序列。
15.根据权利要求12所述的工程化多核苷酸,其中所述第一靶向部分包含与表1的内含子序列栏中列出的序列相同或互补的序列;并且其中所述第二靶向部分包含与表1的外显子序列栏中列出的序列相同或互补的序列。
16.根据权利要求12所述的工程化多核苷酸,其中所述第一靶向部分或所述第二靶向部分包含与内含子供体位点(例如,选自GU、GT、GC和CA)的共有序列相同或互补的序列。
17.根据权利要求12所述的工程化多核苷酸,其中所述第一靶向部分或所述第二靶向部分包含与外显子供体位点(例如,G)的共有序列相同或互补的序列。
18.根据权利要求12所述的工程化多核苷酸,其中所述第一靶向部分或所述第二靶向部分包含与选自GU、GC、G和CA的共有序列相同或互补的序列。
19.根据权利要求1至18中任一项所述的工程化多核苷酸,其中所述剪接体部分选自剪接体核糖核蛋白复合物、剪接体小核核糖核酸(snRNA)、剪接体蛋白、其功能变体或其功能片段。
20.根据权利要求19所述的工程化多核苷酸,其中所述剪接体部分包含U1 snRNA和剪接体蛋白。
21.根据权利要求19至20中任一项所述的工程化多核苷酸,其中所述剪接体snRNA选自U1、U2、U4、U5、U6、U11、U12、U14atac、U6atac及其组合。
22.根据权利要求19至21中任一项所述的工程化多核苷酸,其中所述剪接体蛋白选自Sm、U1-70k、U1A、U1C及其组合。
23.根据权利要求1至22中任一项所述的工程化多核苷酸,其中所述募集部分包含与SEQ ID NO:1-4中任一项至少70%、80%、85%或90%相同或互补的核苷酸序列。
24.根据权利要求23所述的工程化多核苷酸,其中所述募集部分包含与SEQ ID NO:1-4中任一项相同或互补的核苷酸序列。
25.根据权利要求1至24中任一项所述的工程化多核苷酸,其中所述工程化多核苷酸包含(例如,二级的)结构特点。
26.根据权利要求24所述的工程化多核苷酸,其中所述工程化多核苷酸包含顶环、上茎、内环、下茎或其组合。
27.根据权利要求24所述的工程化多核苷酸,其中所述工程化多核苷酸包含与茎(例如,下茎或上茎)相邻的环(例如,内环),所述茎包含两个互补的茎序列。
28.根据权利要求27所述的工程化多核苷酸,其中所述茎(例如,所述下茎或所述上茎)的茎序列包含不超过约五个、四个或三个核苷酸。
29.根据权利要求26或28所述的工程化多核苷酸,其中所述环为与所述茎(例如,所述下茎)和另一茎(例如,上茎)相邻的内环,所述另一茎包含两个互补的茎序列。
30.根据权利要求29所述的工程化多核苷酸,其中所述内环包含具有不超过10、9或8个核苷酸的核酸序列。
31.根据权利要求29或30所述的工程化多核苷酸,其中所述另一茎(例如,所述上茎)的茎序列包含不超过约五个、四个或三个核苷酸。
32.根据权利要求29至31中任一项所述的工程化多核苷酸,其中所述工程化多核苷酸还包含顶环。
33.根据权利要求32所述的工程化多核苷酸,其中所述顶环包含具有不超过10、9、8、7、6或5个核苷酸的核酸序列。
34.根据权利要求1至33中任一项所述的工程化多核苷酸,其中所述工程化多核苷酸不包含任何分子内二硫键。
35.根据权利要求1至34中任一项所述的工程化多核苷酸,其中当与所述工程化多核苷酸和所述剪接体部分相关联时,所述mRNA前体实质上不表现出与U1 snRNA的RNA结合结构域(RBD)的碱基配对。
36.根据权利要求1至35中任一项所述的工程化多核苷酸,其中当与所述工程化多核苷酸和所述剪接体部分相关联时,所述mRNA前体实质上不表现出与U1-C蛋白的碱基特异性相互作用。
37.根据权利要求1至36中任一项所述的工程化多核苷酸,其中所述工程化多核苷酸被配置为与U1-C蛋白的锌指特异性地相互作用。
38.根据权利要求37所述的工程化多核苷酸,其中所述工程化多核苷酸的5'-靶向部分被配置为与U1-C蛋白的锌指特异性地相互作用。
39.根据权利要求37或38所述的工程化多核苷酸,其中所述工程化多核苷酸(例如,所述工程化多核苷酸的所述5'-靶向部分)被配置为与U1-C蛋白的锌指共价地相互作用(例如,通过二硫键)。
40.根据权利要求37至39中任一项所述的工程化多核苷酸,其中所述工程化多核苷酸(例如,所述工程化多核苷酸的所述5'-靶向部分)被配置为与U1-C蛋白的锌指非共价地相互作用(例如,通过氢键)。
41.根据权利要求1至40中任一项所述的工程化多核苷酸,其中所述工程化多核苷酸包含与U1 snRNA的茎环II(SL2)的部分序列互补的核苷酸序列。
42.根据权利要求41所述的工程化多核苷酸,其中所述工程化多核苷酸的茎环结构的一侧包含与U1 snRNA的茎环II(SL2)的部分序列互补的核苷酸序列。
43.根据权利要求41或42所述的工程化多核苷酸,其中所述部分序列包含与U1 snRNA的SL2的5’-GGCCU-3’对应的序列。
44.根据权利要求41至43中任一项所述的工程化多核苷酸,其中所述部分序列不包含与U1 snRNA的SL2的5’-CACGUUA-3’对应的序列。
45.根据权利要求1至44中任一项所述的工程化多核苷酸,其中所述工程化多核苷酸实质上不表现出与U1 snRNA的SL2的锚定序列的碱基配对。
46.根据权利要求45所述的工程化多核苷酸,其中所述工程化多核苷酸的内环实质上不表现出与U1 snRNA的所述SL2的所述锚定序列的碱基配对。
47.根据权利要求45或46所述的工程化多核苷酸,其中所述工程化多核苷酸的下茎实质上不表现出与U1 snRNA的所述SL2的所述锚定序列的碱基配对。
48.根据权利要求45至47中任一项所述的工程化多核苷酸,其中所述锚定序列包含对应于5'-CACGUUA-3'的序列。
49.根据权利要求1至48中任一项所述的工程化多核苷酸,其中所述工程化多核苷酸实质上不表现出与U1 snRNA的H螺旋的碱基配对。
50.根据权利要求1至49中任一项所述的工程化多核苷酸,其中所述工程化多核苷酸包含至少一种化学修饰。
51.根据权利要求50所述的工程化多核苷酸,其中所述工程化多核苷酸包含至少一个2'-修饰的(例如,2'-甲氧基、2'-甲氧基甲基或2'-甲氧基乙基)核苷酸。
52.根据权利要求50或51所述的工程化多核苷酸,其中所述工程化多核苷酸的至少约50%、60%、70%、80%或90%核苷酸为化学修饰的核苷酸。
53.根据权利要求50或51所述的工程化多核苷酸,其中所述工程化多核苷酸的至少约50%、60%、70%、80%或90%核苷酸为2'-修饰的(例如,2'-甲氧基、2'-甲氧基甲基或2'-甲氧基乙基)核苷酸。
54.根据权利要求50至53中任一项所述的工程化多核苷酸,其中所述工程化多核苷酸包含至少一个硫代磷酸酯核苷酸间键。
55.根据权利要求50至54中任一项所述的工程化多核苷酸,其中所述工程化多核苷酸的至少约50%、60%、70%、80%或90%核苷酸间键合被化学修饰。
56.根据权利要求50至54中任一项所述的工程化多核苷酸,其中至少约50%、60%、70%、80%或90%核苷酸间键合为硫代磷酸酯。
57.根据权利要求1至56中任一项所述的工程化多核苷酸,其中所述工程化多核苷酸包含约10至约40个核苷酸、约10至约35个核苷酸、约10至约30个核苷酸或约10至约25个核苷酸。
58.根据权利要求1至57中任一项所述的工程化多核苷酸,其中所述募集部分包含约10至约30个核苷酸或约10至约20个核苷酸。
59.根据权利要求1至58中任一项所述的工程化多核苷酸,其中所述一个或多个靶向部分各自独立地包含约2至约15个核苷酸、约2个核苷酸至约10个核苷酸或约2个核苷酸至约8个核苷酸。
60.根据权利要求1至59中任一项所述的工程化多核苷酸,其中所述第一和第二靶向部分中的一个包含约2个核苷酸,并且所述第一和第二靶向部分中的另一个包含约5或6个核苷酸。
61.根据权利要求1至60中任一项所述的工程化多核苷酸,其中当与所述工程化多核苷酸和所述mRNA前体相关联时,所述剪接体部分切割或剪接所述靶序列中的所述mRNA前体。
62.根据权利要求1至61中任一项所述的工程化多核苷酸,其中所述剪接体部分还促进切割的mRNA前体的修饰。
63.一种工程化多核苷酸,所述工程化多核苷酸包含与SEQ ID NO:1-8中任一项至少70%、80%、85%或90%相同或互补的核苷酸序列,该工程化多核苷酸的特征在于(例如,二级的)结构特点。
64.根据权利要求63所述的工程化多核苷酸,其中所述核苷酸序列与SEQ ID NO:1-8中的任一项相同或互补。
65.根据权利要求63或64所述的工程化多核苷酸,其中所述结构特点包含一种或多种茎环结构。
66.根据权利要求63或64所述的工程化多核苷酸,其中所述结构特点包含顶环、上茎、内环、下茎或其组合。
67.根据权利要求63至66中任一项所述的工程化多核苷酸,其中所述工程化多核苷酸包含与茎(例如,下茎或上茎)相邻的环(例如,内环),所述茎包含两个互补的茎序列。
68.根据权利要求67所述的工程化多核苷酸,其中所述茎(例如,所述下茎或所述上茎)的茎序列包含不超过约五个、四个或三个核苷酸。
69.根据权利要求63至68中任一项所述的工程化多核苷酸,其中所述环为与所述茎(例如,所述下茎)和另一茎(例如,上茎)相邻的内环,所述另一茎包含两个互补的茎序列。
70.根据权利要求69所述的工程化多核苷酸,其中所述内环包含具有不超过10、9或8个核苷酸的核酸序列。
71.根据权利要求69或70所述的工程化多核苷酸,其中所述另一茎(例如,所述上茎)的茎序列包含不超过约五个、四个或三个核苷酸。
72.根据权利要求69至71中任一项所述的工程化多核苷酸,其中所述工程化多核苷酸还包含顶环。
73.根据权利要求72所述的工程化多核苷酸,其中所述顶环包含具有不超过10、9、8、7、6或5个核苷酸的核酸序列。
74.根据权利要求63至73中任一项所述的工程化多核苷酸,其中所述工程化多核苷酸还包含一个或多个靶向部分,所述一个或多个靶向部分与靶基因的靶序列足够相同或互补。
75.根据权利要求74所述的工程化多核苷酸,其中所述一个或多个靶向部分中的靶向部分与所述靶基因的所述靶序列中的共有序列足够相同或互补。
76.根据权利要求74所述的工程化多核苷酸,其中所述靶基因为微管相关蛋白tau(MAPT)。
77.根据权利要求63至75中任一项所述的工程化多核苷酸,其中所述工程化多核苷酸包含至少一种化学修饰。
78.根据权利要求77所述的工程化多核苷酸,其中所述工程化多核苷酸包含至少一个硫代磷酸酯核苷酸间键。
79.根据权利要求77所述的工程化多核苷酸,其中所述工程化多核苷酸的至少约50%、60%、70%、80%或90%核苷酸间键合被化学修饰。
80.根据权利要求77所述的工程化多核苷酸,其中至少约50%、60%、70%、80%或90%核苷酸间键合为硫代磷酸酯。
81.根据权利要求77至80中任一项所述的工程化多核苷酸,其中所述工程化多核苷酸包含至少一个2'-修饰的(例如,2'-甲氧基、2'-甲氧基甲基或2'-甲氧基乙基)核苷酸。
82.根据权利要求77至80中任一项所述的工程化多核苷酸,其中所述工程化多核苷酸的至少约50%、60%、70%、80%或90%核苷酸为化学修饰的核苷酸。
83.根据权利要求77至80中任一项所述的工程化多核苷酸,其中所述工程化多核苷酸的至少约50%、60%、70%、80%或90%核苷酸为2'-修饰的(例如,2'-甲氧基、2'-甲氧基甲基或2'-甲氧基乙基)核苷酸。
84.根据权利要求63至83中任一项所述的工程化多核苷酸,其中所述工程化多核苷酸包含约10至约40个核苷酸、约10至约35个核苷酸、约10至约30个核苷酸或约10至约25个核苷酸。
85.一种用于改变细胞中信使核糖核酸前体(mRNA前体)的方法,所述方法包括使所述细胞与工程化多核苷酸接触,所述工程化多核苷酸包含一个或多个靶向部分和募集部分,其中所述一个或多个靶向部分在所述mRNA前体中的靶序列处结合至所述mRNA前体,并且所述募集部分在所述mRNA前体的所述靶序列附近内募集转录后调节部分(例如,剪接体部分)以改变所述细胞中的所述mRNA前体,从而产生一种或多种改变的mRNA前体。
86.根据权利要求85所述的方法,其中所述一个或多个靶向部分中的靶向部分与靶基因的所述靶序列中的共有序列足够相同或互补。
87.根据权利要求85或86所述的方法,其中所述mRNA前体对应于靶基因。
88.根据权利要求87所述的方法,其中所述靶基因为微管相关蛋白tau(MAPT)。
89.根据权利要求85至88中任一项所述的方法,其中所述方法改变所述靶基因的表达或活性。
90.根据权利要求85至89中任一项所述的方法,其中在所述接触之前,所述细胞表现出对应于所述靶基因的异常信使核糖核酸(mRNA)或蛋白质。
91.一个工程化多核苷酸组,各自独立地包含:(i)一个或多个靶向部分,所述一个或多个靶向部分被配置为在靶序列处结合信使核糖核酸前体(mRNA前体),和(ii)募集部分,所述募集部分被配置为募集转录后调节部分(例如,剪接体部分),其中所述工程化多核苷酸组被配置为在包含所述靶序列的多个靶序列处特异性地结合所述mRNA前体。
CN202280062767.XA 2021-07-16 2022-07-15 用于基因表达调节的多核苷酸组合物和方法 Pending CN117980481A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202163222741P 2021-07-16 2021-07-16
US63/222,741 2021-07-16
PCT/US2022/037391 WO2023288111A2 (en) 2021-07-16 2022-07-15 Polynucleotide compositions and methods for gene expression regulation

Publications (1)

Publication Number Publication Date
CN117980481A true CN117980481A (zh) 2024-05-03

Family

ID=84919651

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202280062767.XA Pending CN117980481A (zh) 2021-07-16 2022-07-15 用于基因表达调节的多核苷酸组合物和方法

Country Status (5)

Country Link
US (1) US11946050B2 (zh)
EP (1) EP4370680A2 (zh)
JP (1) JP2024525866A (zh)
CN (1) CN117980481A (zh)
WO (1) WO2023288111A2 (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023288111A2 (en) * 2021-07-16 2023-01-19 Aptah Bio, Inc. Polynucleotide compositions and methods for gene expression regulation
WO2024155740A1 (en) * 2023-01-18 2024-07-25 Aptah Bio, Inc. Polynucleotide compositions and methods for treatment of cancer
WO2024155739A1 (en) * 2023-01-18 2024-07-25 Aptah Bio, Inc. Polynucleotide compositions and methods for treatment of neurodegenerative diseases

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5642916B2 (ja) 2003-04-17 2014-12-17 ザ スクリプス リサーチ インスティテュート 真核遺伝コードの拡張
EP2392923B1 (en) 2003-06-18 2014-05-21 The Scripps Research Institute Method of producing proteins comprising unnatural amino acid
PT3041854T (pt) 2013-08-08 2020-03-05 Scripps Research Inst Um método para a identificação enzimática específica ao local de ácidos nucleicos in vitro pela incorporação de nucleótidos não-naturais
TWI638047B (zh) 2014-04-09 2018-10-11 史基普研究協會 藉由核酸三磷酸酯轉運子將非天然或經修飾的核苷三磷酸酯輸入至細胞中
GB201410693D0 (en) * 2014-06-16 2014-07-30 Univ Southampton Splicing modulation
WO2017106767A1 (en) 2015-12-18 2017-06-22 The Scripps Research Institute Production of unnatural nucleotides using a crispr/cas9 system
EP3651774A4 (en) 2017-07-11 2021-07-07 The Scripps Research Institute INTEGRATION OF INNATURAL NUCLEOTIDES AND APPLICATION METHODS IN VIVO
WO2019014267A1 (en) 2017-07-11 2019-01-17 Synthorx, Inc. INCORPORATION OF NON-NATURAL NUCLEOTIDES AND ASSOCIATED METHODS
WO2023288111A2 (en) * 2021-07-16 2023-01-19 Aptah Bio, Inc. Polynucleotide compositions and methods for gene expression regulation

Also Published As

Publication number Publication date
JP2024525866A (ja) 2024-07-12
EP4370680A2 (en) 2024-05-22
WO2023288111A3 (en) 2023-04-27
WO2023288111A2 (en) 2023-01-19
US20230047776A1 (en) 2023-02-16
US11946050B2 (en) 2024-04-02

Similar Documents

Publication Publication Date Title
JP2023529316A (ja) ゲノム編集のための組成物及び方法
RU2661104C2 (ru) Лечение заболеваний, связанных с нейтрофическим фактором головного мозга (bdnf), путем ингибирования природного антисмыслового транскрипта bdnf
CN117980481A (zh) 用于基因表达调节的多核苷酸组合物和方法
KR102043422B1 (ko) 프라탁신 (fxn)에 대한 자연 안티센스 전사체의 저해에 의한 프라탁신 (fxn) 관련된 질환의 치료
EP3429632B1 (en) Materials and methods for treatment of hereditary haemochromatosis
ES2658626T3 (es) Tratamiento de enfermedades relacionadas con el factor neurotrófico derivado de células gliales (GDNF) por inhibición de transcrito antisentido natural a GDNF
CN107412251A (zh) 通过抑制无调同源物1(atoh1)的天然反义转录物而治疗atoh1相关疾病
JP2013534512A (ja) Pycr1に対する天然アンチセンス転写物の阻害によるピロリン−5−カルボン酸レダクターゼ1(pycr1)関連疾患の治療
CA3128488A1 (en) Vortex mixers and associated methods, systems, and apparatuses thereof
EP3852814A1 (en) Compositions and methods for delivery of nucleic acids
CN113728102A (zh) 使用剪接调节化合物进行新抗原工程化
KR20210091180A (ko) 디스트로핀 엑손 스키핑을 위한 이중특이적 안티센스 올리고뉴클레오타이드
CA3236122A1 (en) Engineered rnas
KR102353847B1 (ko) 안구인두 근이영양증(opmd)의 치료용 시약 및 이의 용도
US20240182894A1 (en) Compositions and methods for modulating sos gene expressions
JP2024532477A (ja) Kras発現を調節するための組成物及び方法
WO2024138135A2 (en) Compositions and methods for modulating sos gene expressions
CN118613582A (zh) 工程化rna
CN118251494A (zh) 用于调节kras表达的组合物和方法
WO2024155770A2 (en) Compositions for modulating kras expression and uses thereof
WO2022269346A2 (en) Compositions and methods of modulating xanthine dehydrogenase
JP7246304B2 (ja) ポンペ病用アンチセンスオリゴマー化合物
WO2024226860A2 (en) Small nuclear rna processing hairpins for small rna payloads
WO2024100247A1 (en) Artificial nucleic acids for site-directed editing of a target rna
WO2024197139A2 (en) Delivery of rna therapeutics using circular prodrug nucleic acids

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination