CN111372611A - 修饰rna剪接的方法 - Google Patents

修饰rna剪接的方法 Download PDF

Info

Publication number
CN111372611A
CN111372611A CN201880052678.0A CN201880052678A CN111372611A CN 111372611 A CN111372611 A CN 111372611A CN 201880052678 A CN201880052678 A CN 201880052678A CN 111372611 A CN111372611 A CN 111372611A
Authority
CN
China
Prior art keywords
alkyl
amino
carbonyl
radical
alkoxy
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201880052678.0A
Other languages
English (en)
Inventor
阿努拉哈·巴特查里亚
阿迈尔·达卡
克斯廷·埃芬贝格尔
维加亚拉克什米·加贝塔
米纳基·B·贾尼
李文成
尼柯莱·纳雷什金
克里斯多佛·特罗塔
卡利·韦丁格
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
PTC Therapeutics Inc
Original Assignee
PTC Therapeutics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by PTC Therapeutics Inc filed Critical PTC Therapeutics Inc
Publication of CN111372611A publication Critical patent/CN111372611A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K31/00Medicinal preparations containing organic active ingredients
    • A61K31/33Heterocyclic compounds
    • A61K31/395Heterocyclic compounds having nitrogen as a ring hetero atom, e.g. guanethidine or rifamycins
    • A61K31/41Heterocyclic compounds having nitrogen as a ring hetero atom, e.g. guanethidine or rifamycins having five-membered rings with two or more ring hetero atoms, at least one of which being nitrogen, e.g. tetrazole
    • A61K31/433Thidiazoles
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/111General methods applicable to biologically active non-coding nucleic acids
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K31/00Medicinal preparations containing organic active ingredients
    • A61K31/33Heterocyclic compounds
    • A61K31/395Heterocyclic compounds having nitrogen as a ring hetero atom, e.g. guanethidine or rifamycins
    • A61K31/435Heterocyclic compounds having nitrogen as a ring hetero atom, e.g. guanethidine or rifamycins having six-membered rings with one nitrogen as the only ring hetero atom
    • A61K31/44Non condensed pyridines; Hydrogenated derivatives thereof
    • A61K31/445Non condensed piperidines, e.g. piperocaine
    • A61K31/4523Non condensed piperidines, e.g. piperocaine containing further heterocyclic ring systems
    • A61K31/454Non condensed piperidines, e.g. piperocaine containing further heterocyclic ring systems containing a five-membered ring with nitrogen as a ring hetero atom, e.g. pimozide, domperidone
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K31/00Medicinal preparations containing organic active ingredients
    • A61K31/33Heterocyclic compounds
    • A61K31/395Heterocyclic compounds having nitrogen as a ring hetero atom, e.g. guanethidine or rifamycins
    • A61K31/495Heterocyclic compounds having nitrogen as a ring hetero atom, e.g. guanethidine or rifamycins having six-membered rings with two or more nitrogen atoms as the only ring heteroatoms, e.g. piperazine or tetrazines
    • A61K31/50Pyridazines; Hydrogenated pyridazines
    • A61K31/501Pyridazines; Hydrogenated pyridazines not condensed and containing further heterocyclic rings
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K31/00Medicinal preparations containing organic active ingredients
    • A61K31/33Heterocyclic compounds
    • A61K31/395Heterocyclic compounds having nitrogen as a ring hetero atom, e.g. guanethidine or rifamycins
    • A61K31/55Heterocyclic compounds having nitrogen as a ring hetero atom, e.g. guanethidine or rifamycins having seven-membered rings, e.g. azelastine, pentylenetetrazole
    • A61K31/551Heterocyclic compounds having nitrogen as a ring hetero atom, e.g. guanethidine or rifamycins having seven-membered rings, e.g. azelastine, pentylenetetrazole having two nitrogen atoms, e.g. dilazep
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07DHETEROCYCLIC COMPOUNDS
    • C07D401/00Heterocyclic compounds containing two or more hetero rings, having nitrogen atoms as the only ring hetero atoms, at least one ring being a six-membered ring with only one nitrogen atom
    • C07D401/02Heterocyclic compounds containing two or more hetero rings, having nitrogen atoms as the only ring hetero atoms, at least one ring being a six-membered ring with only one nitrogen atom containing two hetero rings
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07DHETEROCYCLIC COMPOUNDS
    • C07D401/00Heterocyclic compounds containing two or more hetero rings, having nitrogen atoms as the only ring hetero atoms, at least one ring being a six-membered ring with only one nitrogen atom
    • C07D401/14Heterocyclic compounds containing two or more hetero rings, having nitrogen atoms as the only ring hetero atoms, at least one ring being a six-membered ring with only one nitrogen atom containing three or more hetero rings
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07DHETEROCYCLIC COMPOUNDS
    • C07D417/00Heterocyclic compounds containing two or more hetero rings, at least one ring having nitrogen and sulfur atoms as the only ring hetero atoms, not provided for by group C07D415/00
    • C07D417/02Heterocyclic compounds containing two or more hetero rings, at least one ring having nitrogen and sulfur atoms as the only ring hetero atoms, not provided for by group C07D415/00 containing two hetero rings
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07DHETEROCYCLIC COMPOUNDS
    • C07D417/00Heterocyclic compounds containing two or more hetero rings, at least one ring having nitrogen and sulfur atoms as the only ring hetero atoms, not provided for by group C07D415/00
    • C07D417/14Heterocyclic compounds containing two or more hetero rings, at least one ring having nitrogen and sulfur atoms as the only ring hetero atoms, not provided for by group C07D415/00 containing three or more hetero rings
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2320/00Applications; Uses
    • C12N2320/30Special therapeutic applications
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2320/00Applications; Uses
    • C12N2320/30Special therapeutic applications
    • C12N2320/33Alteration of splicing

Landscapes

  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Medicinal Chemistry (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Veterinary Medicine (AREA)
  • Epidemiology (AREA)
  • Public Health (AREA)
  • Animal Behavior & Ethology (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

本文描述了可以被本文提供的式(I)的小分子剪接修饰剂化合物或其形式识别的剪接修饰剂的内含子识别元件(iREMS):
Figure DDA0002383693020000011
其中W、X、A和B如本文所定义。一方面,本文描述了用于修饰RNA剪接以调节基因产物的量的方法,其中利用式(I)的剪接修饰剂化合物修饰从包含内含子REMS的基因转录的前体RNA转录物。另一方面,本文描述了用于修饰RNA剪接以调节RNA转录物或由基因编码的蛋白产物的量的方法,其中利用式(I)的剪接修饰剂化合物修饰从所述基因转录的前体RNA转录物以包含内含子REMS。

Description

修饰RNA剪接的方法
相关申请的交叉引用
本申请要求2017年6月14日提交的第62/519,226号美国临时申请的权益,将其全部内容通过引用并入本文。
对以电子方式提交的序列表的引用
本申请通过引用并入了与本申请一起提交的序列表,该序列表是ASCII格式的文本文件,名称为“10589-277-228_Sequence_Listing.txt”,于2018年6月13日创建,大小为1,200,491字节。
技术领域
一方面,本文描述了存在于内含子中的剪接修饰剂的识别元件(REMS)(即,“内含子REMS”或“iREMS”),其在小分子剪接修饰剂的存在下可以被U1 snRNP和/或前体mRNA剪接机制的其他组分识别为5’剪接位点,其中通过在转录的RNA中诱导内含外显子(intronicexon)(iExon)的供选择的剪接来修饰基因表达。另一方面,本文描述了用于调节基因产物的量的方法,其中从所述基因转录的前体RNA转录物包含内含子REMS、分支点和3’剪接位点,并且所述方法利用本文所述的小分子化合物来诱导iExon的供选择的剪接。更具体地,本文描述了用于通过iExon的供选择的剪接调节RNA转录物或由基因编码的蛋白产物的量的方法,其中从所述基因转录的前体RNA转录物包含内源或非内源内含子REMS,并且所述方法利用本文所述的化合物来诱导iExon的供选择的剪接。另一方面,本文提供了包含内含子REMS(包括内源或非内源内含子REMS)的人工基因构建体,以及那些人工基因构建体用于在小分子剪接修饰剂化合物的存在下,通过iExon的供选择的剪接调节蛋白产物的用途。另一方面,本文提供了用于改变基因以包含非内源内含子REMS的方法,以及本文所述的小分子化合物用于诱导iExon的供选择的剪接,随后调节由这样的改变的非内源基因转录物产生的蛋白的量并改变由这样的改变的非内源基因转录物产生的蛋白的类型的用途。
背景技术
与异常量(低于或高于正常所需)的基因产物或异常基因产物(例如,其中异常的RNA转录物或蛋白的产生引起疾病)的表达相关的疾病通常用专注于影响异常蛋白表达的方法治疗。然而,通过使用小分子靶向在表达异常蛋白或异常量的蛋白之前负责产生异常RNA的剪接过程的组分可能会影响疾病或障碍的根本原因,因此可以更有效地预防或改善由异常基因产物或异常量的基因产物的表达引起的疾病或障碍。因此,需要一种使用小分子调节由某些基因编码的异常RNA转录物的表达的方法,以预防或治疗与异常RNA转录物或相关蛋白的表达相关的疾病,或与异常量的RNA转录物或相关蛋白的表达相关的疾病。
发明内容
一方面,本文提供了存在于内含子中的剪接修饰剂的识别元件(也称为“REMS”)(即,“内含子REMS”或“iREMS”),其在小分子剪接修饰剂的存在下可以被U1 snRNP和/或前体mRNA剪接机制的其他组分识别,由此剪接反应的元件受到影响,如本文进一步所述。在具体方面,内含子REMS在RNA水平上包含存在于内含子序列中的核苷酸序列GAgurngn,其中r为A或G(即,携带腺嘌呤或鸟嘌呤的嘌呤核苷酸),并且n为任何核苷酸。在另一个具体方面,内含子REMS在RNA水平上包含存在于内含子序列中的核苷酸序列GAguragu,其中r为腺嘌呤或鸟嘌呤。在具体方面,内含子REMS在RNA水平上包含存在于内含子序列中的核苷酸序列NNGAgurngn(SEQ ID NO:1),其中r为A或G(即,携带腺嘌呤或鸟嘌呤的嘌呤核苷酸),并且n或N为任何核苷酸。在另一个具体方面,内含子REMS在RNA水平上包含存在于内含子序列中的核苷酸序列NNGAguragu(SEQ ID NO:2),其中r为腺嘌呤或鸟嘌呤,并且N为任何核苷酸。在本文提供的一个或多个这样的具体方面,N为腺嘌呤或鸟嘌呤。
另一方面,除了iREMS序列以外,RNA转录物的内含子包含分支点和功能性3’剪接位点。本文所述的一个方面涉及iExon,其中RNA转录物包含两个外显子和内含子,其中第一外显子在内含子的上游,并且第二外显子在内含子的下游,其中所述内含子按5’至3’顺序包含:第一5’剪接位点、第一分支点、第一3’剪接位点(也称为iExon 3’剪接位点)、内含子REMS序列、第二分支点和第二3’剪接位点(参见例如,图1A)。在这方面,在本文所述的化合物的存在下,内含子REMS序列充当5’剪接位点,并且将经历与第二3’剪接位点的剪接,导致iREMS序列的NNGA核苷酸和第一3’剪接位点下游的内含子核苷酸被保留并剪接为内含外显子,以提供非野生型mRNA。本文所述的另一方面涉及eExon(extended exons)(延伸的外显子),其中所述RNA转录物包含两个外显子和内含子,其中第一外显子在内含子的上游,并且第二外显子在内含子的下游,其中所述内含子包含RNA核苷酸序列,所述RNA核苷酸序列按5’至3’顺序包含:内含子REMS序列、分支点和3’剪接位点(参见例如,参见图1B和1C:分别为外显子1e和外显子2e)。在这方面,在本文所述的化合物的存在下,iREMS剪接位点上游的5’剪接位点不经历与下游3’剪接位点的剪接。相反,在本文所述的化合物的存在下,iREMS序列在下游分支点的存在下经历与下游3’剪接位点的剪接。在这方面,通过将一种或多种核苷酸包含在注释的5’剪接位点下游的mRNA转录物中,使外显子从5’剪接位点延伸到iREMS剪接位点。
在某些方面,形成iExon所需的一种或多种序列元件可以内源或非内源存在,其中所述序列元件选自内含子REMS、分支点和iExon 3’剪接位点。在其他方面,形成iExon所需的一种或多种另外的序列元件可以内源或非内源存在,其中所述序列元件选自外显子的5’剪接位点、第二分支点和第二3’剪接位点。在iExon的另一个方面,形成iExon所需的序列元件包含上游iExon 3’剪接位点序列、内含子REMS序列、下游分支点序列和下游3’剪接位点序列。另一方面,其中形成eExon(延伸的外显子),形成eExon所需的序列元件包含内含子REMS序列、下游分支点序列和下游功能性3’剪接位点序列。在某些方面,由于本文所述的化合物的存在,剪接所需的一种或多种snRNP和反式因子元件可以以本文所述的各种剪接诱导序列组合中的任一种超过内源水平存在。不受任何理论或机制的束缚,本文所述的小分子化合物连同iREMS序列在弱的或不完全限定的外显子(即新生iExon)周围启动了具有剪接能力的剪接体的组装。剪接修饰剂化合物最有可能实现功能性U1 snRNP–REMS相互作用,并且至少已经显示出可以增加剪接所需的一种或多种snRNP和反式因子元件,包括U1、U2、U4、U5和U6的亲和力,由此增强U1 snRNP以及前体mRNA剪接机制的其他组分和REMS的核苷酸NNGA(将保留为iExon或eExon的部分)之间的相互作用。实际上,我们已经发现U1 snRNP、iREMS和本文所述的小分子剪接修饰剂化合物的相互作用通过提高前体mRNA剪接机制与iREMS序列的结合亲和力,稳定与iREMS序列的U1结合,激活iREMS上游的iExon 3’剪接位点(在iExon的情况下),和将U2 snRNP和其他反式作用剪接因子如U2AF(U2AF65和U2AF35)和SF3A(SF3A1、SF3A2和SF3A3)募集到下游分支点和3’剪接位点,起到限定新生外显子的作用。在不存在化合物的情况下,分支点和3’剪接位点可以必须或不必被反式因子部分或完全占据,但已显示在该化合物实现功能性U1 snRNP–iREMS复合物的形成后,被更多地占据。我们已经详细说明了这些关键剪接机制元件的相互作用,表明在存在小分子剪接修饰剂化合物(例如但不一定限于本文所述的那些)的情况下,可以通过iREMS序列与这样的化合物的相互作用介导新生iExon上剪接体组装的机制,使得内含子REMS序列充当U1 snRNP结合位点,导致内含子核苷酸在成熟RNA转录物中剪接为非野生型内含外显子。
在图1A中,内含子REMS在RNA转录物(即,前体mRNA)中位于外显子1 5’剪接位点(即,外显子1的3’端处的5’剪接位点)、第一分支点(BP)序列和第一iExon 3’剪接位点序列下游和第二分支点序列和外显子2的第二3’剪接位点序列上游的内含子1中。本文所述的小分子剪接修饰剂化合物的存在下,iREMS序列充当5’剪接位点,由此在外显子1和新生内含外显子之间去除了外显子1 5’剪接位点和第一iExon 3’剪接位点之间的核苷酸,并且在iExon 1a和外显子2之间去除了内含子REMS和第二3’剪接位点之间的核苷酸,从而允许外显子2和包含从第一3’剪接位点到内含子REMS的NNGA(包括NNGA)的核苷酸的内含子部分进行连接,从而引入内含子来源的iExon 1a,产生非野生型mRNA。在图1A的某些方面,诱导剪接所需的一种或多种元件可以内源存在或被引入,并且可以采用能够被剪接机制识别为“外显子”的任何配置,其中所述一种或多种元件选自内含子REMS、第一分支点、第一3’剪接位点、第二分支点和第二3’剪接位点。虽然在此针对内含子1进行了说明,但在这种情况下的配置产生非野生型iExon,该概念通常适用于RNA转录物中的任何其他内含子。
在图1B中,内含子REMS位于外显子1 5’剪接位点(即,外显子1的3’端处的5’剪接位点)的下游和外显子2的3’剪接位点序列(即,外显子2的5’端的3’剪接位点)和内含子1分支点序列的上游的RNA转录物的内含子中。在本文所述的小分子剪接修饰剂化合物的存在下,外显子1 5’剪接位点和内含子REMS之间的核苷酸被保留,并且内含子REMS和内含子13’剪接位点序列之间的核苷酸(除了内含子REMS的NNGA核苷酸)被去除,允许外显子1和包含从邻近外显子1 5’剪接位点的核苷酸到内含子REMS的NNGA(包括NNGA)的核苷酸的内含子的部分进行连接。尽管此处将外显子1作为特定配置的实例进行了说明,但该概念通常适用于具有另一个下游外显子的任何其他外显子。诱导eExon的剪接所需的元件可以以任何能够被剪接机制识别为“外显子”的配置存在。因此,在剪接修饰剂化合物的存在下,剪接体将这些元件识别为外显子边界,用于在这些边界之间的插入的内含子核苷酸。这种情况下的配置将产生eExon,其中上游外显子在其3’端延伸。
在图1C中,内含子REMS在RNA转录物中位于外显子2 5’剪接位点(即,外显子2的3’端处的5’剪接位点)下游和内含子2分支点序列和外显子3的3’剪接位点序列(即,外显子3的5’端处的3’剪接位点)上游的内含子2中。在本文所述的小分子剪接修饰剂化合物的存在下,内含子REMS和外显子3 3’剪接位点序列之间的核苷酸被去除,允许外显子3和包含从邻近外显子2 5’剪接位点的核苷酸到内含子REMS的NNGA(包括NNGA)的核苷酸的内含子的部分进行连接。在该实例中,外显子1和外显子2之间的内源剪接反应不受本文所述化合物的存在的影响,从而导致内含子1的完全去除。虽然在此处针对外显子2进行了说明,但该概念通常适用于任何其他新生外显子,即位于同一前mRNA转录物的至少一个上游外显子和一个下游外显子之间的外显子。
如本文所使用,“外显子5’剪接位点”或类似术语是指在iREMS序列上游的外显子的3’端处的5’剪接位点,而“外显子3’剪接位点”或类似术语是指在iREMS序列下游的外显子的5’端处的3’剪接位点。
在本文所述的小分子剪接修饰剂化合物存在下,在iExon或eExon的形成中保留的iREMS核苷酸选自ANGA、CNGA、GNGA、UNGA、NAGA、NCGA、NGGA、NUGA、AAGA、ACGA、AGGA、AUGA、CAGA、CCGA、CGGA、CUGA、GAGA、GCGA、GGGA、GUGA、UAGA、UCGA、UGGA和UUGA。由于在开放阅读框内包含框保持序列、移码、提前终止密码子或内部插入或缺失(互斥的供选择的剪接的结果),包含iExon或形成eExon可以产生具有改变的或截短的开放阅读框的RNA转录物。在由非互斥的供选择的剪接产生的其他方面,包含iExon或形成eExon可以产生具有功能性开放阅读框的成熟mRNA,其产生新的蛋白,该蛋白可能是功能性的或可能不是功能性的或可能是不稳定的并迅速降解。具有改变的或截短的开放阅读框的RNA转录物预期以较低的丰度存在,并且可以是无义介导的降解(nonsense-mediated decay)、不间断介导的降解(nonstop-mediated decay)、不可行降解(no-go decay)、翻译依赖性降解(translation-dependent decay)、iExon介导的脱帽(iExon-mediated decapping)、供选择的3’端形成和聚腺苷酸化的底物,因此具有低丰度。任何内含子REMS介导的供选择的剪接修饰的RNA转录物还可以具有改变的稳定性、改变的细胞内转运、改变的3’端形成效率和改变的翻译效率。在本文所述的方面,术语“框保持序列”是指包含改变开放阅读框但在成熟mRNA中的起始密码子和终止密码子之间保持核苷酸三聚体的序列。在本文所述的方面,术语“互斥的供选择的剪接”是指两个外显子或外显子组之间的选择,其中两个外显子或外显子组将被剪接。换言之,互斥的剪接事件不是独立的,仅使RNA中的外显子或外显子组中的一个被剪接而不是两者都被剪接(即“互斥的”)。例如,包含iExon本身不会导致缺失。然而,在互斥的供选择的剪接事件中,这样的包含也可能导致外显子跳过iExon或在iExon下游,并且在剪接一个外显子或另一个外显子时导致缺失。在本文所述的其他方面,术语“非互斥的供选择的剪接”是指其中RNA中的一个或另一个或两个外显子或外显子组可以被剪接的独立剪接事件。
因此,一方面,本文提供了用于调节由包含内源或非内源内含子REMS的前体RNA产生的RNA转录物的量的方法。另一方面,本文提供了包含内源或非内源内含子REMS的人工基因构建体,其可以用于例如基因治疗或报告基因分析的情况中。另一方面,本文提供了用于改变内源基因以使其包含内含子REMS或另外的内含子REMS的方法。
另一方面,本文提供了用于调节表达为一种或多种基因的产物的一种或多种RNA转录物(例如,mRNA转录物)或其蛋白的量的方法,其中由所述一种或多种基因转录的前体RNA转录物包含内含子REMS,所述方法包括使细胞与式(I)的化合物或其形式接触:
Figure BDA0002383691000000061
其中W、X、A和B如本文所定义。
一方面,本文提供了用于调节由包含剪接修饰剂的内含子识别元件(iREMS)的前体RNA产生的RNA转录物的量的方法,所述方法包括使包含前体RNA的细胞与式(I)的化合物或其形式接触,其中所述内含子REMS包含序列NNGAgurngn(SEQ ID NO:1),其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸,其中所述前体RNA为本文所述的基因。另一方面,本文提供了用于调节由包含剪接修饰剂的内含子识别元件(REMS)的前体RNA产生的RNA转录物的量的方法,所述方法包括使前体RNA与式(I)的化合物或其形式接触,其中内含子REMS包含序列NNGAgurngn(SEQ ID NO:1),其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸,其中所述前体RNA为本文所述的基因。在一些方面,内含子REMS在RNA水平上包含序列NNGAguragu(SEQ ID NO:3),其中r为腺嘌呤或鸟嘌呤,并且N为任何核苷酸。在某些方面,内含子REMS包含选自以下的序列:ANGAgurngn(SEQ ID NO:4)、CNGAgurngn(SEQ ID NO:5)、GNGAgurngn(SEQ ID NO:6)、UNGAgurngn(SEQ ID NO:7)、NAGAgurngn(SEQ ID NO:8)、NCGAgurngn(SEQID NO:9)、NGGAgurngn(SEQ ID NO:10)、NUGAgurngn(SEQ ID NO:11)、AAGAgurngn(SEQ IDNO:12)、ACGAgurngn(SEQ ID NO:13)、AGGAgurngn(SEQ ID NO:14)、AUGAgurngn(SEQ IDNO:15)、CAGAgurngn(SEQ ID NO:16)、CCGAgurngn(SEQ ID NO:17)、CGGAgurngn(SEQ IDNO:18)、CUGAgurngn(SEQ ID NO:19)、GAGAgurngn(SEQ ID NO:20)、GCGAgurngn(SEQ IDNO:21)、GGGAgurngn(SEQ ID NO:22)、GUGAgurngn(SEQ ID NO:23)、UAGAgurngn(SEQ IDNO:24)、UCGAgurngn(SEQ ID NO:25)、UGGAgurngn(SEQ ID NO:26)和UUGAgurngn(SEQ IDNO:27),其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸。
在一些方面,内含子REMS在RNA水平上包含选自以下的序列:ANGAguragu(SEQ IDNO:28)、CNGAguragu(SEQ ID NO:29)、GNGAguragu(SEQ ID NO:30)、UNGAguragu(SEQ IDNO:31)、NAGAguragu(SEQ ID NO:32)、NCGAguragu(SEQ ID NO:33)、NGGAguragu(SEQ IDNO:34)、NUGAguragu(SEQ ID NO:35)、AAGAguragu(SEQ ID NO:36)、ACGAguragu(SEQ IDNO:37)、AGGAguragu(SEQ ID NO:38)、AUGAguragu(SEQ ID NO:39)、CAGAguragu(SEQ IDNO:40)、CCGAguragu(SEQ ID NO:41)、CGGAguragu(SEQ ID NO:42)、CUGAguragu(SEQ IDNO:43)、GAGAguragu(SEQ ID NO:44)、GCGAguragu(SEQ ID NO:45)、GGGAguragu(SEQ IDNO:46)、GUGAguragu(SEQ ID NO:47)、UAGAguragu(SEQ ID NO:48)、UCGAguragu(SEQ IDNO:49)、UGGAguragu(SEQ ID NO:50)和UUGAguragu(SEQ ID NO:51),其中r为腺嘌呤或鸟嘌呤,并且N为任何核苷酸。在本文提供的一个或多个方面,N为腺嘌呤或鸟嘌呤。
在具体方面,在本文所述的方法或人工基因构建体中提及的内含子REMS在RNA水平上包含表1所示的序列(其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸):
表1.内含子REMS RNA序列(其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸)
Figure BDA0002383691000000081
表1(续).内含子REMS RNA序列(其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸)
Figure BDA0002383691000000082
表1(续).内含子REMS RNA序列(其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸)
Figure BDA0002383691000000091
表1(续).内含子REMS RNA序列(其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸)
Figure BDA0002383691000000101
表1(续).内含子REMS RNA序列(其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸)
Figure BDA0002383691000000111
表1(续).内含子REMS RNA序列(其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸)
Figure BDA0002383691000000121
表1(续).内含子REMS RNA序列(其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸)
Figure BDA0002383691000000131
表1(续).内含子REMS RNA序列(其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸)
Figure BDA0002383691000000141
表1(续).内含子REMS RNA序列(其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸)
Figure BDA0002383691000000151
表1(续).内含子REMS RNA序列(其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸)
Figure BDA0002383691000000161
表1(续).内含子REMS RNA序列(其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸)
Figure BDA0002383691000000171
表1(续).内含子REMS RNA序列(其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸)
Figure BDA0002383691000000181
表1(续).内含子REMS RNA序列(其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸)
Figure BDA0002383691000000191
表1(续).内含子REMS RNA序列(其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸)
Figure BDA0002383691000000201
表1(续).内含子REMS RNA序列(其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸)
Figure BDA0002383691000000211
表1(续).内含子REMS RNA序列(其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸)
Figure BDA0002383691000000221
表1(续).内含子REMS RNA序列(其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸)
Figure BDA0002383691000000231
表1(续).内含子REMS RNA序列(其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸)
Figure BDA0002383691000000241
表1(续).内含子REMS RNA序列(其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸)
Figure BDA0002383691000000251
表1(续).内含子REMS RNA序列(其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸)
Figure BDA0002383691000000261
一方面,本文提供了用于调节本文所述的基因的一种、两种、三种或更多种RNA转录物的量的方法,所述方法包括使细胞与式(I)的化合物或其形式接触。另一方面,本文提供了用于调节本文所述的基因的一种、两种、三种或更多种RNA转录物的量的方法,其中从所述基因转录的前体转录物包含内含子REMS,所述方法包括使细胞与式(I)的化合物或其形式接触。另一方面,本文提供了用于调节第PCT/US2014/071252号国际专利申请(第WO2015/105657号国际公开)中公开的基因的一种、两种、三种或更多种RNA转录物的量的方法,其中从所述基因转录的前体转录物包含内含子REMS,所述方法包括使细胞与式(I)的化合物或其形式接触。另一方面,本文提供了用于调节第PCT/US2016/034864号国际专利申请(第WO 2016/196386号国际公开)公开的基因的一种、两种、三种或更多种RNA转录物的量的方法,其中从所述基因转录的前体转录物包含内含子REMS,所述方法包括使细胞与式(I)的化合物或其形式接触。另一方面,本文提供了用于调节第PCT/US2017/063323号国际专利申请(第WO/2018/098446号国际公开)中公开的一种、两种、三种或更多种RNA转录物的量的方法,其中从所述基因转录的前体转录物包含内含子REMS,所述方法包括使细胞与式(I)的化合物或其形式接触。
一方面,本文提供了用于调节本文所述的基因的一种、两种、三种或更多种RNA转录物的量的方法,所述方法包括使细胞与式(I)的化合物或其形式接触。另一方面,本文提供了用于调节本文所述的基因的一种、两种、三种或更多种RNA转录物的量的方法,其中从所述基因转录的前体转录物包含内含子REMS,所述方法包括使细胞与式(I)的化合物或其形式接触。
另一方面,本文提供了用于调节本文所述的基因的一种、两种、三种或更多种RNA转录物的量的方法,其中从所述基因转录的前体转录物包含内含子REMS,所述方法包括使细胞与式(I)的化合物或其形式接触。另一方面,本文提供了用于调节本文所述的基因的一种、两种、三种或更多种RNA转录物的量的方法,包括使细胞与式(I)的化合物或其形式接触。在某些方面,在细胞培养物中使细胞与式(I)的化合物或其形式接触。在其他方面,在对象(例如,非人类动物对象或人类对象)中使细胞与式(I)的化合物或其形式接触。
另一方面,本文提供了用于调节本文所述的基因的一种、两种、三种或更多种RNA转录物的量的方法,其中从所述基因转录的所述前体RNA转录物包含内含子REMS,所述方法包括向人类或非人类对象施用式(I)的化合物或其形式或包含式(I)的化合物或其形式和药学上可接受的载体、赋形剂或稀释剂的药物组合物。一方面,本文提供了用于调节本文所述的基因的一种、两种、三种或更多种RNA转录物的量的方法,所述方法包括向人类或非人类对象施用式(I)的化合物或其形式或包含式(I)的化合物或其形式和药学上可接受的载体、赋形剂或稀释剂的药物组合物。
另一方面,本文提供了用于调节本文所述的基因的一种、两种、三种或更多种RNA转录物的量的方法,其中从所述基因转录的所述前体RNA转录物包含内含子REMS,所述方法包括向人类或非人类对象施用式(I)的化合物或其形式或包含式(I)的化合物或其形式和药学上可接受的载体、赋形剂或稀释剂的药物组合物。
另一方面,本文提供了用于调节本文所述的基因的一种、两种、三种或更多种RNA转录物的量的方法,其中从所述基因转录的所述前体RNA转录物包含内含子REMS,所述方法包括向人类或非人类对象施用式(I)的化合物或其形式或包含式(I)的化合物或其形式和药学上可接受的载体、赋形剂或稀释剂的药物组合物。
另一方面,本文提供了用于调节本文所述的基因的一种、两种、三种或更多种RNA转录物的量的方法,包括向人类或非人类对象施用式(I)的化合物或其形式或包含式(I)的化合物或其形式和药学上可接受的载体、赋形剂或稀释剂的药物组合物。关于本文所述的基因的另外的信息,参见实施例部分。在一些方面,式(I)的化合物是选自本文所述的化合物的化合物。
在用于调节本文所述的基因的一种、两种、三种或更多种RNA转录物的量的前述方法中的任一种的另一方面,最低需要的功能性内含子REMS元件按5’至3’顺序包含:内含子REMS序列、分支点序列和3’剪接位点序列。
另一方面,本文提供了用于调节包含RNA核苷酸序列的RNA转录物的量的方法,其中所述RNA核苷酸序列包含两个外显子和内含子,其中第一外显子在内含子的上游,并且第二外显子在内含子的下游,其中所述内含子的RNA核苷酸序列按5’至3’顺序包含:第一5’剪接位点、第一分支点、第一3’剪接位点、iREMS、第二分支点和第二3’剪接位点,其中所述iREMS包含RNA序列GAgurngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,所述方法包括使所述RNA转录物与本文所述的化合物(例如,式(I)的化合物或其形式或另一种小分子剪接调节剂化合物)接触。在具体方面,所述RNA转录物是本文所述的基因的转录物(例如,在本文的表或本文的实施例中)。在具体方面,所述iREMS是非内源的。
另一方面,本文提供了用于调节包含RNA核苷酸序列的RNA转录物的量的方法,其中所述RNA核苷酸序列包含两个外显子和内含子,其中第一外显子在内含子的上游,并且第二外显子在内含子的下游,其中所述内含子的所述RNA核苷酸序列按5’至3’顺序包含:分支点、3’剪接位点和iREMS,其中所述iREMS包含RNA序列GAgurngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,所述方法包括使所述RNA转录物与本文所述的化合物(例如,式(I)的化合物或其形式或另一种小分子剪接调节剂化合物)接触。在具体方面,the RNA转录物是本文所述的基因的转录物(例如,在本文的表或本文的实施例中)。在具体方面,所述iREMS是非内源的。
另一方面,本文提供了用于调节包含RNA核苷酸序列的RNA转录物的量的方法,其中所述RNA核苷酸序列包含两个外显子和内含子,并且其中所述RNA核苷酸序列包含图1A所示的外显子和内含子元件,所述方法包括使所述RNA转录物与本文所述的化合物(例如,式(I)的化合物或其形式或另一种小分子剪接调节剂化合物)接触。在具体方面,所述RNA转录物是本文所述的基因的转录物(例如,在本文的表或本文的实施例中)。在具体方面,所述iREMS是非内源的。
另一方面,本文提供了用于调节包含RNA核苷酸序列的RNA转录物的量的方法,其中所述RNA核苷酸序列包含两个外显子和内含子,并且其中所述RNA核苷酸序列包含图1B所示的外显子和内含子元件,所述方法包括使所述RNA转录物与本文所述的化合物(例如,式(I)的化合物或其形式或另一种小分子剪接调节剂化合物)接触。在具体方面,所述RNA转录物是本文所述的基因的转录物(例如,在本文的表或本文的实施例中)。在具体方面,所述iREMS是非内源的。
另一方面,本文提供了用于调节包含RNA核苷酸序列的RNA转录物的量的方法,其中所述RNA核苷酸序列包含三个外显子和两个内含子,并且其中所述RNA核苷酸序列包含图1C所示的外显子和内含子元件,所述方法包括使所述RNA转录物与本文所述的化合物(例如,式(I)的化合物或其形式或另一种小分子剪接调节剂化合物)接触。在具体方面,所述RNA转录物是本文所述的基因的转录物(例如,在本文的表或实施例中)。在具体方面,所述iREMS是非内源的。
在具体方面,所述RNA转录物是本公开的表中描述的基因的RNA转录物。
另一方面,本文提供了用于调节对象中的基因产物(如RNA转录物或蛋白)的量的方法,其中所述基因包含编码两个外显子和内含子的DNA核苷酸序列,其中编码第一外显子的核苷酸序列在编码内含子的核苷酸序列的上游,并且编码第二外显子的核苷酸序列在编码内含子的核苷酸序列的下游,其中所述编码内含子的DNA核苷酸序列按5’至3’顺序包含:编码第一5’剪接位点的核苷酸序列、编码第一分支点的核苷酸序列、编码第一3’剪接位点的核苷酸序列、编码iREMS的核苷酸序列、编码第二分支点的核苷酸序列和编码第二3’剪接位点的核苷酸序列,其中编码iREMS的所述核苷酸序列包含DNA序列GAgtrngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,所述方法包括向所述对象施用本文所述的化合物(例如,式(I)的化合物或其形式或另一种小分子剪接调节剂化合物)。
另一方面,本文提供了用于调节对象中的基因产物(如RNA转录物或蛋白)的量的方法,其中所述基因包含编码两个外显子和内含子的DNA核苷酸序列,其中编码第一外显子的核苷酸序列在编码内含子的核苷酸序列的上游,并且编码第二外显子的核苷酸序列在编码内含子的核苷酸序列的下游,其中内含子的DNA核苷酸序列按5’至3’顺序包含:编码分支点的核苷酸序列、编码3’剪接位点的核苷酸序列和编码iREMS的核苷酸序列,其中所述编码iREMS的核苷酸序列包含DNA序列GAgtrngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,所述方法包括向所述对象施用本文所述的化合物(例如,式(I)的化合物或其形式或另一种小分子剪接调节剂化合物)。
另一方面,本文提供了用于调节对象中的基因产物(如RNA转录物或蛋白)的方法,其中所述基因包含编码两个外显子和内含子的DNA核苷酸序列,其中编码第一外显子的核苷酸序列在编码内含子的核苷酸序列的上游,并且编码第二外显子的核苷酸序列在编码内含子的核苷酸序列的下游,其中内含子的DNA核苷酸序列按5’至3’顺序包含:编码iREMS的核苷酸序列、编码分支点的核苷酸序列和编码3’剪接位点的核苷酸序列,其中所述编码iREMS的核苷酸序列包含DNA序列GAgtrngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,所述方法包括向所述对象施用本文所述的化合物(例如,式(I)的化合物或其形式或另一种小分子剪接调节剂化合物)。
另一方面,本文提供了用于调节对象中的基因产物(如RNA转录物或蛋白)的方法,其中所述基因包含编码两个外显子和内含子的DNA核苷酸序列,并且其中所述DNA核苷酸序列编码图1A所示的外显子和内含子元件,所述方法包括向所述对象施用本文所述的化合物(例如,式(I)的化合物或其形式或另一种小分子剪接调节剂化合物)。
另一方面,本文提供了用于调节对象中的基因产物(如RNA转录物或蛋白)的方法,其中所述基因包含编码两个外显子和内含子的DNA核苷酸序列,并且其中所述DNA核苷酸序列编码图1B所示的外显子和内含子元件,所述方法包括向所述对象施用本文所述的化合物(例如,式(I)的化合物或其形式或另一种小分子剪接调节剂化合物)。
另一方面,本文提供了用于调节对象中的基因产物(如RNA转录物或蛋白)的方法,其中所述基因包含编码两个外显子和内含子的DNA核苷酸序列,并且其中所述DNA核苷酸序列编码图1C所示的外显子和内含子元件,所述方法包括向所述对象施用本文所述的化合物(例如,式(I)的化合物或其形式或另一种小分子剪接调节剂化合物)。
在具体方面,所述基因是在本公开的表中描述的基因。
另一方面,本文提供了用于预防和/或治疗与基因产物(例如,mRNA转录物或蛋白)的异常表达相关的疾病的方法,其中从所述基因转录的所述前体RNA转录物包含内含子REMS,所述方法包括向人类或非人类对象施用式(I)的化合物或其形式或包含式(I)的化合物或其形式和药学上可接受的载体、赋形剂或稀释剂的药物组合物。一方面,本文提供了用于预防和/或治疗与本文所述的基因产物(例如,mRNA,RNA转录物或蛋白)的异常表达相关的疾病的方法,所述方法包括向人类或非人类对象施用式(I)的化合物或其形式或包含式(I)的化合物或其形式和药学上可接受的载体、赋形剂或稀释剂的药物组合物。另一方面,本文提供了用于预防和/或治疗与本文所述的基因产物(例如,mRNA、RNA转录物或蛋白)的异常表达相关的疾病的方法,其中从所述基因转录的所述前体RNA转录物包含内含子REMS,所述方法包括向人类或非人类对象施用式(I)的化合物或其形式或包含式(I)的化合物或其形式和药学上可接受的载体、赋形剂或稀释剂的药物组合物。另一方面,本文提供了用于预防和/或治疗与本文所述的基因产物(例如,mRNA、RNA转录物或蛋白)的异常表达相关的疾病的方法,其中从所述基因转录的所述前体RNA转录物包含内含子REMS,所述方法包括向人类或非人类对象施用式(I)的化合物或其形式或包含式(I)的化合物或其形式和药学上可接受的载体、赋形剂或稀释剂的药物组合物。另一方面,本文提供了用于预防和/或治疗与本文所述的基因产物(例如,mRNA、RNA转录物或蛋白)的异常表达相关的疾病的方法,包括向人类或非人类对象施用式(I)的化合物或其形式或包含式(I)的化合物或其形式和药学上可接受的载体、赋形剂或稀释剂的药物组合物。关于本文所述的基因的另外的信息,参见实施例部分。在某些方面,式(I)的化合物是选自本文所述的化合物的化合物。
另一方面,本文提供了用于预防和/或治疗疾病的方法,其中由基因编码的一种、两种、三种或更多种RNA同种型(isoform)的表达水平的改变有利于预防和/或治疗所述疾病,其中从所述基因转录的所述前体RNA转录物包含内含子REMS,所述方法包括向人类或非人类对象施用式(I)的化合物或其形式或包含式(I)的化合物或其形式和药学上可接受的载体、赋形剂或稀释剂的药物组合物。一方面,本文提供了用于预防和/或治疗疾病的方法,其中由本文所述的基因编码的一种、两种、三种或更多种RNA同种型的表达的调节(例如,增加或减少)有利于预防和/或治疗所述疾病,所述方法包括向人类或非人类对象施用式(I)的化合物或其形式或包含式(I)的化合物或其形式和药学上可接受的载体、赋形剂或稀释剂的药物组合物。
另一方面,本文提供了用于预防和/或治疗疾病的方法,其中由本文所述的基因编码的一种、两种、三种或更多种RNA同种型的表达的调节(例如,增加或减少)有利于预防和/或治疗所述疾病,其中从所述基因转录的所述前体RNA转录物包含内含子REMS,所述方法包括向人类或非人类对象施用式(I)的化合物或其形式或包含式(I)的化合物或其形式和药学上可接受的载体、赋形剂或稀释剂的药物组合物。
另一方面,本文提供了用于预防和/或治疗疾病的方法,其中由本文所述的基因编码的一种、两种、三种或更多种RNA同种型的表达的调节(例如,增加或减少)有利于预防和/或治疗所述疾病,其中从所述基因转录的所述前体RNA转录物包含内含子REMS,所述方法包括向人类或非人类对象施用式(I)的化合物或其形式或包含式(I)的化合物或其形式和药学上可接受的载体、赋形剂或稀释剂的药物组合物。另一方面,本文提供了用于预防和/或治疗疾病的方法,其中由本文所述的基因编码的一种、两种、三种或更多种RNA同种型的表达的调节(例如,增加或减少)有利于预防和/或治疗所述疾病,所述方法包括向人类或非人类对象施用式(I)的化合物或其形式或包含式(I)的化合物或其形式和药学上可接受的载体、赋形剂或稀释剂的药物组合物。在具体方面,在施用式(I)的化合物或其形式和药学上可接受的载体、赋形剂或稀释剂后,由本文所述的基因编码的一种、两种、三种或更多种RNA同种型降低。关于本文所述的基因的另外的信息,参见实施例部分。在某些方面,式(I)的化合物是选自本文所述的化合物的化合物。
另一方面,本文提供了用于预防和/或治疗疾病的方法,其中由基因编码的一种、两种、三种或更多种蛋白同种型的表达水平的改变有利于预防和/或治疗所述疾病,其中从所述基因转录的所述前体RNA转录物包含内含子REMS,所述方法包括向人类或非人类对象施用式(I)的化合物或其形式或包含式(I)的化合物或其形式和药学上可接受的载体、赋形剂或稀释剂的药物组合物。
一方面,本文提供了用于预防和/或治疗疾病的方法,其中由本文所述的基因编码的一种、两种、三种或更多种蛋白同种型的表达的调节(例如,增加或减少)有利于预防和/或治疗所述疾病,所述方法包括向人类或非人类对象施用式(I)的化合物或其形式或包含式(I)的化合物或其形式和药学上可接受的载体、赋形剂或稀释剂的药物组合物。
另一方面,本文提供了用于预防和/或治疗疾病的方法,其中由本文所述的基因编码的一种、两种、三种或更多种蛋白同种型的表达的调节(例如,增加或减少)有利于预防和/或治疗所述疾病,其中从所述基因转录的所述前体RNA转录物包含内含子REMS,所述方法包括向人类或非人类对象施用式(I)的化合物或其形式或包含式(I)的化合物或其形式和药学上可接受的载体、赋形剂或稀释剂的药物组合物。另一方面,本文提供了用于预防和/或治疗疾病的方法,其中由本文所述的基因编码的一种、两种、三种或更多种蛋白同种型的表达的调节(例如,增加或减少)有利于预防和/或治疗所述疾病,其中从所述基因转录的所述前体RNA转录物包含内含子REMS,所述方法包括向人类或非人类对象施用式(I)的化合物或其形式或包含式(I)的化合物或其形式和药学上可接受的载体、赋形剂或稀释剂的药物组合物。
另一方面,本文提供了用于预防和/或治疗疾病的方法,其中由本文所述的基因编码的一种、两种、三种或更多种蛋白同种型的表达的调节(例如,增加或减少)有利于预防和/或治疗所述疾病,所述方法包括向人类或非人类对象施用式(I)的化合物或其形式或包含式(I)的化合物或其形式和药学上可接受的载体、赋形剂或稀释剂的药物组合物。在具体方面,在施用式(I)的化合物或其形式和药学上可接受的载体、赋形剂或稀释剂后,由本文所述的基因编码的一种、两种、三种或更多种RNA同种型降低。关于本文所述的基因的另外的信息,参见实施例部分。在某些方面,式(I)的化合物是选自本文所述的化合物的化合物。
另一方面,本文提供了用于预防、治疗或预防和治疗对象的疾病的方法,其中由基因编码的一种、两种、三种或更多种蛋白同种型的表达的调节(例如,增加或减少)有利于预防和/或治疗所述疾病,其中所述基因包含编码两个外显子和内含子的DNA核苷酸序列,其中编码第一外显子的核苷酸序列在编码内含子的核苷酸序列的上游,并且编码第二外显子的核苷酸序列在编码内含子的核苷酸序列的下游,其中编码内含子的DNA的核苷酸序列按5’至3’顺序包含:编码第一5’剪接位点的核苷酸序列、编码第一分支点的核苷酸序列、编码第一3’剪接位点的核苷酸序列、编码iREMS的核苷酸序列、编码第二分支点的核苷酸序列和编码第二3’剪接位点的核苷酸序列,其中所述编码iREMS的核苷酸序列包含DNA序列GAgtrngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,所述方法包括向所述对象施用本文所述的化合物(例如,式(I)的化合物或其形式或另一种小分子剪接调节剂化合物)。
另一方面,本文提供了用于预防、治疗或预防和治疗对象的疾病的方法,其中由基因编码的一种、两种、三种或更多种蛋白同种型的表达的调节(例如,增加或减少)有利于预防和/或治疗所述疾病,其中所述基因包含编码两个外显子和内含子的DNA核苷酸序列,其中编码第一外显子的核苷酸序列在编码内含子的核苷酸序列的上游,并且编码第二外显子的核苷酸序列在编码内含子的核苷酸序列的下游,其中内含子的DNA核苷酸序列按5’至3’顺序包含:编码分支点的核苷酸序列、编码3’剪接位点的核苷酸序列和编码iREMS的核苷酸序列,其中所述编码iREMS的核苷酸序列包含DNA序列GAgtrngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,所述方法包括向所述对象施用本文所述的化合物(例如,式(I)的化合物或其形式或另一种小分子剪接调节剂化合物)。
另一方面,本文提供了用于预防、治疗或预防和治疗对象的疾病的方法,其中由基因编码的一种、两种、三种或更多种蛋白同种型的表达的调节(例如,增加或减少)有利于预防和/或治疗所述疾病,其中所述基因包含编码两个外显子和内含子的DNA核苷酸序列,并且其中所述DNA核苷酸序列编码图1A所示的外显子和内含子元件,所述方法包括向所述对象施用本文所述的化合物(例如,式(I)的化合物或其形式或另一种小分子剪接调节剂化合物)。
另一方面,本文提供了用于预防、治疗或预防和治疗对象的疾病的方法,其中由基因编码的一种、两种、三种或更多种蛋白同种型的表达的调节(例如,增加或减少)有利于预防和/或治疗所述疾病,其中所述基因包含编码两个外显子和内含子的DNA核苷酸序列,并且其中所述DNA核苷酸序列编码图1B所示的外显子和内含子元件,所述方法包括向所述对象施用本文所述的化合物(例如,式(I)的化合物或其形式或另一种小分子剪接调节剂化合物)。
另一方面,本文提供了用于预防、治疗或预防和治疗对象的疾病的方法,其中由基因编码的一种、两种、三种或更多种蛋白同种型的表达的调节(例如,增加或减少)有利于预防和/或治疗所述疾病,其中所述基因包含编码两个外显子和内含子的DNA核苷酸序列,并且其中所述DNA核苷酸序列编码图1C所示的外显子和内含子元件,所述方法包括向所述对象施用本文所述的化合物(例如,式(I)的化合物或其形式或另一种小分子剪接调节剂化合物)。
在具体方面,所述基因是在本公开的表中描述的基因。
另一方面,本文提供了人工基因构建体。一方面,本文提供了包含内源DNA的人工基因构建体,所述内源DNA被修饰以引入编码包含(多个)3’剪接位点和(多个)分支点和内含子REMS的内含子的非内源核苷酸序列。另一方面,本文提供了包含编码外显子和一个、两个或三个内含子的DNA的人工基因构建体,其中可以在编码分支点的内源核苷酸序列和编码3’剪接位点的内源核苷酸序列的上游的编码内含子REMS的核苷酸序列被修饰以引入在内源内含子REMS更上游的编码非内源分支点和非内源3’剪接位点的核苷酸序列,所述内含子REMS在本文所述的化合物的存在下充当5’剪接位点。另一方面,本文提供了包含编码外显子和一个、两个或三个内含子的DNA的人工基因构建体,其中可以在编码分支点的内源核苷酸序列和编码3’剪接位点的内源核苷酸序列的下游的编码内含子REMS 5’剪接位点的核苷酸序列被修饰,以引入在内源内含子REMS更下游的编码非内源分支点和非内源3’剪接位点的核苷酸序列。另一方面,本文提供了包含编码内含子REMS的DNA的人工基因构建体,所述DNA包含编码具有一个或多个5’剪接位点、3’剪接位点和分支点的内含子REMS的核苷酸。在某些方面,所述人工基因构建体在开放阅读框内编码移码或提前终止密码子或内部插入或缺失。在其他方面,所述人工基因构建体编码具有功能性开放阅读框的成熟mRNA,产生可以具有功能或可以不具有功能的新的蛋白。在一些方面,所述人工基因构建体编码可检测的报告蛋白。由于在开放阅读框内包含框保持序列、移码、提前终止密码子或内部插入或缺失而具有改变的或截短的开放阅读框的RNA转录物可以是无义介导的降解的底物,因此具有低丰度。当与野生型RNA转录物相比时,任何内含子REMS介导的供选择地剪接的RNA转录物还可以具有调节的稳定性、细胞内转运、3’端形成效率和/或翻译效率。
在具体方面,引入人工基因构建体的核苷酸序列中的内含子REMS的核苷酸序列包含序列NNGAgtrngn(SEQ ID NO:1808),其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸。在具体方面,在DNA的情况下,编码内含子REMS的核苷酸序列包含选自以下的序列:ANGAgtrngn(SEQ ID NO:1809)、CNGAgtrngn(SEQ ID NO:1810)、GNGAgtrngn(SEQ ID NO:1811)、TNGAgtrngn(SEQ ID NO:1812)、NAGAgtrngn(SEQ ID NO:1813)、NCGAgtrngn(SEQ IDNO:1814)、NGGAgtrngn(SEQ ID NO:1815)、NTGAgtrngn(SEQ ID NO:1816)、AAGAgtrngn(SEQID NO:1817)、ACGAgtrngn(SEQ ID NO:1818)、AGGAgtrngn(SEQ ID NO:1819)、ATGAgtrngn(SEQ ID NO:1820)、CAGAgtrngn(SEQ ID NO:1821)、CCGAgtrngn(SEQ ID NO:1822)、CGGAgtrngn(SEQ ID NO:1823)、CTGAgtrngn(SEQ ID NO:1824)、GAGAgtrngn(SEQ ID NO:1825)、GCGAgtrngn(SEQ ID NO:1826)、GGGAgtrngn(SEQ ID NO:1827)、GTGAgtrngn(SEQ IDNO:1828)、TAGAgtrngn(SEQ ID NO:1829)、TCGAgtrngn(SEQ ID NO:1830)、TGGAgtrngn(SEQID NO:1831)和TTGAgtrngn(SEQ ID NO:1832),其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸。
在另外的具体方面,在DNA的情况下,编码内含子REMS的核苷酸序列包含选自以下的序列:ANGAgtragt(SEQ ID NO:1833)、CNGAgtragt(SEQ ID NO:1834)、GNGAgtragt(SEQID NO:1835)、TNGAgtragt(SEQ ID NO:1836)、NAGAgtragt(SEQ ID NO:1837)、NCGAgtragt(SEQ ID NO:1838)、NGGAgtragt(SEQ ID NO:1839)、NTGAgtragt(SEQ ID NO:1840)、AAGAgtragt(SEQ ID NO:1841)、ACGAgtragt(SEQ ID NO:1842)、AGGAgtragt(SEQ ID NO:1843)、ATGAgtragt(SEQ ID NO:1844)、CAGAgtragt(SEQ ID NO:1845)、CCGAgtragt(SEQ IDNO:1846)、CGGAgtragt(SEQ ID NO:1847)、CTGAgtragt(SEQ ID NO:1848)、GAGAgtragt(SEQID NO:1849)、GCGAgtragt(SEQ ID NO:1850)、GGGAgtragt(SEQ ID NO:1851)、GTGAgtragt(SEQ ID NO:1852)、TAGAgtragt(SEQ ID NO:1853)、TCGAgtragt(SEQ ID NO:1854)、TGGAgtragt(SEQ ID NO:1855)和TTGAgtragt(SEQ ID NO:1856),其中r为腺嘌呤或鸟嘌呤,并且N为任何核苷酸。在本文提供的一个或多个方面,N为腺嘌呤或鸟嘌呤A或G。在各个具体方面,编码内含子REMS的核苷酸序列是编码非内源内含子REMS的核苷酸序列,即包含在人工构建体的DNA序列中非天然存在的非内源内含子REMS的前体RNA转录物。
在具体方面,在本文所述的方法或人工基因构建体中提及的内含子REMS在DNA水平上包含表2所示的序列(其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸):
表2.内含子REMS DNA序列(其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸)
Figure BDA0002383691000000361
表2(续).内含子REMS DNA序列(其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸)
Figure BDA0002383691000000362
Figure BDA0002383691000000371
表2(续).内含子REMS DNA序列(其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸)
Figure BDA0002383691000000372
表2(续).内含子REMS DNA序列(其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸)
Figure BDA0002383691000000373
Figure BDA0002383691000000381
表2(续).内含子REMS DNA序列(其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸)
Figure BDA0002383691000000382
表2(续).内含子REMS DNA序列(其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸)
Figure BDA0002383691000000391
表2(续).内含子REMS DNA序列(其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸)
Figure BDA0002383691000000392
Figure BDA0002383691000000401
表2(续).内含子REMS DNA序列(其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸)
Figure BDA0002383691000000402
表2(续).内含子REMS DNA序列(其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸)
Figure BDA0002383691000000403
Figure BDA0002383691000000411
表2(续).内含子REMS DNA序列(其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸)
Figure BDA0002383691000000412
Figure BDA0002383691000000421
表2(续).内含子REMS DNA序列(其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸)
Figure BDA0002383691000000422
表2(续).内含子REMS DNA序列(其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸)
Figure BDA0002383691000000423
Figure BDA0002383691000000431
表2(续).内含子REMS DNA序列(其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸)
Figure BDA0002383691000000432
表2(续).内含子REMS DNA序列(其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸)
Figure BDA0002383691000000441
表2(续).内含子REMS DNA序列(其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸)
Figure BDA0002383691000000442
Figure BDA0002383691000000451
表2(续).内含子REMS DNA序列(其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸)
Figure BDA0002383691000000452
表2(续).内含子REMS DNA序列(其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸)
Figure BDA0002383691000000453
Figure BDA0002383691000000461
表2(续).内含子REMS DNA序列(其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸)
Figure BDA0002383691000000462
表2(续).内含子REMS DNA序列(其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸)
Figure BDA0002383691000000471
表2(续).内含子REMS DNA序列(其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸)
Figure BDA0002383691000000472
在某些方面,本文提供了包含本文所述的人工基因构建体的载体。在一些方面,本文提供了包含本文所述的人工基因构建体的细胞或包含本文所述的人工基因构建体的载体。
另一方面,本文提供了调节由包含本文所述的人工基因构建体的细胞产生的蛋白的量以及修饰由包含本文所述的人工基因构建体的细胞产生的蛋白的类型的方法。一方面,本文提供了调节由包含本文所述的人工基因构建体的细胞产生的蛋白的量以及修饰由包含本文所述的人工基因构建体的细胞产生的蛋白的类型的方法,所述方法包括使所述细胞与式(I)的化合物或其形式接触。在某些方面,所述人工基因构建体编码治疗性蛋白。在某些方面,所述人工基因构建体编码非功能性蛋白。在产生治疗性蛋白的一些方面,所述人工基因构建体还可以编码可检测的报告蛋白。在产生非功能性蛋白的一些方面,所述人工基因构建体还可以编码可检测的报告蛋白。
另一方面,本文提供了调节由对象产生的蛋白的量的方法,其中向所述对象施用或向所述对象施用过本文所述的人工基因构建体。一方面,本文提供了调节由对象产生的蛋白的量的方法,所述方法包括:(a)向所述对象施用人工基因构建体或包含本文所述的人工基因构建体的载体;和(b)向所述对象施用式(I)的化合物或其形式。另一方面,本文提供了调节由对象产生的蛋白的量的方法,所述方法包括向所述对象施用式(I)的化合物或其形式,所述对象携带包含编码内含子REMS的核苷酸序列的基因。另一方面,本文提供了调节由对象产生的蛋白的量的方法,所述方法包括向所述对象施用式(I)的化合物,其中先前向所述对象施用过本文所述的人工基因构建体。在某些方面,所述人工基因构建体可以编码治疗性或非功能性蛋白。在一些方面,所述人工基因构建体编码可检测的报告蛋白。在某些方面,所述对象是非人类。在特定方面,所述对象是人类。
一方面,本文提供了用于修饰RNA剪接以调节由前体RNA产生的RNA转录物的量的方法,所述前体RNA按5’至3’顺序包含以下RNA核苷酸序列:分支点、3’剪接位点和内源或非内源剪接修饰剂的内含子识别元件(REMS),其中内含子REMS包含RNA序列GAgurngn,其中r为腺嘌呤或鸟嘌呤(分别为A或G),并且n为任何核苷酸,所述方法包括使前体RNA与式(I)的化合物或其形式接触,其中所述式(I)的化合物为:
Figure BDA0002383691000000481
或其形式,其中
W为CH=CH或S;
X为CH2、CH(C1-4烷基)、C(C1-4烷基)2、CH=CH、O、NR5或键;
A为芳基、杂芳基、杂环基或C9-10环烷基,
其中芳基选自苯基和萘基,其各自任选地被1、2、3或4个各自选自R1的取代基取代,
其中杂芳基具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R1的取代基取代,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R2的取代基取代,和
其中C9-10环烷基为任选地被1、2、3、4或5个各自选自R2的取代基取代的饱和或部分不饱和二环环系;
B为杂环基,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或多环环系,其各自任选地被1、2、3、4或5个各自选自R4的取代基取代;
R1为卤素、羟基、氰基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、杂环基-C1-4烷氧基、苯基或苯基-C1-4烷氧基,
其中杂芳基为具有1、2或3个选自N、O和S的杂原子环成员的饱和单环或二环环系,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中苯基、杂芳基或杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R2为卤素、羟基、氰基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、羟基-C1-4烷基、C1-4烷氧基、C1-4烷氧基-羰基、C2-4烯基、C3-7环烷基或杂环基-C1-4烷基,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R3为卤素、羟基、硝基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、苯基或苯基-C1-4烷氧基;
R4独立地选自卤素、C1-4烷基、羟基-C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基或羟基-C1-4烷基-氨基;和
R5为氢、C1-4烷基或羟基-C1-4烷基;
其中所述化合物的形式选自其前药、盐、水合物、溶剂化物、包合物、同位素体、外消旋体、对映异构体、非对映异构体、立体异构体、多晶型物和互变异构体形式。
另一方面,本文提供了用于修饰RNA剪接以调节由前体RNA产生的RNA转录物的量的方法,所述前体RNA按5’至3’顺序包含以下RNA核苷酸序列:分支点、3’剪接位点和内源或非内源剪接修饰剂的内含子识别元件(REMS),其中内含子REMS包含RNA序列GAgurngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,所述方法包括使前体RNA与式(I)的化合物或其形式接触,其中所述式(I)的化合物选自式(Ia)和式(Ib)的化合物:
Figure BDA0002383691000000511
或其形式,其中
X为CH2、CH(C1-4烷基)、C(C1-4烷基)2、CH=CH、O、NR5或键;
A为芳基、杂芳基、杂环基或C9-10环烷基,
其中芳基选自苯基和萘基,其各自任选地被1、2、3或4个各自选自R1的取代基取代,
其中杂芳基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R1的取代基取代,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R2的取代基取代,和
其中C9-10环烷基为任选地被1、2、3、4或5个各自选自R2的取代基取代的饱和或部分不饱和二环环系;
B为杂环基,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或多环环系,其各自任选地被1、2、3、4或5个各自选自R4的取代基取代;
R1为卤素、羟基、氰基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、杂环基-C1-4烷氧基、苯基或苯基-C1-4烷氧基,
其中杂芳基为具有1、2或3个选自N、O和S的杂原子环成员的饱和单环或二环环系,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中苯基、杂芳基或杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R2为卤素、羟基、氰基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、氨基-羰基、羟基-C1-4烷基、C1-4烷氧基、C1-4烷氧基-羰基、C2-4烯基、C3-7环烷基或杂环基-C1-4烷基;
R3为卤素、羟基、硝基、氧代基、羟基-亚氨基、C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、苯基或苯基-C1-4烷氧基;
R4独立地选自卤素、C1-4烷基、羟基-C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基或羟基-C1-4烷基-氨基;和
R5为氢、C1-4烷基或羟基-C1-4烷基;
其中化合物的形式选自其前药、盐、水合物、溶剂化物、包合物、同位素体、外消旋体、对映异构体、非对映异构体、立体异构体、多晶型物和互变异构体形式。
一方面,本文提供了用于修饰RNA剪接以调节由前体RNA产生的RNA转录物的量的方法,所述前体RNA按5’至3’顺序包含以下RNA核苷酸序列:分支点、3’剪接位点和内源或非内源剪接修饰剂的内含子识别元件(REMS),其中内含子REMS包含RNA序列NNGAgurngn(SEQID NO:1),其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸,所述方法包括使前体RNA与式(I)的化合物或其形式接触,其中所述式(I)的化合物为:
Figure BDA0002383691000000531
或其形式,其中
W为CH=CH或S;
X为CH2、CH(C1-4烷基)、C(C1-4烷基)2、CH=CH、O、NR5或键;
A为芳基、杂芳基、杂环基或C9-10环烷基,
其中芳基选自苯基和萘基,其各自任选地被1、2、3或4个各自选自R1的取代基取代,
其中杂芳基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R1的取代基取代,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R2的取代基取代,和
其中C9-10环烷基为任选地被1、2、3、4或5个各自选自R2的取代基取代的饱和或部分不饱和二环环系;
B为杂环基,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或多环环系,其各自任选地被1、2、3、4或5个各自选自R4的取代基取代;
R1为卤素、羟基、氰基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、杂环基-C1-4烷氧基、苯基或苯基-C1-4烷氧基,
其中杂芳基为具有1、2或3个选自N、O和S的杂原子环成员的饱和单环或二环环系,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中苯基、杂芳基或杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R2为卤素、羟基、氰基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、羟基-C1-4烷基、C1-4烷氧基、C1-4烷氧基-羰基、C2-4烯基、C3-7环烷基或杂环基-C1-4烷基,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R3为卤素、羟基、硝基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、苯基或苯基-C1-4烷氧基;
R4独立地选自卤素、C1-4烷基、羟基-C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基或羟基-C1-4烷基-氨基;和
R5为氢、C1-4烷基或羟基-C1-4烷基;
其中化合物的形式选自其前药、盐、水合物、溶剂化物、包合物、同位素体、外消旋体、对映异构体、非对映异构体、立体异构体、多晶型物和互变异构体形式。
另一方面,本文提供了用于修饰RNA剪接以调节由前体RNA产生的RNA转录物的量的方法,所述前体RNA按5’至3’顺序包含以下RNA核苷酸序列:分支点、3’剪接位点和内源或非内源剪接修饰剂的内含子识别元件(REMS),其中内含子REMS包含RNA序列NNGAgurngn(SEQ ID NO:1),其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸,所述方法包括使前体RNA与式(I)的化合物或其形式接触,其中所述式(I)的化合物选自式(Ia)和式(Ib)的化合物:
Figure BDA0002383691000000551
或其形式,其中
X为CH2、CH(C1-4烷基)、C(C1-4烷基)2、CH=CH、O、NR5或键;
A为芳基、杂芳基、杂环基或C9-10环烷基,
其中芳基选自苯基和萘基,其各自任选地被1、2、3或4个各自选自R1的取代基取代,
其中杂芳基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R1的取代基取代,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R2的取代基取代,和
其中C9-10环烷基为任选地被1、2、3、4或5个各自选自R2的取代基取代的饱和或部分不饱和二环环系;
B为杂环基,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或多环环系,其各自任选地被1、2、3、4或5个各自选自R4的取代基取代;
R1为卤素、羟基、氰基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、杂环基-C1-4烷氧基、苯基或苯基-C1-4烷氧基,
其中杂芳基为具有1、2或3个选自N、O和S的杂原子环成员的饱和单环或二环环系,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中苯基、杂芳基或杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R2为卤素、羟基、氰基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、氨基-羰基、羟基-C1-4烷基、C1-4烷氧基、C1-4烷氧基-羰基、C2-4烯基、C3-7环烷基或杂环基-C1-4烷基;
R3为卤素、羟基、硝基、氧代基、羟基-亚氨基、C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、苯基或苯基-C1-4烷氧基;
R4独立地选自卤素、C1-4烷基、羟基-C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基或羟基-C1-4烷基-氨基;和
R5为氢、C1-4烷基或羟基-C1-4烷基;
其中化合物的形式选自其前药、盐、水合物、溶剂化物、包合物、同位素体、外消旋体、对映异构体、非对映异构体、立体异构体、多晶型物和互变异构体形式。
一方面,本文提供了用于修饰RNA剪接以调节对象中的由包含编码内源或非内源内含子REMS的DNA核苷酸序列的基因产生的蛋白的量和类型的方法,其中所述DNA核苷酸序列按5’至3’顺序包含:编码分支点的核苷酸序列、编码3’剪接位点的核苷酸序列和编码内源或非内源内含子REMS的核苷酸序列,其中所述编码内源或非内源内含子REMS的核苷酸序列包含DNA序列GAgtrngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,所述方法包括向对象施用式(I)的化合物,其中所述式(I)的化合物为:
Figure BDA0002383691000000571
或其形式,其中
W为CH=CH或S;
X为CH2、CH(C1-4烷基)、C(C1-4烷基)2、CH=CH、O、NR5或键;
A为芳基、杂芳基、杂环基或C9-10环烷基,
其中芳基选自苯基和萘基,其各自任选地被1、2、3或4个各自选自R1的取代基取代,
其中杂芳基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R1的取代基取代,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R2的取代基取代,和
其中C9-10环烷基为任选地被1、2、3、4或5个各自选自R2的取代基取代的饱和或部分不饱和二环环系;
B为杂环基,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或多环环系,其各自任选地被1、2、3、4或5个各自选自R4的取代基取代;
R1为卤素、羟基、氰基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、杂环基-C1-4烷氧基、苯基或苯基-C1-4烷氧基,
其中杂芳基为具有1、2或3个选自N、O和S的杂原子环成员的饱和单环或二环环系,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中苯基、杂芳基或杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R2为卤素、羟基、氰基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、羟基-C1-4烷基、C1-4烷氧基、C1-4烷氧基-羰基、C2-4烯基、C3-7环烷基或杂环基-C1-4烷基,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R3为卤素、羟基、硝基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、苯基或苯基-C1-4烷氧基;
R4独立地选自卤素、C1-4烷基、羟基-C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基或羟基-C1-4烷基-氨基;和
R5为氢、C1-4烷基或羟基-C1-4烷基;
其中化合物的形式选自其前药、盐、水合物、溶剂化物、包合物、同位素体、外消旋体、对映异构体、非对映异构体、立体异构体、多晶型物和互变异构体形式。
一方面,本文提供了用于修饰RNA剪接以调节对象中的由包含编码内源或非内源内含子REMS的DNA核苷酸序列的基因产生的蛋白的量和类型的方法,其中所述DNA核苷酸序列按5’至3’顺序包含:编码内源或非内源内含子REMS的核苷酸序列、编码分支点的核苷酸序列和编码3’剪接位点的核苷酸序列,其中所述编码内源或非内源内含子REMS的核苷酸序列包含DNA序列GAgtrngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,所述方法包括向所述对象施用式(I)的化合物,其中所述式(I)的化合物为:
Figure BDA0002383691000000591
或其形式,其中
W为CH=CH或S;
X为CH2、CH(C1-4烷基)、C(C1-4烷基)2、CH=CH、O、NR5或键;
A为芳基、杂芳基、杂环基或C9-10环烷基,
其中芳基选自苯基和萘基,其各自任选地被1、2、3或4个各自选自R1的取代基取代,
其中杂芳基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R1的取代基取代,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R2的取代基取代,和
其中C9-10环烷基为任选地被1、2、3、4或5个各自选自R2的取代基取代的饱和或部分不饱和二环环系;
B为杂环基,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或多环环系,其各自任选地被1、2、3、4或5个各自选自R4的取代基取代;
R1为卤素、羟基、氰基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、杂环基-C1-4烷氧基、苯基或苯基-C1-4烷氧基,
其中杂芳基为具有1、2或3个选自N、O和S的杂原子环成员的饱和单环或二环环系,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中苯基、杂芳基或杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R2为卤素、羟基、氰基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、羟基-C1-4烷基、C1-4烷氧基、C1-4烷氧基-羰基、C2-4烯基、C3-7环烷基或杂环基-C1-4烷基,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R3为卤素、羟基、硝基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、苯基或苯基-C1-4烷氧基;
R4独立地选自卤素、C1-4烷基、羟基-C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基或羟基-C1-4烷基-氨基;和
R5为氢、C1-4烷基或羟基-C1-4烷基;
其中化合物的形式选自其前药、盐、水合物、溶剂化物、包合物、同位素体、外消旋体、对映异构体、非对映异构体、立体异构体、多晶型物和互变异构体形式。
另一方面,本文提供了修饰RNA剪接以调节对象中的由包含编码内源或非内源内含子REMS的DNA核苷酸序列的基因产生的蛋白的量和类型的方法,其中所述DNA核苷酸序列按5’至3’顺序包含:编码分支点的核苷酸序列、编码3’剪接位点的核苷酸序列和编码内源或非内源内含子REMS的核苷酸序列,其中所述编码内源或非内源内含子REMS的核苷酸序列包含DNA序列GAgtrngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,所述方法包括向所述对象施用式(I)的化合物,其中所述式(I)的化合物选自式(Ia)和式(Ib)的化合物:
Figure BDA0002383691000000611
或其形式,其中
X为CH2、CH(C1-4烷基)、C(C1-4烷基)2、CH=CH、O、NR5或键;
A为芳基、杂芳基、杂环基或C9-10环烷基,
其中芳基选自苯基和萘基,其各自任选地被1、2、3或4个各自选自R1的取代基取代,
其中杂芳基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R1的取代基取代,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R2的取代基取代,和
其中C9-10环烷基为任选地被1、2、3、4或5个各自选自R2的取代基取代的饱和或部分不饱和二环环系;
B为杂环基,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或多环环系,其各自任选地被1、2、3、4或5个各自选自R4的取代基取代;
R1为卤素、羟基、氰基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、杂环基-C1-4烷氧基、苯基或苯基-C1-4烷氧基,
其中杂芳基为具有1、2或3个选自N、O和S的杂原子环成员的饱和单环或二环环系,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中苯基、杂芳基或杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R2为卤素、羟基、氰基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、氨基-羰基、羟基-C1-4烷基、C1-4烷氧基、C1-4烷氧基-羰基、C2-4烯基、C3-7环烷基或杂环基-C1-4烷基;
R3为卤素、羟基、硝基、氧代基、羟基-亚氨基、C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、苯基或苯基-C1-4烷氧基;
R4独立地选自卤素、C1-4烷基、羟基-C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基或羟基-C1-4烷基-氨基;和
R5为氢、C1-4烷基或羟基-C1-4烷基;
其中化合物的形式选自其前药、盐、水合物、溶剂化物、包合物、同位素体、外消旋体、对映异构体、非对映异构体、立体异构体、多晶型物和互变异构体形式。
另一方面,本文提供了修饰RNA剪接以调节对象中的由包含编码内源或非内源内含子REMS的DNA核苷酸序列的基因产生的蛋白的量和类型的方法,其中所述DNA核苷酸序列按5’至3’顺序包含:编码内源或非内源内含子REMS的核苷酸序列、编码分支点的核苷酸序列和编码3’剪接位点的核苷酸序列,其中所述编码内源或非内源内含子REMS的核苷酸序列包含DNA序列GAgtrngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,所述方法包括向所述对象施用式(I)的化合物,其中所述式(I)的化合物选自式(Ia)和式(Ib)的化合物:
Figure BDA0002383691000000631
或其形式,其中
X为CH2、CH(C1-4烷基)、C(C1-4烷基)2、CH=CH、O、NR5或键;
A为芳基、杂芳基、杂环基或C9-10环烷基,
其中芳基选自苯基和萘基,其各自任选地被1、2、3或4个各自选自R1的取代基取代,
其中杂芳基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R1的取代基取代,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R2的取代基取代,和
其中C9-10环烷基为任选地被1、2、3、4或5个各自选自R2的取代基取代的饱和或部分不饱和二环环系;
B为杂环基,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或多环环系,其各自任选地被1、2、3、4或5个各自选自R4的取代基取代;
R1为卤素、羟基、氰基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、杂环基-C1-4烷氧基、苯基或苯基-C1-4烷氧基,
其中杂芳基为具有1、2或3个选自N、O和S的杂原子环成员的饱和单环或二环环系,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中苯基、杂芳基或杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R2为卤素、羟基、氰基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、氨基-羰基、羟基-C1-4烷基、C1-4烷氧基、C1-4烷氧基-羰基、C2-4烯基、C3-7环烷基或杂环基-C1-4烷基;
R3为卤素、羟基、硝基、氧代基、羟基-亚氨基、C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、苯基或苯基-C1-4烷氧基;
R4独立地选自卤素、C1-4烷基、羟基-C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基或羟基-C1-4烷基-氨基;和
R5为氢、C1-4烷基或羟基-C1-4烷基;
其中化合物的形式选自其前药、盐、水合物、溶剂化物、包合物、同位素体、外消旋体、对映异构体、非对映异构体、立体异构体、多晶型物和互变异构体形式。
一方面,本文提供了修饰RNA剪接以调节对象中的由包含编码内源或非内源内含子REMS的DNA核苷酸序列的基因产生的蛋白的量和类型的方法,其中所述DNA核苷酸序列按5’至3’顺序包含:编码分支点的核苷酸序列、编码3’剪接位点的核苷酸序列和编码内源或非内源内含子REMS的核苷酸序列,其中所述编码内源或非内源内含子REMS的核苷酸序列包含DNA序列NNGAgtrngn(SEQ ID NO:1808),其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸,所述方法包括向所述对象施用式(I)的化合物,其中所述式(I)的化合物为:
Figure BDA0002383691000000651
或其形式,其中
W为CH=CH或S;
X为CH2、CH(C1-4烷基)、C(C1-4烷基)2、CH=CH、O、NR5或键;
A为芳基、杂芳基、杂环基或C9-10环烷基,
其中芳基选自苯基和萘基,其各自任选地被1、2、3或4个各自选自R1的取代基取代,
其中杂芳基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R1的取代基取代,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R2的取代基取代,和
其中C9-10环烷基为任选地被1、2、3、4或5个各自选自R2的取代基取代的饱和或部分不饱和二环环系;
B为杂环基,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或多环环系,其各自任选地被1、2、3、4或5个各自选自R4的取代基取代;
R1为卤素、羟基、氰基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、杂环基-C1-4烷氧基、苯基或苯基-C1-4烷氧基,
其中杂芳基为具有1、2或3个选自N、O和S的杂原子环成员的饱和单环或二环环系,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中苯基、杂芳基或杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R2为卤素、羟基、氰基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、羟基-C1-4烷基、C1-4烷氧基、C1-4烷氧基-羰基、C2-4烯基、C3-7环烷基或杂环基-C1-4烷基,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R3为卤素、羟基、硝基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、苯基或苯基-C1-4烷氧基;
R4独立地选自卤素、C1-4烷基、羟基-C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基或羟基-C1-4烷基-氨基;和
R5为氢、C1-4烷基或羟基-C1-4烷基;
其中化合物的形式选自其前药、盐、水合物、溶剂化物、包合物、同位素体、外消旋体、对映异构体、非对映异构体、立体异构体、多晶型物和互变异构体形式。
一方面,本文提供了修饰RNA剪接以调节对象中的由包含编码内源或非内源内含子REMS的DNA核苷酸序列的基因产生的蛋白的量和类型的方法,其中所述DNA核苷酸序列按5’至3’顺序包含:编码内源或非内源内含子REMS的核苷酸序列、编码分支点的核苷酸序列和编码3’剪接位点的核苷酸序列,其中所述编码内源或非内源内含子REMS的核苷酸序列包含DNA序列NNGAgtrngn(SEQ ID NO:1808),其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸,所述方法包括向所述对象施用式(I)的化合物,其中所述式(I)的化合物为:
Figure BDA0002383691000000681
或其形式,其中
W为CH=CH或S;
X为CH2、CH(C1-4烷基)、C(C1-4烷基)2、CH=CH、O、NR5或键;
A为芳基、杂芳基、杂环基或C9-10环烷基,
其中芳基选自苯基和萘基,其各自任选地被1、2、3或4个各自选自R1的取代基取代,
其中杂芳基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R1的取代基取代,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R2的取代基取代,和
其中C9-10环烷基为任选地被1、2、3、4或5个各自选自R2的取代基取代的饱和或部分不饱和二环环系;
B为杂环基,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或多环环系,其各自任选地被1、2、3、4或5个各自选自R4的取代基取代;
R1为卤素、羟基、氰基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、杂环基-C1-4烷氧基、苯基或苯基-C1-4烷氧基,
其中杂芳基为具有1、2或3个选自N、O和S的杂原子环成员的饱和单环或二环环系,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中苯基、杂芳基或杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R2为卤素、羟基、氰基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、羟基-C1-4烷基、C1-4烷氧基、C1-4烷氧基-羰基、C2-4烯基、C3-7环烷基或杂环基-C1-4烷基,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R3为卤素、羟基、硝基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、苯基或苯基-C1-4烷氧基;
R4独立地选自卤素、C1-4烷基、羟基-C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基或羟基-C1-4烷基-氨基;和
R5为氢、C1-4烷基或羟基-C1-4烷基;
其中化合物的形式选自其前药、盐、水合物、溶剂化物、包合物、同位素体、外消旋体、对映异构体、非对映异构体、立体异构体、多晶型物和互变异构体形式。
另一方面,本文提供了修饰RNA剪接以调节对象中的由包含编码内源或非内源内含子REMS的DNA核苷酸序列的基因产生的蛋白的量和类型的方法,其中所述DNA核苷酸序列按5’至3’顺序包含:编码分支点的核苷酸序列、编码3’剪接位点的核苷酸序列和编码内源或非内源内含子REMS的核苷酸序列,其中所述编码内源或非内源内含子REMS的核苷酸序列包含DNA序列NNGAgtrngn(SEQ ID NO:1808),其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸,所述方法包括向所述对象施用式(I)的化合物,其中所述式(I)的化合物选自式(Ia)和式(Ib)的化合物:
Figure BDA0002383691000000701
或其形式,其中
X为CH2、CH(C1-4烷基)、C(C1-4烷基)2、CH=CH、O、NR5或键;
A为芳基、杂芳基、杂环基或C9-10环烷基,
其中芳基选自苯基和萘基,其各自任选地被1、2、3或4个各自选自R1的取代基取代,
其中杂芳基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R1的取代基取代,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R2的取代基取代,和
其中C9-10环烷基为任选地被1、2、3、4或5个各自选自R2的取代基取代的饱和或部分不饱和二环环系;
B为杂环基,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或多环环系,其各自任选地被1、2、3、4或5个各自选自R4的取代基取代;
R1为卤素、羟基、氰基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、杂环基-C1-4烷氧基、苯基或苯基-C1-4烷氧基,
其中杂芳基为具有1、2或3个选自N、O和S的杂原子环成员的饱和单环或二环环系,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中苯基、杂芳基或杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R2为卤素、羟基、氰基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、氨基-羰基、羟基-C1-4烷基、C1-4烷氧基、C1-4烷氧基-羰基、C2-4烯基、C3-7环烷基或杂环基-C1-4烷基;
R3为卤素、羟基、硝基、氧代基、羟基-亚氨基、C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、苯基或苯基-C1-4烷氧基;
R4独立地选自卤素、C1-4烷基、羟基-C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基或羟基-C1-4烷基-氨基;和
R5为氢、C1-4烷基或羟基-C1-4烷基;
其中化合物的形式选自其前药、盐、水合物、溶剂化物、包合物、同位素体、外消旋体、对映异构体、非对映异构体、立体异构体、多晶型物和互变异构体形式。
另一方面,本文提供了修饰RNA剪接以调节对象中的由包含编码内源或非内源内含子REMS的DNA核苷酸序列的基因产生的蛋白的量和类型的方法,其中所述DNA核苷酸序列按5’至3’顺序包含:编码内源或非内源内含子REMS的核苷酸序列、编码分支点的核苷酸序列和编码3’剪接位点的核苷酸序列,其中所述编码内源或非内源内含子REMS的核苷酸序列包含DNA序列NNGAgtrngn(SEQ ID NO:1808),其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸,所述方法包括向所述对象施用式(I)的化合物,其中所述式(I)的化合物选自式(Ia)和式(Ib)的化合物:
Figure BDA0002383691000000721
或其形式,其中
X为CH2、CH(C1-4烷基)、C(C1-4烷基)2、CH=CH、O、NR5或键;
A为芳基、杂芳基、杂环基或C9-10环烷基,
其中芳基选自苯基和萘基,其各自任选地被1、2、3或4个各自选自R1的取代基取代,
其中杂芳基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R1的取代基取代,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R2的取代基取代,和
其中C9-10环烷基为任选地被1、2、3、4或5个各自选自R2的取代基取代的饱和或部分不饱和二环环系;
B为杂环基,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或多环环系,其各自任选地被1、2、3、4或5个各自选自R4的取代基取代;
R1为卤素、羟基、氰基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、杂环基-C1-4烷氧基、苯基或苯基-C1-4烷氧基,
其中杂芳基为具有1、2或3个选自N、O和S的杂原子环成员的饱和单环或二环环系,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中苯基、杂芳基或杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R2为卤素、羟基、氰基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、氨基-羰基、羟基-C1-4烷基、C1-4烷氧基、C1-4烷氧基-羰基、C2-4烯基、C3-7环烷基或杂环基-C1-4烷基;
R3为卤素、羟基、硝基、氧代基、羟基-亚氨基、C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、苯基或苯基-C1-4烷氧基;
R4独立地选自卤素、C1-4烷基、羟基-C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基或羟基-C1-4烷基-氨基;和
R5为氢、C1-4烷基或羟基-C1-4烷基;
其中化合物的形式选自其前药、盐、水合物、溶剂化物、包合物、同位素体、外消旋体、对映异构体、非对映异构体、立体异构体、多晶型物和互变异构体形式。
在本文所述的特定方面,所述基因或所述RNA转录物是从选自以下的基因转录的:ABCA1、ABCA10、ABCB7、ABCB8、ABCC1、ABCC3、ABHD10、ABL2、ABLIM3、ACACA、ACADVL、ACAT2、ACTA2、ADAL、ADAM12、ADAM15、ADAM17、ADAM23、ADAM33、ADAMTS1、ADAMTS19、ADCY3、ADD1、ADGRG6、ADH6、ADHFE1、AFF2、AFF3、AGK、AGPAT3、AGPAT4、AGPS、AHCYL2、AHDC1、AHRR、AJUBA、AK021888、AK310472、AKAP1、AKAP3、AKAP8L、AKAP9、AKNA、AKT1、ALCAM、ALDH4A1、AMPD2、ANK1、ANK2、ANK3、ANKFY1、ANKHD1-EIF4EBP3、ANKRA2、ANKRD13C、ANKRD17、ANKRD33B、ANKRD36、ANKS6、ANP32A、ANXA11、ANXA6、AP2B1、AP4B1-AS1、APAF1、APIP、APLP2、APOA2、APP、APPL2、APTX、ARHGAP1、ARHGAP12、ARHGAP22、ARHGAP5、ARHGEF16、ARID1A、ARID2、ARID5B、ARL9、ARL15、ARL5B、ARMCX3、ARMCX6、ARSJ、ASAP1、ASIC1、ASL、ASNS、ASPH、ATAD2B、ATF6、ATF7IP、ATG5、ATG9A、ATMIN、ATP2A3、ATP2C1、ATXN1、ATXN3、AURKA、AXIN1、B3GALT2、B3GNT6、B4GALT2、BACE1、BAG2、BASP1、BC033281、BCAR3、BCL2L15、BCYRN1、BECN1、BEND6、BHMT2、BICD1、BIN1、BIN3、BIN3-IT1、BIRC3、BIRC6、BNC1、BNC2、BRCA1、BRCA2、BRD2、BRPF1、BSCL2、BTBD10、BTG2、BTN3A1、BZW1、C1QTNF9B-AS1、C1orf27、C1orf86、C10orf54、C11orf30、C11orf70、C11orf73、C11orf76、C11orf94、C12orf4、C12orf56、C14orf132、C17orf76-AS1、C19orf47、C2orf47、C3、C4orf27、C5orf24、C6orf48、C7orf31、C8orf34、C8orf44、C8orf44-SGK3、C8orf88、C9orf69、CA13、CA3、CAB39、CACNA2D2、CACNB1、CACNB4、CADM1、CADM2、CALU、CAMKK1、CAND2、CAPNS1、CASC3、CASP7、CASP8AP2、CAV1、CCAR1、CCDC77、CCDC79、CCDC88A、CCDC92、CCDC122、CCER2、CCNF、CCNL2、CCT6A、CD276、CD46、CDC25B、CDC40、CDC42BPA、CDCA7、CDH11、CDH13、CDH18、CDK11B、CDK16、CDKAL1、CDKN1C、CECR7、CELSR1、CEMIP、CENPI、CEP112、CEP162、CEP170、CEP192、CEP57、CEP68、CFH、CFLAR、CHD8、CHEK1、CHRM2、CIITA、CIZ1、CLDN23、CLIC1、CLK4、CLTA、CMAHP、CNGA4、CNOT1、CNRIP1、CNTD1、CMSS1、CNOT7、CNRIP1、CNTN1、COG1、COL1A1、COL11A1、COL12A1、COL14A1、COL15A1、COL5A1、COL5A3、COL6A1、COL6A6、COL8A1、COLEC12、COMP、COPS7B、CPA4、CPEB2、CPQ、CPSF4、CREB5、CRISPLD2、CRLF1、CRLS1、CRTAP、CRX、CRYBG3、CRYL1、CSDE1、CSNK1A1、CSNK1E、CSNK1G1、CTDSP2、CTNND1、CTRC、CUL2、CUL4A、CUX1、CYB5B、CYB5R2、CYBRD1、CYGB、CYP1B1、CYP51A1、DAAM1、DAB2、DACT1、DAGLB、DARS、DAXX、DCAF10、DCAF11、DCAF17、DCBLD2、DCLK1、DCN、DCUN1D4、DDAH1、DDAH2、DDHD2、DDIT4L、DDR1、DDX39B、DDX42、DDX50、DEGS1、DENND1A、DENND1B、DENND4A、DENND5A、DEPTOR、DET1、DFNB59、DGCR2、DGK1、DGKA、DHCR24、DHCR7、DHFR、DHX9、DIAPH1、DIAPH3、DIRAS3、DIS3L、DKFZp434M1735、DKK3、DLC1、DLG5、DLGAP4、DMD、DMXL1、DNAH8、DNAH11、DNAJA4、DNAJC13、DNAJC27、DNM2、DNMBP、DOCK1、DOCK11、DPP8、DSEL、DST、DSTN、DYNC1I1、DYRK1A、DZIP1L、EBF1、EEA1、EEF1A1、EFCAB14、EFEMP1、EGR1、EGR3、EHMT2、EIF2B3、EIF4G1、EIF4G2、EIF4G3、ELF2、ELMO2、ELN、ELP4、EMX2OS、ENAH、ENG、ENOX1、ENPP1、ENPP2、ENSA、EP300、EPN1、EPT1、ERC1、ERC2、ERCC1、ERCC8、ERGIC3、ERLIN2、ERRFI1、ESM1、ETV5、EVC、EVC2、EXO1、EXOC3、EXOC6B、EXTL2、EYA3、F2R、FADS1、FADS2、FAF1、FAIM、FAM111A、FAM126A、FAM13A、FAM160A1、FAM162A、FAM174A、FAM195B、FAM198B、FAM20A、FAM208B、FAM219A、FAM219B、FAM3C、FAM46B、FAM49B、FAM65A、FAM65B、FAM69B、FAP、FARP1、FBLN2、FBN2、FBXL16、FBXL6、FBXO9、FBXO10、FBXO18、FBXO31、FBXO34、FBXO9、FCHO1、FDFT1、FDPS、FER、FEZ1、FGD4、FGD5-AS1、FGFR2、FGFRL1、FGL2、FHOD3、FLII、FLNB、FLT1、FN1、FNBP1、FOCAD、FOS、FOSB、FOSL1、FOXK1、FOXM1、FRAS1、FSCN2、FUS、FYN、GABPB1、GAL3ST4、GALC、GALNT1、GALNT15、GAS7、GATA6、GBA2、GBGT1、GBP1、GCFC2、GLCE、GCNT1、GDF6、GGACT、GGCT、GHDC、GIGYF2、GJC1、GLCE、GMIP、GNA13、GNAQ、GNAS、GNG12、GNL3L、GOLGA2、GOLGA4、GOLGB1、GORASP1、GPR1、GPR183、GPR50、GPR89A、GPRC5A、GPRC5B、GPSM2、GREM1、GRK6、GRTP1、GSE1、GTF2H2B、GTSF1、GUCA1B、GULP1、GXYLT1、HAPLN1、HAPLN2、HAS2、HAS3、HAT1、HAUS3、HAUS6、HAVCR2、HDAC5、HDAC7、HDX、HECTD2-AS1、HEG1、HEPH、HEY1、HLA-A、HLA-E、HLTF、HMGA1、HMGA2、HMGB1、HMGCR、HMGN3-AS1、HMGCS1、HMGXB4、HOOK3、HOXB3、HMOX1、HNMT、HNRNPR、HNRNPUL1、HP1BP3、HPS1、HRH1、HSD17B12、HSD17B4、HSPA1L、HTATIP2、HTT、IARS、IDH1、IDI1、IFT57、IGDCC4、IGF2BP2、IGF2R、IGFBP3、IKBKAP、IL16、IL6ST、INA、INHBA、INO80、IPP4B、INPP5K、INSIG1、INTU、INVS、IQCE、IQCG、ITCH、ITGA11、ITGA8、ITGAV、ITGB5、ITGB8、ITIH1、ITM2C、ITPKA、ITSN1、IVD、KANSL3、KAT6B、KCNK2、KCNS1、KCNS2、KDM6A、KDSR、KIAA1033、KIAA1143、KIAA1199、KIAA1456、KIAA1462、KIAA1522、KIAA1524、KIAA1549、KIAA1715、KIAA1755、KIDINS220、KIF14、KIF2A、KIF21A、KIF3A、KIT、KLC1、KLC2、KLF17、KLF6、KLHL7、KLRG1、KMT2D、KRT7、KRT18、KRT19、KRT34、KRTAP1-1、KRTAP1-5、KRTAP2-3、L3MBTL2、LAMA2、LAMB1、LAMB2P1、LARP4、LARP7、LATS2、LDLR、LEMD3、LETM2、LGALS3、LGALS8、LGI2、LGR4、LHX9、LIMS1、LINC00341、LINC00472、LINC00570、LINC00578、LINC00607、LINC00657、LINC00678、LINC00702、LINC00886、LINC00961、LINC01011、LINC01118、LINC01204、LINCR-0002、LINGO2、LMAN2L、LMNA、LMO7、LMOD1、LOC400927、LONP1、LOX、LPHN1、LRBA、LRCH4、LRIG1、LRP4、LRP8、LRRC1、LRRC32、LRRC39、LRRC42、LRRC8A、LSAMP、LSS、LTBR、LUC7L2、LUM、LYPD1、LYRM1、LZTS2、MACROD2、MADD、MAFB、MAGED4、MAGED4B、MAMDC2、MAN1A2、MAN2A1、MAN2C1、MANEA、MAP4K4、MAPK10、MAPK13、MARCH7、MARCH8、MASP1、MB、MB21D2、MBD1、MBOAT7、MC4R、MCM10、MDM2、MDN1、MEAF6、MECP2、MED1、MED13L、MEDAG、MEF2D、MEGF6、MEIS2、MEMO1、MEPCE、MFGE8、MFN2、MIAT、MICAL2、MINPP1、MIR612、MKL1、MKLN1、MKNK2、MLLT4、MLLT10、MLST8、MMAB、MMP10、MMP24、MMS19、MMS22L、MN1、MORF4L1、MOXD1、MPPE1、MPZL1、MRPL3、MRPL39、MRPL45、MRPL55、MRPS28、MRVI1、MSANTD3、MSC、MSH2、MSH4、MSH6、MSL3、MSMO1、MSRB3、MTAP、MTERF3、MTERFD1、MTHFD1L、MTMR3、MTMR9、MTRR、MUM1、MVD、MVK、MXRA5、MYADM、MYB、MYCBP2、MYLK、MYO1D、MYO9B、MYOF、NA、NAA35、NAALADL2、NADK、NAE1、NAGS、NASP、NAV1、NAV2、NCOA1、NCOA3、NCOA4、NCSTN、NDNF、NEDD4、NELFA、NEO1、NEURL1B、NF2、NFASC、NFE2L1、NFX1、NGF、NGFR、NHLH1、NID1、NID2、NIPA1、NKX3-1、NLGN1、NLN、NOL10、NOMO3、NOTCH3、NOTUM、NOVA2、NOX4、NPEPPS、NRD1、NREP、NRG1、NRROS、NSUN4、NT5C2、NT5E、NTNG1、NUDT4、NUP153、NUP35、NUP50、NUPL1、NUSAP1、OCLN、ODF2、OLR1、OS9、OSBPL3、OSBPL6、OSBPL10、OSMR、OXCT1、OXCT2、P4HA1、P4HB、PABPC1、PAIP2B、PAK4、PAPD4、PARD3、PARN、PARP14、PARP4、PARVB、PAX6、PBLD、PBX3、PCBP2、PCBP4、PCCB、PCDH10、PCDHGB3、PCGF3、PCM1、PCMTD2、PCNXL2、PCSK9、PDE1C、PDE3A、PDE4A、PDE5A、PDE7A、PDGFD、PDGFRB、PDLIM7、PDS5B、PDXDC1、PDXDC2P、PEAR1、PELI1、PEPD、PEX5、PFKP、PHACTR3、PHF19、PHF8、PHRF1、PHTF2、PI4K2A、PIEZO1、PIGN、PIGU、PIK3C2B、PIK3CD、PIK3R1、PIKFYVE、PIM2、PITPNA、PITPNB、PITPNM1、PITPNM3、PLAU、PLEC、PLEK2、PLEKHA1、PLEKHA6、PLEKHB2、PLEKHH2、PLSCR1、PLSCR3、PLXNB2、PLXNC1、PMS1、PNISR、PODN、POLE3、POLN、POLR1A、POLR3D、POMT2、POSTN、POU2F1、PPAPDC1A、PPARA、PPARG、PPFIBP1、PPHLN1、PPIP5K1、PPIP5K2、PPM1E、PPP1R12A、PPP1R26、PPP3CA、PPP6R1、PPP6R2、PRKACB、PRKCA、PRKDC、PRKG1、PRMT1、PRNP、PRPF31、PRPH2、PRRG4、PRSS23、PRUNE2、PSMA4、PSMC1、PSMD6、PSMD6-AS2、PTCH1、PTGIS、PTK2B、PTPN14、PTX3、PUF60、PUS7、PVR、PXK、PXN、QKI、RAB23、RAB2B、RAB30、RAB34、RAB38、RAB44、RAD1、RAD9B、RAD23B、RAF1、RALB、RAP1A、RAP1GDS1、RAPGEF1、RARG、RARS、RARS2、RASIP1、RASSF8、RBBP8、RBCK1、RCOR3、RBFOX2、RBKS、RBM10、RCC1、RDX、RERE、RFTN1、RFWD2、RFX3-AS1、RGCC、RGL1、RGS10、RGS3、RIF1、RNF14、RNF19A、RNF130、RNF144A、RNF213、RNF38、RNFT1、ROR1、ROR2、RPA1、RPF2、RPL10、RPS10、RPS6KB2、RPS6KC1、RRBP1、RWDD4、SAMD4A、SAMD9、SAMD9L、SAR1A、SART3、SCAF4、SCAF8、SCARNA9、SCD、SCLT1、SCO1、SDCBP、SEC14L1、SEC22A、SEC24A、SEC24B、SEC61A1、SENP6、SEPT9、SERGEF、SERPINE2、SF1、SF3B3、SGIP1、SGK3、SGMS1、SGOL2、SGPL1、SH2B3、SH3RF1、SH3YL1、SHROOM3、SIGLEC10、SKA2、SKIL、SKP1、SLC12A2、SLC24A3、SLC25A16、SLC25A17、SLC34A3、SLC35F3、SLC39A3、SLC39A10、SLC4A4、SLC4A11、SLC41A1、SLC44A2、SLC46A2、SLC6A15、SLC7A6、SLC7A8、SLC7A11、SLC9A3、SLIT3、SMARCA4、SMARCC2、SMC4、SMC6、SMCHD1、SMG1、SMG1P3、SMN2、SMOX、SMPD4、SMTN、SMYD3、SMYD5、SNAP23、SNED1、SNHG16、SNX7、SNX14、SNX24、SNX7、SOCS2、SOCS6、SOGA2、SON、SORBS2、SORCS1、SORCS2、SOS2、SOX7、SPATA18、SPATA20、SPATA5、SPATS2、SPDYA、SPEF2、SPG20、SPIDR、SPINK5、SPRED2、SPRYD7、SQLE、SQRDL、SQSTM1、SRCAP、SREBF1、SREK1、SRGAP1、SRRM1、SRSF3、SSBP1、STAC2、STARD4、STAT1、STAT3、STAT4、STAU1、STC2、STEAP2、STK32B、STRAD8、STRIP1、STRN3、STRN4、STS、STX16、STXBP4、STXBP6、SULF1、SUPT20H、SVEP1、SYNE1、SYNE2、SYNGR2、SYNPO、SYNPO2、SYNPO2L、SYT15、SYTL2、TACC1、TAF2、TAGLN3、TANC2、TANGO6、TARBP1、TARS、TASP1、TBC1D15、TBCA、TBL1XR1、TBL2、TCF12、TCF4、TCF7L2、TEKT4P2、TENC1、TENM2、TEP1、TET1、TET3、TEX21P、TFCP2、TGFA、TGFB2、TGFB3、TGFBI、TGFBR1、TGFBRAP1、TGM2、THADA、THAP4、THBS2、THRB、TIAM1、TIMP2、TJAP1、TJP2、TLE3、TLK1、TMC3、TMEM67、TMEM102、TMEM119、TMEM134、TMEM154、TMEM189-UBE2V1、TMEM214、TMEM256-PLSCR3、TMEM47、TMEM50B、TMEM63A、TMX3、TNC、TNFAIP3、TNFAIP8L3、TNFRSF12A、TNFRSF14、TNIP1、TNKS1BP1、TNPO3、TNRC18P1、TNRC6A、TNS1、TNS3、TNXB、TOE1、TOMM40、TOMM5、TOPORS、TP53AIP1、TP53INP1、TPRG1、TRAF3、TRAK1、TRAPPC12、TRIB1、TRIM2、TRIM23、TRIM26、TRIM28、TRIM65、TRIM66、TRMT1L、TRPC4、TRPS1、TSC2、TSHZ1、TSHZ2、TSPAN11、TSPAN18、TSPAN2、TSPAN7、TSSK3、TTC7A、TTC7B、TUBB2C、TUBB3、TUBE1、TXNIP、TXNL1、TXNL4B、TXNRD1、TYW5、U2SURP、UBAP2L、UBE2D3、UBE2G2、UBE2L3、UBE2V1、UBN2、UBQLN4、UCHL5、UHMK1、UHRF1BP1L、UNC13B、UNC5B、URGCP、URGCP-MRPS24、USP19、USP7、USP27X、UVRAG、VANGL1、VARS2、VAV2、VCL、VDAC2、VIM-AS1、VIPAS39、VPS13A、VPS29、VPS41、VPS51、VSTM2L、VWA8、VWF、WDR19、WDR27、WDR37、WDR48、WDR90、WDR91、WHSC2、WIPF1、WISP1、WNK1、WNT5B、WNT10B、WSB1、WWTR1、XDH、XIAP、XRN2、YAP1、YDJC、YES1、YPEL5、YTHDF3、Z24749、ZAK、ZBTB10、ZBTB24、ZBTB26、ZBTB7A、ZC3H12C、ZC3H14、ZC3H18、ZCCHC5、ZCCHC8、ZCCHC11、ZEB1、ZEB2、ZFAND1、ZFAND5、ZFP82、ZHX3、ZMIZ1、ZMIZ1-AS1、ZMIZ2、ZMYM2、ZNF12、ZNF138、ZNF148、ZNF208、ZNF212、ZNF219、ZNF227、ZNF232、ZNF24、ZNF268、ZNF28、ZNF280D、ZNF281、ZNF335、ZNF350、ZNF37A、ZNF37BP、ZNF395、ZNF426、ZNF431、ZNF583、ZNF618、ZNF621、ZNF652、ZNF655、ZNF660、ZNF674、ZNF680、ZNF730、ZNF74、ZNF764、ZNF777、ZNF778、ZNF780A、ZNF7804A、ZNF79、ZNF827、ZNF836、ZNF837、ZNF839、ZNF91和ZSCAN25。
在本文所述的另一特定方面,所述基因或所述RNA转录物是从选自以下的基因转录的:ABCA1、ABCB7、ABCC1、ABHD10、ABL2、ABLIM3、ACACA、ACADVL、ACAT2、ADAM12、ADAM15、ADAM17、ADAM33、AFF2、AGK、AGPAT3、AGPS、AHCYL2、AHDC1、AHRR、AJUBA、AK021888、AK310472、AKAP1、AKAP9、AKNA、ALCAM、ALDH4A1、AMPD2、ANK2、ANKFY1、ANKHD1-EIF4EBP3、ANKRD17、ANKS6、ANP32A、ANXA11、ANXA6、AP2B1、APAF1、APLP2、APP、APPL2、APTX、ARHGAP22、ARID1A、ARID2、ARMCX3、ASAP1、ASL、ASNS、ASPH、ATAD2B、ATF7IP、ATG9A、ATMIN、ATP2C1、ATXN3、AURKA、AXIN1、B4GALT2、BACE1、BAG2、BASP1、BC033281、BCAR3、BEND6、BICD1、BIN1、BNC1、BRD2、BRPF1、BSCL2、BTBD10、BZW1、C11orf30、C11orf73、C17orf76-AS1、C4orf27、C5orf24、C6orf48、C9orf69、CAB39、CALU、CAMKK1、CAPNS1、CASC3、CASP8AP2、CAV1、CCAR1、CCDC77、CCDC88A、CCDC92、CCT6A、CD276、CD46、CDC25B、CDC40、CDC42BPA、CDCA7、CDH11、CDH13、CDK11B、CDK16、CDKAL1、CEP68、CFLAR、CHD8、CIZ1、CLIC1、CLK4、CNOT1、COG1、COL12A1、COL1A1、COL6A1、COPS7B、CPEB2、CREB5、CRLS1、CRTAP、CSDE1、CSNK1A1、CTDSP2、CTNND1、CUL2、CUL4A、CUX1、CYB5B、CYBRD1、CYP51A1、DAB2、DACT1、DARS、DAXX、DCAF10、DCAF11、DCBLD2、DCUN1D4、DDAH1、DDAH2、DDHD2、DDR1、DDX39B、DDX42、DENND1A、DENND1B、DENND5A、DGCR2、DGKA、DHCR24、DHCR7、DHFR、DHX9、DIAPH1、DIAPH3、DIS3L、DKFZp434M1735、DKK3、DLC1、DNM2、DOCK1、DPP8、DSEL、DST、DSTN、EBF1、EEA1、EEF1A1、EFCAB14、EGR1、EHMT2、EIF2B3、EIF4G1、EIF4G2、EIF4G3、ELF2、ENG、ENPP2、ENSA、EPN1、EPT1、ERC1、ERGIC3、ETV5、EXO1、EXTL2、EYA3、FADS1、FADS2、FAF1、FAM111A、FAM198B、FAM219A、FAM219B、FAM3C、FAM65A、FBXO10、FBXO18、FBXO31、FBXO34、FBXO9、FDFT1、FDPS、FER、FEZ1、FGD5-AS1、FGFRL1、FHOD3、FLII、FLNB、FN1、FNBP1、FOCAD、FOS、FOSB、FOSL1、FOXK1、FOXM1、FUS、FYN、GABPB1、GALC、GALNT1、GAS7、GBA2、GCFC2、GGCT、GHDC、GIGYF2、GJC1、GMIP、GNA13、GNAS、GNL3L、GOLGA2、GOLGA4、GOLGB1、GORASP1、GPR1、GPR89A、GPSM2、GREM1、GRK6、GSE1、GTF2H2B、HAS2、HAT1、HAUS3、HAUS6、HDAC7、HEG1、HLA-A、HLA-E、HLTF、HMGA1、HMGB1、HMGCR、HMGCS1、HMOX1、HNRNPR、HNRNPUL1、HP1BP3、HRH1、HSD17B12、HSD17B4、HTT、IARS、IDH1、IDI1、IGF2BP2、IL6ST、INHBA、INSIG1、IQCE、ITGAV、ITGB5、ITM2C、ITSN1、KANSL3、KCNK2、KIAA1033、KIAA1143、KIAA1199、KIAA1522、KIAA1524、KIAA1549、KIAA1715、KIF14、KIF2A、KIF3A、KLC1、KLC2、KLF6、KLHL7、KRT18、KRT19、KRT34、KRTAP2-3、LAMA2、LAMB1、LARP4、LARP7、LATS2、LDLR、LEMD3、LGALS8、LIMS1、LINC00341、LINC00657、LMAN2L、LMO7、LONP1、LOX、LRCH4、LRIG1、LRP8、LRRC8A、LSS、LTBR、LUC7L2、LZTS2、MADD、MAGED4、MAGED4B、MAN1A2、MAP4K4、MBD1、MBOAT7、MDM2、MED1、MEDAG、MEF2D、MEIS2、MEMO1、MEPCE、MFGE8、MICAL2、MINPP1、MKL1、MKLN1、MKNK2、MLLT4、MLST8、MMAB、MMS19、MMS22L、MPPE1、MPZL1、MRPL3、MSANTD3、MSC、MSH2、MSH6、MSL3、MSMO1、MSRB3、MTAP、MTERFD1、MTHFD1L、MTMR9、MTRR、MUM1、MVD、MVK、MYADM、MYLK、MYO1D、MYO9B、MYOF、NAA35、NADK、NASP、NAV1、NAV2、NCOA1、NCOA3、NCOA4、NCSTN、NELFA、NEO1、NEURL1B、NF2、NFE2L1、NFX1、NID1、NID2、NIPA1、NKX3-1、NOL10、NOMO3、NPEPPS、NRD1、NREP、NRG1、NSUN4、NT5C2、NT5E、NTNG1、NUDT4、NUP153、NUP35、NUP50、NUPL1、NUSAP1、ODF2、OS9、OSBPL6、OSMR、P4HA1、P4HB、PABPC1、PAK4、PAPD4、PARD3、PARN、PARP14、PARP4、PARVB、PCBP2、PCBP4、PCDHGB3、PCGF3、PCM1、PCMTD2、PCNXL2、PCSK9、PDE4A、PDE7A、PDLIM7、PDXDC1、PEPD、PEX5、PFKP、PHF19、PHF8、PHRF1、PHTF2、PI4K2A、PIEZO1、PIGU、PIK3C2B、PITPNA、PITPNB、PITPNM1、PLAU、PLEC、PLEKHB2、PLSCR3、PLXNB2、PLXNC1、PMS1、POLE3、POLR3D、POSTN、POU2F1、PPAPDC1A、PPARA、PPHLN1、PPIP5K1、PPP1R12A、PPP6R1、PPP6R2、PRKACB、PRKDC、PRMT1、PRNP、PRSS23、PSMA4、PSMC1、PSMD6、PTK2B、PTPN14、PUF60、PUS7、PVR、PXN、QKI、RAB23、RAB2B、RAB34、RAD1、RAD23B、RALB、RAP1A、RAP1GDS1、RARG、RASSF8、RBCK1、RBFOX2、RBM10、RCC1、RFTN1、RFWD2、RGS10、RGS3、RIF1、RNF14、RNF19A、RNF38、RNFT1、RPL10、RPS6KC1、RRBP1、RWDD4、SAMD9、SAMD9L、SAR1A、SART3、SCAF4、SCAF8、SCD、SCLT1、SCO1、SDCBP、SEC14L1、SEC22A、SEC24B、SEC61A1、SEPT9、SERPINE2、SF1、SGOL2、SH3RF1、SKIL、SLC25A17、SLC39A3、SLC41A1、SLC4A4、SLC7A6、SLC7A8、SMARCA4、SMARCC2、SMC4、SMC6、SMCHD1、SMG1、SMN2、SMPD4、SMYD3、SMYD5、SNAP23、SNHG16、SNX14、SOCS2、SON、SOS2、SPATA20、SPATS2、SPG20、SPRED2、SQLE、SQRDL、SQSTM1、SRCAP、SREBF1、SREK1、SRSF3、STARD4、STAT1、STAT3、STAU1、STC2、STEAP2、STRIP1、STRN3、STX16、SUPT20H、SYNE1、SYNE2、SYT15、SYTL2、TACC1、TAF2、TANC2、TARBP1、TARS、TBC1D15、TBL2、TCF7L2、TENC1、TENM2、TEP1、TET3、TFCP2、TGFBI、TGFBR1、TGFBRAP1、THADA、THAP4、THRB、TIMP2、TJP2、TLE3、TLK1、TMEM154、TMEM47、TMEM63A、TNC、TNFAIP3、TNFRSF12A、TNIP1、TNKS1BP1、TNPO3、TNS1、TNS3、TOE1、TOMM40、TOMM5、TOPORS、TP53INP1、TRAF3、TRAK1、TRAPPC12、TRIB1、TRIM2、TRIM23、TRIM26、TRIM28、TRIM65、TRMT1L、TRPS1、TSC2、TSHZ1、TSPAN2、TTC7A、TUBB2C、TUBB3、TXNL1、TXNRD1、U2SURP、UBAP2L、UBE2G2、UBE2V1、UBQLN4、UCHL5、UHMK1、UHRF1BP1L、UNC5B、USP19、USP7、VANGL1、VARS2、VCL、VIPAS39、VPS13A、VPS29、VPS51、VWA8、WDR19、WDR37、WDR48、WIPF1、WNT5B、WSB1、WWTR1、XIAP、XRN2、YAP1、YES1、YPEL5、YTHDF3、Z24749、ZAK、ZBTB10、ZBTB24、ZBTB7A、ZC3H12C、ZC3H14、ZC3H18、ZCCHC11、ZEB1、ZEB2、ZFAND1、ZFAND5、ZHX3、ZMIZ1、ZMYM2、ZNF12、ZNF148、ZNF219、ZNF227、ZNF24、ZNF268、ZNF28、ZNF281、ZNF335、ZNF37A、ZNF37BP、ZNF395、ZNF583、ZNF621、ZNF652、ZNF655、ZNF674、ZNF74、ZNF764、ZNF778、ZNF780A、ZNF827、ZNF839和ZNF91。
在本文所述的另一特定方面,所述基因或所述RNA转录物是从选自以下的基因转录的:ABCB8、ANKRD36、APLP2、ARHGAP12、ARMCX6、ASAP1、ATG5、AXIN1、BIRC6、C1orf86、CDC42BPA、CLTA、DYRK1A、ERGIC3、FBXL6、FOXM1、GGCT、KAT6B、KDM6A、KIF3A、KMT2D、LARP7、LYRM1、MADD、MAN2C1、MRPL55、MYCBP2、MYO9B、PNISR、RAP1A、RAPGEF1、SENP6、SH3YL1、SLC25A17、SMN2、SREK1、STRN3、TAF2、TMEM134、VPS29、ZFAND1和ZNF431。
在本文所述的另一特定方面,所述基因或所述RNA转录物是从选自以下的基因转录的:ABCB8、ANKRD36、ARHGAP12、ARMCX6、ATG5、BIRC6、C1orf86、CLTA、DYRK1A、FBXL6、KAT6B、KDM6A、KMT2D、LYRM1、MAN2C1、MRPL55、MYCBP2、PNISR、RAPGEF1、SENP6、SH3YL1、TMEM134和ZNF431。
在本文所述的另一特定方面,所述基因或所述RNA转录物是从选自以下的基因转录的:ABCA10、ABCC1、ACTA2、ADAL、ADAM12、ADAMTS1、ADAMTS5、ADD1、ADGRG6、ADH6、ADHFE1、AFF2、AFF3、AGK、AGPS、AKAP3、ANK1、ANK2、ANK3、ANKRD33B、ANXA11、ANXA6、AP4B1-AS1、ARHGEF16、ARID5B、ARL9、ARMCX3、ASAP1、ASIC1、ATP2A3、B3GALT2、B3GNT6、BCL2L15、BCYRN1、BIN3-IT1、BIRC3、BTG2、C10orf54、C11orf70、C11orf73、C11orf94、C12orf56、C19orf47、C3、C4orf27、C7orf31、C8orf34、CA13、CA3、CACNA2D2、CACNB1、CADM1、CAND2、CCDC79、CCER2、CCNF、CDCA7、CDKAL1、CELSR1、CEMIP、CEP170、CFH、CIITA、CLDN23、CMAHP、CNGA4、CNTD1、COL11A1、COL12A1、COL14A1、COL15A1、COL5A1、COL5A3、COL6A6、COL8A1、COLEC12、COMP、CPA4、CPQ、CRISPLD2、CRLF1、CRYL1、CUX1、CYB5B、CYB5R2、CYGB、CYP1B1、DCLK1、DCN、DDIT4L、DDX42、DDX50、DEGS1、DENND1A、DENND5A、DEPTOR、DFNB59、DGKA、DHFR、DIAPH3、DIRAS3、DIS3L、DLG5、DNAH8、DNAJC27、DOCK1、DOCK11、DYNC1I1、DZIP1L、EBF1、EFEMP1、EGR3、EIF2B3、ELN、ELP4、EMX2OS、ENPP1、ERCC8、ESM1、EVC2、F2R、FAM160A1、FAM198B、FAM20A、FAM46B、FAM65B、FAP、FARP1、FBLN2、FBN2、FBXO9、FCHO1、FER、FGFR2、FGL2、FLT1、FRAS1、FSCN2、GAL3ST4、GALC、GALNT15、GATA6、GBGT1、GCNT1、GDF6、GNAQ、GOLGB1、GPR183、GPR50、GPRC5A、GPRC5B、GRTP1、GUCA1B、GXYLT1、HAPLN1、HAPLN2、HAS3、HAVCR2、HDAC5、HECTD2-AS1、HEPH、HEY1、HLTF、HMGN3-AS1、HMOX1、HOOK3、HSD17B12、HSPA1L、HTATIP2、HTT、IGDCC4、IGF2R、IGFBP3、IL16、INA、INTU、IQCG、ITGA11、ITGA8、ITGB8、ITIH1、ITPKA、KCNS1、KCNS2、KDM6A、KDSR、KIAA1456、KIAA1462、KIAA1524、KIAA1715、KIAA1755、KIT、KLF17、KLRG1、KRT7、KRTAP1-1、KRTAP1-5、L3MBTL2、LAMB2P1、LGI2、LGR4、LHX9、LINC00472、LINC00570、LINC00578、LINC00607、LINC00678、LINC00702、LINC00886、LINC00961、LINC01011、LINC01118、LINC01204、LMOD1、LRBA、LRP4、LRRC32、LRRC39、LSAMP、LUM、LYPD1、LYRM1、MAFB、MAMDC2、MAN1A2、MAN2A1、MAPK13、MASP1、MB、MC4R、MEDAG、MEGF6、MEMO1、MIAT、MIR612、MLLT10、MMP10、MMP24、MMS19、MN1、MOXD1、MRVI1、MSH4、MTERF3、MXRA5、MYO1D、NA、NAALADL2、NAE1、NAGS、NDNF、NEURL1B、NGFR、NHLH1、NLN、NOTCH3、NOTUM、NOVA2、NOX4、NRROS、NTNG1、OCLN、OLR1、OSBPL10、OXCT2、PAIP2B、PAPD4、PBLD、PCM1、PDE1C、PDE5A、PDGFD、PDGFRB、PDS5B、PDXDC1、PEAR1、PEPD、PHACTR3、PI4K2B、PIK3R1、PIM2、PITPNB、PITPNM3、PLAU、PLEK2、PLEKHA6、PLEKHH2、PLXNC1、PMS1、PODN、POLN、POLR1A、POSTN、PPM1E、PPP3CA、PRKCA、PRKDC、PRKG1、PRPH2、PRRG4、PRUNE2、PSMD6-AS2、PTGIS、PTX3、RAB30、RAB38、RAB44、RAD9B、RARS、RBBP8、RBKS、RCC1、RDX、RFWD2、RFX3-AS1、RGCC、RNFT1、ROR1、ROR2、RWDD4、SCARNA9、SCO1、SEC22A、SHROOM3、SIGLEC10、SLC24A3、SLC35F3、SLC39A10、SLC46A2、SLC4A11、SLC6A15、SLC7A11、SLC9A3、SLIT3、SMG1P3、SMTN、SMYD3、SNED1、SORBS2、SORCS2、SOX7、SPDYA、SPEF2、SQRDL、STAC2、STAT1、STAT4、STEAP2、STK32B、STRN4、STS、STXBP6、SULF1、SVEP1、SYNGR2、SYNPO、SYNPO2、SYNPO2L、TAGLN3、TANGO6、TARBP1、TEX21P、TGFA、TGFB2、TGFB3、TGM2、THADA、THBS2、THRB、TMEM102、TMEM119、TMEM256-PLSCR3、TMEM50B、TNC、TNFAIP8L3、TNFRSF14、TNRC18P1、TNS3、TNXB、TP53AIP1、TPRG1、TRAF3、TRIM66、TRPC4、TSHZ2、TSPAN11、TSPAN18、TSPAN7、TSSK3、TXNIP、UNC5B、USP27X、UVRAG、VIM-AS1、VPS41、VSTM2L、VWA8、VWF、WDR91、WISP1、WNT10B、XRN2、YDJC、ZBTB26、ZCCHC5、ZFP82、ZMIZ1-AS1、ZNF212、ZNF350、ZNF660、ZNF79和ZNF837。
在本文所述的另一特定方面,所述基因或所述RNA转录物是从选自以下的基因转录的:ABCA10、ACTA2、ADAL、ADAMTS1、ADAMTS5、ADD1、ADGRG6、ADH6、ADHFE1、AFF3、AKAP3、ANK1、ANK3、ANKRD33B、AP4B1-AS1、ARHGEF16、ARID5B、ARL9、ASIC1、ATP2A3、B3GALT2、B3GNT6、BCL2L15、BCYRN1、BIN3-IT1、BIRC3、BTG2、C10orf54、C11orf70、C11orf94、C12orf56、C19orf47、C3、C7orf31、C8orf34、CA13、CA3、CACNA2D2、CACNB1、CADM1、CAND2、CCDC79、CCER2、CCNF、CELSR1、CEMIP、CEP170、CFH、CIITA、CLDN23、CMAHP、CNGA4、CNTD1、COL11A1、COL14A1、COL15A1、COL5A1、COL5A3、COL6A6、COL8A1、COLEC12、COMP、CPA4、CPQ、CRISPLD2、CRLF1、CRYL1、CYB5R2、CYGB、CYP1B1、DCLK1、DCN、DDIT4L、DDX50、DEGS1、DEPTOR、DFNB59、DIRAS3、DLG5、DNAH8、DNAJC27、DOCK11、DYNC1I1、DZIP1L、EFEMP1、EGR3、ELN、ELP4、EMX2OS、ENPP1、ERCC8、ESM1、EVC2、F2R、FAM160A1、FAM20A、FAM46B、FAM65B、FAP、FARP1、FBLN2、FBN2、FBXO9、FCHO1、FGFR2、FGL2、FLT1、FRAS1、FSCN2、GAL3ST4、GALNT15、GATA6、GBGT1、GCNT1、GDF6、GNAQ、GPR183、GPR50、GPRC5A、GPRC5B、GRTP1、GUCA1B、GXYLT1、HAPLN1、HAPLN2、HAS3、HAVCR2、HDAC5、HECTD2-AS1、HEPH、HEY1、HMGN3-AS1、HOOK3、HSPA1L、HTATIP2、IGDCC4、IGF2R、IGFBP3、IL16、INA、INTU、IQCG、ITGA11、ITGA8、ITGB8、ITIH1、ITPKA、KCNS1、KCNS2、KDM6A、KDSR、KIAA1456、KIAA1462、KIAA1755、KIT、KLF17、KLRG1、KRT7、KRTAP1-1、KRTAP1-5、L3MBTL2、LAMB2P1、LGI2、LGR4、LHX9、LINC00472、LINC00570、LINC00578、LINC00607、LINC00678、LINC00702、LINC00886、LINC00961、LINC01011、LINC01118、LINC01204、LMOD1、LRBA、LRP4、LRRC32、LRRC39、LSAMP、LUM、LYPD1、MAFB、MAMDC2、MAN2A1、MAPK13、MASP1、MB、MC4R、MEGF6、MIAT、MIR612、MLLT10、MMP10、MMP24、MN1、MOXD1、MRVI1、MSH4、MTERF3、MXRA5、NA、NAALADL2、NAE1、NAGS、NDNF、NGFR、NHLH1、NLN、NOTCH3、NOTUM、NOVA2、NOX4、NRROS、OCLN、OLR1、OSBPL10、OXCT2、PAIP2B、PBLD、PDE1C、PDE5A、PDGFD、PDGFRB、PDS5B、PEAR1、PHACTR3、PI4K2B、PIK3R1、PIM2、PITPNM3、PLEK2、PLEKHA6、PLEKHH2、PODN、POLN、POLR1A、PPM1E、PPP3CA、PRKCA、PRKG1、PRPH2、PRRG4、PRUNE2、PSMD6-AS2、PTGIS、PTX3、RAB30、RAB38、RAB44、RAD9B、RARS、RBBP8、RBKS、RDX、RFX3-AS1、RGCC、ROR1、ROR2、SCARNA9、SHROOM3、SIGLEC10、SLC24A3、SLC35F3、SLC39A10、SLC46A2、SLC4A11、SLC6A15、SLC7A11、SLC9A3、SLIT3、SMG1P3、SMTN、SNED1、SORBS2、SORCS2、SOX7、SPDYA、SPEF2、STAC2、STAT4、STK32B、STRN4、STS、STXBP6、SULF1、SVEP1、SYNGR2、SYNPO、SYNPO2、SYNPO2L、TAGLN3、TANGO6、TEX21P、TGFA、TGFB2、TGFB3、TGM2、THBS2、TMEM102、TMEM119、TMEM256-PLSCR3、TMEM50B、TNFAIP8L3、TNFRSF14、TNRC18P1、TNXB、TP53AIP1、TPRG1、TRIM66、TRPC4、TSHZ2、TSPAN11、TSPAN18、TSPAN7、TSSK3、TXNIP、USP27X、UVRAG、VIM-AS1、VPS41、VSTM2L、VWF、WDR91、WISP1、WNT10B、YDJC、ZBTB26、ZCCHC5、ZFP82、ZMIZ1-AS1、ZNF212、ZNF350、ZNF660、ZNF79和ZNF837。
在本文所述的另一特定方面,所述基因或所述RNA转录物是从选自以下的基因转录的:ABCB8、ABCC3、ADAM17、ADCY3、AGPAT4、ANKRA2、ANXA11、APIP、APLP2、ARHGAP1、ARL15、ASAP1、ASPH、ATAD2B、ATXN1、AXIN1、BECN1、BHMT2、BICD1、BTN3A1、C11orf30、C11orf73、C12orf4、C14orf132、C8orf44、C8orf44-SGK3、C8orf88、CASC3、CASP7、CCDC122、CDH13、CECR7、CENPI、CEP112、CEP192、CHEK1、CMAHP、CNRIP1、COPS7B、CPSF4、CRISPLD2、CRYBG3、CSNK1E、CSNK1G1、DAGLB、DCAF17、DCUN1D4、DDX42、DENND1A、DENND5A、DGKA、DHFR、DIAPH3、DLGAP4、DNAJC13、DNMBP、DOCK1、DYRK1A、EIF2B3、ENAH、ENOX1、EP300、ERC1、ERCC1、ERGIC3、ERLIN2、ERRFI1、EVC、FAF1、FAIM、FAM126A、FAM13A、FAM162A、FAM174A、FAM198B、FBN2、FER、FHOD3、FOCAD、GALC、GCFC2、GGACT、GGCT、GLCE、GOLGA4、GOLGB1、GPSM2、GULP1、GXYLT1、HAT1、HDX、HLTF、HMGA2、HNMT、HPS1、HSD17B12、HSD17B4、HTT、IFT57、INPP5K、IVD、KDM6A、KIAA1524、KIAA1715、LETM2、LOC400927、LRRC42、LUC7L3、LYRM1、MADD、MB21D2、MCM10、MED13L、MEDAG、MEMO1、MFN2、MMS19、MRPL45、MRPS28、MTERF3、MYCBP2、MYLK、MYOF、NGF、NREP、NSUN4、NT5C2、OSMR、OXCT1、PAPD4、PCM1、PDE7A、PDS5B、PDXDC1、PIGN、PIK3CD、PIK3R1、PIKFYVE、PITPNB、PLEKHA1、PLSCR1、PMS1、POMT2、PPARG、PPHLN1、PPIP5K2、PPP1R26、PRPF31、PRSS23、PRUNE2、PSMA4、PXK、RAF1、RAP1A、RAPGEF1、RARS2、RBKS、RERE、RFWD2、RNFT1、RPA1、RPS10、RPS6KB2、SAMD4A、SAR1A、SCO1、SEC24A、SENP6、SERGEF、SGK3、SH3YL1、SKA2、SLC12A2、SLC25A17、SLC44A2、SMYD3、SNAP23、SNHG16、SNX7、SOS2、SPATA18、SPATA5、SPIDR、SPRYD7、SRGAP1、SRRM1、STAT1、STRN3、STXBP6、SUPT20H、TAF2、TASP1、TBC1D15、TCF12、TCF4、TIAM1、TJP2、TMC3、TMEM189-UBE2V1、TMEM214、TNRC6A、TNS3、TOE1、TRAF3、TRIM65、TSPAN2、TTC7B、TUBE1、TYW5、UBAP2L、UBE2V1、URGCP、VAV2、VPS29、WDR27、WDR37、WDR91、WNK1、XRN2、ZCCHC8、ZFP82、ZNF138、ZNF232、ZNF37BP和ZNF680。
在本文所述的另一特定方面,所述基因或所述RNA转录物是从选自以下的基因转录的:ABCB8、ABCC3、ADCY3、AGPAT4、ANKRA2、APIP、ARHGAP1、ARL15、ATXN1、BECN1、BHMT2、BTN3A1、C12orf4、C14orf132、C8orf44、C8orf44-SGK3、C8orf88、CASP7、CCDC122、CECR7、CENPI、CEP112、CEP192、CHEK1、CMAHP、CNRIP1、CPSF4、CRISPLD2、CRYBG3、CSNK1E、CSNK1G1、DAGLB、DCAF17、DLGAP4、DNAJC13、DNMBP、DYRK1A、ENAH、EP300、ERCC1、ERLIN2、ERRFI1、EVC、FAIM、FAM126A、FAM13A、FAM162A、FAM174A、FBN2、GGACT、GLCE、GULP1、GXYLT1、HDX、HMGA2、HNMT、HPS1、IFT57、INPP5K、IVD、KDM6A、LETM2、LOC400927、LRRC42、LYRM1、MB21D2、MCM10、MED13L、MFN2、MRPL45、MRPS28、MTERF3、MYCBP2、NGF、OXCT1、PDS5B、PIGN、PIK3CD、PIK3R1、PIKFYVE、PLEKHA1、PLSCR1、POMT2、PPARG、PPIP5K2、PPP1R26、PRPF31、PRUNE2、PXK、RAF1、RAPGEF1、RARS2、RBKS、RERE、RPA1、RPS10、RPS6KB2、SAMD4A、SEC24A、SENP6、SERGEF、SGK3、SH3YL1、SKA2、SLC12A2、SLC44A2、SNX7、SPATA18、SPATA5、SPIDR、SPRYD7、SRGAP1、SRRM1、STXBP6、TASP1、TCF12、TCF4、TIAM1、TMC3、TMEM189-UBE2V1、TMEM214、TNRC6A、TTC7B、TUBE1、TYW5、URGCP、VAV2、WDR27、WDR91、WNK1、ZCCHC8、ZFP82、ZNF138、ZNF232和ZNF680。
在本文所述的另一特定方面,所述基因或所述RNA转录物是从选自以下的基因转录的:ABHD10、ADAL、ADAM17、ADAM23、ADAMTS19、AGPAT4、AGPS、AKAP8L、AKT1、ANKRD13C、ANXA11、APIP、APPL2、ARHGAP1、ARHGAP5、ARL15、ARL5B、ARSJ、ASAP1、ATF6、BECN1、BHMT2、BIN3、BNC2、BTBD10、C1QTNF9B-AS1、C1orf27、C11orf30、C11orf73、C11orf76、C12orf4、C2orf47、CACNB1、CACNB4、CADM2、CCNL2、CDH18、CENPI、CEP162、CEP170、CEP192、CEP57、CHEK1、CHRM2、CMAHP、CMSS1、CNOT7、CNRIP1、CNTN1、COPS7B、CRISPLD2、CRYBG3、CUX1、DAAM1、DCAF17、DCUN1D4、DDX42、DENND1A、DENND4A、DENND5A、DET1、DGK1、DHFR、DIAPH3、DLG5、DMXL1、DNAJA4、DNMBP、DYRK1A、DZIP1L、ELMO2、ENAH、ENOX1、EP300、ERC1、ERC2、EVC、EXOC3、EXOC6B、FAM162A、FAM174A、FAM195B、FAM208B、FAM49B、FAM69B、FBN2、FBXL16、FBXO9、FGD4、FHOD3、GALC、GBP1、GLCE、GNG12、GOLGB1、GTSF1、GXYLT1、HDAC5、HDX、HMGXB4、HOXB3、HSD17B4、HTT、IFT57、IKBKAP、INO80、IPP4B、INVS、ITCH、IVD、KDM6A、KDSR、KIAA1524、KIAA1715、KIDINS220、KIF21A、L3MBTL2、LGALS3、LINCR-0002、LINGO2、LOC400927、LPHN1、LRRC1、LRRC42、LYRM1、MACROD2、MANEA、MAPK10、MARCH7、MARCH8、MDN1、MEAF6、MEMO1、MFN2、MLLT10、MMS19、MORF4L1、MRPL39、MRPL45、MRPS28、MTMR3、MYB、MYCBP2、MYLK、NEDD4、NFASC、NGF、NIPA1、NLGN1、NLN、NREP、NSUN4、NUPL1、OSBPL3、PAPD4、PBX3、PCDH10、PDE3A、PDE7A、PDXDC1、PDXDC2P、PELI1、PIGN、PITPNB、PMS1、PNISR、POMT2、PPARG、PPFIBP1、PRPF31、PSMA4、PXK、RAB23、RAF1、RAPGEF1、RASIP1、RBBP8、RCOR3、RERE、RGL1、RNF130、RNF144A、RNF213、RPF2、RPS10、SAMD4A、SCO1、SENP6、SF3B3、SGIP1、SGMS1、SGPL1、SH2B3、SKP1、SLC12A2、SLC25A16、SLC25A17、SMOX、SNAP23、SNX24、SNX7、SOCS6、SOGA2、SORCS1、SPIDR、SPRYD7、SREK1、SSBP1、STRAD8、STXBP4、STXBP6、SUPT20H、TAF2、TARBP1、TASP1、TBCA、TBL1XR1、TCF4、TEKT4P2、TET1、TIAM1、TJAP1、TJP2、TMEM214、TMX3、TNRC6A、TRAF3、TRIM65、TSPAN7、TXNL4B、UBE2D3、UBE2L3、UBN2、UNC13B、URGCP-MRPS24、UVRAG、VDAC2、WDR27、WDR90、WHSC2、WNK1、XRN2、ZFP82、ZMIZ2、ZNF138、ZNF208、ZNF212、ZNF280D、ZNF350、ZNF37BP、ZNF426、ZNF618、ZNF680、ZNF730、ZNF777、ZNF7804A、ZNF836和ZSCAN25。
在本文所述的另一特定方面,所述基因或所述RNA转录物是从选自以下的基因转录的:APOA2、ASAP1、BRCA1、BRCA2、CDKN1C、CRX、CTRC、DENND5A、DIAPH3、DMD、DNAH11、EIF2B3、GALC、HPS1、HTT、IKBKAP、KIAA1524、LMNA、MECP2、PAPD4、PAX6、PCCB、PITPNB、PTCH1、SLC34A3、SMN2、SPINK5、SREK1、TMEM67、VWF、XDH和XRN2。
在本文所述的另一特定方面,所述基因或所述RNA转录物是从选自以下的基因转录的:ABCA1、ABCA10、ABCB7、ABCB8、ABCC1、ABCC3、ABL2、ABLIM3、ACACA、ACADVL、ACAT2、ACTA2、ADAL、ADAM15、ADAM17、ADAM23、ADAM33、ADAMTS1、ADAMTS19、ADCY3、ADD1、ADGRG6、ADH6、ADHFE1、AFF2、AFF3、AGK、AGPAT3、AGPAT4、AGPS、AHCYL2、AHDC1、AHRR、AJUBA、AK021888、AK310472、AKAP1、AKAP3、AKAP8L、AKAP9、AKNA、ALCAM、ALDH4A1、AMPD2、ANK1、ANK2、ANK3、ANKFY1、ANKHD1-EIF4EBP3、ANKRA2、ANKRD13C、ANKRD17、ANKRD33B、ANKRD36、ANKS6、ANP32A、ANXA6、AP2B1、AP4B1-AS1、APAF1、APIP、APOA2、APP、APTX、ARHGAP1、ARHGAP12、ARHGAP22、ARHGAP5、ARHGEF16、ARID1A、ARID2、ARID5B、ARL9、ARL15、ARL5B、ARMCX3、ARSJ、ASAP1、ASIC1、ASL、ASNS、ASPH、ATAD2B、ATF6、ATF7IP、ATG9A、ATMIN、ATP2A3、ATP2C1、ATXN1、ATXN3、AURKA、B3GALT2、B3GNT6、B4GALT2、BACE1、BAG2、BASP1、BC033281、BCAR3、BCL2L15、BCYRN1、BECN1、BEND6、BHMT2、BICD1、BIN1、BIN3、BIN3-IT1、BIRC3、BIRC6、BNC1、BNC2、BRCA1、BRCA2、BRD2、BRPF1、BSCL2、BTBD10、BTG2、BTN3A1、BZW1、C1QTNF9B-AS1、C1orf27、C1orf86、C10orf54、C11orf30、C11orf70、C11orf73、C11orf76、C11orf94、C12orf4、C12orf56、C14orf132、C17orf76-AS1、C19orf47、C2orf47、C3、C4orf27、C5orf24、C6orf48、C7orf31、C8orf34、C8orf44、C8orf44-SGK3、C8orf88、C9orf69、CA13、CA3、CAB39、CACNA2D2、CACNB1、CACNB4、CADM1、CADM2、CALU、CAMKK1、CAND2、CAPNS1、CASC3、CASP7、CASP8AP2、CAV1、CCAR1、CCDC77、CCDC79、CCDC88A、CCDC92、CCDC122、CCER2、CCNF、CCNL2、CCT6A、CD276、CD46、CDC25B、CDC40、CDC42BPA、CDCA7、CDH11、CDH13、CDH18、CDK11B、CDK16、CDKAL1、CDKN1C、CECR7、CELSR1、CEMIP、CENPI、CEP112、CEP162、CEP170、CEP192、CEP68、CFH、CFLAR、CHD8、CHEK1、CHRM2、CIITA、CIZ1、CLDN23、CLIC1、CLK4、CLTA、CMAHP、CNGA4、CNOT1、CNRIP1、CNTD1、CMSS1、CNOT7、CNRIP1、CNTN1、COG1、COL1A1、COL11A1、COL12A1、COL14A1、COL15A1、COL5A1、COL5A3、COL6A1、COL6A6、COL8A1、COLEC12、COMP、COPS7B、CPA4、CPEB2、CPQ、CPSF4、CREB5、CRISPLD2、CRLF1、CRLS1、CRTAP、CRX、CRYBG3、CRYL1、CSDE1、CSNK1A1、CSNK1E、CSNK1G1、CTDSP2、CTNND1、CTRC、CUL2、CUL4A、CUX1、CYB5B、CYB5R2、CYBRD1、CYGB、CYP1B1、CYP51A1、DAAM1、DAB2、DACT1、DAGLB、DARS、DAXX、DCAF10、DCAF11、DCAF17、DCBLD2、DCLK1、DCN、DCUN1D4、DDAH1、DDAH2、DDHD2、DDIT4L、DDR1、DDX39B、DDX42、DDX50、DEGS1、DENND1A、DENND1B、DENND4A、DENND5A、DEPTOR、DET1、DFNB59、DGCR2、DGK1、DGKA、DHCR24、DHCR7、DHFR、DHX9、DIAPH1、DIAPH3、DIRAS3、DIS3L、DKFZp434M1735、DKK3、DLC1、DLG5、DMD、DMXL1、DNAH8、DNAH11、DNAJA4、DNAJC13、DNAJC27、DNM2、DNMBP、DOCK1、DOCK11、DPP8、DSEL、DST、DSTN、DYNC1I1、DYRK1A、DZIP1L、EBF1、EEA1、EEF1A1、EFCAB14、EFEMP1、EGR1、EGR3、EHMT2、EIF2B3、EIF4G1、EIF4G2、EIF4G3、ELF2、ELMO2、ELN、ELP4、EMX2OS、ENAH、ENG、ENOX1、ENPP1、ENPP2、ENSA、EP300、EPT1、ERC1、ERC2、ERCC1、ERCC8、ERLIN2、ERRFI1、ESM1、ETV5、EVC、EVC2、EXO1、EXOC3、EXOC6B、EXTL2、EYA3、F2R、FADS1、FADS2、FAF1、FAIM、FAM111A、FAM126A、FAM13A、FAM160A1、FAM162A、FAM174A、FAM195B、FAM198B、FAM20A、FAM208B、FAM219A、FAM219B、FAM3C、FAM46B、FAM49B、FAM65A、FAM65B、FAM69B、FAP、FARP1、FBLN2、FBN2、FBXL16、FBXL6、FBXO9、FBXO10、FBXO18、FBXO31、FBXO34、FBXO9、FCHO1、FDFT1、FDPS、FER、FEZ1、FGD4、FGD5-AS1、FGFR2、FGFRL1、FGL2、FHOD3、FLII、FLNB、FLT1、FN1、FNBP1、FOCAD、FOS、FOSB、FOSL1、FOXK1、FRAS1、FSCN2、FUS、FYN、GABPB1、GAL3ST4、GALC、GALNT1、GALNT15、GAS7、GATA6、GBA2、GBGT1、GBP1、GCFC2、GLCE、GCNT1、GDF6、GGACT、GHDC、GIGYF2、GJC1、GLCE、GMIP、GNA13、GNAQ、GNAS、GNG12、GNL3L、GOLGA2、GOLGA4、GOLGB1、GORASP1、GPR1、GPR183、GPR50、GPR89A、GPRC5A、GPRC5B、GPSM2、GREM1、GRK6、GRTP1、GSE1、GTF2H2B、GTSF1、GUCA1B、GULP1、GXYLT1、HAPLN1、HAPLN2、HAS2、HAS3、HAT1、HAUS3、HAUS6、HAVCR2、HDAC5、HDAC7、HDX、HECTD2-AS1、HEG1、HEPH、HEY1、HLA-A、HLA-E、HLTF、HMGA1、HMGA2、HMGB1、HMGCR、HMGN3-AS1、HMGCS1、HMGXB4、HOOK3、HOXB3、HMOX1、HNMT、HNRNPR、HNRNPUL1、HP1BP3、HPS1、HRH1、HSD17B12、HSPA1L、HTATIP2、HTT、IARS、IDH1、IDI1、IFT57、IGDCC4、IGF2BP2、IGF2R、IGFBP3、IKBKAP、IL16、IL6ST、INA、INHBA、INO80、IPP4B、INPP5K、INSIG1、INTU、INVS、IQCE、IQCG、ITCH、ITGA11、ITGA8、ITGAV、ITGB5、ITGB8、ITIH1、ITM2C、ITPKA、ITSN1、IVD、KANSL3、KAT6B、KCNK2、KCNS1、KCNS2、KDM6A、KDSR、KIAA1033、KIAA1143、KIAA1199、KIAA1456、KIAA1462、KIAA1522、KIAA1524、KIAA1549、KIAA1715、KIAA1755、KIDINS220、KIF14、KIF2A、KIF21A、KIF3A、KIT、KLC1、KLC2、KLF17、KLF6、KLHL7、KLRG1、KMT2D、KRT7、KRT18、KRT19、KRT34、KRTAP1-1、KRTAP1-5、KRTAP2-3、L3MBTL2、LAMA2、LAMB1、LAMB2P1、LARP4、LATS2、LDLR、LEMD3、LETM2、LGALS3、LGALS8、LGI2、LGR4、LHX9、LIMS1、LINC00341、LINC00472、LINC00570、LINC00578、LINC00607、LINC00657、LINC00678、LINC00702、LINC00886、LINC00961、LINC01011、LINC01118、LINC01204、LINCR-0002、LINGO2、LMAN2L、LMNA、LMO7、LMOD1、LOC400927、LONP1、LOX、LPHN1、LRBA、LRCH4、LRIG1、LRP4、LRP8、LRRC1、LRRC32、LRRC39、LRRC8A、LSAMP、LSS、LTBR、LUC7L2、LUM、LYPD1、LYRM1、LZTS2、MACROD2、MAFB、MAGED4、MAGED4B、MAMDC2、MAN1A2、MAN2A1、MAN2C1、MANEA、MAP4K4、MAPK10、MAPK13、MARCH7、MARCH8、MASP1、MB、MB21D2、MBD1、MBOAT7、MC4R、MCM10、MDM2、MDN1、MEAF6、MECP2、MED1、MED13L、MEDAG、MEF2D、MEGF6、MEIS2、MEMO1、MEPCE、MFGE8、MFN2、MIAT、MICAL2、MINPP1、MIR612、MKL1、MKLN1、MKNK2、MLLT4、MLLT10、MLST8、MMAB、MMP10、MMP24、MMS19、MMS22L、MN1、MORF4L1、MOXD1、MPPE1、MPZL1、MRPL3、MRPL45、MRPL55、MRPS28、MRVI1、MSANTD3、MSC、MSH2、MSH4、MSH6、MSL3、MSMO1、MSRB3、MTAP、MTERF3、MTERFD1、MTHFD1L、MTMR3、MTMR9、MTRR、MUM1、MVD、MVK、MXRA5、MYADM、MYB、MYCBP2、MYLK、MYO1D、MYO9B、MYOF、NA、NAA35、NAALADL2、NADK、NAE1、NAGS、NASP、NAV1、NAV2、NCOA1、NCOA3、NCOA4、NCSTN、NDNF、NEDD4、NELFA、NEO1、NEURL1B、NF2、NFASC、NFE2L1、NFX1、NGF、NGFR、NHLH1、NID1、NID2、NIPA1、NKX3-1、NLGN1、NLN、NOL10、NOMO3、NOTCH3、NOTUM、NOVA2、NOX4、NPEPPS、NRD1、NREP、NRG1、NRROS、NSUN4、NT5C2、NT5E、NTNG1、NUDT4、NUP153、NUP35、NUP50、NUPL1、NUSAP1、OCLN、ODF2、OLR1、OS9、OSBPL3、OSBPL6、OSBPL10、OSMR、OXCT1、OXCT2、P4HA1、P4HB、PABPC1、PAIP2B、PAK4、PAPD4、PARD3、PARN、PARP14、PARP4、PARVB、PAX6、PBLD、PBX3、PCBP2、PCCB、PCDH10、PCDHGB3、PCGF3、PCM1、PCMTD2、PCNXL2、PCSK9、PDE1C、PDE3A、PDE4A、PDE5A、PDE7A、PDGFD、PDGFRB、PDLIM7、PDS5B、PDXDC1、PDXDC2P、PEAR1、PELI1、PEPD、PEX5、PFKP、PHACTR3、PHF19、PHF8、PHRF1、PHTF2、PI4K2A、PIEZO1、PIGN、PIGU、PIK3C2B、PIK3CD、PIK3R1、PIKFYVE、PIM2、PITPNA、PITPNB、PITPNM1、PITPNM3、PLAU、PLEC、PLEK2、PLEKHA1、PLEKHA6、PLEKHB2、PLEKHH2、PLSCR1、PLSCR3、PLXNB2、PLXNC1、PMS1、PNISR、PODN、POLE3、POLN、POLR1A、POLR3D、POMT2、POSTN、POU2F1、PPAPDC1A、PPARA、PPARG、PPFIBP1、PPIP5K1、PPIP5K2、PPM1E、PPP1R12A、PPP1R26、PPP3CA、PPP6R1、PPP6R2、PRKCA、PRKDC、PRKG1、PRMT1、PRNP、PRPF31、PRPH2、PRRG4、PRSS23、PRUNE2、PSMA4、PSMC1、PSMD6、PSMD6-AS2、PTCH1、PTGIS、PTK2B、PTPN14、PTX3、PUF60、PUS7、PVR、PXK、PXN、QKI、RAB2B、RAB30、RAB34、RAB38、RAB44、RAD1、RAD9B、RAD23B、RAF1、RALB、RAP1GDS1、RAPGEF1、RARG、RARS、RARS2、RASIP1、RASSF8、RBBP8、RBCK1、RCOR3、RBFOX2、RBKS、RBM10、RDX、RERE、RFTN1、RFWD2、RFX3-AS1、RGCC、RGL1、RGS10、RGS3、RIF1、RNF14、RNF19A、RNF130、RNF144A、RNF213、RNF38、RNFT1、ROR1、ROR2、RPA1、RPF2、RPL10、RPS10、RPS6KB2、RPS6KC1、RRBP1、RWDD4、SAMD4A、SAMD9、SAMD9L、SAR1A、SART3、SCAF4、SCAF8、SCARNA9、SCD、SCLT1、SCO1、SDCBP、SEC14L1、SEC22A、SEC24A、SEC24B、SEC61A1、SENP6、SEPT9、SERGEF、SERPINE2、SF1、SF3B3、SGIP1、SGK3、SGMS1、SGOL2、SGPL1、SH2B3、SH3RF1、SH3YL1、SHROOM3、SIGLEC10、SKA2、SKIL、SKP1、SLC12A2、SLC24A3、SLC25A16、SLC25A17、SLC34A3、SLC35F3、SLC39A3、SLC39A10、SLC4A4、SLC4A11、SLC41A1、SLC44A2、SLC46A2、SLC6A15、SLC7A6、SLC7A8、SLC7A11、SLC9A3、SLIT3、SMARCA4、SMARCC2、SMC4、SMC6、SMCHD1、SMG1、SMG1P3、SMOX、SMPD4、SMTN、SMYD3、SMYD5、SNAP23、SNED1、SNHG16、SNX7、SNX14、SNX24、SNX7、SOCS2、SOCS6、SOGA2、SON、SORBS2、SORCS1、SORCS2、SOS2、SOX7、SPATA18、SPATA20、SPATA5、SPATS2、SPDYA、SPEF2、SPG20、SPIDR、SPINK5、SPRED2、SPRYD7、SQLE、SQRDL、SQSTM1、SRCAP、SREBF1、SRGAP1、SRRM1、SRSF3、SSBP1、STAC2、STARD4、STAT1、STAT3、STAT4、STAU1、STC2、STEAP2、STK32B、STRAD8、STRIP1、STRN4、STS、STX16、STXBP4、STXBP6、SULF1、SUPT20H、SVEP1、SYNE1、SYNE2、SYNGR2、SYNPO、SYNPO2、SYNPO2L、SYT15、SYTL2、TACC1、TAF2、TAGLN3、TANC2、TANGO6、TARBP1、TARS、TASP1、TBC1D15、TBCA、TBL1XR1、TBL2、TCF12、TCF4、TCF7L2、TEKT4P2、TENC1、TENM2、TEP1、TET1、TET3、TEX21P、TFCP2、TGFA、TGFB2、TGFB3、TGFBI、TGFBR1、TGFBRAP1、TGM2、THADA、THAP4、THBS2、THRB、TIAM1、TIMP2、TJAP1、TJP2、TLE3、TLK1、TMC3、TMEM67、TMEM102、TMEM119、TMEM134、TMEM154、TMEM189-UBE2V1、TMEM214、TMEM256-PLSCR3、TMEM47、TMEM50B、TMEM63A、TMX3、TNC、TNFAIP3、TNFAIP8L3、TNFRSF12A、TNFRSF14、TNIP1、TNKS1BP1、TNPO3、TNRC18P1、TNS1、TNS3、TNXB、TOE1、TOMM40、TOMM5、TOPORS、TP53AIP1、TP53INP1、TPRG1、TRAF3、TRAK1、TRAPPC12、TRIB1、TRIM2、TRIM23、TRIM26、TRIM28、TRIM65、TRIM66、TRMT1L、TRPC4、TRPS1、TSC2、TSHZ1、TSHZ2、TSPAN11、TSPAN18、TSPAN2、TSPAN7、TSSK3、TTC7A、TTC7B、TUBB2C、TUBB3、TUBE1、TXNIP、TXNL1、TXNL4B、TXNRD1、TYW5、U2SURP、UBAP2L、UBE2D3、UBE2G2、UBE2L3、UBE2V1、UBN2、UBQLN4、UCHL5、UHMK1、UHRF1BP1L、UNC13B、UNC5B、URGCP、URGCP-MRPS24、USP19、USP7、USP27X、UVRAG、VANGL1、VARS2、VAV2、VCL、VDAC2、VIM-AS1、VIPAS39、VPS13A、VPS29、VPS41、VPS51、VSTM2L、VWA8、VWF、WDR19、WDR27、WDR37、WDR48、WDR90、WDR91、WHSC2、WIPF1、WISP1、WNK1、WNT5B、WNT10B、WSB1、WWTR1、XDH、XIAP、XRN2、YAP1、YDJC、YES1、YPEL5、YTHDF3、Z24749、ZAK、ZBTB10、ZBTB24、ZBTB26、ZBTB7A、ZC3H12C、ZC3H14、ZC3H18、ZCCHC5、ZCCHC8、ZCCHC11、ZEB1、ZEB2、ZFAND1、ZFAND5、ZFP82、ZHX3、ZMIZ1、ZMIZ1-AS1、ZMIZ2、ZMYM2、ZNF12、ZNF138、ZNF148、ZNF208、ZNF212、ZNF219、ZNF227、ZNF232、ZNF24、ZNF268、ZNF28、ZNF280D、ZNF281、ZNF335、ZNF350、ZNF37A、ZNF37BP、ZNF395、ZNF426、ZNF431、ZNF583、ZNF618、ZNF621、ZNF652、ZNF655、ZNF660、ZNF674、ZNF680、ZNF730、ZNF74、ZNF764、ZNF777、ZNF778、ZNF780A、ZNF7804A、ZNF79、ZNF827、ZNF836、ZNF837、ZNF839、ZNF91和ZSCAN25。
在本文所述的另一特定方面,所述基因或所述RNA转录物不是从SMN2基因转录的。
在本文所述的另一特定方面,所述基因或所述RNA转录物不是从选自以下的基因转录的:ABHD10、ADAM12、AKT1、ANXA11、APLP2、APPL2、ARMCX6、ATG5、AXIN1、BAIAP2、CCNB1IP1、CCT7、CEP57、CSF1、DLGAP4、EPN1、ERGIC3、FOXM1、GGCT、GRAMD3、HSD17B4、LARP7、LRRC42、MADD、MAN1B1、MRPL39、PCBP4、PPHLN1、PRKACB、RAB23、RAP1A、RCC1、SREK1、STRN3和TNRC6A。
在本文所述的另一特定方面,所述基因或所述RNA转录物不是从选自以下的基因转录的:ABHD10、ADAM12、AKT1、ANXA11、APLP2、APPL2、ARMCX6、ATG5、AXIN1、BAIAP2、CCNB1IP1、CCT7、CEP57、CSF1、DLGAP4、EPN1、ERGIC3、FOXM1、GGCT、GRAMD3、HSD17B4、LARP7、LRRC42、MADD、MAN1B1、MRPL39、PCBP4、PPHLN1、PRKACB、RAB23、RAP1A、RCC1、SMN2、SREK1、STRN3和TNRC6A。
在本文所述的另一特定方面,所述基因或所述RNA转录物是从SMN2基因转录的。
在本文所述的另一特定方面,所述基因或所述RNA转录物是从选自以下的基因转录的:ABHD10、ADAM12、AKT1、ANXA11、APLP2、APPL2、ARMCX6、ATG5、AXIN1、BAIAP2、CCNB1IP1、CCT7、CEP57、CSF1、DLGAP4、EPN1、ERGIC3、FOXM1、GGCT、GRAMD3、HSD17B4、LARP7、LRRC42、MADD、MAN1B1、MRPL39、PCBP4、PPHLN1、PRKACB、RAB23、RAP1A、RCC1、SREK1、STRN3和TNRC6A。
在本文所述的另一特定方面,所述基因或所述RNA转录物是从选自以下的基因转录的:ABHD10、ADAM12、AKT1、ANXA11、APLP2、APPL2、ARMCX6、ATG5、AXIN1、BAIAP2、CCNB1IP1、CCT7、CEP57、CSF1、DLGAP4、EPN1、ERGIC3、FOXM1、GGCT、GRAMD3、HSD17B4、LARP7、LRRC42、MADD、MAN1B1、MRPL39、PCBP4、PPHLN1、PRKACB、RAB23、RAP1A、RCC1、SMN2、SREK1、STRN3和TNRC6A。
一方面,本文提供了调节由包含如上所述的人工基因构建体的细胞产生的蛋白的量和修饰由包含如上所述的人工基因构建体的细胞产生的蛋白的类型的方法,所述方法包括使细胞与式(I)的化合物或其形式接触,其中式(I)为:
Figure BDA0002383691000000931
或其形式,其中
W为CH=CH或S;
X为CH2、CH(C1-4烷基)、C(C1-4烷基)2、CH=CH、O、NR5或键;
A为芳基、杂芳基、杂环基或C9-10环烷基,
其中芳基选自苯基和萘基,其各自任选地被1、2、3或4个各自选自R1的取代基取代,
其中杂芳基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R1的取代基取代,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R2的取代基取代,和
其中C9-10环烷基为任选地被1、2、3、4或5个各自选自R2的取代基取代的饱和或部分不饱和二环环系;
B为杂环基,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或多环环系,其各自任选地被1、2、3、4或5个各自选自R4的取代基取代;
R1为卤素、羟基、氰基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、杂环基-C1-4烷氧基、苯基或苯基-C1-4烷氧基,
其中杂芳基为具有1、2或3个选自N、O和S的杂原子环成员的饱和单环或二环环系,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中苯基、杂芳基或杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R2为卤素、羟基、氰基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、羟基-C1-4烷基、C1-4烷氧基、C1-4烷氧基-羰基、C2-4烯基、C3-7环烷基或杂环基-C1-4烷基,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R3为卤素、羟基、硝基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、苯基或苯基-C1-4烷氧基;
R4独立地选自卤素、C1-4烷基、羟基-C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基或羟基-C1-4烷基-氨基;和
R5为氢、C1-4烷基或羟基-C1-4烷基;
其中化合物的形式选自其前药、盐、水合物、溶剂化物、包合物、同位素体、外消旋体、对映异构体、非对映异构体、立体异构体、多晶型物和互变异构体形式。
另一方面,本文提供了调节由包含如上所述的人工基因构建体的细胞产生的蛋白的量和修饰由包含如上所述的人工基因构建体的细胞产生的蛋白的类型的方法,所述方法包括使细胞与式(I)的化合物或其形式接触,其中式(I)选自式(Ia)和式(Ib)的化合物:
Figure BDA0002383691000000951
或其形式,其中
X为CH2、CH(C1-4烷基)、C(C1-4烷基)2、CH=CH、O、NR5或键;
A为芳基、杂芳基、杂环基或C9-10环烷基,
其中芳基选自苯基和萘基,其各自任选地被1、2、3或4个各自选自R1的取代基取代,
其中杂芳基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R1的取代基取代,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R2的取代基取代,和
其中C9-10环烷基为任选地被1、2、3、4或5个各自选自R2的取代基取代的饱和或部分不饱和二环环系;
B为杂环基,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或多环环系,其各自任选地被1、2、3、4或5个各自选自R4的取代基取代;
R1为卤素、羟基、氰基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、杂环基-C1-4烷氧基、苯基或苯基-C1-4烷氧基,
其中杂芳基为具有1、2或3个选自N、O和S的杂原子环成员的饱和单环或二环环系,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中苯基、杂芳基或杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R2为卤素、羟基、氰基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、氨基-羰基、羟基-C1-4烷基、C1-4烷氧基、C1-4烷氧基-羰基、C2-4烯基、C3-7环烷基或杂环基-C1-4烷基;
R3为卤素、羟基、硝基、氧代基、羟基-亚氨基、C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、苯基或苯基-C1-4烷氧基;
R4独立地选自卤素、C1-4烷基、羟基-C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基或羟基-C1-4烷基-氨基;和
R5为氢、C1-4烷基或羟基-C1-4烷基;
其中化合物的形式选自其前药、盐、水合物、溶剂化物、包合物、同位素体、外消旋体、对映异构体、非对映异构体、立体异构体、多晶型物和互变异构体形式。
在具体方面,在DNA的情况下,编码内含子REMS的核苷酸序列包含选自以下的序列:ANGAgtrngn(SEQ ID NO:1809)、CNGAgtrngn(SEQ ID NO:1810)、GNGAgtrngn(SEQ IDNO:1811)、TNGAgtrngn(SEQ ID NO:1812)、NAGAgtrngn(SEQ ID NO:1813)、NCGAgtrngn(SEQID NO:1814)、NGGAgtrngn(SEQ ID NO:1815)、NTGAgtrngn(SEQ ID NO:1816)、AAGAgtrngn(SEQ ID NO:1817)、ACGAgtrngn(SEQ ID NO:1818)、AGGAgtrngn(SEQ ID NO:1819)、ATGAgtrngn(SEQ ID NO:1820)、CAGAgtrngn(SEQ ID NO:1821)、CCGAgtrngn(SEQ ID NO:1822)、CGGAgtrngn(SEQ ID NO:1823)、CTGAgtrngn(SEQ ID NO:1824)、GAGAgtrngn(SEQ IDNO:1825)、GCGAgtrngn(SEQ ID NO:1826)、GGGAgtrngn(SEQ ID NO:1827)、GTGAgtrngn(SEQID NO:1828)、TAGAgtrngn(SEQ ID NO:1829)、TCGAgtrngn(SEQ ID NO:1830)、TGGAgtrngn(SEQ ID NO:1831)和TTGAgtrngn(SEQ ID NO:1832),其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸。在另一具体方面,在DNA的情况下,编码内含子REMS的核苷酸序列包含选自以下的序列:ANGAgtragt(SEQ ID NO:1833)、CNGAgtragt(SEQ ID NO:1834)、GNGAgtragt(SEQID NO:1835)、TNGAgtragt(SEQ ID NO:1836)、NAGAgtragt(SEQ ID NO:1837)、NCGAgtragt(SEQ ID NO:1838)、NGGAgtragt(SEQ ID NO:1839)、NTGAgtragt(SEQ ID NO:1840)、AAGAgtragt(SEQ ID NO:1841)、ACGAgtragt(SEQ ID NO:1842)、AGGAgtragt(SEQ ID NO:1843)、ATGAgtragt(SEQ ID NO:1844)、CAGAgtragt(SEQ ID NO:1845)、CCGAgtragt(SEQ IDNO:1846)、CGGAgtragt(SEQ ID NO:1847)、CTGAgtragt(SEQ ID NO:1848)、GAGAgtragt(SEQID NO:1849)、GCGAgtragt(SEQ ID NO:1850)、GGGAgtragt(SEQ ID NO:1851)、GTGAgtragt(SEQ ID NO:1852)、TAGAgtragt(SEQ ID NO:1853)、TCGAgtragt(SEQ ID NO:1854)、TGGAgtragt(SEQ ID NO:1855)和TTGAgtragt(SEQ ID NO:1856),其中r为腺嘌呤或鸟嘌呤,并且N为任何核苷酸。在本文提供的一个或多个方面,N为腺嘌呤或鸟嘌呤。在多个特定方面,编码内含子REMS的核苷酸序列是编码非内源内含子REMS的核苷酸序列,即包含在人工构建体的DNA序列中非天然存在的非内源内含子REMS的前体RNA转录物。
一方面,本文提供了用于修饰RNA剪接以产生具有iExon的成熟mRNA转录物的方法,所述方法包括使前体mRNA转录物与式(I)的化合物或其形式接触,其中所述前体mRNA转录物包含两个外显子和内含子,其中第一外显子在内含子的上游,并且第二外显子在内含子的下游,其中所述内含子按5’至3’顺序包含:第一5’剪接位点、第一分支点、第一3’剪接位点、剪接修饰剂的内含子识别元件(iREMS)、第二分支点和第二3’剪接位点,其中所述iREMS包含RNA序列GAgurngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,并且其中式(I)为:
Figure BDA0002383691000000981
或其形式,其中
W为CH=CH或S;
X为CH2、CH(C1-4烷基)、C(C1-4烷基)2、CH=CH、O、NR5或键;
A为芳基、杂芳基、杂环基或C9-10环烷基,
其中芳基选自苯基和萘基,其各自任选地被1、2、3或4个各自选自R1的取代基取代,
其中杂芳基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R1的取代基取代,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R2的取代基取代,和
其中C9-10环烷基为任选地被1、2、3、4或5个各自选自R2的取代基取代的饱和或部分不饱和二环环系;
B为杂环基,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或多环环系,其各自任选地被1、2、3、4或5个各自选自R4的取代基取代;
R1为卤素、羟基、氰基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、杂环基-C1-4烷氧基、苯基或苯基-C1-4烷氧基,
其中杂芳基为具有1、2或3个选自N、O和S的杂原子环成员的饱和单环或二环环系,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中苯基、杂芳基或杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R2为卤素、羟基、氰基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、羟基-C1-4烷基、C1-4烷氧基、C1-4烷氧基-羰基、C2-4烯基、C3-7环烷基或杂环基-C1-4烷基,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R3为卤素、羟基、硝基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、苯基或苯基-C1-4烷氧基;
R4独立地选自卤素、C1-4烷基、羟基-C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基或羟基-C1-4烷基-氨基;和
R5为氢、C1-4烷基或羟基-C1-4烷基;
其中化合物的形式选自其前药、盐、水合物、溶剂化物、包合物、同位素体、外消旋体、对映异构体、非对映异构体、立体异构体、多晶型物和互变异构体形式。
另一方面,本文提供了用于修饰RNA剪接以调节由前体mRNA转录物产生的成熟mRNA转录物的量的方法,所述方法包括使前体mRNA转录物与式(I)的化合物或其形式接触,其中所述前体mRNA转录物包含两个外显子和内含子,其中第一外显子在内含子的上游,并且第二外显子在内含子的下游,其中所述内含子包含RNA核苷酸序列,所述RNA核苷酸序列按5’至3’顺序包含:剪接修饰剂的内含子识别元件(iREMS)、分支点和3’剪接位点,其中所述iREMS包含RNA序列GAgurngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,并且其中式(I)为:
Figure BDA0002383691000001001
或其形式,其中
W为CH=CH或S;
X为CH2、CH(C1-4烷基)、C(C1-4烷基)2、CH=CH、O、NR5或键;
A为芳基、杂芳基、杂环基或C9-10环烷基,
其中芳基选自苯基和萘基,其各自任选地被1、2、3或4个各自选自R1的取代基取代,
其中杂芳基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R1的取代基取代,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R2的取代基取代,和
其中C9-10环烷基为任选地被1、2、3、4或5个各自选自R2的取代基取代的饱和或部分不饱和二环环系;
B为杂环基,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或多环环系,其各自任选地被1、2、3、4或5个各自选自R4的取代基取代;
R1为卤素、羟基、氰基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、杂环基-C1-4烷氧基、苯基或苯基-C1-4烷氧基,
其中杂芳基为具有1、2或3个选自N、O和S的杂原子环成员的饱和单环或二环环系,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中苯基、杂芳基或杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R2为卤素、羟基、氰基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、羟基-C1-4烷基、C1-4烷氧基、C1-4烷氧基-羰基、C2-4烯基、C3-7环烷基或杂环基-C1-4烷基,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R3为卤素、羟基、硝基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、苯基或苯基-C1-4烷氧基;
R4独立地选自卤素、C1-4烷基、羟基-C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基或羟基-C1-4烷基-氨基;和
R5为氢、C1-4烷基或羟基-C1-4烷基;
其中化合物的形式选自其前药、盐、水合物、溶剂化物、包合物、同位素体、外消旋体、对映异构体、非对映异构体、立体异构体、多晶型物和互变异构体形式。
在前述方面的特定方面,所述内含子按5’至3’顺序还包含:5’剪接位点、分支点和iREMS上游的3’剪接位点。
另一方面,本文提供了用于修饰RNA剪接以调节由前体mRNA转录物产生的成熟mRNA转录物的量的方法,所述方法包括使前体mRNA转录物与式(I)的化合物或其形式接触,其中所述前体mRNA转录物包含三个外显子和两个内含子,其中三个外显子和两个内含子按以下5’至3’的顺序为:第一外显子、第一内含子、第二外显子、第二内含子和第三外显子,其中所述第一内含子包含RNA核苷酸序列,所述RNA核苷酸序列按5’至3’顺序包含:第一5’剪接位点、第一分支点和第一3’剪接位点,其中所述第二内含子包含RNA核苷酸序列,所述RNA核苷酸序列按5’至3’顺序包含:第二5’剪接位点、剪接修饰剂的内含子识别元件(iREMS)、第二分支点和第二3’剪接位点,其中所述iREMS包含RNA序列GAgurngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,并且其中式(I)为:
Figure BDA0002383691000001021
或其形式,其中
W为CH=CH或S;
X为CH2、CH(C1-4烷基)、C(C1-4烷基)2、CH=CH、O、NR5或键;
A为芳基、杂芳基、杂环基或C9-10环烷基,
其中芳基选自苯基和萘基,其各自任选地被1、2、3或4个各自选自R1的取代基取代,
其中杂芳基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R1的取代基取代,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R2的取代基取代,和
其中C9-10环烷基为任选地被1、2、3、4或5个各自选自R2的取代基取代的饱和或部分不饱和二环环系;
B为杂环基,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或多环环系,其各自任选地被1、2、3、4或5个各自选自R4的取代基取代;
R1为卤素、羟基、氰基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、杂环基-C1-4烷氧基、苯基或苯基-C1-4烷氧基,
其中杂芳基为具有1、2或3个选自N、O和S的杂原子环成员的饱和单环或二环环系,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中苯基、杂芳基或杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R2为卤素、羟基、氰基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、羟基-C1-4烷基、C1-4烷氧基、C1-4烷氧基-羰基、C2-4烯基、C3-7环烷基或杂环基-C1-4烷基,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R3为卤素、羟基、硝基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、苯基或苯基-C1-4烷氧基;
R4独立地选自卤素、C1-4烷基、羟基-C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基或羟基-C1-4烷基-氨基;和
R5为氢、C1-4烷基或羟基-C1-4烷基;
其中化合物的形式选自其前药、盐、水合物、溶剂化物、包合物、同位素体、外消旋体、对映异构体、非对映异构体、立体异构体、多晶型物和互变异构体形式。
在一些方面,所述iREMS为内源iREMS。在其他方面,所述iREMS为非内源iREMS。
另一方面,本文提供了用于修饰RNA剪接以产生具有iExon的成熟mRNA转录物的方法,所述方法包括使前体mRNA转录物与式(I)的化合物或其形式接触,其中所述前体mRNA转录物包含两个外显子和内含子,其中第一外显子在内含子的上游,并且第二外显子在内含子的下游,其中所述内含子按5’至3’顺序包含:第一5’剪接位点、第一分支点、第一3’剪接位点、剪接修饰剂的内含子识别元件(iREMS)、第二分支点和第二3’剪接位点,其中所述iREMS包含RNA序列GAgurngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,其中所述前体mRNA转录物是选自本文表中所列基因的基因的前体mRNA转录物,并且其中式(I)为:
Figure BDA0002383691000001051
或其形式,其中
W为CH=CH或S;
X为CH2、CH(C1-4烷基)、C(C1-4烷基)2、CH=CH、O、NR5或键;
A为芳基、杂芳基、杂环基或C9-10环烷基,
其中芳基选自苯基和萘基,其各自任选地被1、2、3或4个各自选自R1的取代基取代,
其中杂芳基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R1的取代基取代,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R2的取代基取代,和
其中C9-10环烷基为任选地被1、2、3、4或5个各自选自R2的取代基取代的饱和或部分不饱和二环环系;
B为杂环基,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或多环环系,其各自任选地被1、2、3、4或5个各自选自R4的取代基取代;
R1为卤素、羟基、氰基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、杂环基-C1-4烷氧基、苯基或苯基-C1-4烷氧基,
其中杂芳基为具有1、2或3个选自N、O和S的杂原子环成员的饱和单环或二环环系,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中苯基、杂芳基或杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R2为卤素、羟基、氰基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、羟基-C1-4烷基、C1-4烷氧基、C1-4烷氧基-羰基、C2-4烯基、C3-7环烷基或杂环基-C1-4烷基,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R3为卤素、羟基、硝基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、苯基或苯基-C1-4烷氧基;
R4独立地选自卤素、C1-4烷基、羟基-C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基或羟基-C1-4烷基-氨基;和
R5为氢、C1-4烷基或羟基-C1-4烷基;
其中化合物的形式选自其前药、盐、水合物、溶剂化物、包合物、同位素体、外消旋体、对映异构体、非对映异构体、立体异构体、多晶型物和互变异构体形式。
另一方面,本文提供了用于修饰RNA剪接以调节由前体mRNA转录物产生的成熟mRNA转录物的量的方法,所述方法包括使前体mRNA转录物与式(I)的化合物或其形式接触,其中所述前体mRNA转录物包含两个外显子和内含子,其中第一外显子在内含子的上游,并且第二外显子在内含子的下游,其中所述内含子包含RNA核苷酸序列,所述RNA核苷酸序列按5’至3’顺序包含:剪接修饰剂的内含子识别元件(iREMS)、分支点和3’剪接位点,其中所述iREMS包含RNA序列GAgurngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,其中所述前体mRNA转录物是选自本文表中所列基因的基因的前体mRNA转录物,并且其中式(I)为:
Figure BDA0002383691000001071
或其形式,其中
W为CH=CH或S;
X为CH2、CH(C1-4烷基)、C(C1-4烷基)2、CH=CH、O、NR5或键;
A为芳基、杂芳基、杂环基或C9-10环烷基,
其中芳基选自苯基和萘基,其各自任选地被1、2、3或4个各自选自R1的取代基取代,
其中杂芳基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R1的取代基取代,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R2的取代基取代,和
其中C9-10环烷基为任选地被1、2、3、4或5个各自选自R2的取代基取代的饱和或部分不饱和二环环系;
B为杂环基,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或多环环系,其各自任选地被1、2、3、4或5个各自选自R4的取代基取代;
R1为卤素、羟基、氰基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、杂环基-C1-4烷氧基、苯基或苯基-C1-4烷氧基,
其中杂芳基为具有1、2或3个选自N、O和S的杂原子环成员的饱和单环或二环环系,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中苯基、杂芳基或杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R2为卤素、羟基、氰基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、羟基-C1-4烷基、C1-4烷氧基、C1-4烷氧基-羰基、C2-4烯基、C3-7环烷基或杂环基-C1-4烷基,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R3为卤素、羟基、硝基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、苯基或苯基-C1-4烷氧基;
R4独立地选自卤素、C1-4烷基、羟基-C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基或羟基-C1-4烷基-氨基;和
R5为氢、C1-4烷基或羟基-C1-4烷基;
其中化合物的形式选自其前药、盐、水合物、溶剂化物、包合物、同位素体、外消旋体、对映异构体、非对映异构体、立体异构体、多晶型物和互变异构体形式。
在前述方面的特定方面,所述内含子按5’至3’顺序还包含:5’剪接位点、分支点和iREMS上游的3’剪接位点。
另一方面,本文提供了用于修饰RNA剪接以调节由前体mRNA转录物产生的成熟mRNA转录物的量的方法,所述方法包括使前体mRNA转录物与式(I)的化合物或其形式接触,其中所述前体mRNA转录物包含三个外显子和两个内含子,其中三个外显子和两个内含子按以下5’至3’的顺序为:第一外显子、第一内含子、第二外显子、第二内含子和第三外显子,其中所述第一内含子包含RNA核苷酸序列,所述RNA核苷酸序列按5’至3’顺序包含:第一5’剪接位点、第一分支点和第一3’剪接位点,其中所述第二内含子包含RNA核苷酸序列,所述RNA核苷酸序列按5’至3’顺序包含:第二5’剪接位点、剪接修饰剂的内含子识别元件(iREMS)、第二分支点和第二3’剪接位点,其中所述iREMS包含RNA序列GAgurngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,其中所述前体mRNA转录物是选自本文表中所列基因的基因的前体mRNA转录物,并且其中式(I)为:
Figure BDA0002383691000001091
或其形式,其中
W为CH=CH或S;
X为CH2、CH(C1-4烷基)、C(C1-4烷基)2、CH=CH、O、NR5或键;
A为芳基、杂芳基、杂环基或C9-10环烷基,
其中芳基选自苯基和萘基,其各自任选地被1、2、3或4个各自选自R1的取代基取代,
其中杂芳基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R1的取代基取代,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R2的取代基取代,和
其中C9-10环烷基为任选地被1、2、3、4或5个各自选自R2的取代基取代的饱和或部分不饱和二环环系;
B为杂环基,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或多环环系,其各自任选地被1、2、3、4或5个各自选自R4的取代基取代;
R1为卤素、羟基、氰基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、杂环基-C1-4烷氧基、苯基或苯基-C1-4烷氧基,
其中杂芳基为具有1、2或3个选自N、O和S的杂原子环成员的饱和单环或二环环系,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中苯基、杂芳基或杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R2为卤素、羟基、氰基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、羟基-C1-4烷基、C1-4烷氧基、C1-4烷氧基-羰基、C2-4烯基、C3-7环烷基或杂环基-C1-4烷基,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R3为卤素、羟基、硝基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、苯基或苯基-C1-4烷氧基;
R4独立地选自卤素、C1-4烷基、羟基-C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基或羟基-C1-4烷基-氨基;和
R5为氢、C1-4烷基或羟基-C1-4烷基;
其中化合物的形式选自其前药、盐、水合物、溶剂化物、包合物、同位素体、外消旋体、对映异构体、非对映异构体、立体异构体、多晶型物和互变异构体形式。
一方面,本文提供了用于修饰RNA剪接以产生具有iExon的成熟mRNA转录物的方法,所述方法包括使前体mRNA转录物与式(I)的化合物或其形式接触,其中所述前体mRNA转录物包含两个外显子和内含子,其中第一外显子在内含子的上游,并且第二外显子在内含子的下游,其中所述内含子按5’至3’顺序包含:第一5’剪接位点、第一分支点、第一3’剪接位点、剪接修饰剂的内含子识别元件(iREMS)、第二分支点和第二3’剪接位点,其中所述iREMS包含RNA序列GAgurngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,并且其中式(I)为:
Figure BDA0002383691000001111
或其形式,其中
W为CH=CH或S;
X为CH2、CH(C1-4烷基)、C(C1-4烷基)2、CH=CH、O、NR5或键;
A为芳基、杂芳基、杂环基或C9-10环烷基,
其中芳基选自苯基和萘基,其各自任选地被1、2、3或4个各自选自R1的取代基取代,
其中杂芳基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R1的取代基取代,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R2的取代基取代,和
其中C9-10环烷基为任选地被1、2、3、4或5个各自选自R2的取代基取代的饱和或部分不饱和二环环系;
B为杂环基,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或多环环系,其各自任选地被1、2、3、4或5个各自选自R4的取代基取代;
R1为卤素、羟基、氰基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、杂环基-C1-4烷氧基、苯基或苯基-C1-4烷氧基,
其中杂芳基为具有1、2或3个选自N、O和S的杂原子环成员的饱和单环或二环环系,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中苯基、杂芳基或杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R2为卤素、羟基、氰基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、羟基-C1-4烷基、C1-4烷氧基、C1-4烷氧基-羰基、C2-4烯基、C3-7环烷基或杂环基-C1-4烷基,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R3为卤素、羟基、硝基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、苯基或苯基-C1-4烷氧基;
R4独立地选自卤素、C1-4烷基、羟基-C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基或羟基-C1-4烷基-氨基;和
R5为氢、C1-4烷基或羟基-C1-4烷基;
其中化合物的形式选自其前药、盐、水合物、溶剂化物、包合物、同位素体、外消旋体、对映异构体、非对映异构体、立体异构体、多晶型物和互变异构体形式。
另一方面,本文提供了用于修饰RNA剪接以调节由前体mRNA转录物产生的成熟mRNA转录物的量的方法,所述方法包括使前体mRNA转录物与式(I)的化合物或其形式接触,其中所述前体mRNA转录物包含两个外显子和内含子,其中第一外显子在内含子的上游,并且第二外显子在内含子的下游,其中所述内含子包含RNA核苷酸序列,所述RNA核苷酸序列按5’至3’顺序包含:剪接修饰剂的内含子识别元件(iREMS)、分支点和3’剪接位点,其中所述iREMS包含RNA序列GAgurngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,并且其中式(I)为:
Figure BDA0002383691000001141
或其形式,其中
W为CH=CH或S;
X为CH2、CH(C1-4烷基)、C(C1-4烷基)2、CH=CH、O、NR5或键;
A为芳基、杂芳基、杂环基或C9-10环烷基,
其中芳基选自苯基和萘基,其各自任选地被1、2、3或4个各自选自R1的取代基取代,
其中杂芳基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R1的取代基取代,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R2的取代基取代,和
其中C9-10环烷基为任选地被1、2、3、4或5个各自选自R2的取代基取代的饱和或部分不饱和二环环系;
B为杂环基,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或多环环系,其各自任选地被1、2、3、4或5个各自选自R4的取代基取代;
R1为卤素、羟基、氰基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、杂环基-C1-4烷氧基、苯基或苯基-C1-4烷氧基,
其中杂芳基为具有1、2或3个选自N、O和S的杂原子环成员的饱和单环或二环环系,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中苯基、杂芳基或杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R2为卤素、羟基、氰基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、羟基-C1-4烷基、C1-4烷氧基、C1-4烷氧基-羰基、C2-4烯基、C3-7环烷基或杂环基-C1-4烷基,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R3为卤素、羟基、硝基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、苯基或苯基-C1-4烷氧基;
R4独立地选自卤素、C1-4烷基、羟基-C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基或羟基-C1-4烷基-氨基;和
R5为氢、C1-4烷基或羟基-C1-4烷基;
其中化合物的形式选自其前药、盐、水合物、溶剂化物、包合物、同位素体、外消旋体、对映异构体、非对映异构体、立体异构体、多晶型物和互变异构体形式。
在前述方面的特定方面,所述内含子按5’至3’顺序还包含:5’剪接位点、分支点和iREMS上游的3’剪接位点。
另一方面,本文提供了用于修饰RNA剪接以调节由前体mRNA转录物产生的成熟mRNA转录物的量的方法,所述方法包括使前体mRNA转录物与式(I)的化合物或其形式接触,其中所述前体mRNA转录物包含三个外显子和两个内含子,其中三个外显子和两个内含子按以下5’至3’的顺序为:第一外显子、第一内含子、第二外显子、第二内含子和第三外显子,其中所述第一内含子包含RNA核苷酸序列,所述RNA核苷酸序列按5’至3’顺序包含:第一5’剪接位点、第一分支点和第一3’剪接位点,其中所述第二内含子包含RNA核苷酸序列,所述RNA核苷酸序列按5’至3’顺序包含:第二5’剪接位点、剪接修饰剂的内含子识别元件(iREMS)、第二分支点和第二3’剪接位点,其中所述iREMS包含RNA序列GAgurngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,并且其中式(I)为:
Figure BDA0002383691000001161
或其形式,其中
W为CH=CH或S;
X为CH2、CH(C1-4烷基)、C(C1-4烷基)2、CH=CH、O、NR5或键;
A为芳基、杂芳基、杂环基或C9-10环烷基,
其中芳基选自苯基和萘基,其各自任选地被1、2、3或4个各自选自R1的取代基取代,
其中杂芳基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R1的取代基取代,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R2的取代基取代,和
其中C9-10环烷基为任选地被1、2、3、4或5个各自选自R2的取代基取代的饱和或部分不饱和二环环系;
B为杂环基,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或多环环系,其各自任选地被1、2、3、4或5个各自选自R4的取代基取代;
R1为卤素、羟基、氰基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、杂环基-C1-4烷氧基、苯基或苯基-C1-4烷氧基,
其中杂芳基为具有1、2或3个选自N、O和S的杂原子环成员的饱和单环或二环环系,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中苯基、杂芳基或杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R2为卤素、羟基、氰基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、羟基-C1-4烷基、C1-4烷氧基、C1-4烷氧基-羰基、C2-4烯基、C3-7环烷基或杂环基-C1-4烷基,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R3为卤素、羟基、硝基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、苯基或苯基-C1-4烷氧基;
R4独立地选自卤素、C1-4烷基、羟基-C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基或羟基-C1-4烷基-氨基;和
R5为氢、C1-4烷基或羟基-C1-4烷基;
其中化合物的形式选自其前药、盐、水合物、溶剂化物、包合物、同位素体、外消旋体、对映异构体、非对映异构体、立体异构体、多晶型物和互变异构体形式。
在具体方面,所述前体mRNA转录物在细胞或细胞的裂解物中,并且所述方法包括使化合物与细胞或细胞裂解物接触。在具体方面,所述方法调节由成熟mRNA转录物产生的和在细胞或细胞的裂解物中产生的蛋白的量和/修饰由成熟mRNA转录物产生的和在细胞或细胞的裂解物中产生的蛋白的类型。
在具体方面,所述方法包括向对象施用所述化合物。在具体方面,所述方法调节由成熟mRNA转录物产生的和在对象中产生的蛋白的量和/或修饰由成熟mRNA转录物产生的和在对象中产生的蛋白的类型。一方面,所述对象是非人类对象。另一方面,所述对象是人类对象。
在具体方面,所述成熟mRNA转录物编码可检测的报告蛋白。
另一方面,本文提供了用于修饰RNA剪接以预防或治疗疾病或障碍的方法,其中由基因编码的一种、两种、三种或更多种RNA同种型的表达水平的改变有利于预防或治疗所述疾病,所述方法包括向有此需要的对象施用本文所述的化合物,其中所述一种、两种、三种或更多种RNA同种型通过修饰前体mRNA转录物的RNA剪接产生,所述前体mRNA转录物包含两个外显子和内含子,其中第一外显子在内含子的上游,并且第二外显子在内含子的下游,其中所述内含子按5’至3’顺序包含:第一5’剪接位点、第一分支点、第一3’剪接位点、剪接修饰剂的内含子识别元件(iREMS)、第二分支点和第二3’剪接位点,其中所述iREMS包含RNA序列GAgurngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,并且其中式(I)为:
Figure BDA0002383691000001181
或其形式,其中
W为CH=CH或S;
X为CH2、CH(C1-4烷基)、C(C1-4烷基)2、CH=CH、O、NR5或键;
A为芳基、杂芳基、杂环基或C9-10环烷基,
其中芳基选自苯基和萘基,其各自任选地被1、2、3或4个各自选自R1的取代基取代,
其中杂芳基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R1的取代基取代,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R2的取代基取代,和
其中C9-10环烷基为任选地被1、2、3、4或5个各自选自R2的取代基取代的饱和或部分不饱和二环环系;
B为杂环基,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或多环环系,其各自任选地被1、2、3、4或5个各自选自R4的取代基取代;
R1为卤素、羟基、氰基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、杂环基-C1-4烷氧基、苯基或苯基-C1-4烷氧基,
其中杂芳基为具有1、2或3个选自N、O和S的杂原子环成员的饱和单环或二环环系,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中苯基、杂芳基或杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R2为卤素、羟基、氰基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、羟基-C1-4烷基、C1-4烷氧基、C1-4烷氧基-羰基、C2-4烯基、C3-7环烷基或杂环基-C1-4烷基,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R3为卤素、羟基、硝基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、苯基或苯基-C1-4烷氧基;
R4独立地选自卤素、C1-4烷基、羟基-C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基或羟基-C1-4烷基-氨基;和
R5为氢、C1-4烷基或羟基-C1-4烷基;
其中化合物的形式选自其前药、盐、水合物、溶剂化物、包合物、同位素体、外消旋体、对映异构体、非对映异构体、立体异构体、多晶型物和互变异构体形式。
另一方面,本文提供了用于修饰RNA剪接以预防或治疗疾病或障碍的方法,其中由基因编码的一种、两种、三种或更多种RNA同种型的表达水平的改变有利于预防或治疗所述疾病,所述方法包括向有此需要的对象施用本文所述的化合物,其中所述一种、两种、三种或更多种RNA同种型由前体mRNA转录物产生,所述前体mRNA转录物包含两个外显子和内含子,其中第一外显子在内含子的上游,并且第二外显子在内含子的下游,其中所述内含子包含RNA核苷酸序列,所述RNA核苷酸序列按5’至3’顺序包含:剪接修饰剂的内含子识别元件(iREMS)、分支点和3’剪接位点,其中所述iREMS包含RNA序列GAgurngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,并且其中式(I)为:
Figure BDA0002383691000001211
或其形式,其中
W为CH=CH或S;
X为CH2、CH(C1-4烷基)、C(C1-4烷基)2、CH=CH、O、NR5或键;
A为芳基、杂芳基、杂环基或C9-10环烷基,
其中芳基选自苯基和萘基,其各自任选地被1、2、3或4个各自选自R1的取代基取代,
其中杂芳基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R1的取代基取代,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R2的取代基取代,和
其中C9-10环烷基为任选地被1、2、3、4或5个各自选自R2的取代基取代的饱和或部分不饱和二环环系;
B为杂环基,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或多环环系,其各自任选地被1、2、3、4或5个各自选自R4的取代基取代;
R1为卤素、羟基、氰基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、杂环基-C1-4烷氧基、苯基或苯基-C1-4烷氧基,
其中杂芳基为具有1、2或3个选自N、O和S的杂原子环成员的饱和单环或二环环系,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中苯基、杂芳基或杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R2为卤素、羟基、氰基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、羟基-C1-4烷基、C1-4烷氧基、C1-4烷氧基-羰基、C2-4烯基、C3-7环烷基或杂环基-C1-4烷基,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R3为卤素、羟基、硝基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、苯基或苯基-C1-4烷氧基;
R4独立地选自卤素、C1-4烷基、羟基-C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基或羟基-C1-4烷基-氨基;和
R5为氢、C1-4烷基或羟基-C1-4烷基;
其中化合物的形式选自其前药、盐、水合物、溶剂化物、包合物、同位素体、外消旋体、对映异构体、非对映异构体、立体异构体、多晶型物和互变异构体形式。
在前述方面的特定方面,所述内含子按5’至3’顺序还包含:5’剪接位点、分支点和iREMS上游的3’剪接位点。
另一方面,本文提供了用于修饰RNA剪接以预防或治疗疾病或障碍的方法,其中由基因编码的一种、两种、三种或更多种RNA同种型的表达水平的改变有利于预防或治疗所述疾病,所述方法包括向有此需要的对象施用本文所述的化合物,其中所述一种、两种、三种或更多种RNA同种型由前体mRNA转录物产生,所述前体mRNA转录物包含三个外显子和两个内含子,其中三个外显子和两个内含子按以下5’至3’的顺序为:第一外显子、第一内含子、第二外显子、第二内含子和第三外显子,其中所述第一内含子包含RNA核苷酸序列,所述RNA核苷酸序列按5’至3’顺序包含:第一5’剪接位点、第一分支点和第一3’剪接位点,其中所述第二内含子包含RNA核苷酸序列,所述RNA核苷酸序列按5’至3’顺序包含:第二5’剪接位点、剪接修饰剂的内含子识别元件(iREMS)、第二分支点和第二3’剪接位点,其中所述iREMS包含RNA序列GAgurngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,并且其中式(I)为:
Figure BDA0002383691000001231
或其形式,其中
W为CH=CH或S;
X为CH2、CH(C1-4烷基)、C(C1-4烷基)2、CH=CH、O、NR5或键;
A为芳基、杂芳基、杂环基或C9-10环烷基,
其中芳基选自苯基和萘基,其各自任选地被1、2、3或4个各自选自R1的取代基取代,
其中杂芳基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R1的取代基取代,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R2的取代基取代,和
其中C9-10环烷基为任选地被1、2、3、4或5个各自选自R2的取代基取代的饱和或部分不饱和二环环系;
B为杂环基,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或多环环系,其各自任选地被1、2、3、4或5个各自选自R4的取代基取代;
R1为卤素、羟基、氰基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、杂环基-C1-4烷氧基、苯基或苯基-C1-4烷氧基,
其中杂芳基为具有1、2或3个选自N、O和S的杂原子环成员的饱和单环或二环环系,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中苯基、杂芳基或杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R2为卤素、羟基、氰基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、羟基-C1-4烷基、C1-4烷氧基、C1-4烷氧基-羰基、C2-4烯基、C3-7环烷基或杂环基-C1-4烷基,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R3为卤素、羟基、硝基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、苯基或苯基-C1-4烷氧基;
R4独立地选自卤素、C1-4烷基、羟基-C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基或羟基-C1-4烷基-氨基;和
R5为氢、C1-4烷基或羟基-C1-4烷基;
其中化合物的形式选自其前药、盐、水合物、溶剂化物、包合物、同位素体、外消旋体、对映异构体、非对映异构体、立体异构体、多晶型物和互变异构体形式。
在一些方面,所述iREMS为内源iREMS。在其他方面,所述iREMS为非内源iREMS。
另一方面,本文提供了包含RNA序列别的人工基因构建体,所述RNA序列包含外显子和一个或多个内含子,其中至少一个内含子包含在分支点和3’剪接位点下游的iREMS,并且其中所述iREMS包含序列GAgurngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸。
另一方面,本文提供了包含RNA序列的人工基因构建体,所述RNA序列包含两个外显子和内含子,其中第一外显子在内含子的上游,并且第二外显子在内含子的下游,其中所述内含子的RNA核苷酸序列按5’至3’顺序包含:第一5’剪接位点、第一分支点、第一3’剪接位点、iREMS、第二分支点和第二3’剪接位点,其中所述iREMS包含RNA序列GAgurngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸。
另一方面,本文提供了包含RNA序列的人工基因构建体,所述RNA序列包含两个外显子和内含子,其中第一外显子在内含子的上游,并且第二外显子在内含子的下游,其中所述内含子的RNA核苷酸序列按5’至3’顺序包含:iREMS、分支点和3’剪接位点,其中所述iREMS包含RNA序列GAgurngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸。
另一方面,本文提供了包含本文所述的人工基因构建体的细胞。
在具体方面,所述iREMS包含RNA序列GAguragu,其中r为腺嘌呤或鸟嘌呤。
在另一个具体方面,所述iREMS包含RNA序列NNGAgurngn(SEQ ID NO:1),其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸。在具体方面,RNA序列NNGAgurngn(SEQ ID NO:1)选自:ANGAgurngn(SEQ ID NO:4)、CNGAgurngn(SEQ ID NO:5)、GNGAgurngn(SEQ ID NO:6)、UNGAgurngn(SEQ ID NO:7)、NAGAgurngn(SEQ ID NO:8)、NCGAgurngn(SEQ ID NO:9)、NGGAgurngn(SEQ ID NO:10)、NUGAgurngn(SEQ ID NO:11)、AAGAgurngn(SEQ ID NO:12)、ACGAgurngn(SEQ ID NO:13)、AGGAgurngn(SEQ ID NO:14)、AUGAgurngn(SEQ ID NO:15)、CAGAgurngn(SEQ ID NO:16)、CCGAgurngn(SEQ ID NO:17)、CGGAgurngn(SEQ ID NO:18)、CUGAgurngn(SEQ ID NO:19)、GAGAgurngn(SEQ ID NO:20)、GCGAgurngn(SEQ ID NO:21)、GGGAgurngn(SEQ ID NO:22)、GUGAgurngn(SEQ ID NO:23)、UAGAgurngn(SEQ ID NO:24)、UCGAgurngn(SEQ ID NO:25)、UGGAgurngn(SEQ ID NO:52)和UUGAgurngn(SEQ ID NO:53),其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸。
在另一个具体方面,所述iREMS包含RNA序列NNGAguragu(SEQ ID NO:2),其中r为腺嘌呤或鸟嘌呤,并且N为任何核苷酸。在具体方面,RNA序列NNGAguragu(SEQ ID NO:2)选自:ANGAguragu(SEQ ID NO:28)、CNGAguragu(SEQ ID NO:29)、GNGAguragu(SEQ ID NO:30)、UNGAguragu(SEQ ID NO:31)、NAGAguragu(SEQ ID NO:32)、NCGAguragu(SEQ ID NO:33)、NGGAguragu(SEQ ID NO:34)、NUGAguragu(SEQ ID NO:35)、AAGAguragu(SEQ ID NO:36)、ACGAguragu(SEQ ID NO:37)、AGGAguragu(SEQ ID NO:38)、AUGAguragu(SEQ ID NO:39)、CAGAguragu(SEQ ID NO:40)、CCGAguragu(SEQ ID NO:41)、CGGAguragu(SEQ ID NO:42)、CUGAguragu(SEQ ID NO:43)、GAGAguragu(SEQ ID NO:44)、GCGAguragu(SEQ ID NO:45)、GGGAguragu(SEQ ID NO:46)、GUGAguragu(SEQ ID NO:47)、UAGAguragu(SEQ ID NO:48)、UCGAguragu(SEQ ID NO:49)、UGGAguragu(SEQ ID NO:489)和UUGAguragu(SEQ ID NO:508),其中r为腺嘌呤或鸟嘌呤,并且N为任何核苷酸。
在某些方面,n为腺嘌呤或鸟嘌呤。
一方面,本文提供了用于修饰RNA剪接以产生具有iExon的成熟mRNA转录物的方法,所述方法包括使由DNA序列产生的前体mRNA转录物与式(I)的化合物或其形式接触,其中所述DNA序列编码两个外显子和内含子,其中编码第一外显子的核苷酸序列在编码内含子的核苷酸序列的上游,并且编码第二外显子的核苷酸序列在编码内含子的核苷酸序列的下游,其中所述编码内含子的核苷酸序列按5’至3’顺序包含:编码第一5’剪接位点的核苷酸序列、编码第一分支点的核苷酸序列、编码第一3’剪接位点的核苷酸序列、编码剪接修饰剂的内含子识别元件(iREMS)的核苷酸序列、编码第二分支点的核苷酸序列和编码第二3’剪接位点的核苷酸序列,其中编码iREMS的核苷酸序列包含DNA序列GAgtrngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,并且其中式(I)为:
Figure BDA0002383691000001271
或其形式,其中
W为CH=CH或S;
X为CH2、CH(C1-4烷基)、C(C1-4烷基)2、CH=CH、O、NR5或键;
A为芳基、杂芳基、杂环基或C9-10环烷基,
其中芳基选自苯基和萘基,其各自任选地被1、2、3或4个各自选自R1的取代基取代,
其中杂芳基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R1的取代基取代,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R2的取代基取代,和
其中C9-10环烷基为任选地被1、2、3、4或5个各自选自R2的取代基取代的饱和或部分不饱和二环环系;
B为杂环基,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或多环环系,其各自任选地被1、2、3、4或5个各自选自R4的取代基取代;
R1为卤素、羟基、氰基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、杂环基-C1-4烷氧基、苯基或苯基-C1-4烷氧基,
其中杂芳基为具有1、2或3个选自N、O和S的杂原子环成员的饱和单环或二环环系,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中苯基、杂芳基或杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R2为卤素、羟基、氰基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、羟基-C1-4烷基、C1-4烷氧基、C1-4烷氧基-羰基、C2-4烯基、C3-7环烷基或杂环基-C1-4烷基,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R3为卤素、羟基、硝基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、苯基或苯基-C1-4烷氧基;
R4独立地选自卤素、C1-4烷基、羟基-C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基或羟基-C1-4烷基-氨基;和
R5为氢、C1-4烷基或羟基-C1-4烷基;
其中化合物的形式选自其前药、盐、水合物、溶剂化物、包合物、同位素体、外消旋体、对映异构体、非对映异构体、立体异构体、多晶型物和互变异构体形式。
另一方面,本文提供了用于修饰RNA剪接以调节由前体mRNA转录物产生的成熟mRNA转录物的量的方法,所述前体mRNA转录物由DNA序列产生,所述方法包括使由所述DNA序列产生的前体mRNA转录物与式(I)的化合物或其形式接触,其中所述DNA序列编码两个外显子和内含子,其中编码第一外显子的核苷酸序列在编码内含子的核苷酸序列的上游,并且编码第二外显子的核苷酸序列在编码内含子的核苷酸序列的下游,其中编码所述内含子的核苷酸序列包含DNA核苷酸序列,所述DNA核苷酸序列按5’至3’顺序包含:编码剪接修饰剂的内含子识别元件(iREMS)的核苷酸序列、编码分支点的核苷酸序列和编码3’剪接位点的核苷酸序列,其中编码iREMS的核苷酸序列包含DNA序列GAgtrngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,并且其中式(I)为:
Figure BDA0002383691000001291
或其形式,其中
W为CH=CH或S;
X为CH2、CH(C1-4烷基)、C(C1-4烷基)2、CH=CH、O、NR5或键;
A为芳基、杂芳基、杂环基或C9-10环烷基,
其中芳基选自苯基和萘基,其各自任选地被1、2、3或4个各自选自R1的取代基取代,
其中杂芳基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R1的取代基取代,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R2的取代基取代,和
其中C9-10环烷基为任选地被1、2、3、4或5个各自选自R2的取代基取代的饱和或部分不饱和二环环系;
B为杂环基,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或多环环系,其各自任选地被1、2、3、4或5个各自选自R4的取代基取代;
R1为卤素、羟基、氰基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、杂环基-C1-4烷氧基、苯基或苯基-C1-4烷氧基,
其中杂芳基为具有1、2或3个选自N、O和S的杂原子环成员的饱和单环或二环环系,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中苯基、杂芳基或杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R2为卤素、羟基、氰基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、羟基-C1-4烷基、C1-4烷氧基、C1-4烷氧基-羰基、C2-4烯基、C3-7环烷基或杂环基-C1-4烷基,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R3为卤素、羟基、硝基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、苯基或苯基-C1-4烷氧基;
R4独立地选自卤素、C1-4烷基、羟基-C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基或羟基-C1-4烷基-氨基;和
R5为氢、C1-4烷基或羟基-C1-4烷基;
其中化合物的形式选自其前药、盐、水合物、溶剂化物、包合物、同位素体、外消旋体、对映异构体、非对映异构体、立体异构体、多晶型物和互变异构体形式。
在前述方面的特定方面,所述编码内含子的核苷酸序列按5’至3’顺序还包含:编码5’剪接位点的核苷酸序列、编码分支点的核苷酸序列和编码在编码iREMS的核苷酸序列上游的3’剪接位点的核苷酸序列。
另一方面,本文提供了用于修饰RNA剪接以调节由前体mRNA转录物产生的成熟mRNA转录物的量的方法,所述前体mRNA转录物由DNA序列产生,所述方法包括使由DNA序列产生的前体mRNA转录物与式(I)的化合物或其形式接触,其中所述DNA序列编码三个外显子和两个内含子,其中分别编码三个外显子和两个内含子的核苷酸序列按以下5’至3’的顺序为:编码第一外显子的核苷酸序列、编码第一内含子的核苷酸序列、编码第二外显子的核苷酸序列、编码第二内含子的核苷酸序列和编码第三外显子的核苷酸序列,其中编码第一内含子的核苷酸序列包含DNA核苷酸序列,所述DNA核苷酸序列按5’至3’顺序包含:编码第一5’剪接位点的核苷酸序列、编码第一分支点的核苷酸序列和编码第一3’剪接位点的核苷酸序列,其中编码第二内含子的核苷酸序列包含DNA核苷酸序列,所述DNA核苷酸序列按5’至3’顺序包含:编码第二5’剪接位点的核苷酸序列、编码剪接修饰剂的内含子识别元件(iREMS)的核苷酸序列、编码第二分支点的核苷酸序列和编码第二3’剪接位点的核苷酸序列,其中编码iREMS的核苷酸序列包含DNA序列GAgtrngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,并且其中式(I)为:
Figure BDA0002383691000001321
或其形式,其中
W为CH=CH或S;
X为CH2、CH(C1-4烷基)、C(C1-4烷基)2、CH=CH、O、NR5或键;
A为芳基、杂芳基、杂环基或C9-10环烷基,
其中芳基选自苯基和萘基,其各自任选地被1、2、3或4个各自选自R1的取代基取代,
其中杂芳基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R1的取代基取代,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R2的取代基取代,和
其中C9-10环烷基为任选地被1、2、3、4或5个各自选自R2的取代基取代的饱和或部分不饱和二环环系;
B为杂环基,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或多环环系,其各自任选地被1、2、3、4或5个各自选自R4的取代基取代;
R1为卤素、羟基、氰基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、杂环基-C1-4烷氧基、苯基或苯基-C1-4烷氧基,
其中杂芳基为具有1、2或3个选自N、O和S的杂原子环成员的饱和单环或二环环系,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中苯基、杂芳基或杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R2为卤素、羟基、氰基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、羟基-C1-4烷基、C1-4烷氧基、C1-4烷氧基-羰基、C2-4烯基、C3-7环烷基或杂环基-C1-4烷基,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R3为卤素、羟基、硝基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、苯基或苯基-C1-4烷氧基;
R4独立地选自卤素、C1-4烷基、羟基-C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基或羟基-C1-4烷基-氨基;和
R5为氢、C1-4烷基或羟基-C1-4烷基;
其中化合物的形式选自其前药、盐、水合物、溶剂化物、包合物、同位素体、外消旋体、对映异构体、非对映异构体、立体异构体、多晶型物和互变异构体形式。
在一些方面,编码iREMS的核苷酸序列是编码内源iREMS的核苷酸序列。在其他方面,编码iREMS的核苷酸序列是编码非内源iREMS的核苷酸序列。
另一方面,本文提供了用于修饰RNA剪接以产生具有iExon的成熟mRNA转录物的方法,所述方法包括使由DNA序列产生的前体mRNA转录物与式(I)的化合物或其形式接触,其中所述DNA序列编码两个外显子和内含子,其中编码第一外显子的核苷酸序列在编码内含子的核苷酸序列的上游,并且编码第二外显子的核苷酸序列在编码内含子的核苷酸序列的下游,其中所述编码内含子的核苷酸序列按5’至3’顺序包含:编码第一5’剪接位点的核苷酸序列、编码第一分支点的核苷酸序列、编码第一3’剪接位点的核苷酸序列、编码内源剪接修饰剂的内含子识别元件(iREMS)的核苷酸序列、编码第二分支点的核苷酸序列和编码第二3’剪接位点的核苷酸序列,其中编码iREMS的核苷酸序列包含DNA序列GAgtrngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,其中所述DNA序列是选自本文表中所列基因的基因的DNA序列,并且其中式(I)为:
Figure BDA0002383691000001341
或其形式,其中
W为CH=CH或S;
X为CH2、CH(C1-4烷基)、C(C1-4烷基)2、CH=CH、O、NR5或键;
A为芳基、杂芳基、杂环基或C9-10环烷基,
其中芳基选自苯基和萘基,其各自任选地被1、2、3或4个各自选自R1的取代基取代,
其中杂芳基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R1的取代基取代,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R2的取代基取代,和
其中C9-10环烷基为任选地被1、2、3、4或5个各自选自R2的取代基取代的饱和或部分不饱和二环环系;
B为杂环基,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或多环环系,其各自任选地被1、2、3、4或5个各自选自R4的取代基取代;
R1为卤素、羟基、氰基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、杂环基-C1-4烷氧基、苯基或苯基-C1-4烷氧基,
其中杂芳基为具有1、2或3个选自N、O和S的杂原子环成员的饱和单环或二环环系,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中苯基、杂芳基或杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R2为卤素、羟基、氰基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、羟基-C1-4烷基、C1-4烷氧基、C1-4烷氧基-羰基、C2-4烯基、C3-7环烷基或杂环基-C1-4烷基,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R3为卤素、羟基、硝基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、苯基或苯基-C1-4烷氧基;
R4独立地选自卤素、C1-4烷基、羟基-C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基或羟基-C1-4烷基-氨基;和
R5为氢、C1-4烷基或羟基-C1-4烷基;
其中化合物的形式选自其前药、盐、水合物、溶剂化物、包合物、同位素体、外消旋体、对映异构体、非对映异构体、立体异构体、多晶型物和互变异构体形式。
另一方面,本文提供了用于修饰RNA剪接以调节由前体mRNA转录物产生的成熟mRNA转录物的量的方法,所述前体mRNA转录物由DNA序列产生,所述方法包括使由DNA序列产生的前体mRNA转录物与式(I)的化合物或其形式接触,其中所述DNA序列编码两个外显子和内含子,其中编码第一外显子的核苷酸序列在编码内含子的核苷酸序列的上游,并且编码第二外显子的核苷酸序列在编码内含子的核苷酸序列的下游,其中编码所述内含子的核苷酸序列包含DNA核苷酸序列,所述DNA核苷酸序列按5’至3’顺序包含:编码内源或非内源剪接修饰剂的内含子识别元件(iREMS)的核苷酸序列、编码分支点的核苷酸序列和编码3’剪接位点的核苷酸序列,其中编码iREMS的核苷酸序列包含DNA序列GAgtrngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,其中所述DNA序列是选自本文表中所列基因的基因的DNA序列,并且其中式(I)为:
Figure BDA0002383691000001361
或其形式,其中
W为CH=CH或S;
X为CH2、CH(C1-4烷基)、C(C1-4烷基)2、CH=CH、O、NR5或键;
A为芳基、杂芳基、杂环基或C9-10环烷基,
其中芳基选自苯基和萘基,其各自任选地被1、2、3或4个各自选自R1的取代基取代,
其中杂芳基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R1的取代基取代,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R2的取代基取代,和
其中C9-10环烷基为任选地被1、2、3、4或5个各自选自R2的取代基取代的饱和或部分不饱和二环环系;
B为杂环基,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或多环环系,其各自任选地被1、2、3、4或5个各自选自R4的取代基取代;
R1为卤素、羟基、氰基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、杂环基-C1-4烷氧基、苯基或苯基-C1-4烷氧基,
其中杂芳基为具有1、2或3个选自N、O和S的杂原子环成员的饱和单环或二环环系,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中苯基、杂芳基或杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R2为卤素、羟基、氰基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、羟基-C1-4烷基、C1-4烷氧基、C1-4烷氧基-羰基、C2-4烯基、C3-7环烷基或杂环基-C1-4烷基,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R3为卤素、羟基、硝基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、苯基或苯基-C1-4烷氧基;
R4独立地选自卤素、C1-4烷基、羟基-C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基或羟基-C1-4烷基-氨基;和
R5为氢、C1-4烷基或羟基-C1-4烷基;
其中化合物的形式选自其前药、盐、水合物、溶剂化物、包合物、同位素体、外消旋体、对映异构体、非对映异构体、立体异构体、多晶型物和互变异构体形式。
在前述方面的特定方面,所述编码内含子的核苷酸序列按5’至3’顺序还包含:编码5’剪接位点的核苷酸序列、编码分支点的核苷酸序列和编码在编码iREMS的核苷酸序列上游的3’剪接位点的核苷酸序列。
另一方面,本文提供了用于修饰RNA剪接以调节由前体mRNA转录物产生的成熟mRNA转录物的量的方法,所述前体mRNA转录物由DNA序列产生,所述方法包括使由DNA序列产生的前体mRNA转录物与式(I)的化合物或其形式接触,其中所述DNA序列编码三个外显子和两个内含子,其中分别编码三个外显子和两个内含子的核苷酸序列按以下5’至3’的顺序为:编码第一外显子的核苷酸序列、编码第一内含子的核苷酸序列、编码第二外显子的核苷酸序列、编码第二内含子的核苷酸序列和编码第三外显子的核苷酸序列,其中所述编码第一内含子的核苷酸序列包含DNA核苷酸序列,所述DNA核苷酸序列按5’至3’顺序包含:编码第一5’剪接位点的核苷酸序列、编码第一分支点的核苷酸序列和编码第一3’剪接位点的核苷酸序列,其中所述编码第二内含子的核苷酸序列包含DNA核苷酸序列,所述DNA核苷酸序列按5’至3’顺序包含:编码第二5’剪接位点的核苷酸序列、编码内源或非内源剪接修饰剂的内含子识别元件(iREMS)的核苷酸序列、编码第二分支点的核苷酸序列和编码第二3’剪接位点的核苷酸序列,其中所述编码iREMS的核苷酸序列包含DNA序列GAgtrngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,其中所述DNA序列是选自本文表中所列基因的基因的DNA序列,并且其中式(I)为:
Figure BDA0002383691000001391
或其形式,其中
W为CH=CH或S;
X为CH2、CH(C1-4烷基)、C(C1-4烷基)2、CH=CH、O、NR5或键;
A为芳基、杂芳基、杂环基或C9-10环烷基,
其中芳基选自苯基和萘基,其各自任选地被1、2、3或4个各自选自R1的取代基取代,
其中杂芳基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R1的取代基取代,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R2的取代基取代,和
其中C9-10环烷基为任选地被1、2、3、4或5个各自选自R2的取代基取代的饱和或部分不饱和二环环系;
B为杂环基,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或多环环系,其各自任选地被1、2、3、4或5个各自选自R4的取代基取代;
R1为卤素、羟基、氰基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、杂环基-C1-4烷氧基、苯基或苯基-C1-4烷氧基,
其中杂芳基为具有1、2或3个选自N、O和S的杂原子环成员的饱和单环或二环环系,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中苯基、杂芳基或杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R2为卤素、羟基、氰基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、羟基-C1-4烷基、C1-4烷氧基、C1-4烷氧基-羰基、C2-4烯基、C3-7环烷基或杂环基-C1-4烷基,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R3为卤素、羟基、硝基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、苯基或苯基-C1-4烷氧基;
R4独立地选自卤素、C1-4烷基、羟基-C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基或羟基-C1-4烷基-氨基;和
R5为氢、C1-4烷基或羟基-C1-4烷基;
其中化合物的形式选自其前药、盐、水合物、溶剂化物、包合物、同位素体、外消旋体、对映异构体、非对映异构体、立体异构体、多晶型物和互变异构体形式。
另一方面,本文提供了用于修饰RNA剪接以产生具有iExon的成熟mRNA转录物的方法,所述方法包括使由DNA序列产生的前体mRNA转录物与式(I)的化合物或其形式接触,其中所述DNA序列编码两个外显子和内含子,其中编码第一外显子的核苷酸序列在编码内含子的核苷酸序列的上游,并且编码第二外显子的核苷酸序列在编码内含子的核苷酸序列的下游,其中所述编码内含子的核苷酸序列按5’至3’顺序包含:编码第一5’剪接位点的核苷酸序列、编码第一分支点的核苷酸序列、编码第一3’剪接位点的核苷酸序列、编码非内源剪接修饰剂的内含子识别元件(iREMS)的核苷酸序列、编码第二分支点的核苷酸序列和编码第二3’剪接位点的核苷酸序列,其中所述编码iREMS的核苷酸序列包含DNA序列GAgtrngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,并且其中式(I)为:
Figure BDA0002383691000001411
或其形式,其中
W为CH=CH或S;
X为CH2、CH(C1-4烷基)、C(C1-4烷基)2、CH=CH、O、NR5或键;
A为芳基、杂芳基、杂环基或C9-10环烷基,
其中芳基选自苯基和萘基,其各自任选地被1、2、3或4个各自选自R1的取代基取代,
其中杂芳基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R1的取代基取代,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R2的取代基取代,和
其中C9-10环烷基为任选地被1、2、3、4或5个各自选自R2的取代基取代的饱和或部分不饱和二环环系;
B为杂环基,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或多环环系,其各自任选地被1、2、3、4或5个各自选自R4的取代基取代;
R1为卤素、羟基、氰基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、杂环基-C1-4烷氧基、苯基或苯基-C1-4烷氧基,
其中杂芳基为具有1、2或3个选自N、O和S的杂原子环成员的饱和单环或二环环系,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中苯基、杂芳基或杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R2为卤素、羟基、氰基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、羟基-C1-4烷基、C1-4烷氧基、C1-4烷氧基-羰基、C2-4烯基、C3-7环烷基或杂环基-C1-4烷基,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R3为卤素、羟基、硝基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、苯基或苯基-C1-4烷氧基;
R4独立地选自卤素、C1-4烷基、羟基-C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基或羟基-C1-4烷基-氨基;和
R5为氢、C1-4烷基或羟基-C1-4烷基;
其中化合物的形式选自其前药、盐、水合物、溶剂化物、包合物、同位素体、外消旋体、对映异构体、非对映异构体、立体异构体、多晶型物和互变异构体形式。
另一方面,本文提供了用于修饰RNA剪接以调节由前体mRNA转录物产生的成熟mRNA转录物的量的方法,所述前体mRNA转录物由DNA序列产生,所述方法包括使由DNA序列产生的前体mRNA转录物与式(I)的化合物或其形式接触,其中所述DNA序列编码两个外显子和内含子,其中编码第一外显子的核苷酸序列在编码内含子的核苷酸序列的上游,并且编码第二外显子的核苷酸序列在编码内含子的核苷酸序列的下游,其中编码所述内含子的核苷酸序列包含DNA核苷酸序列,所述DNA核苷酸序列按5’至3’顺序包含:编码内源或非内源剪接修饰剂的内含子识别元件(iREMS)的核苷酸序列、编码分支点的核苷酸序列和编码3’剪接位点的核苷酸序列,其中所述编码iREMS的核苷酸序列包含DNA序列GAgtrngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,并且其中式(I)为:
Figure BDA0002383691000001441
或其形式,其中
W为CH=CH或S;
X为CH2、CH(C1-4烷基)、C(C1-4烷基)2、CH=CH、O、NR5或键;
A为芳基、杂芳基、杂环基或C9-10环烷基,
其中芳基选自苯基和萘基,其各自任选地被1、2、3或4个各自选自R1的取代基取代,
其中杂芳基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R1的取代基取代,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R2的取代基取代,和
其中C9-10环烷基为任选地被1、2、3、4或5个各自选自R2的取代基取代的饱和或部分不饱和二环环系;
B为杂环基,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或多环环系,其各自任选地被1、2、3、4或5个各自选自R4的取代基取代;
R1为卤素、羟基、氰基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、杂环基-C1-4烷氧基、苯基或苯基-C1-4烷氧基,
其中杂芳基为具有1、2或3个选自N、O和S的杂原子环成员的饱和单环或二环环系,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中苯基、杂芳基或杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R2为卤素、羟基、氰基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、羟基-C1-4烷基、C1-4烷氧基、C1-4烷氧基-羰基、C2-4烯基、C3-7环烷基或杂环基-C1-4烷基,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R3为卤素、羟基、硝基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、苯基或苯基-C1-4烷氧基;
R4独立地选自卤素、C1-4烷基、羟基-C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基或羟基-C1-4烷基-氨基;和
R5为氢、C1-4烷基或羟基-C1-4烷基;
其中化合物的形式选自其前药、盐、水合物、溶剂化物、包合物、同位素体、外消旋体、对映异构体、非对映异构体、立体异构体、多晶型物和互变异构体形式。
在前述方面的特定方面,所述编码内含子的核苷酸序列按5’至3’顺序还包含:编码5’剪接位点的核苷酸序列、编码分支点的核苷酸序列和编码iREMS上游的3’剪接位点的核苷酸序列。
另一方面,本文提供了用于修饰RNA剪接以调节由前体mRNA转录物产生的成熟mRNA转录物的量的方法,所述前体mRNA转录物由DNA序列产生,所述方法包括使由DNA序列产生的前体mRNA转录物与式(I)的化合物或其形式接触,其中所述DNA序列编码三个外显子和两个内含子,其中分别编码三个外显子和两个内含子的核苷酸序列按以下5’至3’的顺序为:编码第一外显子的核苷酸序列、编码第一内含子的核苷酸序列、编码第二外显子的核苷酸序列、编码第二内含子的核苷酸序列和编码第三外显子的核苷酸序列,其中所述编码第一内含子的核苷酸序列包含DNA核苷酸序列,所述DNA核苷酸序列按5’至3’顺序包含:编码第一5’剪接位点的核苷酸序列、编码第一分支点的核苷酸序列和编码第一3’剪接位点的核苷酸序列,其中编码所述第二内含子的核苷酸序列包含DNA核苷酸序列,所述DNA核苷酸序列按5’至3’顺序包含:编码第二5’剪接位点的核苷酸序列、编码内源或非内源剪接修饰剂的内含子识别元件(iREMS)的核苷酸序列、编码第二分支点的核苷酸序列和编码第二3’剪接位点的核苷酸序列,其中所述编码iREMS的核苷酸序列包含DNA序列GAgtrngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,并且其中式(I)为:
Figure BDA0002383691000001461
或其形式,其中
W为CH=CH或S;
X为CH2、CH(C1-4烷基)、C(C1-4烷基)2、CH=CH、O、NR5或键;
A为芳基、杂芳基、杂环基或C9-10环烷基,
其中芳基选自苯基和萘基,其各自任选地被1、2、3或4个各自选自R1的取代基取代,
其中杂芳基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R1的取代基取代,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R2的取代基取代,和
其中C9-10环烷基为任选地被1、2、3、4或5个各自选自R2的取代基取代的饱和或部分不饱和二环环系;
B为杂环基,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或多环环系,其各自任选地被1、2、3、4或5个各自选自R4的取代基取代;
R1为卤素、羟基、氰基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、杂环基-C1-4烷氧基、苯基或苯基-C1-4烷氧基,
其中杂芳基为具有1、2或3个选自N、O和S的杂原子环成员的饱和单环或二环环系,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中苯基、杂芳基或杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R2为卤素、羟基、氰基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、羟基-C1-4烷基、C1-4烷氧基、C1-4烷氧基-羰基、C2-4烯基、C3-7环烷基或杂环基-C1-4烷基,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R3为卤素、羟基、硝基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、苯基或苯基-C1-4烷氧基;
R4独立地选自卤素、C1-4烷基、羟基-C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基或羟基-C1-4烷基-氨基;和
R5为氢、C1-4烷基或羟基-C1-4烷基;
其中化合物的形式选自其前药、盐、水合物、溶剂化物、包合物、同位素体、外消旋体、对映异构体、非对映异构体、立体异构体、多晶型物和互变异构体形式。
在具体方面,所述前体mRNA转录物在细胞或细胞的裂解物中,并且所述方法包括使化合物与细胞或细胞裂解物接触。在具体方面,所述方法调节由成熟mRNA转录物产生的和在细胞或细胞的裂解物中产生的蛋白的量和/修饰由成熟mRNA转录物产生的和在细胞或细胞的裂解物中产生的蛋白的类型。
在具体方面,所述方法包括向对象施用所述化合物。在具体方面,所述方法调节由成熟mRNA转录物产生的和在对象中产生的蛋白的量和/或修饰由成熟mRNA转录物产生的和在对象中产生的蛋白的类型。一方面,所述对象是非人类对象。另一方面,所述对象是人类对象。
在具体方面,所述成熟mRNA转录物编码可检测的报告蛋白。
另一方面,本文提供了用于修饰RNA剪接以预防或治疗疾病或障碍的方法,其中由基因编码的一种、两种、三种或更多种RNA同种型的表达水平的改变有利于预防或治疗所述疾病,所述方法包括向有此需要的对象施用本文所述的化合物,其中所述一种、两种、三种或更多种RNA同种型由前体mRNA转录物产生,所述前体mRNA转录物由编码两个外显子和内含子的DNA序列产生,其中编码第一外显子的核苷酸序列在编码内含子的核苷酸序列的上游,并且编码第二外显子的核苷酸序列在编码内含子的核苷酸序列的下游,其中所述编码内含子的核苷酸序列按5’至3’顺序包含:编码第一5’剪接位点的核苷酸序列、编码第一分支点的核苷酸序列、编码第一3’剪接位点的核苷酸序列、编码剪接修饰剂的内含子识别元件(iREMS)的核苷酸序列、编码第二分支点的核苷酸序列和编码第二3’剪接位点的核苷酸序列,其中所述编码iREMS的核苷酸序列包含DNA序列GAgtrngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,并且其中式(I)为:
Figure BDA0002383691000001491
或其形式,其中
W为CH=CH或S;
X为CH2、CH(C1-4烷基)、C(C1-4烷基)2、CH=CH、O、NR5或键;
A为芳基、杂芳基、杂环基或C9-10环烷基,
其中芳基选自苯基和萘基,其各自任选地被1、2、3或4个各自选自R1的取代基取代,
其中杂芳基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R1的取代基取代,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R2的取代基取代,和
其中C9-10环烷基为任选地被1、2、3、4或5个各自选自R2的取代基取代的饱和或部分不饱和二环环系;
B为杂环基,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或多环环系,其各自任选地被1、2、3、4或5个各自选自R4的取代基取代;
R1为卤素、羟基、氰基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、杂环基-C1-4烷氧基、苯基或苯基-C1-4烷氧基,
其中杂芳基为具有1、2或3个选自N、O和S的杂原子环成员的饱和单环或二环环系,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中苯基、杂芳基或杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R2为卤素、羟基、氰基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、羟基-C1-4烷基、C1-4烷氧基、C1-4烷氧基-羰基、C2-4烯基、C3-7环烷基或杂环基-C1-4烷基,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R3为卤素、羟基、硝基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、苯基或苯基-C1-4烷氧基;
R4独立地选自卤素、C1-4烷基、羟基-C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基或羟基-C1-4烷基-氨基;和
R5为氢、C1-4烷基或羟基-C1-4烷基;
其中化合物的形式选自其前药、盐、水合物、溶剂化物、包合物、同位素体、外消旋体、对映异构体、非对映异构体、立体异构体、多晶型物和互变异构体形式。
另一方面,本文提供了用于修饰RNA剪接以预防或治疗疾病或障碍的方法,其中由基因编码的一种、两种、三种或更多种RNA同种型的表达水平的改变有利于预防或治疗所述疾病,所述方法包括向有此需要的对象施用本文所述的化合物,其中所述一种、两种、三种或更多种RNA同种型由前体mRNA转录物产生,所述前体mRNA转录物由编码两个外显子和内含子的DNA序列产生,其中编码第一外显子的核苷酸序列在编码内含子的核苷酸序列的上游,并且编码第二外显子的核苷酸序列在编码内含子的核苷酸序列的下游,其中编码所述内含子的核苷酸序列包含DNA核苷酸序列,所述DNA核苷酸序列按5’至3’顺序包含:编码剪接修饰剂的内含子识别元件(iREMS)的核苷酸序列、编码分支点的核苷酸序列和编码3’剪接位点的核苷酸序列,其中编码iREMS的核苷酸序列包含DNA序列GAgtrngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,并且其中式(I)为:
Figure BDA0002383691000001511
或其形式,其中
W为CH=CH或S;
X为CH2、CH(C1-4烷基)、C(C1-4烷基)2、CH=CH、O、NR5或键;
A为芳基、杂芳基、杂环基或C9-10环烷基,
其中芳基选自苯基和萘基,其各自任选地被1、2、3或4个各自选自R1的取代基取代,
其中杂芳基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R1的取代基取代,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R2的取代基取代,和
其中C9-10环烷基为任选地被1、2、3、4或5个各自选自R2的取代基取代的饱和或部分不饱和二环环系;
B为杂环基,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或多环环系,其各自任选地被1、2、3、4或5个各自选自R4的取代基取代;
R1为卤素、羟基、氰基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、杂环基-C1-4烷氧基、苯基或苯基-C1-4烷氧基,
其中杂芳基为具有1、2或3个选自N、O和S的杂原子环成员的饱和单环或二环环系,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中苯基、杂芳基或杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R2为卤素、羟基、氰基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、羟基-C1-4烷基、C1-4烷氧基、C1-4烷氧基-羰基、C2-4烯基、C3-7环烷基或杂环基-C1-4烷基,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R3为卤素、羟基、硝基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、苯基或苯基-C1-4烷氧基;
R4独立地选自卤素、C1-4烷基、羟基-C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基或羟基-C1-4烷基-氨基;和
R5为氢、C1-4烷基或羟基-C1-4烷基;
其中化合物的形式选自其前药、盐、水合物、溶剂化物、包合物、同位素体、外消旋体、对映异构体、非对映异构体、立体异构体、多晶型物和互变异构体形式。
在前述方面的特定方面,所述编码内含子的核苷酸序列按5’至3’顺序还包含:编码5’剪接位点的核苷酸序列、编码分支点的核苷酸序列和编码在编码iREMS的核苷酸序列上游的3’剪接位点的核苷酸序列。
另一方面,本文提供了用于修饰RNA剪接以预防或治疗疾病或障碍的方法,其中由基因编码的一种、两种、三种或更多种RNA同种型的表达水平的改变有利于预防或治疗所述疾病,所述方法包括向有此需要的对象施用本文所述的化合物,其中所述一种、两种、三种或更多种RNA同种型由前体mRNA转录物产生,所述前体mRNA转录物由编码三个外显子和两个内含子的DNA序列产生,其中分别编码三个外显子和两个内含子的核苷酸序列按以下5’至3’的顺序为:编码第一外显子的核苷酸序列、编码第一内含子的核苷酸序列、编码第二外显子的核苷酸序列、编码第二内含子的核苷酸序列和编码第三外显子的核苷酸序列,其中所述编码第一内含子的核苷酸序列包含DNA核苷酸序列,所述DNA核苷酸序列按5’至3’顺序包含:编码第一5’剪接位点的核苷酸序列、编码第一分支点的核苷酸序列和编码第一3’剪接位点的核苷酸序列,其中编码所述第二内含子的核苷酸序列包含DNA核苷酸序列,所述DNA核苷酸序列按5’至3’顺序包含:编码第二5’剪接位点的核苷酸序列、编码剪接修饰剂的内含子识别元件(iREMS)的核苷酸序列、编码第二分支点的核苷酸序列和编码第二3’剪接位点的核苷酸序列,其中所述编码iREMS的核苷酸序列包含DNA序列GAgtrngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,并且其中式(I)为:
Figure BDA0002383691000001541
或其形式,其中
W为CH=CH或S;
X为CH2、CH(C1-4烷基)、C(C1-4烷基)2、CH=CH、O、NR5或键;
A为芳基、杂芳基、杂环基或C9-10环烷基,
其中芳基选自苯基和萘基,其各自任选地被1、2、3或4个各自选自R1的取代基取代,
其中杂芳基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R1的取代基取代,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R2的取代基取代,和
其中C9-10环烷基为任选地被1、2、3、4或5个各自选自R2的取代基取代的饱和或部分不饱和二环环系;
B为杂环基,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或多环环系,其各自任选地被1、2、3、4或5个各自选自R4的取代基取代;
R1为卤素、羟基、氰基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、杂环基-C1-4烷氧基、苯基或苯基-C1-4烷氧基,
其中杂芳基为具有1、2或3个选自N、O和S的杂原子环成员的饱和单环或二环环系,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中苯基、杂芳基或杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R2为卤素、羟基、氰基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、羟基-C1-4烷基、C1-4烷氧基、C1-4烷氧基-羰基、C2-4烯基、C3-7环烷基或杂环基-C1-4烷基,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R3为卤素、羟基、硝基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、苯基或苯基-C1-4烷氧基;
R4独立地选自卤素、C1-4烷基、羟基-C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基或羟基-C1-4烷基-氨基;和
R5为氢、C1-4烷基或羟基-C1-4烷基;
其中化合物的形式选自其前药、盐、水合物、溶剂化物、包合物、同位素体、外消旋体、对映异构体、非对映异构体、立体异构体、多晶型物和互变异构体形式。
在一些方面,编码iREMS的核苷酸序列为编码iREMS的内源核苷酸序列。在其他方面,编码iREMS的核苷酸序列为编码iREMS的非内源核苷酸序列。
另一方面,本文提供了包含编码外显子和一个或多个内含子的DNA序列的人工基因构建体,其中编码至少一个内含子的核苷酸序列包含编码iREMS的核苷酸序列,该核苷酸序列在编码分支点的核苷酸序列和编码3’剪接位点的核苷酸序列的下游,并且其中编码iREMS的核苷酸序列包含序列GAgtrngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸。
另一方面,本文提供了包含编码两个外显子和内含子的DNA序列的人工基因构建体,其中编码第一外显子的核苷酸序列在编码内含子的核苷酸序列的上游,并且编码第二外显子的核苷酸序列在编码内含子的核苷酸序列的下游,其中编码内含子的DNA核苷酸序列按5’至3’顺序包含:编码第一5’剪接位点的核苷酸序列、编码第一分支点的核苷酸序列、编码第一3’剪接位点的核苷酸序列、编码iREMS的核苷酸序列、编码第二分支点的核苷酸序列和编码第二3’剪接位点的核苷酸序列,其中编码iREMS的核苷酸序列包含DNA序列GAgtrngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸。
另一方面,本文提供了包含编码两个外显子和内含子的DNA序列的人工基因构建体,其中编码第一外显子的核苷酸序列在编码内含子的核苷酸序列的上游,并且编码第二外显子的核苷酸序列在编码内含子的核苷酸序列的下游,其中编码内含子的DNA核苷酸序列按5’至3’顺序包含:编码iREMS的核苷酸序列、编码分支点的核苷酸序列和编码3’剪接位点的核苷酸序列,其中编码iREMS的核苷酸序列包含DNA序列GAgtrngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸。
另一方面,本文提供了包含本文所述的人工基因构建体的细胞。
在具体方面,编码iREMS的核苷酸序列包含DNA序列GAgtragu,其中r为腺嘌呤或鸟嘌呤。
在另一个具体方面,编码iREMS的核苷酸序列包含DNA序列NNGAgtrngn(SEQ IDNO:1808),其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸。在具体方面,DNA序列NNGAgtrngn(SEQ ID NO:1808)选自:ANGAgtrngn(SEQ ID NO:1809)、CNGAgtrngn(SEQ IDNO:1810)、GNGAgtrngn(SEQ ID NO:1811)、TNGAgtrngn(SEQ ID NO:1812)、NAGAgtrngn(SEQID NO:1813)、NCGAgtrngn(SEQ ID NO:1814)、NGGAgtrngn(SEQ ID NO:1815)、NTGAgtrngn(SEQ ID NO:1816)、AAGAgtrngn(SEQ ID NO:1817)、ACGAgtrngn(SEQ ID NO:1818)、AGGAgtrngn(SEQ ID NO:1819)、ATGAgtrngn(SEQ ID NO:1820)、CAGAgtrngn(SEQ ID NO:1821)、CCGAgtrngn(SEQ ID NO:1822)、CGGAgtrngn(SEQ ID NO:1823)、CTGAgtrngn(SEQ IDNO:1824)、GAGAgtrngn(SEQ ID NO:1825)、GCGAgtrngn(SEQ ID NO:1826)、GGGAgtrngn(SEQID NO:1827)、GTGAgtrngn(SEQ ID NO:1828)、TAGAgtrngn(SEQ ID NO:1829)、TCGAgtrngn(SEQ ID NO:1830)、TGGAgtrngn(SEQ ID NO:1831)和TTGAgtrngn(SEQ ID NO:1832),其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸。
在另一个具体方面,编码iREMS的核苷酸序列包含DNA序列NNGAgtragu(SEQ IDNO:3609),其中r为腺嘌呤或鸟嘌呤,并且N为任何核苷酸。在具体方面,DNA序列NNGAgtragu(SEQ ID NO:3609)选自:ANGAgtragu(SEQ ID NO:3610)、CNGAgtragu(SEQ ID NO:3611)、GNGAgtragu(SEQ ID NO:3612)、TNGAgtragu(SEQ ID NO:3613)、NAGAgtragu(SEQ ID NO:3614)、NCGAgtragu(SEQ ID NO:3615)、NGGAgtragu(SEQ ID NO:3616)、NTGAgtragu(SEQ IDNO:3617)、AAGAgtragu(SEQ ID NO:3618)、ACGAgtragu(SEQ ID NO:3619)、AGGAgtragu(SEQID NO:3620)、ATGAgtragu(SEQ ID NO:3621)、CAGAgtragu(SEQ ID NO:3622)、CCGAgtragu(SEQ ID NO:3623)、CGGAgtragu(SEQ ID NO:3624)、CTGAgtragu(SEQ ID NO:3625)、GAGAgtragu(SEQ ID NO:3626)、GCGAgtragu(SEQ ID NO:3627)、GGGAgtragu(SEQ ID NO:3628)、GTGAgtragu(SEQ ID NO:3629)、TAGAgtragu(SEQ ID NO:3630)、TCGAgtragu(SEQ IDNO:3631)、TGGAgtragu(SEQ ID NO:3632)和TTGAgtragu(SEQ ID NO:3633),其中r为腺嘌呤或鸟嘌呤,并且N为任何核苷酸。
在某些方面,n为腺嘌呤或鸟嘌呤。
在具体方面,本文所述的前体mRNA转录物不是选自以下的基因的前体mRNA转录物:ABHD10、ADAM12、AKT1、ANXA11、APLP2、APPL2、ARMCX6、ATG5、AXIN1、BAIAP2、CCNB1IP1、CCT7、CEP57、CSF1、DLGAP4、EPN1、ERGIC3、FOXM1、GGCT、GRAMD3、HSD17B4、LARP7、LRRC42、MADD、MAN1B1、MRPL39、PCBP4、PPHLN1、PRKACB、RAB23、RAP1A、RCC1、SMN2、SREK1、STRN3和TNRC6A。
附图说明
图1A-1C.内含子REMS介导的内含外显子剪接的代表性示意图,其中5’ss表示5’剪接位点;3’ss表示3’剪接位点;BP表示剪接分支点;外显子1e和外显子2e表示eExon;并且iExon 1a表示内含外显子。在本文所述的化合物不存在的情况下由内含子REMS介导的剪接事件由连接外显子的实线表示,在本文所述的化合物的存在下由内含子REMS介导的剪接事件由连接外显子和eExon或iExon的虚线表示。
图2A、2B、3A、3B、4A、4B、5A、5B和6A.图2A、2B、3A、3B、4A、4B中显示了用本文所述的化合物处理20个小时的SH-SY5Y细胞中特定基因的iExon的剂量依赖性产生。图5A和5B中显示了用本文所述的化合物处理20个小时的GM04856细胞中特定基因的iExon的剂量依赖性产生。图6A中显示了用本文所述的化合物处理20个小时的SH-SY5Y细胞中基因ELMO2的iExon的剂量依赖性产生。对于每幅附图,总RNA的终点RT-PCR显示每种基因产生的目的条带,如空心箭头和实心箭头所示,其中空心箭头表示其中发生内源野生型剪接的外显子同种型;并且,其中实心箭头表示在mRNA中包含iExon的外显子同种型。在所有情况下,化合物浓度的增加都会导致包含内含子衍生的外显子的迁移较慢的PCR产物的出现,其中看到的其他条带是中间剪接产物。在一些图中,星号(*)表示跳过目标外显子的事件。因此,每种基因的结果证明了统计学显著的剪接事件,所述事件代表与如本文所述的剪接修饰剂化合物组合的内含子REMS的操作的各个方面。
图6B和6C.这些示意图显示了在一种或多种本文所述的化合物的存在下,ELMO2的某些内含外显子同种型的产生,其中每种同种型的存在均显示出统计学显著的剪接事件,所述剪接事件代表了内含子REMS序列相互作用的各个方面,其中显示了在本文所述的化合物的存在下的一个或多个分支点和一个或多个3’剪接位点。
剪接修饰剂的内含子识别元件(iREMS)
一方面,本文提供了一种剪接修饰剂的内含子识别元件(也称为“iREMS”),其具有能够被小分子剪接修饰剂识别的元件,由此相关的iREMS复合物的元件与小分子剪接修饰剂组合在一起影响与剪接体的相互作用,如本文进一步所述。在具体方面,内含子REMS在RNA水平上具有核苷酸序列GAgurngn,其中r为A或G(即,嘌呤核苷酸腺嘌呤或鸟嘌呤)和n为任何核苷酸。在另一个具体方面,内含子REMS在RNA水平上具有核苷酸序列GAguragu,其中r为腺嘌呤或鸟嘌呤。在本文提供的这些具体方面的一个或多个中,n为腺嘌呤或鸟嘌呤。在更具体的方面,内含子REMS在RNA水平上具有核苷酸序列NNGAgurngn(SEQ ID NO:1),其中r为A或G(即,嘌呤核苷酸腺嘌呤或鸟嘌呤)和n或N为任何核苷酸。在另一个更具体的方面,内含子REMS在RNA水平上具有核苷酸序列NNGAguragu(SEQ ID NO:2),其中r为腺嘌呤或鸟嘌呤,并且N为任何核苷酸。在本文提供的这些更具体的方面的一个或多个中,N为腺嘌呤或鸟嘌呤。在另一个具体方面,内含子REMS在内含子分支点和功能性内含子3’剪接位点的下游,其中内含子REMS在RNA水平上包含选自以下的核苷酸序列:ANGAgurngn(SEQ ID NO:4)、CNGAgurngn(SEQ ID NO:5)、GNGAgurngn(SEQ ID NO:6)、UNGAgurngn(SEQ ID NO:7)、NAGAgurngn(SEQ ID NO:8)、NCGAgurngn(SEQ ID NO:9)、NGGAgurngn(SEQ ID NO:10)、NUGAgurngn(SEQ ID NO:11)、AAGAgurngn(SEQ ID NO:12)、ACGAgurngn(SEQ ID NO:13)、AGGAgurngn(SEQ ID NO:14)、AUGAgurngn(SEQ ID NO:15)、CAGAgurngn(SEQ ID NO:16)、CCGAgurngn(SEQ ID NO:17)、CGGAgurngn(SEQ ID NO:18)、CUGAgurngn(SEQ ID NO:19)、GAGAgurngn(SEQ ID NO:20)、GCGAgurngn(SEQ ID NO:21)、GGGAgurngn(SEQ ID NO:22)、GUGAgurngn(SEQ ID NO:23)、UAGAgurngn(SEQ ID NO:24)、UCGAgurngn(SEQ ID NO:25)、UGGAgurngn(SEQ ID NO:52)和UUGAgurngn(SEQ ID NO:53),其中r为A或G(即,嘌呤核苷酸腺嘌呤或鸟嘌呤),并且n或N为任何核苷酸,在本文所述的化合物的存在下,内含子REMS通过所述核苷酸序列充当内含子5’剪接位点,导致REMS的NNGA核苷酸和内含子3’剪接位点直到NNGA核苷酸(含NNGA核苷酸)之间的内含子核苷酸被剪接成作为内含外显子的成熟RNA,以提供非野生型无功能mRNA。在另一个具体方面,内含子REMS在内含子分支点和功能性内含子3’剪接位点的上游,其中内含子REMS在RNA水平上包含选自以下的核苷酸序列:ANGAgurngn(SEQ ID NO:4)、CNGAgurngn(SEQ ID NO:5)、GNGAgurngn(SEQ ID NO:6)、UNGAgurngn(SEQ ID NO:7)、NAGAgurngn(SEQ ID NO:8)、NCGAgurngn(SEQ ID NO:9)、NGGAgurngn(SEQ ID NO:10)、NUGAgurngn(SEQ ID NO:11)、AAGAgurngn(SEQ ID NO:12)、ACGAgurngn(SEQ ID NO:13)、AGGAgurngn(SEQ ID NO:14)、AUGAgurngn(SEQ ID NO:15)、CAGAgurngn(SEQ ID NO:16)、CCGAgurngn(SEQ ID NO:17)、CGGAgurngn(SEQ ID NO:18)、CUGAgurngn(SEQ ID NO:19)、GAGAgurngn(SEQ ID NO:20)、GCGAgurngn(SEQ ID NO:21)、GGGAgurngn(SEQ ID NO:22)、GUGAgurngn(SEQ ID NO:23)、UAGAgurngn(SEQ ID NO:24)、UCGAgurngn(SEQ ID NO:25)、UGGAgurngn(SEQ ID NO:52)和UUGAgurngn(SEQ ID NO:53),其中r为A或G(即,嘌呤核苷酸腺嘌呤或鸟嘌呤),并且n或N为任何核苷酸,在本文所述的化合物的存在下,内含子REMS通过所述核苷酸序列充当内含子5’剪接位点,导致REMS的NNGA核苷酸和内含子3’剪接位点直到NNGA核苷酸(含NNGA核苷酸)之间的内含子核苷酸被剪接成作为内含外显子的成熟RNA,以提供非野生型无功能mRNA。在优选的方面,所述REMS在RNA水平上具有选自以下的核苷酸序列:ANGAguragu(SEQ ID NO:28)、CNGAguragu(SEQ ID NO:29)、GNGAguragu(SEQ ID NO:30)、UNGAguragu(SEQ ID NO:31)、NAGAguragu(SEQ ID NO:32)、NCGAguragu(SEQ ID NO:33)、NGGAguragu(SEQ ID NO:34)、NUGAguragu(SEQ ID NO:35)、AAGAguragu(SEQ ID NO:36)、ACGAguragu(SEQ ID NO:37)、AGGAguragu(SEQ ID NO:38)、AUGAguragu(SEQ ID NO:39)、CAGAguragu(SEQ ID NO:40)、CCGAguragu(SEQ ID NO:41)、CGGAguragu(SEQ ID NO:42)、CUGAguragu(SEQ ID NO:43)、GAGAguragu(SEQ ID NO:44)、GCGAguragu(SEQ ID NO:45)、GGGAguragu(SEQ ID NO:46)、GUGAguragu(SEQ ID NO:47)、UAGAguragu(SEQ ID NO:48)、UCGAguragu(SEQ ID NO:49)、UGGAguragu(SEQ ID NO:489)和UUGAguragu(SEQ ID NO:508),其中r为A或G(即,嘌呤核苷酸腺嘌呤或鸟嘌呤),并且N为任何核苷酸。在本文提供的一个或多个方面,N为腺嘌呤或鸟嘌呤。
在DNA的情况下,在具体方面,编码内含子REMS的核苷酸序列具有序列Gagtrngn,其中r为A或G(即,嘌呤核苷酸腺嘌呤或鸟嘌呤),并且n为任何核苷酸。在另一个具体方面,在DNA的情况下,编码内含子REMS的核苷酸序列具有序列Gagtragt,其中r为腺嘌呤或鸟嘌呤。在具体方面,在DNA的情况下,编码内含子REMS的核苷酸序列具有序列NNGAgtrngn(SEQID NO:1808),其中r为A或G(即,嘌呤核苷酸腺嘌呤或鸟嘌呤),并且n或N为任何核苷酸。在另一个具体方面,在DNA的情况下,编码内含子REMS的核苷酸序列具有序列NNGAgtragt(SEQID NO:3634),其中r为腺嘌呤或鸟嘌呤,并且N为任何核苷酸。在具体方面,在DNA的情况下,编码内含子REMS的核苷酸序列包含选自以下的序列:ANGAgtrngn(SEQ ID NO:1809)、CNGAgtrngn(SEQ ID NO:1810)、GNGAgtrngn(SEQ ID NO:1811)、TNGAgtrngn(SEQ ID NO:1812)、NAGAgtrngn(SEQ ID NO:1813)、NCGAgtrngn(SEQ ID NO:1814)、NGGAgtrngn(SEQ IDNO:1815)、NTGAgtrngn(SEQ ID NO:1816)、AAGAgtrngn(SEQ ID NO:1817)、ACGAgtrngn(SEQID NO:1818)、AGGAgtrngn(SEQ ID NO:1819)、ATGAgtrngn(SEQ ID NO:1820)、CAGAgtrngn(SEQ ID NO:1821)、CCGAgtrngn(SEQ ID NO:1822)、CGGAgtrngn(SEQ ID NO:1823)、CTGAgtrngn(SEQ ID NO:1824)、GAGAgtrngn(SEQ ID NO:1825)、GCGAgtrngn(SEQ ID NO:1826)、GGGAgtrngn(SEQ ID NO:1827)、GTGAgtrngn(SEQ ID NO:1828)、TAGAgtrngn(SEQ IDNO:1829)、TCGAgtrngn(SEQ ID NO:1830)、TGGAgtrngn(SEQ ID NO:1831)和TTGAgtrngn(SEQ ID NO:1832),其中r为A或G(即,嘌呤核苷酸腺嘌呤或鸟嘌呤),并且n或N为任何核苷酸。在优选的方面,在DNA的情况下,编码内含子REMS的核苷酸序列包含选自以下的序列:ANGAgtragt(SEQ ID NO:1833)、CNGAgtragt(SEQ ID NO:1834)、GNGAgtragt(SEQ ID NO:1835)、TNGAgtragt(SEQ ID NO:1836)、NAGAgtragt(SEQ ID NO:1837)、NCGAgtragt(SEQ IDNO:1838)、NGGAgtragt(SEQ ID NO:1839)、NTGAgtragt(SEQ ID NO:1840)、AAGAgtragt(SEQID NO:1841)、ACGAgtragt(SEQ ID NO:1842)、AGGAgtragt(SEQ ID NO:1843)、ATGAgtragt(SEQ ID NO:1844)、CAGAgtragt(SEQ ID NO:1845)、CCGAgtragt(SEQ ID NO:1846)、CGGAgtragt(SEQ ID NO:1847)、CTGAgtragt(SEQ ID NO:1848)、GAGAgtragt(SEQ ID NO:1849)、GCGAgtragt(SEQ ID NO:1850)、GGGAgtragt(SEQ ID NO:1851)、GTGAgtragt(SEQ IDNO:1852)、TAGAgtragt(SEQ ID NO:1853)、TCGAgtragt(SEQ ID NO:1854)、TGGAgtragt(SEQID NO:1855)和TTGAgtragt(SEQ ID NO:1856),其中r为腺嘌呤或鸟嘌呤,并且N为任何核苷酸。在本文提供的一个或多个方面,N为腺嘌呤或鸟嘌呤。
内含子REMS可以是内源RNA的部分,或可以被引入不天然包含内含子REMS序列的RNA序列中(在这种情况下,引入的内含子REMS是非内源内含子REMS,即内含子REMS不天然存在于相应的RNA中)。编码内含子REMS的核苷酸序列也可以是内源DNA序列的部分,或编码内含子REMS的核苷酸序列可以被引入不天然包含编码内含子REMS的核苷酸序列的DNA序列中。
在具体方面,REMS位于内含子中,并且在分支点和功能性3’剪接位点的上游,这在小分子剪接修饰剂的存在下使得REMS能够充当5’剪接位点。不受任何理论或机制的束缚,本文所述的小分子化合物已显示出可增加U1 snRNP以及前体mRNA剪接机制的其他组分与REMS的核苷酸NNGA之间的相互作用的亲和力,由此,在该化合物存在下,内含子REMS充当U1snRNP结合位点,导致内含子核苷酸被剪接为内含外显子。
化合物用途
一方面,本文提供了用于本文所述的方法的式(I)的化合物:
Figure BDA0002383691000001621
或其形式,其中
W为CH=CH或S;
X为CH2、CH(C1-4烷基)、C(C1-4烷基)2、CH=CH、O、NR5或键;
A为芳基、杂芳基、杂环基或C9-10环烷基,
其中芳基选自苯基和萘基,其各自任选地被1、2、3或4个各自选自R1的取代基取代,
其中杂芳基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R1的取代基取代,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R2的取代基取代,和
其中C9-10环烷基为任选地被1、2、3、4或5个各自选自R2的取代基取代的饱和或部分不饱和二环环系;
B为杂环基,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或多环环系,其各自任选地被1、2、3、4或5个各自选自R4的取代基取代;
R1为卤素、羟基、氰基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、杂环基-C1-4烷氧基、苯基或苯基-C1-4烷氧基,
其中杂芳基为具有1、2或3个选自N、O和S的杂原子环成员的饱和单环或二环环系,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中苯基、杂芳基或杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R2为卤素、羟基、氰基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、羟基-C1-4烷基、C1-4烷氧基、C1-4烷氧基-羰基、C2-4烯基、C3-7环烷基或杂环基-C1-4烷基,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R3为卤素、羟基、硝基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、苯基或苯基-C1-4烷氧基;
R4独立地选自卤素、C1-4烷基、羟基-C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基或羟基-C1-4烷基-氨基;和
R5为氢、C1-4烷基或羟基-C1-4烷基;
其中化合物的形式选自其前药、盐、水合物、溶剂化物、包合物、同位素体、外消旋体、对映异构体、非对映异构体、立体异构体、多晶型物和互变异构体形式。
另一方面,本文提供了用于本文所述的方法的式(I)的化合物,其选自式(Ia)和式(Ib)的化合物:
Figure BDA0002383691000001641
或其形式,其中
X为CH2、CH(C1-4烷基)、C(C1-4烷基)2、CH=CH、O、NR5或键;
A为芳基、杂芳基、杂环基或C9-10环烷基,
其中芳基选自苯基和萘基,其各自任选地被1、2、3或4个各自选自R1的取代基取代,
其中杂芳基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R1的取代基取代,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R2的取代基取代,和
其中C9-10环烷基为任选地被1、2、3、4或5个各自选自R2的取代基取代的饱和或部分不饱和二环环系;
B为杂环基,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或多环环系,其各自任选地被1、2、3、4或5个各自选自R4的取代基取代;
R1为卤素、羟基、氰基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、杂环基-C1-4烷氧基、苯基或苯基-C1-4烷氧基,
其中杂芳基为具有1、2或3个选自N、O和S的杂原子环成员的饱和单环或二环环系,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中苯基、杂芳基或杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R2为卤素、羟基、氰基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、氨基-羰基、羟基-C1-4烷基、C1-4烷氧基、C1-4烷氧基-羰基、C2-4烯基、C3-7环烷基或杂环基-C1-4烷基;
R3为卤素、羟基、硝基、氧代基、羟基-亚氨基、C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、苯基或苯基-C1-4烷氧基;
R4独立地选自卤素、C1-4烷基、羟基-C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基或羟基-C1-4烷基-氨基;和
R5为氢、C1-4烷基或羟基-C1-4烷基;
其中化合物的形式选自其前药、盐、水合物、溶剂化物、包合物、同位素体、外消旋体、对映异构体、非对映异构体、立体异构体、多晶型物和互变异构体形式。
另一方面,本文提供了用于本文所述的方法的式(I)的化合物,其选自式(Ia)和式(Ib)的化合物:
Figure BDA0002383691000001661
或其形式,其中
X为O、NH、N(CH3)或键;
A为芳基、杂芳基或杂环基,
其中芳基选自:
Figure BDA0002383691000001662
其中杂芳基选自:
Figure BDA0002383691000001663
Figure BDA0002383691000001671
Figure BDA0002383691000001681
其中杂环基选自:
Figure BDA0002383691000001682
B为选自以下的杂环基:
Figure BDA0002383691000001683
Figure BDA0002383691000001691
Figure BDA0002383691000001701
在可用化合价允许的情况下,R1a、R1b和R1c各自为一个或多个取代基,所述取代基各自选自卤素、羟基、氰基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、杂环基-C1-4烷氧基、苯基或苯基-C1-4烷氧基,
其中杂芳基为具有1、2或3个选自N、O和S的杂原子环成员的饱和单环或二环环系,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中苯基、杂芳基或杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
在可用化合价允许的情况下,R2a、R2b和R2c各自为一个或多个取代基,所述取代基各自选自卤素、羟基、氰基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、羟基-C1-4烷基、C1-4烷氧基、C1-4烷氧基-羰基、C2-4烯基、C3-7环烷基或杂环基-C1-4烷基,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R3为卤素、羟基、硝基、氧代基、羟基-亚氨基、C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、苯基或苯基-C1-4烷氧基;和
R4a、R4b、R4c、R4d、R4e、R4f和R4g独立地选自卤素、C1-4烷基、羟基-C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基或羟基-C1-4烷基-氨基;
其中化合物的形式选自其前药、盐、水合物、溶剂化物、包合物、同位素体、外消旋体、对映异构体、非对映异构体、立体异构体、多晶型物和互变异构体形式。
另一方面,本文提供了用于本文所述的方法的式(I)的化合物,其中所述式(I)的化合物选自式(Ia11)、式(Ia15)、式(Ia18)或式(Ib1)的化合物:
Figure BDA0002383691000001721
或其形式,其中(当存在时),
X选自O、NR5或键;
A选自苯基、噻吩基、吲唑基、吡啶基、嘧啶基或苯氧基,
其中苯基和苯氧基各自任选地被1、2或3个各自选自R1a的取代基取代,
其中噻吩基、吲唑基、吡啶基、嘧啶基各自任选地被1或2个各自选自R1a的取代基取代,
B选自1H-吡唑基、哌啶基、1,2,3,6-四氢吡啶基、(1R,5S)-8-氮杂双环[3.2.1]辛基、8-氮杂双环[3.2.1]辛-2-烯基、2,6-二氮杂螺[3.4]辛基或2,7-二氮杂螺[3.5]壬基,其各自任选地被1或2个各自选自R4a的取代基取代;
R1a选自卤素、羟基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷氧基或杂芳基,
其中杂芳基为具有1、2或3个选自N、O和S的杂原子环成员的饱和单环或二环环系,其任选地被1或2个各自选自R3a的取代基取代;
R3a选自硝基或C1-4烷基;和
R4a为C1-4烷基;
R5a为氢、C1-4烷基或羟基-C1-4烷基;
其中化合物的形式选自其前药、盐、水合物、溶剂化物、包合物、同位素体、外消旋体、对映异构体、非对映异构体、立体异构体、多晶型物和互变异构体形式。
本说明书的另一方面涉及涉及式(I)的化合物,其选自式(Ia11)、式(Ia15)、式(Ia18)或式(Ib1)的化合物,
或其形式,其中(当存在时),
R1a选自氟、氯、羟基、甲基、二氟甲基、氨基、甲氧基或1H-吡唑基或1H-咪唑-1-基,
其中1H-吡唑基任选地被1或2个各自选自R3a的取代基取代;
R3a选自硝基或甲基或氨基;和
R4a为甲基或乙基;
R5a为氢或甲基;
其中化合物的形式选自其前药、盐、水合物、溶剂化物、包合物、同位素体、外消旋体、对映异构体、非对映异构体、立体异构体、多晶型物和互变异构体形式。
另一方面,本文提供了用于本文所述的方法的式(Ia)的化合物或其形式,其中所述化合物选自式(Ia1)的化合物或其形式,其中取代基R1a、R1b和X当存在时显示在下表中,其中多个取代基用逗号隔开;“--”表示一个或多个R1a、R1b和X取代基不存在:
Figure BDA0002383691000001731
Figure BDA0002383691000001732
另一方面,本文提供了用于本文所述的方法的式(Ia)的化合物或其形式,其中所述化合物选自式(Ia2)的化合物或其形式,其中取代基R1a、R1b和R4a当存在时显示在下表中,其中多个取代基用逗号隔开;并且“--”表示一个或多个R1a、R1b和R4a取代基不存在:
Figure BDA0002383691000001741
Figure BDA0002383691000001742
Figure BDA0002383691000001751
另一方面,本文提供了用于本文所述的方法的式(Ia)的化合物或其形式,其中所述化合物选自式(Ia3)的化合物或其形式,其中取代基R1a、R1b和X当存在时显示在下表中,其中多个取代基用逗号隔开;并且“--”表示一个或多个R1a、R1b和X取代基不存在:
Figure BDA0002383691000001752
Figure BDA0002383691000001753
另一方面,本文提供了用于本文所述的方法的式(Ia)的化合物或其形式,其中所述化合物选自式(Ia4)的化合物或其形式,其中取代基X、R1a、R1b和R4a当存在时显示在下表中;并且“--”表示一个或多个X、R1a、R1b和R4a取代基不存在:
Figure BDA0002383691000001761
Figure BDA0002383691000001762
另一方面,本文提供了用于本文所述的方法的式(Ia)的化合物或其形式,其中所述化合物选自式(Ia5)的化合物或其形式,其中取代基R1a和R1b当存在时显示在下表中,其中多个取代基用逗号隔开;并且“--”表示一个或多个R1a和R1b取代基不存在:
Figure BDA0002383691000001763
Figure BDA0002383691000001771
Figure BDA0002383691000001772
另一方面,本文提供了用于本文所述的方法的式(Ia)的化合物或其形式,其中所述化合物选自式(Ia6)的化合物或其形式,其中取代基R1a当存在时显示在下表中;并且“--”表示一个或多个R1a取代基不存在:
Figure BDA0002383691000001773
Figure BDA0002383691000001774
另一方面,本文提供了用于本文所述的方法的式(Ia)的化合物或其形式,其中所述化合物选自式(Ia7)的化合物或其形式,其中取代基R1a当存在时显示在下表中;并且“--”表示一个或多个R1a取代基不存在:
Figure BDA0002383691000001775
Cpd R<sub>1a</sub>
258 --
260 2-CH<sub>3</sub>
另一方面,本文提供了用于本文所述的方法的式(Ia)的化合物或其形式,其中所述化合物选自式(Ia8)的化合物或其形式,其中取代基R1a和B当存在时显示在下表中;并且“--”表示一个或多个R1a和B取代基不存在:
Figure BDA0002383691000001781
Figure BDA0002383691000001782
另一方面,本文提供了用于本文所述的方法的式(Ia)的化合物或其形式,其中所述化合物选自式(Ia9)的化合物或其形式,其中取代基R1a和B当存在时显示在下表中;并且“--”表示一个或多个R1a和B取代基不存在:
Figure BDA0002383691000001783
Cpd R<sub>1a</sub> B
214 -- 6-((3aR,6aS)-5-CH<sub>3</sub>-六氢吡咯并[3,4-c]吡咯-2(1H)-基)
270 -- 哌嗪-1-基
291 3-CH<sub>3</sub> 哌嗪-1-基
另一方面,本文提供了用于本文所述的方法的式(Ia)的化合物或其形式,其中所述化合物选自式(Ia10)的化合物或其形式,其中取代基R1a和B当存在时显示在下表中;并且“--”表示一个或多个R1a和B取代基不存在:
Figure BDA0002383691000001784
Cpd R<sub>1a</sub> B
268 2-CN 哌嗪-1-基
271 -- 1,2,3,6-四氢吡啶-4-基
另一方面,本文提供了用于本文所述的方法的式(Ia)的化合物或其形式,其中所述化合物选自式(Ia11)的化合物或其形式,其中取代基A、X和R4a当存在时显示在下表中;并且“--”表示一个或多个A、X和R4a取代基不存在:
Figure BDA0002383691000001791
Figure BDA0002383691000001792
Figure BDA0002383691000001801
Figure BDA0002383691000001811
Figure BDA0002383691000001821
另一方面,本文提供了用于本文所述的方法的式(Ia)的化合物或其形式,其中所述化合物选自式(Ia11)的化合物或其形式,其中取代基A、X和R4a当存在时显示在下表中;并且“--”表示一个或多个A、X和R4a取代基不存在:
Figure BDA0002383691000001822
Figure BDA0002383691000001823
Figure BDA0002383691000001832
另一方面,本文提供了用于本文所述的方法的式(Ia)的化合物或其形式,其中所述化合物选自式(Ia11)的化合物或其形式,其中取代基A、X和R4a当存在时显示在下表中;并且“--”表示一个或多个A、X和R4a取代基不存在:
Figure BDA0002383691000001831
Figure BDA0002383691000001833
Figure BDA0002383691000001843
另一方面,本文提供了用于本文所述的方法的式(Ia)的化合物或其形式,其中所述化合物选自式(Ia12)的化合物或其形式,其中取代基X、R1a和B当存在时显示在下表中;并且“--”表示一个或多个X、R1a和B取代基不存在:
Figure BDA0002383691000001841
Figure BDA0002383691000001842
另一方面,本文提供了用于本文所述的方法的式(Ia)的化合物或其形式,其中所述化合物选自式(Ia13)的化合物或其形式,其中取代基X、R1a和R4a当存在时显示在下表中;并且“--”表示一个或多个X、R1a和R4a取代基不存在:
Figure BDA0002383691000001851
Cpd X R<sub>1a</sub> R<sub>4a</sub>
26 N(CH<sub>3</sub>) H H
28 NH H H
31 O H H
90 O OH H
91 N(CH<sub>3</sub>) OH H
92 NH OH H
93 N(CH<sub>3</sub>) O(CH<sub>2</sub>)<sub>3</sub>NHCO<sub>2</sub>C(CH<sub>3</sub>)<sub>3</sub> H
94 N(CH<sub>3</sub>) O(CH<sub>2</sub>)<sub>3</sub>NH<sub>2</sub> H
95 N(CH<sub>3</sub>) O(CH<sub>2</sub>)<sub>3</sub>NHCO<sub>2</sub>CH<sub>3</sub> H
96 N(CH<sub>3</sub>) O(CH<sub>2</sub>)<sub>3</sub>OH H
97 N(CH<sub>3</sub>) O(CH<sub>2</sub>)<sub>3</sub>OCH<sub>3</sub> H
98 O O(CH<sub>2</sub>)<sub>3</sub>-吗啉-4-基 H
103 N(CH<sub>3</sub>) CN H
104 N(CH<sub>3</sub>) CH<sub>2</sub>-1-哌啶基 H
105 N(CH<sub>3</sub>) CH<sub>2</sub>-吡咯烷-1-基 H
108 N(CH<sub>3</sub>) OCH<sub>3</sub> H
109 N(CH<sub>3</sub>) OCH<sub>3</sub> CH<sub>3</sub>
110 N(CH<sub>3</sub>) 3,6-二氢-2H-吡喃-4-基 H
111 N(CH<sub>3</sub>) 四氢-2H-吡喃-4-基 H
112 N(CH<sub>3</sub>) CHF<sub>2</sub> H
113 N(CH<sub>3</sub>) OC(CH<sub>3</sub>)<sub>2</sub>(CH<sub>2</sub>)<sub>2</sub>OH H
114 N(CH<sub>3</sub>) O(CH<sub>2</sub>)<sub>2</sub>C(CH<sub>3</sub>)<sub>2</sub>OH H
另一方面,本文提供了用于本文所述的方法的式(Ia)的化合物或其形式,其中所述化合物选自式(Ia14)的化合物或其形式,其中取代基X和B当存在时显示在下表中;并且“--”表示一个或多个X和B取代基不存在:
Figure BDA0002383691000001852
Cpd X B
55 O 哌啶-4-基
56 O (2S,4R,6R)-2,6-(CH<sub>3</sub>)<sub>2</sub>-哌啶-4-基
57 O 2,6-(CH<sub>3</sub>)<sub>2</sub>-哌啶-4-基
58 O 吡咯烷-3-基
59 O 2-CH<sub>3</sub>-哌啶-4-基
60 OCH<sub>2</sub> 1H-吡咯烷-3-基
61 O 3-F-哌啶-4-基
65 -- 哌嗪-1-基
67 NH 氮杂环丁-3-基
68 -- 3,5-(CH<sub>3</sub>)<sub>2</sub>-哌嗪-1-基
69 -- 7-CH<sub>3</sub>-2,7-二氮杂螺[4.4]壬-2-基
70 -- [1,4]二氮杂环庚-1-基
71 -- 4-CH<sub>2</sub>CH<sub>2</sub>OH-哌嗪-1-基
72 -- 2,7-二氮杂螺[3.5]壬-7-基
73 -- 2,7-二氮杂螺[3.5]壬-7-基
74 -- 3-CH<sub>2</sub>OH-哌嗪-1-基
75 -- 1,7-二氮杂螺[4.4]壬-7-基
76 -- 4-NH<sub>2</sub>-4-CH<sub>3</sub>-哌啶-1-基
77 -- 3-N(CH<sub>3</sub>)<sub>2</sub>-哌啶-1-基
79 -- 3,3-(CH<sub>3</sub>)<sub>2</sub>-哌嗪-1-基
80 -- 7-CH<sub>2</sub>CH<sub>2</sub>OH-2,7-二氮杂螺[4.4]-壬烷-2-基
83 -- 1,2,3,6-四氢吡啶-4-基
84 -- 哌啶-4-基
102 O (6S)-6-[(S)-CH(OH)CH<sub>3</sub>]-2,2-(CH<sub>3</sub>)<sub>2</sub>-哌啶-4-基
133 O 2,2-(CH<sub>3</sub>)<sub>2</sub>-哌啶-4-基
另一方面,本文提供了用于本文所述的方法的式(Ia)的化合物或其形式,其中所述化合物选自式(Ia15)的化合物或其形式,其中取代基X、R1a和R4a当存在时显示在下表中;并且“--”表示一个或多个X、R1a和R4a取代基不存在:
Figure BDA0002383691000001861
Figure BDA0002383691000001871
Figure BDA0002383691000001872
Figure BDA0002383691000001881
另一方面,本文提供了用于本文所述的方法的式(Ia)的化合物或其形式,其中所述化合物选自式(Ia15)的化合物或其形式,其中取代基X、R1a和R4a当存在时显示在下表中;并且“--”表示一个或多个X、R1a和R4a取代基不存在:
Figure BDA0002383691000001891
Cpd X R<sub>1a</sub>
413 NH 1H-吡唑-4-基
414 O 1-CH<sub>3</sub>-1H-吡唑-4-基
416 N(CH<sub>3</sub>) 5-CH<sub>3</sub>-1H-吡唑-4-基
417 O 1H-咪唑-1-基
418 O 5-CH<sub>3</sub>-1H-吡唑-4-基
419 N(CH<sub>3</sub>) 4-NO<sub>2</sub>-1H-吡唑-1-基
421 O 4-NH<sub>2</sub>-1H-吡唑-1-基
423 O 4-NO<sub>2</sub>-1H-吡唑-1-基
460 N(CH<sub>3</sub>) 1H-吡唑-4-基
461 O 1H-吡唑-4-基
另一方面,本文提供了用于本文所述的方法的式(Ia)的化合物或其形式,其中所述化合物选自式(Ia16)的化合物或其形式,其中取代基R1a和R4a当存在时显示在下表中;并且“--”表示一个或多个R1a和R4a取代基不存在:
Figure BDA0002383691000001892
Figure BDA0002383691000001893
另一方面,本文提供了用于本文所述的方法的式(Ia)的化合物或其形式,其中所述化合物选自式(Ia17)的化合物或其形式,其中取代基R1a当存在时显示在下表中;并且“--”表示一个或多个R1a取代基不存在:
Figure BDA0002383691000001901
Cpd R<sub>1a</sub>
204 1H-吡唑-4-基
205 4-(1-CH<sub>3</sub>-吡啶-2(1H)-酮)
另一方面,本文提供了用于本文所述的方法的式(Ia)的化合物或其形式,其中所述化合物选自式(Ia18)的化合物或其形式,其中取代基X和B当存在时显示在下表中;并且“--”表示一个或多个X和B取代基不存在:
Figure BDA0002383691000001902
Figure BDA0002383691000001903
Figure BDA0002383691000001913
另一方面,本文提供了用于本文所述的方法的式(Ia)的化合物或其形式,其中所述化合物选自式(Ia18)的化合物或其形式,其中取代基X、R1a和B当存在时显示在下表中;并且“--”表示一个或多个X、R1a和B取代基不存在:
Figure BDA0002383691000001911
Figure BDA0002383691000001912
另一方面,本文提供了用于本文所述的方法的式(Ib)的化合物或其形式,其中所述化合物选自式(Ib1)的化合物或其形式,其中取代基A显示在下表中:
Figure BDA0002383691000001921
Cpd A
302 6-(萘-2-醇)
320 6-(萘-2,7-二醇)
331 7-OCH<sub>3</sub>-喹啉-6-基
332 7-OH-喹啉-6-基
337 2-CN-7-OCH<sub>3</sub>-喹啉-6-基
355 3-F-5-(1H-吡唑-4-基)-吡啶-2-基
364 2-(6-OCH<sub>3</sub>-3,4-二氢异喹啉-1(2H)-酮)
392 6-OH-1-氧代基-2,3-二氢-1H-茚基-5-基
401 3-(4-OCH<sub>3</sub>-1-CH<sub>3</sub>-喹啉-2(1H)-酮)
402 3-(4-OH-1-CH<sub>3</sub>-喹啉-2(1H)-酮)
403 3-(喹啉-2(1H)-酮)
404 3-(1-OCH<sub>3</sub>-喹啉-2(1H)-酮)
408 5-CN-苯并[b]噻吩-2-基
409 3-Cl-苯并[b]噻吩-2-基
另一方面,本文提供了用于本文所述的方法的式(Ib)的化合物或其形式,其中所述化合物选自式(Ib1)的化合物或其形式,其中取代基A显示在下表中:
Cpd A
462 3-(1H-吡唑-4-基)苯氧基
463 4-(1H-吡唑-4-基)苯氧基
另一方面,本文提供了用于本文所述的方法的式(Ib)的化合物或其形式,其中所述化合物选自式(Ib1)的化合物或其形式,其中取代基A显示在下表中:
Figure BDA0002383691000001922
Cpd A
462 3-(1H-吡唑-4-基)苯氧基
463 4-(1H-吡唑-4-基)苯氧基
另一方面,本文提供了用于本文所述的方法的式(Ib)的化合物或其形式,其中所述化合物选自式(Ib2)的化合物或其形式,其中取代基A显示在下表中:
Figure BDA0002383691000001931
Cpd A
321 6-萘-2,7-二醇
另一方面,本文提供了用于本文所述的方法的式(Ib)的化合物或其形式,其中所述化合物选自式(Ib3)的化合物或其形式,其中取代基R1a、R1b和B当存在时显示在下表中;并且“--”表示一个或多个R1a、R1b和B取代基不存在:
Figure BDA0002383691000001932
Figure BDA0002383691000001933
另一方面,本文提供了用于本文所述的方法的式(Ib)的化合物或其形式,其中所述化合物选自式(Ib4)的化合物或其形式,其中取代基R1a、R1b、R1c、R1d(各自表示R1的范围)和X当存在时显示在下表中;并且“--”表示一个或多个R1a、R1b、R1c、R1d和X取代基不存在:
Figure BDA0002383691000001941
Figure BDA0002383691000001942
Figure BDA0002383691000001951
Figure BDA0002383691000001962
另一方面,本文提供了用于本文所述的方法的式(Ib)的化合物或其形式,其中所述化合物选自式(Ib5)的化合物或其形式,其中取代基R1a、R1b、R1c、R1d(各自表示R1的范围)和R4a当存在时显示在下表中;并且“--”表示一个或多个R1a、R1b、R1c、R1d和R4a取代基不存在:
Figure BDA0002383691000001961
Cpd R<sub>1a</sub> R<sub>1b</sub> R<sub>1c</sub> R<sub>1d</sub> R<sub>4a</sub>
353 1H-吡唑-4-基 F F H --
362 1H-吡唑-4-基 OCH<sub>3</sub> H F CH<sub>3</sub>
370 1H-咪唑-1-基 Cl H H CH<sub>3</sub>
379 1-CH<sub>3</sub>-1H-吡唑-4-基 Cl H H CH<sub>3</sub>
380 1H-吡唑-4-基 Cl H H CH<sub>3</sub>
384 1H-吡唑-4-基 F H H CH<sub>3</sub>
396 1H-吡唑-4-基 F H OH --
405 1H-吡唑-4-基 Cl H H --
另一方面,本文提供了用于本文所述的方法的式(Ib)的化合物或其形式,其中所述化合物选自式(Ib6)的化合物或其形式,其中取代基R1a、R1b、R1c和R1d(各自表示R1的范围)当存在时显示在下表中;并且“--”表示一个或多个R1a、R1b、R1c和R1d取代基不存在:
Figure BDA0002383691000001971
Cpd R<sub>1a</sub> R<sub>1b</sub> R<sub>1c</sub> R<sub>1d</sub>
386 1-CH<sub>3</sub>-1H-吡唑-4-基 OCH<sub>3</sub> H H
395 1-CH<sub>3</sub>-1H-吡唑-4-基 OH H H
399 1H-吡唑-4-基 H F F
400 1H-吡唑-4-基 OH H F
另一方面,本文提供了用于本文所述的方法的式(Ib)的化合物或其形式,其中所述化合物选自式(Ib7)的化合物或其形式,其中取代基R1b当存在时显示在下表中:
Figure BDA0002383691000001972
Cpd R<sub>1b</sub>
304 OCH<sub>3</sub>
322 OH
另一方面,本文提供了用于本文所述的方法的式(Ib)的化合物或其形式,其中所述化合物选自式(Ib8)的化合物或其形式,其中取代基R1b当存在时显示在下表中:
Figure BDA0002383691000001973
Cpd R<sub>1b</sub>
303 OCH<sub>3</sub>
323 OH
化合物的制备
本文提供的化合物可以由本领域技术人员制备,例如通过在以下文献中阐述的合成方法制备:2013年8月13日提交的第PCT/US2013/054687号国际申请,于2014年2月20日以国际公开号WO2014/028459公开;2014年1月23日提交的第PCT/US2014/012774号国际申请,于2014年7月31日以国际公开号WO2014/116845A1公开;2014年7月30日提交的第PCT/US2014/048984号国际申请,于2015年2月5日以国际公开号WO2015/017589公开;和2016年12月11日提交的第PCT/US2016/066042号国际申请,于2017年6月5日以国际公开号WO2017/100726公开,其各自通过引用整体并入本文,如同在本文中完整阐述一样。
一方面,用于本文公开的方法的式(I)的化合物是选自以下的化合物:
Figure BDA0002383691000001981
Figure BDA0002383691000001991
Figure BDA0002383691000002001
Figure BDA0002383691000002011
Figure BDA0002383691000002021
Figure BDA0002383691000002031
Figure BDA0002383691000002041
Figure BDA0002383691000002051
Figure BDA0002383691000002061
Figure BDA0002383691000002071
Figure BDA0002383691000002081
Figure BDA0002383691000002091
Figure BDA0002383691000002101
Figure BDA0002383691000002111
Figure BDA0002383691000002121
Figure BDA0002383691000002131
Figure BDA0002383691000002141
Figure BDA0002383691000002151
Figure BDA0002383691000002161
Figure BDA0002383691000002171
Figure BDA0002383691000002181
Figure BDA0002383691000002191
Figure BDA0002383691000002201
Figure BDA0002383691000002211
Figure BDA0002383691000002221
Figure BDA0002383691000002231
Figure BDA0002383691000002241
Figure BDA0002383691000002251
Figure BDA0002383691000002261
Figure BDA0002383691000002271
Figure BDA0002383691000002281
Figure BDA0002383691000002291
Figure BDA0002383691000002301
Figure BDA0002383691000002311
Figure BDA0002383691000002321
Figure BDA0002383691000002331
Figure BDA0002383691000002341
Figure BDA0002383691000002351
Figure BDA0002383691000002361
Figure BDA0002383691000002371
Figure BDA0002383691000002381
Figure BDA0002383691000002391
其中化合物的形式选自其前药、盐、水合物、溶剂化物、包合物、同位素体、外消旋体、对映异构体、非对映异构体、立体异构体、多晶型物和互变异构体形式。
另一方面,用于本文公开的方法的式(I)的化合物是选自以下的化合物:
Figure BDA0002383691000002392
Figure BDA0002383691000002401
Figure BDA0002383691000002411
Figure BDA0002383691000002421
Figure BDA0002383691000002431
Figure BDA0002383691000002441
Figure BDA0002383691000002451
其中化合物的形式选自其前药、盐、水合物、溶剂化物、包合物、同位素体、外消旋体、对映异构体、非对映异构体、立体异构体、多晶型物和互变异构体形式。
另一方面,用于本文公开的方法的式(I)的化合物或其形式是选自以下的式(I)的化合物或其形式(其中化合物编号(#1)表示盐形式为分离的):
Figure BDA0002383691000002452
Figure BDA0002383691000002461
Figure BDA0002383691000002471
Figure BDA0002383691000002481
Figure BDA0002383691000002491
Figure BDA0002383691000002501
Figure BDA0002383691000002511
Figure BDA0002383691000002521
Figure BDA0002383691000002531
Figure BDA0002383691000002541
Figure BDA0002383691000002551
Figure BDA0002383691000002561
Figure BDA0002383691000002571
Figure BDA0002383691000002581
其中化合物的形式选自其前药、盐、水合物、溶剂化物、包合物、同位素体、外消旋体、对映异构体、非对映异构体、立体异构体、多晶型物和互变异构体形式。
另一方面,用于本文公开的方法的式(I)的化合物或其形式是选自以下的化合物:
Figure BDA0002383691000002582
Figure BDA0002383691000002591
Figure BDA0002383691000002601
其中化合物的形式选自其前药、盐、水合物、溶剂化物、包合物、同位素体、外消旋体、对映异构体、非对映异构体、立体异构体、多晶型物和互变异构体形式。
另一方面,用于本文公开的方法的式(I)的化合物或其形式是选自以下的化合物盐:
Figure BDA0002383691000002602
Figure BDA0002383691000002611
Figure BDA0002383691000002621
其中化合物盐的形式选自其前药、水合物、溶剂化物、包合物、同位素体、外消旋体、对映异构体、非对映异构体、立体异构体、多晶型物和互变异构体形式。
另一方面,用于本文公开的方法的式(I)的化合物是选自以下的化合物盐:
Figure BDA0002383691000002622
其中化合物盐的形式选自其前药、水合物、溶剂化物、包合物、同位素体、外消旋体、对映异构体、非对映异构体、立体异构体、多晶型物和互变异构体形式。
术语
如本文所使用,术语“C1-4烷基”通常是指具有一至四个直链或支链构型的碳原子的饱和烃基,包括但不限于甲基、乙基、正丙基、异丙基、正丁基、异丁基、仲丁基、叔丁基等。在一些方面,C1-4烷基包括C1-3烷基、C1-2烷基等。在可用化合价允许的情况下,C1-4烷基可以任选被取代。
如本文所使用,术语“C2-6烯基”通常是指其中具有二至五个直链或支链构型的碳原子和一个或多个碳-碳双键的部分不饱和烃基,包括但不限于乙烯基、烯丙基、丙烯基等。在一些方面,C2-6烯基包括C2-4烯基、C2-3烯基等。在可用化合价允许的情况下,C2-6烯基可以任选被取代。
如本文所使用,术语“C1-4烷氧基”通常是指式-O-C1-4烷基的具有一至四个直链或支链构型的碳原子的饱和烃基,包括但不限于甲氧基、乙氧基、正丙氧基、异丙氧基、正丁氧基、异丁氧基、仲丁氧基、叔丁氧基等。在一些方面,C1-4烷氧基包括C1-3烷氧基、C1-2烷氧基等。在可用化合价允许的情况下,C1-4烷氧基可以任选被取代。
如本文所使用,术语“C3-14环烷基”通常是指饱和单环、二环或多环烃基,包括但不限于环丙基、环丁基、环戊基、环己基、环庚基、环辛基、1H-茚满基、茚基、四氢萘基等。在一些方面,C3-14环烷基包括C3-10环烷基、C3-8环烷基、C3-7环烷基、C5-8环烷基、C9-10环烷基等。在可用化合价允许的情况下,C3-14环烷基可以任选被取代。
如本文所使用,术语“C3-14环烯基”通常是指其中具有一个或多个化学稳定的碳-碳双键的部分不饱和单环、二环或多环烃基,包括但不限于环丙烯基、环丁烯基、环戊烯基、环己烯基、环庚烯基、环辛烯基等。在一些方面,C3-14环烯基包括C3-7环烯基、C3-8环烯基、C5-8环烯基、C3-10环烯基等。在可用化合价允许的情况下,C3-14环烯基可以任选被取代。
如本文所使用,术语“芳基”通常是指单环、二环或多环芳族碳原子环结构基团,包括但不限于苯基、萘基、蒽基、芴基、薁基、菲基等。在可用化合价允许的情况下,芳基可以任选被取代。
如本文所使用,术语“杂芳基”通常是指单环、二环或多环芳族碳原子环结构基团,其中在结构稳定性允许的情况下,一个或多个碳原子环成员被一个或多个杂原子,如O、S或N原子替代,包括但不限于呋喃基、噻吩基(thienyl)(也称为噻吩基(thiophenyl))、吡咯基、吡唑基、咪唑基、异噁唑基、异噻唑基、噁唑基、噻唑基、三唑基、噁二唑基、噻二唑基、四唑基、吡喃基、噻喃基、吡啶基、嘧啶基、吡嗪基、哒嗪基、三嗪基、吲哚基、吲唑基、吲哚嗪基、苯并呋喃基、苯并噻吩基、苯并咪唑基、苯并噻唑基、苯并噁唑基、9H-嘌呤基、喹喔啉基、异吲哚基、喹啉基、异喹啉基、喹唑啉基、吖啶基、酞嗪基、咪唑并[1,2-a]吡啶基、咪唑并[1,5-a]吡啶基、咪唑并[5,1-a]异喹啉基、1,4-二氢茚并[1,2-c]-1H-吡唑基、2,3-二氢-1H-茚基-1-酮、2,3-二氢-1H-茚基、3,4-二氢喹啉-2(1H)-酮、5,6-二氢咪唑并[5,1-a]异喹啉基、8H-茚并[1,2-d]噻唑基、苯并[c][1,2,5]噁二唑基、苯并[d]噁唑-2(3H)-酮、喹啉-2(1H)-酮、喹唑啉-4(1H)-酮、喹唑啉-2,4(1H,3H)-二酮、苯并-[d]噁唑基、吡唑并[1,5-a]吡啶基等。在可获得的化合价允许的情况下,杂芳基可以任选地在碳或氮原子环成员上被取代。
如本文所使用,术语“杂环基”通常是指饱和或部分不饱和单环、二环或多环碳原子环结构基团,其中在结构稳定性允许的情况下,一个或多个碳原子环成员被杂原子,如O、S或N原子替代,包括但不限于氧杂环丙基、氧杂环丁基、氮杂环丁基、二氢呋喃基、四氢呋喃基、二氢噻吩基、四氢噻吩基、吡咯啉基、吡咯烷基、二氢吡唑基、吡唑啉基、吡唑烷基、二氢咪唑基、咪唑啉基、咪唑烷基、异噁唑啉基、异噁唑烷基、异噻唑啉基、异噻唑烷基、噁唑啉基、噁唑烷基、噻唑啉基、噻唑烷基、三唑啉基、三唑烷基、噁二唑啉基、噁二唑烷基、噻二唑啉基、噻二唑烷基、四唑啉基、四唑烷基、二氢-2H-吡喃基、二氢吡啶基、四氢吡啶基、1,2,3,6-四氢吡啶基、六氢吡啶基、二氢嘧啶基、四氢嘧啶基、1,4,5,6-四氢嘧啶基、二氢吡嗪基、四氢吡嗪基、二氢哒嗪基、四氢哒嗪基、哌嗪基、哌啶基、吗啉基、硫代吗啉基、二氢三嗪基、四氢三嗪基、六氢三嗪基、1,4-二氮杂环庚基、二氢吲哚基、吲哚啉基、四氢吲哚基、二氢吲唑基、四氢吲唑基、二氢异吲哚基、二氢苯并呋喃基、四氢苯并呋喃基、二氢苯并噻吩基、四氢苯并噻吩基、二氢苯并咪唑基、四氢苯并咪唑基、二氢苯并噁唑基、2,3-二氢苯并[d]噁唑基、四氢苯并噁唑基、二氢苯并噁嗪基、3,4-二氢-2H-苯并[b][1,4]噁嗪基、四氢苯并噁嗪基、苯并[1,3]二氧杂环戊烯基、苯并[1,4]二氧杂环己基、二氢嘌呤基、四氢嘌呤基、二氢喹啉基、四氢喹啉基、1,2,3,4-四氢喹啉基、二氢异喹啉基、3,4-二氢异喹啉-(1H)-基、四氢异喹啉基、1,2,3,4-四氢异喹啉基、二氢喹唑啉基、四氢喹唑啉基、二氢喹喔啉基、四氢喹喔啉基、1,2,3,4-四氢喹喔啉基、1,3-二氧杂环戊基、2,5-二氢-1H-吡咯基、4,5-二氢-1H-咪唑基、四氢-2H-吡喃基、六氢吡咯并[3,4-b][1,4]噁嗪基-(2H)-基、(4aR,7aS)-六氢吡咯并[3,4-b][1,4]噁嗪基-(4aH)-基、3,4-二氢-2H-吡啶并[3,2-b][1,4]噁嗪基、(顺式)-八氢环戊烷[c]吡咯基、六氢吡咯并[3,4-b]吡咯-(1H)-基、(3aR,6aR)-六氢吡咯并[3,4-b]吡咯-(1H)-基、(3aR,6aS)-六氢吡咯并[3,4-c]吡咯-(1H)-基、5H-吡咯并[3,4-b]吡啶-(7H)-基、5,7-二氢-6H-吡咯并[3,4-b]吡啶基、四氢-1H-吡咯并[3,4-b]吡啶-(2H,7H,7aH)-基、六氢-1H-吡咯并[3,4-b]吡啶-(2H)-基、(4aR,7aR)-六氢-1H-吡咯并[3,4-b]吡啶-(2H)-基、八氢-6H-吡咯并[3,4-b]吡啶基、2,3,4,9-四氢-1H-咔唑基、1,2,3,4-四氢吡嗪并[1,2-a]吲哚基、2,3-二氢-1H-吡咯并[1,2-a]吲哚基、(3aR,6aR)-六氢环戊烷[c]吡咯-(1H)-基、(3aR,4R,6aS)-六氢环戊烷[c]吡咯-(1H)-基、(3aR,4S,6aS)-六氢环戊烷[c]吡咯-(1H)-基、(3aR,5r,6aS)-六氢环戊烷[c]吡咯-(1H)-基、1,3-二氢-2H-异吲哚基、八氢-2H-异吲哚基、(3aS)-1,3,3a,4,5,6-六氢-2H-异吲哚基、(3aR,4R,7aS)-1H-异吲哚-(3H,3aH,4H,5H,6H,7H,7aH)-基、(3aR,7aS)-八氢-2H-异吲哚基、(3aR,4R,7aS)-八氢-2H-异吲哚基、(3aR,4S,7aS)-八氢-2H-异吲哚基、2,5-二氮杂双环[2.2.1]庚基、2-氮杂双环[2.2.1]庚烯基、3-氮杂双环[3.1.0]己基、3,6-二氮杂双环[3.1.0]己基、(1R,5S)-3-氮杂双环[3.1.0]己基、(1S,5R)-3-氮杂双环[3.2.0]庚基、5-氮杂螺[2.4]庚基、2,6-二氮杂螺[3.3]庚基、2,5-二氮杂螺[3.4]辛基、2,6-二氮杂螺[3.4]辛基、2,7-二氮杂螺[3.5]壬基、2,7-二氮杂螺[4.4]壬基、2-氮杂螺[4.5]癸基、2,8-二氮杂螺[4.5]癸基、3,6-二氮杂双环[3.2.1]辛基、1,4-二氢茚并[1,2-c]吡唑基、二氢吡喃基、二氢吡啶基、二氢喹啉基、8H-茚并[1,2-d]噻唑基、四氢咪唑并[1,2-a]吡啶基、吡啶-2(1H)-酮、(1R,5S)-8-氮杂双环[3.2.1]辛基、8-氮杂双环[3.2.1]辛-2-烯基等。在可用化合价允许的情况下,杂环基可任选地在碳或氮原子环成员上被取代。
如本文所使用,术语“C2-4烯基-氨基-羰基”是指下式的基团:-C(=O)-NH-C2-4烯基。
如本文所使用,术语“C1-4烷氧基-C1-4烷氧基”是指下式的基团:-O-C1-4烷基-O-C1-4烷基。
如本文所使用,术语“C1-4烷氧基-羰基”是指下式的基团:-C(=O)-O-C1-4烷基。
如本文所使用,术语“C1-4烷氧基-羰基-氨基”是指下式的基团:-NH-C(=O)-O-C1-4烷基。
如本文所使用,术语“C1-4烷氧基-羰基-氨基-C1-4烷氧基”是指下式的基团:-O-C1-4烷基-NH-C(=O)-O-C1-4烷基。
如本文所使用,术语“C1-4烷基-C1-4烷氧基”是指下式的基团:-O-C1-4烷基-C1-4烷基。
如本文所使用,术语“C1-4烷基-氨基”是指下式的基团:-NH-C1-4烷基。
如本文所使用,术语“(C1-4烷基)2-氨基”是指下式的基团:-N(C1-4烷基)2
如本文所使用,术语“C1-4烷基-氨基-C1-4烷氧基”是指下式的基团:-O-C1-4烷基-NH-C1-4烷基。
如本文所使用,术语“(C1-4烷基)2-氨基-C1-4烷氧基”是指下式的基团:-O-C1-4烷基-N(C1-4烷基)2
如本文所使用,术语“C1-4烷基-氨基-C1-4烷基”是指下式的基团:-C1-4烷基-NH-C1-4烷基。
如本文所使用,术语“(C1-4烷基)2-氨基-C1-4烷基”是指下式的基团:-C1-4烷基-N(C1-4烷基)2
如本文所使用,术语“C1-4烷基-氨基-羰基”是指下式的基团:-C(=O)-NH-C1-4烷基。
如本文所使用,术语“(C1-4烷基)2-氨基-羰基”是指下式的基团:–C(=O)-N(C1-4烷基)2
如本文所使用,术语“C1-4烷基-氨基-羰基-C1-4烷基”是指下式的基团:-C1-4烷基-C(=O)-NH-C1-4烷基。
如本文所使用,术语“(C1-4烷基)2-氨基-羰基-C1-4烷基”是指下式的基团:-C1-4烷基-C(=O)-N(C1-4烷基)2
如本文所使用,术语“C1-4烷基-羰基”是指下式的基团:-C(=O)-C1-4烷基。
如本文所使用,术语“C1-4烷基-羰基-氨基”是指下式的基团:-NH-C(=O)-C1-4烷基。
如本文所使用,术语“C1-4烷基-羰基-氨基-C1-4烷氧基”是指下式的基团:-O-C1-4烷基-NH-C(=O)-C1-4烷基。
如本文所使用,术语“C1-4烷基-羰基-氨基-C1-4烷基”是指下式的基团:-C1-4烷基-NH-C(=O)-C1-4烷基。
如本文所使用,术语“氨基”是指下式的基团:-NH2
如本文所使用,术语“氨基-C1-4烷氧基”是指下式的基团:-O-C1-4烷基-NH2
如本文所使用,术语“氨基-C1-4烷基”是指下式的基团:-C1-4烷基-NH2
如本文所使用,术语“氨基-羰基”是指下式的基团:-C(=O)-NH2
如本文所使用,术语“氰基”是指下式的基团:-CN。
如本文所使用,术语“C3-7环烷基-C1-4烷氧基”是指下式的基团:-O-C1-4烷基-C3-7环烷基。
如本文所使用,术语“卤代C1-4烷氧基”是指下式的基团:-O-C1-4烷基-卤素,其中在可用价允许的情况下,C1-4烷基可以被一个或多个卤素原子部分或完全取代。在一些方面,卤代C1-4烷氧基包括卤代C1-6烷氧基、卤代C1-4烷氧基等。
如本文所使用,术语“卤代C1-4烷基”是指下式的基团:-C1-4烷基-卤素,其中在可用价允许的情况下,C1-4烷基可以被一个或多个卤素原子部分或完全取代。在一些方面,卤代C1-4烷基包括卤代C1-6烷基、卤代C1-4烷基等。
如本文所使用,术语“杂芳基-C1-4烷基”是指下式的基团:-C1-4烷基-杂芳基。
如本文所使用,术语“杂芳基-C1-4烷基-氨基”是指下式的基团:-NH-C1-4烷基-杂芳基。
如本文所使用,术语“杂芳基-C1-4烷基-氨基-羰基”是指下式的基团:-C(=O)-NH-C1-4烷基-杂芳基。
如本文所使用,术语“杂芳基-C1-4烷基-氨基-羰基-C1-4烷基”是指下式的基团:-C1-4烷基-C(=O)-NH-C1-4烷基-杂芳基。
如本文所使用,术语“杂芳基-C1-4烷基-羰基-氨基”是指下式的基团:-NH-C(=O)-C1-4烷基-杂芳基。
如本文所使用,术语“杂芳基-C1-4烷基-羰基-氨基-C1-4烷基”是指下式的基团:-C1-4烷基-NH-C(=O)-C1-4烷基-杂芳基。
如本文所使用,术语“杂环基-C1-4烷氧基”是指下式的基团:-C1-4烷氧基-杂环基。
如本文所使用,术语“杂环基-C1-4烷基”是指下式的基团:-C1-4烷基-杂环基。
如本文所使用,术语“羟基”是指下式的基团:-OH。
如本文所使用,术语“羟基-C1-4烷氧基”是指下式的基团:-O-C1-4烷基-OH,其中在可用化合价允许的情况下,C1-4烷基可以被一个或多个羟基部分或完全取代。
如本文所使用,术语“羟基-C1-4烷基”是指下式的基团:-C1-4烷基-OH,其中在可用化合价允许的情况下,C1-4烷基可以被一个或多个羟基部分或完全取代。
如本文所使用,术语“羟基-C1-4烷基-氨基”是指下式的基团:-NH-C1-4烷基-OH,其中在可用化合价允许的情况下,C1-4烷基可以被一个或多个羟基部分或完全取代。
如本文所使用,术语“羟基-亚氨基”是指式C(=NOH)的=NOH基团。
如本文所使用,术语“氧代基”是指下式的基团:C=O。
如本文所使用,术语“苯基-C1-4烷氧基”是指下式的基团:-C1-4烷氧基-苯基。
如本文所使用,术语“取代基”是指在指定原子位置处被取代,以替代指定原子上的一个或多个氢的核心分子的原子上的位置变量,条件是不超过指定原子的正常化合价,并且该取代产生稳定的化合物。仅当取代基和/或变量的组合产生稳定的化合物时,才允许这些组合。本领域普通技术人员应注意,假定具有看起来不满足如本文所述或所示的化合价的任何碳以及杂原子均具有足够数量的氢原子以满足所述或所示的化合价。在某些情况下,本文可以在取代基内描述、显示或列出一个或多个具有双键(例如,“氧代基”或“=O”)作为连接点的取代基,其中所述结构可以仅显示单键作为与式(I)的核心结构的连接点。本领域普通技术人员将理解,尽管仅示出了单键,但是双键意在用于这些取代基。
如本文所使用,参考本文所提供的化学术语的定义,术语“等”是指本领域技术人员可以预期的化学结构变化包括但不限于异构体(包括链、支链或位置结构异构体)、环系的水合(包括单环、二环或多环环结构的饱和或部分不饱和)以及在可用化合价允许的情况下形成稳定化合物的所有其他变化。
出于该描述的目的,其中式(I)的化合物或其形式的一个或多个取代基变量包括包含到式(I)的化合物中的官能团,每个出现在公开的化合物内的任何位置的官能团可以独立地选择并且可以适当地独立地和/或任选地被取代。
如本文所使用,术语“独立选择的”或“各自选择的”是指取代基列表中的官能变量,其可以在式(I)的结构上多于一次出现,每次发生的取代模式为与任何其他情况下的模式无关。此外,本文所述化合物的任何式或结构上的通用取代基变量的使用应理解为包括用特定种属中包括的取代基种类替代通用取代基,并且所得化合物将包括在本文所述化合物的范围内,例如,芳基可以被苯基或萘基等替代。
如本文所使用,术语“……的每种情况”或“在每种情况下,当存在时”,当在术语如“…C3-14环烷基、C3-14环烷基-C1-4烷基、芳基、芳基-C1-4烷基、杂芳基、杂芳基-C1-4烷基、杂环基和杂环基-C1-4烷基”之前使用使,意指C3-14环烷基、芳基、杂芳基和杂环基环系各自单独存在或作为取代基存在。
如本文所使用,术语“任选地被取代”是指被指定的取代基变量、基团(group)、基团(radical)或部分任选地取代。
化合物形式
如本文所使用,术语“形式”是指具有选自以下的形式的式(I)的化合物:其游离酸、游离碱、前药、盐、水合物、溶剂化物、包合物、同位素体、外消旋体、对映异构体、非对映异构体、立体异构体、多晶型物和互变异构体形式。
在本文所述的某些方面,式(I)的化合物的形式是其游离酸、游离碱或盐。
在本文所述的某些方面,式(I)的化合物的形式是其盐。
在本文所述的某些方面,式(I)的化合物的形式是其同位素体。
在本文所述的某些方面,式(I)的化合物的形式是其立体异构体、外消旋体、对映异构体或非对映异构体。
在本文所述的某些方面,式(I)的化合物的形式是其互变异构体。
在本文所述的某些方面,式(I)的化合物的形式是药学上可接受的形式。
在本文所述的某些方面,分离式(I)的化合物或其形式以供使用。
如本文所使用,术语“分离的”是指根据本文所述的或本领域技术人员众所周知的(多种)分离或纯化方法方法(例如色谱法、重结晶法等),从合成过程(例如,从反应混合物)或天然来源或其组合分离和/或纯化后的式(I)的化合物或其形式的物理状态,其纯度足以通过本文所述的或本领域技术人员众所周知的标准分析技术表征。
如本文所使用,术语“保护的”是指式(I)的化合物或其形式中的官能团为被修饰以防止当化合物进行反应时在保护的位点上发生不希望的副反应的形式。合适的保护基将被本领域普通技术人员所认识,以及通过参考标准教科书例如T.W.Greene等人,Protective Groups in organic Synthesis(1991),Wiley,New York认识。这样的官能团包括羟基、苯酚、氨基和羧酸。羟基或苯酚的合适的保护基包括三烷基甲硅烷基或二芳基烷基甲硅烷基(例如叔丁基二甲基甲硅烷基、叔丁基二苯基甲硅烷基或三甲基甲硅烷基)、四氢吡喃基、苄基、取代的苄基、甲基、甲氧基甲醇等。氨基、脒基和胍基的合适的保护基包括叔丁氧羰基,苄氧羰基等。羧酸的合适的保护基包括烷基、芳基或芳基烷基酯。在某些情况下,保护基也可以是聚合物树脂,例如Wang树脂或2-氯三苯甲基氯树脂。可以根据本领域技术人员众所周知的和如本文所述的标准技术添加或去除保护基。本领域技术人员也将理解,尽管本文所述化合物的这种保护的衍生物可能本身不具有药理活性,但是它们可以施用于对象,然后在体内代谢以形成具有药理学活性的本文所述的化合物。因此,此类衍生物可被描述为“前药”。本文所述化合物的所有前药均包括在本文所述用途的范围内。
如本文所使用,术语“前药”是指在体内转化以产生具有活性的式(I)的化合物或其形式的本发明化合物的形式(例如,药物前体)。转化可以通过各种机制发生(例如通过代谢和/或非代谢化学过程),例如通过在血液、肝脏和/或其他器官和组织中水解和/或代谢发生。“Pro-drugs as Novel Delivery Systems,”Vol.14,A.C.S.专题讨论会系列,和Bioreversible Carriers in Drug Design,Edward B.Roche编,AmericanPharmaceutical Association and Pergamon Press,1987中提供了对前药的用途的讨论。
在一个实例中,当式(I)的化合物或其形式包含羧酸官能团时,前药可包含通过用诸如烷基等的官能团替代酸基团的氢原子形成的酯。在另一个实例中,当式(I)的化合物或其形式包含羟基官能团时,可以通过用另一个官能团如烷基、烷基羰基或膦酸酯基团替代羟基的氢原子来制备前药形式。在另一个实例中,当式(I)的化合物或其形式包含胺官能团时,可以通过用诸如烷基或取代羰基的官能团替代一个或多个胺氢原子来制备前药形式。如果合适,式(I)的化合物或其形式的药学上可接受的前药包括被一个或多个以下基团取代的那些化合物:羧酸酯,磺酸酯,氨基酸酯,膦酸酯和单、二或三磷酸酯或烷基取代基。如本文所述,本领域普通技术人员应理解,一种或多种这样的取代基可用于提供式(I)化合物或其形式作为前药。
本文所述的一种或多种化合物可以以非溶剂化物以及溶剂化物形式与药学上可接受的溶剂(例如水、乙醇等)一起存在,并且本文的描述旨在涵盖溶剂化物形式和非溶剂化物形式。
如本文所使用,术语“溶剂化物”是指本文所述的化合物与一个或多个溶剂分子的物理缔合。这种物理缔合涉及不同程度的离子键合和共价键合,包括氢键合。在某些情况下,例如当在结晶固体的晶格中掺入一个或多个溶剂分子时,溶剂化物将能够分离。如本文所使用,“溶剂化物”涵盖溶液相和可分离的溶剂化物。合适的溶剂化物的非限制性实例包括乙醇化物、甲醇化物等。
如本文所使用,术语“水合物”是指其中溶剂分子是水的溶剂化物。
式(I)的化合物可以形成盐,其意图包括在本说明书的范围内。除非另外指出,否则本文中提及的式(I)的化合物或其形式应理解为包括提及其盐形式。如本文所使用,术语“(多种)盐”表示与无机和/或有机酸形成的酸式盐,以及与无机和/或有机碱形成的碱式盐。另外,当式(I)的化合物或其形式同时包含碱性部分(例如但不限于胺部分)和酸性部分(例如但不限于羧酸)时,两性离子(“内盐”)可以形成并且包括在本文所用的术语“(多种)盐”之内。
如本文所使用,术语“(多种)药学上可接受的盐”是指在哺乳动物中安全有效(即无毒、生理上可接受)地使用并且具有生物学活性的本文所述的化合物的那些盐,但是其他盐也有用。式(I)的化合物的盐可以例如通过使式(I)的化合物或其形式与一定量的酸或碱(例如等量)在例如盐在其中沉淀的介质中反应形成,或在水性介质中反应形成,然后冻干。
药学上可接受的盐包括存在于本文所述的化合物中的一种或多种酸性或碱性基团的盐。在某些方面,酸加成盐可以包括但不限于乙酸盐、抗坏血酸盐、苯甲酸盐、苯磺酸盐、硫酸氢盐、酒石酸氢盐、硼酸盐、溴化物、丁酸盐、氯化物、柠檬酸盐、樟脑酸盐、樟脑磺酸盐、乙磺酸盐、甲酸盐、富马酸盐、龙胆酸盐、葡萄糖酸盐、葡糖醛酸盐、谷氨酸盐、碘化物、异烟酸盐、乳酸盐、马来酸盐、甲磺酸盐、萘磺酸盐、硝酸盐、草酸盐、双羟萘酸酸盐、泛酸盐、磷酸盐、丙酸盐、蔗糖酸盐、水杨酸盐、琥珀酸盐、硫酸盐、酒石酸盐、硫氰酸盐、甲苯磺酸盐(toluenesulfonate)(也称为甲苯磺酸盐(tosylate))、三氟乙酸盐等。酸加成盐的某些方面可以进一步包括氯化物、二氯化物、三氯化物、溴化物、乙酸盐、甲酸盐或三氟乙酸盐。
另外,例如P.Stahl等人,Camille G.(eds.)Handbook of PharmaceuticalSalts.Properties,Selection and Use.(2002)Zurich:Wiley-VCH;S.Berge等人,Journalof Pharmaceutical Sciences(1977)66(1)1-19;P.Gould,International J.ofPharmaceutics(1986)33,201-217;Anderson等人,The Practice of MedicinalChemistry(1996),Academic Press,New York;和The Orange Book(美国食品药品监督管理局,华盛顿,在其网站上)讨论了通常被认为适合由碱性药物化合物形成药学上有用的盐的酸。这些公开内容通过引用并入本文。
合适的碱性盐包括但不限于铝、铵、钙、锂、镁、钾、钠和锌盐。
所有这样的酸式盐和碱式盐都意图包括在本文所述的药学上可接受的盐的范围内。另外,出于描述的目的,所有这样的酸式盐和碱式盐被认为等同于相应化合物的游离形式。
式(I)的化合物及其形式可以进一步以互变异构形式存在。所有这些互变异构形式均预期并意图包括在如本文所述的式(I)化合物或其形式的范围内。
式(I)的化合物或其形式可以包含不对称或手性中心,因此以不同的立体异构形式存在。本说明书旨在包括式(I)的化合物的所有立体异构形式及其混合物,包括外消旋混合物。
本文所述的化合物可以包括一个或多个手性中心,并且可以以外消旋混合物(R/S))或基本上纯的对映异构体和非对映异构体的形式存在。化合物也可以以基本上纯的(R)或(S)对映异构体的形式存在(当存在一个手性中心时)。一方面,本文所述的化合物是(S)异构体,并且可以以基本上仅包含(S)异构体的对映异构纯组合物的形式存在。另一方面,本文描述的化合物是(R)异构体,并且可以以基本上仅包含(R)异构体的对映异构纯组合物的形式存在。如本领域技术人员将认识到的,当存在多于一个手性中心时,本文所述的化合物也可以以(R,R)、(R,S)、(S,R)或(S,S)异构体的形式存在,如IUPAC命名建议所定义。
如本文所使用,术语“基本上纯的”是指基本上由大于或等于90%的量、大于或等于92%的量、大于或等于95%的量、大于或等于98%的量、大于或等于99%的量或等于100%的量的单一异构体组成的化合物。
在说明书的一方面,式(I)的化合物或其形式是基本上纯的(S)对映异构体形式,其以大于或等于90%的量、以大于或等于92%的量、以大于或等于95%的量、以大于或等于98%的量,大于或等于99%的量或以等于100%的量存在。
另一方面,本文提供了用于本文所述的方法的式(I)的化合物,其选自式(Ia)和式(Ib)的化合物:
在说明书的一方面,式(I)的化合物或其形式是基本上纯的(R)对映异构体形式,其以大于或等于90%的量、以大于或等于92%的量、以大于或等于95%的量、以大于或等于98%的量,大于或等于99%的量或以等于100%的量存在。
另一方面,本文提供了用于本文所述的方法的式(I)的化合物,其选自式(Ia)和式(Ib)的化合物:
如本文所使用,“外消旋体”是异构形式的任何混合物,其不是“对映异构纯的”,包括例如但不限于比例为约50/50、约60/40、约70/30或约80/20的混合物。
另一方面,本文提供了用于本文所述的方法的式(I)的化合物,其选自式(Ia)和式(Ib)的化合物:
另外,本说明书涵盖所有几何和位置异构体。例如,如果式(I)的化合物或其形式包含双键或稠环,则顺式和反式形式以及其混合物均包含在说明书的范围内。非对映异构体混合物可以根据其物理化学差异,通过本领域技术人员公知的方法,例如通过色谱法和/或分级结晶,分离为它们各自的非对映异构体。对映异构体可以通过使用手性HPLC柱或本领域技术人员已知的其他色谱方法来分离。对映异构体也可以通过以下分离:与合适的光学活性化合物(例如,手性助剂,如手性醇或Mosher酰氯)反应,将对映异构体混合物转化为非对映异构体混合物,分离非对映异构体并将各非对映异构体转化(例如水解)为相应的纯对映异构体。而且,某些式(I)的化合物可以是阻转异构体(例如,取代的联芳基),并被认为是本说明书的一部分。
另一方面,本文提供了用于本文所述的方法的式(I)的化合物,其选自式(Ia)和式(Ib)的化合物:
本发明化合物(包括化合物的盐、溶剂化物、酯和前药以及前药的盐、溶剂化物和酯)的所有立体异构体(例如几何异构体、光学异构体等),例如,由于各种取代基上的不对称碳而可能存在的那些,包括对映异构体形式(即使在不存在不对称碳的情况下也可能存在)、旋转异构体形式、阻转异构体和非对映异构体形式,均涵盖在本说明书的范围内,位置异构体(例如4-吡啶基和3-吡啶基)也是如此。如上所述,本文所述的化合物的各个立体异构体可以例如基本上不含其他异构体,或者可以存在于外消旋混合物中。
另一方面,本文提供了用于本文所述的方法的式(I)的化合物,其选自式(Ia)和式(Ib)的化合物:
术语“盐”、“溶剂化物”、“酯”、“前药”等的使用旨在等同地应用于本发明的化合物的对映异构体、立体异构体、旋转异构体、互变异构体、位置异构体、外消旋体或同位素体的盐、溶剂化物、酯和前药。
另一方面,本文提供了用于本文所述的方法的式(I)的化合物,其选自式(Ia)和式(Ib)的化合物:
术语“同位素体”是指本文所述的同位素富集的化合物,其与本文所述的那些相同,但是一个或多个原子被原子质量或质量数不同于通常在自然界中发现的原子质量或质量数的原子替代。可掺入本文所述的化合物的同位素的实例包括氢、碳、氮、氧、磷、氟和氯的同位素,分别例如2H、3H、13C、14C、15N、18O、17O、31P、32P、35S、18F、35Cl和36Cl,其各自也在本说明书的范围内。
另一方面,本文提供了用于本文所述的方法的式(I)的化合物,其选自式(Ia)和式(Ib)的化合物:
本文所述的某些同位素富集的化合物(例如,用3H和14C标记的那些)可用于化合物和/或底物组织分布分析中。氚代(即,3H)和碳-14(即,14C)同位素由于易于制备和可检测性而是特别优选的。此外,用较重的同位素例如氘(即,2H)取代可以提供由于更大的代谢稳定性(例如,增加的体内半衰期或降低的剂量要求)而产生的某些治疗优势,因此在某些情况下可以是优选的。
另一方面,本文提供了用于本文所述的方法的式(I)的化合物,其选自式(Ia)和式(Ib)的化合物:式(I)的化合物以及式(I)的化合物的盐、溶剂化物、水合物、酯和前药的多晶型结晶和无定形形式也进一步旨在包含在本说明书中。
本文提供的化合物名称是使用ACD Labs提供的ACD Labs Index Name软件和/或
Figure BDA0002383691000002731
提供的ChemDraw Ultra软件获得的。当本文公开的化合物名称与所示结构冲突时,所示结构将取代名称的使用来定义预期的化合物。本文定义的取代基的命名可能与其衍生的化学名称略有不同;本领域技术人员将认识到,取代基的定义旨在包括化学名中存在的基团。
如本文所使用,术语“异常”是指偏离例如平均健康对象或来自健康对象的(多个)细胞或组织样品的标准。如本文所使用,术语“异常表达”是指相对于相应的正常、健康的细胞、组织样品或对象,细胞、组织样品或对象的基因产物(例如RNA转录物或蛋白)的异常表达(上调或下调,导致其过量或量不足)。在具体方面,“异常表达”是指相对于相应的正常、健康的细胞、组织样品或对象,细胞、组织样品或对象中的基因产物(例如RNA转录物或蛋白)的水平改变。如本文所使用,术语“异常量”是指相对于相应的正常、健康的细胞、组织样品或对象,细胞、组织样品或对象中的基因产物(例如,RNA、蛋白、多肽或肽)的水平改变。在特定方面,如果相对于相应的来自健康对象的细胞或组织样品或健康对象,细胞、组织样品或对象中的基因产物(例如,RNA、蛋白、多肽或肽)的量比相应的来自健康对象的细胞或组织样品或健康对象中的基因产物的量高或低1、1.5、2、2.5、3、3.5、4、4.5、5、5.5、6倍,则被认为是常的。
术语“内含子REMS”是指内含子中存在的REMS序列,其在本文所述的化合物的存在下充当5’剪接位点。内含子REMS,当在第一分支点(BP)序列和第一3’剪接位点(3’ss)序列下游并且在第二分支点(BP)序列和第二3’剪接位点(3’ss)序列上游(如图1A所示)时,并且在本文所述的化合物的存在下,充当5’剪接位点。当在本文所述的化合物的存在下在分支点和3’剪接位点的上游(参见图1B或1C)并且最低需要的元件存在时,内含子REMS还可以充当5’剪接位点。以下任何一种、两种、三种或更多种或全部可以内源或非内源存在于受影响的内含子中:内含子REMS、第一BP、第二BP、第一3’ss和第二3’ss。内含子REMS充当5’剪接位点所需的最低需要的另外的元件包含下游分支点(BP)序列和下游3’剪接位点(3’ss)序列。BP和3’ss中的任一种和两种可以内源或非内源存在于受影响的内含子中。
如本文所使用,“非内源”核苷酸序列(如非内源5’剪接位点、非内源分支点或非内源3’剪接位点)是这样的核苷酸序列,其不是天然发现为前体RNA或编码前体RNA序列的DNA序列的部分。换言之,需要人工合成或操纵RNA或DNA序列以引入该核苷酸序列。
如本文所使用,术语“非内源内含子REMS”是指这样的REMS序列其不是天然发现为RNA序列的部分或不是天然由DNA序列编码。换言之,需要人工合成或操纵RNA或DNA序列以引入内含子REMS或编码内含子REMS的核苷酸序列。
如本文所使用,术语“内含子来源的外显子”、“内含外显子”、“iExon”和“内含外显子”(统称为iExon)是指当内含子REMS序列、分支点、3’剪接位点和剪接修饰剂化合物存在时,由内含子RNA序列产生的外显子。特别地,当在本文所述的化合物的存在下发生包含两个外显子和内含子的RNA转录物的RNA剪接时,其中第一外显子在内含子的上游,并且第二外显子在内含子的下游,并且其中内含子按5’至3’顺序包含:第一5’剪接位点、第一分支点、第一3’剪接位点、iREMS、第二分支点和第二3’剪接位点,得到的iExon包含以下RNA序列:第一3’剪接位点和所述iREMS之间的RNA序列(对应于图1A所示的iExon)。内含子REMS序列、分支点和3’剪接位点中的一个或多个可以天然存在于内含子RNA序列中或可以引入到内含子RNA序列中。当存在或引入所有这样的元件时,在本文所述的化合物的存在下,元件限定外显子边界,该边界能够实现剪接机制,以在RNA中产生iExon,如果不添加剪接修饰剂化合物,这种情况不会天然发生。
如本文所使用,术语“假外显子”是指天然存在于内含子编码DNA中的已知内源内含子序列,其可以匹配分支点、3’剪接位点和5’剪接位点的序列,但在剪接过程中均无活性、被剪接或不存在于成熟mRNA中。一些假外显子在其5’剪接位点包含内含子REMS。包含内含子REMS的假外显子尚未被产生iExon的剪接机制内源识别,但是在本文所述的剪接修饰剂化合物的存在下,剪接机制产生iExon。因此,由假外显子产生iExon意图旨在包括在统称术语“iExon”的各个方面的范围内。
如本文所使用,术语“未注释的外显子”是指是指根据实验证据作为外显子天然存在于成熟mRNA产物中,但未在NCBI的RefSeq数据库中注释(https://www.ncbi.nlm.nih.gov/refseq/)的内源序列。一些未注释的外显子在5’剪接位点包含内含子REMS。包含REMS的未注释的外显子尚未被产生iExon的剪接机制内源识别,但是在本文所述的剪接修饰剂化合物的存在下,剪接机制产生iExon。因此,由未注释的外显子产生iExon意图旨在包括在统称术语“iExon”的各个方面的范围内。
如本文所使用,术语“延伸的外显子”(即,eExon)是指当内含子REMS序列、分支点、3’剪接位点和剪接修饰剂化合物以例如图1B所示的顺序存在时,包含外显子和相邻内含子序列的一部分的外显子。特别地,当在本文所述的化合物的存在下发生包含两个外显子和内含子的RNA转录物的RNA剪接时,其中第一外显子在内含子的上游,并且第二外显子在内含子的下游,并且其中所示内含子按5’至3’顺序包含:5’剪接位点、iREMS、分支点和3’剪接位点,并且其中在所述iREMS序列和5’剪接位点之间没有中间分支点且没有中间3’剪接位点,得到的eExon包含第一外显子以及5’剪接位点和内含子REMS之间的RNA序列(对应于图1B中所示的外显子1e和图1C中所示的外显子2e)。
如本文所使用,术语“实质改变”在各自表达为基因的一种或多种的产物的一种或多种RNA转录物(例如,rRNA、tRNA、miRNA、siRNA、piRNA、lncRNA、前体mRNA或mRNA转录物)、其供选择的剪接变体或其同种型或其一种或多种蛋白的量的上下文中,是指这样的产物的量发生统计学显著的改变,例如在非限制性示例中p值小于选自0.1、0.01、0.001或0.0001的值。
如本文所使用,术语“对象”和“患者”互换使用,是指具有感觉和自发运动能力并且其生存需要氧和有机食物的动物或任何生物。非限制性实例包括人、马、猪、牛、大鼠、小鼠、犬和猫物种的成员。在一些方面,所述对象是哺乳动物或温血脊椎动物。在某些方面,所述对象是非人类动物。在特定方面,对象是人。
如本文所使用,术语“功能性蛋白”是指保留某种生物学功能或基因编码的全长蛋白或蛋白同种型的功能的蛋白的形式。
如本文所使用,术语“非功能性蛋白”是指与不存在如本文所述的剪接修饰剂化合物时基因编码的全长蛋白或蛋白同种型相比,不保留任何生物学功能的蛋白的形式。
如本文所使用,在由人工构建体产生的功能性蛋白的上下文中,术语“产生基本上更低的”是指在本文所述的化合物的存在下产生的功能性蛋白的量比不存在所述化合物时产生的功能性蛋白的量至少基本上低20%、25%、30%、35%、40%、45%、50%、55%、60%、70%、75%、80%、85%、90%、95%、98%或100%。
确定基因的表达是否被化合物调节或修饰的方法
另一方面,本文提供了用于确定基因的前体RNA的剪接是否可能被式(I)的化合物或其形式修饰的方法,包括搜索基因内含子序列中的内含子REMS(即,响应化合物的存在而充当5’剪接位点的序列)的存在,其中基因序列中存在内含子REMS、3’剪接位点和内含子分支点表明基因的前体RNA的剪接可能被式(I)的化合物或其形式修饰,并且基因序列中不存在内含子REMS和内含子3’剪接位点和内含子分支点表明基因的前体RNA的剪接不可能被式(I)的化合物或其形式修饰。在特定方面,该方法还包括搜索基因序列中的内含子REMS、内含子3’剪接位点和内含子分支点的组合的存在。
另一方面,本文提供了用于确定基因的产物(例如,mRNA转录物或蛋白)的量是否可能被式(I)的化合物或其形式调节的方法,包括搜索基因序列中的内含子REMS的存在,其中基因序列中存在内含子REMS、内含子3’剪接位点和内含子分支点的组合表明基因的产物(例如,mRNA转录物或蛋白)的量可能被式(I)的化合物或其形式调节,并且基因序列中不存在内含子REMS、内含子3’剪接位点和内含子分支点的组合表明基因的产物(例如,mRNA转录物或蛋白)的量不可能被式(I)的化合物或其形式调节。在特定方面,该方法还包括搜索基因序列中的内含子REMS、内含子3’剪接位点和内含子分支点中任一种的存在。在特定方面,该方法还包括搜索基因序列中的内含子REMS、下游分支点和下游3’剪接位点的组合的存在。
搜索本文所述的基因序列中的内含子REMS、下游3’剪接位点和下游分支点的最低需要的组合的存在的步骤可以由包括记忆存储指令的存储器的计算机系统执行,以搜索基因序列中该组合的存在,或可以手动进行这样的搜索。
在某些方面,通过使本文所述的化合物与细胞培养物中的前体RNA接触来评估包含内含子REMS的前体RNA的剪接。在一些方面,通过使本文所述的化合物与无细胞提取物中的前体RNA接触来评估包含内含子REMS的前体RNA的剪接。在具体方面,该化合物是已知调节包含内含子REMS的前体RNA的剪接的化合物。参见例如下面有关确定化合物是否调节某些基因表达的方法的部分,以及以下可用于这些评估的技术的实例。
确定哪些化合物调节或修饰特定基因的表达的方法
本文提供了用于确定式(I)的化合物或其形式是否调节一种、两种、三种或更多种基因的一种、两种、三种或更多种RNA转录物(例如,前体mRNA或mRNA转录物或其同种型)的量的方法。在一些方面,该基因是本文所述的基因中的任一种。
一方面,本文提供了用于确定式(I)的化合物或其形式是否调节RNA转录物的量的方法,包括:(a)使(多种)细胞与式(I)的化合物或其形式接触,和(b)确定由该(多种)细胞产生的RNA转录物的量,其中相对于化合物不存在或阴性对照(例如,溶媒对照如PBS或DMSO)存在下的RNA转录物的量,在化合物存在下的RNA转录物的量的调节表明式(I)的化合物或其形式调节RNA转录物的量。另一方面,本文提供了用于确定式(I)的化合物或其形式是否调节RNA转录物(例如,mRNA转录物)的量的方法,包括:(a)使第一(多种)细胞与式(I)的化合物或其形式接触,(b)使第二(多种)细胞与阴性对照(例如,溶媒对照,如PBS或DMSO)接触;(c)确定由第一(多种)细胞和第二(多种)细胞产生的RNA转录物的量;和(d)比较由第一(多种)细胞产生的RNA转录物的量与由第二(多种)细胞表达的RNA转录物的量,其中相对于由第二(多种)细胞产生的RNA转录物的量,由第一(多种)细胞产生的RNA转录物的量的调节表明式(I)的化合物或其形式调节RNA转录物的量。在某些方面,(多种)细胞与化合物的接触发生在细胞培养物中。在其他方面,(多种)细胞与化合物的接触发生在对象,如非人类动物对象中。
另一方面,本文提供了用于确定式(I)的化合物或其形式是否修饰RNA转录物(例如,mRNA转录物)的剪接的方法,包括:(a)在式(I)的化合物或其形式的存在下培养(多种)细胞;和(b)确定由(多种)细胞产生的两种或更多种RNA转录物剪接变体的量,其中相对于化合物不存在或阴性对照(例如,溶媒对照,如PBS或DMSO)存在下的两种或更多种RNA转录物剪接变体的量,在化合物的存在下的两种或更多种RNA转录物的量的调节表明式(I)的化合物或其形式修饰RNA转录物的剪接。
另一方面,本文提供了用于确定式(I)的化合物或其形式是否修饰RNA转录物(例如,mRNA转录物)的剪接的方法,包括:(a)在式(I)的化合物或其形式的存在下培养(多种)细胞;(b)在特定的一段时间后从(多种)细胞分离两种或更多种RNA转录物剪接变体;和(c)确定由(多种)细胞产生的两种或更多种RNA转录物剪接变体的量,其中相对于化合物不存在或阴性对照(例如,溶媒对照,如PBS或DMSO)存在下的两种或更多种RNA转录物剪接变体的量,在化合物的存在下的两种或更多种RNA转录物的量的调节表明式(I)的化合物或其形式修饰RNA转录物的剪接。另一方面,本文提供了用于确定式(I)的化合物或其形式是否修饰RNA转录物(例如,mRNA转录物)的剪接的方法,包括:(a)在式(I)的化合物或其形式的存在下培养第一(多种)细胞;(b)在阴性对照(例如,溶媒对照,如PBS或DMSO)的存在下培养第二(多种)细胞;(c)分离由第一(多种)细胞产生的两种或更多种RNA转录物剪接变体和分离由第二(多种)细胞产生的两种或更多种RNA转录物剪接变体;(d)确定由第一(多种)细胞和第二(多种)细胞产生的两种或更多种RNA转录物剪接变体的量;和(e)比较由第一(多种)细胞产生的两种或更多种RNA转录物剪接变体的量与由第二(多种)细胞产生的两种或更多种RNA转录物剪接变体的量,其中相对于由第二(多种)细胞产生的两种或更多种RNA转录物剪接变体的量,由第一(多种)细胞产生的两种或更多种RNA转录物剪接变体的量的调节表明式(I)的化合物或其形式调节RNA转录物的剪接。
另一方面,本文提供了用于确定式(I)的化合物或其形式是否调节RNA转录物(例如,mRNA转录物)的量的方法,包括:(a)使无细胞体系与式(I)的化合物或其形式接触,和(b)确定由无细胞体系产生的RNA转录物的量,其中相对于化合物不存在或阴性对照(例如,溶媒对照,如PBS或DMSO)存在下的RNA转录物的量,在化合物存在下的RNA转录物的量的调节表明式(I)的化合物或其形式调节RNA转录物的量。另一方面,本文提供了用于确定式(I)的化合物或其形式是否调节RNA转录物(例如,mRNA转录物)的量的方法,包括:(a)使第一无细胞体系与式(I)的化合物或其形式接触,(b)使第二无细胞体系与阴性对照(例如,溶媒对照,如PBS或DMSO)接触;和(c)确定由该第一无细胞体系和该第二无细胞体系产生的RNA转录物的量;和(d)比较由第一无细胞体系产生的RNA转录物的量与由第二无细胞体系表达的RNA转录物的量,其中相对于由第二无细胞体系产生的RNA转录物的量,由第一无细胞体系产生的RNA转录物的量的调节表明式(I)的化合物或其形式调节RNA转录物的量。在某些方面,无细胞体系包含纯合成RNA、合成或重组(纯化的)酶和蛋白因子。在其他方面,无细胞体系包含从合成DNA模板转录的RNA、合成或重组(纯化的)酶和蛋白因子。在其他方面,无细胞体系包含纯合成RNA和细胞核提取物。在其他方面,无细胞体系包含从合成DNA模板转录的RNA和细胞核提取物。在其他方面,无细胞体系包含纯合成RNA和全细胞提取物。在其他方面,无细胞体系包含从合成DNA模板转录的RNA和全细胞提取物。在某些方面,无细胞体系另外包含调节RNA(例如,微小RNA)。
另一方面,本文提供了用于确定式(I)的化合物或其形式是否修饰RNA转录物(例如,mRNA转录物)的剪接的方法,包括:(a)使无细胞体系与式(I)的化合物或其形式接触;和(b)确定由无细胞体系产生的两种或更多种RNA转录物剪接变体的量,其中相对于化合物不存在或阴性对照(例如,溶媒对照,如PBS或DMSO)存在下的两种或更多种RNA转录物剪接变体的量,在化合物存在下的两种或更多种RNA转录物剪接变体的量的调节表明式(I)的化合物或其形式修饰RNA转录物的剪接。另一方面,本文提供了用于确定式(I)的化合物或其形式是否修饰RNA转录物(例如,mRNA转录物)的剪接的方法,包括:(a)使第一无细胞体系与式(I)的化合物或其形式接触;(b)使第二无细胞体系与阴性对照(例如,溶媒对照,如PBS或DMSO)接触;和(c)确定由该第一无细胞体系和该第二无细胞体系产生的两种或更多种RNA转录物剪接变体的量;和(d)比较由第一无细胞体系产生的两种或更多种RNA转录物剪接变体的量与由第二无细胞体系表达的RNA转录物的量,其中相对于由第二无细胞体系产生的两种或更多种RNA转录物剪接变体的量,由第一无细胞体系产生的两种或更多种RNA转录物剪接变体的量的调节表明式(I)的化合物或其形式修饰RNA转录物的剪接。在某些方面,无细胞体系包含纯合成RNA、合成或重组(纯化的)酶和蛋白因子。在其他方面,无细胞体系包含从合成DNA模板转录的RNA、合成或重组(纯化的)酶和蛋白因子。在其他方面,无细胞体系包含纯合成RNA和细胞核提取物。在其他方面,无细胞体系包含从合成DNA模板转录的RNA和细胞核提取物。在其他方面,无细胞体系包含纯合成RNA和全细胞提取物。在其他方面,无细胞体系包含从合成DNA模板转录的RNA和全细胞提取物。在某些方面,无细胞体系另外包含调节RNA(例如,微小RNA)。
另一方面,本文提供了用于确定式(I)的化合物或其形式是否调节RNA转录物(例如,mRNA转录物)的量的方法,包括:(a)在式(I)的化合物或其形式的存在下培养(多种)细胞,(b)在特定的一段时间后从(多种)细胞分离RNA转录物;和(c)确定由(多种)细胞产生的RNA转录物的量,其中相对于化合物不存在或阴性对照(例如,溶媒对照,如PBS或DMSO)存在下的RNA转录物的量,化合物存在下的RNA转录物的量的调节表明式(I)的化合物或其形式调节RNA转录物的量。另一方面,本文提供了用于确定式(I)的化合物或其形式是否调节RNA转录物(例如,mRNA转录物)的量的方法,包括:(a)在式(I)的化合物或其形式的存在下培养第一(多种)细胞,(b)在阴性对照(例如,溶媒对照,如PBS或DMSO)的存在下培养第二(多种)细胞;(c)分离由第一(多种)细胞产生的RNA转录物和分离由第二(多种)细胞产生的RNA转录物;(d)确定由第一(多种)细胞和第二(多种)细胞产生的RNA转录物的量;和(e)比较由第一(多种)细胞产生的RNA转录物的量与由第二(多种)细胞产生的RNA转录物的量,其中相对于由第二(多种)细胞产生的RNA转录物的量,由第一(多种)细胞产生的RNA转录物的量的调节表明式(I)的化合物或其形式调节RNA转录物的量。
在某些方面,与式(I)的化合物或其形式接触或培养的(多种)细胞是来自对象的(多种)原代细胞。在一些方面,与式(I)的化合物或其形式接触或培养的(多种)细胞是来自患有疾病的对象的(多种)原代细胞。在特定方面,与式(I)的化合物或其形式接触或培养的(多种)细胞是来自患有与(多种)特定基因的(多种)RNA转录物的异常量相关的疾病的对象的(多种)原代细胞。在一些特定方面,与式(I)的化合物或其形式接触或培养的(多种)细胞是来自患有与(多种)特定基因的(多种)同种型的异常量相关的疾病的对象的(多种)原代细胞。在一些方面,与式(I)的化合物或其形式接触或培养的(多种)细胞是成纤维细胞(例如,GM03813或PNN 1-46成纤维细胞)、免疫细胞(例如,T细胞、B细胞、自然杀伤细胞、巨噬细胞)或肌细胞。在某些方面,与式(I)的化合物或其形式接触或培养的(多种)细胞是癌细胞。
在某些方面,与式(I)的化合物或其形式接触或培养的(多种)细胞来自细胞系。在一些方面,与式(I)的化合物或其形式接触或培养的(多种)细胞是源自患有疾病的对象的细胞系。在某些方面,与式(I)的化合物或其形式接触或培养的(多种)细胞来自已知具有(多种)特定基因的异常RNA转录物水平的细胞系。在特定方面,与式(I)的化合物或其形式接触或培养的(多种)细胞来自源自对象的细胞系,所述对象患有已知具有(多种)特定基因的异常RNA转录物水平的疾病。在某些方面,与式(I)的化合物或其形式接触或培养的(多种)细胞是癌细胞系。
在一些特定方面,与式(I)的化合物或其形式接触或培养的(多种)细胞来自源自对象的细胞系,所述对象患有已知具有(多种)特定基因的(多种)RNA同种型和/或(多种)蛋白同种型的异常量的疾病。细胞系的非限制性实例包括3T3、4T1、721、9L、A2780、A172、A20、A253、A431、A-549、ALC、B16、B35、BCP-1、BEAS-2B、bEnd.3、BHK、BR 293、BT2O、BT483、BxPC3、C2C12、C3H-10T1/2、C6/36、C6、Cal-27、CHO、COR-L23、COS、COV-434、CML T1、CMT、CRL7O3O、CT26、D17、DH82、DU145、DuCaP、EL4、EM2、EM3、EMT6、FM3、H1299、H69、HB54、HB55、HCA2、HD-1994、HDF(人真皮成纤维细胞)、HEK-293、HeLa、Hepa1c1c7、HL-60、HMEC、Hs578T、HsS78Bst、HT-29、HTB2、HUVEC、Jurkat、J558L、JY、K562、Ku812、KCL22、KG1、KYO1、LNCap、Ma-Mel、MC-38、MCF-7、MCF-10A、MDA-MB-231、MDA-MB-468、MDA-MB-435、MDCK、MG63、MOR/0.2R、MONO-MAC6、MRC5、MTD-1A、NCI-H69、NIH-3T3、NALM-1、NS0、NW-145、OPCN、OPCT、PNT-1A、PNT-2、Raji、RBL、RenCa、RIN-5F、RMA、Saos-2、Sf21、Sf9、SH-SY5Y、SiHa、SKBR3、SKOV-3、T2、T-47D、T84、THP1、U373、U87、U937、VCaP、Vero、VERY、W138、WM39、WT-49、X63、YAC-1和YAR细胞。一方面,细胞来自患者。另一方面,患者细胞是GM03813细胞。另一方面,患者细胞是GM04856、GM04857、GM09197、GM04281、GM04022、GM07492细胞。
另一方面,本文提供了用于确定式(I)的化合物或其形式是否调节RNA转录物(例如,mRNA转录物)的量的方法,包括:(a)使组织样品与式(I)的化合物或其形式接触;和(b)确定由组织样品产生的RNA转录物的量,其中相对于化合物不存在或阴性对照(例如,溶媒对照,如PBS或DMSO)存在下的RNA转录物的量,在化合物存在下的RNA转录物的量的调节表明式(I)的化合物或其形式调节RNA转录物的量。另一方面,本文提供了用于确定式(I)的化合物或其形式是否调节RNA转录物(例如,mRNA转录物)的量的方法,包括:(a)使第一组织样品与式(I)的化合物或其形式接触,(b)使第二组织样品与阴性对照(例如,溶媒对照,如PBS或DMSO);和(c)确定由第一组织样品和第二组织样品产生的RNA转录物的量;和(d)比较由第一组织样品产生的RNA转录物的量与第二组织样品产生的RNA转录物的量,其中相对于由第二组织样品产生的RNA转录物的量,由第一组织样品产生的RNA转录物的量的调节表明式(I)的化合物或其形式调节RNA转录物的量。可以根据这些方法使用任何包含细胞的组织样品。在某些方面,组织样品是血液样品、皮肤样品、肌肉样品或肿瘤样品。本领域技术人员已知的技术可以用于从对象获得组织样品。
在一些方面,进行剂量反应分析。一方面,剂量反应分析包括:(a)使(多种)细胞与一定浓度的式(I)的化合物或其形式接触;(b)确定由(多种)细胞产生的RNA转录物的量,其中相对于化合物不存在或阴性对照(例如,溶媒对照,如PBS或DMSO)存在下的RNA转录物的量,在化合物存在下的RNA转录物的量的调节表明式(I)的化合物或其形式调节RNA转录物的量;(c)重复步骤(a)和(b),其中唯一改变的实验变量是化合物或其形式的浓度;和(d)比较在不同浓度的化合物或其形式下产生的RNA转录物的量。另一方面,剂量反应分析包括:(a)在式(I)的化合物或其形式的存在下培养(多种)细胞;(b)在特定的一段时间后从(多种)细胞分离RNA转录物;(c)确定由(多种)细胞产生的RNA转录物的量,其中相对于化合物不存在或阴性对照(例如,溶媒对照,如PBS或DMSO)存在下的RNA转录物的量,在化合物存在下的RNA转录物的量的调节表明式(I)的化合物或其形式调节RNA转录物的量;(d)重复步骤(a)、(b)和(c),其中唯一改变的实验变量是化合物或其形式的浓度;和(e)比较在不同浓度的化合物或其形式下产生的RNA转录物的量。另一方面,剂量反应分析包括:(a)使含有细胞的微量滴定板的每个孔与不同浓度的式(I)的化合物或其形式接触;(b)确定由每个孔中的细胞产生的RNA转录物的量;和(c)评估在不同浓度的化合物或其形式下RNA转录物的量的变化。
一方面,剂量反应分析包括:(a)使(多种)细胞与一定浓度的式(I)的化合物或其形式接触,其中细胞在细胞培养容器(例如,96孔板)的孔内,在每个孔内的密度大致相同,其中细胞在不同的孔中与不同浓度的化合物接触;(b)从每个孔中的所述细胞分离RNA;(c)确定由每个孔中的(多种)细胞产生的RNA转录物的量;和(d)相对于不同浓度的化合物存在或化合物不存在或阴性对照(例如,溶媒对照,如PBS或DMSO)存在下的RNA转录物的量,评估在一种或多种浓度的化合物的存在下的RNA转录物的量的改变。
在某些方面,使(多种)细胞与化合物接触发生在细胞培养物中。在其他方面,使(多种)细胞与化合物接触发生在对象,如非人类动物对象中。
在本文所述的某些方面,使(多种)细胞与式(I)的化合物或其形式接触或培养,或使组织样品与式(I)的化合物或其形式或阴性对照接触15分钟、30分钟、45分钟、1小时、2小时、3小时、4小时、5小时、6小时、8小时、12小时、18小时、24小时、48小时、72小时或更长的时间段。在本文所述的其他方面,使(多种)细胞与式(I)的化合物或其形式接触或培养,或使组织样品与式(I)的化合物或其形式或阴性对照接触15分钟至1小时、1至2小时、2至4小时、6至12小时、12至18小时、12至24小时、28至24小时、24至48小时、48至72小时的时间段。
在本文所述的某些方面,使(多种)细胞与特定浓度的式(I)的化合物或其形式接触或培养,或使组织样品与特定浓度的式(I)的化合物或其形式接触,其中所述特定浓度为0.0001μM、0.0003μM、0.001μM、0.003μM、0.01μM、0.05μM、1μM、2μM、5μM、10μM、15μM、20μM、25μM、50μM、75μM、100μM或150μM。在本文所述的其他方面,使(多种)细胞与特定浓度的式(I)的化合物或其形式接触或培养,或使组织样品与特定浓度的式(I)的化合物或其形式接触,其中所述特定浓度为0.0001μM、0.0003μM、0.0005μM、0.001μM、0.003μM、0.005μM、0.01μM、0.03μM、0.05μM、0.1μM、0.3μM、0.5μM或1μM。在本文所述的其他方面,使(多种)细胞与特定浓度的式(I)的化合物或其形式接触或培养,或使组织样品与特定浓度的式(I)的化合物或其形式接触,其中所述特定浓度为175μM、200μM、250μM、275μM、300μM、350μM、400μM、450μM、500μM、550μM 600μM、650μM、700μM、750μM、800μM、850μM、900μM、950μM或1mM。在本文所述的一些方面,使(多种)细胞与特定浓度的式(I)的化合物或其形式接触或培养,或使组织样品与特定浓度的式(I)的化合物或其形式接触,其中所述特定浓度为5nM、10nM、20nM、30nM、40nM、50nM、60nM、70nM、80nM、90nM、100nM、150nM、200nM、250nM、300nM、350nM、400nM、450nM、500nM、550nM、600nM、650nM、700nM、750nM、800nM、850nM、900nM或950nM。在本文所述的某些方面,使(多种)细胞与特定浓度的式(I)的化合物或其形式接触或培养,或使组织样品与特定浓度的式(I)的化合物或其形式接触,其中所述特定浓度为0.0001μM至0.001μM、0.0001μM至0.01μM、0.0003μM至0.001μM、0.0003μM至0.01μM、0.001μM至0.01μM、0.003μM至0.01μM、0.01μM至0.1μM、0.1μM至1μM、1μM至50μM、50μM至100μM、100μM至500μM、500μM至1nM、1nM至10nM、10nM至50nM、50nM至100nM、100nM至500nM、500nM至1000nM。
另一方面,本文提供了用于确定式(I)的化合物或其形式是否调节RNA转录物(例如,mRNA转录物)的量的方法,包括:(a)向对象(在某些方面,非人类动物)施用式(I)的化合物或其形式;和(b)确定从对象获得的样品中RNA转录物的量,其中相对于化合物中的RNA转录物的量,其中相对于来自施用化合物或其形式之前的对象的样品或来自未施用化合物或其形式的相同物种的不同对象的样品中的RNA转录物的量,来自施用了化合物或其形式的对象的样品中测量的RNA转录物的量的调节表明式(I)的化合物或其形式调节RNA转录物的量。另一方面,本文提供了用于确定式(I)的化合物或其形式是否调节RNA转录物(例如,mRNA转录物)的量的方法,包括:(a)向第一对象(在某些方面,非人类动物)施用式(I)的化合物或其形式;(b)向与第一对象物种相同的第二对象(在某些方面,非人类动物)施用非活性对照(例如,药物载体);和(c)确定来自第一对象的第一组织样品中的RNA转录物的量和来自第二对象的第二组织样品中的RNA转录物的量;和(d)比较第一组织样品中的RNA转录物的量与第二组织样品中的RNA转录物的量,其中相对于第二组织样品中的RNA转录物的量,第一组织样品中的RNA转录物的量的调节表明式(I)的化合物或其形式调节RNA转录物的量。在某些方面,向对象施用式(I)的化合物或其形式的剂量为约0.001mg/kg/天至约500mg/kg/天。在一些方面,根据本文所述的方法向对象施用单剂量的式(I)的化合物或其形式。在其他方面,根据本文所述的方法向对象施用2、3、4、5或更多个剂量的式(I)的化合物。在特定方面,式(I)的化合物或其形式在药学上可接受的载体、赋形剂或稀释剂中在对象中施用。
另一方面,本文提供了用于确定式(I)的化合物或其形式是否修饰RNA转录物(例如,mRNA转录物)的剪接的方法,包括:(a)向对象(在某些方面,非人类动物)施用式(I)的化合物或其形式;和(b)确定从对象获得的样品中的两种或更多种RNA转录物剪接变体的量,其中相对于来自施用化合物或其形式之前的对象的样品或来自未施用化合物或其形式的相同物种的不同对象的样品中的两种或更多种RNA转录物剪接变体的量,来自施用了化合物或其形式的对象的样品中测量的两种或更多种RNA转录物剪接变体的量的调节表明式(I)的化合物或其形式修饰RNA转录物的剪接。在另一方面,本文提供了用于确定式(I)的化合物或其形式是否修饰RNA转录物(例如,mRNA转录物)的剪接的方法,包括:(a)向第一对象(在某些方面,非人类动物)施用式(I)的化合物或其形式;(b)向与第一对象物种相同的第二对象(在某些方面,非人类动物)施用阴性对照(例如,药物载体);(c)确定来自第一对象的第一组织样品中的两种或更多种RNA转录物剪接变体的量和来自第二对象的第二组织样品中的两种或更多种RNA转录物剪接变体的量;(d)比较第一组织样品中的两种或更多种RNA转录物剪接变体的量与第二组织样品中的两种或更多种RNA转录物剪接变体的量,其中相对于第二组织样品中的两种或更多种RNA转录物剪接变体的量,第一组织样品中的两种或更多种RNA转录物剪接变体的量的调节表明式(I)的化合物或其形式调节RNA转录物的剪接。在某些方面向对象施用式(I)的化合物或其形式的剂量为约0.001mg/kg/天至约500mg/kg/天。在一些方面,根据本文所述的方法向对象施用单剂量的式(I)的化合物或其形式。在其他方面,根据本文所述的方法向对象施用2、3、4、5或更多个剂量的式(I)的化合物。在特定方面,式(I)的化合物或其形式在药学上可接受的载体、赋形剂或稀释剂中在对象中施用。
在一些方面,与(多种)细胞或组织样品接触或培养或施用于对象的式(I)的化合物或其形式是本文所述的化合物。
本领域技术人员已知的技术可以用于确定(多种)RNA转录物的量。在一些方面,使用以下测量一种、两种、三种或更多种RNA转录物的量:深度测序,如
Figure BDA0002383691000002851
RNASeq、
Figure BDA0002383691000002852
下一代测序(NGS)、ION TORRENTTM RNA下一代测序、454TM焦磷酸测序或通过寡核苷酸连接检测测序(SOLIDTM),单分子实时(SMRT)测序,纳米孔测序。在其他方面,使用外显子阵列,例如
Figure BDA0002383691000002853
人外显子阵列,测量多种RNA转录物的量。在某些方面,通过RT-PCR测量一种、两种、三种或更多种RNA转录物的量。在其他方面,通过RT-qPCR或数字颜色编码条形码技术测量一种、两种、三种或更多种RNA转录物的量。进行这些分析的技术是本领域技术人员已知的。
在一些方面,对源自所述分析的数据进行分析以测量剪接的幅度,以相对于化合物不存在或阴性对照存在下的量,确定在化合物存在下产生的剪接成mRNA转录物的外显子的量。在优选的方面,所使用的方法是计算拼接百分比(ΔPSI)的变化。该方法利用来自RNAseq的读取数据(或任何其他可区分mRNA剪接同种型的方法)来计算显示包含(上游外显子与目标外显子之间的连接)或排除(上游和下游外显子之间的连接,不包括目标外显子)的读数之间的比例(百分比),以证明相对于化合物不存在或阴性对照存在下的包含的量,化合物的存在是否影响外显子包含的量。
ΔPSI值从以下公式得出:
ΔPSI(%)=C-U x100
其中,“U”表示在不存在化合物的情况下iExon包含的概率的值(a+b)/2/[(a+b)/2+c];并且,其中“C”表示在存在该化合物的情况下iExon包含的概率的值(a+b)/2/[(a+b)/2+c]。“a”和“b”的值表示支持在RNA转录物中包含iExon的读取次数。换言之,“a”值来自于第一内含子核苷酸序列的读取的量,所述第一内含子核苷酸序列按5’至3’顺序包含:可操作地连接并在第一内含子核苷酸序列上游的第一外显子5’剪接位点,其包含进一步可操作地连接并在第一内含子3’剪接位点上游(新生iExon上游)的第一分支点。“b”值来自于第二内含子核苷酸序列的读取的量,所述第二内含子核苷酸序列按5’至3’顺序包含:可操作地连接并在第二内含子核苷酸序列上游的REMS序列,其包含进一步可操作地连接并在第二外显子的第二内含子3’剪接位点上游的第二分支点。“c”的值表示支持排除iExon的读取次数。因此,当化合物使剪接机制能够识别新生iExon时,在剪接调节化合物的存在下,“C”的值将与不存在化合物的情况下的“U”的值不同。可以根据统计分析方法或本领域普通技术人员已知的其他概率分析方法获得关于iExon包含的可能性的统计上显著的值。
在一些方面,对来自用于测量RNA转录物的分析的数据进行统计分析或其他概率分析。在某些方面,例如,基于来自用于测量相对于化合物不存在或阴性对照存在下的量,RNA转录物的量在化合物的存在下是否被调节的一个或多个分析的数据,通过比较包含和排除iExon(或区域)的总读取次数,进行Fisher精确检验统计分析。在特定方面,统计分析得出的那些调节的RNA转录物的置信度值为10%、5%、4%、3%、2%、1%、0.5%、0.1%、0.01%、0.001%或0.0001%。在一些特定方面,置信度值是那些调节的RNA转录物的p值,为10%、5%、4%、3%、2%、1%、0.5%、0.1%、0.01%、0.001%或0.0001%。在某些特定方面,那些调节的RNA转录物的精确检验、学生t检验或p值分别为10%、5%、4%、3%、2%、1%、0.5%或0.1%和10%、5%、4%、3%、2%、1%、0.5%、0.1%、0.01%、0.001%或0.0001%。
在某些方面,进行另外的分析以确定式(I)的化合物或其形式如何改变(多种)RNA转录物的量。在特定方面,进行另外的分析以确定相对于化合物或其形式不存在或阴性对照存在下的(多种)RNA转录物的量,在式(I)的化合物或其形式的存在下的(多种)RNA转录物的量的调节是否是由于(多种)RNA转录物的转录、剪接和/或稳定性的变化引起的。可以使用本领域技术人员已知的技术来确定式(I)的化合物或其形式是否改变例如(多种)RNA转录物的转录、剪接和/或稳定性。
在某些方面,通过以下确定一种或多种RNA转录物的稳定性:基因表达系列分析(SAGE)、差异显示分析(DD)、RNA任意引物(RAP)-PCR、差异表达序列的限制性核酸内切酶裂解分析(READS)、扩增限制性片段长度多态性(ALFP)、总基因表达分析(TOGA)、RT-PCR、RT-RPA(重组酶聚合酶扩增)、RT-qPCR、RNA-Seq、数字彩色编码条形码技术、高密度cDNA过滤杂交分析(HDFCA)、抑制消减杂交(SSH)、差异筛选(DS)、cDNA阵列、寡核苷酸芯片或组织微阵列。在其他方面,一种或多种RNA转录物的稳定性通过RNA印迹、RNA酶保护或狭缝印迹来确定。
在一些方面,在细胞或组织样品与转录抑制剂,如α-鹅膏菌素、DRB、黄酮吡醇、雷公藤甲素或放线菌素-D接触或培养之前(例如,5分钟、10分钟、30分钟、1小时、2小时、4小时、6小时、8小时、12小时、18小时、24小时、36小时、48小时或72小时之前)或之后(例如,5分钟、10分钟、30分钟、1小时、2小时、4小时、6小时、8小时、12小时、18小时、24小时、36小时、48小时或72小时之后)抑制(多种)细胞或组织样品的转录。在其他方面,在(多种)细胞或组织样品与式(I)的化合物或其形式接触或培养的同时,用转录抑制剂,如α-鹅膏菌素、DRB、黄酮吡醇、雷公藤甲素或放线菌素-D抑制(多种)细胞或组织样品中的转录。
在某些方面,一种或多种RNA转录物的转录水平通过核连缀分析或体外转录起始和延伸分析来确定。在一些方面,转录的检测基于测量放射性或荧光。在一些方面,使用基于PCR的扩增步骤。
在特定方面,测量特定基因的RNA转录物的供选择的剪接形式的量,以查看该基因的RNA转录物的一种、两种或更多种供选择的剪接形式的量是否存在调节。在一些方面,测量由特定基因编码的(多种)同种型的量,以查看该(多种)同种型的量是否存在调节。在某些方面,RNA的剪接形式的水平通过RT-PCR、RT-qPCR、RNA-Seq、数字彩色编码条形码技术或RNA印迹来定量。在其他方面,序列特异性技术可用于检测单个剪接形式的水平。在某些方面,使用细胞核提取物体外测量剪接。在一些方面,检测基于测量放射性或荧光。本领域技术人员已知的技术可用于测量基因的RNA转录物的供选择的剪接形式的量的调节和基因编码的同种型的量的调节。
药物组合物和施用方式
当向患者施用时,式(I)的化合物或其形式优选作为组合物的组分施用,该组合物任选地包含药学上可接受的载体,赋形剂或稀释剂。组合物可以口服施用,或通过任何其他方便的途径施用,例如,通过输注或推注注射,通过上皮或粘膜皮肤衬壁吸收(例如,口腔粘膜、直肠和肠粘膜)吸收,并且可以与另一种生物活性剂一起施用。施用可以是全身的或局部的。各种递送系统是已知的,例如封装在脂质体、微粒、微囊、胶囊中,并且可以用于施用化合物。
施用方法包括但不限于肠胃外、皮内、肌肉内、腹膜内、静脉内、皮下、鼻内、硬膜外、口服、舌下、鼻内、眼内、肿瘤内、脑内、阴道内、经皮、经眼、经直肠、吸入或局部,特别是向耳朵、鼻子、眼睛或皮肤施用。施用方式由医师决定。在大多数情况下,施用会导致化合物释放到血液、组织或(多种)细胞中。在具体方面,化合物是口服施用的。
有效治疗由异常量的mRNA转录物引起的疾病的式(I)的化合物或其形式的量取决于例如施用途径,所治疗的疾病,对象的总体健康状况,对象的种族、年龄、体重和性别,饮食,时间和疾病进展的严重程度,并且应根据从业者的判断以及每个患者或对象的情况来决定。
在特定方面,在向患者施用式(I)的化合物或其形式或其组合物或药物的上下文中,“有效量”是指式(I)的化合物或其形式的具有治疗作用和/或有益作用的量。在某些特定方面,在向患者施用式(I)的化合物或其形式或其组合物或药物的上下文中,“有效量”导致以下作用中的一种、两种或更多种:(i)降低或改善疾病的严重程度;(ii)延迟疾病发作;(iii)抑制疾病的进展;(iv)减少对象的住院;(v)缩短对象的住院时间;(vi)增加对象的存活率;(vii)改善对象的生活质量;(viii)减少与疾病相关的症状数量;(ix)减轻或改善与疾病相关的(多种)症状的严重性;(x)减少与疾病相关的症状的持续时间;(xi)防止与疾病相关的症状的复发;(xii)抑制疾病症状的发展或发作;和/或(xiii)抑制与疾病相关的症状的进展。在某些方面,式(I)的化合物或其形式的有效量是这样的量,其有效地使基因的RNA转录物的量恢复到健康患者或来自健康患者的细胞中可检测到的RNA转录物的量。在其他方面,式(I)的化合物或其形式的有效量是这样的量,其有效地使基因的RNA同种型和/或蛋白同种型的量恢复到健康患者或来自健康患者的细胞中可检测到的RNA同种型和/或蛋白同种型的量。
在某些方面,式(I)的化合物或其形式的有效量是这样的量,其有效降低与疾病相关的基因的RNA转录物的异常量。在某些方面,式(I)的化合物或其形式的有效量是这样的量,其有效降低基因的同种型的异常表达的量。在一些方面,式(I)的化合物或其形式的有效量是这样的量,其有效导致RNA转录物(例如,mRNA转录物)、供选择的剪接变体或同种型的量实质改变。
在某些方面,式(I)的化合物或其形式的有效量是这样的量,其有效地使有益于预防和/或治疗疾病的基因的RNA转录物(例如,mRNA转录物)的量升高或降低。在某些方面,式(I)的化合物或其形式的有效量是这样的量,其有效地使有益于预防和/或治疗疾病的基因的RNA转录物的供选择的剪接变体的量升高或降低。在某些方面,式(I)的化合物或其形式的有效量是这样的量,其有效地使有益于预防和/或治疗疾病的基因的同种型的量升高或降低。本文描述了式(I)的化合物或其形式的有效量的非限制性实例。
例如,有效量可以是预防和/或治疗与人类对象中基因的mRNA转录物的异常量相关的疾病所需的量。
通常,对于体重为约1kg至约200kg的患者,有效量将在约0.001mg/kg/天至约500mg/kg/天的范围内。预期典型的成人对象的中值体重在约70至约100kg的范围内。
在本说明书的范围内,用于制备药物、制备药物试剂盒或用于预防和/或治疗有此需要的人类对象的疾病的方法的式(I)的化合物或其形式的“有效量”意在包括约0.001mg至约35,000mg范围内的量。
本文所述的组合物经配制以通过本领域已知的任何药物递送途径施用于对象。非限制性实例包括口腔、眼、直肠、颊、局部、经鼻、经眼、皮下、肌内、静脉内(推注和输注)、脑内、透皮和肺部施用途径。
本文所述的方面包括式(I)的化合物或其形式在药物组合物中的用途。在具体方面,本文描述了式(I)的化合物或其形式在用于预防和/或治疗有此需要的人类对象的疾病的药物组合物中的用途,包括给予与药学上可接受的载体、赋形剂或稀释剂混合的有效量的式(I)的化合物或其形式。在具体方面,人类对象是患有与异常量的(多种)mRNA转录物相关的疾病的患者。
式(I)的化合物或其形式可以任选地为包含该化合物或其形式和任选的载体、赋形剂或稀释剂的组合物的形式。本文提供的其他方面包括药物组合物,其包含有效量的式(I)的化合物或其形式和药学上可接受的载体、赋形剂或稀释剂。在具体方面,药物组合物适合于兽医和/或人施用。本文提供的药物组合物可以是允许将组合物施用于对象的任何形式。
在特定的方面和在该上下文中,术语“药学上可接受的载体、赋形剂或稀释剂”是指经联邦或州政府的监管机构批准或在美国药典或通常公认的用于动物,尤其是人类的药典中列出的载体、赋形剂或稀释剂。术语“载体”是指与治疗剂一起施用的稀释剂、佐剂(例如弗氏佐剂(完全和不完全)),赋形剂或溶媒。这样的药物载体可以是无菌液体,例如水和油,包括石油、动物、植物或合成来源的油,例如花生油、大豆油、矿物油、芝麻油等。水是用于静脉内施用的药物组合物的特定载体。盐溶液以及葡萄糖和甘油水溶液也可以用作液体载体,特别是用于注射溶液。
典型的组合物和剂型包含一种或多种赋形剂。合适的赋形剂是药学领域技术人员众所周知的,并且合适的赋形剂的非限制性实例包括淀粉、葡萄糖、乳糖、蔗糖、明胶、麦芽、大米、面粉、白垩、硅胶、硬脂酸钠、单硬脂酸甘油酯、滑石粉、氯化钠、脱脂奶粉、甘油、丙二醇、水、乙醇等。特定的赋形剂是否适合掺入药物组合物或剂型中取决于本领域众所周知的多种因素,包括但不限于剂型将施用于患者的方式和剂型中的特定的活性剂。本文还提供了包含一种或多种如本文所述的式(I)的化合物或其形式的无水药物组合物和剂型。组合物和单一单位剂型可以采取溶液剂或糖浆剂(任选地具有调味剂)、混悬剂(任选地具有调味剂)、乳剂、片剂(例如咀嚼片)、丸剂、胶囊剂、颗粒剂、散剂(任选用于重新配制)、掩味或持续释放制剂等。
本文提供的适用于口服施用的药物组合物可以以离散剂型存在,例如但不限于片剂、囊片剂、胶囊剂、颗粒剂、散剂和液体剂。这样的剂型包含预定量的活性成分,并且可以通过本领域技术人员众所周知的药学方法来制备。
可用于本文提供的口服剂型的赋形剂的实例包括但不限于粘合剂、填充剂、崩解剂和润滑剂。
调节特定基因编码的RNA转录物的量的方法
一方面,本文描述了用于修饰RNA剪接以调节基因产物的量的方法,其中从所述基因转录的前体RNA转录物包含内含子REMS,并且所述方法利用本文所述的化合物。在某些方面,基因是本文所述的基因中的任一种。在某些方面,基因包含编码非内源内含子REMS的核苷酸序列。一方面,本文提供了用于修饰RNA剪接以调节本文所述的基因中的一种、两种、三种或更多种RNA转录物的量的方法,该方法包括使细胞与式(I)的化合物或其形式接触。
另一方面,本文提供了用于修饰RNA剪接以调节基因产物(如RNA转录物或蛋白)的量的方法,其中所述基因包含编码两个外显子和内含子的DNA核苷酸序列,其中编码第一外显子的核苷酸序列在编码内含子的核苷酸序列的上游,并且编码第二外显子的核苷酸序列在编码内含子的核苷酸序列的下游,其中所述编码内含子的DNA核苷酸序列按5’至3’顺序包含:编码第一5’剪接位点的核苷酸序列、编码第一分支点的核苷酸序列、编码第一3’剪接位点的核苷酸序列、编码iREMS的核苷酸序列、编码第二分支点的核苷酸序列和编码第二3’剪接位点的核苷酸序列,其中编码所述iREMS的核苷酸序列包含DNA序列Gagtrngn,并且其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,所述方法包括使细胞与本文所述的化合物(例如,式(I)的化合物或其形式)接触。
另一方面,本文提供了用于修饰RNA剪接以调节基因产物(如RNA转录物或蛋白)的量的方法,其中所述基因包含编码两个外显子和内含子的DNA核苷酸序列,其中编码第一外显子的核苷酸序列在编码内含子的核苷酸序列的上游,并且编码第二外显子的核苷酸序列在编码内含子的核苷酸序列的下游,其中所述内含子的DNA核苷酸序列按5’至3’顺序包含:编码iREMS的核苷酸序列、编码分支点的核苷酸序列和编码3’剪接位点的核苷酸序列,其中编码所述iREMS的核苷酸序列包含DNA序列GAgtrngn,并且其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,所述方法包括使细胞与本文所述的化合物(例如,式(I)的化合物或其形式)接触。
另一方面,本文提供了用于修饰RNA剪接以调节基因产物(如RNA转录物或蛋白)的量的方法,其中所述基因包含编码两个外显子和内含子的DNA核苷酸序列,并且其中所述DNA核苷酸序列编码图1A示出的外显子和内含子元件,所述方法包括使细胞与本文所述的化合物接触。
另一方面,本文提供了用于修饰RNA剪接以调节基因产物(如RNA转录物或蛋白)的量的方法,其中所述基因包含编码两个外显子和内含子的DNA核苷酸序列,并且其中所述DNA核苷酸序列编码图1B示出的外显子和内含子元件,所述方法包括使细胞与本文所述的化合物接触。
另一方面,本文提供了用于修饰RNA剪接以调节基因产物(如RNA转录物或蛋白)的量的方法,其中所述基因包含编码两个外显子和内含子的DNA核苷酸序列,并且其中所述DNA核苷酸序列编码图1C示出的外显子和内含子元件,所述方法包括使细胞与本文所述的化合物接触。
在具体方面,所述基因是在本公开的表中描述的基因。
另一方面,本文提供了用于修饰RNA剪接以调节本文所述的基因的一种、两种、三种或更多种RNA转录物的量的方法,其中从所述基因转录的前体转录物包含内含子REMS,所述方法包括使细胞与式(I)的化合物或其形式接触。在具体方面,所述前体转录物按5’至3’顺序包含:分支点、3’剪接位点和内含子REMS。在另一个具体方面,前体转录物按5’至3’顺序包含:第一5’剪接位点、第一分支点、第一3’剪接位点、内含子REMS、第二分支点和第二3’剪接位点。在另一个具体方面,前体转录物按5’至3’顺序包含:内含子REMS、分支点和3’剪接位点。
另一方面,本文提供了用于修饰RNA剪接以调节本文所述的基因的一种、两种、三种或更多种RNA转录物的量的方法,其中从所述基因转录的前体转录物包含内含子REMS,所述方法包括使细胞与式(I)的化合物或其形式接触。在具体方面,前体转录物按5’至3’顺序包含:分支点、3’剪接位点和内含子REMS。在另一个具体方面,前体转录物按5’至3’顺序包含:第一5’剪接位点、第一分支点、第一3’剪接位点、内含子REMS、第二分支点和第二3’剪接位点。在另一个具体方面,前体转录物按5’至3’顺序包含:内含子REMS、分支点和3’剪接位点。
另一方面,本文提供了用于修饰RNA剪接以调节本文所述的基因的一种、两种、三种或更多种RNA转录物的量的方法,包括使细胞与式(I)的化合物或其形式接触。关于本文所述的基因的另外的信息,参见实施例部分。在某些方面,细胞在细胞培养物中与式(I)的化合物或其形式接触。在其他方面,细胞在对象(例如,非人类动物对象或人类对象)中与式(I)的化合物或其形式接触。
一方面,本文提供了用于修饰RNA剪接以产生成熟mRNA转录物的方法,所述成熟mRNA转录物具有来自前体mRNA转录物的iExon,其中所述前体mRNA转录物包含两个外显子和内含子,其中第一外显子在内含子的上游,并且第二外显子在内含子的下游,其中所述内含子按5’至3’顺序包含:第一5’剪接位点、第一分支点、第一3’剪接位点、内源或非内源剪接修饰剂的内含子识别元件(iREMS)、第二分支点和第二3’剪接位点,其中所述iREMS包含RNA序列GAgurngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸。
一方面,本文提供了用于修饰RNA剪接以产生具有iExon的成熟mRNA转录物的方法,所述方法包括使前体mRNA转录物与接触式(I)的化合物或其形式,其中所述前体mRNA转录物包含两个外显子和内含子,其中第一外显子在内含子的上游,并且第二外显子在内含子的下游,其中所述内含子包含按5’至3’顺序:第一5’剪接位点、第一分支点、第一3’剪接位点、内源或非内源剪接修饰剂的内含子识别元件(iREMS)、第二分支点和第二3’剪接位点,其中所述iREMS包含RNA序列GAgurngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸。
另一方面,本文提供了用于修饰RNA剪接以产生具有iExon的成熟mRNA转录物的方法,所述方法包括使包含前体mRNA转录物的细胞或细胞裂解物与式(I)的化合物或其形式接触,其中所述前体mRNA转录物包含两个外显子和内含子,其中第一外显子在内含子的上游,并且第二外显子在内含子的下游,其中所述内含子按5’至3’顺序包含:第一5’剪接位点、第一分支点、第一3’剪接位点、内源或非内源剪接修饰剂的内含子识别元件(iREMS)、第二分支点和第二3’剪接位点,其中所述iREMS包含RNA序列GAgurngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸。在一些方面,前体mRNA转录物由本文公开(例如,在本文的表中)的基因编码。
在特定方面,本文提供了用于修饰RNA剪接以产生具有iExon的成熟mRNA转录物的方法,所述方法包括使前体mRNA转录物与式(I)的化合物或其形式接触,其中所述前体mRNA转录物包含两个外显子和内含子,其中第一外显子在内含子的上游,并且第二外显子在内含子的下游,其中所述内含子按5’至3’顺序包含:第一5’剪接位点、第一分支点、第一3’剪接位点、内源或非内源剪接修饰剂的内含子识别元件(iREMS)、第二分支点和第二3’剪接位点,其中所述iREMS包含RNA序列GAgurngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,并且其中所述前体mRNA转录物是选自以下的基因的前体mRNA转录物:ABCB8、ABCC3、ADAM17、ADCY3、AGPAT4、ANKRA2、ANXA11、APIP、APPL2、ARHGAP1、ARL15、ASAP1、ASPH、ATAD2B、ATXN1、BECN1、BHMT2、BICD1、BTN3A1、C11orf30、C11orf73、C12orf4、C14orf132、C8orf44、C8orf44-SGK3、C8orf88、CASC3、CASP7、CCDC122、CDH13、CECR7、CENPI、CEP112、CEP192、CHEK1、CMAHP、CNRIP1、COPS7B、CPSF4、CRISPLD2、CRYBG3、CSNK1E、CSNK1G1、DCAF17、DCUN1D4、DDX42、DENND1A、DENND5A、DGKA、DHFR、DIAPH3、DNAJC13、DNMBP、DOCK1、DYRK1A、EIF2B3、ENAH、ENOX1、EP300、ERC1、ERLIN2、ERRFI1、EVC、FAF1、FAIM、FAM126A、FAM13A、FAM162A、FAM174A、FBN2、FER、FHOD3、FOCAD、GALC、GCFC2、GGACT、GLCE、GOLGA4、GOLGB1、GPSM2、GULP1、GXYLT1、HDX、HLTF、HMGA2、HNMT、HSD17B12、HSD17B4、HTT、IFT57、IVD、KDM6A、KIAA1524、KIAA1715、LETM2、LOC400927、LRRC42、LUC7L3、LYRM1、MB21D2、MCM10、MED13L、MEDAG、MEMO1、MFN2、MMS19、MRPL45、MRPS28、MTERF3、MYCBP2、MYLK、MYOF、NGF、NREP、NSUN4、NT5C2、OSMR、OXCT1、PAPD4、PCM1、PDE7A、PDS5B、PDXDC1、PIGN、PIK3CD、PIK3R1、PIKFYVE、PITPNB、PLEKHA1、PLSCR1、PMS1、POMT2、PPARG、PPIP5K2、PPP1R26、PRPF31、PRSS23、PSMA4、PXK、RAF1、RAPGEF1、RARS2、RBKS、RERE、RFWD2、RPA1、RPS10、SAMD4A、SAR1A、SCO1、SEC24A、SENP6、SERGEF、SGK3、SLC12A2、SLC25A17、SLC44A2、SMYD3、SNAP23、SNHG16、SNX7、SOS2、SPATA5、SPIDR、SPRYD7、SRGAP1、SRRM1、STAT1、STXBP6、SUPT20H、TAF2、TASP1、TBC1D15、TCF12、TCF4、TIAM1、TJP2、TMC3、TMEM214、TNRC6A、TNS3、TOE1、TRAF3、TSPAN2、TTC7B、TYW5、UBAP2L、URGCP、VAV2、WDR27、WDR37、WDR91、WNK1、XRN2、ZCCHC8、ZFP82、ZNF138、ZNF232和ZNF37BP。
在另一个特定方面,本文提供了用于修饰RNA剪接以产生具有iExon的成熟mRNA转录物的方法,所述方法包括使包含前体mRNA转录物的细胞或细胞裂解物与式(I)的化合物或其形式接触,其中所述前体mRNA转录物包含两个外显子和内含子,其中第一外显子在内含子的上游,并且第二外显子在内含子的下游,其中所述内含子按5’至3’顺序包含:第一5’剪接位点、第一分支点、第一3’剪接位点、内源或非内源剪接修饰剂的内含子识别元件(iREMS)、第二分支点和第二3’剪接位点,其中所述iREMS包含RNA序列GAgurngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,并且其中所述前体mRNA转录物是选自以下的基因的前体mRNA转录物:ABCB8、ABCC3、ADAM17、ADCY3、AGPAT4、ANKRA2、ANXA11、APIP、APPL2、ARHGAP1、ARL15、ASAP1、ASPH、ATAD2B、ATXN1、BECN1、BHMT2、BICD1、BTN3A1、C11orf30、C11orf73、C12orf4、C14orf132、C8orf44、C8orf44-SGK3、C8orf88、CASC3、CASP7、CCDC122、CDH13、CECR7、CENPI、CEP112、CEP192、CHEK1、CMAHP、CNRIP1、COPS7B、CPSF4、CRISPLD2、CRYBG3、CSNK1E、CSNK1G1、DCAF17、DCUN1D4、DDX42、DENND1A、DENND5A、DGKA、DHFR、DIAPH3、DNAJC13、DNMBP、DOCK1、DYRK1A、EIF2B3、ENAH、ENOX1、EP300、ERC1、ERLIN2、ERRFI1、EVC、FAF1、FAIM、FAM126A、FAM13A、FAM162A、FAM174A、FBN2、FER、FHOD3、FOCAD、GALC、GCFC2、GGACT、GLCE、GOLGA4、GOLGB1、GPSM2、GULP1、GXYLT1、HDX、HLTF、HMGA2、HNMT、HSD17B12、HSD17B4、HTT、IFT57、IVD、KDM6A、KIAA1524、KIAA1715、LETM2、LOC400927、LRRC42、LUC7L3、LYRM1、MB21D2、MCM10、MED13L、MEDAG、MEMO1、MFN2、MMS19、MRPL45、MRPS28、MTERF3、MYCBP2、MYLK、MYOF、NGF、NREP、NSUN4、NT5C2、OSMR、OXCT1、PAPD4、PCM1、PDE7A、PDS5B、PDXDC1、PIGN、PIK3CD、PIK3R1、PIKFYVE、PITPNB、PLEKHA1、PLSCR1、PMS1、POMT2、PPARG、PPIP5K2、PPP1R26、PRPF31、PRSS23、PSMA4、PXK、RAF1、RAPGEF1、RARS2、RBKS、RERE、RFWD2、RPA1、RPS10、SAMD4A、SAR1A、SCO1、SEC24A、SENP6、SERGEF、SGK3、SLC12A2、SLC25A17、SLC44A2、SMYD3、SNAP23、SNHG16、SNX7、SOS2、SPATA5、SPIDR、SPRYD7、SRGAP1、SRRM1、STAT1、STXBP6、SUPT20H、TAF2、TASP1、TBC1D15、TCF12、TCF4、TIAM1、TJP2、TMC3、TMEM214、TNRC6A、TNS3、TOE1、TRAF3、TSPAN2、TTC7B、TYW5、UBAP2L、URGCP、VAV2、WDR27、WDR37、WDR91、WNK1、XRN2、ZCCHC8、ZFP82、ZNF138、ZNF232和ZNF37BP。
在另一个特定方面,本文提供了用于修饰RNA剪接以产生具有iExon的成熟mRNA转录物的方法,所述方法包括使包含前体mRNA转录物的细胞或细胞裂解物与式(I)的化合物或其形式接触,其中所述前体mRNA转录物包含两个外显子和内含子,其中第一外显子在内含子的上游,并且第二外显子在内含子的下游,其中所述内含子按5’至3’顺序包含:第一5’剪接位点、第一分支点、第一3’剪接位点、内源或非内源剪接修饰剂的内含子识别元件(iREMS)、第二分支点和第二3’剪接位点,其中所述iREMS包含RNA序列GAgurngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,并且其中所述前体mRNA转录物是选自以下的基因的前体mRNA转录物:ABCA1、ABCA10、ABCB7、ABCB8、ABCC1、ABCC3、ABHD10、ABL2、ABLIM3、ACACA、ACADVL、ACAT2、ACTA2、ADAL、ADAM12、ADAM15、ADAM17、ADAM23、ADAM33、ADAMTS1、ADAMTS19、ADCY3、ADD1、ADGRG6、ADH6、ADHFE1、AFF2、AFF3、AGK、AGPAT3、AGPAT4、AGPS、AHCYL2、AHDC1、AHRR、AJUBA、AK021888、AK310472、AKAP1、AKAP3、AKAP8L、AKAP9、AKNA、AKT1、ALCAM、ALDH4A1、AMPD2、ANK1、ANK2、ANK3、ANKFY1、ANKHD1-EIF4EBP3、ANKRA2、ANKRD13C、ANKRD17、ANKRD33B、ANKRD36、ANKS6、ANP32A、ANXA11、ANXA6、AP2B1、AP4B1-AS1、APAF1、APIP、APLP2、APOA2、APP、APPL2、APTX、ARHGAP1、ARHGAP12、ARHGAP22、ARHGAP5、ARHGEF16、ARID1A、ARID2、ARID5B、ARL9、ARL15、ARL5B、ARMCX3、ARMCX6、ARSJ、ASAP1、ASIC1、ASL、ASNS、ASPH、ATAD2B、ATF6、ATF7IP、ATG5、ATG9A、ATMIN、ATP2A3、ATP2C1、ATXN1、ATXN3、AURKA、AXIN1、B3GALT2、B3GNT6、B4GALT2、BACE1、BAG2、BASP1、BC033281、BCAR3、BCL2L15、BCYRN1、BECN1、BEND6、BHMT2、BICD1、BIN1、BIN3、BIN3-IT1、BIRC3、BIRC6、BNC1、BNC2、BRCA1、BRCA2、BRD2、BRPF1、BSCL2、BTBD10、BTG2、BTN3A1、BZW1、C1QTNF9B-AS1、C1orf27、C1orf86、C10orf54、C11orf30、C11orf70、C11orf73、C11orf76、C11orf94、C12orf4、C12orf56、C14orf132、C17orf76-AS1、C19orf47、C2orf47、C3、C4orf27、C5orf24、C6orf48、C7orf31、C8orf34、C8orf44、C8orf44-SGK3、C8orf88、C9orf69、CA13、CA3、CAB39、CACNA2D2、CACNB1、CACNB4、CADM1、CADM2、CALU、CAMKK1、CAND2、CAPNS1、CASC3、CASP7、CASP8AP2、CAV1、CCAR1、CCDC77、CCDC79、CCDC88A、CCDC92、CCDC122、CCER2、CCNF、CCNL2、CCT6A、CD276、CD46、CDC25B、CDC40、CDC42BPA、CDCA7、CDH11、CDH13、CDH18、CDK11B、CDK16、CDKAL1、CDKN1C、CECR7、CELSR1、CEMIP、CENPI、CEP112、CEP162、CEP170、CEP192、CEP57、CEP68、CFH、CFLAR、CHD8、CHEK1、CHRM2、CIITA、CIZ1、CLDN23、CLIC1、CLK4、CLTA、CMAHP、CNGA4、CNOT1、CNRIP1、CNTD1、CMSS1、CNOT7、CNRIP1、CNTN1、COG1、COL1A1、COL11A1、COL12A1、COL14A1、COL15A1、COL5A1、COL5A3、COL6A1、COL6A6、COL8A1、COLEC12、COMP、COPS7B、CPA4、CPEB2、CPQ、CPSF4、CREB5、CRISPLD2、CRLF1、CRLS1、CRTAP、CRX、CRYBG3、CRYL1、CSDE1、CSNK1A1、CSNK1E、CSNK1G1、CTDSP2、CTNND1、CTRC、CUL2、CUL4A、CUX1、CYB5B、CYB5R2、CYBRD1、CYGB、CYP1B1、CYP51A1、DAAM1、DAB2、DACT1、DAGLB、DARS、DAXX、DCAF10、DCAF11、DCAF17、DCBLD2、DCLK1、DCN、DCUN1D4、DDAH1、DDAH2、DDHD2、DDIT4L、DDR1、DDX39B、DDX42、DDX50、DEGS1、DENND1A、DENND1B、DENND4A、DENND5A、DEPTOR、DET1、DFNB59、DGCR2、DGK1、DGKA、DHCR24、DHCR7、DHFR、DHX9、DIAPH1、DIAPH3、DIRAS3、DIS3L、DKFZp434M1735、DKK3、DLC1、DLG5、DLGAP4、DMD、DMXL1、DNAH8、DNAH11、DNAJA4、DNAJC13、DNAJC27、DNM2、DNMBP、DOCK1、DOCK11、DPP8、DSEL、DST、DSTN、DYNC1I1、DYRK1A、DZIP1L、EBF1、EEA1、EEF1A1、EFCAB14、EFEMP1、EGR1、EGR3、EHMT2、EIF2B3、EIF4G1、EIF4G2、EIF4G3、ELF2、ELMO2、ELN、ELP4、EMX2OS、ENAH、ENG、ENOX1、ENPP1、ENPP2、ENSA、EP300、EPN1、EPT1、ERC1、ERC2、ERCC1、ERCC8、ERGIC3、ERLIN2、ERRFI1、ESM1、ETV5、EVC、EVC2、EXO1、EXOC3、EXOC6B、EXTL2、EYA3、F2R、FADS1、FADS2、FAF1、FAIM、FAM111A、FAM126A、FAM13A、FAM160A1、FAM162A、FAM174A、FAM195B、FAM198B、FAM20A、FAM208B、FAM219A、FAM219B、FAM3C、FAM46B、FAM49B、FAM65A、FAM65B、FAM69B、FAP、FARP1、FBLN2、FBN2、FBXL16、FBXL6、FBXO9、FBXO10、FBXO18、FBXO31、FBXO34、FBXO9、FCHO1、FDFT1、FDPS、FER、FEZ1、FGD4、FGD5-AS1、FGFR2、FGFRL1、FGL2、FHOD3、FLII、FLNB、FLT1、FN1、FNBP1、FOCAD、FOS、FOSB、FOSL1、FOXK1、FOXM1、FRAS1、FSCN2、FUS、FYN、GABPB1、GAL3ST4、GALC、GALNT1、GALNT15、GAS7、GATA6、GBA2、GBGT1、GBP1、GCFC2、GLCE、GCNT1、GDF6、GGACT、GGCT、GHDC、GIGYF2、GJC1、GLCE、GMIP、GNA13、GNAQ、GNAS、GNG12、GNL3L、GOLGA2、GOLGA4、GOLGB1、GORASP1、GPR1、GPR183、GPR50、GPR89A、GPRC5A、GPRC5B、GPSM2、GREM1、GRK6、GRTP1、GSE1、GTF2H2B、GTSF1、GUCA1B、GULP1、GXYLT1、HAPLN1、HAPLN2、HAS2、HAS3、HAT1、HAUS3、HAUS6、HAVCR2、HDAC5、HDAC7、HDX、HECTD2-AS1、HEG1、HEPH、HEY1、HLA-A、HLA-E、HLTF、HMGA1、HMGA2、HMGB1、HMGCR、HMGN3-AS1、HMGCS1、HMGXB4、HOOK3、HOXB3、HMOX1、HNMT、HNRNPR、HNRNPUL1、HP1BP3、HPS1、HRH1、HSD17B12、HSD17B4、HSPA1L、HTATIP2、HTT、IARS、IDH1、IDI1、IFT57、IGDCC4、IGF2BP2、IGF2R、IGFBP3、IKBKAP、IL16、IL6ST、INA、INHBA、INO80、IPP4B、INPP5K、INSIG1、INTU、INVS、IQCE、IQCG、ITCH、ITGA11、ITGA8、ITGAV、ITGB5、ITGB8、ITIH1、ITM2C、ITPKA、ITSN1、IVD、KANSL3、KAT6B、KCNK2、KCNS1、KCNS2、KDM6A、KDSR、KIAA1033、KIAA1143、KIAA1199、KIAA1456、KIAA1462、KIAA1522、KIAA1524、KIAA1549、KIAA1715、KIAA1755、KIDINS220、KIF14、KIF2A、KIF21A、KIF3A、KIT、KLC1、KLC2、KLF17、KLF6、KLHL7、KLRG1、KMT2D、KRT7、KRT18、KRT19、KRT34、KRTAP1-1、KRTAP1-5、KRTAP2-3、L3MBTL2、LAMA2、LAMB1、LAMB2P1、LARP4、LARP7、LATS2、LDLR、LEMD3、LETM2、LGALS3、LGALS8、LGI2、LGR4、LHX9、LIMS1、LINC00341、LINC00472、LINC00570、LINC00578、LINC00607、LINC00657、LINC00678、LINC00702、LINC00886、LINC00961、LINC01011、LINC01118、LINC01204、LINCR-0002、LINGO2、LMAN2L、LMNA、LMO7、LMOD1、LOC400927、LONP1、LOX、LPHN1、LRBA、LRCH4、LRIG1、LRP4、LRP8、LRRC1、LRRC32、LRRC39、LRRC42、LRRC8A、LSAMP、LSS、LTBR、LUC7L2、LUM、LYPD1、LYRM1、LZTS2、MACROD2、MADD、MAFB、MAGED4、MAGED4B、MAMDC2、MAN1A2、MAN2A1、MAN2C1、MANEA、MAP4K4、MAPK10、MAPK13、MARCH7、MARCH8、MASP1、MB、MB21D2、MBD1、MBOAT7、MC4R、MCM10、MDM2、MDN1、MEAF6、MECP2、MED1、MED13L、MEDAG、MEF2D、MEGF6、MEIS2、MEMO1、MEPCE、MFGE8、MFN2、MIAT、MICAL2、MINPP1、MIR612、MKL1、MKLN1、MKNK2、MLLT4、MLLT10、MLST8、MMAB、MMP10、MMP24、MMS19、MMS22L、MN1、MORF4L1、MOXD1、MPPE1、MPZL1、MRPL3、MRPL39、MRPL45、MRPL55、MRPS28、MRVI1、MSANTD3、MSC、MSH2、MSH4、MSH6、MSL3、MSMO1、MSRB3、MTAP、MTERF3、MTERFD1、MTHFD1L、MTMR3、MTMR9、MTRR、MUM1、MVD、MVK、MXRA5、MYADM、MYB、MYCBP2、MYLK、MYO1D、MYO9B、MYOF、NA、NAA35、NAALADL2、NADK、NAE1、NAGS、NASP、NAV1、NAV2、NCOA1、NCOA3、NCOA4、NCSTN、NDNF、NEDD4、NELFA、NEO1、NEURL1B、NF2、NFASC、NFE2L1、NFX1、NGF、NGFR、NHLH1、NID1、NID2、NIPA1、NKX3-1、NLGN1、NLN、NOL10、NOMO3、NOTCH3、NOTUM、NOVA2、NOX4、NPEPPS、NRD1、NREP、NRG1、NRROS、NSUN4、NT5C2、NT5E、NTNG1、NUDT4、NUP153、NUP35、NUP50、NUPL1、NUSAP1、OCLN、ODF2、OLR1、OS9、OSBPL3、OSBPL6、OSBPL10、OSMR、OXCT1、OXCT2、P4HA1、P4HB、PABPC1、PAIP2B、PAK4、PAPD4、PARD3、PARN、PARP14、PARP4、PARVB、PAX6、PBLD、PBX3、PCBP2、PCBP4、PCCB、PCDH10、PCDHGB3、PCGF3、PCM1、PCMTD2、PCNXL2、PCSK9、PDE1C、PDE3A、PDE4A、PDE5A、PDE7A、PDGFD、PDGFRB、PDLIM7、PDS5B、PDXDC1、PDXDC2P、PEAR1、PELI1、PEPD、PEX5、PFKP、PHACTR3、PHF19、PHF8、PHRF1、PHTF2、PI4K2A、PIEZO1、PIGN、PIGU、PIK3C2B、PIK3CD、PIK3R1、PIKFYVE、PIM2、PITPNA、PITPNB、PITPNM1、PITPNM3、PLAU、PLEC、PLEK2、PLEKHA1、PLEKHA6、PLEKHB2、PLEKHH2、PLSCR1、PLSCR3、PLXNB2、PLXNC1、PMS1、PNISR、PODN、POLE3、POLN、POLR1A、POLR3D、POMT2、POSTN、POU2F1、PPAPDC1A、PPARA、PPARG、PPFIBP1、PPHLN1、PPIP5K1、PPIP5K2、PPM1E、PPP1R12A、PPP1R26、PPP3CA、PPP6R1、PPP6R2、PRKACB、PRKCA、PRKDC、PRKG1、PRMT1、PRNP、PRPF31、PRPH2、PRRG4、PRSS23、PRUNE2、PSMA4、PSMC1、PSMD6、PSMD6-AS2、PTCH1、PTGIS、PTK2B、PTPN14、PTX3、PUF60、PUS7、PVR、PXK、PXN、QKI、RAB23、RAB2B、RAB30、RAB34、RAB38、RAB44、RAD1、RAD9B、RAD23B、RAF1、RALB、RAP1A、RAP1GDS1、RAPGEF1、RARG、RARS、RARS2、RASIP1、RASSF8、RBBP8、RBCK1、RCOR3、RBFOX2、RBKS、RBM10、RCC1、RDX、RERE、RFTN1、RFWD2、RFX3-AS1、RGCC、RGL1、RGS10、RGS3、RIF1、RNF14、RNF19A、RNF130、RNF144A、RNF213、RNF38、RNFT1、ROR1、ROR2、RPA1、RPF2、RPL10、RPS10、RPS6KB2、RPS6KC1、RRBP1、RWDD4、SAMD4A、SAMD9、SAMD9L、SAR1A、SART3、SCAF4、SCAF8、SCARNA9、SCD、SCLT1、SCO1、SDCBP、SEC14L1、SEC22A、SEC24A、SEC24B、SEC61A1、SENP6、SEPT9、SERGEF、SERPINE2、SF1、SF3B3、SGIP1、SGK3、SGMS1、SGOL2、SGPL1、SH2B3、SH3RF1、SH3YL1、SHROOM3、SIGLEC10、SKA2、SKIL、SKP1、SLC12A2、SLC24A3、SLC25A16、SLC25A17、SLC34A3、SLC35F3、SLC39A3、SLC39A10、SLC4A4、SLC4A11、SLC41A1、SLC44A2、SLC46A2、SLC6A15、SLC7A6、SLC7A8、SLC7A11、SLC9A3、SLIT3、SMARCA4、SMARCC2、SMC4、SMC6、SMCHD1、SMG1、SMG1P3、SMN2、SMOX、SMPD4、SMTN、SMYD3、SMYD5、SNAP23、SNED1、SNHG16、SNX7、SNX14、SNX24、SNX7、SOCS2、SOCS6、SOGA2、SON、SORBS2、SORCS1、SORCS2、SOS2、SOX7、SPATA18、SPATA20、SPATA5、SPATS2、SPDYA、SPEF2、SPG20、SPIDR、SPINK5、SPRED2、SPRYD7、SQLE、SQRDL、SQSTM1、SRCAP、SREBF1、SREK1、SRGAP1、SRRM1、SRSF3、SSBP1、STAC2、STARD4、STAT1、STAT3、STAT4、STAU1、STC2、STEAP2、STK32B、STRAD8、STRIP1、STRN3、STRN4、STS、STX16、STXBP4、STXBP6、SULF1、SUPT20H、SVEP1、SYNE1、SYNE2、SYNGR2、SYNPO、SYNPO2、SYNPO2L、SYT15、SYTL2、TACC1、TAF2、TAGLN3、TANC2、TANGO6、TARBP1、TARS、TASP1、TBC1D15、TBCA、TBL1XR1、TBL2、TCF12、TCF4、TCF7L2、TEKT4P2、TENC1、TENM2、TEP1、TET1、TET3、TEX21P、TFCP2、TGFA、TGFB2、TGFB3、TGFBI、TGFBR1、TGFBRAP1、TGM2、THADA、THAP4、THBS2、THRB、TIAM1、TIMP2、TJAP1、TJP2、TLE3、TLK1、TMC3、TMEM67、TMEM102、TMEM119、TMEM134、TMEM154、TMEM189-UBE2V1、TMEM214、TMEM256-PLSCR3、TMEM47、TMEM50B、TMEM63A、TMX3、TNC、TNFAIP3、TNFAIP8L3、TNFRSF12A、TNFRSF14、TNIP1、TNKS1BP1、TNPO3、TNRC18P1、TNRC6A、TNS1、TNS3、TNXB、TOE1、TOMM40、TOMM5、TOPORS、TP53AIP1、TP53INP1、TPRG1、TRAF3、TRAK1、TRAPPC12、TRIB1、TRIM2、TRIM23、TRIM26、TRIM28、TRIM65、TRIM66、TRMT1L、TRPC4、TRPS1、TSC2、TSHZ1、TSHZ2、TSPAN11、TSPAN18、TSPAN2、TSPAN7、TSSK3、TTC7A、TTC7B、TUBB2C、TUBB3、TUBE1、TXNIP、TXNL1、TXNL4B、TXNRD1、TYW5、U2SURP、UBAP2L、UBE2D3、UBE2G2、UBE2L3、UBE2V1、UBN2、UBQLN4、UCHL5、UHMK1、UHRF1BP1L、UNC13B、UNC5B、URGCP、URGCP-MRPS24、USP19、USP7、USP27X、UVRAG、VANGL1、VARS2、VAV2、VCL、VDAC2、VIM-AS1、VIPAS39、VPS13A、VPS29、VPS41、VPS51、VSTM2L、VWA8、VWF、WDR19、WDR27、WDR37、WDR48、WDR90、WDR91、WHSC2、WIPF1、WISP1、WNK1、WNT5B、WNT10B、WSB1、WWTR1、XDH、XIAP、XRN2、YAP1、YDJC、YES1、YPEL5、YTHDF3、Z24749、ZAK、ZBTB10、ZBTB24、ZBTB26、ZBTB7A、ZC3H12C、ZC3H14、ZC3H18、ZCCHC5、ZCCHC8、ZCCHC11、ZEB1、ZEB2、ZFAND1、ZFAND5、ZFP82、ZHX3、ZMIZ1、ZMIZ1-AS1、ZMIZ2、ZMYM2、ZNF12、ZNF138、ZNF148、ZNF208、ZNF212、ZNF219、ZNF227、ZNF232、ZNF24、ZNF268、ZNF28、ZNF280D、ZNF281、ZNF335、ZNF350、ZNF37A、ZNF37BP、ZNF395、ZNF426、ZNF431、ZNF583、ZNF618、ZNF621、ZNF652、ZNF655、ZNF660、ZNF674、ZNF680、ZNF730、ZNF74、ZNF764、ZNF777、ZNF778、ZNF780A、ZNF7804A、ZNF79、ZNF827、ZNF836、ZNF837、ZNF839、ZNF91和ZSCAN25。
在另一个特定方面,本文提供了用于修饰RNA剪接以产生具有iExon的成熟mRNA转录物的方法,所述方法包括使包含前体mRNA转录物的细胞或细胞裂解物与式(I)的化合物或其形式接触,其中所述前体mRNA转录物包含两个外显子和内含子,其中第一外显子在内含子的上游,并且第二外显子在内含子的下游,其中所述内含子按5’至3’顺序包含:第一5’剪接位点、第一分支点、第一3’剪接位点、内源或非内源剪接修饰剂的内含子识别元件(iREMS)、第二分支点和第二3’剪接位点,其中所述iREMS包含RNA序列GAgurngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,并且其中所述前体mRNA转录物是选自以下的基因的前体mRNA转录物:APOA2、ASAP1、BRCA1、BRCA2、CDKN1C、CRX、CTRC、DENND5A、DIAPH3、DMD、DNAH11、EIF2B3、GALC、HPS1、HTT、IKBKAP、KIAA1524、LMNA、MECP2、PAPD4、PAX6、PCCB、PITPNB、PTCH1、SLC34A3、SMN2、SPINK5、SREK1、TMEM67、VWF、XDH和XRN2。
在另一个特定方面,本文提供了用于修饰RNA剪接以产生具有iExon的成熟mRNA转录物的方法,所述方法包括使包含前体mRNA转录物的细胞或细胞裂解物与式(I)的化合物或其形式接触,其中所述前体mRNA转录物包含两个外显子和内含子,其中第一外显子在内含子的上游,并且第二外显子在内含子的下游,其中所述内含子按5’至3’顺序包含:第一5’剪接位点、第一分支点、第一3’剪接位点、内源或非内源剪接修饰剂的内含子识别元件(iREMS)、第二分支点和第二3’剪接位点,其中所述iREMS包含RNA序列GAgurngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,并且其中所述前体mRNA转录物是选自以下的基因的前体mRNA转录物:ABCA1、ABCA10、ABCB7、ABCB8、ABCC1、ABCC3、ABL2、ABLIM3、ACACA、ACADVL、ACAT2、ACTA2、ADAL、ADAM15、ADAM17、ADAM23、ADAM33、ADAMTS1、ADAMTS19、ADCY3、ADD1、ADGRG6、ADH6、ADHFE1、AFF2、AFF3、AGK、AGPAT3、AGPAT4、AGPS、AHCYL2、AHDC1、AHRR、AJUBA、AK021888、AK310472、AKAP1、AKAP3、AKAP8L、AKAP9、AKNA、ALCAM、ALDH4A1、AMPD2、ANK1、ANK2、ANK3、ANKFY1、ANKHD1-EIF4EBP3、ANKRA2、ANKRD13C、ANKRD17、ANKRD33B、ANKRD36、ANKS6、ANP32A、ANXA6、AP2B1、AP4B1-AS1、APAF1、APIP、APOA2、APP、APTX、ARHGAP1、ARHGAP12、ARHGAP22、ARHGAP5、ARHGEF16、ARID1A、ARID2、ARID5B、ARL9、ARL15、ARL5B、ARMCX3、ARSJ、ASAP1、ASIC1、ASL、ASNS、ASPH、ATAD2B、ATF6、ATF7IP、ATG9A、ATMIN、ATP2A3、ATP2C1、ATXN1、ATXN3、AURKA、B3GALT2、B3GNT6、B4GALT2、BACE1、BAG2、BASP1、BC033281、BCAR3、BCL2L15、BCYRN1、BECN1、BEND6、BHMT2、BICD1、BIN1、BIN3、BIN3-IT1、BIRC3、BIRC6、BNC1、BNC2、BRCA1、BRCA2、BRD2、BRPF1、BSCL2、BTBD10、BTG2、BTN3A1、BZW1、C1QTNF9B-AS1、C1orf27、C1orf86、C10orf54、C11orf30、C11orf70、C11orf73、C11orf76、C11orf94、C12orf4、C12orf56、C14orf132、C17orf76-AS1、C19orf47、C2orf47、C3、C4orf27、C5orf24、C6orf48、C7orf31、C8orf34、C8orf44、C8orf44-SGK3、C8orf88、C9orf69、CA13、CA3、CAB39、CACNA2D2、CACNB1、CACNB4、CADM1、CADM2、CALU、CAMKK1、CAND2、CAPNS1、CASC3、CASP7、CASP8AP2、CAV1、CCAR1、CCDC77、CCDC79、CCDC88A、CCDC92、CCDC122、CCER2、CCNF、CCNL2、CCT6A、CD276、CD46、CDC25B、CDC40、CDC42BPA、CDCA7、CDH11、CDH13、CDH18、CDK11B、CDK16、CDKAL1、CDKN1C、CECR7、CELSR1、CEMIP、CENPI、CEP112、CEP162、CEP170、CEP192、CEP68、CFH、CFLAR、CHD8、CHEK1、CHRM2、CIITA、CIZ1、CLDN23、CLIC1、CLK4、CLTA、CMAHP、CNGA4、CNOT1、CNRIP1、CNTD1、CMSS1、CNOT7、CNRIP1、CNTN1、COG1、COL1A1、COL11A1、COL12A1、COL14A1、COL15A1、COL5A1、COL5A3、COL6A1、COL6A6、COL8A1、COLEC12、COMP、COPS7B、CPA4、CPEB2、CPQ、CPSF4、CREB5、CRISPLD2、CRLF1、CRLS1、CRTAP、CRX、CRYBG3、CRYL1、CSDE1、CSNK1A1、CSNK1E、CSNK1G1、CTDSP2、CTNND1、CTRC、CUL2、CUL4A、CUX1、CYB5B、CYB5R2、CYBRD1、CYGB、CYP1B1、CYP51A1、DAAM1、DAB2、DACT1、DAGLB、DARS、DAXX、DCAF10、DCAF11、DCAF17、DCBLD2、DCLK1、DCN、DCUN1D4、DDAH1、DDAH2、DDHD2、DDIT4L、DDR1、DDX39B、DDX42、DDX50、DEGS1、DENND1A、DENND1B、DENND4A、DENND5A、DEPTOR、DET1、DFNB59、DGCR2、DGK1、DGKA、DHCR24、DHCR7、DHFR、DHX9、DIAPH1、DIAPH3、DIRAS3、DIS3L、DKFZp434M1735、DKK3、DLC1、DLG5、DMD、DMXL1、DNAH8、DNAH11、DNAJA4、DNAJC13、DNAJC27、DNM2、DNMBP、DOCK1、DOCK11、DPP8、DSEL、DST、DSTN、DYNC1I1、DYRK1A、DZIP1L、EBF1、EEA1、EEF1A1、EFCAB14、EFEMP1、EGR1、EGR3、EHMT2、EIF2B3、EIF4G1、EIF4G2、EIF4G3、ELF2、ELMO2、ELN、ELP4、EMX2OS、ENAH、ENG、ENOX1、ENPP1、ENPP2、ENSA、EP300、EPT1、ERC1、ERC2、ERCC1、ERCC8、ERLIN2、ERRFI1、ESM1、ETV5、EVC、EVC2、EXO1、EXOC3、EXOC6B、EXTL2、EYA3、F2R、FADS1、FADS2、FAF1、FAIM、FAM111A、FAM126A、FAM13A、FAM160A1、FAM162A、FAM174A、FAM195B、FAM198B、FAM20A、FAM208B、FAM219A、FAM219B、FAM3C、FAM46B、FAM49B、FAM65A、FAM65B、FAM69B、FAP、FARP1、FBLN2、FBN2、FBXL16、FBXL6、FBXO9、FBXO10、FBXO18、FBXO31、FBXO34、FBXO9、FCHO1、FDFT1、FDPS、FER、FEZ1、FGD4、FGD5-AS1、FGFR2、FGFRL1、FGL2、FHOD3、FLII、FLNB、FLT1、FN1、FNBP1、FOCAD、FOS、FOSB、FOSL1、FOXK1、FRAS1、FSCN2、FUS、FYN、GABPB1、GAL3ST4、GALC、GALNT1、GALNT15、GAS7、GATA6、GBA2、GBGT1、GBP1、GCFC2、GLCE、GCNT1、GDF6、GGACT、GHDC、GIGYF2、GJC1、GLCE、GMIP、GNA13、GNAQ、GNAS、GNG12、GNL3L、GOLGA2、GOLGA4、GOLGB1、GORASP1、GPR1、GPR183、GPR50、GPR89A、GPRC5A、GPRC5B、GPSM2、GREM1、GRK6、GRTP1、GSE1、GTF2H2B、GTSF1、GUCA1B、GULP1、GXYLT1、HAPLN1、HAPLN2、HAS2、HAS3、HAT1、HAUS3、HAUS6、HAVCR2、HDAC5、HDAC7、HDX、HECTD2-AS1、HEG1、HEPH、HEY1、HLA-A、HLA-E、HLTF、HMGA1、HMGA2、HMGB1、HMGCR、HMGN3-AS1、HMGCS1、HMGXB4、HOOK3、HOXB3、HMOX1、HNMT、HNRNPR、HNRNPUL1、HP1BP3、HPS1、HRH1、HSD17B12、HSPA1L、HTATIP2、HTT、IARS、IDH1、IDI1、IFT57、IGDCC4、IGF2BP2、IGF2R、IGFBP3、IKBKAP、IL16、IL6ST、INA、INHBA、INO80、IPP4B、INPP5K、INSIG1、INTU、INVS、IQCE、IQCG、ITCH、ITGA11、ITGA8、ITGAV、ITGB5、ITGB8、ITIH1、ITM2C、ITPKA、ITSN1、IVD、KANSL3、KAT6B、KCNK2、KCNS1、KCNS2、KDM6A、KDSR、KIAA1033、KIAA1143、KIAA1199、KIAA1456、KIAA1462、KIAA1522、KIAA1524、KIAA1549、KIAA1715、KIAA1755、KIDINS220、KIF14、KIF2A、KIF21A、KIF3A、KIT、KLC1、KLC2、KLF17、KLF6、KLHL7、KLRG1、KMT2D、KRT7、KRT18、KRT19、KRT34、KRTAP1-1、KRTAP1-5、KRTAP2-3、L3MBTL2、LAMA2、LAMB1、LAMB2P1、LARP4、LATS2、LDLR、LEMD3、LETM2、LGALS3、LGALS8、LGI2、LGR4、LHX9、LIMS1、LINC00341、LINC00472、LINC00570、LINC00578、LINC00607、LINC00657、LINC00678、LINC00702、LINC00886、LINC00961、LINC01011、LINC01118、LINC01204、LINCR-0002、LINGO2、LMAN2L、LMNA、LMO7、LMOD1、LOC400927、LONP1、LOX、LPHN1、LRBA、LRCH4、LRIG1、LRP4、LRP8、LRRC1、LRRC32、LRRC39、LRRC8A、LSAMP、LSS、LTBR、LUC7L2、LUM、LYPD1、LYRM1、LZTS2、MACROD2、MAFB、MAGED4、MAGED4B、MAMDC2、MAN1A2、MAN2A1、MAN2C1、MANEA、MAP4K4、MAPK10、MAPK13、MARCH7、MARCH8、MASP1、MB、MB21D2、MBD1、MBOAT7、MC4R、MCM10、MDM2、MDN1、MEAF6、MECP2、MED1、MED13L、MEDAG、MEF2D、MEGF6、MEIS2、MEMO1、MEPCE、MFGE8、MFN2、MIAT、MICAL2、MINPP1、MIR612、MKL1、MKLN1、MKNK2、MLLT4、MLLT10、MLST8、MMAB、MMP10、MMP24、MMS19、MMS22L、MN1、MORF4L1、MOXD1、MPPE1、MPZL1、MRPL3、MRPL45、MRPL55、MRPS28、MRVI1、MSANTD3、MSC、MSH2、MSH4、MSH6、MSL3、MSMO1、MSRB3、MTAP、MTERF3、MTERFD1、MTHFD1L、MTMR3、MTMR9、MTRR、MUM1、MVD、MVK、MXRA5、MYADM、MYB、MYCBP2、MYLK、MYO1D、MYO9B、MYOF、NA、NAA35、NAALADL2、NADK、NAE1、NAGS、NASP、NAV1、NAV2、NCOA1、NCOA3、NCOA4、NCSTN、NDNF、NEDD4、NELFA、NEO1、NEURL1B、NF2、NFASC、NFE2L1、NFX1、NGF、NGFR、NHLH1、NID1、NID2、NIPA1、NKX3-1、NLGN1、NLN、NOL10、NOMO3、NOTCH3、NOTUM、NOVA2、NOX4、NPEPPS、NRD1、NREP、NRG1、NRROS、NSUN4、NT5C2、NT5E、NTNG1、NUDT4、NUP153、NUP35、NUP50、NUPL1、NUSAP1、OCLN、ODF2、OLR1、OS9、OSBPL3、OSBPL6、OSBPL10、OSMR、OXCT1、OXCT2、P4HA1、P4HB、PABPC1、PAIP2B、PAK4、PAPD4、PARD3、PARN、PARP14、PARP4、PARVB、PAX6、PBLD、PBX3、PCBP2、PCCB、PCDH10、PCDHGB3、PCGF3、PCM1、PCMTD2、PCNXL2、PCSK9、PDE1C、PDE3A、PDE4A、PDE5A、PDE7A、PDGFD、PDGFRB、PDLIM7、PDS5B、PDXDC1、PDXDC2P、PEAR1、PELI1、PEPD、PEX5、PFKP、PHACTR3、PHF19、PHF8、PHRF1、PHTF2、PI4K2A、PIEZO1、PIGN、PIGU、PIK3C2B、PIK3CD、PIK3R1、PIKFYVE、PIM2、PITPNA、PITPNB、PITPNM1、PITPNM3、PLAU、PLEC、PLEK2、PLEKHA1、PLEKHA6、PLEKHB2、PLEKHH2、PLSCR1、PLSCR3、PLXNB2、PLXNC1、PMS1、PNISR、PODN、POLE3、POLN、POLR1A、POLR3D、POMT2、POSTN、POU2F1、PPAPDC1A、PPARA、PPARG、PPFIBP1、PPIP5K1、PPIP5K2、PPM1E、PPP1R12A、PPP1R26、PPP3CA、PPP6R1、PPP6R2、PRKCA、PRKDC、PRKG1、PRMT1、PRNP、PRPF31、PRPH2、PRRG4、PRSS23、PRUNE2、PSMA4、PSMC1、PSMD6、PSMD6-AS2、PTCH1、PTGIS、PTK2B、PTPN14、PTX3、PUF60、PUS7、PVR、PXK、PXN、QKI、RAB2B、RAB30、RAB34、RAB38、RAB44、RAD1、RAD9B、RAD23B、RAF1、RALB、RAP1GDS1、RAPGEF1、RARG、RARS、RARS2、RASIP1、RASSF8、RBBP8、RBCK1、RCOR3、RBFOX2、RBKS、RBM10、RDX、RERE、RFTN1、RFWD2、RFX3-AS1、RGCC、RGL1、RGS10、RGS3、RIF1、RNF14、RNF19A、RNF130、RNF144A、RNF213、RNF38、RNFT1、ROR1、ROR2、RPA1、RPF2、RPL10、RPS10、RPS6KB2、RPS6KC1、RRBP1、RWDD4、SAMD4A、SAMD9、SAMD9L、SAR1A、SART3、SCAF4、SCAF8、SCARNA9、SCD、SCLT1、SCO1、SDCBP、SEC14L1、SEC22A、SEC24A、SEC24B、SEC61A1、SENP6、SEPT9、SERGEF、SERPINE2、SF1、SF3B3、SGIP1、SGK3、SGMS1、SGOL2、SGPL1、SH2B3、SH3RF1、SH3YL1、SHROOM3、SIGLEC10、SKA2、SKIL、SKP1、SLC12A2、SLC24A3、SLC25A16、SLC25A17、SLC34A3、SLC35F3、SLC39A3、SLC39A10、SLC4A4、SLC4A11、SLC41A1、SLC44A2、SLC46A2、SLC6A15、SLC7A6、SLC7A8、SLC7A11、SLC9A3、SLIT3、SMARCA4、SMARCC2、SMC4、SMC6、SMCHD1、SMG1、SMG1P3、SMOX、SMPD4、SMTN、SMYD3、SMYD5、SNAP23、SNED1、SNHG16、SNX7、SNX14、SNX24、SNX7、SOCS2、SOCS6、SOGA2、SON、SORBS2、SORCS1、SORCS2、SOS2、SOX7、SPATA18、SPATA20、SPATA5、SPATS2、SPDYA、SPEF2、SPG20、SPIDR、SPINK5、SPRED2、SPRYD7、SQLE、SQRDL、SQSTM1、SRCAP、SREBF1、SRGAP1、SRRM1、SRSF3、SSBP1、STAC2、STARD4、STAT1、STAT3、STAT4、STAU1、STC2、STEAP2、STK32B、STRAD8、STRIP1、STRN4、STS、STX16、STXBP4、STXBP6、SULF1、SUPT20H、SVEP1、SYNE1、SYNE2、SYNGR2、SYNPO、SYNPO2、SYNPO2L、SYT15、SYTL2、TACC1、TAF2、TAGLN3、TANC2、TANGO6、TARBP1、TARS、TASP1、TBC1D15、TBCA、TBL1XR1、TBL2、TCF12、TCF4、TCF7L2、TEKT4P2、TENC1、TENM2、TEP1、TET1、TET3、TEX21P、TFCP2、TGFA、TGFB2、TGFB3、TGFBI、TGFBR1、TGFBRAP1、TGM2、THADA、THAP4、THBS2、THRB、TIAM1、TIMP2、TJAP1、TJP2、TLE3、TLK1、TMC3、TMEM67、TMEM102、TMEM119、TMEM134、TMEM154、TMEM189-UBE2V1、TMEM214、TMEM256-PLSCR3、TMEM47、TMEM50B、TMEM63A、TMX3、TNC、TNFAIP3、TNFAIP8L3、TNFRSF12A、TNFRSF14、TNIP1、TNKS1BP1、TNPO3、TNRC18P1、TNS1、TNS3、TNXB、TOE1、TOMM40、TOMM5、TOPORS、TP53AIP1、TP53INP1、TPRG1、TRAF3、TRAK1、TRAPPC12、TRIB1、TRIM2、TRIM23、TRIM26、TRIM28、TRIM65、TRIM66、TRMT1L、TRPC4、TRPS1、TSC2、TSHZ1、TSHZ2、TSPAN11、TSPAN18、TSPAN2、TSPAN7、TSSK3、TTC7A、TTC7B、TUBB2C、TUBB3、TUBE1、TXNIP、TXNL1、TXNL4B、TXNRD1、TYW5、U2SURP、UBAP2L、UBE2D3、UBE2G2、UBE2L3、UBE2V1、UBN2、UBQLN4、UCHL5、UHMK1、UHRF1BP1L、UNC13B、UNC5B、URGCP、URGCP-MRPS24、USP19、USP7、USP27X、UVRAG、VANGL1、VARS2、VAV2、VCL、VDAC2、VIM-AS1、VIPAS39、VPS13A、VPS29、VPS41、VPS51、VSTM2L、VWA8、VWF、WDR19、WDR27、WDR37、WDR48、WDR90、WDR91、WHSC2、WIPF1、WISP1、WNK1、WNT5B、WNT10B、WSB1、WWTR1、XDH、XIAP、XRN2、YAP1、YDJC、YES1、YPEL5、YTHDF3、Z24749、ZAK、ZBTB10、ZBTB24、ZBTB26、ZBTB7A、ZC3H12C、ZC3H14、ZC3H18、ZCCHC5、ZCCHC8、ZCCHC11、ZEB1、ZEB2、ZFAND1、ZFAND5、ZFP82、ZHX3、ZMIZ1、ZMIZ1-AS1、ZMIZ2、ZMYM2、ZNF12、ZNF138、ZNF148、ZNF208、ZNF212、ZNF219、ZNF227、ZNF232、ZNF24、ZNF268、ZNF28、ZNF280D、ZNF281、ZNF335、ZNF350、ZNF37A、ZNF37BP、ZNF395、ZNF426、ZNF431、ZNF583、ZNF618、ZNF621、ZNF652、ZNF655、ZNF660、ZNF674、ZNF680、ZNF730、ZNF74、ZNF764、ZNF777、ZNF778、ZNF780A、ZNF7804A、ZNF79、ZNF827、ZNF836、ZNF837、ZNF839、ZNF91和ZSCAN25。
在另一个特定方面,本文提供了用于修饰RNA剪接以产生具有iExon的成熟mRNA转录物的方法,所述方法包括使包含前体mRNA转录物的细胞或细胞裂解物与式(I)的化合物或其形式接触,其中所述前体mRNA转录物包含两个外显子和内含子,其中第一外显子在内含子的上游,并且第二外显子在内含子的下游,其中所述内含子按5’至3’顺序包含:第一5’剪接位点、第一分支点、第一3’剪接位点、内源或非内源剪接修饰剂的内含子识别元件(iREMS)、第二分支点和第二3’剪接位点,其中所述iREMS包含RNA序列GAgurngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,并且其中所述前体mRNA转录物不是基因SMN2的前体mRNA转录物。
在另一个特定方面,本文提供了用于修饰RNA剪接以产生具有iExon的成熟mRNA转录物的方法,所述方法包括使包含前体mRNA转录物的细胞或细胞裂解物与式(I)的化合物或其形式接触,其中所述前体mRNA转录物包含两个外显子和内含子,其中第一外显子在内含子的上游,并且第二外显子在内含子的下游,其中所述内含子按5’至3’顺序包含:第一5’剪接位点、第一分支点、第一3’剪接位点、内源或非内源剪接修饰剂的内含子识别元件(iREMS)、第二分支点和第二3’剪接位点,其中所述iREMS包含RNA序列GAgurngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,并且其中所述前体mRNA转录物不是选自以下的基因的前体mRNA转录物:ABHD10、ADAM12、AKT1、ANXA11、APLP2、APPL2、ARMCX6、ATG5、AXIN1、BAIAP2、CCNB1IP1、CCT7、CEP57、CSF1、DLGAP4、EPN1、ERGIC3、FOXM1、GGCT、GRAMD3、HSD17B4、LARP7、LRRC42、MADD、MAN1B1、MRPL39、PCBP4、PPHLN1、PRKACB、RAB23、RAP1A、RCC1、SREK1、STRN3和TNRC6A。
在另一个特定方面,本文提供了用于修饰RNA剪接以产生具有iExon的成熟mRNA转录物的方法,所述方法包括使包含前体mRNA转录物的细胞或细胞裂解物与式(I)的化合物或其形式接触,其中所述前体mRNA转录物包含两个外显子和内含子,其中第一外显子在内含子的上游,并且第二外显子在内含子的下游,其中所述内含子按5’至3’顺序包含:第一5’剪接位点、第一分支点、第一3’剪接位点、内源或非内源剪接修饰剂的内含子识别元件(iREMS)、第二分支点和第二3’剪接位点,其中所述iREMS包含RNA序列GAgurngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,并且其中所述前体mRNA转录物不是选自以下的基因的前体mRNA转录物:ABHD10、ADAM12、AKT1、ANXA11、APLP2、APPL2、ARMCX6、ATG5、AXIN1、BAIAP2、CCNB1IP1、CCT7、CEP57、CSF1、DLGAP4、EPN1、ERGIC3、FOXM1、GGCT、GRAMD3、HSD17B4、LARP7、LRRC42、MADD、MAN1B1、MRPL39、PCBP4、PPHLN1、PRKACB、RAB23、RAP1A、RCC1、SMN2、SREK1、STRN3和TNRC6A。
另一方面,本文提供了用于修饰RNA剪接以调节由前体mRNA转录物产生的成熟mRNA转录物的量的方法,其中所述前体mRNA转录物包含两个外显子和内含子,其中第一外显子在内含子的上游,并且第二外显子在内含子的下游,其中所述内含子包含RNA核苷酸序列,所述RNA核苷酸序列按5’至3’顺序包含:内源或非内源剪接修饰剂的内含子识别元件(iREMS)、分支点和3’剪接位点,其中所述iREMS包含RNA序列GAgurngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸。
一方面,本文提供了用于修饰RNA剪接以调节由前体mRNA转录物产生的成熟mRNA转录物的量的方法,所述方法包括使前体mRNA转录物与式(I)的化合物或其形式接触,其中所述前体mRNA转录物包含两个外显子和内含子,其中第一外显子在内含子的上游,并且第二外显子在内含子的下游,其中所述内含子包含RNA核苷酸序列,所述RNA核苷酸序列按5’至3’顺序包含:内源或非内源剪接修饰剂的内含子识别元件(iREMS)、分支点和3’剪接位点,其中所述iREMS包含RNA序列GAgurngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸。
另一方面,本文提供了用于修饰RNA剪接以调节由前体mRNA转录物产生的成熟mRNA转录物的量的方法,所述方法包括使包含前体mRNA转录物的细胞或细胞裂解物与式(I)的化合物或其形式接触,其中所述前体mRNA转录物包含两个外显子和内含子,其中第一外显子在内含子的上游,并且第二外显子在内含子的下游,其中所述内含子包含RNA核苷酸序列,所述RNA核苷酸序列按5’至3’顺序包含:内源或非内源剪接修饰剂的内含子识别元件(iREMS)、分支点和3’剪接位点,其中所述iREMS包含RNA序列GAgurngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸。在一些方面,所述内含子按5’至3’顺序还包含:在所述iREMS上游的5’剪接位点、分支点和3’剪接位点。在一些方面,前体mRNA转录物由本文公开(例如,在本文的表中)的基因编码。
在特定方面,本文提供了用于修饰RNA剪接以调节由前体mRNA转录物产生的成熟mRNA转录物的量的方法,所述方法包括使前体mRNA转录物与式(I)的化合物或其形式接触,其中所述前体mRNA转录物包含两个外显子和内含子,其中第一外显子在内含子的上游,并且第二外显子在内含子的下游,其中所述内含子包含RNA核苷酸序列,所述RNA核苷酸序列按5’至3’顺序包含:内源或非内源剪接修饰剂的内含子识别元件(iREMS)、分支点和3’剪接位点,其中所述iREMS包含RNA序列GAgurngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,并且其中所述前体mRNA转录物是选自以下的基因的前体mRNA转录物:ABCA10、ABCB8、ABCC3、ACTA2、ADAL、ADAMTS1、ADCY3、ADD1、ADGRG6、ADH6、ADHFE1、AFF3、AGPAT4、AKAP3、ANK1、ANK3、ANKRA2、ANKRD33B、ANKRD36、AP4B1-AS1、APIP、ARHGAP1、ARHGAP12、ARHGEF16、ARID5B、ARL15、ARL9、ARMCX6、ASIC1、ATG5、ATP2A3、ATXN1、B3GALT2、B3GNT6、BCL2L15、BCYRN1、BECN1、BHMT2、BIN3-IT1、BIRC3、BIRC6、BTG2、BTN3A1、C10orf54、C11orf70、C11orf94、C12orf4、C12orf56、C14orf132、C19orf47、C1orf86、C3、C7orf31、C8orf34、C8orf44、C8orf44-SGK3、C8orf88、CA13、CA3、CACNA2D2、CACNB1、CADM1、CAND2、CASP7、CCDC122、CCDC79、CCER2、CCNF、CECR7、CELSR1、CEMIP、CENPI、CEP112、CEP170、CEP192、CFH、CHEK1、CIITA、CLDN23、CLTA、CMAHP、CNGA4、CNRIP1、CNTD1、COL11A1、COL14A1、COL15A1、COL5A1、COL5A3、COL6A6、COL8A1、COLEC12、COMP、CPA4、CPQ、CPSF4、CRISPLD2、CRLF1、CRYBG3、CRYL1、CSNK1E、CSNK1G1、CYB5R2、CYGB、CYP1B1、DAGLB、DCAF17、DCLK1、DCN、DDIT4L、DDX50、DEGS1、DEPTOR、DFNB59、DIRAS3、DLG5、DLGAP4、DNAH8、DNAJC13、DNAJC27、DNMBP、DOCK11、DYNC1I1、DYRK1A、DZIP1L、EFEMP1、EGR3、ELN、ELP4、EMX2OS、ENAH、ENPP1、EP300、ERCC1、ERCC8、ERGIC3、ERLIN2、ERRFI1、ESM1、EVC、EVC2、F2R、FAIM、FAM126A、FAM13A、FAM160A1、FAM162A、FAM174A、FAM20A、FAM46B、FAM65B、FAP、FARP1、FBLN2、FBN2、FBXL6、FCHO1、FGFR2、FGL2、FLT1、FRAS1、FSCN2、GAL3ST4、GALNT15、GATA6、GBGT1、GCNT1、GDF6、GGACT、GLCE、GNAQ、GPR183、GPR50、GPRC5A、GPRC5B、GRTP1、GUCA1B、GULP1、GXYLT1、HAPLN1、HAPLN2、HAS3、HAVCR2、HDAC5、HDX、HECTD2-AS1、HEPH、HEY1、HMGA2、HMGN3-AS1、HNMT、HOOK3、HPS1、HSPA1L、HTATIP2、IFT57、IGDCC4、IGF2R、IGFBP3、IL16、INA、INPP5K、INTU、IQCG、ITGA11、ITGA8、ITGB8、ITIH1、ITPKA、IVD、KAT6B、KCNS1、KCNS2、KDM6A、KDSR、KIAA1456、KIAA1462、KIAA1755、KIT、KLF17、KLRG1、KMT2D、KRT7、KRTAP1-1、KRTAP1-5、L3MBTL2、LAMB2P1、LETM2、LGI2、LGR4、LHX9、LINC00472、LINC00570、LINC00578、LINC00607、LINC00678、LINC00702、LINC00886、LINC00961、LINC01011、LINC01118、LINC01204、LMOD1、LOC400927、LRBA、LRP4、LRRC32、LRRC39、LRRC42、LSAMP、LUM、LYPD1、LYRM1、MAFB、MAMDC2、MAN2A1、MAN2C1、MAPK13、MASP1、MB、MB21D2、MC4R、MCM10、MED13L、MEGF6、MFN2、MIAT、MIR612、MLLT10、MMP10、MMP24、MN1、MOXD1、MRPL45、MRPL55、MRPS28、MRVI1、MSH4、MTERF3、MXRA5、MYCBP2、NA、NAALADL2、NAE1、NAGS、NDNF、NGF、NGFR、NHLH1、NLN、NOTCH3、NOTUM、NOVA2、NOX4、NRROS、OCLN、OLR1、OSBPL10、OXCT1、OXCT2、PAIP2B、PBLD、PDE1C、PDE5A、PDGFD、PDGFRB、PDS5B、PEAR1、PHACTR3、PIGN、PIK3CD、PIK3R1、PIKFYVE、PIM2、PITPNM3、PLEK2、PLEKHA1、PLEKHA6、PLEKHH2、PLSCR1、PNISR、PODN、POLN、POLR1A、POMT2、PPARG、PPIP5K2、PPM1E、PPP1R26、PPP3CA、PRKCA、PRKG1、PRPF31、PRPH2、PRRG4、PRUNE2、PSMD6-AS2、PTGIS、PTX3、PXK、RAB30、RAB38、RAB44、RAD9B、RAF1、RAPGEF1、RARS、RARS2、RBBP8、RBKS、RDX、RERE、RFX3-AS1、RGCC、ROR1、ROR2、RPA1、RPS10、RPS6KB2、SAMD4A、SCARNA9、SEC24A、SENP6、SERGEF、SGK3、SH3YL1、SHROOM3、SIGLEC10、SKA2、SLC12A2、SLC24A3、SLC35F3、SLC39A10、SLC44A2、SLC46A2、SLC4A11、SLC6A15、SLC7A11、SLC9A3、SLIT3、SMG1P3、SMTN、SNED1、SNX7、SORBS2、SORCS2、SOX7、SPATA18、SPATA5、SPDYA、SPEF2、SPIDR、SPRYD7、SRGAP1、SRRM1、STAC2、STAT4、STK32B、STRN4、STS、STXBP6、SULF1、SVEP1、SYNGR2、SYNPO、SYNPO2、SYNPO2L、TAGLN3、TANGO6、TASP1、TCF12、TCF4、TGFA、TGFB2、TGFB3、TGM2、THBS2、TIAM1、TMC3、TMEM102、TMEM119、TMEM134、TMEM189-UBE2V1、TMEM214、TMEM256-PLSCR3、TMEM50B、TNFAIP8L3、TNFRSF14、TNRC18P1、TNRC6A、TNXB、TP53AIP1、TPRG1、TRIM66、TRPC4、TSHZ2、TSPAN11、TSPAN18、TSPAN7、TSSK3、TTC7B、TUBE1、TXNIP、TYW5、URGCP、USP27X、UVRAG、VAV2、VIM-AS1、VPS41、VSTM2L、VWF、WDR27、WDR91、WISP1、WNK1、WNT10B、YDJC、ZBTB26、ZCCHC5、ZCCHC8、ZFP82、ZMIZ1-AS1、ZNF138、ZNF212、ZNF232、ZNF350、ZNF431、ZNF660、ZNF680、ZNF79和ZNF837。
在特定方面,本文提供了用于修饰RNA剪接以调节由前体mRNA转录物产生的成熟mRNA转录物的量的方法,所述方法包括使包含前体mRNA转录物的细胞或细胞裂解物与式(I)的化合物或其形式接触,其中所述前体mRNA转录物包含两个外显子和内含子,其中第一外显子在内含子的上游,并且第二外显子在内含子的下游,其中所述内含子包含RNA核苷酸序列,所述RNA核苷酸序列按5’至3’顺序包含:内源或非内源剪接修饰剂的内含子识别元件(iREMS)、分支点和3’剪接位点,其中所述iREMS包含RNA序列GAgurngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,并且其中所述前体mRNA转录物是选自以下的基因的前体mRNA转录物:ABCA10、ABCB8、ABCC3、ACTA2、ADAL、ADAMTS1、ADCY3、ADD1、ADGRG6、ADH6、ADHFE1、AFF3、AGPAT4、AKAP3、ANK1、ANK3、ANKRA2、ANKRD33B、ANKRD36、AP4B1-AS1、APIP、ARHGAP1、ARHGAP12、ARHGEF16、ARID5B、ARL15、ARL9、ARMCX6、ASIC1、ATG5、ATP2A3、ATXN1、B3GALT2、B3GNT6、BCL2L15、BCYRN1、BECN1、BHMT2、BIN3-IT1、BIRC3、BIRC6、BTG2、BTN3A1、C10orf54、C11orf70、C11orf94、C12orf4、C12orf56、C14orf132、C19orf47、C1orf86、C3、C7orf31、C8orf34、C8orf44、C8orf44-SGK3、C8orf88、CA13、CA3、CACNA2D2、CACNB1、CADM1、CAND2、CASP7、CCDC122、CCDC79、CCER2、CCNF、CECR7、CELSR1、CEMIP、CENPI、CEP112、CEP170、CEP192、CFH、CHEK1、CIITA、CLDN23、CLTA、CMAHP、CNGA4、CNRIP1、CNTD1、COL11A1、COL14A1、COL15A1、COL5A1、COL5A3、COL6A6、COL8A1、COLEC12、COMP、CPA4、CPQ、CPSF4、CRISPLD2、CRLF1、CRYBG3、CRYL1、CSNK1E、CSNK1G1、CYB5R2、CYGB、CYP1B1、DAGLB、DCAF17、DCLK1、DCN、DDIT4L、DDX50、DEGS1、DEPTOR、DFNB59、DIRAS3、DLG5、DLGAP4、DNAH8、DNAJC13、DNAJC27、DNMBP、DOCK11、DYNC1I1、DYRK1A、DZIP1L、EFEMP1、EGR3、ELN、ELP4、EMX2OS、ENAH、ENPP1、EP300、ERCC1、ERCC8、ERGIC3、ERLIN2、ERRFI1、ESM1、EVC、EVC2、F2R、FAIM、FAM126A、FAM13A、FAM160A1、FAM162A、FAM174A、FAM20A、FAM46B、FAM65B、FAP、FARP1、FBLN2、FBN2、FBXL6、FCHO1、FGFR2、FGL2、FLT1、FRAS1、FSCN2、GAL3ST4、GALNT15、GATA6、GBGT1、GCNT1、GDF6、GGACT、GLCE、GNAQ、GPR183、GPR50、GPRC5A、GPRC5B、GRTP1、GUCA1B、GULP1、GXYLT1、HAPLN1、HAPLN2、HAS3、HAVCR2、HDAC5、HDX、HECTD2-AS1、HEPH、HEY1、HMGA2、HMGN3-AS1、HNMT、HOOK3、HPS1、HSPA1L、HTATIP2、IFT57、IGDCC4、IGF2R、IGFBP3、IL16、INA、INPP5K、INTU、IQCG、ITGA11、ITGA8、ITGB8、ITIH1、ITPKA、IVD、KAT6B、KCNS1、KCNS2、KDM6A、KDSR、KIAA1456、KIAA1462、KIAA1755、KIT、KLF17、KLRG1、KMT2D、KRT7、KRTAP1-1、KRTAP1-5、L3MBTL2、LAMB2P1、LETM2、LGI2、LGR4、LHX9、LINC00472、LINC00570、LINC00578、LINC00607、LINC00678、LINC00702、LINC00886、LINC00961、LINC01011、LINC01118、LINC01204、LMOD1、LOC400927、LRBA、LRP4、LRRC32、LRRC39、LRRC42、LSAMP、LUM、LYPD1、LYRM1、MAFB、MAMDC2、MAN2A1、MAN2C1、MAPK13、MASP1、MB、MB21D2、MC4R、MCM10、MED13L、MEGF6、MFN2、MIAT、MIR612、MLLT10、MMP10、MMP24、MN1、MOXD1、MRPL45、MRPL55、MRPS28、MRVI1、MSH4、MTERF3、MXRA5、MYCBP2、NA、NAALADL2、NAE1、NAGS、NDNF、NGF、NGFR、NHLH1、NLN、NOTCH3、NOTUM、NOVA2、NOX4、NRROS、OCLN、OLR1、OSBPL10、OXCT1、OXCT2、PAIP2B、PBLD、PDE1C、PDE5A、PDGFD、PDGFRB、PDS5B、PEAR1、PHACTR3、PIGN、PIK3CD、PIK3R1、PIKFYVE、PIM2、PITPNM3、PLEK2、PLEKHA1、PLEKHA6、PLEKHH2、PLSCR1、PNISR、PODN、POLN、POLR1A、POMT2、PPARG、PPIP5K2、PPM1E、PPP1R26、PPP3CA、PRKCA、PRKG1、PRPF31、PRPH2、PRRG4、PRUNE2、PSMD6-AS2、PTGIS、PTX3、PXK、RAB30、RAB38、RAB44、RAD9B、RAF1、RAPGEF1、RARS、RARS2、RBBP8、RBKS、RDX、RERE、RFX3-AS1、RGCC、ROR1、ROR2、RPA1、RPS10、RPS6KB2、SAMD4A、SCARNA9、SEC24A、SENP6、SERGEF、SGK3、SH3YL1、SHROOM3、SIGLEC10、SKA2、SLC12A2、SLC24A3、SLC35F3、SLC39A10、SLC44A2、SLC46A2、SLC4A11、SLC6A15、SLC7A11、SLC9A3、SLIT3、SMG1P3、SMTN、SNED1、SNX7、SORBS2、SORCS2、SOX7、SPATA18、SPATA5、SPDYA、SPEF2、SPIDR、SPRYD7、SRGAP1、SRRM1、STAC2、STAT4、STK32B、STRN4、STS、STXBP6、SULF1、SVEP1、SYNGR2、SYNPO、SYNPO2、SYNPO2L、TAGLN3、TANGO6、TASP1、TCF12、TCF4、TGFA、TGFB2、TGFB3、TGM2、THBS2、TIAM1、TMC3、TMEM102、TMEM119、TMEM134、TMEM189-UBE2V1、TMEM214、TMEM256-PLSCR3、TMEM50B、TNFAIP8L3、TNFRSF14、TNRC18P1、TNRC6A、TNXB、TP53AIP1、TPRG1、TRIM66、TRPC4、TSHZ2、TSPAN11、TSPAN18、TSPAN7、TSSK3、TTC7B、TUBE1、TXNIP、TYW5、URGCP、USP27X、UVRAG、VAV2、VIM-AS1、VPS41、VSTM2L、VWF、WDR27、WDR91、WISP1、WNK1、WNT10B、YDJC、ZBTB26、ZCCHC5、ZCCHC8、ZFP82、ZMIZ1-AS1、ZNF138、ZNF212、ZNF232、ZNF350、ZNF431、ZNF660、ZNF680、ZNF79和ZNF837。在一些方面,所述内含子还包含在所述iREMS上游的第一5’剪接位点、第二分支点和第二3’剪接位点。
在特定方面,本文提供了用于修饰RNA剪接以调节由前体mRNA转录物产生的成熟mRNA转录物的量的方法,所述方法包括使包含前体mRNA转录物的细胞或细胞裂解物与式(I)的化合物或其形式接触,其中所述前体mRNA转录物包含两个外显子和内含子,其中第一外显子在内含子的上游,并且第二外显子在内含子的下游,其中所述内含子包含RNA核苷酸序列,所述RNA核苷酸序列按5’至3’顺序包含:内源或非内源剪接修饰剂的内含子识别元件(iREMS)、分支点和3’剪接位点,其中所述iREMS包含RNA序列GAgurngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,并且其中所述前体mRNA转录物是选自以下的基因的前体mRNA转录物:ABCA1、ABCA10、ABCB7、ABCB8、ABCC1、ABCC3、ABHD10、ABL2、ABLIM3、ACACA、ACADVL、ACAT2、ACTA2、ADAL、ADAM12、ADAM15、ADAM17、ADAM23、ADAM33、ADAMTS1、ADAMTS19、ADCY3、ADD1、ADGRG6、ADH6、ADHFE1、AFF2、AFF3、AGK、AGPAT3、AGPAT4、AGPS、AHCYL2、AHDC1、AHRR、AJUBA、AK021888、AK310472、AKAP1、AKAP3、AKAP8L、AKAP9、AKNA、AKT1、ALCAM、ALDH4A1、AMPD2、ANK1、ANK2、ANK3、ANKFY1、ANKHD1-EIF4EBP3、ANKRA2、ANKRD13C、ANKRD17、ANKRD33B、ANKRD36、ANKS6、ANP32A、ANXA11、ANXA6、AP2B1、AP4B1-AS1、APAF1、APIP、APLP2、APOA2、APP、APPL2、APTX、ARHGAP1、ARHGAP12、ARHGAP22、ARHGAP5、ARHGEF16、ARID1A、ARID2、ARID5B、ARL9、ARL15、ARL5B、ARMCX3、ARMCX6、ARSJ、ASAP1、ASIC1、ASL、ASNS、ASPH、ATAD2B、ATF6、ATF7IP、ATG5、ATG9A、ATMIN、ATP2A3、ATP2C1、ATXN1、ATXN3、AURKA、AXIN1、B3GALT2、B3GNT6、B4GALT2、BACE1、BAG2、BASP1、BC033281、BCAR3、BCL2L15、BCYRN1、BECN1、BEND6、BHMT2、BICD1、BIN1、BIN3、BIN3-IT1、BIRC3、BIRC6、BNC1、BNC2、BRCA1、BRCA2、BRD2、BRPF1、BSCL2、BTBD10、BTG2、BTN3A1、BZW1、C1QTNF9B-AS1、C1orf27、C1orf86、C10orf54、C11orf30、C11orf70、C11orf73、C11orf76、C11orf94、C12orf4、C12orf56、C14orf132、C17orf76-AS1、C19orf47、C2orf47、C3、C4orf27、C5orf24、C6orf48、C7orf31、C8orf34、C8orf44、C8orf44-SGK3、C8orf88、C9orf69、CA13、CA3、CAB39、CACNA2D2、CACNB1、CACNB4、CADM1、CADM2、CALU、CAMKK1、CAND2、CAPNS1、CASC3、CASP7、CASP8AP2、CAV1、CCAR1、CCDC77、CCDC79、CCDC88A、CCDC92、CCDC122、CCER2、CCNF、CCNL2、CCT6A、CD276、CD46、CDC25B、CDC40、CDC42BPA、CDCA7、CDH11、CDH13、CDH18、CDK11B、CDK16、CDKAL1、CDKN1C、CECR7、CELSR1、CEMIP、CENPI、CEP112、CEP162、CEP170、CEP192、CEP57、CEP68、CFH、CFLAR、CHD8、CHEK1、CHRM2、CIITA、CIZ1、CLDN23、CLIC1、CLK4、CLTA、CMAHP、CNGA4、CNOT1、CNRIP1、CNTD1、CMSS1、CNOT7、CNRIP1、CNTN1、COG1、COL1A1、COL11A1、COL12A1、COL14A1、COL15A1、COL5A1、COL5A3、COL6A1、COL6A6、COL8A1、COLEC12、COMP、COPS7B、CPA4、CPEB2、CPQ、CPSF4、CREB5、CRISPLD2、CRLF1、CRLS1、CRTAP、CRX、CRYBG3、CRYL1、CSDE1、CSNK1A1、CSNK1E、CSNK1G1、CTDSP2、CTNND1、CTRC、CUL2、CUL4A、CUX1、CYB5B、CYB5R2、CYBRD1、CYGB、CYP1B1、CYP51A1、DAAM1、DAB2、DACT1、DAGLB、DARS、DAXX、DCAF10、DCAF11、DCAF17、DCBLD2、DCLK1、DCN、DCUN1D4、DDAH1、DDAH2、DDHD2、DDIT4L、DDR1、DDX39B、DDX42、DDX50、DEGS1、DENND1A、DENND1B、DENND4A、DENND5A、DEPTOR、DET1、DFNB59、DGCR2、DGK1、DGKA、DHCR24、DHCR7、DHFR、DHX9、DIAPH1、DIAPH3、DIRAS3、DIS3L、DKFZp434M1735、DKK3、DLC1、DLG5、DLGAP4、DMD、DMXL1、DNAH8、DNAH11、DNAJA4、DNAJC13、DNAJC27、DNM2、DNMBP、DOCK1、DOCK11、DPP8、DSEL、DST、DSTN、DYNC1I1、DYRK1A、DZIP1L、EBF1、EEA1、EEF1A1、EFCAB14、EFEMP1、EGR1、EGR3、EHMT2、EIF2B3、EIF4G1、EIF4G2、EIF4G3、ELF2、ELMO2、ELN、ELP4、EMX2OS、ENAH、ENG、ENOX1、ENPP1、ENPP2、ENSA、EP300、EPN1、EPT1、ERC1、ERC2、ERCC1、ERCC8、ERGIC3、ERLIN2、ERRFI1、ESM1、ETV5、EVC、EVC2、EXO1、EXOC3、EXOC6B、EXTL2、EYA3、F2R、FADS1、FADS2、FAF1、FAIM、FAM111A、FAM126A、FAM13A、FAM160A1、FAM162A、FAM174A、FAM195B、FAM198B、FAM20A、FAM208B、FAM219A、FAM219B、FAM3C、FAM46B、FAM49B、FAM65A、FAM65B、FAM69B、FAP、FARP1、FBLN2、FBN2、FBXL16、FBXL6、FBXO9、FBXO10、FBXO18、FBXO31、FBXO34、FBXO9、FCHO1、FDFT1、FDPS、FER、FEZ1、FGD4、FGD5-AS1、FGFR2、FGFRL1、FGL2、FHOD3、FLII、FLNB、FLT1、FN1、FNBP1、FOCAD、FOS、FOSB、FOSL1、FOXK1、FOXM1、FRAS1、FSCN2、FUS、FYN、GABPB1、GAL3ST4、GALC、GALNT1、GALNT15、GAS7、GATA6、GBA2、GBGT1、GBP1、GCFC2、GLCE、GCNT1、GDF6、GGACT、GGCT、GHDC、GIGYF2、GJC1、GLCE、GMIP、GNA13、GNAQ、GNAS、GNG12、GNL3L、GOLGA2、GOLGA4、GOLGB1、GORASP1、GPR1、GPR183、GPR50、GPR89A、GPRC5A、GPRC5B、GPSM2、GREM1、GRK6、GRTP1、GSE1、GTF2H2B、GTSF1、GUCA1B、GULP1、GXYLT1、HAPLN1、HAPLN2、HAS2、HAS3、HAT1、HAUS3、HAUS6、HAVCR2、HDAC5、HDAC7、HDX、HECTD2-AS1、HEG1、HEPH、HEY1、HLA-A、HLA-E、HLTF、HMGA1、HMGA2、HMGB1、HMGCR、HMGN3-AS1、HMGCS1、HMGXB4、HOOK3、HOXB3、HMOX1、HNMT、HNRNPR、HNRNPUL1、HP1BP3、HPS1、HRH1、HSD17B12、HSD17B4、HSPA1L、HTATIP2、HTT、IARS、IDH1、IDI1、IFT57、IGDCC4、IGF2BP2、IGF2R、IGFBP3、IKBKAP、IL16、IL6ST、INA、INHBA、INO80、IPP4B、INPP5K、INSIG1、INTU、INVS、IQCE、IQCG、ITCH、ITGA11、ITGA8、ITGAV、ITGB5、ITGB8、ITIH1、ITM2C、ITPKA、ITSN1、IVD、KANSL3、KAT6B、KCNK2、KCNS1、KCNS2、KDM6A、KDSR、KIAA1033、KIAA1143、KIAA1199、KIAA1456、KIAA1462、KIAA1522、KIAA1524、KIAA1549、KIAA1715、KIAA1755、KIDINS220、KIF14、KIF2A、KIF21A、KIF3A、KIT、KLC1、KLC2、KLF17、KLF6、KLHL7、KLRG1、KMT2D、KRT7、KRT18、KRT19、KRT34、KRTAP1-1、KRTAP1-5、KRTAP2-3、L3MBTL2、LAMA2、LAMB1、LAMB2P1、LARP4、LARP7、LATS2、LDLR、LEMD3、LETM2、LGALS3、LGALS8、LGI2、LGR4、LHX9、LIMS1、LINC00341、LINC00472、LINC00570、LINC00578、LINC00607、LINC00657、LINC00678、LINC00702、LINC00886、LINC00961、LINC01011、LINC01118、LINC01204、LINCR-0002、LINGO2、LMAN2L、LMNA、LMO7、LMOD1、LOC400927、LONP1、LOX、LPHN1、LRBA、LRCH4、LRIG1、LRP4、LRP8、LRRC1、LRRC32、LRRC39、LRRC42、LRRC8A、LSAMP、LSS、LTBR、LUC7L2、LUM、LYPD1、LYRM1、LZTS2、MACROD2、MADD、MAFB、MAGED4、MAGED4B、MAMDC2、MAN1A2、MAN2A1、MAN2C1、MANEA、MAP4K4、MAPK10、MAPK13、MARCH7、MARCH8、MASP1、MB、MB21D2、MBD1、MBOAT7、MC4R、MCM10、MDM2、MDN1、MEAF6、MECP2、MED1、MED13L、MEDAG、MEF2D、MEGF6、MEIS2、MEMO1、MEPCE、MFGE8、MFN2、MIAT、MICAL2、MINPP1、MIR612、MKL1、MKLN1、MKNK2、MLLT4、MLLT10、MLST8、MMAB、MMP10、MMP24、MMS19、MMS22L、MN1、MORF4L1、MOXD1、MPPE1、MPZL1、MRPL3、MRPL39、MRPL45、MRPL55、MRPS28、MRVI1、MSANTD3、MSC、MSH2、MSH4、MSH6、MSL3、MSMO1、MSRB3、MTAP、MTERF3、MTERFD1、MTHFD1L、MTMR3、MTMR9、MTRR、MUM1、MVD、MVK、MXRA5、MYADM、MYB、MYCBP2、MYLK、MYO1D、MYO9B、MYOF、NA、NAA35、NAALADL2、NADK、NAE1、NAGS、NASP、NAV1、NAV2、NCOA1、NCOA3、NCOA4、NCSTN、NDNF、NEDD4、NELFA、NEO1、NEURL1B、NF2、NFASC、NFE2L1、NFX1、NGF、NGFR、NHLH1、NID1、NID2、NIPA1、NKX3-1、NLGN1、NLN、NOL10、NOMO3、NOTCH3、NOTUM、NOVA2、NOX4、NPEPPS、NRD1、NREP、NRG1、NRROS、NSUN4、NT5C2、NT5E、NTNG1、NUDT4、NUP153、NUP35、NUP50、NUPL1、NUSAP1、OCLN、ODF2、OLR1、OS9、OSBPL3、OSBPL6、OSBPL10、OSMR、OXCT1、OXCT2、P4HA1、P4HB、PABPC1、PAIP2B、PAK4、PAPD4、PARD3、PARN、PARP14、PARP4、PARVB、PAX6、PBLD、PBX3、PCBP2、PCBP4、PCCB、PCDH10、PCDHGB3、PCGF3、PCM1、PCMTD2、PCNXL2、PCSK9、PDE1C、PDE3A、PDE4A、PDE5A、PDE7A、PDGFD、PDGFRB、PDLIM7、PDS5B、PDXDC1、PDXDC2P、PEAR1、PELI1、PEPD、PEX5、PFKP、PHACTR3、PHF19、PHF8、PHRF1、PHTF2、PI4K2A、PIEZO1、PIGN、PIGU、PIK3C2B、PIK3CD、PIK3R1、PIKFYVE、PIM2、PITPNA、PITPNB、PITPNM1、PITPNM3、PLAU、PLEC、PLEK2、PLEKHA1、PLEKHA6、PLEKHB2、PLEKHH2、PLSCR1、PLSCR3、PLXNB2、PLXNC1、PMS1、PNISR、PODN、POLE3、POLN、POLR1A、POLR3D、POMT2、POSTN、POU2F1、PPAPDC1A、PPARA、PPARG、PPFIBP1、PPHLN1、PPIP5K1、PPIP5K2、PPM1E、PPP1R12A、PPP1R26、PPP3CA、PPP6R1、PPP6R2、PRKACB、PRKCA、PRKDC、PRKG1、PRMT1、PRNP、PRPF31、PRPH2、PRRG4、PRSS23、PRUNE2、PSMA4、PSMC1、PSMD6、PSMD6-AS2、PTCH1、PTGIS、PTK2B、PTPN14、PTX3、PUF60、PUS7、PVR、PXK、PXN、QKI、RAB23、RAB2B、RAB30、RAB34、RAB38、RAB44、RAD1、RAD9B、RAD23B、RAF1、RALB、RAP1A、RAP1GDS1、RAPGEF1、RARG、RARS、RARS2、RASIP1、RASSF8、RBBP8、RBCK1、RCOR3、RBFOX2、RBKS、RBM10、RCC1、RDX、RERE、RFTN1、RFWD2、RFX3-AS1、RGCC、RGL1、RGS10、RGS3、RIF1、RNF14、RNF19A、RNF130、RNF144A、RNF213、RNF38、RNFT1、ROR1、ROR2、RPA1、RPF2、RPL10、RPS10、RPS6KB2、RPS6KC1、RRBP1、RWDD4、SAMD4A、SAMD9、SAMD9L、SAR1A、SART3、SCAF4、SCAF8、SCARNA9、SCD、SCLT1、SCO1、SDCBP、SEC14L1、SEC22A、SEC24A、SEC24B、SEC61A1、SENP6、SEPT9、SERGEF、SERPINE2、SF1、SF3B3、SGIP1、SGK3、SGMS1、SGOL2、SGPL1、SH2B3、SH3RF1、SH3YL1、SHROOM3、SIGLEC10、SKA2、SKIL、SKP1、SLC12A2、SLC24A3、SLC25A16、SLC25A17、SLC34A3、SLC35F3、SLC39A3、SLC39A10、SLC4A4、SLC4A11、SLC41A1、SLC44A2、SLC46A2、SLC6A15、SLC7A6、SLC7A8、SLC7A11、SLC9A3、SLIT3、SMARCA4、SMARCC2、SMC4、SMC6、SMCHD1、SMG1、SMG1P3、SMN2、SMOX、SMPD4、SMTN、SMYD3、SMYD5、SNAP23、SNED1、SNHG16、SNX7、SNX14、SNX24、SNX7、SOCS2、SOCS6、SOGA2、SON、SORBS2、SORCS1、SORCS2、SOS2、SOX7、SPATA18、SPATA20、SPATA5、SPATS2、SPDYA、SPEF2、SPG20、SPIDR、SPINK5、SPRED2、SPRYD7、SQLE、SQRDL、SQSTM1、SRCAP、SREBF1、SREK1、SRGAP1、SRRM1、SRSF3、SSBP1、STAC2、STARD4、STAT1、STAT3、STAT4、STAU1、STC2、STEAP2、STK32B、STRAD8、STRIP1、STRN3、STRN4、STS、STX16、STXBP4、STXBP6、SULF1、SUPT20H、SVEP1、SYNE1、SYNE2、SYNGR2、SYNPO、SYNPO2、SYNPO2L、SYT15、SYTL2、TACC1、TAF2、TAGLN3、TANC2、TANGO6、TARBP1、TARS、TASP1、TBC1D15、TBCA、TBL1XR1、TBL2、TCF12、TCF4、TCF7L2、TEKT4P2、TENC1、TENM2、TEP1、TET1、TET3、TEX21P、TFCP2、TGFA、TGFB2、TGFB3、TGFBI、TGFBR1、TGFBRAP1、TGM2、THADA、THAP4、THBS2、THRB、TIAM1、TIMP2、TJAP1、TJP2、TLE3、TLK1、TMC3、TMEM67、TMEM102、TMEM119、TMEM134、TMEM154、TMEM189-UBE2V1、TMEM214、TMEM256-PLSCR3、TMEM47、TMEM50B、TMEM63A、TMX3、TNC、TNFAIP3、TNFAIP8L3、TNFRSF12A、TNFRSF14、TNIP1、TNKS1BP1、TNPO3、TNRC18P1、TNRC6A、TNS1、TNS3、TNXB、TOE1、TOMM40、TOMM5、TOPORS、TP53AIP1、TP53INP1、TPRG1、TRAF3、TRAK1、TRAPPC12、TRIB1、TRIM2、TRIM23、TRIM26、TRIM28、TRIM65、TRIM66、TRMT1L、TRPC4、TRPS1、TSC2、TSHZ1、TSHZ2、TSPAN11、TSPAN18、TSPAN2、TSPAN7、TSSK3、TTC7A、TTC7B、TUBB2C、TUBB3、TUBE1、TXNIP、TXNL1、TXNL4B、TXNRD1、TYW5、U2SURP、UBAP2L、UBE2D3、UBE2G2、UBE2L3、UBE2V1、UBN2、UBQLN4、UCHL5、UHMK1、UHRF1BP1L、UNC13B、UNC5B、URGCP、URGCP-MRPS24、USP19、USP7、USP27X、UVRAG、VANGL1、VARS2、VAV2、VCL、VDAC2、VIM-AS1、VIPAS39、VPS13A、VPS29、VPS41、VPS51、VSTM2L、VWA8、VWF、WDR19、WDR27、WDR37、WDR48、WDR90、WDR91、WHSC2、WIPF1、WISP1、WNK1、WNT5B、WNT10B、WSB1、WWTR1、XDH、XIAP、XRN2、YAP1、YDJC、YES1、YPEL5、YTHDF3、Z24749、ZAK、ZBTB10、ZBTB24、ZBTB26、ZBTB7A、ZC3H12C、ZC3H14、ZC3H18、ZCCHC5、ZCCHC8、ZCCHC11、ZEB1、ZEB2、ZFAND1、ZFAND5、ZFP82、ZHX3、ZMIZ1、ZMIZ1-AS1、ZMIZ2、ZMYM2、ZNF12、ZNF138、ZNF148、ZNF208、ZNF212、ZNF219、ZNF227、ZNF232、ZNF24、ZNF268、ZNF28、ZNF280D、ZNF281、ZNF335、ZNF350、ZNF37A、ZNF37BP、ZNF395、ZNF426、ZNF431、ZNF583、ZNF618、ZNF621、ZNF652、ZNF655、ZNF660、ZNF674、ZNF680、ZNF730、ZNF74、ZNF764、ZNF777、ZNF778、ZNF780A、ZNF7804A、ZNF79、ZNF827、ZNF836、ZNF837、ZNF839、ZNF91和ZSCAN25。
在特定方面,本文提供了用于修饰RNA剪接以调节由前体mRNA转录物产生的成熟mRNA转录物的量的方法,所述方法包括使包含前体mRNA转录物的细胞或细胞裂解物与式(I)的化合物或其形式接触,其中所述前体mRNA转录物包含两个外显子和内含子,其中第一外显子在内含子的上游,并且第二外显子在内含子的下游,其中所述内含子包含RNA核苷酸序列,所述RNA核苷酸序列按5’至3’顺序包含:内源或非内源剪接修饰剂的内含子识别元件(iREMS)、分支点和3’剪接位点,其中所述iREMS包含RNA序列GAgurngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,并且其中所述前体mRNA转录物是选自以下的基因的前体mRNA转录物:APOA2、ASAP1、BRCA1、BRCA2、CDKN1C、CRX、CTRC、DENND5A、DIAPH3、DMD、DNAH11、EIF2B3、GALC、HPS1、HTT、IKBKAP、KIAA1524、LMNA、MECP2、PAPD4、PAX6、PCCB、PITPNB、PTCH1、SLC34A3、SMN2、SPINK5、SREK1、TMEM67、VWF、XDH和XRN2。
在特定方面,本文提供了用于修饰RNA剪接以调节由前体mRNA转录物产生的成熟mRNA转录物的量的方法,所述方法包括使包含前体mRNA转录物的细胞或细胞裂解物与式(I)的化合物或其形式接触,其中所述前体mRNA转录物包含两个外显子和内含子,其中第一外显子在内含子的上游,并且第二外显子在内含子的下游,其中所述内含子包含RNA核苷酸序列,所述RNA核苷酸序列按5’至3’顺序包含:内源或非内源剪接修饰剂的内含子识别元件(iREMS)、分支点和3’剪接位点,其中所述iREMS包含RNA序列GAgurngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,并且其中所述前体mRNA转录物是选自以下的基因的前体mRNA转录物:ABCA1、ABCA10、ABCB7、ABCB8、ABCC1、ABCC3、ABL2、ABLIM3、ACACA、ACADVL、ACAT2、ACTA2、ADAL、ADAM15、ADAM17、ADAM23、ADAM33、ADAMTS1、ADAMTS19、ADCY3、ADD1、ADGRG6、ADH6、ADHFE1、AFF2、AFF3、AGK、AGPAT3、AGPAT4、AGPS、AHCYL2、AHDC1、AHRR、AJUBA、AK021888、AK310472、AKAP1、AKAP3、AKAP8L、AKAP9、AKNA、ALCAM、ALDH4A1、AMPD2、ANK1、ANK2、ANK3、ANKFY1、ANKHD1-EIF4EBP3、ANKRA2、ANKRD13C、ANKRD17、ANKRD33B、ANKRD36、ANKS6、ANP32A、ANXA6、AP2B1、AP4B1-AS1、APAF1、APIP、APOA2、APP、APTX、ARHGAP1、ARHGAP12、ARHGAP22、ARHGAP5、ARHGEF16、ARID1A、ARID2、ARID5B、ARL9、ARL15、ARL5B、ARMCX3、ARSJ、ASAP1、ASIC1、ASL、ASNS、ASPH、ATAD2B、ATF6、ATF7IP、ATG9A、ATMIN、ATP2A3、ATP2C1、ATXN1、ATXN3、AURKA、B3GALT2、B3GNT6、B4GALT2、BACE1、BAG2、BASP1、BC033281、BCAR3、BCL2L15、BCYRN1、BECN1、BEND6、BHMT2、BICD1、BIN1、BIN3、BIN3-IT1、BIRC3、BIRC6、BNC1、BNC2、BRCA1、BRCA2、BRD2、BRPF1、BSCL2、BTBD10、BTG2、BTN3A1、BZW1、C1QTNF9B-AS1、C1orf27、C1orf86、C10orf54、C11orf30、C11orf70、C11orf73、C11orf76、C11orf94、C12orf4、C12orf56、C14orf132、C17orf76-AS1、C19orf47、C2orf47、C3、C4orf27、C5orf24、C6orf48、C7orf31、C8orf34、C8orf44、C8orf44-SGK3、C8orf88、C9orf69、CA13、CA3、CAB39、CACNA2D2、CACNB1、CACNB4、CADM1、CADM2、CALU、CAMKK1、CAND2、CAPNS1、CASC3、CASP7、CASP8AP2、CAV1、CCAR1、CCDC77、CCDC79、CCDC88A、CCDC92、CCDC122、CCER2、CCNF、CCNL2、CCT6A、CD276、CD46、CDC25B、CDC40、CDC42BPA、CDCA7、CDH11、CDH13、CDH18、CDK11B、CDK16、CDKAL1、CDKN1C、CECR7、CELSR1、CEMIP、CENPI、CEP112、CEP162、CEP170、CEP192、CEP68、CFH、CFLAR、CHD8、CHEK1、CHRM2、CIITA、CIZ1、CLDN23、CLIC1、CLK4、CLTA、CMAHP、CNGA4、CNOT1、CNRIP1、CNTD1、CMSS1、CNOT7、CNRIP1、CNTN1、COG1、COL1A1、COL11A1、COL12A1、COL14A1、COL15A1、COL5A1、COL5A3、COL6A1、COL6A6、COL8A1、COLEC12、COMP、COPS7B、CPA4、CPEB2、CPQ、CPSF4、CREB5、CRISPLD2、CRLF1、CRLS1、CRTAP、CRX、CRYBG3、CRYL1、CSDE1、CSNK1A1、CSNK1E、CSNK1G1、CTDSP2、CTNND1、CTRC、CUL2、CUL4A、CUX1、CYB5B、CYB5R2、CYBRD1、CYGB、CYP1B1、CYP51A1、DAAM1、DAB2、DACT1、DAGLB、DARS、DAXX、DCAF10、DCAF11、DCAF17、DCBLD2、DCLK1、DCN、DCUN1D4、DDAH1、DDAH2、DDHD2、DDIT4L、DDR1、DDX39B、DDX42、DDX50、DEGS1、DENND1A、DENND1B、DENND4A、DENND5A、DEPTOR、DET1、DFNB59、DGCR2、DGK1、DGKA、DHCR24、DHCR7、DHFR、DHX9、DIAPH1、DIAPH3、DIRAS3、DIS3L、DKFZp434M1735、DKK3、DLC1、DLG5、DMD、DMXL1、DNAH8、DNAH11、DNAJA4、DNAJC13、DNAJC27、DNM2、DNMBP、DOCK1、DOCK11、DPP8、DSEL、DST、DSTN、DYNC1I1、DYRK1A、DZIP1L、EBF1、EEA1、EEF1A1、EFCAB14、EFEMP1、EGR1、EGR3、EHMT2、EIF2B3、EIF4G1、EIF4G2、EIF4G3、ELF2、ELMO2、ELN、ELP4、EMX2OS、ENAH、ENG、ENOX1、ENPP1、ENPP2、ENSA、EP300、EPT1、ERC1、ERC2、ERCC1、ERCC8、ERLIN2、ERRFI1、ESM1、ETV5、EVC、EVC2、EXO1、EXOC3、EXOC6B、EXTL2、EYA3、F2R、FADS1、FADS2、FAF1、FAIM、FAM111A、FAM126A、FAM13A、FAM160A1、FAM162A、FAM174A、FAM195B、FAM198B、FAM20A、FAM208B、FAM219A、FAM219B、FAM3C、FAM46B、FAM49B、FAM65A、FAM65B、FAM69B、FAP、FARP1、FBLN2、FBN2、FBXL16、FBXL6、FBXO9、FBXO10、FBXO18、FBXO31、FBXO34、FBXO9、FCHO1、FDFT1、FDPS、FER、FEZ1、FGD4、FGD5-AS1、FGFR2、FGFRL1、FGL2、FHOD3、FLII、FLNB、FLT1、FN1、FNBP1、FOCAD、FOS、FOSB、FOSL1、FOXK1、FRAS1、FSCN2、FUS、FYN、GABPB1、GAL3ST4、GALC、GALNT1、GALNT15、GAS7、GATA6、GBA2、GBGT1、GBP1、GCFC2、GLCE、GCNT1、GDF6、GGACT、GHDC、GIGYF2、GJC1、GLCE、GMIP、GNA13、GNAQ、GNAS、GNG12、GNL3L、GOLGA2、GOLGA4、GOLGB1、GORASP1、GPR1、GPR183、GPR50、GPR89A、GPRC5A、GPRC5B、GPSM2、GREM1、GRK6、GRTP1、GSE1、GTF2H2B、GTSF1、GUCA1B、GULP1、GXYLT1、HAPLN1、HAPLN2、HAS2、HAS3、HAT1、HAUS3、HAUS6、HAVCR2、HDAC5、HDAC7、HDX、HECTD2-AS1、HEG1、HEPH、HEY1、HLA-A、HLA-E、HLTF、HMGA1、HMGA2、HMGB1、HMGCR、HMGN3-AS1、HMGCS1、HMGXB4、HOOK3、HOXB3、HMOX1、HNMT、HNRNPR、HNRNPUL1、HP1BP3、HPS1、HRH1、HSD17B12、HSPA1L、HTATIP2、HTT、IARS、IDH1、IDI1、IFT57、IGDCC4、IGF2BP2、IGF2R、IGFBP3、IKBKAP、IL16、IL6ST、INA、INHBA、INO80、IPP4B、INPP5K、INSIG1、INTU、INVS、IQCE、IQCG、ITCH、ITGA11、ITGA8、ITGAV、ITGB5、ITGB8、ITIH1、ITM2C、ITPKA、ITSN1、IVD、KANSL3、KAT6B、KCNK2、KCNS1、KCNS2、KDM6A、KDSR、KIAA1033、KIAA1143、KIAA1199、KIAA1456、KIAA1462、KIAA1522、KIAA1524、KIAA1549、KIAA1715、KIAA1755、KIDINS220、KIF14、KIF2A、KIF21A、KIF3A、KIT、KLC1、KLC2、KLF17、KLF6、KLHL7、KLRG1、KMT2D、KRT7、KRT18、KRT19、KRT34、KRTAP1-1、KRTAP1-5、KRTAP2-3、L3MBTL2、LAMA2、LAMB1、LAMB2P1、LARP4、LATS2、LDLR、LEMD3、LETM2、LGALS3、LGALS8、LGI2、LGR4、LHX9、LIMS1、LINC00341、LINC00472、LINC00570、LINC00578、LINC00607、LINC00657、LINC00678、LINC00702、LINC00886、LINC00961、LINC01011、LINC01118、LINC01204、LINCR-0002、LINGO2、LMAN2L、LMNA、LMO7、LMOD1、LOC400927、LONP1、LOX、LPHN1、LRBA、LRCH4、LRIG1、LRP4、LRP8、LRRC1、LRRC32、LRRC39、LRRC8A、LSAMP、LSS、LTBR、LUC7L2、LUM、LYPD1、LYRM1、LZTS2、MACROD2、MAFB、MAGED4、MAGED4B、MAMDC2、MAN1A2、MAN2A1、MAN2C1、MANEA、MAP4K4、MAPK10、MAPK13、MARCH7、MARCH8、MASP1、MB、MB21D2、MBD1、MBOAT7、MC4R、MCM10、MDM2、MDN1、MEAF6、MECP2、MED1、MED13L、MEDAG、MEF2D、MEGF6、MEIS2、MEMO1、MEPCE、MFGE8、MFN2、MIAT、MICAL2、MINPP1、MIR612、MKL1、MKLN1、MKNK2、MLLT4、MLLT10、MLST8、MMAB、MMP10、MMP24、MMS19、MMS22L、MN1、MORF4L1、MOXD1、MPPE1、MPZL1、MRPL3、MRPL45、MRPL55、MRPS28、MRVI1、MSANTD3、MSC、MSH2、MSH4、MSH6、MSL3、MSMO1、MSRB3、MTAP、MTERF3、MTERFD1、MTHFD1L、MTMR3、MTMR9、MTRR、MUM1、MVD、MVK、MXRA5、MYADM、MYB、MYCBP2、MYLK、MYO1D、MYO9B、MYOF、NA、NAA35、NAALADL2、NADK、NAE1、NAGS、NASP、NAV1、NAV2、NCOA1、NCOA3、NCOA4、NCSTN、NDNF、NEDD4、NELFA、NEO1、NEURL1B、NF2、NFASC、NFE2L1、NFX1、NGF、NGFR、NHLH1、NID1、NID2、NIPA1、NKX3-1、NLGN1、NLN、NOL10、NOMO3、NOTCH3、NOTUM、NOVA2、NOX4、NPEPPS、NRD1、NREP、NRG1、NRROS、NSUN4、NT5C2、NT5E、NTNG1、NUDT4、NUP153、NUP35、NUP50、NUPL1、NUSAP1、OCLN、ODF2、OLR1、OS9、OSBPL3、OSBPL6、OSBPL10、OSMR、OXCT1、OXCT2、P4HA1、P4HB、PABPC1、PAIP2B、PAK4、PAPD4、PARD3、PARN、PARP14、PARP4、PARVB、PAX6、PBLD、PBX3、PCBP2、PCCB、PCDH10、PCDHGB3、PCGF3、PCM1、PCMTD2、PCNXL2、PCSK9、PDE1C、PDE3A、PDE4A、PDE5A、PDE7A、PDGFD、PDGFRB、PDLIM7、PDS5B、PDXDC1、PDXDC2P、PEAR1、PELI1、PEPD、PEX5、PFKP、PHACTR3、PHF19、PHF8、PHRF1、PHTF2、PI4K2A、PIEZO1、PIGN、PIGU、PIK3C2B、PIK3CD、PIK3R1、PIKFYVE、PIM2、PITPNA、PITPNB、PITPNM1、PITPNM3、PLAU、PLEC、PLEK2、PLEKHA1、PLEKHA6、PLEKHB2、PLEKHH2、PLSCR1、PLSCR3、PLXNB2、PLXNC1、PMS1、PNISR、PODN、POLE3、POLN、POLR1A、POLR3D、POMT2、POSTN、POU2F1、PPAPDC1A、PPARA、PPARG、PPFIBP1、PPIP5K1、PPIP5K2、PPM1E、PPP1R12A、PPP1R26、PPP3CA、PPP6R1、PPP6R2、PRKCA、PRKDC、PRKG1、PRMT1、PRNP、PRPF31、PRPH2、PRRG4、PRSS23、PRUNE2、PSMA4、PSMC1、PSMD6、PSMD6-AS2、PTCH1、PTGIS、PTK2B、PTPN14、PTX3、PUF60、PUS7、PVR、PXK、PXN、QKI、RAB2B、RAB30、RAB34、RAB38、RAB44、RAD1、RAD9B、RAD23B、RAF1、RALB、RAP1GDS1、RAPGEF1、RARG、RARS、RARS2、RASIP1、RASSF8、RBBP8、RBCK1、RCOR3、RBFOX2、RBKS、RBM10、RDX、RERE、RFTN1、RFWD2、RFX3-AS1、RGCC、RGL1、RGS10、RGS3、RIF1、RNF14、RNF19A、RNF130、RNF144A、RNF213、RNF38、RNFT1、ROR1、ROR2、RPA1、RPF2、RPL10、RPS10、RPS6KB2、RPS6KC1、RRBP1、RWDD4、SAMD4A、SAMD9、SAMD9L、SAR1A、SART3、SCAF4、SCAF8、SCARNA9、SCD、SCLT1、SCO1、SDCBP、SEC14L1、SEC22A、SEC24A、SEC24B、SEC61A1、SENP6、SEPT9、SERGEF、SERPINE2、SF1、SF3B3、SGIP1、SGK3、SGMS1、SGOL2、SGPL1、SH2B3、SH3RF1、SH3YL1、SHROOM3、SIGLEC10、SKA2、SKIL、SKP1、SLC12A2、SLC24A3、SLC25A16、SLC25A17、SLC34A3、SLC35F3、SLC39A3、SLC39A10、SLC4A4、SLC4A11、SLC41A1、SLC44A2、SLC46A2、SLC6A15、SLC7A6、SLC7A8、SLC7A11、SLC9A3、SLIT3、SMARCA4、SMARCC2、SMC4、SMC6、SMCHD1、SMG1、SMG1P3、SMOX、SMPD4、SMTN、SMYD3、SMYD5、SNAP23、SNED1、SNHG16、SNX7、SNX14、SNX24、SNX7、SOCS2、SOCS6、SOGA2、SON、SORBS2、SORCS1、SORCS2、SOS2、SOX7、SPATA18、SPATA20、SPATA5、SPATS2、SPDYA、SPEF2、SPG20、SPIDR、SPINK5、SPRED2、SPRYD7、SQLE、SQRDL、SQSTM1、SRCAP、SREBF1、SRGAP1、SRRM1、SRSF3、SSBP1、STAC2、STARD4、STAT1、STAT3、STAT4、STAU1、STC2、STEAP2、STK32B、STRAD8、STRIP1、STRN4、STS、STX16、STXBP4、STXBP6、SULF1、SUPT20H、SVEP1、SYNE1、SYNE2、SYNGR2、SYNPO、SYNPO2、SYNPO2L、SYT15、SYTL2、TACC1、TAF2、TAGLN3、TANC2、TANGO6、TARBP1、TARS、TASP1、TBC1D15、TBCA、TBL1XR1、TBL2、TCF12、TCF4、TCF7L2、TEKT4P2、TENC1、TENM2、TEP1、TET1、TET3、TEX21P、TFCP2、TGFA、TGFB2、TGFB3、TGFBI、TGFBR1、TGFBRAP1、TGM2、THADA、THAP4、THBS2、THRB、TIAM1、TIMP2、TJAP1、TJP2、TLE3、TLK1、TMC3、TMEM67、TMEM102、TMEM119、TMEM134、TMEM154、TMEM189-UBE2V1、TMEM214、TMEM256-PLSCR3、TMEM47、TMEM50B、TMEM63A、TMX3、TNC、TNFAIP3、TNFAIP8L3、TNFRSF12A、TNFRSF14、TNIP1、TNKS1BP1、TNPO3、TNRC18P1、TNS1、TNS3、TNXB、TOE1、TOMM40、TOMM5、TOPORS、TP53AIP1、TP53INP1、TPRG1、TRAF3、TRAK1、TRAPPC12、TRIB1、TRIM2、TRIM23、TRIM26、TRIM28、TRIM65、TRIM66、TRMT1L、TRPC4、TRPS1、TSC2、TSHZ1、TSHZ2、TSPAN11、TSPAN18、TSPAN2、TSPAN7、TSSK3、TTC7A、TTC7B、TUBB2C、TUBB3、TUBE1、TXNIP、TXNL1、TXNL4B、TXNRD1、TYW5、U2SURP、UBAP2L、UBE2D3、UBE2G2、UBE2L3、UBE2V1、UBN2、UBQLN4、UCHL5、UHMK1、UHRF1BP1L、UNC13B、UNC5B、URGCP、URGCP-MRPS24、USP19、USP7、USP27X、UVRAG、VANGL1、VARS2、VAV2、VCL、VDAC2、VIM-AS1、VIPAS39、VPS13A、VPS29、VPS41、VPS51、VSTM2L、VWA8、VWF、WDR19、WDR27、WDR37、WDR48、WDR90、WDR91、WHSC2、WIPF1、WISP1、WNK1、WNT5B、WNT10B、WSB1、WWTR1、XDH、XIAP、XRN2、YAP1、YDJC、YES1、YPEL5、YTHDF3、Z24749、ZAK、ZBTB10、ZBTB24、ZBTB26、ZBTB7A、ZC3H12C、ZC3H14、ZC3H18、ZCCHC5、ZCCHC8、ZCCHC11、ZEB1、ZEB2、ZFAND1、ZFAND5、ZFP82、ZHX3、ZMIZ1、ZMIZ1-AS1、ZMIZ2、ZMYM2、ZNF12、ZNF138、ZNF148、ZNF208、ZNF212、ZNF219、ZNF227、ZNF232、ZNF24、ZNF268、ZNF28、ZNF280D、ZNF281、ZNF335、ZNF350、ZNF37A、ZNF37BP、ZNF395、ZNF426、ZNF431、ZNF583、ZNF618、ZNF621、ZNF652、ZNF655、ZNF660、ZNF674、ZNF680、ZNF730、ZNF74、ZNF764、ZNF777、ZNF778、ZNF780A、ZNF7804A、ZNF79、ZNF827、ZNF836、ZNF837、ZNF839、ZNF91和ZSCAN25。
在特定方面,本文提供了用于修饰RNA剪接以调节由前体mRNA转录物产生的成熟mRNA转录物的量的方法,所述方法包括使包含前体mRNA转录物的细胞或细胞裂解物与式(I)的化合物或其形式接触,其中所述前体mRNA转录物包含两个外显子和内含子,其中第一外显子在内含子的上游,并且第二外显子在内含子的下游,其中所述内含子包含RNA核苷酸序列,所述RNA核苷酸序列按5’至3’顺序包含:内源或非内源剪接修饰剂的内含子识别元件(iREMS)、分支点和3’剪接位点,其中所述iREMS包含RNA序列GAgurngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,并且其中所述前体mRNA转录物不是基因SMN2的前体mRNA转录物。
在特定方面,本文提供了用于修饰RNA剪接以调节由前体mRNA转录物产生的成熟mRNA转录物的量的方法,所述方法包括使包含前体mRNA转录物的细胞或细胞裂解物与式(I)的化合物或其形式接触,其中所述前体mRNA转录物包含两个外显子和内含子,其中第一外显子在内含子的上游,并且第二外显子在内含子的下游,其中所述内含子包含RNA核苷酸序列,所述RNA核苷酸序列按5’至3’顺序包含:内源或非内源剪接修饰剂的内含子识别元件(iREMS)、分支点和3’剪接位点,其中所述iREMS包含RNA序列GAgurngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,并且其中所述前体mRNA转录物is a前体mRNA转录物of a基因that is not selected from ABHD10、ADAM12、AKT1、ANXA11、APLP2、APPL2、ARMCX6、ATG5、AXIN1、BAIAP2、CCNB1IP1、CCT7、CEP57、CSF1、DLGAP4、EPN1、ERGIC3、FOXM1、GGCT、GRAMD3、HSD17B4、LARP7、LRRC42、MADD、MAN1B1、MRPL39、PCBP4、PPHLN1、PRKACB、RAB23、RAP1A、RCC1、SREK1、STRN3和TNRC6A.
在特定方面,本文提供了用于修饰RNA剪接以调节由前体mRNA转录物产生的成熟mRNA转录物的量的方法,所述方法包括使包含前体mRNA转录物的细胞或细胞裂解物与式(I)的化合物或其形式接触,其中所述前体mRNA转录物包含两个外显子和内含子,其中第一外显子在内含子的上游,并且第二外显子在内含子的下游,其中所述内含子包含RNA核苷酸序列,所述RNA核苷酸序列按包含5’至3’顺序:内源或非内源剪接修饰剂的内含子识别元件(iREMS)、分支点和3’剪接位点,其中所述iREMS包含RNA序列GAgurngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,并且其中所述前体mRNA转录物不是选自以下的基因的前体mRNA转录物:ABHD10、ADAM12、AKT1、ANXA11、APLP2、APPL2、ARMCX6、ATG5、AXIN1、BAIAP2、CCNB1IP1、CCT7、CEP57、CSF1、DLGAP4、EPN1、ERGIC3、FOXM1、GGCT、GRAMD3、HSD17B4、LARP7、LRRC42、MADD、MAN1B1、MRPL39、PCBP4、PPHLN1、PRKACB、RAB23、RAP1A、RCC1、SMN2、SREK1、STRN3和TNRC6A。
在某些方面,与式(I)的化合物或其形式接触或培养的(多种)细胞是来自细胞系的(多种)原代细胞或(多种)细胞。在一些方面,与式(I)的化合物或其形式接触或培养的(多种)细胞是(多种)成纤维细胞、(多种)免疫细胞或(多种)肌细胞。在一些实施方案中,与式(I)的化合物或其形式接触或培养的(多种)细胞是癌细胞。细胞系的非限制性实例包括3T3、4T1、721、9L、A2780、A172、A20、A253、A431、A-549、ALC、B16、B35、BCP-1、BEAS-2B、bEnd.3、BHK、BR 293、BT2O、BT483、BxPC3、C2C12、C3H-10T1/2、C6/36、C6、Cal-27、CHO、COR-L23、COS、COV-434、CML T1、CMT、CRL7O3O、CT26、D17、DH82、DU145、DuCaP、EL4、EM2、EM3、EMT6、FM3、H1299、H69、HB54、HB55、HCA2、HD-1994、HDF、HEK-293、HeLa、Hepa1c1c7、HL-60、HMEC、Hs578T、HsS78Bst、HT-29、HTB2、HUVEC、Jurkat、J558L、JY、K562、Ku812、KCL22、KG1、KYO1、LNCap、Ma-Mel、MC-38、MCF-7、MCF-10A、MDA-MB-231、MDA-MB-468、MDA-MB-435、MDCK、MG63、MOR/0.2R、MONO-MAC 6、MRC5、MTD-1A、NCI-H69、NIH-3T3、NALM-1、NS0、NW-145、OPCN、OPCT、PNT-1A、PNT-2、Raji、RBL、RenCa、RIN-5F、RMA、Saos-2、Sf21、Sf9、SH-SY5Y、SiHa、SKBR3、SKOV-3、T2、T-47D、T84、THP1、U373、U87、U937、VCaP、Vero、VERY、W138、WM39、WT-49、X63、YAC-1和YAR细胞。一方面,细胞来自患者。另一方面,患者细胞是GM03813细胞。另一方面,患者细胞是GM04856、GM04857、GM09197、GM04281、GM04022、GM07492细胞。
在本文所述的某些方面,(多种)细胞与式(I)的化合物或其形式接触或培养15分钟、30分钟、45分钟、1小时、2小时、3小时、4小时、5小时、6小时、8小时、12小时、18小时、24小时、48小时、72小时或更长的时间段。在本文所述的其他方面,(多种)细胞与式(I)的化合物或其形式接触或培养15分钟至1小时、1至2小时、2至4小时、6至12小时、12至18小时、12至24小时、28至24小时、24至48小时、48至72小时的时间段。
在本文所述的某些方面,使(多种)细胞与特定浓度的式(I)的化合物或其形式接触或培养,其中所述特定浓度为0.01μM、0.05μM、1μM、2μM、5μM、10μM、15μM、20μM、25μM、50μM、75μM、100μM或150μM。在本文所述的其他方面,使(多种)细胞与特定浓度的式(I)的化合物或其形式接触或培养,其中所述特定浓度为175μM、200μM、250μM、275μM、300μM、350μM、400μM、450μM、500μM、550μM 600μM、650μM、700μM、750μM、800μM、850μM、900μM、950μM或1mM。在本文所述的一些方面,使(多种)细胞与特定浓度的式(I)的化合物或其形式接触或培养,其中所述特定浓度为5nM、10nM、20nM、30nM、40nM、50nM、60nM、70nM、80nM、90nM、100nM、150nM、200nM、250nM、300nM、350nM、400nM、450nM、500nM、550nM、600nM、650nM、700nM、750nM、800nM、850nM、900nM或950nM。在本文所述的某些方面,使(多种)细胞与特定浓度的式(I)的化合物或其形式接触或培养,其中所述特定浓度为0.01μM至0.1μM、0.1μM至1μM、1μM至50μM、50μM至100μM、100μM至500μM、500μM至1nM、1nM至10nM、10nM至50nM、50nM至100nM、100nM至500nM、500nM至1000nM。在本文所述的某些方面,使(多种)细胞与特定浓度的式(I)的化合物或其形式接触或培养,其导致基因(例如,下文所述的基因)的RNA转录物(例如,mRNA转录物)、供选择的剪接变体或同种型的量实质改变。
另一方面,本文提供了用于修饰RNA剪接以调节基因的一种、两种、三种或更多种RNA转录物的量的方法,其中从所述基因转录的所述前体RNA转录物包含内含子REMS,所述方法包括向人类或非人类对象施用式(I)的化合物或其形式或包含式(I)的化合物或其形式和药学上可接受的载体、赋形剂或稀释剂的药物组合物。在具体方面,所述前体RNA转录物按5’至3’顺序包含:分支点、3’剪接位点和内含子REMS。在另一个具体方面,所述前体RNA转录物按5’至3’顺序包含:第一5’剪接位点、第一分支点、第一3’剪接位点、内含子REMS、第二分支点和第二3’剪接位点。在另一个具体方面,前体RNA转录物按5’至3’顺序包含:内含子REMS、分支点和3’剪接位点。
一方面,本文提供了用于修饰RNA剪接以调节本文所述的基因的一种、两种、三种或更多种RNA转录物的量的方法,所述方法包括向人类或非人类对象施用式(I)的化合物或其形式或包含式(I)的化合物或其形式和药学上可接受的载体、赋形剂或稀释剂的药物组合物。
另一方面,本文提供了用于修饰RNA剪接以调节本文所述的基因的一种、两种、三种或更多种RNA转录物的量的方法,其中从所述基因转录的所述前体RNA转录物包含内含子REMS,所述方法包括向人类或非人类对象施用式(I)的化合物或其形式或包含式(I)的化合物或其形式和药学上可接受的载体、赋形剂或稀释剂的药物组合物。在具体方面,所述前体RNA转录物按5’至3’顺序包含:分支点、3’剪接位点和内含子REMS。在另一个具体方面,所述前体RNA转录物按5’至3’顺序包含:第一5’剪接位点、第一分支点、第一3’剪接位点、内含子REMS、第二分支点和第二3’剪接位点。在另一个具体方面,前体RNA转录物按5’至3’顺序包含:内含子REMS、分支点和3’剪接位点。
在特定方面,本文提供了用于修饰RNA剪接以调节对象的基因的一种、两种、三种或更多种RNA转录物的量的方法,其中从所述基因转录的所述前体RNA转录物包含内含子REMS(例如,内源内含子REMS或非内源内含子REMS),所述方法包括向所述对象施用式(I)的化合物或其形式或包含式(I)的化合物或其形式和药学上可接受的载体、赋形剂或稀释剂的药物组合物,并且其中所述基因选自ABCA1、ABCA10、ABCB7、ABCB8、ABCC1、ABCC3、ABHD10、ABL2、ABLIM3、ACACA、ACADVL、ACAT2、ACTA2、ADAL、ADAM12、ADAM15、ADAM17、ADAM23、ADAM33、ADAMTS1、ADAMTS19、ADCY3、ADD1、ADGRG6、ADH6、ADHFE1、AFF2、AFF3、AGK、AGPAT3、AGPAT4、AGPS、AHCYL2、AHDC1、AHRR、AJUBA、AK021888、AK310472、AKAP1、AKAP3、AKAP8L、AKAP9、AKNA、AKT1、ALCAM、ALDH4A1、AMPD2、ANK1、ANK2、ANK3、ANKFY1、ANKHD1-EIF4EBP3、ANKRA2、ANKRD13C、ANKRD17、ANKRD33B、ANKRD36、ANKS6、ANP32A、ANXA11、ANXA6、AP2B1、AP4B1-AS1、APAF1、APIP、APLP2、APOA2、APP、APPL2、APTX、ARHGAP1、ARHGAP12、ARHGAP22、ARHGAP5、ARHGEF16、ARID1A、ARID2、ARID5B、ARL9、ARL15、ARL5B、ARMCX3、ARMCX6、ARSJ、ASAP1、ASIC1、ASL、ASNS、ASPH、ATAD2B、ATF6、ATF7IP、ATG5、ATG9A、ATMIN、ATP2A3、ATP2C1、ATXN1、ATXN3、AURKA、AXIN1、B3GALT2、B3GNT6、B4GALT2、BACE1、BAG2、BASP1、BC033281、BCAR3、BCL2L15、BCYRN1、BECN1、BEND6、BHMT2、BICD1、BIN1、BIN3、BIN3-IT1、BIRC3、BIRC6、BNC1、BNC2、BRCA1、BRCA2、BRD2、BRPF1、BSCL2、BTBD10、BTG2、BTN3A1、BZW1、C1QTNF9B-AS1、C1orf27、C1orf86、C10orf54、C11orf30、C11orf70、C11orf73、C11orf76、C11orf94、C12orf4、C12orf56、C14orf132、C17orf76-AS1、C19orf47、C2orf47、C3、C4orf27、C5orf24、C6orf48、C7orf31、C8orf34、C8orf44、C8orf44-SGK3、C8orf88、C9orf69、CA13、CA3、CAB39、CACNA2D2、CACNB1、CACNB4、CADM1、CADM2、CALU、CAMKK1、CAND2、CAPNS1、CASC3、CASP7、CASP8AP2、CAV1、CCAR1、CCDC77、CCDC79、CCDC88A、CCDC92、CCDC122、CCER2、CCNF、CCNL2、CCT6A、CD276、CD46、CDC25B、CDC40、CDC42BPA、CDCA7、CDH11、CDH13、CDH18、CDK11B、CDK16、CDKAL1、CDKN1C、CECR7、CELSR1、CEMIP、CENPI、CEP112、CEP162、CEP170、CEP192、CEP57、CEP68、CFH、CFLAR、CHD8、CHEK1、CHRM2、CIITA、CIZ1、CLDN23、CLIC1、CLK4、CLTA、CMAHP、CNGA4、CNOT1、CNRIP1、CNTD1、CMSS1、CNOT7、CNRIP1、CNTN1、COG1、COL1A1、COL11A1、COL12A1、COL14A1、COL15A1、COL5A1、COL5A3、COL6A1、COL6A6、COL8A1、COLEC12、COMP、COPS7B、CPA4、CPEB2、CPQ、CPSF4、CREB5、CRISPLD2、CRLF1、CRLS1、CRTAP、CRX、CRYBG3、CRYL1、CSDE1、CSNK1A1、CSNK1E、CSNK1G1、CTDSP2、CTNND1、CTRC、CUL2、CUL4A、CUX1、CYB5B、CYB5R2、CYBRD1、CYGB、CYP1B1、CYP51A1、DAAM1、DAB2、DACT1、DAGLB、DARS、DAXX、DCAF10、DCAF11、DCAF17、DCBLD2、DCLK1、DCN、DCUN1D4、DDAH1、DDAH2、DDHD2、DDIT4L、DDR1、DDX39B、DDX42、DDX50、DEGS1、DENND1A、DENND1B、DENND4A、DENND5A、DEPTOR、DET1、DFNB59、DGCR2、DGK1、DGKA、DHCR24、DHCR7、DHFR、DHX9、DIAPH1、DIAPH3、DIRAS3、DIS3L、DKFZp434M1735、DKK3、DLC1、DLG5、DLGAP4、DMD、DMXL1、DNAH8、DNAH11、DNAJA4、DNAJC13、DNAJC27、DNM2、DNMBP、DOCK1、DOCK11、DPP8、DSEL、DST、DSTN、DYNC1I1、DYRK1A、DZIP1L、EBF1、EEA1、EEF1A1、EFCAB14、EFEMP1、EGR1、EGR3、EHMT2、EIF2B3、EIF4G1、EIF4G2、EIF4G3、ELF2、ELMO2、ELN、ELP4、EMX2OS、ENAH、ENG、ENOX1、ENPP1、ENPP2、ENSA、EP300、EPN1、EPT1、ERC1、ERC2、ERCC1、ERCC8、ERGIC3、ERLIN2、ERRFI1、ESM1、ETV5、EVC、EVC2、EXO1、EXOC3、EXOC6B、EXTL2、EYA3、F2R、FADS1、FADS2、FAF1、FAIM、FAM111A、FAM126A、FAM13A、FAM160A1、FAM162A、FAM174A、FAM195B、FAM198B、FAM20A、FAM208B、FAM219A、FAM219B、FAM3C、FAM46B、FAM49B、FAM65A、FAM65B、FAM69B、FAP、FARP1、FBLN2、FBN2、FBXL16、FBXL6、FBXO9、FBXO10、FBXO18、FBXO31、FBXO34、FBXO9、FCHO1、FDFT1、FDPS、FER、FEZ1、FGD4、FGD5-AS1、FGFR2、FGFRL1、FGL2、FHOD3、FLII、FLNB、FLT1、FN1、FNBP1、FOCAD、FOS、FOSB、FOSL1、FOXK1、FOXM1、FRAS1、FSCN2、FUS、FYN、GABPB1、GAL3ST4、GALC、GALNT1、GALNT15、GAS7、GATA6、GBA2、GBGT1、GBP1、GCFC2、GLCE、GCNT1、GDF6、GGACT、GGCT、GHDC、GIGYF2、GJC1、GLCE、GMIP、GNA13、GNAQ、GNAS、GNG12、GNL3L、GOLGA2、GOLGA4、GOLGB1、GORASP1、GPR1、GPR183、GPR50、GPR89A、GPRC5A、GPRC5B、GPSM2、GREM1、GRK6、GRTP1、GSE1、GTF2H2B、GTSF1、GUCA1B、GULP1、GXYLT1、HAPLN1、HAPLN2、HAS2、HAS3、HAT1、HAUS3、HAUS6、HAVCR2、HDAC5、HDAC7、HDX、HECTD2-AS1、HEG1、HEPH、HEY1、HLA-A、HLA-E、HLTF、HMGA1、HMGA2、HMGB1、HMGCR、HMGN3-AS1、HMGCS1、HMGXB4、HOOK3、HOXB3、HMOX1、HNMT、HNRNPR、HNRNPUL1、HP1BP3、HPS1、HRH1、HSD17B12、HSD17B4、HSPA1L、HTATIP2、HTT、IARS、IDH1、IDI1、IFT57、IGDCC4、IGF2BP2、IGF2R、IGFBP3、IKBKAP、IL16、IL6ST、INA、INHBA、INO80、IPP4B、INPP5K、INSIG1、INTU、INVS、IQCE、IQCG、ITCH、ITGA11、ITGA8、ITGAV、ITGB5、ITGB8、ITIH1、ITM2C、ITPKA、ITSN1、IVD、KANSL3、KAT6B、KCNK2、KCNS1、KCNS2、KDM6A、KDSR、KIAA1033、KIAA1143、KIAA1199、KIAA1456、KIAA1462、KIAA1522、KIAA1524、KIAA1549、KIAA1715、KIAA1755、KIDINS220、KIF14、KIF2A、KIF21A、KIF3A、KIT、KLC1、KLC2、KLF17、KLF6、KLHL7、KLRG1、KMT2D、KRT7、KRT18、KRT19、KRT34、KRTAP1-1、KRTAP1-5、KRTAP2-3、L3MBTL2、LAMA2、LAMB1、LAMB2P1、LARP4、LARP7、LATS2、LDLR、LEMD3、LETM2、LGALS3、LGALS8、LGI2、LGR4、LHX9、LIMS1、LINC00341、LINC00472、LINC00570、LINC00578、LINC00607、LINC00657、LINC00678、LINC00702、LINC00886、LINC00961、LINC01011、LINC01118、LINC01204、LINCR-0002、LINGO2、LMAN2L、LMNA、LMO7、LMOD1、LOC400927、LONP1、LOX、LPHN1、LRBA、LRCH4、LRIG1、LRP4、LRP8、LRRC1、LRRC32、LRRC39、LRRC42、LRRC8A、LSAMP、LSS、LTBR、LUC7L2、LUM、LYPD1、LYRM1、LZTS2、MACROD2、MADD、MAFB、MAGED4、MAGED4B、MAMDC2、MAN1A2、MAN2A1、MAN2C1、MANEA、MAP4K4、MAPK10、MAPK13、MARCH7、MARCH8、MASP1、MB、MB21D2、MBD1、MBOAT7、MC4R、MCM10、MDM2、MDN1、MEAF6、MECP2、MED1、MED13L、MEDAG、MEF2D、MEGF6、MEIS2、MEMO1、MEPCE、MFGE8、MFN2、MIAT、MICAL2、MINPP1、MIR612、MKL1、MKLN1、MKNK2、MLLT4、MLLT10、MLST8、MMAB、MMP10、MMP24、MMS19、MMS22L、MN1、MORF4L1、MOXD1、MPPE1、MPZL1、MRPL3、MRPL39、MRPL45、MRPL55、MRPS28、MRVI1、MSANTD3、MSC、MSH2、MSH4、MSH6、MSL3、MSMO1、MSRB3、MTAP、MTERF3、MTERFD1、MTHFD1L、MTMR3、MTMR9、MTRR、MUM1、MVD、MVK、MXRA5、MYADM、MYB、MYCBP2、MYLK、MYO1D、MYO9B、MYOF、NA、NAA35、NAALADL2、NADK、NAE1、NAGS、NASP、NAV1、NAV2、NCOA1、NCOA3、NCOA4、NCSTN、NDNF、NEDD4、NELFA、NEO1、NEURL1B、NF2、NFASC、NFE2L1、NFX1、NGF、NGFR、NHLH1、NID1、NID2、NIPA1、NKX3-1、NLGN1、NLN、NOL10、NOMO3、NOTCH3、NOTUM、NOVA2、NOX4、NPEPPS、NRD1、NREP、NRG1、NRROS、NSUN4、NT5C2、NT5E、NTNG1、NUDT4、NUP153、NUP35、NUP50、NUPL1、NUSAP1、OCLN、ODF2、OLR1、OS9、OSBPL3、OSBPL6、OSBPL10、OSMR、OXCT1、OXCT2、P4HA1、P4HB、PABPC1、PAIP2B、PAK4、PAPD4、PARD3、PARN、PARP14、PARP4、PARVB、PAX6、PBLD、PBX3、PCBP2、PCBP4、PCCB、PCDH10、PCDHGB3、PCGF3、PCM1、PCMTD2、PCNXL2、PCSK9、PDE1C、PDE3A、PDE4A、PDE5A、PDE7A、PDGFD、PDGFRB、PDLIM7、PDS5B、PDXDC1、PDXDC2P、PEAR1、PELI1、PEPD、PEX5、PFKP、PHACTR3、PHF19、PHF8、PHRF1、PHTF2、PI4K2A、PIEZO1、PIGN、PIGU、PIK3C2B、PIK3CD、PIK3R1、PIKFYVE、PIM2、PITPNA、PITPNB、PITPNM1、PITPNM3、PLAU、PLEC、PLEK2、PLEKHA1、PLEKHA6、PLEKHB2、PLEKHH2、PLSCR1、PLSCR3、PLXNB2、PLXNC1、PMS1、PNISR、PODN、POLE3、POLN、POLR1A、POLR3D、POMT2、POSTN、POU2F1、PPAPDC1A、PPARA、PPARG、PPFIBP1、PPHLN1、PPIP5K1、PPIP5K2、PPM1E、PPP1R12A、PPP1R26、PPP3CA、PPP6R1、PPP6R2、PRKACB、PRKCA、PRKDC、PRKG1、PRMT1、PRNP、PRPF31、PRPH2、PRRG4、PRSS23、PRUNE2、PSMA4、PSMC1、PSMD6、PSMD6-AS2、PTCH1、PTGIS、PTK2B、PTPN14、PTX3、PUF60、PUS7、PVR、PXK、PXN、QKI、RAB23、RAB2B、RAB30、RAB34、RAB38、RAB44、RAD1、RAD9B、RAD23B、RAF1、RALB、RAP1A、RAP1GDS1、RAPGEF1、RARG、RARS、RARS2、RASIP1、RASSF8、RBBP8、RBCK1、RCOR3、RBFOX2、RBKS、RBM10、RCC1、RDX、RERE、RFTN1、RFWD2、RFX3-AS1、RGCC、RGL1、RGS10、RGS3、RIF1、RNF14、RNF19A、RNF130、RNF144A、RNF213、RNF38、RNFT1、ROR1、ROR2、RPA1、RPF2、RPL10、RPS10、RPS6KB2、RPS6KC1、RRBP1、RWDD4、SAMD4A、SAMD9、SAMD9L、SAR1A、SART3、SCAF4、SCAF8、SCARNA9、SCD、SCLT1、SCO1、SDCBP、SEC14L1、SEC22A、SEC24A、SEC24B、SEC61A1、SENP6、SEPT9、SERGEF、SERPINE2、SF1、SF3B3、SGIP1、SGK3、SGMS1、SGOL2、SGPL1、SH2B3、SH3RF1、SH3YL1、SHROOM3、SIGLEC10、SKA2、SKIL、SKP1、SLC12A2、SLC24A3、SLC25A16、SLC25A17、SLC34A3、SLC35F3、SLC39A3、SLC39A10、SLC4A4、SLC4A11、SLC41A1、SLC44A2、SLC46A2、SLC6A15、SLC7A6、SLC7A8、SLC7A11、SLC9A3、SLIT3、SMARCA4、SMARCC2、SMC4、SMC6、SMCHD1、SMG1、SMG1P3、SMN2、SMOX、SMPD4、SMTN、SMYD3、SMYD5、SNAP23、SNED1、SNHG16、SNX7、SNX14、SNX24、SNX7、SOCS2、SOCS6、SOGA2、SON、SORBS2、SORCS1、SORCS2、SOS2、SOX7、SPATA18、SPATA20、SPATA5、SPATS2、SPDYA、SPEF2、SPG20、SPIDR、SPINK5、SPRED2、SPRYD7、SQLE、SQRDL、SQSTM1、SRCAP、SREBF1、SREK1、SRGAP1、SRRM1、SRSF3、SSBP1、STAC2、STARD4、STAT1、STAT3、STAT4、STAU1、STC2、STEAP2、STK32B、STRAD8、STRIP1、STRN3、STRN4、STS、STX16、STXBP4、STXBP6、SULF1、SUPT20H、SVEP1、SYNE1、SYNE2、SYNGR2、SYNPO、SYNPO2、SYNPO2L、SYT15、SYTL2、TACC1、TAF2、TAGLN3、TANC2、TANGO6、TARBP1、TARS、TASP1、TBC1D15、TBCA、TBL1XR1、TBL2、TCF12、TCF4、TCF7L2、TEKT4P2、TENC1、TENM2、TEP1、TET1、TET3、TEX21P、TFCP2、TGFA、TGFB2、TGFB3、TGFBI、TGFBR1、TGFBRAP1、TGM2、THADA、THAP4、THBS2、THRB、TIAM1、TIMP2、TJAP1、TJP2、TLE3、TLK1、TMC3、TMEM67、TMEM102、TMEM119、TMEM134、TMEM154、TMEM189-UBE2V1、TMEM214、TMEM256-PLSCR3、TMEM47、TMEM50B、TMEM63A、TMX3、TNC、TNFAIP3、TNFAIP8L3、TNFRSF12A、TNFRSF14、TNIP1、TNKS1BP1、TNPO3、TNRC18P1、TNRC6A、TNS1、TNS3、TNXB、TOE1、TOMM40、TOMM5、TOPORS、TP53AIP1、TP53INP1、TPRG1、TRAF3、TRAK1、TRAPPC12、TRIB1、TRIM2、TRIM23、TRIM26、TRIM28、TRIM65、TRIM66、TRMT1L、TRPC4、TRPS1、TSC2、TSHZ1、TSHZ2、TSPAN11、TSPAN18、TSPAN2、TSPAN7、TSSK3、TTC7A、TTC7B、TUBB2C、TUBB3、TUBE1、TXNIP、TXNL1、TXNL4B、TXNRD1、TYW5、U2SURP、UBAP2L、UBE2D3、UBE2G2、UBE2L3、UBE2V1、UBN2、UBQLN4、UCHL5、UHMK1、UHRF1BP1L、UNC13B、UNC5B、URGCP、URGCP-MRPS24、USP19、USP7、USP27X、UVRAG、VANGL1、VARS2、VAV2、VCL、VDAC2、VIM-AS1、VIPAS39、VPS13A、VPS29、VPS41、VPS51、VSTM2L、VWA8、VWF、WDR19、WDR27、WDR37、WDR48、WDR90、WDR91、WHSC2、WIPF1、WISP1、WNK1、WNT5B、WNT10B、WSB1、WWTR1、XDH、XIAP、XRN2、YAP1、YDJC、YES1、YPEL5、YTHDF3、Z24749、ZAK、ZBTB10、ZBTB24、ZBTB26、ZBTB7A、ZC3H12C、ZC3H14、ZC3H18、ZCCHC5、ZCCHC8、ZCCHC11、ZEB1、ZEB2、ZFAND1、ZFAND5、ZFP82、ZHX3、ZMIZ1、ZMIZ1-AS1、ZMIZ2、ZMYM2、ZNF12、ZNF138、ZNF148、ZNF208、ZNF212、ZNF219、ZNF227、ZNF232、ZNF24、ZNF268、ZNF28、ZNF280D、ZNF281、ZNF335、ZNF350、ZNF37A、ZNF37BP、ZNF395、ZNF426、ZNF431、ZNF583、ZNF618、ZNF621、ZNF652、ZNF655、ZNF660、ZNF674、ZNF680、ZNF730、ZNF74、ZNF764、ZNF777、ZNF778、ZNF780A、ZNF7804A、ZNF79、ZNF827、ZNF836、ZNF837、ZNF839、ZNF91和ZSCAN25。
在前述的另一个具体方面,所述前体RNA转录物按5’至3’顺序包含:分支点、3’剪接位点和内含子REMS。在前述的另一个具体方面,所述前体RNA转录物按5’至3’顺序包含:第一5’剪接位点、第一分支点、第一3’剪接位点、内含子REMS、第二分支点和第二3’剪接位点。在前述的另一个具体方面,所述前体RNA转录物按5’至3’顺序包含:内含子REMS、分支点和3’剪接位点。
在前述的另一个具体方面,所述基因选自ABCA1、ABCA10、ABCB7、ABCB8、ABCC1、ABCC3、ABHD10、ABL2、ABLIM3、ACACA、ACADVL、ACAT2、ACTA2、ADAL、ADAM12、ADAM15、ADAM17、ADAM33、ADAMTS1、ADCY3、ADD1、ADGRG6、ADH6、ADHFE1、AFF2、AFF3、AGK、AGPAT3、AGPAT4、AGPS、AHCYL2、AHDC1、AHRR、AJUBA、AK021888、AK310472、AKAP1、AKAP3、AKAP9、AKNA、ALCAM、ALDH4A1、AMPD2、ANK1、ANK2、ANK3、ANKFY1、ANKHD1-EIF4EBP3、ANKRA2、ANKRD17、ANKRD33B、ANKRD36、ANKS6、ANP32A、ANXA11、ANXA6、AP2B1、AP4B1-AS1、APAF1、APIP、APLP2、APP、APPL2、APTX、ARHGAP1、ARHGAP12、ARHGAP22、ARHGEF16、ARID1A、ARID2、ARID5B、ARL9、ARL15、ARMCX3、ARMCX6、ASAP1、ASIC1、ASL、ASNS、ASPH、ATAD2B、ATF7IP、ATG5、ATG9A、ATMIN、ATP2A3、ATP2C1、ATXN1、ATXN3、AURKA、AXIN1、B3GALT2、B3GNT6、B4GALT2、BACE1、BAG2、BASP1、BC033281、BCAR3、BCL2L15、BCYRN1、BECN1、BEND6、BHMT2、BICD1、BIN1、BIN3-IT1、BIRC3、BIRC6、BNC1、BRD2、BRPF1、BSCL2、BTBD10、BTG2、BTN3A1、BZW1、C1orf86、C10orf54、C11orf30、C11orf70、C11orf73、C11orf94、C12orf4、C12orf56、C14orf132、C17orf76-AS1、C19orf47、C3、C4orf27、C5orf24、C6orf48、C7orf31、C8orf34、C8orf44、C8orf44-SGK3、C8orf88、C9orf69、CA13、CA3、CAB39、CACNA2D2、CACNB1、CADM1、CALU、CAMKK1、CAND2、CAPNS1、CASC3、CASP7、CASP8AP2、CAV1、CCAR1、CCDC77、CCDC79、CCDC88A、CCDC92、CCDC122、CCER2、CCNF、CCT6A、CD276、CD46、CDC25B、CDC40、CDC42BPA、CDCA7、CDH11、CDH13、CDK11B、CDK16、CDKAL1、CECR7、CELSR1、CEMIP、CENPI、CEP112、CEP170、CEP192、CEP68、CFH、CFLAR、CHD8、CHEK1、CIITA、CIZ1、CLDN23、CLIC1、CLK4、CLTA、CMAHP、CNGA4、CNOT1、CNRIP1、CNTD1、COG1、COL1A1、COL11A1、COL12A1、COL14A1、COL15A1、COL5A1、COL5A3、COL6A1、COL6A6、COL8A1、COLEC12、COMP、COPS7B、CPA4、CPEB2、CPQ、CPSF4、CREB5、CRISPLD2、CRLF1、CRLS1、CRTAP、CRYBG3、CRYL1、CSDE1、CSNK1A1、CSNK1E、CSNK1G1、CTDSP2、CTNND1、CUL2、CUL4A、CUX1、CYB5B、CYB5R2、CYBRD1、CYGB、CYP1B1、CYP51A1、DAB2、DACT1、DAGLB、DARS、DAXX、DCAF10、DCAF11、DCAF17、DCBLD2、DCLK1、DCN、DCUN1D4、DDAH1、DDAH2、DDHD2、DDIT4L、DDR1、DDX39B、DDX42、DDX50、DEGS1、DENND1A、DENND1B、DENND5A、DEPTOR、DFNB59、DGCR2、DGKA、DHCR24、DHCR7、DHFR、DHX9、DIAPH1、DIAPH3、DIRAS3、DIS3L、DKFZp434M1735、DKK3、DLC1、DLG5、DLGAP4、DNAH8、DNAJC13、DNAJC27、DNM2、DNMBP、DOCK1、DOCK11、DPP8、DSEL、DST、DSTN、DYNC1I1、DYRK1A、DZIP1L、EBF1、EEA1、EEF1A1、EFCAB14、EFEMP1、EGR1、EGR3、EHMT2、EIF2B3、EIF4G1、EIF4G2、EIF4G3、ELF2、ELN、ELP4、EMX2OS、ENAH、ENG、ENPP1、ENPP2、ENSA、EP300、EPN1、EPT1、ERC1、ERCC1、ERCC8、ERGIC3、ERLIN2、ERRFI1、ESM1、ETV5、EVC、EVC2、EXO1、EXTL2、EYA3、F2R、FADS1、FADS2、FAF1、FAIM、FAM111A、FAM126A、FAM13A、FAM160A1、FAM162A、FAM174A、FAM198B、FAM20A、FAM219A、FAM219B、FAM3C、FAM46B、FAM65A、FAM65B、FAP、FARP1、FBLN2、FBN2、FBXO9、FBXL6、FBXO10、FBXO18、FBXO31、FBXO34、FBXO9、FCHO1、FDFT1、FDPS、FER、FEZ1、FGD5-AS1、FGFR2、FGFRL1、FGL2、FHOD3、FLII、FLNB、FLT1、FN1、FNBP1、FOCAD、FOS、FOSB、FOSL1、FOXK1、FOXM1、FRAS1、FSCN2、FUS、FYN、GABPB1、GAL3ST4、GALC、GALNT1、GALNT15、GAS7、GATA6、GBA2、GBGT1、GCFC2、GCNT1、GDF6、GGACT、GGCT、GHDC、GIGYF2、GJC1、GLCE、GMIP、GNA13、GNAQ、GNAS、GNL3L、GOLGA2、GOLGA4、GOLGB1、GORASP1、GPR1、GPR183、GPR50、GPR89A、GPRC5A、GPRC5B、GPSM2、GREM1、GRK6、GRTP1、GSE1、GTF2H2B、GUCA1B、GULP1、GXYLT1、HAPLN1、HAPLN2、HAS2、HAS3、HAT1、HAUS3、HAUS6、HAVCR2、HDAC5、HDAC7、HDX、HECTD2-AS1、HEG1、HEPH、HEY1、HLA-A、HLA-E、HLTF、HMGA1、HMGA2、HMGB1、HMGCR、HMGN3-AS1、HMGCS1、HOOK3、HMOX1、HNMT、HNRNPR、HNRNPUL1、HP1BP3、HPS1、HRH1、HSD17B12、HSD17B4、HSPA1L、HTATIP2、HTT、IARS、IDH1、IDI1、IFT57、IGDCC4、IGF2BP2、IGF2R、IGFBP3、IL16、IL6ST、INA、INHBA、INPP5K、INSIG1、INTU、IQCE、IQCG、ITGA11、ITGA8、ITGAV、ITGB5、ITGB8、ITIH1、ITM2C、ITPKA、ITSN1、IVD、KANSL3、KAT6B、KCNK2、KCNS1、KCNS2、KDM6A、KDSR、KIAA1033、KIAA1143、KIAA1199、KIAA1456、KIAA1462、KIAA1522、KIAA1524、KIAA1549、KIAA1715、KIAA1755、KIF14、KIF2A、KIF3A、KIT、KLC1、KLC2、KLF17、KLF6、KLHL7、KLRG1、KMT2D、KRT7、KRT18、KRT19、KRT34、KRTAP1-1、KRTAP1-5、KRTAP2-3、L3MBTL2、LAMA2、LAMB1、LAMB2P1、LARP4、LARP7、LATS2、LDLR、LEMD3、LETM2、LGALS8、LGI2、LGR4、LHX9、LIMS1、LINC00341、LINC00472、LINC00570、LINC00578、LINC00607、LINC00657、LINC00678、LINC00702、LINC00886、LINC00961、LINC01011、LINC01118、LINC01204、LMAN2L、LMO7、LMOD1、LOC400927、LONP1、LOX、LRBA、LRCH4、LRIG1、LRP4、LRP8、LRRC32、LRRC39、LRRC42、LRRC8A、LSAMP、LSS、LTBR、LUC7L2、LUM、LYPD1、LYRM1、LZTS2、MADD、MAFB、MAGED4、MAGED4B、MAMDC2、MAN1A2、MAN2A1、MAN2C1、MAP4K4、MAPK13、MASP1、MB、MB21D2、MBD1、MBOAT7、MC4R、MCM10、MDM2、MED1、MED13L、MEDAG、MEF2D、MEGF6、MEIS2、MEMO1、MEPCE、MFGE8、MFN2、MIAT、MICAL2、MINPP1、MIR612、MKL1、MKLN1、MKNK2、MLLT4、MLLT10、MLST8、MMAB、MMP10、MMP24、MMS19、MMS22L、MN1、MOXD1、MPPE1、MPZL1、MRPL3、MRPL45、MRPL55、MRPS28、MRVI1、MSANTD3、MSC、MSH2、MSH4、MSH6、MSL3、MSMO1、MSRB3、MTAP、MTERF3、MTERFD1、MTHFD1L、MTMR9、MTRR、MUM1、MVD、MVK、MXRA5、MYADM、MYCBP2、MYLK、MYO1D、MYO9B、MYOF、NA、NAA35、NAALADL2、NADK、NAE1、NAGS、NASP、NAV1、NAV2、NCOA1、NCOA3、NCOA4、NCSTN、NDNF、NELFA、NEO1、NEURL1B、NF2、NFE2L1、NFX1、NGF、NGFR、NHLH1、NID1、NID2、NIPA1、NKX3-1、NLN、NOL10、NOMO3、NOTCH3、NOTUM、NOVA2、NOX4、NPEPPS、NRD1、NREP、NRG1、NRROS、NSUN4、NT5C2、NT5E、NTNG1、NUDT4、NUP153、NUP35、NUP50、NUPL1、NUSAP1、OCLN、ODF2、OLR1、OS9、OSBPL6、OSBPL10、OSMR、OXCT1、OXCT2、P4HA1、P4HB、PABPC1、PAIP2B、PAK4、PAPD4、PARD3、PARN、PARP14、PARP4、PARVB、PBLD、PCBP2、PCBP4、PCDHGB3、PCGF3、PCM1、PCMTD2、PCNXL2、PCSK9、PDE1C、PDE4A、PDE5A、PDE7A、PDGFD、PDGFRB、PDLIM7、PDS5B、PDXDC1、PEAR1、PEPD、PEX5、PFKP、PHACTR3、PHF19、PHF8、PHRF1、PHTF2、PI4K2A、PIEZO1、PIGN、PIGU、PIK3C2B、PIK3CD、PIK3R1、PIKFYVE、PIM2、PITPNA、PITPNB、PITPNM1、PITPNM3、PLAU、PLEC、PLEK2、PLEKHA1、PLEKHA6、PLEKHB2、PLEKHH2、PLSCR1、PLSCR3、PLXNB2、PLXNC1、PMS1、PNISR、PODN、POLE3、POLN、POLR1A、POLR3D、POMT2、POSTN、POU2F1、PPAPDC1A、PPARA、PPARG、PPHLN1、PPIP5K1、PPIP5K2、PPM1E、PPP1R12A、PPP1R26、PPP3CA、PPP6R1、PPP6R2、PRKACB、PRKCA、PRKDC、PRKG1、PRMT1、PRNP、PRPF31、PRPH2、PRRG4、PRSS23、PRUNE2、PSMA4、PSMC1、PSMD6、PSMD6-AS2、PTGIS、PTK2B、PTPN14、PTX3、PUF60、PUS7、PVR、PXK、PXN、QKI、RAB23、RAB2B、RAB30、RAB34、RAB38、RAB44、RAD1、RAD9B、RAD23B、RAF1、RALB、RAP1A、RAP1GDS1、RAPGEF1、RARG、RARS、RARS2、RASSF8、RBBP8、RBCK1、RBFOX2、RBKS、RBM10、RCC1、RDX、RERE、RFTN1、RFWD2、RFX3-AS1、RGCC、RGS10、RGS3、RIF1、RNF14、RNF19A、RNF38、RNFT1、ROR1、ROR2、RPA1、RPL10、RPS10、RPS6KB2、RPS6KC1、RRBP1、RWDD4、SAMD4A、SAMD9、SAMD9L、SAR1A、SART3、SCAF4、SCAF8、SCARNA9、SCD、SCLT1、SCO1、SDCBP、SEC14L1、SEC22A、SEC24A、SEC24B、SEC61A1、SENP6、SEPT9、SERGEF、SERPINE2、SF1、SGK3、SGOL2、SH3RF1、SH3YL1、SHROOM3、SIGLEC10、SKA2、SKIL、SLC12A2、SLC24A3、SLC25A17、SLC35F3、SLC39A3、SLC39A10、SLC4A4、SLC4A11、SLC41A1、SLC44A2、SLC46A2、SLC6A15、SLC7A6、SLC7A8、SLC7A11、SLC9A3、SLIT3、SMARCA4、SMARCC2、SMC4、SMC6、SMCHD1、SMG1、SMG1P3、SMN2、SMPD4、SMTN、SMYD3、SMYD5、SNAP23、SNED1、SNHG16、SNX7、SNX14、SOCS2、SON、SORBS2、SORCS2、SOS2、SOX7、SPATA18、SPATA20、SPATA5、SPATS2、SPDYA、SPEF2、SPG20、SPIDR、SPRED2、SPRYD7、SQLE、SQRDL、SQSTM1、SRCAP、SREBF1、SREK1、SRGAP1、SRRM1、SRSF3、STAC2、STARD4、STAT1、STAT3、STAT4、STAU1、STC2、STEAP2、STK32B、STRIP1、STRN3、STRN4、STS、STX16、STXBP6、SULF1、SUPT20H、SVEP1、SYNE1、SYNE2、SYNGR2、SYNPO、SYNPO2、SYNPO2L、SYT15、SYTL2、TACC1、TAF2、TAGLN3、TANC2、TANGO6、TARBP1、TARS、TASP1、TBC1D15、TBL2、TCF12、TCF4、TCF7L2、TENC1、TENM2、TEP1、TET3、TEX21P、TFCP2、TGFA、TGFB2、TGFB3、TGFBI、TGFBR1、TGFBRAP1、TGM2、THADA、THAP4、THBS2、THRB、TIAM1、TIMP2、TJP2、TLE3、TLK1、TMC3、TMEM102、TMEM119、TMEM134、TMEM154、TMEM189-UBE2V1、TMEM214、TMEM256-PLSCR3、TMEM47、TMEM50B、TMEM63A、TNC、TNFAIP3、TNFAIP8L3、TNFRSF12A、TNFRSF14、TNIP1、TNKS1BP1、TNPO3、TNRC18P1、TNRC6A、TNS1、TNS3、TNXB、TOE1、TOMM40、TOMM5、TOPORS、TP53AIP1、TP53INP1、TPRG1、TRAF3、TRAK1、TRAPPC12、TRIB1、TRIM2、TRIM23、TRIM26、TRIM28、TRIM65、TRIM66、TRMT1L、TRPC4、TRPS1、TSC2、TSHZ1、TSHZ2、TSPAN11、TSPAN18、TSPAN2、TSPAN7、TSSK3、TTC7A、TTC7B、TUBB2C、TUBB3、TUBE1、TXNIP、TXNL1、TXNRD1、TYW5、U2SURP、UBAP2L、UBE2G2、UBE2V1、UBQLN4、UCHL5、UHMK1、UHRF1BP1L、UNC5B、URGCP、USP19、USP7、USP27X、UVRAG、VANGL1、VARS2、VAV2、VCL、VIM-AS1、VIPAS39、VPS13A、VPS29、VPS41、VPS51、VSTM2L、VWA8、VWF、WDR19、WDR27、WDR37、WDR48、WDR91、WIPF1、WISP1、WNK1、WNT5B、WNT10B、WSB1、WWTR1、XIAP、XRN2、YAP1、YDJC、YES1、YPEL5、YTHDF3、Z24749、ZAK、ZBTB10、ZBTB24、ZBTB26、ZBTB7A、ZC3H12C、ZC3H14、ZC3H18、ZCCHC5、ZCCHC8、ZCCHC11、ZEB1、ZEB2、ZFAND1、ZFAND5、ZFP82、ZHX3、ZMIZ1、ZMIZ1-AS1、ZMYM2、ZNF12、ZNF138、ZNF148、ZNF212、ZNF219、ZNF227、ZNF232、ZNF24、ZNF268、ZNF28、ZNF281、ZNF335、ZNF350、ZNF37A、ZNF37BP、ZNF395、ZNF431、ZNF583、ZNF621、ZNF652、ZNF655、ZNF660、ZNF674、ZNF680、ZNF74、ZNF764、ZNF778、ZNF780A、ZNF79、ZNF827、ZNF837、ZNF839和ZNF91。
在前述的另一个具体方面,所述基因选自ABCA1、ABCB7、ABCC1、ABHD10、ABL2、ABLIM3、ACACA、ACADVL、ACAT2、ADAM12、ADAM15、ADAM17、ADAM33、AFF2、AGK、AGPAT3、AGPS、AHCYL2、AHDC1、AHRR、AJUBA、AK021888、AK310472、AKAP1、AKAP9、AKNA、ALCAM、ALDH4A1、AMPD2、ANK2、ANKFY1、ANKHD1-EIF4EBP3、ANKRD17、ANKS6、ANP32A、ANXA11、ANXA6、AP2B1、APAF1、APLP2、APP、APPL2、APTX、ARHGAP22、ARID1A、ARID2、ARMCX3、ASAP1、ASL、ASNS、ASPH、ATAD2B、ATF7IP、ATG9A、ATMIN、ATP2C1、ATXN3、AURKA、AXIN1、B4GALT2、BACE1、BAG2、BASP1、BC033281、BCAR3、BEND6、BICD1、BIN1、BNC1、BRD2、BRPF1、BSCL2、BTBD10、BZW1、C11orf30、C11orf73、C17orf76-AS1、C4orf27、C5orf24、C6orf48、C9orf69、CAB39、CALU、CAMKK1、CAPNS1、CASC3、CASP8AP2、CAV1、CCAR1、CCDC77、CCDC88A、CCDC92、CCT6A、CD276、CD46、CDC25B、CDC40、CDC42BPA、CDCA7、CDH11、CDH13、CDK11B、CDK16、CDKAL1、CEP68、CFLAR、CHD8、CIZ1、CLIC1、CLK4、CNOT1、COG1、COL12A1、COL1A1、COL6A1、COPS7B、CPEB2、CREB5、CRLS1、CRTAP、CSDE1、CSNK1A1、CTDSP2、CTNND1、CUL2、CUL4A、CUX1、CYB5B、CYBRD1、CYP51A1、DAB2、DACT1、DARS、DAXX、DCAF10、DCAF11、DCBLD2、DCUN1D4、DDAH1、DDAH2、DDHD2、DDR1、DDX39B、DDX42、DENND1A、DENND1B、DENND5A、DGCR2、DGKA、DHCR24、DHCR7、DHFR、DHX9、DIAPH1、DIAPH3、DIS3L、DKFZp434M1735、DKK3、DLC1、DNM2、DOCK1、DPP8、DSEL、DST、DSTN、EBF1、EEA1、EEF1A1、EFCAB14、EGR1、EHMT2、EIF2B3、EIF4G1、EIF4G2、EIF4G3、ELF2、ENG、ENPP2、ENSA、EPN1、EPT1、ERC1、ERGIC3、ETV5、EXO1、EXTL2、EYA3、FADS1、FADS2、FAF1、FAM111A、FAM198B、FAM219A、FAM219B、FAM3C、FAM65A、FBXO10、FBXO18、FBXO31、FBXO34、FBXO9、FDFT1、FDPS、FER、FEZ1、FGD5-AS1、FGFRL1、FHOD3、FLII、FLNB、FN1、FNBP1、FOCAD、FOS、FOSB、FOSL1、FOXK1、FOXM1、FUS、FYN、GABPB1、GALC、GALNT1、GAS7、GBA2、GCFC2、GGCT、GHDC、GIGYF2、GJC1、GMIP、GNA13、GNAS、GNL3L、GOLGA2、GOLGA4、GOLGB1、GORASP1、GPR1、GPR89A、GPSM2、GREM1、GRK6、GSE1、GTF2H2B、HAS2、HAT1、HAUS3、HAUS6、HDAC7、HEG1、HLA-A、HLA-E、HLTF、HMGA1、HMGB1、HMGCR、HMGCS1、HMOX1、HNRNPR、HNRNPUL1、HP1BP3、HRH1、HSD17B12、HSD17B4、HTT、IARS、IDH1、IDI1、IGF2BP2、IL6ST、INHBA、INSIG1、IQCE、ITGAV、ITGB5、ITM2C、ITSN1、KANSL3、KCNK2、KIAA1033、KIAA1143、KIAA1199、KIAA1522、KIAA1524、KIAA1549、KIAA1715、KIF14、KIF2A、KIF3A、KLC1、KLC2、KLF6、KLHL7、KRT18、KRT19、KRT34、KRTAP2-3、LAMA2、LAMB1、LARP4、LARP7、LATS2、LDLR、LEMD3、LGALS8、LIMS1、LINC00341、LINC00657、LMAN2L、LMO7、LONP1、LOX、LRCH4、LRIG1、LRP8、LRRC8A、LSS、LTBR、LUC7L2、LZTS2、MADD、MAGED4、MAGED4B、MAN1A2、MAP4K4、MBD1、MBOAT7、MDM2、MED1、MEDAG、MEF2D、MEIS2、MEMO1、MEPCE、MFGE8、MICAL2、MINPP1、MKL1、MKLN1、MKNK2、MLLT4、MLST8、MMAB、MMS19、MMS22L、MPPE1、MPZL1、MRPL3、MSANTD3、MSC、MSH2、MSH6、MSL3、MSMO1、MSRB3、MTAP、MTERFD1、MTHFD1L、MTMR9、MTRR、MUM1、MVD、MVK、MYADM、MYLK、MYO1D、MYO9B、MYOF、NAA35、NADK、NASP、NAV1、NAV2、NCOA1、NCOA3、NCOA4、NCSTN、NELFA、NEO1、NEURL1B、NF2、NFE2L1、NFX1、NID1、NID2、NIPA1、NKX3-1、NOL10、NOMO3、NPEPPS、NRD1、NREP、NRG1、NSUN4、NT5C2、NT5E、NTNG1、NUDT4、NUP153、NUP35、NUP50、NUPL1、NUSAP1、ODF2、OS9、OSBPL6、OSMR、P4HA1、P4HB、PABPC1、PAK4、PAPD4、PARD3、PARN、PARP14、PARP4、PARVB、PCBP2、PCBP4、PCDHGB3、PCGF3、PCM1、PCMTD2、PCNXL2、PCSK9、PDE4A、PDE7A、PDLIM7、PDXDC1、PEPD、PEX5、PFKP、PHF19、PHF8、PHRF1、PHTF2、PI4K2A、PIEZO1、PIGU、PIK3C2B、PITPNA、PITPNB、PITPNM1、PLAU、PLEC、PLEKHB2、PLSCR3、PLXNB2、PLXNC1、PMS1、POLE3、POLR3D、POSTN、POU2F1、PPAPDC1A、PPARA、PPHLN1、PPIP5K1、PPP1R12A、PPP6R1、PPP6R2、PRKACB、PRKDC、PRMT1、PRNP、PRSS23、PSMA4、PSMC1、PSMD6、PTK2B、PTPN14、PUF60、PUS7、PVR、PXN、QKI、RAB23、RAB2B、RAB34、RAD1、RAD23B、RALB、RAP1A、RAP1GDS1、RARG、RASSF8、RBCK1、RBFOX2、RBM10、RCC1、RFTN1、RFWD2、RGS10、RGS3、RIF1、RNF14、RNF19A、RNF38、RNFT1、RPL10、RPS6KC1、RRBP1、RWDD4、SAMD9、SAMD9L、SAR1A、SART3、SCAF4、SCAF8、SCD、SCLT1、SCO1、SDCBP、SEC14L1、SEC22A、SEC24B、SEC61A1、SEPT9、SERPINE2、SF1、SGOL2、SH3RF1、SKIL、SLC25A17、SLC39A3、SLC41A1、SLC4A4、SLC7A6、SLC7A8、SMARCA4、SMARCC2、SMC4、SMC6、SMCHD1、SMG1、SMN2、SMPD4、SMYD3、SMYD5、SNAP23、SNHG16、SNX14、SOCS2、SON、SOS2、SPATA20、SPATS2、SPG20、SPRED2、SQLE、SQRDL、SQSTM1、SRCAP、SREBF1、SREK1、SRSF3、STARD4、STAT1、STAT3、STAU1、STC2、STEAP2、STRIP1、STRN3、STX16、SUPT20H、SYNE1、SYNE2、SYT15、SYTL2、TACC1、TAF2、TANC2、TARBP1、TARS、TBC1D15、TBL2、TCF7L2、TENC1、TENM2、TEP1、TET3、TFCP2、TGFBI、TGFBR1、TGFBRAP1、THADA、THAP4、THRB、TIMP2、TJP2、TLE3、TLK1、TMEM154、TMEM47、TMEM63A、TNC、TNFAIP3、TNFRSF12A、TNIP1、TNKS1BP1、TNPO3、TNS1、TNS3、TOE1、TOMM40、TOMM5、TOPORS、TP53INP1、TRAF3、TRAK1、TRAPPC12、TRIB1、TRIM2、TRIM23、TRIM26、TRIM28、TRIM65、TRMT1L、TRPS1、TSC2、TSHZ1、TSPAN2、TTC7A、TUBB2C、TUBB3、TXNL1、TXNRD1、U2SURP、UBAP2L、UBE2G2、UBE2V1、UBQLN4、UCHL5、UHMK1、UHRF1BP1L、UNC5B、USP19、USP7、VANGL1、VARS2、VCL、VIPAS39、VPS13A、VPS29、VPS51、VWA8、WDR19、WDR37、WDR48、WIPF1、WNT5B、WSB1、WWTR1、XIAP、XRN2、YAP1、YES1、YPEL5、YTHDF3、Z24749、ZAK、ZBTB10、ZBTB24、ZBTB7A、ZC3H12C、ZC3H14、ZC3H18、ZCCHC11、ZEB1、ZEB2、ZFAND1、ZFAND5、ZHX3、ZMIZ1、ZMYM2、ZNF12、ZNF148、ZNF219、ZNF227、ZNF24、ZNF268、ZNF28、ZNF281、ZNF335、ZNF37A、ZNF37BP、ZNF395、ZNF583、ZNF621、ZNF652、ZNF655、ZNF674、ZNF74、ZNF764、ZNF778、ZNF780A、ZNF827、ZNF839和ZNF91。
在前述的另一个具体方面,所述基因选自ABCB8、ANKRD36、APLP2、ARHGAP12、ARMCX6、ASAP1、ATG5、AXIN1、BIRC6、C1orf86、CDC42BPA、CLTA、DYRK1A、ERGIC3、FBXL6、FOXM1、GGCT、KAT6B、KDM6A、KIF3A、KMT2D、LARP7、LYRM1、MADD、MAN2C1、MRPL55、MYCBP2、MYO9B、PNISR、RAP1A、RAPGEF1、SENP6、SH3YL1、SLC25A17、SMN2、SREK1、STRN3、TAF2、TMEM134、VPS29、ZFAND1和ZNF431.
在前述的另一个具体方面,所述基因选自ABCB8、ANKRD36、ARHGAP12、ARMCX6、ATG5、BIRC6、C1orf86、CLTA、DYRK1A、FBXL6、KAT6B、KDM6A、KMT2D、LYRM1、MAN2C1、MRPL55、MYCBP2、PNISR、RAPGEF1、SENP6、SH3YL1、TMEM134和ZNF431。
在前述的另一个具体方面,所述基因选自ABCA10、ABCC1、ACTA2、ADAL、ADAM12、ADAMTS1、ADAMTS5、ADD1、ADGRG6、ADH6、ADHFE1、AFF2、AFF3、AGK、AGPS、AKAP3、ANK1、ANK2、ANK3、ANKRD33B、ANXA11、ANXA6、AP4B1-AS1、ARHGEF16、ARID5B、ARL9、ARMCX3、ASAP1、ASIC1、ATP2A3、B3GALT2、B3GNT6、BCL2L15、BCYRN1、BIN3-IT1、BIRC3、BTG2、C10orf54、C11orf70、C11orf73、C11orf94、C12orf56、C19orf47、C3、C4orf27、C7orf31、C8orf34、CA13、CA3、CACNA2D2、CACNB1、CADM1、CAND2、CCDC79、CCER2、CCNF、CDCA7、CDKAL1、CELSR1、CEMIP、CEP170、CFH、CIITA、CLDN23、CMAHP、CNGA4、CNTD1、COL11A1、COL12A1、COL14A1、COL15A1、COL5A1、COL5A3、COL6A6、COL8A1、COLEC12、COMP、CPA4、CPQ、CRISPLD2、CRLF1、CRYL1、CUX1、CYB5B、CYB5R2、CYGB、CYP1B1、DCLK1、DCN、DDIT4L、DDX42、DDX50、DEGS1、DENND1A、DENND5A、DEPTOR、DFNB59、DGKA、DHFR、DIAPH3、DIRAS3、DIS3L、DLG5、DNAH8、DNAJC27、DOCK1、DOCK11、DYNC1I1、DZIP1L、EBF1、EFEMP1、EGR3、EIF2B3、ELN、ELP4、EMX2OS、ENPP1、ERCC8、ESM1、EVC2、F2R、FAM160A1、FAM198B、FAM20A、FAM46B、FAM65B、FAP、FARP1、FBLN2、FBN2、FBXO9、FCHO1、FER、FGFR2、FGL2、FLT1、FRAS1、FSCN2、GAL3ST4、GALC、GALNT15、GATA6、GBGT1、GCNT1、GDF6、GNAQ、GOLGB1、GPR183、GPR50、GPRC5A、GPRC5B、GRTP1、GUCA1B、GXYLT1、HAPLN1、HAPLN2、HAS3、HAVCR2、HDAC5、HECTD2-AS1、HEPH、HEY1、HLTF、HMGN3-AS1、HMOX1、HOOK3、HSD17B12、HSPA1L、HTATIP2、HTT、IGDCC4、IGF2R、IGFBP3、IL16、INA、INTU、IQCG、ITGA11、ITGA8、ITGB8、ITIH1、ITPKA、KCNS1、KCNS2、KDM6A、KDSR、KIAA1456、KIAA1462、KIAA1524、KIAA1715、KIAA1755、KIT、KLF17、KLRG1、KRT7、KRTAP1-1、KRTAP1-5、L3MBTL2、LAMB2P1、LGI2、LGR4、LHX9、LINC00472、LINC00570、LINC00578、LINC00607、LINC00678、LINC00702、LINC00886、LINC00961、LINC01011、LINC01118、LINC01204、LMOD1、LRBA、LRP4、LRRC32、LRRC39、LSAMP、LUM、LYPD1、LYRM1、MAFB、MAMDC2、MAN1A2、MAN2A1、MAPK13、MASP1、MB、MC4R、MEDAG、MEGF6、MEMO1、MIAT、MIR612、MLLT10、MMP10、MMP24、MMS19、MN1、MOXD1、MRVI1、MSH4、MTERF3、MXRA5、MYO1D、NA、NAALADL2、NAE1、NAGS、NDNF、NEURL1B、NGFR、NHLH1、NLN、NOTCH3、NOTUM、NOVA2、NOX4、NRROS、NTNG1、OCLN、OLR1、OSBPL10、OXCT2、PAIP2B、PAPD4、PBLD、PCM1、PDE1C、PDE5A、PDGFD、PDGFRB、PDS5B、PDXDC1、PEAR1、PEPD、PHACTR3、PI4K2B、PIK3R1、PIM2、PITPNB、PITPNM3、PLAU、PLEK2、PLEKHA6、PLEKHH2、PLXNC1、PMS1、PODN、POLN、POLR1A、POSTN、PPM1E、PPP3CA、PRKCA、PRKDC、PRKG1、PRPH2、PRRG4、PRUNE2、PSMD6-AS2、PTGIS、PTX3、RAB30、RAB38、RAB44、RAD9B、RARS、RBBP8、RBKS、RCC1、RDX、RFWD2、RFX3-AS1、RGCC、RNFT1、ROR1、ROR2、RWDD4、SCARNA9、SCO1、SEC22A、SHROOM3、SIGLEC10、SLC24A3、SLC35F3、SLC39A10、SLC46A2、SLC4A11、SLC6A15、SLC7A11、SLC9A3、SLIT3、SMG1P3、SMTN、SMYD3、SNED1、SORBS2、SORCS2、SOX7、SPDYA、SPEF2、SQRDL、STAC2、STAT1、STAT4、STEAP2、STK32B、STRN4、STS、STXBP6、SULF1、SVEP1、SYNGR2、SYNPO、SYNPO2、SYNPO2L、TAGLN3、TANGO6、TARBP1、TEX21P、TGFA、TGFB2、TGFB3、TGM2、THADA、THBS2、THRB、TMEM102、TMEM119、TMEM256-PLSCR3、TMEM50B、TNC、TNFAIP8L3、TNFRSF14、TNRC18P1、TNS3、TNXB、TP53AIP1、TPRG1、TRAF3、TRIM66、TRPC4、TSHZ2、TSPAN11、TSPAN18、TSPAN7、TSSK3、TXNIP、UNC5B、USP27X、UVRAG、VIM-AS1、VPS41、VSTM2L、VWA8、VWF、WDR91、WISP1、WNT10B、XRN2、YDJC、ZBTB26、ZCCHC5、ZFP82、ZMIZ1-AS1、ZNF212、ZNF350、ZNF660、ZNF79和ZNF837。
在前述的另一个具体方面,所述基因选自ABCA10、ACTA2、ADAL、ADAMTS1、ADAMTS5、ADD1、ADGRG6、ADH6、ADHFE1、AFF3、AKAP3、ANK1、ANK3、ANKRD33B、AP4B1-AS1、ARHGEF16、ARID5B、ARL9、ASIC1、ATP2A3、B3GALT2、B3GNT6、BCL2L15、BCYRN1、BIN3-IT1、BIRC3、BTG2、C10orf54、C11orf70、C11orf94、C12orf56、C19orf47、C3、C7orf31、C8orf34、CA13、CA3、CACNA2D2、CACNB1、CADM1、CAND2、CCDC79、CCER2、CCNF、CELSR1、CEMIP、CEP170、CFH、CIITA、CLDN23、CMAHP、CNGA4、CNTD1、COL11A1、COL14A1、COL15A1、COL5A1、COL5A3、COL6A6、COL8A1、COLEC12、COMP、CPA4、CPQ、CRISPLD2、CRLF1、CRYL1、CYB5R2、CYGB、CYP1B1、DCLK1、DCN、DDIT4L、DDX50、DEGS1、DEPTOR、DFNB59、DIRAS3、DLG5、DNAH8、DNAJC27、DOCK11、DYNC1I1、DZIP1L、EFEMP1、EGR3、ELN、ELP4、EMX2OS、ENPP1、ERCC8、ESM1、EVC2、F2R、FAM160A1、FAM20A、FAM46B、FAM65B、FAP、FARP1、FBLN2、FBN2、FBXO9、FCHO1、FGFR2、FGL2、FLT1、FRAS1、FSCN2、GAL3ST4、GALNT15、GATA6、GBGT1、GCNT1、GDF6、GNAQ、GPR183、GPR50、GPRC5A、GPRC5B、GRTP1、GUCA1B、GXYLT1、HAPLN1、HAPLN2、HAS3、HAVCR2、HDAC5、HECTD2-AS1、HEPH、HEY1、HMGN3-AS1、HOOK3、HSPA1L、HTATIP2、IGDCC4、IGF2R、IGFBP3、IL16、INA、INTU、IQCG、ITGA11、ITGA8、ITGB8、ITIH1、ITPKA、KCNS1、KCNS2、KDM6A、KDSR、KIAA1456、KIAA1462、KIAA1755、KIT、KLF17、KLRG1、KRT7、KRTAP1-1、KRTAP1-5、L3MBTL2、LAMB2P1、LGI2、LGR4、LHX9、LINC00472、LINC00570、LINC00578、LINC00607、LINC00678、LINC00702、LINC00886、LINC00961、LINC01011、LINC01118、LINC01204、LMOD1、LRBA、LRP4、LRRC32、LRRC39、LSAMP、LUM、LYPD1、MAFB、MAMDC2、MAN2A1、MAPK13、MASP1、MB、MC4R、MEGF6、MIAT、MIR612、MLLT10、MMP10、MMP24、MN1、MOXD1、MRVI1、MSH4、MTERF3、MXRA5、NA、NAALADL2、NAE1、NAGS、NDNF、NGFR、NHLH1、NLN、NOTCH3、NOTUM、NOVA2、NOX4、NRROS、OCLN、OLR1、OSBPL10、OXCT2、PAIP2B、PBLD、PDE1C、PDE5A、PDGFD、PDGFRB、PDS5B、PEAR1、PHACTR3、PI4K2B、PIK3R1、PIM2、PITPNM3、PLEK2、PLEKHA6、PLEKHH2、PODN、POLN、POLR1A、PPM1E、PPP3CA、PRKCA、PRKG1、PRPH2、PRRG4、PRUNE2、PSMD6-AS2、PTGIS、PTX3、RAB30、RAB38、RAB44、RAD9B、RARS、RBBP8、RBKS、RDX、RFX3-AS1、RGCC、ROR1、ROR2、SCARNA9、SHROOM3、SIGLEC10、SLC24A3、SLC35F3、SLC39A10、SLC46A2、SLC4A11、SLC6A15、SLC7A11、SLC9A3、SLIT3、SMG1P3、SMTN、SNED1、SORBS2、SORCS2、SOX7、SPDYA、SPEF2、STAC2、STAT4、STK32B、STRN4、STS、STXBP6、SULF1、SVEP1、SYNGR2、SYNPO、SYNPO2、SYNPO2L、TAGLN3、TANGO6、TEX21P、TGFA、TGFB2、TGFB3、TGM2、THBS2、TMEM102、TMEM119、TMEM256-PLSCR3、TMEM50B、TNFAIP8L3、TNFRSF14、TNRC18P1、TNXB、TP53AIP1、TPRG1、TRIM66、TRPC4、TSHZ2、TSPAN11、TSPAN18、TSPAN7、TSSK3、TXNIP、USP27X、UVRAG、VIM-AS1、VPS41、VSTM2L、VWF、WDR91、WISP1、WNT10B、YDJC、ZBTB26、ZCCHC5、ZFP82、ZMIZ1-AS1、ZNF212、ZNF350、ZNF660、ZNF79和ZNF837。
在前述的另一个具体方面,所述基因选自ABCB8、ABCC3、ADAM17、ADCY3、AGPAT4、ANKRA2、ANXA11、APIP、APLP2、ARHGAP1、ARL15、ASAP1、ASPH、ATAD2B、ATXN1、AXIN1、BECN1、BHMT2、BICD1、BTN3A1、C11orf30、C11orf73、C12orf4、C14orf132、C8orf44、C8orf44-SGK3、C8orf88、CASC3、CASP7、CCDC122、CDH13、CECR7、CENPI、CEP112、CEP192、CHEK1、CMAHP、CNRIP1、COPS7B、CPSF4、CRISPLD2、CRYBG3、CSNK1E、CSNK1G1、DAGLB、DCAF17、DCUN1D4、DDX42、DENND1A、DENND5A、DGKA、DHFR、DIAPH3、DLGAP4、DNAJC13、DNMBP、DOCK1、DYRK1A、EIF2B3、ENAH、ENOX1、EP300、ERC1、ERCC1、ERGIC3、ERLIN2、ERRFI1、EVC、FAF1、FAIM、FAM126A、FAM13A、FAM162A、FAM174A、FAM198B、FBN2、FER、FHOD3、FOCAD、GALC、GCFC2、GGACT、GGCT、GLCE、GOLGA4、GOLGB1、GPSM2、GULP1、GXYLT1、HAT1、HDX、HLTF、HMGA2、HNMT、HPS1、HSD17B12、HSD17B4、HTT、IFT57、INPP5K、IVD、KDM6A、KIAA1524、KIAA1715、LETM2、LOC400927、LRRC42、LUC7L3、LYRM1、MADD、MB21D2、MCM10、MED13L、MEDAG、MEMO1、MFN2、MMS19、MRPL45、MRPS28、MTERF3、MYCBP2、MYLK、MYOF、NGF、NREP、NSUN4、NT5C2、OSMR、OXCT1、PAPD4、PCM1、PDE7A、PDS5B、PDXDC1、PIGN、PIK3CD、PIK3R1、PIKFYVE、PITPNB、PLEKHA1、PLSCR1、PMS1、POMT2、PPARG、PPHLN1、PPIP5K2、PPP1R26、PRPF31、PRSS23、PRUNE2、PSMA4、PXK、RAF1、RAP1A、RAPGEF1、RARS2、RBKS、RERE、RFWD2、RNFT1、RPA1、RPS10、RPS6KB2、SAMD4A、SAR1A、SCO1、SEC24A、SENP6、SERGEF、SGK3、SH3YL1、SKA2、SLC12A2、SLC25A17、SLC44A2、SMYD3、SNAP23、SNHG16、SNX7、SOS2、SPATA18、SPATA5、SPIDR、SPRYD7、SRGAP1、SRRM1、STAT1、STRN3、STXBP6、SUPT20H、TAF2、TASP1、TBC1D15、TCF12、TCF4、TIAM1、TJP2、TMC3、TMEM189-UBE2V1、TMEM214、TNRC6A、TNS3、TOE1、TRAF3、TRIM65、TSPAN2、TTC7B、TUBE1、TYW5、UBAP2L、UBE2V1、URGCP、VAV2、VPS29、WDR27、WDR37、WDR91、WNK1、XRN2、ZCCHC8、ZFP82、ZNF138、ZNF232、ZNF37BP和ZNF680。
在前述的另一个具体方面,所述基因选自ABCB8、ABCC3、ADCY3、AGPAT4、ANKRA2、APIP、ARHGAP1、ARL15、ATXN1、BECN1、BHMT2、BTN3A1、C12orf4、C14orf132、C8orf44、C8orf44-SGK3、C8orf88、CASP7、CCDC122、CECR7、CENPI、CEP112、CEP192、CHEK1、CMAHP、CNRIP1、CPSF4、CRISPLD2、CRYBG3、CSNK1E、CSNK1G1、DAGLB、DCAF17、DLGAP4、DNAJC13、DNMBP、DYRK1A、ENAH、EP300、ERCC1、ERLIN2、ERRFI1、EVC、FAIM、FAM126A、FAM13A、FAM162A、FAM174A、FBN2、GGACT、GLCE、GULP1、GXYLT1、HDX、HMGA2、HNMT、HPS1、IFT57、INPP5K、IVD、KDM6A、LETM2、LOC400927、LRRC42、LYRM1、MB21D2、MCM10、MED13L、MFN2、MRPL45、MRPS28、MTERF3、MYCBP2、NGF、OXCT1、PDS5B、PIGN、PIK3CD、PIK3R1、PIKFYVE、PLEKHA1、PLSCR1、POMT2、PPARG、PPIP5K2、PPP1R26、PRPF31、PRUNE2、PXK、RAF1、RAPGEF1、RARS2、RBKS、RERE、RPA1、RPS10、RPS6KB2、SAMD4A、SEC24A、SENP6、SERGEF、SGK3、SH3YL1、SKA2、SLC12A2、SLC44A2、SNX7、SPATA18、SPATA5、SPIDR、SPRYD7、SRGAP1、SRRM1、STXBP6、TASP1、TCF12、TCF4、TIAM1、TMC3、TMEM189-UBE2V1、TMEM214、TNRC6A、TTC7B、TUBE1、TYW5、URGCP、VAV2、WDR27、WDR91、WNK1、ZCCHC8、ZFP82、ZNF138、ZNF232和ZNF680。
在前述的另一个具体方面,所述基因选自ABHD10、ADAL、ADAM17、ADAM23、ADAMTS19、AGPAT4、AGPS、AKAP8L、AKT1、ANKRD13C、ANXA11、APIP、APPL2、ARHGAP1、ARHGAP5、ARL15、ARL5B、ARSJ、ASAP1、ATF6、BECN1、BHMT2、BIN3、BNC2、BTBD10、C1QTNF9B-AS1、C1orf27、C11orf30、C11orf73、C11orf76、C12orf4、C2orf47、CACNB1、CACNB4、CADM2、CCNL2、CDH18、CENPI、CEP162、CEP170、CEP192、CEP57、CHEK1、CHRM2、CMAHP、CMSS1、CNOT7、CNRIP1、CNTN1、COPS7B、CRISPLD2、CRYBG3、CUX1、DAAM1、DCAF17、DCUN1D4、DDX42、DENND1A、DENND4A、DENND5A、DET1、DGK1、DHFR、DIAPH3、DLG5、DMXL1、DNAJA4、DNMBP、DYRK1A、DZIP1L、ELMO2、ENAH、ENOX1、EP300、ERC1、ERC2、EVC、EXOC3、EXOC6B、FAM162A、FAM174A、FAM195B、FAM208B、FAM49B、FAM69B、FBN2、FBXL16、FBXO9、FGD4、FHOD3、GALC、GBP1、GLCE、GNG12、GOLGB1、GTSF1、GXYLT1、HDAC5、HDX、HMGXB4、HOXB3、HSD17B4、HTT、IFT57、IKBKAP、INO80、IPP4B、INVS、ITCH、IVD、KDM6A、KDSR、KIAA1524、KIAA1715、KIDINS220、KIF21A、L3MBTL2、LGALS3、LINCR-0002、LINGO2、LOC400927、LPHN1、LRRC1、LRRC42、LYRM1、MACROD2、MANEA、MAPK10、MARCH7、MARCH8、MDN1、MEAF6、MEMO1、MFN2、MLLT10、MMS19、MORF4L1、MRPL39、MRPL45、MRPS28、MTMR3、MYB、MYCBP2、MYLK、NEDD4、NFASC、NGF、NIPA1、NLGN1、NLN、NREP、NSUN4、NUPL1、OSBPL3、PAPD4、PBX3、PCDH10、PDE3A、PDE7A、PDXDC1、PDXDC2P、PELI1、PIGN、PITPNB、PMS1、PNISR、POMT2、PPARG、PPFIBP1、PRPF31、PSMA4、PXK、RAB23、RAF1、RAPGEF1、RASIP1、RBBP8、RCOR3、RERE、RGL1、RNF130、RNF144A、RNF213、RPF2、RPS10、SAMD4A、SCO1、SENP6、SF3B3、SGIP1、SGMS1、SGPL1、SH2B3、SKP1、SLC12A2、SLC25A16、SLC25A17、SMOX、SNAP23、SNX24、SNX7、SOCS6、SOGA2、SORCS1、SPIDR、SPRYD7、SREK1、SSBP1、STRAD8、STXBP4、STXBP6、SUPT20H、TAF2、TARBP1、TASP1、TBCA、TBL1XR1、TCF4、TEKT4P2、TET1、TIAM1、TJAP1、TJP2、TMEM214、TMX3、TNRC6A、TRAF3、TRIM65、TSPAN7、TXNL4B、UBE2D3、UBE2L3、UBN2、UNC13B、URGCP-MRPS24、UVRAG、VDAC2、WDR27、WDR90、WHSC2、WNK1、XRN2、ZFP82、ZMIZ2、ZNF138、ZNF208、ZNF212、ZNF280D、ZNF350、ZNF37BP、ZNF426、ZNF618、ZNF680、ZNF730、ZNF777、ZNF7804A、ZNF836和ZSCAN25。
在前述的另一个具体方面,所述基因选自APOA2、ASAP1、BRCA1、BRCA2、CDKN1C、CRX、CTRC、DENND5A、DIAPH3、DMD、DNAH11、EIF2B3、GALC、HPS1、HTT、IKBKAP、KIAA1524、LMNA、MECP2、PAPD4、PAX6、PCCB、PITPNB、PTCH1、SLC34A3、SMN2、SPINK5、SREK1、TMEM67、VWF、XDH和XRN2。
在前述的另一个具体方面,所述基因选自ABCA1、ABCA10、ABCB7、ABCB8、ABCC1、ABCC3、ABL2、ABLIM3、ACACA、ACADVL、ACAT2、ACTA2、ADAL、ADAM15、ADAM17、ADAM23、ADAM33、ADAMTS1、ADAMTS19、ADCY3、ADD1、ADGRG6、ADH6、ADHFE1、AFF2、AFF3、AGK、AGPAT3、AGPAT4、AGPS、AHCYL2、AHDC1、AHRR、AJUBA、AK021888、AK310472、AKAP1、AKAP3、AKAP8L、AKAP9、AKNA、ALCAM、ALDH4A1、AMPD2、ANK1、ANK2、ANK3、ANKFY1、ANKHD1-EIF4EBP3、ANKRA2、ANKRD13C、ANKRD17、ANKRD33B、ANKRD36、ANKS6、ANP32A、ANXA6、AP2B1、AP4B1-AS1、APAF1、APIP、APOA2、APP、APTX、ARHGAP1、ARHGAP12、ARHGAP22、ARHGAP5、ARHGEF16、ARID1A、ARID2、ARID5B、ARL9、ARL15、ARL5B、ARMCX3、ARSJ、ASAP1、ASIC1、ASL、ASNS、ASPH、ATAD2B、ATF6、ATF7IP、ATG9A、ATMIN、ATP2A3、ATP2C1、ATXN1、ATXN3、AURKA、B3GALT2、B3GNT6、B4GALT2、BACE1、BAG2、BASP1、BC033281、BCAR3、BCL2L15、BCYRN1、BECN1、BEND6、BHMT2、BICD1、BIN1、BIN3、BIN3-IT1、BIRC3、BIRC6、BNC1、BNC2、BRCA1、BRCA2、BRD2、BRPF1、BSCL2、BTBD10、BTG2、BTN3A1、BZW1、C1QTNF9B-AS1、C1orf27、C1orf86、C10orf54、C11orf30、C11orf70、C11orf73、C11orf76、C11orf94、C12orf4、C12orf56、C14orf132、C17orf76-AS1、C19orf47、C2orf47、C3、C4orf27、C5orf24、C6orf48、C7orf31、C8orf34、C8orf44、C8orf44-SGK3、C8orf88、C9orf69、CA13、CA3、CAB39、CACNA2D2、CACNB1、CACNB4、CADM1、CADM2、CALU、CAMKK1、CAND2、CAPNS1、CASC3、CASP7、CASP8AP2、CAV1、CCAR1、CCDC77、CCDC79、CCDC88A、CCDC92、CCDC122、CCER2、CCNF、CCNL2、CCT6A、CD276、CD46、CDC25B、CDC40、CDC42BPA、CDCA7、CDH11、CDH13、CDH18、CDK11B、CDK16、CDKAL1、CDKN1C、CECR7、CELSR1、CEMIP、CENPI、CEP112、CEP162、CEP170、CEP192、CEP68、CFH、CFLAR、CHD8、CHEK1、CHRM2、CIITA、CIZ1、CLDN23、CLIC1、CLK4、CLTA、CMAHP、CNGA4、CNOT1、CNRIP1、CNTD1、CMSS1、CNOT7、CNRIP1、CNTN1、COG1、COL1A1、COL11A1、COL12A1、COL14A1、COL15A1、COL5A1、COL5A3、COL6A1、COL6A6、COL8A1、COLEC12、COMP、COPS7B、CPA4、CPEB2、CPQ、CPSF4、CREB5、CRISPLD2、CRLF1、CRLS1、CRTAP、CRX、CRYBG3、CRYL1、CSDE1、CSNK1A1、CSNK1E、CSNK1G1、CTDSP2、CTNND1、CTRC、CUL2、CUL4A、CUX1、CYB5B、CYB5R2、CYBRD1、CYGB、CYP1B1、CYP51A1、DAAM1、DAB2、DACT1、DAGLB、DARS、DAXX、DCAF10、DCAF11、DCAF17、DCBLD2、DCLK1、DCN、DCUN1D4、DDAH1、DDAH2、DDHD2、DDIT4L、DDR1、DDX39B、DDX42、DDX50、DEGS1、DENND1A、DENND1B、DENND4A、DENND5A、DEPTOR、DET1、DFNB59、DGCR2、DGK1、DGKA、DHCR24、DHCR7、DHFR、DHX9、DIAPH1、DIAPH3、DIRAS3、DIS3L、DKFZp434M1735、DKK3、DLC1、DLG5、DMD、DMXL1、DNAH8、DNAH11、DNAJA4、DNAJC13、DNAJC27、DNM2、DNMBP、DOCK1、DOCK11、DPP8、DSEL、DST、DSTN、DYNC1I1、DYRK1A、DZIP1L、EBF1、EEA1、EEF1A1、EFCAB14、EFEMP1、EGR1、EGR3、EHMT2、EIF2B3、EIF4G1、EIF4G2、EIF4G3、ELF2、ELMO2、ELN、ELP4、EMX2OS、ENAH、ENG、ENOX1、ENPP1、ENPP2、ENSA、EP300、EPT1、ERC1、ERC2、ERCC1、ERCC8、ERLIN2、ERRFI1、ESM1、ETV5、EVC、EVC2、EXO1、EXOC3、EXOC6B、EXTL2、EYA3、F2R、FADS1、FADS2、FAF1、FAIM、FAM111A、FAM126A、FAM13A、FAM160A1、FAM162A、FAM174A、FAM195B、FAM198B、FAM20A、FAM208B、FAM219A、FAM219B、FAM3C、FAM46B、FAM49B、FAM65A、FAM65B、FAM69B、FAP、FARP1、FBLN2、FBN2、FBXL16、FBXL6、FBXO9、FBXO10、FBXO18、FBXO31、FBXO34、FBXO9、FCHO1、FDFT1、FDPS、FER、FEZ1、FGD4、FGD5-AS1、FGFR2、FGFRL1、FGL2、FHOD3、FLII、FLNB、FLT1、FN1、FNBP1、FOCAD、FOS、FOSB、FOSL1、FOXK1、FRAS1、FSCN2、FUS、FYN、GABPB1、GAL3ST4、GALC、GALNT1、GALNT15、GAS7、GATA6、GBA2、GBGT1、GBP1、GCFC2、GLCE、GCNT1、GDF6、GGACT、GHDC、GIGYF2、GJC1、GLCE、GMIP、GNA13、GNAQ、GNAS、GNG12、GNL3L、GOLGA2、GOLGA4、GOLGB1、GORASP1、GPR1、GPR183、GPR50、GPR89A、GPRC5A、GPRC5B、GPSM2、GREM1、GRK6、GRTP1、GSE1、GTF2H2B、GTSF1、GUCA1B、GULP1、GXYLT1、HAPLN1、HAPLN2、HAS2、HAS3、HAT1、HAUS3、HAUS6、HAVCR2、HDAC5、HDAC7、HDX、HECTD2-AS1、HEG1、HEPH、HEY1、HLA-A、HLA-E、HLTF、HMGA1、HMGA2、HMGB1、HMGCR、HMGN3-AS1、HMGCS1、HMGXB4、HOOK3、HOXB3、HMOX1、HNMT、HNRNPR、HNRNPUL1、HP1BP3、HPS1、HRH1、HSD17B12、HSPA1L、HTATIP2、HTT、IARS、IDH1、IDI1、IFT57、IGDCC4、IGF2BP2、IGF2R、IGFBP3、IKBKAP、IL16、IL6ST、INA、INHBA、INO80、IPP4B、INPP5K、INSIG1、INTU、INVS、IQCE、IQCG、ITCH、ITGA11、ITGA8、ITGAV、ITGB5、ITGB8、ITIH1、ITM2C、ITPKA、ITSN1、IVD、KANSL3、KAT6B、KCNK2、KCNS1、KCNS2、KDM6A、KDSR、KIAA1033、KIAA1143、KIAA1199、KIAA1456、KIAA1462、KIAA1522、KIAA1524、KIAA1549、KIAA1715、KIAA1755、KIDINS220、KIF14、KIF2A、KIF21A、KIF3A、KIT、KLC1、KLC2、KLF17、KLF6、KLHL7、KLRG1、KMT2D、KRT7、KRT18、KRT19、KRT34、KRTAP1-1、KRTAP1-5、KRTAP2-3、L3MBTL2、LAMA2、LAMB1、LAMB2P1、LARP4、LATS2、LDLR、LEMD3、LETM2、LGALS3、LGALS8、LGI2、LGR4、LHX9、LIMS1、LINC00341、LINC00472、LINC00570、LINC00578、LINC00607、LINC00657、LINC00678、LINC00702、LINC00886、LINC00961、LINC01011、LINC01118、LINC01204、LINCR-0002、LINGO2、LMAN2L、LMNA、LMO7、LMOD1、LOC400927、LONP1、LOX、LPHN1、LRBA、LRCH4、LRIG1、LRP4、LRP8、LRRC1、LRRC32、LRRC39、LRRC8A、LSAMP、LSS、LTBR、LUC7L2、LUM、LYPD1、LYRM1、LZTS2、MACROD2、MAFB、MAGED4、MAGED4B、MAMDC2、MAN1A2、MAN2A1、MAN2C1、MANEA、MAP4K4、MAPK10、MAPK13、MARCH7、MARCH8、MASP1、MB、MB21D2、MBD1、MBOAT7、MC4R、MCM10、MDM2、MDN1、MEAF6、MECP2、MED1、MED13L、MEDAG、MEF2D、MEGF6、MEIS2、MEMO1、MEPCE、MFGE8、MFN2、MIAT、MICAL2、MINPP1、MIR612、MKL1、MKLN1、MKNK2、MLLT4、MLLT10、MLST8、MMAB、MMP10、MMP24、MMS19、MMS22L、MN1、MORF4L1、MOXD1、MPPE1、MPZL1、MRPL3、MRPL45、MRPL55、MRPS28、MRVI1、MSANTD3、MSC、MSH2、MSH4、MSH6、MSL3、MSMO1、MSRB3、MTAP、MTERF3、MTERFD1、MTHFD1L、MTMR3、MTMR9、MTRR、MUM1、MVD、MVK、MXRA5、MYADM、MYB、MYCBP2、MYLK、MYO1D、MYO9B、MYOF、NA、NAA35、NAALADL2、NADK、NAE1、NAGS、NASP、NAV1、NAV2、NCOA1、NCOA3、NCOA4、NCSTN、NDNF、NEDD4、NELFA、NEO1、NEURL1B、NF2、NFASC、NFE2L1、NFX1、NGF、NGFR、NHLH1、NID1、NID2、NIPA1、NKX3-1、NLGN1、NLN、NOL10、NOMO3、NOTCH3、NOTUM、NOVA2、NOX4、NPEPPS、NRD1、NREP、NRG1、NRROS、NSUN4、NT5C2、NT5E、NTNG1、NUDT4、NUP153、NUP35、NUP50、NUPL1、NUSAP1、OCLN、ODF2、OLR1、OS9、OSBPL3、OSBPL6、OSBPL10、OSMR、OXCT1、OXCT2、P4HA1、P4HB、PABPC1、PAIP2B、PAK4、PAPD4、PARD3、PARN、PARP14、PARP4、PARVB、PAX6、PBLD、PBX3、PCBP2、PCCB、PCDH10、PCDHGB3、PCGF3、PCM1、PCMTD2、PCNXL2、PCSK9、PDE1C、PDE3A、PDE4A、PDE5A、PDE7A、PDGFD、PDGFRB、PDLIM7、PDS5B、PDXDC1、PDXDC2P、PEAR1、PELI1、PEPD、PEX5、PFKP、PHACTR3、PHF19、PHF8、PHRF1、PHTF2、PI4K2A、PIEZO1、PIGN、PIGU、PIK3C2B、PIK3CD、PIK3R1、PIKFYVE、PIM2、PITPNA、PITPNB、PITPNM1、PITPNM3、PLAU、PLEC、PLEK2、PLEKHA1、PLEKHA6、PLEKHB2、PLEKHH2、PLSCR1、PLSCR3、PLXNB2、PLXNC1、PMS1、PNISR、PODN、POLE3、POLN、POLR1A、POLR3D、POMT2、POSTN、POU2F1、PPAPDC1A、PPARA、PPARG、PPFIBP1、PPIP5K1、PPIP5K2、PPM1E、PPP1R12A、PPP1R26、PPP3CA、PPP6R1、PPP6R2、PRKCA、PRKDC、PRKG1、PRMT1、PRNP、PRPF31、PRPH2、PRRG4、PRSS23、PRUNE2、PSMA4、PSMC1、PSMD6、PSMD6-AS2、PTCH1、PTGIS、PTK2B、PTPN14、PTX3、PUF60、PUS7、PVR、PXK、PXN、QKI、RAB2B、RAB30、RAB34、RAB38、RAB44、RAD1、RAD9B、RAD23B、RAF1、RALB、RAP1GDS1、RAPGEF1、RARG、RARS、RARS2、RASIP1、RASSF8、RBBP8、RBCK1、RCOR3、RBFOX2、RBKS、RBM10、RDX、RERE、RFTN1、RFWD2、RFX3-AS1、RGCC、RGL1、RGS10、RGS3、RIF1、RNF14、RNF19A、RNF130、RNF144A、RNF213、RNF38、RNFT1、ROR1、ROR2、RPA1、RPF2、RPL10、RPS10、RPS6KB2、RPS6KC1、RRBP1、RWDD4、SAMD4A、SAMD9、SAMD9L、SAR1A、SART3、SCAF4、SCAF8、SCARNA9、SCD、SCLT1、SCO1、SDCBP、SEC14L1、SEC22A、SEC24A、SEC24B、SEC61A1、SENP6、SEPT9、SERGEF、SERPINE2、SF1、SF3B3、SGIP1、SGK3、SGMS1、SGOL2、SGPL1、SH2B3、SH3RF1、SH3YL1、SHROOM3、SIGLEC10、SKA2、SKIL、SKP1、SLC12A2、SLC24A3、SLC25A16、SLC25A17、SLC34A3、SLC35F3、SLC39A3、SLC39A10、SLC4A4、SLC4A11、SLC41A1、SLC44A2、SLC46A2、SLC6A15、SLC7A6、SLC7A8、SLC7A11、SLC9A3、SLIT3、SMARCA4、SMARCC2、SMC4、SMC6、SMCHD1、SMG1、SMG1P3、SMOX、SMPD4、SMTN、SMYD3、SMYD5、SNAP23、SNED1、SNHG16、SNX7、SNX14、SNX24、SNX7、SOCS2、SOCS6、SOGA2、SON、SORBS2、SORCS1、SORCS2、SOS2、SOX7、SPATA18、SPATA20、SPATA5、SPATS2、SPDYA、SPEF2、SPG20、SPIDR、SPINK5、SPRED2、SPRYD7、SQLE、SQRDL、SQSTM1、SRCAP、SREBF1、SRGAP1、SRRM1、SRSF3、SSBP1、STAC2、STARD4、STAT1、STAT3、STAT4、STAU1、STC2、STEAP2、STK32B、STRAD8、STRIP1、STRN4、STS、STX16、STXBP4、STXBP6、SULF1、SUPT20H、SVEP1、SYNE1、SYNE2、SYNGR2、SYNPO、SYNPO2、SYNPO2L、SYT15、SYTL2、TACC1、TAF2、TAGLN3、TANC2、TANGO6、TARBP1、TARS、TASP1、TBC1D15、TBCA、TBL1XR1、TBL2、TCF12、TCF4、TCF7L2、TEKT4P2、TENC1、TENM2、TEP1、TET1、TET3、TEX21P、TFCP2、TGFA、TGFB2、TGFB3、TGFBI、TGFBR1、TGFBRAP1、TGM2、THADA、THAP4、THBS2、THRB、TIAM1、TIMP2、TJAP1、TJP2、TLE3、TLK1、TMC3、TMEM67、TMEM102、TMEM119、TMEM134、TMEM154、TMEM189-UBE2V1、TMEM214、TMEM256-PLSCR3、TMEM47、TMEM50B、TMEM63A、TMX3、TNC、TNFAIP3、TNFAIP8L3、TNFRSF12A、TNFRSF14、TNIP1、TNKS1BP1、TNPO3、TNRC18P1、TNS1、TNS3、TNXB、TOE1、TOMM40、TOMM5、TOPORS、TP53AIP1、TP53INP1、TPRG1、TRAF3、TRAK1、TRAPPC12、TRIB1、TRIM2、TRIM23、TRIM26、TRIM28、TRIM65、TRIM66、TRMT1L、TRPC4、TRPS1、TSC2、TSHZ1、TSHZ2、TSPAN11、TSPAN18、TSPAN2、TSPAN7、TSSK3、TTC7A、TTC7B、TUBB2C、TUBB3、TUBE1、TXNIP、TXNL1、TXNL4B、TXNRD1、TYW5、U2SURP、UBAP2L、UBE2D3、UBE2G2、UBE2L3、UBE2V1、UBN2、UBQLN4、UCHL5、UHMK1、UHRF1BP1L、UNC13B、UNC5B、URGCP、URGCP-MRPS24、USP19、USP7、USP27X、UVRAG、VANGL1、VARS2、VAV2、VCL、VDAC2、VIM-AS1、VIPAS39、VPS13A、VPS29、VPS41、VPS51、VSTM2L、VWA8、VWF、WDR19、WDR27、WDR37、WDR48、WDR90、WDR91、WHSC2、WIPF1、WISP1、WNK1、WNT5B、WNT10B、WSB1、WWTR1、XDH、XIAP、XRN2、YAP1、YDJC、YES1、YPEL5、YTHDF3、Z24749、ZAK、ZBTB10、ZBTB24、ZBTB26、ZBTB7A、ZC3H12C、ZC3H14、ZC3H18、ZCCHC5、ZCCHC8、ZCCHC11、ZEB1、ZEB2、ZFAND1、ZFAND5、ZFP82、ZHX3、ZMIZ1、ZMIZ1-AS1、ZMIZ2、ZMYM2、ZNF12、ZNF138、ZNF148、ZNF208、ZNF212、ZNF219、ZNF227、ZNF232、ZNF24、ZNF268、ZNF28、ZNF280D、ZNF281、ZNF335、ZNF350、ZNF37A、ZNF37BP、ZNF395、ZNF426、ZNF431、ZNF583、ZNF618、ZNF621、ZNF652、ZNF655、ZNF660、ZNF674、ZNF680、ZNF730、ZNF74、ZNF764、ZNF777、ZNF778、ZNF780A、ZNF7804A、ZNF79、ZNF827、ZNF836、ZNF837、ZNF839、ZNF91和ZSCAN25。
另一方面,所述基因不是SMN2。
另一方面,所述基因不选自ABHD10、ADAM12、AKT1、ANXA11、APLP2、APPL2、ARMCX6、ATG5、AXIN1、BAIAP2、CCNB1IP1、CCT7、CEP57、CSF1、DLGAP4、EPN1、ERGIC3、FOXM1、GGCT、GRAMD3、HSD17B4、LARP7、LRRC42、MADD、MAN1B1、MRPL39、PCBP4、PPHLN1、PRKACB、RAB23、RAP1A、RCC1、SREK1、STRN3和TNRC6A。
另一方面,所述基因不选自ABHD10、ADAM12、AKT1、ANXA11、APLP2、APPL2、ARMCX6、ATG5、AXIN1、BAIAP2、CCNB1IP1、CCT7、CEP57、CSF1、DLGAP4、EPN1、ERGIC3、FOXM1、GGCT、GRAMD3、HSD17B4、LARP7、LRRC42、MADD、MAN1B1、MRPL39、PCBP4、PPHLN1、PRKACB、RAB23、RAP1A、RCC1、SMN2、SREK1、STRN3和TNRC6A。
在另一个特定方面,本文提供了用于修饰RNA剪接以调节对象的基因的一种、两种、三种或更多种RNA转录物的量的方法,其中从所述基因转录的所述前体RNA转录物包含内含子REMS(例如,内源内含子REMS或非内源内含子REMS),所述方法包括向所述对象施用式(I)的化合物或其形式或包含式(I)的化合物或其形式和药学上可接受的载体、赋形剂或稀释剂的药物组合物。在具体方面,所述前体RNA转录物按5’至3’顺序包含:分支点、3’剪接位点和内含子REMS。在另一个具体方面,所述前体RNA转录物按5’至3’顺序包含:第一5’剪接位点、第一分支点、第一3’剪接位点、内含子REMS、第二分支点和第二3’剪接位点。在另一个具体方面,前体RNA转录物按5’至3’顺序包含:内含子REMS、分支点和3’剪接位点。
在另一个特定方面,本文提供了用于修饰RNA剪接以调节对象的基因的一种、两种、三种或更多种RNA转录物的量的方法,其中从所述基因转录的所述前体RNA转录物包含非内源内含子REMS,所述方法包括向所述对象施用式(I)的化合物或其形式或包含式(I)的化合物或其形式和药学上可接受的载体、赋形剂或稀释剂的药物组合物。在具体方面,所述前体RNA转录物按5’至3’顺序包含:分支点、3’剪接位点和内含子REMS。在另一个具体方面,所述前体RNA转录物按5’至3’顺序包含:第一5’剪接位点、第一分支点、第一3’剪接位点、内含子REMS、第二分支点和第二3’剪接位点。在另一个具体方面,前体RNA转录物按5’至3’顺序包含:内含子REMS、分支点和3’剪接位点。
另一方面,本文提供了用于修饰RNA剪接以调节基因的一种、两种、三种或更多种RNA转录物的量的方法,其中从所述基因转录的所述前体RNA转录物包含内含子REMS,所述方法包括向人类或非人类对象施用式(I)的化合物或其形式或包含式(I)的化合物或其形式和药学上可接受的载体、赋形剂或稀释剂的药物组合物。在具体方面,所述前体RNA转录物按5’至3’顺序包含:分支点、3’剪接位点和内含子REMS。在另一个具体方面,所述前体RNA转录物按5’至3’顺序包含:第一5’剪接位点、第一分支点、第一3’剪接位点、内含子REMS、第二分支点和第二3’剪接位点。在另一个具体方面,前体RNA转录物按5’至3’顺序包含:内含子REMS、分支点和3’剪接位点。
另一方面,本文提供了用于修饰RNA剪接以调节本文所述的基因的一种、两种、三种或更多种RNA转录物的量的方法,包括向人类或非人类对象施用式(I)的化合物或其形式或包含式(I)的化合物或其形式和药学上可接受的载体、赋形剂或稀释剂的药物组合物。参见实施例部分以获取有关本文所述的基因的其他信息。
另一方面,本文提供了用于修饰RNA剪接以调节对象的基因产物(如RNA转录物或蛋白)的量的方法,其中所述基因包含编码两个外显子和内含子的DNA核苷酸序列,其中编码第一外显子的核苷酸序列在编码内含子的核苷酸序列的上游,并且编码第二外显子的核苷酸序列在编码内含子的核苷酸序列的下游,其中所述编码内含子的DNA核苷酸序列按5’至3’顺序包含:编码第一5’剪接位点的核苷酸序列、编码第一分支点的核苷酸序列、编码第一3’剪接位点的核苷酸序列、编码iREMS的核苷酸序列、编码第二分支点的核苷酸序列和编码第二3’剪接位点的核苷酸序列,其中编码所述iREMS的所述核苷酸序列包含DNA序列GAgtrngn,并且其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,所述方法包括向对象施用本文所述的化合物(例如,式(I)的化合物或其形式)。
另一方面,本文提供了用于修饰RNA剪接以调节对象的基因产物(如RNA转录物或蛋白)的量的方法,其中所述基因包含编码两个外显子和内含子的DNA核苷酸序列,其中编码第一外显子的核苷酸序列在编码内含子的核苷酸序列的上游,并且编码第二外显子的核苷酸序列在编码内含子的核苷酸序列的下游,其中所述内含子的所述DNA核苷酸序列按5’至3’顺序包含:编码iREMS的核苷酸序列、编码分支点的核苷酸序列和编码3’剪接位点的核苷酸序列,其中编码所述iREMS的核苷酸序列包含DNA序列GAgtrngn,并且其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,所述方法包括向对象施用本文所述的化合物(例如,式(I)的化合物或其形式)。
另一方面,本文提供了用于修饰RNA剪接以调节对象的基因产物(如RNA转录物或蛋白)的量的方法,其中所述基因包含编码两个外显子和内含子的DNA核苷酸序列,并且其中所述DNA核苷酸序列编码图1A示出的外显子和内含子元件,所述方法包括向对象施用本文所述的化合物(例如,式(I)的化合物或其形式)。
另一方面,本文提供了用于修饰RNA剪接以调节对象的基因产物(如RNA转录物或蛋白)的量的方法,其中所述基因包含编码两个外显子和内含子的DNA核苷酸序列,并且其中所述DNA核苷酸序列编码图1B示出的外显子和内含子元件,所述方法包括向对象施用本文所述的化合物(例如,式(I)的化合物或其形式)。
另一方面,本文提供了用于修饰RNA剪接以调节对象的基因产物(如RNA转录物或蛋白)的量的方法,其中所述基因包含编码两个外显子和内含子的DNA核苷酸序列,并且其中所述DNA核苷酸序列编码图1C示出的外显子和内含子元件所述方法包括向对象施用本文所述的化合物(例如,式(I)的化合物或其形式)。
在具体方面,所述基因是在本公开的表中描述的基因。
在某些方面,与(多种)细胞接触或培养的或向对象施用的式(I)的化合物或其形式是本文所述的化合物。
表3显示了特定基因,其在本文所述的化合物的存在下预期显示出对包含iExon或形成eExon的作用,其中由于在具有内含子REMS元件的RNA中产生iExon或eExon而导致同种型丰度的相应变化。丰度的变化预期具有统计学上显著的p值。
表3
Figure BDA0002383691000003501
Figure BDA0002383691000003511
Figure BDA0002383691000003521
Figure BDA0002383691000003531
表4显示了特定基因,其在本文所述的化合物的存在下预期显示出对包含iExon或形成eExon的作用,其中由于在具有内含子REMS元件的RNA中产生iExon或eExon而导致同种型丰度的相应变化。丰度的变化预期具有统计学上显著的p值。
表4
Figure BDA0002383691000003541
Figure BDA0002383691000003551
Figure BDA0002383691000003561
表5显示了特定基因,其在本文所述的化合物的存在下预期显示出对包含iExon或形成eExon的作用,其中由于在具有内含子REMS元件的RNA中产生iExon或eExon而导致同种型丰度的相应变化。丰度的变化预期具有统计学上显著的p值。
表5
Figure BDA0002383691000003562
表6显示了特定基因,其在本文所述的化合物的存在下预期显示出对包含iExon或形成eExon的作用,其中由于在具有内含子REMS元件的RNA中产生iExon或eExon而导致同种型丰度的相应变化。丰度的变化预期具有统计学上显著的p值。
表6
Figure BDA0002383691000003571
表7显示了特定基因,其在本文所述的化合物的存在下预期显示出对包含iExon或形成eExon的作用,其中由于在具有内含子REMS元件的RNA中产生iExon或eExon而导致同种型丰度的相应变化。丰度的变化预期具有统计学上显著的p值。
表7
Figure BDA0002383691000003572
Figure BDA0002383691000003581
Figure BDA0002383691000003591
表8显示了特定基因,其在本文所述的化合物的存在下预期显示出对包含iExon或形成eExon的作用,其中由于在具有内含子REMS元件的RNA中产生iExon或eExon而导致同种型丰度的相应变化。丰度的变化预期具有统计学上显著的p值。
表8
Figure BDA0002383691000003592
表9显示了特定基因,其在本文所述的化合物的存在下预期显示出对包含iExon或形成eExon的作用,其中由于在具有内含子REMS元件的RNA中产生iExon或eExon而导致同种型丰度的相应变化。丰度的变化预期具有统计学上显著的p值。
表9
Figure BDA0002383691000003601
表10显示了基因,其显示出对包含iExon或形成eExon的作用,其中在用化合物64(24nm和100nm)处理的细胞中,由于在具有内含子REMS序列的RNA中产生iExon或eExon而导致同种型丰度的相应变化,产生统计学显著的调整后的Fisher精确检验p值。
表10
Figure BDA0002383691000003602
Figure BDA0002383691000003611
表11显示了特定基因,其在本文所述的化合物的存在下预期显示出对包含iExon或形成eExon的作用,其中由于在具有内含子REMS元件的RNA中产生iExon或eExon而导致同种型丰度的相应变化。丰度的变化预期具有统计学上显著的p值。
表11
Figure BDA0002383691000003612
表12显示了特定基因,其在本文所述的化合物的存在下预期显示出对包含iExon或形成eExon的作用,其中由于在具有内含子REMS元件的RNA中产生iExon或eExon而导致同种型丰度的相应变化。丰度的变化预期具有统计学上显著的p值。
表12
Figure BDA0002383691000003621
Figure BDA0002383691000003631
Figure BDA0002383691000003641
Figure BDA0002383691000003651
Figure BDA0002383691000003661
预防和/或治疗疾病的方法
另一方面,本文提供了由于修饰RNA剪接以预防和/或治疗与基因产物(例如,mRNA转录物或蛋白)的异常表达相关的疾病的方法,其中从所述基因转录的所述前体RNA转录物包含内含子REMS,所述方法包括向人类或非人类对象施用式(I)的化合物或其形式或包含式(I)的化合物或其形式和药学上可接受的载体、赋形剂或稀释剂的药物组合物。在具体方面,所述前体RNA转录物按5’至3’顺序包含:5’剪接位点、分支点、3’剪接位点和内含子REMS。在另一个具体方面,所述前体RNA转录物按5’至3’顺序包含:分支点、3’剪接位点和内含子REMS。在另一个具体方面,所述前体RNA转录物按5’至3’顺序包含:第一5’剪接位点、第一分支点、第一3’剪接位点、内含子REMS、第二分支点和第二3’剪接位点。在另一个具体方面,前体RNA转录物按5’至3’顺序包含:内含子REMS、分支点和3’剪接位点。
在某些方面,所述基因是本文所述的基因中的任一种。在某些方面,所述基因包含编码非内源内含子REMS的核苷酸序列。一方面,本文提供了用于修饰RNA剪接以预防和/或治疗与本文所述的基因产物(例如,mRNA、RNA转录物或蛋白)的异常表达相关的疾病的方法,所述方法包括向人类或非人类对象施用式(I)的化合物或其形式或包含式(I)的化合物或其形式和药学上可接受的载体、赋形剂或稀释剂的药物组合物。
另一方面,本文提供了用于修饰RNA剪接以预防和/或治疗与本文所述的基因产物(例如,mRNA、RNA转录物或蛋白)的异常表达相关的疾病的方法,其中从所述基因转录的所述前体RNA转录物包含内含子REMS,所述方法包括向人类或非人类对象施用式(I)的化合物或其形式或包含式(I)的化合物或其形式和药学上可接受的载体、赋形剂或稀释剂的药物组合物。在具体方面,所述前体RNA转录物按5’至3’顺序包含:分支点、3’剪接位点和内含子REMS。在另一个具体方面,所述前体RNA转录物按5’至3’顺序包含:第一5’剪接位点、第一分支点、第一3’剪接位点、内含子REMS、第二分支点和第二3’剪接位点。在另一个具体方面,前体RNA转录物按5’至3’顺序包含:内含子REMS、分支点和3’剪接位点。
另一方面,本文提供了用于修饰RNA剪接以预防和/或治疗与本文所述的基因产物(例如,mRNA、RNA转录物或蛋白)的异常表达相关的疾病的方法,其中从所述基因转录的所述前体RNA转录物包含内含子REMS,所述方法包括向人类或非人类对象施用式(I)的化合物或其形式或包含式(I)的化合物或其形式和药学上可接受的载体、赋形剂或稀释剂的药物组合物。在具体方面,所述前体RNA转录物按5’至3’顺序包含:5’剪接位点、分支点、3’剪接位点和内含子REMS。在另一个具体方面,所述前体RNA转录物按5’至3’顺序包含:分支点、3’剪接位点和内含子REMS。在另一个具体方面,所述前体RNA转录物按5’至3’顺序包含:第一5’剪接位点、第一分支点、第一3’剪接位点、内含子REMS、第二分支点和第二3’剪接位点。在另一个具体方面,前体RNA转录物按5’至3’顺序包含:内含子REMS、分支点和3’剪接位点。
另一方面,本文提供了用于修饰RNA剪接以预防和/或治疗与本文所述的基因产物(例如,mRNA、RNA转录物或蛋白)的异常表达相关的疾病的方法,包括向人类或非人类对象施用式(I)的化合物或其形式或包含式(I)的化合物或其形式和药学上可接受的载体、赋形剂或稀释剂的药物组合物。关于本文所述的基因的另外的信息,参见实施例部分。
另一方面,本文提供了用于修饰RNA剪接以预防和/或治疗疾病的方法,其中由基因编码的一种、两种、三种或更多种RNA同种型的表达水平的改变有利于预防和/或治疗所述疾病,其中从所述基因转录的所述前体RNA转录物包含内含子REMS,所述方法包括向人类或非人类对象施用式(I)的化合物或其形式或包含式(I)的化合物或其形式和药学上可接受的载体、赋形剂或稀释剂的药物组合物。在具体方面,所述前体RNA转录物按5’至3’顺序包含:5’剪接位点、分支点、3’剪接位点和内含子REMS。在另一个具体方面,所述前体RNA转录物按5’至3’顺序包含:分支点、3’剪接位点和内含子REMS。在另一个具体方面,所述前体RNA转录物按5’至3’顺序包含:第一5’剪接位点、第一分支点、第一3’剪接位点、内含子REMS、第二分支点和第二3’剪接位点。在另一个具体方面,前体RNA转录物按5’至3’顺序包含:内含子REMS、分支点和3’剪接位点。
在某些方面,所述基因是本文所述的基因中的任一种。在某些方面,所述基因包含编码非内源内含子REMS的核苷酸序列。一方面,本文提供了用于修饰RNA剪接以预防和/或治疗疾病的方法,其中由本文所述的基因编码的一种、两种、三种或更多种RNA同种型的表达的调节(例如,增加或减少)有利于预防和/或治疗所述疾病,所述方法包括向人类或非人类对象施用式(I)的化合物或其形式或包含式(I)的化合物或其形式和药学上可接受的载体、赋形剂或稀释剂的药物组合物。
另一方面,本文提供了用于修饰RNA剪接以预防和/或治疗疾病的方法,其中由本文所述的基因编码的一种、两种、三种或更多种RNA同种型的表达的调节(例如,增加或减少)有利于预防和/或治疗所述疾病,其中从所述基因转录的所述前体RNA转录物包含内含子REMS,所述方法包括向人类或非人类对象施用式(I)的化合物或其形式或包含式(I)的化合物或其形式和药学上可接受的载体、赋形剂或稀释剂的药物组合物。在具体方面,所述前体RNA转录物按5’至3’顺序包含:5’剪接位点、分支点、3’剪接位点和内含子REMS。在另一个具体方面,所述前体RNA转录物按5’至3’顺序包含:分支点、3’剪接位点和内含子REMS。在另一个具体方面,所述前体RNA转录物按5’至3’顺序包含:第一5’剪接位点、第一分支点、第一3’剪接位点、内含子REMS、第二分支点和第二3’剪接位点。在另一个具体方面,前体RNA转录物按5’至3’顺序包含:内含子REMS、分支点和3’剪接位点。
另一方面,本文提供了用于修饰RNA剪接以预防和/或治疗疾病的方法,其中由本文所述的基因编码的一种、两种、三种或更多种RNA同种型的表达的调节(例如,增加或减少)有利于预防和/或治疗所述疾病,其中从所述基因转录的所述前体RNA转录物包含内含子REMS,所述方法包括向人类或非人类对象施用式(I)的化合物或其形式或包含式(I)的化合物或其形式和药学上可接受的载体、赋形剂或稀释剂的药物组合物。在具体方面,所述前体RNA转录物按5’至3’顺序包含:5’剪接位点、分支点、3’剪接位点和内含子REMS。在另一个具体方面,所述前体RNA转录物按5’至3’顺序包含:分支点、3’剪接位点和内含子REMS。在另一个具体方面,所述前体RNA转录物按5’至3’顺序包含:第一5’剪接位点、第一分支点、第一3’剪接位点、内含子REMS、第二分支点和第二3’剪接位点。在另一个具体方面,前体RNA转录物按5’至3’顺序包含:内含子REMS、分支点和3’剪接位点。
另一方面,本文提供了用于修饰RNA剪接以预防和/或治疗疾病的方法,其中由本文所述的基因编码的一种、两种、三种或更多种RNA同种型的表达的调节(例如,增加或减少)有利于预防和/或治疗所述疾病,所述方法包括向人类或非人类对象施用式(I)的化合物或其形式或包含式(I)的化合物或其形式和药学上可接受的载体、赋形剂或稀释剂的药物组合物。在具体方面,在施用式(I)的化合物或其形式和药学上可接受的载体、赋形剂或稀释剂后,由本文所述的基因编码的一种、两种、三种或更多种RNA同种型减少。参见实施例部分以获取有关本文所述的基因的其他信息。
另一方面,本文提供了用于修饰RNA剪接以预防和/或治疗疾病的方法,其中由基因编码的一种、两种、三种或更多种蛋白同种型的表达水平的改变有利于预防和/或治疗所述疾病,其中从所述基因转录的所述前体RNA转录物包含内含子REMS,所述方法包括向人类或非人类对象施用式(I)的化合物或其形式或包含式(I)的化合物或其形式和药学上可接受的载体、赋形剂或稀释剂的药物组合物。在具体方面,所述前体RNA转录物按5’至3’顺序包含:5’剪接位点、分支点、3’剪接位点和内含子REMS。在另一个具体方面,所述前体RNA转录物按5’至3’顺序包含:分支点、3’剪接位点和内含子REMS。在另一个具体方面,所述前体RNA转录物按5’至3’顺序包含:第一5’剪接位点、第一分支点、第一3’剪接位点、内含子REMS、第二分支点和第二3’剪接位点。在另一个具体方面,前体RNA转录物按5’至3’顺序包含:内含子REMS、分支点和3’剪接位点。
在某些方面,所述基因是本文所述的基因中的任一种。在某些方面,所述基因包含编码非内源内含子REMS的核苷酸序列。一方面,本文提供了用于修饰RNA剪接以预防和/或治疗疾病的方法,其中由本文所述的基因编码的一种、两种、三种或更多种蛋白同种型的表达的调节(例如,增加或减少)有利于预防和/或治疗所述疾病,所述方法包括向人类或非人类对象施用式(I)的化合物或其形式或包含式(I)的化合物或其形式和药学上可接受的载体、赋形剂或稀释剂的药物组合物。
另一方面,本文提供了用于修饰RNA剪接以预防和/或治疗疾病的方法,其中由本文所述的基因编码的一种、两种、三种或更多种蛋白同种型的表达的调节(例如,增加或减少)有利于预防和/或治疗所述疾病,其中从所述基因转录的所述前体RNA转录物包含内含子REMS,所述方法包括向人类或非人类对象施用式(I)的化合物或其形式或包含式(I)的化合物或其形式和药学上可接受的载体、赋形剂或稀释剂的药物组合物。在具体方面,所述前体RNA转录物按5’至3’顺序包含:5’剪接位点、分支点、3’剪接位点和内含子REMS。在另一个具体方面,所述前体RNA转录物按5’至3’顺序包含:分支点、3’剪接位点和内含子REMS。在另一个具体方面,所述前体RNA转录物按5’至3’顺序包含:第一5’剪接位点、第一分支点、第一3’剪接位点、内含子REMS、第二分支点和第二3’剪接位点。在另一个具体方面,前体RNA转录物按5’至3’顺序包含:内含子REMS、分支点和3’剪接位点。
另一方面,本文提供了用于修饰RNA剪接以预防和/或治疗疾病的方法,其中由本文所述的基因编码的一种、两种、三种或更多种蛋白同种型的表达的调节(例如,增加或减少)有利于预防和/或治疗所述疾病,其中从所述基因转录的所述前体RNA转录物包含内含子REMS,所述方法包括向人类或非人类对象施用式(I)的化合物或其形式或包含式(I)的化合物或其形式和药学上可接受的载体、赋形剂或稀释剂的药物组合物。在具体方面,所述前体RNA转录物按5’至3’顺序包含:5’剪接位点、分支点、3’剪接位点和内含子REMS。在另一个具体方面,所述前体RNA转录物按5’至3’顺序包含:分支点、3’剪接位点和内含子REMS。在另一个具体方面,所述前体RNA转录物按5’至3’顺序包含:第一5’剪接位点、第一分支点、第一3’剪接位点、内含子REMS、第二分支点和第二3’剪接位点。在另一个具体方面,前体RNA转录物按5’至3’顺序包含:内含子REMS、分支点和3’剪接位点。
另一方面,本文提供了用于修饰RNA剪接以预防和/或治疗疾病的方法,其中由本文所述的基因编码的一种、两种、三种或更多种蛋白同种型的表达的调节(例如,增加或减少)有利于预防和/或治疗所述疾病,所述方法包括向人类或非人类对象施用式(I)的化合物或其形式或包含式(I)的化合物或其形式和药学上可接受的载体、赋形剂或稀释剂的药物组合物。在具体方面,在施用式(I)的化合物或其形式和药学上可接受的载体、赋形剂或稀释剂后,由本文所述的基因编码的一种、两种、三种或更多种RNA同种型减少。参见实施例部分以获取有关本文所述的基因的其他信息。
另一方面,本文提供了用于修饰RNA剪接以预防、治疗或预防和治疗对象的疾病的方法,其中由基因编码的一种、两种、三种或更多种蛋白同种型的表达的调节(例如,增加或减少)有利于预防和/或治疗所述疾病,其中所述基因包含编码两个外显子和内含子的DNA核苷酸序列,其中编码第一外显子的核苷酸序列在编码内含子的核苷酸序列的上游,并且编码第二外显子的核苷酸序列在编码内含子的核苷酸序列的下游,其中所述编码内含子的DNA核苷酸序列按5’至3’顺序包含:编码第一5’剪接位点的核苷酸序列、编码第一分支点的核苷酸序列、编码第一3’剪接位点的核苷酸序列、编码iREMS的核苷酸序列、编码第二分支点的核苷酸序列和编码第二3’剪接位点的核苷酸序列,其中编码所述iREMS的核苷酸序列包含DNA序列GAgtrngn,并且其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,所述方法包括向对象施用本文所述的化合物(例如,式(I)的化合物或其形式)。
另一方面,本文提供了用于修饰RNA剪接以预防、治疗或预防和治疗对象的疾病的方法,其中由基因编码的一种、两种、三种或更多种蛋白同种型的表达的调节(例如,增加或减少)有利于预防和/或治疗所述疾病,其中所述基因包含编码两个外显子和内含子的DNA核苷酸序列,其中编码第一外显子的核苷酸序列在编码内含子的核苷酸序列的上游,并且编码第二外显子的核苷酸序列在编码内含子的核苷酸序列的下游,其中所述内含子的DNA核苷酸序列按5’至3’顺序包含:编码iREMS的核苷酸序列、编码分支点的核苷酸序列和编码3’剪接位点的核苷酸序列,其中编码所述iREMS的核苷酸序列包含DNA序列GAgtrngn,并且其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,所述方法包括向对象施用本文所述的化合物(例如,式(I)的化合物或其形式)。
另一方面,本文提供了用于修饰RNA剪接以预防、治疗或预防和治疗对象的疾病的方法,其中由基因编码的一种、两种、三种或更多种蛋白同种型的表达的调节(例如,增加或减少)有利于预防和/或治疗所述疾病,其中所述基因包含编码两个外显子和内含子的DNA核苷酸序列,并且其中所述DNA核苷酸序列编码图1A所示的外显子和内含子元件,所述方法包括向对象施用本文所述的化合物(例如,式(I)的化合物或其形式)。
另一方面,本文提供了用于修饰RNA剪接以预防、治疗或预防和治疗对象的疾病的方法,其中由基因编码的一种、两种、三种或更多种蛋白同种型的表达的调节(例如,增加或减少)有利于预防和/或治疗所述疾病,其中所述基因包含编码两个外显子和内含子的DNA核苷酸序列,并且其中所述DNA核苷酸序列编码图1B所示的外显子和内含子元件,所述方法包括向对象施用本文所述的化合物(例如,式(I)的化合物或其形式)。
另一方面,本文提供了用于修饰RNA剪接以预防、治疗或预防和治疗对象的疾病的方法,其中由基因编码的一种、两种、三种或更多种蛋白同种型的表达的调节(例如,增加或减少)有利于预防和/或治疗所述疾病,其中所述基因包含编码两个外显子和内含子的DNA核苷酸序列,并且其中所述DNA核苷酸序列编码图1C所示的外显子和内含子元件,所述方法包括向对象施用本文所述的化合物(例如,式(I)的化合物或其形式)。
在具体方面,所述基因是在本公开的表中描述的基因。
在一些方面,向对象施用的式(I)的化合物或其形式是本文所述的化合物。
在具体方面,用于修饰RNA剪接以预防本文所述的疾病的方法防止疾病的一种或多种症状的发作或发展。另一方面,本文所述的用于预防疾病的方法防止疾病的复发或延迟疾病的复发。另一方面,本文所述的用于预防疾病的方法具有以下作用中的一种、两种或更多种:(i)降低或改善疾病的严重程度;(ii)抑制疾病的进展;(iii)减少对象的住院;(iv)缩短对象的住院时间;(v)增加对象的存活率;(vi)改善对象的生活质量;(vii)减少与疾病相关的症状数量;(viii)减轻或改善与疾病相关的(多种)症状的严重性;(ix)减少与疾病相关的(多种)症状的持续时间;(x)防止与疾病相关的症状的复发;(xi)抑制疾病症状的发展或发作;和/或(xii)抑制与疾病相关的症状的进展。
人工基因构建体
本文还提供了人工基因构建体,其包含编码外显子和一个或多个内含子的DNA序列,其中所述编码至少一个内含子的核苷酸序列按5’至3’顺序包含:编码分支点的核苷酸序列、编码3’剪接位点的核苷酸序列和编码内含子REMS的核苷酸序列,并且人工基因构建体包含RNA序列,所述RNA序列包含外显子和一个或多个内含子,其中至少一个内含子按5’至3’顺序包含:分支点、3’剪接位点和内含子REMS。本文所述的DNA序列可以是或源自例如基因组DNA序列或其DNA类似物。本文所述的RNA序列可以是或源自例如前体RNA转录物或其RNA类似物。如本文所使用,术语“人工基因构建体”是指含自然界中未发现的核苷酸序列的DNA或RNA基因构建体。
另一方面,本文提供了包含RNA序列的人工基因构建体,所述RNA序列包含两个外显子和内含子,其中第一外显子在内含子的上游,并且第二外显子在内含子的下游,其中所述内含子的RNA核苷酸序列按5’至3’顺序包含:第一5’剪接位点、第一分支点、第一3’剪接位点、iREMS、第二分支点和第二3’剪接位点,其中所述iREMS包含RNA序列GAgurngn,并且其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸。
另一方面,本文提供了包含RNA序列的人工基因构建体,所述RNA序列包含两个外显子和内含子,其中第一外显子在内含子的上游,并且第二外显子在内含子的下游,其中所述内含子的RNA核苷酸序列按5’至3’顺序包含:iREMS、分支点和3’剪接位点,其中所述iREMS包含RNA序列GAgurngn,并且其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸。
另一方面,本文提供了包含RNA序列的人工基因构建体,所述RNA序列包含两个外显子和内含子,其中所述RNA序列包含图1A所示的外显子和内含子元件。
另一方面,本文提供了包含RNA序列的人工基因构建体,所述RNA序列包含两个外显子和内含子,其中所述RNA序列包含图1B所示的外显子和内含子元件。
另一方面,本文提供了包含RNA序列的人工基因构建体,所述RNA序列包含两个外显子和内含子,其中所述RNA序列包含图1C所示的外显子和内含子元件。
另一方面,本文提供了包含编码两个外显子和内含子的DNA序列的人工基因构建体,其中编码第一外显子的核苷酸序列在编码内含子的核苷酸序列的上游,并且编码第二外显子的核苷酸序列在编码内含子的核苷酸序列的下游,其中所述编码内含子的核苷酸序列按5’至3’顺序包含:编码第一5’剪接位点的核苷酸序列、编码第一分支点的核苷酸序列、编码第一3’剪接位点的核苷酸序列、iREMS、编码第二分支点的核苷酸序列和编码第二3’剪接位点的核苷酸序列,其中编码所述iREMS的核苷酸序列包含DNA序列GAgtrngn,并且其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸。
另一方面,本文提供了包含编码两个外显子和内含子的DNA序列的人工基因构建体,其中编码第一外显子的核苷酸序列在编码内含子的核苷酸序列的上游,并且编码第二外显子的核苷酸序列在编码内含子的核苷酸序列的下游,其中编码内含子的核苷酸序列按5’至3’顺序包含:编码iREMS的核苷酸序列、编码分支点的核苷酸序列和编码3’剪接位点的核苷酸序列,其中编码所述iREMS的核苷酸序列包含DNA序列GAgtrngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸。
另一方面,本文提供了包含编码两个外显子和内含子的DNA序列的人工基因构建体,其中所述DNA序列编码图1A所示的外显子和内含子元件。
另一方面,本文提供了包含编码两个外显子和内含子的DNA序列的人工基因构建体,其中所述DNA序列编码图1B所示的外显子和内含子元件。
另一方面,本文提供了包含编码两个外显子和内含子的DNA序列的人工基因构建体,其中所述DNA序列编码图1C所示的外显子和内含子元件。
一方面,本文提供了包含内含子REMS的人工基因构建体。一方面,人工基因构建体包含基因组DNA或编码外显子和一个、两个或三个内含子的DNA,其中通过基因工程将编码内含子REMS的核苷酸序列引入编码内含子的核苷酸序列中,所述编码内含子REMS的核苷酸序列可以在编码分支点的核苷酸序列和编码3’剪接位点的核苷酸序列的上游或下游。另一方面,人工基因构建体包含编码外显子和一个、两个或三个内含子的DNA,其中编码内含子的核苷酸序列包含编码内含子REMS的核苷酸序列、编码(多个)3’剪接位点的核苷酸序列和编码(多个)分支点序列的核苷酸序列,其中通过基因工程将编码内含子REMS的核苷酸序列引入编码内含子的核苷酸序列中,所述编码内含子REMS的核苷酸序列可以在至少一个编码分支点的核苷酸序列和至少一个编码3’剪接位点的核苷酸序列的上游或下游。另一方面,人工基因构建体包含编码外显子和一个、两个或三个内含子的DNA,其中编码内含子的核苷酸序列包含编码(多个)3’剪接位点的核苷酸序列和编码(多个)分支点的核苷酸序列,其中编码内含子的核苷酸序列被修饰以引入编码内含子REMS的核苷酸序列。在一些方面,人工基因构建体包含DNA序列,其被修饰以引入编码内含子REMS的核苷酸序列,其中内含子REMS的位置如图1A-1C中任一个所示。在某些方面,选择用于制备人工基因构建体的DNA序列可以包含编码内含子REMS的核苷酸序列,并且引入编码内含子REMS的另外的核苷酸序列或分支点或3’剪接位点序列。在特定方面,编码内含子REMS的核苷酸序列或分支点或3’剪接位点序列是编码非内源内含子REMS或分支点或3’剪接位点序列的核苷酸序列,即在人工基因构建体的DNA序列中非天然发现的序列。在某些方面,人工基因构建体包含其他元件,如启动子(例如,组成型、诱导型或组织特异性启动子)、Poly(A)位点、转录终止位点和(多个)转录结合位点。在某些方面,人工基因构建体包含至少编码治疗性蛋白的序列。在一些方面,人工基因构建体包含至少本文所述的基因的内含子REMS。在某些方面,人工基因构建体包含至少可检测的报告基因的外显子,所述可检测的报告基因如绿色荧光蛋白(GFP)、黄色荧光蛋白(YFP)、红色荧光蛋白、β-半乳糖苷酶、海肾荧光素酶、萤火虫荧光素酶等。
在某些方面,人工基因构建体如下制备:将编码内含子REMS的核苷酸序列引入编码基因组DNA或DNA的现有内含子分支点和内含子3’剪接位点的核苷酸序列中,其中所述DNA编码两个或更多个外显子和一个或多个内含子,并且其中所述编码内含子REMS的核苷酸序列在编码分支点的核苷酸序列和3’剪接位点上游。在一些方面,人工基因构建体如下制备:在编码基因组DNA或DNA的分支点和3’剪接位点的核苷酸序列的上游引入编码内含子REMS的核苷酸序列,其中所述DNA编码两个或更多个外显子和(多个)内含子。在具体方面,编码内含子REMS的核苷酸序列从内部引入编码内含子的核苷酸序列内。在某些方面,人工基因构建体如下制备:将编码内含子REMS的核苷酸序列、编码分支点的核苷酸序列和编码3’剪接位点的核苷酸序列引入cDNA中,其中所述编码内含子REMS的核苷酸序列可以分别在分支点和3’剪接位点的上游;或可以分别在3’剪接位点和分支点的下游。编码内含子REMS的核苷酸序列充当5’剪接位点。在某些方面,编码内含子REMS的核苷酸序列在内含子内部。在具体方面,选择用于制备人工基因构建体的基因组DNA或DNA不包含编码内含子REMS的核苷酸序列或编码分支点的核苷酸序列或编码3’剪接位点的核苷酸序列中的一个或多个。在某些方面,选择用于制备人工基因构建体的基因组DNA或DNA包含内含子REMS,并且引入另外的内含子REMS。在一些方面,应注意将编码内含子REMS的核苷酸序列引入DNA序列中,以免破坏开放阅读框或引入终止密码子。将编码内含子REMS的核苷酸序列引入DNA序列中可能会或可能不会导致蛋白水平的氨基酸变化。在某些方面,将编码内含子REMS的核苷酸序列引入DNA序列导致蛋白水平的氨基酸变化。在一些方面,该氨基酸变化是保守的氨基酸取代。在其他方面,将编码内含子REMS的核苷酸序列引入DNA序列中不会导致蛋白水平的氨基酸变化。可以使用本领域技术人员已知的技术将内含子REMS和其他元件,例如分支点序列或3’剪接位点序列引入DNA序列中,例如可以使用基因编辑技术,例如CRISPR-Cas方法、转录激活因子样效应物核酸酶(TALEN)或锌指核酸酶(ZFN)。
在某些方面,人工基因构建体包含RNA序列,所述RNA序列包含外显子和一个、两个或三个内含子,其中在3’剪接位点下游的内含子REMS 5’剪接位点通过基因工程引入内含子。另一方面,人工基因构建体包含RNA序列,所述RNA序列包含外显子和一个、两个或三个内含子,其中内含子包含(多个)5’剪接位点、(多个)3’剪接位点和(多个)分支点,其中在3’剪接位点上游的内含子REMS通过基因工程引入内含子。另一方面,人工基因构建体包含RNA序列,所述RNA序列包含外显子和一个、两个或三个内含子,其中内含子包含(多个)3’剪接位点和(多个)分支点,其中内含子被修饰以引入内含子REMS。在特定方面,内含子REMS是非内源的,即非天然存在于人工基因构建体的RNA序列中。在某些方面,人工基因构建体包含其他元件,如启动子(例如,组织特异性启动子或组成性表达的启动子)、5’非翻译区、3’非翻译区、调节剪接位点(5’和3’)识别和催化的(多种)RNA结合蛋白的(多个)结合位点、(多种)小分子RNA传感器,例如核糖开关,茎环结构和/或内部核糖体进入位点(IRES)等。在某些方面,人工基因构建体包含至少编码治疗性蛋白的基因的内含子。在一些方面,人工基因构建体包含至少本文所述的基因的内含子。在具体方面,选择用于制备人工基因构建体的RNA转录物不包含内含子REMS。在某些方面,选择用于制备人工基因构建体的RNA转录物包含内含子REMS,并引入另外的外显子或内含子REMS。在其他方面,人工基因构建体包含可检测的报告基因的至少一个内含子和两个外显子,所述可检测的报告基因如绿色荧光蛋白(GFP)、黄色荧光蛋白(YFP)、红色荧光蛋白、β-半乳糖苷酶、海肾荧光素酶、萤火虫荧光素酶等。
在某些方面,人工基因构建体如下制备:将内含子REMS引入前体RNA的现有5’剪接位点,其中所述RNA包含两个或更多个外显子和一个或多个内含子,并且其中内含子REMS在分支点序列和3’剪接位点序列的上游。在一些方面,人工基因构建体如下制备:将内含子REMS引入前体RNA的3’剪接位点的上游,其中所述RNA包含两个或更多个外显子和(多个)内含子。在具体方面,内含子REMS从内部引入内含子内。在某些方面,人工基因构建体如下制备:将分支点、3’剪接位点和内含子REMS引入mRNA中,其中所述REMS可以在分支点和3’剪接位点的下游或上游。内含子REMS充当5’剪接位点。在某些方面,内含子REMS位于内含子中。在一些方面,应注意将内含子REMS引入RNA序列,以免破坏开放阅读框或引入终止密码子。将内含子REMS引入RNA转录物中可能会或可能不会导致蛋白水平的氨基酸变化。在某些方面,将内含子REMS引入RNA转录物中导致蛋白水平的氨基酸变化。在一些方面,该氨基酸变化是保守的氨基酸取代。在其他方面,将内含子REMS引入RNA转录物中不会导致蛋白水平的氨基酸变化。可以使用本领域技术人员已知的技术将内含子REMS和其他元件,如分支点或3’剪接位点引入RNA转录物中。
在一些方面,人工基因构建体存在于病毒载体(例如,腺相关病毒(AAV)、自互补腺相关病毒(scAAV)、腺病毒、逆转录病毒、慢病毒(例如,猿猴免疫缺陷病毒、人免疫缺陷病毒或改良人免疫缺陷病毒)、新城疫病毒(NDV)、疱疹病毒(例如,单纯疱疹病毒)、甲病毒、牛痘病毒等)、质粒或其他载体(例如,非病毒载体,如阳性脂质体、脂质体、多微粒体(polymerosome)或纳米颗粒)。
在一些方面,人工基因构建体是被修饰以实现细胞摄取的RNA分子。在某些方面,人工基因构建体是包含假尿苷或其他修饰/人工核苷酸的RNA分子,用于增强细胞摄取和基因表达。
本文所述的人工基因构建体在基因治疗中的用途允许根据本文所述的化合物的存在调节由该构建体产生的蛋白的量和类型。化合物本质上是可调开关,其根据化合物剂量的量和持续时间,调节产生的蛋白的量和类型。
在某些方面,与本文所述的化合物不存在的情况下产生的功能性蛋白的量相比,在本文所述的化合物的存在下从作为DNA的人工基因构建体转录的RNA转录物将不会产生功能性蛋白或将产生实质上更少的功能性蛋白。例如,如果人工基因构建体包含在编码3’剪接位点的内含子核苷酸序列的下游的编码内含子REMS的核苷酸序列,则内含外显子的产生最终将导致更少量的原始蛋白(即,当不修饰RNA剪接时产生的蛋白)在本文所述的化合物的存在下产生。供选择地,在某些方面,与本文所述的化合物不存在的情况下产生的功能性蛋白的量相比,在本文所述的化合物的存在下从作为DNA的人工基因构建体转录的RNA转录物将产生功能性蛋白或将产生实质上更少的功能性蛋白。
在某些方面,在细胞培养物中使用人工基因构建体或包含人工基因构建体的载体。例如,在用人工基因构建体转染或用包含人工基因构建体的载体转导的(多种)细胞中,可以根据本文所述的化合物是否与(多种)转染的细胞接触,调节或修饰由人工基因构建体产生的蛋白的量和类型。例如,如果人工基因构建体包含在编码核苷酸序列的3’剪接位点的下游的编码内含子REMS的核苷酸序列,则相对于在化合物存在的情况下,在不存在化合物的情况下产生内含外显子的可能性将会更低。因此,本文所述的人工基因构建体的使用允许根据是否存在本文所述的化合物来调节由该构建体产生的蛋白的量和类型。换言之,本文所述的化合物实质上是调节产生的蛋白的量和类型的开关。例如,当试图评估某些基因的作用或某些药剂对途径的作用时,这种蛋白产生的调节可能是有用的。可以基于与转染的细胞接触的本文所述的化合物的量和/或该化合物与转染的细胞接触的时间,来修饰产生的蛋白的量。
在某些方面,将动物(例如,非人类动物,例如小鼠、大鼠、蝇等)工程化以包含人工基因构建体或包含人工基因构建体的载体。本领域技术人员已知的技术可用于工程化这样的动物。可以通过是否将本文所述的化合物施用于动物来调节由该工程动物产生的蛋白的量。可以基于向工程动物施用本文所述的化合物的剂量和/或持续时间来滴定测量产生的蛋白的量。在某些方面,人工基因构建体编码可检测的报告基因,例如绿色荧光蛋白(GFP)、黄色荧光蛋白(YFP)、红色荧光蛋白、β-半乳糖苷酶、海肾荧光素酶、萤火虫荧光素酶等。根据该方面,该工程动物可用于监测不同阶段的发育,可视化组织功能等。在其他方面,人工基因构建体编码治疗性基因产物,例如本文所述。根据该方面,该工程动物可用于监测不同阶段的发育或用于功能生物学研究,其中某些蛋白或蛋白同种型仅需要表达一段时间而不是组成性表达等。
在某些方面,人工基因构建体或包含人工基因构建体的载体用于基因治疗。载体的非限制性实例包括但不限于质粒和病毒载体,例如源自复制缺陷型逆转录病毒、腺病毒、腺相关病毒和杆状病毒的载体。载体可以是RNA载体或优选地是DNA载体。
基因治疗
另一方面,可以提供人工基因构建体或包含人工基因构建体的载体以用于基因治疗。本文所述的人工基因构建体在基因治疗中的用途允许根据是否存在本文所述的化合物来调节由所述构建体产生的蛋白的量和类型。该化合物本质上是调节产生的蛋白的量和类型的开关。
在本文提供的某些方面,与本文所述的化合物不存在的情况下产生的功能性蛋白的量相比,在本文所述的化合物的存在下从作为DNA的人工基因构建体转录的RNA转录物将产生实质上更多的功能性蛋白。例如,包含在编码分支点的核苷酸序列和3’剪接位点下游的编码内含子REMS的核苷酸序列的人工基因构建体或载体,在本文所述的化合物不存在的情况下产生内含外显子的可能性更低。如果由于包含iExon而产生的蛋白是功能性蛋白,则化合物施用的结果将最终导致由人工基因构建体产生更多的功能性蛋白。因此,当人工基因构建体或包含人工基因构建体的载体在本文所述的化合物的存在下增加了产生内含外显子的可能性时,该构建体或载体可以用于治疗和/或预防与基因相关的某些病症或疾病。所述病症或疾病可以包括本文所述的那些。
供选择地,在某些方面,与本文所述的化合物不存在的情况下产生的功能性蛋白的量相比,在本文所述的化合物的存在下从作为DNA的人工基因构建体转录的RNA转录物将产生实质上更少的功能性蛋白。例如,包含编码内含子REMS的核苷酸序列的人工基因构建体或载体在本文所述的化合物的存在下产生内含外显子的可能性更高。如果由于包含iExon而产生的蛋白不是功能性蛋白,但在没有包含iExon的情况下产生的蛋白是功能性蛋白,则化合物施用的结果将导致功能性蛋白的产生减少。然而,在本文所述的化合物不存在的情况下,会发生正常剪接,并且功能性蛋白的产生不会减少。可以根据化合物的剂量和给药时间来滴定测量产生的蛋白的量和类型。在具体方面,用于基因治疗的人工基因构建体包含RNA序列,所述RNA序列包含两个外显子和内含子,其中第一外显子在内含子的上游,并且第二外显子在内含子的下游,其中所述内含子的RNA核苷酸序列按5’至3’顺序包含:第一5’剪接位点、第一分支点、第一3’剪接位点、iREMS、第二分支点和第二3’剪接位点,其中所述iREMS包含RNA序列GAgurngn,并且其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸。
在另一个具体方面,用于基因治疗的人工基因构建体包含RNA序列,所述RNA序列包含两个外显子和内含子,其中第一外显子在内含子的上游,并且第二外显子在内含子的下游,其中所述内含子的RNA核苷酸序列按5’至3’顺序包含:iREMS、分支点和3’剪接位点,其中所述iREMS包含RNA序列GAgurngn,并且其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸。
在另一个具体方面,用于基因治疗的人工基因构建体包含RNA序列,所述RNA序列包含两个外显子和内含子,其中所述RNA序列包含图1A所示的外显子和内含子元件。
在另一个具体方面,用于基因治疗的人工基因构建体包含RNA序列,所述RNA序列包含两个外显子和内含子,其中所述RNA序列包含图1B所示的外显子和内含子元件。
在另一个具体方面,用于基因治疗的人工基因构建体包含RNA序列,所述RNA序列包含两个外显子和内含子,其中所述RNA序列包含图1C所示的外显子和内含子元件。
在另一个具体方面,用于基因治疗的人工基因构建体包含编码两个外显子和内含子的DNA序列,其中编码第一外显子的核苷酸序列在编码内含子的核苷酸序列的上游,并且编码第二外显子的核苷酸序列在编码内含子的核苷酸序列的下游,其中所述编码内含子的核苷酸序列按5’至3’顺序包含:编码第一5’剪接位点的核苷酸序列、编码第一分支点的核苷酸序列、编码第一3’剪接位点的核苷酸序列、编码iREMS的核苷酸序列、编码第二分支点的核苷酸序列和编码第二3’剪接位点的核苷酸序列,其中编码所述iREMS的核苷酸序列包含DNA序列GAgtrngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸。
在另一个具体方面,用于基因治疗的人工基因构建体包含编码两个外显子和内含子的DNA序列,其中编码第一外显子的核苷酸序列在编码内含子的核苷酸序列的上游,并且编码第二外显子的核苷酸序列在编码内含子的核苷酸序列的下游,其中所述编码内含子的核苷酸序列按5’至3’顺序包含:编码iREMS的核苷酸序列、编码分支点的核苷酸序列和编码3’剪接位点的核苷酸序列,其中编码所述iREMS的核苷酸序列包含DNA序列GAgtrngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸。
在另一个具体方面,用于基因治疗的人工基因构建体包含编码两个外显子和内含子的DNA序列,其中所述DNA序列编码图1A所示的外显子和内含子元件。
在另一个具体方面,用于基因治疗的人工基因构建体包含编码两个外显子和内含子的DNA序列,其中所述DNA序列编码图1B所示的外显子和内含子元件。
在另一个具体方面,用于基因治疗的人工基因构建体包含编码两个外显子和内含子的DNA序列,其中所述DNA序列编码图1C所示的外显子和内含子元件。
可以将人工基因构建体,包含人工基因构建体的载体,或包含被修饰以允许细胞摄取的人工基因构建体的RNA分子引入细胞或直接施用于患者。一方面,将人工基因构建体或包含人工基因构建体的载体离体或体内引入细胞中。在具体方面,将人工基因构建体或载体离体引入(多种)细胞中,并且可以将所述(多种)细胞施用于对象。可以使用本领域技术人员已知的多种技术将人工基因构建体或包含人工基因构建体的载体引入(多种)细胞,例如电穿孔、转染、转化等。另一方面,将人工基因构建体或包含人工基因构建体的载体施用于对象。可以通过本领域技术人员已知的任何技术,例如通过肌肉内、静脉内、皮下、皮内、局部、鞘内、腹膜内、肿瘤内等将人工基因构建体或包含人工基因构建体的载体施用于对象。在一些方面,人工基因构建体或包含人工基因构建体的载体全身施用于对象。在其他方面,人工基因构建体或包含人工基因构建体的载体局部施用于对象。
修饰内源基因
另一方面,本文提供了用于修饰内源基因以使得得到的基因包含编码内含子REMS的核苷酸序列,或包含编码内含子REMS的另外的核苷酸序列的方法(换句话说,内含子REMS不是天然存在于内源基因中的,即非内源内含子REMS)。在具体方面,本文提供了用于修饰内源基因,以使得到的基因包含编码内含子REMS的核苷酸序列,并且包含在编码内含子REMS的核苷酸序列上游的编码分支点的核苷酸序列和编码3’剪接位点的核苷酸序列的方法。
如本文所使用,术语“内源基因”是指天然存在于细胞或存活对象中的基因。本领域技术人员已知的技术可用于将以下任意一种、两种或全部引入内源基因:分支点、3’剪接位点和内含子REMS,例如,可以使用CRISPR-Cas方法、TALEN或ZFN。在某些方面,编码现有的5’剪接位点的核苷酸序列可以被内含子REMS替代,或者内含子REMS可以内部插入内含子REMS内。在一些方面,应注意将编码内含子REMS的核苷酸序列引入内源基因,以免破坏开放阅读框或引入终止密码子。将编码内含子REMS的核苷酸序列引入内源基因可能会或可能不会导致蛋白水平的氨基酸变化。在某些方面,将编码内含子REMS的核苷酸序列引入内源基因导致蛋白水平的氨基酸变化。在一些方面,该氨基酸变化是保守的氨基酸取代。在其他方面,将编码内含子REMS的核苷酸序列引入内源基因中不会导致蛋白水平的氨基酸变化。
试剂盒
一方面,本文提供了试剂盒,其在容器中包含人工基因构建体或包含人工构建体的载体。在某些方面,试剂盒还在单独的容器中包含本文所述的化合物,和/或在单独的容器中包含阴性对照,例如磷酸盐缓冲盐水或不识别内含子REMS的化合物。在具体方面,试剂盒还包含阳性对照,例如包含本文所述的化合物作为阳性对照。在一些方面,试剂盒还在一个或多个单独的容器中包含引物和/或抗体,用于评估来自人工基因构建体的mRNA转录物的产生和/或由此引起的蛋白产生。
另一方面,本文提供了试剂盒,其在一个或多个容器中包含产生人工基因构建体所需的组分和/或试剂和/或包含人工基因构建体的载体。另一方面,本文提供了试剂盒,其在一个或多个容器中包含修饰内源基因所需的组分和/或试剂,以使其包含编码内含子REMS的核苷酸序列或编码内含子REMS的另外的核苷酸序列(换言之,在内源基因中非天然存在的REMS,即非内源REMS)。另一方面,本文提供了试剂盒,其在一个或多个容器中包含修饰内源基因所需的组分和/或试剂,以使得到的基因包含编码内含子REMS的核苷酸序列,并包含在编码内含子REMS的核苷酸序列上游的编码分支点的核苷酸序列和编码3’剪接位点的核苷酸序列。在一些方面,试剂盒还在一个或多个单独的容器中包含引物和/或抗体,用于评估来自修饰的内源基因的mRNA转录物的产生和/或由此引起的蛋白产生。
另一方面,本文提供了试剂盒,其在容器中包含本文所述的化合物和使用说明书。在一些方面,试剂盒还在单独的容器中包含阴性对照,如磷酸盐缓冲盐水或不识别内含子REMS的化合物。
实施例
为了更详细地描述并帮助理解本说明书,提供以下非限制性生物学实例以更充分地说明本说明书的范围,并且不应解释为具体地限制其范围。在本领域技术人员可以确定的范围内的可以目前已知或以后形成的本说明书的这种变化被认为落入本说明书的范围内,并且如以下所要求保护的。以下实施例说明了剪接修饰剂的内含子识别元件(REMS)的存在,其对于识别本文所述的化合物很重要,并且这样的化合物与前体RNA上的内含子REMS的结合允许或增强所述前体RNA的剪接,并暗示内含子REMS与本文所述的化合物组合用于修饰RNA剪接和调节基因产物的量的有用性。
材料和方法
细胞处理:将GM04856淋巴细胞在由DMEM、10%FBS和1x Pen/Strep组成的培养基中稀释至2.5e5个细胞/mL的浓度。将2mL(500K细胞)接种到6孔板中,并在37℃、5%CO2下恢复4h。将化合物稀释液在培养基中制备成2x化合物储备液(例如,对于最终100nM,制备200nM储备液)。恢复4h后,将2mL的2x化合物储备液添加到每个孔中,得到4mL/孔,最终化合物浓度为1x。将细胞在37℃、5%CO2下孵育~20h。孵育后,将细胞以1000rpm沉淀5min。真空去除上清液,并将细胞重悬于350μL RLT缓冲液(含10μL/mLβ-巯基乙醇,RNeasy试剂盒)中。根据制造商的说明,使用Qiagen的RNeasy Mini试剂盒分离总RNA。使用Nanodrop确定所得总RNA的浓度,并用水稀释至25ng/μL的终浓度。
终点RT-PCR和RNAseq:在培养的细胞中供选择地剪接的mRNA的分析
将源自患有神经母细胞瘤的女性患者的骨髓活检的SH-SY5Y细胞以600,000个细胞/孔接种在6孔板中的含有10%FBS的2mL DMEM中,并在细胞培养箱中孵育4小时(37℃,5%CO2,100%的相对湿度)。然后用不同浓度的化合物64(在0.1%DMSO中)处理细胞24小时。除去上清液后,将细胞在含有β-巯基乙醇的RLT缓冲液中裂解,并根据制造商的方案(RNeasy Mini试剂盒,Qiagen,Inc.)提取。
使用AgPath-IDTM一步法RT-PCR试剂(Life Technologies,Inc.),使用50ng总RNA作为输入进行一步法RT-PCR。使用以下PCR条件:步骤1:48℃(15min),步骤2:95℃(10min),步骤3:95℃(30sec),步骤4:55℃(30sec),步骤5:68℃(1min),重复步骤3至5,进行34个循环,然后保持在4℃下。使用表13至表19中列出的引物(对应于图2、3、4和5)确定了供选择地剪接的mRNA中iExons的存在。PCR产物在2%琼脂糖E-凝胶(Life Technologies,Inc.)上分离,用溴化乙锭染色,并使用凝胶成像仪(UVP)可视化。显示了通过用化合物64处理而产生的内含外显子影响的基因的结果,表21和表22分别显示了在24nm和100nm下用化合物64处理的SH-SY5Y细胞的结果,表23显示了在100nm下用化合物64处理的HD-1994细胞的结果。
对于RNAseq,如上所述处理SH-SY5Y细胞。总RNA(3μg)用于RNA链文库的制备和测序。使用低聚核苷酸(dT)珠富集mRNA,然后通过添加片段缓冲液随机片段化,然后通过使用mRNA模板和随机六聚体引物合成cDNA,然后添加定制的第二链合成缓冲液(Illumina)、dNTP、RNA酶H加入DNA聚合酶I以引发第二链合成。在一系列末端修复、连接和测序衔接头连接后,通过尺寸选择和PCR富集完成了双链cDNA文库。RNA文库在HiSeq测序仪中以每种样品>30M进行测序,然后产生150nt对末端读数。去除含有衔接头序列的读数,并使用STAR(2.5.1版)将其余的读数映射到人类基因组(hg19)。仅使用<5nt/100nt错配的唯一映射读数(MAPQ>10)和正确配对的读数。使用DESeq2对编码蛋白的基因的编码序列(CDS)区域和非编码基因的外显子区域的读取次数进行计数和分析(Love等,2014)。对于剪接分析,对注释或未注释但从RNA-seq确定的不同外显子的读数进行计数。对于每个外显子,使用支持包含或排除外显子的所有读数中支持包含外显子的平均读数的百分比来计算拼接百分比(PSI)值。比较了两种样品之间的PSI差异,并使用Fisher精确检验确定统计显著性。PSI增加>5%和P值<0.01用于选择该化合物包括的具有统计学显著的内含外显子。
结果:对应于iExon所在的内含子侧翼的外显子的寡核苷酸用于扩增从未经处理的(DMSO)或经化合物64(剂量水平为10nM、1μM或10μM)处理的细胞纯化的总RNA。
所得产物在琼脂糖凝胶上跑电泳,其中每种基因得到的目标条带用空心箭头和实心箭头表示,其中空心箭头表示其中发生内源野生型剪接的外显子同种型;并且其中实心箭头表示其中iExon包含在mRNA中的外显子同种型,如图2A、2B、3A、3B、4A、4B、5A、5B和6A所示。在所有情况下,化合物浓度的增加都会导致迁移更慢的包含内含子来源的外显子的PCR产物出现,其中看到的其他条带是中间剪接产物。每幅图中的星号(*)表示跳过目标外显子的事件。
表13.图2的正向引物
基因 正向引物 序列5'-3' SEQ ID NO:
ABCB8 ABCB_54-73 GCCGGCGGCTCCTGTTTTAC 3635
ANXA11 ANXA_101-120 AGTCGCTGTACCACGACATC 3636
ARL15 ARL1_87-106-1a-KE GCTGCCGGATGTCTGATCTC 3637
ATG5 ATG5_100-122-KE ACGAATTCCAACTTGTTTCACGC 3638
BECN1 BECN_53-72 TTGACCATGCAATGGTGGCT 3639
C12orf4 c12o_40-58 GCCCAGGACTTCGGAACTA 3640
DENND4A DENN_79-98-KE GATCCGGGACAGCCCTTGTA 3641
DIAPH3 DIAP_6-25 CGGCAGAGTCTCAGTCCAAT 3642
EVC EVC_61-80-KE GGCACTGAGGCAGGAAAAGC 3643
FAM162A FAM1_54-72 GTCGGCGGAGTAGCAAGTG 3644
HTT HTT_E49_For TGCCCAGTCATTTGCACCTT 3645
MMS22L MMS22Le14F1 TGGTGTCTAAGAATGAGGAAATGGTA 3646
NIPA1 NIPA1e4R1 TTTGGGGAGTGGATAATCAGCA 3647
PAPD4 PAPD_46-65-KE CCCGGAGCAGTGATGGTGAT 3648
PDXDC1 PDXD_23-42 TGTGCCGTGTACCCTGTAAC 3649
RAF1 RAF1_90-112-KE CGACATCCACACCTAATGTCCAC 3650
SENP6 SENP_12-36-KE TCAGAGTCTAAGAGAGATGGAGGTT 3651
SF3B3 SF3B-9a_122-143-KE CTGGTTGATGAGTTGGACAGCC 3652
SF3B3 SF3B-2a_84-105-KE ACTTAACCTTGCAGAGAGCCAC 3653
TBCA TBCA_21-39-KE GCCTAAATAGCCGCAGCCT 3654
UBE2L3 UBE2_18-36 GCCAGCAGGAGGCTGATGA 3655
XRN2 XRN2_28-47 TTCACATCTGATGGCTCCCC 3656
ZFAND1 ZFAN_9-32-KE CCATTTGTGTGTGATGATTGTTCA 3657
表14.图2的反向引物
Figure BDA0002383691000003831
Figure BDA0002383691000003841
表15.图3的正向引物
基因 正向引物 序列5'-3' SEQ ID NO:
ACVR1B ACVR_171-190-KE TACCAGACGGTCATGCTGCG 3681
AXIN1 AXIN_198-217-KE AAAAGAGAGCCAGCCGAGCA 3682
CENPI CENP_177-201-KE TCATCCTTCTTTCTTGAGTTACGCT 3683
DCAF17 DCAF_84-103-KE TTATCGGCGCTGTGTCAGCA 3684
FAM174A FAM1_85-109-KE GGATGATGAGGATGATGACAACACG 3685
FBL FBL_99-118 TGCTCGACACCCACACAAAT 3686
GNG12 GNG1_17-39-KE ACCTGAAAACATTGGACCACACA 3687
GXYLT1 GXYL_57-77 GGAAGCAATTGCCAAGAAGCA 3688
HMGXB4 HMGX_829-848-KE CTCCCAGCATCCCATACGCT 3689
IVD IVD_40-60-KE CTGGGGATGAGGGGCTCTAAC 3690
KDM6A KDM6_94-116-KE TGGCACGAAATATCAAGGTCTCA 3691
MADD MADD_137-156-KE TGCCACAGGAAAGGGTCCTA 3692
MRPL45 MRP4_42-65 AGGACTTCCCTGAAAAAGCTAAGG 3693
NSUN4 NSUN_142-160-KE AGGGGGACACCTATGACCG 3694
NUPL1 NUPL_144-163 GTCCACAGGGTTCTCCTTCG 3695
PPIP5K2 PPIP_34-57-KE TCAGTTGACCTATCTCCCTCATGG 3696
SOS2 SOS2_86-107-KE AACCTCGAAACTGCAAACAGCC 3697
STAT1 STAT_68-88-KE TTCCTGCTGCGGTTCAGTGAG 3698
STRN3 STRN_95-115-KE GTGAAGGAGCTGGAGAAGCAC 3699
TNS3 TNS3_6-29-KE CCAGGTGATAAACTTGTGATCGTG 3700
WNK1 WNK1_45-67 GCTGGTGTTTTTAAGATGGGACG 3701
表16.图3的反向引物
Figure BDA0002383691000003842
Figure BDA0002383691000003852
表17.图4的正向引物
Figure BDA0002383691000003851
表18.图4的反向引物
Figure BDA0002383691000003853
Figure BDA0002383691000003861
表19.图5的正向引物
基因 正向引物 序列5'-3' SEQ ID NO:
ASAP1 ASAP_64-83-19a-KE TCACCAAAACCCACCCCTTC 3751
ATF6 ATF6_65-85 GAAGCCATCCGCAGAAGGGGA 3752
CRYL1 CRYL_36-56-KE CATGTCAGAAGGGTTGGGCAT 3753
CTNS CTNS_14-33 CCTCACTGTTCCTCCTGTCG 3754
DENND5A DENN_178-199-8a-KE CGGACACCTACTCTCCGTACAT 3755
DGKI DGKI_81-101-KE CCATGTGGAAAGAAACCCCGA 3756
DLGAP4 DLGA_281-301-KE AAGTGAACAAGGGACGCTGAC 3757
ELMO2 ELMO_53-72-KE TGCCACCACCGTCAGACATT 3758
ENTPD1 ENTP_79-97-KE TTGCTTGCTGTGGGGTTGAC 3759
ERGIC3 ERGI_128-147-KE GAAGGCTGCCAGGTGTATGG 3760
GNAQ GNAQ_143-164-KE CATGGACACACTCAAGATCCCA 3761
KIAA1524 KIAA_107-129-KE GGGATTTGGAACAAAGGTTGCAG 3762
KIAA1715 KIAA_2-26 TGAAGCATTGGATGATTTAAAATCC 3763
L3MBTL2 L3MB_47-67-KE TTACAAGGCTGCTCCCGTCAG 3764
LRRC42 LRCC_190-211 CCAGTGAATACTAGAGGGATCG 3765
MAN1A2 MAN1_24-46-KE ATTGGCTGAGAAACTCCTTCCTG 3766
MMS19 MMS1_22-45-KE CAGTGTTACAAGTTGTGGAAGCCC 3767
PMS1 PMS1_104-127-KE TCTCCTCATGAGCTTTGGTATCCT 3768
POMT2 POMT_10-29 ACCCTTCCTTCCCAGTGGAG 3769
PRPF31 RPRF_50-69-KE GCCAACCGTATGAGCTTCGG 3770
SKP1 SKP1_56-75 TCTTCCTTCGCTAACGCCTC 3771
STRN STRN_84-105-KE GAGAGAAAGGGGAAAAAGGGGG 3772
STRN4 STRN_33-52-4a-KE GAGAACAGCCCGTTGGTGTG 3773
SUPT20H SUPT_8-30-KE AGCAAGGTTCAACCAGTCAAGAA 3774
TMEM214 TMEM_55-75 CCCACTTCTGGACTTTGCCTA 3775
UBAP2L UBAP_60-79-KE CCCTTTCCAACAGCCGAGTG 3776
VDAC2 VDAC_25-48 ATTGGAGTAGGCTATACTCAGACT 3777
VPS29 VPS2_12-31-KE CGACGGTGGTGGTGACTGAG 3778
表20–图5的引物
Figure BDA0002383691000003862
Figure BDA0002383691000003871
结果:根据用24nM(表21)和100nM(表22)的化合物64处理的SH-SY5Y细胞和用100nM(表23)化合物64处理的HD-1994人正常成纤维细胞系细胞中的Fisher精确检验(FET)得到的RNA-seq数据iExon产生(ΔPSI),各自提供了基因表达的基于Log2的倍数变化(Log2FC),其中NA表示“不可用”。HD1994细胞中的RNA-seq数据分析获得自Palacino等人(Nat.Chem.Bio.,2015,(11)511-517;NCBI-SRA登录号SRP055454)。
确定的RNA转录物的调节的表达的ΔPSI在表21、表22和表23中用星号表示,其中一个星号(*)表示表达变化≤25%,其中两个星号(**)表示表达变化在>25%至≤50%变化的范围内,其中三个星号(***)表示表达变化在>50%至≤75%变化的范围内,并且其中四个星号(****)表示表达变化在>75%至≤100%变化的范围内。
表21.在24nm下的SHSY5Y细胞中的化合物作用
Figure BDA0002383691000003872
Figure BDA0002383691000003881
Figure BDA0002383691000003891
Figure BDA0002383691000003901
Figure BDA0002383691000003911
表22.在100nm下的SHSY5Y细胞中的化合物作用
Figure BDA0002383691000003912
Figure BDA0002383691000003921
Figure BDA0002383691000003931
Figure BDA0002383691000003941
Figure BDA0002383691000003951
Figure BDA0002383691000003961
表23.在100nm下的HD-1994细胞中的化合物作用
Figure BDA0002383691000003962
Figure BDA0002383691000003971
Figure BDA0002383691000003981
Figure BDA0002383691000003991
Figure BDA0002383691000004002
表24中显示了来自表21、表22和表23的受影响基因中产生的iExon的位置的细节。
表24.基因坐标
Figure BDA0002383691000004001
Figure BDA0002383691000004011
Figure BDA0002383691000004021
Figure BDA0002383691000004031
Figure BDA0002383691000004041
Figure BDA0002383691000004051
Figure BDA0002383691000004061
Figure BDA0002383691000004071
Figure BDA0002383691000004081
Figure BDA0002383691000004091
Figure BDA0002383691000004101
Figure BDA0002383691000004111
表25中显示了在表24中所示坐标处在某些受影响的基因中产生的iExon的序列。在某些情况下,对iExon序列的量和类型的检测和分析是有用的生物标志物,其是由于使细胞与本文所述的化合物接触或向有此需要的对象施用本文所述的化合物而产生的。
表25.基因序列
Figure BDA0002383691000004112
Figure BDA0002383691000004121
Figure BDA0002383691000004131
Figure BDA0002383691000004141
Figure BDA0002383691000004151
Figure BDA0002383691000004161
Figure BDA0002383691000004171
Figure BDA0002383691000004181
Figure BDA0002383691000004191
Figure BDA0002383691000004201
Figure BDA0002383691000004211
Figure BDA0002383691000004221
Figure BDA0002383691000004231
Figure BDA0002383691000004241
Figure BDA0002383691000004251
Figure BDA0002383691000004261
结果:对于某些基因,其中剪接修饰的值可能已经被认为是统计上不显著的,在那些情况下,这些值促使人工检查RNAseq数据中包含iExon产生的可能性。显示有定性读数支持iExon包含的那些事件随后通过终点PCR进行验证。如本文所示,已经针对大量目标证明并验证了iExon的存在。
应当理解,尽管出于说明的目的已经在本文中描述了本发明的特定方面,但是本文所描述的发明在范围上不受本文所公开的特定方面的限制。这些方面旨在作为本发明的几个方面的说明。任何等同方面都意图在本发明的范围内。实际上,根据前面的描述,除了本文中示出和描述的那些之外,本发明的各种修改对于本领域技术人员而言将变得显而易见,该修改也意图在本发明的范围内。
本文引用的所有参考文献通过整体引用并出于所有目的并入本文,就如同每个单独的出版物或专利或专利申请被具体地并单独地指出出于所有目的通过整体引用并入本文。

Claims (5)

1.一种用于修饰RNA剪接以产生具有iExon的成熟mRNA转录物的方法,所述方法包括使前体mRNA转录物与式(I)的化合物或其形式接触,其中所述前体mRNA转录物包含两个外显子和内含子,其中第一外显子在所述内含子的上游,并且第二外显子在所述内含子的下游,其中所述内含子按5’至3’顺序包含:第一5’剪接位点、第一分支点、第一3’剪接位点、剪接修饰剂的内含子识别元件(iREMS)、第二分支点和第二3’剪接位点,其中所述iREMS包含RNA序列GAgurngn,其中r为腺嘌呤或鸟嘌呤,n为任何核苷酸,并且其中式(I)为:
Figure FDA0002383690990000011
或其形式,其中
W为CH=CH或S;
X为CH2、CH(C1-4烷基)、C(C1-4烷基)2、CH=CH、O、NR5或键;
A为芳基、杂芳基、杂环基或C9-10环烷基,
其中芳基选自苯基和萘基,其各自任选地被1、2、3或4个各自选自R1的取代基取代,
其中杂芳基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R1的取代基取代,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员饱和或部分不饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R2的取代基取代,和
其中C9-10环烷基为任选地被1、2、3、4或5个各自选自R2的取代基取代的饱和或部分不饱和二环环系;
B为杂环基,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或多环环系,其各自任选地被1、2、3、4或5个各自选自R4的取代基取代;
R1为卤素、羟基、氰基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、杂环基-C1-4烷氧基、苯基或苯基-C1-4烷氧基,
其中杂芳基为具有1、2或3个选自N、O和S的杂原子环成员的饱和单环或二环环系,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中苯基、杂芳基或杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R2为卤素、羟基、氰基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、羟基-C1-4烷基、C1-4烷氧基、C1-4烷氧基-羰基、C2-4烯基、C3-7环烷基或杂环基-C1-4烷基,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R3为卤素、羟基、硝基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、苯基或苯基-C1-4烷氧基;
R4独立地选自卤素、C1-4烷基、羟基-C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基或羟基-C1-4烷基-氨基;和
R5为氢、C1-4烷基或羟基-C1-4烷基;
其中所述化合物的形式选自其前药、盐、水合物、溶剂化物、包合物、同位素体、外消旋体、对映异构体、非对映异构体、立体异构体、多晶型物和互变异构体形式。
2.一种用于修饰RNA剪接以调节由前体mRNA转录物产生的成熟mRNA转录物的量的方法,所述方法包括使前体mRNA转录物与式(I)的化合物或其形式接触,其中所述前体mRNA转录物包含两个外显子和内含子,其中第一外显子在内含子的上游,并且第二外显子在内含子的下游,其中所述内含子包含RNA核苷酸序列,所述核苷酸序列按5’至3’顺序包含:剪接修饰剂的内含子识别元件(iREMS)、分支点和3’剪接位点,其中所述iREMS包含RNA序列GAgurngn,其中r为腺嘌呤或鸟嘌呤,n为任何核苷酸,并且其中式(I)为:
Figure FDA0002383690990000031
或其形式,其中
W为CH=CH或S;
X为CH2、CH(C1-4烷基)、C(C1-4烷基)2、CH=CH、O、NR5或键;
A为芳基、杂芳基、杂环基或C9-10环烷基,
其中芳基选自苯基和萘基,其各自任选地被1、2、3或4个各自选自R1的取代基取代,
其中杂芳基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R1的取代基取代,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R2的取代基取代,和
其中C9-10环烷基为任选地被1、2、3、4或5个各自选自R2的取代基取代的饱和或部分不饱和二环环系;
B为杂环基,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或多环环系,其各自任选地被1、2、3、4或5个各自选自R4的取代基取代;
R1为卤素、羟基、氰基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、杂环基-C1-4烷氧基、苯基或苯基-C1-4烷氧基,
其中杂芳基为具有1、2或3个选自N、O和S的杂原子环成员的饱和单环或二环环系,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中苯基、杂芳基或杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R2为卤素、羟基、氰基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、羟基-C1-4烷基、C1-4烷氧基、C1-4烷氧基-羰基、C2-4烯基、C3-7环烷基或杂环基-C1-4烷基,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R3为卤素、羟基、硝基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、苯基或苯基-C1-4烷氧基;
R4独立地选自卤素、C1-4烷基、羟基-C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基或羟基-C1-4烷基-氨基;和
R5为氢、C1-4烷基或羟基-C1-4烷基;
其中化合物的形式选自其前药、盐、水合物、溶剂化物、包合物、同位素体、外消旋体、对映异构体、非对映异构体、立体异构体、多晶型物和互变异构体形式。
3.权利要求1或2所述的方法,其中所述iREMS包含RNA序列GAguragu,并且其中r为腺嘌呤或鸟嘌呤。
4.权利要求1或2所述的方法,其中所述iREMS包含RNA序列NNGAgurngn(SEQ ID NO:1),其中r为腺嘌呤或鸟嘌呤,n或N为任何核苷酸,并且其中所述RNA序列NNGAgurngn(SEQ IDNO:1)选自:ANGAgurngn(SEQ ID NO:4)、CNGAgurngn(SEQ ID NO:5)、GNGAgurngn(SEQ IDNO:6)、UNGAgurngn(SEQ ID NO:7)、NAGAgurngn(SEQ ID NO:8)、NCGAgurngn(SEQ ID NO:9)、NGGAgurngn(SEQ ID NO:10)、NUGAgurngn(SEQ ID NO:11)、AAGAgurngn(SEQ ID NO:12)、ACGAgurngn(SEQ ID NO:13)、AGGAgurngn(SEQ ID NO:14)、AUGAgurngn(SEQ ID NO:15)、CAGAgurngn(SEQ ID NO:16)、CCGAgurngn(SEQ ID NO:17)、CGGAgurngn(SEQ ID NO:18)、CUGAgurngn(SEQ ID NO:19)、GAGAgurngn(SEQ ID NO:20)、GCGAgurngn(SEQ ID NO:21)、GGGAgurngn(SEQ ID NO:22)、GUGAgurngn(SEQ ID NO:23)、UAGAgurngn(SEQ ID NO:24)、UCGAgurngn(SEQ ID NO:25)、UGGAgurngn(SEQ ID NO:52)和UUGAgurngn(SEQ ID NO:53),其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸。
5.权利要求1或2所述的方法,其中所述iREMS包含RNA序列NNGAguragu(SEQ ID NO:2),其中r为腺嘌呤或鸟嘌呤,N为任何核苷酸,并且其中所述RNA序列NNGAguragu(SEQ ID NO:2)选自:ANGAguragu(SEQ ID NO:28)、CNGAguragu(SEQ ID NO:29)、GNGAguragu(SEQ IDNO:30)、UNGAguragu(SEQ ID NO:31)、NAGAguragu(SEQ ID NO:32)、NCGAguragu(SEQ IDNO:33)、NGGAguragu(SEQ ID NO:34)、NUGAguragu(SEQ ID NO:35)、AAGAguragu(SEQ IDNO:36)、ACGAguragu(SEQ ID NO:37)、AGGAguragu(SEQ ID NO:38)、AUGAguragu(SEQ IDNO:39)、CAGAguragu(SEQ ID NO:40)、CCGAguragu(SEQ ID NO:41)、CGGAguragu(SEQ IDNO:42)、CUGAguragu(SEQ ID NO:43)、GAGAguragu(SEQ ID NO:44)、GCGAguragu(SEQ IDNO:45)、GGGAguragu(SEQ ID NO:46)、GUGAguragu(SEQ ID NO:47)、UAGAguragu(SEQ IDNO:48)、UCGAguragu(SEQ ID NO:49)、UGGAguragu(SEQ ID NO:489)和UUGAguragu(SEQ IDNO:508),其中r为腺嘌呤或鸟嘌呤,并且N为任何核苷酸。
CN201880052678.0A 2017-06-14 2018-06-13 修饰rna剪接的方法 Pending CN111372611A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201762519226P 2017-06-14 2017-06-14
US62/519,226 2017-06-14
PCT/US2018/037412 WO2018232039A1 (en) 2017-06-14 2018-06-13 Methods for modifying rna splicing

Publications (1)

Publication Number Publication Date
CN111372611A true CN111372611A (zh) 2020-07-03

Family

ID=64659912

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201880052678.0A Pending CN111372611A (zh) 2017-06-14 2018-06-13 修饰rna剪接的方法

Country Status (11)

Country Link
US (1) US11608501B2 (zh)
EP (1) EP3638318A4 (zh)
JP (1) JP2020523365A (zh)
KR (1) KR20200017476A (zh)
CN (1) CN111372611A (zh)
AU (1) AU2018284853A1 (zh)
BR (1) BR112019026508A2 (zh)
CA (1) CA3065547A1 (zh)
EA (1) EA202090034A1 (zh)
IL (1) IL271053A (zh)
WO (1) WO2018232039A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111194215A (zh) * 2017-08-04 2020-05-22 斯基霍克疗法公司 用于调节剪接的方法和组合物

Families Citing this family (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4249472A3 (en) 2015-05-30 2023-12-13 PTC Therapeutics, Inc. Methods for modulating rna splicing
EA201991309A1 (ru) 2016-11-28 2019-11-29 Способы модуляции сплайсинга рнк
JP2020523365A (ja) 2017-06-14 2020-08-06 ピーティーシー セラピューティクス,インコーポレーテッド Rnaスプライシングを改変する方法
JP2021506978A (ja) 2017-12-22 2021-02-22 ラヴェンナ ファーマシューティカルズ,インコーポレイテッド ホスファチジルイノシトールリン酸キナーゼ阻害剤としてのアミノピリジン誘導体
KR20210135242A (ko) * 2019-02-04 2021-11-12 스카이호크 테라퓨틱스, 인코포레이티드 스플라이싱을 조절하는 방법 및 조성물
CN113692402A (zh) * 2019-02-04 2021-11-23 斯基霍克疗法公司 用于调节剪接的方法和组合物
WO2020163382A1 (en) * 2019-02-04 2020-08-13 Skyhawk Therapeutics, Inc. Methods and compositions for modulating splicing
WO2020163248A1 (en) * 2019-02-04 2020-08-13 Skyhawk Therapeutics, Inc. Methods and compositions for modulating splicing
JP2022521467A (ja) * 2019-02-05 2022-04-08 スカイホーク・セラピューティクス・インコーポレーテッド スプライシングを調節するための方法および組成物
WO2020163401A1 (en) * 2019-02-05 2020-08-13 Skyhawk Therapeutics, Inc. Methods and compositions for modulating splicing
JP2022520051A (ja) * 2019-02-05 2022-03-28 スカイホーク・セラピューティクス・インコーポレーテッド スプライシングを調節するための方法および組成物
WO2020163409A1 (en) * 2019-02-05 2020-08-13 Skyhawk Therapeutics, Inc. Methods and compositions for modulating splicing
KR20210135239A (ko) * 2019-02-05 2021-11-12 스카이호크 테라퓨틱스, 인코포레이티드 스플라이싱을 조절하는 방법 및 조성물
EP3920928A4 (en) * 2019-02-06 2022-09-28 Skyhawk Therapeutics, Inc. METHODS AND COMPOSITIONS FOR MODULATION OF SPLICING
KR20210135511A (ko) * 2019-02-06 2021-11-15 스카이호크 테라퓨틱스, 인코포레이티드 스플라이싱을 조절하는 방법 및 조성물
AR119731A1 (es) 2019-05-17 2022-01-05 Novartis Ag Inhibidores del inflamasoma nlrp3
WO2020248018A1 (en) * 2019-06-14 2020-12-17 Children's Medical Research Institute Methods of treating cancer with an inhibitor of znf827
US11129829B2 (en) * 2019-06-17 2021-09-28 Skyhawk Therapeutics, Inc. Methods for modulating splicing
TW202112767A (zh) 2019-06-17 2021-04-01 美商佩特拉製藥公司 作為磷脂酸肌醇磷酸激酶抑制劑之胺基吡啶衍生物
JP2023500251A (ja) 2019-11-01 2023-01-05 ノバルティス アーゲー ハンチントン病の進行を遅らせる処置のためのスプライシングモジュレーターの使用
WO2021126779A1 (en) * 2019-12-18 2021-06-24 The Regents Of The University Of California Inhibitors of lin28 and methods of use thereof
WO2021138678A1 (en) * 2020-01-02 2021-07-08 The General Hospital Corporation Rna splicing modulation
US20230140983A1 (en) 2020-02-28 2023-05-11 Remix Therapeutics Inc. Pyridazine derivatives for modulating nucleic acid splicing
AU2021228770A1 (en) 2020-02-28 2022-09-29 Remix Therapeutics Inc. Thiophenyl derivatives useful for modulating nucleic acid splicing
WO2021174167A1 (en) 2020-02-28 2021-09-02 Remix Therapeutics Inc. Compounds and methods for modulating splicing
WO2021174164A1 (en) 2020-02-28 2021-09-02 Remix Therapeutics Inc. Compounds and methods for modulating splicing
WO2021207550A1 (en) 2020-04-08 2021-10-14 Remix Therapeutics Inc. Compounds and methods for modulating splicing
MX2022012678A (es) 2020-04-08 2023-01-11 Remix Therapeutics Inc Compuestos y metodos para modular el corte y empalme.
TW202208358A (zh) 2020-05-13 2022-03-01 美商Chdi基金會股份有限公司 用於治療亨汀頓舞蹈症之htt調節劑
CN116157135A (zh) * 2020-06-03 2023-05-23 纽约市哥伦比亚大学理事会 使用基于crispr的碱基编辑器系统抑制谱系特异性抗原的组合物和方法
BR112022027107A2 (pt) 2020-07-02 2023-03-14 Remix Therapeutics Inc Derivados de 2-(indazol-5-il)-6-(piperidin-4-il)-1,7-naftiridina e compostos relacionados como moduladores para splicing de ácidos nucleicos e para o tratamento de doenças proliferativas
AU2021300260A1 (en) 2020-07-02 2023-02-09 Remix Therapeutics Inc. 5-[5-(piperidin-4-yl)thieno[3,2-c]pyrazol-2-yl]indazole derivatives and related compounds as modulators for splicing nucleic acids and for the treatment of proliferative diseases
WO2022093835A1 (en) * 2020-10-26 2022-05-05 Remix Therapeutics Inc. Oligonucleotides useful for modulation of splicing
EP4244362A1 (en) * 2020-11-12 2023-09-20 PTC Therapeutics, Inc. Novel rna transcript
WO2022204471A1 (en) * 2021-03-26 2022-09-29 Ptc Therapeutics Inc. Regulation of transgene expression using a small molecule inducible splicing switch
WO2023034836A1 (en) 2021-08-30 2023-03-09 Remix Therapeutics Inc. Compounds and methods for modulating splicing
EP4396177A1 (en) 2021-08-30 2024-07-10 Remix Therapeutics Inc. Compounds and methods for modulating splicing
EP4395889A1 (en) 2021-08-30 2024-07-10 Remix Therapeutics Inc. Compounds and methods for modulating splicing
IL311135A (en) 2021-08-30 2024-04-01 Remix Therapeutics Inc Splicing Modulation Compounds and Methods
CA3230256A1 (en) 2021-08-30 2023-03-09 Dominic Reynolds Compounds and methods for modulating splicing
CA3233973A1 (en) 2021-10-13 2023-04-20 Dominic Reynolds Compounds and methods for modulating nucleic acid splicing
TW202330552A (zh) 2021-10-13 2023-08-01 美商雷密克斯醫療公司 調節剪接之化合物及方法
TW202337442A (zh) 2022-01-05 2023-10-01 美商雷密克斯醫療公司 用於調節剪切之化合物及方法
WO2023133225A1 (en) 2022-01-05 2023-07-13 Remix Therapeutics Inc. Compounds and methods for modulating splicing
WO2023133229A2 (en) 2022-01-05 2023-07-13 Remix Therapeutics Inc. Compounds and methods for modulating splicing

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170001995A1 (en) * 2015-02-09 2017-01-05 Hoffmann-La Roche Inc. Compounds for the treatment of cancer

Family Cites Families (60)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3558618A (en) 1968-04-01 1971-01-26 Dow Chemical Co Novel 4h-pyrazino(1,2-a)pyrimidine-4-ones
US4122274A (en) 1977-05-25 1978-10-24 Bristol-Myers Company 3-Tetrazolo-5,6,7,8-substituted-pyrido[1,2-a]pyrimidin-4-ones
US4342870A (en) 1980-03-28 1982-08-03 Janssen Pharmaceutica N.V. Novel 3-(1-piperidinylalkyl)-4H-pyrido[1,2-a]pyrimidin-4-one derivatives
JPS56150091A (en) 1980-03-28 1981-11-20 Janssen Pharmaceutica Nv 3-(1-piperidinylalkyl)-4h-pyrido(1,2-a)pyrimidine- 4-one derivative and its manufacture
US5089633A (en) 1987-04-28 1992-02-18 Georgia Tech Research Corporation Substituted isocoumarins
US5726182A (en) 1990-05-02 1998-03-10 Abbott Laboratories Quinolizinone type compounds
AU4231293A (en) 1992-05-13 1993-12-13 E.I. Du Pont De Nemours And Company Substituted pyrido(1,2-A)pyrimidinone derivatives as fungicides
IL122296A0 (en) 1995-06-06 1998-04-05 Abbott Lab Quinolizinone type compounds
US5869500A (en) 1996-12-13 1999-02-09 Hoffmann-La Roche Inc. Pyridone compounds useful in treating Alzheimer's disease
EP1115724A1 (en) 1998-09-21 2001-07-18 Shire Biochem Inc. Quinolizinones as integrin inhibitors
WO2001030757A1 (fr) 1999-10-28 2001-05-03 Microcide Pharmaceuticals, Inc. Inhibiteurs de la pompe par liberation de medicaments
ATE363471T1 (de) 2000-01-24 2007-06-15 Astrazeneca Ab Durch einen morpholinrest substituierte therapeutische verbindungen
WO2002053576A1 (en) 2001-01-05 2002-07-11 The General Hospital Corporation Viral delivery system for infectious transfer of large genomic dna inserts
WO2002087589A1 (fr) 2001-04-26 2002-11-07 Daiichi Pharmaceutical Co., Ltd. Medicament permettant d'inhiber une pompe d'elimination de medicament
DE60236322D1 (de) 2001-12-07 2010-06-17 Vertex Pharma Verbindungen auf pyrimidin-basis als gsk-3-hemmer
GB0205281D0 (en) 2002-03-06 2002-04-17 Novartis Ag Organic compounds
WO2004009558A2 (en) 2002-07-24 2004-01-29 Ptc Therapeutics, Inc. Ureido substituted benzoic acid compounds, their use for nonsense suppression and the treatment of diseases caused by such mutations
US9068234B2 (en) 2003-01-21 2015-06-30 Ptc Therapeutics, Inc. Methods and agents for screening for compounds capable of modulating gene expression
MXPA05013142A (es) 2003-06-20 2006-03-17 Chiron Corp Compuestos de piridinio [1,2-a]pirimidin-4-ona como agentes anticancer.
BRPI0510560A (pt) 2004-05-04 2007-11-20 Warner Lambert Co pirido[2,3-d] pirimidin-7-onas pirrolil substituìdas e seus derivados como agentes terapêuticos
EP1846397A1 (en) 2005-01-21 2007-10-24 Janssen Pharmaceutica N.V. Novel heterocyclic benzoy[c]chromene derivatives useful as modulators of the estrogen receptors
US7563601B1 (en) 2005-06-01 2009-07-21 City Of Hope Artificial riboswitch for controlling pre-mRNA splicing
EP1910569A4 (en) 2005-06-17 2009-08-05 Genizon Biosciences Inc GENEMAP GENE CARD OF HUMAN GENES ASSOCIATED WITH LONGEVITY
WO2007085906A2 (en) 2005-10-13 2007-08-02 Bc Cancer Agency Functional mutant loxp sequences and uses thereof
AR059339A1 (es) 2006-02-09 2008-03-26 Chugai Pharmaceutical Co Ltd Derivados de la cumarina para trastornos proliferativos de celulas, composicion farmaceutica y agente terapeutico que los contiene
US8110681B2 (en) 2006-03-17 2012-02-07 The United States Of America As Represented By The Secretary, Department Of Health And Human Services Compounds for the treatment of spinal muscular atrophy and other uses
US8337941B2 (en) 2006-07-27 2012-12-25 The Trustees Of Columbia University In The City Of New York Fluorescent substrates for monoamine transporters as optical false neurotransmitters
NZ577491A (en) 2006-12-22 2011-06-30 Avexa Ltd 2-heteroaryl-3-hydroxy-4-oxo-pyrido[1,2-a]pyrimidines and uses thereof
US8633019B2 (en) 2008-05-27 2014-01-21 Ptc Therapeutics, Inc. Methods for treating spinal muscular atrophy
EP2138493A1 (en) 2008-06-26 2009-12-30 Sanofi-Aventis Substituted pyrimidone derivatives
PL2212324T3 (pl) 2008-07-02 2014-11-28 Avexa Ltd Związki posiadające właściwości przeciwwirusowe
US8986935B2 (en) 2008-08-13 2015-03-24 Ptc Therapeutics, Inc. Methods for treating spinal muscular atrophy
EP2381965B1 (en) 2009-01-14 2020-05-06 Drexel University Modulation of pre-mrna using splice modulating oligonucleotides as therapeutic agents in the treatment of disease
US20100303776A1 (en) 2009-04-16 2010-12-02 The University Of North Carolina At Chapel Hill Methods and compositions for regulated expression of multiple nucleic acids
WO2011050245A1 (en) 2009-10-23 2011-04-28 Yangbo Feng Bicyclic heteroaryls as kinase inhibitors
EP2501231B1 (en) 2009-11-20 2016-12-21 Merck Sharp & Dohme Corp. Quinolizidinone carboxamide m1 receptor positive allosteric modulators
AU2011206761A1 (en) 2010-01-13 2012-07-12 Institut National De La Sante Et De La Recherche Medicale (Inserm) Anti - infective pyrido (1,2 -a) pyrimidines
US8962842B2 (en) 2010-09-27 2015-02-24 Evolva Sa 2-pyridone antimicrobial compositions
WO2013059606A1 (en) 2011-10-21 2013-04-25 Tufts Medical Center, Inc. Compounds and methods for the treatment of muscular disease, and related screening methods
MX352861B (es) 2011-12-30 2017-12-13 Ptc Therapeutics Inc Compuestos para tratar la atrofia muscular espinal.
EP2809322B9 (en) 2012-01-26 2019-10-30 PTC Therapeutics, Inc. Compounds for treating spinal muscular atrophy
EP3406252B1 (en) 2012-02-10 2020-05-13 PTC Therapeutics, Inc. Compounds for treating spinal muscular atrophy
EA029155B1 (ru) 2012-03-01 2018-02-28 ПиТиСи ТЕРАПЬЮТИКС, ИНК. Соединения для лечения спинальной мышечной атрофии
CN104470909B (zh) 2012-03-23 2018-04-24 Ptc医疗公司 用于治疗脊髓性肌萎缩的化合物
US9212209B2 (en) 2012-07-13 2015-12-15 Indiana University Research And Technology Corporation Screening methods for spinal muscular atrophy
US8729263B2 (en) 2012-08-13 2014-05-20 Novartis Ag 1,4-disubstituted pyridazine analogs there of and methods for treating SMN-deficiency-related conditions
US9040712B2 (en) 2013-01-23 2015-05-26 Novartis Ag Thiadiazole analogs thereof and methods for treating SMN-deficiency-related-conditions
EA030631B1 (ru) 2013-07-31 2018-09-28 Новартис Аг 1,4-дизамещенные аналоги пиридазинхинолина и способы лечения состояний, связанных с smn-дефицитом
MX2016001963A (es) 2013-08-19 2016-05-26 Hoffmann La Roche Metodo de seleccion.
WO2015095446A1 (en) 2013-12-19 2015-06-25 Ptc Therapeutics, Inc. Methods for modulating the amount of rna transcripts
WO2015095449A1 (en) 2013-12-19 2015-06-25 Ptc Therapeutics, Inc. Methods for modulating the amount rna transcripts
EP3082820B1 (en) 2013-12-19 2022-07-20 PTC Therapeutics, Inc. Methods for modulating the amount of rna transcripts
EP4241772A3 (en) 2014-05-15 2023-11-15 F. Hoffmann-La Roche AG Process for the preparation of compounds useful for treating spinal muscular atrophy
WO2016042015A1 (en) 2014-09-16 2016-03-24 Centre National De La Recherche Scientifique (Cnrs) Method for evaluating developmental competence of an oocyte
JP6749343B2 (ja) 2015-05-20 2020-09-02 エフ.ホフマン−ラ ロシュ アーゲーF. Hoffmann−La Roche Aktiengesellschaft 脊髄性筋萎縮症を処置するための化合物
EP4249472A3 (en) 2015-05-30 2023-12-13 PTC Therapeutics, Inc. Methods for modulating rna splicing
EA201991309A1 (ru) 2016-11-28 2019-11-29 Способы модуляции сплайсинга рнк
JP2020523365A (ja) 2017-06-14 2020-08-06 ピーティーシー セラピューティクス,インコーポレーテッド Rnaスプライシングを改変する方法
RU2020105929A (ru) 2017-08-04 2021-09-06 Скайхоук Терапьютикс, Инк. Способы и композиции для модулирования сплайсинга
JP7195328B2 (ja) 2017-09-25 2022-12-23 スカイホーク・セラピューティクス・インコーポレーテッド スプライシングモジュレーターのスクリーニングおよび特定を行うための方法および組成物

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170001995A1 (en) * 2015-02-09 2017-01-05 Hoffmann-La Roche Inc. Compounds for the treatment of cancer

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
ALYSSA N. CALDERA等: "Small Molecules in Development for the Treatment of Spinal Muscular Atrophy" *
J AMES PALACINO等: "S MN2 splice modulators enhance U1–pre-mRNA association and rescue SMA mice" *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111194215A (zh) * 2017-08-04 2020-05-22 斯基霍克疗法公司 用于调节剪接的方法和组合物
CN111499615A (zh) * 2017-08-04 2020-08-07 斯基霍克疗法公司 用于调节剪接的方法和组合物
CN111499615B (zh) * 2017-08-04 2024-02-02 斯基霍克疗法公司 用于调节剪接的方法和组合物
CN111194215B (zh) * 2017-08-04 2024-03-01 斯基霍克疗法公司 用于调节剪接的方法和组合物

Also Published As

Publication number Publication date
KR20200017476A (ko) 2020-02-18
BR112019026508A2 (pt) 2020-07-14
EA202090034A1 (ru) 2020-04-16
IL271053A (en) 2020-01-30
CA3065547A1 (en) 2018-12-20
WO2018232039A1 (en) 2018-12-20
EP3638318A1 (en) 2020-04-22
EP3638318A4 (en) 2021-03-17
US11608501B2 (en) 2023-03-21
AU2018284853A1 (en) 2019-12-19
JP2020523365A (ja) 2020-08-06
US20200370043A1 (en) 2020-11-26

Similar Documents

Publication Publication Date Title
CN111372611A (zh) 修饰rna剪接的方法
US11602567B2 (en) Methods for modulating RNA splicing
US11446398B2 (en) Regulated biocircuit systems
US20230272367A1 (en) Methods for modulating rna splicing
US8597949B2 (en) Methods and compositions for modulating RAD51 and homologous recombination
US10688099B2 (en) Methods for modulating the amount of RNA transcripts
BR112020002270A2 (pt) métodos e composições para modular o splicing
EP3700527A1 (en) Papd5 inhibitors and methods of use thereof
CN115515679A (zh) 杂环酰胺及其用于调节剪接的用途
KR102117016B1 (ko) Crispr 시스템 기능 향상 방법 및 그의 이용
AU2019414608A1 (en) Oligomeric nucleic acid molecule and application thereof
WO2022006550A1 (en) 2-(indazol-5-yl)-6-(piperidin-4-yl)-1,7-naphthyridine derivatives and related compounds as modulators for splicing nucleic acids and for the treatment of proliferative diseases
Cook et al. A strike against indolent neuroblastoma
EP3732301A1 (en) Methods of cancer treatment using an atr inhibitor
CN114634928B (zh) 一种降低stat3转录功能的核酸片段及其制药用途
WO2022204471A1 (en) Regulation of transgene expression using a small molecule inducible splicing switch
KR20240087568A (ko) HCV/miR-122 활성 이중계측 발광플랫폼 및 도출물질 리고세르팁의 소포스부비어 저항성 HCV 치료 용도
WO2024036143A2 (en) Methods for modulating rna splicing

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20200703