CN111372611A - 修饰rna剪接的方法 - Google Patents
修饰rna剪接的方法 Download PDFInfo
- Publication number
- CN111372611A CN111372611A CN201880052678.0A CN201880052678A CN111372611A CN 111372611 A CN111372611 A CN 111372611A CN 201880052678 A CN201880052678 A CN 201880052678A CN 111372611 A CN111372611 A CN 111372611A
- Authority
- CN
- China
- Prior art keywords
- alkyl
- amino
- carbonyl
- radical
- alkoxy
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 161
- 150000001875 compounds Chemical class 0.000 claims abstract description 217
- 239000002243 precursor Substances 0.000 claims abstract description 79
- 239000003607 modifier Substances 0.000 claims abstract description 36
- 150000003254 radicals Chemical class 0.000 claims description 1021
- -1 C3-7Cycloalkyl radical Chemical class 0.000 claims description 278
- 239000002773 nucleotide Substances 0.000 claims description 277
- 125000003729 nucleotide group Chemical group 0.000 claims description 277
- 125000001424 substituent group Chemical group 0.000 claims description 257
- 125000005842 heteroatom Chemical group 0.000 claims description 230
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims description 206
- 125000000623 heterocyclic group Chemical group 0.000 claims description 200
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical group O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 claims description 184
- 125000002950 monocyclic group Chemical group 0.000 claims description 154
- 229910052760 oxygen Inorganic materials 0.000 claims description 152
- 229910052717 sulfur Inorganic materials 0.000 claims description 152
- 229920006395 saturated elastomer Polymers 0.000 claims description 127
- 229910052757 nitrogen Inorganic materials 0.000 claims description 114
- 108020005067 RNA Splice Sites Proteins 0.000 claims description 110
- 125000001072 heteroaryl group Chemical group 0.000 claims description 110
- GOJUJUVQIVIZAV-UHFFFAOYSA-N 2-amino-4,6-dichloropyrimidine-5-carbaldehyde Chemical group NC1=NC(Cl)=C(C=O)C(Cl)=N1 GOJUJUVQIVIZAV-UHFFFAOYSA-N 0.000 claims description 106
- 229910052736 halogen Inorganic materials 0.000 claims description 106
- 150000002367 halogens Chemical class 0.000 claims description 106
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 claims description 106
- 125000001997 phenyl group Chemical group [H]C1=C([H])C([H])=C(*)C([H])=C1[H] 0.000 claims description 105
- 229930024421 Adenine Natural products 0.000 claims description 92
- 229960000643 adenine Drugs 0.000 claims description 92
- GFFGJBXGBJISGV-UHFFFAOYSA-N adenyl group Chemical group N1=CN=C2N=CNC2=C1N GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 claims description 92
- 125000002619 bicyclic group Chemical group 0.000 claims description 81
- 125000003917 carbamoyl group Chemical group [H]N([H])C(*)=O 0.000 claims description 79
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 63
- 125000003118 aryl group Chemical group 0.000 claims description 55
- 125000004093 cyano group Chemical group *C#N 0.000 claims description 54
- 125000004122 cyclic group Chemical group 0.000 claims description 54
- 108020004999 messenger RNA Proteins 0.000 claims description 54
- 125000003830 C1- C4 alkylcarbonylamino group Chemical group 0.000 claims description 53
- 125000003545 alkoxy group Chemical group 0.000 claims description 53
- 125000000217 alkyl group Chemical group 0.000 claims description 53
- 125000004043 oxo group Chemical group O=* 0.000 claims description 52
- 108700024394 Exon Proteins 0.000 claims description 41
- 238000011144 upstream manufacturing Methods 0.000 claims description 33
- 125000004178 (C1-C4) alkyl group Chemical group 0.000 claims description 27
- 125000006272 (C3-C7) cycloalkyl group Chemical group 0.000 claims description 27
- 125000001624 naphthyl group Chemical group 0.000 claims description 27
- 125000003282 alkyl amino group Chemical group 0.000 claims description 26
- 229910052739 hydrogen Inorganic materials 0.000 claims description 26
- 239000001257 hydrogen Substances 0.000 claims description 26
- 125000004435 hydrogen atom Chemical class [H]* 0.000 claims description 26
- 125000000449 nitro group Chemical group [O-][N+](*)=O 0.000 claims description 26
- 239000000651 prodrug Substances 0.000 claims description 26
- 229940002612 prodrug Drugs 0.000 claims description 26
- 150000003839 salts Chemical class 0.000 claims description 26
- 239000012453 solvate Substances 0.000 claims description 26
- 108091027974 Mature messenger RNA Proteins 0.000 claims description 19
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 claims description 19
- 125000001475 halogen functional group Chemical group 0.000 claims 10
- 125000004356 hydroxy functional group Chemical group O* 0.000 claims 6
- 108090000623 proteins and genes Proteins 0.000 abstract description 211
- 102000004169 proteins and genes Human genes 0.000 abstract description 57
- 150000003384 small molecules Chemical class 0.000 abstract description 28
- 125000005843 halogen group Chemical group 0.000 description 115
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 74
- 108020004414 DNA Proteins 0.000 description 48
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 48
- 201000010099 disease Diseases 0.000 description 44
- 210000004027 cell Anatomy 0.000 description 31
- 230000014509 gene expression Effects 0.000 description 30
- 108700005078 Synthetic Genes Proteins 0.000 description 25
- 230000002265 prevention Effects 0.000 description 24
- 239000003085 diluting agent Substances 0.000 description 22
- 239000003937 drug carrier Substances 0.000 description 22
- 239000000546 pharmaceutical excipient Substances 0.000 description 22
- 239000008194 pharmaceutical composition Substances 0.000 description 20
- 108091092195 Intron Proteins 0.000 description 19
- 239000000047 product Substances 0.000 description 19
- 230000009286 beneficial effect Effects 0.000 description 16
- 230000001594 aberrant effect Effects 0.000 description 13
- 108020003584 RNA Isoforms Proteins 0.000 description 11
- 108010029485 Protein Isoforms Proteins 0.000 description 10
- 102000001708 Protein Isoforms Human genes 0.000 description 10
- 230000002068 genetic effect Effects 0.000 description 10
- 230000001404 mediated effect Effects 0.000 description 10
- 102100040038 Amyloid beta precursor like protein 2 Human genes 0.000 description 9
- 101000890401 Homo sapiens Amyloid beta precursor like protein 2 Proteins 0.000 description 9
- 108700026244 Open Reading Frames Proteins 0.000 description 9
- 230000015572 biosynthetic process Effects 0.000 description 9
- 230000015556 catabolic process Effects 0.000 description 9
- 238000006731 degradation reaction Methods 0.000 description 9
- UGTJLJZQQFGTJD-UHFFFAOYSA-N Carbonylcyanide-3-chlorophenylhydrazone Chemical compound ClC1=CC=CC(NN=C(C#N)C#N)=C1 UGTJLJZQQFGTJD-UHFFFAOYSA-N 0.000 description 8
- 101000794187 Homo sapiens Tetraspanin-18 Proteins 0.000 description 7
- 102100030175 Tetraspanin-18 Human genes 0.000 description 7
- RMLPZKRPSQVRAB-UHFFFAOYSA-N tris(3-methylphenyl) phosphate Chemical compound CC1=CC=CC(OP(=O)(OC=2C=C(C)C=CC=2)OC=2C=C(C)C=CC=2)=C1 RMLPZKRPSQVRAB-UHFFFAOYSA-N 0.000 description 7
- 101150044980 Akap1 gene Proteins 0.000 description 6
- 102100035682 Axin-1 Human genes 0.000 description 6
- 101001010541 Homo sapiens Electron transfer flavoprotein subunit alpha, mitochondrial Proteins 0.000 description 6
- 101001059644 Homo sapiens MAP kinase-activating death domain protein Proteins 0.000 description 6
- 101000823316 Homo sapiens Tyrosine-protein kinase ABL1 Proteins 0.000 description 6
- 102100028822 MAP kinase-activating death domain protein Human genes 0.000 description 6
- 102100033810 RAC-alpha serine/threonine-protein kinase Human genes 0.000 description 6
- 102100021947 Survival motor neuron protein Human genes 0.000 description 6
- 108091022879 ADAMTS Proteins 0.000 description 5
- 102000029750 ADAMTS Human genes 0.000 description 5
- 102100034326 Adenosine deaminase-like protein Human genes 0.000 description 5
- 102100034112 Alkyldihydroxyacetonephosphate synthase, peroxisomal Human genes 0.000 description 5
- 102100028118 Annexin A11 Human genes 0.000 description 5
- 108010092776 Autophagy-Related Protein 5 Proteins 0.000 description 5
- 102000016614 Autophagy-Related Protein 5 Human genes 0.000 description 5
- 102100040004 Gamma-glutamylcyclotransferase Human genes 0.000 description 5
- 101000799143 Homo sapiens Alkyldihydroxyacetonephosphate synthase, peroxisomal Proteins 0.000 description 5
- 101000768066 Homo sapiens Annexin A11 Proteins 0.000 description 5
- 101000886680 Homo sapiens Gamma-glutamylcyclotransferase Proteins 0.000 description 5
- 101000726740 Homo sapiens Homeobox protein cut-like 1 Proteins 0.000 description 5
- 101001016777 Homo sapiens Microtubule-associated protein 9 Proteins 0.000 description 5
- 101000677825 Homo sapiens Palmitoyl-protein thioesterase ABHD10, mitochondrial Proteins 0.000 description 5
- 101001045218 Homo sapiens Peroxisomal multifunctional enzyme type 2 Proteins 0.000 description 5
- 101000752520 Homo sapiens Protein ARMCX6 Proteins 0.000 description 5
- 101000761460 Homo sapiens Protein CASP Proteins 0.000 description 5
- 101000663181 Homo sapiens Splicing regulatory glutamine/lysine-rich protein 1 Proteins 0.000 description 5
- 101000944219 Homo sapiens cAMP-dependent protein kinase catalytic subunit beta Proteins 0.000 description 5
- 102100021498 Palmitoyl-protein thioesterase ABHD10, mitochondrial Human genes 0.000 description 5
- 102100022587 Peroxisomal multifunctional enzyme type 2 Human genes 0.000 description 5
- 102100022029 Protein ARMCX6 Human genes 0.000 description 5
- 102100037079 Splicing regulatory glutamine/lysine-rich protein 1 Human genes 0.000 description 5
- 108010091281 U1 Small Nuclear Ribonucleoprotein Proteins 0.000 description 5
- 102000018165 U1 Small Nuclear Ribonucleoprotein Human genes 0.000 description 5
- 102100033065 cAMP-dependent protein kinase catalytic subunit beta Human genes 0.000 description 5
- 238000012217 deletion Methods 0.000 description 5
- 230000037430 deletion Effects 0.000 description 5
- 230000003993 interaction Effects 0.000 description 5
- 102100040297 39S ribosomal protein L39, mitochondrial Human genes 0.000 description 4
- 102000029791 ADAM Human genes 0.000 description 4
- 108091022885 ADAM Proteins 0.000 description 4
- 108091007507 ADAM12 Proteins 0.000 description 4
- 101800001241 Acetylglutamate kinase Proteins 0.000 description 4
- 102100026656 Actin, alpha skeletal muscle Human genes 0.000 description 4
- 102100020963 Actin-binding LIM protein 1 Human genes 0.000 description 4
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 4
- 102100024075 Alpha-internexin Human genes 0.000 description 4
- 102100031329 Ankyrin repeat family A protein 2 Human genes 0.000 description 4
- 102100026346 Brain-specific angiogenesis inhibitor 1-associated protein 2 Human genes 0.000 description 4
- 108091011896 CSF1 Proteins 0.000 description 4
- 102100030297 Calcium uptake protein 1, mitochondrial Human genes 0.000 description 4
- 101710195848 Centrosomal protein CEP57L1 Proteins 0.000 description 4
- 102100031213 Centrosomal protein of 57 kDa Human genes 0.000 description 4
- 101710147964 Centrosomal protein of 57 kDa Proteins 0.000 description 4
- 102100038254 Cyclin-F Human genes 0.000 description 4
- 102100031112 Disintegrin and metalloproteinase domain-containing protein 12 Human genes 0.000 description 4
- 102100037983 Disks large-associated protein 4 Human genes 0.000 description 4
- 102100037734 Dynein regulatory complex protein 9 Human genes 0.000 description 4
- 102100037038 E3 ubiquitin-protein ligase CCNB1IP1 Human genes 0.000 description 4
- 102100021771 Endoplasmic reticulum mannosyl-oligosaccharide 1,2-alpha-mannosidase Human genes 0.000 description 4
- 102100029988 Endoplasmic reticulum-Golgi intermediate compartment protein 3 Human genes 0.000 description 4
- 102100030082 Epsin-1 Human genes 0.000 description 4
- 108010008599 Forkhead Box Protein M1 Proteins 0.000 description 4
- 102100023374 Forkhead box protein M1 Human genes 0.000 description 4
- 102100036838 GRAM domain-containing protein 2B Human genes 0.000 description 4
- 102100041003 Glutamate carboxypeptidase 2 Human genes 0.000 description 4
- 101001104233 Homo sapiens 39S ribosomal protein L39, mitochondrial Proteins 0.000 description 4
- 101000783802 Homo sapiens Actin-binding LIM protein 1 Proteins 0.000 description 4
- 101000780272 Homo sapiens Adenosine deaminase-like protein Proteins 0.000 description 4
- 101000874566 Homo sapiens Axin-1 Proteins 0.000 description 4
- 101000766212 Homo sapiens Brain-specific angiogenesis inhibitor 1-associated protein 2 Proteins 0.000 description 4
- 101000991050 Homo sapiens Calcium uptake protein 1, mitochondrial Proteins 0.000 description 4
- 101000884183 Homo sapiens Cyclin-F Proteins 0.000 description 4
- 101001053257 Homo sapiens DCC-interacting protein 13-beta Proteins 0.000 description 4
- 101000951335 Homo sapiens Disks large-associated protein 4 Proteins 0.000 description 4
- 101000880811 Homo sapiens Dynein regulatory complex protein 9 Proteins 0.000 description 4
- 101000737896 Homo sapiens E3 ubiquitin-protein ligase CCNB1IP1 Proteins 0.000 description 4
- 101000615944 Homo sapiens Endoplasmic reticulum mannosyl-oligosaccharide 1,2-alpha-mannosidase Proteins 0.000 description 4
- 101001010804 Homo sapiens Endoplasmic reticulum-Golgi intermediate compartment protein 3 Proteins 0.000 description 4
- 101001012105 Homo sapiens Epsin-1 Proteins 0.000 description 4
- 101001071433 Homo sapiens GRAM domain-containing protein 2B Proteins 0.000 description 4
- 101000892862 Homo sapiens Glutamate carboxypeptidase 2 Proteins 0.000 description 4
- 101001008442 Homo sapiens La-related protein 7 Proteins 0.000 description 4
- 101000984841 Homo sapiens Leucine-rich repeat-containing protein 42 Proteins 0.000 description 4
- 101000577541 Homo sapiens Neuronal regeneration-related protein Proteins 0.000 description 4
- 101001131972 Homo sapiens PX domain-containing protein kinase-like protein Proteins 0.000 description 4
- 101000595868 Homo sapiens Phosphatidylinositol transfer protein beta isoform Proteins 0.000 description 4
- 101000735365 Homo sapiens Poly(rC)-binding protein 4 Proteins 0.000 description 4
- 101000779418 Homo sapiens RAC-alpha serine/threonine-protein kinase Proteins 0.000 description 4
- 101001130305 Homo sapiens Ras-related protein Rab-23 Proteins 0.000 description 4
- 101000668416 Homo sapiens Regulator of chromosome condensation Proteins 0.000 description 4
- 101000717377 Homo sapiens Ribokinase Proteins 0.000 description 4
- 101000585019 Homo sapiens Striatin-3 Proteins 0.000 description 4
- 101000713879 Homo sapiens T-complex protein 1 subunit eta Proteins 0.000 description 4
- 101000900749 Homo sapiens Uncharacterized protein C14orf132 Proteins 0.000 description 4
- 102100027436 La-related protein 7 Human genes 0.000 description 4
- 102100027170 Leucine-rich repeat-containing protein 42 Human genes 0.000 description 4
- 101710097496 Lysophospholipid acyltransferase Proteins 0.000 description 4
- 102100028123 Macrophage colony-stimulating factor 1 Human genes 0.000 description 4
- 102100028745 Neuronal regeneration-related protein Human genes 0.000 description 4
- 102100034602 PX domain-containing protein kinase-like protein Human genes 0.000 description 4
- 102100036063 Phosphatidylinositol transfer protein beta isoform Human genes 0.000 description 4
- 102100034956 Poly(rC)-binding protein 4 Human genes 0.000 description 4
- 102100033479 RAF proto-oncogene serine/threonine-protein kinase Human genes 0.000 description 4
- 102100031522 Ras-related protein Rab-23 Human genes 0.000 description 4
- 102100039977 Regulator of chromosome condensation Human genes 0.000 description 4
- 102100020783 Ribokinase Human genes 0.000 description 4
- 108091006211 SLC4 Proteins 0.000 description 4
- 108091006212 SLC7 Proteins 0.000 description 4
- 102100029955 Striatin-3 Human genes 0.000 description 4
- 102100036476 T-complex protein 1 subunit eta Human genes 0.000 description 4
- 102100022061 Uncharacterized protein C14orf132 Human genes 0.000 description 4
- 230000002159 abnormal effect Effects 0.000 description 4
- 230000004075 alteration Effects 0.000 description 4
- 208000035475 disorder Diseases 0.000 description 4
- 206010053219 non-alcoholic steatohepatitis Diseases 0.000 description 4
- 229920001481 poly(stearyl methacrylate) Polymers 0.000 description 4
- 230000014616 translation Effects 0.000 description 4
- 238000013519 translation Methods 0.000 description 4
- UXFQFBNBSPQBJW-UHFFFAOYSA-N 2-amino-2-methylpropane-1,3-diol Chemical compound OCC(N)(C)CO UXFQFBNBSPQBJW-UHFFFAOYSA-N 0.000 description 3
- OTJMDLIUFVHKNU-UHFFFAOYSA-N 2-hydroxy-5-methylidene-3-(piperidin-1-ylamino)cyclopent-2-en-1-one Chemical compound C1C(=C)C(=O)C(O)=C1NN1CCCCC1 OTJMDLIUFVHKNU-UHFFFAOYSA-N 0.000 description 3
- OUSYFDXGONIFSX-UHFFFAOYSA-N 2-sulfooxyprop-2-enoic acid Chemical compound OC(=O)C(=C)OS(O)(=O)=O OUSYFDXGONIFSX-UHFFFAOYSA-N 0.000 description 3
- FVFVNNKYKYZTJU-UHFFFAOYSA-N 6-chloro-1,3,5-triazine-2,4-diamine Chemical compound NC1=NC(N)=NC(Cl)=N1 FVFVNNKYKYZTJU-UHFFFAOYSA-N 0.000 description 3
- 101150059521 AHRR gene Proteins 0.000 description 3
- 101150035093 AMPD gene Proteins 0.000 description 3
- 102100034402 ATP-dependent RNA helicase DDX39A Human genes 0.000 description 3
- 108010075348 Activated-Leukocyte Cell Adhesion Molecule Proteins 0.000 description 3
- 102100034270 Ankyrin repeat domain-containing protein 13A Human genes 0.000 description 3
- 101100494468 Arabidopsis thaliana CAD1 gene Proteins 0.000 description 3
- 101100327837 Arabidopsis thaliana CHLH gene Proteins 0.000 description 3
- 101100168911 Arabidopsis thaliana CUL4 gene Proteins 0.000 description 3
- 102100024365 Arf-GAP domain and FG repeat-containing protein 1 Human genes 0.000 description 3
- 102100036131 Arginine-tRNA ligase, cytoplasmic Human genes 0.000 description 3
- 102100035921 Arginine/serine-rich protein PNISR Human genes 0.000 description 3
- 102100026789 Aryl hydrocarbon receptor repressor Human genes 0.000 description 3
- 102100028820 Aspartate-tRNA ligase, cytoplasmic Human genes 0.000 description 3
- 108091007065 BIRCs Proteins 0.000 description 3
- 102100024210 CD166 antigen Human genes 0.000 description 3
- 101150033031 CYP51A gene Proteins 0.000 description 3
- 102100027848 Cartilage-associated protein Human genes 0.000 description 3
- 102100023668 Coiled-coil domain-containing protein 122 Human genes 0.000 description 3
- 101150077031 DAXX gene Proteins 0.000 description 3
- 102000038566 DCAFs Human genes 0.000 description 3
- 108091007824 DCAFs Proteins 0.000 description 3
- 102100028559 Death domain-associated protein 6 Human genes 0.000 description 3
- 101100054330 Dictyostelium discoideum abhd gene Proteins 0.000 description 3
- 101100168913 Dictyostelium discoideum culD gene Proteins 0.000 description 3
- 101100228462 Dictyostelium discoideum gbpD gene Proteins 0.000 description 3
- 101100072702 Drosophila melanogaster defl gene Proteins 0.000 description 3
- 102100036041 Exopolyphosphatase PRUNE1 Human genes 0.000 description 3
- 102100024359 Exosome complex exonuclease RRP44 Human genes 0.000 description 3
- 102100031509 Fibrillin-1 Human genes 0.000 description 3
- 102100031812 Fibulin-1 Human genes 0.000 description 3
- 102100028496 Galactocerebrosidase Human genes 0.000 description 3
- 102100027489 Helicase-like transcription factor Human genes 0.000 description 3
- 102100028902 Hermansky-Pudlak syndrome 1 protein Human genes 0.000 description 3
- 102100030234 Homeobox protein cut-like 1 Human genes 0.000 description 3
- 101100162766 Homo sapiens ANKRA2 gene Proteins 0.000 description 3
- 101000923749 Homo sapiens ATP-dependent RNA helicase DDX39A Proteins 0.000 description 3
- 101000834207 Homo sapiens Actin, alpha skeletal muscle Proteins 0.000 description 3
- 101000833549 Homo sapiens Alpha-internexin Proteins 0.000 description 3
- 101000780149 Homo sapiens Ankyrin repeat domain-containing protein 13A Proteins 0.000 description 3
- 101000833314 Homo sapiens Arf-GAP domain and FG repeat-containing protein 1 Proteins 0.000 description 3
- 101001000549 Homo sapiens Arginine/serine-rich protein PNISR Proteins 0.000 description 3
- 101000696909 Homo sapiens Aspartate-tRNA ligase, cytoplasmic Proteins 0.000 description 3
- 101000859758 Homo sapiens Cartilage-associated protein Proteins 0.000 description 3
- 101000978258 Homo sapiens Coiled-coil domain-containing protein 122 Proteins 0.000 description 3
- 101000627103 Homo sapiens Exosome complex exonuclease RRP44 Proteins 0.000 description 3
- 101001065276 Homo sapiens Fibulin-1 Proteins 0.000 description 3
- 101000860395 Homo sapiens Galactocerebrosidase Proteins 0.000 description 3
- 101001081105 Homo sapiens Helicase-like transcription factor Proteins 0.000 description 3
- 101001011421 Homo sapiens IQ domain-containing protein E Proteins 0.000 description 3
- 101000852596 Homo sapiens Inositol-trisphosphate 3-kinase A Proteins 0.000 description 3
- 101001046677 Homo sapiens Integrin alpha-V Proteins 0.000 description 3
- 101001056724 Homo sapiens Intersectin-1 Proteins 0.000 description 3
- 101000875582 Homo sapiens Isoleucine-tRNA ligase, cytoplasmic Proteins 0.000 description 3
- 101000717987 Homo sapiens LIM domain-containing protein ajuba Proteins 0.000 description 3
- 101001057154 Homo sapiens Melanoma-associated antigen D2 Proteins 0.000 description 3
- 101001030284 Homo sapiens Methylthioribulose-1-phosphate dehydratase Proteins 0.000 description 3
- 101000928479 Homo sapiens Microtubule organization protein AKNA Proteins 0.000 description 3
- 101000970403 Homo sapiens Nuclear pore complex protein Nup153 Proteins 0.000 description 3
- 101001024118 Homo sapiens Nuclear-interacting partner of ALK Proteins 0.000 description 3
- 101001086785 Homo sapiens Occludin Proteins 0.000 description 3
- 101000586302 Homo sapiens Oncostatin-M-specific receptor subunit beta Proteins 0.000 description 3
- 101000741790 Homo sapiens Peroxisome proliferator-activated receptor gamma Proteins 0.000 description 3
- 101000589419 Homo sapiens Photoreceptor ankyrin repeat protein Proteins 0.000 description 3
- 101000833167 Homo sapiens Poly(A) RNA polymerase GLD2 Proteins 0.000 description 3
- 101001135385 Homo sapiens Prostacyclin synthase Proteins 0.000 description 3
- 101000766826 Homo sapiens Protein CIP2A Proteins 0.000 description 3
- 101000993776 Homo sapiens Protein inturned Proteins 0.000 description 3
- 101000592517 Homo sapiens Puromycin-sensitive aminopeptidase Proteins 0.000 description 3
- 101000760281 Homo sapiens Putative zinc finger protein 730 Proteins 0.000 description 3
- 101000687448 Homo sapiens REST corepressor 1 Proteins 0.000 description 3
- 101000864070 Homo sapiens Smoothelin Proteins 0.000 description 3
- 101000648196 Homo sapiens Striatin Proteins 0.000 description 3
- 101000716763 Homo sapiens Succinyl-CoA:3-ketoacid coenzyme A transferase 1, mitochondrial Proteins 0.000 description 3
- 101000617738 Homo sapiens Survival motor neuron protein Proteins 0.000 description 3
- 101000626163 Homo sapiens Tenascin-X Proteins 0.000 description 3
- 101001004913 Homo sapiens Transforming growth factor beta activator LRRC33 Proteins 0.000 description 3
- 101000801114 Homo sapiens Transmembrane protein 134 Proteins 0.000 description 3
- 101000759241 Homo sapiens Zinc finger protein 138 Proteins 0.000 description 3
- 101000744930 Homo sapiens Zinc finger protein 212 Proteins 0.000 description 3
- 101000782169 Homo sapiens Zinc finger protein 232 Proteins 0.000 description 3
- 101000788752 Homo sapiens Zinc finger protein 350 Proteins 0.000 description 3
- 101000785611 Homo sapiens Zinc finger protein 660 Proteins 0.000 description 3
- 101000782310 Homo sapiens Zinc finger protein 836 Proteins 0.000 description 3
- 102100029840 IQ domain-containing protein E Human genes 0.000 description 3
- 102100027004 Inhibin beta A chain Human genes 0.000 description 3
- 102100036405 Inositol-trisphosphate 3-kinase A Human genes 0.000 description 3
- 102100022337 Integrin alpha-V Human genes 0.000 description 3
- 102100025494 Intersectin-1 Human genes 0.000 description 3
- 102100039905 Isocitrate dehydrogenase [NADP] cytoplasmic Human genes 0.000 description 3
- 102100036015 Isoleucine-tRNA ligase, cytoplasmic Human genes 0.000 description 3
- 102100026447 LIM domain-containing protein ajuba Human genes 0.000 description 3
- 102100027251 Melanoma-associated antigen D2 Human genes 0.000 description 3
- 102100038593 Methylthioribulose-1-phosphate dehydratase Human genes 0.000 description 3
- 102100036470 Microtubule organization protein AKNA Human genes 0.000 description 3
- 102100028134 Mitochondrial potassium channel ATP-binding subunit Human genes 0.000 description 3
- 101710106113 Mitochondrial potassium channel ATP-binding subunit Proteins 0.000 description 3
- 101710085388 N(G),N(G)-dimethylarginine dimethylaminohydrolase Proteins 0.000 description 3
- 102100035854 N(G),N(G)-dimethylarginine dimethylaminohydrolase 1 Human genes 0.000 description 3
- 108700020297 NeuroD Proteins 0.000 description 3
- 108020004485 Nonsense Codon Proteins 0.000 description 3
- 102100021706 Nuclear pore complex protein Nup153 Human genes 0.000 description 3
- 102100035376 Nuclear-interacting partner of ALK Human genes 0.000 description 3
- 241000233803 Nypa Species 0.000 description 3
- 235000005305 Nypa fruticans Nutrition 0.000 description 3
- CVRALZAYCYJELZ-UHFFFAOYSA-N O-(4-bromo-2,5-dichlorophenyl) O-methyl phenylphosphonothioate Chemical compound C=1C=CC=CC=1P(=S)(OC)OC1=CC(Cl)=C(Br)C=C1Cl CVRALZAYCYJELZ-UHFFFAOYSA-N 0.000 description 3
- 102100032604 Occludin Human genes 0.000 description 3
- 102100030098 Oncostatin-M-specific receptor subunit beta Human genes 0.000 description 3
- 102100038825 Peroxisome proliferator-activated receptor gamma Human genes 0.000 description 3
- 102100032330 Photoreceptor ankyrin repeat protein Human genes 0.000 description 3
- 102100024380 Poly(A) RNA polymerase GLD2 Human genes 0.000 description 3
- 102100033075 Prostacyclin synthase Human genes 0.000 description 3
- 102100028634 Protein CIP2A Human genes 0.000 description 3
- 102100031753 Protein inturned Human genes 0.000 description 3
- 102100028680 Protein patched homolog 1 Human genes 0.000 description 3
- 102100033192 Puromycin-sensitive aminopeptidase Human genes 0.000 description 3
- 102100024700 Putative zinc finger protein 730 Human genes 0.000 description 3
- 102100024864 REST corepressor 1 Human genes 0.000 description 3
- 101100168914 Schizosaccharomyces pombe (strain 972 / ATCC 24843) pcu4 gene Proteins 0.000 description 3
- 102100029937 Smoothelin Human genes 0.000 description 3
- 102100028898 Striatin Human genes 0.000 description 3
- 102100020868 Succinyl-CoA:3-ketoacid coenzyme A transferase 1, mitochondrial Human genes 0.000 description 3
- 102100024549 Tenascin-X Human genes 0.000 description 3
- 102100025954 Transforming growth factor beta activator LRRC33 Human genes 0.000 description 3
- 102100033701 Transmembrane protein 134 Human genes 0.000 description 3
- 102100021937 VPS10 domain-containing receptor SorCS1 Human genes 0.000 description 3
- 102100023394 Zinc finger protein 138 Human genes 0.000 description 3
- 102100039979 Zinc finger protein 212 Human genes 0.000 description 3
- 102100036549 Zinc finger protein 232 Human genes 0.000 description 3
- 102100025434 Zinc finger protein 350 Human genes 0.000 description 3
- 102100026454 Zinc finger protein 660 Human genes 0.000 description 3
- 102100035782 Zinc finger protein 836 Human genes 0.000 description 3
- MRUAUOIMASANKQ-UHFFFAOYSA-N cocamidopropyl betaine Chemical compound CCCCCCCCCCCC(=O)NCCC[N+](C)(C)CC([O-])=O MRUAUOIMASANKQ-UHFFFAOYSA-N 0.000 description 3
- 230000037433 frameshift Effects 0.000 description 3
- 230000001939 inductive effect Effects 0.000 description 3
- 108010019691 inhibin beta A subunit Proteins 0.000 description 3
- 238000003780 insertion Methods 0.000 description 3
- 230000037431 insertion Effects 0.000 description 3
- QNILTEGFHQSKFF-UHFFFAOYSA-N n-propan-2-ylprop-2-enamide Chemical compound CC(C)NC(=O)C=C QNILTEGFHQSKFF-UHFFFAOYSA-N 0.000 description 3
- 230000001225 therapeutic effect Effects 0.000 description 3
- 239000013598 vector Substances 0.000 description 3
- XKZCXMNMUMGDJG-AWEZNQCLSA-N (2s)-3-[(6-acetylnaphthalen-2-yl)amino]-2-aminopropanoic acid Chemical compound C1=C(NC[C@H](N)C(O)=O)C=CC2=CC(C(=O)C)=CC=C21 XKZCXMNMUMGDJG-AWEZNQCLSA-N 0.000 description 2
- IGRCWJPBLWGNPX-UHFFFAOYSA-N 3-(2-chlorophenyl)-n-(4-chlorophenyl)-n,5-dimethyl-1,2-oxazole-4-carboxamide Chemical compound C=1C=C(Cl)C=CC=1N(C)C(=O)C1=C(C)ON=C1C1=CC=CC=C1Cl IGRCWJPBLWGNPX-UHFFFAOYSA-N 0.000 description 2
- 102100029077 3-hydroxy-3-methylglutaryl-coenzyme A reductase Human genes 0.000 description 2
- XDLMVUHYZWKMMD-UHFFFAOYSA-N 3-trimethoxysilylpropyl 2-methylprop-2-enoate Chemical compound CO[Si](OC)(OC)CCCOC(=O)C(C)=C XDLMVUHYZWKMMD-UHFFFAOYSA-N 0.000 description 2
- 102100034095 5'(3')-deoxyribonucleotidase, cytosolic type Human genes 0.000 description 2
- 102100040086 A-kinase anchor protein 8 Human genes 0.000 description 2
- 108091007505 ADAM17 Proteins 0.000 description 2
- 102100028162 ATP-binding cassette sub-family C member 3 Human genes 0.000 description 2
- 102100030089 ATP-dependent RNA helicase DHX8 Human genes 0.000 description 2
- RZVAJINKPMORJF-UHFFFAOYSA-N Acetaminophen Chemical compound CC(=O)NC1=CC=C(O)C=C1 RZVAJINKPMORJF-UHFFFAOYSA-N 0.000 description 2
- 102100032153 Adenylate cyclase type 8 Human genes 0.000 description 2
- 101000783817 Agaricus bisporus lectin Proteins 0.000 description 2
- 102100040055 Amyloid beta precursor like protein 1 Human genes 0.000 description 2
- 101710168919 Amyloid beta precursor like protein 1 Proteins 0.000 description 2
- 101100002350 Arabidopsis thaliana ARID5 gene Proteins 0.000 description 2
- 102100028449 Arginine-glutamic acid dipeptide repeats protein Human genes 0.000 description 2
- 102100022108 Aspartyl/asparaginyl beta-hydroxylase Human genes 0.000 description 2
- 102100029516 Basic salivary proline-rich protein 1 Human genes 0.000 description 2
- 102100026596 Bcl-2-like protein 1 Human genes 0.000 description 2
- 102100040904 Beta-parvin Human genes 0.000 description 2
- 102100025991 Betaine-homocysteine S-methyltransferase 1 Human genes 0.000 description 2
- 101001042041 Bos taurus Isocitrate dehydrogenase [NAD] subunit beta, mitochondrial Proteins 0.000 description 2
- 102100021534 Calcium/calmodulin-dependent protein kinase kinase 2 Human genes 0.000 description 2
- 102100029398 Calpain small subunit 1 Human genes 0.000 description 2
- 102100039370 Carbohydrate deacetylase Human genes 0.000 description 2
- 102100037182 Cation-independent mannose-6-phosphate receptor Human genes 0.000 description 2
- 102100034786 Cell migration-inducing and hyaluronan-binding protein Human genes 0.000 description 2
- 102100023343 Centromere protein I Human genes 0.000 description 2
- 102100039511 Chymotrypsin-C Human genes 0.000 description 2
- 102100034467 Clathrin light chain A Human genes 0.000 description 2
- 102100029362 Cone-rod homeobox protein Human genes 0.000 description 2
- 102100034126 Cytoglobin Human genes 0.000 description 2
- 102100029816 DEP domain-containing mTOR-interacting protein Human genes 0.000 description 2
- 102100026139 DNA damage-inducible transcript 4 protein Human genes 0.000 description 2
- 102100037794 Diacylglycerol lipase-beta Human genes 0.000 description 2
- 101100127296 Dictyostelium discoideum kif1 gene Proteins 0.000 description 2
- 101100407335 Dictyostelium discoideum pde7 gene Proteins 0.000 description 2
- 101100046553 Dictyostelium discoideum tnpo gene Proteins 0.000 description 2
- 102100024746 Dihydrofolate reductase Human genes 0.000 description 2
- 102100031111 Disintegrin and metalloproteinase domain-containing protein 17 Human genes 0.000 description 2
- 101100432802 Drosophila melanogaster Ypel gene Proteins 0.000 description 2
- 101100214180 Drosophila melanogaster Ythdf gene Proteins 0.000 description 2
- 102100028554 Dual specificity tyrosine-phosphorylation-regulated kinase 1A Human genes 0.000 description 2
- 102100024108 Dystrophin Human genes 0.000 description 2
- 102100035489 E3 ubiquitin-protein ligase NEURL1B Human genes 0.000 description 2
- 102100021183 E3 ubiquitin-protein ligase RNF130 Human genes 0.000 description 2
- 102100031534 E3 ubiquitin-protein ligase RNF144A Human genes 0.000 description 2
- 102100027418 E3 ubiquitin-protein ligase RNF213 Human genes 0.000 description 2
- 102100037460 E3 ubiquitin-protein ligase Topors Human genes 0.000 description 2
- 102100037024 E3 ubiquitin-protein ligase XIAP Human genes 0.000 description 2
- 102100039246 Elongator complex protein 1 Human genes 0.000 description 2
- 102100031726 Endoplasmic reticulum junction formation protein lunapark Human genes 0.000 description 2
- 102000036354 FBXLs Human genes 0.000 description 2
- 108091007025 FBXLs Proteins 0.000 description 2
- 102000036355 FBXOs Human genes 0.000 description 2
- 108091007024 FBXOs Proteins 0.000 description 2
- 108091008794 FGF receptors Proteins 0.000 description 2
- 102100035189 GPI ethanolamine phosphate transferase 1 Human genes 0.000 description 2
- 102100023177 Glycoprotein endo-alpha-1,2-mannosidase Human genes 0.000 description 2
- 102100040408 Heat shock 70 kDa protein 1-like Human genes 0.000 description 2
- 102100040352 Heat shock 70 kDa protein 1A Human genes 0.000 description 2
- 102100031880 Helicase SRCAP Human genes 0.000 description 2
- 102100031188 Hephaestin Human genes 0.000 description 2
- 102100023999 Heterogeneous nuclear ribonucleoprotein R Human genes 0.000 description 2
- 101000988577 Homo sapiens 3-hydroxy-3-methylglutaryl-coenzyme A reductase Proteins 0.000 description 2
- 101000591192 Homo sapiens 5'(3')-deoxyribonucleotidase, cytosolic type Proteins 0.000 description 2
- 101000890594 Homo sapiens A-kinase anchor protein 8 Proteins 0.000 description 2
- 101000986633 Homo sapiens ATP-binding cassette sub-family C member 3 Proteins 0.000 description 2
- 101000864666 Homo sapiens ATP-dependent RNA helicase DHX8 Proteins 0.000 description 2
- 101000959328 Homo sapiens Adenylate cyclase type 3 Proteins 0.000 description 2
- 101000775481 Homo sapiens Adenylate cyclase type 8 Proteins 0.000 description 2
- 101001061654 Homo sapiens Arginine-glutamic acid dipeptide repeats protein Proteins 0.000 description 2
- 101000874860 Homo sapiens Arginine-tRNA ligase, cytoplasmic Proteins 0.000 description 2
- 101000901030 Homo sapiens Aspartyl/asparaginyl beta-hydroxylase Proteins 0.000 description 2
- 101000765923 Homo sapiens Bcl-2-like protein 1 Proteins 0.000 description 2
- 101000613557 Homo sapiens Beta-parvin Proteins 0.000 description 2
- 101000933413 Homo sapiens Betaine-homocysteine S-methyltransferase 1 Proteins 0.000 description 2
- 101100168465 Homo sapiens CAPNS1 gene Proteins 0.000 description 2
- 101000961486 Homo sapiens Carbohydrate deacetylase Proteins 0.000 description 2
- 101001028831 Homo sapiens Cation-independent mannose-6-phosphate receptor Proteins 0.000 description 2
- 101000945881 Homo sapiens Cell migration-inducing and hyaluronan-binding protein Proteins 0.000 description 2
- 101000907944 Homo sapiens Centromere protein I Proteins 0.000 description 2
- 101000889306 Homo sapiens Chymotrypsin-C Proteins 0.000 description 2
- 101000710244 Homo sapiens Clathrin light chain A Proteins 0.000 description 2
- 101000919370 Homo sapiens Cone-rod homeobox protein Proteins 0.000 description 2
- 101000870148 Homo sapiens Cytoglobin Proteins 0.000 description 2
- 101000916686 Homo sapiens Cytohesin-interacting protein Proteins 0.000 description 2
- 101000865183 Homo sapiens DEP domain-containing mTOR-interacting protein Proteins 0.000 description 2
- 101000912753 Homo sapiens DNA damage-inducible transcript 4 protein Proteins 0.000 description 2
- 101000950829 Homo sapiens Diacylglycerol lipase-beta Proteins 0.000 description 2
- 101000838016 Homo sapiens Dual specificity tyrosine-phosphorylation-regulated kinase 1A Proteins 0.000 description 2
- 101000817629 Homo sapiens Dymeclin Proteins 0.000 description 2
- 101001053946 Homo sapiens Dystrophin Proteins 0.000 description 2
- 101001023726 Homo sapiens E3 ubiquitin-protein ligase NEURL1B Proteins 0.000 description 2
- 101001130270 Homo sapiens E3 ubiquitin-protein ligase RNF144A Proteins 0.000 description 2
- 101000650316 Homo sapiens E3 ubiquitin-protein ligase RNF213 Proteins 0.000 description 2
- 101000662670 Homo sapiens E3 ubiquitin-protein ligase Topors Proteins 0.000 description 2
- 101000813117 Homo sapiens Elongator complex protein 1 Proteins 0.000 description 2
- 101000941029 Homo sapiens Endoplasmic reticulum junction formation protein lunapark Proteins 0.000 description 2
- 101000736918 Homo sapiens Exopolyphosphatase PRUNE1 Proteins 0.000 description 2
- 101001093751 Homo sapiens GPI ethanolamine phosphate transferase 1 Proteins 0.000 description 2
- 101000978837 Homo sapiens Glycoprotein endo-alpha-1,2-mannosidase Proteins 0.000 description 2
- 101001037977 Homo sapiens Heat shock 70 kDa protein 1-like Proteins 0.000 description 2
- 101001037759 Homo sapiens Heat shock 70 kDa protein 1A Proteins 0.000 description 2
- 101000704158 Homo sapiens Helicase SRCAP Proteins 0.000 description 2
- 101000993183 Homo sapiens Hephaestin Proteins 0.000 description 2
- 101000838926 Homo sapiens Hermansky-Pudlak syndrome 1 protein Proteins 0.000 description 2
- 101001047853 Homo sapiens Heterogeneous nuclear ribonucleoprotein R Proteins 0.000 description 2
- 101001016841 Homo sapiens Histamine H1 receptor Proteins 0.000 description 2
- 101001034663 Homo sapiens Immunoglobulin superfamily DCC subclass member 4 Proteins 0.000 description 2
- 101001076680 Homo sapiens Insulin-induced gene 1 protein Proteins 0.000 description 2
- 101001076292 Homo sapiens Insulin-like growth factor II Proteins 0.000 description 2
- 101001044927 Homo sapiens Insulin-like growth factor-binding protein 3 Proteins 0.000 description 2
- 101001078151 Homo sapiens Integrin alpha-11 Proteins 0.000 description 2
- 101000994322 Homo sapiens Integrin alpha-8 Proteins 0.000 description 2
- 101000997670 Homo sapiens Integrin beta-8 Proteins 0.000 description 2
- 101000960234 Homo sapiens Isocitrate dehydrogenase [NADP] cytoplasmic Proteins 0.000 description 2
- 101001081533 Homo sapiens Isopentenyl-diphosphate Delta-isomerase 1 Proteins 0.000 description 2
- 101001046587 Homo sapiens Krueppel-like factor 1 Proteins 0.000 description 2
- 101001065536 Homo sapiens LYR motif-containing protein 1 Proteins 0.000 description 2
- 101000628547 Homo sapiens Metalloreductase STEAP1 Proteins 0.000 description 2
- 101000588130 Homo sapiens Microsomal triglyceride transfer protein large subunit Proteins 0.000 description 2
- 101000979297 Homo sapiens Negative elongation factor A Proteins 0.000 description 2
- 101001023793 Homo sapiens Neurofascin Proteins 0.000 description 2
- 101000996111 Homo sapiens Neuroligin-4, X-linked Proteins 0.000 description 2
- 101000979259 Homo sapiens Neurolysin, mitochondrial Proteins 0.000 description 2
- 101000578353 Homo sapiens Nodal modulator 2 Proteins 0.000 description 2
- 101001103036 Homo sapiens Nuclear receptor ROR-alpha Proteins 0.000 description 2
- 101000839399 Homo sapiens Oxidoreductase HTATIP2 Proteins 0.000 description 2
- 101000741788 Homo sapiens Peroxisome proliferator-activated receptor alpha Proteins 0.000 description 2
- 101001113717 Homo sapiens Phenazine biosynthesis-like domain-containing protein Proteins 0.000 description 2
- 101001113490 Homo sapiens Poly(A)-specific ribonuclease PARN Proteins 0.000 description 2
- 101001003584 Homo sapiens Prelamin-A/C Proteins 0.000 description 2
- 101000614345 Homo sapiens Prolyl 4-hydroxylase subunit alpha-1 Proteins 0.000 description 2
- 101000652172 Homo sapiens Protein Smaug homolog 1 Proteins 0.000 description 2
- 101000695187 Homo sapiens Protein patched homolog 1 Proteins 0.000 description 2
- 101000604116 Homo sapiens RNA-binding protein Nova-2 Proteins 0.000 description 2
- 101001110308 Homo sapiens Radixin Proteins 0.000 description 2
- 101000709121 Homo sapiens Ral guanine nucleotide dissociation stimulator-like 1 Proteins 0.000 description 2
- 101001092185 Homo sapiens Regulator of cell cycle RGCC Proteins 0.000 description 2
- 101000880310 Homo sapiens SH3 and cysteine-rich domain-containing protein Proteins 0.000 description 2
- 101000936731 Homo sapiens Sarcoplasmic/endoplasmic reticulum calcium ATPase 1 Proteins 0.000 description 2
- 101000697600 Homo sapiens Serine/threonine-protein kinase 32B Proteins 0.000 description 2
- 101000618181 Homo sapiens Speedy protein A Proteins 0.000 description 2
- 101000708620 Homo sapiens Spermine oxidase Proteins 0.000 description 2
- 101001056878 Homo sapiens Squalene monooxygenase Proteins 0.000 description 2
- 101000587717 Homo sapiens Sulfide:quinone oxidoreductase, mitochondrial Proteins 0.000 description 2
- 101000626142 Homo sapiens Tensin-1 Proteins 0.000 description 2
- 101000796022 Homo sapiens Thioredoxin-interacting protein Proteins 0.000 description 2
- 101000794213 Homo sapiens Thymus-specific serine protease Proteins 0.000 description 2
- 101000659863 Homo sapiens Translin Proteins 0.000 description 2
- 101000788517 Homo sapiens Tubulin beta-2A chain Proteins 0.000 description 2
- 101000679903 Homo sapiens Tumor necrosis factor receptor superfamily member 25 Proteins 0.000 description 2
- 101000617915 Homo sapiens VPS10 domain-containing receptor SorCS3 Proteins 0.000 description 2
- 101000806266 Homo sapiens Very-long-chain 3-oxoacyl-CoA reductase Proteins 0.000 description 2
- 101000965721 Homo sapiens Volume-regulated anion channel subunit LRRC8A Proteins 0.000 description 2
- 101000650035 Homo sapiens WD repeat-containing protein 91 Proteins 0.000 description 2
- 101000759453 Homo sapiens YY1-associated protein 1 Proteins 0.000 description 2
- 101000759255 Homo sapiens Zinc finger protein 148 Proteins 0.000 description 2
- 101000744932 Homo sapiens Zinc finger protein 208 Proteins 0.000 description 2
- 101000782130 Homo sapiens Zinc finger protein 219 Proteins 0.000 description 2
- 101000782143 Homo sapiens Zinc finger protein 227 Proteins 0.000 description 2
- 101000785650 Homo sapiens Zinc finger protein 268 Proteins 0.000 description 2
- 101000785710 Homo sapiens Zinc finger protein 281 Proteins 0.000 description 2
- 101000760227 Homo sapiens Zinc finger protein 335 Proteins 0.000 description 2
- 101000788735 Homo sapiens Zinc finger protein 37A Proteins 0.000 description 2
- 101000964713 Homo sapiens Zinc finger protein 395 Proteins 0.000 description 2
- 101000818824 Homo sapiens Zinc finger protein 431 Proteins 0.000 description 2
- 101000760270 Homo sapiens Zinc finger protein 583 Proteins 0.000 description 2
- 101000818706 Homo sapiens Zinc finger protein 618 Proteins 0.000 description 2
- 101000782278 Homo sapiens Zinc finger protein 621 Proteins 0.000 description 2
- 101000785613 Homo sapiens Zinc finger protein 652 Proteins 0.000 description 2
- 101000785609 Homo sapiens Zinc finger protein 655 Proteins 0.000 description 2
- 101000743803 Homo sapiens Zinc finger protein 674 Proteins 0.000 description 2
- 101000743805 Homo sapiens Zinc finger protein 680 Proteins 0.000 description 2
- 101000915596 Homo sapiens Zinc finger protein 777 Proteins 0.000 description 2
- 101000964730 Homo sapiens Zinc finger protein 79 Proteins 0.000 description 2
- 101000818450 Homo sapiens Zinc finger protein 82 homolog Proteins 0.000 description 2
- 101001022836 Homo sapiens c-Myc-binding protein Proteins 0.000 description 2
- 101000848450 Homo sapiens tRNA (guanine(26)-N(2))-dimethyltransferase Proteins 0.000 description 2
- 101100339395 Hydra viridissima Hln-1 gene Proteins 0.000 description 2
- 102100028888 Hydroxymethylglutaryl-CoA synthase, cytoplasmic Human genes 0.000 description 2
- 102100039724 Immunoglobulin superfamily DCC subclass member 4 Human genes 0.000 description 2
- 102100025887 Insulin-induced gene 1 protein Human genes 0.000 description 2
- 102100025947 Insulin-like growth factor II Human genes 0.000 description 2
- 102100022708 Insulin-like growth factor-binding protein 3 Human genes 0.000 description 2
- 102100025320 Integrin alpha-11 Human genes 0.000 description 2
- 102100032825 Integrin alpha-8 Human genes 0.000 description 2
- 102100033336 Integrin beta-8 Human genes 0.000 description 2
- 101800003050 Interleukin-16 Proteins 0.000 description 2
- 102100027665 Isopentenyl-diphosphate Delta-isomerase 1 Human genes 0.000 description 2
- 102100022248 Krueppel-like factor 1 Human genes 0.000 description 2
- 102100032135 LYR motif-containing protein 1 Human genes 0.000 description 2
- 101710162762 Limbic system-associated membrane protein Proteins 0.000 description 2
- 102100028263 Limbic system-associated membrane protein Human genes 0.000 description 2
- 108091054455 MAP kinase family Proteins 0.000 description 2
- 102000043136 MAP kinase family Human genes 0.000 description 2
- 108091007340 MARCHs Proteins 0.000 description 2
- 241000020990 Macrodes Species 0.000 description 2
- 101000761459 Mesocricetus auratus Calcium-dependent serine proteinase Proteins 0.000 description 2
- 102100026712 Metalloreductase STEAP1 Human genes 0.000 description 2
- 102100022450 Mitochondrial tRNA-specific 2-thiouridylase 1 Human genes 0.000 description 2
- 101100001708 Mus musculus Angptl4 gene Proteins 0.000 description 2
- 101100108836 Mus musculus Anp32a gene Proteins 0.000 description 2
- 101100127339 Mus musculus Camkk1 gene Proteins 0.000 description 2
- 101100127288 Mus musculus Kif1a gene Proteins 0.000 description 2
- 101100135809 Mus musculus Pcp2 gene Proteins 0.000 description 2
- 102100023062 Negative elongation factor A Human genes 0.000 description 2
- 108010025020 Nerve Growth Factor Proteins 0.000 description 2
- 108010032605 Nerve Growth Factor Receptors Proteins 0.000 description 2
- 102100035414 Neurofascin Human genes 0.000 description 2
- 102100034441 Neuroligin-4, X-linked Human genes 0.000 description 2
- 102100023072 Neurolysin, mitochondrial Human genes 0.000 description 2
- 102100027967 Nodal modulator 2 Human genes 0.000 description 2
- 102100039614 Nuclear receptor ROR-alpha Human genes 0.000 description 2
- 102100027952 Oxidoreductase HTATIP2 Human genes 0.000 description 2
- 102100040375 Peripherin-2 Human genes 0.000 description 2
- 102100038831 Peroxisome proliferator-activated receptor alpha Human genes 0.000 description 2
- 102100023743 Phenazine biosynthesis-like domain-containing protein Human genes 0.000 description 2
- 101710179684 Poly [ADP-ribose] polymerase Proteins 0.000 description 2
- 102100023712 Poly [ADP-ribose] polymerase 1 Human genes 0.000 description 2
- 102100023715 Poly(A)-specific ribonuclease PARN Human genes 0.000 description 2
- 229920000776 Poly(Adenosine diphosphate-ribose) polymerase Polymers 0.000 description 2
- 102100026531 Prelamin-A/C Human genes 0.000 description 2
- 102100026884 Pro-interleukin-16 Human genes 0.000 description 2
- 101710190829 Progressive ankylosis protein homolog Proteins 0.000 description 2
- 102100040477 Prolyl 4-hydroxylase subunit alpha-1 Human genes 0.000 description 2
- 108091008611 Protein Kinase B Proteins 0.000 description 2
- 102100030591 Protein Smaug homolog 1 Human genes 0.000 description 2
- 208000003251 Pruritus Diseases 0.000 description 2
- 102100038461 RNA-binding protein Nova-2 Human genes 0.000 description 2
- 108091007333 RNF130 Proteins 0.000 description 2
- 102100022851 Rab5 GDP/GTP exchange factor Human genes 0.000 description 2
- 102100022127 Radixin Human genes 0.000 description 2
- 102100034485 Ras-related protein Rab-2A Human genes 0.000 description 2
- 102100035542 Regulator of cell cycle RGCC Human genes 0.000 description 2
- 101710203837 Replication-associated protein Proteins 0.000 description 2
- 102100037646 SH3 and cysteine-rich domain-containing protein Human genes 0.000 description 2
- 101150015954 SMN2 gene Proteins 0.000 description 2
- 102100024171 STE20-related kinase adapter protein alpha Human genes 0.000 description 2
- 101150105183 SUPT20H gene Proteins 0.000 description 2
- 101001053942 Saccharolobus solfataricus (strain ATCC 35092 / DSM 1617 / JCM 11322 / P2) Diphosphomevalonate decarboxylase Proteins 0.000 description 2
- 101000744436 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) Trans-acting factor D Proteins 0.000 description 2
- 102100027697 Sarcoplasmic/endoplasmic reticulum calcium ATPase 1 Human genes 0.000 description 2
- 102100028030 Serine/threonine-protein kinase 32B Human genes 0.000 description 2
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 2
- 108010003165 Small Nuclear Ribonucleoproteins Proteins 0.000 description 2
- 102000004598 Small Nuclear Ribonucleoproteins Human genes 0.000 description 2
- 102100021885 Speedy protein A Human genes 0.000 description 2
- 102100032800 Spermine oxidase Human genes 0.000 description 2
- 102100025560 Squalene monooxygenase Human genes 0.000 description 2
- 102100031138 Sulfide:quinone oxidoreductase, mitochondrial Human genes 0.000 description 2
- 102000027549 TRPC Human genes 0.000 description 2
- 108060008648 TRPC Proteins 0.000 description 2
- 101100451295 Takifugu rubripes hmox gene Proteins 0.000 description 2
- 102100038126 Tenascin Human genes 0.000 description 2
- 102100024547 Tensin-1 Human genes 0.000 description 2
- 102100031344 Thioredoxin-interacting protein Human genes 0.000 description 2
- 102100030138 Thymus-specific serine protease Human genes 0.000 description 2
- 102100036032 Translin Human genes 0.000 description 2
- 206010051956 Trichorhinophalangeal syndrome Diseases 0.000 description 2
- 102000011408 Tripartite Motif Proteins Human genes 0.000 description 2
- 108010023649 Tripartite Motif Proteins Proteins 0.000 description 2
- 102100025225 Tubulin beta-2A chain Human genes 0.000 description 2
- 108060008683 Tumor Necrosis Factor Receptor Proteins 0.000 description 2
- 102100033725 Tumor necrosis factor receptor superfamily member 16 Human genes 0.000 description 2
- 102100022203 Tumor necrosis factor receptor superfamily member 25 Human genes 0.000 description 2
- 101150045640 VWF gene Proteins 0.000 description 2
- 102100037438 Very-long-chain 3-oxoacyl-CoA reductase Human genes 0.000 description 2
- 102100040985 Volume-regulated anion channel subunit LRRC8A Human genes 0.000 description 2
- 102100028273 WD repeat-containing protein 91 Human genes 0.000 description 2
- 108700031544 X-Linked Inhibitor of Apoptosis Proteins 0.000 description 2
- 102100023267 YY1-associated protein 1 Human genes 0.000 description 2
- 102100023442 Zinc finger protein 148 Human genes 0.000 description 2
- 102100039975 Zinc finger protein 208 Human genes 0.000 description 2
- 102100036594 Zinc finger protein 219 Human genes 0.000 description 2
- 102100036566 Zinc finger protein 227 Human genes 0.000 description 2
- 102100026516 Zinc finger protein 268 Human genes 0.000 description 2
- 102100026316 Zinc finger protein 281 Human genes 0.000 description 2
- 102100024773 Zinc finger protein 335 Human genes 0.000 description 2
- 102100025435 Zinc finger protein 37A Human genes 0.000 description 2
- 102100040733 Zinc finger protein 395 Human genes 0.000 description 2
- 102100021349 Zinc finger protein 431 Human genes 0.000 description 2
- 102100024713 Zinc finger protein 583 Human genes 0.000 description 2
- 102100021103 Zinc finger protein 618 Human genes 0.000 description 2
- 102100035818 Zinc finger protein 621 Human genes 0.000 description 2
- 102100026453 Zinc finger protein 652 Human genes 0.000 description 2
- 102100026494 Zinc finger protein 655 Human genes 0.000 description 2
- 102100039040 Zinc finger protein 674 Human genes 0.000 description 2
- 102100039056 Zinc finger protein 680 Human genes 0.000 description 2
- 102100028587 Zinc finger protein 777 Human genes 0.000 description 2
- 102100040706 Zinc finger protein 79 Human genes 0.000 description 2
- 102100021138 Zinc finger protein 82 homolog Human genes 0.000 description 2
- 102100035161 c-Myc-binding protein Human genes 0.000 description 2
- 239000013592 cell lysate Substances 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 108020001096 dihydrofolate reductase Proteins 0.000 description 2
- 102000052178 fibroblast growth factor receptor activity proteins Human genes 0.000 description 2
- 108091022911 insulin-like growth factor binding Proteins 0.000 description 2
- 102000028416 insulin-like growth factor binding Human genes 0.000 description 2
- 230000010189 intracellular transport Effects 0.000 description 2
- 239000006166 lysate Substances 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 239000002213 purine nucleotide Substances 0.000 description 2
- 150000003212 purines Chemical group 0.000 description 2
- 108010067765 rab2 GTP Binding protein Proteins 0.000 description 2
- 101150061737 rbck1 gene Proteins 0.000 description 2
- 230000002829 reductive effect Effects 0.000 description 2
- 230000000717 retained effect Effects 0.000 description 2
- 239000004576 sand Substances 0.000 description 2
- 210000001324 spliceosome Anatomy 0.000 description 2
- 239000000758 substrate Substances 0.000 description 2
- JLKIGFTWXXRPMT-UHFFFAOYSA-N sulphamethoxazole Chemical compound O1C(C)=CC(NS(=O)(=O)C=2C=CC(N)=CC=2)=N1 JLKIGFTWXXRPMT-UHFFFAOYSA-N 0.000 description 2
- 102000003298 tumor necrosis factor receptor Human genes 0.000 description 2
- 102100036537 von Willebrand factor Human genes 0.000 description 2
- NQBHBXSQWRBTIE-VKHMYHEASA-N (2s)-2-(carbamoylamino)pentanediamide Chemical compound NC(=O)CC[C@@H](C(N)=O)NC(N)=O NQBHBXSQWRBTIE-VKHMYHEASA-N 0.000 description 1
- 108010052418 (N-(2-((4-((2-((4-(9-acridinylamino)phenyl)amino)-2-oxoethyl)amino)-4-oxobutyl)amino)-1-(1H-imidazol-4-ylmethyl)-1-oxoethyl)-6-(((-2-aminoethyl)amino)methyl)-2-pyridinecarboxamidato) iron(1+) Proteins 0.000 description 1
- KUBWJGWIWGGEPZ-UHFFFAOYSA-N 1-[amino(ethoxy)phosphoryl]oxy-4-nitrobenzene Chemical compound CCOP(N)(=O)OC1=CC=C([N+]([O-])=O)C=C1 KUBWJGWIWGGEPZ-UHFFFAOYSA-N 0.000 description 1
- 102100038369 1-acyl-sn-glycerol-3-phosphate acyltransferase beta Human genes 0.000 description 1
- 102100030471 1-acyl-sn-glycerol-3-phosphate acyltransferase delta Human genes 0.000 description 1
- 102100038368 1-acyl-sn-glycerol-3-phosphate acyltransferase gamma Human genes 0.000 description 1
- IESVDEZGAHUQJU-ZLBXKVHBSA-N 1-hexadecanoyl-2-(4Z,7Z,10Z,13Z,16Z,19Z-docosahexaenoyl)-sn-glycero-3-phosphocholine Chemical compound CCCCCCCCCCCCCCCC(=O)OC[C@H](COP([O-])(=O)OCC[N+](C)(C)C)OC(=O)CC\C=C/C\C=C/C\C=C/C\C=C/C\C=C/C\C=C/CC IESVDEZGAHUQJU-ZLBXKVHBSA-N 0.000 description 1
- 102100038028 1-phosphatidylinositol 3-phosphate 5-kinase Human genes 0.000 description 1
- XLEYFDVVXLMULC-UHFFFAOYSA-N 2',4',6'-trihydroxyacetophenone Chemical compound CC(=O)C1=C(O)C=C(O)C=C1O XLEYFDVVXLMULC-UHFFFAOYSA-N 0.000 description 1
- SIVJKYRAPQKLIM-UHFFFAOYSA-N 3-(3,4-difluorophenyl)-n-(3-fluoro-5-morpholin-4-ylphenyl)propanamide Chemical compound C=1C(N2CCOCC2)=CC(F)=CC=1NC(=O)CCC1=CC=C(F)C(F)=C1 SIVJKYRAPQKLIM-UHFFFAOYSA-N 0.000 description 1
- VYBKAZXQKUFAHG-UHFFFAOYSA-N 3-amino-4-methylbenzamide Chemical compound CC1=CC=C(C(N)=O)C=C1N VYBKAZXQKUFAHG-UHFFFAOYSA-N 0.000 description 1
- NPOAOTPXWNWTSH-UHFFFAOYSA-N 3-hydroxy-3-methylglutaric acid Chemical compound OC(=O)CC(O)(C)CC(O)=O NPOAOTPXWNWTSH-UHFFFAOYSA-N 0.000 description 1
- 102100023340 3-ketodihydrosphingosine reductase Human genes 0.000 description 1
- 102100039822 39S ribosomal protein L55, mitochondrial Human genes 0.000 description 1
- WUBBRNOQWQTFEX-UHFFFAOYSA-N 4-aminosalicylic acid Chemical compound NC1=CC=C(C(O)=O)C(O)=C1 WUBBRNOQWQTFEX-UHFFFAOYSA-N 0.000 description 1
- 102100033714 40S ribosomal protein S6 Human genes 0.000 description 1
- 102100039222 5'-3' exoribonuclease 2 Human genes 0.000 description 1
- QEVHRUUCFGRFIF-UHFFFAOYSA-N 6,18-dimethoxy-17-[oxo-(3,4,5-trimethoxyphenyl)methoxy]-1,3,11,12,14,15,16,17,18,19,20,21-dodecahydroyohimban-19-carboxylic acid methyl ester Chemical compound C1C2CN3CCC(C4=CC=C(OC)C=C4N4)=C4C3CC2C(C(=O)OC)C(OC)C1OC(=O)C1=CC(OC)=C(OC)C(OC)=C1 QEVHRUUCFGRFIF-UHFFFAOYSA-N 0.000 description 1
- ZKRFOXLVOKTUTA-KQYNXXCUSA-N 9-(5-phosphoribofuranosyl)-6-mercaptopurine Chemical compound O[C@@H]1[C@H](O)[C@@H](COP(O)(O)=O)O[C@H]1N1C(NC=NC2=S)=C2N=C1 ZKRFOXLVOKTUTA-KQYNXXCUSA-N 0.000 description 1
- 102100028323 ADP-ribose glycohydrolase MACROD2 Human genes 0.000 description 1
- 102100022861 ADP-ribosylation factor-like protein 5A Human genes 0.000 description 1
- 102100032091 ALK and LTK ligand 2 Human genes 0.000 description 1
- 101150107820 ATG9 gene Proteins 0.000 description 1
- 102100039864 ATPase family AAA domain-containing protein 2 Human genes 0.000 description 1
- 102100022622 Alpha-1,3-mannosyl-glycoprotein 2-beta-N-acetylglucosaminyltransferase Human genes 0.000 description 1
- 102100029231 Alpha-2,8-sialyltransferase 8B Human genes 0.000 description 1
- 101710105328 Alpha-2,8-sialyltransferase 8B Proteins 0.000 description 1
- 102100036092 Alpha-endosulfine Human genes 0.000 description 1
- 102100023165 Alpha-mannosidase 2C1 Human genes 0.000 description 1
- 102100034452 Alternative prion protein Human genes 0.000 description 1
- 101710191958 Amino-acid acetyltransferase Proteins 0.000 description 1
- 101710185938 Amino-acid acetyltransferase, mitochondrial Proteins 0.000 description 1
- 101000798762 Anguilla anguilla Troponin C, skeletal muscle Proteins 0.000 description 1
- 102100034564 Ankyrin repeat domain-containing protein 36A Human genes 0.000 description 1
- 101100225890 Aplysia californica ENPP gene Proteins 0.000 description 1
- 102100030942 Apolipoprotein A-II Human genes 0.000 description 1
- 102100024044 Aprataxin Human genes 0.000 description 1
- 101100002343 Arabidopsis thaliana ARID1 gene Proteins 0.000 description 1
- 101100339431 Arabidopsis thaliana HMGB2 gene Proteins 0.000 description 1
- 101100072743 Arabidopsis thaliana IP5P7 gene Proteins 0.000 description 1
- 101100028391 Arabidopsis thaliana PI4KB1 gene Proteins 0.000 description 1
- 101100539496 Arabidopsis thaliana UNC gene Proteins 0.000 description 1
- 101100375591 Arabidopsis thaliana YAB4 gene Proteins 0.000 description 1
- 102100024003 Arf-GAP with SH3 domain, ANK repeat and PH domain-containing protein 1 Human genes 0.000 description 1
- 102100033893 Arylsulfatase J Human genes 0.000 description 1
- 102000007371 Ataxin-3 Human genes 0.000 description 1
- 108010032947 Ataxin-3 Proteins 0.000 description 1
- 101000773168 Atrax robustus Delta-hexatoxin-Ar1a Proteins 0.000 description 1
- 102100035683 Axin-2 Human genes 0.000 description 1
- 101700047552 Axin-2 Proteins 0.000 description 1
- 108700020463 BRCA1 Proteins 0.000 description 1
- 101150072950 BRCA1 gene Proteins 0.000 description 1
- 108700020462 BRCA2 Proteins 0.000 description 1
- 102000008836 BTB/POZ domains Human genes 0.000 description 1
- 108050000749 BTB/POZ domains Proteins 0.000 description 1
- 102100027515 Baculoviral IAP repeat-containing protein 6 Human genes 0.000 description 1
- 208000014596 Berardinelli-Seip congenital lipodystrophy Diseases 0.000 description 1
- 101100057216 Bos taurus ATG9A gene Proteins 0.000 description 1
- 101150008921 Brca2 gene Proteins 0.000 description 1
- 102100025401 Breast cancer type 1 susceptibility protein Human genes 0.000 description 1
- 102100025399 Breast cancer type 2 susceptibility protein Human genes 0.000 description 1
- 102100031173 CCN family member 4 Human genes 0.000 description 1
- 101710038256 CEP112 Proteins 0.000 description 1
- 101710036791 CEP192 Proteins 0.000 description 1
- 102100026861 CYFIP-related Rac1 interactor B Human genes 0.000 description 1
- 101001059929 Caenorhabditis elegans Forkhead box protein O Proteins 0.000 description 1
- 101100491824 Caenorhabditis elegans arl-3 gene Proteins 0.000 description 1
- 101100491817 Caenorhabditis elegans evl-20 gene Proteins 0.000 description 1
- 101100343342 Caenorhabditis elegans lin-11 gene Proteins 0.000 description 1
- 101100518995 Caenorhabditis elegans pax-3 gene Proteins 0.000 description 1
- 101000841393 Candida albicans Probable NADPH dehydrogenase Proteins 0.000 description 1
- 235000008474 Cardamine pratensis Nutrition 0.000 description 1
- 240000000606 Cardamine pratensis Species 0.000 description 1
- 102100028906 Catenin delta-1 Human genes 0.000 description 1
- 102000011068 Cdc42 Human genes 0.000 description 1
- 102100025045 Cell cycle checkpoint control protein RAD9B Human genes 0.000 description 1
- 102100033129 Centrosomal protein of 112 kDa Human genes 0.000 description 1
- 102100036179 Centrosomal protein of 170 kDa Human genes 0.000 description 1
- 101710142011 Centrosomal protein of 170 kDa Proteins 0.000 description 1
- 102100036178 Centrosomal protein of 192 kDa Human genes 0.000 description 1
- 102100039095 Chromatin-remodeling ATPase INO80 Human genes 0.000 description 1
- 108010076130 Cleavage And Polyadenylation Specificity Factor Proteins 0.000 description 1
- 102000011591 Cleavage And Polyadenylation Specificity Factor Human genes 0.000 description 1
- 108020004705 Codon Proteins 0.000 description 1
- 102100032372 Coiled-coil domain-containing protein 88B Human genes 0.000 description 1
- 102100025407 Complement C1q and tumor necrosis factor-related protein 9A Human genes 0.000 description 1
- 102100035432 Complement factor H Human genes 0.000 description 1
- 201000006705 Congenital generalized lipodystrophy Diseases 0.000 description 1
- 101000637625 Cricetulus griseus GTP-binding protein SAR1b Proteins 0.000 description 1
- 102100023578 Cyclic AMP-dependent transcription factor ATF-7 Human genes 0.000 description 1
- 102100022052 Cyclin N-terminal domain-containing protein 1 Human genes 0.000 description 1
- 108010017222 Cyclin-Dependent Kinase Inhibitor p57 Proteins 0.000 description 1
- 102000004480 Cyclin-Dependent Kinase Inhibitor p57 Human genes 0.000 description 1
- 102100035300 Cystine/glutamate transporter Human genes 0.000 description 1
- 102100031655 Cytochrome b5 Human genes 0.000 description 1
- 102100028712 Cytosolic purine 5'-nucleotidase Human genes 0.000 description 1
- 108010058076 D-xylulose reductase Proteins 0.000 description 1
- 101150027068 DEGS1 gene Proteins 0.000 description 1
- 102100025267 DENN domain-containing protein 5A Human genes 0.000 description 1
- 102100039524 DNA endonuclease RBBP8 Human genes 0.000 description 1
- 102100022286 DNA repair-scaffolding protein Human genes 0.000 description 1
- 102100022204 DNA-dependent protein kinase catalytic subunit Human genes 0.000 description 1
- 101100459919 Danio rerio neurod1 gene Proteins 0.000 description 1
- 101100309432 Danio rerio sec61al1 gene Proteins 0.000 description 1
- 102100040577 Dermatan-sulfate epimerase-like protein Human genes 0.000 description 1
- 102000003668 Destrin Human genes 0.000 description 1
- 108090000082 Destrin Proteins 0.000 description 1
- 108010062677 Diacylglycerol Kinase Proteins 0.000 description 1
- 102100022735 Diacylglycerol kinase alpha Human genes 0.000 description 1
- 101100296720 Dictyostelium discoideum Pde4 gene Proteins 0.000 description 1
- 101100386048 Dictyostelium discoideum cyri gene Proteins 0.000 description 1
- 101100168861 Dictyostelium discoideum fcpA gene Proteins 0.000 description 1
- 101100286286 Dictyostelium discoideum ipi gene Proteins 0.000 description 1
- 101100510209 Dictyostelium discoideum kif3 gene Proteins 0.000 description 1
- 101100135868 Dictyostelium discoideum pde3 gene Proteins 0.000 description 1
- 101100533283 Dictyostelium discoideum serp gene Proteins 0.000 description 1
- 101100425707 Dictyostelium discoideum tmem50 gene Proteins 0.000 description 1
- MYMOFIZGZYHOMD-UHFFFAOYSA-N Dioxygen Chemical compound O=O MYMOFIZGZYHOMD-UHFFFAOYSA-N 0.000 description 1
- 102100037849 Divergent protein kinase domain 1B Human genes 0.000 description 1
- 102100038002 Dolichyl-diphosphooligosaccharide-protein glycosyltransferase subunit STT3A Human genes 0.000 description 1
- 101100377506 Drosophila melanogaster 14-3-3zeta gene Proteins 0.000 description 1
- 101100021869 Drosophila melanogaster Lrch gene Proteins 0.000 description 1
- 101100405254 Drosophila melanogaster Nrg gene Proteins 0.000 description 1
- 101100165771 Drosophila melanogaster l(2)gd1 gene Proteins 0.000 description 1
- 101100014709 Drosophila melanogaster wisp gene Proteins 0.000 description 1
- 102100024821 Dynamin-binding protein Human genes 0.000 description 1
- 102100032300 Dynein axonemal heavy chain 11 Human genes 0.000 description 1
- 102100032249 Dystonin Human genes 0.000 description 1
- 102100035102 E3 ubiquitin-protein ligase MYCBP2 Human genes 0.000 description 1
- 108050002772 E3 ubiquitin-protein ligase Mdm2 Proteins 0.000 description 1
- 102000012199 E3 ubiquitin-protein ligase Mdm2 Human genes 0.000 description 1
- 102100031918 E3 ubiquitin-protein ligase NEDD4 Human genes 0.000 description 1
- 102100022166 E3 ubiquitin-protein ligase NEURL1 Human genes 0.000 description 1
- 102100040278 E3 ubiquitin-protein ligase RNF19A Human genes 0.000 description 1
- 102100029520 E3 ubiquitin-protein ligase TRIM31 Human genes 0.000 description 1
- 101150040636 ELP1 gene Proteins 0.000 description 1
- 102100030801 Elongation factor 1-alpha 1 Human genes 0.000 description 1
- 101000813126 Escherichia coli O157:H7 Laminin-binding fimbrial subunit ElfA Proteins 0.000 description 1
- 108010082945 Eukaryotic Initiation Factor-2B Proteins 0.000 description 1
- 102000012858 Eukaryotic Initiation Factor-4G Human genes 0.000 description 1
- 108010057192 Eukaryotic Initiation Factor-4G Proteins 0.000 description 1
- 102100035975 Exostosin-like 1 Human genes 0.000 description 1
- 102100037343 F-box/LRR-repeat protein 6 Human genes 0.000 description 1
- 102100027279 FAS-associated factor 1 Human genes 0.000 description 1
- 102100027267 FERM, ARHGEF and pleckstrin domain-containing protein 1 Human genes 0.000 description 1
- 102100027868 FHF complex subunit HOOK interacting protein 1A Human genes 0.000 description 1
- 102100027639 Fanconi anemia core complex-associated protein 20 Human genes 0.000 description 1
- 102100035111 Farnesyl pyrophosphate synthase Human genes 0.000 description 1
- 102100037819 Fas apoptotic inhibitory molecule 1 Human genes 0.000 description 1
- 102100026559 Filamin-B Human genes 0.000 description 1
- 102100021245 G-protein coupled receptor 183 Human genes 0.000 description 1
- 102100035205 GA-binding protein subunit beta-1 Human genes 0.000 description 1
- 241001123946 Gaga Species 0.000 description 1
- 101710088083 Glomulin Proteins 0.000 description 1
- 102100038395 Granzyme K Human genes 0.000 description 1
- 102100032134 Guanine nucleotide exchange factor VAV2 Human genes 0.000 description 1
- 102100025334 Guanine nucleotide-binding protein G(q) subunit alpha Human genes 0.000 description 1
- 102100033969 Guanylyl cyclase-activating protein 1 Human genes 0.000 description 1
- 102100034471 H(+)/Cl(-) exchange transporter 5 Human genes 0.000 description 1
- 102100028970 HLA class I histocompatibility antigen, alpha chain E Human genes 0.000 description 1
- 108010049069 HMGA Proteins Proteins 0.000 description 1
- 102000009012 HMGA Proteins Human genes 0.000 description 1
- 108010001860 HMGB Proteins Proteins 0.000 description 1
- 102000000849 HMGB Proteins Human genes 0.000 description 1
- 108700010013 HMGB1 Proteins 0.000 description 1
- 101150021904 HMGB1 gene Proteins 0.000 description 1
- 108010081348 HRT1 protein Hairy Proteins 0.000 description 1
- 102100021881 Hairy/enhancer-of-split related with YRPW motif protein 1 Human genes 0.000 description 1
- 102100021888 Helix-loop-helix protein 1 Human genes 0.000 description 1
- 102100028006 Heme oxygenase 1 Human genes 0.000 description 1
- 108010007707 Hepatitis A Virus Cellular Receptor 2 Proteins 0.000 description 1
- 102100034459 Hepatitis A virus cellular receptor 1 Human genes 0.000 description 1
- 102100034458 Hepatitis A virus cellular receptor 2 Human genes 0.000 description 1
- 102100037848 Heterochromatin protein 1-binding protein 3 Human genes 0.000 description 1
- 102100033998 Heterogeneous nuclear ribonucleoprotein U-like protein 1 Human genes 0.000 description 1
- 102100024233 High affinity cAMP-specific 3',5'-cyclic phosphodiesterase 7A Human genes 0.000 description 1
- 102100037907 High mobility group protein B1 Human genes 0.000 description 1
- 102100029009 High mobility group protein HMG-I/HMG-Y Human genes 0.000 description 1
- 102100029076 Histamine N-methyltransferase Human genes 0.000 description 1
- 102100022893 Histone acetyltransferase KAT5 Human genes 0.000 description 1
- 102100033070 Histone acetyltransferase KAT6B Human genes 0.000 description 1
- 108090000353 Histone deacetylase Proteins 0.000 description 1
- 102100021453 Histone deacetylase 5 Human genes 0.000 description 1
- 102100038720 Histone deacetylase 9 Human genes 0.000 description 1
- 102100027768 Histone-lysine N-methyltransferase 2D Human genes 0.000 description 1
- 102100034826 Homeobox protein Meis2 Human genes 0.000 description 1
- 101000605571 Homo sapiens 1-acyl-sn-glycerol-3-phosphate acyltransferase beta Proteins 0.000 description 1
- 101001126450 Homo sapiens 1-acyl-sn-glycerol-3-phosphate acyltransferase delta Proteins 0.000 description 1
- 101000605576 Homo sapiens 1-acyl-sn-glycerol-3-phosphate acyltransferase gamma Proteins 0.000 description 1
- 101000866618 Homo sapiens 3-beta-hydroxysteroid-Delta(8),Delta(7)-isomerase Proteins 0.000 description 1
- 101001050680 Homo sapiens 3-ketodihydrosphingosine reductase Proteins 0.000 description 1
- 101000667530 Homo sapiens 39S ribosomal protein L55, mitochondrial Proteins 0.000 description 1
- 101000656896 Homo sapiens 40S ribosomal protein S6 Proteins 0.000 description 1
- 101000745788 Homo sapiens 5'-3' exoribonuclease 2 Proteins 0.000 description 1
- 101000578915 Homo sapiens ADP-ribose glycohydrolase MACROD2 Proteins 0.000 description 1
- 101000974441 Homo sapiens ADP-ribosylation factor-like protein 5A Proteins 0.000 description 1
- 101000776351 Homo sapiens ALK and LTK ligand 2 Proteins 0.000 description 1
- 101000887284 Homo sapiens ATPase family AAA domain-containing protein 2 Proteins 0.000 description 1
- 101000690306 Homo sapiens Aldo-keto reductase family 1 member C3 Proteins 0.000 description 1
- 101000972916 Homo sapiens Alpha-1,3-mannosyl-glycoprotein 2-beta-N-acetylglucosaminyltransferase Proteins 0.000 description 1
- 101000876352 Homo sapiens Alpha-endosulfine Proteins 0.000 description 1
- 101000979029 Homo sapiens Alpha-mannosidase 2C1 Proteins 0.000 description 1
- 101000924727 Homo sapiens Alternative prion protein Proteins 0.000 description 1
- 101000924343 Homo sapiens Ankyrin repeat domain-containing protein 36A Proteins 0.000 description 1
- 101000796083 Homo sapiens Ankyrin repeat family A protein 2 Proteins 0.000 description 1
- 101000793406 Homo sapiens Apolipoprotein A-II Proteins 0.000 description 1
- 101000757586 Homo sapiens Aprataxin Proteins 0.000 description 1
- 101000975752 Homo sapiens Arf-GAP with SH3 domain, ANK repeat and PH domain-containing protein 1 Proteins 0.000 description 1
- 101000925514 Homo sapiens Arylsulfatase J Proteins 0.000 description 1
- 101000936081 Homo sapiens Baculoviral IAP repeat-containing protein 6 Proteins 0.000 description 1
- 101001125486 Homo sapiens Basic salivary proline-rich protein 1 Proteins 0.000 description 1
- 101000765010 Homo sapiens Beta-galactosidase Proteins 0.000 description 1
- 101000713085 Homo sapiens C-C motif chemokine 21 Proteins 0.000 description 1
- 101000777560 Homo sapiens CCN family member 4 Proteins 0.000 description 1
- 101100382122 Homo sapiens CIITA gene Proteins 0.000 description 1
- 101000911995 Homo sapiens CYFIP-related Rac1 interactor B Proteins 0.000 description 1
- 101000916264 Homo sapiens Catenin delta-1 Proteins 0.000 description 1
- 101001077512 Homo sapiens Cell cycle checkpoint control protein RAD9B Proteins 0.000 description 1
- 101001033682 Homo sapiens Chromatin-remodeling ATPase INO80 Proteins 0.000 description 1
- 101000868820 Homo sapiens Coiled-coil domain-containing protein 88B Proteins 0.000 description 1
- 101000934939 Homo sapiens Complement C1q and tumor necrosis factor-related protein 9A Proteins 0.000 description 1
- 101000737574 Homo sapiens Complement factor H Proteins 0.000 description 1
- 101000905723 Homo sapiens Cyclic AMP-dependent transcription factor ATF-7 Proteins 0.000 description 1
- 101000900815 Homo sapiens Cyclin N-terminal domain-containing protein 1 Proteins 0.000 description 1
- 101000922386 Homo sapiens Cytochrome b5 Proteins 0.000 description 1
- 101000915162 Homo sapiens Cytosolic purine 5'-nucleotidase Proteins 0.000 description 1
- 101000722275 Homo sapiens DENN domain-containing protein 5A Proteins 0.000 description 1
- 101000746134 Homo sapiens DNA endonuclease RBBP8 Proteins 0.000 description 1
- 101000825159 Homo sapiens DNA repair-scaffolding protein Proteins 0.000 description 1
- 101000619536 Homo sapiens DNA-dependent protein kinase catalytic subunit Proteins 0.000 description 1
- 101000816741 Homo sapiens Dermatan-sulfate epimerase-like protein Proteins 0.000 description 1
- 101001044817 Homo sapiens Diacylglycerol kinase alpha Proteins 0.000 description 1
- 101000806069 Homo sapiens Divergent protein kinase domain 1B Proteins 0.000 description 1
- 101000661592 Homo sapiens Dolichyl-diphosphooligosaccharide-protein glycosyltransferase subunit STT3A Proteins 0.000 description 1
- 101000909230 Homo sapiens Dynamin-binding protein Proteins 0.000 description 1
- 101001016208 Homo sapiens Dynein axonemal heavy chain 11 Proteins 0.000 description 1
- 101001016186 Homo sapiens Dystonin Proteins 0.000 description 1
- 101000636713 Homo sapiens E3 ubiquitin-protein ligase NEDD4 Proteins 0.000 description 1
- 101000973232 Homo sapiens E3 ubiquitin-protein ligase NEURL1 Proteins 0.000 description 1
- 101001104280 Homo sapiens E3 ubiquitin-protein ligase RNF19A Proteins 0.000 description 1
- 101001103581 Homo sapiens E3 ubiquitin-protein ligase RNF34 Proteins 0.000 description 1
- 101000634974 Homo sapiens E3 ubiquitin-protein ligase TRIM31 Proteins 0.000 description 1
- 101000920078 Homo sapiens Elongation factor 1-alpha 1 Proteins 0.000 description 1
- 101000881679 Homo sapiens Endoglin Proteins 0.000 description 1
- 101000875550 Homo sapiens Exostosin-like 1 Proteins 0.000 description 1
- 101001026845 Homo sapiens F-box/LRR-repeat protein 6 Proteins 0.000 description 1
- 101000914654 Homo sapiens FAS-associated factor 1 Proteins 0.000 description 1
- 101000914701 Homo sapiens FERM, ARHGEF and pleckstrin domain-containing protein 1 Proteins 0.000 description 1
- 101001060551 Homo sapiens FHF complex subunit HOOK interacting protein 1A Proteins 0.000 description 1
- 101000937164 Homo sapiens Fanconi anemia core complex-associated protein 20 Proteins 0.000 description 1
- 101001023007 Homo sapiens Farnesyl pyrophosphate synthase Proteins 0.000 description 1
- 101000878509 Homo sapiens Fas apoptotic inhibitory molecule 1 Proteins 0.000 description 1
- 101000846893 Homo sapiens Fibrillin-1 Proteins 0.000 description 1
- 101000913551 Homo sapiens Filamin-B Proteins 0.000 description 1
- 101001040801 Homo sapiens G-protein coupled receptor 183 Proteins 0.000 description 1
- 101001022098 Homo sapiens GA-binding protein subunit beta-1 Proteins 0.000 description 1
- 101000637622 Homo sapiens GTP-binding protein SAR1a Proteins 0.000 description 1
- 101001033007 Homo sapiens Granzyme K Proteins 0.000 description 1
- 101000775776 Homo sapiens Guanine nucleotide exchange factor VAV2 Proteins 0.000 description 1
- 101000857888 Homo sapiens Guanine nucleotide-binding protein G(q) subunit alpha Proteins 0.000 description 1
- 101001068480 Homo sapiens Guanylyl cyclase-activating protein 1 Proteins 0.000 description 1
- 101000710225 Homo sapiens H(+)/Cl(-) exchange transporter 5 Proteins 0.000 description 1
- 101000986085 Homo sapiens HLA class I histocompatibility antigen, alpha chain E Proteins 0.000 description 1
- 101000897691 Homo sapiens Helix-loop-helix protein 1 Proteins 0.000 description 1
- 101001079623 Homo sapiens Heme oxygenase 1 Proteins 0.000 description 1
- 101001068136 Homo sapiens Hepatitis A virus cellular receptor 1 Proteins 0.000 description 1
- 101001025546 Homo sapiens Heterochromatin protein 1-binding protein 3 Proteins 0.000 description 1
- 101001017567 Homo sapiens Heterogeneous nuclear ribonucleoprotein U-like protein 1 Proteins 0.000 description 1
- 101001117267 Homo sapiens High affinity cAMP-specific 3',5'-cyclic phosphodiesterase 7A Proteins 0.000 description 1
- 101000986380 Homo sapiens High mobility group protein HMG-I/HMG-Y Proteins 0.000 description 1
- 101000988655 Homo sapiens Histamine N-methyltransferase Proteins 0.000 description 1
- 101000944174 Homo sapiens Histone acetyltransferase KAT6B Proteins 0.000 description 1
- 101000899255 Homo sapiens Histone deacetylase 5 Proteins 0.000 description 1
- 101001008894 Homo sapiens Histone-lysine N-methyltransferase 2D Proteins 0.000 description 1
- 101001019057 Homo sapiens Homeobox protein Meis2 Proteins 0.000 description 1
- 101000839025 Homo sapiens Hydroxymethylglutaryl-CoA synthase, cytoplasmic Proteins 0.000 description 1
- 101000635408 Homo sapiens Inactive N-acetylated-alpha-linked acidic dipeptidase-like protein 2 Proteins 0.000 description 1
- 101000902205 Homo sapiens Inactive cytidine monophosphate-N-acetylneuraminic acid hydroxylase Proteins 0.000 description 1
- 101001103039 Homo sapiens Inactive tyrosine-protein kinase transmembrane receptor ROR1 Proteins 0.000 description 1
- 101000953488 Homo sapiens Inositol hexakisphosphate and diphosphoinositol-pentakisphosphate kinase 2 Proteins 0.000 description 1
- 101001053320 Homo sapiens Inositol polyphosphate 5-phosphatase K Proteins 0.000 description 1
- 101000599779 Homo sapiens Insulin-like growth factor 2 mRNA-binding protein 2 Proteins 0.000 description 1
- 101000840577 Homo sapiens Insulin-like growth factor-binding protein 7 Proteins 0.000 description 1
- 101001015059 Homo sapiens Integrin beta-5 Proteins 0.000 description 1
- 101000976697 Homo sapiens Inter-alpha-trypsin inhibitor heavy chain H1 Proteins 0.000 description 1
- 101000599056 Homo sapiens Interleukin-6 receptor subunit beta Proteins 0.000 description 1
- 101001010842 Homo sapiens Intraflagellar transport protein 57 homolog Proteins 0.000 description 1
- 101000998711 Homo sapiens Inversin Proteins 0.000 description 1
- 101000975512 Homo sapiens Junctional protein associated with coronary artery disease Proteins 0.000 description 1
- 101001046960 Homo sapiens Keratin, type II cytoskeletal 1 Proteins 0.000 description 1
- 101000944957 Homo sapiens Keratin-associated protein 1-5 Proteins 0.000 description 1
- 101000605496 Homo sapiens Kinesin light chain 1 Proteins 0.000 description 1
- 101001135088 Homo sapiens LIM domain only protein 7 Proteins 0.000 description 1
- 101001138022 Homo sapiens La-related protein 1 Proteins 0.000 description 1
- 101001065660 Homo sapiens Lanosterol synthase Proteins 0.000 description 1
- 101001038427 Homo sapiens Leucine zipper putative tumor suppressor 2 Proteins 0.000 description 1
- 101000981675 Homo sapiens Leucine-rich repeat and immunoglobulin-like domain-containing nogo receptor-interacting protein 2 Proteins 0.000 description 1
- 101001017764 Homo sapiens Lipopolysaccharide-responsive and beige-like anchor protein Proteins 0.000 description 1
- 101001065609 Homo sapiens Lumican Proteins 0.000 description 1
- 101001038505 Homo sapiens Ly6/PLAUR domain-containing protein 1 Proteins 0.000 description 1
- 101000613958 Homo sapiens Lysine-specific demethylase 2A Proteins 0.000 description 1
- 101001025967 Homo sapiens Lysine-specific demethylase 6A Proteins 0.000 description 1
- 101000615932 Homo sapiens Mannosyl-oligosaccharide 1,2-alpha-mannosidase IB Proteins 0.000 description 1
- 101001120864 Homo sapiens Meckelin Proteins 0.000 description 1
- 101001055427 Homo sapiens Mediator of RNA polymerase II transcription subunit 13 Proteins 0.000 description 1
- 101000583145 Homo sapiens Membrane-associated phosphatidylinositol transfer protein 1 Proteins 0.000 description 1
- 101000954986 Homo sapiens Merlin Proteins 0.000 description 1
- 101000615030 Homo sapiens Mesenteric estrogen-dependent adipogenesis protein Proteins 0.000 description 1
- 101000669513 Homo sapiens Metalloproteinase inhibitor 1 Proteins 0.000 description 1
- 101000581507 Homo sapiens Methyl-CpG-binding domain protein 1 Proteins 0.000 description 1
- 101001022780 Homo sapiens Myosin light chain kinase, smooth muscle Proteins 0.000 description 1
- 101000906927 Homo sapiens N-chimaerin Proteins 0.000 description 1
- 101000636823 Homo sapiens Neogenin Proteins 0.000 description 1
- 101000672316 Homo sapiens Netrin receptor UNC5B Proteins 0.000 description 1
- 101000578062 Homo sapiens Nicastrin Proteins 0.000 description 1
- 101000601047 Homo sapiens Nidogen-1 Proteins 0.000 description 1
- 101000601048 Homo sapiens Nidogen-2 Proteins 0.000 description 1
- 101000578354 Homo sapiens Nodal modulator 3 Proteins 0.000 description 1
- 101001018109 Homo sapiens Nucleotidyltransferase MB21D2 Proteins 0.000 description 1
- 101001120706 Homo sapiens Outer dense fiber protein 2 Proteins 0.000 description 1
- 101000992396 Homo sapiens Oxysterol-binding protein-related protein 3 Proteins 0.000 description 1
- 101100174573 Homo sapiens PIKFYVE gene Proteins 0.000 description 1
- 101000738901 Homo sapiens PMS1 protein homolog 1 Proteins 0.000 description 1
- 101000604110 Homo sapiens Palmitoleoyl-protein carboxylesterase NOTUM Proteins 0.000 description 1
- 101001135199 Homo sapiens Partitioning defective 3 homolog Proteins 0.000 description 1
- 101001082142 Homo sapiens Pentraxin-related protein PTX3 Proteins 0.000 description 1
- 101001134861 Homo sapiens Pericentriolar material 1 protein Proteins 0.000 description 1
- 101000987578 Homo sapiens Peripherin Proteins 0.000 description 1
- 101000610652 Homo sapiens Peripherin-2 Proteins 0.000 description 1
- 101001122930 Homo sapiens Periphilin-1 Proteins 0.000 description 1
- 101001120056 Homo sapiens Phosphatidylinositol 3-kinase regulatory subunit alpha Proteins 0.000 description 1
- 101000595746 Homo sapiens Phosphatidylinositol 4,5-bisphosphate 3-kinase catalytic subunit delta isoform Proteins 0.000 description 1
- 101001074954 Homo sapiens Phosphatidylinositol 4,5-bisphosphate 5-phosphatase A Proteins 0.000 description 1
- 101000604565 Homo sapiens Phosphatidylinositol glycan anchor biosynthesis class U protein Proteins 0.000 description 1
- 101000582936 Homo sapiens Pleckstrin Proteins 0.000 description 1
- 101001096190 Homo sapiens Pleckstrin homology domain-containing family A member 1 Proteins 0.000 description 1
- 101001077449 Homo sapiens Potassium voltage-gated channel subfamily S member 1 Proteins 0.000 description 1
- 101000649043 Homo sapiens Probable tRNA methyltransferase 9B Proteins 0.000 description 1
- 101001098982 Homo sapiens Propionyl-CoA carboxylase beta chain, mitochondrial Proteins 0.000 description 1
- 101000866633 Homo sapiens Protein Hook homolog 3 Proteins 0.000 description 1
- 101000979760 Homo sapiens Protein NDNF Proteins 0.000 description 1
- 101001094684 Homo sapiens Protein O-mannosyl-transferase 2 Proteins 0.000 description 1
- 101001129746 Homo sapiens Protein PHTF1 Proteins 0.000 description 1
- 101000869690 Homo sapiens Protein S100-A8 Proteins 0.000 description 1
- 101000652263 Homo sapiens Protein SOGA1 Proteins 0.000 description 1
- 101000707247 Homo sapiens Protein Shroom3 Proteins 0.000 description 1
- 101000928406 Homo sapiens Protein diaphanous homolog 3 Proteins 0.000 description 1
- 101000893493 Homo sapiens Protein flightless-1 homolog Proteins 0.000 description 1
- 101001051777 Homo sapiens Protein kinase C alpha type Proteins 0.000 description 1
- 101000742071 Homo sapiens Protein phosphatase 1 regulatory subunit 26 Proteins 0.000 description 1
- 101000622041 Homo sapiens Putative RNA-binding protein Luc7-like 1 Proteins 0.000 description 1
- 101001008492 Homo sapiens Putative RNA-binding protein Luc7-like 2 Proteins 0.000 description 1
- 101000734537 Homo sapiens Pyridoxal-dependent decarboxylase domain-containing protein 1 Proteins 0.000 description 1
- 101000848700 Homo sapiens Rap guanine nucleotide exchange factor 1 Proteins 0.000 description 1
- 101000994792 Homo sapiens Ras GTPase-activating-like protein IQGAP1 Proteins 0.000 description 1
- 101000620554 Homo sapiens Ras-related protein Rab-38 Proteins 0.000 description 1
- 101001099876 Homo sapiens Ras-related protein Rab-44 Proteins 0.000 description 1
- 101001130458 Homo sapiens Ras-related protein Ral-B Proteins 0.000 description 1
- 101001132658 Homo sapiens Retinoic acid receptor gamma Proteins 0.000 description 1
- 101001094537 Homo sapiens Retrotransposon Gag-like protein 3 Proteins 0.000 description 1
- 101000581155 Homo sapiens Rho GTPase-activating protein 12 Proteins 0.000 description 1
- 101000575667 Homo sapiens Rho family-interacting cell polarization regulator 1 Proteins 0.000 description 1
- 101000704874 Homo sapiens Rho family-interacting cell polarization regulator 2 Proteins 0.000 description 1
- 101000581125 Homo sapiens Rho-related GTP-binding protein RhoF Proteins 0.000 description 1
- 101000709370 Homo sapiens S-phase kinase-associated protein 2 Proteins 0.000 description 1
- 101001093937 Homo sapiens SEC14-like protein 1 Proteins 0.000 description 1
- 101000654564 Homo sapiens SH3 domain-containing YSC84-like protein 1 Proteins 0.000 description 1
- 101000616556 Homo sapiens SH3 domain-containing protein 19 Proteins 0.000 description 1
- 101000831887 Homo sapiens STE20-related kinase adapter protein alpha Proteins 0.000 description 1
- 101000684514 Homo sapiens Sentrin-specific protease 6 Proteins 0.000 description 1
- 101000650621 Homo sapiens Septin-1 Proteins 0.000 description 1
- 101001069710 Homo sapiens Serine protease 23 Proteins 0.000 description 1
- 101000885321 Homo sapiens Serine/threonine-protein kinase DCLK1 Proteins 0.000 description 1
- 101000939549 Homo sapiens Serine/threonine-protein kinase Kist Proteins 0.000 description 1
- 101000576901 Homo sapiens Serine/threonine-protein kinase MRCK alpha Proteins 0.000 description 1
- 101000770770 Homo sapiens Serine/threonine-protein kinase WNK1 Proteins 0.000 description 1
- 101000836954 Homo sapiens Sialic acid-binding Ig-like lectin 10 Proteins 0.000 description 1
- 101000609926 Homo sapiens Sister chromatid cohesion protein PDS5 homolog B Proteins 0.000 description 1
- 101000654356 Homo sapiens Sodium channel protein type 10 subunit alpha Proteins 0.000 description 1
- 101000707569 Homo sapiens Splicing factor 3A subunit 3 Proteins 0.000 description 1
- 101000808799 Homo sapiens Splicing factor U2AF 35 kDa subunit Proteins 0.000 description 1
- 101000651021 Homo sapiens Splicing factor, arginine/serine-rich 19 Proteins 0.000 description 1
- 101000831940 Homo sapiens Stathmin Proteins 0.000 description 1
- 101000641015 Homo sapiens Sterile alpha motif domain-containing protein 9 Proteins 0.000 description 1
- 101000617830 Homo sapiens Sterol O-acyltransferase 1 Proteins 0.000 description 1
- 101000868422 Homo sapiens Sushi, nidogen and EGF-like domain-containing protein 1 Proteins 0.000 description 1
- 101000659054 Homo sapiens Synaptopodin Proteins 0.000 description 1
- 101000740523 Homo sapiens Syntenin-1 Proteins 0.000 description 1
- 101000653469 Homo sapiens T-complex protein 1 subunit zeta Proteins 0.000 description 1
- 101000633627 Homo sapiens Teashirt homolog 2 Proteins 0.000 description 1
- 101000666340 Homo sapiens Tenascin Proteins 0.000 description 1
- 101000626153 Homo sapiens Tensin-3 Proteins 0.000 description 1
- 101000666421 Homo sapiens Terminal nucleotidyltransferase 5B Proteins 0.000 description 1
- 101000794197 Homo sapiens Testis-specific serine/threonine-protein kinase 3 Proteins 0.000 description 1
- 101000759876 Homo sapiens Tetraspanin-11 Proteins 0.000 description 1
- 101000612838 Homo sapiens Tetraspanin-7 Proteins 0.000 description 1
- 101000845180 Homo sapiens Tetratricopeptide repeat protein 7A Proteins 0.000 description 1
- 101000773153 Homo sapiens Thioredoxin-like protein 4A Proteins 0.000 description 1
- 101000802084 Homo sapiens Thiosulfate sulfurtransferase Proteins 0.000 description 1
- 101000659879 Homo sapiens Thrombospondin-1 Proteins 0.000 description 1
- 101000666234 Homo sapiens Thyroid adenoma-associated protein Proteins 0.000 description 1
- 101000712600 Homo sapiens Thyroid hormone receptor beta Proteins 0.000 description 1
- 101000909637 Homo sapiens Transcription factor COE1 Proteins 0.000 description 1
- 101000979190 Homo sapiens Transcription factor MafB Proteins 0.000 description 1
- 101000636213 Homo sapiens Transcriptional activator Myb Proteins 0.000 description 1
- 101001049688 Homo sapiens Translation initiation factor eIF-2B subunit gamma Proteins 0.000 description 1
- 101000655133 Homo sapiens Transmembrane protein 102 Proteins 0.000 description 1
- 101000598051 Homo sapiens Transmembrane protein 119 Proteins 0.000 description 1
- 101000655149 Homo sapiens Transmembrane protein 154 Proteins 0.000 description 1
- 101000851588 Homo sapiens Transmembrane protein 214 Proteins 0.000 description 1
- 101000648531 Homo sapiens Transmembrane protein 50B Proteins 0.000 description 1
- 101000611194 Homo sapiens Trinucleotide repeat-containing gene 6A protein Proteins 0.000 description 1
- 101000625727 Homo sapiens Tubulin beta chain Proteins 0.000 description 1
- 101000636780 Homo sapiens Tumor necrosis factor alpha-induced protein 8-like protein 3 Proteins 0.000 description 1
- 101000648507 Homo sapiens Tumor necrosis factor receptor superfamily member 14 Proteins 0.000 description 1
- 101000679857 Homo sapiens Tumor necrosis factor receptor superfamily member 3 Proteins 0.000 description 1
- 101000830843 Homo sapiens Tumor protein p63-regulated gene 1 protein Proteins 0.000 description 1
- 101001103033 Homo sapiens Tyrosine-protein kinase transmembrane receptor ROR2 Proteins 0.000 description 1
- 101000704170 Homo sapiens U2 snRNP-associated SURP motif-containing protein Proteins 0.000 description 1
- 101000610557 Homo sapiens U4/U6 small nuclear ribonucleoprotein Prp31 Proteins 0.000 description 1
- 101000768621 Homo sapiens UHRF1-binding protein 1-like Proteins 0.000 description 1
- 101000777263 Homo sapiens UV radiation resistance-associated gene protein Proteins 0.000 description 1
- 101000607645 Homo sapiens Ubiquilin-4 Proteins 0.000 description 1
- 101000939135 Homo sapiens Ubiquitin carboxyl-terminal hydrolase 27 Proteins 0.000 description 1
- 101000809126 Homo sapiens Ubiquitin carboxyl-terminal hydrolase isozyme L5 Proteins 0.000 description 1
- 101000772914 Homo sapiens Ubiquitin-associated protein 2 Proteins 0.000 description 1
- 101000644657 Homo sapiens Ubiquitin-conjugating enzyme E2 G1 Proteins 0.000 description 1
- 101000808753 Homo sapiens Ubiquitin-conjugating enzyme E2 variant 1 Proteins 0.000 description 1
- 101000776508 Homo sapiens Up-regulator of cell proliferation Proteins 0.000 description 1
- 101000803711 Homo sapiens V-set and transmembrane domain-containing protein 2-like protein Proteins 0.000 description 1
- 101001038317 Homo sapiens VIP36-like protein Proteins 0.000 description 1
- 101000617919 Homo sapiens VPS10 domain-containing receptor SorCS1 Proteins 0.000 description 1
- 101000771974 Homo sapiens Vacuolar protein sorting-associated protein 41 homolog Proteins 0.000 description 1
- 101000851018 Homo sapiens Vascular endothelial growth factor receptor 1 Proteins 0.000 description 1
- 101000859452 Homo sapiens Very large A-kinase anchor protein Proteins 0.000 description 1
- 101000743114 Homo sapiens WASH complex subunit 4 Proteins 0.000 description 1
- 101000743193 Homo sapiens WD repeat-containing protein 27 Proteins 0.000 description 1
- 101000788847 Homo sapiens Zinc finger CCHC domain-containing protein 8 Proteins 0.000 description 1
- 101000915475 Homo sapiens Zinc finger MIZ domain-containing protein 2 Proteins 0.000 description 1
- 101000818566 Homo sapiens Zinc finger and BTB domain-containing protein 26 Proteins 0.000 description 1
- 101000759547 Homo sapiens Zinc finger and BTB domain-containing protein 7A Proteins 0.000 description 1
- 101000818737 Homo sapiens Zinc finger protein 12 Proteins 0.000 description 1
- 101000723740 Homo sapiens Zinc finger protein 24 Proteins 0.000 description 1
- 101000723761 Homo sapiens Zinc finger protein 28 Proteins 0.000 description 1
- 101000788890 Homo sapiens Zinc finger protein 280A Proteins 0.000 description 1
- 101000964390 Homo sapiens Zinc finger protein 280D Proteins 0.000 description 1
- 101000818799 Homo sapiens Zinc finger protein 426 Proteins 0.000 description 1
- 101000964727 Homo sapiens Zinc finger protein 74 Proteins 0.000 description 1
- 101000802395 Homo sapiens Zinc finger protein 764 Proteins 0.000 description 1
- 101000915597 Homo sapiens Zinc finger protein 778 Proteins 0.000 description 1
- 101000976248 Homo sapiens Zinc finger protein 780A Proteins 0.000 description 1
- 101000782300 Homo sapiens Zinc finger protein 827 Proteins 0.000 description 1
- 101000782309 Homo sapiens Zinc finger protein 837 Proteins 0.000 description 1
- 101000782317 Homo sapiens Zinc finger protein 839 Proteins 0.000 description 1
- 101000743781 Homo sapiens Zinc finger protein 91 Proteins 0.000 description 1
- 101000851815 Homo sapiens p53-regulated apoptosis-inducing protein 1 Proteins 0.000 description 1
- 101000667264 Homo sapiens von Willebrand factor A domain-containing protein 8 Proteins 0.000 description 1
- 108090000320 Hyaluronan Synthases Proteins 0.000 description 1
- 102000003918 Hyaluronan Synthases Human genes 0.000 description 1
- 108010000775 Hydroxymethylglutaryl-CoA synthase Proteins 0.000 description 1
- 102100031009 Inactive N-acetylated-alpha-linked acidic dipeptidase-like protein 2 Human genes 0.000 description 1
- 102100022247 Inactive cytidine monophosphate-N-acetylneuraminic acid hydroxylase Human genes 0.000 description 1
- 102100037736 Inositol hexakisphosphate and diphosphoinositol-pentakisphosphate kinase 2 Human genes 0.000 description 1
- 102100024368 Inositol polyphosphate 5-phosphatase K Human genes 0.000 description 1
- 102100037919 Insulin-like growth factor 2 mRNA-binding protein 2 Human genes 0.000 description 1
- 102100029228 Insulin-like growth factor-binding protein 7 Human genes 0.000 description 1
- 102100033010 Integrin beta-5 Human genes 0.000 description 1
- 102100023490 Inter-alpha-trypsin inhibitor heavy chain H1 Human genes 0.000 description 1
- 102000004889 Interleukin-6 Human genes 0.000 description 1
- 108090001005 Interleukin-6 Proteins 0.000 description 1
- 102100037795 Interleukin-6 receptor subunit beta Human genes 0.000 description 1
- 102100029996 Intraflagellar transport protein 57 homolog Human genes 0.000 description 1
- 102100033257 Inversin Human genes 0.000 description 1
- 101710177984 Isocitrate dehydrogenase [NADP] Proteins 0.000 description 1
- 101710102690 Isocitrate dehydrogenase [NADP] cytoplasmic Proteins 0.000 description 1
- 101710175291 Isocitrate dehydrogenase [NADP], mitochondrial Proteins 0.000 description 1
- 101710157228 Isoepoxydon dehydrogenase patN Proteins 0.000 description 1
- 102100023957 Junctional protein associated with coronary artery disease Human genes 0.000 description 1
- 101710025069 KIAA1143 Proteins 0.000 description 1
- 101710059433 KIAA1755 Proteins 0.000 description 1
- 101150078489 KIF3A gene Proteins 0.000 description 1
- 102100022905 Keratin, type II cytoskeletal 1 Human genes 0.000 description 1
- 102100023974 Keratin, type II cytoskeletal 7 Human genes 0.000 description 1
- 102100033546 Keratin-associated protein 1-5 Human genes 0.000 description 1
- 102100038306 Kinesin light chain 1 Human genes 0.000 description 1
- 102100023425 Kinesin-like protein KIF3A Human genes 0.000 description 1
- 101100288095 Klebsiella pneumoniae neo gene Proteins 0.000 description 1
- 102100033515 LIM domain only protein 7 Human genes 0.000 description 1
- 101150008417 LIN gene Proteins 0.000 description 1
- 102100020859 La-related protein 1 Human genes 0.000 description 1
- 102100032011 Lanosterol synthase Human genes 0.000 description 1
- 102100040276 Leucine zipper putative tumor suppressor 2 Human genes 0.000 description 1
- 102100024103 Leucine-rich repeat and immunoglobulin-like domain-containing nogo receptor-interacting protein 2 Human genes 0.000 description 1
- 102100033353 Lipopolysaccharide-responsive and beige-like anchor protein Human genes 0.000 description 1
- 102100025889 Lon protease homolog 2, peroxisomal Human genes 0.000 description 1
- 101710167388 Lon protease homolog, mitochondrial Proteins 0.000 description 1
- 102100032114 Lumican Human genes 0.000 description 1
- 102100040284 Ly6/PLAUR domain-containing protein 1 Human genes 0.000 description 1
- 108010075710 Lysine Acetyltransferase 5 Proteins 0.000 description 1
- 102100040598 Lysine-specific demethylase 2A Human genes 0.000 description 1
- 102100037462 Lysine-specific demethylase 6A Human genes 0.000 description 1
- 101150083522 MECP2 gene Proteins 0.000 description 1
- 102100026371 MHC class II transactivator Human genes 0.000 description 1
- 108700002010 MHC class II transactivator Proteins 0.000 description 1
- 108091007877 MYCBP2 Proteins 0.000 description 1
- 102100026061 Mannan-binding lectin serine protease 1 Human genes 0.000 description 1
- 108010042484 Mannose-Binding Protein-Associated Serine Proteases Proteins 0.000 description 1
- 102100021767 Mannosyl-oligosaccharide 1,2-alpha-mannosidase IB Human genes 0.000 description 1
- 102100026047 Meckelin Human genes 0.000 description 1
- 102100026161 Mediator of RNA polymerase II transcription subunit 13 Human genes 0.000 description 1
- 102100030353 Membrane-associated phosphatidylinositol transfer protein 1 Human genes 0.000 description 1
- 102100037106 Merlin Human genes 0.000 description 1
- 102100021078 Mesenteric estrogen-dependent adipogenesis protein Human genes 0.000 description 1
- 102100039364 Metalloproteinase inhibitor 1 Human genes 0.000 description 1
- 102100027383 Methyl-CpG-binding domain protein 1 Human genes 0.000 description 1
- 102100039124 Methyl-CpG-binding protein 2 Human genes 0.000 description 1
- 108700027650 Mitogen-Activated Protein Kinase 7 Proteins 0.000 description 1
- 102100037805 Mitogen-activated protein kinase 7 Human genes 0.000 description 1
- 101100119832 Mus musculus Fbn1 gene Proteins 0.000 description 1
- 101100180319 Mus musculus Itk gene Proteins 0.000 description 1
- 101100296200 Mus musculus Pak3 gene Proteins 0.000 description 1
- 101100518997 Mus musculus Pax3 gene Proteins 0.000 description 1
- 101100467856 Mus musculus Rbmy1a1 gene Proteins 0.000 description 1
- 101100467858 Mus musculus Rbmy1b gene Proteins 0.000 description 1
- 101100095974 Mus musculus Smc3 gene Proteins 0.000 description 1
- 101100115709 Mus musculus Stfa2 gene Proteins 0.000 description 1
- 101100206932 Mus musculus Tlk2 gene Proteins 0.000 description 1
- 101100370223 Mus musculus Tprg1 gene Proteins 0.000 description 1
- 101000999362 Mycobacterium tuberculosis (strain ATCC 25618 / H37Rv) Immunity factor for TNT Proteins 0.000 description 1
- 102100035044 Myosin light chain kinase, smooth muscle Human genes 0.000 description 1
- 102100032618 N-acetylglutamate synthase, mitochondrial Human genes 0.000 description 1
- 102100023648 N-chimaerin Human genes 0.000 description 1
- 108010082699 NADPH Oxidase 4 Proteins 0.000 description 1
- 102100021872 NADPH oxidase 4 Human genes 0.000 description 1
- 108091007791 NAE1 Proteins 0.000 description 1
- 102100029781 NEDD8-activating enzyme E1 regulatory subunit Human genes 0.000 description 1
- 101150054781 NOL gene Proteins 0.000 description 1
- 102100031900 Neogenin Human genes 0.000 description 1
- 108090000028 Neprilysin Proteins 0.000 description 1
- 102000015336 Nerve Growth Factor Human genes 0.000 description 1
- 102100040289 Netrin receptor UNC5B Human genes 0.000 description 1
- 101100271302 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) apg-7 gene Proteins 0.000 description 1
- 102100028056 Nicastrin Human genes 0.000 description 1
- 102100037369 Nidogen-1 Human genes 0.000 description 1
- 102100037371 Nidogen-2 Human genes 0.000 description 1
- 102100027966 Nodal modulator 3 Human genes 0.000 description 1
- 102000001760 Notch3 Receptor Human genes 0.000 description 1
- 108010029756 Notch3 Receptor Proteins 0.000 description 1
- 102100033052 Nucleotidyltransferase MB21D2 Human genes 0.000 description 1
- 102100026069 Outer dense fiber protein 2 Human genes 0.000 description 1
- 102100032154 Oxysterol-binding protein-related protein 3 Human genes 0.000 description 1
- 108010032788 PAX6 Transcription Factor Proteins 0.000 description 1
- 239000008411 PCM 4 Substances 0.000 description 1
- 102100037482 PMS1 protein homolog 1 Human genes 0.000 description 1
- 102100037506 Paired box protein Pax-6 Human genes 0.000 description 1
- 102100038424 Palmitoleoyl-protein carboxylesterase NOTUM Human genes 0.000 description 1
- 102100033496 Partitioning defective 3 homolog Human genes 0.000 description 1
- 108010065129 Patched-1 Receptor Proteins 0.000 description 1
- BFHAYPLBUQVNNJ-UHFFFAOYSA-N Pectenotoxin 3 Natural products OC1C(C)CCOC1(O)C1OC2C=CC(C)=CC(C)CC(C)(O3)CCC3C(O3)(O4)CCC3(C=O)CC4C(O3)C(=O)CC3(C)C(O)C(O3)CCC3(O3)CCCC3C(C)C(=O)OC2C1 BFHAYPLBUQVNNJ-UHFFFAOYSA-N 0.000 description 1
- 101001038535 Pelodiscus sinensis Lysozyme C Proteins 0.000 description 1
- 102100027351 Pentraxin-related protein PTX3 Human genes 0.000 description 1
- 102100028525 Periphilin-1 Human genes 0.000 description 1
- 102100026169 Phosphatidylinositol 3-kinase regulatory subunit alpha Human genes 0.000 description 1
- 102100036056 Phosphatidylinositol 4,5-bisphosphate 3-kinase catalytic subunit delta isoform Human genes 0.000 description 1
- 102100035985 Phosphatidylinositol 4,5-bisphosphate 5-phosphatase A Human genes 0.000 description 1
- 102100038725 Phosphatidylinositol glycan anchor biosynthesis class U protein Human genes 0.000 description 1
- 101000902425 Pinus strobus Pinosylvin synthase 2 Proteins 0.000 description 1
- 101100082610 Plasmodium falciparum (isolate 3D7) PDEdelta gene Proteins 0.000 description 1
- 108010051742 Platelet-Derived Growth Factor beta Receptor Proteins 0.000 description 1
- 102100026547 Platelet-derived growth factor receptor beta Human genes 0.000 description 1
- 102100030264 Pleckstrin Human genes 0.000 description 1
- 102100037862 Pleckstrin homology domain-containing family A member 1 Human genes 0.000 description 1
- 101710169169 Polyprenol monophosphomannose synthase Proteins 0.000 description 1
- 102100025066 Potassium voltage-gated channel subfamily S member 1 Human genes 0.000 description 1
- 102100028105 Probable tRNA methyltransferase 9B Human genes 0.000 description 1
- 102100023832 Prolyl endopeptidase FAP Human genes 0.000 description 1
- 102100039025 Propionyl-CoA carboxylase beta chain, mitochondrial Human genes 0.000 description 1
- 102100031717 Protein Hook homolog 3 Human genes 0.000 description 1
- 102100024983 Protein NDNF Human genes 0.000 description 1
- 102100035490 Protein O-mannosyl-transferase 2 Human genes 0.000 description 1
- 102100031569 Protein PHTF1 Human genes 0.000 description 1
- 102100032442 Protein S100-A8 Human genes 0.000 description 1
- 102100030527 Protein SOGA1 Human genes 0.000 description 1
- 102100036468 Protein diaphanous homolog 3 Human genes 0.000 description 1
- 102100040923 Protein flightless-1 homolog Human genes 0.000 description 1
- 102100024924 Protein kinase C alpha type Human genes 0.000 description 1
- 102100038674 Protein phosphatase 1 regulatory subunit 26 Human genes 0.000 description 1
- 102100034271 Protein transport protein Sec61 subunit alpha isoform 1 Human genes 0.000 description 1
- 102100023468 Putative RNA-binding protein Luc7-like 1 Human genes 0.000 description 1
- 102100027435 Putative RNA-binding protein Luc7-like 2 Human genes 0.000 description 1
- 102100030096 Putative thiamine transporter SLC35F3 Human genes 0.000 description 1
- 102100034759 Pyridoxal-dependent decarboxylase domain-containing protein 1 Human genes 0.000 description 1
- 235000014443 Pyrus communis Nutrition 0.000 description 1
- 102000015097 RNA Splicing Factors Human genes 0.000 description 1
- 108010039259 RNA Splicing Factors Proteins 0.000 description 1
- 102000028598 Rab30 Human genes 0.000 description 1
- 108050007282 Rab30 Proteins 0.000 description 1
- 102100032665 Ral guanine nucleotide dissociation stimulator-like 1 Human genes 0.000 description 1
- 102100034589 Rap guanine nucleotide exchange factor 1 Human genes 0.000 description 1
- 102100034419 Ras GTPase-activating-like protein IQGAP1 Human genes 0.000 description 1
- 102100022305 Ras-related protein Rab-38 Human genes 0.000 description 1
- 102100038480 Ras-related protein Rab-44 Human genes 0.000 description 1
- 102100031425 Ras-related protein Ral-B Human genes 0.000 description 1
- 101100185027 Rattus norvegicus Msln gene Proteins 0.000 description 1
- 101000832669 Rattus norvegicus Probable alcohol sulfotransferase Proteins 0.000 description 1
- 108700008625 Reporter Genes Proteins 0.000 description 1
- 102100033912 Retinoic acid receptor gamma Human genes 0.000 description 1
- 102100035122 Retrotransposon Gag-like protein 3 Human genes 0.000 description 1
- 101100283734 Rhizobium radiobacter rdc gene Proteins 0.000 description 1
- 102100027663 Rho GTPase-activating protein 12 Human genes 0.000 description 1
- 102100025999 Rho family-interacting cell polarization regulator 1 Human genes 0.000 description 1
- 102100032023 Rho family-interacting cell polarization regulator 2 Human genes 0.000 description 1
- 102100027608 Rho-related GTP-binding protein RhoF Human genes 0.000 description 1
- 102100034374 S-phase kinase-associated protein 2 Human genes 0.000 description 1
- 102100035214 SEC14-like protein 1 Human genes 0.000 description 1
- 101150026037 SEC22 gene Proteins 0.000 description 1
- 101150055297 SET1 gene Proteins 0.000 description 1
- 102100032637 SH3 domain-containing YSC84-like protein 1 Human genes 0.000 description 1
- 102100021782 SH3 domain-containing protein 19 Human genes 0.000 description 1
- 108091006699 SLC24A3 Proteins 0.000 description 1
- 108091006575 SLC34A3 Proteins 0.000 description 1
- 108091006538 SLC35F Proteins 0.000 description 1
- 108091006972 SLC35F3 Proteins 0.000 description 1
- 108091006941 SLC39A10 Proteins 0.000 description 1
- 108091007567 SLC46A2 Proteins 0.000 description 1
- 108091006267 SLC4A11 Proteins 0.000 description 1
- 102000005031 SLC6A15 Human genes 0.000 description 1
- 108060007754 SLC6A15 Proteins 0.000 description 1
- 108091006241 SLC7A11 Proteins 0.000 description 1
- 108091006649 SLC9A3 Proteins 0.000 description 1
- 101700004678 SLIT3 Proteins 0.000 description 1
- 108010044012 STAT1 Transcription Factor Proteins 0.000 description 1
- 101000930003 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) Diacylglycerol O-acyltransferase 1 Proteins 0.000 description 1
- 101000772372 Salmonella typhimurium (strain LT2 / SGSC1412 / ATCC 700720) tRNA threonylcarbamoyladenosine biosynthesis protein TsaB Proteins 0.000 description 1
- 101000746496 Schizosaccharomyces pombe (strain 972 / ATCC 24843) GTP-binding protein ypt3 Proteins 0.000 description 1
- 101100100680 Schizosaccharomyces pombe (strain 972 / ATCC 24843) trp4 gene Proteins 0.000 description 1
- 101150084362 Sec61a1 gene Proteins 0.000 description 1
- 102100023713 Sentrin-specific protease 6 Human genes 0.000 description 1
- 108010005020 Serine Peptidase Inhibitor Kazal-Type 5 Proteins 0.000 description 1
- 102100033835 Serine protease 23 Human genes 0.000 description 1
- 102100025420 Serine protease inhibitor Kazal-type 5 Human genes 0.000 description 1
- 102100039758 Serine/threonine-protein kinase DCLK1 Human genes 0.000 description 1
- 102100029680 Serine/threonine-protein kinase Kist Human genes 0.000 description 1
- 102100025352 Serine/threonine-protein kinase MRCK alpha Human genes 0.000 description 1
- 102100029064 Serine/threonine-protein kinase WNK1 Human genes 0.000 description 1
- 102100027164 Sialic acid-binding Ig-like lectin 10 Human genes 0.000 description 1
- 102100029904 Signal transducer and activator of transcription 1-alpha/beta Human genes 0.000 description 1
- 102100039163 Sister chromatid cohesion protein PDS5 homolog B Human genes 0.000 description 1
- 102100025490 Slit homolog 1 protein Human genes 0.000 description 1
- 102100031374 Sodium channel protein type 10 subunit alpha Human genes 0.000 description 1
- 102100038440 Sodium-dependent phosphate transport protein 2C Human genes 0.000 description 1
- 102100030375 Sodium/hydrogen exchanger 3 Human genes 0.000 description 1
- 102100032070 Sodium/potassium/calcium exchanger 3 Human genes 0.000 description 1
- 102100021475 Solute carrier family 4 member 11 Human genes 0.000 description 1
- 102100026974 Sorbitol dehydrogenase Human genes 0.000 description 1
- 102100031710 Splicing factor 3A subunit 3 Human genes 0.000 description 1
- 102100038501 Splicing factor U2AF 35 kDa subunit Human genes 0.000 description 1
- 102100035040 Splicing factor U2AF 65 kDa subunit Human genes 0.000 description 1
- 101710186483 Splicing factor U2AF 65 kDa subunit Proteins 0.000 description 1
- 102100027779 Splicing factor, arginine/serine-rich 19 Human genes 0.000 description 1
- 108091081024 Start codon Proteins 0.000 description 1
- 102100034291 Sterile alpha motif domain-containing protein 9 Human genes 0.000 description 1
- 102100021993 Sterol O-acyltransferase 1 Human genes 0.000 description 1
- 101001094830 Streptomyces hygroscopicus 2-phosphinomethylmalate synthase Proteins 0.000 description 1
- 101000697584 Streptomyces lavendulae Streptothricin acetyltransferase Proteins 0.000 description 1
- 102100032853 Sushi, nidogen and EGF-like domain-containing protein 1 Human genes 0.000 description 1
- 102100035604 Synaptopodin Human genes 0.000 description 1
- 102100037219 Syntenin-1 Human genes 0.000 description 1
- 102100030664 T-complex protein 1 subunit zeta Human genes 0.000 description 1
- 102000004399 TNF receptor-associated factor 3 Human genes 0.000 description 1
- 108090000922 TNF receptor-associated factor 3 Proteins 0.000 description 1
- 108091007288 TRIM66 Proteins 0.000 description 1
- 102000003622 TRPC4 Human genes 0.000 description 1
- 102100029218 Teashirt homolog 2 Human genes 0.000 description 1
- 102100024548 Tensin-3 Human genes 0.000 description 1
- 102100038310 Terminal nucleotidyltransferase 5B Human genes 0.000 description 1
- 102100030168 Testis-specific serine/threonine-protein kinase 3 Human genes 0.000 description 1
- 102100024987 Tetraspanin-11 Human genes 0.000 description 1
- 102100040952 Tetraspanin-7 Human genes 0.000 description 1
- 102100031282 Tetratricopeptide repeat protein 7A Human genes 0.000 description 1
- HATRDXDCPOXQJX-UHFFFAOYSA-N Thapsigargin Natural products CCCCCCCC(=O)OC1C(OC(O)C(=C/C)C)C(=C2C3OC(=O)C(C)(O)C3(O)C(CC(C)(OC(=O)C)C12)OC(=O)CCC)C HATRDXDCPOXQJX-UHFFFAOYSA-N 0.000 description 1
- 102100030272 Thioredoxin-like protein 4A Human genes 0.000 description 1
- 108010022173 Thiosulfate sulfurtransferase Proteins 0.000 description 1
- 102100030140 Thiosulfate:glutathione sulfurtransferase Human genes 0.000 description 1
- 102100036034 Thrombospondin-1 Human genes 0.000 description 1
- 102100031558 Thymic stromal cotransporter homolog Human genes 0.000 description 1
- 102100038148 Thyroid adenoma-associated protein Human genes 0.000 description 1
- 102100033451 Thyroid hormone receptor beta Human genes 0.000 description 1
- 102100024207 Transcription factor COE1 Human genes 0.000 description 1
- 102100023234 Transcription factor MafB Human genes 0.000 description 1
- 102100030780 Transcriptional activator Myb Human genes 0.000 description 1
- 102100027065 Translation initiation factor eIF-2B subunit beta Human genes 0.000 description 1
- 102100023225 Translation initiation factor eIF-2B subunit gamma Human genes 0.000 description 1
- 102100033026 Transmembrane protein 102 Human genes 0.000 description 1
- 102100037029 Transmembrane protein 119 Human genes 0.000 description 1
- 102100033042 Transmembrane protein 154 Human genes 0.000 description 1
- 102100036748 Transmembrane protein 214 Human genes 0.000 description 1
- 102100028769 Transmembrane protein 50B Human genes 0.000 description 1
- 102100040241 Trinucleotide repeat-containing gene 6A protein Human genes 0.000 description 1
- 102100025033 Tripartite motif-containing protein 66 Human genes 0.000 description 1
- 101150099990 Trpc4 gene Proteins 0.000 description 1
- 102100031905 Tumor necrosis factor alpha-induced protein 8-like protein 3 Human genes 0.000 description 1
- 102100028785 Tumor necrosis factor receptor superfamily member 14 Human genes 0.000 description 1
- 102100022156 Tumor necrosis factor receptor superfamily member 3 Human genes 0.000 description 1
- 102100024934 Tumor protein p63-regulated gene 1 protein Human genes 0.000 description 1
- 108010072724 U2 Small Nuclear Ribonucleoprotein Proteins 0.000 description 1
- 102000006986 U2 Small Nuclear Ribonucleoprotein Human genes 0.000 description 1
- 102100031884 U2 snRNP-associated SURP motif-containing protein Human genes 0.000 description 1
- 102100040118 U4/U6 small nuclear ribonucleoprotein Prp31 Human genes 0.000 description 1
- 108010085193 UDP-N-acetylglucosamine 1-carboxyvinyltransferase Proteins 0.000 description 1
- 102100027977 UHRF1-binding protein 1-like Human genes 0.000 description 1
- 102100031275 UV radiation resistance-associated gene protein Human genes 0.000 description 1
- 102100039932 Ubiquilin-4 Human genes 0.000 description 1
- 102100029736 Ubiquitin carboxyl-terminal hydrolase 27 Human genes 0.000 description 1
- 102100038443 Ubiquitin carboxyl-terminal hydrolase isozyme L5 Human genes 0.000 description 1
- 102100030424 Ubiquitin-associated protein 2 Human genes 0.000 description 1
- 102100020712 Ubiquitin-conjugating enzyme E2 G1 Human genes 0.000 description 1
- 102100038467 Ubiquitin-conjugating enzyme E2 variant 1 Human genes 0.000 description 1
- 102100025379 Uncharacterized protein KIAA1143 Human genes 0.000 description 1
- 102100022856 Uncharacterized protein KIAA1755 Human genes 0.000 description 1
- 102100031205 Up-regulator of cell proliferation Human genes 0.000 description 1
- 102100035141 V-set and transmembrane domain-containing protein 2-like protein Human genes 0.000 description 1
- 102100040248 VIP36-like protein Human genes 0.000 description 1
- 101150084765 VPS gene Proteins 0.000 description 1
- 102100029496 Vacuolar protein sorting-associated protein 41 homolog Human genes 0.000 description 1
- 102100033178 Vascular endothelial growth factor receptor 1 Human genes 0.000 description 1
- 102100027989 Very large A-kinase anchor protein Human genes 0.000 description 1
- 102100038143 WASH complex subunit 4 Human genes 0.000 description 1
- 102100038159 WD repeat-containing protein 27 Human genes 0.000 description 1
- 101100334377 Xenopus laevis fscn gene Proteins 0.000 description 1
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 1
- 102100025400 Zinc finger CCHC domain-containing protein 8 Human genes 0.000 description 1
- 102100028536 Zinc finger MIZ domain-containing protein 2 Human genes 0.000 description 1
- 102100021128 Zinc finger and BTB domain-containing protein 26 Human genes 0.000 description 1
- 102100023264 Zinc finger and BTB domain-containing protein 7A Human genes 0.000 description 1
- 102100021058 Zinc finger protein 12 Human genes 0.000 description 1
- 102100028365 Zinc finger protein 24 Human genes 0.000 description 1
- 102100028399 Zinc finger protein 28 Human genes 0.000 description 1
- 102100025300 Zinc finger protein 280A Human genes 0.000 description 1
- 102100040319 Zinc finger protein 280D Human genes 0.000 description 1
- 102100021365 Zinc finger protein 426 Human genes 0.000 description 1
- 102100040711 Zinc finger protein 74 Human genes 0.000 description 1
- 102100034973 Zinc finger protein 764 Human genes 0.000 description 1
- 102100028586 Zinc finger protein 778 Human genes 0.000 description 1
- 102100023873 Zinc finger protein 780A Human genes 0.000 description 1
- 102100035802 Zinc finger protein 827 Human genes 0.000 description 1
- 102100035781 Zinc finger protein 837 Human genes 0.000 description 1
- 102100035783 Zinc finger protein 839 Human genes 0.000 description 1
- 102100039070 Zinc finger protein 91 Human genes 0.000 description 1
- 102100027904 Zinc finger protein basonuclin-1 Human genes 0.000 description 1
- 102100035243 Zinc transporter ZIP10 Human genes 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 230000001668 ameliorated effect Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000000149 argon plasma sintering Methods 0.000 description 1
- 208000029618 autoimmune pulmonary alveolar proteinosis Diseases 0.000 description 1
- XOZUGNYVDXMRKW-AATRIKPKSA-N azodicarbonamide Chemical compound NC(=O)\N=N\C(N)=O XOZUGNYVDXMRKW-AATRIKPKSA-N 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 108010051348 cdc42 GTP-Binding Protein Proteins 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- RUDATBOHQWOJDD-BSWAIDMHSA-N chenodeoxycholic acid Chemical compound C([C@H]1C[C@H]2O)[C@H](O)CC[C@]1(C)[C@@H]1[C@@H]2[C@@H]2CC[C@H]([C@@H](CCC(O)=O)C)[C@@]2(C)CC1 RUDATBOHQWOJDD-BSWAIDMHSA-N 0.000 description 1
- HZBLLTXMVMMHRJ-UHFFFAOYSA-L disodium;sulfidosulfanylmethanedithioate Chemical compound [Na+].[Na+].[S-]SC([S-])=S HZBLLTXMVMMHRJ-UHFFFAOYSA-L 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 101150059718 fam174 gene Proteins 0.000 description 1
- 101150014423 fni gene Proteins 0.000 description 1
- 238000001415 gene therapy Methods 0.000 description 1
- 102000034356 gene-regulatory proteins Human genes 0.000 description 1
- 108091006104 gene-regulatory proteins Proteins 0.000 description 1
- 102000009543 guanyl-nucleotide exchange factor activity proteins Human genes 0.000 description 1
- 108040001860 guanyl-nucleotide exchange factor activity proteins Proteins 0.000 description 1
- 101150075592 idi gene Proteins 0.000 description 1
- 230000001965 increasing effect Effects 0.000 description 1
- SQEHCNOBYLQFTG-UHFFFAOYSA-M lithium;thiophene-2-carboxylate Chemical compound [Li+].[O-]C(=O)C1=CC=CS1 SQEHCNOBYLQFTG-UHFFFAOYSA-M 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000013470 microfluidic resistive pulse sensing Methods 0.000 description 1
- AMZRCWDZLLMPBU-UHFFFAOYSA-N n',n'-diethyl-n-naphthalen-1-ylethane-1,2-diamine Chemical compound C1=CC=C2C(NCCN(CC)CC)=CC=CC2=C1 AMZRCWDZLLMPBU-UHFFFAOYSA-N 0.000 description 1
- APVPOHHVBBYQAV-UHFFFAOYSA-N n-(4-aminophenyl)sulfonyloctadecanamide Chemical compound CCCCCCCCCCCCCCCCCC(=O)NS(=O)(=O)C1=CC=C(N)C=C1 APVPOHHVBBYQAV-UHFFFAOYSA-N 0.000 description 1
- 102100036520 p53-regulated apoptosis-inducing protein 1 Human genes 0.000 description 1
- 230000008488 polyadenylation Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- ODLMAHJVESYWTB-UHFFFAOYSA-N propylbenzene Chemical compound CCCC1=CC=CC=C1 ODLMAHJVESYWTB-UHFFFAOYSA-N 0.000 description 1
- QEVHRUUCFGRFIF-MDEJGZGSSA-N reserpine Chemical compound O([C@H]1[C@@H]([C@H]([C@H]2C[C@@H]3C4=C(C5=CC=C(OC)C=C5N4)CCN3C[C@H]2C1)C(=O)OC)OC)C(=O)C1=CC(OC)=C(OC)C(OC)=C1 QEVHRUUCFGRFIF-MDEJGZGSSA-N 0.000 description 1
- 229960003147 reserpine Drugs 0.000 description 1
- 238000013469 resistive pulse sensing Methods 0.000 description 1
- 108090000064 retinoic acid receptors Proteins 0.000 description 1
- 102000003702 retinoic acid receptors Human genes 0.000 description 1
- 238000002442 scanning plasmon near-field microscopy Methods 0.000 description 1
- 101150015999 sec24 gene Proteins 0.000 description 1
- 101150097125 sec61a gene Proteins 0.000 description 1
- 230000027039 spliceosomal complex assembly Effects 0.000 description 1
- 230000000087 stabilizing effect Effects 0.000 description 1
- 208000009996 subepithelial mucinous corneal dystrophy Diseases 0.000 description 1
- 238000004416 surface enhanced Raman spectroscopy Methods 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 239000013638 trimer Substances 0.000 description 1
- 102100039135 von Willebrand factor A domain-containing protein 8 Human genes 0.000 description 1
Images
Classifications
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K31/00—Medicinal preparations containing organic active ingredients
- A61K31/33—Heterocyclic compounds
- A61K31/395—Heterocyclic compounds having nitrogen as a ring hetero atom, e.g. guanethidine or rifamycins
- A61K31/41—Heterocyclic compounds having nitrogen as a ring hetero atom, e.g. guanethidine or rifamycins having five-membered rings with two or more ring hetero atoms, at least one of which being nitrogen, e.g. tetrazole
- A61K31/433—Thidiazoles
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/111—General methods applicable to biologically active non-coding nucleic acids
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K31/00—Medicinal preparations containing organic active ingredients
- A61K31/33—Heterocyclic compounds
- A61K31/395—Heterocyclic compounds having nitrogen as a ring hetero atom, e.g. guanethidine or rifamycins
- A61K31/435—Heterocyclic compounds having nitrogen as a ring hetero atom, e.g. guanethidine or rifamycins having six-membered rings with one nitrogen as the only ring hetero atom
- A61K31/44—Non condensed pyridines; Hydrogenated derivatives thereof
- A61K31/445—Non condensed piperidines, e.g. piperocaine
- A61K31/4523—Non condensed piperidines, e.g. piperocaine containing further heterocyclic ring systems
- A61K31/454—Non condensed piperidines, e.g. piperocaine containing further heterocyclic ring systems containing a five-membered ring with nitrogen as a ring hetero atom, e.g. pimozide, domperidone
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K31/00—Medicinal preparations containing organic active ingredients
- A61K31/33—Heterocyclic compounds
- A61K31/395—Heterocyclic compounds having nitrogen as a ring hetero atom, e.g. guanethidine or rifamycins
- A61K31/495—Heterocyclic compounds having nitrogen as a ring hetero atom, e.g. guanethidine or rifamycins having six-membered rings with two or more nitrogen atoms as the only ring heteroatoms, e.g. piperazine or tetrazines
- A61K31/50—Pyridazines; Hydrogenated pyridazines
- A61K31/501—Pyridazines; Hydrogenated pyridazines not condensed and containing further heterocyclic rings
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K31/00—Medicinal preparations containing organic active ingredients
- A61K31/33—Heterocyclic compounds
- A61K31/395—Heterocyclic compounds having nitrogen as a ring hetero atom, e.g. guanethidine or rifamycins
- A61K31/55—Heterocyclic compounds having nitrogen as a ring hetero atom, e.g. guanethidine or rifamycins having seven-membered rings, e.g. azelastine, pentylenetetrazole
- A61K31/551—Heterocyclic compounds having nitrogen as a ring hetero atom, e.g. guanethidine or rifamycins having seven-membered rings, e.g. azelastine, pentylenetetrazole having two nitrogen atoms, e.g. dilazep
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07D—HETEROCYCLIC COMPOUNDS
- C07D401/00—Heterocyclic compounds containing two or more hetero rings, having nitrogen atoms as the only ring hetero atoms, at least one ring being a six-membered ring with only one nitrogen atom
- C07D401/02—Heterocyclic compounds containing two or more hetero rings, having nitrogen atoms as the only ring hetero atoms, at least one ring being a six-membered ring with only one nitrogen atom containing two hetero rings
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07D—HETEROCYCLIC COMPOUNDS
- C07D401/00—Heterocyclic compounds containing two or more hetero rings, having nitrogen atoms as the only ring hetero atoms, at least one ring being a six-membered ring with only one nitrogen atom
- C07D401/14—Heterocyclic compounds containing two or more hetero rings, having nitrogen atoms as the only ring hetero atoms, at least one ring being a six-membered ring with only one nitrogen atom containing three or more hetero rings
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07D—HETEROCYCLIC COMPOUNDS
- C07D417/00—Heterocyclic compounds containing two or more hetero rings, at least one ring having nitrogen and sulfur atoms as the only ring hetero atoms, not provided for by group C07D415/00
- C07D417/02—Heterocyclic compounds containing two or more hetero rings, at least one ring having nitrogen and sulfur atoms as the only ring hetero atoms, not provided for by group C07D415/00 containing two hetero rings
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07D—HETEROCYCLIC COMPOUNDS
- C07D417/00—Heterocyclic compounds containing two or more hetero rings, at least one ring having nitrogen and sulfur atoms as the only ring hetero atoms, not provided for by group C07D415/00
- C07D417/14—Heterocyclic compounds containing two or more hetero rings, at least one ring having nitrogen and sulfur atoms as the only ring hetero atoms, not provided for by group C07D415/00 containing three or more hetero rings
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2320/00—Applications; Uses
- C12N2320/30—Special therapeutic applications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2320/00—Applications; Uses
- C12N2320/30—Special therapeutic applications
- C12N2320/33—Alteration of splicing
Landscapes
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Wood Science & Technology (AREA)
- Biotechnology (AREA)
- Zoology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Medicinal Chemistry (AREA)
- Pharmacology & Pharmacy (AREA)
- Veterinary Medicine (AREA)
- Epidemiology (AREA)
- Public Health (AREA)
- Animal Behavior & Ethology (AREA)
- Molecular Biology (AREA)
- Microbiology (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Biochemistry (AREA)
- Biophysics (AREA)
- Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
Abstract
Description
相关申请的交叉引用
本申请要求2017年6月14日提交的第62/519,226号美国临时申请的权益,将其全部内容通过引用并入本文。
对以电子方式提交的序列表的引用
本申请通过引用并入了与本申请一起提交的序列表,该序列表是ASCII格式的文本文件,名称为“10589-277-228_Sequence_Listing.txt”,于2018年6月13日创建,大小为1,200,491字节。
技术领域
一方面,本文描述了存在于内含子中的剪接修饰剂的识别元件(REMS)(即,“内含子REMS”或“iREMS”),其在小分子剪接修饰剂的存在下可以被U1 snRNP和/或前体mRNA剪接机制的其他组分识别为5’剪接位点,其中通过在转录的RNA中诱导内含外显子(intronicexon)(iExon)的供选择的剪接来修饰基因表达。另一方面,本文描述了用于调节基因产物的量的方法,其中从所述基因转录的前体RNA转录物包含内含子REMS、分支点和3’剪接位点,并且所述方法利用本文所述的小分子化合物来诱导iExon的供选择的剪接。更具体地,本文描述了用于通过iExon的供选择的剪接调节RNA转录物或由基因编码的蛋白产物的量的方法,其中从所述基因转录的前体RNA转录物包含内源或非内源内含子REMS,并且所述方法利用本文所述的化合物来诱导iExon的供选择的剪接。另一方面,本文提供了包含内含子REMS(包括内源或非内源内含子REMS)的人工基因构建体,以及那些人工基因构建体用于在小分子剪接修饰剂化合物的存在下,通过iExon的供选择的剪接调节蛋白产物的用途。另一方面,本文提供了用于改变基因以包含非内源内含子REMS的方法,以及本文所述的小分子化合物用于诱导iExon的供选择的剪接,随后调节由这样的改变的非内源基因转录物产生的蛋白的量并改变由这样的改变的非内源基因转录物产生的蛋白的类型的用途。
背景技术
与异常量(低于或高于正常所需)的基因产物或异常基因产物(例如,其中异常的RNA转录物或蛋白的产生引起疾病)的表达相关的疾病通常用专注于影响异常蛋白表达的方法治疗。然而,通过使用小分子靶向在表达异常蛋白或异常量的蛋白之前负责产生异常RNA的剪接过程的组分可能会影响疾病或障碍的根本原因,因此可以更有效地预防或改善由异常基因产物或异常量的基因产物的表达引起的疾病或障碍。因此,需要一种使用小分子调节由某些基因编码的异常RNA转录物的表达的方法,以预防或治疗与异常RNA转录物或相关蛋白的表达相关的疾病,或与异常量的RNA转录物或相关蛋白的表达相关的疾病。
发明内容
一方面,本文提供了存在于内含子中的剪接修饰剂的识别元件(也称为“REMS”)(即,“内含子REMS”或“iREMS”),其在小分子剪接修饰剂的存在下可以被U1 snRNP和/或前体mRNA剪接机制的其他组分识别,由此剪接反应的元件受到影响,如本文进一步所述。在具体方面,内含子REMS在RNA水平上包含存在于内含子序列中的核苷酸序列GAgurngn,其中r为A或G(即,携带腺嘌呤或鸟嘌呤的嘌呤核苷酸),并且n为任何核苷酸。在另一个具体方面,内含子REMS在RNA水平上包含存在于内含子序列中的核苷酸序列GAguragu,其中r为腺嘌呤或鸟嘌呤。在具体方面,内含子REMS在RNA水平上包含存在于内含子序列中的核苷酸序列NNGAgurngn(SEQ ID NO:1),其中r为A或G(即,携带腺嘌呤或鸟嘌呤的嘌呤核苷酸),并且n或N为任何核苷酸。在另一个具体方面,内含子REMS在RNA水平上包含存在于内含子序列中的核苷酸序列NNGAguragu(SEQ ID NO:2),其中r为腺嘌呤或鸟嘌呤,并且N为任何核苷酸。在本文提供的一个或多个这样的具体方面,N为腺嘌呤或鸟嘌呤。
另一方面,除了iREMS序列以外,RNA转录物的内含子包含分支点和功能性3’剪接位点。本文所述的一个方面涉及iExon,其中RNA转录物包含两个外显子和内含子,其中第一外显子在内含子的上游,并且第二外显子在内含子的下游,其中所述内含子按5’至3’顺序包含:第一5’剪接位点、第一分支点、第一3’剪接位点(也称为iExon 3’剪接位点)、内含子REMS序列、第二分支点和第二3’剪接位点(参见例如,图1A)。在这方面,在本文所述的化合物的存在下,内含子REMS序列充当5’剪接位点,并且将经历与第二3’剪接位点的剪接,导致iREMS序列的NNGA核苷酸和第一3’剪接位点下游的内含子核苷酸被保留并剪接为内含外显子,以提供非野生型mRNA。本文所述的另一方面涉及eExon(extended exons)(延伸的外显子),其中所述RNA转录物包含两个外显子和内含子,其中第一外显子在内含子的上游,并且第二外显子在内含子的下游,其中所述内含子包含RNA核苷酸序列,所述RNA核苷酸序列按5’至3’顺序包含:内含子REMS序列、分支点和3’剪接位点(参见例如,参见图1B和1C:分别为外显子1e和外显子2e)。在这方面,在本文所述的化合物的存在下,iREMS剪接位点上游的5’剪接位点不经历与下游3’剪接位点的剪接。相反,在本文所述的化合物的存在下,iREMS序列在下游分支点的存在下经历与下游3’剪接位点的剪接。在这方面,通过将一种或多种核苷酸包含在注释的5’剪接位点下游的mRNA转录物中,使外显子从5’剪接位点延伸到iREMS剪接位点。
在某些方面,形成iExon所需的一种或多种序列元件可以内源或非内源存在,其中所述序列元件选自内含子REMS、分支点和iExon 3’剪接位点。在其他方面,形成iExon所需的一种或多种另外的序列元件可以内源或非内源存在,其中所述序列元件选自外显子的5’剪接位点、第二分支点和第二3’剪接位点。在iExon的另一个方面,形成iExon所需的序列元件包含上游iExon 3’剪接位点序列、内含子REMS序列、下游分支点序列和下游3’剪接位点序列。另一方面,其中形成eExon(延伸的外显子),形成eExon所需的序列元件包含内含子REMS序列、下游分支点序列和下游功能性3’剪接位点序列。在某些方面,由于本文所述的化合物的存在,剪接所需的一种或多种snRNP和反式因子元件可以以本文所述的各种剪接诱导序列组合中的任一种超过内源水平存在。不受任何理论或机制的束缚,本文所述的小分子化合物连同iREMS序列在弱的或不完全限定的外显子(即新生iExon)周围启动了具有剪接能力的剪接体的组装。剪接修饰剂化合物最有可能实现功能性U1 snRNP–REMS相互作用,并且至少已经显示出可以增加剪接所需的一种或多种snRNP和反式因子元件,包括U1、U2、U4、U5和U6的亲和力,由此增强U1 snRNP以及前体mRNA剪接机制的其他组分和REMS的核苷酸NNGA(将保留为iExon或eExon的部分)之间的相互作用。实际上,我们已经发现U1 snRNP、iREMS和本文所述的小分子剪接修饰剂化合物的相互作用通过提高前体mRNA剪接机制与iREMS序列的结合亲和力,稳定与iREMS序列的U1结合,激活iREMS上游的iExon 3’剪接位点(在iExon的情况下),和将U2 snRNP和其他反式作用剪接因子如U2AF(U2AF65和U2AF35)和SF3A(SF3A1、SF3A2和SF3A3)募集到下游分支点和3’剪接位点,起到限定新生外显子的作用。在不存在化合物的情况下,分支点和3’剪接位点可以必须或不必被反式因子部分或完全占据,但已显示在该化合物实现功能性U1 snRNP–iREMS复合物的形成后,被更多地占据。我们已经详细说明了这些关键剪接机制元件的相互作用,表明在存在小分子剪接修饰剂化合物(例如但不一定限于本文所述的那些)的情况下,可以通过iREMS序列与这样的化合物的相互作用介导新生iExon上剪接体组装的机制,使得内含子REMS序列充当U1 snRNP结合位点,导致内含子核苷酸在成熟RNA转录物中剪接为非野生型内含外显子。
在图1A中,内含子REMS在RNA转录物(即,前体mRNA)中位于外显子1 5’剪接位点(即,外显子1的3’端处的5’剪接位点)、第一分支点(BP)序列和第一iExon 3’剪接位点序列下游和第二分支点序列和外显子2的第二3’剪接位点序列上游的内含子1中。本文所述的小分子剪接修饰剂化合物的存在下,iREMS序列充当5’剪接位点,由此在外显子1和新生内含外显子之间去除了外显子1 5’剪接位点和第一iExon 3’剪接位点之间的核苷酸,并且在iExon 1a和外显子2之间去除了内含子REMS和第二3’剪接位点之间的核苷酸,从而允许外显子2和包含从第一3’剪接位点到内含子REMS的NNGA(包括NNGA)的核苷酸的内含子部分进行连接,从而引入内含子来源的iExon 1a,产生非野生型mRNA。在图1A的某些方面,诱导剪接所需的一种或多种元件可以内源存在或被引入,并且可以采用能够被剪接机制识别为“外显子”的任何配置,其中所述一种或多种元件选自内含子REMS、第一分支点、第一3’剪接位点、第二分支点和第二3’剪接位点。虽然在此针对内含子1进行了说明,但在这种情况下的配置产生非野生型iExon,该概念通常适用于RNA转录物中的任何其他内含子。
在图1B中,内含子REMS位于外显子1 5’剪接位点(即,外显子1的3’端处的5’剪接位点)的下游和外显子2的3’剪接位点序列(即,外显子2的5’端的3’剪接位点)和内含子1分支点序列的上游的RNA转录物的内含子中。在本文所述的小分子剪接修饰剂化合物的存在下,外显子1 5’剪接位点和内含子REMS之间的核苷酸被保留,并且内含子REMS和内含子13’剪接位点序列之间的核苷酸(除了内含子REMS的NNGA核苷酸)被去除,允许外显子1和包含从邻近外显子1 5’剪接位点的核苷酸到内含子REMS的NNGA(包括NNGA)的核苷酸的内含子的部分进行连接。尽管此处将外显子1作为特定配置的实例进行了说明,但该概念通常适用于具有另一个下游外显子的任何其他外显子。诱导eExon的剪接所需的元件可以以任何能够被剪接机制识别为“外显子”的配置存在。因此,在剪接修饰剂化合物的存在下,剪接体将这些元件识别为外显子边界,用于在这些边界之间的插入的内含子核苷酸。这种情况下的配置将产生eExon,其中上游外显子在其3’端延伸。
在图1C中,内含子REMS在RNA转录物中位于外显子2 5’剪接位点(即,外显子2的3’端处的5’剪接位点)下游和内含子2分支点序列和外显子3的3’剪接位点序列(即,外显子3的5’端处的3’剪接位点)上游的内含子2中。在本文所述的小分子剪接修饰剂化合物的存在下,内含子REMS和外显子3 3’剪接位点序列之间的核苷酸被去除,允许外显子3和包含从邻近外显子2 5’剪接位点的核苷酸到内含子REMS的NNGA(包括NNGA)的核苷酸的内含子的部分进行连接。在该实例中,外显子1和外显子2之间的内源剪接反应不受本文所述化合物的存在的影响,从而导致内含子1的完全去除。虽然在此处针对外显子2进行了说明,但该概念通常适用于任何其他新生外显子,即位于同一前mRNA转录物的至少一个上游外显子和一个下游外显子之间的外显子。
如本文所使用,“外显子5’剪接位点”或类似术语是指在iREMS序列上游的外显子的3’端处的5’剪接位点,而“外显子3’剪接位点”或类似术语是指在iREMS序列下游的外显子的5’端处的3’剪接位点。
在本文所述的小分子剪接修饰剂化合物存在下,在iExon或eExon的形成中保留的iREMS核苷酸选自ANGA、CNGA、GNGA、UNGA、NAGA、NCGA、NGGA、NUGA、AAGA、ACGA、AGGA、AUGA、CAGA、CCGA、CGGA、CUGA、GAGA、GCGA、GGGA、GUGA、UAGA、UCGA、UGGA和UUGA。由于在开放阅读框内包含框保持序列、移码、提前终止密码子或内部插入或缺失(互斥的供选择的剪接的结果),包含iExon或形成eExon可以产生具有改变的或截短的开放阅读框的RNA转录物。在由非互斥的供选择的剪接产生的其他方面,包含iExon或形成eExon可以产生具有功能性开放阅读框的成熟mRNA,其产生新的蛋白,该蛋白可能是功能性的或可能不是功能性的或可能是不稳定的并迅速降解。具有改变的或截短的开放阅读框的RNA转录物预期以较低的丰度存在,并且可以是无义介导的降解(nonsense-mediated decay)、不间断介导的降解(nonstop-mediated decay)、不可行降解(no-go decay)、翻译依赖性降解(translation-dependent decay)、iExon介导的脱帽(iExon-mediated decapping)、供选择的3’端形成和聚腺苷酸化的底物,因此具有低丰度。任何内含子REMS介导的供选择的剪接修饰的RNA转录物还可以具有改变的稳定性、改变的细胞内转运、改变的3’端形成效率和改变的翻译效率。在本文所述的方面,术语“框保持序列”是指包含改变开放阅读框但在成熟mRNA中的起始密码子和终止密码子之间保持核苷酸三聚体的序列。在本文所述的方面,术语“互斥的供选择的剪接”是指两个外显子或外显子组之间的选择,其中两个外显子或外显子组将被剪接。换言之,互斥的剪接事件不是独立的,仅使RNA中的外显子或外显子组中的一个被剪接而不是两者都被剪接(即“互斥的”)。例如,包含iExon本身不会导致缺失。然而,在互斥的供选择的剪接事件中,这样的包含也可能导致外显子跳过iExon或在iExon下游,并且在剪接一个外显子或另一个外显子时导致缺失。在本文所述的其他方面,术语“非互斥的供选择的剪接”是指其中RNA中的一个或另一个或两个外显子或外显子组可以被剪接的独立剪接事件。
因此,一方面,本文提供了用于调节由包含内源或非内源内含子REMS的前体RNA产生的RNA转录物的量的方法。另一方面,本文提供了包含内源或非内源内含子REMS的人工基因构建体,其可以用于例如基因治疗或报告基因分析的情况中。另一方面,本文提供了用于改变内源基因以使其包含内含子REMS或另外的内含子REMS的方法。
另一方面,本文提供了用于调节表达为一种或多种基因的产物的一种或多种RNA转录物(例如,mRNA转录物)或其蛋白的量的方法,其中由所述一种或多种基因转录的前体RNA转录物包含内含子REMS,所述方法包括使细胞与式(I)的化合物或其形式接触:
其中W、X、A和B如本文所定义。
一方面,本文提供了用于调节由包含剪接修饰剂的内含子识别元件(iREMS)的前体RNA产生的RNA转录物的量的方法,所述方法包括使包含前体RNA的细胞与式(I)的化合物或其形式接触,其中所述内含子REMS包含序列NNGAgurngn(SEQ ID NO:1),其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸,其中所述前体RNA为本文所述的基因。另一方面,本文提供了用于调节由包含剪接修饰剂的内含子识别元件(REMS)的前体RNA产生的RNA转录物的量的方法,所述方法包括使前体RNA与式(I)的化合物或其形式接触,其中内含子REMS包含序列NNGAgurngn(SEQ ID NO:1),其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸,其中所述前体RNA为本文所述的基因。在一些方面,内含子REMS在RNA水平上包含序列NNGAguragu(SEQ ID NO:3),其中r为腺嘌呤或鸟嘌呤,并且N为任何核苷酸。在某些方面,内含子REMS包含选自以下的序列:ANGAgurngn(SEQ ID NO:4)、CNGAgurngn(SEQ ID NO:5)、GNGAgurngn(SEQ ID NO:6)、UNGAgurngn(SEQ ID NO:7)、NAGAgurngn(SEQ ID NO:8)、NCGAgurngn(SEQID NO:9)、NGGAgurngn(SEQ ID NO:10)、NUGAgurngn(SEQ ID NO:11)、AAGAgurngn(SEQ IDNO:12)、ACGAgurngn(SEQ ID NO:13)、AGGAgurngn(SEQ ID NO:14)、AUGAgurngn(SEQ IDNO:15)、CAGAgurngn(SEQ ID NO:16)、CCGAgurngn(SEQ ID NO:17)、CGGAgurngn(SEQ IDNO:18)、CUGAgurngn(SEQ ID NO:19)、GAGAgurngn(SEQ ID NO:20)、GCGAgurngn(SEQ IDNO:21)、GGGAgurngn(SEQ ID NO:22)、GUGAgurngn(SEQ ID NO:23)、UAGAgurngn(SEQ IDNO:24)、UCGAgurngn(SEQ ID NO:25)、UGGAgurngn(SEQ ID NO:26)和UUGAgurngn(SEQ IDNO:27),其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸。
在一些方面,内含子REMS在RNA水平上包含选自以下的序列:ANGAguragu(SEQ IDNO:28)、CNGAguragu(SEQ ID NO:29)、GNGAguragu(SEQ ID NO:30)、UNGAguragu(SEQ IDNO:31)、NAGAguragu(SEQ ID NO:32)、NCGAguragu(SEQ ID NO:33)、NGGAguragu(SEQ IDNO:34)、NUGAguragu(SEQ ID NO:35)、AAGAguragu(SEQ ID NO:36)、ACGAguragu(SEQ IDNO:37)、AGGAguragu(SEQ ID NO:38)、AUGAguragu(SEQ ID NO:39)、CAGAguragu(SEQ IDNO:40)、CCGAguragu(SEQ ID NO:41)、CGGAguragu(SEQ ID NO:42)、CUGAguragu(SEQ IDNO:43)、GAGAguragu(SEQ ID NO:44)、GCGAguragu(SEQ ID NO:45)、GGGAguragu(SEQ IDNO:46)、GUGAguragu(SEQ ID NO:47)、UAGAguragu(SEQ ID NO:48)、UCGAguragu(SEQ IDNO:49)、UGGAguragu(SEQ ID NO:50)和UUGAguragu(SEQ ID NO:51),其中r为腺嘌呤或鸟嘌呤,并且N为任何核苷酸。在本文提供的一个或多个方面,N为腺嘌呤或鸟嘌呤。
在具体方面,在本文所述的方法或人工基因构建体中提及的内含子REMS在RNA水平上包含表1所示的序列(其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸):
表1.内含子REMS RNA序列(其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸)
表1(续).内含子REMS RNA序列(其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸)
表1(续).内含子REMS RNA序列(其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸)
表1(续).内含子REMS RNA序列(其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸)
表1(续).内含子REMS RNA序列(其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸)
表1(续).内含子REMS RNA序列(其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸)
表1(续).内含子REMS RNA序列(其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸)
表1(续).内含子REMS RNA序列(其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸)
表1(续).内含子REMS RNA序列(其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸)
表1(续).内含子REMS RNA序列(其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸)
表1(续).内含子REMS RNA序列(其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸)
表1(续).内含子REMS RNA序列(其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸)
表1(续).内含子REMS RNA序列(其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸)
表1(续).内含子REMS RNA序列(其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸)
表1(续).内含子REMS RNA序列(其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸)
表1(续).内含子REMS RNA序列(其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸)
表1(续).内含子REMS RNA序列(其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸)
表1(续).内含子REMS RNA序列(其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸)
表1(续).内含子REMS RNA序列(其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸)
表1(续).内含子REMS RNA序列(其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸)
一方面,本文提供了用于调节本文所述的基因的一种、两种、三种或更多种RNA转录物的量的方法,所述方法包括使细胞与式(I)的化合物或其形式接触。另一方面,本文提供了用于调节本文所述的基因的一种、两种、三种或更多种RNA转录物的量的方法,其中从所述基因转录的前体转录物包含内含子REMS,所述方法包括使细胞与式(I)的化合物或其形式接触。另一方面,本文提供了用于调节第PCT/US2014/071252号国际专利申请(第WO2015/105657号国际公开)中公开的基因的一种、两种、三种或更多种RNA转录物的量的方法,其中从所述基因转录的前体转录物包含内含子REMS,所述方法包括使细胞与式(I)的化合物或其形式接触。另一方面,本文提供了用于调节第PCT/US2016/034864号国际专利申请(第WO 2016/196386号国际公开)公开的基因的一种、两种、三种或更多种RNA转录物的量的方法,其中从所述基因转录的前体转录物包含内含子REMS,所述方法包括使细胞与式(I)的化合物或其形式接触。另一方面,本文提供了用于调节第PCT/US2017/063323号国际专利申请(第WO/2018/098446号国际公开)中公开的一种、两种、三种或更多种RNA转录物的量的方法,其中从所述基因转录的前体转录物包含内含子REMS,所述方法包括使细胞与式(I)的化合物或其形式接触。
一方面,本文提供了用于调节本文所述的基因的一种、两种、三种或更多种RNA转录物的量的方法,所述方法包括使细胞与式(I)的化合物或其形式接触。另一方面,本文提供了用于调节本文所述的基因的一种、两种、三种或更多种RNA转录物的量的方法,其中从所述基因转录的前体转录物包含内含子REMS,所述方法包括使细胞与式(I)的化合物或其形式接触。
另一方面,本文提供了用于调节本文所述的基因的一种、两种、三种或更多种RNA转录物的量的方法,其中从所述基因转录的前体转录物包含内含子REMS,所述方法包括使细胞与式(I)的化合物或其形式接触。另一方面,本文提供了用于调节本文所述的基因的一种、两种、三种或更多种RNA转录物的量的方法,包括使细胞与式(I)的化合物或其形式接触。在某些方面,在细胞培养物中使细胞与式(I)的化合物或其形式接触。在其他方面,在对象(例如,非人类动物对象或人类对象)中使细胞与式(I)的化合物或其形式接触。
另一方面,本文提供了用于调节本文所述的基因的一种、两种、三种或更多种RNA转录物的量的方法,其中从所述基因转录的所述前体RNA转录物包含内含子REMS,所述方法包括向人类或非人类对象施用式(I)的化合物或其形式或包含式(I)的化合物或其形式和药学上可接受的载体、赋形剂或稀释剂的药物组合物。一方面,本文提供了用于调节本文所述的基因的一种、两种、三种或更多种RNA转录物的量的方法,所述方法包括向人类或非人类对象施用式(I)的化合物或其形式或包含式(I)的化合物或其形式和药学上可接受的载体、赋形剂或稀释剂的药物组合物。
另一方面,本文提供了用于调节本文所述的基因的一种、两种、三种或更多种RNA转录物的量的方法,其中从所述基因转录的所述前体RNA转录物包含内含子REMS,所述方法包括向人类或非人类对象施用式(I)的化合物或其形式或包含式(I)的化合物或其形式和药学上可接受的载体、赋形剂或稀释剂的药物组合物。
另一方面,本文提供了用于调节本文所述的基因的一种、两种、三种或更多种RNA转录物的量的方法,其中从所述基因转录的所述前体RNA转录物包含内含子REMS,所述方法包括向人类或非人类对象施用式(I)的化合物或其形式或包含式(I)的化合物或其形式和药学上可接受的载体、赋形剂或稀释剂的药物组合物。
另一方面,本文提供了用于调节本文所述的基因的一种、两种、三种或更多种RNA转录物的量的方法,包括向人类或非人类对象施用式(I)的化合物或其形式或包含式(I)的化合物或其形式和药学上可接受的载体、赋形剂或稀释剂的药物组合物。关于本文所述的基因的另外的信息,参见实施例部分。在一些方面,式(I)的化合物是选自本文所述的化合物的化合物。
在用于调节本文所述的基因的一种、两种、三种或更多种RNA转录物的量的前述方法中的任一种的另一方面,最低需要的功能性内含子REMS元件按5’至3’顺序包含:内含子REMS序列、分支点序列和3’剪接位点序列。
另一方面,本文提供了用于调节包含RNA核苷酸序列的RNA转录物的量的方法,其中所述RNA核苷酸序列包含两个外显子和内含子,其中第一外显子在内含子的上游,并且第二外显子在内含子的下游,其中所述内含子的RNA核苷酸序列按5’至3’顺序包含:第一5’剪接位点、第一分支点、第一3’剪接位点、iREMS、第二分支点和第二3’剪接位点,其中所述iREMS包含RNA序列GAgurngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,所述方法包括使所述RNA转录物与本文所述的化合物(例如,式(I)的化合物或其形式或另一种小分子剪接调节剂化合物)接触。在具体方面,所述RNA转录物是本文所述的基因的转录物(例如,在本文的表或本文的实施例中)。在具体方面,所述iREMS是非内源的。
另一方面,本文提供了用于调节包含RNA核苷酸序列的RNA转录物的量的方法,其中所述RNA核苷酸序列包含两个外显子和内含子,其中第一外显子在内含子的上游,并且第二外显子在内含子的下游,其中所述内含子的所述RNA核苷酸序列按5’至3’顺序包含:分支点、3’剪接位点和iREMS,其中所述iREMS包含RNA序列GAgurngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,所述方法包括使所述RNA转录物与本文所述的化合物(例如,式(I)的化合物或其形式或另一种小分子剪接调节剂化合物)接触。在具体方面,the RNA转录物是本文所述的基因的转录物(例如,在本文的表或本文的实施例中)。在具体方面,所述iREMS是非内源的。
另一方面,本文提供了用于调节包含RNA核苷酸序列的RNA转录物的量的方法,其中所述RNA核苷酸序列包含两个外显子和内含子,并且其中所述RNA核苷酸序列包含图1A所示的外显子和内含子元件,所述方法包括使所述RNA转录物与本文所述的化合物(例如,式(I)的化合物或其形式或另一种小分子剪接调节剂化合物)接触。在具体方面,所述RNA转录物是本文所述的基因的转录物(例如,在本文的表或本文的实施例中)。在具体方面,所述iREMS是非内源的。
另一方面,本文提供了用于调节包含RNA核苷酸序列的RNA转录物的量的方法,其中所述RNA核苷酸序列包含两个外显子和内含子,并且其中所述RNA核苷酸序列包含图1B所示的外显子和内含子元件,所述方法包括使所述RNA转录物与本文所述的化合物(例如,式(I)的化合物或其形式或另一种小分子剪接调节剂化合物)接触。在具体方面,所述RNA转录物是本文所述的基因的转录物(例如,在本文的表或本文的实施例中)。在具体方面,所述iREMS是非内源的。
另一方面,本文提供了用于调节包含RNA核苷酸序列的RNA转录物的量的方法,其中所述RNA核苷酸序列包含三个外显子和两个内含子,并且其中所述RNA核苷酸序列包含图1C所示的外显子和内含子元件,所述方法包括使所述RNA转录物与本文所述的化合物(例如,式(I)的化合物或其形式或另一种小分子剪接调节剂化合物)接触。在具体方面,所述RNA转录物是本文所述的基因的转录物(例如,在本文的表或实施例中)。在具体方面,所述iREMS是非内源的。
在具体方面,所述RNA转录物是本公开的表中描述的基因的RNA转录物。
另一方面,本文提供了用于调节对象中的基因产物(如RNA转录物或蛋白)的量的方法,其中所述基因包含编码两个外显子和内含子的DNA核苷酸序列,其中编码第一外显子的核苷酸序列在编码内含子的核苷酸序列的上游,并且编码第二外显子的核苷酸序列在编码内含子的核苷酸序列的下游,其中所述编码内含子的DNA核苷酸序列按5’至3’顺序包含:编码第一5’剪接位点的核苷酸序列、编码第一分支点的核苷酸序列、编码第一3’剪接位点的核苷酸序列、编码iREMS的核苷酸序列、编码第二分支点的核苷酸序列和编码第二3’剪接位点的核苷酸序列,其中编码iREMS的所述核苷酸序列包含DNA序列GAgtrngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,所述方法包括向所述对象施用本文所述的化合物(例如,式(I)的化合物或其形式或另一种小分子剪接调节剂化合物)。
另一方面,本文提供了用于调节对象中的基因产物(如RNA转录物或蛋白)的量的方法,其中所述基因包含编码两个外显子和内含子的DNA核苷酸序列,其中编码第一外显子的核苷酸序列在编码内含子的核苷酸序列的上游,并且编码第二外显子的核苷酸序列在编码内含子的核苷酸序列的下游,其中内含子的DNA核苷酸序列按5’至3’顺序包含:编码分支点的核苷酸序列、编码3’剪接位点的核苷酸序列和编码iREMS的核苷酸序列,其中所述编码iREMS的核苷酸序列包含DNA序列GAgtrngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,所述方法包括向所述对象施用本文所述的化合物(例如,式(I)的化合物或其形式或另一种小分子剪接调节剂化合物)。
另一方面,本文提供了用于调节对象中的基因产物(如RNA转录物或蛋白)的方法,其中所述基因包含编码两个外显子和内含子的DNA核苷酸序列,其中编码第一外显子的核苷酸序列在编码内含子的核苷酸序列的上游,并且编码第二外显子的核苷酸序列在编码内含子的核苷酸序列的下游,其中内含子的DNA核苷酸序列按5’至3’顺序包含:编码iREMS的核苷酸序列、编码分支点的核苷酸序列和编码3’剪接位点的核苷酸序列,其中所述编码iREMS的核苷酸序列包含DNA序列GAgtrngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,所述方法包括向所述对象施用本文所述的化合物(例如,式(I)的化合物或其形式或另一种小分子剪接调节剂化合物)。
另一方面,本文提供了用于调节对象中的基因产物(如RNA转录物或蛋白)的方法,其中所述基因包含编码两个外显子和内含子的DNA核苷酸序列,并且其中所述DNA核苷酸序列编码图1A所示的外显子和内含子元件,所述方法包括向所述对象施用本文所述的化合物(例如,式(I)的化合物或其形式或另一种小分子剪接调节剂化合物)。
另一方面,本文提供了用于调节对象中的基因产物(如RNA转录物或蛋白)的方法,其中所述基因包含编码两个外显子和内含子的DNA核苷酸序列,并且其中所述DNA核苷酸序列编码图1B所示的外显子和内含子元件,所述方法包括向所述对象施用本文所述的化合物(例如,式(I)的化合物或其形式或另一种小分子剪接调节剂化合物)。
另一方面,本文提供了用于调节对象中的基因产物(如RNA转录物或蛋白)的方法,其中所述基因包含编码两个外显子和内含子的DNA核苷酸序列,并且其中所述DNA核苷酸序列编码图1C所示的外显子和内含子元件,所述方法包括向所述对象施用本文所述的化合物(例如,式(I)的化合物或其形式或另一种小分子剪接调节剂化合物)。
在具体方面,所述基因是在本公开的表中描述的基因。
另一方面,本文提供了用于预防和/或治疗与基因产物(例如,mRNA转录物或蛋白)的异常表达相关的疾病的方法,其中从所述基因转录的所述前体RNA转录物包含内含子REMS,所述方法包括向人类或非人类对象施用式(I)的化合物或其形式或包含式(I)的化合物或其形式和药学上可接受的载体、赋形剂或稀释剂的药物组合物。一方面,本文提供了用于预防和/或治疗与本文所述的基因产物(例如,mRNA,RNA转录物或蛋白)的异常表达相关的疾病的方法,所述方法包括向人类或非人类对象施用式(I)的化合物或其形式或包含式(I)的化合物或其形式和药学上可接受的载体、赋形剂或稀释剂的药物组合物。另一方面,本文提供了用于预防和/或治疗与本文所述的基因产物(例如,mRNA、RNA转录物或蛋白)的异常表达相关的疾病的方法,其中从所述基因转录的所述前体RNA转录物包含内含子REMS,所述方法包括向人类或非人类对象施用式(I)的化合物或其形式或包含式(I)的化合物或其形式和药学上可接受的载体、赋形剂或稀释剂的药物组合物。另一方面,本文提供了用于预防和/或治疗与本文所述的基因产物(例如,mRNA、RNA转录物或蛋白)的异常表达相关的疾病的方法,其中从所述基因转录的所述前体RNA转录物包含内含子REMS,所述方法包括向人类或非人类对象施用式(I)的化合物或其形式或包含式(I)的化合物或其形式和药学上可接受的载体、赋形剂或稀释剂的药物组合物。另一方面,本文提供了用于预防和/或治疗与本文所述的基因产物(例如,mRNA、RNA转录物或蛋白)的异常表达相关的疾病的方法,包括向人类或非人类对象施用式(I)的化合物或其形式或包含式(I)的化合物或其形式和药学上可接受的载体、赋形剂或稀释剂的药物组合物。关于本文所述的基因的另外的信息,参见实施例部分。在某些方面,式(I)的化合物是选自本文所述的化合物的化合物。
另一方面,本文提供了用于预防和/或治疗疾病的方法,其中由基因编码的一种、两种、三种或更多种RNA同种型(isoform)的表达水平的改变有利于预防和/或治疗所述疾病,其中从所述基因转录的所述前体RNA转录物包含内含子REMS,所述方法包括向人类或非人类对象施用式(I)的化合物或其形式或包含式(I)的化合物或其形式和药学上可接受的载体、赋形剂或稀释剂的药物组合物。一方面,本文提供了用于预防和/或治疗疾病的方法,其中由本文所述的基因编码的一种、两种、三种或更多种RNA同种型的表达的调节(例如,增加或减少)有利于预防和/或治疗所述疾病,所述方法包括向人类或非人类对象施用式(I)的化合物或其形式或包含式(I)的化合物或其形式和药学上可接受的载体、赋形剂或稀释剂的药物组合物。
另一方面,本文提供了用于预防和/或治疗疾病的方法,其中由本文所述的基因编码的一种、两种、三种或更多种RNA同种型的表达的调节(例如,增加或减少)有利于预防和/或治疗所述疾病,其中从所述基因转录的所述前体RNA转录物包含内含子REMS,所述方法包括向人类或非人类对象施用式(I)的化合物或其形式或包含式(I)的化合物或其形式和药学上可接受的载体、赋形剂或稀释剂的药物组合物。
另一方面,本文提供了用于预防和/或治疗疾病的方法,其中由本文所述的基因编码的一种、两种、三种或更多种RNA同种型的表达的调节(例如,增加或减少)有利于预防和/或治疗所述疾病,其中从所述基因转录的所述前体RNA转录物包含内含子REMS,所述方法包括向人类或非人类对象施用式(I)的化合物或其形式或包含式(I)的化合物或其形式和药学上可接受的载体、赋形剂或稀释剂的药物组合物。另一方面,本文提供了用于预防和/或治疗疾病的方法,其中由本文所述的基因编码的一种、两种、三种或更多种RNA同种型的表达的调节(例如,增加或减少)有利于预防和/或治疗所述疾病,所述方法包括向人类或非人类对象施用式(I)的化合物或其形式或包含式(I)的化合物或其形式和药学上可接受的载体、赋形剂或稀释剂的药物组合物。在具体方面,在施用式(I)的化合物或其形式和药学上可接受的载体、赋形剂或稀释剂后,由本文所述的基因编码的一种、两种、三种或更多种RNA同种型降低。关于本文所述的基因的另外的信息,参见实施例部分。在某些方面,式(I)的化合物是选自本文所述的化合物的化合物。
另一方面,本文提供了用于预防和/或治疗疾病的方法,其中由基因编码的一种、两种、三种或更多种蛋白同种型的表达水平的改变有利于预防和/或治疗所述疾病,其中从所述基因转录的所述前体RNA转录物包含内含子REMS,所述方法包括向人类或非人类对象施用式(I)的化合物或其形式或包含式(I)的化合物或其形式和药学上可接受的载体、赋形剂或稀释剂的药物组合物。
一方面,本文提供了用于预防和/或治疗疾病的方法,其中由本文所述的基因编码的一种、两种、三种或更多种蛋白同种型的表达的调节(例如,增加或减少)有利于预防和/或治疗所述疾病,所述方法包括向人类或非人类对象施用式(I)的化合物或其形式或包含式(I)的化合物或其形式和药学上可接受的载体、赋形剂或稀释剂的药物组合物。
另一方面,本文提供了用于预防和/或治疗疾病的方法,其中由本文所述的基因编码的一种、两种、三种或更多种蛋白同种型的表达的调节(例如,增加或减少)有利于预防和/或治疗所述疾病,其中从所述基因转录的所述前体RNA转录物包含内含子REMS,所述方法包括向人类或非人类对象施用式(I)的化合物或其形式或包含式(I)的化合物或其形式和药学上可接受的载体、赋形剂或稀释剂的药物组合物。另一方面,本文提供了用于预防和/或治疗疾病的方法,其中由本文所述的基因编码的一种、两种、三种或更多种蛋白同种型的表达的调节(例如,增加或减少)有利于预防和/或治疗所述疾病,其中从所述基因转录的所述前体RNA转录物包含内含子REMS,所述方法包括向人类或非人类对象施用式(I)的化合物或其形式或包含式(I)的化合物或其形式和药学上可接受的载体、赋形剂或稀释剂的药物组合物。
另一方面,本文提供了用于预防和/或治疗疾病的方法,其中由本文所述的基因编码的一种、两种、三种或更多种蛋白同种型的表达的调节(例如,增加或减少)有利于预防和/或治疗所述疾病,所述方法包括向人类或非人类对象施用式(I)的化合物或其形式或包含式(I)的化合物或其形式和药学上可接受的载体、赋形剂或稀释剂的药物组合物。在具体方面,在施用式(I)的化合物或其形式和药学上可接受的载体、赋形剂或稀释剂后,由本文所述的基因编码的一种、两种、三种或更多种RNA同种型降低。关于本文所述的基因的另外的信息,参见实施例部分。在某些方面,式(I)的化合物是选自本文所述的化合物的化合物。
另一方面,本文提供了用于预防、治疗或预防和治疗对象的疾病的方法,其中由基因编码的一种、两种、三种或更多种蛋白同种型的表达的调节(例如,增加或减少)有利于预防和/或治疗所述疾病,其中所述基因包含编码两个外显子和内含子的DNA核苷酸序列,其中编码第一外显子的核苷酸序列在编码内含子的核苷酸序列的上游,并且编码第二外显子的核苷酸序列在编码内含子的核苷酸序列的下游,其中编码内含子的DNA的核苷酸序列按5’至3’顺序包含:编码第一5’剪接位点的核苷酸序列、编码第一分支点的核苷酸序列、编码第一3’剪接位点的核苷酸序列、编码iREMS的核苷酸序列、编码第二分支点的核苷酸序列和编码第二3’剪接位点的核苷酸序列,其中所述编码iREMS的核苷酸序列包含DNA序列GAgtrngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,所述方法包括向所述对象施用本文所述的化合物(例如,式(I)的化合物或其形式或另一种小分子剪接调节剂化合物)。
另一方面,本文提供了用于预防、治疗或预防和治疗对象的疾病的方法,其中由基因编码的一种、两种、三种或更多种蛋白同种型的表达的调节(例如,增加或减少)有利于预防和/或治疗所述疾病,其中所述基因包含编码两个外显子和内含子的DNA核苷酸序列,其中编码第一外显子的核苷酸序列在编码内含子的核苷酸序列的上游,并且编码第二外显子的核苷酸序列在编码内含子的核苷酸序列的下游,其中内含子的DNA核苷酸序列按5’至3’顺序包含:编码分支点的核苷酸序列、编码3’剪接位点的核苷酸序列和编码iREMS的核苷酸序列,其中所述编码iREMS的核苷酸序列包含DNA序列GAgtrngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,所述方法包括向所述对象施用本文所述的化合物(例如,式(I)的化合物或其形式或另一种小分子剪接调节剂化合物)。
另一方面,本文提供了用于预防、治疗或预防和治疗对象的疾病的方法,其中由基因编码的一种、两种、三种或更多种蛋白同种型的表达的调节(例如,增加或减少)有利于预防和/或治疗所述疾病,其中所述基因包含编码两个外显子和内含子的DNA核苷酸序列,并且其中所述DNA核苷酸序列编码图1A所示的外显子和内含子元件,所述方法包括向所述对象施用本文所述的化合物(例如,式(I)的化合物或其形式或另一种小分子剪接调节剂化合物)。
另一方面,本文提供了用于预防、治疗或预防和治疗对象的疾病的方法,其中由基因编码的一种、两种、三种或更多种蛋白同种型的表达的调节(例如,增加或减少)有利于预防和/或治疗所述疾病,其中所述基因包含编码两个外显子和内含子的DNA核苷酸序列,并且其中所述DNA核苷酸序列编码图1B所示的外显子和内含子元件,所述方法包括向所述对象施用本文所述的化合物(例如,式(I)的化合物或其形式或另一种小分子剪接调节剂化合物)。
另一方面,本文提供了用于预防、治疗或预防和治疗对象的疾病的方法,其中由基因编码的一种、两种、三种或更多种蛋白同种型的表达的调节(例如,增加或减少)有利于预防和/或治疗所述疾病,其中所述基因包含编码两个外显子和内含子的DNA核苷酸序列,并且其中所述DNA核苷酸序列编码图1C所示的外显子和内含子元件,所述方法包括向所述对象施用本文所述的化合物(例如,式(I)的化合物或其形式或另一种小分子剪接调节剂化合物)。
在具体方面,所述基因是在本公开的表中描述的基因。
另一方面,本文提供了人工基因构建体。一方面,本文提供了包含内源DNA的人工基因构建体,所述内源DNA被修饰以引入编码包含(多个)3’剪接位点和(多个)分支点和内含子REMS的内含子的非内源核苷酸序列。另一方面,本文提供了包含编码外显子和一个、两个或三个内含子的DNA的人工基因构建体,其中可以在编码分支点的内源核苷酸序列和编码3’剪接位点的内源核苷酸序列的上游的编码内含子REMS的核苷酸序列被修饰以引入在内源内含子REMS更上游的编码非内源分支点和非内源3’剪接位点的核苷酸序列,所述内含子REMS在本文所述的化合物的存在下充当5’剪接位点。另一方面,本文提供了包含编码外显子和一个、两个或三个内含子的DNA的人工基因构建体,其中可以在编码分支点的内源核苷酸序列和编码3’剪接位点的内源核苷酸序列的下游的编码内含子REMS 5’剪接位点的核苷酸序列被修饰,以引入在内源内含子REMS更下游的编码非内源分支点和非内源3’剪接位点的核苷酸序列。另一方面,本文提供了包含编码内含子REMS的DNA的人工基因构建体,所述DNA包含编码具有一个或多个5’剪接位点、3’剪接位点和分支点的内含子REMS的核苷酸。在某些方面,所述人工基因构建体在开放阅读框内编码移码或提前终止密码子或内部插入或缺失。在其他方面,所述人工基因构建体编码具有功能性开放阅读框的成熟mRNA,产生可以具有功能或可以不具有功能的新的蛋白。在一些方面,所述人工基因构建体编码可检测的报告蛋白。由于在开放阅读框内包含框保持序列、移码、提前终止密码子或内部插入或缺失而具有改变的或截短的开放阅读框的RNA转录物可以是无义介导的降解的底物,因此具有低丰度。当与野生型RNA转录物相比时,任何内含子REMS介导的供选择地剪接的RNA转录物还可以具有调节的稳定性、细胞内转运、3’端形成效率和/或翻译效率。
在具体方面,引入人工基因构建体的核苷酸序列中的内含子REMS的核苷酸序列包含序列NNGAgtrngn(SEQ ID NO:1808),其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸。在具体方面,在DNA的情况下,编码内含子REMS的核苷酸序列包含选自以下的序列:ANGAgtrngn(SEQ ID NO:1809)、CNGAgtrngn(SEQ ID NO:1810)、GNGAgtrngn(SEQ ID NO:1811)、TNGAgtrngn(SEQ ID NO:1812)、NAGAgtrngn(SEQ ID NO:1813)、NCGAgtrngn(SEQ IDNO:1814)、NGGAgtrngn(SEQ ID NO:1815)、NTGAgtrngn(SEQ ID NO:1816)、AAGAgtrngn(SEQID NO:1817)、ACGAgtrngn(SEQ ID NO:1818)、AGGAgtrngn(SEQ ID NO:1819)、ATGAgtrngn(SEQ ID NO:1820)、CAGAgtrngn(SEQ ID NO:1821)、CCGAgtrngn(SEQ ID NO:1822)、CGGAgtrngn(SEQ ID NO:1823)、CTGAgtrngn(SEQ ID NO:1824)、GAGAgtrngn(SEQ ID NO:1825)、GCGAgtrngn(SEQ ID NO:1826)、GGGAgtrngn(SEQ ID NO:1827)、GTGAgtrngn(SEQ IDNO:1828)、TAGAgtrngn(SEQ ID NO:1829)、TCGAgtrngn(SEQ ID NO:1830)、TGGAgtrngn(SEQID NO:1831)和TTGAgtrngn(SEQ ID NO:1832),其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸。
在另外的具体方面,在DNA的情况下,编码内含子REMS的核苷酸序列包含选自以下的序列:ANGAgtragt(SEQ ID NO:1833)、CNGAgtragt(SEQ ID NO:1834)、GNGAgtragt(SEQID NO:1835)、TNGAgtragt(SEQ ID NO:1836)、NAGAgtragt(SEQ ID NO:1837)、NCGAgtragt(SEQ ID NO:1838)、NGGAgtragt(SEQ ID NO:1839)、NTGAgtragt(SEQ ID NO:1840)、AAGAgtragt(SEQ ID NO:1841)、ACGAgtragt(SEQ ID NO:1842)、AGGAgtragt(SEQ ID NO:1843)、ATGAgtragt(SEQ ID NO:1844)、CAGAgtragt(SEQ ID NO:1845)、CCGAgtragt(SEQ IDNO:1846)、CGGAgtragt(SEQ ID NO:1847)、CTGAgtragt(SEQ ID NO:1848)、GAGAgtragt(SEQID NO:1849)、GCGAgtragt(SEQ ID NO:1850)、GGGAgtragt(SEQ ID NO:1851)、GTGAgtragt(SEQ ID NO:1852)、TAGAgtragt(SEQ ID NO:1853)、TCGAgtragt(SEQ ID NO:1854)、TGGAgtragt(SEQ ID NO:1855)和TTGAgtragt(SEQ ID NO:1856),其中r为腺嘌呤或鸟嘌呤,并且N为任何核苷酸。在本文提供的一个或多个方面,N为腺嘌呤或鸟嘌呤A或G。在各个具体方面,编码内含子REMS的核苷酸序列是编码非内源内含子REMS的核苷酸序列,即包含在人工构建体的DNA序列中非天然存在的非内源内含子REMS的前体RNA转录物。
在具体方面,在本文所述的方法或人工基因构建体中提及的内含子REMS在DNA水平上包含表2所示的序列(其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸):
表2.内含子REMS DNA序列(其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸)
表2(续).内含子REMS DNA序列(其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸)
表2(续).内含子REMS DNA序列(其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸)
表2(续).内含子REMS DNA序列(其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸)
表2(续).内含子REMS DNA序列(其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸)
表2(续).内含子REMS DNA序列(其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸)
表2(续).内含子REMS DNA序列(其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸)
表2(续).内含子REMS DNA序列(其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸)
表2(续).内含子REMS DNA序列(其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸)
表2(续).内含子REMS DNA序列(其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸)
表2(续).内含子REMS DNA序列(其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸)
表2(续).内含子REMS DNA序列(其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸)
表2(续).内含子REMS DNA序列(其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸)
表2(续).内含子REMS DNA序列(其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸)
表2(续).内含子REMS DNA序列(其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸)
表2(续).内含子REMS DNA序列(其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸)
表2(续).内含子REMS DNA序列(其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸)
表2(续).内含子REMS DNA序列(其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸)
表2(续).内含子REMS DNA序列(其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸)
表2(续).内含子REMS DNA序列(其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸)
在某些方面,本文提供了包含本文所述的人工基因构建体的载体。在一些方面,本文提供了包含本文所述的人工基因构建体的细胞或包含本文所述的人工基因构建体的载体。
另一方面,本文提供了调节由包含本文所述的人工基因构建体的细胞产生的蛋白的量以及修饰由包含本文所述的人工基因构建体的细胞产生的蛋白的类型的方法。一方面,本文提供了调节由包含本文所述的人工基因构建体的细胞产生的蛋白的量以及修饰由包含本文所述的人工基因构建体的细胞产生的蛋白的类型的方法,所述方法包括使所述细胞与式(I)的化合物或其形式接触。在某些方面,所述人工基因构建体编码治疗性蛋白。在某些方面,所述人工基因构建体编码非功能性蛋白。在产生治疗性蛋白的一些方面,所述人工基因构建体还可以编码可检测的报告蛋白。在产生非功能性蛋白的一些方面,所述人工基因构建体还可以编码可检测的报告蛋白。
另一方面,本文提供了调节由对象产生的蛋白的量的方法,其中向所述对象施用或向所述对象施用过本文所述的人工基因构建体。一方面,本文提供了调节由对象产生的蛋白的量的方法,所述方法包括:(a)向所述对象施用人工基因构建体或包含本文所述的人工基因构建体的载体;和(b)向所述对象施用式(I)的化合物或其形式。另一方面,本文提供了调节由对象产生的蛋白的量的方法,所述方法包括向所述对象施用式(I)的化合物或其形式,所述对象携带包含编码内含子REMS的核苷酸序列的基因。另一方面,本文提供了调节由对象产生的蛋白的量的方法,所述方法包括向所述对象施用式(I)的化合物,其中先前向所述对象施用过本文所述的人工基因构建体。在某些方面,所述人工基因构建体可以编码治疗性或非功能性蛋白。在一些方面,所述人工基因构建体编码可检测的报告蛋白。在某些方面,所述对象是非人类。在特定方面,所述对象是人类。
一方面,本文提供了用于修饰RNA剪接以调节由前体RNA产生的RNA转录物的量的方法,所述前体RNA按5’至3’顺序包含以下RNA核苷酸序列:分支点、3’剪接位点和内源或非内源剪接修饰剂的内含子识别元件(REMS),其中内含子REMS包含RNA序列GAgurngn,其中r为腺嘌呤或鸟嘌呤(分别为A或G),并且n为任何核苷酸,所述方法包括使前体RNA与式(I)的化合物或其形式接触,其中所述式(I)的化合物为:
或其形式,其中
W为CH=CH或S;
X为CH2、CH(C1-4烷基)、C(C1-4烷基)2、CH=CH、O、NR5或键;
A为芳基、杂芳基、杂环基或C9-10环烷基,
其中芳基选自苯基和萘基,其各自任选地被1、2、3或4个各自选自R1的取代基取代,
其中杂芳基具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R1的取代基取代,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R2的取代基取代,和
其中C9-10环烷基为任选地被1、2、3、4或5个各自选自R2的取代基取代的饱和或部分不饱和二环环系;
B为杂环基,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或多环环系,其各自任选地被1、2、3、4或5个各自选自R4的取代基取代;
R1为卤素、羟基、氰基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、杂环基-C1-4烷氧基、苯基或苯基-C1-4烷氧基,
其中杂芳基为具有1、2或3个选自N、O和S的杂原子环成员的饱和单环或二环环系,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中苯基、杂芳基或杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R2为卤素、羟基、氰基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、羟基-C1-4烷基、C1-4烷氧基、C1-4烷氧基-羰基、C2-4烯基、C3-7环烷基或杂环基-C1-4烷基,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R3为卤素、羟基、硝基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、苯基或苯基-C1-4烷氧基;
R4独立地选自卤素、C1-4烷基、羟基-C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基或羟基-C1-4烷基-氨基;和
R5为氢、C1-4烷基或羟基-C1-4烷基;
其中所述化合物的形式选自其前药、盐、水合物、溶剂化物、包合物、同位素体、外消旋体、对映异构体、非对映异构体、立体异构体、多晶型物和互变异构体形式。
另一方面,本文提供了用于修饰RNA剪接以调节由前体RNA产生的RNA转录物的量的方法,所述前体RNA按5’至3’顺序包含以下RNA核苷酸序列:分支点、3’剪接位点和内源或非内源剪接修饰剂的内含子识别元件(REMS),其中内含子REMS包含RNA序列GAgurngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,所述方法包括使前体RNA与式(I)的化合物或其形式接触,其中所述式(I)的化合物选自式(Ia)和式(Ib)的化合物:
或其形式,其中
X为CH2、CH(C1-4烷基)、C(C1-4烷基)2、CH=CH、O、NR5或键;
A为芳基、杂芳基、杂环基或C9-10环烷基,
其中芳基选自苯基和萘基,其各自任选地被1、2、3或4个各自选自R1的取代基取代,
其中杂芳基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R1的取代基取代,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R2的取代基取代,和
其中C9-10环烷基为任选地被1、2、3、4或5个各自选自R2的取代基取代的饱和或部分不饱和二环环系;
B为杂环基,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或多环环系,其各自任选地被1、2、3、4或5个各自选自R4的取代基取代;
R1为卤素、羟基、氰基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、杂环基-C1-4烷氧基、苯基或苯基-C1-4烷氧基,
其中杂芳基为具有1、2或3个选自N、O和S的杂原子环成员的饱和单环或二环环系,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中苯基、杂芳基或杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R2为卤素、羟基、氰基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、氨基-羰基、羟基-C1-4烷基、C1-4烷氧基、C1-4烷氧基-羰基、C2-4烯基、C3-7环烷基或杂环基-C1-4烷基;
R3为卤素、羟基、硝基、氧代基、羟基-亚氨基、C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、苯基或苯基-C1-4烷氧基;
R4独立地选自卤素、C1-4烷基、羟基-C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基或羟基-C1-4烷基-氨基;和
R5为氢、C1-4烷基或羟基-C1-4烷基;
其中化合物的形式选自其前药、盐、水合物、溶剂化物、包合物、同位素体、外消旋体、对映异构体、非对映异构体、立体异构体、多晶型物和互变异构体形式。
一方面,本文提供了用于修饰RNA剪接以调节由前体RNA产生的RNA转录物的量的方法,所述前体RNA按5’至3’顺序包含以下RNA核苷酸序列:分支点、3’剪接位点和内源或非内源剪接修饰剂的内含子识别元件(REMS),其中内含子REMS包含RNA序列NNGAgurngn(SEQID NO:1),其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸,所述方法包括使前体RNA与式(I)的化合物或其形式接触,其中所述式(I)的化合物为:
或其形式,其中
W为CH=CH或S;
X为CH2、CH(C1-4烷基)、C(C1-4烷基)2、CH=CH、O、NR5或键;
A为芳基、杂芳基、杂环基或C9-10环烷基,
其中芳基选自苯基和萘基,其各自任选地被1、2、3或4个各自选自R1的取代基取代,
其中杂芳基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R1的取代基取代,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R2的取代基取代,和
其中C9-10环烷基为任选地被1、2、3、4或5个各自选自R2的取代基取代的饱和或部分不饱和二环环系;
B为杂环基,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或多环环系,其各自任选地被1、2、3、4或5个各自选自R4的取代基取代;
R1为卤素、羟基、氰基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、杂环基-C1-4烷氧基、苯基或苯基-C1-4烷氧基,
其中杂芳基为具有1、2或3个选自N、O和S的杂原子环成员的饱和单环或二环环系,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中苯基、杂芳基或杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R2为卤素、羟基、氰基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、羟基-C1-4烷基、C1-4烷氧基、C1-4烷氧基-羰基、C2-4烯基、C3-7环烷基或杂环基-C1-4烷基,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R3为卤素、羟基、硝基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、苯基或苯基-C1-4烷氧基;
R4独立地选自卤素、C1-4烷基、羟基-C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基或羟基-C1-4烷基-氨基;和
R5为氢、C1-4烷基或羟基-C1-4烷基;
其中化合物的形式选自其前药、盐、水合物、溶剂化物、包合物、同位素体、外消旋体、对映异构体、非对映异构体、立体异构体、多晶型物和互变异构体形式。
另一方面,本文提供了用于修饰RNA剪接以调节由前体RNA产生的RNA转录物的量的方法,所述前体RNA按5’至3’顺序包含以下RNA核苷酸序列:分支点、3’剪接位点和内源或非内源剪接修饰剂的内含子识别元件(REMS),其中内含子REMS包含RNA序列NNGAgurngn(SEQ ID NO:1),其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸,所述方法包括使前体RNA与式(I)的化合物或其形式接触,其中所述式(I)的化合物选自式(Ia)和式(Ib)的化合物:
或其形式,其中
X为CH2、CH(C1-4烷基)、C(C1-4烷基)2、CH=CH、O、NR5或键;
A为芳基、杂芳基、杂环基或C9-10环烷基,
其中芳基选自苯基和萘基,其各自任选地被1、2、3或4个各自选自R1的取代基取代,
其中杂芳基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R1的取代基取代,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R2的取代基取代,和
其中C9-10环烷基为任选地被1、2、3、4或5个各自选自R2的取代基取代的饱和或部分不饱和二环环系;
B为杂环基,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或多环环系,其各自任选地被1、2、3、4或5个各自选自R4的取代基取代;
R1为卤素、羟基、氰基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、杂环基-C1-4烷氧基、苯基或苯基-C1-4烷氧基,
其中杂芳基为具有1、2或3个选自N、O和S的杂原子环成员的饱和单环或二环环系,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中苯基、杂芳基或杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R2为卤素、羟基、氰基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、氨基-羰基、羟基-C1-4烷基、C1-4烷氧基、C1-4烷氧基-羰基、C2-4烯基、C3-7环烷基或杂环基-C1-4烷基;
R3为卤素、羟基、硝基、氧代基、羟基-亚氨基、C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、苯基或苯基-C1-4烷氧基;
R4独立地选自卤素、C1-4烷基、羟基-C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基或羟基-C1-4烷基-氨基;和
R5为氢、C1-4烷基或羟基-C1-4烷基;
其中化合物的形式选自其前药、盐、水合物、溶剂化物、包合物、同位素体、外消旋体、对映异构体、非对映异构体、立体异构体、多晶型物和互变异构体形式。
一方面,本文提供了用于修饰RNA剪接以调节对象中的由包含编码内源或非内源内含子REMS的DNA核苷酸序列的基因产生的蛋白的量和类型的方法,其中所述DNA核苷酸序列按5’至3’顺序包含:编码分支点的核苷酸序列、编码3’剪接位点的核苷酸序列和编码内源或非内源内含子REMS的核苷酸序列,其中所述编码内源或非内源内含子REMS的核苷酸序列包含DNA序列GAgtrngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,所述方法包括向对象施用式(I)的化合物,其中所述式(I)的化合物为:
或其形式,其中
W为CH=CH或S;
X为CH2、CH(C1-4烷基)、C(C1-4烷基)2、CH=CH、O、NR5或键;
A为芳基、杂芳基、杂环基或C9-10环烷基,
其中芳基选自苯基和萘基,其各自任选地被1、2、3或4个各自选自R1的取代基取代,
其中杂芳基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R1的取代基取代,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R2的取代基取代,和
其中C9-10环烷基为任选地被1、2、3、4或5个各自选自R2的取代基取代的饱和或部分不饱和二环环系;
B为杂环基,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或多环环系,其各自任选地被1、2、3、4或5个各自选自R4的取代基取代;
R1为卤素、羟基、氰基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、杂环基-C1-4烷氧基、苯基或苯基-C1-4烷氧基,
其中杂芳基为具有1、2或3个选自N、O和S的杂原子环成员的饱和单环或二环环系,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中苯基、杂芳基或杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R2为卤素、羟基、氰基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、羟基-C1-4烷基、C1-4烷氧基、C1-4烷氧基-羰基、C2-4烯基、C3-7环烷基或杂环基-C1-4烷基,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R3为卤素、羟基、硝基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、苯基或苯基-C1-4烷氧基;
R4独立地选自卤素、C1-4烷基、羟基-C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基或羟基-C1-4烷基-氨基;和
R5为氢、C1-4烷基或羟基-C1-4烷基;
其中化合物的形式选自其前药、盐、水合物、溶剂化物、包合物、同位素体、外消旋体、对映异构体、非对映异构体、立体异构体、多晶型物和互变异构体形式。
一方面,本文提供了用于修饰RNA剪接以调节对象中的由包含编码内源或非内源内含子REMS的DNA核苷酸序列的基因产生的蛋白的量和类型的方法,其中所述DNA核苷酸序列按5’至3’顺序包含:编码内源或非内源内含子REMS的核苷酸序列、编码分支点的核苷酸序列和编码3’剪接位点的核苷酸序列,其中所述编码内源或非内源内含子REMS的核苷酸序列包含DNA序列GAgtrngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,所述方法包括向所述对象施用式(I)的化合物,其中所述式(I)的化合物为:
或其形式,其中
W为CH=CH或S;
X为CH2、CH(C1-4烷基)、C(C1-4烷基)2、CH=CH、O、NR5或键;
A为芳基、杂芳基、杂环基或C9-10环烷基,
其中芳基选自苯基和萘基,其各自任选地被1、2、3或4个各自选自R1的取代基取代,
其中杂芳基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R1的取代基取代,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R2的取代基取代,和
其中C9-10环烷基为任选地被1、2、3、4或5个各自选自R2的取代基取代的饱和或部分不饱和二环环系;
B为杂环基,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或多环环系,其各自任选地被1、2、3、4或5个各自选自R4的取代基取代;
R1为卤素、羟基、氰基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、杂环基-C1-4烷氧基、苯基或苯基-C1-4烷氧基,
其中杂芳基为具有1、2或3个选自N、O和S的杂原子环成员的饱和单环或二环环系,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中苯基、杂芳基或杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R2为卤素、羟基、氰基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、羟基-C1-4烷基、C1-4烷氧基、C1-4烷氧基-羰基、C2-4烯基、C3-7环烷基或杂环基-C1-4烷基,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R3为卤素、羟基、硝基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、苯基或苯基-C1-4烷氧基;
R4独立地选自卤素、C1-4烷基、羟基-C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基或羟基-C1-4烷基-氨基;和
R5为氢、C1-4烷基或羟基-C1-4烷基;
其中化合物的形式选自其前药、盐、水合物、溶剂化物、包合物、同位素体、外消旋体、对映异构体、非对映异构体、立体异构体、多晶型物和互变异构体形式。
另一方面,本文提供了修饰RNA剪接以调节对象中的由包含编码内源或非内源内含子REMS的DNA核苷酸序列的基因产生的蛋白的量和类型的方法,其中所述DNA核苷酸序列按5’至3’顺序包含:编码分支点的核苷酸序列、编码3’剪接位点的核苷酸序列和编码内源或非内源内含子REMS的核苷酸序列,其中所述编码内源或非内源内含子REMS的核苷酸序列包含DNA序列GAgtrngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,所述方法包括向所述对象施用式(I)的化合物,其中所述式(I)的化合物选自式(Ia)和式(Ib)的化合物:
或其形式,其中
X为CH2、CH(C1-4烷基)、C(C1-4烷基)2、CH=CH、O、NR5或键;
A为芳基、杂芳基、杂环基或C9-10环烷基,
其中芳基选自苯基和萘基,其各自任选地被1、2、3或4个各自选自R1的取代基取代,
其中杂芳基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R1的取代基取代,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R2的取代基取代,和
其中C9-10环烷基为任选地被1、2、3、4或5个各自选自R2的取代基取代的饱和或部分不饱和二环环系;
B为杂环基,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或多环环系,其各自任选地被1、2、3、4或5个各自选自R4的取代基取代;
R1为卤素、羟基、氰基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、杂环基-C1-4烷氧基、苯基或苯基-C1-4烷氧基,
其中杂芳基为具有1、2或3个选自N、O和S的杂原子环成员的饱和单环或二环环系,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中苯基、杂芳基或杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R2为卤素、羟基、氰基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、氨基-羰基、羟基-C1-4烷基、C1-4烷氧基、C1-4烷氧基-羰基、C2-4烯基、C3-7环烷基或杂环基-C1-4烷基;
R3为卤素、羟基、硝基、氧代基、羟基-亚氨基、C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、苯基或苯基-C1-4烷氧基;
R4独立地选自卤素、C1-4烷基、羟基-C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基或羟基-C1-4烷基-氨基;和
R5为氢、C1-4烷基或羟基-C1-4烷基;
其中化合物的形式选自其前药、盐、水合物、溶剂化物、包合物、同位素体、外消旋体、对映异构体、非对映异构体、立体异构体、多晶型物和互变异构体形式。
另一方面,本文提供了修饰RNA剪接以调节对象中的由包含编码内源或非内源内含子REMS的DNA核苷酸序列的基因产生的蛋白的量和类型的方法,其中所述DNA核苷酸序列按5’至3’顺序包含:编码内源或非内源内含子REMS的核苷酸序列、编码分支点的核苷酸序列和编码3’剪接位点的核苷酸序列,其中所述编码内源或非内源内含子REMS的核苷酸序列包含DNA序列GAgtrngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,所述方法包括向所述对象施用式(I)的化合物,其中所述式(I)的化合物选自式(Ia)和式(Ib)的化合物:
或其形式,其中
X为CH2、CH(C1-4烷基)、C(C1-4烷基)2、CH=CH、O、NR5或键;
A为芳基、杂芳基、杂环基或C9-10环烷基,
其中芳基选自苯基和萘基,其各自任选地被1、2、3或4个各自选自R1的取代基取代,
其中杂芳基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R1的取代基取代,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R2的取代基取代,和
其中C9-10环烷基为任选地被1、2、3、4或5个各自选自R2的取代基取代的饱和或部分不饱和二环环系;
B为杂环基,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或多环环系,其各自任选地被1、2、3、4或5个各自选自R4的取代基取代;
R1为卤素、羟基、氰基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、杂环基-C1-4烷氧基、苯基或苯基-C1-4烷氧基,
其中杂芳基为具有1、2或3个选自N、O和S的杂原子环成员的饱和单环或二环环系,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中苯基、杂芳基或杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R2为卤素、羟基、氰基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、氨基-羰基、羟基-C1-4烷基、C1-4烷氧基、C1-4烷氧基-羰基、C2-4烯基、C3-7环烷基或杂环基-C1-4烷基;
R3为卤素、羟基、硝基、氧代基、羟基-亚氨基、C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、苯基或苯基-C1-4烷氧基;
R4独立地选自卤素、C1-4烷基、羟基-C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基或羟基-C1-4烷基-氨基;和
R5为氢、C1-4烷基或羟基-C1-4烷基;
其中化合物的形式选自其前药、盐、水合物、溶剂化物、包合物、同位素体、外消旋体、对映异构体、非对映异构体、立体异构体、多晶型物和互变异构体形式。
一方面,本文提供了修饰RNA剪接以调节对象中的由包含编码内源或非内源内含子REMS的DNA核苷酸序列的基因产生的蛋白的量和类型的方法,其中所述DNA核苷酸序列按5’至3’顺序包含:编码分支点的核苷酸序列、编码3’剪接位点的核苷酸序列和编码内源或非内源内含子REMS的核苷酸序列,其中所述编码内源或非内源内含子REMS的核苷酸序列包含DNA序列NNGAgtrngn(SEQ ID NO:1808),其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸,所述方法包括向所述对象施用式(I)的化合物,其中所述式(I)的化合物为:
或其形式,其中
W为CH=CH或S;
X为CH2、CH(C1-4烷基)、C(C1-4烷基)2、CH=CH、O、NR5或键;
A为芳基、杂芳基、杂环基或C9-10环烷基,
其中芳基选自苯基和萘基,其各自任选地被1、2、3或4个各自选自R1的取代基取代,
其中杂芳基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R1的取代基取代,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R2的取代基取代,和
其中C9-10环烷基为任选地被1、2、3、4或5个各自选自R2的取代基取代的饱和或部分不饱和二环环系;
B为杂环基,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或多环环系,其各自任选地被1、2、3、4或5个各自选自R4的取代基取代;
R1为卤素、羟基、氰基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、杂环基-C1-4烷氧基、苯基或苯基-C1-4烷氧基,
其中杂芳基为具有1、2或3个选自N、O和S的杂原子环成员的饱和单环或二环环系,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中苯基、杂芳基或杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R2为卤素、羟基、氰基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、羟基-C1-4烷基、C1-4烷氧基、C1-4烷氧基-羰基、C2-4烯基、C3-7环烷基或杂环基-C1-4烷基,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R3为卤素、羟基、硝基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、苯基或苯基-C1-4烷氧基;
R4独立地选自卤素、C1-4烷基、羟基-C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基或羟基-C1-4烷基-氨基;和
R5为氢、C1-4烷基或羟基-C1-4烷基;
其中化合物的形式选自其前药、盐、水合物、溶剂化物、包合物、同位素体、外消旋体、对映异构体、非对映异构体、立体异构体、多晶型物和互变异构体形式。
一方面,本文提供了修饰RNA剪接以调节对象中的由包含编码内源或非内源内含子REMS的DNA核苷酸序列的基因产生的蛋白的量和类型的方法,其中所述DNA核苷酸序列按5’至3’顺序包含:编码内源或非内源内含子REMS的核苷酸序列、编码分支点的核苷酸序列和编码3’剪接位点的核苷酸序列,其中所述编码内源或非内源内含子REMS的核苷酸序列包含DNA序列NNGAgtrngn(SEQ ID NO:1808),其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸,所述方法包括向所述对象施用式(I)的化合物,其中所述式(I)的化合物为:
或其形式,其中
W为CH=CH或S;
X为CH2、CH(C1-4烷基)、C(C1-4烷基)2、CH=CH、O、NR5或键;
A为芳基、杂芳基、杂环基或C9-10环烷基,
其中芳基选自苯基和萘基,其各自任选地被1、2、3或4个各自选自R1的取代基取代,
其中杂芳基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R1的取代基取代,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R2的取代基取代,和
其中C9-10环烷基为任选地被1、2、3、4或5个各自选自R2的取代基取代的饱和或部分不饱和二环环系;
B为杂环基,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或多环环系,其各自任选地被1、2、3、4或5个各自选自R4的取代基取代;
R1为卤素、羟基、氰基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、杂环基-C1-4烷氧基、苯基或苯基-C1-4烷氧基,
其中杂芳基为具有1、2或3个选自N、O和S的杂原子环成员的饱和单环或二环环系,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中苯基、杂芳基或杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R2为卤素、羟基、氰基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、羟基-C1-4烷基、C1-4烷氧基、C1-4烷氧基-羰基、C2-4烯基、C3-7环烷基或杂环基-C1-4烷基,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R3为卤素、羟基、硝基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、苯基或苯基-C1-4烷氧基;
R4独立地选自卤素、C1-4烷基、羟基-C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基或羟基-C1-4烷基-氨基;和
R5为氢、C1-4烷基或羟基-C1-4烷基;
其中化合物的形式选自其前药、盐、水合物、溶剂化物、包合物、同位素体、外消旋体、对映异构体、非对映异构体、立体异构体、多晶型物和互变异构体形式。
另一方面,本文提供了修饰RNA剪接以调节对象中的由包含编码内源或非内源内含子REMS的DNA核苷酸序列的基因产生的蛋白的量和类型的方法,其中所述DNA核苷酸序列按5’至3’顺序包含:编码分支点的核苷酸序列、编码3’剪接位点的核苷酸序列和编码内源或非内源内含子REMS的核苷酸序列,其中所述编码内源或非内源内含子REMS的核苷酸序列包含DNA序列NNGAgtrngn(SEQ ID NO:1808),其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸,所述方法包括向所述对象施用式(I)的化合物,其中所述式(I)的化合物选自式(Ia)和式(Ib)的化合物:
或其形式,其中
X为CH2、CH(C1-4烷基)、C(C1-4烷基)2、CH=CH、O、NR5或键;
A为芳基、杂芳基、杂环基或C9-10环烷基,
其中芳基选自苯基和萘基,其各自任选地被1、2、3或4个各自选自R1的取代基取代,
其中杂芳基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R1的取代基取代,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R2的取代基取代,和
其中C9-10环烷基为任选地被1、2、3、4或5个各自选自R2的取代基取代的饱和或部分不饱和二环环系;
B为杂环基,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或多环环系,其各自任选地被1、2、3、4或5个各自选自R4的取代基取代;
R1为卤素、羟基、氰基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、杂环基-C1-4烷氧基、苯基或苯基-C1-4烷氧基,
其中杂芳基为具有1、2或3个选自N、O和S的杂原子环成员的饱和单环或二环环系,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中苯基、杂芳基或杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R2为卤素、羟基、氰基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、氨基-羰基、羟基-C1-4烷基、C1-4烷氧基、C1-4烷氧基-羰基、C2-4烯基、C3-7环烷基或杂环基-C1-4烷基;
R3为卤素、羟基、硝基、氧代基、羟基-亚氨基、C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、苯基或苯基-C1-4烷氧基;
R4独立地选自卤素、C1-4烷基、羟基-C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基或羟基-C1-4烷基-氨基;和
R5为氢、C1-4烷基或羟基-C1-4烷基;
其中化合物的形式选自其前药、盐、水合物、溶剂化物、包合物、同位素体、外消旋体、对映异构体、非对映异构体、立体异构体、多晶型物和互变异构体形式。
另一方面,本文提供了修饰RNA剪接以调节对象中的由包含编码内源或非内源内含子REMS的DNA核苷酸序列的基因产生的蛋白的量和类型的方法,其中所述DNA核苷酸序列按5’至3’顺序包含:编码内源或非内源内含子REMS的核苷酸序列、编码分支点的核苷酸序列和编码3’剪接位点的核苷酸序列,其中所述编码内源或非内源内含子REMS的核苷酸序列包含DNA序列NNGAgtrngn(SEQ ID NO:1808),其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸,所述方法包括向所述对象施用式(I)的化合物,其中所述式(I)的化合物选自式(Ia)和式(Ib)的化合物:
或其形式,其中
X为CH2、CH(C1-4烷基)、C(C1-4烷基)2、CH=CH、O、NR5或键;
A为芳基、杂芳基、杂环基或C9-10环烷基,
其中芳基选自苯基和萘基,其各自任选地被1、2、3或4个各自选自R1的取代基取代,
其中杂芳基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R1的取代基取代,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R2的取代基取代,和
其中C9-10环烷基为任选地被1、2、3、4或5个各自选自R2的取代基取代的饱和或部分不饱和二环环系;
B为杂环基,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或多环环系,其各自任选地被1、2、3、4或5个各自选自R4的取代基取代;
R1为卤素、羟基、氰基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、杂环基-C1-4烷氧基、苯基或苯基-C1-4烷氧基,
其中杂芳基为具有1、2或3个选自N、O和S的杂原子环成员的饱和单环或二环环系,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中苯基、杂芳基或杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R2为卤素、羟基、氰基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、氨基-羰基、羟基-C1-4烷基、C1-4烷氧基、C1-4烷氧基-羰基、C2-4烯基、C3-7环烷基或杂环基-C1-4烷基;
R3为卤素、羟基、硝基、氧代基、羟基-亚氨基、C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、苯基或苯基-C1-4烷氧基;
R4独立地选自卤素、C1-4烷基、羟基-C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基或羟基-C1-4烷基-氨基;和
R5为氢、C1-4烷基或羟基-C1-4烷基;
其中化合物的形式选自其前药、盐、水合物、溶剂化物、包合物、同位素体、外消旋体、对映异构体、非对映异构体、立体异构体、多晶型物和互变异构体形式。
在本文所述的特定方面,所述基因或所述RNA转录物是从选自以下的基因转录的:ABCA1、ABCA10、ABCB7、ABCB8、ABCC1、ABCC3、ABHD10、ABL2、ABLIM3、ACACA、ACADVL、ACAT2、ACTA2、ADAL、ADAM12、ADAM15、ADAM17、ADAM23、ADAM33、ADAMTS1、ADAMTS19、ADCY3、ADD1、ADGRG6、ADH6、ADHFE1、AFF2、AFF3、AGK、AGPAT3、AGPAT4、AGPS、AHCYL2、AHDC1、AHRR、AJUBA、AK021888、AK310472、AKAP1、AKAP3、AKAP8L、AKAP9、AKNA、AKT1、ALCAM、ALDH4A1、AMPD2、ANK1、ANK2、ANK3、ANKFY1、ANKHD1-EIF4EBP3、ANKRA2、ANKRD13C、ANKRD17、ANKRD33B、ANKRD36、ANKS6、ANP32A、ANXA11、ANXA6、AP2B1、AP4B1-AS1、APAF1、APIP、APLP2、APOA2、APP、APPL2、APTX、ARHGAP1、ARHGAP12、ARHGAP22、ARHGAP5、ARHGEF16、ARID1A、ARID2、ARID5B、ARL9、ARL15、ARL5B、ARMCX3、ARMCX6、ARSJ、ASAP1、ASIC1、ASL、ASNS、ASPH、ATAD2B、ATF6、ATF7IP、ATG5、ATG9A、ATMIN、ATP2A3、ATP2C1、ATXN1、ATXN3、AURKA、AXIN1、B3GALT2、B3GNT6、B4GALT2、BACE1、BAG2、BASP1、BC033281、BCAR3、BCL2L15、BCYRN1、BECN1、BEND6、BHMT2、BICD1、BIN1、BIN3、BIN3-IT1、BIRC3、BIRC6、BNC1、BNC2、BRCA1、BRCA2、BRD2、BRPF1、BSCL2、BTBD10、BTG2、BTN3A1、BZW1、C1QTNF9B-AS1、C1orf27、C1orf86、C10orf54、C11orf30、C11orf70、C11orf73、C11orf76、C11orf94、C12orf4、C12orf56、C14orf132、C17orf76-AS1、C19orf47、C2orf47、C3、C4orf27、C5orf24、C6orf48、C7orf31、C8orf34、C8orf44、C8orf44-SGK3、C8orf88、C9orf69、CA13、CA3、CAB39、CACNA2D2、CACNB1、CACNB4、CADM1、CADM2、CALU、CAMKK1、CAND2、CAPNS1、CASC3、CASP7、CASP8AP2、CAV1、CCAR1、CCDC77、CCDC79、CCDC88A、CCDC92、CCDC122、CCER2、CCNF、CCNL2、CCT6A、CD276、CD46、CDC25B、CDC40、CDC42BPA、CDCA7、CDH11、CDH13、CDH18、CDK11B、CDK16、CDKAL1、CDKN1C、CECR7、CELSR1、CEMIP、CENPI、CEP112、CEP162、CEP170、CEP192、CEP57、CEP68、CFH、CFLAR、CHD8、CHEK1、CHRM2、CIITA、CIZ1、CLDN23、CLIC1、CLK4、CLTA、CMAHP、CNGA4、CNOT1、CNRIP1、CNTD1、CMSS1、CNOT7、CNRIP1、CNTN1、COG1、COL1A1、COL11A1、COL12A1、COL14A1、COL15A1、COL5A1、COL5A3、COL6A1、COL6A6、COL8A1、COLEC12、COMP、COPS7B、CPA4、CPEB2、CPQ、CPSF4、CREB5、CRISPLD2、CRLF1、CRLS1、CRTAP、CRX、CRYBG3、CRYL1、CSDE1、CSNK1A1、CSNK1E、CSNK1G1、CTDSP2、CTNND1、CTRC、CUL2、CUL4A、CUX1、CYB5B、CYB5R2、CYBRD1、CYGB、CYP1B1、CYP51A1、DAAM1、DAB2、DACT1、DAGLB、DARS、DAXX、DCAF10、DCAF11、DCAF17、DCBLD2、DCLK1、DCN、DCUN1D4、DDAH1、DDAH2、DDHD2、DDIT4L、DDR1、DDX39B、DDX42、DDX50、DEGS1、DENND1A、DENND1B、DENND4A、DENND5A、DEPTOR、DET1、DFNB59、DGCR2、DGK1、DGKA、DHCR24、DHCR7、DHFR、DHX9、DIAPH1、DIAPH3、DIRAS3、DIS3L、DKFZp434M1735、DKK3、DLC1、DLG5、DLGAP4、DMD、DMXL1、DNAH8、DNAH11、DNAJA4、DNAJC13、DNAJC27、DNM2、DNMBP、DOCK1、DOCK11、DPP8、DSEL、DST、DSTN、DYNC1I1、DYRK1A、DZIP1L、EBF1、EEA1、EEF1A1、EFCAB14、EFEMP1、EGR1、EGR3、EHMT2、EIF2B3、EIF4G1、EIF4G2、EIF4G3、ELF2、ELMO2、ELN、ELP4、EMX2OS、ENAH、ENG、ENOX1、ENPP1、ENPP2、ENSA、EP300、EPN1、EPT1、ERC1、ERC2、ERCC1、ERCC8、ERGIC3、ERLIN2、ERRFI1、ESM1、ETV5、EVC、EVC2、EXO1、EXOC3、EXOC6B、EXTL2、EYA3、F2R、FADS1、FADS2、FAF1、FAIM、FAM111A、FAM126A、FAM13A、FAM160A1、FAM162A、FAM174A、FAM195B、FAM198B、FAM20A、FAM208B、FAM219A、FAM219B、FAM3C、FAM46B、FAM49B、FAM65A、FAM65B、FAM69B、FAP、FARP1、FBLN2、FBN2、FBXL16、FBXL6、FBXO9、FBXO10、FBXO18、FBXO31、FBXO34、FBXO9、FCHO1、FDFT1、FDPS、FER、FEZ1、FGD4、FGD5-AS1、FGFR2、FGFRL1、FGL2、FHOD3、FLII、FLNB、FLT1、FN1、FNBP1、FOCAD、FOS、FOSB、FOSL1、FOXK1、FOXM1、FRAS1、FSCN2、FUS、FYN、GABPB1、GAL3ST4、GALC、GALNT1、GALNT15、GAS7、GATA6、GBA2、GBGT1、GBP1、GCFC2、GLCE、GCNT1、GDF6、GGACT、GGCT、GHDC、GIGYF2、GJC1、GLCE、GMIP、GNA13、GNAQ、GNAS、GNG12、GNL3L、GOLGA2、GOLGA4、GOLGB1、GORASP1、GPR1、GPR183、GPR50、GPR89A、GPRC5A、GPRC5B、GPSM2、GREM1、GRK6、GRTP1、GSE1、GTF2H2B、GTSF1、GUCA1B、GULP1、GXYLT1、HAPLN1、HAPLN2、HAS2、HAS3、HAT1、HAUS3、HAUS6、HAVCR2、HDAC5、HDAC7、HDX、HECTD2-AS1、HEG1、HEPH、HEY1、HLA-A、HLA-E、HLTF、HMGA1、HMGA2、HMGB1、HMGCR、HMGN3-AS1、HMGCS1、HMGXB4、HOOK3、HOXB3、HMOX1、HNMT、HNRNPR、HNRNPUL1、HP1BP3、HPS1、HRH1、HSD17B12、HSD17B4、HSPA1L、HTATIP2、HTT、IARS、IDH1、IDI1、IFT57、IGDCC4、IGF2BP2、IGF2R、IGFBP3、IKBKAP、IL16、IL6ST、INA、INHBA、INO80、IPP4B、INPP5K、INSIG1、INTU、INVS、IQCE、IQCG、ITCH、ITGA11、ITGA8、ITGAV、ITGB5、ITGB8、ITIH1、ITM2C、ITPKA、ITSN1、IVD、KANSL3、KAT6B、KCNK2、KCNS1、KCNS2、KDM6A、KDSR、KIAA1033、KIAA1143、KIAA1199、KIAA1456、KIAA1462、KIAA1522、KIAA1524、KIAA1549、KIAA1715、KIAA1755、KIDINS220、KIF14、KIF2A、KIF21A、KIF3A、KIT、KLC1、KLC2、KLF17、KLF6、KLHL7、KLRG1、KMT2D、KRT7、KRT18、KRT19、KRT34、KRTAP1-1、KRTAP1-5、KRTAP2-3、L3MBTL2、LAMA2、LAMB1、LAMB2P1、LARP4、LARP7、LATS2、LDLR、LEMD3、LETM2、LGALS3、LGALS8、LGI2、LGR4、LHX9、LIMS1、LINC00341、LINC00472、LINC00570、LINC00578、LINC00607、LINC00657、LINC00678、LINC00702、LINC00886、LINC00961、LINC01011、LINC01118、LINC01204、LINCR-0002、LINGO2、LMAN2L、LMNA、LMO7、LMOD1、LOC400927、LONP1、LOX、LPHN1、LRBA、LRCH4、LRIG1、LRP4、LRP8、LRRC1、LRRC32、LRRC39、LRRC42、LRRC8A、LSAMP、LSS、LTBR、LUC7L2、LUM、LYPD1、LYRM1、LZTS2、MACROD2、MADD、MAFB、MAGED4、MAGED4B、MAMDC2、MAN1A2、MAN2A1、MAN2C1、MANEA、MAP4K4、MAPK10、MAPK13、MARCH7、MARCH8、MASP1、MB、MB21D2、MBD1、MBOAT7、MC4R、MCM10、MDM2、MDN1、MEAF6、MECP2、MED1、MED13L、MEDAG、MEF2D、MEGF6、MEIS2、MEMO1、MEPCE、MFGE8、MFN2、MIAT、MICAL2、MINPP1、MIR612、MKL1、MKLN1、MKNK2、MLLT4、MLLT10、MLST8、MMAB、MMP10、MMP24、MMS19、MMS22L、MN1、MORF4L1、MOXD1、MPPE1、MPZL1、MRPL3、MRPL39、MRPL45、MRPL55、MRPS28、MRVI1、MSANTD3、MSC、MSH2、MSH4、MSH6、MSL3、MSMO1、MSRB3、MTAP、MTERF3、MTERFD1、MTHFD1L、MTMR3、MTMR9、MTRR、MUM1、MVD、MVK、MXRA5、MYADM、MYB、MYCBP2、MYLK、MYO1D、MYO9B、MYOF、NA、NAA35、NAALADL2、NADK、NAE1、NAGS、NASP、NAV1、NAV2、NCOA1、NCOA3、NCOA4、NCSTN、NDNF、NEDD4、NELFA、NEO1、NEURL1B、NF2、NFASC、NFE2L1、NFX1、NGF、NGFR、NHLH1、NID1、NID2、NIPA1、NKX3-1、NLGN1、NLN、NOL10、NOMO3、NOTCH3、NOTUM、NOVA2、NOX4、NPEPPS、NRD1、NREP、NRG1、NRROS、NSUN4、NT5C2、NT5E、NTNG1、NUDT4、NUP153、NUP35、NUP50、NUPL1、NUSAP1、OCLN、ODF2、OLR1、OS9、OSBPL3、OSBPL6、OSBPL10、OSMR、OXCT1、OXCT2、P4HA1、P4HB、PABPC1、PAIP2B、PAK4、PAPD4、PARD3、PARN、PARP14、PARP4、PARVB、PAX6、PBLD、PBX3、PCBP2、PCBP4、PCCB、PCDH10、PCDHGB3、PCGF3、PCM1、PCMTD2、PCNXL2、PCSK9、PDE1C、PDE3A、PDE4A、PDE5A、PDE7A、PDGFD、PDGFRB、PDLIM7、PDS5B、PDXDC1、PDXDC2P、PEAR1、PELI1、PEPD、PEX5、PFKP、PHACTR3、PHF19、PHF8、PHRF1、PHTF2、PI4K2A、PIEZO1、PIGN、PIGU、PIK3C2B、PIK3CD、PIK3R1、PIKFYVE、PIM2、PITPNA、PITPNB、PITPNM1、PITPNM3、PLAU、PLEC、PLEK2、PLEKHA1、PLEKHA6、PLEKHB2、PLEKHH2、PLSCR1、PLSCR3、PLXNB2、PLXNC1、PMS1、PNISR、PODN、POLE3、POLN、POLR1A、POLR3D、POMT2、POSTN、POU2F1、PPAPDC1A、PPARA、PPARG、PPFIBP1、PPHLN1、PPIP5K1、PPIP5K2、PPM1E、PPP1R12A、PPP1R26、PPP3CA、PPP6R1、PPP6R2、PRKACB、PRKCA、PRKDC、PRKG1、PRMT1、PRNP、PRPF31、PRPH2、PRRG4、PRSS23、PRUNE2、PSMA4、PSMC1、PSMD6、PSMD6-AS2、PTCH1、PTGIS、PTK2B、PTPN14、PTX3、PUF60、PUS7、PVR、PXK、PXN、QKI、RAB23、RAB2B、RAB30、RAB34、RAB38、RAB44、RAD1、RAD9B、RAD23B、RAF1、RALB、RAP1A、RAP1GDS1、RAPGEF1、RARG、RARS、RARS2、RASIP1、RASSF8、RBBP8、RBCK1、RCOR3、RBFOX2、RBKS、RBM10、RCC1、RDX、RERE、RFTN1、RFWD2、RFX3-AS1、RGCC、RGL1、RGS10、RGS3、RIF1、RNF14、RNF19A、RNF130、RNF144A、RNF213、RNF38、RNFT1、ROR1、ROR2、RPA1、RPF2、RPL10、RPS10、RPS6KB2、RPS6KC1、RRBP1、RWDD4、SAMD4A、SAMD9、SAMD9L、SAR1A、SART3、SCAF4、SCAF8、SCARNA9、SCD、SCLT1、SCO1、SDCBP、SEC14L1、SEC22A、SEC24A、SEC24B、SEC61A1、SENP6、SEPT9、SERGEF、SERPINE2、SF1、SF3B3、SGIP1、SGK3、SGMS1、SGOL2、SGPL1、SH2B3、SH3RF1、SH3YL1、SHROOM3、SIGLEC10、SKA2、SKIL、SKP1、SLC12A2、SLC24A3、SLC25A16、SLC25A17、SLC34A3、SLC35F3、SLC39A3、SLC39A10、SLC4A4、SLC4A11、SLC41A1、SLC44A2、SLC46A2、SLC6A15、SLC7A6、SLC7A8、SLC7A11、SLC9A3、SLIT3、SMARCA4、SMARCC2、SMC4、SMC6、SMCHD1、SMG1、SMG1P3、SMN2、SMOX、SMPD4、SMTN、SMYD3、SMYD5、SNAP23、SNED1、SNHG16、SNX7、SNX14、SNX24、SNX7、SOCS2、SOCS6、SOGA2、SON、SORBS2、SORCS1、SORCS2、SOS2、SOX7、SPATA18、SPATA20、SPATA5、SPATS2、SPDYA、SPEF2、SPG20、SPIDR、SPINK5、SPRED2、SPRYD7、SQLE、SQRDL、SQSTM1、SRCAP、SREBF1、SREK1、SRGAP1、SRRM1、SRSF3、SSBP1、STAC2、STARD4、STAT1、STAT3、STAT4、STAU1、STC2、STEAP2、STK32B、STRAD8、STRIP1、STRN3、STRN4、STS、STX16、STXBP4、STXBP6、SULF1、SUPT20H、SVEP1、SYNE1、SYNE2、SYNGR2、SYNPO、SYNPO2、SYNPO2L、SYT15、SYTL2、TACC1、TAF2、TAGLN3、TANC2、TANGO6、TARBP1、TARS、TASP1、TBC1D15、TBCA、TBL1XR1、TBL2、TCF12、TCF4、TCF7L2、TEKT4P2、TENC1、TENM2、TEP1、TET1、TET3、TEX21P、TFCP2、TGFA、TGFB2、TGFB3、TGFBI、TGFBR1、TGFBRAP1、TGM2、THADA、THAP4、THBS2、THRB、TIAM1、TIMP2、TJAP1、TJP2、TLE3、TLK1、TMC3、TMEM67、TMEM102、TMEM119、TMEM134、TMEM154、TMEM189-UBE2V1、TMEM214、TMEM256-PLSCR3、TMEM47、TMEM50B、TMEM63A、TMX3、TNC、TNFAIP3、TNFAIP8L3、TNFRSF12A、TNFRSF14、TNIP1、TNKS1BP1、TNPO3、TNRC18P1、TNRC6A、TNS1、TNS3、TNXB、TOE1、TOMM40、TOMM5、TOPORS、TP53AIP1、TP53INP1、TPRG1、TRAF3、TRAK1、TRAPPC12、TRIB1、TRIM2、TRIM23、TRIM26、TRIM28、TRIM65、TRIM66、TRMT1L、TRPC4、TRPS1、TSC2、TSHZ1、TSHZ2、TSPAN11、TSPAN18、TSPAN2、TSPAN7、TSSK3、TTC7A、TTC7B、TUBB2C、TUBB3、TUBE1、TXNIP、TXNL1、TXNL4B、TXNRD1、TYW5、U2SURP、UBAP2L、UBE2D3、UBE2G2、UBE2L3、UBE2V1、UBN2、UBQLN4、UCHL5、UHMK1、UHRF1BP1L、UNC13B、UNC5B、URGCP、URGCP-MRPS24、USP19、USP7、USP27X、UVRAG、VANGL1、VARS2、VAV2、VCL、VDAC2、VIM-AS1、VIPAS39、VPS13A、VPS29、VPS41、VPS51、VSTM2L、VWA8、VWF、WDR19、WDR27、WDR37、WDR48、WDR90、WDR91、WHSC2、WIPF1、WISP1、WNK1、WNT5B、WNT10B、WSB1、WWTR1、XDH、XIAP、XRN2、YAP1、YDJC、YES1、YPEL5、YTHDF3、Z24749、ZAK、ZBTB10、ZBTB24、ZBTB26、ZBTB7A、ZC3H12C、ZC3H14、ZC3H18、ZCCHC5、ZCCHC8、ZCCHC11、ZEB1、ZEB2、ZFAND1、ZFAND5、ZFP82、ZHX3、ZMIZ1、ZMIZ1-AS1、ZMIZ2、ZMYM2、ZNF12、ZNF138、ZNF148、ZNF208、ZNF212、ZNF219、ZNF227、ZNF232、ZNF24、ZNF268、ZNF28、ZNF280D、ZNF281、ZNF335、ZNF350、ZNF37A、ZNF37BP、ZNF395、ZNF426、ZNF431、ZNF583、ZNF618、ZNF621、ZNF652、ZNF655、ZNF660、ZNF674、ZNF680、ZNF730、ZNF74、ZNF764、ZNF777、ZNF778、ZNF780A、ZNF7804A、ZNF79、ZNF827、ZNF836、ZNF837、ZNF839、ZNF91和ZSCAN25。
在本文所述的另一特定方面,所述基因或所述RNA转录物是从选自以下的基因转录的:ABCA1、ABCB7、ABCC1、ABHD10、ABL2、ABLIM3、ACACA、ACADVL、ACAT2、ADAM12、ADAM15、ADAM17、ADAM33、AFF2、AGK、AGPAT3、AGPS、AHCYL2、AHDC1、AHRR、AJUBA、AK021888、AK310472、AKAP1、AKAP9、AKNA、ALCAM、ALDH4A1、AMPD2、ANK2、ANKFY1、ANKHD1-EIF4EBP3、ANKRD17、ANKS6、ANP32A、ANXA11、ANXA6、AP2B1、APAF1、APLP2、APP、APPL2、APTX、ARHGAP22、ARID1A、ARID2、ARMCX3、ASAP1、ASL、ASNS、ASPH、ATAD2B、ATF7IP、ATG9A、ATMIN、ATP2C1、ATXN3、AURKA、AXIN1、B4GALT2、BACE1、BAG2、BASP1、BC033281、BCAR3、BEND6、BICD1、BIN1、BNC1、BRD2、BRPF1、BSCL2、BTBD10、BZW1、C11orf30、C11orf73、C17orf76-AS1、C4orf27、C5orf24、C6orf48、C9orf69、CAB39、CALU、CAMKK1、CAPNS1、CASC3、CASP8AP2、CAV1、CCAR1、CCDC77、CCDC88A、CCDC92、CCT6A、CD276、CD46、CDC25B、CDC40、CDC42BPA、CDCA7、CDH11、CDH13、CDK11B、CDK16、CDKAL1、CEP68、CFLAR、CHD8、CIZ1、CLIC1、CLK4、CNOT1、COG1、COL12A1、COL1A1、COL6A1、COPS7B、CPEB2、CREB5、CRLS1、CRTAP、CSDE1、CSNK1A1、CTDSP2、CTNND1、CUL2、CUL4A、CUX1、CYB5B、CYBRD1、CYP51A1、DAB2、DACT1、DARS、DAXX、DCAF10、DCAF11、DCBLD2、DCUN1D4、DDAH1、DDAH2、DDHD2、DDR1、DDX39B、DDX42、DENND1A、DENND1B、DENND5A、DGCR2、DGKA、DHCR24、DHCR7、DHFR、DHX9、DIAPH1、DIAPH3、DIS3L、DKFZp434M1735、DKK3、DLC1、DNM2、DOCK1、DPP8、DSEL、DST、DSTN、EBF1、EEA1、EEF1A1、EFCAB14、EGR1、EHMT2、EIF2B3、EIF4G1、EIF4G2、EIF4G3、ELF2、ENG、ENPP2、ENSA、EPN1、EPT1、ERC1、ERGIC3、ETV5、EXO1、EXTL2、EYA3、FADS1、FADS2、FAF1、FAM111A、FAM198B、FAM219A、FAM219B、FAM3C、FAM65A、FBXO10、FBXO18、FBXO31、FBXO34、FBXO9、FDFT1、FDPS、FER、FEZ1、FGD5-AS1、FGFRL1、FHOD3、FLII、FLNB、FN1、FNBP1、FOCAD、FOS、FOSB、FOSL1、FOXK1、FOXM1、FUS、FYN、GABPB1、GALC、GALNT1、GAS7、GBA2、GCFC2、GGCT、GHDC、GIGYF2、GJC1、GMIP、GNA13、GNAS、GNL3L、GOLGA2、GOLGA4、GOLGB1、GORASP1、GPR1、GPR89A、GPSM2、GREM1、GRK6、GSE1、GTF2H2B、HAS2、HAT1、HAUS3、HAUS6、HDAC7、HEG1、HLA-A、HLA-E、HLTF、HMGA1、HMGB1、HMGCR、HMGCS1、HMOX1、HNRNPR、HNRNPUL1、HP1BP3、HRH1、HSD17B12、HSD17B4、HTT、IARS、IDH1、IDI1、IGF2BP2、IL6ST、INHBA、INSIG1、IQCE、ITGAV、ITGB5、ITM2C、ITSN1、KANSL3、KCNK2、KIAA1033、KIAA1143、KIAA1199、KIAA1522、KIAA1524、KIAA1549、KIAA1715、KIF14、KIF2A、KIF3A、KLC1、KLC2、KLF6、KLHL7、KRT18、KRT19、KRT34、KRTAP2-3、LAMA2、LAMB1、LARP4、LARP7、LATS2、LDLR、LEMD3、LGALS8、LIMS1、LINC00341、LINC00657、LMAN2L、LMO7、LONP1、LOX、LRCH4、LRIG1、LRP8、LRRC8A、LSS、LTBR、LUC7L2、LZTS2、MADD、MAGED4、MAGED4B、MAN1A2、MAP4K4、MBD1、MBOAT7、MDM2、MED1、MEDAG、MEF2D、MEIS2、MEMO1、MEPCE、MFGE8、MICAL2、MINPP1、MKL1、MKLN1、MKNK2、MLLT4、MLST8、MMAB、MMS19、MMS22L、MPPE1、MPZL1、MRPL3、MSANTD3、MSC、MSH2、MSH6、MSL3、MSMO1、MSRB3、MTAP、MTERFD1、MTHFD1L、MTMR9、MTRR、MUM1、MVD、MVK、MYADM、MYLK、MYO1D、MYO9B、MYOF、NAA35、NADK、NASP、NAV1、NAV2、NCOA1、NCOA3、NCOA4、NCSTN、NELFA、NEO1、NEURL1B、NF2、NFE2L1、NFX1、NID1、NID2、NIPA1、NKX3-1、NOL10、NOMO3、NPEPPS、NRD1、NREP、NRG1、NSUN4、NT5C2、NT5E、NTNG1、NUDT4、NUP153、NUP35、NUP50、NUPL1、NUSAP1、ODF2、OS9、OSBPL6、OSMR、P4HA1、P4HB、PABPC1、PAK4、PAPD4、PARD3、PARN、PARP14、PARP4、PARVB、PCBP2、PCBP4、PCDHGB3、PCGF3、PCM1、PCMTD2、PCNXL2、PCSK9、PDE4A、PDE7A、PDLIM7、PDXDC1、PEPD、PEX5、PFKP、PHF19、PHF8、PHRF1、PHTF2、PI4K2A、PIEZO1、PIGU、PIK3C2B、PITPNA、PITPNB、PITPNM1、PLAU、PLEC、PLEKHB2、PLSCR3、PLXNB2、PLXNC1、PMS1、POLE3、POLR3D、POSTN、POU2F1、PPAPDC1A、PPARA、PPHLN1、PPIP5K1、PPP1R12A、PPP6R1、PPP6R2、PRKACB、PRKDC、PRMT1、PRNP、PRSS23、PSMA4、PSMC1、PSMD6、PTK2B、PTPN14、PUF60、PUS7、PVR、PXN、QKI、RAB23、RAB2B、RAB34、RAD1、RAD23B、RALB、RAP1A、RAP1GDS1、RARG、RASSF8、RBCK1、RBFOX2、RBM10、RCC1、RFTN1、RFWD2、RGS10、RGS3、RIF1、RNF14、RNF19A、RNF38、RNFT1、RPL10、RPS6KC1、RRBP1、RWDD4、SAMD9、SAMD9L、SAR1A、SART3、SCAF4、SCAF8、SCD、SCLT1、SCO1、SDCBP、SEC14L1、SEC22A、SEC24B、SEC61A1、SEPT9、SERPINE2、SF1、SGOL2、SH3RF1、SKIL、SLC25A17、SLC39A3、SLC41A1、SLC4A4、SLC7A6、SLC7A8、SMARCA4、SMARCC2、SMC4、SMC6、SMCHD1、SMG1、SMN2、SMPD4、SMYD3、SMYD5、SNAP23、SNHG16、SNX14、SOCS2、SON、SOS2、SPATA20、SPATS2、SPG20、SPRED2、SQLE、SQRDL、SQSTM1、SRCAP、SREBF1、SREK1、SRSF3、STARD4、STAT1、STAT3、STAU1、STC2、STEAP2、STRIP1、STRN3、STX16、SUPT20H、SYNE1、SYNE2、SYT15、SYTL2、TACC1、TAF2、TANC2、TARBP1、TARS、TBC1D15、TBL2、TCF7L2、TENC1、TENM2、TEP1、TET3、TFCP2、TGFBI、TGFBR1、TGFBRAP1、THADA、THAP4、THRB、TIMP2、TJP2、TLE3、TLK1、TMEM154、TMEM47、TMEM63A、TNC、TNFAIP3、TNFRSF12A、TNIP1、TNKS1BP1、TNPO3、TNS1、TNS3、TOE1、TOMM40、TOMM5、TOPORS、TP53INP1、TRAF3、TRAK1、TRAPPC12、TRIB1、TRIM2、TRIM23、TRIM26、TRIM28、TRIM65、TRMT1L、TRPS1、TSC2、TSHZ1、TSPAN2、TTC7A、TUBB2C、TUBB3、TXNL1、TXNRD1、U2SURP、UBAP2L、UBE2G2、UBE2V1、UBQLN4、UCHL5、UHMK1、UHRF1BP1L、UNC5B、USP19、USP7、VANGL1、VARS2、VCL、VIPAS39、VPS13A、VPS29、VPS51、VWA8、WDR19、WDR37、WDR48、WIPF1、WNT5B、WSB1、WWTR1、XIAP、XRN2、YAP1、YES1、YPEL5、YTHDF3、Z24749、ZAK、ZBTB10、ZBTB24、ZBTB7A、ZC3H12C、ZC3H14、ZC3H18、ZCCHC11、ZEB1、ZEB2、ZFAND1、ZFAND5、ZHX3、ZMIZ1、ZMYM2、ZNF12、ZNF148、ZNF219、ZNF227、ZNF24、ZNF268、ZNF28、ZNF281、ZNF335、ZNF37A、ZNF37BP、ZNF395、ZNF583、ZNF621、ZNF652、ZNF655、ZNF674、ZNF74、ZNF764、ZNF778、ZNF780A、ZNF827、ZNF839和ZNF91。
在本文所述的另一特定方面,所述基因或所述RNA转录物是从选自以下的基因转录的:ABCB8、ANKRD36、APLP2、ARHGAP12、ARMCX6、ASAP1、ATG5、AXIN1、BIRC6、C1orf86、CDC42BPA、CLTA、DYRK1A、ERGIC3、FBXL6、FOXM1、GGCT、KAT6B、KDM6A、KIF3A、KMT2D、LARP7、LYRM1、MADD、MAN2C1、MRPL55、MYCBP2、MYO9B、PNISR、RAP1A、RAPGEF1、SENP6、SH3YL1、SLC25A17、SMN2、SREK1、STRN3、TAF2、TMEM134、VPS29、ZFAND1和ZNF431。
在本文所述的另一特定方面,所述基因或所述RNA转录物是从选自以下的基因转录的:ABCB8、ANKRD36、ARHGAP12、ARMCX6、ATG5、BIRC6、C1orf86、CLTA、DYRK1A、FBXL6、KAT6B、KDM6A、KMT2D、LYRM1、MAN2C1、MRPL55、MYCBP2、PNISR、RAPGEF1、SENP6、SH3YL1、TMEM134和ZNF431。
在本文所述的另一特定方面,所述基因或所述RNA转录物是从选自以下的基因转录的:ABCA10、ABCC1、ACTA2、ADAL、ADAM12、ADAMTS1、ADAMTS5、ADD1、ADGRG6、ADH6、ADHFE1、AFF2、AFF3、AGK、AGPS、AKAP3、ANK1、ANK2、ANK3、ANKRD33B、ANXA11、ANXA6、AP4B1-AS1、ARHGEF16、ARID5B、ARL9、ARMCX3、ASAP1、ASIC1、ATP2A3、B3GALT2、B3GNT6、BCL2L15、BCYRN1、BIN3-IT1、BIRC3、BTG2、C10orf54、C11orf70、C11orf73、C11orf94、C12orf56、C19orf47、C3、C4orf27、C7orf31、C8orf34、CA13、CA3、CACNA2D2、CACNB1、CADM1、CAND2、CCDC79、CCER2、CCNF、CDCA7、CDKAL1、CELSR1、CEMIP、CEP170、CFH、CIITA、CLDN23、CMAHP、CNGA4、CNTD1、COL11A1、COL12A1、COL14A1、COL15A1、COL5A1、COL5A3、COL6A6、COL8A1、COLEC12、COMP、CPA4、CPQ、CRISPLD2、CRLF1、CRYL1、CUX1、CYB5B、CYB5R2、CYGB、CYP1B1、DCLK1、DCN、DDIT4L、DDX42、DDX50、DEGS1、DENND1A、DENND5A、DEPTOR、DFNB59、DGKA、DHFR、DIAPH3、DIRAS3、DIS3L、DLG5、DNAH8、DNAJC27、DOCK1、DOCK11、DYNC1I1、DZIP1L、EBF1、EFEMP1、EGR3、EIF2B3、ELN、ELP4、EMX2OS、ENPP1、ERCC8、ESM1、EVC2、F2R、FAM160A1、FAM198B、FAM20A、FAM46B、FAM65B、FAP、FARP1、FBLN2、FBN2、FBXO9、FCHO1、FER、FGFR2、FGL2、FLT1、FRAS1、FSCN2、GAL3ST4、GALC、GALNT15、GATA6、GBGT1、GCNT1、GDF6、GNAQ、GOLGB1、GPR183、GPR50、GPRC5A、GPRC5B、GRTP1、GUCA1B、GXYLT1、HAPLN1、HAPLN2、HAS3、HAVCR2、HDAC5、HECTD2-AS1、HEPH、HEY1、HLTF、HMGN3-AS1、HMOX1、HOOK3、HSD17B12、HSPA1L、HTATIP2、HTT、IGDCC4、IGF2R、IGFBP3、IL16、INA、INTU、IQCG、ITGA11、ITGA8、ITGB8、ITIH1、ITPKA、KCNS1、KCNS2、KDM6A、KDSR、KIAA1456、KIAA1462、KIAA1524、KIAA1715、KIAA1755、KIT、KLF17、KLRG1、KRT7、KRTAP1-1、KRTAP1-5、L3MBTL2、LAMB2P1、LGI2、LGR4、LHX9、LINC00472、LINC00570、LINC00578、LINC00607、LINC00678、LINC00702、LINC00886、LINC00961、LINC01011、LINC01118、LINC01204、LMOD1、LRBA、LRP4、LRRC32、LRRC39、LSAMP、LUM、LYPD1、LYRM1、MAFB、MAMDC2、MAN1A2、MAN2A1、MAPK13、MASP1、MB、MC4R、MEDAG、MEGF6、MEMO1、MIAT、MIR612、MLLT10、MMP10、MMP24、MMS19、MN1、MOXD1、MRVI1、MSH4、MTERF3、MXRA5、MYO1D、NA、NAALADL2、NAE1、NAGS、NDNF、NEURL1B、NGFR、NHLH1、NLN、NOTCH3、NOTUM、NOVA2、NOX4、NRROS、NTNG1、OCLN、OLR1、OSBPL10、OXCT2、PAIP2B、PAPD4、PBLD、PCM1、PDE1C、PDE5A、PDGFD、PDGFRB、PDS5B、PDXDC1、PEAR1、PEPD、PHACTR3、PI4K2B、PIK3R1、PIM2、PITPNB、PITPNM3、PLAU、PLEK2、PLEKHA6、PLEKHH2、PLXNC1、PMS1、PODN、POLN、POLR1A、POSTN、PPM1E、PPP3CA、PRKCA、PRKDC、PRKG1、PRPH2、PRRG4、PRUNE2、PSMD6-AS2、PTGIS、PTX3、RAB30、RAB38、RAB44、RAD9B、RARS、RBBP8、RBKS、RCC1、RDX、RFWD2、RFX3-AS1、RGCC、RNFT1、ROR1、ROR2、RWDD4、SCARNA9、SCO1、SEC22A、SHROOM3、SIGLEC10、SLC24A3、SLC35F3、SLC39A10、SLC46A2、SLC4A11、SLC6A15、SLC7A11、SLC9A3、SLIT3、SMG1P3、SMTN、SMYD3、SNED1、SORBS2、SORCS2、SOX7、SPDYA、SPEF2、SQRDL、STAC2、STAT1、STAT4、STEAP2、STK32B、STRN4、STS、STXBP6、SULF1、SVEP1、SYNGR2、SYNPO、SYNPO2、SYNPO2L、TAGLN3、TANGO6、TARBP1、TEX21P、TGFA、TGFB2、TGFB3、TGM2、THADA、THBS2、THRB、TMEM102、TMEM119、TMEM256-PLSCR3、TMEM50B、TNC、TNFAIP8L3、TNFRSF14、TNRC18P1、TNS3、TNXB、TP53AIP1、TPRG1、TRAF3、TRIM66、TRPC4、TSHZ2、TSPAN11、TSPAN18、TSPAN7、TSSK3、TXNIP、UNC5B、USP27X、UVRAG、VIM-AS1、VPS41、VSTM2L、VWA8、VWF、WDR91、WISP1、WNT10B、XRN2、YDJC、ZBTB26、ZCCHC5、ZFP82、ZMIZ1-AS1、ZNF212、ZNF350、ZNF660、ZNF79和ZNF837。
在本文所述的另一特定方面,所述基因或所述RNA转录物是从选自以下的基因转录的:ABCA10、ACTA2、ADAL、ADAMTS1、ADAMTS5、ADD1、ADGRG6、ADH6、ADHFE1、AFF3、AKAP3、ANK1、ANK3、ANKRD33B、AP4B1-AS1、ARHGEF16、ARID5B、ARL9、ASIC1、ATP2A3、B3GALT2、B3GNT6、BCL2L15、BCYRN1、BIN3-IT1、BIRC3、BTG2、C10orf54、C11orf70、C11orf94、C12orf56、C19orf47、C3、C7orf31、C8orf34、CA13、CA3、CACNA2D2、CACNB1、CADM1、CAND2、CCDC79、CCER2、CCNF、CELSR1、CEMIP、CEP170、CFH、CIITA、CLDN23、CMAHP、CNGA4、CNTD1、COL11A1、COL14A1、COL15A1、COL5A1、COL5A3、COL6A6、COL8A1、COLEC12、COMP、CPA4、CPQ、CRISPLD2、CRLF1、CRYL1、CYB5R2、CYGB、CYP1B1、DCLK1、DCN、DDIT4L、DDX50、DEGS1、DEPTOR、DFNB59、DIRAS3、DLG5、DNAH8、DNAJC27、DOCK11、DYNC1I1、DZIP1L、EFEMP1、EGR3、ELN、ELP4、EMX2OS、ENPP1、ERCC8、ESM1、EVC2、F2R、FAM160A1、FAM20A、FAM46B、FAM65B、FAP、FARP1、FBLN2、FBN2、FBXO9、FCHO1、FGFR2、FGL2、FLT1、FRAS1、FSCN2、GAL3ST4、GALNT15、GATA6、GBGT1、GCNT1、GDF6、GNAQ、GPR183、GPR50、GPRC5A、GPRC5B、GRTP1、GUCA1B、GXYLT1、HAPLN1、HAPLN2、HAS3、HAVCR2、HDAC5、HECTD2-AS1、HEPH、HEY1、HMGN3-AS1、HOOK3、HSPA1L、HTATIP2、IGDCC4、IGF2R、IGFBP3、IL16、INA、INTU、IQCG、ITGA11、ITGA8、ITGB8、ITIH1、ITPKA、KCNS1、KCNS2、KDM6A、KDSR、KIAA1456、KIAA1462、KIAA1755、KIT、KLF17、KLRG1、KRT7、KRTAP1-1、KRTAP1-5、L3MBTL2、LAMB2P1、LGI2、LGR4、LHX9、LINC00472、LINC00570、LINC00578、LINC00607、LINC00678、LINC00702、LINC00886、LINC00961、LINC01011、LINC01118、LINC01204、LMOD1、LRBA、LRP4、LRRC32、LRRC39、LSAMP、LUM、LYPD1、MAFB、MAMDC2、MAN2A1、MAPK13、MASP1、MB、MC4R、MEGF6、MIAT、MIR612、MLLT10、MMP10、MMP24、MN1、MOXD1、MRVI1、MSH4、MTERF3、MXRA5、NA、NAALADL2、NAE1、NAGS、NDNF、NGFR、NHLH1、NLN、NOTCH3、NOTUM、NOVA2、NOX4、NRROS、OCLN、OLR1、OSBPL10、OXCT2、PAIP2B、PBLD、PDE1C、PDE5A、PDGFD、PDGFRB、PDS5B、PEAR1、PHACTR3、PI4K2B、PIK3R1、PIM2、PITPNM3、PLEK2、PLEKHA6、PLEKHH2、PODN、POLN、POLR1A、PPM1E、PPP3CA、PRKCA、PRKG1、PRPH2、PRRG4、PRUNE2、PSMD6-AS2、PTGIS、PTX3、RAB30、RAB38、RAB44、RAD9B、RARS、RBBP8、RBKS、RDX、RFX3-AS1、RGCC、ROR1、ROR2、SCARNA9、SHROOM3、SIGLEC10、SLC24A3、SLC35F3、SLC39A10、SLC46A2、SLC4A11、SLC6A15、SLC7A11、SLC9A3、SLIT3、SMG1P3、SMTN、SNED1、SORBS2、SORCS2、SOX7、SPDYA、SPEF2、STAC2、STAT4、STK32B、STRN4、STS、STXBP6、SULF1、SVEP1、SYNGR2、SYNPO、SYNPO2、SYNPO2L、TAGLN3、TANGO6、TEX21P、TGFA、TGFB2、TGFB3、TGM2、THBS2、TMEM102、TMEM119、TMEM256-PLSCR3、TMEM50B、TNFAIP8L3、TNFRSF14、TNRC18P1、TNXB、TP53AIP1、TPRG1、TRIM66、TRPC4、TSHZ2、TSPAN11、TSPAN18、TSPAN7、TSSK3、TXNIP、USP27X、UVRAG、VIM-AS1、VPS41、VSTM2L、VWF、WDR91、WISP1、WNT10B、YDJC、ZBTB26、ZCCHC5、ZFP82、ZMIZ1-AS1、ZNF212、ZNF350、ZNF660、ZNF79和ZNF837。
在本文所述的另一特定方面,所述基因或所述RNA转录物是从选自以下的基因转录的:ABCB8、ABCC3、ADAM17、ADCY3、AGPAT4、ANKRA2、ANXA11、APIP、APLP2、ARHGAP1、ARL15、ASAP1、ASPH、ATAD2B、ATXN1、AXIN1、BECN1、BHMT2、BICD1、BTN3A1、C11orf30、C11orf73、C12orf4、C14orf132、C8orf44、C8orf44-SGK3、C8orf88、CASC3、CASP7、CCDC122、CDH13、CECR7、CENPI、CEP112、CEP192、CHEK1、CMAHP、CNRIP1、COPS7B、CPSF4、CRISPLD2、CRYBG3、CSNK1E、CSNK1G1、DAGLB、DCAF17、DCUN1D4、DDX42、DENND1A、DENND5A、DGKA、DHFR、DIAPH3、DLGAP4、DNAJC13、DNMBP、DOCK1、DYRK1A、EIF2B3、ENAH、ENOX1、EP300、ERC1、ERCC1、ERGIC3、ERLIN2、ERRFI1、EVC、FAF1、FAIM、FAM126A、FAM13A、FAM162A、FAM174A、FAM198B、FBN2、FER、FHOD3、FOCAD、GALC、GCFC2、GGACT、GGCT、GLCE、GOLGA4、GOLGB1、GPSM2、GULP1、GXYLT1、HAT1、HDX、HLTF、HMGA2、HNMT、HPS1、HSD17B12、HSD17B4、HTT、IFT57、INPP5K、IVD、KDM6A、KIAA1524、KIAA1715、LETM2、LOC400927、LRRC42、LUC7L3、LYRM1、MADD、MB21D2、MCM10、MED13L、MEDAG、MEMO1、MFN2、MMS19、MRPL45、MRPS28、MTERF3、MYCBP2、MYLK、MYOF、NGF、NREP、NSUN4、NT5C2、OSMR、OXCT1、PAPD4、PCM1、PDE7A、PDS5B、PDXDC1、PIGN、PIK3CD、PIK3R1、PIKFYVE、PITPNB、PLEKHA1、PLSCR1、PMS1、POMT2、PPARG、PPHLN1、PPIP5K2、PPP1R26、PRPF31、PRSS23、PRUNE2、PSMA4、PXK、RAF1、RAP1A、RAPGEF1、RARS2、RBKS、RERE、RFWD2、RNFT1、RPA1、RPS10、RPS6KB2、SAMD4A、SAR1A、SCO1、SEC24A、SENP6、SERGEF、SGK3、SH3YL1、SKA2、SLC12A2、SLC25A17、SLC44A2、SMYD3、SNAP23、SNHG16、SNX7、SOS2、SPATA18、SPATA5、SPIDR、SPRYD7、SRGAP1、SRRM1、STAT1、STRN3、STXBP6、SUPT20H、TAF2、TASP1、TBC1D15、TCF12、TCF4、TIAM1、TJP2、TMC3、TMEM189-UBE2V1、TMEM214、TNRC6A、TNS3、TOE1、TRAF3、TRIM65、TSPAN2、TTC7B、TUBE1、TYW5、UBAP2L、UBE2V1、URGCP、VAV2、VPS29、WDR27、WDR37、WDR91、WNK1、XRN2、ZCCHC8、ZFP82、ZNF138、ZNF232、ZNF37BP和ZNF680。
在本文所述的另一特定方面,所述基因或所述RNA转录物是从选自以下的基因转录的:ABCB8、ABCC3、ADCY3、AGPAT4、ANKRA2、APIP、ARHGAP1、ARL15、ATXN1、BECN1、BHMT2、BTN3A1、C12orf4、C14orf132、C8orf44、C8orf44-SGK3、C8orf88、CASP7、CCDC122、CECR7、CENPI、CEP112、CEP192、CHEK1、CMAHP、CNRIP1、CPSF4、CRISPLD2、CRYBG3、CSNK1E、CSNK1G1、DAGLB、DCAF17、DLGAP4、DNAJC13、DNMBP、DYRK1A、ENAH、EP300、ERCC1、ERLIN2、ERRFI1、EVC、FAIM、FAM126A、FAM13A、FAM162A、FAM174A、FBN2、GGACT、GLCE、GULP1、GXYLT1、HDX、HMGA2、HNMT、HPS1、IFT57、INPP5K、IVD、KDM6A、LETM2、LOC400927、LRRC42、LYRM1、MB21D2、MCM10、MED13L、MFN2、MRPL45、MRPS28、MTERF3、MYCBP2、NGF、OXCT1、PDS5B、PIGN、PIK3CD、PIK3R1、PIKFYVE、PLEKHA1、PLSCR1、POMT2、PPARG、PPIP5K2、PPP1R26、PRPF31、PRUNE2、PXK、RAF1、RAPGEF1、RARS2、RBKS、RERE、RPA1、RPS10、RPS6KB2、SAMD4A、SEC24A、SENP6、SERGEF、SGK3、SH3YL1、SKA2、SLC12A2、SLC44A2、SNX7、SPATA18、SPATA5、SPIDR、SPRYD7、SRGAP1、SRRM1、STXBP6、TASP1、TCF12、TCF4、TIAM1、TMC3、TMEM189-UBE2V1、TMEM214、TNRC6A、TTC7B、TUBE1、TYW5、URGCP、VAV2、WDR27、WDR91、WNK1、ZCCHC8、ZFP82、ZNF138、ZNF232和ZNF680。
在本文所述的另一特定方面,所述基因或所述RNA转录物是从选自以下的基因转录的:ABHD10、ADAL、ADAM17、ADAM23、ADAMTS19、AGPAT4、AGPS、AKAP8L、AKT1、ANKRD13C、ANXA11、APIP、APPL2、ARHGAP1、ARHGAP5、ARL15、ARL5B、ARSJ、ASAP1、ATF6、BECN1、BHMT2、BIN3、BNC2、BTBD10、C1QTNF9B-AS1、C1orf27、C11orf30、C11orf73、C11orf76、C12orf4、C2orf47、CACNB1、CACNB4、CADM2、CCNL2、CDH18、CENPI、CEP162、CEP170、CEP192、CEP57、CHEK1、CHRM2、CMAHP、CMSS1、CNOT7、CNRIP1、CNTN1、COPS7B、CRISPLD2、CRYBG3、CUX1、DAAM1、DCAF17、DCUN1D4、DDX42、DENND1A、DENND4A、DENND5A、DET1、DGK1、DHFR、DIAPH3、DLG5、DMXL1、DNAJA4、DNMBP、DYRK1A、DZIP1L、ELMO2、ENAH、ENOX1、EP300、ERC1、ERC2、EVC、EXOC3、EXOC6B、FAM162A、FAM174A、FAM195B、FAM208B、FAM49B、FAM69B、FBN2、FBXL16、FBXO9、FGD4、FHOD3、GALC、GBP1、GLCE、GNG12、GOLGB1、GTSF1、GXYLT1、HDAC5、HDX、HMGXB4、HOXB3、HSD17B4、HTT、IFT57、IKBKAP、INO80、IPP4B、INVS、ITCH、IVD、KDM6A、KDSR、KIAA1524、KIAA1715、KIDINS220、KIF21A、L3MBTL2、LGALS3、LINCR-0002、LINGO2、LOC400927、LPHN1、LRRC1、LRRC42、LYRM1、MACROD2、MANEA、MAPK10、MARCH7、MARCH8、MDN1、MEAF6、MEMO1、MFN2、MLLT10、MMS19、MORF4L1、MRPL39、MRPL45、MRPS28、MTMR3、MYB、MYCBP2、MYLK、NEDD4、NFASC、NGF、NIPA1、NLGN1、NLN、NREP、NSUN4、NUPL1、OSBPL3、PAPD4、PBX3、PCDH10、PDE3A、PDE7A、PDXDC1、PDXDC2P、PELI1、PIGN、PITPNB、PMS1、PNISR、POMT2、PPARG、PPFIBP1、PRPF31、PSMA4、PXK、RAB23、RAF1、RAPGEF1、RASIP1、RBBP8、RCOR3、RERE、RGL1、RNF130、RNF144A、RNF213、RPF2、RPS10、SAMD4A、SCO1、SENP6、SF3B3、SGIP1、SGMS1、SGPL1、SH2B3、SKP1、SLC12A2、SLC25A16、SLC25A17、SMOX、SNAP23、SNX24、SNX7、SOCS6、SOGA2、SORCS1、SPIDR、SPRYD7、SREK1、SSBP1、STRAD8、STXBP4、STXBP6、SUPT20H、TAF2、TARBP1、TASP1、TBCA、TBL1XR1、TCF4、TEKT4P2、TET1、TIAM1、TJAP1、TJP2、TMEM214、TMX3、TNRC6A、TRAF3、TRIM65、TSPAN7、TXNL4B、UBE2D3、UBE2L3、UBN2、UNC13B、URGCP-MRPS24、UVRAG、VDAC2、WDR27、WDR90、WHSC2、WNK1、XRN2、ZFP82、ZMIZ2、ZNF138、ZNF208、ZNF212、ZNF280D、ZNF350、ZNF37BP、ZNF426、ZNF618、ZNF680、ZNF730、ZNF777、ZNF7804A、ZNF836和ZSCAN25。
在本文所述的另一特定方面,所述基因或所述RNA转录物是从选自以下的基因转录的:APOA2、ASAP1、BRCA1、BRCA2、CDKN1C、CRX、CTRC、DENND5A、DIAPH3、DMD、DNAH11、EIF2B3、GALC、HPS1、HTT、IKBKAP、KIAA1524、LMNA、MECP2、PAPD4、PAX6、PCCB、PITPNB、PTCH1、SLC34A3、SMN2、SPINK5、SREK1、TMEM67、VWF、XDH和XRN2。
在本文所述的另一特定方面,所述基因或所述RNA转录物是从选自以下的基因转录的:ABCA1、ABCA10、ABCB7、ABCB8、ABCC1、ABCC3、ABL2、ABLIM3、ACACA、ACADVL、ACAT2、ACTA2、ADAL、ADAM15、ADAM17、ADAM23、ADAM33、ADAMTS1、ADAMTS19、ADCY3、ADD1、ADGRG6、ADH6、ADHFE1、AFF2、AFF3、AGK、AGPAT3、AGPAT4、AGPS、AHCYL2、AHDC1、AHRR、AJUBA、AK021888、AK310472、AKAP1、AKAP3、AKAP8L、AKAP9、AKNA、ALCAM、ALDH4A1、AMPD2、ANK1、ANK2、ANK3、ANKFY1、ANKHD1-EIF4EBP3、ANKRA2、ANKRD13C、ANKRD17、ANKRD33B、ANKRD36、ANKS6、ANP32A、ANXA6、AP2B1、AP4B1-AS1、APAF1、APIP、APOA2、APP、APTX、ARHGAP1、ARHGAP12、ARHGAP22、ARHGAP5、ARHGEF16、ARID1A、ARID2、ARID5B、ARL9、ARL15、ARL5B、ARMCX3、ARSJ、ASAP1、ASIC1、ASL、ASNS、ASPH、ATAD2B、ATF6、ATF7IP、ATG9A、ATMIN、ATP2A3、ATP2C1、ATXN1、ATXN3、AURKA、B3GALT2、B3GNT6、B4GALT2、BACE1、BAG2、BASP1、BC033281、BCAR3、BCL2L15、BCYRN1、BECN1、BEND6、BHMT2、BICD1、BIN1、BIN3、BIN3-IT1、BIRC3、BIRC6、BNC1、BNC2、BRCA1、BRCA2、BRD2、BRPF1、BSCL2、BTBD10、BTG2、BTN3A1、BZW1、C1QTNF9B-AS1、C1orf27、C1orf86、C10orf54、C11orf30、C11orf70、C11orf73、C11orf76、C11orf94、C12orf4、C12orf56、C14orf132、C17orf76-AS1、C19orf47、C2orf47、C3、C4orf27、C5orf24、C6orf48、C7orf31、C8orf34、C8orf44、C8orf44-SGK3、C8orf88、C9orf69、CA13、CA3、CAB39、CACNA2D2、CACNB1、CACNB4、CADM1、CADM2、CALU、CAMKK1、CAND2、CAPNS1、CASC3、CASP7、CASP8AP2、CAV1、CCAR1、CCDC77、CCDC79、CCDC88A、CCDC92、CCDC122、CCER2、CCNF、CCNL2、CCT6A、CD276、CD46、CDC25B、CDC40、CDC42BPA、CDCA7、CDH11、CDH13、CDH18、CDK11B、CDK16、CDKAL1、CDKN1C、CECR7、CELSR1、CEMIP、CENPI、CEP112、CEP162、CEP170、CEP192、CEP68、CFH、CFLAR、CHD8、CHEK1、CHRM2、CIITA、CIZ1、CLDN23、CLIC1、CLK4、CLTA、CMAHP、CNGA4、CNOT1、CNRIP1、CNTD1、CMSS1、CNOT7、CNRIP1、CNTN1、COG1、COL1A1、COL11A1、COL12A1、COL14A1、COL15A1、COL5A1、COL5A3、COL6A1、COL6A6、COL8A1、COLEC12、COMP、COPS7B、CPA4、CPEB2、CPQ、CPSF4、CREB5、CRISPLD2、CRLF1、CRLS1、CRTAP、CRX、CRYBG3、CRYL1、CSDE1、CSNK1A1、CSNK1E、CSNK1G1、CTDSP2、CTNND1、CTRC、CUL2、CUL4A、CUX1、CYB5B、CYB5R2、CYBRD1、CYGB、CYP1B1、CYP51A1、DAAM1、DAB2、DACT1、DAGLB、DARS、DAXX、DCAF10、DCAF11、DCAF17、DCBLD2、DCLK1、DCN、DCUN1D4、DDAH1、DDAH2、DDHD2、DDIT4L、DDR1、DDX39B、DDX42、DDX50、DEGS1、DENND1A、DENND1B、DENND4A、DENND5A、DEPTOR、DET1、DFNB59、DGCR2、DGK1、DGKA、DHCR24、DHCR7、DHFR、DHX9、DIAPH1、DIAPH3、DIRAS3、DIS3L、DKFZp434M1735、DKK3、DLC1、DLG5、DMD、DMXL1、DNAH8、DNAH11、DNAJA4、DNAJC13、DNAJC27、DNM2、DNMBP、DOCK1、DOCK11、DPP8、DSEL、DST、DSTN、DYNC1I1、DYRK1A、DZIP1L、EBF1、EEA1、EEF1A1、EFCAB14、EFEMP1、EGR1、EGR3、EHMT2、EIF2B3、EIF4G1、EIF4G2、EIF4G3、ELF2、ELMO2、ELN、ELP4、EMX2OS、ENAH、ENG、ENOX1、ENPP1、ENPP2、ENSA、EP300、EPT1、ERC1、ERC2、ERCC1、ERCC8、ERLIN2、ERRFI1、ESM1、ETV5、EVC、EVC2、EXO1、EXOC3、EXOC6B、EXTL2、EYA3、F2R、FADS1、FADS2、FAF1、FAIM、FAM111A、FAM126A、FAM13A、FAM160A1、FAM162A、FAM174A、FAM195B、FAM198B、FAM20A、FAM208B、FAM219A、FAM219B、FAM3C、FAM46B、FAM49B、FAM65A、FAM65B、FAM69B、FAP、FARP1、FBLN2、FBN2、FBXL16、FBXL6、FBXO9、FBXO10、FBXO18、FBXO31、FBXO34、FBXO9、FCHO1、FDFT1、FDPS、FER、FEZ1、FGD4、FGD5-AS1、FGFR2、FGFRL1、FGL2、FHOD3、FLII、FLNB、FLT1、FN1、FNBP1、FOCAD、FOS、FOSB、FOSL1、FOXK1、FRAS1、FSCN2、FUS、FYN、GABPB1、GAL3ST4、GALC、GALNT1、GALNT15、GAS7、GATA6、GBA2、GBGT1、GBP1、GCFC2、GLCE、GCNT1、GDF6、GGACT、GHDC、GIGYF2、GJC1、GLCE、GMIP、GNA13、GNAQ、GNAS、GNG12、GNL3L、GOLGA2、GOLGA4、GOLGB1、GORASP1、GPR1、GPR183、GPR50、GPR89A、GPRC5A、GPRC5B、GPSM2、GREM1、GRK6、GRTP1、GSE1、GTF2H2B、GTSF1、GUCA1B、GULP1、GXYLT1、HAPLN1、HAPLN2、HAS2、HAS3、HAT1、HAUS3、HAUS6、HAVCR2、HDAC5、HDAC7、HDX、HECTD2-AS1、HEG1、HEPH、HEY1、HLA-A、HLA-E、HLTF、HMGA1、HMGA2、HMGB1、HMGCR、HMGN3-AS1、HMGCS1、HMGXB4、HOOK3、HOXB3、HMOX1、HNMT、HNRNPR、HNRNPUL1、HP1BP3、HPS1、HRH1、HSD17B12、HSPA1L、HTATIP2、HTT、IARS、IDH1、IDI1、IFT57、IGDCC4、IGF2BP2、IGF2R、IGFBP3、IKBKAP、IL16、IL6ST、INA、INHBA、INO80、IPP4B、INPP5K、INSIG1、INTU、INVS、IQCE、IQCG、ITCH、ITGA11、ITGA8、ITGAV、ITGB5、ITGB8、ITIH1、ITM2C、ITPKA、ITSN1、IVD、KANSL3、KAT6B、KCNK2、KCNS1、KCNS2、KDM6A、KDSR、KIAA1033、KIAA1143、KIAA1199、KIAA1456、KIAA1462、KIAA1522、KIAA1524、KIAA1549、KIAA1715、KIAA1755、KIDINS220、KIF14、KIF2A、KIF21A、KIF3A、KIT、KLC1、KLC2、KLF17、KLF6、KLHL7、KLRG1、KMT2D、KRT7、KRT18、KRT19、KRT34、KRTAP1-1、KRTAP1-5、KRTAP2-3、L3MBTL2、LAMA2、LAMB1、LAMB2P1、LARP4、LATS2、LDLR、LEMD3、LETM2、LGALS3、LGALS8、LGI2、LGR4、LHX9、LIMS1、LINC00341、LINC00472、LINC00570、LINC00578、LINC00607、LINC00657、LINC00678、LINC00702、LINC00886、LINC00961、LINC01011、LINC01118、LINC01204、LINCR-0002、LINGO2、LMAN2L、LMNA、LMO7、LMOD1、LOC400927、LONP1、LOX、LPHN1、LRBA、LRCH4、LRIG1、LRP4、LRP8、LRRC1、LRRC32、LRRC39、LRRC8A、LSAMP、LSS、LTBR、LUC7L2、LUM、LYPD1、LYRM1、LZTS2、MACROD2、MAFB、MAGED4、MAGED4B、MAMDC2、MAN1A2、MAN2A1、MAN2C1、MANEA、MAP4K4、MAPK10、MAPK13、MARCH7、MARCH8、MASP1、MB、MB21D2、MBD1、MBOAT7、MC4R、MCM10、MDM2、MDN1、MEAF6、MECP2、MED1、MED13L、MEDAG、MEF2D、MEGF6、MEIS2、MEMO1、MEPCE、MFGE8、MFN2、MIAT、MICAL2、MINPP1、MIR612、MKL1、MKLN1、MKNK2、MLLT4、MLLT10、MLST8、MMAB、MMP10、MMP24、MMS19、MMS22L、MN1、MORF4L1、MOXD1、MPPE1、MPZL1、MRPL3、MRPL45、MRPL55、MRPS28、MRVI1、MSANTD3、MSC、MSH2、MSH4、MSH6、MSL3、MSMO1、MSRB3、MTAP、MTERF3、MTERFD1、MTHFD1L、MTMR3、MTMR9、MTRR、MUM1、MVD、MVK、MXRA5、MYADM、MYB、MYCBP2、MYLK、MYO1D、MYO9B、MYOF、NA、NAA35、NAALADL2、NADK、NAE1、NAGS、NASP、NAV1、NAV2、NCOA1、NCOA3、NCOA4、NCSTN、NDNF、NEDD4、NELFA、NEO1、NEURL1B、NF2、NFASC、NFE2L1、NFX1、NGF、NGFR、NHLH1、NID1、NID2、NIPA1、NKX3-1、NLGN1、NLN、NOL10、NOMO3、NOTCH3、NOTUM、NOVA2、NOX4、NPEPPS、NRD1、NREP、NRG1、NRROS、NSUN4、NT5C2、NT5E、NTNG1、NUDT4、NUP153、NUP35、NUP50、NUPL1、NUSAP1、OCLN、ODF2、OLR1、OS9、OSBPL3、OSBPL6、OSBPL10、OSMR、OXCT1、OXCT2、P4HA1、P4HB、PABPC1、PAIP2B、PAK4、PAPD4、PARD3、PARN、PARP14、PARP4、PARVB、PAX6、PBLD、PBX3、PCBP2、PCCB、PCDH10、PCDHGB3、PCGF3、PCM1、PCMTD2、PCNXL2、PCSK9、PDE1C、PDE3A、PDE4A、PDE5A、PDE7A、PDGFD、PDGFRB、PDLIM7、PDS5B、PDXDC1、PDXDC2P、PEAR1、PELI1、PEPD、PEX5、PFKP、PHACTR3、PHF19、PHF8、PHRF1、PHTF2、PI4K2A、PIEZO1、PIGN、PIGU、PIK3C2B、PIK3CD、PIK3R1、PIKFYVE、PIM2、PITPNA、PITPNB、PITPNM1、PITPNM3、PLAU、PLEC、PLEK2、PLEKHA1、PLEKHA6、PLEKHB2、PLEKHH2、PLSCR1、PLSCR3、PLXNB2、PLXNC1、PMS1、PNISR、PODN、POLE3、POLN、POLR1A、POLR3D、POMT2、POSTN、POU2F1、PPAPDC1A、PPARA、PPARG、PPFIBP1、PPIP5K1、PPIP5K2、PPM1E、PPP1R12A、PPP1R26、PPP3CA、PPP6R1、PPP6R2、PRKCA、PRKDC、PRKG1、PRMT1、PRNP、PRPF31、PRPH2、PRRG4、PRSS23、PRUNE2、PSMA4、PSMC1、PSMD6、PSMD6-AS2、PTCH1、PTGIS、PTK2B、PTPN14、PTX3、PUF60、PUS7、PVR、PXK、PXN、QKI、RAB2B、RAB30、RAB34、RAB38、RAB44、RAD1、RAD9B、RAD23B、RAF1、RALB、RAP1GDS1、RAPGEF1、RARG、RARS、RARS2、RASIP1、RASSF8、RBBP8、RBCK1、RCOR3、RBFOX2、RBKS、RBM10、RDX、RERE、RFTN1、RFWD2、RFX3-AS1、RGCC、RGL1、RGS10、RGS3、RIF1、RNF14、RNF19A、RNF130、RNF144A、RNF213、RNF38、RNFT1、ROR1、ROR2、RPA1、RPF2、RPL10、RPS10、RPS6KB2、RPS6KC1、RRBP1、RWDD4、SAMD4A、SAMD9、SAMD9L、SAR1A、SART3、SCAF4、SCAF8、SCARNA9、SCD、SCLT1、SCO1、SDCBP、SEC14L1、SEC22A、SEC24A、SEC24B、SEC61A1、SENP6、SEPT9、SERGEF、SERPINE2、SF1、SF3B3、SGIP1、SGK3、SGMS1、SGOL2、SGPL1、SH2B3、SH3RF1、SH3YL1、SHROOM3、SIGLEC10、SKA2、SKIL、SKP1、SLC12A2、SLC24A3、SLC25A16、SLC25A17、SLC34A3、SLC35F3、SLC39A3、SLC39A10、SLC4A4、SLC4A11、SLC41A1、SLC44A2、SLC46A2、SLC6A15、SLC7A6、SLC7A8、SLC7A11、SLC9A3、SLIT3、SMARCA4、SMARCC2、SMC4、SMC6、SMCHD1、SMG1、SMG1P3、SMOX、SMPD4、SMTN、SMYD3、SMYD5、SNAP23、SNED1、SNHG16、SNX7、SNX14、SNX24、SNX7、SOCS2、SOCS6、SOGA2、SON、SORBS2、SORCS1、SORCS2、SOS2、SOX7、SPATA18、SPATA20、SPATA5、SPATS2、SPDYA、SPEF2、SPG20、SPIDR、SPINK5、SPRED2、SPRYD7、SQLE、SQRDL、SQSTM1、SRCAP、SREBF1、SRGAP1、SRRM1、SRSF3、SSBP1、STAC2、STARD4、STAT1、STAT3、STAT4、STAU1、STC2、STEAP2、STK32B、STRAD8、STRIP1、STRN4、STS、STX16、STXBP4、STXBP6、SULF1、SUPT20H、SVEP1、SYNE1、SYNE2、SYNGR2、SYNPO、SYNPO2、SYNPO2L、SYT15、SYTL2、TACC1、TAF2、TAGLN3、TANC2、TANGO6、TARBP1、TARS、TASP1、TBC1D15、TBCA、TBL1XR1、TBL2、TCF12、TCF4、TCF7L2、TEKT4P2、TENC1、TENM2、TEP1、TET1、TET3、TEX21P、TFCP2、TGFA、TGFB2、TGFB3、TGFBI、TGFBR1、TGFBRAP1、TGM2、THADA、THAP4、THBS2、THRB、TIAM1、TIMP2、TJAP1、TJP2、TLE3、TLK1、TMC3、TMEM67、TMEM102、TMEM119、TMEM134、TMEM154、TMEM189-UBE2V1、TMEM214、TMEM256-PLSCR3、TMEM47、TMEM50B、TMEM63A、TMX3、TNC、TNFAIP3、TNFAIP8L3、TNFRSF12A、TNFRSF14、TNIP1、TNKS1BP1、TNPO3、TNRC18P1、TNS1、TNS3、TNXB、TOE1、TOMM40、TOMM5、TOPORS、TP53AIP1、TP53INP1、TPRG1、TRAF3、TRAK1、TRAPPC12、TRIB1、TRIM2、TRIM23、TRIM26、TRIM28、TRIM65、TRIM66、TRMT1L、TRPC4、TRPS1、TSC2、TSHZ1、TSHZ2、TSPAN11、TSPAN18、TSPAN2、TSPAN7、TSSK3、TTC7A、TTC7B、TUBB2C、TUBB3、TUBE1、TXNIP、TXNL1、TXNL4B、TXNRD1、TYW5、U2SURP、UBAP2L、UBE2D3、UBE2G2、UBE2L3、UBE2V1、UBN2、UBQLN4、UCHL5、UHMK1、UHRF1BP1L、UNC13B、UNC5B、URGCP、URGCP-MRPS24、USP19、USP7、USP27X、UVRAG、VANGL1、VARS2、VAV2、VCL、VDAC2、VIM-AS1、VIPAS39、VPS13A、VPS29、VPS41、VPS51、VSTM2L、VWA8、VWF、WDR19、WDR27、WDR37、WDR48、WDR90、WDR91、WHSC2、WIPF1、WISP1、WNK1、WNT5B、WNT10B、WSB1、WWTR1、XDH、XIAP、XRN2、YAP1、YDJC、YES1、YPEL5、YTHDF3、Z24749、ZAK、ZBTB10、ZBTB24、ZBTB26、ZBTB7A、ZC3H12C、ZC3H14、ZC3H18、ZCCHC5、ZCCHC8、ZCCHC11、ZEB1、ZEB2、ZFAND1、ZFAND5、ZFP82、ZHX3、ZMIZ1、ZMIZ1-AS1、ZMIZ2、ZMYM2、ZNF12、ZNF138、ZNF148、ZNF208、ZNF212、ZNF219、ZNF227、ZNF232、ZNF24、ZNF268、ZNF28、ZNF280D、ZNF281、ZNF335、ZNF350、ZNF37A、ZNF37BP、ZNF395、ZNF426、ZNF431、ZNF583、ZNF618、ZNF621、ZNF652、ZNF655、ZNF660、ZNF674、ZNF680、ZNF730、ZNF74、ZNF764、ZNF777、ZNF778、ZNF780A、ZNF7804A、ZNF79、ZNF827、ZNF836、ZNF837、ZNF839、ZNF91和ZSCAN25。
在本文所述的另一特定方面,所述基因或所述RNA转录物不是从SMN2基因转录的。
在本文所述的另一特定方面,所述基因或所述RNA转录物不是从选自以下的基因转录的:ABHD10、ADAM12、AKT1、ANXA11、APLP2、APPL2、ARMCX6、ATG5、AXIN1、BAIAP2、CCNB1IP1、CCT7、CEP57、CSF1、DLGAP4、EPN1、ERGIC3、FOXM1、GGCT、GRAMD3、HSD17B4、LARP7、LRRC42、MADD、MAN1B1、MRPL39、PCBP4、PPHLN1、PRKACB、RAB23、RAP1A、RCC1、SREK1、STRN3和TNRC6A。
在本文所述的另一特定方面,所述基因或所述RNA转录物不是从选自以下的基因转录的:ABHD10、ADAM12、AKT1、ANXA11、APLP2、APPL2、ARMCX6、ATG5、AXIN1、BAIAP2、CCNB1IP1、CCT7、CEP57、CSF1、DLGAP4、EPN1、ERGIC3、FOXM1、GGCT、GRAMD3、HSD17B4、LARP7、LRRC42、MADD、MAN1B1、MRPL39、PCBP4、PPHLN1、PRKACB、RAB23、RAP1A、RCC1、SMN2、SREK1、STRN3和TNRC6A。
在本文所述的另一特定方面,所述基因或所述RNA转录物是从SMN2基因转录的。
在本文所述的另一特定方面,所述基因或所述RNA转录物是从选自以下的基因转录的:ABHD10、ADAM12、AKT1、ANXA11、APLP2、APPL2、ARMCX6、ATG5、AXIN1、BAIAP2、CCNB1IP1、CCT7、CEP57、CSF1、DLGAP4、EPN1、ERGIC3、FOXM1、GGCT、GRAMD3、HSD17B4、LARP7、LRRC42、MADD、MAN1B1、MRPL39、PCBP4、PPHLN1、PRKACB、RAB23、RAP1A、RCC1、SREK1、STRN3和TNRC6A。
在本文所述的另一特定方面,所述基因或所述RNA转录物是从选自以下的基因转录的:ABHD10、ADAM12、AKT1、ANXA11、APLP2、APPL2、ARMCX6、ATG5、AXIN1、BAIAP2、CCNB1IP1、CCT7、CEP57、CSF1、DLGAP4、EPN1、ERGIC3、FOXM1、GGCT、GRAMD3、HSD17B4、LARP7、LRRC42、MADD、MAN1B1、MRPL39、PCBP4、PPHLN1、PRKACB、RAB23、RAP1A、RCC1、SMN2、SREK1、STRN3和TNRC6A。
一方面,本文提供了调节由包含如上所述的人工基因构建体的细胞产生的蛋白的量和修饰由包含如上所述的人工基因构建体的细胞产生的蛋白的类型的方法,所述方法包括使细胞与式(I)的化合物或其形式接触,其中式(I)为:
或其形式,其中
W为CH=CH或S;
X为CH2、CH(C1-4烷基)、C(C1-4烷基)2、CH=CH、O、NR5或键;
A为芳基、杂芳基、杂环基或C9-10环烷基,
其中芳基选自苯基和萘基,其各自任选地被1、2、3或4个各自选自R1的取代基取代,
其中杂芳基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R1的取代基取代,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R2的取代基取代,和
其中C9-10环烷基为任选地被1、2、3、4或5个各自选自R2的取代基取代的饱和或部分不饱和二环环系;
B为杂环基,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或多环环系,其各自任选地被1、2、3、4或5个各自选自R4的取代基取代;
R1为卤素、羟基、氰基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、杂环基-C1-4烷氧基、苯基或苯基-C1-4烷氧基,
其中杂芳基为具有1、2或3个选自N、O和S的杂原子环成员的饱和单环或二环环系,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中苯基、杂芳基或杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R2为卤素、羟基、氰基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、羟基-C1-4烷基、C1-4烷氧基、C1-4烷氧基-羰基、C2-4烯基、C3-7环烷基或杂环基-C1-4烷基,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R3为卤素、羟基、硝基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、苯基或苯基-C1-4烷氧基;
R4独立地选自卤素、C1-4烷基、羟基-C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基或羟基-C1-4烷基-氨基;和
R5为氢、C1-4烷基或羟基-C1-4烷基;
其中化合物的形式选自其前药、盐、水合物、溶剂化物、包合物、同位素体、外消旋体、对映异构体、非对映异构体、立体异构体、多晶型物和互变异构体形式。
另一方面,本文提供了调节由包含如上所述的人工基因构建体的细胞产生的蛋白的量和修饰由包含如上所述的人工基因构建体的细胞产生的蛋白的类型的方法,所述方法包括使细胞与式(I)的化合物或其形式接触,其中式(I)选自式(Ia)和式(Ib)的化合物:
或其形式,其中
X为CH2、CH(C1-4烷基)、C(C1-4烷基)2、CH=CH、O、NR5或键;
A为芳基、杂芳基、杂环基或C9-10环烷基,
其中芳基选自苯基和萘基,其各自任选地被1、2、3或4个各自选自R1的取代基取代,
其中杂芳基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R1的取代基取代,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R2的取代基取代,和
其中C9-10环烷基为任选地被1、2、3、4或5个各自选自R2的取代基取代的饱和或部分不饱和二环环系;
B为杂环基,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或多环环系,其各自任选地被1、2、3、4或5个各自选自R4的取代基取代;
R1为卤素、羟基、氰基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、杂环基-C1-4烷氧基、苯基或苯基-C1-4烷氧基,
其中杂芳基为具有1、2或3个选自N、O和S的杂原子环成员的饱和单环或二环环系,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中苯基、杂芳基或杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R2为卤素、羟基、氰基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、氨基-羰基、羟基-C1-4烷基、C1-4烷氧基、C1-4烷氧基-羰基、C2-4烯基、C3-7环烷基或杂环基-C1-4烷基;
R3为卤素、羟基、硝基、氧代基、羟基-亚氨基、C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、苯基或苯基-C1-4烷氧基;
R4独立地选自卤素、C1-4烷基、羟基-C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基或羟基-C1-4烷基-氨基;和
R5为氢、C1-4烷基或羟基-C1-4烷基;
其中化合物的形式选自其前药、盐、水合物、溶剂化物、包合物、同位素体、外消旋体、对映异构体、非对映异构体、立体异构体、多晶型物和互变异构体形式。
在具体方面,在DNA的情况下,编码内含子REMS的核苷酸序列包含选自以下的序列:ANGAgtrngn(SEQ ID NO:1809)、CNGAgtrngn(SEQ ID NO:1810)、GNGAgtrngn(SEQ IDNO:1811)、TNGAgtrngn(SEQ ID NO:1812)、NAGAgtrngn(SEQ ID NO:1813)、NCGAgtrngn(SEQID NO:1814)、NGGAgtrngn(SEQ ID NO:1815)、NTGAgtrngn(SEQ ID NO:1816)、AAGAgtrngn(SEQ ID NO:1817)、ACGAgtrngn(SEQ ID NO:1818)、AGGAgtrngn(SEQ ID NO:1819)、ATGAgtrngn(SEQ ID NO:1820)、CAGAgtrngn(SEQ ID NO:1821)、CCGAgtrngn(SEQ ID NO:1822)、CGGAgtrngn(SEQ ID NO:1823)、CTGAgtrngn(SEQ ID NO:1824)、GAGAgtrngn(SEQ IDNO:1825)、GCGAgtrngn(SEQ ID NO:1826)、GGGAgtrngn(SEQ ID NO:1827)、GTGAgtrngn(SEQID NO:1828)、TAGAgtrngn(SEQ ID NO:1829)、TCGAgtrngn(SEQ ID NO:1830)、TGGAgtrngn(SEQ ID NO:1831)和TTGAgtrngn(SEQ ID NO:1832),其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸。在另一具体方面,在DNA的情况下,编码内含子REMS的核苷酸序列包含选自以下的序列:ANGAgtragt(SEQ ID NO:1833)、CNGAgtragt(SEQ ID NO:1834)、GNGAgtragt(SEQID NO:1835)、TNGAgtragt(SEQ ID NO:1836)、NAGAgtragt(SEQ ID NO:1837)、NCGAgtragt(SEQ ID NO:1838)、NGGAgtragt(SEQ ID NO:1839)、NTGAgtragt(SEQ ID NO:1840)、AAGAgtragt(SEQ ID NO:1841)、ACGAgtragt(SEQ ID NO:1842)、AGGAgtragt(SEQ ID NO:1843)、ATGAgtragt(SEQ ID NO:1844)、CAGAgtragt(SEQ ID NO:1845)、CCGAgtragt(SEQ IDNO:1846)、CGGAgtragt(SEQ ID NO:1847)、CTGAgtragt(SEQ ID NO:1848)、GAGAgtragt(SEQID NO:1849)、GCGAgtragt(SEQ ID NO:1850)、GGGAgtragt(SEQ ID NO:1851)、GTGAgtragt(SEQ ID NO:1852)、TAGAgtragt(SEQ ID NO:1853)、TCGAgtragt(SEQ ID NO:1854)、TGGAgtragt(SEQ ID NO:1855)和TTGAgtragt(SEQ ID NO:1856),其中r为腺嘌呤或鸟嘌呤,并且N为任何核苷酸。在本文提供的一个或多个方面,N为腺嘌呤或鸟嘌呤。在多个特定方面,编码内含子REMS的核苷酸序列是编码非内源内含子REMS的核苷酸序列,即包含在人工构建体的DNA序列中非天然存在的非内源内含子REMS的前体RNA转录物。
一方面,本文提供了用于修饰RNA剪接以产生具有iExon的成熟mRNA转录物的方法,所述方法包括使前体mRNA转录物与式(I)的化合物或其形式接触,其中所述前体mRNA转录物包含两个外显子和内含子,其中第一外显子在内含子的上游,并且第二外显子在内含子的下游,其中所述内含子按5’至3’顺序包含:第一5’剪接位点、第一分支点、第一3’剪接位点、剪接修饰剂的内含子识别元件(iREMS)、第二分支点和第二3’剪接位点,其中所述iREMS包含RNA序列GAgurngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,并且其中式(I)为:
或其形式,其中
W为CH=CH或S;
X为CH2、CH(C1-4烷基)、C(C1-4烷基)2、CH=CH、O、NR5或键;
A为芳基、杂芳基、杂环基或C9-10环烷基,
其中芳基选自苯基和萘基,其各自任选地被1、2、3或4个各自选自R1的取代基取代,
其中杂芳基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R1的取代基取代,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R2的取代基取代,和
其中C9-10环烷基为任选地被1、2、3、4或5个各自选自R2的取代基取代的饱和或部分不饱和二环环系;
B为杂环基,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或多环环系,其各自任选地被1、2、3、4或5个各自选自R4的取代基取代;
R1为卤素、羟基、氰基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、杂环基-C1-4烷氧基、苯基或苯基-C1-4烷氧基,
其中杂芳基为具有1、2或3个选自N、O和S的杂原子环成员的饱和单环或二环环系,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中苯基、杂芳基或杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R2为卤素、羟基、氰基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、羟基-C1-4烷基、C1-4烷氧基、C1-4烷氧基-羰基、C2-4烯基、C3-7环烷基或杂环基-C1-4烷基,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R3为卤素、羟基、硝基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、苯基或苯基-C1-4烷氧基;
R4独立地选自卤素、C1-4烷基、羟基-C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基或羟基-C1-4烷基-氨基;和
R5为氢、C1-4烷基或羟基-C1-4烷基;
其中化合物的形式选自其前药、盐、水合物、溶剂化物、包合物、同位素体、外消旋体、对映异构体、非对映异构体、立体异构体、多晶型物和互变异构体形式。
另一方面,本文提供了用于修饰RNA剪接以调节由前体mRNA转录物产生的成熟mRNA转录物的量的方法,所述方法包括使前体mRNA转录物与式(I)的化合物或其形式接触,其中所述前体mRNA转录物包含两个外显子和内含子,其中第一外显子在内含子的上游,并且第二外显子在内含子的下游,其中所述内含子包含RNA核苷酸序列,所述RNA核苷酸序列按5’至3’顺序包含:剪接修饰剂的内含子识别元件(iREMS)、分支点和3’剪接位点,其中所述iREMS包含RNA序列GAgurngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,并且其中式(I)为:
或其形式,其中
W为CH=CH或S;
X为CH2、CH(C1-4烷基)、C(C1-4烷基)2、CH=CH、O、NR5或键;
A为芳基、杂芳基、杂环基或C9-10环烷基,
其中芳基选自苯基和萘基,其各自任选地被1、2、3或4个各自选自R1的取代基取代,
其中杂芳基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R1的取代基取代,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R2的取代基取代,和
其中C9-10环烷基为任选地被1、2、3、4或5个各自选自R2的取代基取代的饱和或部分不饱和二环环系;
B为杂环基,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或多环环系,其各自任选地被1、2、3、4或5个各自选自R4的取代基取代;
R1为卤素、羟基、氰基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、杂环基-C1-4烷氧基、苯基或苯基-C1-4烷氧基,
其中杂芳基为具有1、2或3个选自N、O和S的杂原子环成员的饱和单环或二环环系,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中苯基、杂芳基或杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R2为卤素、羟基、氰基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、羟基-C1-4烷基、C1-4烷氧基、C1-4烷氧基-羰基、C2-4烯基、C3-7环烷基或杂环基-C1-4烷基,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R3为卤素、羟基、硝基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、苯基或苯基-C1-4烷氧基;
R4独立地选自卤素、C1-4烷基、羟基-C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基或羟基-C1-4烷基-氨基;和
R5为氢、C1-4烷基或羟基-C1-4烷基;
其中化合物的形式选自其前药、盐、水合物、溶剂化物、包合物、同位素体、外消旋体、对映异构体、非对映异构体、立体异构体、多晶型物和互变异构体形式。
在前述方面的特定方面,所述内含子按5’至3’顺序还包含:5’剪接位点、分支点和iREMS上游的3’剪接位点。
另一方面,本文提供了用于修饰RNA剪接以调节由前体mRNA转录物产生的成熟mRNA转录物的量的方法,所述方法包括使前体mRNA转录物与式(I)的化合物或其形式接触,其中所述前体mRNA转录物包含三个外显子和两个内含子,其中三个外显子和两个内含子按以下5’至3’的顺序为:第一外显子、第一内含子、第二外显子、第二内含子和第三外显子,其中所述第一内含子包含RNA核苷酸序列,所述RNA核苷酸序列按5’至3’顺序包含:第一5’剪接位点、第一分支点和第一3’剪接位点,其中所述第二内含子包含RNA核苷酸序列,所述RNA核苷酸序列按5’至3’顺序包含:第二5’剪接位点、剪接修饰剂的内含子识别元件(iREMS)、第二分支点和第二3’剪接位点,其中所述iREMS包含RNA序列GAgurngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,并且其中式(I)为:
或其形式,其中
W为CH=CH或S;
X为CH2、CH(C1-4烷基)、C(C1-4烷基)2、CH=CH、O、NR5或键;
A为芳基、杂芳基、杂环基或C9-10环烷基,
其中芳基选自苯基和萘基,其各自任选地被1、2、3或4个各自选自R1的取代基取代,
其中杂芳基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R1的取代基取代,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R2的取代基取代,和
其中C9-10环烷基为任选地被1、2、3、4或5个各自选自R2的取代基取代的饱和或部分不饱和二环环系;
B为杂环基,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或多环环系,其各自任选地被1、2、3、4或5个各自选自R4的取代基取代;
R1为卤素、羟基、氰基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、杂环基-C1-4烷氧基、苯基或苯基-C1-4烷氧基,
其中杂芳基为具有1、2或3个选自N、O和S的杂原子环成员的饱和单环或二环环系,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中苯基、杂芳基或杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R2为卤素、羟基、氰基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、羟基-C1-4烷基、C1-4烷氧基、C1-4烷氧基-羰基、C2-4烯基、C3-7环烷基或杂环基-C1-4烷基,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R3为卤素、羟基、硝基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、苯基或苯基-C1-4烷氧基;
R4独立地选自卤素、C1-4烷基、羟基-C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基或羟基-C1-4烷基-氨基;和
R5为氢、C1-4烷基或羟基-C1-4烷基;
其中化合物的形式选自其前药、盐、水合物、溶剂化物、包合物、同位素体、外消旋体、对映异构体、非对映异构体、立体异构体、多晶型物和互变异构体形式。
在一些方面,所述iREMS为内源iREMS。在其他方面,所述iREMS为非内源iREMS。
另一方面,本文提供了用于修饰RNA剪接以产生具有iExon的成熟mRNA转录物的方法,所述方法包括使前体mRNA转录物与式(I)的化合物或其形式接触,其中所述前体mRNA转录物包含两个外显子和内含子,其中第一外显子在内含子的上游,并且第二外显子在内含子的下游,其中所述内含子按5’至3’顺序包含:第一5’剪接位点、第一分支点、第一3’剪接位点、剪接修饰剂的内含子识别元件(iREMS)、第二分支点和第二3’剪接位点,其中所述iREMS包含RNA序列GAgurngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,其中所述前体mRNA转录物是选自本文表中所列基因的基因的前体mRNA转录物,并且其中式(I)为:
或其形式,其中
W为CH=CH或S;
X为CH2、CH(C1-4烷基)、C(C1-4烷基)2、CH=CH、O、NR5或键;
A为芳基、杂芳基、杂环基或C9-10环烷基,
其中芳基选自苯基和萘基,其各自任选地被1、2、3或4个各自选自R1的取代基取代,
其中杂芳基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R1的取代基取代,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R2的取代基取代,和
其中C9-10环烷基为任选地被1、2、3、4或5个各自选自R2的取代基取代的饱和或部分不饱和二环环系;
B为杂环基,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或多环环系,其各自任选地被1、2、3、4或5个各自选自R4的取代基取代;
R1为卤素、羟基、氰基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、杂环基-C1-4烷氧基、苯基或苯基-C1-4烷氧基,
其中杂芳基为具有1、2或3个选自N、O和S的杂原子环成员的饱和单环或二环环系,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中苯基、杂芳基或杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R2为卤素、羟基、氰基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、羟基-C1-4烷基、C1-4烷氧基、C1-4烷氧基-羰基、C2-4烯基、C3-7环烷基或杂环基-C1-4烷基,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R3为卤素、羟基、硝基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、苯基或苯基-C1-4烷氧基;
R4独立地选自卤素、C1-4烷基、羟基-C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基或羟基-C1-4烷基-氨基;和
R5为氢、C1-4烷基或羟基-C1-4烷基;
其中化合物的形式选自其前药、盐、水合物、溶剂化物、包合物、同位素体、外消旋体、对映异构体、非对映异构体、立体异构体、多晶型物和互变异构体形式。
另一方面,本文提供了用于修饰RNA剪接以调节由前体mRNA转录物产生的成熟mRNA转录物的量的方法,所述方法包括使前体mRNA转录物与式(I)的化合物或其形式接触,其中所述前体mRNA转录物包含两个外显子和内含子,其中第一外显子在内含子的上游,并且第二外显子在内含子的下游,其中所述内含子包含RNA核苷酸序列,所述RNA核苷酸序列按5’至3’顺序包含:剪接修饰剂的内含子识别元件(iREMS)、分支点和3’剪接位点,其中所述iREMS包含RNA序列GAgurngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,其中所述前体mRNA转录物是选自本文表中所列基因的基因的前体mRNA转录物,并且其中式(I)为:
或其形式,其中
W为CH=CH或S;
X为CH2、CH(C1-4烷基)、C(C1-4烷基)2、CH=CH、O、NR5或键;
A为芳基、杂芳基、杂环基或C9-10环烷基,
其中芳基选自苯基和萘基,其各自任选地被1、2、3或4个各自选自R1的取代基取代,
其中杂芳基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R1的取代基取代,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R2的取代基取代,和
其中C9-10环烷基为任选地被1、2、3、4或5个各自选自R2的取代基取代的饱和或部分不饱和二环环系;
B为杂环基,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或多环环系,其各自任选地被1、2、3、4或5个各自选自R4的取代基取代;
R1为卤素、羟基、氰基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、杂环基-C1-4烷氧基、苯基或苯基-C1-4烷氧基,
其中杂芳基为具有1、2或3个选自N、O和S的杂原子环成员的饱和单环或二环环系,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中苯基、杂芳基或杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R2为卤素、羟基、氰基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、羟基-C1-4烷基、C1-4烷氧基、C1-4烷氧基-羰基、C2-4烯基、C3-7环烷基或杂环基-C1-4烷基,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R3为卤素、羟基、硝基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、苯基或苯基-C1-4烷氧基;
R4独立地选自卤素、C1-4烷基、羟基-C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基或羟基-C1-4烷基-氨基;和
R5为氢、C1-4烷基或羟基-C1-4烷基;
其中化合物的形式选自其前药、盐、水合物、溶剂化物、包合物、同位素体、外消旋体、对映异构体、非对映异构体、立体异构体、多晶型物和互变异构体形式。
在前述方面的特定方面,所述内含子按5’至3’顺序还包含:5’剪接位点、分支点和iREMS上游的3’剪接位点。
另一方面,本文提供了用于修饰RNA剪接以调节由前体mRNA转录物产生的成熟mRNA转录物的量的方法,所述方法包括使前体mRNA转录物与式(I)的化合物或其形式接触,其中所述前体mRNA转录物包含三个外显子和两个内含子,其中三个外显子和两个内含子按以下5’至3’的顺序为:第一外显子、第一内含子、第二外显子、第二内含子和第三外显子,其中所述第一内含子包含RNA核苷酸序列,所述RNA核苷酸序列按5’至3’顺序包含:第一5’剪接位点、第一分支点和第一3’剪接位点,其中所述第二内含子包含RNA核苷酸序列,所述RNA核苷酸序列按5’至3’顺序包含:第二5’剪接位点、剪接修饰剂的内含子识别元件(iREMS)、第二分支点和第二3’剪接位点,其中所述iREMS包含RNA序列GAgurngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,其中所述前体mRNA转录物是选自本文表中所列基因的基因的前体mRNA转录物,并且其中式(I)为:
或其形式,其中
W为CH=CH或S;
X为CH2、CH(C1-4烷基)、C(C1-4烷基)2、CH=CH、O、NR5或键;
A为芳基、杂芳基、杂环基或C9-10环烷基,
其中芳基选自苯基和萘基,其各自任选地被1、2、3或4个各自选自R1的取代基取代,
其中杂芳基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R1的取代基取代,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R2的取代基取代,和
其中C9-10环烷基为任选地被1、2、3、4或5个各自选自R2的取代基取代的饱和或部分不饱和二环环系;
B为杂环基,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或多环环系,其各自任选地被1、2、3、4或5个各自选自R4的取代基取代;
R1为卤素、羟基、氰基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、杂环基-C1-4烷氧基、苯基或苯基-C1-4烷氧基,
其中杂芳基为具有1、2或3个选自N、O和S的杂原子环成员的饱和单环或二环环系,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中苯基、杂芳基或杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R2为卤素、羟基、氰基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、羟基-C1-4烷基、C1-4烷氧基、C1-4烷氧基-羰基、C2-4烯基、C3-7环烷基或杂环基-C1-4烷基,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R3为卤素、羟基、硝基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、苯基或苯基-C1-4烷氧基;
R4独立地选自卤素、C1-4烷基、羟基-C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基或羟基-C1-4烷基-氨基;和
R5为氢、C1-4烷基或羟基-C1-4烷基;
其中化合物的形式选自其前药、盐、水合物、溶剂化物、包合物、同位素体、外消旋体、对映异构体、非对映异构体、立体异构体、多晶型物和互变异构体形式。
一方面,本文提供了用于修饰RNA剪接以产生具有iExon的成熟mRNA转录物的方法,所述方法包括使前体mRNA转录物与式(I)的化合物或其形式接触,其中所述前体mRNA转录物包含两个外显子和内含子,其中第一外显子在内含子的上游,并且第二外显子在内含子的下游,其中所述内含子按5’至3’顺序包含:第一5’剪接位点、第一分支点、第一3’剪接位点、剪接修饰剂的内含子识别元件(iREMS)、第二分支点和第二3’剪接位点,其中所述iREMS包含RNA序列GAgurngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,并且其中式(I)为:
或其形式,其中
W为CH=CH或S;
X为CH2、CH(C1-4烷基)、C(C1-4烷基)2、CH=CH、O、NR5或键;
A为芳基、杂芳基、杂环基或C9-10环烷基,
其中芳基选自苯基和萘基,其各自任选地被1、2、3或4个各自选自R1的取代基取代,
其中杂芳基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R1的取代基取代,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R2的取代基取代,和
其中C9-10环烷基为任选地被1、2、3、4或5个各自选自R2的取代基取代的饱和或部分不饱和二环环系;
B为杂环基,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或多环环系,其各自任选地被1、2、3、4或5个各自选自R4的取代基取代;
R1为卤素、羟基、氰基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、杂环基-C1-4烷氧基、苯基或苯基-C1-4烷氧基,
其中杂芳基为具有1、2或3个选自N、O和S的杂原子环成员的饱和单环或二环环系,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中苯基、杂芳基或杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R2为卤素、羟基、氰基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、羟基-C1-4烷基、C1-4烷氧基、C1-4烷氧基-羰基、C2-4烯基、C3-7环烷基或杂环基-C1-4烷基,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R3为卤素、羟基、硝基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、苯基或苯基-C1-4烷氧基;
R4独立地选自卤素、C1-4烷基、羟基-C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基或羟基-C1-4烷基-氨基;和
R5为氢、C1-4烷基或羟基-C1-4烷基;
其中化合物的形式选自其前药、盐、水合物、溶剂化物、包合物、同位素体、外消旋体、对映异构体、非对映异构体、立体异构体、多晶型物和互变异构体形式。
另一方面,本文提供了用于修饰RNA剪接以调节由前体mRNA转录物产生的成熟mRNA转录物的量的方法,所述方法包括使前体mRNA转录物与式(I)的化合物或其形式接触,其中所述前体mRNA转录物包含两个外显子和内含子,其中第一外显子在内含子的上游,并且第二外显子在内含子的下游,其中所述内含子包含RNA核苷酸序列,所述RNA核苷酸序列按5’至3’顺序包含:剪接修饰剂的内含子识别元件(iREMS)、分支点和3’剪接位点,其中所述iREMS包含RNA序列GAgurngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,并且其中式(I)为:
或其形式,其中
W为CH=CH或S;
X为CH2、CH(C1-4烷基)、C(C1-4烷基)2、CH=CH、O、NR5或键;
A为芳基、杂芳基、杂环基或C9-10环烷基,
其中芳基选自苯基和萘基,其各自任选地被1、2、3或4个各自选自R1的取代基取代,
其中杂芳基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R1的取代基取代,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R2的取代基取代,和
其中C9-10环烷基为任选地被1、2、3、4或5个各自选自R2的取代基取代的饱和或部分不饱和二环环系;
B为杂环基,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或多环环系,其各自任选地被1、2、3、4或5个各自选自R4的取代基取代;
R1为卤素、羟基、氰基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、杂环基-C1-4烷氧基、苯基或苯基-C1-4烷氧基,
其中杂芳基为具有1、2或3个选自N、O和S的杂原子环成员的饱和单环或二环环系,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中苯基、杂芳基或杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R2为卤素、羟基、氰基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、羟基-C1-4烷基、C1-4烷氧基、C1-4烷氧基-羰基、C2-4烯基、C3-7环烷基或杂环基-C1-4烷基,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R3为卤素、羟基、硝基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、苯基或苯基-C1-4烷氧基;
R4独立地选自卤素、C1-4烷基、羟基-C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基或羟基-C1-4烷基-氨基;和
R5为氢、C1-4烷基或羟基-C1-4烷基;
其中化合物的形式选自其前药、盐、水合物、溶剂化物、包合物、同位素体、外消旋体、对映异构体、非对映异构体、立体异构体、多晶型物和互变异构体形式。
在前述方面的特定方面,所述内含子按5’至3’顺序还包含:5’剪接位点、分支点和iREMS上游的3’剪接位点。
另一方面,本文提供了用于修饰RNA剪接以调节由前体mRNA转录物产生的成熟mRNA转录物的量的方法,所述方法包括使前体mRNA转录物与式(I)的化合物或其形式接触,其中所述前体mRNA转录物包含三个外显子和两个内含子,其中三个外显子和两个内含子按以下5’至3’的顺序为:第一外显子、第一内含子、第二外显子、第二内含子和第三外显子,其中所述第一内含子包含RNA核苷酸序列,所述RNA核苷酸序列按5’至3’顺序包含:第一5’剪接位点、第一分支点和第一3’剪接位点,其中所述第二内含子包含RNA核苷酸序列,所述RNA核苷酸序列按5’至3’顺序包含:第二5’剪接位点、剪接修饰剂的内含子识别元件(iREMS)、第二分支点和第二3’剪接位点,其中所述iREMS包含RNA序列GAgurngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,并且其中式(I)为:
或其形式,其中
W为CH=CH或S;
X为CH2、CH(C1-4烷基)、C(C1-4烷基)2、CH=CH、O、NR5或键;
A为芳基、杂芳基、杂环基或C9-10环烷基,
其中芳基选自苯基和萘基,其各自任选地被1、2、3或4个各自选自R1的取代基取代,
其中杂芳基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R1的取代基取代,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R2的取代基取代,和
其中C9-10环烷基为任选地被1、2、3、4或5个各自选自R2的取代基取代的饱和或部分不饱和二环环系;
B为杂环基,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或多环环系,其各自任选地被1、2、3、4或5个各自选自R4的取代基取代;
R1为卤素、羟基、氰基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、杂环基-C1-4烷氧基、苯基或苯基-C1-4烷氧基,
其中杂芳基为具有1、2或3个选自N、O和S的杂原子环成员的饱和单环或二环环系,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中苯基、杂芳基或杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R2为卤素、羟基、氰基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、羟基-C1-4烷基、C1-4烷氧基、C1-4烷氧基-羰基、C2-4烯基、C3-7环烷基或杂环基-C1-4烷基,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R3为卤素、羟基、硝基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、苯基或苯基-C1-4烷氧基;
R4独立地选自卤素、C1-4烷基、羟基-C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基或羟基-C1-4烷基-氨基;和
R5为氢、C1-4烷基或羟基-C1-4烷基;
其中化合物的形式选自其前药、盐、水合物、溶剂化物、包合物、同位素体、外消旋体、对映异构体、非对映异构体、立体异构体、多晶型物和互变异构体形式。
在具体方面,所述前体mRNA转录物在细胞或细胞的裂解物中,并且所述方法包括使化合物与细胞或细胞裂解物接触。在具体方面,所述方法调节由成熟mRNA转录物产生的和在细胞或细胞的裂解物中产生的蛋白的量和/修饰由成熟mRNA转录物产生的和在细胞或细胞的裂解物中产生的蛋白的类型。
在具体方面,所述方法包括向对象施用所述化合物。在具体方面,所述方法调节由成熟mRNA转录物产生的和在对象中产生的蛋白的量和/或修饰由成熟mRNA转录物产生的和在对象中产生的蛋白的类型。一方面,所述对象是非人类对象。另一方面,所述对象是人类对象。
在具体方面,所述成熟mRNA转录物编码可检测的报告蛋白。
另一方面,本文提供了用于修饰RNA剪接以预防或治疗疾病或障碍的方法,其中由基因编码的一种、两种、三种或更多种RNA同种型的表达水平的改变有利于预防或治疗所述疾病,所述方法包括向有此需要的对象施用本文所述的化合物,其中所述一种、两种、三种或更多种RNA同种型通过修饰前体mRNA转录物的RNA剪接产生,所述前体mRNA转录物包含两个外显子和内含子,其中第一外显子在内含子的上游,并且第二外显子在内含子的下游,其中所述内含子按5’至3’顺序包含:第一5’剪接位点、第一分支点、第一3’剪接位点、剪接修饰剂的内含子识别元件(iREMS)、第二分支点和第二3’剪接位点,其中所述iREMS包含RNA序列GAgurngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,并且其中式(I)为:
或其形式,其中
W为CH=CH或S;
X为CH2、CH(C1-4烷基)、C(C1-4烷基)2、CH=CH、O、NR5或键;
A为芳基、杂芳基、杂环基或C9-10环烷基,
其中芳基选自苯基和萘基,其各自任选地被1、2、3或4个各自选自R1的取代基取代,
其中杂芳基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R1的取代基取代,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R2的取代基取代,和
其中C9-10环烷基为任选地被1、2、3、4或5个各自选自R2的取代基取代的饱和或部分不饱和二环环系;
B为杂环基,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或多环环系,其各自任选地被1、2、3、4或5个各自选自R4的取代基取代;
R1为卤素、羟基、氰基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、杂环基-C1-4烷氧基、苯基或苯基-C1-4烷氧基,
其中杂芳基为具有1、2或3个选自N、O和S的杂原子环成员的饱和单环或二环环系,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中苯基、杂芳基或杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R2为卤素、羟基、氰基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、羟基-C1-4烷基、C1-4烷氧基、C1-4烷氧基-羰基、C2-4烯基、C3-7环烷基或杂环基-C1-4烷基,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R3为卤素、羟基、硝基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、苯基或苯基-C1-4烷氧基;
R4独立地选自卤素、C1-4烷基、羟基-C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基或羟基-C1-4烷基-氨基;和
R5为氢、C1-4烷基或羟基-C1-4烷基;
其中化合物的形式选自其前药、盐、水合物、溶剂化物、包合物、同位素体、外消旋体、对映异构体、非对映异构体、立体异构体、多晶型物和互变异构体形式。
另一方面,本文提供了用于修饰RNA剪接以预防或治疗疾病或障碍的方法,其中由基因编码的一种、两种、三种或更多种RNA同种型的表达水平的改变有利于预防或治疗所述疾病,所述方法包括向有此需要的对象施用本文所述的化合物,其中所述一种、两种、三种或更多种RNA同种型由前体mRNA转录物产生,所述前体mRNA转录物包含两个外显子和内含子,其中第一外显子在内含子的上游,并且第二外显子在内含子的下游,其中所述内含子包含RNA核苷酸序列,所述RNA核苷酸序列按5’至3’顺序包含:剪接修饰剂的内含子识别元件(iREMS)、分支点和3’剪接位点,其中所述iREMS包含RNA序列GAgurngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,并且其中式(I)为:
或其形式,其中
W为CH=CH或S;
X为CH2、CH(C1-4烷基)、C(C1-4烷基)2、CH=CH、O、NR5或键;
A为芳基、杂芳基、杂环基或C9-10环烷基,
其中芳基选自苯基和萘基,其各自任选地被1、2、3或4个各自选自R1的取代基取代,
其中杂芳基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R1的取代基取代,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R2的取代基取代,和
其中C9-10环烷基为任选地被1、2、3、4或5个各自选自R2的取代基取代的饱和或部分不饱和二环环系;
B为杂环基,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或多环环系,其各自任选地被1、2、3、4或5个各自选自R4的取代基取代;
R1为卤素、羟基、氰基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、杂环基-C1-4烷氧基、苯基或苯基-C1-4烷氧基,
其中杂芳基为具有1、2或3个选自N、O和S的杂原子环成员的饱和单环或二环环系,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中苯基、杂芳基或杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R2为卤素、羟基、氰基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、羟基-C1-4烷基、C1-4烷氧基、C1-4烷氧基-羰基、C2-4烯基、C3-7环烷基或杂环基-C1-4烷基,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R3为卤素、羟基、硝基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、苯基或苯基-C1-4烷氧基;
R4独立地选自卤素、C1-4烷基、羟基-C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基或羟基-C1-4烷基-氨基;和
R5为氢、C1-4烷基或羟基-C1-4烷基;
其中化合物的形式选自其前药、盐、水合物、溶剂化物、包合物、同位素体、外消旋体、对映异构体、非对映异构体、立体异构体、多晶型物和互变异构体形式。
在前述方面的特定方面,所述内含子按5’至3’顺序还包含:5’剪接位点、分支点和iREMS上游的3’剪接位点。
另一方面,本文提供了用于修饰RNA剪接以预防或治疗疾病或障碍的方法,其中由基因编码的一种、两种、三种或更多种RNA同种型的表达水平的改变有利于预防或治疗所述疾病,所述方法包括向有此需要的对象施用本文所述的化合物,其中所述一种、两种、三种或更多种RNA同种型由前体mRNA转录物产生,所述前体mRNA转录物包含三个外显子和两个内含子,其中三个外显子和两个内含子按以下5’至3’的顺序为:第一外显子、第一内含子、第二外显子、第二内含子和第三外显子,其中所述第一内含子包含RNA核苷酸序列,所述RNA核苷酸序列按5’至3’顺序包含:第一5’剪接位点、第一分支点和第一3’剪接位点,其中所述第二内含子包含RNA核苷酸序列,所述RNA核苷酸序列按5’至3’顺序包含:第二5’剪接位点、剪接修饰剂的内含子识别元件(iREMS)、第二分支点和第二3’剪接位点,其中所述iREMS包含RNA序列GAgurngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,并且其中式(I)为:
或其形式,其中
W为CH=CH或S;
X为CH2、CH(C1-4烷基)、C(C1-4烷基)2、CH=CH、O、NR5或键;
A为芳基、杂芳基、杂环基或C9-10环烷基,
其中芳基选自苯基和萘基,其各自任选地被1、2、3或4个各自选自R1的取代基取代,
其中杂芳基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R1的取代基取代,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R2的取代基取代,和
其中C9-10环烷基为任选地被1、2、3、4或5个各自选自R2的取代基取代的饱和或部分不饱和二环环系;
B为杂环基,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或多环环系,其各自任选地被1、2、3、4或5个各自选自R4的取代基取代;
R1为卤素、羟基、氰基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、杂环基-C1-4烷氧基、苯基或苯基-C1-4烷氧基,
其中杂芳基为具有1、2或3个选自N、O和S的杂原子环成员的饱和单环或二环环系,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中苯基、杂芳基或杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R2为卤素、羟基、氰基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、羟基-C1-4烷基、C1-4烷氧基、C1-4烷氧基-羰基、C2-4烯基、C3-7环烷基或杂环基-C1-4烷基,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R3为卤素、羟基、硝基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、苯基或苯基-C1-4烷氧基;
R4独立地选自卤素、C1-4烷基、羟基-C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基或羟基-C1-4烷基-氨基;和
R5为氢、C1-4烷基或羟基-C1-4烷基;
其中化合物的形式选自其前药、盐、水合物、溶剂化物、包合物、同位素体、外消旋体、对映异构体、非对映异构体、立体异构体、多晶型物和互变异构体形式。
在一些方面,所述iREMS为内源iREMS。在其他方面,所述iREMS为非内源iREMS。
另一方面,本文提供了包含RNA序列别的人工基因构建体,所述RNA序列包含外显子和一个或多个内含子,其中至少一个内含子包含在分支点和3’剪接位点下游的iREMS,并且其中所述iREMS包含序列GAgurngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸。
另一方面,本文提供了包含RNA序列的人工基因构建体,所述RNA序列包含两个外显子和内含子,其中第一外显子在内含子的上游,并且第二外显子在内含子的下游,其中所述内含子的RNA核苷酸序列按5’至3’顺序包含:第一5’剪接位点、第一分支点、第一3’剪接位点、iREMS、第二分支点和第二3’剪接位点,其中所述iREMS包含RNA序列GAgurngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸。
另一方面,本文提供了包含RNA序列的人工基因构建体,所述RNA序列包含两个外显子和内含子,其中第一外显子在内含子的上游,并且第二外显子在内含子的下游,其中所述内含子的RNA核苷酸序列按5’至3’顺序包含:iREMS、分支点和3’剪接位点,其中所述iREMS包含RNA序列GAgurngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸。
另一方面,本文提供了包含本文所述的人工基因构建体的细胞。
在具体方面,所述iREMS包含RNA序列GAguragu,其中r为腺嘌呤或鸟嘌呤。
在另一个具体方面,所述iREMS包含RNA序列NNGAgurngn(SEQ ID NO:1),其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸。在具体方面,RNA序列NNGAgurngn(SEQ ID NO:1)选自:ANGAgurngn(SEQ ID NO:4)、CNGAgurngn(SEQ ID NO:5)、GNGAgurngn(SEQ ID NO:6)、UNGAgurngn(SEQ ID NO:7)、NAGAgurngn(SEQ ID NO:8)、NCGAgurngn(SEQ ID NO:9)、NGGAgurngn(SEQ ID NO:10)、NUGAgurngn(SEQ ID NO:11)、AAGAgurngn(SEQ ID NO:12)、ACGAgurngn(SEQ ID NO:13)、AGGAgurngn(SEQ ID NO:14)、AUGAgurngn(SEQ ID NO:15)、CAGAgurngn(SEQ ID NO:16)、CCGAgurngn(SEQ ID NO:17)、CGGAgurngn(SEQ ID NO:18)、CUGAgurngn(SEQ ID NO:19)、GAGAgurngn(SEQ ID NO:20)、GCGAgurngn(SEQ ID NO:21)、GGGAgurngn(SEQ ID NO:22)、GUGAgurngn(SEQ ID NO:23)、UAGAgurngn(SEQ ID NO:24)、UCGAgurngn(SEQ ID NO:25)、UGGAgurngn(SEQ ID NO:52)和UUGAgurngn(SEQ ID NO:53),其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸。
在另一个具体方面,所述iREMS包含RNA序列NNGAguragu(SEQ ID NO:2),其中r为腺嘌呤或鸟嘌呤,并且N为任何核苷酸。在具体方面,RNA序列NNGAguragu(SEQ ID NO:2)选自:ANGAguragu(SEQ ID NO:28)、CNGAguragu(SEQ ID NO:29)、GNGAguragu(SEQ ID NO:30)、UNGAguragu(SEQ ID NO:31)、NAGAguragu(SEQ ID NO:32)、NCGAguragu(SEQ ID NO:33)、NGGAguragu(SEQ ID NO:34)、NUGAguragu(SEQ ID NO:35)、AAGAguragu(SEQ ID NO:36)、ACGAguragu(SEQ ID NO:37)、AGGAguragu(SEQ ID NO:38)、AUGAguragu(SEQ ID NO:39)、CAGAguragu(SEQ ID NO:40)、CCGAguragu(SEQ ID NO:41)、CGGAguragu(SEQ ID NO:42)、CUGAguragu(SEQ ID NO:43)、GAGAguragu(SEQ ID NO:44)、GCGAguragu(SEQ ID NO:45)、GGGAguragu(SEQ ID NO:46)、GUGAguragu(SEQ ID NO:47)、UAGAguragu(SEQ ID NO:48)、UCGAguragu(SEQ ID NO:49)、UGGAguragu(SEQ ID NO:489)和UUGAguragu(SEQ ID NO:508),其中r为腺嘌呤或鸟嘌呤,并且N为任何核苷酸。
在某些方面,n为腺嘌呤或鸟嘌呤。
一方面,本文提供了用于修饰RNA剪接以产生具有iExon的成熟mRNA转录物的方法,所述方法包括使由DNA序列产生的前体mRNA转录物与式(I)的化合物或其形式接触,其中所述DNA序列编码两个外显子和内含子,其中编码第一外显子的核苷酸序列在编码内含子的核苷酸序列的上游,并且编码第二外显子的核苷酸序列在编码内含子的核苷酸序列的下游,其中所述编码内含子的核苷酸序列按5’至3’顺序包含:编码第一5’剪接位点的核苷酸序列、编码第一分支点的核苷酸序列、编码第一3’剪接位点的核苷酸序列、编码剪接修饰剂的内含子识别元件(iREMS)的核苷酸序列、编码第二分支点的核苷酸序列和编码第二3’剪接位点的核苷酸序列,其中编码iREMS的核苷酸序列包含DNA序列GAgtrngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,并且其中式(I)为:
或其形式,其中
W为CH=CH或S;
X为CH2、CH(C1-4烷基)、C(C1-4烷基)2、CH=CH、O、NR5或键;
A为芳基、杂芳基、杂环基或C9-10环烷基,
其中芳基选自苯基和萘基,其各自任选地被1、2、3或4个各自选自R1的取代基取代,
其中杂芳基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R1的取代基取代,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R2的取代基取代,和
其中C9-10环烷基为任选地被1、2、3、4或5个各自选自R2的取代基取代的饱和或部分不饱和二环环系;
B为杂环基,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或多环环系,其各自任选地被1、2、3、4或5个各自选自R4的取代基取代;
R1为卤素、羟基、氰基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、杂环基-C1-4烷氧基、苯基或苯基-C1-4烷氧基,
其中杂芳基为具有1、2或3个选自N、O和S的杂原子环成员的饱和单环或二环环系,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中苯基、杂芳基或杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R2为卤素、羟基、氰基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、羟基-C1-4烷基、C1-4烷氧基、C1-4烷氧基-羰基、C2-4烯基、C3-7环烷基或杂环基-C1-4烷基,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R3为卤素、羟基、硝基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、苯基或苯基-C1-4烷氧基;
R4独立地选自卤素、C1-4烷基、羟基-C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基或羟基-C1-4烷基-氨基;和
R5为氢、C1-4烷基或羟基-C1-4烷基;
其中化合物的形式选自其前药、盐、水合物、溶剂化物、包合物、同位素体、外消旋体、对映异构体、非对映异构体、立体异构体、多晶型物和互变异构体形式。
另一方面,本文提供了用于修饰RNA剪接以调节由前体mRNA转录物产生的成熟mRNA转录物的量的方法,所述前体mRNA转录物由DNA序列产生,所述方法包括使由所述DNA序列产生的前体mRNA转录物与式(I)的化合物或其形式接触,其中所述DNA序列编码两个外显子和内含子,其中编码第一外显子的核苷酸序列在编码内含子的核苷酸序列的上游,并且编码第二外显子的核苷酸序列在编码内含子的核苷酸序列的下游,其中编码所述内含子的核苷酸序列包含DNA核苷酸序列,所述DNA核苷酸序列按5’至3’顺序包含:编码剪接修饰剂的内含子识别元件(iREMS)的核苷酸序列、编码分支点的核苷酸序列和编码3’剪接位点的核苷酸序列,其中编码iREMS的核苷酸序列包含DNA序列GAgtrngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,并且其中式(I)为:
或其形式,其中
W为CH=CH或S;
X为CH2、CH(C1-4烷基)、C(C1-4烷基)2、CH=CH、O、NR5或键;
A为芳基、杂芳基、杂环基或C9-10环烷基,
其中芳基选自苯基和萘基,其各自任选地被1、2、3或4个各自选自R1的取代基取代,
其中杂芳基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R1的取代基取代,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R2的取代基取代,和
其中C9-10环烷基为任选地被1、2、3、4或5个各自选自R2的取代基取代的饱和或部分不饱和二环环系;
B为杂环基,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或多环环系,其各自任选地被1、2、3、4或5个各自选自R4的取代基取代;
R1为卤素、羟基、氰基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、杂环基-C1-4烷氧基、苯基或苯基-C1-4烷氧基,
其中杂芳基为具有1、2或3个选自N、O和S的杂原子环成员的饱和单环或二环环系,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中苯基、杂芳基或杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R2为卤素、羟基、氰基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、羟基-C1-4烷基、C1-4烷氧基、C1-4烷氧基-羰基、C2-4烯基、C3-7环烷基或杂环基-C1-4烷基,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R3为卤素、羟基、硝基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、苯基或苯基-C1-4烷氧基;
R4独立地选自卤素、C1-4烷基、羟基-C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基或羟基-C1-4烷基-氨基;和
R5为氢、C1-4烷基或羟基-C1-4烷基;
其中化合物的形式选自其前药、盐、水合物、溶剂化物、包合物、同位素体、外消旋体、对映异构体、非对映异构体、立体异构体、多晶型物和互变异构体形式。
在前述方面的特定方面,所述编码内含子的核苷酸序列按5’至3’顺序还包含:编码5’剪接位点的核苷酸序列、编码分支点的核苷酸序列和编码在编码iREMS的核苷酸序列上游的3’剪接位点的核苷酸序列。
另一方面,本文提供了用于修饰RNA剪接以调节由前体mRNA转录物产生的成熟mRNA转录物的量的方法,所述前体mRNA转录物由DNA序列产生,所述方法包括使由DNA序列产生的前体mRNA转录物与式(I)的化合物或其形式接触,其中所述DNA序列编码三个外显子和两个内含子,其中分别编码三个外显子和两个内含子的核苷酸序列按以下5’至3’的顺序为:编码第一外显子的核苷酸序列、编码第一内含子的核苷酸序列、编码第二外显子的核苷酸序列、编码第二内含子的核苷酸序列和编码第三外显子的核苷酸序列,其中编码第一内含子的核苷酸序列包含DNA核苷酸序列,所述DNA核苷酸序列按5’至3’顺序包含:编码第一5’剪接位点的核苷酸序列、编码第一分支点的核苷酸序列和编码第一3’剪接位点的核苷酸序列,其中编码第二内含子的核苷酸序列包含DNA核苷酸序列,所述DNA核苷酸序列按5’至3’顺序包含:编码第二5’剪接位点的核苷酸序列、编码剪接修饰剂的内含子识别元件(iREMS)的核苷酸序列、编码第二分支点的核苷酸序列和编码第二3’剪接位点的核苷酸序列,其中编码iREMS的核苷酸序列包含DNA序列GAgtrngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,并且其中式(I)为:
或其形式,其中
W为CH=CH或S;
X为CH2、CH(C1-4烷基)、C(C1-4烷基)2、CH=CH、O、NR5或键;
A为芳基、杂芳基、杂环基或C9-10环烷基,
其中芳基选自苯基和萘基,其各自任选地被1、2、3或4个各自选自R1的取代基取代,
其中杂芳基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R1的取代基取代,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R2的取代基取代,和
其中C9-10环烷基为任选地被1、2、3、4或5个各自选自R2的取代基取代的饱和或部分不饱和二环环系;
B为杂环基,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或多环环系,其各自任选地被1、2、3、4或5个各自选自R4的取代基取代;
R1为卤素、羟基、氰基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、杂环基-C1-4烷氧基、苯基或苯基-C1-4烷氧基,
其中杂芳基为具有1、2或3个选自N、O和S的杂原子环成员的饱和单环或二环环系,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中苯基、杂芳基或杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R2为卤素、羟基、氰基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、羟基-C1-4烷基、C1-4烷氧基、C1-4烷氧基-羰基、C2-4烯基、C3-7环烷基或杂环基-C1-4烷基,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R3为卤素、羟基、硝基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、苯基或苯基-C1-4烷氧基;
R4独立地选自卤素、C1-4烷基、羟基-C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基或羟基-C1-4烷基-氨基;和
R5为氢、C1-4烷基或羟基-C1-4烷基;
其中化合物的形式选自其前药、盐、水合物、溶剂化物、包合物、同位素体、外消旋体、对映异构体、非对映异构体、立体异构体、多晶型物和互变异构体形式。
在一些方面,编码iREMS的核苷酸序列是编码内源iREMS的核苷酸序列。在其他方面,编码iREMS的核苷酸序列是编码非内源iREMS的核苷酸序列。
另一方面,本文提供了用于修饰RNA剪接以产生具有iExon的成熟mRNA转录物的方法,所述方法包括使由DNA序列产生的前体mRNA转录物与式(I)的化合物或其形式接触,其中所述DNA序列编码两个外显子和内含子,其中编码第一外显子的核苷酸序列在编码内含子的核苷酸序列的上游,并且编码第二外显子的核苷酸序列在编码内含子的核苷酸序列的下游,其中所述编码内含子的核苷酸序列按5’至3’顺序包含:编码第一5’剪接位点的核苷酸序列、编码第一分支点的核苷酸序列、编码第一3’剪接位点的核苷酸序列、编码内源剪接修饰剂的内含子识别元件(iREMS)的核苷酸序列、编码第二分支点的核苷酸序列和编码第二3’剪接位点的核苷酸序列,其中编码iREMS的核苷酸序列包含DNA序列GAgtrngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,其中所述DNA序列是选自本文表中所列基因的基因的DNA序列,并且其中式(I)为:
或其形式,其中
W为CH=CH或S;
X为CH2、CH(C1-4烷基)、C(C1-4烷基)2、CH=CH、O、NR5或键;
A为芳基、杂芳基、杂环基或C9-10环烷基,
其中芳基选自苯基和萘基,其各自任选地被1、2、3或4个各自选自R1的取代基取代,
其中杂芳基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R1的取代基取代,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R2的取代基取代,和
其中C9-10环烷基为任选地被1、2、3、4或5个各自选自R2的取代基取代的饱和或部分不饱和二环环系;
B为杂环基,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或多环环系,其各自任选地被1、2、3、4或5个各自选自R4的取代基取代;
R1为卤素、羟基、氰基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、杂环基-C1-4烷氧基、苯基或苯基-C1-4烷氧基,
其中杂芳基为具有1、2或3个选自N、O和S的杂原子环成员的饱和单环或二环环系,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中苯基、杂芳基或杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R2为卤素、羟基、氰基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、羟基-C1-4烷基、C1-4烷氧基、C1-4烷氧基-羰基、C2-4烯基、C3-7环烷基或杂环基-C1-4烷基,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R3为卤素、羟基、硝基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、苯基或苯基-C1-4烷氧基;
R4独立地选自卤素、C1-4烷基、羟基-C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基或羟基-C1-4烷基-氨基;和
R5为氢、C1-4烷基或羟基-C1-4烷基;
其中化合物的形式选自其前药、盐、水合物、溶剂化物、包合物、同位素体、外消旋体、对映异构体、非对映异构体、立体异构体、多晶型物和互变异构体形式。
另一方面,本文提供了用于修饰RNA剪接以调节由前体mRNA转录物产生的成熟mRNA转录物的量的方法,所述前体mRNA转录物由DNA序列产生,所述方法包括使由DNA序列产生的前体mRNA转录物与式(I)的化合物或其形式接触,其中所述DNA序列编码两个外显子和内含子,其中编码第一外显子的核苷酸序列在编码内含子的核苷酸序列的上游,并且编码第二外显子的核苷酸序列在编码内含子的核苷酸序列的下游,其中编码所述内含子的核苷酸序列包含DNA核苷酸序列,所述DNA核苷酸序列按5’至3’顺序包含:编码内源或非内源剪接修饰剂的内含子识别元件(iREMS)的核苷酸序列、编码分支点的核苷酸序列和编码3’剪接位点的核苷酸序列,其中编码iREMS的核苷酸序列包含DNA序列GAgtrngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,其中所述DNA序列是选自本文表中所列基因的基因的DNA序列,并且其中式(I)为:
或其形式,其中
W为CH=CH或S;
X为CH2、CH(C1-4烷基)、C(C1-4烷基)2、CH=CH、O、NR5或键;
A为芳基、杂芳基、杂环基或C9-10环烷基,
其中芳基选自苯基和萘基,其各自任选地被1、2、3或4个各自选自R1的取代基取代,
其中杂芳基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R1的取代基取代,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R2的取代基取代,和
其中C9-10环烷基为任选地被1、2、3、4或5个各自选自R2的取代基取代的饱和或部分不饱和二环环系;
B为杂环基,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或多环环系,其各自任选地被1、2、3、4或5个各自选自R4的取代基取代;
R1为卤素、羟基、氰基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、杂环基-C1-4烷氧基、苯基或苯基-C1-4烷氧基,
其中杂芳基为具有1、2或3个选自N、O和S的杂原子环成员的饱和单环或二环环系,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中苯基、杂芳基或杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R2为卤素、羟基、氰基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、羟基-C1-4烷基、C1-4烷氧基、C1-4烷氧基-羰基、C2-4烯基、C3-7环烷基或杂环基-C1-4烷基,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R3为卤素、羟基、硝基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、苯基或苯基-C1-4烷氧基;
R4独立地选自卤素、C1-4烷基、羟基-C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基或羟基-C1-4烷基-氨基;和
R5为氢、C1-4烷基或羟基-C1-4烷基;
其中化合物的形式选自其前药、盐、水合物、溶剂化物、包合物、同位素体、外消旋体、对映异构体、非对映异构体、立体异构体、多晶型物和互变异构体形式。
在前述方面的特定方面,所述编码内含子的核苷酸序列按5’至3’顺序还包含:编码5’剪接位点的核苷酸序列、编码分支点的核苷酸序列和编码在编码iREMS的核苷酸序列上游的3’剪接位点的核苷酸序列。
另一方面,本文提供了用于修饰RNA剪接以调节由前体mRNA转录物产生的成熟mRNA转录物的量的方法,所述前体mRNA转录物由DNA序列产生,所述方法包括使由DNA序列产生的前体mRNA转录物与式(I)的化合物或其形式接触,其中所述DNA序列编码三个外显子和两个内含子,其中分别编码三个外显子和两个内含子的核苷酸序列按以下5’至3’的顺序为:编码第一外显子的核苷酸序列、编码第一内含子的核苷酸序列、编码第二外显子的核苷酸序列、编码第二内含子的核苷酸序列和编码第三外显子的核苷酸序列,其中所述编码第一内含子的核苷酸序列包含DNA核苷酸序列,所述DNA核苷酸序列按5’至3’顺序包含:编码第一5’剪接位点的核苷酸序列、编码第一分支点的核苷酸序列和编码第一3’剪接位点的核苷酸序列,其中所述编码第二内含子的核苷酸序列包含DNA核苷酸序列,所述DNA核苷酸序列按5’至3’顺序包含:编码第二5’剪接位点的核苷酸序列、编码内源或非内源剪接修饰剂的内含子识别元件(iREMS)的核苷酸序列、编码第二分支点的核苷酸序列和编码第二3’剪接位点的核苷酸序列,其中所述编码iREMS的核苷酸序列包含DNA序列GAgtrngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,其中所述DNA序列是选自本文表中所列基因的基因的DNA序列,并且其中式(I)为:
或其形式,其中
W为CH=CH或S;
X为CH2、CH(C1-4烷基)、C(C1-4烷基)2、CH=CH、O、NR5或键;
A为芳基、杂芳基、杂环基或C9-10环烷基,
其中芳基选自苯基和萘基,其各自任选地被1、2、3或4个各自选自R1的取代基取代,
其中杂芳基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R1的取代基取代,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R2的取代基取代,和
其中C9-10环烷基为任选地被1、2、3、4或5个各自选自R2的取代基取代的饱和或部分不饱和二环环系;
B为杂环基,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或多环环系,其各自任选地被1、2、3、4或5个各自选自R4的取代基取代;
R1为卤素、羟基、氰基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、杂环基-C1-4烷氧基、苯基或苯基-C1-4烷氧基,
其中杂芳基为具有1、2或3个选自N、O和S的杂原子环成员的饱和单环或二环环系,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中苯基、杂芳基或杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R2为卤素、羟基、氰基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、羟基-C1-4烷基、C1-4烷氧基、C1-4烷氧基-羰基、C2-4烯基、C3-7环烷基或杂环基-C1-4烷基,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R3为卤素、羟基、硝基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、苯基或苯基-C1-4烷氧基;
R4独立地选自卤素、C1-4烷基、羟基-C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基或羟基-C1-4烷基-氨基;和
R5为氢、C1-4烷基或羟基-C1-4烷基;
其中化合物的形式选自其前药、盐、水合物、溶剂化物、包合物、同位素体、外消旋体、对映异构体、非对映异构体、立体异构体、多晶型物和互变异构体形式。
另一方面,本文提供了用于修饰RNA剪接以产生具有iExon的成熟mRNA转录物的方法,所述方法包括使由DNA序列产生的前体mRNA转录物与式(I)的化合物或其形式接触,其中所述DNA序列编码两个外显子和内含子,其中编码第一外显子的核苷酸序列在编码内含子的核苷酸序列的上游,并且编码第二外显子的核苷酸序列在编码内含子的核苷酸序列的下游,其中所述编码内含子的核苷酸序列按5’至3’顺序包含:编码第一5’剪接位点的核苷酸序列、编码第一分支点的核苷酸序列、编码第一3’剪接位点的核苷酸序列、编码非内源剪接修饰剂的内含子识别元件(iREMS)的核苷酸序列、编码第二分支点的核苷酸序列和编码第二3’剪接位点的核苷酸序列,其中所述编码iREMS的核苷酸序列包含DNA序列GAgtrngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,并且其中式(I)为:
或其形式,其中
W为CH=CH或S;
X为CH2、CH(C1-4烷基)、C(C1-4烷基)2、CH=CH、O、NR5或键;
A为芳基、杂芳基、杂环基或C9-10环烷基,
其中芳基选自苯基和萘基,其各自任选地被1、2、3或4个各自选自R1的取代基取代,
其中杂芳基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R1的取代基取代,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R2的取代基取代,和
其中C9-10环烷基为任选地被1、2、3、4或5个各自选自R2的取代基取代的饱和或部分不饱和二环环系;
B为杂环基,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或多环环系,其各自任选地被1、2、3、4或5个各自选自R4的取代基取代;
R1为卤素、羟基、氰基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、杂环基-C1-4烷氧基、苯基或苯基-C1-4烷氧基,
其中杂芳基为具有1、2或3个选自N、O和S的杂原子环成员的饱和单环或二环环系,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中苯基、杂芳基或杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R2为卤素、羟基、氰基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、羟基-C1-4烷基、C1-4烷氧基、C1-4烷氧基-羰基、C2-4烯基、C3-7环烷基或杂环基-C1-4烷基,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R3为卤素、羟基、硝基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、苯基或苯基-C1-4烷氧基;
R4独立地选自卤素、C1-4烷基、羟基-C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基或羟基-C1-4烷基-氨基;和
R5为氢、C1-4烷基或羟基-C1-4烷基;
其中化合物的形式选自其前药、盐、水合物、溶剂化物、包合物、同位素体、外消旋体、对映异构体、非对映异构体、立体异构体、多晶型物和互变异构体形式。
另一方面,本文提供了用于修饰RNA剪接以调节由前体mRNA转录物产生的成熟mRNA转录物的量的方法,所述前体mRNA转录物由DNA序列产生,所述方法包括使由DNA序列产生的前体mRNA转录物与式(I)的化合物或其形式接触,其中所述DNA序列编码两个外显子和内含子,其中编码第一外显子的核苷酸序列在编码内含子的核苷酸序列的上游,并且编码第二外显子的核苷酸序列在编码内含子的核苷酸序列的下游,其中编码所述内含子的核苷酸序列包含DNA核苷酸序列,所述DNA核苷酸序列按5’至3’顺序包含:编码内源或非内源剪接修饰剂的内含子识别元件(iREMS)的核苷酸序列、编码分支点的核苷酸序列和编码3’剪接位点的核苷酸序列,其中所述编码iREMS的核苷酸序列包含DNA序列GAgtrngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,并且其中式(I)为:
或其形式,其中
W为CH=CH或S;
X为CH2、CH(C1-4烷基)、C(C1-4烷基)2、CH=CH、O、NR5或键;
A为芳基、杂芳基、杂环基或C9-10环烷基,
其中芳基选自苯基和萘基,其各自任选地被1、2、3或4个各自选自R1的取代基取代,
其中杂芳基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R1的取代基取代,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R2的取代基取代,和
其中C9-10环烷基为任选地被1、2、3、4或5个各自选自R2的取代基取代的饱和或部分不饱和二环环系;
B为杂环基,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或多环环系,其各自任选地被1、2、3、4或5个各自选自R4的取代基取代;
R1为卤素、羟基、氰基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、杂环基-C1-4烷氧基、苯基或苯基-C1-4烷氧基,
其中杂芳基为具有1、2或3个选自N、O和S的杂原子环成员的饱和单环或二环环系,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中苯基、杂芳基或杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R2为卤素、羟基、氰基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、羟基-C1-4烷基、C1-4烷氧基、C1-4烷氧基-羰基、C2-4烯基、C3-7环烷基或杂环基-C1-4烷基,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R3为卤素、羟基、硝基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、苯基或苯基-C1-4烷氧基;
R4独立地选自卤素、C1-4烷基、羟基-C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基或羟基-C1-4烷基-氨基;和
R5为氢、C1-4烷基或羟基-C1-4烷基;
其中化合物的形式选自其前药、盐、水合物、溶剂化物、包合物、同位素体、外消旋体、对映异构体、非对映异构体、立体异构体、多晶型物和互变异构体形式。
在前述方面的特定方面,所述编码内含子的核苷酸序列按5’至3’顺序还包含:编码5’剪接位点的核苷酸序列、编码分支点的核苷酸序列和编码iREMS上游的3’剪接位点的核苷酸序列。
另一方面,本文提供了用于修饰RNA剪接以调节由前体mRNA转录物产生的成熟mRNA转录物的量的方法,所述前体mRNA转录物由DNA序列产生,所述方法包括使由DNA序列产生的前体mRNA转录物与式(I)的化合物或其形式接触,其中所述DNA序列编码三个外显子和两个内含子,其中分别编码三个外显子和两个内含子的核苷酸序列按以下5’至3’的顺序为:编码第一外显子的核苷酸序列、编码第一内含子的核苷酸序列、编码第二外显子的核苷酸序列、编码第二内含子的核苷酸序列和编码第三外显子的核苷酸序列,其中所述编码第一内含子的核苷酸序列包含DNA核苷酸序列,所述DNA核苷酸序列按5’至3’顺序包含:编码第一5’剪接位点的核苷酸序列、编码第一分支点的核苷酸序列和编码第一3’剪接位点的核苷酸序列,其中编码所述第二内含子的核苷酸序列包含DNA核苷酸序列,所述DNA核苷酸序列按5’至3’顺序包含:编码第二5’剪接位点的核苷酸序列、编码内源或非内源剪接修饰剂的内含子识别元件(iREMS)的核苷酸序列、编码第二分支点的核苷酸序列和编码第二3’剪接位点的核苷酸序列,其中所述编码iREMS的核苷酸序列包含DNA序列GAgtrngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,并且其中式(I)为:
或其形式,其中
W为CH=CH或S;
X为CH2、CH(C1-4烷基)、C(C1-4烷基)2、CH=CH、O、NR5或键;
A为芳基、杂芳基、杂环基或C9-10环烷基,
其中芳基选自苯基和萘基,其各自任选地被1、2、3或4个各自选自R1的取代基取代,
其中杂芳基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R1的取代基取代,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R2的取代基取代,和
其中C9-10环烷基为任选地被1、2、3、4或5个各自选自R2的取代基取代的饱和或部分不饱和二环环系;
B为杂环基,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或多环环系,其各自任选地被1、2、3、4或5个各自选自R4的取代基取代;
R1为卤素、羟基、氰基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、杂环基-C1-4烷氧基、苯基或苯基-C1-4烷氧基,
其中杂芳基为具有1、2或3个选自N、O和S的杂原子环成员的饱和单环或二环环系,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中苯基、杂芳基或杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R2为卤素、羟基、氰基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、羟基-C1-4烷基、C1-4烷氧基、C1-4烷氧基-羰基、C2-4烯基、C3-7环烷基或杂环基-C1-4烷基,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R3为卤素、羟基、硝基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、苯基或苯基-C1-4烷氧基;
R4独立地选自卤素、C1-4烷基、羟基-C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基或羟基-C1-4烷基-氨基;和
R5为氢、C1-4烷基或羟基-C1-4烷基;
其中化合物的形式选自其前药、盐、水合物、溶剂化物、包合物、同位素体、外消旋体、对映异构体、非对映异构体、立体异构体、多晶型物和互变异构体形式。
在具体方面,所述前体mRNA转录物在细胞或细胞的裂解物中,并且所述方法包括使化合物与细胞或细胞裂解物接触。在具体方面,所述方法调节由成熟mRNA转录物产生的和在细胞或细胞的裂解物中产生的蛋白的量和/修饰由成熟mRNA转录物产生的和在细胞或细胞的裂解物中产生的蛋白的类型。
在具体方面,所述方法包括向对象施用所述化合物。在具体方面,所述方法调节由成熟mRNA转录物产生的和在对象中产生的蛋白的量和/或修饰由成熟mRNA转录物产生的和在对象中产生的蛋白的类型。一方面,所述对象是非人类对象。另一方面,所述对象是人类对象。
在具体方面,所述成熟mRNA转录物编码可检测的报告蛋白。
另一方面,本文提供了用于修饰RNA剪接以预防或治疗疾病或障碍的方法,其中由基因编码的一种、两种、三种或更多种RNA同种型的表达水平的改变有利于预防或治疗所述疾病,所述方法包括向有此需要的对象施用本文所述的化合物,其中所述一种、两种、三种或更多种RNA同种型由前体mRNA转录物产生,所述前体mRNA转录物由编码两个外显子和内含子的DNA序列产生,其中编码第一外显子的核苷酸序列在编码内含子的核苷酸序列的上游,并且编码第二外显子的核苷酸序列在编码内含子的核苷酸序列的下游,其中所述编码内含子的核苷酸序列按5’至3’顺序包含:编码第一5’剪接位点的核苷酸序列、编码第一分支点的核苷酸序列、编码第一3’剪接位点的核苷酸序列、编码剪接修饰剂的内含子识别元件(iREMS)的核苷酸序列、编码第二分支点的核苷酸序列和编码第二3’剪接位点的核苷酸序列,其中所述编码iREMS的核苷酸序列包含DNA序列GAgtrngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,并且其中式(I)为:
或其形式,其中
W为CH=CH或S;
X为CH2、CH(C1-4烷基)、C(C1-4烷基)2、CH=CH、O、NR5或键;
A为芳基、杂芳基、杂环基或C9-10环烷基,
其中芳基选自苯基和萘基,其各自任选地被1、2、3或4个各自选自R1的取代基取代,
其中杂芳基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R1的取代基取代,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R2的取代基取代,和
其中C9-10环烷基为任选地被1、2、3、4或5个各自选自R2的取代基取代的饱和或部分不饱和二环环系;
B为杂环基,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或多环环系,其各自任选地被1、2、3、4或5个各自选自R4的取代基取代;
R1为卤素、羟基、氰基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、杂环基-C1-4烷氧基、苯基或苯基-C1-4烷氧基,
其中杂芳基为具有1、2或3个选自N、O和S的杂原子环成员的饱和单环或二环环系,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中苯基、杂芳基或杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R2为卤素、羟基、氰基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、羟基-C1-4烷基、C1-4烷氧基、C1-4烷氧基-羰基、C2-4烯基、C3-7环烷基或杂环基-C1-4烷基,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R3为卤素、羟基、硝基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、苯基或苯基-C1-4烷氧基;
R4独立地选自卤素、C1-4烷基、羟基-C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基或羟基-C1-4烷基-氨基;和
R5为氢、C1-4烷基或羟基-C1-4烷基;
其中化合物的形式选自其前药、盐、水合物、溶剂化物、包合物、同位素体、外消旋体、对映异构体、非对映异构体、立体异构体、多晶型物和互变异构体形式。
另一方面,本文提供了用于修饰RNA剪接以预防或治疗疾病或障碍的方法,其中由基因编码的一种、两种、三种或更多种RNA同种型的表达水平的改变有利于预防或治疗所述疾病,所述方法包括向有此需要的对象施用本文所述的化合物,其中所述一种、两种、三种或更多种RNA同种型由前体mRNA转录物产生,所述前体mRNA转录物由编码两个外显子和内含子的DNA序列产生,其中编码第一外显子的核苷酸序列在编码内含子的核苷酸序列的上游,并且编码第二外显子的核苷酸序列在编码内含子的核苷酸序列的下游,其中编码所述内含子的核苷酸序列包含DNA核苷酸序列,所述DNA核苷酸序列按5’至3’顺序包含:编码剪接修饰剂的内含子识别元件(iREMS)的核苷酸序列、编码分支点的核苷酸序列和编码3’剪接位点的核苷酸序列,其中编码iREMS的核苷酸序列包含DNA序列GAgtrngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,并且其中式(I)为:
或其形式,其中
W为CH=CH或S;
X为CH2、CH(C1-4烷基)、C(C1-4烷基)2、CH=CH、O、NR5或键;
A为芳基、杂芳基、杂环基或C9-10环烷基,
其中芳基选自苯基和萘基,其各自任选地被1、2、3或4个各自选自R1的取代基取代,
其中杂芳基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R1的取代基取代,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R2的取代基取代,和
其中C9-10环烷基为任选地被1、2、3、4或5个各自选自R2的取代基取代的饱和或部分不饱和二环环系;
B为杂环基,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或多环环系,其各自任选地被1、2、3、4或5个各自选自R4的取代基取代;
R1为卤素、羟基、氰基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、杂环基-C1-4烷氧基、苯基或苯基-C1-4烷氧基,
其中杂芳基为具有1、2或3个选自N、O和S的杂原子环成员的饱和单环或二环环系,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中苯基、杂芳基或杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R2为卤素、羟基、氰基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、羟基-C1-4烷基、C1-4烷氧基、C1-4烷氧基-羰基、C2-4烯基、C3-7环烷基或杂环基-C1-4烷基,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R3为卤素、羟基、硝基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、苯基或苯基-C1-4烷氧基;
R4独立地选自卤素、C1-4烷基、羟基-C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基或羟基-C1-4烷基-氨基;和
R5为氢、C1-4烷基或羟基-C1-4烷基;
其中化合物的形式选自其前药、盐、水合物、溶剂化物、包合物、同位素体、外消旋体、对映异构体、非对映异构体、立体异构体、多晶型物和互变异构体形式。
在前述方面的特定方面,所述编码内含子的核苷酸序列按5’至3’顺序还包含:编码5’剪接位点的核苷酸序列、编码分支点的核苷酸序列和编码在编码iREMS的核苷酸序列上游的3’剪接位点的核苷酸序列。
另一方面,本文提供了用于修饰RNA剪接以预防或治疗疾病或障碍的方法,其中由基因编码的一种、两种、三种或更多种RNA同种型的表达水平的改变有利于预防或治疗所述疾病,所述方法包括向有此需要的对象施用本文所述的化合物,其中所述一种、两种、三种或更多种RNA同种型由前体mRNA转录物产生,所述前体mRNA转录物由编码三个外显子和两个内含子的DNA序列产生,其中分别编码三个外显子和两个内含子的核苷酸序列按以下5’至3’的顺序为:编码第一外显子的核苷酸序列、编码第一内含子的核苷酸序列、编码第二外显子的核苷酸序列、编码第二内含子的核苷酸序列和编码第三外显子的核苷酸序列,其中所述编码第一内含子的核苷酸序列包含DNA核苷酸序列,所述DNA核苷酸序列按5’至3’顺序包含:编码第一5’剪接位点的核苷酸序列、编码第一分支点的核苷酸序列和编码第一3’剪接位点的核苷酸序列,其中编码所述第二内含子的核苷酸序列包含DNA核苷酸序列,所述DNA核苷酸序列按5’至3’顺序包含:编码第二5’剪接位点的核苷酸序列、编码剪接修饰剂的内含子识别元件(iREMS)的核苷酸序列、编码第二分支点的核苷酸序列和编码第二3’剪接位点的核苷酸序列,其中所述编码iREMS的核苷酸序列包含DNA序列GAgtrngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,并且其中式(I)为:
或其形式,其中
W为CH=CH或S;
X为CH2、CH(C1-4烷基)、C(C1-4烷基)2、CH=CH、O、NR5或键;
A为芳基、杂芳基、杂环基或C9-10环烷基,
其中芳基选自苯基和萘基,其各自任选地被1、2、3或4个各自选自R1的取代基取代,
其中杂芳基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R1的取代基取代,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R2的取代基取代,和
其中C9-10环烷基为任选地被1、2、3、4或5个各自选自R2的取代基取代的饱和或部分不饱和二环环系;
B为杂环基,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或多环环系,其各自任选地被1、2、3、4或5个各自选自R4的取代基取代;
R1为卤素、羟基、氰基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、杂环基-C1-4烷氧基、苯基或苯基-C1-4烷氧基,
其中杂芳基为具有1、2或3个选自N、O和S的杂原子环成员的饱和单环或二环环系,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中苯基、杂芳基或杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R2为卤素、羟基、氰基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、羟基-C1-4烷基、C1-4烷氧基、C1-4烷氧基-羰基、C2-4烯基、C3-7环烷基或杂环基-C1-4烷基,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R3为卤素、羟基、硝基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、苯基或苯基-C1-4烷氧基;
R4独立地选自卤素、C1-4烷基、羟基-C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基或羟基-C1-4烷基-氨基;和
R5为氢、C1-4烷基或羟基-C1-4烷基;
其中化合物的形式选自其前药、盐、水合物、溶剂化物、包合物、同位素体、外消旋体、对映异构体、非对映异构体、立体异构体、多晶型物和互变异构体形式。
在一些方面,编码iREMS的核苷酸序列为编码iREMS的内源核苷酸序列。在其他方面,编码iREMS的核苷酸序列为编码iREMS的非内源核苷酸序列。
另一方面,本文提供了包含编码外显子和一个或多个内含子的DNA序列的人工基因构建体,其中编码至少一个内含子的核苷酸序列包含编码iREMS的核苷酸序列,该核苷酸序列在编码分支点的核苷酸序列和编码3’剪接位点的核苷酸序列的下游,并且其中编码iREMS的核苷酸序列包含序列GAgtrngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸。
另一方面,本文提供了包含编码两个外显子和内含子的DNA序列的人工基因构建体,其中编码第一外显子的核苷酸序列在编码内含子的核苷酸序列的上游,并且编码第二外显子的核苷酸序列在编码内含子的核苷酸序列的下游,其中编码内含子的DNA核苷酸序列按5’至3’顺序包含:编码第一5’剪接位点的核苷酸序列、编码第一分支点的核苷酸序列、编码第一3’剪接位点的核苷酸序列、编码iREMS的核苷酸序列、编码第二分支点的核苷酸序列和编码第二3’剪接位点的核苷酸序列,其中编码iREMS的核苷酸序列包含DNA序列GAgtrngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸。
另一方面,本文提供了包含编码两个外显子和内含子的DNA序列的人工基因构建体,其中编码第一外显子的核苷酸序列在编码内含子的核苷酸序列的上游,并且编码第二外显子的核苷酸序列在编码内含子的核苷酸序列的下游,其中编码内含子的DNA核苷酸序列按5’至3’顺序包含:编码iREMS的核苷酸序列、编码分支点的核苷酸序列和编码3’剪接位点的核苷酸序列,其中编码iREMS的核苷酸序列包含DNA序列GAgtrngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸。
另一方面,本文提供了包含本文所述的人工基因构建体的细胞。
在具体方面,编码iREMS的核苷酸序列包含DNA序列GAgtragu,其中r为腺嘌呤或鸟嘌呤。
在另一个具体方面,编码iREMS的核苷酸序列包含DNA序列NNGAgtrngn(SEQ IDNO:1808),其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸。在具体方面,DNA序列NNGAgtrngn(SEQ ID NO:1808)选自:ANGAgtrngn(SEQ ID NO:1809)、CNGAgtrngn(SEQ IDNO:1810)、GNGAgtrngn(SEQ ID NO:1811)、TNGAgtrngn(SEQ ID NO:1812)、NAGAgtrngn(SEQID NO:1813)、NCGAgtrngn(SEQ ID NO:1814)、NGGAgtrngn(SEQ ID NO:1815)、NTGAgtrngn(SEQ ID NO:1816)、AAGAgtrngn(SEQ ID NO:1817)、ACGAgtrngn(SEQ ID NO:1818)、AGGAgtrngn(SEQ ID NO:1819)、ATGAgtrngn(SEQ ID NO:1820)、CAGAgtrngn(SEQ ID NO:1821)、CCGAgtrngn(SEQ ID NO:1822)、CGGAgtrngn(SEQ ID NO:1823)、CTGAgtrngn(SEQ IDNO:1824)、GAGAgtrngn(SEQ ID NO:1825)、GCGAgtrngn(SEQ ID NO:1826)、GGGAgtrngn(SEQID NO:1827)、GTGAgtrngn(SEQ ID NO:1828)、TAGAgtrngn(SEQ ID NO:1829)、TCGAgtrngn(SEQ ID NO:1830)、TGGAgtrngn(SEQ ID NO:1831)和TTGAgtrngn(SEQ ID NO:1832),其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸。
在另一个具体方面,编码iREMS的核苷酸序列包含DNA序列NNGAgtragu(SEQ IDNO:3609),其中r为腺嘌呤或鸟嘌呤,并且N为任何核苷酸。在具体方面,DNA序列NNGAgtragu(SEQ ID NO:3609)选自:ANGAgtragu(SEQ ID NO:3610)、CNGAgtragu(SEQ ID NO:3611)、GNGAgtragu(SEQ ID NO:3612)、TNGAgtragu(SEQ ID NO:3613)、NAGAgtragu(SEQ ID NO:3614)、NCGAgtragu(SEQ ID NO:3615)、NGGAgtragu(SEQ ID NO:3616)、NTGAgtragu(SEQ IDNO:3617)、AAGAgtragu(SEQ ID NO:3618)、ACGAgtragu(SEQ ID NO:3619)、AGGAgtragu(SEQID NO:3620)、ATGAgtragu(SEQ ID NO:3621)、CAGAgtragu(SEQ ID NO:3622)、CCGAgtragu(SEQ ID NO:3623)、CGGAgtragu(SEQ ID NO:3624)、CTGAgtragu(SEQ ID NO:3625)、GAGAgtragu(SEQ ID NO:3626)、GCGAgtragu(SEQ ID NO:3627)、GGGAgtragu(SEQ ID NO:3628)、GTGAgtragu(SEQ ID NO:3629)、TAGAgtragu(SEQ ID NO:3630)、TCGAgtragu(SEQ IDNO:3631)、TGGAgtragu(SEQ ID NO:3632)和TTGAgtragu(SEQ ID NO:3633),其中r为腺嘌呤或鸟嘌呤,并且N为任何核苷酸。
在某些方面,n为腺嘌呤或鸟嘌呤。
在具体方面,本文所述的前体mRNA转录物不是选自以下的基因的前体mRNA转录物:ABHD10、ADAM12、AKT1、ANXA11、APLP2、APPL2、ARMCX6、ATG5、AXIN1、BAIAP2、CCNB1IP1、CCT7、CEP57、CSF1、DLGAP4、EPN1、ERGIC3、FOXM1、GGCT、GRAMD3、HSD17B4、LARP7、LRRC42、MADD、MAN1B1、MRPL39、PCBP4、PPHLN1、PRKACB、RAB23、RAP1A、RCC1、SMN2、SREK1、STRN3和TNRC6A。
附图说明
图1A-1C.内含子REMS介导的内含外显子剪接的代表性示意图,其中5’ss表示5’剪接位点;3’ss表示3’剪接位点;BP表示剪接分支点;外显子1e和外显子2e表示eExon;并且iExon 1a表示内含外显子。在本文所述的化合物不存在的情况下由内含子REMS介导的剪接事件由连接外显子的实线表示,在本文所述的化合物的存在下由内含子REMS介导的剪接事件由连接外显子和eExon或iExon的虚线表示。
图2A、2B、3A、3B、4A、4B、5A、5B和6A.图2A、2B、3A、3B、4A、4B中显示了用本文所述的化合物处理20个小时的SH-SY5Y细胞中特定基因的iExon的剂量依赖性产生。图5A和5B中显示了用本文所述的化合物处理20个小时的GM04856细胞中特定基因的iExon的剂量依赖性产生。图6A中显示了用本文所述的化合物处理20个小时的SH-SY5Y细胞中基因ELMO2的iExon的剂量依赖性产生。对于每幅附图,总RNA的终点RT-PCR显示每种基因产生的目的条带,如空心箭头和实心箭头所示,其中空心箭头表示其中发生内源野生型剪接的外显子同种型;并且,其中实心箭头表示在mRNA中包含iExon的外显子同种型。在所有情况下,化合物浓度的增加都会导致包含内含子衍生的外显子的迁移较慢的PCR产物的出现,其中看到的其他条带是中间剪接产物。在一些图中,星号(*)表示跳过目标外显子的事件。因此,每种基因的结果证明了统计学显著的剪接事件,所述事件代表与如本文所述的剪接修饰剂化合物组合的内含子REMS的操作的各个方面。
图6B和6C.这些示意图显示了在一种或多种本文所述的化合物的存在下,ELMO2的某些内含外显子同种型的产生,其中每种同种型的存在均显示出统计学显著的剪接事件,所述剪接事件代表了内含子REMS序列相互作用的各个方面,其中显示了在本文所述的化合物的存在下的一个或多个分支点和一个或多个3’剪接位点。
剪接修饰剂的内含子识别元件(iREMS)
一方面,本文提供了一种剪接修饰剂的内含子识别元件(也称为“iREMS”),其具有能够被小分子剪接修饰剂识别的元件,由此相关的iREMS复合物的元件与小分子剪接修饰剂组合在一起影响与剪接体的相互作用,如本文进一步所述。在具体方面,内含子REMS在RNA水平上具有核苷酸序列GAgurngn,其中r为A或G(即,嘌呤核苷酸腺嘌呤或鸟嘌呤)和n为任何核苷酸。在另一个具体方面,内含子REMS在RNA水平上具有核苷酸序列GAguragu,其中r为腺嘌呤或鸟嘌呤。在本文提供的这些具体方面的一个或多个中,n为腺嘌呤或鸟嘌呤。在更具体的方面,内含子REMS在RNA水平上具有核苷酸序列NNGAgurngn(SEQ ID NO:1),其中r为A或G(即,嘌呤核苷酸腺嘌呤或鸟嘌呤)和n或N为任何核苷酸。在另一个更具体的方面,内含子REMS在RNA水平上具有核苷酸序列NNGAguragu(SEQ ID NO:2),其中r为腺嘌呤或鸟嘌呤,并且N为任何核苷酸。在本文提供的这些更具体的方面的一个或多个中,N为腺嘌呤或鸟嘌呤。在另一个具体方面,内含子REMS在内含子分支点和功能性内含子3’剪接位点的下游,其中内含子REMS在RNA水平上包含选自以下的核苷酸序列:ANGAgurngn(SEQ ID NO:4)、CNGAgurngn(SEQ ID NO:5)、GNGAgurngn(SEQ ID NO:6)、UNGAgurngn(SEQ ID NO:7)、NAGAgurngn(SEQ ID NO:8)、NCGAgurngn(SEQ ID NO:9)、NGGAgurngn(SEQ ID NO:10)、NUGAgurngn(SEQ ID NO:11)、AAGAgurngn(SEQ ID NO:12)、ACGAgurngn(SEQ ID NO:13)、AGGAgurngn(SEQ ID NO:14)、AUGAgurngn(SEQ ID NO:15)、CAGAgurngn(SEQ ID NO:16)、CCGAgurngn(SEQ ID NO:17)、CGGAgurngn(SEQ ID NO:18)、CUGAgurngn(SEQ ID NO:19)、GAGAgurngn(SEQ ID NO:20)、GCGAgurngn(SEQ ID NO:21)、GGGAgurngn(SEQ ID NO:22)、GUGAgurngn(SEQ ID NO:23)、UAGAgurngn(SEQ ID NO:24)、UCGAgurngn(SEQ ID NO:25)、UGGAgurngn(SEQ ID NO:52)和UUGAgurngn(SEQ ID NO:53),其中r为A或G(即,嘌呤核苷酸腺嘌呤或鸟嘌呤),并且n或N为任何核苷酸,在本文所述的化合物的存在下,内含子REMS通过所述核苷酸序列充当内含子5’剪接位点,导致REMS的NNGA核苷酸和内含子3’剪接位点直到NNGA核苷酸(含NNGA核苷酸)之间的内含子核苷酸被剪接成作为内含外显子的成熟RNA,以提供非野生型无功能mRNA。在另一个具体方面,内含子REMS在内含子分支点和功能性内含子3’剪接位点的上游,其中内含子REMS在RNA水平上包含选自以下的核苷酸序列:ANGAgurngn(SEQ ID NO:4)、CNGAgurngn(SEQ ID NO:5)、GNGAgurngn(SEQ ID NO:6)、UNGAgurngn(SEQ ID NO:7)、NAGAgurngn(SEQ ID NO:8)、NCGAgurngn(SEQ ID NO:9)、NGGAgurngn(SEQ ID NO:10)、NUGAgurngn(SEQ ID NO:11)、AAGAgurngn(SEQ ID NO:12)、ACGAgurngn(SEQ ID NO:13)、AGGAgurngn(SEQ ID NO:14)、AUGAgurngn(SEQ ID NO:15)、CAGAgurngn(SEQ ID NO:16)、CCGAgurngn(SEQ ID NO:17)、CGGAgurngn(SEQ ID NO:18)、CUGAgurngn(SEQ ID NO:19)、GAGAgurngn(SEQ ID NO:20)、GCGAgurngn(SEQ ID NO:21)、GGGAgurngn(SEQ ID NO:22)、GUGAgurngn(SEQ ID NO:23)、UAGAgurngn(SEQ ID NO:24)、UCGAgurngn(SEQ ID NO:25)、UGGAgurngn(SEQ ID NO:52)和UUGAgurngn(SEQ ID NO:53),其中r为A或G(即,嘌呤核苷酸腺嘌呤或鸟嘌呤),并且n或N为任何核苷酸,在本文所述的化合物的存在下,内含子REMS通过所述核苷酸序列充当内含子5’剪接位点,导致REMS的NNGA核苷酸和内含子3’剪接位点直到NNGA核苷酸(含NNGA核苷酸)之间的内含子核苷酸被剪接成作为内含外显子的成熟RNA,以提供非野生型无功能mRNA。在优选的方面,所述REMS在RNA水平上具有选自以下的核苷酸序列:ANGAguragu(SEQ ID NO:28)、CNGAguragu(SEQ ID NO:29)、GNGAguragu(SEQ ID NO:30)、UNGAguragu(SEQ ID NO:31)、NAGAguragu(SEQ ID NO:32)、NCGAguragu(SEQ ID NO:33)、NGGAguragu(SEQ ID NO:34)、NUGAguragu(SEQ ID NO:35)、AAGAguragu(SEQ ID NO:36)、ACGAguragu(SEQ ID NO:37)、AGGAguragu(SEQ ID NO:38)、AUGAguragu(SEQ ID NO:39)、CAGAguragu(SEQ ID NO:40)、CCGAguragu(SEQ ID NO:41)、CGGAguragu(SEQ ID NO:42)、CUGAguragu(SEQ ID NO:43)、GAGAguragu(SEQ ID NO:44)、GCGAguragu(SEQ ID NO:45)、GGGAguragu(SEQ ID NO:46)、GUGAguragu(SEQ ID NO:47)、UAGAguragu(SEQ ID NO:48)、UCGAguragu(SEQ ID NO:49)、UGGAguragu(SEQ ID NO:489)和UUGAguragu(SEQ ID NO:508),其中r为A或G(即,嘌呤核苷酸腺嘌呤或鸟嘌呤),并且N为任何核苷酸。在本文提供的一个或多个方面,N为腺嘌呤或鸟嘌呤。
在DNA的情况下,在具体方面,编码内含子REMS的核苷酸序列具有序列Gagtrngn,其中r为A或G(即,嘌呤核苷酸腺嘌呤或鸟嘌呤),并且n为任何核苷酸。在另一个具体方面,在DNA的情况下,编码内含子REMS的核苷酸序列具有序列Gagtragt,其中r为腺嘌呤或鸟嘌呤。在具体方面,在DNA的情况下,编码内含子REMS的核苷酸序列具有序列NNGAgtrngn(SEQID NO:1808),其中r为A或G(即,嘌呤核苷酸腺嘌呤或鸟嘌呤),并且n或N为任何核苷酸。在另一个具体方面,在DNA的情况下,编码内含子REMS的核苷酸序列具有序列NNGAgtragt(SEQID NO:3634),其中r为腺嘌呤或鸟嘌呤,并且N为任何核苷酸。在具体方面,在DNA的情况下,编码内含子REMS的核苷酸序列包含选自以下的序列:ANGAgtrngn(SEQ ID NO:1809)、CNGAgtrngn(SEQ ID NO:1810)、GNGAgtrngn(SEQ ID NO:1811)、TNGAgtrngn(SEQ ID NO:1812)、NAGAgtrngn(SEQ ID NO:1813)、NCGAgtrngn(SEQ ID NO:1814)、NGGAgtrngn(SEQ IDNO:1815)、NTGAgtrngn(SEQ ID NO:1816)、AAGAgtrngn(SEQ ID NO:1817)、ACGAgtrngn(SEQID NO:1818)、AGGAgtrngn(SEQ ID NO:1819)、ATGAgtrngn(SEQ ID NO:1820)、CAGAgtrngn(SEQ ID NO:1821)、CCGAgtrngn(SEQ ID NO:1822)、CGGAgtrngn(SEQ ID NO:1823)、CTGAgtrngn(SEQ ID NO:1824)、GAGAgtrngn(SEQ ID NO:1825)、GCGAgtrngn(SEQ ID NO:1826)、GGGAgtrngn(SEQ ID NO:1827)、GTGAgtrngn(SEQ ID NO:1828)、TAGAgtrngn(SEQ IDNO:1829)、TCGAgtrngn(SEQ ID NO:1830)、TGGAgtrngn(SEQ ID NO:1831)和TTGAgtrngn(SEQ ID NO:1832),其中r为A或G(即,嘌呤核苷酸腺嘌呤或鸟嘌呤),并且n或N为任何核苷酸。在优选的方面,在DNA的情况下,编码内含子REMS的核苷酸序列包含选自以下的序列:ANGAgtragt(SEQ ID NO:1833)、CNGAgtragt(SEQ ID NO:1834)、GNGAgtragt(SEQ ID NO:1835)、TNGAgtragt(SEQ ID NO:1836)、NAGAgtragt(SEQ ID NO:1837)、NCGAgtragt(SEQ IDNO:1838)、NGGAgtragt(SEQ ID NO:1839)、NTGAgtragt(SEQ ID NO:1840)、AAGAgtragt(SEQID NO:1841)、ACGAgtragt(SEQ ID NO:1842)、AGGAgtragt(SEQ ID NO:1843)、ATGAgtragt(SEQ ID NO:1844)、CAGAgtragt(SEQ ID NO:1845)、CCGAgtragt(SEQ ID NO:1846)、CGGAgtragt(SEQ ID NO:1847)、CTGAgtragt(SEQ ID NO:1848)、GAGAgtragt(SEQ ID NO:1849)、GCGAgtragt(SEQ ID NO:1850)、GGGAgtragt(SEQ ID NO:1851)、GTGAgtragt(SEQ IDNO:1852)、TAGAgtragt(SEQ ID NO:1853)、TCGAgtragt(SEQ ID NO:1854)、TGGAgtragt(SEQID NO:1855)和TTGAgtragt(SEQ ID NO:1856),其中r为腺嘌呤或鸟嘌呤,并且N为任何核苷酸。在本文提供的一个或多个方面,N为腺嘌呤或鸟嘌呤。
内含子REMS可以是内源RNA的部分,或可以被引入不天然包含内含子REMS序列的RNA序列中(在这种情况下,引入的内含子REMS是非内源内含子REMS,即内含子REMS不天然存在于相应的RNA中)。编码内含子REMS的核苷酸序列也可以是内源DNA序列的部分,或编码内含子REMS的核苷酸序列可以被引入不天然包含编码内含子REMS的核苷酸序列的DNA序列中。
在具体方面,REMS位于内含子中,并且在分支点和功能性3’剪接位点的上游,这在小分子剪接修饰剂的存在下使得REMS能够充当5’剪接位点。不受任何理论或机制的束缚,本文所述的小分子化合物已显示出可增加U1 snRNP以及前体mRNA剪接机制的其他组分与REMS的核苷酸NNGA之间的相互作用的亲和力,由此,在该化合物存在下,内含子REMS充当U1snRNP结合位点,导致内含子核苷酸被剪接为内含外显子。
化合物用途
一方面,本文提供了用于本文所述的方法的式(I)的化合物:
或其形式,其中
W为CH=CH或S;
X为CH2、CH(C1-4烷基)、C(C1-4烷基)2、CH=CH、O、NR5或键;
A为芳基、杂芳基、杂环基或C9-10环烷基,
其中芳基选自苯基和萘基,其各自任选地被1、2、3或4个各自选自R1的取代基取代,
其中杂芳基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R1的取代基取代,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R2的取代基取代,和
其中C9-10环烷基为任选地被1、2、3、4或5个各自选自R2的取代基取代的饱和或部分不饱和二环环系;
B为杂环基,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或多环环系,其各自任选地被1、2、3、4或5个各自选自R4的取代基取代;
R1为卤素、羟基、氰基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、杂环基-C1-4烷氧基、苯基或苯基-C1-4烷氧基,
其中杂芳基为具有1、2或3个选自N、O和S的杂原子环成员的饱和单环或二环环系,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中苯基、杂芳基或杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R2为卤素、羟基、氰基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、羟基-C1-4烷基、C1-4烷氧基、C1-4烷氧基-羰基、C2-4烯基、C3-7环烷基或杂环基-C1-4烷基,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R3为卤素、羟基、硝基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、苯基或苯基-C1-4烷氧基;
R4独立地选自卤素、C1-4烷基、羟基-C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基或羟基-C1-4烷基-氨基;和
R5为氢、C1-4烷基或羟基-C1-4烷基;
其中化合物的形式选自其前药、盐、水合物、溶剂化物、包合物、同位素体、外消旋体、对映异构体、非对映异构体、立体异构体、多晶型物和互变异构体形式。
另一方面,本文提供了用于本文所述的方法的式(I)的化合物,其选自式(Ia)和式(Ib)的化合物:
或其形式,其中
X为CH2、CH(C1-4烷基)、C(C1-4烷基)2、CH=CH、O、NR5或键;
A为芳基、杂芳基、杂环基或C9-10环烷基,
其中芳基选自苯基和萘基,其各自任选地被1、2、3或4个各自选自R1的取代基取代,
其中杂芳基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R1的取代基取代,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R2的取代基取代,和
其中C9-10环烷基为任选地被1、2、3、4或5个各自选自R2的取代基取代的饱和或部分不饱和二环环系;
B为杂环基,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或多环环系,其各自任选地被1、2、3、4或5个各自选自R4的取代基取代;
R1为卤素、羟基、氰基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、杂环基-C1-4烷氧基、苯基或苯基-C1-4烷氧基,
其中杂芳基为具有1、2或3个选自N、O和S的杂原子环成员的饱和单环或二环环系,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中苯基、杂芳基或杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R2为卤素、羟基、氰基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、氨基-羰基、羟基-C1-4烷基、C1-4烷氧基、C1-4烷氧基-羰基、C2-4烯基、C3-7环烷基或杂环基-C1-4烷基;
R3为卤素、羟基、硝基、氧代基、羟基-亚氨基、C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、苯基或苯基-C1-4烷氧基;
R4独立地选自卤素、C1-4烷基、羟基-C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基或羟基-C1-4烷基-氨基;和
R5为氢、C1-4烷基或羟基-C1-4烷基;
其中化合物的形式选自其前药、盐、水合物、溶剂化物、包合物、同位素体、外消旋体、对映异构体、非对映异构体、立体异构体、多晶型物和互变异构体形式。
另一方面,本文提供了用于本文所述的方法的式(I)的化合物,其选自式(Ia)和式(Ib)的化合物:
或其形式,其中
X为O、NH、N(CH3)或键;
A为芳基、杂芳基或杂环基,
其中芳基选自:
其中杂芳基选自:
其中杂环基选自:
B为选自以下的杂环基:
在可用化合价允许的情况下,R1a、R1b和R1c各自为一个或多个取代基,所述取代基各自选自卤素、羟基、氰基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、杂环基-C1-4烷氧基、苯基或苯基-C1-4烷氧基,
其中杂芳基为具有1、2或3个选自N、O和S的杂原子环成员的饱和单环或二环环系,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中苯基、杂芳基或杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
在可用化合价允许的情况下,R2a、R2b和R2c各自为一个或多个取代基,所述取代基各自选自卤素、羟基、氰基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、羟基-C1-4烷基、C1-4烷氧基、C1-4烷氧基-羰基、C2-4烯基、C3-7环烷基或杂环基-C1-4烷基,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R3为卤素、羟基、硝基、氧代基、羟基-亚氨基、C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、苯基或苯基-C1-4烷氧基;和
R4a、R4b、R4c、R4d、R4e、R4f和R4g独立地选自卤素、C1-4烷基、羟基-C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基或羟基-C1-4烷基-氨基;
其中化合物的形式选自其前药、盐、水合物、溶剂化物、包合物、同位素体、外消旋体、对映异构体、非对映异构体、立体异构体、多晶型物和互变异构体形式。
另一方面,本文提供了用于本文所述的方法的式(I)的化合物,其中所述式(I)的化合物选自式(Ia11)、式(Ia15)、式(Ia18)或式(Ib1)的化合物:
或其形式,其中(当存在时),
X选自O、NR5或键;
A选自苯基、噻吩基、吲唑基、吡啶基、嘧啶基或苯氧基,
其中苯基和苯氧基各自任选地被1、2或3个各自选自R1a的取代基取代,
其中噻吩基、吲唑基、吡啶基、嘧啶基各自任选地被1或2个各自选自R1a的取代基取代,
B选自1H-吡唑基、哌啶基、1,2,3,6-四氢吡啶基、(1R,5S)-8-氮杂双环[3.2.1]辛基、8-氮杂双环[3.2.1]辛-2-烯基、2,6-二氮杂螺[3.4]辛基或2,7-二氮杂螺[3.5]壬基,其各自任选地被1或2个各自选自R4a的取代基取代;
R1a选自卤素、羟基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷氧基或杂芳基,
其中杂芳基为具有1、2或3个选自N、O和S的杂原子环成员的饱和单环或二环环系,其任选地被1或2个各自选自R3a的取代基取代;
R3a选自硝基或C1-4烷基;和
R4a为C1-4烷基;
R5a为氢、C1-4烷基或羟基-C1-4烷基;
其中化合物的形式选自其前药、盐、水合物、溶剂化物、包合物、同位素体、外消旋体、对映异构体、非对映异构体、立体异构体、多晶型物和互变异构体形式。
本说明书的另一方面涉及涉及式(I)的化合物,其选自式(Ia11)、式(Ia15)、式(Ia18)或式(Ib1)的化合物,
或其形式,其中(当存在时),
R1a选自氟、氯、羟基、甲基、二氟甲基、氨基、甲氧基或1H-吡唑基或1H-咪唑-1-基,
其中1H-吡唑基任选地被1或2个各自选自R3a的取代基取代;
R3a选自硝基或甲基或氨基;和
R4a为甲基或乙基;
R5a为氢或甲基;
其中化合物的形式选自其前药、盐、水合物、溶剂化物、包合物、同位素体、外消旋体、对映异构体、非对映异构体、立体异构体、多晶型物和互变异构体形式。
另一方面,本文提供了用于本文所述的方法的式(Ia)的化合物或其形式,其中所述化合物选自式(Ia1)的化合物或其形式,其中取代基R1a、R1b和X当存在时显示在下表中,其中多个取代基用逗号隔开;“--”表示一个或多个R1a、R1b和X取代基不存在:
另一方面,本文提供了用于本文所述的方法的式(Ia)的化合物或其形式,其中所述化合物选自式(Ia2)的化合物或其形式,其中取代基R1a、R1b和R4a当存在时显示在下表中,其中多个取代基用逗号隔开;并且“--”表示一个或多个R1a、R1b和R4a取代基不存在:
另一方面,本文提供了用于本文所述的方法的式(Ia)的化合物或其形式,其中所述化合物选自式(Ia3)的化合物或其形式,其中取代基R1a、R1b和X当存在时显示在下表中,其中多个取代基用逗号隔开;并且“--”表示一个或多个R1a、R1b和X取代基不存在:
另一方面,本文提供了用于本文所述的方法的式(Ia)的化合物或其形式,其中所述化合物选自式(Ia4)的化合物或其形式,其中取代基X、R1a、R1b和R4a当存在时显示在下表中;并且“--”表示一个或多个X、R1a、R1b和R4a取代基不存在:
另一方面,本文提供了用于本文所述的方法的式(Ia)的化合物或其形式,其中所述化合物选自式(Ia5)的化合物或其形式,其中取代基R1a和R1b当存在时显示在下表中,其中多个取代基用逗号隔开;并且“--”表示一个或多个R1a和R1b取代基不存在:
另一方面,本文提供了用于本文所述的方法的式(Ia)的化合物或其形式,其中所述化合物选自式(Ia6)的化合物或其形式,其中取代基R1a当存在时显示在下表中;并且“--”表示一个或多个R1a取代基不存在:
另一方面,本文提供了用于本文所述的方法的式(Ia)的化合物或其形式,其中所述化合物选自式(Ia7)的化合物或其形式,其中取代基R1a当存在时显示在下表中;并且“--”表示一个或多个R1a取代基不存在:
Cpd | R<sub>1a</sub> |
258 | -- |
260 | 2-CH<sub>3</sub> |
另一方面,本文提供了用于本文所述的方法的式(Ia)的化合物或其形式,其中所述化合物选自式(Ia8)的化合物或其形式,其中取代基R1a和B当存在时显示在下表中;并且“--”表示一个或多个R1a和B取代基不存在:
另一方面,本文提供了用于本文所述的方法的式(Ia)的化合物或其形式,其中所述化合物选自式(Ia9)的化合物或其形式,其中取代基R1a和B当存在时显示在下表中;并且“--”表示一个或多个R1a和B取代基不存在:
Cpd | R<sub>1a</sub> | B |
214 | -- | 6-((3aR,6aS)-5-CH<sub>3</sub>-六氢吡咯并[3,4-c]吡咯-2(1H)-基) |
270 | -- | 哌嗪-1-基 |
291 | 3-CH<sub>3</sub> | 哌嗪-1-基 |
另一方面,本文提供了用于本文所述的方法的式(Ia)的化合物或其形式,其中所述化合物选自式(Ia10)的化合物或其形式,其中取代基R1a和B当存在时显示在下表中;并且“--”表示一个或多个R1a和B取代基不存在:
Cpd | R<sub>1a</sub> | B |
268 | 2-CN | 哌嗪-1-基 |
271 | -- | 1,2,3,6-四氢吡啶-4-基 |
另一方面,本文提供了用于本文所述的方法的式(Ia)的化合物或其形式,其中所述化合物选自式(Ia11)的化合物或其形式,其中取代基A、X和R4a当存在时显示在下表中;并且“--”表示一个或多个A、X和R4a取代基不存在:
另一方面,本文提供了用于本文所述的方法的式(Ia)的化合物或其形式,其中所述化合物选自式(Ia11)的化合物或其形式,其中取代基A、X和R4a当存在时显示在下表中;并且“--”表示一个或多个A、X和R4a取代基不存在:
另一方面,本文提供了用于本文所述的方法的式(Ia)的化合物或其形式,其中所述化合物选自式(Ia11)的化合物或其形式,其中取代基A、X和R4a当存在时显示在下表中;并且“--”表示一个或多个A、X和R4a取代基不存在:
另一方面,本文提供了用于本文所述的方法的式(Ia)的化合物或其形式,其中所述化合物选自式(Ia12)的化合物或其形式,其中取代基X、R1a和B当存在时显示在下表中;并且“--”表示一个或多个X、R1a和B取代基不存在:
另一方面,本文提供了用于本文所述的方法的式(Ia)的化合物或其形式,其中所述化合物选自式(Ia13)的化合物或其形式,其中取代基X、R1a和R4a当存在时显示在下表中;并且“--”表示一个或多个X、R1a和R4a取代基不存在:
Cpd | X | R<sub>1a</sub> | R<sub>4a</sub> |
26 | N(CH<sub>3</sub>) | H | H |
28 | NH | H | H |
31 | O | H | H |
90 | O | OH | H |
91 | N(CH<sub>3</sub>) | OH | H |
92 | NH | OH | H |
93 | N(CH<sub>3</sub>) | O(CH<sub>2</sub>)<sub>3</sub>NHCO<sub>2</sub>C(CH<sub>3</sub>)<sub>3</sub> | H |
94 | N(CH<sub>3</sub>) | O(CH<sub>2</sub>)<sub>3</sub>NH<sub>2</sub> | H |
95 | N(CH<sub>3</sub>) | O(CH<sub>2</sub>)<sub>3</sub>NHCO<sub>2</sub>CH<sub>3</sub> | H |
96 | N(CH<sub>3</sub>) | O(CH<sub>2</sub>)<sub>3</sub>OH | H |
97 | N(CH<sub>3</sub>) | O(CH<sub>2</sub>)<sub>3</sub>OCH<sub>3</sub> | H |
98 | O | O(CH<sub>2</sub>)<sub>3</sub>-吗啉-4-基 | H |
103 | N(CH<sub>3</sub>) | CN | H |
104 | N(CH<sub>3</sub>) | CH<sub>2</sub>-1-哌啶基 | H |
105 | N(CH<sub>3</sub>) | CH<sub>2</sub>-吡咯烷-1-基 | H |
108 | N(CH<sub>3</sub>) | OCH<sub>3</sub> | H |
109 | N(CH<sub>3</sub>) | OCH<sub>3</sub> | CH<sub>3</sub> |
110 | N(CH<sub>3</sub>) | 3,6-二氢-2H-吡喃-4-基 | H |
111 | N(CH<sub>3</sub>) | 四氢-2H-吡喃-4-基 | H |
112 | N(CH<sub>3</sub>) | CHF<sub>2</sub> | H |
113 | N(CH<sub>3</sub>) | OC(CH<sub>3</sub>)<sub>2</sub>(CH<sub>2</sub>)<sub>2</sub>OH | H |
114 | N(CH<sub>3</sub>) | O(CH<sub>2</sub>)<sub>2</sub>C(CH<sub>3</sub>)<sub>2</sub>OH | H |
另一方面,本文提供了用于本文所述的方法的式(Ia)的化合物或其形式,其中所述化合物选自式(Ia14)的化合物或其形式,其中取代基X和B当存在时显示在下表中;并且“--”表示一个或多个X和B取代基不存在:
Cpd | X | B |
55 | O | 哌啶-4-基 |
56 | O | (2S,4R,6R)-2,6-(CH<sub>3</sub>)<sub>2</sub>-哌啶-4-基 |
57 | O | 2,6-(CH<sub>3</sub>)<sub>2</sub>-哌啶-4-基 |
58 | O | 吡咯烷-3-基 |
59 | O | 2-CH<sub>3</sub>-哌啶-4-基 |
60 | OCH<sub>2</sub> | 1H-吡咯烷-3-基 |
61 | O | 3-F-哌啶-4-基 |
65 | -- | 哌嗪-1-基 |
67 | NH | 氮杂环丁-3-基 |
68 | -- | 3,5-(CH<sub>3</sub>)<sub>2</sub>-哌嗪-1-基 |
69 | -- | 7-CH<sub>3</sub>-2,7-二氮杂螺[4.4]壬-2-基 |
70 | -- | [1,4]二氮杂环庚-1-基 |
71 | -- | 4-CH<sub>2</sub>CH<sub>2</sub>OH-哌嗪-1-基 |
72 | -- | 2,7-二氮杂螺[3.5]壬-7-基 |
73 | -- | 2,7-二氮杂螺[3.5]壬-7-基 |
74 | -- | 3-CH<sub>2</sub>OH-哌嗪-1-基 |
75 | -- | 1,7-二氮杂螺[4.4]壬-7-基 |
76 | -- | 4-NH<sub>2</sub>-4-CH<sub>3</sub>-哌啶-1-基 |
77 | -- | 3-N(CH<sub>3</sub>)<sub>2</sub>-哌啶-1-基 |
79 | -- | 3,3-(CH<sub>3</sub>)<sub>2</sub>-哌嗪-1-基 |
80 | -- | 7-CH<sub>2</sub>CH<sub>2</sub>OH-2,7-二氮杂螺[4.4]-壬烷-2-基 |
83 | -- | 1,2,3,6-四氢吡啶-4-基 |
84 | -- | 哌啶-4-基 |
102 | O | (6S)-6-[(S)-CH(OH)CH<sub>3</sub>]-2,2-(CH<sub>3</sub>)<sub>2</sub>-哌啶-4-基 |
133 | O | 2,2-(CH<sub>3</sub>)<sub>2</sub>-哌啶-4-基 |
另一方面,本文提供了用于本文所述的方法的式(Ia)的化合物或其形式,其中所述化合物选自式(Ia15)的化合物或其形式,其中取代基X、R1a和R4a当存在时显示在下表中;并且“--”表示一个或多个X、R1a和R4a取代基不存在:
另一方面,本文提供了用于本文所述的方法的式(Ia)的化合物或其形式,其中所述化合物选自式(Ia15)的化合物或其形式,其中取代基X、R1a和R4a当存在时显示在下表中;并且“--”表示一个或多个X、R1a和R4a取代基不存在:
Cpd | X | R<sub>1a</sub> |
413 | NH | 1H-吡唑-4-基 |
414 | O | 1-CH<sub>3</sub>-1H-吡唑-4-基 |
416 | N(CH<sub>3</sub>) | 5-CH<sub>3</sub>-1H-吡唑-4-基 |
417 | O | 1H-咪唑-1-基 |
418 | O | 5-CH<sub>3</sub>-1H-吡唑-4-基 |
419 | N(CH<sub>3</sub>) | 4-NO<sub>2</sub>-1H-吡唑-1-基 |
421 | O | 4-NH<sub>2</sub>-1H-吡唑-1-基 |
423 | O | 4-NO<sub>2</sub>-1H-吡唑-1-基 |
460 | N(CH<sub>3</sub>) | 1H-吡唑-4-基 |
461 | O | 1H-吡唑-4-基 |
另一方面,本文提供了用于本文所述的方法的式(Ia)的化合物或其形式,其中所述化合物选自式(Ia16)的化合物或其形式,其中取代基R1a和R4a当存在时显示在下表中;并且“--”表示一个或多个R1a和R4a取代基不存在:
另一方面,本文提供了用于本文所述的方法的式(Ia)的化合物或其形式,其中所述化合物选自式(Ia17)的化合物或其形式,其中取代基R1a当存在时显示在下表中;并且“--”表示一个或多个R1a取代基不存在:
Cpd | R<sub>1a</sub> |
204 | 1H-吡唑-4-基 |
205 | 4-(1-CH<sub>3</sub>-吡啶-2(1H)-酮) |
另一方面,本文提供了用于本文所述的方法的式(Ia)的化合物或其形式,其中所述化合物选自式(Ia18)的化合物或其形式,其中取代基X和B当存在时显示在下表中;并且“--”表示一个或多个X和B取代基不存在:
另一方面,本文提供了用于本文所述的方法的式(Ia)的化合物或其形式,其中所述化合物选自式(Ia18)的化合物或其形式,其中取代基X、R1a和B当存在时显示在下表中;并且“--”表示一个或多个X、R1a和B取代基不存在:
另一方面,本文提供了用于本文所述的方法的式(Ib)的化合物或其形式,其中所述化合物选自式(Ib1)的化合物或其形式,其中取代基A显示在下表中:
Cpd | A |
302 | 6-(萘-2-醇) |
320 | 6-(萘-2,7-二醇) |
331 | 7-OCH<sub>3</sub>-喹啉-6-基 |
332 | 7-OH-喹啉-6-基 |
337 | 2-CN-7-OCH<sub>3</sub>-喹啉-6-基 |
355 | 3-F-5-(1H-吡唑-4-基)-吡啶-2-基 |
364 | 2-(6-OCH<sub>3</sub>-3,4-二氢异喹啉-1(2H)-酮) |
392 | 6-OH-1-氧代基-2,3-二氢-1H-茚基-5-基 |
401 | 3-(4-OCH<sub>3</sub>-1-CH<sub>3</sub>-喹啉-2(1H)-酮) |
402 | 3-(4-OH-1-CH<sub>3</sub>-喹啉-2(1H)-酮) |
403 | 3-(喹啉-2(1H)-酮) |
404 | 3-(1-OCH<sub>3</sub>-喹啉-2(1H)-酮) |
408 | 5-CN-苯并[b]噻吩-2-基 |
409 | 3-Cl-苯并[b]噻吩-2-基 |
另一方面,本文提供了用于本文所述的方法的式(Ib)的化合物或其形式,其中所述化合物选自式(Ib1)的化合物或其形式,其中取代基A显示在下表中:
Cpd | A |
462 | 3-(1H-吡唑-4-基)苯氧基 |
463 | 4-(1H-吡唑-4-基)苯氧基 |
另一方面,本文提供了用于本文所述的方法的式(Ib)的化合物或其形式,其中所述化合物选自式(Ib1)的化合物或其形式,其中取代基A显示在下表中:
Cpd | A |
462 | 3-(1H-吡唑-4-基)苯氧基 |
463 | 4-(1H-吡唑-4-基)苯氧基 |
另一方面,本文提供了用于本文所述的方法的式(Ib)的化合物或其形式,其中所述化合物选自式(Ib2)的化合物或其形式,其中取代基A显示在下表中:
Cpd | A |
321 | 6-萘-2,7-二醇 |
另一方面,本文提供了用于本文所述的方法的式(Ib)的化合物或其形式,其中所述化合物选自式(Ib3)的化合物或其形式,其中取代基R1a、R1b和B当存在时显示在下表中;并且“--”表示一个或多个R1a、R1b和B取代基不存在:
另一方面,本文提供了用于本文所述的方法的式(Ib)的化合物或其形式,其中所述化合物选自式(Ib4)的化合物或其形式,其中取代基R1a、R1b、R1c、R1d(各自表示R1的范围)和X当存在时显示在下表中;并且“--”表示一个或多个R1a、R1b、R1c、R1d和X取代基不存在:
另一方面,本文提供了用于本文所述的方法的式(Ib)的化合物或其形式,其中所述化合物选自式(Ib5)的化合物或其形式,其中取代基R1a、R1b、R1c、R1d(各自表示R1的范围)和R4a当存在时显示在下表中;并且“--”表示一个或多个R1a、R1b、R1c、R1d和R4a取代基不存在:
Cpd | R<sub>1a</sub> | R<sub>1b</sub> | R<sub>1c</sub> | R<sub>1d</sub> | R<sub>4a</sub> |
353 | 1H-吡唑-4-基 | F | F | H | -- |
362 | 1H-吡唑-4-基 | OCH<sub>3</sub> | H | F | CH<sub>3</sub> |
370 | 1H-咪唑-1-基 | Cl | H | H | CH<sub>3</sub> |
379 | 1-CH<sub>3</sub>-1H-吡唑-4-基 | Cl | H | H | CH<sub>3</sub> |
380 | 1H-吡唑-4-基 | Cl | H | H | CH<sub>3</sub> |
384 | 1H-吡唑-4-基 | F | H | H | CH<sub>3</sub> |
396 | 1H-吡唑-4-基 | F | H | OH | -- |
405 | 1H-吡唑-4-基 | Cl | H | H | -- |
另一方面,本文提供了用于本文所述的方法的式(Ib)的化合物或其形式,其中所述化合物选自式(Ib6)的化合物或其形式,其中取代基R1a、R1b、R1c和R1d(各自表示R1的范围)当存在时显示在下表中;并且“--”表示一个或多个R1a、R1b、R1c和R1d取代基不存在:
Cpd | R<sub>1a</sub> | R<sub>1b</sub> | R<sub>1c</sub> | R<sub>1d</sub> |
386 | 1-CH<sub>3</sub>-1H-吡唑-4-基 | OCH<sub>3</sub> | H | H |
395 | 1-CH<sub>3</sub>-1H-吡唑-4-基 | OH | H | H |
399 | 1H-吡唑-4-基 | H | F | F |
400 | 1H-吡唑-4-基 | OH | H | F |
另一方面,本文提供了用于本文所述的方法的式(Ib)的化合物或其形式,其中所述化合物选自式(Ib7)的化合物或其形式,其中取代基R1b当存在时显示在下表中:
Cpd | R<sub>1b</sub> |
304 | OCH<sub>3</sub> |
322 | OH |
另一方面,本文提供了用于本文所述的方法的式(Ib)的化合物或其形式,其中所述化合物选自式(Ib8)的化合物或其形式,其中取代基R1b当存在时显示在下表中:
Cpd | R<sub>1b</sub> |
303 | OCH<sub>3</sub> |
323 | OH |
化合物的制备
本文提供的化合物可以由本领域技术人员制备,例如通过在以下文献中阐述的合成方法制备:2013年8月13日提交的第PCT/US2013/054687号国际申请,于2014年2月20日以国际公开号WO2014/028459公开;2014年1月23日提交的第PCT/US2014/012774号国际申请,于2014年7月31日以国际公开号WO2014/116845A1公开;2014年7月30日提交的第PCT/US2014/048984号国际申请,于2015年2月5日以国际公开号WO2015/017589公开;和2016年12月11日提交的第PCT/US2016/066042号国际申请,于2017年6月5日以国际公开号WO2017/100726公开,其各自通过引用整体并入本文,如同在本文中完整阐述一样。
一方面,用于本文公开的方法的式(I)的化合物是选自以下的化合物:
其中化合物的形式选自其前药、盐、水合物、溶剂化物、包合物、同位素体、外消旋体、对映异构体、非对映异构体、立体异构体、多晶型物和互变异构体形式。
另一方面,用于本文公开的方法的式(I)的化合物是选自以下的化合物:
其中化合物的形式选自其前药、盐、水合物、溶剂化物、包合物、同位素体、外消旋体、对映异构体、非对映异构体、立体异构体、多晶型物和互变异构体形式。
另一方面,用于本文公开的方法的式(I)的化合物或其形式是选自以下的式(I)的化合物或其形式(其中化合物编号(#1)表示盐形式为分离的):
其中化合物的形式选自其前药、盐、水合物、溶剂化物、包合物、同位素体、外消旋体、对映异构体、非对映异构体、立体异构体、多晶型物和互变异构体形式。
另一方面,用于本文公开的方法的式(I)的化合物或其形式是选自以下的化合物:
其中化合物的形式选自其前药、盐、水合物、溶剂化物、包合物、同位素体、外消旋体、对映异构体、非对映异构体、立体异构体、多晶型物和互变异构体形式。
另一方面,用于本文公开的方法的式(I)的化合物或其形式是选自以下的化合物盐:
其中化合物盐的形式选自其前药、水合物、溶剂化物、包合物、同位素体、外消旋体、对映异构体、非对映异构体、立体异构体、多晶型物和互变异构体形式。
另一方面,用于本文公开的方法的式(I)的化合物是选自以下的化合物盐:
其中化合物盐的形式选自其前药、水合物、溶剂化物、包合物、同位素体、外消旋体、对映异构体、非对映异构体、立体异构体、多晶型物和互变异构体形式。
术语
如本文所使用,术语“C1-4烷基”通常是指具有一至四个直链或支链构型的碳原子的饱和烃基,包括但不限于甲基、乙基、正丙基、异丙基、正丁基、异丁基、仲丁基、叔丁基等。在一些方面,C1-4烷基包括C1-3烷基、C1-2烷基等。在可用化合价允许的情况下,C1-4烷基可以任选被取代。
如本文所使用,术语“C2-6烯基”通常是指其中具有二至五个直链或支链构型的碳原子和一个或多个碳-碳双键的部分不饱和烃基,包括但不限于乙烯基、烯丙基、丙烯基等。在一些方面,C2-6烯基包括C2-4烯基、C2-3烯基等。在可用化合价允许的情况下,C2-6烯基可以任选被取代。
如本文所使用,术语“C1-4烷氧基”通常是指式-O-C1-4烷基的具有一至四个直链或支链构型的碳原子的饱和烃基,包括但不限于甲氧基、乙氧基、正丙氧基、异丙氧基、正丁氧基、异丁氧基、仲丁氧基、叔丁氧基等。在一些方面,C1-4烷氧基包括C1-3烷氧基、C1-2烷氧基等。在可用化合价允许的情况下,C1-4烷氧基可以任选被取代。
如本文所使用,术语“C3-14环烷基”通常是指饱和单环、二环或多环烃基,包括但不限于环丙基、环丁基、环戊基、环己基、环庚基、环辛基、1H-茚满基、茚基、四氢萘基等。在一些方面,C3-14环烷基包括C3-10环烷基、C3-8环烷基、C3-7环烷基、C5-8环烷基、C9-10环烷基等。在可用化合价允许的情况下,C3-14环烷基可以任选被取代。
如本文所使用,术语“C3-14环烯基”通常是指其中具有一个或多个化学稳定的碳-碳双键的部分不饱和单环、二环或多环烃基,包括但不限于环丙烯基、环丁烯基、环戊烯基、环己烯基、环庚烯基、环辛烯基等。在一些方面,C3-14环烯基包括C3-7环烯基、C3-8环烯基、C5-8环烯基、C3-10环烯基等。在可用化合价允许的情况下,C3-14环烯基可以任选被取代。
如本文所使用,术语“芳基”通常是指单环、二环或多环芳族碳原子环结构基团,包括但不限于苯基、萘基、蒽基、芴基、薁基、菲基等。在可用化合价允许的情况下,芳基可以任选被取代。
如本文所使用,术语“杂芳基”通常是指单环、二环或多环芳族碳原子环结构基团,其中在结构稳定性允许的情况下,一个或多个碳原子环成员被一个或多个杂原子,如O、S或N原子替代,包括但不限于呋喃基、噻吩基(thienyl)(也称为噻吩基(thiophenyl))、吡咯基、吡唑基、咪唑基、异噁唑基、异噻唑基、噁唑基、噻唑基、三唑基、噁二唑基、噻二唑基、四唑基、吡喃基、噻喃基、吡啶基、嘧啶基、吡嗪基、哒嗪基、三嗪基、吲哚基、吲唑基、吲哚嗪基、苯并呋喃基、苯并噻吩基、苯并咪唑基、苯并噻唑基、苯并噁唑基、9H-嘌呤基、喹喔啉基、异吲哚基、喹啉基、异喹啉基、喹唑啉基、吖啶基、酞嗪基、咪唑并[1,2-a]吡啶基、咪唑并[1,5-a]吡啶基、咪唑并[5,1-a]异喹啉基、1,4-二氢茚并[1,2-c]-1H-吡唑基、2,3-二氢-1H-茚基-1-酮、2,3-二氢-1H-茚基、3,4-二氢喹啉-2(1H)-酮、5,6-二氢咪唑并[5,1-a]异喹啉基、8H-茚并[1,2-d]噻唑基、苯并[c][1,2,5]噁二唑基、苯并[d]噁唑-2(3H)-酮、喹啉-2(1H)-酮、喹唑啉-4(1H)-酮、喹唑啉-2,4(1H,3H)-二酮、苯并-[d]噁唑基、吡唑并[1,5-a]吡啶基等。在可获得的化合价允许的情况下,杂芳基可以任选地在碳或氮原子环成员上被取代。
如本文所使用,术语“杂环基”通常是指饱和或部分不饱和单环、二环或多环碳原子环结构基团,其中在结构稳定性允许的情况下,一个或多个碳原子环成员被杂原子,如O、S或N原子替代,包括但不限于氧杂环丙基、氧杂环丁基、氮杂环丁基、二氢呋喃基、四氢呋喃基、二氢噻吩基、四氢噻吩基、吡咯啉基、吡咯烷基、二氢吡唑基、吡唑啉基、吡唑烷基、二氢咪唑基、咪唑啉基、咪唑烷基、异噁唑啉基、异噁唑烷基、异噻唑啉基、异噻唑烷基、噁唑啉基、噁唑烷基、噻唑啉基、噻唑烷基、三唑啉基、三唑烷基、噁二唑啉基、噁二唑烷基、噻二唑啉基、噻二唑烷基、四唑啉基、四唑烷基、二氢-2H-吡喃基、二氢吡啶基、四氢吡啶基、1,2,3,6-四氢吡啶基、六氢吡啶基、二氢嘧啶基、四氢嘧啶基、1,4,5,6-四氢嘧啶基、二氢吡嗪基、四氢吡嗪基、二氢哒嗪基、四氢哒嗪基、哌嗪基、哌啶基、吗啉基、硫代吗啉基、二氢三嗪基、四氢三嗪基、六氢三嗪基、1,4-二氮杂环庚基、二氢吲哚基、吲哚啉基、四氢吲哚基、二氢吲唑基、四氢吲唑基、二氢异吲哚基、二氢苯并呋喃基、四氢苯并呋喃基、二氢苯并噻吩基、四氢苯并噻吩基、二氢苯并咪唑基、四氢苯并咪唑基、二氢苯并噁唑基、2,3-二氢苯并[d]噁唑基、四氢苯并噁唑基、二氢苯并噁嗪基、3,4-二氢-2H-苯并[b][1,4]噁嗪基、四氢苯并噁嗪基、苯并[1,3]二氧杂环戊烯基、苯并[1,4]二氧杂环己基、二氢嘌呤基、四氢嘌呤基、二氢喹啉基、四氢喹啉基、1,2,3,4-四氢喹啉基、二氢异喹啉基、3,4-二氢异喹啉-(1H)-基、四氢异喹啉基、1,2,3,4-四氢异喹啉基、二氢喹唑啉基、四氢喹唑啉基、二氢喹喔啉基、四氢喹喔啉基、1,2,3,4-四氢喹喔啉基、1,3-二氧杂环戊基、2,5-二氢-1H-吡咯基、4,5-二氢-1H-咪唑基、四氢-2H-吡喃基、六氢吡咯并[3,4-b][1,4]噁嗪基-(2H)-基、(4aR,7aS)-六氢吡咯并[3,4-b][1,4]噁嗪基-(4aH)-基、3,4-二氢-2H-吡啶并[3,2-b][1,4]噁嗪基、(顺式)-八氢环戊烷[c]吡咯基、六氢吡咯并[3,4-b]吡咯-(1H)-基、(3aR,6aR)-六氢吡咯并[3,4-b]吡咯-(1H)-基、(3aR,6aS)-六氢吡咯并[3,4-c]吡咯-(1H)-基、5H-吡咯并[3,4-b]吡啶-(7H)-基、5,7-二氢-6H-吡咯并[3,4-b]吡啶基、四氢-1H-吡咯并[3,4-b]吡啶-(2H,7H,7aH)-基、六氢-1H-吡咯并[3,4-b]吡啶-(2H)-基、(4aR,7aR)-六氢-1H-吡咯并[3,4-b]吡啶-(2H)-基、八氢-6H-吡咯并[3,4-b]吡啶基、2,3,4,9-四氢-1H-咔唑基、1,2,3,4-四氢吡嗪并[1,2-a]吲哚基、2,3-二氢-1H-吡咯并[1,2-a]吲哚基、(3aR,6aR)-六氢环戊烷[c]吡咯-(1H)-基、(3aR,4R,6aS)-六氢环戊烷[c]吡咯-(1H)-基、(3aR,4S,6aS)-六氢环戊烷[c]吡咯-(1H)-基、(3aR,5r,6aS)-六氢环戊烷[c]吡咯-(1H)-基、1,3-二氢-2H-异吲哚基、八氢-2H-异吲哚基、(3aS)-1,3,3a,4,5,6-六氢-2H-异吲哚基、(3aR,4R,7aS)-1H-异吲哚-(3H,3aH,4H,5H,6H,7H,7aH)-基、(3aR,7aS)-八氢-2H-异吲哚基、(3aR,4R,7aS)-八氢-2H-异吲哚基、(3aR,4S,7aS)-八氢-2H-异吲哚基、2,5-二氮杂双环[2.2.1]庚基、2-氮杂双环[2.2.1]庚烯基、3-氮杂双环[3.1.0]己基、3,6-二氮杂双环[3.1.0]己基、(1R,5S)-3-氮杂双环[3.1.0]己基、(1S,5R)-3-氮杂双环[3.2.0]庚基、5-氮杂螺[2.4]庚基、2,6-二氮杂螺[3.3]庚基、2,5-二氮杂螺[3.4]辛基、2,6-二氮杂螺[3.4]辛基、2,7-二氮杂螺[3.5]壬基、2,7-二氮杂螺[4.4]壬基、2-氮杂螺[4.5]癸基、2,8-二氮杂螺[4.5]癸基、3,6-二氮杂双环[3.2.1]辛基、1,4-二氢茚并[1,2-c]吡唑基、二氢吡喃基、二氢吡啶基、二氢喹啉基、8H-茚并[1,2-d]噻唑基、四氢咪唑并[1,2-a]吡啶基、吡啶-2(1H)-酮、(1R,5S)-8-氮杂双环[3.2.1]辛基、8-氮杂双环[3.2.1]辛-2-烯基等。在可用化合价允许的情况下,杂环基可任选地在碳或氮原子环成员上被取代。
如本文所使用,术语“C2-4烯基-氨基-羰基”是指下式的基团:-C(=O)-NH-C2-4烯基。
如本文所使用,术语“C1-4烷氧基-C1-4烷氧基”是指下式的基团:-O-C1-4烷基-O-C1-4烷基。
如本文所使用,术语“C1-4烷氧基-羰基”是指下式的基团:-C(=O)-O-C1-4烷基。
如本文所使用,术语“C1-4烷氧基-羰基-氨基”是指下式的基团:-NH-C(=O)-O-C1-4烷基。
如本文所使用,术语“C1-4烷氧基-羰基-氨基-C1-4烷氧基”是指下式的基团:-O-C1-4烷基-NH-C(=O)-O-C1-4烷基。
如本文所使用,术语“C1-4烷基-C1-4烷氧基”是指下式的基团:-O-C1-4烷基-C1-4烷基。
如本文所使用,术语“C1-4烷基-氨基”是指下式的基团:-NH-C1-4烷基。
如本文所使用,术语“(C1-4烷基)2-氨基”是指下式的基团:-N(C1-4烷基)2。
如本文所使用,术语“C1-4烷基-氨基-C1-4烷氧基”是指下式的基团:-O-C1-4烷基-NH-C1-4烷基。
如本文所使用,术语“(C1-4烷基)2-氨基-C1-4烷氧基”是指下式的基团:-O-C1-4烷基-N(C1-4烷基)2。
如本文所使用,术语“C1-4烷基-氨基-C1-4烷基”是指下式的基团:-C1-4烷基-NH-C1-4烷基。
如本文所使用,术语“(C1-4烷基)2-氨基-C1-4烷基”是指下式的基团:-C1-4烷基-N(C1-4烷基)2。
如本文所使用,术语“C1-4烷基-氨基-羰基”是指下式的基团:-C(=O)-NH-C1-4烷基。
如本文所使用,术语“(C1-4烷基)2-氨基-羰基”是指下式的基团:–C(=O)-N(C1-4烷基)2。
如本文所使用,术语“C1-4烷基-氨基-羰基-C1-4烷基”是指下式的基团:-C1-4烷基-C(=O)-NH-C1-4烷基。
如本文所使用,术语“(C1-4烷基)2-氨基-羰基-C1-4烷基”是指下式的基团:-C1-4烷基-C(=O)-N(C1-4烷基)2。
如本文所使用,术语“C1-4烷基-羰基”是指下式的基团:-C(=O)-C1-4烷基。
如本文所使用,术语“C1-4烷基-羰基-氨基”是指下式的基团:-NH-C(=O)-C1-4烷基。
如本文所使用,术语“C1-4烷基-羰基-氨基-C1-4烷氧基”是指下式的基团:-O-C1-4烷基-NH-C(=O)-C1-4烷基。
如本文所使用,术语“C1-4烷基-羰基-氨基-C1-4烷基”是指下式的基团:-C1-4烷基-NH-C(=O)-C1-4烷基。
如本文所使用,术语“氨基”是指下式的基团:-NH2。
如本文所使用,术语“氨基-C1-4烷氧基”是指下式的基团:-O-C1-4烷基-NH2。
如本文所使用,术语“氨基-C1-4烷基”是指下式的基团:-C1-4烷基-NH2。
如本文所使用,术语“氨基-羰基”是指下式的基团:-C(=O)-NH2。
如本文所使用,术语“氰基”是指下式的基团:-CN。
如本文所使用,术语“C3-7环烷基-C1-4烷氧基”是指下式的基团:-O-C1-4烷基-C3-7环烷基。
如本文所使用,术语“卤代C1-4烷氧基”是指下式的基团:-O-C1-4烷基-卤素,其中在可用价允许的情况下,C1-4烷基可以被一个或多个卤素原子部分或完全取代。在一些方面,卤代C1-4烷氧基包括卤代C1-6烷氧基、卤代C1-4烷氧基等。
如本文所使用,术语“卤代C1-4烷基”是指下式的基团:-C1-4烷基-卤素,其中在可用价允许的情况下,C1-4烷基可以被一个或多个卤素原子部分或完全取代。在一些方面,卤代C1-4烷基包括卤代C1-6烷基、卤代C1-4烷基等。
如本文所使用,术语“杂芳基-C1-4烷基”是指下式的基团:-C1-4烷基-杂芳基。
如本文所使用,术语“杂芳基-C1-4烷基-氨基”是指下式的基团:-NH-C1-4烷基-杂芳基。
如本文所使用,术语“杂芳基-C1-4烷基-氨基-羰基”是指下式的基团:-C(=O)-NH-C1-4烷基-杂芳基。
如本文所使用,术语“杂芳基-C1-4烷基-氨基-羰基-C1-4烷基”是指下式的基团:-C1-4烷基-C(=O)-NH-C1-4烷基-杂芳基。
如本文所使用,术语“杂芳基-C1-4烷基-羰基-氨基”是指下式的基团:-NH-C(=O)-C1-4烷基-杂芳基。
如本文所使用,术语“杂芳基-C1-4烷基-羰基-氨基-C1-4烷基”是指下式的基团:-C1-4烷基-NH-C(=O)-C1-4烷基-杂芳基。
如本文所使用,术语“杂环基-C1-4烷氧基”是指下式的基团:-C1-4烷氧基-杂环基。
如本文所使用,术语“杂环基-C1-4烷基”是指下式的基团:-C1-4烷基-杂环基。
如本文所使用,术语“羟基”是指下式的基团:-OH。
如本文所使用,术语“羟基-C1-4烷氧基”是指下式的基团:-O-C1-4烷基-OH,其中在可用化合价允许的情况下,C1-4烷基可以被一个或多个羟基部分或完全取代。
如本文所使用,术语“羟基-C1-4烷基”是指下式的基团:-C1-4烷基-OH,其中在可用化合价允许的情况下,C1-4烷基可以被一个或多个羟基部分或完全取代。
如本文所使用,术语“羟基-C1-4烷基-氨基”是指下式的基团:-NH-C1-4烷基-OH,其中在可用化合价允许的情况下,C1-4烷基可以被一个或多个羟基部分或完全取代。
如本文所使用,术语“羟基-亚氨基”是指式C(=NOH)的=NOH基团。
如本文所使用,术语“氧代基”是指下式的基团:C=O。
如本文所使用,术语“苯基-C1-4烷氧基”是指下式的基团:-C1-4烷氧基-苯基。
如本文所使用,术语“取代基”是指在指定原子位置处被取代,以替代指定原子上的一个或多个氢的核心分子的原子上的位置变量,条件是不超过指定原子的正常化合价,并且该取代产生稳定的化合物。仅当取代基和/或变量的组合产生稳定的化合物时,才允许这些组合。本领域普通技术人员应注意,假定具有看起来不满足如本文所述或所示的化合价的任何碳以及杂原子均具有足够数量的氢原子以满足所述或所示的化合价。在某些情况下,本文可以在取代基内描述、显示或列出一个或多个具有双键(例如,“氧代基”或“=O”)作为连接点的取代基,其中所述结构可以仅显示单键作为与式(I)的核心结构的连接点。本领域普通技术人员将理解,尽管仅示出了单键,但是双键意在用于这些取代基。
如本文所使用,参考本文所提供的化学术语的定义,术语“等”是指本领域技术人员可以预期的化学结构变化包括但不限于异构体(包括链、支链或位置结构异构体)、环系的水合(包括单环、二环或多环环结构的饱和或部分不饱和)以及在可用化合价允许的情况下形成稳定化合物的所有其他变化。
出于该描述的目的,其中式(I)的化合物或其形式的一个或多个取代基变量包括包含到式(I)的化合物中的官能团,每个出现在公开的化合物内的任何位置的官能团可以独立地选择并且可以适当地独立地和/或任选地被取代。
如本文所使用,术语“独立选择的”或“各自选择的”是指取代基列表中的官能变量,其可以在式(I)的结构上多于一次出现,每次发生的取代模式为与任何其他情况下的模式无关。此外,本文所述化合物的任何式或结构上的通用取代基变量的使用应理解为包括用特定种属中包括的取代基种类替代通用取代基,并且所得化合物将包括在本文所述化合物的范围内,例如,芳基可以被苯基或萘基等替代。
如本文所使用,术语“……的每种情况”或“在每种情况下,当存在时”,当在术语如“…C3-14环烷基、C3-14环烷基-C1-4烷基、芳基、芳基-C1-4烷基、杂芳基、杂芳基-C1-4烷基、杂环基和杂环基-C1-4烷基”之前使用使,意指C3-14环烷基、芳基、杂芳基和杂环基环系各自单独存在或作为取代基存在。
如本文所使用,术语“任选地被取代”是指被指定的取代基变量、基团(group)、基团(radical)或部分任选地取代。
化合物形式
如本文所使用,术语“形式”是指具有选自以下的形式的式(I)的化合物:其游离酸、游离碱、前药、盐、水合物、溶剂化物、包合物、同位素体、外消旋体、对映异构体、非对映异构体、立体异构体、多晶型物和互变异构体形式。
在本文所述的某些方面,式(I)的化合物的形式是其游离酸、游离碱或盐。
在本文所述的某些方面,式(I)的化合物的形式是其盐。
在本文所述的某些方面,式(I)的化合物的形式是其同位素体。
在本文所述的某些方面,式(I)的化合物的形式是其立体异构体、外消旋体、对映异构体或非对映异构体。
在本文所述的某些方面,式(I)的化合物的形式是其互变异构体。
在本文所述的某些方面,式(I)的化合物的形式是药学上可接受的形式。
在本文所述的某些方面,分离式(I)的化合物或其形式以供使用。
如本文所使用,术语“分离的”是指根据本文所述的或本领域技术人员众所周知的(多种)分离或纯化方法方法(例如色谱法、重结晶法等),从合成过程(例如,从反应混合物)或天然来源或其组合分离和/或纯化后的式(I)的化合物或其形式的物理状态,其纯度足以通过本文所述的或本领域技术人员众所周知的标准分析技术表征。
如本文所使用,术语“保护的”是指式(I)的化合物或其形式中的官能团为被修饰以防止当化合物进行反应时在保护的位点上发生不希望的副反应的形式。合适的保护基将被本领域普通技术人员所认识,以及通过参考标准教科书例如T.W.Greene等人,Protective Groups in organic Synthesis(1991),Wiley,New York认识。这样的官能团包括羟基、苯酚、氨基和羧酸。羟基或苯酚的合适的保护基包括三烷基甲硅烷基或二芳基烷基甲硅烷基(例如叔丁基二甲基甲硅烷基、叔丁基二苯基甲硅烷基或三甲基甲硅烷基)、四氢吡喃基、苄基、取代的苄基、甲基、甲氧基甲醇等。氨基、脒基和胍基的合适的保护基包括叔丁氧羰基,苄氧羰基等。羧酸的合适的保护基包括烷基、芳基或芳基烷基酯。在某些情况下,保护基也可以是聚合物树脂,例如Wang树脂或2-氯三苯甲基氯树脂。可以根据本领域技术人员众所周知的和如本文所述的标准技术添加或去除保护基。本领域技术人员也将理解,尽管本文所述化合物的这种保护的衍生物可能本身不具有药理活性,但是它们可以施用于对象,然后在体内代谢以形成具有药理学活性的本文所述的化合物。因此,此类衍生物可被描述为“前药”。本文所述化合物的所有前药均包括在本文所述用途的范围内。
如本文所使用,术语“前药”是指在体内转化以产生具有活性的式(I)的化合物或其形式的本发明化合物的形式(例如,药物前体)。转化可以通过各种机制发生(例如通过代谢和/或非代谢化学过程),例如通过在血液、肝脏和/或其他器官和组织中水解和/或代谢发生。“Pro-drugs as Novel Delivery Systems,”Vol.14,A.C.S.专题讨论会系列,和Bioreversible Carriers in Drug Design,Edward B.Roche编,AmericanPharmaceutical Association and Pergamon Press,1987中提供了对前药的用途的讨论。
在一个实例中,当式(I)的化合物或其形式包含羧酸官能团时,前药可包含通过用诸如烷基等的官能团替代酸基团的氢原子形成的酯。在另一个实例中,当式(I)的化合物或其形式包含羟基官能团时,可以通过用另一个官能团如烷基、烷基羰基或膦酸酯基团替代羟基的氢原子来制备前药形式。在另一个实例中,当式(I)的化合物或其形式包含胺官能团时,可以通过用诸如烷基或取代羰基的官能团替代一个或多个胺氢原子来制备前药形式。如果合适,式(I)的化合物或其形式的药学上可接受的前药包括被一个或多个以下基团取代的那些化合物:羧酸酯,磺酸酯,氨基酸酯,膦酸酯和单、二或三磷酸酯或烷基取代基。如本文所述,本领域普通技术人员应理解,一种或多种这样的取代基可用于提供式(I)化合物或其形式作为前药。
本文所述的一种或多种化合物可以以非溶剂化物以及溶剂化物形式与药学上可接受的溶剂(例如水、乙醇等)一起存在,并且本文的描述旨在涵盖溶剂化物形式和非溶剂化物形式。
如本文所使用,术语“溶剂化物”是指本文所述的化合物与一个或多个溶剂分子的物理缔合。这种物理缔合涉及不同程度的离子键合和共价键合,包括氢键合。在某些情况下,例如当在结晶固体的晶格中掺入一个或多个溶剂分子时,溶剂化物将能够分离。如本文所使用,“溶剂化物”涵盖溶液相和可分离的溶剂化物。合适的溶剂化物的非限制性实例包括乙醇化物、甲醇化物等。
如本文所使用,术语“水合物”是指其中溶剂分子是水的溶剂化物。
式(I)的化合物可以形成盐,其意图包括在本说明书的范围内。除非另外指出,否则本文中提及的式(I)的化合物或其形式应理解为包括提及其盐形式。如本文所使用,术语“(多种)盐”表示与无机和/或有机酸形成的酸式盐,以及与无机和/或有机碱形成的碱式盐。另外,当式(I)的化合物或其形式同时包含碱性部分(例如但不限于胺部分)和酸性部分(例如但不限于羧酸)时,两性离子(“内盐”)可以形成并且包括在本文所用的术语“(多种)盐”之内。
如本文所使用,术语“(多种)药学上可接受的盐”是指在哺乳动物中安全有效(即无毒、生理上可接受)地使用并且具有生物学活性的本文所述的化合物的那些盐,但是其他盐也有用。式(I)的化合物的盐可以例如通过使式(I)的化合物或其形式与一定量的酸或碱(例如等量)在例如盐在其中沉淀的介质中反应形成,或在水性介质中反应形成,然后冻干。
药学上可接受的盐包括存在于本文所述的化合物中的一种或多种酸性或碱性基团的盐。在某些方面,酸加成盐可以包括但不限于乙酸盐、抗坏血酸盐、苯甲酸盐、苯磺酸盐、硫酸氢盐、酒石酸氢盐、硼酸盐、溴化物、丁酸盐、氯化物、柠檬酸盐、樟脑酸盐、樟脑磺酸盐、乙磺酸盐、甲酸盐、富马酸盐、龙胆酸盐、葡萄糖酸盐、葡糖醛酸盐、谷氨酸盐、碘化物、异烟酸盐、乳酸盐、马来酸盐、甲磺酸盐、萘磺酸盐、硝酸盐、草酸盐、双羟萘酸酸盐、泛酸盐、磷酸盐、丙酸盐、蔗糖酸盐、水杨酸盐、琥珀酸盐、硫酸盐、酒石酸盐、硫氰酸盐、甲苯磺酸盐(toluenesulfonate)(也称为甲苯磺酸盐(tosylate))、三氟乙酸盐等。酸加成盐的某些方面可以进一步包括氯化物、二氯化物、三氯化物、溴化物、乙酸盐、甲酸盐或三氟乙酸盐。
另外,例如P.Stahl等人,Camille G.(eds.)Handbook of PharmaceuticalSalts.Properties,Selection and Use.(2002)Zurich:Wiley-VCH;S.Berge等人,Journalof Pharmaceutical Sciences(1977)66(1)1-19;P.Gould,International J.ofPharmaceutics(1986)33,201-217;Anderson等人,The Practice of MedicinalChemistry(1996),Academic Press,New York;和The Orange Book(美国食品药品监督管理局,华盛顿,在其网站上)讨论了通常被认为适合由碱性药物化合物形成药学上有用的盐的酸。这些公开内容通过引用并入本文。
合适的碱性盐包括但不限于铝、铵、钙、锂、镁、钾、钠和锌盐。
所有这样的酸式盐和碱式盐都意图包括在本文所述的药学上可接受的盐的范围内。另外,出于描述的目的,所有这样的酸式盐和碱式盐被认为等同于相应化合物的游离形式。
式(I)的化合物及其形式可以进一步以互变异构形式存在。所有这些互变异构形式均预期并意图包括在如本文所述的式(I)化合物或其形式的范围内。
式(I)的化合物或其形式可以包含不对称或手性中心,因此以不同的立体异构形式存在。本说明书旨在包括式(I)的化合物的所有立体异构形式及其混合物,包括外消旋混合物。
本文所述的化合物可以包括一个或多个手性中心,并且可以以外消旋混合物(R/S))或基本上纯的对映异构体和非对映异构体的形式存在。化合物也可以以基本上纯的(R)或(S)对映异构体的形式存在(当存在一个手性中心时)。一方面,本文所述的化合物是(S)异构体,并且可以以基本上仅包含(S)异构体的对映异构纯组合物的形式存在。另一方面,本文描述的化合物是(R)异构体,并且可以以基本上仅包含(R)异构体的对映异构纯组合物的形式存在。如本领域技术人员将认识到的,当存在多于一个手性中心时,本文所述的化合物也可以以(R,R)、(R,S)、(S,R)或(S,S)异构体的形式存在,如IUPAC命名建议所定义。
如本文所使用,术语“基本上纯的”是指基本上由大于或等于90%的量、大于或等于92%的量、大于或等于95%的量、大于或等于98%的量、大于或等于99%的量或等于100%的量的单一异构体组成的化合物。
在说明书的一方面,式(I)的化合物或其形式是基本上纯的(S)对映异构体形式,其以大于或等于90%的量、以大于或等于92%的量、以大于或等于95%的量、以大于或等于98%的量,大于或等于99%的量或以等于100%的量存在。
另一方面,本文提供了用于本文所述的方法的式(I)的化合物,其选自式(Ia)和式(Ib)的化合物:
在说明书的一方面,式(I)的化合物或其形式是基本上纯的(R)对映异构体形式,其以大于或等于90%的量、以大于或等于92%的量、以大于或等于95%的量、以大于或等于98%的量,大于或等于99%的量或以等于100%的量存在。
另一方面,本文提供了用于本文所述的方法的式(I)的化合物,其选自式(Ia)和式(Ib)的化合物:
如本文所使用,“外消旋体”是异构形式的任何混合物,其不是“对映异构纯的”,包括例如但不限于比例为约50/50、约60/40、约70/30或约80/20的混合物。
另一方面,本文提供了用于本文所述的方法的式(I)的化合物,其选自式(Ia)和式(Ib)的化合物:
另外,本说明书涵盖所有几何和位置异构体。例如,如果式(I)的化合物或其形式包含双键或稠环,则顺式和反式形式以及其混合物均包含在说明书的范围内。非对映异构体混合物可以根据其物理化学差异,通过本领域技术人员公知的方法,例如通过色谱法和/或分级结晶,分离为它们各自的非对映异构体。对映异构体可以通过使用手性HPLC柱或本领域技术人员已知的其他色谱方法来分离。对映异构体也可以通过以下分离:与合适的光学活性化合物(例如,手性助剂,如手性醇或Mosher酰氯)反应,将对映异构体混合物转化为非对映异构体混合物,分离非对映异构体并将各非对映异构体转化(例如水解)为相应的纯对映异构体。而且,某些式(I)的化合物可以是阻转异构体(例如,取代的联芳基),并被认为是本说明书的一部分。
另一方面,本文提供了用于本文所述的方法的式(I)的化合物,其选自式(Ia)和式(Ib)的化合物:
本发明化合物(包括化合物的盐、溶剂化物、酯和前药以及前药的盐、溶剂化物和酯)的所有立体异构体(例如几何异构体、光学异构体等),例如,由于各种取代基上的不对称碳而可能存在的那些,包括对映异构体形式(即使在不存在不对称碳的情况下也可能存在)、旋转异构体形式、阻转异构体和非对映异构体形式,均涵盖在本说明书的范围内,位置异构体(例如4-吡啶基和3-吡啶基)也是如此。如上所述,本文所述的化合物的各个立体异构体可以例如基本上不含其他异构体,或者可以存在于外消旋混合物中。
另一方面,本文提供了用于本文所述的方法的式(I)的化合物,其选自式(Ia)和式(Ib)的化合物:
术语“盐”、“溶剂化物”、“酯”、“前药”等的使用旨在等同地应用于本发明的化合物的对映异构体、立体异构体、旋转异构体、互变异构体、位置异构体、外消旋体或同位素体的盐、溶剂化物、酯和前药。
另一方面,本文提供了用于本文所述的方法的式(I)的化合物,其选自式(Ia)和式(Ib)的化合物:
术语“同位素体”是指本文所述的同位素富集的化合物,其与本文所述的那些相同,但是一个或多个原子被原子质量或质量数不同于通常在自然界中发现的原子质量或质量数的原子替代。可掺入本文所述的化合物的同位素的实例包括氢、碳、氮、氧、磷、氟和氯的同位素,分别例如2H、3H、13C、14C、15N、18O、17O、31P、32P、35S、18F、35Cl和36Cl,其各自也在本说明书的范围内。
另一方面,本文提供了用于本文所述的方法的式(I)的化合物,其选自式(Ia)和式(Ib)的化合物:
本文所述的某些同位素富集的化合物(例如,用3H和14C标记的那些)可用于化合物和/或底物组织分布分析中。氚代(即,3H)和碳-14(即,14C)同位素由于易于制备和可检测性而是特别优选的。此外,用较重的同位素例如氘(即,2H)取代可以提供由于更大的代谢稳定性(例如,增加的体内半衰期或降低的剂量要求)而产生的某些治疗优势,因此在某些情况下可以是优选的。
另一方面,本文提供了用于本文所述的方法的式(I)的化合物,其选自式(Ia)和式(Ib)的化合物:式(I)的化合物以及式(I)的化合物的盐、溶剂化物、水合物、酯和前药的多晶型结晶和无定形形式也进一步旨在包含在本说明书中。
本文提供的化合物名称是使用ACD Labs提供的ACD Labs Index Name软件和/或提供的ChemDraw Ultra软件获得的。当本文公开的化合物名称与所示结构冲突时,所示结构将取代名称的使用来定义预期的化合物。本文定义的取代基的命名可能与其衍生的化学名称略有不同;本领域技术人员将认识到,取代基的定义旨在包括化学名中存在的基团。
如本文所使用,术语“异常”是指偏离例如平均健康对象或来自健康对象的(多个)细胞或组织样品的标准。如本文所使用,术语“异常表达”是指相对于相应的正常、健康的细胞、组织样品或对象,细胞、组织样品或对象的基因产物(例如RNA转录物或蛋白)的异常表达(上调或下调,导致其过量或量不足)。在具体方面,“异常表达”是指相对于相应的正常、健康的细胞、组织样品或对象,细胞、组织样品或对象中的基因产物(例如RNA转录物或蛋白)的水平改变。如本文所使用,术语“异常量”是指相对于相应的正常、健康的细胞、组织样品或对象,细胞、组织样品或对象中的基因产物(例如,RNA、蛋白、多肽或肽)的水平改变。在特定方面,如果相对于相应的来自健康对象的细胞或组织样品或健康对象,细胞、组织样品或对象中的基因产物(例如,RNA、蛋白、多肽或肽)的量比相应的来自健康对象的细胞或组织样品或健康对象中的基因产物的量高或低1、1.5、2、2.5、3、3.5、4、4.5、5、5.5、6倍,则被认为是常的。
术语“内含子REMS”是指内含子中存在的REMS序列,其在本文所述的化合物的存在下充当5’剪接位点。内含子REMS,当在第一分支点(BP)序列和第一3’剪接位点(3’ss)序列下游并且在第二分支点(BP)序列和第二3’剪接位点(3’ss)序列上游(如图1A所示)时,并且在本文所述的化合物的存在下,充当5’剪接位点。当在本文所述的化合物的存在下在分支点和3’剪接位点的上游(参见图1B或1C)并且最低需要的元件存在时,内含子REMS还可以充当5’剪接位点。以下任何一种、两种、三种或更多种或全部可以内源或非内源存在于受影响的内含子中:内含子REMS、第一BP、第二BP、第一3’ss和第二3’ss。内含子REMS充当5’剪接位点所需的最低需要的另外的元件包含下游分支点(BP)序列和下游3’剪接位点(3’ss)序列。BP和3’ss中的任一种和两种可以内源或非内源存在于受影响的内含子中。
如本文所使用,“非内源”核苷酸序列(如非内源5’剪接位点、非内源分支点或非内源3’剪接位点)是这样的核苷酸序列,其不是天然发现为前体RNA或编码前体RNA序列的DNA序列的部分。换言之,需要人工合成或操纵RNA或DNA序列以引入该核苷酸序列。
如本文所使用,术语“非内源内含子REMS”是指这样的REMS序列其不是天然发现为RNA序列的部分或不是天然由DNA序列编码。换言之,需要人工合成或操纵RNA或DNA序列以引入内含子REMS或编码内含子REMS的核苷酸序列。
如本文所使用,术语“内含子来源的外显子”、“内含外显子”、“iExon”和“内含外显子”(统称为iExon)是指当内含子REMS序列、分支点、3’剪接位点和剪接修饰剂化合物存在时,由内含子RNA序列产生的外显子。特别地,当在本文所述的化合物的存在下发生包含两个外显子和内含子的RNA转录物的RNA剪接时,其中第一外显子在内含子的上游,并且第二外显子在内含子的下游,并且其中内含子按5’至3’顺序包含:第一5’剪接位点、第一分支点、第一3’剪接位点、iREMS、第二分支点和第二3’剪接位点,得到的iExon包含以下RNA序列:第一3’剪接位点和所述iREMS之间的RNA序列(对应于图1A所示的iExon)。内含子REMS序列、分支点和3’剪接位点中的一个或多个可以天然存在于内含子RNA序列中或可以引入到内含子RNA序列中。当存在或引入所有这样的元件时,在本文所述的化合物的存在下,元件限定外显子边界,该边界能够实现剪接机制,以在RNA中产生iExon,如果不添加剪接修饰剂化合物,这种情况不会天然发生。
如本文所使用,术语“假外显子”是指天然存在于内含子编码DNA中的已知内源内含子序列,其可以匹配分支点、3’剪接位点和5’剪接位点的序列,但在剪接过程中均无活性、被剪接或不存在于成熟mRNA中。一些假外显子在其5’剪接位点包含内含子REMS。包含内含子REMS的假外显子尚未被产生iExon的剪接机制内源识别,但是在本文所述的剪接修饰剂化合物的存在下,剪接机制产生iExon。因此,由假外显子产生iExon意图旨在包括在统称术语“iExon”的各个方面的范围内。
如本文所使用,术语“未注释的外显子”是指是指根据实验证据作为外显子天然存在于成熟mRNA产物中,但未在NCBI的RefSeq数据库中注释(https://www.ncbi.nlm.nih.gov/refseq/)的内源序列。一些未注释的外显子在5’剪接位点包含内含子REMS。包含REMS的未注释的外显子尚未被产生iExon的剪接机制内源识别,但是在本文所述的剪接修饰剂化合物的存在下,剪接机制产生iExon。因此,由未注释的外显子产生iExon意图旨在包括在统称术语“iExon”的各个方面的范围内。
如本文所使用,术语“延伸的外显子”(即,eExon)是指当内含子REMS序列、分支点、3’剪接位点和剪接修饰剂化合物以例如图1B所示的顺序存在时,包含外显子和相邻内含子序列的一部分的外显子。特别地,当在本文所述的化合物的存在下发生包含两个外显子和内含子的RNA转录物的RNA剪接时,其中第一外显子在内含子的上游,并且第二外显子在内含子的下游,并且其中所示内含子按5’至3’顺序包含:5’剪接位点、iREMS、分支点和3’剪接位点,并且其中在所述iREMS序列和5’剪接位点之间没有中间分支点且没有中间3’剪接位点,得到的eExon包含第一外显子以及5’剪接位点和内含子REMS之间的RNA序列(对应于图1B中所示的外显子1e和图1C中所示的外显子2e)。
如本文所使用,术语“实质改变”在各自表达为基因的一种或多种的产物的一种或多种RNA转录物(例如,rRNA、tRNA、miRNA、siRNA、piRNA、lncRNA、前体mRNA或mRNA转录物)、其供选择的剪接变体或其同种型或其一种或多种蛋白的量的上下文中,是指这样的产物的量发生统计学显著的改变,例如在非限制性示例中p值小于选自0.1、0.01、0.001或0.0001的值。
如本文所使用,术语“对象”和“患者”互换使用,是指具有感觉和自发运动能力并且其生存需要氧和有机食物的动物或任何生物。非限制性实例包括人、马、猪、牛、大鼠、小鼠、犬和猫物种的成员。在一些方面,所述对象是哺乳动物或温血脊椎动物。在某些方面,所述对象是非人类动物。在特定方面,对象是人。
如本文所使用,术语“功能性蛋白”是指保留某种生物学功能或基因编码的全长蛋白或蛋白同种型的功能的蛋白的形式。
如本文所使用,术语“非功能性蛋白”是指与不存在如本文所述的剪接修饰剂化合物时基因编码的全长蛋白或蛋白同种型相比,不保留任何生物学功能的蛋白的形式。
如本文所使用,在由人工构建体产生的功能性蛋白的上下文中,术语“产生基本上更低的”是指在本文所述的化合物的存在下产生的功能性蛋白的量比不存在所述化合物时产生的功能性蛋白的量至少基本上低20%、25%、30%、35%、40%、45%、50%、55%、60%、70%、75%、80%、85%、90%、95%、98%或100%。
确定基因的表达是否被化合物调节或修饰的方法
另一方面,本文提供了用于确定基因的前体RNA的剪接是否可能被式(I)的化合物或其形式修饰的方法,包括搜索基因内含子序列中的内含子REMS(即,响应化合物的存在而充当5’剪接位点的序列)的存在,其中基因序列中存在内含子REMS、3’剪接位点和内含子分支点表明基因的前体RNA的剪接可能被式(I)的化合物或其形式修饰,并且基因序列中不存在内含子REMS和内含子3’剪接位点和内含子分支点表明基因的前体RNA的剪接不可能被式(I)的化合物或其形式修饰。在特定方面,该方法还包括搜索基因序列中的内含子REMS、内含子3’剪接位点和内含子分支点的组合的存在。
另一方面,本文提供了用于确定基因的产物(例如,mRNA转录物或蛋白)的量是否可能被式(I)的化合物或其形式调节的方法,包括搜索基因序列中的内含子REMS的存在,其中基因序列中存在内含子REMS、内含子3’剪接位点和内含子分支点的组合表明基因的产物(例如,mRNA转录物或蛋白)的量可能被式(I)的化合物或其形式调节,并且基因序列中不存在内含子REMS、内含子3’剪接位点和内含子分支点的组合表明基因的产物(例如,mRNA转录物或蛋白)的量不可能被式(I)的化合物或其形式调节。在特定方面,该方法还包括搜索基因序列中的内含子REMS、内含子3’剪接位点和内含子分支点中任一种的存在。在特定方面,该方法还包括搜索基因序列中的内含子REMS、下游分支点和下游3’剪接位点的组合的存在。
搜索本文所述的基因序列中的内含子REMS、下游3’剪接位点和下游分支点的最低需要的组合的存在的步骤可以由包括记忆存储指令的存储器的计算机系统执行,以搜索基因序列中该组合的存在,或可以手动进行这样的搜索。
在某些方面,通过使本文所述的化合物与细胞培养物中的前体RNA接触来评估包含内含子REMS的前体RNA的剪接。在一些方面,通过使本文所述的化合物与无细胞提取物中的前体RNA接触来评估包含内含子REMS的前体RNA的剪接。在具体方面,该化合物是已知调节包含内含子REMS的前体RNA的剪接的化合物。参见例如下面有关确定化合物是否调节某些基因表达的方法的部分,以及以下可用于这些评估的技术的实例。
确定哪些化合物调节或修饰特定基因的表达的方法
本文提供了用于确定式(I)的化合物或其形式是否调节一种、两种、三种或更多种基因的一种、两种、三种或更多种RNA转录物(例如,前体mRNA或mRNA转录物或其同种型)的量的方法。在一些方面,该基因是本文所述的基因中的任一种。
一方面,本文提供了用于确定式(I)的化合物或其形式是否调节RNA转录物的量的方法,包括:(a)使(多种)细胞与式(I)的化合物或其形式接触,和(b)确定由该(多种)细胞产生的RNA转录物的量,其中相对于化合物不存在或阴性对照(例如,溶媒对照如PBS或DMSO)存在下的RNA转录物的量,在化合物存在下的RNA转录物的量的调节表明式(I)的化合物或其形式调节RNA转录物的量。另一方面,本文提供了用于确定式(I)的化合物或其形式是否调节RNA转录物(例如,mRNA转录物)的量的方法,包括:(a)使第一(多种)细胞与式(I)的化合物或其形式接触,(b)使第二(多种)细胞与阴性对照(例如,溶媒对照,如PBS或DMSO)接触;(c)确定由第一(多种)细胞和第二(多种)细胞产生的RNA转录物的量;和(d)比较由第一(多种)细胞产生的RNA转录物的量与由第二(多种)细胞表达的RNA转录物的量,其中相对于由第二(多种)细胞产生的RNA转录物的量,由第一(多种)细胞产生的RNA转录物的量的调节表明式(I)的化合物或其形式调节RNA转录物的量。在某些方面,(多种)细胞与化合物的接触发生在细胞培养物中。在其他方面,(多种)细胞与化合物的接触发生在对象,如非人类动物对象中。
另一方面,本文提供了用于确定式(I)的化合物或其形式是否修饰RNA转录物(例如,mRNA转录物)的剪接的方法,包括:(a)在式(I)的化合物或其形式的存在下培养(多种)细胞;和(b)确定由(多种)细胞产生的两种或更多种RNA转录物剪接变体的量,其中相对于化合物不存在或阴性对照(例如,溶媒对照,如PBS或DMSO)存在下的两种或更多种RNA转录物剪接变体的量,在化合物的存在下的两种或更多种RNA转录物的量的调节表明式(I)的化合物或其形式修饰RNA转录物的剪接。
另一方面,本文提供了用于确定式(I)的化合物或其形式是否修饰RNA转录物(例如,mRNA转录物)的剪接的方法,包括:(a)在式(I)的化合物或其形式的存在下培养(多种)细胞;(b)在特定的一段时间后从(多种)细胞分离两种或更多种RNA转录物剪接变体;和(c)确定由(多种)细胞产生的两种或更多种RNA转录物剪接变体的量,其中相对于化合物不存在或阴性对照(例如,溶媒对照,如PBS或DMSO)存在下的两种或更多种RNA转录物剪接变体的量,在化合物的存在下的两种或更多种RNA转录物的量的调节表明式(I)的化合物或其形式修饰RNA转录物的剪接。另一方面,本文提供了用于确定式(I)的化合物或其形式是否修饰RNA转录物(例如,mRNA转录物)的剪接的方法,包括:(a)在式(I)的化合物或其形式的存在下培养第一(多种)细胞;(b)在阴性对照(例如,溶媒对照,如PBS或DMSO)的存在下培养第二(多种)细胞;(c)分离由第一(多种)细胞产生的两种或更多种RNA转录物剪接变体和分离由第二(多种)细胞产生的两种或更多种RNA转录物剪接变体;(d)确定由第一(多种)细胞和第二(多种)细胞产生的两种或更多种RNA转录物剪接变体的量;和(e)比较由第一(多种)细胞产生的两种或更多种RNA转录物剪接变体的量与由第二(多种)细胞产生的两种或更多种RNA转录物剪接变体的量,其中相对于由第二(多种)细胞产生的两种或更多种RNA转录物剪接变体的量,由第一(多种)细胞产生的两种或更多种RNA转录物剪接变体的量的调节表明式(I)的化合物或其形式调节RNA转录物的剪接。
另一方面,本文提供了用于确定式(I)的化合物或其形式是否调节RNA转录物(例如,mRNA转录物)的量的方法,包括:(a)使无细胞体系与式(I)的化合物或其形式接触,和(b)确定由无细胞体系产生的RNA转录物的量,其中相对于化合物不存在或阴性对照(例如,溶媒对照,如PBS或DMSO)存在下的RNA转录物的量,在化合物存在下的RNA转录物的量的调节表明式(I)的化合物或其形式调节RNA转录物的量。另一方面,本文提供了用于确定式(I)的化合物或其形式是否调节RNA转录物(例如,mRNA转录物)的量的方法,包括:(a)使第一无细胞体系与式(I)的化合物或其形式接触,(b)使第二无细胞体系与阴性对照(例如,溶媒对照,如PBS或DMSO)接触;和(c)确定由该第一无细胞体系和该第二无细胞体系产生的RNA转录物的量;和(d)比较由第一无细胞体系产生的RNA转录物的量与由第二无细胞体系表达的RNA转录物的量,其中相对于由第二无细胞体系产生的RNA转录物的量,由第一无细胞体系产生的RNA转录物的量的调节表明式(I)的化合物或其形式调节RNA转录物的量。在某些方面,无细胞体系包含纯合成RNA、合成或重组(纯化的)酶和蛋白因子。在其他方面,无细胞体系包含从合成DNA模板转录的RNA、合成或重组(纯化的)酶和蛋白因子。在其他方面,无细胞体系包含纯合成RNA和细胞核提取物。在其他方面,无细胞体系包含从合成DNA模板转录的RNA和细胞核提取物。在其他方面,无细胞体系包含纯合成RNA和全细胞提取物。在其他方面,无细胞体系包含从合成DNA模板转录的RNA和全细胞提取物。在某些方面,无细胞体系另外包含调节RNA(例如,微小RNA)。
另一方面,本文提供了用于确定式(I)的化合物或其形式是否修饰RNA转录物(例如,mRNA转录物)的剪接的方法,包括:(a)使无细胞体系与式(I)的化合物或其形式接触;和(b)确定由无细胞体系产生的两种或更多种RNA转录物剪接变体的量,其中相对于化合物不存在或阴性对照(例如,溶媒对照,如PBS或DMSO)存在下的两种或更多种RNA转录物剪接变体的量,在化合物存在下的两种或更多种RNA转录物剪接变体的量的调节表明式(I)的化合物或其形式修饰RNA转录物的剪接。另一方面,本文提供了用于确定式(I)的化合物或其形式是否修饰RNA转录物(例如,mRNA转录物)的剪接的方法,包括:(a)使第一无细胞体系与式(I)的化合物或其形式接触;(b)使第二无细胞体系与阴性对照(例如,溶媒对照,如PBS或DMSO)接触;和(c)确定由该第一无细胞体系和该第二无细胞体系产生的两种或更多种RNA转录物剪接变体的量;和(d)比较由第一无细胞体系产生的两种或更多种RNA转录物剪接变体的量与由第二无细胞体系表达的RNA转录物的量,其中相对于由第二无细胞体系产生的两种或更多种RNA转录物剪接变体的量,由第一无细胞体系产生的两种或更多种RNA转录物剪接变体的量的调节表明式(I)的化合物或其形式修饰RNA转录物的剪接。在某些方面,无细胞体系包含纯合成RNA、合成或重组(纯化的)酶和蛋白因子。在其他方面,无细胞体系包含从合成DNA模板转录的RNA、合成或重组(纯化的)酶和蛋白因子。在其他方面,无细胞体系包含纯合成RNA和细胞核提取物。在其他方面,无细胞体系包含从合成DNA模板转录的RNA和细胞核提取物。在其他方面,无细胞体系包含纯合成RNA和全细胞提取物。在其他方面,无细胞体系包含从合成DNA模板转录的RNA和全细胞提取物。在某些方面,无细胞体系另外包含调节RNA(例如,微小RNA)。
另一方面,本文提供了用于确定式(I)的化合物或其形式是否调节RNA转录物(例如,mRNA转录物)的量的方法,包括:(a)在式(I)的化合物或其形式的存在下培养(多种)细胞,(b)在特定的一段时间后从(多种)细胞分离RNA转录物;和(c)确定由(多种)细胞产生的RNA转录物的量,其中相对于化合物不存在或阴性对照(例如,溶媒对照,如PBS或DMSO)存在下的RNA转录物的量,化合物存在下的RNA转录物的量的调节表明式(I)的化合物或其形式调节RNA转录物的量。另一方面,本文提供了用于确定式(I)的化合物或其形式是否调节RNA转录物(例如,mRNA转录物)的量的方法,包括:(a)在式(I)的化合物或其形式的存在下培养第一(多种)细胞,(b)在阴性对照(例如,溶媒对照,如PBS或DMSO)的存在下培养第二(多种)细胞;(c)分离由第一(多种)细胞产生的RNA转录物和分离由第二(多种)细胞产生的RNA转录物;(d)确定由第一(多种)细胞和第二(多种)细胞产生的RNA转录物的量;和(e)比较由第一(多种)细胞产生的RNA转录物的量与由第二(多种)细胞产生的RNA转录物的量,其中相对于由第二(多种)细胞产生的RNA转录物的量,由第一(多种)细胞产生的RNA转录物的量的调节表明式(I)的化合物或其形式调节RNA转录物的量。
在某些方面,与式(I)的化合物或其形式接触或培养的(多种)细胞是来自对象的(多种)原代细胞。在一些方面,与式(I)的化合物或其形式接触或培养的(多种)细胞是来自患有疾病的对象的(多种)原代细胞。在特定方面,与式(I)的化合物或其形式接触或培养的(多种)细胞是来自患有与(多种)特定基因的(多种)RNA转录物的异常量相关的疾病的对象的(多种)原代细胞。在一些特定方面,与式(I)的化合物或其形式接触或培养的(多种)细胞是来自患有与(多种)特定基因的(多种)同种型的异常量相关的疾病的对象的(多种)原代细胞。在一些方面,与式(I)的化合物或其形式接触或培养的(多种)细胞是成纤维细胞(例如,GM03813或PNN 1-46成纤维细胞)、免疫细胞(例如,T细胞、B细胞、自然杀伤细胞、巨噬细胞)或肌细胞。在某些方面,与式(I)的化合物或其形式接触或培养的(多种)细胞是癌细胞。
在某些方面,与式(I)的化合物或其形式接触或培养的(多种)细胞来自细胞系。在一些方面,与式(I)的化合物或其形式接触或培养的(多种)细胞是源自患有疾病的对象的细胞系。在某些方面,与式(I)的化合物或其形式接触或培养的(多种)细胞来自已知具有(多种)特定基因的异常RNA转录物水平的细胞系。在特定方面,与式(I)的化合物或其形式接触或培养的(多种)细胞来自源自对象的细胞系,所述对象患有已知具有(多种)特定基因的异常RNA转录物水平的疾病。在某些方面,与式(I)的化合物或其形式接触或培养的(多种)细胞是癌细胞系。
在一些特定方面,与式(I)的化合物或其形式接触或培养的(多种)细胞来自源自对象的细胞系,所述对象患有已知具有(多种)特定基因的(多种)RNA同种型和/或(多种)蛋白同种型的异常量的疾病。细胞系的非限制性实例包括3T3、4T1、721、9L、A2780、A172、A20、A253、A431、A-549、ALC、B16、B35、BCP-1、BEAS-2B、bEnd.3、BHK、BR 293、BT2O、BT483、BxPC3、C2C12、C3H-10T1/2、C6/36、C6、Cal-27、CHO、COR-L23、COS、COV-434、CML T1、CMT、CRL7O3O、CT26、D17、DH82、DU145、DuCaP、EL4、EM2、EM3、EMT6、FM3、H1299、H69、HB54、HB55、HCA2、HD-1994、HDF(人真皮成纤维细胞)、HEK-293、HeLa、Hepa1c1c7、HL-60、HMEC、Hs578T、HsS78Bst、HT-29、HTB2、HUVEC、Jurkat、J558L、JY、K562、Ku812、KCL22、KG1、KYO1、LNCap、Ma-Mel、MC-38、MCF-7、MCF-10A、MDA-MB-231、MDA-MB-468、MDA-MB-435、MDCK、MG63、MOR/0.2R、MONO-MAC6、MRC5、MTD-1A、NCI-H69、NIH-3T3、NALM-1、NS0、NW-145、OPCN、OPCT、PNT-1A、PNT-2、Raji、RBL、RenCa、RIN-5F、RMA、Saos-2、Sf21、Sf9、SH-SY5Y、SiHa、SKBR3、SKOV-3、T2、T-47D、T84、THP1、U373、U87、U937、VCaP、Vero、VERY、W138、WM39、WT-49、X63、YAC-1和YAR细胞。一方面,细胞来自患者。另一方面,患者细胞是GM03813细胞。另一方面,患者细胞是GM04856、GM04857、GM09197、GM04281、GM04022、GM07492细胞。
另一方面,本文提供了用于确定式(I)的化合物或其形式是否调节RNA转录物(例如,mRNA转录物)的量的方法,包括:(a)使组织样品与式(I)的化合物或其形式接触;和(b)确定由组织样品产生的RNA转录物的量,其中相对于化合物不存在或阴性对照(例如,溶媒对照,如PBS或DMSO)存在下的RNA转录物的量,在化合物存在下的RNA转录物的量的调节表明式(I)的化合物或其形式调节RNA转录物的量。另一方面,本文提供了用于确定式(I)的化合物或其形式是否调节RNA转录物(例如,mRNA转录物)的量的方法,包括:(a)使第一组织样品与式(I)的化合物或其形式接触,(b)使第二组织样品与阴性对照(例如,溶媒对照,如PBS或DMSO);和(c)确定由第一组织样品和第二组织样品产生的RNA转录物的量;和(d)比较由第一组织样品产生的RNA转录物的量与第二组织样品产生的RNA转录物的量,其中相对于由第二组织样品产生的RNA转录物的量,由第一组织样品产生的RNA转录物的量的调节表明式(I)的化合物或其形式调节RNA转录物的量。可以根据这些方法使用任何包含细胞的组织样品。在某些方面,组织样品是血液样品、皮肤样品、肌肉样品或肿瘤样品。本领域技术人员已知的技术可以用于从对象获得组织样品。
在一些方面,进行剂量反应分析。一方面,剂量反应分析包括:(a)使(多种)细胞与一定浓度的式(I)的化合物或其形式接触;(b)确定由(多种)细胞产生的RNA转录物的量,其中相对于化合物不存在或阴性对照(例如,溶媒对照,如PBS或DMSO)存在下的RNA转录物的量,在化合物存在下的RNA转录物的量的调节表明式(I)的化合物或其形式调节RNA转录物的量;(c)重复步骤(a)和(b),其中唯一改变的实验变量是化合物或其形式的浓度;和(d)比较在不同浓度的化合物或其形式下产生的RNA转录物的量。另一方面,剂量反应分析包括:(a)在式(I)的化合物或其形式的存在下培养(多种)细胞;(b)在特定的一段时间后从(多种)细胞分离RNA转录物;(c)确定由(多种)细胞产生的RNA转录物的量,其中相对于化合物不存在或阴性对照(例如,溶媒对照,如PBS或DMSO)存在下的RNA转录物的量,在化合物存在下的RNA转录物的量的调节表明式(I)的化合物或其形式调节RNA转录物的量;(d)重复步骤(a)、(b)和(c),其中唯一改变的实验变量是化合物或其形式的浓度;和(e)比较在不同浓度的化合物或其形式下产生的RNA转录物的量。另一方面,剂量反应分析包括:(a)使含有细胞的微量滴定板的每个孔与不同浓度的式(I)的化合物或其形式接触;(b)确定由每个孔中的细胞产生的RNA转录物的量;和(c)评估在不同浓度的化合物或其形式下RNA转录物的量的变化。
一方面,剂量反应分析包括:(a)使(多种)细胞与一定浓度的式(I)的化合物或其形式接触,其中细胞在细胞培养容器(例如,96孔板)的孔内,在每个孔内的密度大致相同,其中细胞在不同的孔中与不同浓度的化合物接触;(b)从每个孔中的所述细胞分离RNA;(c)确定由每个孔中的(多种)细胞产生的RNA转录物的量;和(d)相对于不同浓度的化合物存在或化合物不存在或阴性对照(例如,溶媒对照,如PBS或DMSO)存在下的RNA转录物的量,评估在一种或多种浓度的化合物的存在下的RNA转录物的量的改变。
在某些方面,使(多种)细胞与化合物接触发生在细胞培养物中。在其他方面,使(多种)细胞与化合物接触发生在对象,如非人类动物对象中。
在本文所述的某些方面,使(多种)细胞与式(I)的化合物或其形式接触或培养,或使组织样品与式(I)的化合物或其形式或阴性对照接触15分钟、30分钟、45分钟、1小时、2小时、3小时、4小时、5小时、6小时、8小时、12小时、18小时、24小时、48小时、72小时或更长的时间段。在本文所述的其他方面,使(多种)细胞与式(I)的化合物或其形式接触或培养,或使组织样品与式(I)的化合物或其形式或阴性对照接触15分钟至1小时、1至2小时、2至4小时、6至12小时、12至18小时、12至24小时、28至24小时、24至48小时、48至72小时的时间段。
在本文所述的某些方面,使(多种)细胞与特定浓度的式(I)的化合物或其形式接触或培养,或使组织样品与特定浓度的式(I)的化合物或其形式接触,其中所述特定浓度为0.0001μM、0.0003μM、0.001μM、0.003μM、0.01μM、0.05μM、1μM、2μM、5μM、10μM、15μM、20μM、25μM、50μM、75μM、100μM或150μM。在本文所述的其他方面,使(多种)细胞与特定浓度的式(I)的化合物或其形式接触或培养,或使组织样品与特定浓度的式(I)的化合物或其形式接触,其中所述特定浓度为0.0001μM、0.0003μM、0.0005μM、0.001μM、0.003μM、0.005μM、0.01μM、0.03μM、0.05μM、0.1μM、0.3μM、0.5μM或1μM。在本文所述的其他方面,使(多种)细胞与特定浓度的式(I)的化合物或其形式接触或培养,或使组织样品与特定浓度的式(I)的化合物或其形式接触,其中所述特定浓度为175μM、200μM、250μM、275μM、300μM、350μM、400μM、450μM、500μM、550μM 600μM、650μM、700μM、750μM、800μM、850μM、900μM、950μM或1mM。在本文所述的一些方面,使(多种)细胞与特定浓度的式(I)的化合物或其形式接触或培养,或使组织样品与特定浓度的式(I)的化合物或其形式接触,其中所述特定浓度为5nM、10nM、20nM、30nM、40nM、50nM、60nM、70nM、80nM、90nM、100nM、150nM、200nM、250nM、300nM、350nM、400nM、450nM、500nM、550nM、600nM、650nM、700nM、750nM、800nM、850nM、900nM或950nM。在本文所述的某些方面,使(多种)细胞与特定浓度的式(I)的化合物或其形式接触或培养,或使组织样品与特定浓度的式(I)的化合物或其形式接触,其中所述特定浓度为0.0001μM至0.001μM、0.0001μM至0.01μM、0.0003μM至0.001μM、0.0003μM至0.01μM、0.001μM至0.01μM、0.003μM至0.01μM、0.01μM至0.1μM、0.1μM至1μM、1μM至50μM、50μM至100μM、100μM至500μM、500μM至1nM、1nM至10nM、10nM至50nM、50nM至100nM、100nM至500nM、500nM至1000nM。
另一方面,本文提供了用于确定式(I)的化合物或其形式是否调节RNA转录物(例如,mRNA转录物)的量的方法,包括:(a)向对象(在某些方面,非人类动物)施用式(I)的化合物或其形式;和(b)确定从对象获得的样品中RNA转录物的量,其中相对于化合物中的RNA转录物的量,其中相对于来自施用化合物或其形式之前的对象的样品或来自未施用化合物或其形式的相同物种的不同对象的样品中的RNA转录物的量,来自施用了化合物或其形式的对象的样品中测量的RNA转录物的量的调节表明式(I)的化合物或其形式调节RNA转录物的量。另一方面,本文提供了用于确定式(I)的化合物或其形式是否调节RNA转录物(例如,mRNA转录物)的量的方法,包括:(a)向第一对象(在某些方面,非人类动物)施用式(I)的化合物或其形式;(b)向与第一对象物种相同的第二对象(在某些方面,非人类动物)施用非活性对照(例如,药物载体);和(c)确定来自第一对象的第一组织样品中的RNA转录物的量和来自第二对象的第二组织样品中的RNA转录物的量;和(d)比较第一组织样品中的RNA转录物的量与第二组织样品中的RNA转录物的量,其中相对于第二组织样品中的RNA转录物的量,第一组织样品中的RNA转录物的量的调节表明式(I)的化合物或其形式调节RNA转录物的量。在某些方面,向对象施用式(I)的化合物或其形式的剂量为约0.001mg/kg/天至约500mg/kg/天。在一些方面,根据本文所述的方法向对象施用单剂量的式(I)的化合物或其形式。在其他方面,根据本文所述的方法向对象施用2、3、4、5或更多个剂量的式(I)的化合物。在特定方面,式(I)的化合物或其形式在药学上可接受的载体、赋形剂或稀释剂中在对象中施用。
另一方面,本文提供了用于确定式(I)的化合物或其形式是否修饰RNA转录物(例如,mRNA转录物)的剪接的方法,包括:(a)向对象(在某些方面,非人类动物)施用式(I)的化合物或其形式;和(b)确定从对象获得的样品中的两种或更多种RNA转录物剪接变体的量,其中相对于来自施用化合物或其形式之前的对象的样品或来自未施用化合物或其形式的相同物种的不同对象的样品中的两种或更多种RNA转录物剪接变体的量,来自施用了化合物或其形式的对象的样品中测量的两种或更多种RNA转录物剪接变体的量的调节表明式(I)的化合物或其形式修饰RNA转录物的剪接。在另一方面,本文提供了用于确定式(I)的化合物或其形式是否修饰RNA转录物(例如,mRNA转录物)的剪接的方法,包括:(a)向第一对象(在某些方面,非人类动物)施用式(I)的化合物或其形式;(b)向与第一对象物种相同的第二对象(在某些方面,非人类动物)施用阴性对照(例如,药物载体);(c)确定来自第一对象的第一组织样品中的两种或更多种RNA转录物剪接变体的量和来自第二对象的第二组织样品中的两种或更多种RNA转录物剪接变体的量;(d)比较第一组织样品中的两种或更多种RNA转录物剪接变体的量与第二组织样品中的两种或更多种RNA转录物剪接变体的量,其中相对于第二组织样品中的两种或更多种RNA转录物剪接变体的量,第一组织样品中的两种或更多种RNA转录物剪接变体的量的调节表明式(I)的化合物或其形式调节RNA转录物的剪接。在某些方面向对象施用式(I)的化合物或其形式的剂量为约0.001mg/kg/天至约500mg/kg/天。在一些方面,根据本文所述的方法向对象施用单剂量的式(I)的化合物或其形式。在其他方面,根据本文所述的方法向对象施用2、3、4、5或更多个剂量的式(I)的化合物。在特定方面,式(I)的化合物或其形式在药学上可接受的载体、赋形剂或稀释剂中在对象中施用。
在一些方面,与(多种)细胞或组织样品接触或培养或施用于对象的式(I)的化合物或其形式是本文所述的化合物。
本领域技术人员已知的技术可以用于确定(多种)RNA转录物的量。在一些方面,使用以下测量一种、两种、三种或更多种RNA转录物的量:深度测序,如RNASeq、下一代测序(NGS)、ION TORRENTTM RNA下一代测序、454TM焦磷酸测序或通过寡核苷酸连接检测测序(SOLIDTM),单分子实时(SMRT)测序,纳米孔测序。在其他方面,使用外显子阵列,例如人外显子阵列,测量多种RNA转录物的量。在某些方面,通过RT-PCR测量一种、两种、三种或更多种RNA转录物的量。在其他方面,通过RT-qPCR或数字颜色编码条形码技术测量一种、两种、三种或更多种RNA转录物的量。进行这些分析的技术是本领域技术人员已知的。
在一些方面,对源自所述分析的数据进行分析以测量剪接的幅度,以相对于化合物不存在或阴性对照存在下的量,确定在化合物存在下产生的剪接成mRNA转录物的外显子的量。在优选的方面,所使用的方法是计算拼接百分比(ΔPSI)的变化。该方法利用来自RNAseq的读取数据(或任何其他可区分mRNA剪接同种型的方法)来计算显示包含(上游外显子与目标外显子之间的连接)或排除(上游和下游外显子之间的连接,不包括目标外显子)的读数之间的比例(百分比),以证明相对于化合物不存在或阴性对照存在下的包含的量,化合物的存在是否影响外显子包含的量。
ΔPSI值从以下公式得出:
ΔPSI(%)=C-U x100
其中,“U”表示在不存在化合物的情况下iExon包含的概率的值(a+b)/2/[(a+b)/2+c];并且,其中“C”表示在存在该化合物的情况下iExon包含的概率的值(a+b)/2/[(a+b)/2+c]。“a”和“b”的值表示支持在RNA转录物中包含iExon的读取次数。换言之,“a”值来自于第一内含子核苷酸序列的读取的量,所述第一内含子核苷酸序列按5’至3’顺序包含:可操作地连接并在第一内含子核苷酸序列上游的第一外显子5’剪接位点,其包含进一步可操作地连接并在第一内含子3’剪接位点上游(新生iExon上游)的第一分支点。“b”值来自于第二内含子核苷酸序列的读取的量,所述第二内含子核苷酸序列按5’至3’顺序包含:可操作地连接并在第二内含子核苷酸序列上游的REMS序列,其包含进一步可操作地连接并在第二外显子的第二内含子3’剪接位点上游的第二分支点。“c”的值表示支持排除iExon的读取次数。因此,当化合物使剪接机制能够识别新生iExon时,在剪接调节化合物的存在下,“C”的值将与不存在化合物的情况下的“U”的值不同。可以根据统计分析方法或本领域普通技术人员已知的其他概率分析方法获得关于iExon包含的可能性的统计上显著的值。
在一些方面,对来自用于测量RNA转录物的分析的数据进行统计分析或其他概率分析。在某些方面,例如,基于来自用于测量相对于化合物不存在或阴性对照存在下的量,RNA转录物的量在化合物的存在下是否被调节的一个或多个分析的数据,通过比较包含和排除iExon(或区域)的总读取次数,进行Fisher精确检验统计分析。在特定方面,统计分析得出的那些调节的RNA转录物的置信度值为10%、5%、4%、3%、2%、1%、0.5%、0.1%、0.01%、0.001%或0.0001%。在一些特定方面,置信度值是那些调节的RNA转录物的p值,为10%、5%、4%、3%、2%、1%、0.5%、0.1%、0.01%、0.001%或0.0001%。在某些特定方面,那些调节的RNA转录物的精确检验、学生t检验或p值分别为10%、5%、4%、3%、2%、1%、0.5%或0.1%和10%、5%、4%、3%、2%、1%、0.5%、0.1%、0.01%、0.001%或0.0001%。
在某些方面,进行另外的分析以确定式(I)的化合物或其形式如何改变(多种)RNA转录物的量。在特定方面,进行另外的分析以确定相对于化合物或其形式不存在或阴性对照存在下的(多种)RNA转录物的量,在式(I)的化合物或其形式的存在下的(多种)RNA转录物的量的调节是否是由于(多种)RNA转录物的转录、剪接和/或稳定性的变化引起的。可以使用本领域技术人员已知的技术来确定式(I)的化合物或其形式是否改变例如(多种)RNA转录物的转录、剪接和/或稳定性。
在某些方面,通过以下确定一种或多种RNA转录物的稳定性:基因表达系列分析(SAGE)、差异显示分析(DD)、RNA任意引物(RAP)-PCR、差异表达序列的限制性核酸内切酶裂解分析(READS)、扩增限制性片段长度多态性(ALFP)、总基因表达分析(TOGA)、RT-PCR、RT-RPA(重组酶聚合酶扩增)、RT-qPCR、RNA-Seq、数字彩色编码条形码技术、高密度cDNA过滤杂交分析(HDFCA)、抑制消减杂交(SSH)、差异筛选(DS)、cDNA阵列、寡核苷酸芯片或组织微阵列。在其他方面,一种或多种RNA转录物的稳定性通过RNA印迹、RNA酶保护或狭缝印迹来确定。
在一些方面,在细胞或组织样品与转录抑制剂,如α-鹅膏菌素、DRB、黄酮吡醇、雷公藤甲素或放线菌素-D接触或培养之前(例如,5分钟、10分钟、30分钟、1小时、2小时、4小时、6小时、8小时、12小时、18小时、24小时、36小时、48小时或72小时之前)或之后(例如,5分钟、10分钟、30分钟、1小时、2小时、4小时、6小时、8小时、12小时、18小时、24小时、36小时、48小时或72小时之后)抑制(多种)细胞或组织样品的转录。在其他方面,在(多种)细胞或组织样品与式(I)的化合物或其形式接触或培养的同时,用转录抑制剂,如α-鹅膏菌素、DRB、黄酮吡醇、雷公藤甲素或放线菌素-D抑制(多种)细胞或组织样品中的转录。
在某些方面,一种或多种RNA转录物的转录水平通过核连缀分析或体外转录起始和延伸分析来确定。在一些方面,转录的检测基于测量放射性或荧光。在一些方面,使用基于PCR的扩增步骤。
在特定方面,测量特定基因的RNA转录物的供选择的剪接形式的量,以查看该基因的RNA转录物的一种、两种或更多种供选择的剪接形式的量是否存在调节。在一些方面,测量由特定基因编码的(多种)同种型的量,以查看该(多种)同种型的量是否存在调节。在某些方面,RNA的剪接形式的水平通过RT-PCR、RT-qPCR、RNA-Seq、数字彩色编码条形码技术或RNA印迹来定量。在其他方面,序列特异性技术可用于检测单个剪接形式的水平。在某些方面,使用细胞核提取物体外测量剪接。在一些方面,检测基于测量放射性或荧光。本领域技术人员已知的技术可用于测量基因的RNA转录物的供选择的剪接形式的量的调节和基因编码的同种型的量的调节。
药物组合物和施用方式
当向患者施用时,式(I)的化合物或其形式优选作为组合物的组分施用,该组合物任选地包含药学上可接受的载体,赋形剂或稀释剂。组合物可以口服施用,或通过任何其他方便的途径施用,例如,通过输注或推注注射,通过上皮或粘膜皮肤衬壁吸收(例如,口腔粘膜、直肠和肠粘膜)吸收,并且可以与另一种生物活性剂一起施用。施用可以是全身的或局部的。各种递送系统是已知的,例如封装在脂质体、微粒、微囊、胶囊中,并且可以用于施用化合物。
施用方法包括但不限于肠胃外、皮内、肌肉内、腹膜内、静脉内、皮下、鼻内、硬膜外、口服、舌下、鼻内、眼内、肿瘤内、脑内、阴道内、经皮、经眼、经直肠、吸入或局部,特别是向耳朵、鼻子、眼睛或皮肤施用。施用方式由医师决定。在大多数情况下,施用会导致化合物释放到血液、组织或(多种)细胞中。在具体方面,化合物是口服施用的。
有效治疗由异常量的mRNA转录物引起的疾病的式(I)的化合物或其形式的量取决于例如施用途径,所治疗的疾病,对象的总体健康状况,对象的种族、年龄、体重和性别,饮食,时间和疾病进展的严重程度,并且应根据从业者的判断以及每个患者或对象的情况来决定。
在特定方面,在向患者施用式(I)的化合物或其形式或其组合物或药物的上下文中,“有效量”是指式(I)的化合物或其形式的具有治疗作用和/或有益作用的量。在某些特定方面,在向患者施用式(I)的化合物或其形式或其组合物或药物的上下文中,“有效量”导致以下作用中的一种、两种或更多种:(i)降低或改善疾病的严重程度;(ii)延迟疾病发作;(iii)抑制疾病的进展;(iv)减少对象的住院;(v)缩短对象的住院时间;(vi)增加对象的存活率;(vii)改善对象的生活质量;(viii)减少与疾病相关的症状数量;(ix)减轻或改善与疾病相关的(多种)症状的严重性;(x)减少与疾病相关的症状的持续时间;(xi)防止与疾病相关的症状的复发;(xii)抑制疾病症状的发展或发作;和/或(xiii)抑制与疾病相关的症状的进展。在某些方面,式(I)的化合物或其形式的有效量是这样的量,其有效地使基因的RNA转录物的量恢复到健康患者或来自健康患者的细胞中可检测到的RNA转录物的量。在其他方面,式(I)的化合物或其形式的有效量是这样的量,其有效地使基因的RNA同种型和/或蛋白同种型的量恢复到健康患者或来自健康患者的细胞中可检测到的RNA同种型和/或蛋白同种型的量。
在某些方面,式(I)的化合物或其形式的有效量是这样的量,其有效降低与疾病相关的基因的RNA转录物的异常量。在某些方面,式(I)的化合物或其形式的有效量是这样的量,其有效降低基因的同种型的异常表达的量。在一些方面,式(I)的化合物或其形式的有效量是这样的量,其有效导致RNA转录物(例如,mRNA转录物)、供选择的剪接变体或同种型的量实质改变。
在某些方面,式(I)的化合物或其形式的有效量是这样的量,其有效地使有益于预防和/或治疗疾病的基因的RNA转录物(例如,mRNA转录物)的量升高或降低。在某些方面,式(I)的化合物或其形式的有效量是这样的量,其有效地使有益于预防和/或治疗疾病的基因的RNA转录物的供选择的剪接变体的量升高或降低。在某些方面,式(I)的化合物或其形式的有效量是这样的量,其有效地使有益于预防和/或治疗疾病的基因的同种型的量升高或降低。本文描述了式(I)的化合物或其形式的有效量的非限制性实例。
例如,有效量可以是预防和/或治疗与人类对象中基因的mRNA转录物的异常量相关的疾病所需的量。
通常,对于体重为约1kg至约200kg的患者,有效量将在约0.001mg/kg/天至约500mg/kg/天的范围内。预期典型的成人对象的中值体重在约70至约100kg的范围内。
在本说明书的范围内,用于制备药物、制备药物试剂盒或用于预防和/或治疗有此需要的人类对象的疾病的方法的式(I)的化合物或其形式的“有效量”意在包括约0.001mg至约35,000mg范围内的量。
本文所述的组合物经配制以通过本领域已知的任何药物递送途径施用于对象。非限制性实例包括口腔、眼、直肠、颊、局部、经鼻、经眼、皮下、肌内、静脉内(推注和输注)、脑内、透皮和肺部施用途径。
本文所述的方面包括式(I)的化合物或其形式在药物组合物中的用途。在具体方面,本文描述了式(I)的化合物或其形式在用于预防和/或治疗有此需要的人类对象的疾病的药物组合物中的用途,包括给予与药学上可接受的载体、赋形剂或稀释剂混合的有效量的式(I)的化合物或其形式。在具体方面,人类对象是患有与异常量的(多种)mRNA转录物相关的疾病的患者。
式(I)的化合物或其形式可以任选地为包含该化合物或其形式和任选的载体、赋形剂或稀释剂的组合物的形式。本文提供的其他方面包括药物组合物,其包含有效量的式(I)的化合物或其形式和药学上可接受的载体、赋形剂或稀释剂。在具体方面,药物组合物适合于兽医和/或人施用。本文提供的药物组合物可以是允许将组合物施用于对象的任何形式。
在特定的方面和在该上下文中,术语“药学上可接受的载体、赋形剂或稀释剂”是指经联邦或州政府的监管机构批准或在美国药典或通常公认的用于动物,尤其是人类的药典中列出的载体、赋形剂或稀释剂。术语“载体”是指与治疗剂一起施用的稀释剂、佐剂(例如弗氏佐剂(完全和不完全)),赋形剂或溶媒。这样的药物载体可以是无菌液体,例如水和油,包括石油、动物、植物或合成来源的油,例如花生油、大豆油、矿物油、芝麻油等。水是用于静脉内施用的药物组合物的特定载体。盐溶液以及葡萄糖和甘油水溶液也可以用作液体载体,特别是用于注射溶液。
典型的组合物和剂型包含一种或多种赋形剂。合适的赋形剂是药学领域技术人员众所周知的,并且合适的赋形剂的非限制性实例包括淀粉、葡萄糖、乳糖、蔗糖、明胶、麦芽、大米、面粉、白垩、硅胶、硬脂酸钠、单硬脂酸甘油酯、滑石粉、氯化钠、脱脂奶粉、甘油、丙二醇、水、乙醇等。特定的赋形剂是否适合掺入药物组合物或剂型中取决于本领域众所周知的多种因素,包括但不限于剂型将施用于患者的方式和剂型中的特定的活性剂。本文还提供了包含一种或多种如本文所述的式(I)的化合物或其形式的无水药物组合物和剂型。组合物和单一单位剂型可以采取溶液剂或糖浆剂(任选地具有调味剂)、混悬剂(任选地具有调味剂)、乳剂、片剂(例如咀嚼片)、丸剂、胶囊剂、颗粒剂、散剂(任选用于重新配制)、掩味或持续释放制剂等。
本文提供的适用于口服施用的药物组合物可以以离散剂型存在,例如但不限于片剂、囊片剂、胶囊剂、颗粒剂、散剂和液体剂。这样的剂型包含预定量的活性成分,并且可以通过本领域技术人员众所周知的药学方法来制备。
可用于本文提供的口服剂型的赋形剂的实例包括但不限于粘合剂、填充剂、崩解剂和润滑剂。
调节特定基因编码的RNA转录物的量的方法
一方面,本文描述了用于修饰RNA剪接以调节基因产物的量的方法,其中从所述基因转录的前体RNA转录物包含内含子REMS,并且所述方法利用本文所述的化合物。在某些方面,基因是本文所述的基因中的任一种。在某些方面,基因包含编码非内源内含子REMS的核苷酸序列。一方面,本文提供了用于修饰RNA剪接以调节本文所述的基因中的一种、两种、三种或更多种RNA转录物的量的方法,该方法包括使细胞与式(I)的化合物或其形式接触。
另一方面,本文提供了用于修饰RNA剪接以调节基因产物(如RNA转录物或蛋白)的量的方法,其中所述基因包含编码两个外显子和内含子的DNA核苷酸序列,其中编码第一外显子的核苷酸序列在编码内含子的核苷酸序列的上游,并且编码第二外显子的核苷酸序列在编码内含子的核苷酸序列的下游,其中所述编码内含子的DNA核苷酸序列按5’至3’顺序包含:编码第一5’剪接位点的核苷酸序列、编码第一分支点的核苷酸序列、编码第一3’剪接位点的核苷酸序列、编码iREMS的核苷酸序列、编码第二分支点的核苷酸序列和编码第二3’剪接位点的核苷酸序列,其中编码所述iREMS的核苷酸序列包含DNA序列Gagtrngn,并且其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,所述方法包括使细胞与本文所述的化合物(例如,式(I)的化合物或其形式)接触。
另一方面,本文提供了用于修饰RNA剪接以调节基因产物(如RNA转录物或蛋白)的量的方法,其中所述基因包含编码两个外显子和内含子的DNA核苷酸序列,其中编码第一外显子的核苷酸序列在编码内含子的核苷酸序列的上游,并且编码第二外显子的核苷酸序列在编码内含子的核苷酸序列的下游,其中所述内含子的DNA核苷酸序列按5’至3’顺序包含:编码iREMS的核苷酸序列、编码分支点的核苷酸序列和编码3’剪接位点的核苷酸序列,其中编码所述iREMS的核苷酸序列包含DNA序列GAgtrngn,并且其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,所述方法包括使细胞与本文所述的化合物(例如,式(I)的化合物或其形式)接触。
另一方面,本文提供了用于修饰RNA剪接以调节基因产物(如RNA转录物或蛋白)的量的方法,其中所述基因包含编码两个外显子和内含子的DNA核苷酸序列,并且其中所述DNA核苷酸序列编码图1A示出的外显子和内含子元件,所述方法包括使细胞与本文所述的化合物接触。
另一方面,本文提供了用于修饰RNA剪接以调节基因产物(如RNA转录物或蛋白)的量的方法,其中所述基因包含编码两个外显子和内含子的DNA核苷酸序列,并且其中所述DNA核苷酸序列编码图1B示出的外显子和内含子元件,所述方法包括使细胞与本文所述的化合物接触。
另一方面,本文提供了用于修饰RNA剪接以调节基因产物(如RNA转录物或蛋白)的量的方法,其中所述基因包含编码两个外显子和内含子的DNA核苷酸序列,并且其中所述DNA核苷酸序列编码图1C示出的外显子和内含子元件,所述方法包括使细胞与本文所述的化合物接触。
在具体方面,所述基因是在本公开的表中描述的基因。
另一方面,本文提供了用于修饰RNA剪接以调节本文所述的基因的一种、两种、三种或更多种RNA转录物的量的方法,其中从所述基因转录的前体转录物包含内含子REMS,所述方法包括使细胞与式(I)的化合物或其形式接触。在具体方面,所述前体转录物按5’至3’顺序包含:分支点、3’剪接位点和内含子REMS。在另一个具体方面,前体转录物按5’至3’顺序包含:第一5’剪接位点、第一分支点、第一3’剪接位点、内含子REMS、第二分支点和第二3’剪接位点。在另一个具体方面,前体转录物按5’至3’顺序包含:内含子REMS、分支点和3’剪接位点。
另一方面,本文提供了用于修饰RNA剪接以调节本文所述的基因的一种、两种、三种或更多种RNA转录物的量的方法,其中从所述基因转录的前体转录物包含内含子REMS,所述方法包括使细胞与式(I)的化合物或其形式接触。在具体方面,前体转录物按5’至3’顺序包含:分支点、3’剪接位点和内含子REMS。在另一个具体方面,前体转录物按5’至3’顺序包含:第一5’剪接位点、第一分支点、第一3’剪接位点、内含子REMS、第二分支点和第二3’剪接位点。在另一个具体方面,前体转录物按5’至3’顺序包含:内含子REMS、分支点和3’剪接位点。
另一方面,本文提供了用于修饰RNA剪接以调节本文所述的基因的一种、两种、三种或更多种RNA转录物的量的方法,包括使细胞与式(I)的化合物或其形式接触。关于本文所述的基因的另外的信息,参见实施例部分。在某些方面,细胞在细胞培养物中与式(I)的化合物或其形式接触。在其他方面,细胞在对象(例如,非人类动物对象或人类对象)中与式(I)的化合物或其形式接触。
一方面,本文提供了用于修饰RNA剪接以产生成熟mRNA转录物的方法,所述成熟mRNA转录物具有来自前体mRNA转录物的iExon,其中所述前体mRNA转录物包含两个外显子和内含子,其中第一外显子在内含子的上游,并且第二外显子在内含子的下游,其中所述内含子按5’至3’顺序包含:第一5’剪接位点、第一分支点、第一3’剪接位点、内源或非内源剪接修饰剂的内含子识别元件(iREMS)、第二分支点和第二3’剪接位点,其中所述iREMS包含RNA序列GAgurngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸。
一方面,本文提供了用于修饰RNA剪接以产生具有iExon的成熟mRNA转录物的方法,所述方法包括使前体mRNA转录物与接触式(I)的化合物或其形式,其中所述前体mRNA转录物包含两个外显子和内含子,其中第一外显子在内含子的上游,并且第二外显子在内含子的下游,其中所述内含子包含按5’至3’顺序:第一5’剪接位点、第一分支点、第一3’剪接位点、内源或非内源剪接修饰剂的内含子识别元件(iREMS)、第二分支点和第二3’剪接位点,其中所述iREMS包含RNA序列GAgurngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸。
另一方面,本文提供了用于修饰RNA剪接以产生具有iExon的成熟mRNA转录物的方法,所述方法包括使包含前体mRNA转录物的细胞或细胞裂解物与式(I)的化合物或其形式接触,其中所述前体mRNA转录物包含两个外显子和内含子,其中第一外显子在内含子的上游,并且第二外显子在内含子的下游,其中所述内含子按5’至3’顺序包含:第一5’剪接位点、第一分支点、第一3’剪接位点、内源或非内源剪接修饰剂的内含子识别元件(iREMS)、第二分支点和第二3’剪接位点,其中所述iREMS包含RNA序列GAgurngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸。在一些方面,前体mRNA转录物由本文公开(例如,在本文的表中)的基因编码。
在特定方面,本文提供了用于修饰RNA剪接以产生具有iExon的成熟mRNA转录物的方法,所述方法包括使前体mRNA转录物与式(I)的化合物或其形式接触,其中所述前体mRNA转录物包含两个外显子和内含子,其中第一外显子在内含子的上游,并且第二外显子在内含子的下游,其中所述内含子按5’至3’顺序包含:第一5’剪接位点、第一分支点、第一3’剪接位点、内源或非内源剪接修饰剂的内含子识别元件(iREMS)、第二分支点和第二3’剪接位点,其中所述iREMS包含RNA序列GAgurngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,并且其中所述前体mRNA转录物是选自以下的基因的前体mRNA转录物:ABCB8、ABCC3、ADAM17、ADCY3、AGPAT4、ANKRA2、ANXA11、APIP、APPL2、ARHGAP1、ARL15、ASAP1、ASPH、ATAD2B、ATXN1、BECN1、BHMT2、BICD1、BTN3A1、C11orf30、C11orf73、C12orf4、C14orf132、C8orf44、C8orf44-SGK3、C8orf88、CASC3、CASP7、CCDC122、CDH13、CECR7、CENPI、CEP112、CEP192、CHEK1、CMAHP、CNRIP1、COPS7B、CPSF4、CRISPLD2、CRYBG3、CSNK1E、CSNK1G1、DCAF17、DCUN1D4、DDX42、DENND1A、DENND5A、DGKA、DHFR、DIAPH3、DNAJC13、DNMBP、DOCK1、DYRK1A、EIF2B3、ENAH、ENOX1、EP300、ERC1、ERLIN2、ERRFI1、EVC、FAF1、FAIM、FAM126A、FAM13A、FAM162A、FAM174A、FBN2、FER、FHOD3、FOCAD、GALC、GCFC2、GGACT、GLCE、GOLGA4、GOLGB1、GPSM2、GULP1、GXYLT1、HDX、HLTF、HMGA2、HNMT、HSD17B12、HSD17B4、HTT、IFT57、IVD、KDM6A、KIAA1524、KIAA1715、LETM2、LOC400927、LRRC42、LUC7L3、LYRM1、MB21D2、MCM10、MED13L、MEDAG、MEMO1、MFN2、MMS19、MRPL45、MRPS28、MTERF3、MYCBP2、MYLK、MYOF、NGF、NREP、NSUN4、NT5C2、OSMR、OXCT1、PAPD4、PCM1、PDE7A、PDS5B、PDXDC1、PIGN、PIK3CD、PIK3R1、PIKFYVE、PITPNB、PLEKHA1、PLSCR1、PMS1、POMT2、PPARG、PPIP5K2、PPP1R26、PRPF31、PRSS23、PSMA4、PXK、RAF1、RAPGEF1、RARS2、RBKS、RERE、RFWD2、RPA1、RPS10、SAMD4A、SAR1A、SCO1、SEC24A、SENP6、SERGEF、SGK3、SLC12A2、SLC25A17、SLC44A2、SMYD3、SNAP23、SNHG16、SNX7、SOS2、SPATA5、SPIDR、SPRYD7、SRGAP1、SRRM1、STAT1、STXBP6、SUPT20H、TAF2、TASP1、TBC1D15、TCF12、TCF4、TIAM1、TJP2、TMC3、TMEM214、TNRC6A、TNS3、TOE1、TRAF3、TSPAN2、TTC7B、TYW5、UBAP2L、URGCP、VAV2、WDR27、WDR37、WDR91、WNK1、XRN2、ZCCHC8、ZFP82、ZNF138、ZNF232和ZNF37BP。
在另一个特定方面,本文提供了用于修饰RNA剪接以产生具有iExon的成熟mRNA转录物的方法,所述方法包括使包含前体mRNA转录物的细胞或细胞裂解物与式(I)的化合物或其形式接触,其中所述前体mRNA转录物包含两个外显子和内含子,其中第一外显子在内含子的上游,并且第二外显子在内含子的下游,其中所述内含子按5’至3’顺序包含:第一5’剪接位点、第一分支点、第一3’剪接位点、内源或非内源剪接修饰剂的内含子识别元件(iREMS)、第二分支点和第二3’剪接位点,其中所述iREMS包含RNA序列GAgurngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,并且其中所述前体mRNA转录物是选自以下的基因的前体mRNA转录物:ABCB8、ABCC3、ADAM17、ADCY3、AGPAT4、ANKRA2、ANXA11、APIP、APPL2、ARHGAP1、ARL15、ASAP1、ASPH、ATAD2B、ATXN1、BECN1、BHMT2、BICD1、BTN3A1、C11orf30、C11orf73、C12orf4、C14orf132、C8orf44、C8orf44-SGK3、C8orf88、CASC3、CASP7、CCDC122、CDH13、CECR7、CENPI、CEP112、CEP192、CHEK1、CMAHP、CNRIP1、COPS7B、CPSF4、CRISPLD2、CRYBG3、CSNK1E、CSNK1G1、DCAF17、DCUN1D4、DDX42、DENND1A、DENND5A、DGKA、DHFR、DIAPH3、DNAJC13、DNMBP、DOCK1、DYRK1A、EIF2B3、ENAH、ENOX1、EP300、ERC1、ERLIN2、ERRFI1、EVC、FAF1、FAIM、FAM126A、FAM13A、FAM162A、FAM174A、FBN2、FER、FHOD3、FOCAD、GALC、GCFC2、GGACT、GLCE、GOLGA4、GOLGB1、GPSM2、GULP1、GXYLT1、HDX、HLTF、HMGA2、HNMT、HSD17B12、HSD17B4、HTT、IFT57、IVD、KDM6A、KIAA1524、KIAA1715、LETM2、LOC400927、LRRC42、LUC7L3、LYRM1、MB21D2、MCM10、MED13L、MEDAG、MEMO1、MFN2、MMS19、MRPL45、MRPS28、MTERF3、MYCBP2、MYLK、MYOF、NGF、NREP、NSUN4、NT5C2、OSMR、OXCT1、PAPD4、PCM1、PDE7A、PDS5B、PDXDC1、PIGN、PIK3CD、PIK3R1、PIKFYVE、PITPNB、PLEKHA1、PLSCR1、PMS1、POMT2、PPARG、PPIP5K2、PPP1R26、PRPF31、PRSS23、PSMA4、PXK、RAF1、RAPGEF1、RARS2、RBKS、RERE、RFWD2、RPA1、RPS10、SAMD4A、SAR1A、SCO1、SEC24A、SENP6、SERGEF、SGK3、SLC12A2、SLC25A17、SLC44A2、SMYD3、SNAP23、SNHG16、SNX7、SOS2、SPATA5、SPIDR、SPRYD7、SRGAP1、SRRM1、STAT1、STXBP6、SUPT20H、TAF2、TASP1、TBC1D15、TCF12、TCF4、TIAM1、TJP2、TMC3、TMEM214、TNRC6A、TNS3、TOE1、TRAF3、TSPAN2、TTC7B、TYW5、UBAP2L、URGCP、VAV2、WDR27、WDR37、WDR91、WNK1、XRN2、ZCCHC8、ZFP82、ZNF138、ZNF232和ZNF37BP。
在另一个特定方面,本文提供了用于修饰RNA剪接以产生具有iExon的成熟mRNA转录物的方法,所述方法包括使包含前体mRNA转录物的细胞或细胞裂解物与式(I)的化合物或其形式接触,其中所述前体mRNA转录物包含两个外显子和内含子,其中第一外显子在内含子的上游,并且第二外显子在内含子的下游,其中所述内含子按5’至3’顺序包含:第一5’剪接位点、第一分支点、第一3’剪接位点、内源或非内源剪接修饰剂的内含子识别元件(iREMS)、第二分支点和第二3’剪接位点,其中所述iREMS包含RNA序列GAgurngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,并且其中所述前体mRNA转录物是选自以下的基因的前体mRNA转录物:ABCA1、ABCA10、ABCB7、ABCB8、ABCC1、ABCC3、ABHD10、ABL2、ABLIM3、ACACA、ACADVL、ACAT2、ACTA2、ADAL、ADAM12、ADAM15、ADAM17、ADAM23、ADAM33、ADAMTS1、ADAMTS19、ADCY3、ADD1、ADGRG6、ADH6、ADHFE1、AFF2、AFF3、AGK、AGPAT3、AGPAT4、AGPS、AHCYL2、AHDC1、AHRR、AJUBA、AK021888、AK310472、AKAP1、AKAP3、AKAP8L、AKAP9、AKNA、AKT1、ALCAM、ALDH4A1、AMPD2、ANK1、ANK2、ANK3、ANKFY1、ANKHD1-EIF4EBP3、ANKRA2、ANKRD13C、ANKRD17、ANKRD33B、ANKRD36、ANKS6、ANP32A、ANXA11、ANXA6、AP2B1、AP4B1-AS1、APAF1、APIP、APLP2、APOA2、APP、APPL2、APTX、ARHGAP1、ARHGAP12、ARHGAP22、ARHGAP5、ARHGEF16、ARID1A、ARID2、ARID5B、ARL9、ARL15、ARL5B、ARMCX3、ARMCX6、ARSJ、ASAP1、ASIC1、ASL、ASNS、ASPH、ATAD2B、ATF6、ATF7IP、ATG5、ATG9A、ATMIN、ATP2A3、ATP2C1、ATXN1、ATXN3、AURKA、AXIN1、B3GALT2、B3GNT6、B4GALT2、BACE1、BAG2、BASP1、BC033281、BCAR3、BCL2L15、BCYRN1、BECN1、BEND6、BHMT2、BICD1、BIN1、BIN3、BIN3-IT1、BIRC3、BIRC6、BNC1、BNC2、BRCA1、BRCA2、BRD2、BRPF1、BSCL2、BTBD10、BTG2、BTN3A1、BZW1、C1QTNF9B-AS1、C1orf27、C1orf86、C10orf54、C11orf30、C11orf70、C11orf73、C11orf76、C11orf94、C12orf4、C12orf56、C14orf132、C17orf76-AS1、C19orf47、C2orf47、C3、C4orf27、C5orf24、C6orf48、C7orf31、C8orf34、C8orf44、C8orf44-SGK3、C8orf88、C9orf69、CA13、CA3、CAB39、CACNA2D2、CACNB1、CACNB4、CADM1、CADM2、CALU、CAMKK1、CAND2、CAPNS1、CASC3、CASP7、CASP8AP2、CAV1、CCAR1、CCDC77、CCDC79、CCDC88A、CCDC92、CCDC122、CCER2、CCNF、CCNL2、CCT6A、CD276、CD46、CDC25B、CDC40、CDC42BPA、CDCA7、CDH11、CDH13、CDH18、CDK11B、CDK16、CDKAL1、CDKN1C、CECR7、CELSR1、CEMIP、CENPI、CEP112、CEP162、CEP170、CEP192、CEP57、CEP68、CFH、CFLAR、CHD8、CHEK1、CHRM2、CIITA、CIZ1、CLDN23、CLIC1、CLK4、CLTA、CMAHP、CNGA4、CNOT1、CNRIP1、CNTD1、CMSS1、CNOT7、CNRIP1、CNTN1、COG1、COL1A1、COL11A1、COL12A1、COL14A1、COL15A1、COL5A1、COL5A3、COL6A1、COL6A6、COL8A1、COLEC12、COMP、COPS7B、CPA4、CPEB2、CPQ、CPSF4、CREB5、CRISPLD2、CRLF1、CRLS1、CRTAP、CRX、CRYBG3、CRYL1、CSDE1、CSNK1A1、CSNK1E、CSNK1G1、CTDSP2、CTNND1、CTRC、CUL2、CUL4A、CUX1、CYB5B、CYB5R2、CYBRD1、CYGB、CYP1B1、CYP51A1、DAAM1、DAB2、DACT1、DAGLB、DARS、DAXX、DCAF10、DCAF11、DCAF17、DCBLD2、DCLK1、DCN、DCUN1D4、DDAH1、DDAH2、DDHD2、DDIT4L、DDR1、DDX39B、DDX42、DDX50、DEGS1、DENND1A、DENND1B、DENND4A、DENND5A、DEPTOR、DET1、DFNB59、DGCR2、DGK1、DGKA、DHCR24、DHCR7、DHFR、DHX9、DIAPH1、DIAPH3、DIRAS3、DIS3L、DKFZp434M1735、DKK3、DLC1、DLG5、DLGAP4、DMD、DMXL1、DNAH8、DNAH11、DNAJA4、DNAJC13、DNAJC27、DNM2、DNMBP、DOCK1、DOCK11、DPP8、DSEL、DST、DSTN、DYNC1I1、DYRK1A、DZIP1L、EBF1、EEA1、EEF1A1、EFCAB14、EFEMP1、EGR1、EGR3、EHMT2、EIF2B3、EIF4G1、EIF4G2、EIF4G3、ELF2、ELMO2、ELN、ELP4、EMX2OS、ENAH、ENG、ENOX1、ENPP1、ENPP2、ENSA、EP300、EPN1、EPT1、ERC1、ERC2、ERCC1、ERCC8、ERGIC3、ERLIN2、ERRFI1、ESM1、ETV5、EVC、EVC2、EXO1、EXOC3、EXOC6B、EXTL2、EYA3、F2R、FADS1、FADS2、FAF1、FAIM、FAM111A、FAM126A、FAM13A、FAM160A1、FAM162A、FAM174A、FAM195B、FAM198B、FAM20A、FAM208B、FAM219A、FAM219B、FAM3C、FAM46B、FAM49B、FAM65A、FAM65B、FAM69B、FAP、FARP1、FBLN2、FBN2、FBXL16、FBXL6、FBXO9、FBXO10、FBXO18、FBXO31、FBXO34、FBXO9、FCHO1、FDFT1、FDPS、FER、FEZ1、FGD4、FGD5-AS1、FGFR2、FGFRL1、FGL2、FHOD3、FLII、FLNB、FLT1、FN1、FNBP1、FOCAD、FOS、FOSB、FOSL1、FOXK1、FOXM1、FRAS1、FSCN2、FUS、FYN、GABPB1、GAL3ST4、GALC、GALNT1、GALNT15、GAS7、GATA6、GBA2、GBGT1、GBP1、GCFC2、GLCE、GCNT1、GDF6、GGACT、GGCT、GHDC、GIGYF2、GJC1、GLCE、GMIP、GNA13、GNAQ、GNAS、GNG12、GNL3L、GOLGA2、GOLGA4、GOLGB1、GORASP1、GPR1、GPR183、GPR50、GPR89A、GPRC5A、GPRC5B、GPSM2、GREM1、GRK6、GRTP1、GSE1、GTF2H2B、GTSF1、GUCA1B、GULP1、GXYLT1、HAPLN1、HAPLN2、HAS2、HAS3、HAT1、HAUS3、HAUS6、HAVCR2、HDAC5、HDAC7、HDX、HECTD2-AS1、HEG1、HEPH、HEY1、HLA-A、HLA-E、HLTF、HMGA1、HMGA2、HMGB1、HMGCR、HMGN3-AS1、HMGCS1、HMGXB4、HOOK3、HOXB3、HMOX1、HNMT、HNRNPR、HNRNPUL1、HP1BP3、HPS1、HRH1、HSD17B12、HSD17B4、HSPA1L、HTATIP2、HTT、IARS、IDH1、IDI1、IFT57、IGDCC4、IGF2BP2、IGF2R、IGFBP3、IKBKAP、IL16、IL6ST、INA、INHBA、INO80、IPP4B、INPP5K、INSIG1、INTU、INVS、IQCE、IQCG、ITCH、ITGA11、ITGA8、ITGAV、ITGB5、ITGB8、ITIH1、ITM2C、ITPKA、ITSN1、IVD、KANSL3、KAT6B、KCNK2、KCNS1、KCNS2、KDM6A、KDSR、KIAA1033、KIAA1143、KIAA1199、KIAA1456、KIAA1462、KIAA1522、KIAA1524、KIAA1549、KIAA1715、KIAA1755、KIDINS220、KIF14、KIF2A、KIF21A、KIF3A、KIT、KLC1、KLC2、KLF17、KLF6、KLHL7、KLRG1、KMT2D、KRT7、KRT18、KRT19、KRT34、KRTAP1-1、KRTAP1-5、KRTAP2-3、L3MBTL2、LAMA2、LAMB1、LAMB2P1、LARP4、LARP7、LATS2、LDLR、LEMD3、LETM2、LGALS3、LGALS8、LGI2、LGR4、LHX9、LIMS1、LINC00341、LINC00472、LINC00570、LINC00578、LINC00607、LINC00657、LINC00678、LINC00702、LINC00886、LINC00961、LINC01011、LINC01118、LINC01204、LINCR-0002、LINGO2、LMAN2L、LMNA、LMO7、LMOD1、LOC400927、LONP1、LOX、LPHN1、LRBA、LRCH4、LRIG1、LRP4、LRP8、LRRC1、LRRC32、LRRC39、LRRC42、LRRC8A、LSAMP、LSS、LTBR、LUC7L2、LUM、LYPD1、LYRM1、LZTS2、MACROD2、MADD、MAFB、MAGED4、MAGED4B、MAMDC2、MAN1A2、MAN2A1、MAN2C1、MANEA、MAP4K4、MAPK10、MAPK13、MARCH7、MARCH8、MASP1、MB、MB21D2、MBD1、MBOAT7、MC4R、MCM10、MDM2、MDN1、MEAF6、MECP2、MED1、MED13L、MEDAG、MEF2D、MEGF6、MEIS2、MEMO1、MEPCE、MFGE8、MFN2、MIAT、MICAL2、MINPP1、MIR612、MKL1、MKLN1、MKNK2、MLLT4、MLLT10、MLST8、MMAB、MMP10、MMP24、MMS19、MMS22L、MN1、MORF4L1、MOXD1、MPPE1、MPZL1、MRPL3、MRPL39、MRPL45、MRPL55、MRPS28、MRVI1、MSANTD3、MSC、MSH2、MSH4、MSH6、MSL3、MSMO1、MSRB3、MTAP、MTERF3、MTERFD1、MTHFD1L、MTMR3、MTMR9、MTRR、MUM1、MVD、MVK、MXRA5、MYADM、MYB、MYCBP2、MYLK、MYO1D、MYO9B、MYOF、NA、NAA35、NAALADL2、NADK、NAE1、NAGS、NASP、NAV1、NAV2、NCOA1、NCOA3、NCOA4、NCSTN、NDNF、NEDD4、NELFA、NEO1、NEURL1B、NF2、NFASC、NFE2L1、NFX1、NGF、NGFR、NHLH1、NID1、NID2、NIPA1、NKX3-1、NLGN1、NLN、NOL10、NOMO3、NOTCH3、NOTUM、NOVA2、NOX4、NPEPPS、NRD1、NREP、NRG1、NRROS、NSUN4、NT5C2、NT5E、NTNG1、NUDT4、NUP153、NUP35、NUP50、NUPL1、NUSAP1、OCLN、ODF2、OLR1、OS9、OSBPL3、OSBPL6、OSBPL10、OSMR、OXCT1、OXCT2、P4HA1、P4HB、PABPC1、PAIP2B、PAK4、PAPD4、PARD3、PARN、PARP14、PARP4、PARVB、PAX6、PBLD、PBX3、PCBP2、PCBP4、PCCB、PCDH10、PCDHGB3、PCGF3、PCM1、PCMTD2、PCNXL2、PCSK9、PDE1C、PDE3A、PDE4A、PDE5A、PDE7A、PDGFD、PDGFRB、PDLIM7、PDS5B、PDXDC1、PDXDC2P、PEAR1、PELI1、PEPD、PEX5、PFKP、PHACTR3、PHF19、PHF8、PHRF1、PHTF2、PI4K2A、PIEZO1、PIGN、PIGU、PIK3C2B、PIK3CD、PIK3R1、PIKFYVE、PIM2、PITPNA、PITPNB、PITPNM1、PITPNM3、PLAU、PLEC、PLEK2、PLEKHA1、PLEKHA6、PLEKHB2、PLEKHH2、PLSCR1、PLSCR3、PLXNB2、PLXNC1、PMS1、PNISR、PODN、POLE3、POLN、POLR1A、POLR3D、POMT2、POSTN、POU2F1、PPAPDC1A、PPARA、PPARG、PPFIBP1、PPHLN1、PPIP5K1、PPIP5K2、PPM1E、PPP1R12A、PPP1R26、PPP3CA、PPP6R1、PPP6R2、PRKACB、PRKCA、PRKDC、PRKG1、PRMT1、PRNP、PRPF31、PRPH2、PRRG4、PRSS23、PRUNE2、PSMA4、PSMC1、PSMD6、PSMD6-AS2、PTCH1、PTGIS、PTK2B、PTPN14、PTX3、PUF60、PUS7、PVR、PXK、PXN、QKI、RAB23、RAB2B、RAB30、RAB34、RAB38、RAB44、RAD1、RAD9B、RAD23B、RAF1、RALB、RAP1A、RAP1GDS1、RAPGEF1、RARG、RARS、RARS2、RASIP1、RASSF8、RBBP8、RBCK1、RCOR3、RBFOX2、RBKS、RBM10、RCC1、RDX、RERE、RFTN1、RFWD2、RFX3-AS1、RGCC、RGL1、RGS10、RGS3、RIF1、RNF14、RNF19A、RNF130、RNF144A、RNF213、RNF38、RNFT1、ROR1、ROR2、RPA1、RPF2、RPL10、RPS10、RPS6KB2、RPS6KC1、RRBP1、RWDD4、SAMD4A、SAMD9、SAMD9L、SAR1A、SART3、SCAF4、SCAF8、SCARNA9、SCD、SCLT1、SCO1、SDCBP、SEC14L1、SEC22A、SEC24A、SEC24B、SEC61A1、SENP6、SEPT9、SERGEF、SERPINE2、SF1、SF3B3、SGIP1、SGK3、SGMS1、SGOL2、SGPL1、SH2B3、SH3RF1、SH3YL1、SHROOM3、SIGLEC10、SKA2、SKIL、SKP1、SLC12A2、SLC24A3、SLC25A16、SLC25A17、SLC34A3、SLC35F3、SLC39A3、SLC39A10、SLC4A4、SLC4A11、SLC41A1、SLC44A2、SLC46A2、SLC6A15、SLC7A6、SLC7A8、SLC7A11、SLC9A3、SLIT3、SMARCA4、SMARCC2、SMC4、SMC6、SMCHD1、SMG1、SMG1P3、SMN2、SMOX、SMPD4、SMTN、SMYD3、SMYD5、SNAP23、SNED1、SNHG16、SNX7、SNX14、SNX24、SNX7、SOCS2、SOCS6、SOGA2、SON、SORBS2、SORCS1、SORCS2、SOS2、SOX7、SPATA18、SPATA20、SPATA5、SPATS2、SPDYA、SPEF2、SPG20、SPIDR、SPINK5、SPRED2、SPRYD7、SQLE、SQRDL、SQSTM1、SRCAP、SREBF1、SREK1、SRGAP1、SRRM1、SRSF3、SSBP1、STAC2、STARD4、STAT1、STAT3、STAT4、STAU1、STC2、STEAP2、STK32B、STRAD8、STRIP1、STRN3、STRN4、STS、STX16、STXBP4、STXBP6、SULF1、SUPT20H、SVEP1、SYNE1、SYNE2、SYNGR2、SYNPO、SYNPO2、SYNPO2L、SYT15、SYTL2、TACC1、TAF2、TAGLN3、TANC2、TANGO6、TARBP1、TARS、TASP1、TBC1D15、TBCA、TBL1XR1、TBL2、TCF12、TCF4、TCF7L2、TEKT4P2、TENC1、TENM2、TEP1、TET1、TET3、TEX21P、TFCP2、TGFA、TGFB2、TGFB3、TGFBI、TGFBR1、TGFBRAP1、TGM2、THADA、THAP4、THBS2、THRB、TIAM1、TIMP2、TJAP1、TJP2、TLE3、TLK1、TMC3、TMEM67、TMEM102、TMEM119、TMEM134、TMEM154、TMEM189-UBE2V1、TMEM214、TMEM256-PLSCR3、TMEM47、TMEM50B、TMEM63A、TMX3、TNC、TNFAIP3、TNFAIP8L3、TNFRSF12A、TNFRSF14、TNIP1、TNKS1BP1、TNPO3、TNRC18P1、TNRC6A、TNS1、TNS3、TNXB、TOE1、TOMM40、TOMM5、TOPORS、TP53AIP1、TP53INP1、TPRG1、TRAF3、TRAK1、TRAPPC12、TRIB1、TRIM2、TRIM23、TRIM26、TRIM28、TRIM65、TRIM66、TRMT1L、TRPC4、TRPS1、TSC2、TSHZ1、TSHZ2、TSPAN11、TSPAN18、TSPAN2、TSPAN7、TSSK3、TTC7A、TTC7B、TUBB2C、TUBB3、TUBE1、TXNIP、TXNL1、TXNL4B、TXNRD1、TYW5、U2SURP、UBAP2L、UBE2D3、UBE2G2、UBE2L3、UBE2V1、UBN2、UBQLN4、UCHL5、UHMK1、UHRF1BP1L、UNC13B、UNC5B、URGCP、URGCP-MRPS24、USP19、USP7、USP27X、UVRAG、VANGL1、VARS2、VAV2、VCL、VDAC2、VIM-AS1、VIPAS39、VPS13A、VPS29、VPS41、VPS51、VSTM2L、VWA8、VWF、WDR19、WDR27、WDR37、WDR48、WDR90、WDR91、WHSC2、WIPF1、WISP1、WNK1、WNT5B、WNT10B、WSB1、WWTR1、XDH、XIAP、XRN2、YAP1、YDJC、YES1、YPEL5、YTHDF3、Z24749、ZAK、ZBTB10、ZBTB24、ZBTB26、ZBTB7A、ZC3H12C、ZC3H14、ZC3H18、ZCCHC5、ZCCHC8、ZCCHC11、ZEB1、ZEB2、ZFAND1、ZFAND5、ZFP82、ZHX3、ZMIZ1、ZMIZ1-AS1、ZMIZ2、ZMYM2、ZNF12、ZNF138、ZNF148、ZNF208、ZNF212、ZNF219、ZNF227、ZNF232、ZNF24、ZNF268、ZNF28、ZNF280D、ZNF281、ZNF335、ZNF350、ZNF37A、ZNF37BP、ZNF395、ZNF426、ZNF431、ZNF583、ZNF618、ZNF621、ZNF652、ZNF655、ZNF660、ZNF674、ZNF680、ZNF730、ZNF74、ZNF764、ZNF777、ZNF778、ZNF780A、ZNF7804A、ZNF79、ZNF827、ZNF836、ZNF837、ZNF839、ZNF91和ZSCAN25。
在另一个特定方面,本文提供了用于修饰RNA剪接以产生具有iExon的成熟mRNA转录物的方法,所述方法包括使包含前体mRNA转录物的细胞或细胞裂解物与式(I)的化合物或其形式接触,其中所述前体mRNA转录物包含两个外显子和内含子,其中第一外显子在内含子的上游,并且第二外显子在内含子的下游,其中所述内含子按5’至3’顺序包含:第一5’剪接位点、第一分支点、第一3’剪接位点、内源或非内源剪接修饰剂的内含子识别元件(iREMS)、第二分支点和第二3’剪接位点,其中所述iREMS包含RNA序列GAgurngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,并且其中所述前体mRNA转录物是选自以下的基因的前体mRNA转录物:APOA2、ASAP1、BRCA1、BRCA2、CDKN1C、CRX、CTRC、DENND5A、DIAPH3、DMD、DNAH11、EIF2B3、GALC、HPS1、HTT、IKBKAP、KIAA1524、LMNA、MECP2、PAPD4、PAX6、PCCB、PITPNB、PTCH1、SLC34A3、SMN2、SPINK5、SREK1、TMEM67、VWF、XDH和XRN2。
在另一个特定方面,本文提供了用于修饰RNA剪接以产生具有iExon的成熟mRNA转录物的方法,所述方法包括使包含前体mRNA转录物的细胞或细胞裂解物与式(I)的化合物或其形式接触,其中所述前体mRNA转录物包含两个外显子和内含子,其中第一外显子在内含子的上游,并且第二外显子在内含子的下游,其中所述内含子按5’至3’顺序包含:第一5’剪接位点、第一分支点、第一3’剪接位点、内源或非内源剪接修饰剂的内含子识别元件(iREMS)、第二分支点和第二3’剪接位点,其中所述iREMS包含RNA序列GAgurngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,并且其中所述前体mRNA转录物是选自以下的基因的前体mRNA转录物:ABCA1、ABCA10、ABCB7、ABCB8、ABCC1、ABCC3、ABL2、ABLIM3、ACACA、ACADVL、ACAT2、ACTA2、ADAL、ADAM15、ADAM17、ADAM23、ADAM33、ADAMTS1、ADAMTS19、ADCY3、ADD1、ADGRG6、ADH6、ADHFE1、AFF2、AFF3、AGK、AGPAT3、AGPAT4、AGPS、AHCYL2、AHDC1、AHRR、AJUBA、AK021888、AK310472、AKAP1、AKAP3、AKAP8L、AKAP9、AKNA、ALCAM、ALDH4A1、AMPD2、ANK1、ANK2、ANK3、ANKFY1、ANKHD1-EIF4EBP3、ANKRA2、ANKRD13C、ANKRD17、ANKRD33B、ANKRD36、ANKS6、ANP32A、ANXA6、AP2B1、AP4B1-AS1、APAF1、APIP、APOA2、APP、APTX、ARHGAP1、ARHGAP12、ARHGAP22、ARHGAP5、ARHGEF16、ARID1A、ARID2、ARID5B、ARL9、ARL15、ARL5B、ARMCX3、ARSJ、ASAP1、ASIC1、ASL、ASNS、ASPH、ATAD2B、ATF6、ATF7IP、ATG9A、ATMIN、ATP2A3、ATP2C1、ATXN1、ATXN3、AURKA、B3GALT2、B3GNT6、B4GALT2、BACE1、BAG2、BASP1、BC033281、BCAR3、BCL2L15、BCYRN1、BECN1、BEND6、BHMT2、BICD1、BIN1、BIN3、BIN3-IT1、BIRC3、BIRC6、BNC1、BNC2、BRCA1、BRCA2、BRD2、BRPF1、BSCL2、BTBD10、BTG2、BTN3A1、BZW1、C1QTNF9B-AS1、C1orf27、C1orf86、C10orf54、C11orf30、C11orf70、C11orf73、C11orf76、C11orf94、C12orf4、C12orf56、C14orf132、C17orf76-AS1、C19orf47、C2orf47、C3、C4orf27、C5orf24、C6orf48、C7orf31、C8orf34、C8orf44、C8orf44-SGK3、C8orf88、C9orf69、CA13、CA3、CAB39、CACNA2D2、CACNB1、CACNB4、CADM1、CADM2、CALU、CAMKK1、CAND2、CAPNS1、CASC3、CASP7、CASP8AP2、CAV1、CCAR1、CCDC77、CCDC79、CCDC88A、CCDC92、CCDC122、CCER2、CCNF、CCNL2、CCT6A、CD276、CD46、CDC25B、CDC40、CDC42BPA、CDCA7、CDH11、CDH13、CDH18、CDK11B、CDK16、CDKAL1、CDKN1C、CECR7、CELSR1、CEMIP、CENPI、CEP112、CEP162、CEP170、CEP192、CEP68、CFH、CFLAR、CHD8、CHEK1、CHRM2、CIITA、CIZ1、CLDN23、CLIC1、CLK4、CLTA、CMAHP、CNGA4、CNOT1、CNRIP1、CNTD1、CMSS1、CNOT7、CNRIP1、CNTN1、COG1、COL1A1、COL11A1、COL12A1、COL14A1、COL15A1、COL5A1、COL5A3、COL6A1、COL6A6、COL8A1、COLEC12、COMP、COPS7B、CPA4、CPEB2、CPQ、CPSF4、CREB5、CRISPLD2、CRLF1、CRLS1、CRTAP、CRX、CRYBG3、CRYL1、CSDE1、CSNK1A1、CSNK1E、CSNK1G1、CTDSP2、CTNND1、CTRC、CUL2、CUL4A、CUX1、CYB5B、CYB5R2、CYBRD1、CYGB、CYP1B1、CYP51A1、DAAM1、DAB2、DACT1、DAGLB、DARS、DAXX、DCAF10、DCAF11、DCAF17、DCBLD2、DCLK1、DCN、DCUN1D4、DDAH1、DDAH2、DDHD2、DDIT4L、DDR1、DDX39B、DDX42、DDX50、DEGS1、DENND1A、DENND1B、DENND4A、DENND5A、DEPTOR、DET1、DFNB59、DGCR2、DGK1、DGKA、DHCR24、DHCR7、DHFR、DHX9、DIAPH1、DIAPH3、DIRAS3、DIS3L、DKFZp434M1735、DKK3、DLC1、DLG5、DMD、DMXL1、DNAH8、DNAH11、DNAJA4、DNAJC13、DNAJC27、DNM2、DNMBP、DOCK1、DOCK11、DPP8、DSEL、DST、DSTN、DYNC1I1、DYRK1A、DZIP1L、EBF1、EEA1、EEF1A1、EFCAB14、EFEMP1、EGR1、EGR3、EHMT2、EIF2B3、EIF4G1、EIF4G2、EIF4G3、ELF2、ELMO2、ELN、ELP4、EMX2OS、ENAH、ENG、ENOX1、ENPP1、ENPP2、ENSA、EP300、EPT1、ERC1、ERC2、ERCC1、ERCC8、ERLIN2、ERRFI1、ESM1、ETV5、EVC、EVC2、EXO1、EXOC3、EXOC6B、EXTL2、EYA3、F2R、FADS1、FADS2、FAF1、FAIM、FAM111A、FAM126A、FAM13A、FAM160A1、FAM162A、FAM174A、FAM195B、FAM198B、FAM20A、FAM208B、FAM219A、FAM219B、FAM3C、FAM46B、FAM49B、FAM65A、FAM65B、FAM69B、FAP、FARP1、FBLN2、FBN2、FBXL16、FBXL6、FBXO9、FBXO10、FBXO18、FBXO31、FBXO34、FBXO9、FCHO1、FDFT1、FDPS、FER、FEZ1、FGD4、FGD5-AS1、FGFR2、FGFRL1、FGL2、FHOD3、FLII、FLNB、FLT1、FN1、FNBP1、FOCAD、FOS、FOSB、FOSL1、FOXK1、FRAS1、FSCN2、FUS、FYN、GABPB1、GAL3ST4、GALC、GALNT1、GALNT15、GAS7、GATA6、GBA2、GBGT1、GBP1、GCFC2、GLCE、GCNT1、GDF6、GGACT、GHDC、GIGYF2、GJC1、GLCE、GMIP、GNA13、GNAQ、GNAS、GNG12、GNL3L、GOLGA2、GOLGA4、GOLGB1、GORASP1、GPR1、GPR183、GPR50、GPR89A、GPRC5A、GPRC5B、GPSM2、GREM1、GRK6、GRTP1、GSE1、GTF2H2B、GTSF1、GUCA1B、GULP1、GXYLT1、HAPLN1、HAPLN2、HAS2、HAS3、HAT1、HAUS3、HAUS6、HAVCR2、HDAC5、HDAC7、HDX、HECTD2-AS1、HEG1、HEPH、HEY1、HLA-A、HLA-E、HLTF、HMGA1、HMGA2、HMGB1、HMGCR、HMGN3-AS1、HMGCS1、HMGXB4、HOOK3、HOXB3、HMOX1、HNMT、HNRNPR、HNRNPUL1、HP1BP3、HPS1、HRH1、HSD17B12、HSPA1L、HTATIP2、HTT、IARS、IDH1、IDI1、IFT57、IGDCC4、IGF2BP2、IGF2R、IGFBP3、IKBKAP、IL16、IL6ST、INA、INHBA、INO80、IPP4B、INPP5K、INSIG1、INTU、INVS、IQCE、IQCG、ITCH、ITGA11、ITGA8、ITGAV、ITGB5、ITGB8、ITIH1、ITM2C、ITPKA、ITSN1、IVD、KANSL3、KAT6B、KCNK2、KCNS1、KCNS2、KDM6A、KDSR、KIAA1033、KIAA1143、KIAA1199、KIAA1456、KIAA1462、KIAA1522、KIAA1524、KIAA1549、KIAA1715、KIAA1755、KIDINS220、KIF14、KIF2A、KIF21A、KIF3A、KIT、KLC1、KLC2、KLF17、KLF6、KLHL7、KLRG1、KMT2D、KRT7、KRT18、KRT19、KRT34、KRTAP1-1、KRTAP1-5、KRTAP2-3、L3MBTL2、LAMA2、LAMB1、LAMB2P1、LARP4、LATS2、LDLR、LEMD3、LETM2、LGALS3、LGALS8、LGI2、LGR4、LHX9、LIMS1、LINC00341、LINC00472、LINC00570、LINC00578、LINC00607、LINC00657、LINC00678、LINC00702、LINC00886、LINC00961、LINC01011、LINC01118、LINC01204、LINCR-0002、LINGO2、LMAN2L、LMNA、LMO7、LMOD1、LOC400927、LONP1、LOX、LPHN1、LRBA、LRCH4、LRIG1、LRP4、LRP8、LRRC1、LRRC32、LRRC39、LRRC8A、LSAMP、LSS、LTBR、LUC7L2、LUM、LYPD1、LYRM1、LZTS2、MACROD2、MAFB、MAGED4、MAGED4B、MAMDC2、MAN1A2、MAN2A1、MAN2C1、MANEA、MAP4K4、MAPK10、MAPK13、MARCH7、MARCH8、MASP1、MB、MB21D2、MBD1、MBOAT7、MC4R、MCM10、MDM2、MDN1、MEAF6、MECP2、MED1、MED13L、MEDAG、MEF2D、MEGF6、MEIS2、MEMO1、MEPCE、MFGE8、MFN2、MIAT、MICAL2、MINPP1、MIR612、MKL1、MKLN1、MKNK2、MLLT4、MLLT10、MLST8、MMAB、MMP10、MMP24、MMS19、MMS22L、MN1、MORF4L1、MOXD1、MPPE1、MPZL1、MRPL3、MRPL45、MRPL55、MRPS28、MRVI1、MSANTD3、MSC、MSH2、MSH4、MSH6、MSL3、MSMO1、MSRB3、MTAP、MTERF3、MTERFD1、MTHFD1L、MTMR3、MTMR9、MTRR、MUM1、MVD、MVK、MXRA5、MYADM、MYB、MYCBP2、MYLK、MYO1D、MYO9B、MYOF、NA、NAA35、NAALADL2、NADK、NAE1、NAGS、NASP、NAV1、NAV2、NCOA1、NCOA3、NCOA4、NCSTN、NDNF、NEDD4、NELFA、NEO1、NEURL1B、NF2、NFASC、NFE2L1、NFX1、NGF、NGFR、NHLH1、NID1、NID2、NIPA1、NKX3-1、NLGN1、NLN、NOL10、NOMO3、NOTCH3、NOTUM、NOVA2、NOX4、NPEPPS、NRD1、NREP、NRG1、NRROS、NSUN4、NT5C2、NT5E、NTNG1、NUDT4、NUP153、NUP35、NUP50、NUPL1、NUSAP1、OCLN、ODF2、OLR1、OS9、OSBPL3、OSBPL6、OSBPL10、OSMR、OXCT1、OXCT2、P4HA1、P4HB、PABPC1、PAIP2B、PAK4、PAPD4、PARD3、PARN、PARP14、PARP4、PARVB、PAX6、PBLD、PBX3、PCBP2、PCCB、PCDH10、PCDHGB3、PCGF3、PCM1、PCMTD2、PCNXL2、PCSK9、PDE1C、PDE3A、PDE4A、PDE5A、PDE7A、PDGFD、PDGFRB、PDLIM7、PDS5B、PDXDC1、PDXDC2P、PEAR1、PELI1、PEPD、PEX5、PFKP、PHACTR3、PHF19、PHF8、PHRF1、PHTF2、PI4K2A、PIEZO1、PIGN、PIGU、PIK3C2B、PIK3CD、PIK3R1、PIKFYVE、PIM2、PITPNA、PITPNB、PITPNM1、PITPNM3、PLAU、PLEC、PLEK2、PLEKHA1、PLEKHA6、PLEKHB2、PLEKHH2、PLSCR1、PLSCR3、PLXNB2、PLXNC1、PMS1、PNISR、PODN、POLE3、POLN、POLR1A、POLR3D、POMT2、POSTN、POU2F1、PPAPDC1A、PPARA、PPARG、PPFIBP1、PPIP5K1、PPIP5K2、PPM1E、PPP1R12A、PPP1R26、PPP3CA、PPP6R1、PPP6R2、PRKCA、PRKDC、PRKG1、PRMT1、PRNP、PRPF31、PRPH2、PRRG4、PRSS23、PRUNE2、PSMA4、PSMC1、PSMD6、PSMD6-AS2、PTCH1、PTGIS、PTK2B、PTPN14、PTX3、PUF60、PUS7、PVR、PXK、PXN、QKI、RAB2B、RAB30、RAB34、RAB38、RAB44、RAD1、RAD9B、RAD23B、RAF1、RALB、RAP1GDS1、RAPGEF1、RARG、RARS、RARS2、RASIP1、RASSF8、RBBP8、RBCK1、RCOR3、RBFOX2、RBKS、RBM10、RDX、RERE、RFTN1、RFWD2、RFX3-AS1、RGCC、RGL1、RGS10、RGS3、RIF1、RNF14、RNF19A、RNF130、RNF144A、RNF213、RNF38、RNFT1、ROR1、ROR2、RPA1、RPF2、RPL10、RPS10、RPS6KB2、RPS6KC1、RRBP1、RWDD4、SAMD4A、SAMD9、SAMD9L、SAR1A、SART3、SCAF4、SCAF8、SCARNA9、SCD、SCLT1、SCO1、SDCBP、SEC14L1、SEC22A、SEC24A、SEC24B、SEC61A1、SENP6、SEPT9、SERGEF、SERPINE2、SF1、SF3B3、SGIP1、SGK3、SGMS1、SGOL2、SGPL1、SH2B3、SH3RF1、SH3YL1、SHROOM3、SIGLEC10、SKA2、SKIL、SKP1、SLC12A2、SLC24A3、SLC25A16、SLC25A17、SLC34A3、SLC35F3、SLC39A3、SLC39A10、SLC4A4、SLC4A11、SLC41A1、SLC44A2、SLC46A2、SLC6A15、SLC7A6、SLC7A8、SLC7A11、SLC9A3、SLIT3、SMARCA4、SMARCC2、SMC4、SMC6、SMCHD1、SMG1、SMG1P3、SMOX、SMPD4、SMTN、SMYD3、SMYD5、SNAP23、SNED1、SNHG16、SNX7、SNX14、SNX24、SNX7、SOCS2、SOCS6、SOGA2、SON、SORBS2、SORCS1、SORCS2、SOS2、SOX7、SPATA18、SPATA20、SPATA5、SPATS2、SPDYA、SPEF2、SPG20、SPIDR、SPINK5、SPRED2、SPRYD7、SQLE、SQRDL、SQSTM1、SRCAP、SREBF1、SRGAP1、SRRM1、SRSF3、SSBP1、STAC2、STARD4、STAT1、STAT3、STAT4、STAU1、STC2、STEAP2、STK32B、STRAD8、STRIP1、STRN4、STS、STX16、STXBP4、STXBP6、SULF1、SUPT20H、SVEP1、SYNE1、SYNE2、SYNGR2、SYNPO、SYNPO2、SYNPO2L、SYT15、SYTL2、TACC1、TAF2、TAGLN3、TANC2、TANGO6、TARBP1、TARS、TASP1、TBC1D15、TBCA、TBL1XR1、TBL2、TCF12、TCF4、TCF7L2、TEKT4P2、TENC1、TENM2、TEP1、TET1、TET3、TEX21P、TFCP2、TGFA、TGFB2、TGFB3、TGFBI、TGFBR1、TGFBRAP1、TGM2、THADA、THAP4、THBS2、THRB、TIAM1、TIMP2、TJAP1、TJP2、TLE3、TLK1、TMC3、TMEM67、TMEM102、TMEM119、TMEM134、TMEM154、TMEM189-UBE2V1、TMEM214、TMEM256-PLSCR3、TMEM47、TMEM50B、TMEM63A、TMX3、TNC、TNFAIP3、TNFAIP8L3、TNFRSF12A、TNFRSF14、TNIP1、TNKS1BP1、TNPO3、TNRC18P1、TNS1、TNS3、TNXB、TOE1、TOMM40、TOMM5、TOPORS、TP53AIP1、TP53INP1、TPRG1、TRAF3、TRAK1、TRAPPC12、TRIB1、TRIM2、TRIM23、TRIM26、TRIM28、TRIM65、TRIM66、TRMT1L、TRPC4、TRPS1、TSC2、TSHZ1、TSHZ2、TSPAN11、TSPAN18、TSPAN2、TSPAN7、TSSK3、TTC7A、TTC7B、TUBB2C、TUBB3、TUBE1、TXNIP、TXNL1、TXNL4B、TXNRD1、TYW5、U2SURP、UBAP2L、UBE2D3、UBE2G2、UBE2L3、UBE2V1、UBN2、UBQLN4、UCHL5、UHMK1、UHRF1BP1L、UNC13B、UNC5B、URGCP、URGCP-MRPS24、USP19、USP7、USP27X、UVRAG、VANGL1、VARS2、VAV2、VCL、VDAC2、VIM-AS1、VIPAS39、VPS13A、VPS29、VPS41、VPS51、VSTM2L、VWA8、VWF、WDR19、WDR27、WDR37、WDR48、WDR90、WDR91、WHSC2、WIPF1、WISP1、WNK1、WNT5B、WNT10B、WSB1、WWTR1、XDH、XIAP、XRN2、YAP1、YDJC、YES1、YPEL5、YTHDF3、Z24749、ZAK、ZBTB10、ZBTB24、ZBTB26、ZBTB7A、ZC3H12C、ZC3H14、ZC3H18、ZCCHC5、ZCCHC8、ZCCHC11、ZEB1、ZEB2、ZFAND1、ZFAND5、ZFP82、ZHX3、ZMIZ1、ZMIZ1-AS1、ZMIZ2、ZMYM2、ZNF12、ZNF138、ZNF148、ZNF208、ZNF212、ZNF219、ZNF227、ZNF232、ZNF24、ZNF268、ZNF28、ZNF280D、ZNF281、ZNF335、ZNF350、ZNF37A、ZNF37BP、ZNF395、ZNF426、ZNF431、ZNF583、ZNF618、ZNF621、ZNF652、ZNF655、ZNF660、ZNF674、ZNF680、ZNF730、ZNF74、ZNF764、ZNF777、ZNF778、ZNF780A、ZNF7804A、ZNF79、ZNF827、ZNF836、ZNF837、ZNF839、ZNF91和ZSCAN25。
在另一个特定方面,本文提供了用于修饰RNA剪接以产生具有iExon的成熟mRNA转录物的方法,所述方法包括使包含前体mRNA转录物的细胞或细胞裂解物与式(I)的化合物或其形式接触,其中所述前体mRNA转录物包含两个外显子和内含子,其中第一外显子在内含子的上游,并且第二外显子在内含子的下游,其中所述内含子按5’至3’顺序包含:第一5’剪接位点、第一分支点、第一3’剪接位点、内源或非内源剪接修饰剂的内含子识别元件(iREMS)、第二分支点和第二3’剪接位点,其中所述iREMS包含RNA序列GAgurngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,并且其中所述前体mRNA转录物不是基因SMN2的前体mRNA转录物。
在另一个特定方面,本文提供了用于修饰RNA剪接以产生具有iExon的成熟mRNA转录物的方法,所述方法包括使包含前体mRNA转录物的细胞或细胞裂解物与式(I)的化合物或其形式接触,其中所述前体mRNA转录物包含两个外显子和内含子,其中第一外显子在内含子的上游,并且第二外显子在内含子的下游,其中所述内含子按5’至3’顺序包含:第一5’剪接位点、第一分支点、第一3’剪接位点、内源或非内源剪接修饰剂的内含子识别元件(iREMS)、第二分支点和第二3’剪接位点,其中所述iREMS包含RNA序列GAgurngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,并且其中所述前体mRNA转录物不是选自以下的基因的前体mRNA转录物:ABHD10、ADAM12、AKT1、ANXA11、APLP2、APPL2、ARMCX6、ATG5、AXIN1、BAIAP2、CCNB1IP1、CCT7、CEP57、CSF1、DLGAP4、EPN1、ERGIC3、FOXM1、GGCT、GRAMD3、HSD17B4、LARP7、LRRC42、MADD、MAN1B1、MRPL39、PCBP4、PPHLN1、PRKACB、RAB23、RAP1A、RCC1、SREK1、STRN3和TNRC6A。
在另一个特定方面,本文提供了用于修饰RNA剪接以产生具有iExon的成熟mRNA转录物的方法,所述方法包括使包含前体mRNA转录物的细胞或细胞裂解物与式(I)的化合物或其形式接触,其中所述前体mRNA转录物包含两个外显子和内含子,其中第一外显子在内含子的上游,并且第二外显子在内含子的下游,其中所述内含子按5’至3’顺序包含:第一5’剪接位点、第一分支点、第一3’剪接位点、内源或非内源剪接修饰剂的内含子识别元件(iREMS)、第二分支点和第二3’剪接位点,其中所述iREMS包含RNA序列GAgurngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,并且其中所述前体mRNA转录物不是选自以下的基因的前体mRNA转录物:ABHD10、ADAM12、AKT1、ANXA11、APLP2、APPL2、ARMCX6、ATG5、AXIN1、BAIAP2、CCNB1IP1、CCT7、CEP57、CSF1、DLGAP4、EPN1、ERGIC3、FOXM1、GGCT、GRAMD3、HSD17B4、LARP7、LRRC42、MADD、MAN1B1、MRPL39、PCBP4、PPHLN1、PRKACB、RAB23、RAP1A、RCC1、SMN2、SREK1、STRN3和TNRC6A。
另一方面,本文提供了用于修饰RNA剪接以调节由前体mRNA转录物产生的成熟mRNA转录物的量的方法,其中所述前体mRNA转录物包含两个外显子和内含子,其中第一外显子在内含子的上游,并且第二外显子在内含子的下游,其中所述内含子包含RNA核苷酸序列,所述RNA核苷酸序列按5’至3’顺序包含:内源或非内源剪接修饰剂的内含子识别元件(iREMS)、分支点和3’剪接位点,其中所述iREMS包含RNA序列GAgurngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸。
一方面,本文提供了用于修饰RNA剪接以调节由前体mRNA转录物产生的成熟mRNA转录物的量的方法,所述方法包括使前体mRNA转录物与式(I)的化合物或其形式接触,其中所述前体mRNA转录物包含两个外显子和内含子,其中第一外显子在内含子的上游,并且第二外显子在内含子的下游,其中所述内含子包含RNA核苷酸序列,所述RNA核苷酸序列按5’至3’顺序包含:内源或非内源剪接修饰剂的内含子识别元件(iREMS)、分支点和3’剪接位点,其中所述iREMS包含RNA序列GAgurngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸。
另一方面,本文提供了用于修饰RNA剪接以调节由前体mRNA转录物产生的成熟mRNA转录物的量的方法,所述方法包括使包含前体mRNA转录物的细胞或细胞裂解物与式(I)的化合物或其形式接触,其中所述前体mRNA转录物包含两个外显子和内含子,其中第一外显子在内含子的上游,并且第二外显子在内含子的下游,其中所述内含子包含RNA核苷酸序列,所述RNA核苷酸序列按5’至3’顺序包含:内源或非内源剪接修饰剂的内含子识别元件(iREMS)、分支点和3’剪接位点,其中所述iREMS包含RNA序列GAgurngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸。在一些方面,所述内含子按5’至3’顺序还包含:在所述iREMS上游的5’剪接位点、分支点和3’剪接位点。在一些方面,前体mRNA转录物由本文公开(例如,在本文的表中)的基因编码。
在特定方面,本文提供了用于修饰RNA剪接以调节由前体mRNA转录物产生的成熟mRNA转录物的量的方法,所述方法包括使前体mRNA转录物与式(I)的化合物或其形式接触,其中所述前体mRNA转录物包含两个外显子和内含子,其中第一外显子在内含子的上游,并且第二外显子在内含子的下游,其中所述内含子包含RNA核苷酸序列,所述RNA核苷酸序列按5’至3’顺序包含:内源或非内源剪接修饰剂的内含子识别元件(iREMS)、分支点和3’剪接位点,其中所述iREMS包含RNA序列GAgurngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,并且其中所述前体mRNA转录物是选自以下的基因的前体mRNA转录物:ABCA10、ABCB8、ABCC3、ACTA2、ADAL、ADAMTS1、ADCY3、ADD1、ADGRG6、ADH6、ADHFE1、AFF3、AGPAT4、AKAP3、ANK1、ANK3、ANKRA2、ANKRD33B、ANKRD36、AP4B1-AS1、APIP、ARHGAP1、ARHGAP12、ARHGEF16、ARID5B、ARL15、ARL9、ARMCX6、ASIC1、ATG5、ATP2A3、ATXN1、B3GALT2、B3GNT6、BCL2L15、BCYRN1、BECN1、BHMT2、BIN3-IT1、BIRC3、BIRC6、BTG2、BTN3A1、C10orf54、C11orf70、C11orf94、C12orf4、C12orf56、C14orf132、C19orf47、C1orf86、C3、C7orf31、C8orf34、C8orf44、C8orf44-SGK3、C8orf88、CA13、CA3、CACNA2D2、CACNB1、CADM1、CAND2、CASP7、CCDC122、CCDC79、CCER2、CCNF、CECR7、CELSR1、CEMIP、CENPI、CEP112、CEP170、CEP192、CFH、CHEK1、CIITA、CLDN23、CLTA、CMAHP、CNGA4、CNRIP1、CNTD1、COL11A1、COL14A1、COL15A1、COL5A1、COL5A3、COL6A6、COL8A1、COLEC12、COMP、CPA4、CPQ、CPSF4、CRISPLD2、CRLF1、CRYBG3、CRYL1、CSNK1E、CSNK1G1、CYB5R2、CYGB、CYP1B1、DAGLB、DCAF17、DCLK1、DCN、DDIT4L、DDX50、DEGS1、DEPTOR、DFNB59、DIRAS3、DLG5、DLGAP4、DNAH8、DNAJC13、DNAJC27、DNMBP、DOCK11、DYNC1I1、DYRK1A、DZIP1L、EFEMP1、EGR3、ELN、ELP4、EMX2OS、ENAH、ENPP1、EP300、ERCC1、ERCC8、ERGIC3、ERLIN2、ERRFI1、ESM1、EVC、EVC2、F2R、FAIM、FAM126A、FAM13A、FAM160A1、FAM162A、FAM174A、FAM20A、FAM46B、FAM65B、FAP、FARP1、FBLN2、FBN2、FBXL6、FCHO1、FGFR2、FGL2、FLT1、FRAS1、FSCN2、GAL3ST4、GALNT15、GATA6、GBGT1、GCNT1、GDF6、GGACT、GLCE、GNAQ、GPR183、GPR50、GPRC5A、GPRC5B、GRTP1、GUCA1B、GULP1、GXYLT1、HAPLN1、HAPLN2、HAS3、HAVCR2、HDAC5、HDX、HECTD2-AS1、HEPH、HEY1、HMGA2、HMGN3-AS1、HNMT、HOOK3、HPS1、HSPA1L、HTATIP2、IFT57、IGDCC4、IGF2R、IGFBP3、IL16、INA、INPP5K、INTU、IQCG、ITGA11、ITGA8、ITGB8、ITIH1、ITPKA、IVD、KAT6B、KCNS1、KCNS2、KDM6A、KDSR、KIAA1456、KIAA1462、KIAA1755、KIT、KLF17、KLRG1、KMT2D、KRT7、KRTAP1-1、KRTAP1-5、L3MBTL2、LAMB2P1、LETM2、LGI2、LGR4、LHX9、LINC00472、LINC00570、LINC00578、LINC00607、LINC00678、LINC00702、LINC00886、LINC00961、LINC01011、LINC01118、LINC01204、LMOD1、LOC400927、LRBA、LRP4、LRRC32、LRRC39、LRRC42、LSAMP、LUM、LYPD1、LYRM1、MAFB、MAMDC2、MAN2A1、MAN2C1、MAPK13、MASP1、MB、MB21D2、MC4R、MCM10、MED13L、MEGF6、MFN2、MIAT、MIR612、MLLT10、MMP10、MMP24、MN1、MOXD1、MRPL45、MRPL55、MRPS28、MRVI1、MSH4、MTERF3、MXRA5、MYCBP2、NA、NAALADL2、NAE1、NAGS、NDNF、NGF、NGFR、NHLH1、NLN、NOTCH3、NOTUM、NOVA2、NOX4、NRROS、OCLN、OLR1、OSBPL10、OXCT1、OXCT2、PAIP2B、PBLD、PDE1C、PDE5A、PDGFD、PDGFRB、PDS5B、PEAR1、PHACTR3、PIGN、PIK3CD、PIK3R1、PIKFYVE、PIM2、PITPNM3、PLEK2、PLEKHA1、PLEKHA6、PLEKHH2、PLSCR1、PNISR、PODN、POLN、POLR1A、POMT2、PPARG、PPIP5K2、PPM1E、PPP1R26、PPP3CA、PRKCA、PRKG1、PRPF31、PRPH2、PRRG4、PRUNE2、PSMD6-AS2、PTGIS、PTX3、PXK、RAB30、RAB38、RAB44、RAD9B、RAF1、RAPGEF1、RARS、RARS2、RBBP8、RBKS、RDX、RERE、RFX3-AS1、RGCC、ROR1、ROR2、RPA1、RPS10、RPS6KB2、SAMD4A、SCARNA9、SEC24A、SENP6、SERGEF、SGK3、SH3YL1、SHROOM3、SIGLEC10、SKA2、SLC12A2、SLC24A3、SLC35F3、SLC39A10、SLC44A2、SLC46A2、SLC4A11、SLC6A15、SLC7A11、SLC9A3、SLIT3、SMG1P3、SMTN、SNED1、SNX7、SORBS2、SORCS2、SOX7、SPATA18、SPATA5、SPDYA、SPEF2、SPIDR、SPRYD7、SRGAP1、SRRM1、STAC2、STAT4、STK32B、STRN4、STS、STXBP6、SULF1、SVEP1、SYNGR2、SYNPO、SYNPO2、SYNPO2L、TAGLN3、TANGO6、TASP1、TCF12、TCF4、TGFA、TGFB2、TGFB3、TGM2、THBS2、TIAM1、TMC3、TMEM102、TMEM119、TMEM134、TMEM189-UBE2V1、TMEM214、TMEM256-PLSCR3、TMEM50B、TNFAIP8L3、TNFRSF14、TNRC18P1、TNRC6A、TNXB、TP53AIP1、TPRG1、TRIM66、TRPC4、TSHZ2、TSPAN11、TSPAN18、TSPAN7、TSSK3、TTC7B、TUBE1、TXNIP、TYW5、URGCP、USP27X、UVRAG、VAV2、VIM-AS1、VPS41、VSTM2L、VWF、WDR27、WDR91、WISP1、WNK1、WNT10B、YDJC、ZBTB26、ZCCHC5、ZCCHC8、ZFP82、ZMIZ1-AS1、ZNF138、ZNF212、ZNF232、ZNF350、ZNF431、ZNF660、ZNF680、ZNF79和ZNF837。
在特定方面,本文提供了用于修饰RNA剪接以调节由前体mRNA转录物产生的成熟mRNA转录物的量的方法,所述方法包括使包含前体mRNA转录物的细胞或细胞裂解物与式(I)的化合物或其形式接触,其中所述前体mRNA转录物包含两个外显子和内含子,其中第一外显子在内含子的上游,并且第二外显子在内含子的下游,其中所述内含子包含RNA核苷酸序列,所述RNA核苷酸序列按5’至3’顺序包含:内源或非内源剪接修饰剂的内含子识别元件(iREMS)、分支点和3’剪接位点,其中所述iREMS包含RNA序列GAgurngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,并且其中所述前体mRNA转录物是选自以下的基因的前体mRNA转录物:ABCA10、ABCB8、ABCC3、ACTA2、ADAL、ADAMTS1、ADCY3、ADD1、ADGRG6、ADH6、ADHFE1、AFF3、AGPAT4、AKAP3、ANK1、ANK3、ANKRA2、ANKRD33B、ANKRD36、AP4B1-AS1、APIP、ARHGAP1、ARHGAP12、ARHGEF16、ARID5B、ARL15、ARL9、ARMCX6、ASIC1、ATG5、ATP2A3、ATXN1、B3GALT2、B3GNT6、BCL2L15、BCYRN1、BECN1、BHMT2、BIN3-IT1、BIRC3、BIRC6、BTG2、BTN3A1、C10orf54、C11orf70、C11orf94、C12orf4、C12orf56、C14orf132、C19orf47、C1orf86、C3、C7orf31、C8orf34、C8orf44、C8orf44-SGK3、C8orf88、CA13、CA3、CACNA2D2、CACNB1、CADM1、CAND2、CASP7、CCDC122、CCDC79、CCER2、CCNF、CECR7、CELSR1、CEMIP、CENPI、CEP112、CEP170、CEP192、CFH、CHEK1、CIITA、CLDN23、CLTA、CMAHP、CNGA4、CNRIP1、CNTD1、COL11A1、COL14A1、COL15A1、COL5A1、COL5A3、COL6A6、COL8A1、COLEC12、COMP、CPA4、CPQ、CPSF4、CRISPLD2、CRLF1、CRYBG3、CRYL1、CSNK1E、CSNK1G1、CYB5R2、CYGB、CYP1B1、DAGLB、DCAF17、DCLK1、DCN、DDIT4L、DDX50、DEGS1、DEPTOR、DFNB59、DIRAS3、DLG5、DLGAP4、DNAH8、DNAJC13、DNAJC27、DNMBP、DOCK11、DYNC1I1、DYRK1A、DZIP1L、EFEMP1、EGR3、ELN、ELP4、EMX2OS、ENAH、ENPP1、EP300、ERCC1、ERCC8、ERGIC3、ERLIN2、ERRFI1、ESM1、EVC、EVC2、F2R、FAIM、FAM126A、FAM13A、FAM160A1、FAM162A、FAM174A、FAM20A、FAM46B、FAM65B、FAP、FARP1、FBLN2、FBN2、FBXL6、FCHO1、FGFR2、FGL2、FLT1、FRAS1、FSCN2、GAL3ST4、GALNT15、GATA6、GBGT1、GCNT1、GDF6、GGACT、GLCE、GNAQ、GPR183、GPR50、GPRC5A、GPRC5B、GRTP1、GUCA1B、GULP1、GXYLT1、HAPLN1、HAPLN2、HAS3、HAVCR2、HDAC5、HDX、HECTD2-AS1、HEPH、HEY1、HMGA2、HMGN3-AS1、HNMT、HOOK3、HPS1、HSPA1L、HTATIP2、IFT57、IGDCC4、IGF2R、IGFBP3、IL16、INA、INPP5K、INTU、IQCG、ITGA11、ITGA8、ITGB8、ITIH1、ITPKA、IVD、KAT6B、KCNS1、KCNS2、KDM6A、KDSR、KIAA1456、KIAA1462、KIAA1755、KIT、KLF17、KLRG1、KMT2D、KRT7、KRTAP1-1、KRTAP1-5、L3MBTL2、LAMB2P1、LETM2、LGI2、LGR4、LHX9、LINC00472、LINC00570、LINC00578、LINC00607、LINC00678、LINC00702、LINC00886、LINC00961、LINC01011、LINC01118、LINC01204、LMOD1、LOC400927、LRBA、LRP4、LRRC32、LRRC39、LRRC42、LSAMP、LUM、LYPD1、LYRM1、MAFB、MAMDC2、MAN2A1、MAN2C1、MAPK13、MASP1、MB、MB21D2、MC4R、MCM10、MED13L、MEGF6、MFN2、MIAT、MIR612、MLLT10、MMP10、MMP24、MN1、MOXD1、MRPL45、MRPL55、MRPS28、MRVI1、MSH4、MTERF3、MXRA5、MYCBP2、NA、NAALADL2、NAE1、NAGS、NDNF、NGF、NGFR、NHLH1、NLN、NOTCH3、NOTUM、NOVA2、NOX4、NRROS、OCLN、OLR1、OSBPL10、OXCT1、OXCT2、PAIP2B、PBLD、PDE1C、PDE5A、PDGFD、PDGFRB、PDS5B、PEAR1、PHACTR3、PIGN、PIK3CD、PIK3R1、PIKFYVE、PIM2、PITPNM3、PLEK2、PLEKHA1、PLEKHA6、PLEKHH2、PLSCR1、PNISR、PODN、POLN、POLR1A、POMT2、PPARG、PPIP5K2、PPM1E、PPP1R26、PPP3CA、PRKCA、PRKG1、PRPF31、PRPH2、PRRG4、PRUNE2、PSMD6-AS2、PTGIS、PTX3、PXK、RAB30、RAB38、RAB44、RAD9B、RAF1、RAPGEF1、RARS、RARS2、RBBP8、RBKS、RDX、RERE、RFX3-AS1、RGCC、ROR1、ROR2、RPA1、RPS10、RPS6KB2、SAMD4A、SCARNA9、SEC24A、SENP6、SERGEF、SGK3、SH3YL1、SHROOM3、SIGLEC10、SKA2、SLC12A2、SLC24A3、SLC35F3、SLC39A10、SLC44A2、SLC46A2、SLC4A11、SLC6A15、SLC7A11、SLC9A3、SLIT3、SMG1P3、SMTN、SNED1、SNX7、SORBS2、SORCS2、SOX7、SPATA18、SPATA5、SPDYA、SPEF2、SPIDR、SPRYD7、SRGAP1、SRRM1、STAC2、STAT4、STK32B、STRN4、STS、STXBP6、SULF1、SVEP1、SYNGR2、SYNPO、SYNPO2、SYNPO2L、TAGLN3、TANGO6、TASP1、TCF12、TCF4、TGFA、TGFB2、TGFB3、TGM2、THBS2、TIAM1、TMC3、TMEM102、TMEM119、TMEM134、TMEM189-UBE2V1、TMEM214、TMEM256-PLSCR3、TMEM50B、TNFAIP8L3、TNFRSF14、TNRC18P1、TNRC6A、TNXB、TP53AIP1、TPRG1、TRIM66、TRPC4、TSHZ2、TSPAN11、TSPAN18、TSPAN7、TSSK3、TTC7B、TUBE1、TXNIP、TYW5、URGCP、USP27X、UVRAG、VAV2、VIM-AS1、VPS41、VSTM2L、VWF、WDR27、WDR91、WISP1、WNK1、WNT10B、YDJC、ZBTB26、ZCCHC5、ZCCHC8、ZFP82、ZMIZ1-AS1、ZNF138、ZNF212、ZNF232、ZNF350、ZNF431、ZNF660、ZNF680、ZNF79和ZNF837。在一些方面,所述内含子还包含在所述iREMS上游的第一5’剪接位点、第二分支点和第二3’剪接位点。
在特定方面,本文提供了用于修饰RNA剪接以调节由前体mRNA转录物产生的成熟mRNA转录物的量的方法,所述方法包括使包含前体mRNA转录物的细胞或细胞裂解物与式(I)的化合物或其形式接触,其中所述前体mRNA转录物包含两个外显子和内含子,其中第一外显子在内含子的上游,并且第二外显子在内含子的下游,其中所述内含子包含RNA核苷酸序列,所述RNA核苷酸序列按5’至3’顺序包含:内源或非内源剪接修饰剂的内含子识别元件(iREMS)、分支点和3’剪接位点,其中所述iREMS包含RNA序列GAgurngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,并且其中所述前体mRNA转录物是选自以下的基因的前体mRNA转录物:ABCA1、ABCA10、ABCB7、ABCB8、ABCC1、ABCC3、ABHD10、ABL2、ABLIM3、ACACA、ACADVL、ACAT2、ACTA2、ADAL、ADAM12、ADAM15、ADAM17、ADAM23、ADAM33、ADAMTS1、ADAMTS19、ADCY3、ADD1、ADGRG6、ADH6、ADHFE1、AFF2、AFF3、AGK、AGPAT3、AGPAT4、AGPS、AHCYL2、AHDC1、AHRR、AJUBA、AK021888、AK310472、AKAP1、AKAP3、AKAP8L、AKAP9、AKNA、AKT1、ALCAM、ALDH4A1、AMPD2、ANK1、ANK2、ANK3、ANKFY1、ANKHD1-EIF4EBP3、ANKRA2、ANKRD13C、ANKRD17、ANKRD33B、ANKRD36、ANKS6、ANP32A、ANXA11、ANXA6、AP2B1、AP4B1-AS1、APAF1、APIP、APLP2、APOA2、APP、APPL2、APTX、ARHGAP1、ARHGAP12、ARHGAP22、ARHGAP5、ARHGEF16、ARID1A、ARID2、ARID5B、ARL9、ARL15、ARL5B、ARMCX3、ARMCX6、ARSJ、ASAP1、ASIC1、ASL、ASNS、ASPH、ATAD2B、ATF6、ATF7IP、ATG5、ATG9A、ATMIN、ATP2A3、ATP2C1、ATXN1、ATXN3、AURKA、AXIN1、B3GALT2、B3GNT6、B4GALT2、BACE1、BAG2、BASP1、BC033281、BCAR3、BCL2L15、BCYRN1、BECN1、BEND6、BHMT2、BICD1、BIN1、BIN3、BIN3-IT1、BIRC3、BIRC6、BNC1、BNC2、BRCA1、BRCA2、BRD2、BRPF1、BSCL2、BTBD10、BTG2、BTN3A1、BZW1、C1QTNF9B-AS1、C1orf27、C1orf86、C10orf54、C11orf30、C11orf70、C11orf73、C11orf76、C11orf94、C12orf4、C12orf56、C14orf132、C17orf76-AS1、C19orf47、C2orf47、C3、C4orf27、C5orf24、C6orf48、C7orf31、C8orf34、C8orf44、C8orf44-SGK3、C8orf88、C9orf69、CA13、CA3、CAB39、CACNA2D2、CACNB1、CACNB4、CADM1、CADM2、CALU、CAMKK1、CAND2、CAPNS1、CASC3、CASP7、CASP8AP2、CAV1、CCAR1、CCDC77、CCDC79、CCDC88A、CCDC92、CCDC122、CCER2、CCNF、CCNL2、CCT6A、CD276、CD46、CDC25B、CDC40、CDC42BPA、CDCA7、CDH11、CDH13、CDH18、CDK11B、CDK16、CDKAL1、CDKN1C、CECR7、CELSR1、CEMIP、CENPI、CEP112、CEP162、CEP170、CEP192、CEP57、CEP68、CFH、CFLAR、CHD8、CHEK1、CHRM2、CIITA、CIZ1、CLDN23、CLIC1、CLK4、CLTA、CMAHP、CNGA4、CNOT1、CNRIP1、CNTD1、CMSS1、CNOT7、CNRIP1、CNTN1、COG1、COL1A1、COL11A1、COL12A1、COL14A1、COL15A1、COL5A1、COL5A3、COL6A1、COL6A6、COL8A1、COLEC12、COMP、COPS7B、CPA4、CPEB2、CPQ、CPSF4、CREB5、CRISPLD2、CRLF1、CRLS1、CRTAP、CRX、CRYBG3、CRYL1、CSDE1、CSNK1A1、CSNK1E、CSNK1G1、CTDSP2、CTNND1、CTRC、CUL2、CUL4A、CUX1、CYB5B、CYB5R2、CYBRD1、CYGB、CYP1B1、CYP51A1、DAAM1、DAB2、DACT1、DAGLB、DARS、DAXX、DCAF10、DCAF11、DCAF17、DCBLD2、DCLK1、DCN、DCUN1D4、DDAH1、DDAH2、DDHD2、DDIT4L、DDR1、DDX39B、DDX42、DDX50、DEGS1、DENND1A、DENND1B、DENND4A、DENND5A、DEPTOR、DET1、DFNB59、DGCR2、DGK1、DGKA、DHCR24、DHCR7、DHFR、DHX9、DIAPH1、DIAPH3、DIRAS3、DIS3L、DKFZp434M1735、DKK3、DLC1、DLG5、DLGAP4、DMD、DMXL1、DNAH8、DNAH11、DNAJA4、DNAJC13、DNAJC27、DNM2、DNMBP、DOCK1、DOCK11、DPP8、DSEL、DST、DSTN、DYNC1I1、DYRK1A、DZIP1L、EBF1、EEA1、EEF1A1、EFCAB14、EFEMP1、EGR1、EGR3、EHMT2、EIF2B3、EIF4G1、EIF4G2、EIF4G3、ELF2、ELMO2、ELN、ELP4、EMX2OS、ENAH、ENG、ENOX1、ENPP1、ENPP2、ENSA、EP300、EPN1、EPT1、ERC1、ERC2、ERCC1、ERCC8、ERGIC3、ERLIN2、ERRFI1、ESM1、ETV5、EVC、EVC2、EXO1、EXOC3、EXOC6B、EXTL2、EYA3、F2R、FADS1、FADS2、FAF1、FAIM、FAM111A、FAM126A、FAM13A、FAM160A1、FAM162A、FAM174A、FAM195B、FAM198B、FAM20A、FAM208B、FAM219A、FAM219B、FAM3C、FAM46B、FAM49B、FAM65A、FAM65B、FAM69B、FAP、FARP1、FBLN2、FBN2、FBXL16、FBXL6、FBXO9、FBXO10、FBXO18、FBXO31、FBXO34、FBXO9、FCHO1、FDFT1、FDPS、FER、FEZ1、FGD4、FGD5-AS1、FGFR2、FGFRL1、FGL2、FHOD3、FLII、FLNB、FLT1、FN1、FNBP1、FOCAD、FOS、FOSB、FOSL1、FOXK1、FOXM1、FRAS1、FSCN2、FUS、FYN、GABPB1、GAL3ST4、GALC、GALNT1、GALNT15、GAS7、GATA6、GBA2、GBGT1、GBP1、GCFC2、GLCE、GCNT1、GDF6、GGACT、GGCT、GHDC、GIGYF2、GJC1、GLCE、GMIP、GNA13、GNAQ、GNAS、GNG12、GNL3L、GOLGA2、GOLGA4、GOLGB1、GORASP1、GPR1、GPR183、GPR50、GPR89A、GPRC5A、GPRC5B、GPSM2、GREM1、GRK6、GRTP1、GSE1、GTF2H2B、GTSF1、GUCA1B、GULP1、GXYLT1、HAPLN1、HAPLN2、HAS2、HAS3、HAT1、HAUS3、HAUS6、HAVCR2、HDAC5、HDAC7、HDX、HECTD2-AS1、HEG1、HEPH、HEY1、HLA-A、HLA-E、HLTF、HMGA1、HMGA2、HMGB1、HMGCR、HMGN3-AS1、HMGCS1、HMGXB4、HOOK3、HOXB3、HMOX1、HNMT、HNRNPR、HNRNPUL1、HP1BP3、HPS1、HRH1、HSD17B12、HSD17B4、HSPA1L、HTATIP2、HTT、IARS、IDH1、IDI1、IFT57、IGDCC4、IGF2BP2、IGF2R、IGFBP3、IKBKAP、IL16、IL6ST、INA、INHBA、INO80、IPP4B、INPP5K、INSIG1、INTU、INVS、IQCE、IQCG、ITCH、ITGA11、ITGA8、ITGAV、ITGB5、ITGB8、ITIH1、ITM2C、ITPKA、ITSN1、IVD、KANSL3、KAT6B、KCNK2、KCNS1、KCNS2、KDM6A、KDSR、KIAA1033、KIAA1143、KIAA1199、KIAA1456、KIAA1462、KIAA1522、KIAA1524、KIAA1549、KIAA1715、KIAA1755、KIDINS220、KIF14、KIF2A、KIF21A、KIF3A、KIT、KLC1、KLC2、KLF17、KLF6、KLHL7、KLRG1、KMT2D、KRT7、KRT18、KRT19、KRT34、KRTAP1-1、KRTAP1-5、KRTAP2-3、L3MBTL2、LAMA2、LAMB1、LAMB2P1、LARP4、LARP7、LATS2、LDLR、LEMD3、LETM2、LGALS3、LGALS8、LGI2、LGR4、LHX9、LIMS1、LINC00341、LINC00472、LINC00570、LINC00578、LINC00607、LINC00657、LINC00678、LINC00702、LINC00886、LINC00961、LINC01011、LINC01118、LINC01204、LINCR-0002、LINGO2、LMAN2L、LMNA、LMO7、LMOD1、LOC400927、LONP1、LOX、LPHN1、LRBA、LRCH4、LRIG1、LRP4、LRP8、LRRC1、LRRC32、LRRC39、LRRC42、LRRC8A、LSAMP、LSS、LTBR、LUC7L2、LUM、LYPD1、LYRM1、LZTS2、MACROD2、MADD、MAFB、MAGED4、MAGED4B、MAMDC2、MAN1A2、MAN2A1、MAN2C1、MANEA、MAP4K4、MAPK10、MAPK13、MARCH7、MARCH8、MASP1、MB、MB21D2、MBD1、MBOAT7、MC4R、MCM10、MDM2、MDN1、MEAF6、MECP2、MED1、MED13L、MEDAG、MEF2D、MEGF6、MEIS2、MEMO1、MEPCE、MFGE8、MFN2、MIAT、MICAL2、MINPP1、MIR612、MKL1、MKLN1、MKNK2、MLLT4、MLLT10、MLST8、MMAB、MMP10、MMP24、MMS19、MMS22L、MN1、MORF4L1、MOXD1、MPPE1、MPZL1、MRPL3、MRPL39、MRPL45、MRPL55、MRPS28、MRVI1、MSANTD3、MSC、MSH2、MSH4、MSH6、MSL3、MSMO1、MSRB3、MTAP、MTERF3、MTERFD1、MTHFD1L、MTMR3、MTMR9、MTRR、MUM1、MVD、MVK、MXRA5、MYADM、MYB、MYCBP2、MYLK、MYO1D、MYO9B、MYOF、NA、NAA35、NAALADL2、NADK、NAE1、NAGS、NASP、NAV1、NAV2、NCOA1、NCOA3、NCOA4、NCSTN、NDNF、NEDD4、NELFA、NEO1、NEURL1B、NF2、NFASC、NFE2L1、NFX1、NGF、NGFR、NHLH1、NID1、NID2、NIPA1、NKX3-1、NLGN1、NLN、NOL10、NOMO3、NOTCH3、NOTUM、NOVA2、NOX4、NPEPPS、NRD1、NREP、NRG1、NRROS、NSUN4、NT5C2、NT5E、NTNG1、NUDT4、NUP153、NUP35、NUP50、NUPL1、NUSAP1、OCLN、ODF2、OLR1、OS9、OSBPL3、OSBPL6、OSBPL10、OSMR、OXCT1、OXCT2、P4HA1、P4HB、PABPC1、PAIP2B、PAK4、PAPD4、PARD3、PARN、PARP14、PARP4、PARVB、PAX6、PBLD、PBX3、PCBP2、PCBP4、PCCB、PCDH10、PCDHGB3、PCGF3、PCM1、PCMTD2、PCNXL2、PCSK9、PDE1C、PDE3A、PDE4A、PDE5A、PDE7A、PDGFD、PDGFRB、PDLIM7、PDS5B、PDXDC1、PDXDC2P、PEAR1、PELI1、PEPD、PEX5、PFKP、PHACTR3、PHF19、PHF8、PHRF1、PHTF2、PI4K2A、PIEZO1、PIGN、PIGU、PIK3C2B、PIK3CD、PIK3R1、PIKFYVE、PIM2、PITPNA、PITPNB、PITPNM1、PITPNM3、PLAU、PLEC、PLEK2、PLEKHA1、PLEKHA6、PLEKHB2、PLEKHH2、PLSCR1、PLSCR3、PLXNB2、PLXNC1、PMS1、PNISR、PODN、POLE3、POLN、POLR1A、POLR3D、POMT2、POSTN、POU2F1、PPAPDC1A、PPARA、PPARG、PPFIBP1、PPHLN1、PPIP5K1、PPIP5K2、PPM1E、PPP1R12A、PPP1R26、PPP3CA、PPP6R1、PPP6R2、PRKACB、PRKCA、PRKDC、PRKG1、PRMT1、PRNP、PRPF31、PRPH2、PRRG4、PRSS23、PRUNE2、PSMA4、PSMC1、PSMD6、PSMD6-AS2、PTCH1、PTGIS、PTK2B、PTPN14、PTX3、PUF60、PUS7、PVR、PXK、PXN、QKI、RAB23、RAB2B、RAB30、RAB34、RAB38、RAB44、RAD1、RAD9B、RAD23B、RAF1、RALB、RAP1A、RAP1GDS1、RAPGEF1、RARG、RARS、RARS2、RASIP1、RASSF8、RBBP8、RBCK1、RCOR3、RBFOX2、RBKS、RBM10、RCC1、RDX、RERE、RFTN1、RFWD2、RFX3-AS1、RGCC、RGL1、RGS10、RGS3、RIF1、RNF14、RNF19A、RNF130、RNF144A、RNF213、RNF38、RNFT1、ROR1、ROR2、RPA1、RPF2、RPL10、RPS10、RPS6KB2、RPS6KC1、RRBP1、RWDD4、SAMD4A、SAMD9、SAMD9L、SAR1A、SART3、SCAF4、SCAF8、SCARNA9、SCD、SCLT1、SCO1、SDCBP、SEC14L1、SEC22A、SEC24A、SEC24B、SEC61A1、SENP6、SEPT9、SERGEF、SERPINE2、SF1、SF3B3、SGIP1、SGK3、SGMS1、SGOL2、SGPL1、SH2B3、SH3RF1、SH3YL1、SHROOM3、SIGLEC10、SKA2、SKIL、SKP1、SLC12A2、SLC24A3、SLC25A16、SLC25A17、SLC34A3、SLC35F3、SLC39A3、SLC39A10、SLC4A4、SLC4A11、SLC41A1、SLC44A2、SLC46A2、SLC6A15、SLC7A6、SLC7A8、SLC7A11、SLC9A3、SLIT3、SMARCA4、SMARCC2、SMC4、SMC6、SMCHD1、SMG1、SMG1P3、SMN2、SMOX、SMPD4、SMTN、SMYD3、SMYD5、SNAP23、SNED1、SNHG16、SNX7、SNX14、SNX24、SNX7、SOCS2、SOCS6、SOGA2、SON、SORBS2、SORCS1、SORCS2、SOS2、SOX7、SPATA18、SPATA20、SPATA5、SPATS2、SPDYA、SPEF2、SPG20、SPIDR、SPINK5、SPRED2、SPRYD7、SQLE、SQRDL、SQSTM1、SRCAP、SREBF1、SREK1、SRGAP1、SRRM1、SRSF3、SSBP1、STAC2、STARD4、STAT1、STAT3、STAT4、STAU1、STC2、STEAP2、STK32B、STRAD8、STRIP1、STRN3、STRN4、STS、STX16、STXBP4、STXBP6、SULF1、SUPT20H、SVEP1、SYNE1、SYNE2、SYNGR2、SYNPO、SYNPO2、SYNPO2L、SYT15、SYTL2、TACC1、TAF2、TAGLN3、TANC2、TANGO6、TARBP1、TARS、TASP1、TBC1D15、TBCA、TBL1XR1、TBL2、TCF12、TCF4、TCF7L2、TEKT4P2、TENC1、TENM2、TEP1、TET1、TET3、TEX21P、TFCP2、TGFA、TGFB2、TGFB3、TGFBI、TGFBR1、TGFBRAP1、TGM2、THADA、THAP4、THBS2、THRB、TIAM1、TIMP2、TJAP1、TJP2、TLE3、TLK1、TMC3、TMEM67、TMEM102、TMEM119、TMEM134、TMEM154、TMEM189-UBE2V1、TMEM214、TMEM256-PLSCR3、TMEM47、TMEM50B、TMEM63A、TMX3、TNC、TNFAIP3、TNFAIP8L3、TNFRSF12A、TNFRSF14、TNIP1、TNKS1BP1、TNPO3、TNRC18P1、TNRC6A、TNS1、TNS3、TNXB、TOE1、TOMM40、TOMM5、TOPORS、TP53AIP1、TP53INP1、TPRG1、TRAF3、TRAK1、TRAPPC12、TRIB1、TRIM2、TRIM23、TRIM26、TRIM28、TRIM65、TRIM66、TRMT1L、TRPC4、TRPS1、TSC2、TSHZ1、TSHZ2、TSPAN11、TSPAN18、TSPAN2、TSPAN7、TSSK3、TTC7A、TTC7B、TUBB2C、TUBB3、TUBE1、TXNIP、TXNL1、TXNL4B、TXNRD1、TYW5、U2SURP、UBAP2L、UBE2D3、UBE2G2、UBE2L3、UBE2V1、UBN2、UBQLN4、UCHL5、UHMK1、UHRF1BP1L、UNC13B、UNC5B、URGCP、URGCP-MRPS24、USP19、USP7、USP27X、UVRAG、VANGL1、VARS2、VAV2、VCL、VDAC2、VIM-AS1、VIPAS39、VPS13A、VPS29、VPS41、VPS51、VSTM2L、VWA8、VWF、WDR19、WDR27、WDR37、WDR48、WDR90、WDR91、WHSC2、WIPF1、WISP1、WNK1、WNT5B、WNT10B、WSB1、WWTR1、XDH、XIAP、XRN2、YAP1、YDJC、YES1、YPEL5、YTHDF3、Z24749、ZAK、ZBTB10、ZBTB24、ZBTB26、ZBTB7A、ZC3H12C、ZC3H14、ZC3H18、ZCCHC5、ZCCHC8、ZCCHC11、ZEB1、ZEB2、ZFAND1、ZFAND5、ZFP82、ZHX3、ZMIZ1、ZMIZ1-AS1、ZMIZ2、ZMYM2、ZNF12、ZNF138、ZNF148、ZNF208、ZNF212、ZNF219、ZNF227、ZNF232、ZNF24、ZNF268、ZNF28、ZNF280D、ZNF281、ZNF335、ZNF350、ZNF37A、ZNF37BP、ZNF395、ZNF426、ZNF431、ZNF583、ZNF618、ZNF621、ZNF652、ZNF655、ZNF660、ZNF674、ZNF680、ZNF730、ZNF74、ZNF764、ZNF777、ZNF778、ZNF780A、ZNF7804A、ZNF79、ZNF827、ZNF836、ZNF837、ZNF839、ZNF91和ZSCAN25。
在特定方面,本文提供了用于修饰RNA剪接以调节由前体mRNA转录物产生的成熟mRNA转录物的量的方法,所述方法包括使包含前体mRNA转录物的细胞或细胞裂解物与式(I)的化合物或其形式接触,其中所述前体mRNA转录物包含两个外显子和内含子,其中第一外显子在内含子的上游,并且第二外显子在内含子的下游,其中所述内含子包含RNA核苷酸序列,所述RNA核苷酸序列按5’至3’顺序包含:内源或非内源剪接修饰剂的内含子识别元件(iREMS)、分支点和3’剪接位点,其中所述iREMS包含RNA序列GAgurngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,并且其中所述前体mRNA转录物是选自以下的基因的前体mRNA转录物:APOA2、ASAP1、BRCA1、BRCA2、CDKN1C、CRX、CTRC、DENND5A、DIAPH3、DMD、DNAH11、EIF2B3、GALC、HPS1、HTT、IKBKAP、KIAA1524、LMNA、MECP2、PAPD4、PAX6、PCCB、PITPNB、PTCH1、SLC34A3、SMN2、SPINK5、SREK1、TMEM67、VWF、XDH和XRN2。
在特定方面,本文提供了用于修饰RNA剪接以调节由前体mRNA转录物产生的成熟mRNA转录物的量的方法,所述方法包括使包含前体mRNA转录物的细胞或细胞裂解物与式(I)的化合物或其形式接触,其中所述前体mRNA转录物包含两个外显子和内含子,其中第一外显子在内含子的上游,并且第二外显子在内含子的下游,其中所述内含子包含RNA核苷酸序列,所述RNA核苷酸序列按5’至3’顺序包含:内源或非内源剪接修饰剂的内含子识别元件(iREMS)、分支点和3’剪接位点,其中所述iREMS包含RNA序列GAgurngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,并且其中所述前体mRNA转录物是选自以下的基因的前体mRNA转录物:ABCA1、ABCA10、ABCB7、ABCB8、ABCC1、ABCC3、ABL2、ABLIM3、ACACA、ACADVL、ACAT2、ACTA2、ADAL、ADAM15、ADAM17、ADAM23、ADAM33、ADAMTS1、ADAMTS19、ADCY3、ADD1、ADGRG6、ADH6、ADHFE1、AFF2、AFF3、AGK、AGPAT3、AGPAT4、AGPS、AHCYL2、AHDC1、AHRR、AJUBA、AK021888、AK310472、AKAP1、AKAP3、AKAP8L、AKAP9、AKNA、ALCAM、ALDH4A1、AMPD2、ANK1、ANK2、ANK3、ANKFY1、ANKHD1-EIF4EBP3、ANKRA2、ANKRD13C、ANKRD17、ANKRD33B、ANKRD36、ANKS6、ANP32A、ANXA6、AP2B1、AP4B1-AS1、APAF1、APIP、APOA2、APP、APTX、ARHGAP1、ARHGAP12、ARHGAP22、ARHGAP5、ARHGEF16、ARID1A、ARID2、ARID5B、ARL9、ARL15、ARL5B、ARMCX3、ARSJ、ASAP1、ASIC1、ASL、ASNS、ASPH、ATAD2B、ATF6、ATF7IP、ATG9A、ATMIN、ATP2A3、ATP2C1、ATXN1、ATXN3、AURKA、B3GALT2、B3GNT6、B4GALT2、BACE1、BAG2、BASP1、BC033281、BCAR3、BCL2L15、BCYRN1、BECN1、BEND6、BHMT2、BICD1、BIN1、BIN3、BIN3-IT1、BIRC3、BIRC6、BNC1、BNC2、BRCA1、BRCA2、BRD2、BRPF1、BSCL2、BTBD10、BTG2、BTN3A1、BZW1、C1QTNF9B-AS1、C1orf27、C1orf86、C10orf54、C11orf30、C11orf70、C11orf73、C11orf76、C11orf94、C12orf4、C12orf56、C14orf132、C17orf76-AS1、C19orf47、C2orf47、C3、C4orf27、C5orf24、C6orf48、C7orf31、C8orf34、C8orf44、C8orf44-SGK3、C8orf88、C9orf69、CA13、CA3、CAB39、CACNA2D2、CACNB1、CACNB4、CADM1、CADM2、CALU、CAMKK1、CAND2、CAPNS1、CASC3、CASP7、CASP8AP2、CAV1、CCAR1、CCDC77、CCDC79、CCDC88A、CCDC92、CCDC122、CCER2、CCNF、CCNL2、CCT6A、CD276、CD46、CDC25B、CDC40、CDC42BPA、CDCA7、CDH11、CDH13、CDH18、CDK11B、CDK16、CDKAL1、CDKN1C、CECR7、CELSR1、CEMIP、CENPI、CEP112、CEP162、CEP170、CEP192、CEP68、CFH、CFLAR、CHD8、CHEK1、CHRM2、CIITA、CIZ1、CLDN23、CLIC1、CLK4、CLTA、CMAHP、CNGA4、CNOT1、CNRIP1、CNTD1、CMSS1、CNOT7、CNRIP1、CNTN1、COG1、COL1A1、COL11A1、COL12A1、COL14A1、COL15A1、COL5A1、COL5A3、COL6A1、COL6A6、COL8A1、COLEC12、COMP、COPS7B、CPA4、CPEB2、CPQ、CPSF4、CREB5、CRISPLD2、CRLF1、CRLS1、CRTAP、CRX、CRYBG3、CRYL1、CSDE1、CSNK1A1、CSNK1E、CSNK1G1、CTDSP2、CTNND1、CTRC、CUL2、CUL4A、CUX1、CYB5B、CYB5R2、CYBRD1、CYGB、CYP1B1、CYP51A1、DAAM1、DAB2、DACT1、DAGLB、DARS、DAXX、DCAF10、DCAF11、DCAF17、DCBLD2、DCLK1、DCN、DCUN1D4、DDAH1、DDAH2、DDHD2、DDIT4L、DDR1、DDX39B、DDX42、DDX50、DEGS1、DENND1A、DENND1B、DENND4A、DENND5A、DEPTOR、DET1、DFNB59、DGCR2、DGK1、DGKA、DHCR24、DHCR7、DHFR、DHX9、DIAPH1、DIAPH3、DIRAS3、DIS3L、DKFZp434M1735、DKK3、DLC1、DLG5、DMD、DMXL1、DNAH8、DNAH11、DNAJA4、DNAJC13、DNAJC27、DNM2、DNMBP、DOCK1、DOCK11、DPP8、DSEL、DST、DSTN、DYNC1I1、DYRK1A、DZIP1L、EBF1、EEA1、EEF1A1、EFCAB14、EFEMP1、EGR1、EGR3、EHMT2、EIF2B3、EIF4G1、EIF4G2、EIF4G3、ELF2、ELMO2、ELN、ELP4、EMX2OS、ENAH、ENG、ENOX1、ENPP1、ENPP2、ENSA、EP300、EPT1、ERC1、ERC2、ERCC1、ERCC8、ERLIN2、ERRFI1、ESM1、ETV5、EVC、EVC2、EXO1、EXOC3、EXOC6B、EXTL2、EYA3、F2R、FADS1、FADS2、FAF1、FAIM、FAM111A、FAM126A、FAM13A、FAM160A1、FAM162A、FAM174A、FAM195B、FAM198B、FAM20A、FAM208B、FAM219A、FAM219B、FAM3C、FAM46B、FAM49B、FAM65A、FAM65B、FAM69B、FAP、FARP1、FBLN2、FBN2、FBXL16、FBXL6、FBXO9、FBXO10、FBXO18、FBXO31、FBXO34、FBXO9、FCHO1、FDFT1、FDPS、FER、FEZ1、FGD4、FGD5-AS1、FGFR2、FGFRL1、FGL2、FHOD3、FLII、FLNB、FLT1、FN1、FNBP1、FOCAD、FOS、FOSB、FOSL1、FOXK1、FRAS1、FSCN2、FUS、FYN、GABPB1、GAL3ST4、GALC、GALNT1、GALNT15、GAS7、GATA6、GBA2、GBGT1、GBP1、GCFC2、GLCE、GCNT1、GDF6、GGACT、GHDC、GIGYF2、GJC1、GLCE、GMIP、GNA13、GNAQ、GNAS、GNG12、GNL3L、GOLGA2、GOLGA4、GOLGB1、GORASP1、GPR1、GPR183、GPR50、GPR89A、GPRC5A、GPRC5B、GPSM2、GREM1、GRK6、GRTP1、GSE1、GTF2H2B、GTSF1、GUCA1B、GULP1、GXYLT1、HAPLN1、HAPLN2、HAS2、HAS3、HAT1、HAUS3、HAUS6、HAVCR2、HDAC5、HDAC7、HDX、HECTD2-AS1、HEG1、HEPH、HEY1、HLA-A、HLA-E、HLTF、HMGA1、HMGA2、HMGB1、HMGCR、HMGN3-AS1、HMGCS1、HMGXB4、HOOK3、HOXB3、HMOX1、HNMT、HNRNPR、HNRNPUL1、HP1BP3、HPS1、HRH1、HSD17B12、HSPA1L、HTATIP2、HTT、IARS、IDH1、IDI1、IFT57、IGDCC4、IGF2BP2、IGF2R、IGFBP3、IKBKAP、IL16、IL6ST、INA、INHBA、INO80、IPP4B、INPP5K、INSIG1、INTU、INVS、IQCE、IQCG、ITCH、ITGA11、ITGA8、ITGAV、ITGB5、ITGB8、ITIH1、ITM2C、ITPKA、ITSN1、IVD、KANSL3、KAT6B、KCNK2、KCNS1、KCNS2、KDM6A、KDSR、KIAA1033、KIAA1143、KIAA1199、KIAA1456、KIAA1462、KIAA1522、KIAA1524、KIAA1549、KIAA1715、KIAA1755、KIDINS220、KIF14、KIF2A、KIF21A、KIF3A、KIT、KLC1、KLC2、KLF17、KLF6、KLHL7、KLRG1、KMT2D、KRT7、KRT18、KRT19、KRT34、KRTAP1-1、KRTAP1-5、KRTAP2-3、L3MBTL2、LAMA2、LAMB1、LAMB2P1、LARP4、LATS2、LDLR、LEMD3、LETM2、LGALS3、LGALS8、LGI2、LGR4、LHX9、LIMS1、LINC00341、LINC00472、LINC00570、LINC00578、LINC00607、LINC00657、LINC00678、LINC00702、LINC00886、LINC00961、LINC01011、LINC01118、LINC01204、LINCR-0002、LINGO2、LMAN2L、LMNA、LMO7、LMOD1、LOC400927、LONP1、LOX、LPHN1、LRBA、LRCH4、LRIG1、LRP4、LRP8、LRRC1、LRRC32、LRRC39、LRRC8A、LSAMP、LSS、LTBR、LUC7L2、LUM、LYPD1、LYRM1、LZTS2、MACROD2、MAFB、MAGED4、MAGED4B、MAMDC2、MAN1A2、MAN2A1、MAN2C1、MANEA、MAP4K4、MAPK10、MAPK13、MARCH7、MARCH8、MASP1、MB、MB21D2、MBD1、MBOAT7、MC4R、MCM10、MDM2、MDN1、MEAF6、MECP2、MED1、MED13L、MEDAG、MEF2D、MEGF6、MEIS2、MEMO1、MEPCE、MFGE8、MFN2、MIAT、MICAL2、MINPP1、MIR612、MKL1、MKLN1、MKNK2、MLLT4、MLLT10、MLST8、MMAB、MMP10、MMP24、MMS19、MMS22L、MN1、MORF4L1、MOXD1、MPPE1、MPZL1、MRPL3、MRPL45、MRPL55、MRPS28、MRVI1、MSANTD3、MSC、MSH2、MSH4、MSH6、MSL3、MSMO1、MSRB3、MTAP、MTERF3、MTERFD1、MTHFD1L、MTMR3、MTMR9、MTRR、MUM1、MVD、MVK、MXRA5、MYADM、MYB、MYCBP2、MYLK、MYO1D、MYO9B、MYOF、NA、NAA35、NAALADL2、NADK、NAE1、NAGS、NASP、NAV1、NAV2、NCOA1、NCOA3、NCOA4、NCSTN、NDNF、NEDD4、NELFA、NEO1、NEURL1B、NF2、NFASC、NFE2L1、NFX1、NGF、NGFR、NHLH1、NID1、NID2、NIPA1、NKX3-1、NLGN1、NLN、NOL10、NOMO3、NOTCH3、NOTUM、NOVA2、NOX4、NPEPPS、NRD1、NREP、NRG1、NRROS、NSUN4、NT5C2、NT5E、NTNG1、NUDT4、NUP153、NUP35、NUP50、NUPL1、NUSAP1、OCLN、ODF2、OLR1、OS9、OSBPL3、OSBPL6、OSBPL10、OSMR、OXCT1、OXCT2、P4HA1、P4HB、PABPC1、PAIP2B、PAK4、PAPD4、PARD3、PARN、PARP14、PARP4、PARVB、PAX6、PBLD、PBX3、PCBP2、PCCB、PCDH10、PCDHGB3、PCGF3、PCM1、PCMTD2、PCNXL2、PCSK9、PDE1C、PDE3A、PDE4A、PDE5A、PDE7A、PDGFD、PDGFRB、PDLIM7、PDS5B、PDXDC1、PDXDC2P、PEAR1、PELI1、PEPD、PEX5、PFKP、PHACTR3、PHF19、PHF8、PHRF1、PHTF2、PI4K2A、PIEZO1、PIGN、PIGU、PIK3C2B、PIK3CD、PIK3R1、PIKFYVE、PIM2、PITPNA、PITPNB、PITPNM1、PITPNM3、PLAU、PLEC、PLEK2、PLEKHA1、PLEKHA6、PLEKHB2、PLEKHH2、PLSCR1、PLSCR3、PLXNB2、PLXNC1、PMS1、PNISR、PODN、POLE3、POLN、POLR1A、POLR3D、POMT2、POSTN、POU2F1、PPAPDC1A、PPARA、PPARG、PPFIBP1、PPIP5K1、PPIP5K2、PPM1E、PPP1R12A、PPP1R26、PPP3CA、PPP6R1、PPP6R2、PRKCA、PRKDC、PRKG1、PRMT1、PRNP、PRPF31、PRPH2、PRRG4、PRSS23、PRUNE2、PSMA4、PSMC1、PSMD6、PSMD6-AS2、PTCH1、PTGIS、PTK2B、PTPN14、PTX3、PUF60、PUS7、PVR、PXK、PXN、QKI、RAB2B、RAB30、RAB34、RAB38、RAB44、RAD1、RAD9B、RAD23B、RAF1、RALB、RAP1GDS1、RAPGEF1、RARG、RARS、RARS2、RASIP1、RASSF8、RBBP8、RBCK1、RCOR3、RBFOX2、RBKS、RBM10、RDX、RERE、RFTN1、RFWD2、RFX3-AS1、RGCC、RGL1、RGS10、RGS3、RIF1、RNF14、RNF19A、RNF130、RNF144A、RNF213、RNF38、RNFT1、ROR1、ROR2、RPA1、RPF2、RPL10、RPS10、RPS6KB2、RPS6KC1、RRBP1、RWDD4、SAMD4A、SAMD9、SAMD9L、SAR1A、SART3、SCAF4、SCAF8、SCARNA9、SCD、SCLT1、SCO1、SDCBP、SEC14L1、SEC22A、SEC24A、SEC24B、SEC61A1、SENP6、SEPT9、SERGEF、SERPINE2、SF1、SF3B3、SGIP1、SGK3、SGMS1、SGOL2、SGPL1、SH2B3、SH3RF1、SH3YL1、SHROOM3、SIGLEC10、SKA2、SKIL、SKP1、SLC12A2、SLC24A3、SLC25A16、SLC25A17、SLC34A3、SLC35F3、SLC39A3、SLC39A10、SLC4A4、SLC4A11、SLC41A1、SLC44A2、SLC46A2、SLC6A15、SLC7A6、SLC7A8、SLC7A11、SLC9A3、SLIT3、SMARCA4、SMARCC2、SMC4、SMC6、SMCHD1、SMG1、SMG1P3、SMOX、SMPD4、SMTN、SMYD3、SMYD5、SNAP23、SNED1、SNHG16、SNX7、SNX14、SNX24、SNX7、SOCS2、SOCS6、SOGA2、SON、SORBS2、SORCS1、SORCS2、SOS2、SOX7、SPATA18、SPATA20、SPATA5、SPATS2、SPDYA、SPEF2、SPG20、SPIDR、SPINK5、SPRED2、SPRYD7、SQLE、SQRDL、SQSTM1、SRCAP、SREBF1、SRGAP1、SRRM1、SRSF3、SSBP1、STAC2、STARD4、STAT1、STAT3、STAT4、STAU1、STC2、STEAP2、STK32B、STRAD8、STRIP1、STRN4、STS、STX16、STXBP4、STXBP6、SULF1、SUPT20H、SVEP1、SYNE1、SYNE2、SYNGR2、SYNPO、SYNPO2、SYNPO2L、SYT15、SYTL2、TACC1、TAF2、TAGLN3、TANC2、TANGO6、TARBP1、TARS、TASP1、TBC1D15、TBCA、TBL1XR1、TBL2、TCF12、TCF4、TCF7L2、TEKT4P2、TENC1、TENM2、TEP1、TET1、TET3、TEX21P、TFCP2、TGFA、TGFB2、TGFB3、TGFBI、TGFBR1、TGFBRAP1、TGM2、THADA、THAP4、THBS2、THRB、TIAM1、TIMP2、TJAP1、TJP2、TLE3、TLK1、TMC3、TMEM67、TMEM102、TMEM119、TMEM134、TMEM154、TMEM189-UBE2V1、TMEM214、TMEM256-PLSCR3、TMEM47、TMEM50B、TMEM63A、TMX3、TNC、TNFAIP3、TNFAIP8L3、TNFRSF12A、TNFRSF14、TNIP1、TNKS1BP1、TNPO3、TNRC18P1、TNS1、TNS3、TNXB、TOE1、TOMM40、TOMM5、TOPORS、TP53AIP1、TP53INP1、TPRG1、TRAF3、TRAK1、TRAPPC12、TRIB1、TRIM2、TRIM23、TRIM26、TRIM28、TRIM65、TRIM66、TRMT1L、TRPC4、TRPS1、TSC2、TSHZ1、TSHZ2、TSPAN11、TSPAN18、TSPAN2、TSPAN7、TSSK3、TTC7A、TTC7B、TUBB2C、TUBB3、TUBE1、TXNIP、TXNL1、TXNL4B、TXNRD1、TYW5、U2SURP、UBAP2L、UBE2D3、UBE2G2、UBE2L3、UBE2V1、UBN2、UBQLN4、UCHL5、UHMK1、UHRF1BP1L、UNC13B、UNC5B、URGCP、URGCP-MRPS24、USP19、USP7、USP27X、UVRAG、VANGL1、VARS2、VAV2、VCL、VDAC2、VIM-AS1、VIPAS39、VPS13A、VPS29、VPS41、VPS51、VSTM2L、VWA8、VWF、WDR19、WDR27、WDR37、WDR48、WDR90、WDR91、WHSC2、WIPF1、WISP1、WNK1、WNT5B、WNT10B、WSB1、WWTR1、XDH、XIAP、XRN2、YAP1、YDJC、YES1、YPEL5、YTHDF3、Z24749、ZAK、ZBTB10、ZBTB24、ZBTB26、ZBTB7A、ZC3H12C、ZC3H14、ZC3H18、ZCCHC5、ZCCHC8、ZCCHC11、ZEB1、ZEB2、ZFAND1、ZFAND5、ZFP82、ZHX3、ZMIZ1、ZMIZ1-AS1、ZMIZ2、ZMYM2、ZNF12、ZNF138、ZNF148、ZNF208、ZNF212、ZNF219、ZNF227、ZNF232、ZNF24、ZNF268、ZNF28、ZNF280D、ZNF281、ZNF335、ZNF350、ZNF37A、ZNF37BP、ZNF395、ZNF426、ZNF431、ZNF583、ZNF618、ZNF621、ZNF652、ZNF655、ZNF660、ZNF674、ZNF680、ZNF730、ZNF74、ZNF764、ZNF777、ZNF778、ZNF780A、ZNF7804A、ZNF79、ZNF827、ZNF836、ZNF837、ZNF839、ZNF91和ZSCAN25。
在特定方面,本文提供了用于修饰RNA剪接以调节由前体mRNA转录物产生的成熟mRNA转录物的量的方法,所述方法包括使包含前体mRNA转录物的细胞或细胞裂解物与式(I)的化合物或其形式接触,其中所述前体mRNA转录物包含两个外显子和内含子,其中第一外显子在内含子的上游,并且第二外显子在内含子的下游,其中所述内含子包含RNA核苷酸序列,所述RNA核苷酸序列按5’至3’顺序包含:内源或非内源剪接修饰剂的内含子识别元件(iREMS)、分支点和3’剪接位点,其中所述iREMS包含RNA序列GAgurngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,并且其中所述前体mRNA转录物不是基因SMN2的前体mRNA转录物。
在特定方面,本文提供了用于修饰RNA剪接以调节由前体mRNA转录物产生的成熟mRNA转录物的量的方法,所述方法包括使包含前体mRNA转录物的细胞或细胞裂解物与式(I)的化合物或其形式接触,其中所述前体mRNA转录物包含两个外显子和内含子,其中第一外显子在内含子的上游,并且第二外显子在内含子的下游,其中所述内含子包含RNA核苷酸序列,所述RNA核苷酸序列按5’至3’顺序包含:内源或非内源剪接修饰剂的内含子识别元件(iREMS)、分支点和3’剪接位点,其中所述iREMS包含RNA序列GAgurngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,并且其中所述前体mRNA转录物is a前体mRNA转录物of a基因that is not selected from ABHD10、ADAM12、AKT1、ANXA11、APLP2、APPL2、ARMCX6、ATG5、AXIN1、BAIAP2、CCNB1IP1、CCT7、CEP57、CSF1、DLGAP4、EPN1、ERGIC3、FOXM1、GGCT、GRAMD3、HSD17B4、LARP7、LRRC42、MADD、MAN1B1、MRPL39、PCBP4、PPHLN1、PRKACB、RAB23、RAP1A、RCC1、SREK1、STRN3和TNRC6A.
在特定方面,本文提供了用于修饰RNA剪接以调节由前体mRNA转录物产生的成熟mRNA转录物的量的方法,所述方法包括使包含前体mRNA转录物的细胞或细胞裂解物与式(I)的化合物或其形式接触,其中所述前体mRNA转录物包含两个外显子和内含子,其中第一外显子在内含子的上游,并且第二外显子在内含子的下游,其中所述内含子包含RNA核苷酸序列,所述RNA核苷酸序列按包含5’至3’顺序:内源或非内源剪接修饰剂的内含子识别元件(iREMS)、分支点和3’剪接位点,其中所述iREMS包含RNA序列GAgurngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,并且其中所述前体mRNA转录物不是选自以下的基因的前体mRNA转录物:ABHD10、ADAM12、AKT1、ANXA11、APLP2、APPL2、ARMCX6、ATG5、AXIN1、BAIAP2、CCNB1IP1、CCT7、CEP57、CSF1、DLGAP4、EPN1、ERGIC3、FOXM1、GGCT、GRAMD3、HSD17B4、LARP7、LRRC42、MADD、MAN1B1、MRPL39、PCBP4、PPHLN1、PRKACB、RAB23、RAP1A、RCC1、SMN2、SREK1、STRN3和TNRC6A。
在某些方面,与式(I)的化合物或其形式接触或培养的(多种)细胞是来自细胞系的(多种)原代细胞或(多种)细胞。在一些方面,与式(I)的化合物或其形式接触或培养的(多种)细胞是(多种)成纤维细胞、(多种)免疫细胞或(多种)肌细胞。在一些实施方案中,与式(I)的化合物或其形式接触或培养的(多种)细胞是癌细胞。细胞系的非限制性实例包括3T3、4T1、721、9L、A2780、A172、A20、A253、A431、A-549、ALC、B16、B35、BCP-1、BEAS-2B、bEnd.3、BHK、BR 293、BT2O、BT483、BxPC3、C2C12、C3H-10T1/2、C6/36、C6、Cal-27、CHO、COR-L23、COS、COV-434、CML T1、CMT、CRL7O3O、CT26、D17、DH82、DU145、DuCaP、EL4、EM2、EM3、EMT6、FM3、H1299、H69、HB54、HB55、HCA2、HD-1994、HDF、HEK-293、HeLa、Hepa1c1c7、HL-60、HMEC、Hs578T、HsS78Bst、HT-29、HTB2、HUVEC、Jurkat、J558L、JY、K562、Ku812、KCL22、KG1、KYO1、LNCap、Ma-Mel、MC-38、MCF-7、MCF-10A、MDA-MB-231、MDA-MB-468、MDA-MB-435、MDCK、MG63、MOR/0.2R、MONO-MAC 6、MRC5、MTD-1A、NCI-H69、NIH-3T3、NALM-1、NS0、NW-145、OPCN、OPCT、PNT-1A、PNT-2、Raji、RBL、RenCa、RIN-5F、RMA、Saos-2、Sf21、Sf9、SH-SY5Y、SiHa、SKBR3、SKOV-3、T2、T-47D、T84、THP1、U373、U87、U937、VCaP、Vero、VERY、W138、WM39、WT-49、X63、YAC-1和YAR细胞。一方面,细胞来自患者。另一方面,患者细胞是GM03813细胞。另一方面,患者细胞是GM04856、GM04857、GM09197、GM04281、GM04022、GM07492细胞。
在本文所述的某些方面,(多种)细胞与式(I)的化合物或其形式接触或培养15分钟、30分钟、45分钟、1小时、2小时、3小时、4小时、5小时、6小时、8小时、12小时、18小时、24小时、48小时、72小时或更长的时间段。在本文所述的其他方面,(多种)细胞与式(I)的化合物或其形式接触或培养15分钟至1小时、1至2小时、2至4小时、6至12小时、12至18小时、12至24小时、28至24小时、24至48小时、48至72小时的时间段。
在本文所述的某些方面,使(多种)细胞与特定浓度的式(I)的化合物或其形式接触或培养,其中所述特定浓度为0.01μM、0.05μM、1μM、2μM、5μM、10μM、15μM、20μM、25μM、50μM、75μM、100μM或150μM。在本文所述的其他方面,使(多种)细胞与特定浓度的式(I)的化合物或其形式接触或培养,其中所述特定浓度为175μM、200μM、250μM、275μM、300μM、350μM、400μM、450μM、500μM、550μM 600μM、650μM、700μM、750μM、800μM、850μM、900μM、950μM或1mM。在本文所述的一些方面,使(多种)细胞与特定浓度的式(I)的化合物或其形式接触或培养,其中所述特定浓度为5nM、10nM、20nM、30nM、40nM、50nM、60nM、70nM、80nM、90nM、100nM、150nM、200nM、250nM、300nM、350nM、400nM、450nM、500nM、550nM、600nM、650nM、700nM、750nM、800nM、850nM、900nM或950nM。在本文所述的某些方面,使(多种)细胞与特定浓度的式(I)的化合物或其形式接触或培养,其中所述特定浓度为0.01μM至0.1μM、0.1μM至1μM、1μM至50μM、50μM至100μM、100μM至500μM、500μM至1nM、1nM至10nM、10nM至50nM、50nM至100nM、100nM至500nM、500nM至1000nM。在本文所述的某些方面,使(多种)细胞与特定浓度的式(I)的化合物或其形式接触或培养,其导致基因(例如,下文所述的基因)的RNA转录物(例如,mRNA转录物)、供选择的剪接变体或同种型的量实质改变。
另一方面,本文提供了用于修饰RNA剪接以调节基因的一种、两种、三种或更多种RNA转录物的量的方法,其中从所述基因转录的所述前体RNA转录物包含内含子REMS,所述方法包括向人类或非人类对象施用式(I)的化合物或其形式或包含式(I)的化合物或其形式和药学上可接受的载体、赋形剂或稀释剂的药物组合物。在具体方面,所述前体RNA转录物按5’至3’顺序包含:分支点、3’剪接位点和内含子REMS。在另一个具体方面,所述前体RNA转录物按5’至3’顺序包含:第一5’剪接位点、第一分支点、第一3’剪接位点、内含子REMS、第二分支点和第二3’剪接位点。在另一个具体方面,前体RNA转录物按5’至3’顺序包含:内含子REMS、分支点和3’剪接位点。
一方面,本文提供了用于修饰RNA剪接以调节本文所述的基因的一种、两种、三种或更多种RNA转录物的量的方法,所述方法包括向人类或非人类对象施用式(I)的化合物或其形式或包含式(I)的化合物或其形式和药学上可接受的载体、赋形剂或稀释剂的药物组合物。
另一方面,本文提供了用于修饰RNA剪接以调节本文所述的基因的一种、两种、三种或更多种RNA转录物的量的方法,其中从所述基因转录的所述前体RNA转录物包含内含子REMS,所述方法包括向人类或非人类对象施用式(I)的化合物或其形式或包含式(I)的化合物或其形式和药学上可接受的载体、赋形剂或稀释剂的药物组合物。在具体方面,所述前体RNA转录物按5’至3’顺序包含:分支点、3’剪接位点和内含子REMS。在另一个具体方面,所述前体RNA转录物按5’至3’顺序包含:第一5’剪接位点、第一分支点、第一3’剪接位点、内含子REMS、第二分支点和第二3’剪接位点。在另一个具体方面,前体RNA转录物按5’至3’顺序包含:内含子REMS、分支点和3’剪接位点。
在特定方面,本文提供了用于修饰RNA剪接以调节对象的基因的一种、两种、三种或更多种RNA转录物的量的方法,其中从所述基因转录的所述前体RNA转录物包含内含子REMS(例如,内源内含子REMS或非内源内含子REMS),所述方法包括向所述对象施用式(I)的化合物或其形式或包含式(I)的化合物或其形式和药学上可接受的载体、赋形剂或稀释剂的药物组合物,并且其中所述基因选自ABCA1、ABCA10、ABCB7、ABCB8、ABCC1、ABCC3、ABHD10、ABL2、ABLIM3、ACACA、ACADVL、ACAT2、ACTA2、ADAL、ADAM12、ADAM15、ADAM17、ADAM23、ADAM33、ADAMTS1、ADAMTS19、ADCY3、ADD1、ADGRG6、ADH6、ADHFE1、AFF2、AFF3、AGK、AGPAT3、AGPAT4、AGPS、AHCYL2、AHDC1、AHRR、AJUBA、AK021888、AK310472、AKAP1、AKAP3、AKAP8L、AKAP9、AKNA、AKT1、ALCAM、ALDH4A1、AMPD2、ANK1、ANK2、ANK3、ANKFY1、ANKHD1-EIF4EBP3、ANKRA2、ANKRD13C、ANKRD17、ANKRD33B、ANKRD36、ANKS6、ANP32A、ANXA11、ANXA6、AP2B1、AP4B1-AS1、APAF1、APIP、APLP2、APOA2、APP、APPL2、APTX、ARHGAP1、ARHGAP12、ARHGAP22、ARHGAP5、ARHGEF16、ARID1A、ARID2、ARID5B、ARL9、ARL15、ARL5B、ARMCX3、ARMCX6、ARSJ、ASAP1、ASIC1、ASL、ASNS、ASPH、ATAD2B、ATF6、ATF7IP、ATG5、ATG9A、ATMIN、ATP2A3、ATP2C1、ATXN1、ATXN3、AURKA、AXIN1、B3GALT2、B3GNT6、B4GALT2、BACE1、BAG2、BASP1、BC033281、BCAR3、BCL2L15、BCYRN1、BECN1、BEND6、BHMT2、BICD1、BIN1、BIN3、BIN3-IT1、BIRC3、BIRC6、BNC1、BNC2、BRCA1、BRCA2、BRD2、BRPF1、BSCL2、BTBD10、BTG2、BTN3A1、BZW1、C1QTNF9B-AS1、C1orf27、C1orf86、C10orf54、C11orf30、C11orf70、C11orf73、C11orf76、C11orf94、C12orf4、C12orf56、C14orf132、C17orf76-AS1、C19orf47、C2orf47、C3、C4orf27、C5orf24、C6orf48、C7orf31、C8orf34、C8orf44、C8orf44-SGK3、C8orf88、C9orf69、CA13、CA3、CAB39、CACNA2D2、CACNB1、CACNB4、CADM1、CADM2、CALU、CAMKK1、CAND2、CAPNS1、CASC3、CASP7、CASP8AP2、CAV1、CCAR1、CCDC77、CCDC79、CCDC88A、CCDC92、CCDC122、CCER2、CCNF、CCNL2、CCT6A、CD276、CD46、CDC25B、CDC40、CDC42BPA、CDCA7、CDH11、CDH13、CDH18、CDK11B、CDK16、CDKAL1、CDKN1C、CECR7、CELSR1、CEMIP、CENPI、CEP112、CEP162、CEP170、CEP192、CEP57、CEP68、CFH、CFLAR、CHD8、CHEK1、CHRM2、CIITA、CIZ1、CLDN23、CLIC1、CLK4、CLTA、CMAHP、CNGA4、CNOT1、CNRIP1、CNTD1、CMSS1、CNOT7、CNRIP1、CNTN1、COG1、COL1A1、COL11A1、COL12A1、COL14A1、COL15A1、COL5A1、COL5A3、COL6A1、COL6A6、COL8A1、COLEC12、COMP、COPS7B、CPA4、CPEB2、CPQ、CPSF4、CREB5、CRISPLD2、CRLF1、CRLS1、CRTAP、CRX、CRYBG3、CRYL1、CSDE1、CSNK1A1、CSNK1E、CSNK1G1、CTDSP2、CTNND1、CTRC、CUL2、CUL4A、CUX1、CYB5B、CYB5R2、CYBRD1、CYGB、CYP1B1、CYP51A1、DAAM1、DAB2、DACT1、DAGLB、DARS、DAXX、DCAF10、DCAF11、DCAF17、DCBLD2、DCLK1、DCN、DCUN1D4、DDAH1、DDAH2、DDHD2、DDIT4L、DDR1、DDX39B、DDX42、DDX50、DEGS1、DENND1A、DENND1B、DENND4A、DENND5A、DEPTOR、DET1、DFNB59、DGCR2、DGK1、DGKA、DHCR24、DHCR7、DHFR、DHX9、DIAPH1、DIAPH3、DIRAS3、DIS3L、DKFZp434M1735、DKK3、DLC1、DLG5、DLGAP4、DMD、DMXL1、DNAH8、DNAH11、DNAJA4、DNAJC13、DNAJC27、DNM2、DNMBP、DOCK1、DOCK11、DPP8、DSEL、DST、DSTN、DYNC1I1、DYRK1A、DZIP1L、EBF1、EEA1、EEF1A1、EFCAB14、EFEMP1、EGR1、EGR3、EHMT2、EIF2B3、EIF4G1、EIF4G2、EIF4G3、ELF2、ELMO2、ELN、ELP4、EMX2OS、ENAH、ENG、ENOX1、ENPP1、ENPP2、ENSA、EP300、EPN1、EPT1、ERC1、ERC2、ERCC1、ERCC8、ERGIC3、ERLIN2、ERRFI1、ESM1、ETV5、EVC、EVC2、EXO1、EXOC3、EXOC6B、EXTL2、EYA3、F2R、FADS1、FADS2、FAF1、FAIM、FAM111A、FAM126A、FAM13A、FAM160A1、FAM162A、FAM174A、FAM195B、FAM198B、FAM20A、FAM208B、FAM219A、FAM219B、FAM3C、FAM46B、FAM49B、FAM65A、FAM65B、FAM69B、FAP、FARP1、FBLN2、FBN2、FBXL16、FBXL6、FBXO9、FBXO10、FBXO18、FBXO31、FBXO34、FBXO9、FCHO1、FDFT1、FDPS、FER、FEZ1、FGD4、FGD5-AS1、FGFR2、FGFRL1、FGL2、FHOD3、FLII、FLNB、FLT1、FN1、FNBP1、FOCAD、FOS、FOSB、FOSL1、FOXK1、FOXM1、FRAS1、FSCN2、FUS、FYN、GABPB1、GAL3ST4、GALC、GALNT1、GALNT15、GAS7、GATA6、GBA2、GBGT1、GBP1、GCFC2、GLCE、GCNT1、GDF6、GGACT、GGCT、GHDC、GIGYF2、GJC1、GLCE、GMIP、GNA13、GNAQ、GNAS、GNG12、GNL3L、GOLGA2、GOLGA4、GOLGB1、GORASP1、GPR1、GPR183、GPR50、GPR89A、GPRC5A、GPRC5B、GPSM2、GREM1、GRK6、GRTP1、GSE1、GTF2H2B、GTSF1、GUCA1B、GULP1、GXYLT1、HAPLN1、HAPLN2、HAS2、HAS3、HAT1、HAUS3、HAUS6、HAVCR2、HDAC5、HDAC7、HDX、HECTD2-AS1、HEG1、HEPH、HEY1、HLA-A、HLA-E、HLTF、HMGA1、HMGA2、HMGB1、HMGCR、HMGN3-AS1、HMGCS1、HMGXB4、HOOK3、HOXB3、HMOX1、HNMT、HNRNPR、HNRNPUL1、HP1BP3、HPS1、HRH1、HSD17B12、HSD17B4、HSPA1L、HTATIP2、HTT、IARS、IDH1、IDI1、IFT57、IGDCC4、IGF2BP2、IGF2R、IGFBP3、IKBKAP、IL16、IL6ST、INA、INHBA、INO80、IPP4B、INPP5K、INSIG1、INTU、INVS、IQCE、IQCG、ITCH、ITGA11、ITGA8、ITGAV、ITGB5、ITGB8、ITIH1、ITM2C、ITPKA、ITSN1、IVD、KANSL3、KAT6B、KCNK2、KCNS1、KCNS2、KDM6A、KDSR、KIAA1033、KIAA1143、KIAA1199、KIAA1456、KIAA1462、KIAA1522、KIAA1524、KIAA1549、KIAA1715、KIAA1755、KIDINS220、KIF14、KIF2A、KIF21A、KIF3A、KIT、KLC1、KLC2、KLF17、KLF6、KLHL7、KLRG1、KMT2D、KRT7、KRT18、KRT19、KRT34、KRTAP1-1、KRTAP1-5、KRTAP2-3、L3MBTL2、LAMA2、LAMB1、LAMB2P1、LARP4、LARP7、LATS2、LDLR、LEMD3、LETM2、LGALS3、LGALS8、LGI2、LGR4、LHX9、LIMS1、LINC00341、LINC00472、LINC00570、LINC00578、LINC00607、LINC00657、LINC00678、LINC00702、LINC00886、LINC00961、LINC01011、LINC01118、LINC01204、LINCR-0002、LINGO2、LMAN2L、LMNA、LMO7、LMOD1、LOC400927、LONP1、LOX、LPHN1、LRBA、LRCH4、LRIG1、LRP4、LRP8、LRRC1、LRRC32、LRRC39、LRRC42、LRRC8A、LSAMP、LSS、LTBR、LUC7L2、LUM、LYPD1、LYRM1、LZTS2、MACROD2、MADD、MAFB、MAGED4、MAGED4B、MAMDC2、MAN1A2、MAN2A1、MAN2C1、MANEA、MAP4K4、MAPK10、MAPK13、MARCH7、MARCH8、MASP1、MB、MB21D2、MBD1、MBOAT7、MC4R、MCM10、MDM2、MDN1、MEAF6、MECP2、MED1、MED13L、MEDAG、MEF2D、MEGF6、MEIS2、MEMO1、MEPCE、MFGE8、MFN2、MIAT、MICAL2、MINPP1、MIR612、MKL1、MKLN1、MKNK2、MLLT4、MLLT10、MLST8、MMAB、MMP10、MMP24、MMS19、MMS22L、MN1、MORF4L1、MOXD1、MPPE1、MPZL1、MRPL3、MRPL39、MRPL45、MRPL55、MRPS28、MRVI1、MSANTD3、MSC、MSH2、MSH4、MSH6、MSL3、MSMO1、MSRB3、MTAP、MTERF3、MTERFD1、MTHFD1L、MTMR3、MTMR9、MTRR、MUM1、MVD、MVK、MXRA5、MYADM、MYB、MYCBP2、MYLK、MYO1D、MYO9B、MYOF、NA、NAA35、NAALADL2、NADK、NAE1、NAGS、NASP、NAV1、NAV2、NCOA1、NCOA3、NCOA4、NCSTN、NDNF、NEDD4、NELFA、NEO1、NEURL1B、NF2、NFASC、NFE2L1、NFX1、NGF、NGFR、NHLH1、NID1、NID2、NIPA1、NKX3-1、NLGN1、NLN、NOL10、NOMO3、NOTCH3、NOTUM、NOVA2、NOX4、NPEPPS、NRD1、NREP、NRG1、NRROS、NSUN4、NT5C2、NT5E、NTNG1、NUDT4、NUP153、NUP35、NUP50、NUPL1、NUSAP1、OCLN、ODF2、OLR1、OS9、OSBPL3、OSBPL6、OSBPL10、OSMR、OXCT1、OXCT2、P4HA1、P4HB、PABPC1、PAIP2B、PAK4、PAPD4、PARD3、PARN、PARP14、PARP4、PARVB、PAX6、PBLD、PBX3、PCBP2、PCBP4、PCCB、PCDH10、PCDHGB3、PCGF3、PCM1、PCMTD2、PCNXL2、PCSK9、PDE1C、PDE3A、PDE4A、PDE5A、PDE7A、PDGFD、PDGFRB、PDLIM7、PDS5B、PDXDC1、PDXDC2P、PEAR1、PELI1、PEPD、PEX5、PFKP、PHACTR3、PHF19、PHF8、PHRF1、PHTF2、PI4K2A、PIEZO1、PIGN、PIGU、PIK3C2B、PIK3CD、PIK3R1、PIKFYVE、PIM2、PITPNA、PITPNB、PITPNM1、PITPNM3、PLAU、PLEC、PLEK2、PLEKHA1、PLEKHA6、PLEKHB2、PLEKHH2、PLSCR1、PLSCR3、PLXNB2、PLXNC1、PMS1、PNISR、PODN、POLE3、POLN、POLR1A、POLR3D、POMT2、POSTN、POU2F1、PPAPDC1A、PPARA、PPARG、PPFIBP1、PPHLN1、PPIP5K1、PPIP5K2、PPM1E、PPP1R12A、PPP1R26、PPP3CA、PPP6R1、PPP6R2、PRKACB、PRKCA、PRKDC、PRKG1、PRMT1、PRNP、PRPF31、PRPH2、PRRG4、PRSS23、PRUNE2、PSMA4、PSMC1、PSMD6、PSMD6-AS2、PTCH1、PTGIS、PTK2B、PTPN14、PTX3、PUF60、PUS7、PVR、PXK、PXN、QKI、RAB23、RAB2B、RAB30、RAB34、RAB38、RAB44、RAD1、RAD9B、RAD23B、RAF1、RALB、RAP1A、RAP1GDS1、RAPGEF1、RARG、RARS、RARS2、RASIP1、RASSF8、RBBP8、RBCK1、RCOR3、RBFOX2、RBKS、RBM10、RCC1、RDX、RERE、RFTN1、RFWD2、RFX3-AS1、RGCC、RGL1、RGS10、RGS3、RIF1、RNF14、RNF19A、RNF130、RNF144A、RNF213、RNF38、RNFT1、ROR1、ROR2、RPA1、RPF2、RPL10、RPS10、RPS6KB2、RPS6KC1、RRBP1、RWDD4、SAMD4A、SAMD9、SAMD9L、SAR1A、SART3、SCAF4、SCAF8、SCARNA9、SCD、SCLT1、SCO1、SDCBP、SEC14L1、SEC22A、SEC24A、SEC24B、SEC61A1、SENP6、SEPT9、SERGEF、SERPINE2、SF1、SF3B3、SGIP1、SGK3、SGMS1、SGOL2、SGPL1、SH2B3、SH3RF1、SH3YL1、SHROOM3、SIGLEC10、SKA2、SKIL、SKP1、SLC12A2、SLC24A3、SLC25A16、SLC25A17、SLC34A3、SLC35F3、SLC39A3、SLC39A10、SLC4A4、SLC4A11、SLC41A1、SLC44A2、SLC46A2、SLC6A15、SLC7A6、SLC7A8、SLC7A11、SLC9A3、SLIT3、SMARCA4、SMARCC2、SMC4、SMC6、SMCHD1、SMG1、SMG1P3、SMN2、SMOX、SMPD4、SMTN、SMYD3、SMYD5、SNAP23、SNED1、SNHG16、SNX7、SNX14、SNX24、SNX7、SOCS2、SOCS6、SOGA2、SON、SORBS2、SORCS1、SORCS2、SOS2、SOX7、SPATA18、SPATA20、SPATA5、SPATS2、SPDYA、SPEF2、SPG20、SPIDR、SPINK5、SPRED2、SPRYD7、SQLE、SQRDL、SQSTM1、SRCAP、SREBF1、SREK1、SRGAP1、SRRM1、SRSF3、SSBP1、STAC2、STARD4、STAT1、STAT3、STAT4、STAU1、STC2、STEAP2、STK32B、STRAD8、STRIP1、STRN3、STRN4、STS、STX16、STXBP4、STXBP6、SULF1、SUPT20H、SVEP1、SYNE1、SYNE2、SYNGR2、SYNPO、SYNPO2、SYNPO2L、SYT15、SYTL2、TACC1、TAF2、TAGLN3、TANC2、TANGO6、TARBP1、TARS、TASP1、TBC1D15、TBCA、TBL1XR1、TBL2、TCF12、TCF4、TCF7L2、TEKT4P2、TENC1、TENM2、TEP1、TET1、TET3、TEX21P、TFCP2、TGFA、TGFB2、TGFB3、TGFBI、TGFBR1、TGFBRAP1、TGM2、THADA、THAP4、THBS2、THRB、TIAM1、TIMP2、TJAP1、TJP2、TLE3、TLK1、TMC3、TMEM67、TMEM102、TMEM119、TMEM134、TMEM154、TMEM189-UBE2V1、TMEM214、TMEM256-PLSCR3、TMEM47、TMEM50B、TMEM63A、TMX3、TNC、TNFAIP3、TNFAIP8L3、TNFRSF12A、TNFRSF14、TNIP1、TNKS1BP1、TNPO3、TNRC18P1、TNRC6A、TNS1、TNS3、TNXB、TOE1、TOMM40、TOMM5、TOPORS、TP53AIP1、TP53INP1、TPRG1、TRAF3、TRAK1、TRAPPC12、TRIB1、TRIM2、TRIM23、TRIM26、TRIM28、TRIM65、TRIM66、TRMT1L、TRPC4、TRPS1、TSC2、TSHZ1、TSHZ2、TSPAN11、TSPAN18、TSPAN2、TSPAN7、TSSK3、TTC7A、TTC7B、TUBB2C、TUBB3、TUBE1、TXNIP、TXNL1、TXNL4B、TXNRD1、TYW5、U2SURP、UBAP2L、UBE2D3、UBE2G2、UBE2L3、UBE2V1、UBN2、UBQLN4、UCHL5、UHMK1、UHRF1BP1L、UNC13B、UNC5B、URGCP、URGCP-MRPS24、USP19、USP7、USP27X、UVRAG、VANGL1、VARS2、VAV2、VCL、VDAC2、VIM-AS1、VIPAS39、VPS13A、VPS29、VPS41、VPS51、VSTM2L、VWA8、VWF、WDR19、WDR27、WDR37、WDR48、WDR90、WDR91、WHSC2、WIPF1、WISP1、WNK1、WNT5B、WNT10B、WSB1、WWTR1、XDH、XIAP、XRN2、YAP1、YDJC、YES1、YPEL5、YTHDF3、Z24749、ZAK、ZBTB10、ZBTB24、ZBTB26、ZBTB7A、ZC3H12C、ZC3H14、ZC3H18、ZCCHC5、ZCCHC8、ZCCHC11、ZEB1、ZEB2、ZFAND1、ZFAND5、ZFP82、ZHX3、ZMIZ1、ZMIZ1-AS1、ZMIZ2、ZMYM2、ZNF12、ZNF138、ZNF148、ZNF208、ZNF212、ZNF219、ZNF227、ZNF232、ZNF24、ZNF268、ZNF28、ZNF280D、ZNF281、ZNF335、ZNF350、ZNF37A、ZNF37BP、ZNF395、ZNF426、ZNF431、ZNF583、ZNF618、ZNF621、ZNF652、ZNF655、ZNF660、ZNF674、ZNF680、ZNF730、ZNF74、ZNF764、ZNF777、ZNF778、ZNF780A、ZNF7804A、ZNF79、ZNF827、ZNF836、ZNF837、ZNF839、ZNF91和ZSCAN25。
在前述的另一个具体方面,所述前体RNA转录物按5’至3’顺序包含:分支点、3’剪接位点和内含子REMS。在前述的另一个具体方面,所述前体RNA转录物按5’至3’顺序包含:第一5’剪接位点、第一分支点、第一3’剪接位点、内含子REMS、第二分支点和第二3’剪接位点。在前述的另一个具体方面,所述前体RNA转录物按5’至3’顺序包含:内含子REMS、分支点和3’剪接位点。
在前述的另一个具体方面,所述基因选自ABCA1、ABCA10、ABCB7、ABCB8、ABCC1、ABCC3、ABHD10、ABL2、ABLIM3、ACACA、ACADVL、ACAT2、ACTA2、ADAL、ADAM12、ADAM15、ADAM17、ADAM33、ADAMTS1、ADCY3、ADD1、ADGRG6、ADH6、ADHFE1、AFF2、AFF3、AGK、AGPAT3、AGPAT4、AGPS、AHCYL2、AHDC1、AHRR、AJUBA、AK021888、AK310472、AKAP1、AKAP3、AKAP9、AKNA、ALCAM、ALDH4A1、AMPD2、ANK1、ANK2、ANK3、ANKFY1、ANKHD1-EIF4EBP3、ANKRA2、ANKRD17、ANKRD33B、ANKRD36、ANKS6、ANP32A、ANXA11、ANXA6、AP2B1、AP4B1-AS1、APAF1、APIP、APLP2、APP、APPL2、APTX、ARHGAP1、ARHGAP12、ARHGAP22、ARHGEF16、ARID1A、ARID2、ARID5B、ARL9、ARL15、ARMCX3、ARMCX6、ASAP1、ASIC1、ASL、ASNS、ASPH、ATAD2B、ATF7IP、ATG5、ATG9A、ATMIN、ATP2A3、ATP2C1、ATXN1、ATXN3、AURKA、AXIN1、B3GALT2、B3GNT6、B4GALT2、BACE1、BAG2、BASP1、BC033281、BCAR3、BCL2L15、BCYRN1、BECN1、BEND6、BHMT2、BICD1、BIN1、BIN3-IT1、BIRC3、BIRC6、BNC1、BRD2、BRPF1、BSCL2、BTBD10、BTG2、BTN3A1、BZW1、C1orf86、C10orf54、C11orf30、C11orf70、C11orf73、C11orf94、C12orf4、C12orf56、C14orf132、C17orf76-AS1、C19orf47、C3、C4orf27、C5orf24、C6orf48、C7orf31、C8orf34、C8orf44、C8orf44-SGK3、C8orf88、C9orf69、CA13、CA3、CAB39、CACNA2D2、CACNB1、CADM1、CALU、CAMKK1、CAND2、CAPNS1、CASC3、CASP7、CASP8AP2、CAV1、CCAR1、CCDC77、CCDC79、CCDC88A、CCDC92、CCDC122、CCER2、CCNF、CCT6A、CD276、CD46、CDC25B、CDC40、CDC42BPA、CDCA7、CDH11、CDH13、CDK11B、CDK16、CDKAL1、CECR7、CELSR1、CEMIP、CENPI、CEP112、CEP170、CEP192、CEP68、CFH、CFLAR、CHD8、CHEK1、CIITA、CIZ1、CLDN23、CLIC1、CLK4、CLTA、CMAHP、CNGA4、CNOT1、CNRIP1、CNTD1、COG1、COL1A1、COL11A1、COL12A1、COL14A1、COL15A1、COL5A1、COL5A3、COL6A1、COL6A6、COL8A1、COLEC12、COMP、COPS7B、CPA4、CPEB2、CPQ、CPSF4、CREB5、CRISPLD2、CRLF1、CRLS1、CRTAP、CRYBG3、CRYL1、CSDE1、CSNK1A1、CSNK1E、CSNK1G1、CTDSP2、CTNND1、CUL2、CUL4A、CUX1、CYB5B、CYB5R2、CYBRD1、CYGB、CYP1B1、CYP51A1、DAB2、DACT1、DAGLB、DARS、DAXX、DCAF10、DCAF11、DCAF17、DCBLD2、DCLK1、DCN、DCUN1D4、DDAH1、DDAH2、DDHD2、DDIT4L、DDR1、DDX39B、DDX42、DDX50、DEGS1、DENND1A、DENND1B、DENND5A、DEPTOR、DFNB59、DGCR2、DGKA、DHCR24、DHCR7、DHFR、DHX9、DIAPH1、DIAPH3、DIRAS3、DIS3L、DKFZp434M1735、DKK3、DLC1、DLG5、DLGAP4、DNAH8、DNAJC13、DNAJC27、DNM2、DNMBP、DOCK1、DOCK11、DPP8、DSEL、DST、DSTN、DYNC1I1、DYRK1A、DZIP1L、EBF1、EEA1、EEF1A1、EFCAB14、EFEMP1、EGR1、EGR3、EHMT2、EIF2B3、EIF4G1、EIF4G2、EIF4G3、ELF2、ELN、ELP4、EMX2OS、ENAH、ENG、ENPP1、ENPP2、ENSA、EP300、EPN1、EPT1、ERC1、ERCC1、ERCC8、ERGIC3、ERLIN2、ERRFI1、ESM1、ETV5、EVC、EVC2、EXO1、EXTL2、EYA3、F2R、FADS1、FADS2、FAF1、FAIM、FAM111A、FAM126A、FAM13A、FAM160A1、FAM162A、FAM174A、FAM198B、FAM20A、FAM219A、FAM219B、FAM3C、FAM46B、FAM65A、FAM65B、FAP、FARP1、FBLN2、FBN2、FBXO9、FBXL6、FBXO10、FBXO18、FBXO31、FBXO34、FBXO9、FCHO1、FDFT1、FDPS、FER、FEZ1、FGD5-AS1、FGFR2、FGFRL1、FGL2、FHOD3、FLII、FLNB、FLT1、FN1、FNBP1、FOCAD、FOS、FOSB、FOSL1、FOXK1、FOXM1、FRAS1、FSCN2、FUS、FYN、GABPB1、GAL3ST4、GALC、GALNT1、GALNT15、GAS7、GATA6、GBA2、GBGT1、GCFC2、GCNT1、GDF6、GGACT、GGCT、GHDC、GIGYF2、GJC1、GLCE、GMIP、GNA13、GNAQ、GNAS、GNL3L、GOLGA2、GOLGA4、GOLGB1、GORASP1、GPR1、GPR183、GPR50、GPR89A、GPRC5A、GPRC5B、GPSM2、GREM1、GRK6、GRTP1、GSE1、GTF2H2B、GUCA1B、GULP1、GXYLT1、HAPLN1、HAPLN2、HAS2、HAS3、HAT1、HAUS3、HAUS6、HAVCR2、HDAC5、HDAC7、HDX、HECTD2-AS1、HEG1、HEPH、HEY1、HLA-A、HLA-E、HLTF、HMGA1、HMGA2、HMGB1、HMGCR、HMGN3-AS1、HMGCS1、HOOK3、HMOX1、HNMT、HNRNPR、HNRNPUL1、HP1BP3、HPS1、HRH1、HSD17B12、HSD17B4、HSPA1L、HTATIP2、HTT、IARS、IDH1、IDI1、IFT57、IGDCC4、IGF2BP2、IGF2R、IGFBP3、IL16、IL6ST、INA、INHBA、INPP5K、INSIG1、INTU、IQCE、IQCG、ITGA11、ITGA8、ITGAV、ITGB5、ITGB8、ITIH1、ITM2C、ITPKA、ITSN1、IVD、KANSL3、KAT6B、KCNK2、KCNS1、KCNS2、KDM6A、KDSR、KIAA1033、KIAA1143、KIAA1199、KIAA1456、KIAA1462、KIAA1522、KIAA1524、KIAA1549、KIAA1715、KIAA1755、KIF14、KIF2A、KIF3A、KIT、KLC1、KLC2、KLF17、KLF6、KLHL7、KLRG1、KMT2D、KRT7、KRT18、KRT19、KRT34、KRTAP1-1、KRTAP1-5、KRTAP2-3、L3MBTL2、LAMA2、LAMB1、LAMB2P1、LARP4、LARP7、LATS2、LDLR、LEMD3、LETM2、LGALS8、LGI2、LGR4、LHX9、LIMS1、LINC00341、LINC00472、LINC00570、LINC00578、LINC00607、LINC00657、LINC00678、LINC00702、LINC00886、LINC00961、LINC01011、LINC01118、LINC01204、LMAN2L、LMO7、LMOD1、LOC400927、LONP1、LOX、LRBA、LRCH4、LRIG1、LRP4、LRP8、LRRC32、LRRC39、LRRC42、LRRC8A、LSAMP、LSS、LTBR、LUC7L2、LUM、LYPD1、LYRM1、LZTS2、MADD、MAFB、MAGED4、MAGED4B、MAMDC2、MAN1A2、MAN2A1、MAN2C1、MAP4K4、MAPK13、MASP1、MB、MB21D2、MBD1、MBOAT7、MC4R、MCM10、MDM2、MED1、MED13L、MEDAG、MEF2D、MEGF6、MEIS2、MEMO1、MEPCE、MFGE8、MFN2、MIAT、MICAL2、MINPP1、MIR612、MKL1、MKLN1、MKNK2、MLLT4、MLLT10、MLST8、MMAB、MMP10、MMP24、MMS19、MMS22L、MN1、MOXD1、MPPE1、MPZL1、MRPL3、MRPL45、MRPL55、MRPS28、MRVI1、MSANTD3、MSC、MSH2、MSH4、MSH6、MSL3、MSMO1、MSRB3、MTAP、MTERF3、MTERFD1、MTHFD1L、MTMR9、MTRR、MUM1、MVD、MVK、MXRA5、MYADM、MYCBP2、MYLK、MYO1D、MYO9B、MYOF、NA、NAA35、NAALADL2、NADK、NAE1、NAGS、NASP、NAV1、NAV2、NCOA1、NCOA3、NCOA4、NCSTN、NDNF、NELFA、NEO1、NEURL1B、NF2、NFE2L1、NFX1、NGF、NGFR、NHLH1、NID1、NID2、NIPA1、NKX3-1、NLN、NOL10、NOMO3、NOTCH3、NOTUM、NOVA2、NOX4、NPEPPS、NRD1、NREP、NRG1、NRROS、NSUN4、NT5C2、NT5E、NTNG1、NUDT4、NUP153、NUP35、NUP50、NUPL1、NUSAP1、OCLN、ODF2、OLR1、OS9、OSBPL6、OSBPL10、OSMR、OXCT1、OXCT2、P4HA1、P4HB、PABPC1、PAIP2B、PAK4、PAPD4、PARD3、PARN、PARP14、PARP4、PARVB、PBLD、PCBP2、PCBP4、PCDHGB3、PCGF3、PCM1、PCMTD2、PCNXL2、PCSK9、PDE1C、PDE4A、PDE5A、PDE7A、PDGFD、PDGFRB、PDLIM7、PDS5B、PDXDC1、PEAR1、PEPD、PEX5、PFKP、PHACTR3、PHF19、PHF8、PHRF1、PHTF2、PI4K2A、PIEZO1、PIGN、PIGU、PIK3C2B、PIK3CD、PIK3R1、PIKFYVE、PIM2、PITPNA、PITPNB、PITPNM1、PITPNM3、PLAU、PLEC、PLEK2、PLEKHA1、PLEKHA6、PLEKHB2、PLEKHH2、PLSCR1、PLSCR3、PLXNB2、PLXNC1、PMS1、PNISR、PODN、POLE3、POLN、POLR1A、POLR3D、POMT2、POSTN、POU2F1、PPAPDC1A、PPARA、PPARG、PPHLN1、PPIP5K1、PPIP5K2、PPM1E、PPP1R12A、PPP1R26、PPP3CA、PPP6R1、PPP6R2、PRKACB、PRKCA、PRKDC、PRKG1、PRMT1、PRNP、PRPF31、PRPH2、PRRG4、PRSS23、PRUNE2、PSMA4、PSMC1、PSMD6、PSMD6-AS2、PTGIS、PTK2B、PTPN14、PTX3、PUF60、PUS7、PVR、PXK、PXN、QKI、RAB23、RAB2B、RAB30、RAB34、RAB38、RAB44、RAD1、RAD9B、RAD23B、RAF1、RALB、RAP1A、RAP1GDS1、RAPGEF1、RARG、RARS、RARS2、RASSF8、RBBP8、RBCK1、RBFOX2、RBKS、RBM10、RCC1、RDX、RERE、RFTN1、RFWD2、RFX3-AS1、RGCC、RGS10、RGS3、RIF1、RNF14、RNF19A、RNF38、RNFT1、ROR1、ROR2、RPA1、RPL10、RPS10、RPS6KB2、RPS6KC1、RRBP1、RWDD4、SAMD4A、SAMD9、SAMD9L、SAR1A、SART3、SCAF4、SCAF8、SCARNA9、SCD、SCLT1、SCO1、SDCBP、SEC14L1、SEC22A、SEC24A、SEC24B、SEC61A1、SENP6、SEPT9、SERGEF、SERPINE2、SF1、SGK3、SGOL2、SH3RF1、SH3YL1、SHROOM3、SIGLEC10、SKA2、SKIL、SLC12A2、SLC24A3、SLC25A17、SLC35F3、SLC39A3、SLC39A10、SLC4A4、SLC4A11、SLC41A1、SLC44A2、SLC46A2、SLC6A15、SLC7A6、SLC7A8、SLC7A11、SLC9A3、SLIT3、SMARCA4、SMARCC2、SMC4、SMC6、SMCHD1、SMG1、SMG1P3、SMN2、SMPD4、SMTN、SMYD3、SMYD5、SNAP23、SNED1、SNHG16、SNX7、SNX14、SOCS2、SON、SORBS2、SORCS2、SOS2、SOX7、SPATA18、SPATA20、SPATA5、SPATS2、SPDYA、SPEF2、SPG20、SPIDR、SPRED2、SPRYD7、SQLE、SQRDL、SQSTM1、SRCAP、SREBF1、SREK1、SRGAP1、SRRM1、SRSF3、STAC2、STARD4、STAT1、STAT3、STAT4、STAU1、STC2、STEAP2、STK32B、STRIP1、STRN3、STRN4、STS、STX16、STXBP6、SULF1、SUPT20H、SVEP1、SYNE1、SYNE2、SYNGR2、SYNPO、SYNPO2、SYNPO2L、SYT15、SYTL2、TACC1、TAF2、TAGLN3、TANC2、TANGO6、TARBP1、TARS、TASP1、TBC1D15、TBL2、TCF12、TCF4、TCF7L2、TENC1、TENM2、TEP1、TET3、TEX21P、TFCP2、TGFA、TGFB2、TGFB3、TGFBI、TGFBR1、TGFBRAP1、TGM2、THADA、THAP4、THBS2、THRB、TIAM1、TIMP2、TJP2、TLE3、TLK1、TMC3、TMEM102、TMEM119、TMEM134、TMEM154、TMEM189-UBE2V1、TMEM214、TMEM256-PLSCR3、TMEM47、TMEM50B、TMEM63A、TNC、TNFAIP3、TNFAIP8L3、TNFRSF12A、TNFRSF14、TNIP1、TNKS1BP1、TNPO3、TNRC18P1、TNRC6A、TNS1、TNS3、TNXB、TOE1、TOMM40、TOMM5、TOPORS、TP53AIP1、TP53INP1、TPRG1、TRAF3、TRAK1、TRAPPC12、TRIB1、TRIM2、TRIM23、TRIM26、TRIM28、TRIM65、TRIM66、TRMT1L、TRPC4、TRPS1、TSC2、TSHZ1、TSHZ2、TSPAN11、TSPAN18、TSPAN2、TSPAN7、TSSK3、TTC7A、TTC7B、TUBB2C、TUBB3、TUBE1、TXNIP、TXNL1、TXNRD1、TYW5、U2SURP、UBAP2L、UBE2G2、UBE2V1、UBQLN4、UCHL5、UHMK1、UHRF1BP1L、UNC5B、URGCP、USP19、USP7、USP27X、UVRAG、VANGL1、VARS2、VAV2、VCL、VIM-AS1、VIPAS39、VPS13A、VPS29、VPS41、VPS51、VSTM2L、VWA8、VWF、WDR19、WDR27、WDR37、WDR48、WDR91、WIPF1、WISP1、WNK1、WNT5B、WNT10B、WSB1、WWTR1、XIAP、XRN2、YAP1、YDJC、YES1、YPEL5、YTHDF3、Z24749、ZAK、ZBTB10、ZBTB24、ZBTB26、ZBTB7A、ZC3H12C、ZC3H14、ZC3H18、ZCCHC5、ZCCHC8、ZCCHC11、ZEB1、ZEB2、ZFAND1、ZFAND5、ZFP82、ZHX3、ZMIZ1、ZMIZ1-AS1、ZMYM2、ZNF12、ZNF138、ZNF148、ZNF212、ZNF219、ZNF227、ZNF232、ZNF24、ZNF268、ZNF28、ZNF281、ZNF335、ZNF350、ZNF37A、ZNF37BP、ZNF395、ZNF431、ZNF583、ZNF621、ZNF652、ZNF655、ZNF660、ZNF674、ZNF680、ZNF74、ZNF764、ZNF778、ZNF780A、ZNF79、ZNF827、ZNF837、ZNF839和ZNF91。
在前述的另一个具体方面,所述基因选自ABCA1、ABCB7、ABCC1、ABHD10、ABL2、ABLIM3、ACACA、ACADVL、ACAT2、ADAM12、ADAM15、ADAM17、ADAM33、AFF2、AGK、AGPAT3、AGPS、AHCYL2、AHDC1、AHRR、AJUBA、AK021888、AK310472、AKAP1、AKAP9、AKNA、ALCAM、ALDH4A1、AMPD2、ANK2、ANKFY1、ANKHD1-EIF4EBP3、ANKRD17、ANKS6、ANP32A、ANXA11、ANXA6、AP2B1、APAF1、APLP2、APP、APPL2、APTX、ARHGAP22、ARID1A、ARID2、ARMCX3、ASAP1、ASL、ASNS、ASPH、ATAD2B、ATF7IP、ATG9A、ATMIN、ATP2C1、ATXN3、AURKA、AXIN1、B4GALT2、BACE1、BAG2、BASP1、BC033281、BCAR3、BEND6、BICD1、BIN1、BNC1、BRD2、BRPF1、BSCL2、BTBD10、BZW1、C11orf30、C11orf73、C17orf76-AS1、C4orf27、C5orf24、C6orf48、C9orf69、CAB39、CALU、CAMKK1、CAPNS1、CASC3、CASP8AP2、CAV1、CCAR1、CCDC77、CCDC88A、CCDC92、CCT6A、CD276、CD46、CDC25B、CDC40、CDC42BPA、CDCA7、CDH11、CDH13、CDK11B、CDK16、CDKAL1、CEP68、CFLAR、CHD8、CIZ1、CLIC1、CLK4、CNOT1、COG1、COL12A1、COL1A1、COL6A1、COPS7B、CPEB2、CREB5、CRLS1、CRTAP、CSDE1、CSNK1A1、CTDSP2、CTNND1、CUL2、CUL4A、CUX1、CYB5B、CYBRD1、CYP51A1、DAB2、DACT1、DARS、DAXX、DCAF10、DCAF11、DCBLD2、DCUN1D4、DDAH1、DDAH2、DDHD2、DDR1、DDX39B、DDX42、DENND1A、DENND1B、DENND5A、DGCR2、DGKA、DHCR24、DHCR7、DHFR、DHX9、DIAPH1、DIAPH3、DIS3L、DKFZp434M1735、DKK3、DLC1、DNM2、DOCK1、DPP8、DSEL、DST、DSTN、EBF1、EEA1、EEF1A1、EFCAB14、EGR1、EHMT2、EIF2B3、EIF4G1、EIF4G2、EIF4G3、ELF2、ENG、ENPP2、ENSA、EPN1、EPT1、ERC1、ERGIC3、ETV5、EXO1、EXTL2、EYA3、FADS1、FADS2、FAF1、FAM111A、FAM198B、FAM219A、FAM219B、FAM3C、FAM65A、FBXO10、FBXO18、FBXO31、FBXO34、FBXO9、FDFT1、FDPS、FER、FEZ1、FGD5-AS1、FGFRL1、FHOD3、FLII、FLNB、FN1、FNBP1、FOCAD、FOS、FOSB、FOSL1、FOXK1、FOXM1、FUS、FYN、GABPB1、GALC、GALNT1、GAS7、GBA2、GCFC2、GGCT、GHDC、GIGYF2、GJC1、GMIP、GNA13、GNAS、GNL3L、GOLGA2、GOLGA4、GOLGB1、GORASP1、GPR1、GPR89A、GPSM2、GREM1、GRK6、GSE1、GTF2H2B、HAS2、HAT1、HAUS3、HAUS6、HDAC7、HEG1、HLA-A、HLA-E、HLTF、HMGA1、HMGB1、HMGCR、HMGCS1、HMOX1、HNRNPR、HNRNPUL1、HP1BP3、HRH1、HSD17B12、HSD17B4、HTT、IARS、IDH1、IDI1、IGF2BP2、IL6ST、INHBA、INSIG1、IQCE、ITGAV、ITGB5、ITM2C、ITSN1、KANSL3、KCNK2、KIAA1033、KIAA1143、KIAA1199、KIAA1522、KIAA1524、KIAA1549、KIAA1715、KIF14、KIF2A、KIF3A、KLC1、KLC2、KLF6、KLHL7、KRT18、KRT19、KRT34、KRTAP2-3、LAMA2、LAMB1、LARP4、LARP7、LATS2、LDLR、LEMD3、LGALS8、LIMS1、LINC00341、LINC00657、LMAN2L、LMO7、LONP1、LOX、LRCH4、LRIG1、LRP8、LRRC8A、LSS、LTBR、LUC7L2、LZTS2、MADD、MAGED4、MAGED4B、MAN1A2、MAP4K4、MBD1、MBOAT7、MDM2、MED1、MEDAG、MEF2D、MEIS2、MEMO1、MEPCE、MFGE8、MICAL2、MINPP1、MKL1、MKLN1、MKNK2、MLLT4、MLST8、MMAB、MMS19、MMS22L、MPPE1、MPZL1、MRPL3、MSANTD3、MSC、MSH2、MSH6、MSL3、MSMO1、MSRB3、MTAP、MTERFD1、MTHFD1L、MTMR9、MTRR、MUM1、MVD、MVK、MYADM、MYLK、MYO1D、MYO9B、MYOF、NAA35、NADK、NASP、NAV1、NAV2、NCOA1、NCOA3、NCOA4、NCSTN、NELFA、NEO1、NEURL1B、NF2、NFE2L1、NFX1、NID1、NID2、NIPA1、NKX3-1、NOL10、NOMO3、NPEPPS、NRD1、NREP、NRG1、NSUN4、NT5C2、NT5E、NTNG1、NUDT4、NUP153、NUP35、NUP50、NUPL1、NUSAP1、ODF2、OS9、OSBPL6、OSMR、P4HA1、P4HB、PABPC1、PAK4、PAPD4、PARD3、PARN、PARP14、PARP4、PARVB、PCBP2、PCBP4、PCDHGB3、PCGF3、PCM1、PCMTD2、PCNXL2、PCSK9、PDE4A、PDE7A、PDLIM7、PDXDC1、PEPD、PEX5、PFKP、PHF19、PHF8、PHRF1、PHTF2、PI4K2A、PIEZO1、PIGU、PIK3C2B、PITPNA、PITPNB、PITPNM1、PLAU、PLEC、PLEKHB2、PLSCR3、PLXNB2、PLXNC1、PMS1、POLE3、POLR3D、POSTN、POU2F1、PPAPDC1A、PPARA、PPHLN1、PPIP5K1、PPP1R12A、PPP6R1、PPP6R2、PRKACB、PRKDC、PRMT1、PRNP、PRSS23、PSMA4、PSMC1、PSMD6、PTK2B、PTPN14、PUF60、PUS7、PVR、PXN、QKI、RAB23、RAB2B、RAB34、RAD1、RAD23B、RALB、RAP1A、RAP1GDS1、RARG、RASSF8、RBCK1、RBFOX2、RBM10、RCC1、RFTN1、RFWD2、RGS10、RGS3、RIF1、RNF14、RNF19A、RNF38、RNFT1、RPL10、RPS6KC1、RRBP1、RWDD4、SAMD9、SAMD9L、SAR1A、SART3、SCAF4、SCAF8、SCD、SCLT1、SCO1、SDCBP、SEC14L1、SEC22A、SEC24B、SEC61A1、SEPT9、SERPINE2、SF1、SGOL2、SH3RF1、SKIL、SLC25A17、SLC39A3、SLC41A1、SLC4A4、SLC7A6、SLC7A8、SMARCA4、SMARCC2、SMC4、SMC6、SMCHD1、SMG1、SMN2、SMPD4、SMYD3、SMYD5、SNAP23、SNHG16、SNX14、SOCS2、SON、SOS2、SPATA20、SPATS2、SPG20、SPRED2、SQLE、SQRDL、SQSTM1、SRCAP、SREBF1、SREK1、SRSF3、STARD4、STAT1、STAT3、STAU1、STC2、STEAP2、STRIP1、STRN3、STX16、SUPT20H、SYNE1、SYNE2、SYT15、SYTL2、TACC1、TAF2、TANC2、TARBP1、TARS、TBC1D15、TBL2、TCF7L2、TENC1、TENM2、TEP1、TET3、TFCP2、TGFBI、TGFBR1、TGFBRAP1、THADA、THAP4、THRB、TIMP2、TJP2、TLE3、TLK1、TMEM154、TMEM47、TMEM63A、TNC、TNFAIP3、TNFRSF12A、TNIP1、TNKS1BP1、TNPO3、TNS1、TNS3、TOE1、TOMM40、TOMM5、TOPORS、TP53INP1、TRAF3、TRAK1、TRAPPC12、TRIB1、TRIM2、TRIM23、TRIM26、TRIM28、TRIM65、TRMT1L、TRPS1、TSC2、TSHZ1、TSPAN2、TTC7A、TUBB2C、TUBB3、TXNL1、TXNRD1、U2SURP、UBAP2L、UBE2G2、UBE2V1、UBQLN4、UCHL5、UHMK1、UHRF1BP1L、UNC5B、USP19、USP7、VANGL1、VARS2、VCL、VIPAS39、VPS13A、VPS29、VPS51、VWA8、WDR19、WDR37、WDR48、WIPF1、WNT5B、WSB1、WWTR1、XIAP、XRN2、YAP1、YES1、YPEL5、YTHDF3、Z24749、ZAK、ZBTB10、ZBTB24、ZBTB7A、ZC3H12C、ZC3H14、ZC3H18、ZCCHC11、ZEB1、ZEB2、ZFAND1、ZFAND5、ZHX3、ZMIZ1、ZMYM2、ZNF12、ZNF148、ZNF219、ZNF227、ZNF24、ZNF268、ZNF28、ZNF281、ZNF335、ZNF37A、ZNF37BP、ZNF395、ZNF583、ZNF621、ZNF652、ZNF655、ZNF674、ZNF74、ZNF764、ZNF778、ZNF780A、ZNF827、ZNF839和ZNF91。
在前述的另一个具体方面,所述基因选自ABCB8、ANKRD36、APLP2、ARHGAP12、ARMCX6、ASAP1、ATG5、AXIN1、BIRC6、C1orf86、CDC42BPA、CLTA、DYRK1A、ERGIC3、FBXL6、FOXM1、GGCT、KAT6B、KDM6A、KIF3A、KMT2D、LARP7、LYRM1、MADD、MAN2C1、MRPL55、MYCBP2、MYO9B、PNISR、RAP1A、RAPGEF1、SENP6、SH3YL1、SLC25A17、SMN2、SREK1、STRN3、TAF2、TMEM134、VPS29、ZFAND1和ZNF431.
在前述的另一个具体方面,所述基因选自ABCB8、ANKRD36、ARHGAP12、ARMCX6、ATG5、BIRC6、C1orf86、CLTA、DYRK1A、FBXL6、KAT6B、KDM6A、KMT2D、LYRM1、MAN2C1、MRPL55、MYCBP2、PNISR、RAPGEF1、SENP6、SH3YL1、TMEM134和ZNF431。
在前述的另一个具体方面,所述基因选自ABCA10、ABCC1、ACTA2、ADAL、ADAM12、ADAMTS1、ADAMTS5、ADD1、ADGRG6、ADH6、ADHFE1、AFF2、AFF3、AGK、AGPS、AKAP3、ANK1、ANK2、ANK3、ANKRD33B、ANXA11、ANXA6、AP4B1-AS1、ARHGEF16、ARID5B、ARL9、ARMCX3、ASAP1、ASIC1、ATP2A3、B3GALT2、B3GNT6、BCL2L15、BCYRN1、BIN3-IT1、BIRC3、BTG2、C10orf54、C11orf70、C11orf73、C11orf94、C12orf56、C19orf47、C3、C4orf27、C7orf31、C8orf34、CA13、CA3、CACNA2D2、CACNB1、CADM1、CAND2、CCDC79、CCER2、CCNF、CDCA7、CDKAL1、CELSR1、CEMIP、CEP170、CFH、CIITA、CLDN23、CMAHP、CNGA4、CNTD1、COL11A1、COL12A1、COL14A1、COL15A1、COL5A1、COL5A3、COL6A6、COL8A1、COLEC12、COMP、CPA4、CPQ、CRISPLD2、CRLF1、CRYL1、CUX1、CYB5B、CYB5R2、CYGB、CYP1B1、DCLK1、DCN、DDIT4L、DDX42、DDX50、DEGS1、DENND1A、DENND5A、DEPTOR、DFNB59、DGKA、DHFR、DIAPH3、DIRAS3、DIS3L、DLG5、DNAH8、DNAJC27、DOCK1、DOCK11、DYNC1I1、DZIP1L、EBF1、EFEMP1、EGR3、EIF2B3、ELN、ELP4、EMX2OS、ENPP1、ERCC8、ESM1、EVC2、F2R、FAM160A1、FAM198B、FAM20A、FAM46B、FAM65B、FAP、FARP1、FBLN2、FBN2、FBXO9、FCHO1、FER、FGFR2、FGL2、FLT1、FRAS1、FSCN2、GAL3ST4、GALC、GALNT15、GATA6、GBGT1、GCNT1、GDF6、GNAQ、GOLGB1、GPR183、GPR50、GPRC5A、GPRC5B、GRTP1、GUCA1B、GXYLT1、HAPLN1、HAPLN2、HAS3、HAVCR2、HDAC5、HECTD2-AS1、HEPH、HEY1、HLTF、HMGN3-AS1、HMOX1、HOOK3、HSD17B12、HSPA1L、HTATIP2、HTT、IGDCC4、IGF2R、IGFBP3、IL16、INA、INTU、IQCG、ITGA11、ITGA8、ITGB8、ITIH1、ITPKA、KCNS1、KCNS2、KDM6A、KDSR、KIAA1456、KIAA1462、KIAA1524、KIAA1715、KIAA1755、KIT、KLF17、KLRG1、KRT7、KRTAP1-1、KRTAP1-5、L3MBTL2、LAMB2P1、LGI2、LGR4、LHX9、LINC00472、LINC00570、LINC00578、LINC00607、LINC00678、LINC00702、LINC00886、LINC00961、LINC01011、LINC01118、LINC01204、LMOD1、LRBA、LRP4、LRRC32、LRRC39、LSAMP、LUM、LYPD1、LYRM1、MAFB、MAMDC2、MAN1A2、MAN2A1、MAPK13、MASP1、MB、MC4R、MEDAG、MEGF6、MEMO1、MIAT、MIR612、MLLT10、MMP10、MMP24、MMS19、MN1、MOXD1、MRVI1、MSH4、MTERF3、MXRA5、MYO1D、NA、NAALADL2、NAE1、NAGS、NDNF、NEURL1B、NGFR、NHLH1、NLN、NOTCH3、NOTUM、NOVA2、NOX4、NRROS、NTNG1、OCLN、OLR1、OSBPL10、OXCT2、PAIP2B、PAPD4、PBLD、PCM1、PDE1C、PDE5A、PDGFD、PDGFRB、PDS5B、PDXDC1、PEAR1、PEPD、PHACTR3、PI4K2B、PIK3R1、PIM2、PITPNB、PITPNM3、PLAU、PLEK2、PLEKHA6、PLEKHH2、PLXNC1、PMS1、PODN、POLN、POLR1A、POSTN、PPM1E、PPP3CA、PRKCA、PRKDC、PRKG1、PRPH2、PRRG4、PRUNE2、PSMD6-AS2、PTGIS、PTX3、RAB30、RAB38、RAB44、RAD9B、RARS、RBBP8、RBKS、RCC1、RDX、RFWD2、RFX3-AS1、RGCC、RNFT1、ROR1、ROR2、RWDD4、SCARNA9、SCO1、SEC22A、SHROOM3、SIGLEC10、SLC24A3、SLC35F3、SLC39A10、SLC46A2、SLC4A11、SLC6A15、SLC7A11、SLC9A3、SLIT3、SMG1P3、SMTN、SMYD3、SNED1、SORBS2、SORCS2、SOX7、SPDYA、SPEF2、SQRDL、STAC2、STAT1、STAT4、STEAP2、STK32B、STRN4、STS、STXBP6、SULF1、SVEP1、SYNGR2、SYNPO、SYNPO2、SYNPO2L、TAGLN3、TANGO6、TARBP1、TEX21P、TGFA、TGFB2、TGFB3、TGM2、THADA、THBS2、THRB、TMEM102、TMEM119、TMEM256-PLSCR3、TMEM50B、TNC、TNFAIP8L3、TNFRSF14、TNRC18P1、TNS3、TNXB、TP53AIP1、TPRG1、TRAF3、TRIM66、TRPC4、TSHZ2、TSPAN11、TSPAN18、TSPAN7、TSSK3、TXNIP、UNC5B、USP27X、UVRAG、VIM-AS1、VPS41、VSTM2L、VWA8、VWF、WDR91、WISP1、WNT10B、XRN2、YDJC、ZBTB26、ZCCHC5、ZFP82、ZMIZ1-AS1、ZNF212、ZNF350、ZNF660、ZNF79和ZNF837。
在前述的另一个具体方面,所述基因选自ABCA10、ACTA2、ADAL、ADAMTS1、ADAMTS5、ADD1、ADGRG6、ADH6、ADHFE1、AFF3、AKAP3、ANK1、ANK3、ANKRD33B、AP4B1-AS1、ARHGEF16、ARID5B、ARL9、ASIC1、ATP2A3、B3GALT2、B3GNT6、BCL2L15、BCYRN1、BIN3-IT1、BIRC3、BTG2、C10orf54、C11orf70、C11orf94、C12orf56、C19orf47、C3、C7orf31、C8orf34、CA13、CA3、CACNA2D2、CACNB1、CADM1、CAND2、CCDC79、CCER2、CCNF、CELSR1、CEMIP、CEP170、CFH、CIITA、CLDN23、CMAHP、CNGA4、CNTD1、COL11A1、COL14A1、COL15A1、COL5A1、COL5A3、COL6A6、COL8A1、COLEC12、COMP、CPA4、CPQ、CRISPLD2、CRLF1、CRYL1、CYB5R2、CYGB、CYP1B1、DCLK1、DCN、DDIT4L、DDX50、DEGS1、DEPTOR、DFNB59、DIRAS3、DLG5、DNAH8、DNAJC27、DOCK11、DYNC1I1、DZIP1L、EFEMP1、EGR3、ELN、ELP4、EMX2OS、ENPP1、ERCC8、ESM1、EVC2、F2R、FAM160A1、FAM20A、FAM46B、FAM65B、FAP、FARP1、FBLN2、FBN2、FBXO9、FCHO1、FGFR2、FGL2、FLT1、FRAS1、FSCN2、GAL3ST4、GALNT15、GATA6、GBGT1、GCNT1、GDF6、GNAQ、GPR183、GPR50、GPRC5A、GPRC5B、GRTP1、GUCA1B、GXYLT1、HAPLN1、HAPLN2、HAS3、HAVCR2、HDAC5、HECTD2-AS1、HEPH、HEY1、HMGN3-AS1、HOOK3、HSPA1L、HTATIP2、IGDCC4、IGF2R、IGFBP3、IL16、INA、INTU、IQCG、ITGA11、ITGA8、ITGB8、ITIH1、ITPKA、KCNS1、KCNS2、KDM6A、KDSR、KIAA1456、KIAA1462、KIAA1755、KIT、KLF17、KLRG1、KRT7、KRTAP1-1、KRTAP1-5、L3MBTL2、LAMB2P1、LGI2、LGR4、LHX9、LINC00472、LINC00570、LINC00578、LINC00607、LINC00678、LINC00702、LINC00886、LINC00961、LINC01011、LINC01118、LINC01204、LMOD1、LRBA、LRP4、LRRC32、LRRC39、LSAMP、LUM、LYPD1、MAFB、MAMDC2、MAN2A1、MAPK13、MASP1、MB、MC4R、MEGF6、MIAT、MIR612、MLLT10、MMP10、MMP24、MN1、MOXD1、MRVI1、MSH4、MTERF3、MXRA5、NA、NAALADL2、NAE1、NAGS、NDNF、NGFR、NHLH1、NLN、NOTCH3、NOTUM、NOVA2、NOX4、NRROS、OCLN、OLR1、OSBPL10、OXCT2、PAIP2B、PBLD、PDE1C、PDE5A、PDGFD、PDGFRB、PDS5B、PEAR1、PHACTR3、PI4K2B、PIK3R1、PIM2、PITPNM3、PLEK2、PLEKHA6、PLEKHH2、PODN、POLN、POLR1A、PPM1E、PPP3CA、PRKCA、PRKG1、PRPH2、PRRG4、PRUNE2、PSMD6-AS2、PTGIS、PTX3、RAB30、RAB38、RAB44、RAD9B、RARS、RBBP8、RBKS、RDX、RFX3-AS1、RGCC、ROR1、ROR2、SCARNA9、SHROOM3、SIGLEC10、SLC24A3、SLC35F3、SLC39A10、SLC46A2、SLC4A11、SLC6A15、SLC7A11、SLC9A3、SLIT3、SMG1P3、SMTN、SNED1、SORBS2、SORCS2、SOX7、SPDYA、SPEF2、STAC2、STAT4、STK32B、STRN4、STS、STXBP6、SULF1、SVEP1、SYNGR2、SYNPO、SYNPO2、SYNPO2L、TAGLN3、TANGO6、TEX21P、TGFA、TGFB2、TGFB3、TGM2、THBS2、TMEM102、TMEM119、TMEM256-PLSCR3、TMEM50B、TNFAIP8L3、TNFRSF14、TNRC18P1、TNXB、TP53AIP1、TPRG1、TRIM66、TRPC4、TSHZ2、TSPAN11、TSPAN18、TSPAN7、TSSK3、TXNIP、USP27X、UVRAG、VIM-AS1、VPS41、VSTM2L、VWF、WDR91、WISP1、WNT10B、YDJC、ZBTB26、ZCCHC5、ZFP82、ZMIZ1-AS1、ZNF212、ZNF350、ZNF660、ZNF79和ZNF837。
在前述的另一个具体方面,所述基因选自ABCB8、ABCC3、ADAM17、ADCY3、AGPAT4、ANKRA2、ANXA11、APIP、APLP2、ARHGAP1、ARL15、ASAP1、ASPH、ATAD2B、ATXN1、AXIN1、BECN1、BHMT2、BICD1、BTN3A1、C11orf30、C11orf73、C12orf4、C14orf132、C8orf44、C8orf44-SGK3、C8orf88、CASC3、CASP7、CCDC122、CDH13、CECR7、CENPI、CEP112、CEP192、CHEK1、CMAHP、CNRIP1、COPS7B、CPSF4、CRISPLD2、CRYBG3、CSNK1E、CSNK1G1、DAGLB、DCAF17、DCUN1D4、DDX42、DENND1A、DENND5A、DGKA、DHFR、DIAPH3、DLGAP4、DNAJC13、DNMBP、DOCK1、DYRK1A、EIF2B3、ENAH、ENOX1、EP300、ERC1、ERCC1、ERGIC3、ERLIN2、ERRFI1、EVC、FAF1、FAIM、FAM126A、FAM13A、FAM162A、FAM174A、FAM198B、FBN2、FER、FHOD3、FOCAD、GALC、GCFC2、GGACT、GGCT、GLCE、GOLGA4、GOLGB1、GPSM2、GULP1、GXYLT1、HAT1、HDX、HLTF、HMGA2、HNMT、HPS1、HSD17B12、HSD17B4、HTT、IFT57、INPP5K、IVD、KDM6A、KIAA1524、KIAA1715、LETM2、LOC400927、LRRC42、LUC7L3、LYRM1、MADD、MB21D2、MCM10、MED13L、MEDAG、MEMO1、MFN2、MMS19、MRPL45、MRPS28、MTERF3、MYCBP2、MYLK、MYOF、NGF、NREP、NSUN4、NT5C2、OSMR、OXCT1、PAPD4、PCM1、PDE7A、PDS5B、PDXDC1、PIGN、PIK3CD、PIK3R1、PIKFYVE、PITPNB、PLEKHA1、PLSCR1、PMS1、POMT2、PPARG、PPHLN1、PPIP5K2、PPP1R26、PRPF31、PRSS23、PRUNE2、PSMA4、PXK、RAF1、RAP1A、RAPGEF1、RARS2、RBKS、RERE、RFWD2、RNFT1、RPA1、RPS10、RPS6KB2、SAMD4A、SAR1A、SCO1、SEC24A、SENP6、SERGEF、SGK3、SH3YL1、SKA2、SLC12A2、SLC25A17、SLC44A2、SMYD3、SNAP23、SNHG16、SNX7、SOS2、SPATA18、SPATA5、SPIDR、SPRYD7、SRGAP1、SRRM1、STAT1、STRN3、STXBP6、SUPT20H、TAF2、TASP1、TBC1D15、TCF12、TCF4、TIAM1、TJP2、TMC3、TMEM189-UBE2V1、TMEM214、TNRC6A、TNS3、TOE1、TRAF3、TRIM65、TSPAN2、TTC7B、TUBE1、TYW5、UBAP2L、UBE2V1、URGCP、VAV2、VPS29、WDR27、WDR37、WDR91、WNK1、XRN2、ZCCHC8、ZFP82、ZNF138、ZNF232、ZNF37BP和ZNF680。
在前述的另一个具体方面,所述基因选自ABCB8、ABCC3、ADCY3、AGPAT4、ANKRA2、APIP、ARHGAP1、ARL15、ATXN1、BECN1、BHMT2、BTN3A1、C12orf4、C14orf132、C8orf44、C8orf44-SGK3、C8orf88、CASP7、CCDC122、CECR7、CENPI、CEP112、CEP192、CHEK1、CMAHP、CNRIP1、CPSF4、CRISPLD2、CRYBG3、CSNK1E、CSNK1G1、DAGLB、DCAF17、DLGAP4、DNAJC13、DNMBP、DYRK1A、ENAH、EP300、ERCC1、ERLIN2、ERRFI1、EVC、FAIM、FAM126A、FAM13A、FAM162A、FAM174A、FBN2、GGACT、GLCE、GULP1、GXYLT1、HDX、HMGA2、HNMT、HPS1、IFT57、INPP5K、IVD、KDM6A、LETM2、LOC400927、LRRC42、LYRM1、MB21D2、MCM10、MED13L、MFN2、MRPL45、MRPS28、MTERF3、MYCBP2、NGF、OXCT1、PDS5B、PIGN、PIK3CD、PIK3R1、PIKFYVE、PLEKHA1、PLSCR1、POMT2、PPARG、PPIP5K2、PPP1R26、PRPF31、PRUNE2、PXK、RAF1、RAPGEF1、RARS2、RBKS、RERE、RPA1、RPS10、RPS6KB2、SAMD4A、SEC24A、SENP6、SERGEF、SGK3、SH3YL1、SKA2、SLC12A2、SLC44A2、SNX7、SPATA18、SPATA5、SPIDR、SPRYD7、SRGAP1、SRRM1、STXBP6、TASP1、TCF12、TCF4、TIAM1、TMC3、TMEM189-UBE2V1、TMEM214、TNRC6A、TTC7B、TUBE1、TYW5、URGCP、VAV2、WDR27、WDR91、WNK1、ZCCHC8、ZFP82、ZNF138、ZNF232和ZNF680。
在前述的另一个具体方面,所述基因选自ABHD10、ADAL、ADAM17、ADAM23、ADAMTS19、AGPAT4、AGPS、AKAP8L、AKT1、ANKRD13C、ANXA11、APIP、APPL2、ARHGAP1、ARHGAP5、ARL15、ARL5B、ARSJ、ASAP1、ATF6、BECN1、BHMT2、BIN3、BNC2、BTBD10、C1QTNF9B-AS1、C1orf27、C11orf30、C11orf73、C11orf76、C12orf4、C2orf47、CACNB1、CACNB4、CADM2、CCNL2、CDH18、CENPI、CEP162、CEP170、CEP192、CEP57、CHEK1、CHRM2、CMAHP、CMSS1、CNOT7、CNRIP1、CNTN1、COPS7B、CRISPLD2、CRYBG3、CUX1、DAAM1、DCAF17、DCUN1D4、DDX42、DENND1A、DENND4A、DENND5A、DET1、DGK1、DHFR、DIAPH3、DLG5、DMXL1、DNAJA4、DNMBP、DYRK1A、DZIP1L、ELMO2、ENAH、ENOX1、EP300、ERC1、ERC2、EVC、EXOC3、EXOC6B、FAM162A、FAM174A、FAM195B、FAM208B、FAM49B、FAM69B、FBN2、FBXL16、FBXO9、FGD4、FHOD3、GALC、GBP1、GLCE、GNG12、GOLGB1、GTSF1、GXYLT1、HDAC5、HDX、HMGXB4、HOXB3、HSD17B4、HTT、IFT57、IKBKAP、INO80、IPP4B、INVS、ITCH、IVD、KDM6A、KDSR、KIAA1524、KIAA1715、KIDINS220、KIF21A、L3MBTL2、LGALS3、LINCR-0002、LINGO2、LOC400927、LPHN1、LRRC1、LRRC42、LYRM1、MACROD2、MANEA、MAPK10、MARCH7、MARCH8、MDN1、MEAF6、MEMO1、MFN2、MLLT10、MMS19、MORF4L1、MRPL39、MRPL45、MRPS28、MTMR3、MYB、MYCBP2、MYLK、NEDD4、NFASC、NGF、NIPA1、NLGN1、NLN、NREP、NSUN4、NUPL1、OSBPL3、PAPD4、PBX3、PCDH10、PDE3A、PDE7A、PDXDC1、PDXDC2P、PELI1、PIGN、PITPNB、PMS1、PNISR、POMT2、PPARG、PPFIBP1、PRPF31、PSMA4、PXK、RAB23、RAF1、RAPGEF1、RASIP1、RBBP8、RCOR3、RERE、RGL1、RNF130、RNF144A、RNF213、RPF2、RPS10、SAMD4A、SCO1、SENP6、SF3B3、SGIP1、SGMS1、SGPL1、SH2B3、SKP1、SLC12A2、SLC25A16、SLC25A17、SMOX、SNAP23、SNX24、SNX7、SOCS6、SOGA2、SORCS1、SPIDR、SPRYD7、SREK1、SSBP1、STRAD8、STXBP4、STXBP6、SUPT20H、TAF2、TARBP1、TASP1、TBCA、TBL1XR1、TCF4、TEKT4P2、TET1、TIAM1、TJAP1、TJP2、TMEM214、TMX3、TNRC6A、TRAF3、TRIM65、TSPAN7、TXNL4B、UBE2D3、UBE2L3、UBN2、UNC13B、URGCP-MRPS24、UVRAG、VDAC2、WDR27、WDR90、WHSC2、WNK1、XRN2、ZFP82、ZMIZ2、ZNF138、ZNF208、ZNF212、ZNF280D、ZNF350、ZNF37BP、ZNF426、ZNF618、ZNF680、ZNF730、ZNF777、ZNF7804A、ZNF836和ZSCAN25。
在前述的另一个具体方面,所述基因选自APOA2、ASAP1、BRCA1、BRCA2、CDKN1C、CRX、CTRC、DENND5A、DIAPH3、DMD、DNAH11、EIF2B3、GALC、HPS1、HTT、IKBKAP、KIAA1524、LMNA、MECP2、PAPD4、PAX6、PCCB、PITPNB、PTCH1、SLC34A3、SMN2、SPINK5、SREK1、TMEM67、VWF、XDH和XRN2。
在前述的另一个具体方面,所述基因选自ABCA1、ABCA10、ABCB7、ABCB8、ABCC1、ABCC3、ABL2、ABLIM3、ACACA、ACADVL、ACAT2、ACTA2、ADAL、ADAM15、ADAM17、ADAM23、ADAM33、ADAMTS1、ADAMTS19、ADCY3、ADD1、ADGRG6、ADH6、ADHFE1、AFF2、AFF3、AGK、AGPAT3、AGPAT4、AGPS、AHCYL2、AHDC1、AHRR、AJUBA、AK021888、AK310472、AKAP1、AKAP3、AKAP8L、AKAP9、AKNA、ALCAM、ALDH4A1、AMPD2、ANK1、ANK2、ANK3、ANKFY1、ANKHD1-EIF4EBP3、ANKRA2、ANKRD13C、ANKRD17、ANKRD33B、ANKRD36、ANKS6、ANP32A、ANXA6、AP2B1、AP4B1-AS1、APAF1、APIP、APOA2、APP、APTX、ARHGAP1、ARHGAP12、ARHGAP22、ARHGAP5、ARHGEF16、ARID1A、ARID2、ARID5B、ARL9、ARL15、ARL5B、ARMCX3、ARSJ、ASAP1、ASIC1、ASL、ASNS、ASPH、ATAD2B、ATF6、ATF7IP、ATG9A、ATMIN、ATP2A3、ATP2C1、ATXN1、ATXN3、AURKA、B3GALT2、B3GNT6、B4GALT2、BACE1、BAG2、BASP1、BC033281、BCAR3、BCL2L15、BCYRN1、BECN1、BEND6、BHMT2、BICD1、BIN1、BIN3、BIN3-IT1、BIRC3、BIRC6、BNC1、BNC2、BRCA1、BRCA2、BRD2、BRPF1、BSCL2、BTBD10、BTG2、BTN3A1、BZW1、C1QTNF9B-AS1、C1orf27、C1orf86、C10orf54、C11orf30、C11orf70、C11orf73、C11orf76、C11orf94、C12orf4、C12orf56、C14orf132、C17orf76-AS1、C19orf47、C2orf47、C3、C4orf27、C5orf24、C6orf48、C7orf31、C8orf34、C8orf44、C8orf44-SGK3、C8orf88、C9orf69、CA13、CA3、CAB39、CACNA2D2、CACNB1、CACNB4、CADM1、CADM2、CALU、CAMKK1、CAND2、CAPNS1、CASC3、CASP7、CASP8AP2、CAV1、CCAR1、CCDC77、CCDC79、CCDC88A、CCDC92、CCDC122、CCER2、CCNF、CCNL2、CCT6A、CD276、CD46、CDC25B、CDC40、CDC42BPA、CDCA7、CDH11、CDH13、CDH18、CDK11B、CDK16、CDKAL1、CDKN1C、CECR7、CELSR1、CEMIP、CENPI、CEP112、CEP162、CEP170、CEP192、CEP68、CFH、CFLAR、CHD8、CHEK1、CHRM2、CIITA、CIZ1、CLDN23、CLIC1、CLK4、CLTA、CMAHP、CNGA4、CNOT1、CNRIP1、CNTD1、CMSS1、CNOT7、CNRIP1、CNTN1、COG1、COL1A1、COL11A1、COL12A1、COL14A1、COL15A1、COL5A1、COL5A3、COL6A1、COL6A6、COL8A1、COLEC12、COMP、COPS7B、CPA4、CPEB2、CPQ、CPSF4、CREB5、CRISPLD2、CRLF1、CRLS1、CRTAP、CRX、CRYBG3、CRYL1、CSDE1、CSNK1A1、CSNK1E、CSNK1G1、CTDSP2、CTNND1、CTRC、CUL2、CUL4A、CUX1、CYB5B、CYB5R2、CYBRD1、CYGB、CYP1B1、CYP51A1、DAAM1、DAB2、DACT1、DAGLB、DARS、DAXX、DCAF10、DCAF11、DCAF17、DCBLD2、DCLK1、DCN、DCUN1D4、DDAH1、DDAH2、DDHD2、DDIT4L、DDR1、DDX39B、DDX42、DDX50、DEGS1、DENND1A、DENND1B、DENND4A、DENND5A、DEPTOR、DET1、DFNB59、DGCR2、DGK1、DGKA、DHCR24、DHCR7、DHFR、DHX9、DIAPH1、DIAPH3、DIRAS3、DIS3L、DKFZp434M1735、DKK3、DLC1、DLG5、DMD、DMXL1、DNAH8、DNAH11、DNAJA4、DNAJC13、DNAJC27、DNM2、DNMBP、DOCK1、DOCK11、DPP8、DSEL、DST、DSTN、DYNC1I1、DYRK1A、DZIP1L、EBF1、EEA1、EEF1A1、EFCAB14、EFEMP1、EGR1、EGR3、EHMT2、EIF2B3、EIF4G1、EIF4G2、EIF4G3、ELF2、ELMO2、ELN、ELP4、EMX2OS、ENAH、ENG、ENOX1、ENPP1、ENPP2、ENSA、EP300、EPT1、ERC1、ERC2、ERCC1、ERCC8、ERLIN2、ERRFI1、ESM1、ETV5、EVC、EVC2、EXO1、EXOC3、EXOC6B、EXTL2、EYA3、F2R、FADS1、FADS2、FAF1、FAIM、FAM111A、FAM126A、FAM13A、FAM160A1、FAM162A、FAM174A、FAM195B、FAM198B、FAM20A、FAM208B、FAM219A、FAM219B、FAM3C、FAM46B、FAM49B、FAM65A、FAM65B、FAM69B、FAP、FARP1、FBLN2、FBN2、FBXL16、FBXL6、FBXO9、FBXO10、FBXO18、FBXO31、FBXO34、FBXO9、FCHO1、FDFT1、FDPS、FER、FEZ1、FGD4、FGD5-AS1、FGFR2、FGFRL1、FGL2、FHOD3、FLII、FLNB、FLT1、FN1、FNBP1、FOCAD、FOS、FOSB、FOSL1、FOXK1、FRAS1、FSCN2、FUS、FYN、GABPB1、GAL3ST4、GALC、GALNT1、GALNT15、GAS7、GATA6、GBA2、GBGT1、GBP1、GCFC2、GLCE、GCNT1、GDF6、GGACT、GHDC、GIGYF2、GJC1、GLCE、GMIP、GNA13、GNAQ、GNAS、GNG12、GNL3L、GOLGA2、GOLGA4、GOLGB1、GORASP1、GPR1、GPR183、GPR50、GPR89A、GPRC5A、GPRC5B、GPSM2、GREM1、GRK6、GRTP1、GSE1、GTF2H2B、GTSF1、GUCA1B、GULP1、GXYLT1、HAPLN1、HAPLN2、HAS2、HAS3、HAT1、HAUS3、HAUS6、HAVCR2、HDAC5、HDAC7、HDX、HECTD2-AS1、HEG1、HEPH、HEY1、HLA-A、HLA-E、HLTF、HMGA1、HMGA2、HMGB1、HMGCR、HMGN3-AS1、HMGCS1、HMGXB4、HOOK3、HOXB3、HMOX1、HNMT、HNRNPR、HNRNPUL1、HP1BP3、HPS1、HRH1、HSD17B12、HSPA1L、HTATIP2、HTT、IARS、IDH1、IDI1、IFT57、IGDCC4、IGF2BP2、IGF2R、IGFBP3、IKBKAP、IL16、IL6ST、INA、INHBA、INO80、IPP4B、INPP5K、INSIG1、INTU、INVS、IQCE、IQCG、ITCH、ITGA11、ITGA8、ITGAV、ITGB5、ITGB8、ITIH1、ITM2C、ITPKA、ITSN1、IVD、KANSL3、KAT6B、KCNK2、KCNS1、KCNS2、KDM6A、KDSR、KIAA1033、KIAA1143、KIAA1199、KIAA1456、KIAA1462、KIAA1522、KIAA1524、KIAA1549、KIAA1715、KIAA1755、KIDINS220、KIF14、KIF2A、KIF21A、KIF3A、KIT、KLC1、KLC2、KLF17、KLF6、KLHL7、KLRG1、KMT2D、KRT7、KRT18、KRT19、KRT34、KRTAP1-1、KRTAP1-5、KRTAP2-3、L3MBTL2、LAMA2、LAMB1、LAMB2P1、LARP4、LATS2、LDLR、LEMD3、LETM2、LGALS3、LGALS8、LGI2、LGR4、LHX9、LIMS1、LINC00341、LINC00472、LINC00570、LINC00578、LINC00607、LINC00657、LINC00678、LINC00702、LINC00886、LINC00961、LINC01011、LINC01118、LINC01204、LINCR-0002、LINGO2、LMAN2L、LMNA、LMO7、LMOD1、LOC400927、LONP1、LOX、LPHN1、LRBA、LRCH4、LRIG1、LRP4、LRP8、LRRC1、LRRC32、LRRC39、LRRC8A、LSAMP、LSS、LTBR、LUC7L2、LUM、LYPD1、LYRM1、LZTS2、MACROD2、MAFB、MAGED4、MAGED4B、MAMDC2、MAN1A2、MAN2A1、MAN2C1、MANEA、MAP4K4、MAPK10、MAPK13、MARCH7、MARCH8、MASP1、MB、MB21D2、MBD1、MBOAT7、MC4R、MCM10、MDM2、MDN1、MEAF6、MECP2、MED1、MED13L、MEDAG、MEF2D、MEGF6、MEIS2、MEMO1、MEPCE、MFGE8、MFN2、MIAT、MICAL2、MINPP1、MIR612、MKL1、MKLN1、MKNK2、MLLT4、MLLT10、MLST8、MMAB、MMP10、MMP24、MMS19、MMS22L、MN1、MORF4L1、MOXD1、MPPE1、MPZL1、MRPL3、MRPL45、MRPL55、MRPS28、MRVI1、MSANTD3、MSC、MSH2、MSH4、MSH6、MSL3、MSMO1、MSRB3、MTAP、MTERF3、MTERFD1、MTHFD1L、MTMR3、MTMR9、MTRR、MUM1、MVD、MVK、MXRA5、MYADM、MYB、MYCBP2、MYLK、MYO1D、MYO9B、MYOF、NA、NAA35、NAALADL2、NADK、NAE1、NAGS、NASP、NAV1、NAV2、NCOA1、NCOA3、NCOA4、NCSTN、NDNF、NEDD4、NELFA、NEO1、NEURL1B、NF2、NFASC、NFE2L1、NFX1、NGF、NGFR、NHLH1、NID1、NID2、NIPA1、NKX3-1、NLGN1、NLN、NOL10、NOMO3、NOTCH3、NOTUM、NOVA2、NOX4、NPEPPS、NRD1、NREP、NRG1、NRROS、NSUN4、NT5C2、NT5E、NTNG1、NUDT4、NUP153、NUP35、NUP50、NUPL1、NUSAP1、OCLN、ODF2、OLR1、OS9、OSBPL3、OSBPL6、OSBPL10、OSMR、OXCT1、OXCT2、P4HA1、P4HB、PABPC1、PAIP2B、PAK4、PAPD4、PARD3、PARN、PARP14、PARP4、PARVB、PAX6、PBLD、PBX3、PCBP2、PCCB、PCDH10、PCDHGB3、PCGF3、PCM1、PCMTD2、PCNXL2、PCSK9、PDE1C、PDE3A、PDE4A、PDE5A、PDE7A、PDGFD、PDGFRB、PDLIM7、PDS5B、PDXDC1、PDXDC2P、PEAR1、PELI1、PEPD、PEX5、PFKP、PHACTR3、PHF19、PHF8、PHRF1、PHTF2、PI4K2A、PIEZO1、PIGN、PIGU、PIK3C2B、PIK3CD、PIK3R1、PIKFYVE、PIM2、PITPNA、PITPNB、PITPNM1、PITPNM3、PLAU、PLEC、PLEK2、PLEKHA1、PLEKHA6、PLEKHB2、PLEKHH2、PLSCR1、PLSCR3、PLXNB2、PLXNC1、PMS1、PNISR、PODN、POLE3、POLN、POLR1A、POLR3D、POMT2、POSTN、POU2F1、PPAPDC1A、PPARA、PPARG、PPFIBP1、PPIP5K1、PPIP5K2、PPM1E、PPP1R12A、PPP1R26、PPP3CA、PPP6R1、PPP6R2、PRKCA、PRKDC、PRKG1、PRMT1、PRNP、PRPF31、PRPH2、PRRG4、PRSS23、PRUNE2、PSMA4、PSMC1、PSMD6、PSMD6-AS2、PTCH1、PTGIS、PTK2B、PTPN14、PTX3、PUF60、PUS7、PVR、PXK、PXN、QKI、RAB2B、RAB30、RAB34、RAB38、RAB44、RAD1、RAD9B、RAD23B、RAF1、RALB、RAP1GDS1、RAPGEF1、RARG、RARS、RARS2、RASIP1、RASSF8、RBBP8、RBCK1、RCOR3、RBFOX2、RBKS、RBM10、RDX、RERE、RFTN1、RFWD2、RFX3-AS1、RGCC、RGL1、RGS10、RGS3、RIF1、RNF14、RNF19A、RNF130、RNF144A、RNF213、RNF38、RNFT1、ROR1、ROR2、RPA1、RPF2、RPL10、RPS10、RPS6KB2、RPS6KC1、RRBP1、RWDD4、SAMD4A、SAMD9、SAMD9L、SAR1A、SART3、SCAF4、SCAF8、SCARNA9、SCD、SCLT1、SCO1、SDCBP、SEC14L1、SEC22A、SEC24A、SEC24B、SEC61A1、SENP6、SEPT9、SERGEF、SERPINE2、SF1、SF3B3、SGIP1、SGK3、SGMS1、SGOL2、SGPL1、SH2B3、SH3RF1、SH3YL1、SHROOM3、SIGLEC10、SKA2、SKIL、SKP1、SLC12A2、SLC24A3、SLC25A16、SLC25A17、SLC34A3、SLC35F3、SLC39A3、SLC39A10、SLC4A4、SLC4A11、SLC41A1、SLC44A2、SLC46A2、SLC6A15、SLC7A6、SLC7A8、SLC7A11、SLC9A3、SLIT3、SMARCA4、SMARCC2、SMC4、SMC6、SMCHD1、SMG1、SMG1P3、SMOX、SMPD4、SMTN、SMYD3、SMYD5、SNAP23、SNED1、SNHG16、SNX7、SNX14、SNX24、SNX7、SOCS2、SOCS6、SOGA2、SON、SORBS2、SORCS1、SORCS2、SOS2、SOX7、SPATA18、SPATA20、SPATA5、SPATS2、SPDYA、SPEF2、SPG20、SPIDR、SPINK5、SPRED2、SPRYD7、SQLE、SQRDL、SQSTM1、SRCAP、SREBF1、SRGAP1、SRRM1、SRSF3、SSBP1、STAC2、STARD4、STAT1、STAT3、STAT4、STAU1、STC2、STEAP2、STK32B、STRAD8、STRIP1、STRN4、STS、STX16、STXBP4、STXBP6、SULF1、SUPT20H、SVEP1、SYNE1、SYNE2、SYNGR2、SYNPO、SYNPO2、SYNPO2L、SYT15、SYTL2、TACC1、TAF2、TAGLN3、TANC2、TANGO6、TARBP1、TARS、TASP1、TBC1D15、TBCA、TBL1XR1、TBL2、TCF12、TCF4、TCF7L2、TEKT4P2、TENC1、TENM2、TEP1、TET1、TET3、TEX21P、TFCP2、TGFA、TGFB2、TGFB3、TGFBI、TGFBR1、TGFBRAP1、TGM2、THADA、THAP4、THBS2、THRB、TIAM1、TIMP2、TJAP1、TJP2、TLE3、TLK1、TMC3、TMEM67、TMEM102、TMEM119、TMEM134、TMEM154、TMEM189-UBE2V1、TMEM214、TMEM256-PLSCR3、TMEM47、TMEM50B、TMEM63A、TMX3、TNC、TNFAIP3、TNFAIP8L3、TNFRSF12A、TNFRSF14、TNIP1、TNKS1BP1、TNPO3、TNRC18P1、TNS1、TNS3、TNXB、TOE1、TOMM40、TOMM5、TOPORS、TP53AIP1、TP53INP1、TPRG1、TRAF3、TRAK1、TRAPPC12、TRIB1、TRIM2、TRIM23、TRIM26、TRIM28、TRIM65、TRIM66、TRMT1L、TRPC4、TRPS1、TSC2、TSHZ1、TSHZ2、TSPAN11、TSPAN18、TSPAN2、TSPAN7、TSSK3、TTC7A、TTC7B、TUBB2C、TUBB3、TUBE1、TXNIP、TXNL1、TXNL4B、TXNRD1、TYW5、U2SURP、UBAP2L、UBE2D3、UBE2G2、UBE2L3、UBE2V1、UBN2、UBQLN4、UCHL5、UHMK1、UHRF1BP1L、UNC13B、UNC5B、URGCP、URGCP-MRPS24、USP19、USP7、USP27X、UVRAG、VANGL1、VARS2、VAV2、VCL、VDAC2、VIM-AS1、VIPAS39、VPS13A、VPS29、VPS41、VPS51、VSTM2L、VWA8、VWF、WDR19、WDR27、WDR37、WDR48、WDR90、WDR91、WHSC2、WIPF1、WISP1、WNK1、WNT5B、WNT10B、WSB1、WWTR1、XDH、XIAP、XRN2、YAP1、YDJC、YES1、YPEL5、YTHDF3、Z24749、ZAK、ZBTB10、ZBTB24、ZBTB26、ZBTB7A、ZC3H12C、ZC3H14、ZC3H18、ZCCHC5、ZCCHC8、ZCCHC11、ZEB1、ZEB2、ZFAND1、ZFAND5、ZFP82、ZHX3、ZMIZ1、ZMIZ1-AS1、ZMIZ2、ZMYM2、ZNF12、ZNF138、ZNF148、ZNF208、ZNF212、ZNF219、ZNF227、ZNF232、ZNF24、ZNF268、ZNF28、ZNF280D、ZNF281、ZNF335、ZNF350、ZNF37A、ZNF37BP、ZNF395、ZNF426、ZNF431、ZNF583、ZNF618、ZNF621、ZNF652、ZNF655、ZNF660、ZNF674、ZNF680、ZNF730、ZNF74、ZNF764、ZNF777、ZNF778、ZNF780A、ZNF7804A、ZNF79、ZNF827、ZNF836、ZNF837、ZNF839、ZNF91和ZSCAN25。
另一方面,所述基因不是SMN2。
另一方面,所述基因不选自ABHD10、ADAM12、AKT1、ANXA11、APLP2、APPL2、ARMCX6、ATG5、AXIN1、BAIAP2、CCNB1IP1、CCT7、CEP57、CSF1、DLGAP4、EPN1、ERGIC3、FOXM1、GGCT、GRAMD3、HSD17B4、LARP7、LRRC42、MADD、MAN1B1、MRPL39、PCBP4、PPHLN1、PRKACB、RAB23、RAP1A、RCC1、SREK1、STRN3和TNRC6A。
另一方面,所述基因不选自ABHD10、ADAM12、AKT1、ANXA11、APLP2、APPL2、ARMCX6、ATG5、AXIN1、BAIAP2、CCNB1IP1、CCT7、CEP57、CSF1、DLGAP4、EPN1、ERGIC3、FOXM1、GGCT、GRAMD3、HSD17B4、LARP7、LRRC42、MADD、MAN1B1、MRPL39、PCBP4、PPHLN1、PRKACB、RAB23、RAP1A、RCC1、SMN2、SREK1、STRN3和TNRC6A。
在另一个特定方面,本文提供了用于修饰RNA剪接以调节对象的基因的一种、两种、三种或更多种RNA转录物的量的方法,其中从所述基因转录的所述前体RNA转录物包含内含子REMS(例如,内源内含子REMS或非内源内含子REMS),所述方法包括向所述对象施用式(I)的化合物或其形式或包含式(I)的化合物或其形式和药学上可接受的载体、赋形剂或稀释剂的药物组合物。在具体方面,所述前体RNA转录物按5’至3’顺序包含:分支点、3’剪接位点和内含子REMS。在另一个具体方面,所述前体RNA转录物按5’至3’顺序包含:第一5’剪接位点、第一分支点、第一3’剪接位点、内含子REMS、第二分支点和第二3’剪接位点。在另一个具体方面,前体RNA转录物按5’至3’顺序包含:内含子REMS、分支点和3’剪接位点。
在另一个特定方面,本文提供了用于修饰RNA剪接以调节对象的基因的一种、两种、三种或更多种RNA转录物的量的方法,其中从所述基因转录的所述前体RNA转录物包含非内源内含子REMS,所述方法包括向所述对象施用式(I)的化合物或其形式或包含式(I)的化合物或其形式和药学上可接受的载体、赋形剂或稀释剂的药物组合物。在具体方面,所述前体RNA转录物按5’至3’顺序包含:分支点、3’剪接位点和内含子REMS。在另一个具体方面,所述前体RNA转录物按5’至3’顺序包含:第一5’剪接位点、第一分支点、第一3’剪接位点、内含子REMS、第二分支点和第二3’剪接位点。在另一个具体方面,前体RNA转录物按5’至3’顺序包含:内含子REMS、分支点和3’剪接位点。
另一方面,本文提供了用于修饰RNA剪接以调节基因的一种、两种、三种或更多种RNA转录物的量的方法,其中从所述基因转录的所述前体RNA转录物包含内含子REMS,所述方法包括向人类或非人类对象施用式(I)的化合物或其形式或包含式(I)的化合物或其形式和药学上可接受的载体、赋形剂或稀释剂的药物组合物。在具体方面,所述前体RNA转录物按5’至3’顺序包含:分支点、3’剪接位点和内含子REMS。在另一个具体方面,所述前体RNA转录物按5’至3’顺序包含:第一5’剪接位点、第一分支点、第一3’剪接位点、内含子REMS、第二分支点和第二3’剪接位点。在另一个具体方面,前体RNA转录物按5’至3’顺序包含:内含子REMS、分支点和3’剪接位点。
另一方面,本文提供了用于修饰RNA剪接以调节本文所述的基因的一种、两种、三种或更多种RNA转录物的量的方法,包括向人类或非人类对象施用式(I)的化合物或其形式或包含式(I)的化合物或其形式和药学上可接受的载体、赋形剂或稀释剂的药物组合物。参见实施例部分以获取有关本文所述的基因的其他信息。
另一方面,本文提供了用于修饰RNA剪接以调节对象的基因产物(如RNA转录物或蛋白)的量的方法,其中所述基因包含编码两个外显子和内含子的DNA核苷酸序列,其中编码第一外显子的核苷酸序列在编码内含子的核苷酸序列的上游,并且编码第二外显子的核苷酸序列在编码内含子的核苷酸序列的下游,其中所述编码内含子的DNA核苷酸序列按5’至3’顺序包含:编码第一5’剪接位点的核苷酸序列、编码第一分支点的核苷酸序列、编码第一3’剪接位点的核苷酸序列、编码iREMS的核苷酸序列、编码第二分支点的核苷酸序列和编码第二3’剪接位点的核苷酸序列,其中编码所述iREMS的所述核苷酸序列包含DNA序列GAgtrngn,并且其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,所述方法包括向对象施用本文所述的化合物(例如,式(I)的化合物或其形式)。
另一方面,本文提供了用于修饰RNA剪接以调节对象的基因产物(如RNA转录物或蛋白)的量的方法,其中所述基因包含编码两个外显子和内含子的DNA核苷酸序列,其中编码第一外显子的核苷酸序列在编码内含子的核苷酸序列的上游,并且编码第二外显子的核苷酸序列在编码内含子的核苷酸序列的下游,其中所述内含子的所述DNA核苷酸序列按5’至3’顺序包含:编码iREMS的核苷酸序列、编码分支点的核苷酸序列和编码3’剪接位点的核苷酸序列,其中编码所述iREMS的核苷酸序列包含DNA序列GAgtrngn,并且其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,所述方法包括向对象施用本文所述的化合物(例如,式(I)的化合物或其形式)。
另一方面,本文提供了用于修饰RNA剪接以调节对象的基因产物(如RNA转录物或蛋白)的量的方法,其中所述基因包含编码两个外显子和内含子的DNA核苷酸序列,并且其中所述DNA核苷酸序列编码图1A示出的外显子和内含子元件,所述方法包括向对象施用本文所述的化合物(例如,式(I)的化合物或其形式)。
另一方面,本文提供了用于修饰RNA剪接以调节对象的基因产物(如RNA转录物或蛋白)的量的方法,其中所述基因包含编码两个外显子和内含子的DNA核苷酸序列,并且其中所述DNA核苷酸序列编码图1B示出的外显子和内含子元件,所述方法包括向对象施用本文所述的化合物(例如,式(I)的化合物或其形式)。
另一方面,本文提供了用于修饰RNA剪接以调节对象的基因产物(如RNA转录物或蛋白)的量的方法,其中所述基因包含编码两个外显子和内含子的DNA核苷酸序列,并且其中所述DNA核苷酸序列编码图1C示出的外显子和内含子元件所述方法包括向对象施用本文所述的化合物(例如,式(I)的化合物或其形式)。
在具体方面,所述基因是在本公开的表中描述的基因。
在某些方面,与(多种)细胞接触或培养的或向对象施用的式(I)的化合物或其形式是本文所述的化合物。
表3显示了特定基因,其在本文所述的化合物的存在下预期显示出对包含iExon或形成eExon的作用,其中由于在具有内含子REMS元件的RNA中产生iExon或eExon而导致同种型丰度的相应变化。丰度的变化预期具有统计学上显著的p值。
表3
表4显示了特定基因,其在本文所述的化合物的存在下预期显示出对包含iExon或形成eExon的作用,其中由于在具有内含子REMS元件的RNA中产生iExon或eExon而导致同种型丰度的相应变化。丰度的变化预期具有统计学上显著的p值。
表4
表5显示了特定基因,其在本文所述的化合物的存在下预期显示出对包含iExon或形成eExon的作用,其中由于在具有内含子REMS元件的RNA中产生iExon或eExon而导致同种型丰度的相应变化。丰度的变化预期具有统计学上显著的p值。
表5
表6显示了特定基因,其在本文所述的化合物的存在下预期显示出对包含iExon或形成eExon的作用,其中由于在具有内含子REMS元件的RNA中产生iExon或eExon而导致同种型丰度的相应变化。丰度的变化预期具有统计学上显著的p值。
表6
表7显示了特定基因,其在本文所述的化合物的存在下预期显示出对包含iExon或形成eExon的作用,其中由于在具有内含子REMS元件的RNA中产生iExon或eExon而导致同种型丰度的相应变化。丰度的变化预期具有统计学上显著的p值。
表7
表8显示了特定基因,其在本文所述的化合物的存在下预期显示出对包含iExon或形成eExon的作用,其中由于在具有内含子REMS元件的RNA中产生iExon或eExon而导致同种型丰度的相应变化。丰度的变化预期具有统计学上显著的p值。
表8
表9显示了特定基因,其在本文所述的化合物的存在下预期显示出对包含iExon或形成eExon的作用,其中由于在具有内含子REMS元件的RNA中产生iExon或eExon而导致同种型丰度的相应变化。丰度的变化预期具有统计学上显著的p值。
表9
表10显示了基因,其显示出对包含iExon或形成eExon的作用,其中在用化合物64(24nm和100nm)处理的细胞中,由于在具有内含子REMS序列的RNA中产生iExon或eExon而导致同种型丰度的相应变化,产生统计学显著的调整后的Fisher精确检验p值。
表10
表11显示了特定基因,其在本文所述的化合物的存在下预期显示出对包含iExon或形成eExon的作用,其中由于在具有内含子REMS元件的RNA中产生iExon或eExon而导致同种型丰度的相应变化。丰度的变化预期具有统计学上显著的p值。
表11
表12显示了特定基因,其在本文所述的化合物的存在下预期显示出对包含iExon或形成eExon的作用,其中由于在具有内含子REMS元件的RNA中产生iExon或eExon而导致同种型丰度的相应变化。丰度的变化预期具有统计学上显著的p值。
表12
预防和/或治疗疾病的方法
另一方面,本文提供了由于修饰RNA剪接以预防和/或治疗与基因产物(例如,mRNA转录物或蛋白)的异常表达相关的疾病的方法,其中从所述基因转录的所述前体RNA转录物包含内含子REMS,所述方法包括向人类或非人类对象施用式(I)的化合物或其形式或包含式(I)的化合物或其形式和药学上可接受的载体、赋形剂或稀释剂的药物组合物。在具体方面,所述前体RNA转录物按5’至3’顺序包含:5’剪接位点、分支点、3’剪接位点和内含子REMS。在另一个具体方面,所述前体RNA转录物按5’至3’顺序包含:分支点、3’剪接位点和内含子REMS。在另一个具体方面,所述前体RNA转录物按5’至3’顺序包含:第一5’剪接位点、第一分支点、第一3’剪接位点、内含子REMS、第二分支点和第二3’剪接位点。在另一个具体方面,前体RNA转录物按5’至3’顺序包含:内含子REMS、分支点和3’剪接位点。
在某些方面,所述基因是本文所述的基因中的任一种。在某些方面,所述基因包含编码非内源内含子REMS的核苷酸序列。一方面,本文提供了用于修饰RNA剪接以预防和/或治疗与本文所述的基因产物(例如,mRNA、RNA转录物或蛋白)的异常表达相关的疾病的方法,所述方法包括向人类或非人类对象施用式(I)的化合物或其形式或包含式(I)的化合物或其形式和药学上可接受的载体、赋形剂或稀释剂的药物组合物。
另一方面,本文提供了用于修饰RNA剪接以预防和/或治疗与本文所述的基因产物(例如,mRNA、RNA转录物或蛋白)的异常表达相关的疾病的方法,其中从所述基因转录的所述前体RNA转录物包含内含子REMS,所述方法包括向人类或非人类对象施用式(I)的化合物或其形式或包含式(I)的化合物或其形式和药学上可接受的载体、赋形剂或稀释剂的药物组合物。在具体方面,所述前体RNA转录物按5’至3’顺序包含:分支点、3’剪接位点和内含子REMS。在另一个具体方面,所述前体RNA转录物按5’至3’顺序包含:第一5’剪接位点、第一分支点、第一3’剪接位点、内含子REMS、第二分支点和第二3’剪接位点。在另一个具体方面,前体RNA转录物按5’至3’顺序包含:内含子REMS、分支点和3’剪接位点。
另一方面,本文提供了用于修饰RNA剪接以预防和/或治疗与本文所述的基因产物(例如,mRNA、RNA转录物或蛋白)的异常表达相关的疾病的方法,其中从所述基因转录的所述前体RNA转录物包含内含子REMS,所述方法包括向人类或非人类对象施用式(I)的化合物或其形式或包含式(I)的化合物或其形式和药学上可接受的载体、赋形剂或稀释剂的药物组合物。在具体方面,所述前体RNA转录物按5’至3’顺序包含:5’剪接位点、分支点、3’剪接位点和内含子REMS。在另一个具体方面,所述前体RNA转录物按5’至3’顺序包含:分支点、3’剪接位点和内含子REMS。在另一个具体方面,所述前体RNA转录物按5’至3’顺序包含:第一5’剪接位点、第一分支点、第一3’剪接位点、内含子REMS、第二分支点和第二3’剪接位点。在另一个具体方面,前体RNA转录物按5’至3’顺序包含:内含子REMS、分支点和3’剪接位点。
另一方面,本文提供了用于修饰RNA剪接以预防和/或治疗与本文所述的基因产物(例如,mRNA、RNA转录物或蛋白)的异常表达相关的疾病的方法,包括向人类或非人类对象施用式(I)的化合物或其形式或包含式(I)的化合物或其形式和药学上可接受的载体、赋形剂或稀释剂的药物组合物。关于本文所述的基因的另外的信息,参见实施例部分。
另一方面,本文提供了用于修饰RNA剪接以预防和/或治疗疾病的方法,其中由基因编码的一种、两种、三种或更多种RNA同种型的表达水平的改变有利于预防和/或治疗所述疾病,其中从所述基因转录的所述前体RNA转录物包含内含子REMS,所述方法包括向人类或非人类对象施用式(I)的化合物或其形式或包含式(I)的化合物或其形式和药学上可接受的载体、赋形剂或稀释剂的药物组合物。在具体方面,所述前体RNA转录物按5’至3’顺序包含:5’剪接位点、分支点、3’剪接位点和内含子REMS。在另一个具体方面,所述前体RNA转录物按5’至3’顺序包含:分支点、3’剪接位点和内含子REMS。在另一个具体方面,所述前体RNA转录物按5’至3’顺序包含:第一5’剪接位点、第一分支点、第一3’剪接位点、内含子REMS、第二分支点和第二3’剪接位点。在另一个具体方面,前体RNA转录物按5’至3’顺序包含:内含子REMS、分支点和3’剪接位点。
在某些方面,所述基因是本文所述的基因中的任一种。在某些方面,所述基因包含编码非内源内含子REMS的核苷酸序列。一方面,本文提供了用于修饰RNA剪接以预防和/或治疗疾病的方法,其中由本文所述的基因编码的一种、两种、三种或更多种RNA同种型的表达的调节(例如,增加或减少)有利于预防和/或治疗所述疾病,所述方法包括向人类或非人类对象施用式(I)的化合物或其形式或包含式(I)的化合物或其形式和药学上可接受的载体、赋形剂或稀释剂的药物组合物。
另一方面,本文提供了用于修饰RNA剪接以预防和/或治疗疾病的方法,其中由本文所述的基因编码的一种、两种、三种或更多种RNA同种型的表达的调节(例如,增加或减少)有利于预防和/或治疗所述疾病,其中从所述基因转录的所述前体RNA转录物包含内含子REMS,所述方法包括向人类或非人类对象施用式(I)的化合物或其形式或包含式(I)的化合物或其形式和药学上可接受的载体、赋形剂或稀释剂的药物组合物。在具体方面,所述前体RNA转录物按5’至3’顺序包含:5’剪接位点、分支点、3’剪接位点和内含子REMS。在另一个具体方面,所述前体RNA转录物按5’至3’顺序包含:分支点、3’剪接位点和内含子REMS。在另一个具体方面,所述前体RNA转录物按5’至3’顺序包含:第一5’剪接位点、第一分支点、第一3’剪接位点、内含子REMS、第二分支点和第二3’剪接位点。在另一个具体方面,前体RNA转录物按5’至3’顺序包含:内含子REMS、分支点和3’剪接位点。
另一方面,本文提供了用于修饰RNA剪接以预防和/或治疗疾病的方法,其中由本文所述的基因编码的一种、两种、三种或更多种RNA同种型的表达的调节(例如,增加或减少)有利于预防和/或治疗所述疾病,其中从所述基因转录的所述前体RNA转录物包含内含子REMS,所述方法包括向人类或非人类对象施用式(I)的化合物或其形式或包含式(I)的化合物或其形式和药学上可接受的载体、赋形剂或稀释剂的药物组合物。在具体方面,所述前体RNA转录物按5’至3’顺序包含:5’剪接位点、分支点、3’剪接位点和内含子REMS。在另一个具体方面,所述前体RNA转录物按5’至3’顺序包含:分支点、3’剪接位点和内含子REMS。在另一个具体方面,所述前体RNA转录物按5’至3’顺序包含:第一5’剪接位点、第一分支点、第一3’剪接位点、内含子REMS、第二分支点和第二3’剪接位点。在另一个具体方面,前体RNA转录物按5’至3’顺序包含:内含子REMS、分支点和3’剪接位点。
另一方面,本文提供了用于修饰RNA剪接以预防和/或治疗疾病的方法,其中由本文所述的基因编码的一种、两种、三种或更多种RNA同种型的表达的调节(例如,增加或减少)有利于预防和/或治疗所述疾病,所述方法包括向人类或非人类对象施用式(I)的化合物或其形式或包含式(I)的化合物或其形式和药学上可接受的载体、赋形剂或稀释剂的药物组合物。在具体方面,在施用式(I)的化合物或其形式和药学上可接受的载体、赋形剂或稀释剂后,由本文所述的基因编码的一种、两种、三种或更多种RNA同种型减少。参见实施例部分以获取有关本文所述的基因的其他信息。
另一方面,本文提供了用于修饰RNA剪接以预防和/或治疗疾病的方法,其中由基因编码的一种、两种、三种或更多种蛋白同种型的表达水平的改变有利于预防和/或治疗所述疾病,其中从所述基因转录的所述前体RNA转录物包含内含子REMS,所述方法包括向人类或非人类对象施用式(I)的化合物或其形式或包含式(I)的化合物或其形式和药学上可接受的载体、赋形剂或稀释剂的药物组合物。在具体方面,所述前体RNA转录物按5’至3’顺序包含:5’剪接位点、分支点、3’剪接位点和内含子REMS。在另一个具体方面,所述前体RNA转录物按5’至3’顺序包含:分支点、3’剪接位点和内含子REMS。在另一个具体方面,所述前体RNA转录物按5’至3’顺序包含:第一5’剪接位点、第一分支点、第一3’剪接位点、内含子REMS、第二分支点和第二3’剪接位点。在另一个具体方面,前体RNA转录物按5’至3’顺序包含:内含子REMS、分支点和3’剪接位点。
在某些方面,所述基因是本文所述的基因中的任一种。在某些方面,所述基因包含编码非内源内含子REMS的核苷酸序列。一方面,本文提供了用于修饰RNA剪接以预防和/或治疗疾病的方法,其中由本文所述的基因编码的一种、两种、三种或更多种蛋白同种型的表达的调节(例如,增加或减少)有利于预防和/或治疗所述疾病,所述方法包括向人类或非人类对象施用式(I)的化合物或其形式或包含式(I)的化合物或其形式和药学上可接受的载体、赋形剂或稀释剂的药物组合物。
另一方面,本文提供了用于修饰RNA剪接以预防和/或治疗疾病的方法,其中由本文所述的基因编码的一种、两种、三种或更多种蛋白同种型的表达的调节(例如,增加或减少)有利于预防和/或治疗所述疾病,其中从所述基因转录的所述前体RNA转录物包含内含子REMS,所述方法包括向人类或非人类对象施用式(I)的化合物或其形式或包含式(I)的化合物或其形式和药学上可接受的载体、赋形剂或稀释剂的药物组合物。在具体方面,所述前体RNA转录物按5’至3’顺序包含:5’剪接位点、分支点、3’剪接位点和内含子REMS。在另一个具体方面,所述前体RNA转录物按5’至3’顺序包含:分支点、3’剪接位点和内含子REMS。在另一个具体方面,所述前体RNA转录物按5’至3’顺序包含:第一5’剪接位点、第一分支点、第一3’剪接位点、内含子REMS、第二分支点和第二3’剪接位点。在另一个具体方面,前体RNA转录物按5’至3’顺序包含:内含子REMS、分支点和3’剪接位点。
另一方面,本文提供了用于修饰RNA剪接以预防和/或治疗疾病的方法,其中由本文所述的基因编码的一种、两种、三种或更多种蛋白同种型的表达的调节(例如,增加或减少)有利于预防和/或治疗所述疾病,其中从所述基因转录的所述前体RNA转录物包含内含子REMS,所述方法包括向人类或非人类对象施用式(I)的化合物或其形式或包含式(I)的化合物或其形式和药学上可接受的载体、赋形剂或稀释剂的药物组合物。在具体方面,所述前体RNA转录物按5’至3’顺序包含:5’剪接位点、分支点、3’剪接位点和内含子REMS。在另一个具体方面,所述前体RNA转录物按5’至3’顺序包含:分支点、3’剪接位点和内含子REMS。在另一个具体方面,所述前体RNA转录物按5’至3’顺序包含:第一5’剪接位点、第一分支点、第一3’剪接位点、内含子REMS、第二分支点和第二3’剪接位点。在另一个具体方面,前体RNA转录物按5’至3’顺序包含:内含子REMS、分支点和3’剪接位点。
另一方面,本文提供了用于修饰RNA剪接以预防和/或治疗疾病的方法,其中由本文所述的基因编码的一种、两种、三种或更多种蛋白同种型的表达的调节(例如,增加或减少)有利于预防和/或治疗所述疾病,所述方法包括向人类或非人类对象施用式(I)的化合物或其形式或包含式(I)的化合物或其形式和药学上可接受的载体、赋形剂或稀释剂的药物组合物。在具体方面,在施用式(I)的化合物或其形式和药学上可接受的载体、赋形剂或稀释剂后,由本文所述的基因编码的一种、两种、三种或更多种RNA同种型减少。参见实施例部分以获取有关本文所述的基因的其他信息。
另一方面,本文提供了用于修饰RNA剪接以预防、治疗或预防和治疗对象的疾病的方法,其中由基因编码的一种、两种、三种或更多种蛋白同种型的表达的调节(例如,增加或减少)有利于预防和/或治疗所述疾病,其中所述基因包含编码两个外显子和内含子的DNA核苷酸序列,其中编码第一外显子的核苷酸序列在编码内含子的核苷酸序列的上游,并且编码第二外显子的核苷酸序列在编码内含子的核苷酸序列的下游,其中所述编码内含子的DNA核苷酸序列按5’至3’顺序包含:编码第一5’剪接位点的核苷酸序列、编码第一分支点的核苷酸序列、编码第一3’剪接位点的核苷酸序列、编码iREMS的核苷酸序列、编码第二分支点的核苷酸序列和编码第二3’剪接位点的核苷酸序列,其中编码所述iREMS的核苷酸序列包含DNA序列GAgtrngn,并且其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,所述方法包括向对象施用本文所述的化合物(例如,式(I)的化合物或其形式)。
另一方面,本文提供了用于修饰RNA剪接以预防、治疗或预防和治疗对象的疾病的方法,其中由基因编码的一种、两种、三种或更多种蛋白同种型的表达的调节(例如,增加或减少)有利于预防和/或治疗所述疾病,其中所述基因包含编码两个外显子和内含子的DNA核苷酸序列,其中编码第一外显子的核苷酸序列在编码内含子的核苷酸序列的上游,并且编码第二外显子的核苷酸序列在编码内含子的核苷酸序列的下游,其中所述内含子的DNA核苷酸序列按5’至3’顺序包含:编码iREMS的核苷酸序列、编码分支点的核苷酸序列和编码3’剪接位点的核苷酸序列,其中编码所述iREMS的核苷酸序列包含DNA序列GAgtrngn,并且其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸,所述方法包括向对象施用本文所述的化合物(例如,式(I)的化合物或其形式)。
另一方面,本文提供了用于修饰RNA剪接以预防、治疗或预防和治疗对象的疾病的方法,其中由基因编码的一种、两种、三种或更多种蛋白同种型的表达的调节(例如,增加或减少)有利于预防和/或治疗所述疾病,其中所述基因包含编码两个外显子和内含子的DNA核苷酸序列,并且其中所述DNA核苷酸序列编码图1A所示的外显子和内含子元件,所述方法包括向对象施用本文所述的化合物(例如,式(I)的化合物或其形式)。
另一方面,本文提供了用于修饰RNA剪接以预防、治疗或预防和治疗对象的疾病的方法,其中由基因编码的一种、两种、三种或更多种蛋白同种型的表达的调节(例如,增加或减少)有利于预防和/或治疗所述疾病,其中所述基因包含编码两个外显子和内含子的DNA核苷酸序列,并且其中所述DNA核苷酸序列编码图1B所示的外显子和内含子元件,所述方法包括向对象施用本文所述的化合物(例如,式(I)的化合物或其形式)。
另一方面,本文提供了用于修饰RNA剪接以预防、治疗或预防和治疗对象的疾病的方法,其中由基因编码的一种、两种、三种或更多种蛋白同种型的表达的调节(例如,增加或减少)有利于预防和/或治疗所述疾病,其中所述基因包含编码两个外显子和内含子的DNA核苷酸序列,并且其中所述DNA核苷酸序列编码图1C所示的外显子和内含子元件,所述方法包括向对象施用本文所述的化合物(例如,式(I)的化合物或其形式)。
在具体方面,所述基因是在本公开的表中描述的基因。
在一些方面,向对象施用的式(I)的化合物或其形式是本文所述的化合物。
在具体方面,用于修饰RNA剪接以预防本文所述的疾病的方法防止疾病的一种或多种症状的发作或发展。另一方面,本文所述的用于预防疾病的方法防止疾病的复发或延迟疾病的复发。另一方面,本文所述的用于预防疾病的方法具有以下作用中的一种、两种或更多种:(i)降低或改善疾病的严重程度;(ii)抑制疾病的进展;(iii)减少对象的住院;(iv)缩短对象的住院时间;(v)增加对象的存活率;(vi)改善对象的生活质量;(vii)减少与疾病相关的症状数量;(viii)减轻或改善与疾病相关的(多种)症状的严重性;(ix)减少与疾病相关的(多种)症状的持续时间;(x)防止与疾病相关的症状的复发;(xi)抑制疾病症状的发展或发作;和/或(xii)抑制与疾病相关的症状的进展。
人工基因构建体
本文还提供了人工基因构建体,其包含编码外显子和一个或多个内含子的DNA序列,其中所述编码至少一个内含子的核苷酸序列按5’至3’顺序包含:编码分支点的核苷酸序列、编码3’剪接位点的核苷酸序列和编码内含子REMS的核苷酸序列,并且人工基因构建体包含RNA序列,所述RNA序列包含外显子和一个或多个内含子,其中至少一个内含子按5’至3’顺序包含:分支点、3’剪接位点和内含子REMS。本文所述的DNA序列可以是或源自例如基因组DNA序列或其DNA类似物。本文所述的RNA序列可以是或源自例如前体RNA转录物或其RNA类似物。如本文所使用,术语“人工基因构建体”是指含自然界中未发现的核苷酸序列的DNA或RNA基因构建体。
另一方面,本文提供了包含RNA序列的人工基因构建体,所述RNA序列包含两个外显子和内含子,其中第一外显子在内含子的上游,并且第二外显子在内含子的下游,其中所述内含子的RNA核苷酸序列按5’至3’顺序包含:第一5’剪接位点、第一分支点、第一3’剪接位点、iREMS、第二分支点和第二3’剪接位点,其中所述iREMS包含RNA序列GAgurngn,并且其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸。
另一方面,本文提供了包含RNA序列的人工基因构建体,所述RNA序列包含两个外显子和内含子,其中第一外显子在内含子的上游,并且第二外显子在内含子的下游,其中所述内含子的RNA核苷酸序列按5’至3’顺序包含:iREMS、分支点和3’剪接位点,其中所述iREMS包含RNA序列GAgurngn,并且其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸。
另一方面,本文提供了包含RNA序列的人工基因构建体,所述RNA序列包含两个外显子和内含子,其中所述RNA序列包含图1A所示的外显子和内含子元件。
另一方面,本文提供了包含RNA序列的人工基因构建体,所述RNA序列包含两个外显子和内含子,其中所述RNA序列包含图1B所示的外显子和内含子元件。
另一方面,本文提供了包含RNA序列的人工基因构建体,所述RNA序列包含两个外显子和内含子,其中所述RNA序列包含图1C所示的外显子和内含子元件。
另一方面,本文提供了包含编码两个外显子和内含子的DNA序列的人工基因构建体,其中编码第一外显子的核苷酸序列在编码内含子的核苷酸序列的上游,并且编码第二外显子的核苷酸序列在编码内含子的核苷酸序列的下游,其中所述编码内含子的核苷酸序列按5’至3’顺序包含:编码第一5’剪接位点的核苷酸序列、编码第一分支点的核苷酸序列、编码第一3’剪接位点的核苷酸序列、iREMS、编码第二分支点的核苷酸序列和编码第二3’剪接位点的核苷酸序列,其中编码所述iREMS的核苷酸序列包含DNA序列GAgtrngn,并且其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸。
另一方面,本文提供了包含编码两个外显子和内含子的DNA序列的人工基因构建体,其中编码第一外显子的核苷酸序列在编码内含子的核苷酸序列的上游,并且编码第二外显子的核苷酸序列在编码内含子的核苷酸序列的下游,其中编码内含子的核苷酸序列按5’至3’顺序包含:编码iREMS的核苷酸序列、编码分支点的核苷酸序列和编码3’剪接位点的核苷酸序列,其中编码所述iREMS的核苷酸序列包含DNA序列GAgtrngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸。
另一方面,本文提供了包含编码两个外显子和内含子的DNA序列的人工基因构建体,其中所述DNA序列编码图1A所示的外显子和内含子元件。
另一方面,本文提供了包含编码两个外显子和内含子的DNA序列的人工基因构建体,其中所述DNA序列编码图1B所示的外显子和内含子元件。
另一方面,本文提供了包含编码两个外显子和内含子的DNA序列的人工基因构建体,其中所述DNA序列编码图1C所示的外显子和内含子元件。
一方面,本文提供了包含内含子REMS的人工基因构建体。一方面,人工基因构建体包含基因组DNA或编码外显子和一个、两个或三个内含子的DNA,其中通过基因工程将编码内含子REMS的核苷酸序列引入编码内含子的核苷酸序列中,所述编码内含子REMS的核苷酸序列可以在编码分支点的核苷酸序列和编码3’剪接位点的核苷酸序列的上游或下游。另一方面,人工基因构建体包含编码外显子和一个、两个或三个内含子的DNA,其中编码内含子的核苷酸序列包含编码内含子REMS的核苷酸序列、编码(多个)3’剪接位点的核苷酸序列和编码(多个)分支点序列的核苷酸序列,其中通过基因工程将编码内含子REMS的核苷酸序列引入编码内含子的核苷酸序列中,所述编码内含子REMS的核苷酸序列可以在至少一个编码分支点的核苷酸序列和至少一个编码3’剪接位点的核苷酸序列的上游或下游。另一方面,人工基因构建体包含编码外显子和一个、两个或三个内含子的DNA,其中编码内含子的核苷酸序列包含编码(多个)3’剪接位点的核苷酸序列和编码(多个)分支点的核苷酸序列,其中编码内含子的核苷酸序列被修饰以引入编码内含子REMS的核苷酸序列。在一些方面,人工基因构建体包含DNA序列,其被修饰以引入编码内含子REMS的核苷酸序列,其中内含子REMS的位置如图1A-1C中任一个所示。在某些方面,选择用于制备人工基因构建体的DNA序列可以包含编码内含子REMS的核苷酸序列,并且引入编码内含子REMS的另外的核苷酸序列或分支点或3’剪接位点序列。在特定方面,编码内含子REMS的核苷酸序列或分支点或3’剪接位点序列是编码非内源内含子REMS或分支点或3’剪接位点序列的核苷酸序列,即在人工基因构建体的DNA序列中非天然发现的序列。在某些方面,人工基因构建体包含其他元件,如启动子(例如,组成型、诱导型或组织特异性启动子)、Poly(A)位点、转录终止位点和(多个)转录结合位点。在某些方面,人工基因构建体包含至少编码治疗性蛋白的序列。在一些方面,人工基因构建体包含至少本文所述的基因的内含子REMS。在某些方面,人工基因构建体包含至少可检测的报告基因的外显子,所述可检测的报告基因如绿色荧光蛋白(GFP)、黄色荧光蛋白(YFP)、红色荧光蛋白、β-半乳糖苷酶、海肾荧光素酶、萤火虫荧光素酶等。
在某些方面,人工基因构建体如下制备:将编码内含子REMS的核苷酸序列引入编码基因组DNA或DNA的现有内含子分支点和内含子3’剪接位点的核苷酸序列中,其中所述DNA编码两个或更多个外显子和一个或多个内含子,并且其中所述编码内含子REMS的核苷酸序列在编码分支点的核苷酸序列和3’剪接位点上游。在一些方面,人工基因构建体如下制备:在编码基因组DNA或DNA的分支点和3’剪接位点的核苷酸序列的上游引入编码内含子REMS的核苷酸序列,其中所述DNA编码两个或更多个外显子和(多个)内含子。在具体方面,编码内含子REMS的核苷酸序列从内部引入编码内含子的核苷酸序列内。在某些方面,人工基因构建体如下制备:将编码内含子REMS的核苷酸序列、编码分支点的核苷酸序列和编码3’剪接位点的核苷酸序列引入cDNA中,其中所述编码内含子REMS的核苷酸序列可以分别在分支点和3’剪接位点的上游;或可以分别在3’剪接位点和分支点的下游。编码内含子REMS的核苷酸序列充当5’剪接位点。在某些方面,编码内含子REMS的核苷酸序列在内含子内部。在具体方面,选择用于制备人工基因构建体的基因组DNA或DNA不包含编码内含子REMS的核苷酸序列或编码分支点的核苷酸序列或编码3’剪接位点的核苷酸序列中的一个或多个。在某些方面,选择用于制备人工基因构建体的基因组DNA或DNA包含内含子REMS,并且引入另外的内含子REMS。在一些方面,应注意将编码内含子REMS的核苷酸序列引入DNA序列中,以免破坏开放阅读框或引入终止密码子。将编码内含子REMS的核苷酸序列引入DNA序列中可能会或可能不会导致蛋白水平的氨基酸变化。在某些方面,将编码内含子REMS的核苷酸序列引入DNA序列导致蛋白水平的氨基酸变化。在一些方面,该氨基酸变化是保守的氨基酸取代。在其他方面,将编码内含子REMS的核苷酸序列引入DNA序列中不会导致蛋白水平的氨基酸变化。可以使用本领域技术人员已知的技术将内含子REMS和其他元件,例如分支点序列或3’剪接位点序列引入DNA序列中,例如可以使用基因编辑技术,例如CRISPR-Cas方法、转录激活因子样效应物核酸酶(TALEN)或锌指核酸酶(ZFN)。
在某些方面,人工基因构建体包含RNA序列,所述RNA序列包含外显子和一个、两个或三个内含子,其中在3’剪接位点下游的内含子REMS 5’剪接位点通过基因工程引入内含子。另一方面,人工基因构建体包含RNA序列,所述RNA序列包含外显子和一个、两个或三个内含子,其中内含子包含(多个)5’剪接位点、(多个)3’剪接位点和(多个)分支点,其中在3’剪接位点上游的内含子REMS通过基因工程引入内含子。另一方面,人工基因构建体包含RNA序列,所述RNA序列包含外显子和一个、两个或三个内含子,其中内含子包含(多个)3’剪接位点和(多个)分支点,其中内含子被修饰以引入内含子REMS。在特定方面,内含子REMS是非内源的,即非天然存在于人工基因构建体的RNA序列中。在某些方面,人工基因构建体包含其他元件,如启动子(例如,组织特异性启动子或组成性表达的启动子)、5’非翻译区、3’非翻译区、调节剪接位点(5’和3’)识别和催化的(多种)RNA结合蛋白的(多个)结合位点、(多种)小分子RNA传感器,例如核糖开关,茎环结构和/或内部核糖体进入位点(IRES)等。在某些方面,人工基因构建体包含至少编码治疗性蛋白的基因的内含子。在一些方面,人工基因构建体包含至少本文所述的基因的内含子。在具体方面,选择用于制备人工基因构建体的RNA转录物不包含内含子REMS。在某些方面,选择用于制备人工基因构建体的RNA转录物包含内含子REMS,并引入另外的外显子或内含子REMS。在其他方面,人工基因构建体包含可检测的报告基因的至少一个内含子和两个外显子,所述可检测的报告基因如绿色荧光蛋白(GFP)、黄色荧光蛋白(YFP)、红色荧光蛋白、β-半乳糖苷酶、海肾荧光素酶、萤火虫荧光素酶等。
在某些方面,人工基因构建体如下制备:将内含子REMS引入前体RNA的现有5’剪接位点,其中所述RNA包含两个或更多个外显子和一个或多个内含子,并且其中内含子REMS在分支点序列和3’剪接位点序列的上游。在一些方面,人工基因构建体如下制备:将内含子REMS引入前体RNA的3’剪接位点的上游,其中所述RNA包含两个或更多个外显子和(多个)内含子。在具体方面,内含子REMS从内部引入内含子内。在某些方面,人工基因构建体如下制备:将分支点、3’剪接位点和内含子REMS引入mRNA中,其中所述REMS可以在分支点和3’剪接位点的下游或上游。内含子REMS充当5’剪接位点。在某些方面,内含子REMS位于内含子中。在一些方面,应注意将内含子REMS引入RNA序列,以免破坏开放阅读框或引入终止密码子。将内含子REMS引入RNA转录物中可能会或可能不会导致蛋白水平的氨基酸变化。在某些方面,将内含子REMS引入RNA转录物中导致蛋白水平的氨基酸变化。在一些方面,该氨基酸变化是保守的氨基酸取代。在其他方面,将内含子REMS引入RNA转录物中不会导致蛋白水平的氨基酸变化。可以使用本领域技术人员已知的技术将内含子REMS和其他元件,如分支点或3’剪接位点引入RNA转录物中。
在一些方面,人工基因构建体存在于病毒载体(例如,腺相关病毒(AAV)、自互补腺相关病毒(scAAV)、腺病毒、逆转录病毒、慢病毒(例如,猿猴免疫缺陷病毒、人免疫缺陷病毒或改良人免疫缺陷病毒)、新城疫病毒(NDV)、疱疹病毒(例如,单纯疱疹病毒)、甲病毒、牛痘病毒等)、质粒或其他载体(例如,非病毒载体,如阳性脂质体、脂质体、多微粒体(polymerosome)或纳米颗粒)。
在一些方面,人工基因构建体是被修饰以实现细胞摄取的RNA分子。在某些方面,人工基因构建体是包含假尿苷或其他修饰/人工核苷酸的RNA分子,用于增强细胞摄取和基因表达。
本文所述的人工基因构建体在基因治疗中的用途允许根据本文所述的化合物的存在调节由该构建体产生的蛋白的量和类型。化合物本质上是可调开关,其根据化合物剂量的量和持续时间,调节产生的蛋白的量和类型。
在某些方面,与本文所述的化合物不存在的情况下产生的功能性蛋白的量相比,在本文所述的化合物的存在下从作为DNA的人工基因构建体转录的RNA转录物将不会产生功能性蛋白或将产生实质上更少的功能性蛋白。例如,如果人工基因构建体包含在编码3’剪接位点的内含子核苷酸序列的下游的编码内含子REMS的核苷酸序列,则内含外显子的产生最终将导致更少量的原始蛋白(即,当不修饰RNA剪接时产生的蛋白)在本文所述的化合物的存在下产生。供选择地,在某些方面,与本文所述的化合物不存在的情况下产生的功能性蛋白的量相比,在本文所述的化合物的存在下从作为DNA的人工基因构建体转录的RNA转录物将产生功能性蛋白或将产生实质上更少的功能性蛋白。
在某些方面,在细胞培养物中使用人工基因构建体或包含人工基因构建体的载体。例如,在用人工基因构建体转染或用包含人工基因构建体的载体转导的(多种)细胞中,可以根据本文所述的化合物是否与(多种)转染的细胞接触,调节或修饰由人工基因构建体产生的蛋白的量和类型。例如,如果人工基因构建体包含在编码核苷酸序列的3’剪接位点的下游的编码内含子REMS的核苷酸序列,则相对于在化合物存在的情况下,在不存在化合物的情况下产生内含外显子的可能性将会更低。因此,本文所述的人工基因构建体的使用允许根据是否存在本文所述的化合物来调节由该构建体产生的蛋白的量和类型。换言之,本文所述的化合物实质上是调节产生的蛋白的量和类型的开关。例如,当试图评估某些基因的作用或某些药剂对途径的作用时,这种蛋白产生的调节可能是有用的。可以基于与转染的细胞接触的本文所述的化合物的量和/或该化合物与转染的细胞接触的时间,来修饰产生的蛋白的量。
在某些方面,将动物(例如,非人类动物,例如小鼠、大鼠、蝇等)工程化以包含人工基因构建体或包含人工基因构建体的载体。本领域技术人员已知的技术可用于工程化这样的动物。可以通过是否将本文所述的化合物施用于动物来调节由该工程动物产生的蛋白的量。可以基于向工程动物施用本文所述的化合物的剂量和/或持续时间来滴定测量产生的蛋白的量。在某些方面,人工基因构建体编码可检测的报告基因,例如绿色荧光蛋白(GFP)、黄色荧光蛋白(YFP)、红色荧光蛋白、β-半乳糖苷酶、海肾荧光素酶、萤火虫荧光素酶等。根据该方面,该工程动物可用于监测不同阶段的发育,可视化组织功能等。在其他方面,人工基因构建体编码治疗性基因产物,例如本文所述。根据该方面,该工程动物可用于监测不同阶段的发育或用于功能生物学研究,其中某些蛋白或蛋白同种型仅需要表达一段时间而不是组成性表达等。
在某些方面,人工基因构建体或包含人工基因构建体的载体用于基因治疗。载体的非限制性实例包括但不限于质粒和病毒载体,例如源自复制缺陷型逆转录病毒、腺病毒、腺相关病毒和杆状病毒的载体。载体可以是RNA载体或优选地是DNA载体。
基因治疗
另一方面,可以提供人工基因构建体或包含人工基因构建体的载体以用于基因治疗。本文所述的人工基因构建体在基因治疗中的用途允许根据是否存在本文所述的化合物来调节由所述构建体产生的蛋白的量和类型。该化合物本质上是调节产生的蛋白的量和类型的开关。
在本文提供的某些方面,与本文所述的化合物不存在的情况下产生的功能性蛋白的量相比,在本文所述的化合物的存在下从作为DNA的人工基因构建体转录的RNA转录物将产生实质上更多的功能性蛋白。例如,包含在编码分支点的核苷酸序列和3’剪接位点下游的编码内含子REMS的核苷酸序列的人工基因构建体或载体,在本文所述的化合物不存在的情况下产生内含外显子的可能性更低。如果由于包含iExon而产生的蛋白是功能性蛋白,则化合物施用的结果将最终导致由人工基因构建体产生更多的功能性蛋白。因此,当人工基因构建体或包含人工基因构建体的载体在本文所述的化合物的存在下增加了产生内含外显子的可能性时,该构建体或载体可以用于治疗和/或预防与基因相关的某些病症或疾病。所述病症或疾病可以包括本文所述的那些。
供选择地,在某些方面,与本文所述的化合物不存在的情况下产生的功能性蛋白的量相比,在本文所述的化合物的存在下从作为DNA的人工基因构建体转录的RNA转录物将产生实质上更少的功能性蛋白。例如,包含编码内含子REMS的核苷酸序列的人工基因构建体或载体在本文所述的化合物的存在下产生内含外显子的可能性更高。如果由于包含iExon而产生的蛋白不是功能性蛋白,但在没有包含iExon的情况下产生的蛋白是功能性蛋白,则化合物施用的结果将导致功能性蛋白的产生减少。然而,在本文所述的化合物不存在的情况下,会发生正常剪接,并且功能性蛋白的产生不会减少。可以根据化合物的剂量和给药时间来滴定测量产生的蛋白的量和类型。在具体方面,用于基因治疗的人工基因构建体包含RNA序列,所述RNA序列包含两个外显子和内含子,其中第一外显子在内含子的上游,并且第二外显子在内含子的下游,其中所述内含子的RNA核苷酸序列按5’至3’顺序包含:第一5’剪接位点、第一分支点、第一3’剪接位点、iREMS、第二分支点和第二3’剪接位点,其中所述iREMS包含RNA序列GAgurngn,并且其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸。
在另一个具体方面,用于基因治疗的人工基因构建体包含RNA序列,所述RNA序列包含两个外显子和内含子,其中第一外显子在内含子的上游,并且第二外显子在内含子的下游,其中所述内含子的RNA核苷酸序列按5’至3’顺序包含:iREMS、分支点和3’剪接位点,其中所述iREMS包含RNA序列GAgurngn,并且其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸。
在另一个具体方面,用于基因治疗的人工基因构建体包含RNA序列,所述RNA序列包含两个外显子和内含子,其中所述RNA序列包含图1A所示的外显子和内含子元件。
在另一个具体方面,用于基因治疗的人工基因构建体包含RNA序列,所述RNA序列包含两个外显子和内含子,其中所述RNA序列包含图1B所示的外显子和内含子元件。
在另一个具体方面,用于基因治疗的人工基因构建体包含RNA序列,所述RNA序列包含两个外显子和内含子,其中所述RNA序列包含图1C所示的外显子和内含子元件。
在另一个具体方面,用于基因治疗的人工基因构建体包含编码两个外显子和内含子的DNA序列,其中编码第一外显子的核苷酸序列在编码内含子的核苷酸序列的上游,并且编码第二外显子的核苷酸序列在编码内含子的核苷酸序列的下游,其中所述编码内含子的核苷酸序列按5’至3’顺序包含:编码第一5’剪接位点的核苷酸序列、编码第一分支点的核苷酸序列、编码第一3’剪接位点的核苷酸序列、编码iREMS的核苷酸序列、编码第二分支点的核苷酸序列和编码第二3’剪接位点的核苷酸序列,其中编码所述iREMS的核苷酸序列包含DNA序列GAgtrngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸。
在另一个具体方面,用于基因治疗的人工基因构建体包含编码两个外显子和内含子的DNA序列,其中编码第一外显子的核苷酸序列在编码内含子的核苷酸序列的上游,并且编码第二外显子的核苷酸序列在编码内含子的核苷酸序列的下游,其中所述编码内含子的核苷酸序列按5’至3’顺序包含:编码iREMS的核苷酸序列、编码分支点的核苷酸序列和编码3’剪接位点的核苷酸序列,其中编码所述iREMS的核苷酸序列包含DNA序列GAgtrngn,其中r为腺嘌呤或鸟嘌呤,并且n为任何核苷酸。
在另一个具体方面,用于基因治疗的人工基因构建体包含编码两个外显子和内含子的DNA序列,其中所述DNA序列编码图1A所示的外显子和内含子元件。
在另一个具体方面,用于基因治疗的人工基因构建体包含编码两个外显子和内含子的DNA序列,其中所述DNA序列编码图1B所示的外显子和内含子元件。
在另一个具体方面,用于基因治疗的人工基因构建体包含编码两个外显子和内含子的DNA序列,其中所述DNA序列编码图1C所示的外显子和内含子元件。
可以将人工基因构建体,包含人工基因构建体的载体,或包含被修饰以允许细胞摄取的人工基因构建体的RNA分子引入细胞或直接施用于患者。一方面,将人工基因构建体或包含人工基因构建体的载体离体或体内引入细胞中。在具体方面,将人工基因构建体或载体离体引入(多种)细胞中,并且可以将所述(多种)细胞施用于对象。可以使用本领域技术人员已知的多种技术将人工基因构建体或包含人工基因构建体的载体引入(多种)细胞,例如电穿孔、转染、转化等。另一方面,将人工基因构建体或包含人工基因构建体的载体施用于对象。可以通过本领域技术人员已知的任何技术,例如通过肌肉内、静脉内、皮下、皮内、局部、鞘内、腹膜内、肿瘤内等将人工基因构建体或包含人工基因构建体的载体施用于对象。在一些方面,人工基因构建体或包含人工基因构建体的载体全身施用于对象。在其他方面,人工基因构建体或包含人工基因构建体的载体局部施用于对象。
修饰内源基因
另一方面,本文提供了用于修饰内源基因以使得得到的基因包含编码内含子REMS的核苷酸序列,或包含编码内含子REMS的另外的核苷酸序列的方法(换句话说,内含子REMS不是天然存在于内源基因中的,即非内源内含子REMS)。在具体方面,本文提供了用于修饰内源基因,以使得到的基因包含编码内含子REMS的核苷酸序列,并且包含在编码内含子REMS的核苷酸序列上游的编码分支点的核苷酸序列和编码3’剪接位点的核苷酸序列的方法。
如本文所使用,术语“内源基因”是指天然存在于细胞或存活对象中的基因。本领域技术人员已知的技术可用于将以下任意一种、两种或全部引入内源基因:分支点、3’剪接位点和内含子REMS,例如,可以使用CRISPR-Cas方法、TALEN或ZFN。在某些方面,编码现有的5’剪接位点的核苷酸序列可以被内含子REMS替代,或者内含子REMS可以内部插入内含子REMS内。在一些方面,应注意将编码内含子REMS的核苷酸序列引入内源基因,以免破坏开放阅读框或引入终止密码子。将编码内含子REMS的核苷酸序列引入内源基因可能会或可能不会导致蛋白水平的氨基酸变化。在某些方面,将编码内含子REMS的核苷酸序列引入内源基因导致蛋白水平的氨基酸变化。在一些方面,该氨基酸变化是保守的氨基酸取代。在其他方面,将编码内含子REMS的核苷酸序列引入内源基因中不会导致蛋白水平的氨基酸变化。
试剂盒
一方面,本文提供了试剂盒,其在容器中包含人工基因构建体或包含人工构建体的载体。在某些方面,试剂盒还在单独的容器中包含本文所述的化合物,和/或在单独的容器中包含阴性对照,例如磷酸盐缓冲盐水或不识别内含子REMS的化合物。在具体方面,试剂盒还包含阳性对照,例如包含本文所述的化合物作为阳性对照。在一些方面,试剂盒还在一个或多个单独的容器中包含引物和/或抗体,用于评估来自人工基因构建体的mRNA转录物的产生和/或由此引起的蛋白产生。
另一方面,本文提供了试剂盒,其在一个或多个容器中包含产生人工基因构建体所需的组分和/或试剂和/或包含人工基因构建体的载体。另一方面,本文提供了试剂盒,其在一个或多个容器中包含修饰内源基因所需的组分和/或试剂,以使其包含编码内含子REMS的核苷酸序列或编码内含子REMS的另外的核苷酸序列(换言之,在内源基因中非天然存在的REMS,即非内源REMS)。另一方面,本文提供了试剂盒,其在一个或多个容器中包含修饰内源基因所需的组分和/或试剂,以使得到的基因包含编码内含子REMS的核苷酸序列,并包含在编码内含子REMS的核苷酸序列上游的编码分支点的核苷酸序列和编码3’剪接位点的核苷酸序列。在一些方面,试剂盒还在一个或多个单独的容器中包含引物和/或抗体,用于评估来自修饰的内源基因的mRNA转录物的产生和/或由此引起的蛋白产生。
另一方面,本文提供了试剂盒,其在容器中包含本文所述的化合物和使用说明书。在一些方面,试剂盒还在单独的容器中包含阴性对照,如磷酸盐缓冲盐水或不识别内含子REMS的化合物。
实施例
为了更详细地描述并帮助理解本说明书,提供以下非限制性生物学实例以更充分地说明本说明书的范围,并且不应解释为具体地限制其范围。在本领域技术人员可以确定的范围内的可以目前已知或以后形成的本说明书的这种变化被认为落入本说明书的范围内,并且如以下所要求保护的。以下实施例说明了剪接修饰剂的内含子识别元件(REMS)的存在,其对于识别本文所述的化合物很重要,并且这样的化合物与前体RNA上的内含子REMS的结合允许或增强所述前体RNA的剪接,并暗示内含子REMS与本文所述的化合物组合用于修饰RNA剪接和调节基因产物的量的有用性。
材料和方法
细胞处理:将GM04856淋巴细胞在由DMEM、10%FBS和1x Pen/Strep组成的培养基中稀释至2.5e5个细胞/mL的浓度。将2mL(500K细胞)接种到6孔板中,并在37℃、5%CO2下恢复4h。将化合物稀释液在培养基中制备成2x化合物储备液(例如,对于最终100nM,制备200nM储备液)。恢复4h后,将2mL的2x化合物储备液添加到每个孔中,得到4mL/孔,最终化合物浓度为1x。将细胞在37℃、5%CO2下孵育~20h。孵育后,将细胞以1000rpm沉淀5min。真空去除上清液,并将细胞重悬于350μL RLT缓冲液(含10μL/mLβ-巯基乙醇,RNeasy试剂盒)中。根据制造商的说明,使用Qiagen的RNeasy Mini试剂盒分离总RNA。使用Nanodrop确定所得总RNA的浓度,并用水稀释至25ng/μL的终浓度。
终点RT-PCR和RNAseq:在培养的细胞中供选择地剪接的mRNA的分析
将源自患有神经母细胞瘤的女性患者的骨髓活检的SH-SY5Y细胞以600,000个细胞/孔接种在6孔板中的含有10%FBS的2mL DMEM中,并在细胞培养箱中孵育4小时(37℃,5%CO2,100%的相对湿度)。然后用不同浓度的化合物64(在0.1%DMSO中)处理细胞24小时。除去上清液后,将细胞在含有β-巯基乙醇的RLT缓冲液中裂解,并根据制造商的方案(RNeasy Mini试剂盒,Qiagen,Inc.)提取。
使用AgPath-IDTM一步法RT-PCR试剂(Life Technologies,Inc.),使用50ng总RNA作为输入进行一步法RT-PCR。使用以下PCR条件:步骤1:48℃(15min),步骤2:95℃(10min),步骤3:95℃(30sec),步骤4:55℃(30sec),步骤5:68℃(1min),重复步骤3至5,进行34个循环,然后保持在4℃下。使用表13至表19中列出的引物(对应于图2、3、4和5)确定了供选择地剪接的mRNA中iExons的存在。PCR产物在2%琼脂糖E-凝胶(Life Technologies,Inc.)上分离,用溴化乙锭染色,并使用凝胶成像仪(UVP)可视化。显示了通过用化合物64处理而产生的内含外显子影响的基因的结果,表21和表22分别显示了在24nm和100nm下用化合物64处理的SH-SY5Y细胞的结果,表23显示了在100nm下用化合物64处理的HD-1994细胞的结果。
对于RNAseq,如上所述处理SH-SY5Y细胞。总RNA(3μg)用于RNA链文库的制备和测序。使用低聚核苷酸(dT)珠富集mRNA,然后通过添加片段缓冲液随机片段化,然后通过使用mRNA模板和随机六聚体引物合成cDNA,然后添加定制的第二链合成缓冲液(Illumina)、dNTP、RNA酶H加入DNA聚合酶I以引发第二链合成。在一系列末端修复、连接和测序衔接头连接后,通过尺寸选择和PCR富集完成了双链cDNA文库。RNA文库在HiSeq测序仪中以每种样品>30M进行测序,然后产生150nt对末端读数。去除含有衔接头序列的读数,并使用STAR(2.5.1版)将其余的读数映射到人类基因组(hg19)。仅使用<5nt/100nt错配的唯一映射读数(MAPQ>10)和正确配对的读数。使用DESeq2对编码蛋白的基因的编码序列(CDS)区域和非编码基因的外显子区域的读取次数进行计数和分析(Love等,2014)。对于剪接分析,对注释或未注释但从RNA-seq确定的不同外显子的读数进行计数。对于每个外显子,使用支持包含或排除外显子的所有读数中支持包含外显子的平均读数的百分比来计算拼接百分比(PSI)值。比较了两种样品之间的PSI差异,并使用Fisher精确检验确定统计显著性。PSI增加>5%和P值<0.01用于选择该化合物包括的具有统计学显著的内含外显子。
结果:对应于iExon所在的内含子侧翼的外显子的寡核苷酸用于扩增从未经处理的(DMSO)或经化合物64(剂量水平为10nM、1μM或10μM)处理的细胞纯化的总RNA。
所得产物在琼脂糖凝胶上跑电泳,其中每种基因得到的目标条带用空心箭头和实心箭头表示,其中空心箭头表示其中发生内源野生型剪接的外显子同种型;并且其中实心箭头表示其中iExon包含在mRNA中的外显子同种型,如图2A、2B、3A、3B、4A、4B、5A、5B和6A所示。在所有情况下,化合物浓度的增加都会导致迁移更慢的包含内含子来源的外显子的PCR产物出现,其中看到的其他条带是中间剪接产物。每幅图中的星号(*)表示跳过目标外显子的事件。
表13.图2的正向引物
基因 | 正向引物 | 序列5'-3' | SEQ ID NO: |
ABCB8 | ABCB_54-73 | GCCGGCGGCTCCTGTTTTAC | 3635 |
ANXA11 | ANXA_101-120 | AGTCGCTGTACCACGACATC | 3636 |
ARL15 | ARL1_87-106-1a-KE | GCTGCCGGATGTCTGATCTC | 3637 |
ATG5 | ATG5_100-122-KE | ACGAATTCCAACTTGTTTCACGC | 3638 |
BECN1 | BECN_53-72 | TTGACCATGCAATGGTGGCT | 3639 |
C12orf4 | c12o_40-58 | GCCCAGGACTTCGGAACTA | 3640 |
DENND4A | DENN_79-98-KE | GATCCGGGACAGCCCTTGTA | 3641 |
DIAPH3 | DIAP_6-25 | CGGCAGAGTCTCAGTCCAAT | 3642 |
EVC | EVC_61-80-KE | GGCACTGAGGCAGGAAAAGC | 3643 |
FAM162A | FAM1_54-72 | GTCGGCGGAGTAGCAAGTG | 3644 |
HTT | HTT_E49_For | TGCCCAGTCATTTGCACCTT | 3645 |
MMS22L | MMS22Le14F1 | TGGTGTCTAAGAATGAGGAAATGGTA | 3646 |
NIPA1 | NIPA1e4R1 | TTTGGGGAGTGGATAATCAGCA | 3647 |
PAPD4 | PAPD_46-65-KE | CCCGGAGCAGTGATGGTGAT | 3648 |
PDXDC1 | PDXD_23-42 | TGTGCCGTGTACCCTGTAAC | 3649 |
RAF1 | RAF1_90-112-KE | CGACATCCACACCTAATGTCCAC | 3650 |
SENP6 | SENP_12-36-KE | TCAGAGTCTAAGAGAGATGGAGGTT | 3651 |
SF3B3 | SF3B-9a_122-143-KE | CTGGTTGATGAGTTGGACAGCC | 3652 |
SF3B3 | SF3B-2a_84-105-KE | ACTTAACCTTGCAGAGAGCCAC | 3653 |
TBCA | TBCA_21-39-KE | GCCTAAATAGCCGCAGCCT | 3654 |
UBE2L3 | UBE2_18-36 | GCCAGCAGGAGGCTGATGA | 3655 |
XRN2 | XRN2_28-47 | TTCACATCTGATGGCTCCCC | 3656 |
ZFAND1 | ZFAN_9-32-KE | CCATTTGTGTGTGATGATTGTTCA | 3657 |
表14.图2的反向引物
表15.图3的正向引物
基因 | 正向引物 | 序列5'-3' | SEQ ID NO: |
ACVR1B | ACVR_171-190-KE | TACCAGACGGTCATGCTGCG | 3681 |
AXIN1 | AXIN_198-217-KE | AAAAGAGAGCCAGCCGAGCA | 3682 |
CENPI | CENP_177-201-KE | TCATCCTTCTTTCTTGAGTTACGCT | 3683 |
DCAF17 | DCAF_84-103-KE | TTATCGGCGCTGTGTCAGCA | 3684 |
FAM174A | FAM1_85-109-KE | GGATGATGAGGATGATGACAACACG | 3685 |
FBL | FBL_99-118 | TGCTCGACACCCACACAAAT | 3686 |
GNG12 | GNG1_17-39-KE | ACCTGAAAACATTGGACCACACA | 3687 |
GXYLT1 | GXYL_57-77 | GGAAGCAATTGCCAAGAAGCA | 3688 |
HMGXB4 | HMGX_829-848-KE | CTCCCAGCATCCCATACGCT | 3689 |
IVD | IVD_40-60-KE | CTGGGGATGAGGGGCTCTAAC | 3690 |
KDM6A | KDM6_94-116-KE | TGGCACGAAATATCAAGGTCTCA | 3691 |
MADD | MADD_137-156-KE | TGCCACAGGAAAGGGTCCTA | 3692 |
MRPL45 | MRP4_42-65 | AGGACTTCCCTGAAAAAGCTAAGG | 3693 |
NSUN4 | NSUN_142-160-KE | AGGGGGACACCTATGACCG | 3694 |
NUPL1 | NUPL_144-163 | GTCCACAGGGTTCTCCTTCG | 3695 |
PPIP5K2 | PPIP_34-57-KE | TCAGTTGACCTATCTCCCTCATGG | 3696 |
SOS2 | SOS2_86-107-KE | AACCTCGAAACTGCAAACAGCC | 3697 |
STAT1 | STAT_68-88-KE | TTCCTGCTGCGGTTCAGTGAG | 3698 |
STRN3 | STRN_95-115-KE | GTGAAGGAGCTGGAGAAGCAC | 3699 |
TNS3 | TNS3_6-29-KE | CCAGGTGATAAACTTGTGATCGTG | 3700 |
WNK1 | WNK1_45-67 | GCTGGTGTTTTTAAGATGGGACG | 3701 |
表16.图3的反向引物
表17.图4的正向引物
表18.图4的反向引物
表19.图5的正向引物
基因 | 正向引物 | 序列5'-3' | SEQ ID NO: |
ASAP1 | ASAP_64-83-19a-KE | TCACCAAAACCCACCCCTTC | 3751 |
ATF6 | ATF6_65-85 | GAAGCCATCCGCAGAAGGGGA | 3752 |
CRYL1 | CRYL_36-56-KE | CATGTCAGAAGGGTTGGGCAT | 3753 |
CTNS | CTNS_14-33 | CCTCACTGTTCCTCCTGTCG | 3754 |
DENND5A | DENN_178-199-8a-KE | CGGACACCTACTCTCCGTACAT | 3755 |
DGKI | DGKI_81-101-KE | CCATGTGGAAAGAAACCCCGA | 3756 |
DLGAP4 | DLGA_281-301-KE | AAGTGAACAAGGGACGCTGAC | 3757 |
ELMO2 | ELMO_53-72-KE | TGCCACCACCGTCAGACATT | 3758 |
ENTPD1 | ENTP_79-97-KE | TTGCTTGCTGTGGGGTTGAC | 3759 |
ERGIC3 | ERGI_128-147-KE | GAAGGCTGCCAGGTGTATGG | 3760 |
GNAQ | GNAQ_143-164-KE | CATGGACACACTCAAGATCCCA | 3761 |
KIAA1524 | KIAA_107-129-KE | GGGATTTGGAACAAAGGTTGCAG | 3762 |
KIAA1715 | KIAA_2-26 | TGAAGCATTGGATGATTTAAAATCC | 3763 |
L3MBTL2 | L3MB_47-67-KE | TTACAAGGCTGCTCCCGTCAG | 3764 |
LRRC42 | LRCC_190-211 | CCAGTGAATACTAGAGGGATCG | 3765 |
MAN1A2 | MAN1_24-46-KE | ATTGGCTGAGAAACTCCTTCCTG | 3766 |
MMS19 | MMS1_22-45-KE | CAGTGTTACAAGTTGTGGAAGCCC | 3767 |
PMS1 | PMS1_104-127-KE | TCTCCTCATGAGCTTTGGTATCCT | 3768 |
POMT2 | POMT_10-29 | ACCCTTCCTTCCCAGTGGAG | 3769 |
PRPF31 | RPRF_50-69-KE | GCCAACCGTATGAGCTTCGG | 3770 |
SKP1 | SKP1_56-75 | TCTTCCTTCGCTAACGCCTC | 3771 |
STRN | STRN_84-105-KE | GAGAGAAAGGGGAAAAAGGGGG | 3772 |
STRN4 | STRN_33-52-4a-KE | GAGAACAGCCCGTTGGTGTG | 3773 |
SUPT20H | SUPT_8-30-KE | AGCAAGGTTCAACCAGTCAAGAA | 3774 |
TMEM214 | TMEM_55-75 | CCCACTTCTGGACTTTGCCTA | 3775 |
UBAP2L | UBAP_60-79-KE | CCCTTTCCAACAGCCGAGTG | 3776 |
VDAC2 | VDAC_25-48 | ATTGGAGTAGGCTATACTCAGACT | 3777 |
VPS29 | VPS2_12-31-KE | CGACGGTGGTGGTGACTGAG | 3778 |
表20–图5的引物
结果:根据用24nM(表21)和100nM(表22)的化合物64处理的SH-SY5Y细胞和用100nM(表23)化合物64处理的HD-1994人正常成纤维细胞系细胞中的Fisher精确检验(FET)得到的RNA-seq数据iExon产生(ΔPSI),各自提供了基因表达的基于Log2的倍数变化(Log2FC),其中NA表示“不可用”。HD1994细胞中的RNA-seq数据分析获得自Palacino等人(Nat.Chem.Bio.,2015,(11)511-517;NCBI-SRA登录号SRP055454)。
确定的RNA转录物的调节的表达的ΔPSI在表21、表22和表23中用星号表示,其中一个星号(*)表示表达变化≤25%,其中两个星号(**)表示表达变化在>25%至≤50%变化的范围内,其中三个星号(***)表示表达变化在>50%至≤75%变化的范围内,并且其中四个星号(****)表示表达变化在>75%至≤100%变化的范围内。
表21.在24nm下的SHSY5Y细胞中的化合物作用
表22.在100nm下的SHSY5Y细胞中的化合物作用
表23.在100nm下的HD-1994细胞中的化合物作用
表24中显示了来自表21、表22和表23的受影响基因中产生的iExon的位置的细节。
表24.基因坐标
表25中显示了在表24中所示坐标处在某些受影响的基因中产生的iExon的序列。在某些情况下,对iExon序列的量和类型的检测和分析是有用的生物标志物,其是由于使细胞与本文所述的化合物接触或向有此需要的对象施用本文所述的化合物而产生的。
表25.基因序列
结果:对于某些基因,其中剪接修饰的值可能已经被认为是统计上不显著的,在那些情况下,这些值促使人工检查RNAseq数据中包含iExon产生的可能性。显示有定性读数支持iExon包含的那些事件随后通过终点PCR进行验证。如本文所示,已经针对大量目标证明并验证了iExon的存在。
应当理解,尽管出于说明的目的已经在本文中描述了本发明的特定方面,但是本文所描述的发明在范围上不受本文所公开的特定方面的限制。这些方面旨在作为本发明的几个方面的说明。任何等同方面都意图在本发明的范围内。实际上,根据前面的描述,除了本文中示出和描述的那些之外,本发明的各种修改对于本领域技术人员而言将变得显而易见,该修改也意图在本发明的范围内。
本文引用的所有参考文献通过整体引用并出于所有目的并入本文,就如同每个单独的出版物或专利或专利申请被具体地并单独地指出出于所有目的通过整体引用并入本文。
Claims (5)
1.一种用于修饰RNA剪接以产生具有iExon的成熟mRNA转录物的方法,所述方法包括使前体mRNA转录物与式(I)的化合物或其形式接触,其中所述前体mRNA转录物包含两个外显子和内含子,其中第一外显子在所述内含子的上游,并且第二外显子在所述内含子的下游,其中所述内含子按5’至3’顺序包含:第一5’剪接位点、第一分支点、第一3’剪接位点、剪接修饰剂的内含子识别元件(iREMS)、第二分支点和第二3’剪接位点,其中所述iREMS包含RNA序列GAgurngn,其中r为腺嘌呤或鸟嘌呤,n为任何核苷酸,并且其中式(I)为:
或其形式,其中
W为CH=CH或S;
X为CH2、CH(C1-4烷基)、C(C1-4烷基)2、CH=CH、O、NR5或键;
A为芳基、杂芳基、杂环基或C9-10环烷基,
其中芳基选自苯基和萘基,其各自任选地被1、2、3或4个各自选自R1的取代基取代,
其中杂芳基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R1的取代基取代,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员饱和或部分不饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R2的取代基取代,和
其中C9-10环烷基为任选地被1、2、3、4或5个各自选自R2的取代基取代的饱和或部分不饱和二环环系;
B为杂环基,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或多环环系,其各自任选地被1、2、3、4或5个各自选自R4的取代基取代;
R1为卤素、羟基、氰基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、杂环基-C1-4烷氧基、苯基或苯基-C1-4烷氧基,
其中杂芳基为具有1、2或3个选自N、O和S的杂原子环成员的饱和单环或二环环系,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中苯基、杂芳基或杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R2为卤素、羟基、氰基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、羟基-C1-4烷基、C1-4烷氧基、C1-4烷氧基-羰基、C2-4烯基、C3-7环烷基或杂环基-C1-4烷基,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R3为卤素、羟基、硝基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、苯基或苯基-C1-4烷氧基;
R4独立地选自卤素、C1-4烷基、羟基-C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基或羟基-C1-4烷基-氨基;和
R5为氢、C1-4烷基或羟基-C1-4烷基;
其中所述化合物的形式选自其前药、盐、水合物、溶剂化物、包合物、同位素体、外消旋体、对映异构体、非对映异构体、立体异构体、多晶型物和互变异构体形式。
2.一种用于修饰RNA剪接以调节由前体mRNA转录物产生的成熟mRNA转录物的量的方法,所述方法包括使前体mRNA转录物与式(I)的化合物或其形式接触,其中所述前体mRNA转录物包含两个外显子和内含子,其中第一外显子在内含子的上游,并且第二外显子在内含子的下游,其中所述内含子包含RNA核苷酸序列,所述核苷酸序列按5’至3’顺序包含:剪接修饰剂的内含子识别元件(iREMS)、分支点和3’剪接位点,其中所述iREMS包含RNA序列GAgurngn,其中r为腺嘌呤或鸟嘌呤,n为任何核苷酸,并且其中式(I)为:
或其形式,其中
W为CH=CH或S;
X为CH2、CH(C1-4烷基)、C(C1-4烷基)2、CH=CH、O、NR5或键;
A为芳基、杂芳基、杂环基或C9-10环烷基,
其中芳基选自苯基和萘基,其各自任选地被1、2、3或4个各自选自R1的取代基取代,
其中杂芳基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R1的取代基取代,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或三环环系,其各自任选地被1、2、3、4或5个各自选自R2的取代基取代,和
其中C9-10环烷基为任选地被1、2、3、4或5个各自选自R2的取代基取代的饱和或部分不饱和二环环系;
B为杂环基,
其中杂环基为具有1、2或3个独立地选自N、O或S的杂原子环成员的饱和或部分不饱和单环、二环或多环环系,其各自任选地被1、2、3、4或5个各自选自R4的取代基取代;
R1为卤素、羟基、氰基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、杂环基-C1-4烷氧基、苯基或苯基-C1-4烷氧基,
其中杂芳基为具有1、2或3个选自N、O和S的杂原子环成员的饱和单环或二环环系,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中苯基、杂芳基或杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R2为卤素、羟基、氰基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、羟基-C1-4烷基、C1-4烷氧基、C1-4烷氧基-羰基、C2-4烯基、C3-7环烷基或杂环基-C1-4烷基,
其中杂环基为具有1、2或3个选自N、O和S的杂原子环成员的饱和或部分不饱和单环或二环环系,和
其中杂环基的每个实例任选地被1或2个各自选自R3的取代基取代;
R3为卤素、羟基、硝基、氧代基、羟基-亚氨基、C1-4烷基、卤代C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基、氨基-C1-4烷基、C1-4烷基-氨基-C1-4烷基、(C1-4烷基)2-氨基-C1-4烷基、氨基-羰基、C1-4烷基-氨基-羰基、(C1-4烷基)2-氨基-羰基、C1-4烷基-氨基-羰基-C1-4烷基、(C1-4烷基)2-氨基-羰基-C1-4烷基、C1-4烷基-羰基-氨基、C1-4烷基-羰基-氨基-C1-4烷基、羟基-C1-4烷基、C1-4烷基-羰基、C1-4烷氧基、卤代C1-4烷氧基、氨基-C1-4烷氧基、羟基-C1-4烷氧基、C1-4烷基-C1-4烷氧基、C1-4烷基-氨基-C1-4烷氧基、(C1-4烷基)2-氨基-C1-4烷氧基、C1-4烷基-羰基-氨基-C1-4烷氧基、C1-4烷氧基-C1-4烷氧基、C1-4烷氧基-羰基、C1-4烷氧基-羰基-氨基、C1-4烷氧基-羰基-氨基-C1-4烷氧基、C2-4烯基、C2-4烯基-氨基-羰基、C3-7环烷基、C3-7环烷基-C1-4烷氧基、C3-7环烯基、杂芳基、杂芳基-C1-4烷基、杂芳基-C1-4烷基-氨基、杂芳基-C1-4烷基-氨基-羰基、杂芳基-C1-4烷基-羰基-氨基、杂芳基-C1-4烷基-氨基-羰基-C1-4烷基、杂芳基-C1-4烷基-羰基-氨基-C1-4烷基、杂环基、杂环基-C1-4烷基、苯基或苯基-C1-4烷氧基;
R4独立地选自卤素、C1-4烷基、羟基-C1-4烷基、氨基、C1-4烷基-氨基、(C1-4烷基)2-氨基或羟基-C1-4烷基-氨基;和
R5为氢、C1-4烷基或羟基-C1-4烷基;
其中化合物的形式选自其前药、盐、水合物、溶剂化物、包合物、同位素体、外消旋体、对映异构体、非对映异构体、立体异构体、多晶型物和互变异构体形式。
3.权利要求1或2所述的方法,其中所述iREMS包含RNA序列GAguragu,并且其中r为腺嘌呤或鸟嘌呤。
4.权利要求1或2所述的方法,其中所述iREMS包含RNA序列NNGAgurngn(SEQ ID NO:1),其中r为腺嘌呤或鸟嘌呤,n或N为任何核苷酸,并且其中所述RNA序列NNGAgurngn(SEQ IDNO:1)选自:ANGAgurngn(SEQ ID NO:4)、CNGAgurngn(SEQ ID NO:5)、GNGAgurngn(SEQ IDNO:6)、UNGAgurngn(SEQ ID NO:7)、NAGAgurngn(SEQ ID NO:8)、NCGAgurngn(SEQ ID NO:9)、NGGAgurngn(SEQ ID NO:10)、NUGAgurngn(SEQ ID NO:11)、AAGAgurngn(SEQ ID NO:12)、ACGAgurngn(SEQ ID NO:13)、AGGAgurngn(SEQ ID NO:14)、AUGAgurngn(SEQ ID NO:15)、CAGAgurngn(SEQ ID NO:16)、CCGAgurngn(SEQ ID NO:17)、CGGAgurngn(SEQ ID NO:18)、CUGAgurngn(SEQ ID NO:19)、GAGAgurngn(SEQ ID NO:20)、GCGAgurngn(SEQ ID NO:21)、GGGAgurngn(SEQ ID NO:22)、GUGAgurngn(SEQ ID NO:23)、UAGAgurngn(SEQ ID NO:24)、UCGAgurngn(SEQ ID NO:25)、UGGAgurngn(SEQ ID NO:52)和UUGAgurngn(SEQ ID NO:53),其中r为腺嘌呤或鸟嘌呤,并且n或N为任何核苷酸。
5.权利要求1或2所述的方法,其中所述iREMS包含RNA序列NNGAguragu(SEQ ID NO:2),其中r为腺嘌呤或鸟嘌呤,N为任何核苷酸,并且其中所述RNA序列NNGAguragu(SEQ ID NO:2)选自:ANGAguragu(SEQ ID NO:28)、CNGAguragu(SEQ ID NO:29)、GNGAguragu(SEQ IDNO:30)、UNGAguragu(SEQ ID NO:31)、NAGAguragu(SEQ ID NO:32)、NCGAguragu(SEQ IDNO:33)、NGGAguragu(SEQ ID NO:34)、NUGAguragu(SEQ ID NO:35)、AAGAguragu(SEQ IDNO:36)、ACGAguragu(SEQ ID NO:37)、AGGAguragu(SEQ ID NO:38)、AUGAguragu(SEQ IDNO:39)、CAGAguragu(SEQ ID NO:40)、CCGAguragu(SEQ ID NO:41)、CGGAguragu(SEQ IDNO:42)、CUGAguragu(SEQ ID NO:43)、GAGAguragu(SEQ ID NO:44)、GCGAguragu(SEQ IDNO:45)、GGGAguragu(SEQ ID NO:46)、GUGAguragu(SEQ ID NO:47)、UAGAguragu(SEQ IDNO:48)、UCGAguragu(SEQ ID NO:49)、UGGAguragu(SEQ ID NO:489)和UUGAguragu(SEQ IDNO:508),其中r为腺嘌呤或鸟嘌呤,并且N为任何核苷酸。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201762519226P | 2017-06-14 | 2017-06-14 | |
US62/519,226 | 2017-06-14 | ||
PCT/US2018/037412 WO2018232039A1 (en) | 2017-06-14 | 2018-06-13 | Methods for modifying rna splicing |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111372611A true CN111372611A (zh) | 2020-07-03 |
Family
ID=64659912
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201880052678.0A Pending CN111372611A (zh) | 2017-06-14 | 2018-06-13 | 修饰rna剪接的方法 |
Country Status (11)
Country | Link |
---|---|
US (1) | US11608501B2 (zh) |
EP (1) | EP3638318A4 (zh) |
JP (1) | JP2020523365A (zh) |
KR (1) | KR20200017476A (zh) |
CN (1) | CN111372611A (zh) |
AU (1) | AU2018284853A1 (zh) |
BR (1) | BR112019026508A2 (zh) |
CA (1) | CA3065547A1 (zh) |
EA (1) | EA202090034A1 (zh) |
IL (1) | IL271053A (zh) |
WO (1) | WO2018232039A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111194215A (zh) * | 2017-08-04 | 2020-05-22 | 斯基霍克疗法公司 | 用于调节剪接的方法和组合物 |
Families Citing this family (45)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP4249472A3 (en) | 2015-05-30 | 2023-12-13 | PTC Therapeutics, Inc. | Methods for modulating rna splicing |
EA201991309A1 (ru) | 2016-11-28 | 2019-11-29 | Способы модуляции сплайсинга рнк | |
JP2020523365A (ja) | 2017-06-14 | 2020-08-06 | ピーティーシー セラピューティクス,インコーポレーテッド | Rnaスプライシングを改変する方法 |
JP2021506978A (ja) | 2017-12-22 | 2021-02-22 | ラヴェンナ ファーマシューティカルズ,インコーポレイテッド | ホスファチジルイノシトールリン酸キナーゼ阻害剤としてのアミノピリジン誘導体 |
KR20210135242A (ko) * | 2019-02-04 | 2021-11-12 | 스카이호크 테라퓨틱스, 인코포레이티드 | 스플라이싱을 조절하는 방법 및 조성물 |
CN113692402A (zh) * | 2019-02-04 | 2021-11-23 | 斯基霍克疗法公司 | 用于调节剪接的方法和组合物 |
WO2020163382A1 (en) * | 2019-02-04 | 2020-08-13 | Skyhawk Therapeutics, Inc. | Methods and compositions for modulating splicing |
WO2020163248A1 (en) * | 2019-02-04 | 2020-08-13 | Skyhawk Therapeutics, Inc. | Methods and compositions for modulating splicing |
JP2022521467A (ja) * | 2019-02-05 | 2022-04-08 | スカイホーク・セラピューティクス・インコーポレーテッド | スプライシングを調節するための方法および組成物 |
WO2020163401A1 (en) * | 2019-02-05 | 2020-08-13 | Skyhawk Therapeutics, Inc. | Methods and compositions for modulating splicing |
JP2022520051A (ja) * | 2019-02-05 | 2022-03-28 | スカイホーク・セラピューティクス・インコーポレーテッド | スプライシングを調節するための方法および組成物 |
WO2020163409A1 (en) * | 2019-02-05 | 2020-08-13 | Skyhawk Therapeutics, Inc. | Methods and compositions for modulating splicing |
KR20210135239A (ko) * | 2019-02-05 | 2021-11-12 | 스카이호크 테라퓨틱스, 인코포레이티드 | 스플라이싱을 조절하는 방법 및 조성물 |
EP3920928A4 (en) * | 2019-02-06 | 2022-09-28 | Skyhawk Therapeutics, Inc. | METHODS AND COMPOSITIONS FOR MODULATION OF SPLICING |
KR20210135511A (ko) * | 2019-02-06 | 2021-11-15 | 스카이호크 테라퓨틱스, 인코포레이티드 | 스플라이싱을 조절하는 방법 및 조성물 |
AR119731A1 (es) | 2019-05-17 | 2022-01-05 | Novartis Ag | Inhibidores del inflamasoma nlrp3 |
WO2020248018A1 (en) * | 2019-06-14 | 2020-12-17 | Children's Medical Research Institute | Methods of treating cancer with an inhibitor of znf827 |
US11129829B2 (en) * | 2019-06-17 | 2021-09-28 | Skyhawk Therapeutics, Inc. | Methods for modulating splicing |
TW202112767A (zh) | 2019-06-17 | 2021-04-01 | 美商佩特拉製藥公司 | 作為磷脂酸肌醇磷酸激酶抑制劑之胺基吡啶衍生物 |
JP2023500251A (ja) | 2019-11-01 | 2023-01-05 | ノバルティス アーゲー | ハンチントン病の進行を遅らせる処置のためのスプライシングモジュレーターの使用 |
WO2021126779A1 (en) * | 2019-12-18 | 2021-06-24 | The Regents Of The University Of California | Inhibitors of lin28 and methods of use thereof |
WO2021138678A1 (en) * | 2020-01-02 | 2021-07-08 | The General Hospital Corporation | Rna splicing modulation |
US20230140983A1 (en) | 2020-02-28 | 2023-05-11 | Remix Therapeutics Inc. | Pyridazine derivatives for modulating nucleic acid splicing |
AU2021228770A1 (en) | 2020-02-28 | 2022-09-29 | Remix Therapeutics Inc. | Thiophenyl derivatives useful for modulating nucleic acid splicing |
WO2021174167A1 (en) | 2020-02-28 | 2021-09-02 | Remix Therapeutics Inc. | Compounds and methods for modulating splicing |
WO2021174164A1 (en) | 2020-02-28 | 2021-09-02 | Remix Therapeutics Inc. | Compounds and methods for modulating splicing |
WO2021207550A1 (en) | 2020-04-08 | 2021-10-14 | Remix Therapeutics Inc. | Compounds and methods for modulating splicing |
MX2022012678A (es) | 2020-04-08 | 2023-01-11 | Remix Therapeutics Inc | Compuestos y metodos para modular el corte y empalme. |
TW202208358A (zh) | 2020-05-13 | 2022-03-01 | 美商Chdi基金會股份有限公司 | 用於治療亨汀頓舞蹈症之htt調節劑 |
CN116157135A (zh) * | 2020-06-03 | 2023-05-23 | 纽约市哥伦比亚大学理事会 | 使用基于crispr的碱基编辑器系统抑制谱系特异性抗原的组合物和方法 |
BR112022027107A2 (pt) | 2020-07-02 | 2023-03-14 | Remix Therapeutics Inc | Derivados de 2-(indazol-5-il)-6-(piperidin-4-il)-1,7-naftiridina e compostos relacionados como moduladores para splicing de ácidos nucleicos e para o tratamento de doenças proliferativas |
AU2021300260A1 (en) | 2020-07-02 | 2023-02-09 | Remix Therapeutics Inc. | 5-[5-(piperidin-4-yl)thieno[3,2-c]pyrazol-2-yl]indazole derivatives and related compounds as modulators for splicing nucleic acids and for the treatment of proliferative diseases |
WO2022093835A1 (en) * | 2020-10-26 | 2022-05-05 | Remix Therapeutics Inc. | Oligonucleotides useful for modulation of splicing |
EP4244362A1 (en) * | 2020-11-12 | 2023-09-20 | PTC Therapeutics, Inc. | Novel rna transcript |
WO2022204471A1 (en) * | 2021-03-26 | 2022-09-29 | Ptc Therapeutics Inc. | Regulation of transgene expression using a small molecule inducible splicing switch |
WO2023034836A1 (en) | 2021-08-30 | 2023-03-09 | Remix Therapeutics Inc. | Compounds and methods for modulating splicing |
EP4396177A1 (en) | 2021-08-30 | 2024-07-10 | Remix Therapeutics Inc. | Compounds and methods for modulating splicing |
EP4395889A1 (en) | 2021-08-30 | 2024-07-10 | Remix Therapeutics Inc. | Compounds and methods for modulating splicing |
IL311135A (en) | 2021-08-30 | 2024-04-01 | Remix Therapeutics Inc | Splicing Modulation Compounds and Methods |
CA3230256A1 (en) | 2021-08-30 | 2023-03-09 | Dominic Reynolds | Compounds and methods for modulating splicing |
CA3233973A1 (en) | 2021-10-13 | 2023-04-20 | Dominic Reynolds | Compounds and methods for modulating nucleic acid splicing |
TW202330552A (zh) | 2021-10-13 | 2023-08-01 | 美商雷密克斯醫療公司 | 調節剪接之化合物及方法 |
TW202337442A (zh) | 2022-01-05 | 2023-10-01 | 美商雷密克斯醫療公司 | 用於調節剪切之化合物及方法 |
WO2023133225A1 (en) | 2022-01-05 | 2023-07-13 | Remix Therapeutics Inc. | Compounds and methods for modulating splicing |
WO2023133229A2 (en) | 2022-01-05 | 2023-07-13 | Remix Therapeutics Inc. | Compounds and methods for modulating splicing |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170001995A1 (en) * | 2015-02-09 | 2017-01-05 | Hoffmann-La Roche Inc. | Compounds for the treatment of cancer |
Family Cites Families (60)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3558618A (en) | 1968-04-01 | 1971-01-26 | Dow Chemical Co | Novel 4h-pyrazino(1,2-a)pyrimidine-4-ones |
US4122274A (en) | 1977-05-25 | 1978-10-24 | Bristol-Myers Company | 3-Tetrazolo-5,6,7,8-substituted-pyrido[1,2-a]pyrimidin-4-ones |
US4342870A (en) | 1980-03-28 | 1982-08-03 | Janssen Pharmaceutica N.V. | Novel 3-(1-piperidinylalkyl)-4H-pyrido[1,2-a]pyrimidin-4-one derivatives |
JPS56150091A (en) | 1980-03-28 | 1981-11-20 | Janssen Pharmaceutica Nv | 3-(1-piperidinylalkyl)-4h-pyrido(1,2-a)pyrimidine- 4-one derivative and its manufacture |
US5089633A (en) | 1987-04-28 | 1992-02-18 | Georgia Tech Research Corporation | Substituted isocoumarins |
US5726182A (en) | 1990-05-02 | 1998-03-10 | Abbott Laboratories | Quinolizinone type compounds |
AU4231293A (en) | 1992-05-13 | 1993-12-13 | E.I. Du Pont De Nemours And Company | Substituted pyrido(1,2-A)pyrimidinone derivatives as fungicides |
IL122296A0 (en) | 1995-06-06 | 1998-04-05 | Abbott Lab | Quinolizinone type compounds |
US5869500A (en) | 1996-12-13 | 1999-02-09 | Hoffmann-La Roche Inc. | Pyridone compounds useful in treating Alzheimer's disease |
EP1115724A1 (en) | 1998-09-21 | 2001-07-18 | Shire Biochem Inc. | Quinolizinones as integrin inhibitors |
WO2001030757A1 (fr) | 1999-10-28 | 2001-05-03 | Microcide Pharmaceuticals, Inc. | Inhibiteurs de la pompe par liberation de medicaments |
ATE363471T1 (de) | 2000-01-24 | 2007-06-15 | Astrazeneca Ab | Durch einen morpholinrest substituierte therapeutische verbindungen |
WO2002053576A1 (en) | 2001-01-05 | 2002-07-11 | The General Hospital Corporation | Viral delivery system for infectious transfer of large genomic dna inserts |
WO2002087589A1 (fr) | 2001-04-26 | 2002-11-07 | Daiichi Pharmaceutical Co., Ltd. | Medicament permettant d'inhiber une pompe d'elimination de medicament |
DE60236322D1 (de) | 2001-12-07 | 2010-06-17 | Vertex Pharma | Verbindungen auf pyrimidin-basis als gsk-3-hemmer |
GB0205281D0 (en) | 2002-03-06 | 2002-04-17 | Novartis Ag | Organic compounds |
WO2004009558A2 (en) | 2002-07-24 | 2004-01-29 | Ptc Therapeutics, Inc. | Ureido substituted benzoic acid compounds, their use for nonsense suppression and the treatment of diseases caused by such mutations |
US9068234B2 (en) | 2003-01-21 | 2015-06-30 | Ptc Therapeutics, Inc. | Methods and agents for screening for compounds capable of modulating gene expression |
MXPA05013142A (es) | 2003-06-20 | 2006-03-17 | Chiron Corp | Compuestos de piridinio [1,2-a]pirimidin-4-ona como agentes anticancer. |
BRPI0510560A (pt) | 2004-05-04 | 2007-11-20 | Warner Lambert Co | pirido[2,3-d] pirimidin-7-onas pirrolil substituìdas e seus derivados como agentes terapêuticos |
EP1846397A1 (en) | 2005-01-21 | 2007-10-24 | Janssen Pharmaceutica N.V. | Novel heterocyclic benzoy[c]chromene derivatives useful as modulators of the estrogen receptors |
US7563601B1 (en) | 2005-06-01 | 2009-07-21 | City Of Hope | Artificial riboswitch for controlling pre-mRNA splicing |
EP1910569A4 (en) | 2005-06-17 | 2009-08-05 | Genizon Biosciences Inc | GENEMAP GENE CARD OF HUMAN GENES ASSOCIATED WITH LONGEVITY |
WO2007085906A2 (en) | 2005-10-13 | 2007-08-02 | Bc Cancer Agency | Functional mutant loxp sequences and uses thereof |
AR059339A1 (es) | 2006-02-09 | 2008-03-26 | Chugai Pharmaceutical Co Ltd | Derivados de la cumarina para trastornos proliferativos de celulas, composicion farmaceutica y agente terapeutico que los contiene |
US8110681B2 (en) | 2006-03-17 | 2012-02-07 | The United States Of America As Represented By The Secretary, Department Of Health And Human Services | Compounds for the treatment of spinal muscular atrophy and other uses |
US8337941B2 (en) | 2006-07-27 | 2012-12-25 | The Trustees Of Columbia University In The City Of New York | Fluorescent substrates for monoamine transporters as optical false neurotransmitters |
NZ577491A (en) | 2006-12-22 | 2011-06-30 | Avexa Ltd | 2-heteroaryl-3-hydroxy-4-oxo-pyrido[1,2-a]pyrimidines and uses thereof |
US8633019B2 (en) | 2008-05-27 | 2014-01-21 | Ptc Therapeutics, Inc. | Methods for treating spinal muscular atrophy |
EP2138493A1 (en) | 2008-06-26 | 2009-12-30 | Sanofi-Aventis | Substituted pyrimidone derivatives |
PL2212324T3 (pl) | 2008-07-02 | 2014-11-28 | Avexa Ltd | Związki posiadające właściwości przeciwwirusowe |
US8986935B2 (en) | 2008-08-13 | 2015-03-24 | Ptc Therapeutics, Inc. | Methods for treating spinal muscular atrophy |
EP2381965B1 (en) | 2009-01-14 | 2020-05-06 | Drexel University | Modulation of pre-mrna using splice modulating oligonucleotides as therapeutic agents in the treatment of disease |
US20100303776A1 (en) | 2009-04-16 | 2010-12-02 | The University Of North Carolina At Chapel Hill | Methods and compositions for regulated expression of multiple nucleic acids |
WO2011050245A1 (en) | 2009-10-23 | 2011-04-28 | Yangbo Feng | Bicyclic heteroaryls as kinase inhibitors |
EP2501231B1 (en) | 2009-11-20 | 2016-12-21 | Merck Sharp & Dohme Corp. | Quinolizidinone carboxamide m1 receptor positive allosteric modulators |
AU2011206761A1 (en) | 2010-01-13 | 2012-07-12 | Institut National De La Sante Et De La Recherche Medicale (Inserm) | Anti - infective pyrido (1,2 -a) pyrimidines |
US8962842B2 (en) | 2010-09-27 | 2015-02-24 | Evolva Sa | 2-pyridone antimicrobial compositions |
WO2013059606A1 (en) | 2011-10-21 | 2013-04-25 | Tufts Medical Center, Inc. | Compounds and methods for the treatment of muscular disease, and related screening methods |
MX352861B (es) | 2011-12-30 | 2017-12-13 | Ptc Therapeutics Inc | Compuestos para tratar la atrofia muscular espinal. |
EP2809322B9 (en) | 2012-01-26 | 2019-10-30 | PTC Therapeutics, Inc. | Compounds for treating spinal muscular atrophy |
EP3406252B1 (en) | 2012-02-10 | 2020-05-13 | PTC Therapeutics, Inc. | Compounds for treating spinal muscular atrophy |
EA029155B1 (ru) | 2012-03-01 | 2018-02-28 | ПиТиСи ТЕРАПЬЮТИКС, ИНК. | Соединения для лечения спинальной мышечной атрофии |
CN104470909B (zh) | 2012-03-23 | 2018-04-24 | Ptc医疗公司 | 用于治疗脊髓性肌萎缩的化合物 |
US9212209B2 (en) | 2012-07-13 | 2015-12-15 | Indiana University Research And Technology Corporation | Screening methods for spinal muscular atrophy |
US8729263B2 (en) | 2012-08-13 | 2014-05-20 | Novartis Ag | 1,4-disubstituted pyridazine analogs there of and methods for treating SMN-deficiency-related conditions |
US9040712B2 (en) | 2013-01-23 | 2015-05-26 | Novartis Ag | Thiadiazole analogs thereof and methods for treating SMN-deficiency-related-conditions |
EA030631B1 (ru) | 2013-07-31 | 2018-09-28 | Новартис Аг | 1,4-дизамещенные аналоги пиридазинхинолина и способы лечения состояний, связанных с smn-дефицитом |
MX2016001963A (es) | 2013-08-19 | 2016-05-26 | Hoffmann La Roche | Metodo de seleccion. |
WO2015095446A1 (en) | 2013-12-19 | 2015-06-25 | Ptc Therapeutics, Inc. | Methods for modulating the amount of rna transcripts |
WO2015095449A1 (en) | 2013-12-19 | 2015-06-25 | Ptc Therapeutics, Inc. | Methods for modulating the amount rna transcripts |
EP3082820B1 (en) | 2013-12-19 | 2022-07-20 | PTC Therapeutics, Inc. | Methods for modulating the amount of rna transcripts |
EP4241772A3 (en) | 2014-05-15 | 2023-11-15 | F. Hoffmann-La Roche AG | Process for the preparation of compounds useful for treating spinal muscular atrophy |
WO2016042015A1 (en) | 2014-09-16 | 2016-03-24 | Centre National De La Recherche Scientifique (Cnrs) | Method for evaluating developmental competence of an oocyte |
JP6749343B2 (ja) | 2015-05-20 | 2020-09-02 | エフ.ホフマン−ラ ロシュ アーゲーF. Hoffmann−La Roche Aktiengesellschaft | 脊髄性筋萎縮症を処置するための化合物 |
EP4249472A3 (en) | 2015-05-30 | 2023-12-13 | PTC Therapeutics, Inc. | Methods for modulating rna splicing |
EA201991309A1 (ru) | 2016-11-28 | 2019-11-29 | Способы модуляции сплайсинга рнк | |
JP2020523365A (ja) | 2017-06-14 | 2020-08-06 | ピーティーシー セラピューティクス,インコーポレーテッド | Rnaスプライシングを改変する方法 |
RU2020105929A (ru) | 2017-08-04 | 2021-09-06 | Скайхоук Терапьютикс, Инк. | Способы и композиции для модулирования сплайсинга |
JP7195328B2 (ja) | 2017-09-25 | 2022-12-23 | スカイホーク・セラピューティクス・インコーポレーテッド | スプライシングモジュレーターのスクリーニングおよび特定を行うための方法および組成物 |
-
2018
- 2018-06-13 JP JP2019568746A patent/JP2020523365A/ja active Pending
- 2018-06-13 KR KR1020207000911A patent/KR20200017476A/ko not_active Application Discontinuation
- 2018-06-13 WO PCT/US2018/037412 patent/WO2018232039A1/en active Application Filing
- 2018-06-13 US US16/622,223 patent/US11608501B2/en active Active
- 2018-06-13 EP EP18817883.4A patent/EP3638318A4/en active Pending
- 2018-06-13 CA CA3065547A patent/CA3065547A1/en active Pending
- 2018-06-13 AU AU2018284853A patent/AU2018284853A1/en not_active Abandoned
- 2018-06-13 EA EA202090034A patent/EA202090034A1/ru unknown
- 2018-06-13 BR BR112019026508-2A patent/BR112019026508A2/pt unknown
- 2018-06-13 CN CN201880052678.0A patent/CN111372611A/zh active Pending
-
2019
- 2019-11-29 IL IL271053A patent/IL271053A/en unknown
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170001995A1 (en) * | 2015-02-09 | 2017-01-05 | Hoffmann-La Roche Inc. | Compounds for the treatment of cancer |
Non-Patent Citations (2)
Title |
---|
ALYSSA N. CALDERA等: "Small Molecules in Development for the Treatment of Spinal Muscular Atrophy" * |
J AMES PALACINO等: "S MN2 splice modulators enhance U1–pre-mRNA association and rescue SMA mice" * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111194215A (zh) * | 2017-08-04 | 2020-05-22 | 斯基霍克疗法公司 | 用于调节剪接的方法和组合物 |
CN111499615A (zh) * | 2017-08-04 | 2020-08-07 | 斯基霍克疗法公司 | 用于调节剪接的方法和组合物 |
CN111499615B (zh) * | 2017-08-04 | 2024-02-02 | 斯基霍克疗法公司 | 用于调节剪接的方法和组合物 |
CN111194215B (zh) * | 2017-08-04 | 2024-03-01 | 斯基霍克疗法公司 | 用于调节剪接的方法和组合物 |
Also Published As
Publication number | Publication date |
---|---|
KR20200017476A (ko) | 2020-02-18 |
BR112019026508A2 (pt) | 2020-07-14 |
EA202090034A1 (ru) | 2020-04-16 |
IL271053A (en) | 2020-01-30 |
CA3065547A1 (en) | 2018-12-20 |
WO2018232039A1 (en) | 2018-12-20 |
EP3638318A1 (en) | 2020-04-22 |
EP3638318A4 (en) | 2021-03-17 |
US11608501B2 (en) | 2023-03-21 |
AU2018284853A1 (en) | 2019-12-19 |
JP2020523365A (ja) | 2020-08-06 |
US20200370043A1 (en) | 2020-11-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111372611A (zh) | 修饰rna剪接的方法 | |
US11602567B2 (en) | Methods for modulating RNA splicing | |
US11446398B2 (en) | Regulated biocircuit systems | |
US20230272367A1 (en) | Methods for modulating rna splicing | |
US8597949B2 (en) | Methods and compositions for modulating RAD51 and homologous recombination | |
US10688099B2 (en) | Methods for modulating the amount of RNA transcripts | |
BR112020002270A2 (pt) | métodos e composições para modular o splicing | |
EP3700527A1 (en) | Papd5 inhibitors and methods of use thereof | |
CN115515679A (zh) | 杂环酰胺及其用于调节剪接的用途 | |
KR102117016B1 (ko) | Crispr 시스템 기능 향상 방법 및 그의 이용 | |
AU2019414608A1 (en) | Oligomeric nucleic acid molecule and application thereof | |
WO2022006550A1 (en) | 2-(indazol-5-yl)-6-(piperidin-4-yl)-1,7-naphthyridine derivatives and related compounds as modulators for splicing nucleic acids and for the treatment of proliferative diseases | |
Cook et al. | A strike against indolent neuroblastoma | |
EP3732301A1 (en) | Methods of cancer treatment using an atr inhibitor | |
CN114634928B (zh) | 一种降低stat3转录功能的核酸片段及其制药用途 | |
WO2022204471A1 (en) | Regulation of transgene expression using a small molecule inducible splicing switch | |
KR20240087568A (ko) | HCV/miR-122 활성 이중계측 발광플랫폼 및 도출물질 리고세르팁의 소포스부비어 저항성 HCV 치료 용도 | |
WO2024036143A2 (en) | Methods for modulating rna splicing |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20200703 |