WO2022158906A1 - 표적 rna 및 rna-결합 단백질의 상호작용 분석용 조성물 - Google Patents
표적 rna 및 rna-결합 단백질의 상호작용 분석용 조성물 Download PDFInfo
- Publication number
- WO2022158906A1 WO2022158906A1 PCT/KR2022/001144 KR2022001144W WO2022158906A1 WO 2022158906 A1 WO2022158906 A1 WO 2022158906A1 KR 2022001144 W KR2022001144 W KR 2022001144W WO 2022158906 A1 WO2022158906 A1 WO 2022158906A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- rna
- protein
- binding protein
- target rna
- composition
- Prior art date
Links
- 108091032973 (ribonucleotides)n+m Proteins 0.000 title claims abstract description 164
- 102000044126 RNA-Binding Proteins Human genes 0.000 title claims abstract description 100
- 101710159080 Aconitate hydratase A Proteins 0.000 title claims abstract description 94
- 101710159078 Aconitate hydratase B Proteins 0.000 title claims abstract description 94
- 101710105008 RNA-binding protein Proteins 0.000 title claims abstract description 94
- 239000000203 mixture Substances 0.000 title claims abstract description 46
- 238000004458 analytical method Methods 0.000 title claims abstract description 21
- 230000006916 protein interaction Effects 0.000 title abstract description 5
- 230000003993 interaction Effects 0.000 claims abstract description 76
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 70
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 54
- 201000010099 disease Diseases 0.000 claims abstract description 41
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims abstract description 41
- 108020005004 Guide RNA Proteins 0.000 claims abstract description 39
- 238000000034 method Methods 0.000 claims abstract description 23
- 239000002157 polynucleotide Substances 0.000 claims abstract description 22
- 108091023040 Transcription factor Proteins 0.000 claims abstract description 21
- 102000040945 Transcription factor Human genes 0.000 claims abstract description 21
- 102000040430 polynucleotide Human genes 0.000 claims abstract description 21
- 108091033319 polynucleotide Proteins 0.000 claims abstract description 21
- 108020001507 fusion proteins Proteins 0.000 claims abstract description 12
- 102000037865 fusion proteins Human genes 0.000 claims abstract description 12
- 108060001084 Luciferase Proteins 0.000 claims description 24
- 239000005089 Luciferase Substances 0.000 claims description 24
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 24
- 101710125418 Major capsid protein Proteins 0.000 claims description 15
- 108091027070 Trans-activation response element (TAR) Proteins 0.000 claims description 15
- 238000007877 drug screening Methods 0.000 claims description 14
- XEEYBQQBJWHFJM-UHFFFAOYSA-N Iron Chemical compound [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 claims description 12
- 101710149951 Protein Tat Proteins 0.000 claims description 11
- 238000013518 transcription Methods 0.000 claims description 10
- 230000035897 transcription Effects 0.000 claims description 10
- 241001515965 unidentified phage Species 0.000 claims description 10
- 230000004913 activation Effects 0.000 claims description 9
- 208000002320 spinal muscular atrophy Diseases 0.000 claims description 9
- 208000011580 syndromic disease Diseases 0.000 claims description 9
- 102000004901 Iron regulatory protein 1 Human genes 0.000 claims description 8
- 108090001025 Iron regulatory protein 1 Proteins 0.000 claims description 8
- 108010066420 Iron-Regulatory Proteins Proteins 0.000 claims description 8
- 102000018434 Iron-Regulatory Proteins Human genes 0.000 claims description 8
- 108091005948 blue fluorescent proteins Proteins 0.000 claims description 8
- 108010054624 red fluorescent protein Proteins 0.000 claims description 8
- 230000007547 defect Effects 0.000 claims description 7
- 230000004060 metabolic process Effects 0.000 claims description 7
- 208000030507 AIDS Diseases 0.000 claims description 6
- 101710132601 Capsid protein Proteins 0.000 claims description 6
- 101710094648 Coat protein Proteins 0.000 claims description 6
- 206010013801 Duchenne Muscular Dystrophy Diseases 0.000 claims description 6
- 102100021181 Golgi phosphoprotein 3 Human genes 0.000 claims description 6
- 101710141454 Nucleoprotein Proteins 0.000 claims description 6
- 101710083689 Probable capsid protein Proteins 0.000 claims description 6
- 229910052742 iron Inorganic materials 0.000 claims description 6
- 108010043121 Green Fluorescent Proteins Proteins 0.000 claims description 4
- 102000004144 Green Fluorescent Proteins Human genes 0.000 claims description 4
- 208000002033 Myoclonus Diseases 0.000 claims description 4
- 201000010769 Prader-Willi syndrome Diseases 0.000 claims description 4
- 108010082025 cyan fluorescent protein Proteins 0.000 claims description 4
- 239000005090 green fluorescent protein Substances 0.000 claims description 4
- 108091005957 yellow fluorescent proteins Proteins 0.000 claims description 4
- 102000014914 Carrier Proteins Human genes 0.000 claims description 3
- 206010010356 Congenital anomaly Diseases 0.000 claims description 3
- 201000003883 Cystic fibrosis Diseases 0.000 claims description 3
- 206010012289 Dementia Diseases 0.000 claims description 3
- 108090000331 Firefly luciferases Proteins 0.000 claims description 3
- 208000001914 Fragile X syndrome Diseases 0.000 claims description 3
- 201000011240 Frontotemporal dementia Diseases 0.000 claims description 3
- 206010020649 Hyperkeratosis Diseases 0.000 claims description 3
- 208000001126 Keratosis Diseases 0.000 claims description 3
- 208000003832 Kufor-Rakeb syndrome Diseases 0.000 claims description 3
- 208000005225 Opsoclonus-Myoclonus Syndrome Diseases 0.000 claims description 3
- 208000018737 Parkinson disease Diseases 0.000 claims description 3
- 208000007014 Retinitis pigmentosa Diseases 0.000 claims description 3
- 208000009415 Spinocerebellar Ataxias Diseases 0.000 claims description 3
- 108091008324 binding proteins Proteins 0.000 claims description 3
- 201000003415 fragile X-associated tremor/ataxia syndrome Diseases 0.000 claims description 3
- 201000006938 muscular dystrophy Diseases 0.000 claims description 3
- 244000052769 pathogen Species 0.000 claims description 3
- 241000963438 Gaussia <copepod> Species 0.000 claims description 2
- 241000746758 Heteractis crispa Species 0.000 claims description 2
- 101001023784 Heteractis crispa GFP-like non-fluorescent chromoprotein Proteins 0.000 claims description 2
- 208000036626 Mental retardation Diseases 0.000 claims description 2
- 230000001717 pathogenic effect Effects 0.000 claims description 2
- 239000000126 substance Substances 0.000 abstract description 10
- 239000003814 drug Substances 0.000 abstract description 8
- 238000010453 CRISPR/Cas method Methods 0.000 abstract description 7
- 230000003834 intracellular effect Effects 0.000 abstract description 7
- 238000012216 screening Methods 0.000 abstract description 6
- 229940079593 drug Drugs 0.000 abstract description 5
- 230000001105 regulatory effect Effects 0.000 abstract description 5
- 238000011160 research Methods 0.000 abstract description 4
- 238000009509 drug development Methods 0.000 abstract description 3
- 239000002547 new drug Substances 0.000 abstract description 2
- 230000000694 effects Effects 0.000 description 24
- 210000004027 cell Anatomy 0.000 description 23
- 108010081734 Ribonucleoproteins Proteins 0.000 description 21
- 102000004389 Ribonucleoproteins Human genes 0.000 description 21
- 230000014509 gene expression Effects 0.000 description 18
- 108020004414 DNA Proteins 0.000 description 15
- 230000027455 binding Effects 0.000 description 15
- 239000013612 plasmid Substances 0.000 description 15
- 230000001965 increasing effect Effects 0.000 description 11
- 241000725303 Human immunodeficiency virus Species 0.000 description 9
- 241000700605 Viruses Species 0.000 description 9
- 230000015572 biosynthetic process Effects 0.000 description 9
- 238000005516 engineering process Methods 0.000 description 8
- 230000035772 mutation Effects 0.000 description 8
- 238000006243 chemical reaction Methods 0.000 description 7
- 108700020471 RNA-Binding Proteins Proteins 0.000 description 6
- 108700008625 Reporter Genes Proteins 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 238000010362 genome editing Methods 0.000 description 6
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 5
- 102100020760 Ferritin heavy chain Human genes 0.000 description 5
- 101001002987 Homo sapiens Ferritin heavy chain Proteins 0.000 description 5
- 238000012482 interaction analysis Methods 0.000 description 5
- 230000002265 prevention Effects 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 241000894006 Bacteria Species 0.000 description 4
- 108091033409 CRISPR Proteins 0.000 description 4
- 102000004190 Enzymes Human genes 0.000 description 4
- 108090000790 Enzymes Proteins 0.000 description 4
- 238000003556 assay Methods 0.000 description 4
- 239000000872 buffer Substances 0.000 description 4
- 239000000463 material Substances 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000004445 quantitative analysis Methods 0.000 description 4
- 230000008685 targeting Effects 0.000 description 4
- 108091006106 transcriptional activators Proteins 0.000 description 4
- 108091027981 Response element Proteins 0.000 description 3
- 239000004098 Tetracycline Substances 0.000 description 3
- 230000009471 action Effects 0.000 description 3
- 125000003275 alpha amino acid group Chemical group 0.000 description 3
- -1 and specifically Proteins 0.000 description 3
- 239000003153 chemical reaction reagent Substances 0.000 description 3
- 210000005260 human cell Anatomy 0.000 description 3
- 239000012528 membrane Substances 0.000 description 3
- 239000002773 nucleotide Substances 0.000 description 3
- 125000003729 nucleotide group Chemical group 0.000 description 3
- 230000009870 specific binding Effects 0.000 description 3
- 229930101283 tetracycline Natural products 0.000 description 3
- 229960002180 tetracycline Drugs 0.000 description 3
- 235000019364 tetracycline Nutrition 0.000 description 3
- 150000003522 tetracyclines Chemical class 0.000 description 3
- 238000001262 western blot Methods 0.000 description 3
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 2
- 108010040467 CRISPR-Associated Proteins Proteins 0.000 description 2
- 230000004568 DNA-binding Effects 0.000 description 2
- 102100031780 Endonuclease Human genes 0.000 description 2
- 108010042407 Endonucleases Proteins 0.000 description 2
- 208000026350 Inborn Genetic disease Diseases 0.000 description 2
- 206010028980 Neoplasm Diseases 0.000 description 2
- 230000009948 RNA mutation Effects 0.000 description 2
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 2
- 239000006180 TBST buffer Substances 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 2
- 230000003321 amplification Effects 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 2
- 239000002299 complementary DNA Substances 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- 208000016361 genetic disease Diseases 0.000 description 2
- 230000013632 homeostatic process Effects 0.000 description 2
- 230000001939 inductive effect Effects 0.000 description 2
- 208000015181 infectious disease Diseases 0.000 description 2
- 230000004777 loss-of-function mutation Effects 0.000 description 2
- 239000002609 medium Substances 0.000 description 2
- 108020004999 messenger RNA Proteins 0.000 description 2
- 239000002184 metal Substances 0.000 description 2
- 229910052751 metal Inorganic materials 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 108091027963 non-coding RNA Proteins 0.000 description 2
- 102000042567 non-coding RNA Human genes 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 229920001184 polypeptide Polymers 0.000 description 2
- 230000023603 positive regulation of transcription initiation, DNA-dependent Effects 0.000 description 2
- 230000029279 positive regulation of transcription, DNA-dependent Effects 0.000 description 2
- 102000004196 processed proteins & peptides Human genes 0.000 description 2
- 108090000765 processed proteins & peptides Proteins 0.000 description 2
- UCSJYZPVAKXKNQ-HZYVHMACSA-N streptomycin Chemical compound CN[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O[C@H]1O[C@@H]1[C@](C=O)(O)[C@H](C)O[C@H]1O[C@@H]1[C@@H](NC(N)=N)[C@H](O)[C@@H](NC(N)=N)[C@H](O)[C@H]1O UCSJYZPVAKXKNQ-HZYVHMACSA-N 0.000 description 2
- 239000000758 substrate Substances 0.000 description 2
- 230000014616 translation Effects 0.000 description 2
- NLHHRLWOUZZQLW-UHFFFAOYSA-N Acrylonitrile Chemical compound C=CC#N NLHHRLWOUZZQLW-UHFFFAOYSA-N 0.000 description 1
- 229920000936 Agarose Polymers 0.000 description 1
- 102000052866 Amino Acyl-tRNA Synthetases Human genes 0.000 description 1
- 108700028939 Amino Acyl-tRNA Synthetases Proteins 0.000 description 1
- 229920002799 BoPET Polymers 0.000 description 1
- 238000010354 CRISPR gene editing Methods 0.000 description 1
- 108700004991 Cas12a Proteins 0.000 description 1
- 239000004971 Cross linker Substances 0.000 description 1
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 1
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 1
- 229920002307 Dextran Polymers 0.000 description 1
- 239000006144 Dulbecco’s modified Eagle's medium Substances 0.000 description 1
- 102100035102 E3 ubiquitin-protein ligase MYCBP2 Human genes 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 101710091045 Envelope protein Proteins 0.000 description 1
- 108010001515 Galectin 4 Proteins 0.000 description 1
- 102100039556 Galectin-4 Human genes 0.000 description 1
- 108010068250 Herpes Simplex Virus Protein Vmw65 Proteins 0.000 description 1
- 102000006479 Heterogeneous-Nuclear Ribonucleoproteins Human genes 0.000 description 1
- 108010019372 Heterogeneous-Nuclear Ribonucleoproteins Proteins 0.000 description 1
- 102100034349 Integrase Human genes 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 208000007101 Muscle Cramp Diseases 0.000 description 1
- 239000005041 Mylar™ Substances 0.000 description 1
- 239000012807 PCR reagent Substances 0.000 description 1
- 239000002033 PVDF binder Substances 0.000 description 1
- 229930182555 Penicillin Natural products 0.000 description 1
- JGSARLDLIJGVTE-MBNYWOFBSA-N Penicillin G Chemical compound N([C@H]1[C@H]2SC([C@@H](N2C1=O)C(O)=O)(C)C)C(=O)CC1=CC=CC=C1 JGSARLDLIJGVTE-MBNYWOFBSA-N 0.000 description 1
- 239000004698 Polyethylene Substances 0.000 description 1
- 239000004743 Polypropylene Substances 0.000 description 1
- 239000004793 Polystyrene Substances 0.000 description 1
- 101710188315 Protein X Proteins 0.000 description 1
- 208000028017 Psychotic disease Diseases 0.000 description 1
- 230000004570 RNA-binding Effects 0.000 description 1
- 108010052090 Renilla Luciferases Proteins 0.000 description 1
- 102000002278 Ribosomal Proteins Human genes 0.000 description 1
- 108010000605 Ribosomal Proteins Proteins 0.000 description 1
- 108091046869 Telomeric non-coding RNA Proteins 0.000 description 1
- 108020004566 Transfer RNA Proteins 0.000 description 1
- 101150063416 add gene Proteins 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 230000019522 cellular metabolic process Effects 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000004132 cross linking Methods 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 239000003599 detergent Substances 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 231100000676 disease causative agent Toxicity 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 239000010419 fine particle Substances 0.000 description 1
- 108091006047 fluorescent proteins Proteins 0.000 description 1
- 102000034287 fluorescent proteins Human genes 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 150000004676 glycans Chemical class 0.000 description 1
- 210000000987 immune system Anatomy 0.000 description 1
- 238000010166 immunofluorescence Methods 0.000 description 1
- 238000001114 immunoprecipitation Methods 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 230000031146 intracellular signal transduction Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 239000004816 latex Substances 0.000 description 1
- 229920000126 latex Polymers 0.000 description 1
- 102000033952 mRNA binding proteins Human genes 0.000 description 1
- 108091000373 mRNA binding proteins Proteins 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000010534 mechanism of action Effects 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 231100000350 mutagenesis Toxicity 0.000 description 1
- 231100000219 mutagenic Toxicity 0.000 description 1
- 230000003505 mutagenic effect Effects 0.000 description 1
- 239000013642 negative control Substances 0.000 description 1
- 150000007523 nucleic acids Chemical group 0.000 description 1
- 239000000123 paper Substances 0.000 description 1
- 229940049954 penicillin Drugs 0.000 description 1
- 238000013492 plasmid preparation Methods 0.000 description 1
- 229920000728 polyester Polymers 0.000 description 1
- 229920000573 polyethylene Polymers 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 229920001155 polypropylene Polymers 0.000 description 1
- 229920001282 polysaccharide Polymers 0.000 description 1
- 239000005017 polysaccharide Substances 0.000 description 1
- 229920002223 polystyrene Polymers 0.000 description 1
- 229920002981 polyvinylidene fluoride Polymers 0.000 description 1
- 230000035755 proliferation Effects 0.000 description 1
- 238000001243 protein synthesis Methods 0.000 description 1
- 238000003753 real-time PCR Methods 0.000 description 1
- 238000003757 reverse transcription PCR Methods 0.000 description 1
- 102220315568 rs1039799564 Human genes 0.000 description 1
- 102220167937 rs201786575 Human genes 0.000 description 1
- 235000020183 skimmed milk Nutrition 0.000 description 1
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 239000003381 stabilizer Substances 0.000 description 1
- 230000000087 stabilizing effect Effects 0.000 description 1
- 230000010473 stable expression Effects 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 229960005322 streptomycin Drugs 0.000 description 1
- 101150024821 tetO gene Proteins 0.000 description 1
- 229940124597 therapeutic agent Drugs 0.000 description 1
- 230000001225 therapeutic effect Effects 0.000 description 1
- 230000005758 transcription activity Effects 0.000 description 1
- 238000001890 transfection Methods 0.000 description 1
- 239000012096 transfection reagent Substances 0.000 description 1
- 230000007306 turnover Effects 0.000 description 1
- 241000712461 unidentified influenza virus Species 0.000 description 1
- 230000005727 virus proliferation Effects 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/66—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving luciferase
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/53—Immunoassay; Biospecific binding assay; Materials therefor
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2333/00—Assays involving biological materials from specific organisms or of a specific nature
- G01N2333/90—Enzymes; Proenzymes
- G01N2333/902—Oxidoreductases (1.)
- G01N2333/90241—Oxidoreductases (1.) acting on single donors with incorporation of molecular oxygen, i.e. oxygenases (1.13)
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2500/00—Screening for compounds of potential therapeutic value
Definitions
- the present invention provides (a) a polynucleotide comprising a guide RNA and a target RNA sequence; (b) a fusion protein comprising an activation domain of a target RNA binding protein and a transcription factor; (c) dCas protein; And (d) a composition for analyzing the interaction of a target RNA and an RNA-binding protein comprising a polynucleotide comprising a TRE, a promoter and a reporter sequence, a composition for drug screening for a disease related to the target RNA and the RNA-binding protein, the target RNA and It relates to a kit for analyzing the interaction of an RNA-binding protein, and a method for analyzing the interaction of a target RNA and an RNA-binding protein, comprising the step of treating cells with the composition.
- a ribonucleoprotein is a complex of RNA and protein. From the beginning of RNA formation through the transcription process from DNA to the removal of RNA, RNA interacts extensively with proteins that recognize RNA. through the formation of RNPs. It is known that RNP functions to regulate various RNA metabolism, such as RNA production after RNA transcription, RNA processing, RNA migration, protein synthesis, RNA storage, and RNA degradation (NATURE 325, 1987, 673-678). RNP is a form with the activity of the corresponding RNA, and can make various forms and functional complexes depending on the composition and combination of RNA and protein. It is the key to direct coupling.
- RNA, protein, or RNP formation Since numerous RNAs and RNA-binding proteins exist in cells, the formation of RNPs through specific binding between them is very essential for the normal function of cells. When there is a problem in the processing process involved in RNA, protein, or RNP formation, normal RNP formation is not achieved or abnormal RNP is formed, resulting in a problem in RNA metabolism in cells, ultimately resulting in disease. According to statistics, it is reported that diseases caused by defects in RNA metabolism account for 40% of all diseases.
- RNA-binding proteins include congenital keratosis, fragile X syndrome, Hu syndrome, syndromeal mental retardation, intractable ocular myoclonus-myoclonus ( Opsoclonus-myoclonus ataxia), Prader-Willi syndrome, retinitis pigmentosa, and spinal muscular atrophy.
- Diseases caused by mutations in RNA include muscular dystrophy, spinal muscular atrophy, fragile X-associated tremor/ataxia syndrome, Spinocerebellar ataxias, and duchenne muscular dystrophy. ), etc.
- RNA-binding protein or RNA-related diseases most of them are genetic diseases, but recently, the relationship between RNA-binding protein and RNA mutations in various cancers has been reported. Among these, there are many diseases related to a defect in splicing, and representative diseases of splicing defect include spinal muscular atrophy, Duchenne muscular dystrophy, frontotemporal dementia, and cystic fibrosis. have. In addition, the disease may include Acquired Immune Deficiency Syndrome, bacteriophage infection, Kufor Rakeb syndrome, dementia, and Parkinson's disease caused by HIV virus (Human immunodeficienty Virus). Therefore, RNA Alternatively, a more in-depth study of RNA-binding proteins and the RNPs they form is needed, and further studies on intracellular signal transduction related to RNP formation and degradation are needed.
- the core of RNP basic research is to identify the binding between RNA and protein. Recently, in order to see the intracellular binding more as it is, the RNP is immobilized using a chemical crosslinker or UV, and then only the desired protein is isolated and analyzed by immunoprecipitation (Methods, 2002, 26). :182-90).
- the present inventors more easily quantitatively analyze intracellular RNA-protein interactions, and are useful not only for basic research purposes, but also for screening substances that can actually regulate RNA-protein interactions or elucidating the mechanism of action of RNPs of drugs.
- the present invention has been accomplished by developing a new analytical method that can be used.
- An object of the present invention is (a) a polynucleotide comprising a guide RNA and a target RNA sequence; (b) a fusion protein comprising an active domain of a target RNA binding protein and a transcription factor; (c) dCas protein; And (d) to provide a composition for analyzing the interaction of a target RNA and an RNA-binding protein, including a polynucleotide comprising a TRE, a promoter and a reporter sequence.
- Another object of the present invention is to provide a kit for analyzing the interaction between a target RNA and an RNA-binding protein comprising the composition.
- Another object of the present invention is to provide a method for analyzing the interaction of a target RNA and an RNA-binding protein, comprising the step of treating the cell with the composition.
- Another object of the present invention is (a) a polynucleotide comprising a guide RNA and a target RNA sequence; (b) a fusion protein comprising an active domain of a target RNA binding protein and a transcription factor; (c) dCas; And (d) to provide a composition for drug screening for diseases related to target RNA and RNA-binding protein, including a polynucleotide comprising a TRE, a promoter and a reporter sequence.
- the present invention partially modifies the CRISPR/Cas system to easily analyze and quantify intracellular RNA-protein interactions, and to prepare a system that can be used for screening of substances capable of regulating RNA-protein interactions. , it can be usefully used in basic research based on intracellular RNA-protein interactions or in industries related to drug development using RNP.
- FIG. 1 is a schematic diagram of the CRISPR-RNP analysis system of the present invention.
- Figure 2A is a schematic diagram showing the RNP pair MS2-MCP interaction of the bacteriophage.
- 2B is a graph quantifying 6X MS2-MCP interaction with the CRISPR-RNP analysis system of the present invention.
- Figure 2C is a diagram confirming the expression of each component included in the CRISPR-RNP analysis system of the present invention through Western blot.
- Figure 2D is a graph quantifying the 6X, 1X MS2-MCP interaction with the CRISPR-RNP analysis system of the present invention.
- Figure 2E is a schematic diagram showing 6X MS2-MCP interaction and 1X MS2-MCP interaction.
- FIG. 3A is a schematic diagram showing the TAR-Tat interaction, which is an RNP pair of HIV virus
- FIG. 3B is a graph quantifying the TAR-Tat interaction by the CRISPR-RNP analysis system of the present invention.
- FIG. 4A is a schematic diagram showing IRE-IRP1 interaction, which is an RNP pair in mammalian cells
- FIG. 4B is a graph quantifying IRE-IRP1 interaction with the CRISPR-RNP analysis system of the present invention.
- One aspect of the present invention for achieving the above object is (a) a polynucleotide comprising a guide RNA and a target RNA sequence; (b) a fusion protein comprising an activation domain of a target RNA binding protein and a transcription factor; (c) dCas protein; And (d) it provides a composition for analyzing the interaction of a target RNA and an RNA-binding protein, comprising a polynucleotide comprising a TRE, a promoter and a reporter sequence.
- Another aspect of the present invention is (a) a polynucleotide comprising a guide RNA and a target RNA sequence; (b) a fusion protein comprising an active domain of a target RNA binding protein and a transcription factor; (c) dCas protein; And (d) provides a composition for drug screening for diseases related to target RNA and RNA-binding protein, including a polynucleotide comprising a TRE, a promoter and a reporter sequence.
- the composition for analyzing the interaction of a target RNA and an RNA-binding protein of the present invention is a novel analysis technology that can more easily and quantitatively analyze intracellular RNA and protein interactions by applying CRISPR/Cas gene editing technology.
- the CRISPR/Cas system is a cutting-edge gene editing technology that selectively recognizes a specific part of a vast DNA sequence and cuts DNA and induces mutations. technology that can be applied.
- the CRISPR/Cas system has an sgRNA that recognizes a target base, and a Cas protein that binds to the sgRNA to recognize and cut the target base as essential components.
- the "guide RNA (gRNA)" of the present invention refers to an RNA that induces nucleotide sequence specificity of a target region so that a Cas protein can cleave a target gene. According to the number of RNAs constituting the guide RNA, it may be divided into a single guide RNA (sgRNA) and a dual guide RNA (gRNA) system, but is not limited thereto.
- the guide RNA of the present invention may selectively recognize a tetracycline response element (TRE) sequence, and may form a complex by binding to dCas, but is not limited thereto.
- TRE tetracycline response element
- gRNA can be appropriately regulated according to the type of Cas and the DNA sequence to be recognized, gRNA is not limited to a specific sequence as long as it can serve as a gRNA.
- target RNA refers to an RNA that is the object of analysis of the interaction by binding to an RNA-binding protein.
- Target RNA is the RNA genome of pathogens such as tRNA (transfer RNA), mRNA (messenger RNA), rRNA (ribosomal RNA), various small noncoding RNAs, long noncoding RNAs, virus/bacteria, etc. It may be a ribo-polynucleotide made by, but is not limited thereto. In particular, it may be a useful candidate material for biotechnology, medicine, pharmaceuticals, etc., or RNA of a material that causes an action in vivo.
- the target RNA may be a naturally occurring sequence or a newly modified sequence, MS2 RNA of bacteriophage, Trans-activation response element (TAR) RNA of HIV virus, or human iron- It may be an iron-responsive element (IRE) RNA or a variant thereof, but is not limited thereto.
- TAR Trans-activation response element
- IRE iron-responsive element
- the MS2 RNA is SEQ ID NO: 4, the TAR RNA is SEQ ID NO: 8, the variant TAR (TAR(MT)) RNA is SEQ ID NO: 11, IRE(FTH1) RNA is SEQ ID NO: 13, IRE (FTL) RNA SEQ ID NO: 14, variant IRE (FTH1) (IRE (FTH1-MT)) RNA is SEQ ID NO: 15, and variant IRE (FTL) (IRE (FTL-MT)) RNA includes the nucleotide sequence of SEQ ID NO: 16 or may be configured, but is not limited thereto.
- Target RNA of the present invention may be used interchangeably with “target RNA”.
- the target RNA sequence of the present invention may be linked to the 3' or 5' end of the scaffold stem-loop structure of the guide RNA to form a polynucleotide, but is not limited thereto.
- the dCas9 protein can selectively bind to the guide RNA and recognize the PAM sequence behind the target RNA sequence to which the guide RNA binds. have.
- dCas12 protein is used as another gene editing technology, the direction of gRNA is reversed, so that the target RNA sequence can be linked to the 5' end of the guide RNA.
- the composition for analyzing the interaction of a target RNA and an RNA-binding protein of the present invention includes a polynucleotide including the target RNA sequence and the guide RNA as components.
- the target RNA may include one or more RNA repeating units, but the number is not limited. In the present invention, it was confirmed that even when there is one RNA repeating unit, the interaction between the target RNA and the RNA-binding protein can be analyzed as in the case of having six RNA repeating units (Experimental Example 2).
- RNA-binding protein refers to a protein involved in the formation of a ribonucleoprotein (RNP) complex by binding to single-stranded non-structural RNA or double-stranded structural RNA in a cell (J. Appl. Biol). Chem 58(3), 2015, 201-208).
- RNP ribonucleoprotein
- the present invention includes, without limitation, a protein capable of interacting by binding with a target RNA, as well as a wild-type protein capable of interacting with the target RNA, derivatives, variants, and domains responsible for binding functions or part of a polypeptide.
- the RNA-binding protein may also be a naturally occurring wild-type or newly modified one, and as an mRNA-binding protein, hnRNPs involved in various RNA processing and turnover, splicing SR protein, iron regulatory protein (IRP1), ribosomal protein involved in protein translation, aminoacyl-tRNA synthetase, virus-derived protein that has the ability to bind RNA, It may be Tat (Trans-Activator of Transcription) protein of HIV, NP protein of influenza virus, envelope protein (MCP) of bacteriophage, or a variant thereof, but is not limited thereto.
- Tat Trans-Activator of Transcription
- the MCP protein is SEQ ID NO: 5
- the Tat protein is SEQ ID NO: 9
- the variant Tat (Tat (MT)) protein is SEQ ID NO: 10
- the IRP1 protein is SEQ ID NO: 12
- the protein may include or consist of the amino acid sequence of SEQ ID NO: 17, but is not limited thereto.
- RNA binding protein and “binding protein” may be used interchangeably.
- the "activation domain, trans-activation domain, trans-activating domain” of the present invention refers to an activation domain of a transcription factor that regulates transcription from DNA to RNA.
- transcription factors include a DNA binding domain that binds to a specific DNA region and an activation domain that is a region that binds to other proteins such as a transcription coregulator.
- the active domain of the transcription factor may not include a DNA binding domain, and as long as it can function as an active domain, its type and origin are not limited.
- the activation domain of the transcription factor may be VP64 or GAL4-AD, but is not limited thereto.
- VP64 of the present invention is a polypeptide linking the core region of the transcriptional activation domain of Herpes Simplex Virus protein VP16 by 4-copy, and is a kind of protein that amplifies the transcription of a target gene.
- the VP64 of the present invention may serve to increase the expression of a reporter sequence by binding to TRE by interacting with a target RNA by being fused to an RNA binding protein.
- Transcriptional activators fusing RNA-binding protein may include, but are not limited to, GAL4-AD in place of VP64.
- GAL4-AD refers to the transcriptional activation domain of GAL-4 protein, which is a representative transcriptional activator of yeast, and can perform the same function as VP64.
- the fusion protein comprising the target RNA binding protein of the present invention and an active domain of a transcription factor may further include an active domain of a transcription factor capable of increasing transcription activity.
- the fusion protein may further include p65 and Rta to form VP64-p65-Rta (VPR) to function similarly to VP64 and to produce a superior effect, but is not limited thereto.
- VPR VP64-p65-Rta
- composition for analyzing the interaction of a target RNA and an RNA-binding protein of the present invention includes a fusion protein to which the target RNA-binding protein and VP64 or GAL4-AD are bound as one component.
- the VP64 may include the amino acid sequence of SEQ ID NO: 2, but is not limited thereto.
- the CRISPR/Cas system of the present invention inserts the nucleic acid fragment of the introduced virus into its own chromosome when the virus invades the bacteria, remembers it, recognizes it when the virus with the fragment invades again, and converts the DNA of the virus It is an application of the acquired immune system of bacteria that cut and protect itself.
- the CRISPR/Cas system can be broadly divided into Class I, which consists of several DNA cutting proteins, and Class II, which consists of a single protein.
- the "dCas protein (deactivated CRISPR-associated protein, or dead CRISPR-associated protein)" of the present invention is a Cas protein in which only endonuclease activity is inactivated while targeting a specific gene in the genome.
- dCas protein can form a complex with gRNA to recognize and bind to a specific gene sequence.
- Cas protein or gene information may be obtained from a known database such as GenBank of the National Center for Biotechnology Information (NCBI), but is not limited thereto.
- the composition for analyzing the interaction of a target RNA and an RNA-binding protein of the present invention includes a dCas protein as one component.
- Cas protein of the present invention is included without limitation as long as it is a protein used in gene editing technology in the art.
- the protein used in the gene editing technology can recognize guide RNA and cut target DNA/RNA, and specifically, Cas9, Cas12a (same as Cpf1), Cas12b, Cas13 (Cas13a, Cas13b, Cas13c, Cas13d, etc. Cas13 family) It may be any one or more), Cas14, or CasX (any Cas or variant thereof), but is included in the Cas if it can be utilized in gene editing technology without limitation, such as natural, variant, and its origin.
- the dCas9 may include the amino acid sequence of SEQ ID NO: 3, but is not limited thereto.
- the dCas protein of the present invention may be dCas9, dCas12a (dCpf1), dCas12b, dCas13, dCas14, or dCasX, but is not limited thereto.
- TRE tetracycline response element
- the TRE refers to a sequence of 7 repeats of the TetO sequence (TCCCTATCAGTGATAGAGA), which is a target sequence of the guide RNA of the present invention.
- the TRE is mainly used for inducible expression of a specific gene, and in the present invention, it is linked to an upper region of a promoter for inducible expression of a reporter gene.
- the guide RNA and dCas of the present invention selectively recognize the TRE sequence, and as the RNA-binding protein binds and interacts with the target RNA linked to the guide RNA, it is a reporter by VP64 or GAL4-AD, which is a transcriptional activator.
- the expression of the gene is increased.
- the TRE may include or consist of the nucleotide sequence of SEQ ID NO: 1, but is not limited thereto.
- the "reporter" of the present invention is a gene used to inform the presence or absence of a specific genetic element such as a plasmid or DNA inserted into a vector, or to confirm expression by being linked to a promoter of another gene. It may be fused to a regulatory sequence or a gene of interest to determine the expression location or level of expression of a specific gene, and may include a gene encoding a fluorescent protein or enzyme that makes the substrate in a luminescent or colored form. It can also be used to analyze the activity of a specific promoter without targeting a specific gene.
- the reporter sequence of the present invention is bound to a promoter and its expression is regulated.
- the reporter is luciferase (luciferase), GFP (Green Fluorescent Protein), RFP (Red Fluorescent Protein), mRFP (Monomeric Red Fluorescent Protein), BFP (Blue Fluorescent Protein), CFP (Cyan Fluorescent Protein), YFP (Yellow Fluorescent Protein), AzG (Azami Green), HcR (HcRed, Heteractis crispa red fluorescent protein) and BFP (Blue Fluorescent Protein) may be a gene sequence selected from the group consisting of, more specifically, the luciferase It may be any one or more selected from the group consisting of firefly luciferase, Renilla luciferase, Gaussia luciferase, and nano luciferase, but , but not limited thereto.
- composition for analyzing the interaction of a target RNA and an RNA-binding protein of the present invention includes a polynucleotide including a TRE, a promoter and a reporter sequence as one component.
- the "interaction" of the present invention includes a series of processes in which an RNA-binding protein specifically recognizes and reacts with a target RNA to form a ribonucleoprotein, wherein the target RNA and the RNA-binding protein bind directly or , can be indirectly bound to interact.
- the present inventors have improved the complex steps and difficulties of applying various target RNAs, which are problems of the existing RNA-protein interaction analysis method, so that the interaction between the target RNA and the RNA-binding protein in the cell can be analyzed more easily and quantitatively. An interaction analysis system was developed.
- RNA and RNA-binding proteins were applied and the interaction was quantitatively analyzed.
- MS2 RNA a specific binding between MS2 RNA, a stem-loop present in the genome of a bacteriophage, and a MS2 coat protein (MCP) that specifically recognizes it
- HIV which is the causative agent of AIDS
- MCP MS2 coat protein
- TAR and Tat proteins which are essential for virus proliferation
- IRE and IRP1 proteins which play a key role in iron homeostasis in human cells
- composition for drug screening of diseases related to target RNA and RNA-binding protein is applicable to various pairs of target RNA and RNA-binding protein, and through analysis of the interaction between RNA and protein, target RNA and RNA-binding protein-related diseases can be treated. It can be usefully applied to the screening of drugs (or candidate substances) that can be used for prevention or treatment.
- the "disease associated with target RNA and RNA-binding protein" of the present invention is caused by a problem in the processing process involved in RNA, protein, or RNP formation, so that normal RNP formation is not achieved or abnormal RNP is formed and RNA metabolism of cells It includes, without limitation, diseases caused by problems with The disease associated with the target RNA and RNA-binding protein may be caused by a defect in RNA metabolism or specific RNA metabolism of a pathogen, but is not limited thereto.
- RNA-binding proteins include congenital keratosis, fragile X syndrome, Hu syndrome, psychotic syndrome, and intractable ocular mylar spasm-muscle.
- Opsoclonus-myoclonus ataxia Opsoclonus-myoclonus ataxia, Prader-Willi syndrome, retinitis pigmentosa, spinal muscular atrophy, etc., but are not limited thereto.
- Diseases caused by mutations in RNA include muscular dystrophy, spinal muscular atrophy, fragile X-associated tremor/ataxia syndrome, Spinocerebellar ataxias, Duchenne muscular dystrophy, and the like, but are not limited thereto.
- RNA-binding protein or RNA-related diseases most of them are genetic diseases, but recently, the relationship between RNA-binding protein and RNA mutations in various cancers has been reported. Among these, there are many diseases related to a defect in splicing, and representative diseases of splicing defect include spinal muscular atrophy, Duchenne muscular dystrophy, frontotemporal dementia, and cystic fibrosis. However, it is not limited thereto.
- Acquired Immune Deficiency Syndrome bacteriophage infection, Kufor Rakeb syndrome, dementia, and Parkinson's disease caused by the HIV virus (Human immunodeficienty Virus), etc. may also be included, but are limited thereto.
- composition for drug screening for diseases related to target RNA and RNA-binding protein of the present invention may be for screening drugs that modulate the interaction between RNA and RNA-binding protein, specifically, inhibiting the interaction between RNA and RNA-binding protein Or, it may be to screen for stabilizing drugs, but is not limited thereto.
- cancer substances that can be used for the prevention or treatment of diseases related to target RNA and RNA-binding protein are substances expected to be used in the prevention or treatment of diseases related to target RNA and RNA-binding protein, directly or Any substance that is expected to indirectly ameliorate or ameliorate the disease can be used without limitation, and includes all potential therapeutic substances such as compounds, genes, or proteins.
- Another aspect of the present invention provides a kit for analyzing the interaction of a target RNA and an RNA-binding protein, comprising the composition for analyzing the interaction of the target RNA and the RNA-binding protein.
- Another aspect of the present invention provides a method for analyzing the interaction of a target RNA and an RNA-binding protein, comprising the step of treating a cell with the composition for analysis of the interaction of the target RNA and the RNA-binding protein.
- Another aspect of the present invention is a composition for drug screening of diseases related to the target RNA and RNA-binding protein; And it provides a drug screening method for diseases related to target RNA and RNA-binding protein, comprising the step of treating cells with a candidate substance that can be used for the prevention or treatment of diseases related to target RNA and RNA-binding protein.
- Kit of the present invention means a set of constructs with a specific purpose, and a specific purpose in the present invention can be said to be for analyzing the interaction of a target RNA and an RNA-binding protein.
- the components of the kit may include the composition according to the present invention, and may additionally include components for analyzing the interaction between the target RNA and the RNA-binding protein.
- the kit for analyzing the interaction between a target RNA and an RNA-binding protein of the present invention can easily analyze the interaction between a target RNA and an RNA-binding protein through the expression or activity of a reporter gene.
- the kit may be one selected from the group consisting of a DNA kit, a plasmid kit, an RT-PCR kit, a protein chip kit, and a kit for immunofluorescence, but the presence or degree of interaction between the target RNA and the RNA-binding protein is determined. It is not limited to the principle or form of operation as long as it can be analyzed or the activity or expression of the reporter sequence can be confirmed.
- the kit includes a DNA plasmid kit comprising DNA and a plasmid; Or it may be a kit including cells including DNA and a plasmid. In one embodiment, it may be a DNA plasmid kit, such as HIV TAR-Tat, MS2-MCP, or IRE-IRP, and a product prepared as a stable expression cell line, but is not limited thereto.
- the kit of the present application may include, but is not limited to, one or more other components/compositions, solutions or devices suitable for analysis of the interaction between the target RNA and the RNA-binding protein.
- the other components include, but are not limited to, suitable carriers, labels capable of generating a detectable signal, chromophores, solubilizers, detergents, buffers, stabilizers, and the like.
- the labeling material is an enzyme, it may include a substrate capable of measuring enzyme activity and a reaction terminator.
- the carrier includes a soluble carrier and an insoluble carrier
- an example of the soluble carrier is a physiologically acceptable buffer known in the art, for example, PBS
- an example of the insoluble carrier is polystyrene, polyethylene, polypropylene, polyester, poly It may be acrylonitrile, fluororesin, crosslinked dextran, polysaccharide, polymer such as magnetic fine particles plated with metal on latex, other paper, glass, metal, agarose, and combinations thereof, but is not limited thereto.
- the kit of the present application may include a primer pair for confirming the activity or expression of a reporter sequence or a reagent for performing a reaction thereof, but is not limited thereto.
- the kit of the present application may further include reagents necessary for the DNA or RNA amplification reaction, and the reagents for performing the amplification reaction may include DNA polymerase, dNTPs and buffers, and the like, and also real-time PCR Reagents necessary for conducting and analyzing the reaction may be further included.
- kit of the present application may further include a user's guide describing optimal reaction conditions.
- a handbook is a printed document explaining how to use the kit, eg, how to prepare the buffer, and the reaction conditions presented. Instructions include a brochure in the form of a pamphlet or leaflet, a label affixed to the kit, and instructions on the surface of the package containing the kit.
- the guide includes information published or provided through an electronic medium such as the Internet.
- the drug screening method for a disease related to target RNA and RNA-binding protein comprises the step of treating cells with the composition according to the present invention, and may further comprise the step of measuring the expression or activity of a reporter gene.
- the "cell” of the present invention means a functional and structural basic unit of all living things, and may be a cell of an animal, plant, yeast or bacteria, but is not limited thereto.
- the expression or activity of the reporter gene when the expression or activity of the reporter gene is increased compared to the control, it is determined that the interaction level of the target RNA and the RNA-binding protein is higher than that of the control, and the expression of the control and the reporter gene Alternatively, if the activity is similar, it may further include, but is not limited to, determining that the level of interaction between the target RNA and the RNA-binding protein is higher than that of the control.
- the drug screening method for diseases related to the target RNA and RNA-binding protein is a reporter gene expression or When the activity increases or decreases, the method may further include, but is not limited to, determining that the candidate material can be used for the prevention or treatment of diseases related to target RNA and RNA-binding protein.
- Another aspect of the present invention is (a) a polynucleotide comprising a guide RNA and a target RNA sequence; (b) a fusion protein comprising an activation domain of a target RNA binding protein and a transcription factor; (c) dCas protein; and (d) a composition comprising a polynucleotide comprising a TRE, a promoter and a reporter sequence for analyzing the interaction of a target RNA and an RNA binding protein.
- 293T cells were cultured in DMEM medium containing 10% FBS supplemented with 1% penicillin and streptomycin (Gibco). 293T cells (2 x 10 4 cells/well) were transfected with the appropriate plasmid combination using XtremeGene Transfection Reagent (Roche) in 96-well plates for 48 hours.
- pcDNA-dCas9 and pSPgRNA plasmids were purchased from Addgene (#47106 and #47108), and pNBe2 plasmids were purchased from Promega.
- Addgene #47106 and #47108
- pNBe2 plasmids were purchased from Promega.
- the TRE3G target sequence was inserted into the pSPgRNA plasmid, and then the RNA element sequence of interest was added to the bottom of the TRE3G gRNA scaffold.
- TRE3G gRNA-target RNA hybrid plasmids were generated by inserting 6X MS2, 1X MS2, TAR, and IRE (FTH1, FTL), respectively, and TRE3G gRNA-TAR (MT), TRE3G gRNA-IRE (FTH1-MT) and TRE3G gRNA- The IRE (FTL-MT) plasmid was mutagenic.
- VP64 cDNA was inserted into pNBe2 plasmid, and then MCP (WT, MT), Tat (WT, MT) or IRP1 (WT, MT) cDNA was additionally inserted.
- Proteins were extracted from whole cells, separated by SDS-PAGE, and transferred to a PVDF membrane.
- the membrane was blocked with 5% skim milk for 1 h, and then incubated with an antibody specific for the target protein at 4° C. for 15 h. Thereafter, the membrane was washed 3 times with TBST for 10 minutes each, and then incubated with a secondary antibody at room temperature for 1 h. After incubation with the secondary antibody, it was washed 3 times with TBST for 10 minutes each. After that, the protein reacted with the antibody was analyzed using the WEST-ZOL plus Western Blotting Detection System (iNtRON Biotechnology) in a LAS-4000 Image analyzer (Fujifilm, Tokyo, Japan).
- RNA-protein interaction analysis system of the present invention was completed by introducing some modifications to the existing CRISPR/Cas9 system.
- a clone in which a target RNA sequence is inserted into gRNA is prepared, and ii) a clone in which dCas in which the endonuclease activity of Cas is inactivated is introduced; iii) a clone in which a target RNA binding protein and a transactivation domain (eg, VP64 or GAL4-AD) are fused; and iv) a reporter comprising a tetracycline response element (TRE) promoter and a luciferase sequence was prepared.
- TRE tetracycline response element
- the TRE sequence is selectively recognized by gRNA and dCas9, and when the target RNA binding protein-VP64 or GAL4-AD is bound to the target RNA sequence, the expression of luciferase is increased by the transcriptional activator, thereby increasing the RNA-protein The interaction can be confirmed quantitatively.
- RNA-protein binding pairs were applied to quantitatively analyze the interaction.
- the analysis system of the present invention was evaluated using MS2 RNA, which is a stem-loop present in the genome of bacteriophage, and MS2 coat protein (MCP) that specifically recognizes it.
- MS2 RNA which is a stem-loop present in the genome of bacteriophage
- MCP MS2 coat protein
- a clone in which MS2 RNA (SEQ ID NO: 4) was inserted behind the gRNA scaffold was prepared, and a clone in which VP64 (SEQ ID NO: 2) was fused to MCP (SEQ ID NO: 5) was prepared.
- the clone was overexpressed in 293T cells together with the dCas9 (SEQ ID NO: 3) expression clone and reporter clone for 48 hours, and then luciferase (firefly luciferase or nanoluciferase activity was measured with a luminometer.
- RNA-protein interaction for the proliferation of HIV virus, the causative virus of acquired immunodeficiency syndrome (AIDS), the TAR-Tat interaction was evaluated using the system of the present invention.
- AIDS acquired immunodeficiency syndrome
- the luciferase activity does not appear in the condition in which the TAR RNA sequence (SEQ ID NO: 8) is absent, whereas in the condition in which the TAR RNA sequence and the Tat protein (SEQ ID NO: 9) are present together, luciferase It was confirmed that the enzyme activity increased by 234 times.
- Tat(MT) SEQ ID NO: 10
- TAR(MT) SEQ ID NO: 11
- RNA-protein pair acting in actual human cells As a representative RNA-protein pair acting in actual human cells, the IRE-IRP1 interaction, which plays a key role in iron homeostasis, was evaluated.
- luciferase activity does not appear in the absence of IRE (FTH1; SEQ ID NO: 13, FTL; SEQ ID NO: 14) RNA sequence, whereas IRE (FTH1, FTL) RNA sequence and IRP1 protein (SEQ ID NO: 12) was present, luciferase activity was 36-fold and 21-fold, respectively, and IRP1 (MT) (SEQ ID NO: 17) introduced with a mutation preventing binding to IRE RNA.
- IRE FTH1-MT
- FTL-MT IRE
- RNA-protein interaction analysis system of the present invention suggests that various RNPs in cells can be analyzed and quantified.
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Genetics & Genomics (AREA)
- Organic Chemistry (AREA)
- Molecular Biology (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Biomedical Technology (AREA)
- Biotechnology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Health & Medical Sciences (AREA)
- Microbiology (AREA)
- Biochemistry (AREA)
- Immunology (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Medicinal Chemistry (AREA)
- Analytical Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Hematology (AREA)
- Urology & Nephrology (AREA)
- Biophysics (AREA)
- Cell Biology (AREA)
- Food Science & Technology (AREA)
- General Physics & Mathematics (AREA)
- Pathology (AREA)
- Plant Pathology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Abstract
본 발명은 (a) 가이드 RNA 및 표적 RNA 서열을 포함하는 폴리뉴클레오티드; (b) 표적 RNA 결합 단백질 및 전사인자의 활성도메인을 포함하는 융합 단백질; (c) dCas 단백질; 및 (d) TRE, 프로모터 및 리포터 서열을 포함하는 폴리뉴클레오티드를 포함하는 표적 RNA 및 RNA-결합 단백질의 상호작용 분석용 조성물, 표적 RNA 및 RNA 결합 단백질과 관련된 질환의 약물 스크리닝용 조성물, 표적 RNA 및 RNA 결합 단백질의 상호작용 분석용 키트, 및 상기 조성물을 세포에 처리하는 단계를 포함하는 표적 RNA 및 RNA 결합 단백질의 상호작용 분석 방법에 관한 것이다. 본 발명은 CRISPR/Cas 시스템을 일부 변형하여, 세포 내 RNA 및 단백질 간의 상호작용을 용이하게 분석 및 정량화하고, RNA 및 단백질 간의 상호작용을 조절할 수 있는 물질의 스크리닝 등에 사용될 수 있는 시스템을 제작한 바, 세포 내 RNA 및 단백질 상호작용에 기반을 둔 기초 연구 또는 RNP를 활용한 신약 개발 관련 산업에서 유용하게 활용될 수 있다.
Description
본 발명은 (a) 가이드 RNA 및 표적 RNA 서열을 포함하는 폴리뉴클레오티드; (b) 표적 RNA 결합 단백질 및 전사인자(transcription factor)의 활성도메인(activation domain)을 포함하는 융합 단백질; (c) dCas 단백질; 및 (d) TRE, 프로모터 및 리포터 서열을 포함하는 폴리뉴클레오티드를 포함하는 표적 RNA 및 RNA-결합 단백질의 상호작용 분석용 조성물, 표적 RNA 및 RNA 결합 단백질과 관련된 질환의 약물 스크리닝용 조성물, 표적 RNA 및 RNA 결합 단백질의 상호작용 분석용 키트, 및 상기 조성물을 세포에 처리하는 단계를 포함하는 표적 RNA 및 RNA 결합 단백질의 상호작용 분석 방법에 관한 것이다.
리보핵산단백질(RNP, ribonucleoprotein)이란 RNA와 단백질의 복합체로서, DNA로부터 전사과정을 통해 RNA가 형성되기 시작하면서부터 RNA가 제거되는 단계에 이르기까지 RNA는 RNA를 인식하는 단백질들과 광범위한 상호작용을 통해 RNP를 형성한다. RNP는 RNA 전사 후의 RNA 생성, RNA 가공과정, RNA 이동, 단백질 합성, RNA 저장, RNA 분해 등과 같은 다양한 RNA 대사를 조절하는 기능을 하는 것이 알려져 있다 (NATURE 325, 1987, 673-678). RNP는 해당 RNA의 활성을 가진 형태로 RNA와 단백질의 구성 및 조합에 따라 다양한 형태 및 기능적 복합체를 만들 수 있으며, RNA 상의 특정 염기 서열 및 고차원 구조와 이를 선택적으로 인식하는 RNA 결합 단백질 간의 상호작용이 직접적인 결합의 핵심이다.
세포 내에는 수 많은 RNA와 RNA 결합 단백질이 존재하므로, 이들 간의 특이적 결합을 통한 RNP의 형성은 세포의 정상적인 기능에 매우 필수적이다. RNA, 단백질, 또는 RNP 형성에 관여하는 처리 과정에 문제가 생기게 되면, 정상적인 RNP 형성이 이루어지지 않거나, 비정상적인 RNP가 형성되어 세포의 RNA 대사에 문제가 발생하고, 궁극적으로는 질병을 초래하게 된다. 통계에 의하면, RNA 대사의 결함으로 발병하는 질병은 전체 질병의 40%에 이른다는 보고가 있다.
RNA 결합 단백질 상의 기능 상실(loss-of-function) 돌연변이에 의한 대표적인 질병으로는 선천성 각화 이상증, 취약 X 증후군(fragile X syndrome), Hu 증후군, 증후군성 정신지체, 난치성 안구간대경련-근간대경련 (Opsoclonus-myoclonus ataxia), 프라더 윌리 증후군(Prader-Willi syndrome), 색소성 망막염, 척수성 근위축증 등이 있다. RNA상의 돌연변이에 의한 질병으로는 근디스트로피, 척수성 근위축증, 취약 X-연관 떨림/운동실조 증후군(fragile X-associated tremor/ataxia syndrome), 척수소뇌실조증 (Spinocerebellar ataxias), 듀센형 근이영양증 (duchenne muscular dystrophy) 등이 있다. RNA 결합 단백질 또는 RNA와 관련된 질병의 경우 대부분은 유전질환이 이에 해당하지만, 최근에는 다양한 암에서도 RNA 결합 단백질 및 RNA상의 돌연변이의 관련성이 보고되고 있다. 이들 중에는 특히 스플라이싱(splicing)의 결함과 관련된 질병이 많은데, 대표적인 스플라이싱 결함 질병으로는 척수성 근위축증, 듀센형 근이영양증, 전두측두엽 치매 (frontotemporal dementia), 낭포성 섬유종 (cystic fibrosis) 등이 있다. 또한, 상기 질병에 HIV 바이러스(Human immunodeficienty Virus)에 의한 후천성 면역 결핍증(Acquired Immune Deficiency Syndrome), 박테리오 파지 감염, 쿠포라케프 증후군(Kufor Rakeb syndrome), 치매, 및 파킨슨병 등도 포함될 수 있다 따라서, RNA 또는 RNA 결합 단백질, 그리고 이들이 형성한 RNP에 대한 보다 깊이 있는 연구가 필요하며, 더 나아가 RNP 형성 및 분해와 관련된 세포 내 신호 전달에 대한 연구가 필요하다.
RNP 기초연구의 핵심은 RNA와 단백질간의 결합을 규명하는 것에 있으며, 과거에는 특정 RNA에 결합하는 단백질을 세포 추출액으로부터 in vitro affinity purification 및 단백질체(proteomic) 분석법을 통해서 규명하는 방식의 연구가 주를 이루었는데, 최근에는 세포 내의 결합을 보다 있는 그대로 보기 위한 방식으로 RNP를 chemical crosslinker 또는 UV를 이용해서 고정시킨 후, 원하는 단백질만 면역침전법으로 분리하고 분석하는 방식을 활용하고 있다 (Methods, 2002, 26:182-90).
그러나, 이러한 방법은 UV cross-linking의 효율이 낮으며, RNA-단백질 상호작용의 결과가 편향될 우려가 있고, 실험 과정이 매우 복잡한 과정을 거쳐야 한다는 한계가 있다. 이 외에도, 다양한 in vitro 및 세포 기반의 RNA-단백질 상호작용 분석법들이 고안되고 있으나, 세포 내에서 관심 있는 RNA 부위와 단백질 간의 결합을 쉽고 정량적으로 연구하는 데에 어려움이 있었다. 이에, 세포 기반의 정량적 분석이 가능하면서, 표적 RNA와 결합 단백질의 적용이 용이하고, 돌연변이의 도입 또한 용이하며, RNA의 크기에 크게 구애 받지 않으면서 RNA에 직접 결합하는 단백질뿐 아니라 간접적으로 상호작용하는 단백질도 포함하는 신규한 방식의 분석법이 필요했다.
본 발명자들은 세포 내 RNA-단백질 간의 상호작용을 보다 쉽게 정량적으로 분석하고, 기초연구 목적뿐만 아니라, 실제로 RNA-단백질의 상호작용을 조절할 수 있는 물질을 스크리닝하거나 약물의 RNP 작용기전을 규명하는데도 유용하게 사용될 수 있는 새로운 분석 방법을 개발함으로써 본 발명을 완성하였다.
본 발명의 목적은 (a) 가이드 RNA 및 표적 RNA 서열을 포함하는 폴리뉴클레오티드; (b) 표적 RNA 결합 단백질 및 전사인자의 활성도메인을 포함하는 융합 단백질; (c) dCas 단백질; 및 (d) TRE, 프로모터 및 리포터 서열을 포함하는 폴리뉴클레오티드를 포함하는, 표적 RNA 및 RNA 결합 단백질의 상호작용 분석용 조성물을 제공하는 것이다.
본 발명의 다른 하나의 목적은 상기 조성물을 포함하는 표적 RNA 및 RNA 결합 단백질의 상호작용 분석용 키트를 제공하는 것이다.
본 발명의 다른 하나의 목적은 상기 조성물을 세포에 처리하는 단계를 포함하는, 표적 RNA 및 RNA 결합 단백질의 상호작용 분석 방법을 제공하는 것이다.
본 발명의 또 다른 하나의 목적은 (a) 가이드 RNA 및 표적 RNA 서열을 포함하는 폴리뉴클레오티드; (b) 표적 RNA 결합 단백질 및 전사인자의 활성도메인을 포함하는 융합 단백질; (c) dCas; 및 (d) TRE, 프로모터 및 리포터 서열을 포함하는 폴리뉴클레오티드를 포함하는, 표적 RNA 및 RNA 결합 단백질과 관련된 질환의 약물 스크리닝용 조성물을 제공하는 것이다.
본 발명은 CRISPR/Cas 시스템을 일부 변형하여, 세포 내 RNA-단백질 간의 상호작용을 용이하게 분석 및 정량화하고, RNA-단백질 간의 상호작용을 조절할 수 있는 물질의 스크리닝 등에 사용될 수 있는 시스템을 제작한 바, 세포 내 RNA-단백질 상호작용에 기반을 둔 기초 연구 또는 RNP를 활용한 신약 개발 관련 산업에서 유용하게 활용될 수 있다.
도 1은 본 발명의 CRISPR-RNP 분석 시스템의 모식도이다.
도 2A는 박테리오파지의 RNP 쌍인 MS2-MCP 상호작용을 나타낸 모식도이다.
도 2B는 본 발명의 CRISPR-RNP 분석 시스템으로 6X MS2-MCP 상호작용을 정량화한 그래프이다,
도 2C는 본 발명의 CRISPR-RNP 분석 시스템에 포함된 각 구성요소의 발현을 웨스턴 블롯을 통해 확인한 도이다.
도 2D는 본 발명의 CRISPR-RNP 분석 시스템으로 6X, 1X MS2-MCP 상호작용을 정량화한 그래프이다.
도 2E는 6X MS2-MCP 상호작용과 1X MS2-MCP 상호작용을 나타낸 모식도이다.
도 3A는 HIV 바이러스의 RNP 쌍인 TAR-Tat 상호작용을 나타낸 모식도이며, 도 3B는 본 발명의 CRISPR-RNP 분석 시스템으로 TAR-Tat 상호작용을 정량화한 그래프이다.
도 4A는 포유동물 세포의 RNP 쌍인 IRE-IRP1 상호작용을 나타낸 모식도이며, 도 4B는 본 발명의 CRISPR-RNP 분석 시스템으로 IRE-IRP1 상호작용을 정량화한 그래프이다.
이를 구체적으로 설명하면 다음과 같다. 한편, 본 발명에서 개시된 각각의 설명 및 실시형태는 각각의 다른 설명 및 실시형태에도 적용될 수 있다. 즉, 본 발명에서 개시된 다양한 요소들의 모든 조합이 본 발명의 범주에 속한다. 또한, 하기 기술된 구체적인 서술에 의하여 본 발명의 범주가 제한된다고 볼 수 없다.
또한, 당해 기술분야의 통상의 지식을 가진 자는 통상의 실험만을 사용하여 본 발명에 기재된 본 발명의 특정 양태에 대한 다수의 등가물을 인지하거나 확인할 수 있다. 또한, 이러한 등가물은 본 발명에 포함되는 것으로 의도된다.
상기 목적을 달성하기 위한 본 발명의 하나의 양태는 (a) 가이드 RNA 및 표적 RNA 서열을 포함하는 폴리뉴클레오티드; (b) 표적 RNA 결합 단백질 및 전사인자(transcription factor)의 활성도메인(activation domain)을 포함하는 융합 단백질; (c) dCas 단백질; 및 (d) TRE, 프로모터 및 리포터 서열을 포함하는 폴리뉴클레오티드를 포함하는, 표적 RNA 및 RNA 결합 단백질의 상호작용 분석용 조성물을 제공한다.
본 발명의 또 다른 하나의 양태는 (a) 가이드 RNA 및 표적 RNA 서열을 포함하는 폴리뉴클레오티드; (b) 표적 RNA 결합 단백질 및 전사인자의 활성도메인을 포함하는 융합 단백질; (c) dCas 단백질; 및 (d) TRE, 프로모터 및 리포터 서열을 포함하는 폴리뉴클레오티드를 포함하는, 표적 RNA 및 RNA 결합 단백질과 관련된 질환의 약물 스크리닝용 조성물을 제공한다.
본 발명의 표적 RNA 및 RNA 결합 단백질의 상호작용 분석용 조성물은 CRISPR/Cas 유전자 교정기술을 응용하여 세포 내 RNA와 단백질 상호작용을 보다 쉽고 정량적으로 분석할 수 있는 새로운 분석 기술이다. 구체적으로, CRISPR/Cas 시스템은 최신 유전자 교정기술로써 방대한 DNA 염기서열 중에서 원하는 특정 부위만을 선택적으로 인식해서 DNA를 자르고 돌연변이를 유도할 수 있는 기술로 유전질환의 치료 및 농작물/가축의 품종 개량 등에 널리 적용될 수 있는 기술이다. 상기 CRISPR/Cas 시스템은 표적 염기를 인식하는 sgRNA, 및 sgRNA에 결합하여 표적 염기를 인식 및 절단하는 Cas 단백질을 필수 구성요소로 한다.
본 발명의 "가이드 RNA (guide RNA, gRNA)"는 타겟 영역의 염기서열 특이성을 유도하여 Cas 단백질이 표적 유전자를 절단할 수 있도록 하는 RNA를 의미한다. 상기 가이드 RNA를 구성하는 RNA의 개수에 따라 sgRNA(single guide RNA) 및 dual gRNA(dual guide RNA) 시스템으로 구분할 수 있으나, 이에 제한되지 않는다. 본 발명의 가이드 RNA는 TRE(tetracycline response element) 서열을 선택적으로 인식할 수 있으며, dCas와 결합하여 복합체를 형성할 수 있으나, 이에 제한되지 않는다. 또한, gRNA는 Cas의 종류 및 인식하는 DNA 서열등에 따라 적절히 조절할 수 있으므로, gRNA은 gRNA로의 역할을 할 수 있는 한 특정한 서열에 제한되지 않는다.
본 발명의 "표적 RNA"는, RNA 결합 단백질과 결합함으로써 그 상호작용 분석의 목적이 되는 RNA를 의미한다. 표적 RNA는 tRNA(transfer RNA), mRNA(messenger RNA), rRNA(ribosomal RNA), 다양한 small noncoding RNAs, long noncoding RNAs, virus/bacteria 등 병원체의 RNA genome 내지는 이들이 만들어 내는 RNA 또는 인위적으로 유전자 재조합 방법에 의해 만들어지는 리보-폴리뉴클레오티드(ribo-polynucleotide)일 수 있으나, 이에 제한되지 않는다. 특히, 생명공학, 의학, 약학 등에 유용한 후보물질이나, 생체 내 작용을 일으키는 물질의 RNA 등일 수 있다. 구체적으로, 상기 표적 RNA는 자연적으로 존재하는 서열이거나 새로이 변형된 서열일 수 있고, 박테리오파지의 MS2 RNA, HIV 바이러스의 트랜스-활성 반응 요소(Trans-activation response element; TAR) RNA, 또는 인간의 철-반응 요소(iron-responsive element; IRE) RNA의 또는 이의 변이형일 수 있으나, 이에 제한되지 않는다.
일 구현 예로, 상기 MS2 RNA는 서열번호 4, 상기 TAR RNA는 서열번호 8, 변이형 TAR(TAR(MT)) RNA는 서열번호 11, IRE(FTH1) RNA는 서열번호 13, IRE(FTL) RNA는 서열번호 14, 변이형 IRE(FTH1)(IRE (FTH1-MT)) RNA는 서열번호 15, 및 변이형 IRE(FTL)(IRE (FTL-MT)) RNA는 서열번호 16의 염기서열을 포함하거나 구성되는 것일 수 있으나, 이에 제한되지 않는다.
본 발명의 "표적 RNA"는 "타겟 RNA"와 혼용하여 사용될 수 있다.
본 발명의 표적 RNA 서열은 가이드 RNA의 스캐폴드 스템루프(scaffold stem-loop) 구조의 3‘ 또는 5'말단부에 연결되어 폴리뉴클레오티드를 형성하는 것일 수 있으나, 이에 제한되지 않는다. 표적 RNA 서열이 가이드 RNA의 scaffold stem-loop 구조의 3‘ 말단부에 연결되는 경우, 가이드 RNA에 dCas9 단백질이 선택적으로 결합할 수 있으며, 가이드 RNA가 결합하는 표적 RNA 서열 뒤에 있는 PAM 서열을 인식할 수 있다. 또 다른 유전자 교정기술로 dCas12 단백질을 사용할 경우, gRNA의 방향성이 반대로 바뀌어 가이드 RNA의 5' 말단부에 표적 RNA 서열을 연결할 수 있다. 본 발명의 표적 RNA 및 RNA 결합 단백질의 상호작용 분석용 조성물은 상기 표적 RNA 서열 및 가이드 RNA를 포함하는 폴리뉴클레오티드를 구성요소로서 포함한다.
상기 표적 RNA는 RNA 반복단위를 하나 이상 포함할 수 있으나, 개수에 제한되지 않는다. 본 발명에서는 RNA 반복단위가 하나일 때에도 6개의 RNA 반복단위를 가질 때와 마찬가지로 표적 RNA 및 RNA-결합 단백질의 상호작용을 분석할 수 있음을 확인하였다(실험예 2).
본 발명의 "RNA 결합 단백질"은 세포 내에서 단일가닥의 비구조 RNA 또는 이중가닥이 포함된 구조 RNA와 결합하여 리보핵단백질(RNP) 복합체 형성에 관여하는 단백질을 의미한다 (J. Appl. Biol. Chem 58(3), 2015, 201-208). 본 발명에서는 표적 RNA와 결합하여 상호작용할 수 있는 단백질을 제한 없이 포함하며, 표적 RNA와 상호작용할 수 있는 야생형 단백질뿐만 아니라, RNA와 결합하는 단백질의 유도체(derivatives), 변이체, 결합 기능을 담당하는 도메인 또는 폴리펩티드의 일부일 수 있다. 구체적으로, 상기 RNA 결합 단백질도 자연적으로 존재하는 야생형이거나 새로이 변형된 것일 수 있고, mRNA 결합 단백질(mRNA-binding protein)로는 다양한 RNA 프로세싱 및 턴오버(turnover)에 관여하는 hnRNPs, 스플라이싱에 관여하는 SR 단백질, 철 조절 단백질(Iron regulatory protein; IRP1), 단백질 번역에 관여하는 리보솜 단백질(ribosomal protein), 아미노아실-tRNA 합성효소(aminoacyl-tRNA synthetase), RNA와 결합능이 있는 바이러스 유래 단백질에는, HIV의 Tat(Trans-Activator of Transcription) 단백질, 인플루엔자 바이러스의 NP 단백질, 박테리오파지의 외피 단백질 (MCP), 또는 이의 변이형 등일 수 있으나, 이에 제한되지 않는다.
일 구현 예로, 상기 MCP 단백질은 서열번호 5, 상기 Tat 단백질은 서열번호 9, 변이형 Tat(Tat(MT)) 단백질은 서열번호 10, 상기 IRP1 단백질은 서열번호 12, 변이형 IRP1(IRP1(MT)) 단백질은 서열번호 17의 아미노산 서열을 포함하거나 구성되는 것일 수 있으나, 이에 제한되지 않는다.
본 발명에서, "RNA 결합 단백질" 및 "결합 단백질"은 혼용하여 사용될 수 있다.
본 발명의 "전사인자(transcription factor)의 활성도메인(activation domain, trans-activation domain, trans-activating domain)"은 DNA에서 RNA로의 전사를 조절하는 전사인자의 활성도메인을 의미한다. 일반적으로 전사인자는 특정한 DNA 영역에 결합하는 DNA 결합 도메인(DNA binding domain) 및 전사 조절 매개체(transcription coregulator)와 같은 다른 단백질에 결합하는 영역인 활성도메인(activation domain)을 포함한다. 상기 전사인자의 활성 도메인은 DNA 결합 도메인을 포함하지 않는 것일 수 있고, 활성도메인의 기능을 할 수 있는 한 그 종류 및 유래 등에 제한되지 않는다.
일 구현 예로, 상기 전사인자의 활성도메인은 VP64 또는 GAL4-AD일 수 있으나, 이에 제한되지 않는다.
본 발명의 "VP64"는 헤르페스 단순 바이러스(Herpes Simplex Virus) 단백질 VP16의 전사활성도메인의 핵심 부위를 4-카피로 연결한 폴리펩티드로서, 표적 유전자의 전사를 증폭시키는 단백질의 일종이다. 본 발명의 VP64는 RNA 결합 단백질에 융합되어 표적 RNA과 상호작용함으로써 TRE에 결합하여 리포터 서열의 발현을 증가시키는 역할을 할 수 있다. RNA 결합 단백질에 융합하는 전사 활성 인자로는 VP64 를 대신하여 GAL4-AD 등을 포함할 수 있으나, 이에 제한되지 않는다. 본 발명에서 GAL4-AD는 효모가 가지는 대표적인 전사활성인자인 GAL-4 단백질의 전사활성도메인을 의미하는 것으로서, VP64와 동일한 기능을 수행할 수 있다.
또한, 본 발명의 표적 RNA 결합 단백질 및 전사인자의 활성도메인을 포함하는 융합 단백질은 전사 활성을 증가시킬 수 있는 전사인자의 활성 도메인을 추가로 포함하는 것일 수 있다.
일 구현 예로, 상기 융합 단백질은 p65 및 Rta를 더 포함하여 VP64-p65-Rta (VPR)를 형성하여 VP64와 유사하게 기능하면서 더 우수한 효과를 낼 수 있으나, 이에 제한되지 않는다.
본 발명의 표적 RNA 및 RNA 결합 단백질의 상호작용 분석용 조성물은 표적 RNA 결합 단백질 및 VP64 또는 GAL4-AD가 결합된 융합 단백질을 일 구성요소로서 포함한다. 상기 VP64는 서열번호 2의 아미노산 서열을 포함하는 것일 수 있으나, 이에 제한되지 않는다.
본 발명의 CRISPR/Cas 시스템은 박테리아에 바이러스가 침범했을 때 유입된 바이러스의 핵산 단편을 자신의 염색체에 끼워 넣고 이를 기억하고 있다가 다시 그 단편을 가진 바이러스가 침범했을 때 이를 인식하여 바이러스의 DNA를 잘라 자신을 보호하는 박테리아의 후천성 면역시스템을 응용한 것이다. CRISPR/Cas 시스템은 DNA를 자르는 단백질이 여러 개로 구성된 Class Ⅰ과 단일하게 구성된 Class Ⅱ로 크게 나눌 수 있다.
본 발명의 "dCas 단백질(deactivated CRISPR-associated protein, 또는 dead CRISPR-associated protein)"은 게놈의 특정 유전자를 표적으로 하면서도, 유전자 절단 활성 (endonuclease activity)만을 불활성화한 Cas 단백질이다. dCas 단백질은 gRNA와 복합체를 이루어 특정 유전자 서열을 인식하여 결합할 수 있다. Cas 단백질 또는 유전자 정보는 NCBI(National Center for Biotechnology Information)의 GenBank와 같은 공지의 데이터 베이스에서 얻을 수 있으나, 이에 제한되지 않는다. 본 발명의 표적 RNA 및 RNA 결합 단백질의 상호작용 분석용 조성물은 dCas 단백질을 일 구성요소로서 포함한다.
본 발명의 Cas 단백질은 당업계에서 유전자 교정 기술에 활용되는 단백질이면 제한 없이 포함된다. 상기 유전자 교정 기술에 활용되는 단백질은 가이드 RNA를 인식하고 타겟 DNA/RNA를 절단할 수 있으며, 구체적으로, Cas9, Cas12a (Cpf1와 동일), Cas12b, Cas13(Cas13a, Cas13b, Cas13c, Cas13d 등 Cas13 패밀리 중 어느 하나 이상 포함), Cas14, 또는 CasX(임의의 Cas 또는 이의 변이체)일 수 있으나, 자연형, 변이형, 및 이의 유래 등에 제한 없이 유전자 교정 기술에 활용될 수 있다면 상기 Cas에 포함된다.
일 구현 예로, 상기 dCas9은 서열번호 3의 아미노산 서열을 포함하는 것일 수 있으나, 이에 제한되지 않는다.
또한, 본 발명의 상기 dCas 단백질은 dCas9, dCas12a (dCpf1), dCas12b, dCas13, dCas14, 또는 dCasX일 수 있으나, 이에 제한되지 않는다.
본 발명의 "TRE(tetracycline response element)"는 TetO 서열 (TCCCTATCAGTGATAGAGA)이 7 반복된 서열로써, 본 발명의 가이드 RNA의 표적이 되는 서열을 의미한다. 상기 TRE는 특정한 유전자의 유도 발현에 주로 이용되며, 본 발명에서는 리포터 유전자의 유도 발현을 위하여 프로모터의 상위 영역에 연결된다. 구체적으로, 본 발명의 가이드 RNA 및 dCas는 상기 TRE 서열을 선택적으로 인식하고, 가이드 RNA에 연결된 표적 RNA에 RNA 결합 단백질이 결합하여 상호작용함에 따라, 전사 활성 인자인 VP64 또는 GAL4-AD에 의하여 리포터 유전자의 발현이 증가된다. 상기 TRE는 서열번호 1의 염기서열을 포함하거나, 구성되는 것일 수 있으나, 이에 제한되지 않는다.
본 발명의 "리포터"는 플라스미드와 같은 특정한 유전 요소 또는 벡터 내에 삽입된 DNA의 존재 유무를 알려주거나, 다른 유전자의 프로모터에 연결되어 발현을 확인하기 위해서 이용하는 유전자이다. 특정 유전자의 발현 위치나 발현 수준을 확인하기 위해 조절 서열 또는 관심 유전자에 융합될 수 있으며, 기질을 발광 또는 착색된 형태로 만드는 형광 단백질 또는 효소를 암호화하는 유전자를 포함할 수 있다. 또한, 특정 유전자를 타겟으로 하지 않고 특정 프로모터의 활성을 분석하는데 사용될 수도 있다. 본 발명의 리포터 서열은 프로모터에 결합되어 그 발현이 조절된다.
구체적으로, 상기 리포터는 루시퍼라아제(luciferase), GFP(Green Fluorescent Protein), RFP(Red Fluorescent Protein), mRFP(Monomeric Red Fluorescent Protein), BFP(Blue Fluorescent Protein), CFP(Cyan Fluorescent Protein), YFP(Yellow Fluorescent Protein), AzG(Azami Green), HcR(HcRed, Heteractis crispa red fluorescent protein) 및 BFP(Blue Fluorescent Protein)로 이루어지는 군에서 선택되는 유전자 서열일 수 있으며, 더욱 구체적으로 상기 루시퍼라아제는 파이어플라이 루시퍼라아제(firefly luciferase), 레닐라 루시퍼라아제(renillar luciferase), 가우시아 루시퍼라아제 (Gaussia luciferase), 및 나노루시퍼라아제(nano luciferase)로 구성되는 군에서 선택되는 어느 하나 이상일 수 있으나, 이에 제한되지 않는다.
본 발명의 표적 RNA 및 RNA 결합 단백질의 상호작용 분석용 조성물은 TRE, 프로모터 및 리포터 서열을 포함하는 폴리뉴클레오티드를 일 구성요소로서 포함한다.
본 발명의 "상호작용"은, RNA 결합 단백질이 표적 RNA를 특이적으로 인식하고 반응하여 리보핵산단백질(ribonucleoprotein)을 형성하는 일련의 과정을 포함하며, 표적 RNA 및 RNA 결합 단백질은 직접적으로 결합하거나, 간접적으로 결합하여 상호작용할 수 있다. 본 발명자들은 기존의 RNA-단백질 간 상호작용 분석 방법의 문제점인 복잡한 단계 및 다양한 표적 RNA 적용의 어려움을 개선하여, 세포 내 상기 표적RNA 및 RNA 결합 단백질 간의 상호작용을 보다 용이하면서도 정량적으로 분석 가능한 새로운 상호작용 분석 시스템을 개발하였다.
본 발명의 구체적인 일 구현예에서는, 본 발명의 분석 시스템의 작용을 평가하기 위하여, 다양한 RNA 및 RNA 결합 단백질의 쌍을 적용하여 그 상호작용을 정량 분석하였다. 구체적으로, 박테리오파지의 게놈에 존재하는 stem-loop인 MS2 RNA와 이를 특이적으로 인식하는 MS2 코팅 단백질(MS2 coat protein; MCP) 간의 특이적인 결합 (실험예 2), 후천성 면역 결핍증의 원인 바이러스인 HIV 바이러스의 증식에 핵심적인 TAR 및 Tat 단백질 간의 상호작용 (실험예 3), 인간 세포의 철 항상성에 핵심적인 역할을 하는 IRE 및 IRP1 단백질 간의 상호작용 (실험예 4)을 본 발명의 조성물을 이용하여 측정한 결과, 음성대조군 대비 뚜렷하게 루시퍼라아제 활성이 증가한 바, 본 발명의 상호작용 분석용 조성물은 다양한 RNA 및 RNA 결합 단백질 간의 상호작용을 정량적으로 분석할 수 있음을 확인하였다.
표적 RNA 및 RNA 결합 단백질과 관련된 질환의 약물 스크리닝용 조성물은 다양한 표적 RNA 및 RNA 결합 단백질 쌍의 적용이 가능한 바, 상기 RNA 및 단백질 간의 상호작용의 분석을 통해 표적 RNA 및 RNA 결합 단백질과 관련된 질환의 예방 또는 치료에 이용될 수 있는 약물(또는 후보물질)의 스크리닝에 유용하게 적용될 수 있다.
본 발명의 "표적 RNA 및 RNA 결합 단백질과 관련된 질환"은 RNA, 단백질, 또는 RNP 형성에 관여하는 처리 과정에 문제가 생김으로써, 정상적인 RNP 형성이 이루어지지 않거나, 비정상적인 RNP가 형성되어 세포의 RNA 대사에 문제가 발생하여 발병하는 질환을 제한 없이 포함한다. 상기 표적 RNA 및 RNA 결합 단백질과 관련된 질환은 RNA 대사의 결함 또는 병원체의 특이적 RNA 대사에 의한 것일 수 있으나, 이에 제한되지 않는다.
구체적으로, RNA 결합 단백질 상의 기능 상실(loss-of-function) 돌연변이에 의한 대표적인 질병으로는 선천성 각화 이상증, 취약 X 증후군(fragile X syndrome), Hu 증후군, 증후군성 정신지체, 난치성 안구간대경련-근간대경련 (Opsoclonus-myoclonus ataxia), Prader-Willi 증후군, 색소성 망막염, 척수성 근위축증 등이 있으나, 이에 제한되지 않는다. RNA 상의 돌연변이에 의한 질병으로는 근디스트로피, 척수성 근위축증, fragile X-associated tremor/ataxia syndrome, 척수소뇌실조증 (Spinocerebellar ataxias), 듀센형 근이영양증 (duchenne muscular dystrophy) 등이 있으나, 이에 제한되지 않는다. RNA 결합 단백질 또는 RNA와 관련된 질병의 경우 대부분은 유전질환이 이에 해당하지만, 최근에는 다양한 암에서도 RNA 결합 단백질 및 RNA상의 돌연변이의 관련성이 보고되고 있다. 이들 중에는 특히 스플라이싱(splicing)의 결함과 관련된 질병이 많은데, 대표적인 스플라이싱 결함 질병으로는 척수성 근위축증, 듀센형 근이영양증, 전두측두엽 치매 (frontotemporal dementia), 낭포성 섬유종 (cystic fibrosis) 등이 있으나, 이에 제한되지 않는다. 또한, 상기 질병에 HIV 바이러스(Human immunodeficienty Virus)에 의한 후천성 면역 결핍증(Acquired Immune Deficiency Syndrome), 박테리오 파지 감염, 쿠포라케프 증후군(Kufor Rakeb syndrome), 치매, 및 파킨슨병 등도 포함될 수 있으나, 이에 제한되지 않는다. 최근에는 질병과 관련된 RNA 또는 RNP를 표적으로 하는 치료제 개발이 많은 관심을 받고 있으며, RNA 및 단백질 간의 상호작용이 새로운 신약 개발의 표적으로 대두되고 있는 상황이다. 본 발명의 표적 RNA 및 RNA 결합 단백질과 관련된 질환의 약물 스크리닝용 조성물은 RNA 및 RNA 결합 단백질 간의 상호작용을 조절하는 약물을 스크리닝하는 것일 수 있으며, 구체적으로, RNA 및 RNA 결합 단백질 간의 상호작용을 억제하거나, 또는 안정화하는 약물을 스크리닝하는 것일 수 있으나, 이에 제한되지 않는다.
본 발명에서 "표적 RNA 및 RNA 결합 단백질과 관련된 질환의 예방 또는 치료에 이용될 수 있는 후보물질"은 표적 RNA 및 RNA 결합 단백질과 관련된 질환의 예방 또는 치료에 이용될 것으로 예상되는 물질로서, 직접 또는 간접적으로 상기 질환을 호전 또는 개선시킬 수 있는 것으로 예상되는 물질이면 제한 없이 사용 가능하며, 화합물, 유전자, 또는 단백질 등의 치료 가능 예상물질을 모두 포함한다.
본 발명의 다른 하나의 양태는 상기 표적 RNA 및 RNA 결합 단백질의 상호작용 분석용 조성물을 포함하는 표적 RNA 및 RNA 결합 단백질의 상호작용 분석용 키트를 제공한다.
본 발명의 또 다른 하나의 양태는 상기 표적 RNA 및 RNA 결합 단백질의 상호작용 분석용 조성물을 세포에 처리하는 단계를 포함하는, 표적 RNA 및 RNA 결합 단백질의 상호작용 분석 방법을 제공한다.
본 발명의 또 다른 하나의 양태는 상기 표적 RNA 및 RNA 결합 단백질과 관련된 질환의 약물 스크리닝용 조성물; 및 표적 RNA 및 RNA 결합 단백질과 관련된 질환의 예방 또는 치료에 이용될 수 있는 후보물질을 세포에 처리하는 단계를 포함하는, 표적 RNA 및 RNA 결합 단백질과 관련된 질환의 약물 스크리닝 방법을 제공한다.
본 발명의 "표적 RNA", "RNA 결합 단백질", 및 "상호작용 분석"은 상기 기재된 바와 같다.
본 발명의 "키트"는 특정한 목적을 둔 구성물 세트를 의미하며, 본 발명에서의 특정한 목적은 표적 RNA 및 RNA 결합 단백질의 상호작용 분석용이라고 할 수 있다. 상기 키트의 구성물은 본 발명에 따른 조성물을 포함할 수 있으며, 표적 RNA 및 RNA 결합 단백질의 상호작용 분석을 위한 구성을 추가적으로 포함할 수 있다. 본 발명의 표적 RNA 및 RNA 결합 단백질의 상호작용 분석용 키트는 리포터 유전자의 발현 또는 활성을 통해 표적 RNA 및 RNA 결합 단백질의 상호작용을 간단하게 분석할 수 있다.
구체적으로, 상기 키트는 DNA 키트, 플라스미드 키트, RT-PCR 키트, 단백질 칩 키트, 및 면역 형광용 키트로 이루어진 군으로부터 선택되는 것일 수 있으나, 표적 RNA 및 RNA 결합 단백질의 상호작용을 유무 또는 정도를 분석하거나 리포터 서열의 활성 또는 발현을 확인할 수 있다면 그 작동 원리나 형태에 제한되지 않는다. 본 발명의 목적상 상기 키트는 DNA 및 플라스미드를 포함하는 DNA 플라스미드 키트; 또는 DNA 및 플라스미드를 포함하는 세포를 포함한 키트일 수 있다. 일 구현 예로, HIV TAR-Tat, MS2-MCP, 또는 IRE-IRP 등의 DNA 플라스미드 키트 및 이들을 안정적인 발현 세포주로 제작한 상품일 수 있으나, 이에 제한되지 않는다.
또한, 본 출원의 키트는 표적 RNA 및 RNA 결합 단백질의 상호작용 분석을 위해 적합한 한 종류 또는 그 이상의 다른 구성성분 조성물, 용액 또는 장치를 포함할 수 있으나, 이에 제한되지 않는다. 상기 다른 구성 성분의 일 예로, 적합한 담체, 검출 가능한 신호를 생성할 수 있는 표지 물질, 발색단(chromophores), 용해제, 세정제, 완충제, 안정화제 등이 포함되나 이에 제한되지 않는다. 표지물질이 효소인 경우에는 효소 활성을 측정할 수 있는 기질 및 반응 정지제를 포함할 수 있다. 담체는 가용성 담체, 불용성 담체가 있고, 가용성 담체의 일 예로 당 분야에서 공지된 생리학적으로 허용되는 완충액, 예를 들어 PBS가 있고, 불용성 담체의 일 예로 폴리스틸렌, 폴리에틸렌, 폴리프로필렌, 폴리에스테르, 폴리아크릴로니트릴, 불소 수지, 가교 덱스트란, 폴리사카라이드, 라텍스에 금속을 도금한 자성 미립자와 같은 고분자, 기타 종이, 유리, 금속, 아가로오스 및 이들의 조합일 수 있으나, 이에 제한되지 않는다.
또한, 본 출원의 키트는 리포터 서열의 활성 또는 발현 확인을 위한 프라이머 쌍 또는 이의 반응을 수행하기 위한 시약을 포함할 수 있으나, 이에 제한되지 않는다. 또한, 본 출원의 키트는 DNA 또는 RNA 증폭 반응에 필요한 시약을 추가로 포함할 수 있고, 상기 증폭 반응을 수행하기 위한 시약은 DNA 폴리머라제, dNTPs 및 버퍼 등을 포함할 수 있고, 또한, 실시간 PCR 반응 수행 및 분석을 위해 필요한 시약을 추가로 포함할 수 있다.
또한, 본 출원의 키트는 최적의 반응 수행 조건을 기재한 사용자 안내서를 추가로 포함할 수 있다. 안내서는 키트 사용법, 예를 들면, 버퍼 제조 방법, 제시되는 반응 조건 등을 설명하는 인쇄물이다. 안내서는 팜플렛 또는 전단지 형태의 안내 책자, 키트에 부착된 라벨 및 키트를 포함하는 패키지의 표면상에 설명을 포함한다. 또한, 안내서는 인터넷과 같이 전기 매체를 통해 공개되거나 제공되는 정보를 포함한다.
본 발명의 표적 RNA 및 RNA 결합 단백질의 상호작용 분석 방법; 및 표적 RNA 및 RNA 결합 단백질과 관련된 질환의 약물 스크리닝 방법은 본 발명에 따른 조성물을 세포에 처리하는 단계를 포함하며, 리포터 유전자의 발현 또는 활성을 측정하는 단계를 추가로 포함할 수 있다.
본 발명의 "세포"는 모든 생물의 기능적, 구조적 기본 단위를 의미하며, 동물, 식물, 효모 또는 박테리아의 세포일 수 있으나, 이에 제한되지 않는다.
상기 표적 RNA 및 RNA 결합 단백질의 상호작용 분석 방법은 대조군에 비해 리포터 유전자의 발현 또는 활성이 증가하면 대조군에 비해 표적 RNA 및 RNA 결합 단백질의 상호작용 수준이 높은 것으로 결정하고, 대조군과 리포터 유전자의 발현 또는 활성이 유사하면 대조군에 비해 표적 RNA 및 RNA 결합 단백질의 상호작용 수준이 높은 것으로 결정하는 단계를 더 포함할 수 있으나, 이에 제한되지 않는다.
또한, 상기 표적 RNA 및 RNA 결합 단백질과 관련된 질환의 약물 스크리닝 방법은 상기 표적 RNA 및 RNA 결합 단백질과 관련된 질환의 약물 스크리닝용 조성물만 처리한 대조군에 비해 후보물질을 더 처리하였을 때 리포터 유전자의 발현 또는 활성이 증가 또는 감소하면 상기 후보물질을 표적 RNA 및 RNA 결합 단백질과 관련된 질환의 예방 또는 치료에 이용할 수 있는 것으로 결정하는 단계를 더 포함할 수 있으나, 이에 제한되지 않는다.
본 발명의 다른 하나의 양태는 (a) 가이드 RNA 및 표적 RNA 서열을 포함하는 폴리뉴클레오티드; (b) 표적 RNA 결합 단백질 및 전사인자(transcription factor)의 활성도메인(activation domain)을 포함하는 융합 단백질; (c) dCas 단백질; 및 (d) TRE, 프로모터 및 리포터 서열을 포함하는 폴리뉴클레오티드를 포함하는 조성물의 표적 RNA 및 RNA 결합 단백질의 상호작용 분석 용도를 제공한다.
본 발명의 "가이드 RNA", "표적 RNA", "RNA 결합 단백질", "전사인자의 활성 도메인", 및 "TRE", "리포터 서열", 및 "상호작용 분석" 등은 상기 기재된 바와 같다.
이하, 실시예를 통하여 본 발명을 보다 상세히 설명하고자 한다. 이들 실시예는 본 발명을 보다 구체적으로 설명하기 위한 것으로, 본 발명의 범위가 이들 실시예에 의해 한정되는 것은 아니다.
실시예 1. 세포 배양 및 DNA 트랜스펙션(transfection)
293T 세포를 1% 페니실린 및 스트렙토마이신(Gibco)이 추가된 10% FBS를 함유한 DMEM 배지에서 배양하였다. 293T 세포(2 x 104 cells/well)를 96-well 플레이트에서 48시간 동안 XtremeGene Transfection Reagent (Roche)를 사용하여 적절한 플라스미드 조합으로 트랜스펙션하였다.
실시예 2. 플라스미드 제조
pcDNA-dCas9 및 pSPgRNA 플라스미드는 Addgene (#47106 및 #47108)에서, pNBe2 플라스미드는 Promega에서 구입하였다. tetO 서열을 표적으로 하는 TRE3G gRNA 플라스미드를 제조하기 위하여 TRE3G 표적 서열을 pSPgRNA 플라스미드에 삽입한 후, TRE3G gRNA 스캐폴드의 하위에 관심 있는 RNA 요소 서열을 추가하였다. TRE3G gRNA-표적 RNA 하이브리드 플라스미드는 각각 6X MS2, 1X MS2, TAR, IRE (FTH1, FTL)를 삽입하여 생성하였으며, TRE3G gRNA-TAR(MT), TRE3G gRNA-IRE(FTH1-MT) 및 TRE3G gRNA-IRE(FTL-MT) 플라스미드는 돌연변이를 유발하였다. RBP-VP64 플라스미드를 제조하기 위하여 pNBe2 플라스미드에 VP64 cDNA를 삽입하고난 후 MCP (WT, MT), Tat (WT, MT) 또는 IRP1 (WT, MT) cDNA를 추가적으로 삽입하였다.
실시예 3. 정량적 웨스턴 블롯(western blot) 분석
전체 세포로부터 단백질을 추출한 후, SDS-PAGE로 분리하고 PVDF 멤브레인에 트랜스퍼하였다. 멤브레인은 5% 스킴 밀크로 1h 시간 동안 블로킹한 후, 타겟 단백질에 특이적인 항체로 4℃에서 15h 동안 인큐베이트하였다. 이후, 멤브레인을 TBST로 10분씩 3회 washing 한 후에 2차 항체로 상온에서 1h 동안 인큐베이션하였다. 2차 항체 인큐베이션 후 다시 TBST로 10분씩 3회 washing하였다. 그 후에 항체와 반응한 단백질은 LAS-4000 Image analyzer (Fujifilm, Tokyo, Japan)에서 WEST-ZOL plus Western Blotting Detection System (iNtRON Biotechnology)을 이용하여 분석하였다.
실험예 1. CRISPR-RNP 분석 시스템 개요
본 발명의 RNA-단백질 상호작용 분석 시스템은 기존 CRISPR/Cas9 시스템에 일부 변형을 도입하여 완성하였다.
구체적으로, i) gRNA에 표적 RNA 서열이 삽입된 클론을 제작하고, ii) Cas의 분해 활성(endonuclease activity)이 불활성화된 dCas이 도입된 클론; iii) 표적 RNA 결합 단백질 및 전사활성 도메인(예를 들어, VP64 또는 GAL4-AD)가 융합된 클론; 및 iv) TRE (tetracycline response element) 프로모터 및 루시퍼라아제 서열을 포함하는 리포터를 제작하였다.
결과적으로, gRNA와 dCas9에 의하여 TRE 서열을 선택적으로 인식하고, 표적 RNA 서열에 표적 RNA 결합 단백질-VP64 또는 GAL4-AD가 결합하게 되면 전사활성 인자에 의하여 루시퍼라아제의 발현이 증가됨으로써 RNA-단백질 상호작용을 정량적으로 확인할 수 있다.
상기 분석 시스템의 작용을 평가하기 위하여, 기존에 알려진 여러 RNA-단백질 결합쌍을 적용하여 그 상호작용을 정량 분석하였다.
실험예 2. 박테리오파지의 MS2-MCP 상호작용 정량 분석
박테리오파지의 게놈에 존재하는 stem-loop인 MS2 RNA와 이를 특이적으로 인식하는 MS2 코팅 단백질(MS2 coat protein; MCP)을 활용하여 본 발명 분석 시스템을 평가하였다.
구체적으로, gRNA scaffold 뒤에 MS2 RNA(서열번호 4)를 삽입한 클론을 제작하고, MCP(서열번호 5)에 VP64(서열번호 2)를 융합한 클론을 제작하였다. 상기 클론을 dCas9(서열번호 3) 발현 클론 및 리포터 클론과 함께 293T 세포에서 48시간 과발현한 후, 루미노미터로 루시퍼라제(firefly 루시퍼라아제 또는 나노루시퍼라제 활성을 측정하였다. 그 결과, 도 2에 나타난 바와 같이, 표적 서열이 없는 gRNA의 조건에서는 나타나지 않던 루시퍼라아제의 활성이 표적 서열이 존재할 때에는 50배 이상 뚜렷한 증가가 관찰되었다. 또한, MS2와 결합하지 못하게 하는 N55D 및 K57E 돌연변이를 MCP에 도입한 시스템(MSP(N55D); 서열번호 6 및 MSP(K57E); 서열번호 7)의 경우, 전혀 루시퍼라아제 증가 효과가 나타나지 않는 것을 확인하였다. 그리고, 도 2D 및 도 2E에 나타난 바와 같이, RNA의 반복단위(repeat) 수를 기존 6X MS2에서 1X MS2로 줄여도 루시퍼라아제의 활성이 28배 이상 뚜렷하게 증가함을 관찰하였다.
즉, MS2와 MCP의 특이적인 결합의 결과로서 루시퍼라아제의 활성이 증가한 바, 본 발명 시스템이 박테리오파지의 RNA-단백질 상호작용을 정량 분석할 수 있음을 확인하였다.
실험예 3. HIV 바이러스의 TAR-Tat 상호작용 정량 분석
후천성 면역 결핍증 (AIDS)의 원인 바이러스인 HIV 바이러스의 증식에 핵심적인 RNA-단백질 상호작용으로서, TAR-Tat 상호작용을 본 발명의 시스템을 이용하여 평가하였다.
그 결과, 도 3에 나타난 바와 같이, TAR RNA 서열(서열번호 8)이 없는 조건에서는 루시퍼라아제 활성이 나타나지 않는 반면, TAR RNA 서열과 Tat 단백질(서열번호 9)이 함께 존재하는 조건에서는 루시퍼라아제 활성이 234배 증가하는 것을 확인하였다. 또한, TAR RNA와 결합하지 못하게 하는 돌연변이를 도입한 Tat(MT)(서열번호 10)의 경우와 Tat이 TAR RNA에 결합을 하지 못하게 돌연변이를 도입한 TAR(MT)(서열번호 11)의 경우, 전혀 루시퍼라아제 증가 활성이 나타나지 않는 것을 확인하였다.
실험예 4. 인간 세포의 IRE-IRP1 상호작용 정량 분석
실제 인간 세포에서 작용하는 대표적인 RNA-단백질 쌍으로, 철 항상성에 핵심적인 작용을 하는 IRE-IRP1 상호작용을 평가하였다.
그 결과, 도 4에 나타난 바와 같이, IRE (FTH1; 서열번호 13, FTL; 서열번호 14) RNA 서열이 없는 조건에서는 루시퍼라아제 활성이 나타나지 않는 반면, IRE (FTH1, FTL) RNA 서열 및 IRP1 단백질(서열번호 12)이 존재하는 조건에서는 루시퍼라아제 활성이 각각 36배, 21배 활성이 나타났으며, IRE RNA와 결합하지 못하게 하는 돌연변이를 도입한 IRP1(MT)(서열번호 17)의 경우와 IRP1 단백질이 IRE RNA에 결합하지 못하게 돌연변이를 도입한 IRE (FTH1-MT)(서열번호 15) 및 IRE (FTL-MT)(서열번호 16)의 경우에는 그 활성이 매우 약한 것을 확인하였다.
상기 실험예 2 내지 4의 결과를 통해, 본 발명의 RNA-단백질 상호작용 분석 시스템이 세포 내의 다양한 RNP를 분석하고 정량화할 수 있음을 시사함을 알 수 있었다.
이상의 설명으로부터, 본 발명이 속하는 기술분야의 당업자는 본 발명이 그 기술적 사상이나 필수적 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 이와 관련하여, 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적인 것이 아닌 것으로 이해해야만 한다. 본 발명의 범위는 상기 상세한 설명보다는 후술하는 청구범위의 의미 및 범위 그리고 그 등가 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.
Claims (16)
- (a) 가이드 RNA 및 표적 RNA 서열을 포함하는 폴리뉴클레오티드;(b) 표적 RNA 결합 단백질 및 전사인자(transcription factor)의 활성도메인(activation domain)을 포함하는 융합 단백질;(c) dCas 단백질; 및(d) TRE, 프로모터 및 리포터 서열을 포함하는 폴리뉴클레오티드를 포함하는, 표적 RNA 및 RNA 결합 단백질의 상호작용 분석용 조성물.
- 제1항에 있어서, 상기 dCas 단백질은 dCas9, dCas12a, dCas12b, dCas13, dCas14, 또는 dCasX인 것인, 표적 RNA 및 RNA 결합 단백질의 상호작용 분석용 조성물.
- 제1항에 있어서, 상기 리포터는 루시퍼라아제(luciferase), GFP(Green Fluorescent Protein), RFP(Red Fluorescent Protein), mRFP(Monomeric Red Fluorescent Protein), BFP(Blue Fluorescent Protein), CFP(Cyan Fluorescent Protein), YFP(Yellow Fluorescent Protein), AzG(Azami Green), HcR(HcRed, Heteractis crispa red fluorescent protein) 및 BFP(Blue Fluorescent Protein)로 이루어지는 군에서 선택되는 유전자 서열을 포함하는 것인, 표적 RNA 및 RNA 결합 단백질의 상호작용 분석용 조성물.
- 제1항에 있어서, 상기 표적 RNA 서열은 가이드 RNA의 스캐폴드 스템 루프(scaffold stem-loop) 구조의 3‘ 또는 5' 말단부에 연결되는 것인, 표적 RNA 및 RNA 결합 단백질의 상호작용 분석용 조성물.
- 제3항에 있어서, 상기 루시퍼라아제는 파이어플라이 루시퍼라아제(firefly luciferase), 레닐라 루시퍼라아제(renillar luciferase), 가우시아 루시퍼라아제 (Gaussia luciferase), 및 나노루시퍼라아제(nano luciferase)로 이루어진 군에서 선택되는 어느 하나 이상인 것인, 표적 RNA 및 RNA 결합 단백질의 상호작용 분석용 조성물.
- 제1항에 있어서, 상기 표적 RNA 서열은 MS2 RNA, 트랜스-활성 반응 요소(Trans-activation response element; TAR) RNA, 철-반응 요소(iron-responsive element; IRE) RNA, 및 이의 변이체로 구성되는 군에서 선택되는 어느 하나 이상인 것인, 표적 RNA 및 RNA 결합 단백질의 상호작용 분석용 조성물.
- 제1항에 있어서, 상기 RNA 결합 단백질은 MS2 코팅 단백질(MS2 coat protein; MCP), 전사 트랜스-활성자(trans-activator of transcription; Tat) 단백질, 철 조절 단백질(Iron regulatory protein 1; IRP1), 및 이의 변이체로 구성되는 군에서 선택되는 어느 하나 이상인 것인, 표적 RNA 및 RNA 결합 단백질의 상호작용 분석용 조성물.
- 제1항에 있어서, 상기 전사인자(transcription factor)의 활성도메인(activation domain)은 VP64 또는 GAL4-AD를 포함하는 것인, 표적 RNA 및 RNA 결합 단백질의 상호작용 분석용 조성물.
- 제1항의 조성물을 포함하는 표적 RNA 및 RNA 결합 단백질의 상호작용 분석용 키트.
- 제1항의 조성물을 세포에 처리하는 단계를 포함하는, 표적 RNA 및 RNA 결합 단백질의 상호작용 분석 방법.
- (a) 가이드 RNA 및 표적 RNA 서열을 포함하는 폴리뉴클레오티드;(b) 표적 RNA 결합 단백질 및 전사인자의 활성도메인을 포함하는 융합 단백질;(c) dCas 단백질; 및(d) TRE, 프로모터 및 리포터 서열을 포함하는 폴리뉴클레오티드를 포함하는, 표적 RNA 및 RNA 결합 단백질과 관련된 질환의 약물 스크리닝용 조성물.
- 제11항에 있어서, 상기 표적 RNA 및 RNA 결합 단백질과 관련된 질환은 RNA 대사 결함 또는 병원체의 특이적 RNA 대사에 의한 것인, 표적 RNA 및 RNA 결합 단백질과 관련된 질환의 약물 스크리닝용 조성물.
- 제11항에 있어서, 상기 질환은 선천성 각화 이상증, 취약 X 증후군(fragile X syndrome), Hu 증후군, 증후군성 정신지체, 난치성 안구간대경련-근간대경련 (Opsoclonus-myoclonus ataxia), 프라더 윌리 증후군(Prader-Willi syndrome), 색소성 망막염, 척수성 근위축증, 근디스트로피, 척수성 근위축증, 취약 X-연관 떨림/운동실조 증후군(fragile X-associated tremor/ataxia syndrome), 척수소뇌실조증 (Spinocerebellar ataxias), 듀센형 근이영양증 (duchenne muscular dystrophy), 척수성 근위축증, 듀센형 근이영양증, 전두측두엽 치매 (frontotemporal dementia), 낭포성 섬유종 (cystic fibrosis), 후천성 면역 결핍증(Acquired Immune Deficiency Syndrome), 박테리오 파지 감염, 쿠포라케프 증후군(Kufor Rakeb syndrome), 치매, 및 파킨슨병으로 구성되는 군에서 선택되는 어느 하나 이상을 포함하는 것인, 표적 RNA 및 RNA 결합 단백질과 관련된 질환의 약물 스크리닝용 조성물.
- 제11항에 있어서, 상기 표적 RNA 서열은 MS2 RNA, 트랜스-활성 반응 요소(Trans-activation response element; TAR) RNA, 철-반응 요소(iron-responsive element; IRE) RNA, 및 이의 변이체로 구성되는 군에서 선택되는 어느 하나 이상인 것인, 표적 RNA 및 RNA 결합 단백질과 관련된 질환의 약물 스크리닝용 조성물.
- 제11항에 있어서, 상기 RNA 결합 단백질은 MS2 코팅 단백질(MS2 coat protein; MCP), 전사 트랜스-활성자(trans-activator of transcription; Tat) 단백질, 철 조절 단백질(Iron regulatory protein 1; IRP1), 및 이의 변이체로 구성되는 군에서 선택되는 어느 하나 이상인 것인, 표적 RNA 및 RNA 결합 단백질과 관련된 질환의 약물 스크리닝용 조성물.
- 제11항에 있어서, 상기 전사인자의 활성도메인은 VP64 또는 GAL4-AD를 포함하는 것인, 표적 RNA 및 RNA 결합 단백질과 관련된 질환의 약물 스크리닝용 조성물.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR20210009632 | 2021-01-22 | ||
KR10-2021-0009632 | 2021-01-22 |
Publications (1)
Publication Number | Publication Date |
---|---|
WO2022158906A1 true WO2022158906A1 (ko) | 2022-07-28 |
Family
ID=82548922
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/KR2022/001144 WO2022158906A1 (ko) | 2021-01-22 | 2022-01-21 | 표적 rna 및 rna-결합 단백질의 상호작용 분석용 조성물 |
Country Status (2)
Country | Link |
---|---|
KR (1) | KR20220106712A (ko) |
WO (1) | WO2022158906A1 (ko) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170233762A1 (en) * | 2014-09-29 | 2017-08-17 | The Regents Of The University Of California | Scaffold rnas |
WO2018200653A1 (en) * | 2017-04-25 | 2018-11-01 | The Johns Hopkins University | A yeast two-hybrid rna protein interaction system based on catalytically inactivated crispr-dcas9 |
-
2022
- 2022-01-21 WO PCT/KR2022/001144 patent/WO2022158906A1/ko active Application Filing
- 2022-01-21 KR KR1020220009293A patent/KR20220106712A/ko not_active Application Discontinuation
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170233762A1 (en) * | 2014-09-29 | 2017-08-17 | The Regents Of The University Of California | Scaffold rnas |
WO2018200653A1 (en) * | 2017-04-25 | 2018-11-01 | The Johns Hopkins University | A yeast two-hybrid rna protein interaction system based on catalytically inactivated crispr-dcas9 |
Non-Patent Citations (3)
Title |
---|
HAN SHUO, ZHAO BOXUAN SIMEN, MYERS SAMUEL A., CARR STEVEN A., HE CHUAN, TING ALICE Y.: "RNA–protein interaction mapping via MS2- or Cas13-based APEX targeting", PROCEEDINGS OF THE NATIONAL ACADEMY OF SCIENCES, NATIONAL ACADEMY OF SCIENCES, vol. 117, no. 36, 8 September 2020 (2020-09-08), pages 22068 - 22079, XP055841381, ISSN: 0027-8424, DOI: 10.1073/pnas.2006617117 * |
LEVI G. LOWDER, ZHOU JIANPING, ZHANG YINGXIAO, MALZAHN AIMEE, ZHONG ZHAOHUI, HSIEH TZUNG-FU, VOYTAS DANIEL F., ZHANG YONG, QI YIPI: "Robust Transcriptional Activation in Plants Using Multiplexed CRISPR-Act2.0 and mTALE-Act Systems", MOLECULAR PLANT, vol. 11, no. 2, 28 November 2017 (2017-11-28), pages 245 - 256, XP055577314, ISSN: 1674-2052, DOI: 10.1016/j.molp.2017.11.010 * |
XU XIAOSHU; QI LEI S.: "A CRISPR–dCas Toolbox for Genetic Engineering and Synthetic Biology", JOURNAL OF MOLECULAR BIOLOGY, ACADEMIC PRESS, UNITED KINGDOM, vol. 431, no. 1, 26 June 2018 (2018-06-26), United Kingdom , pages 34 - 47, XP085564888, ISSN: 0022-2836, DOI: 10.1016/j.jmb.2018.06.037 * |
Also Published As
Publication number | Publication date |
---|---|
KR20220106712A (ko) | 2022-07-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Cheow et al. | Single-cell multimodal profiling reveals cellular epigenetic heterogeneity | |
Weingarten-Gabbay et al. | Systematic discovery of cap-independent translation sequences in human and viral genomes | |
Tai et al. | Engineering microdeletions and microduplications by targeting segmental duplications with CRISPR | |
Boudry et al. | Function of the CRISPR-Cas system of the human pathogen Clostridium difficile | |
US20170283779A1 (en) | Bacteriophage engineering methods | |
US20180265934A1 (en) | Coincidence reporter gene system | |
Han et al. | Development of miniature base editors using engineered IscB nickase | |
Engdahl et al. | Human herpesvirus 6B induces hypomethylation on chromosome 17p13. 3, correlating with increased gene expression and virus integration | |
WO2010137903A2 (ko) | 신개념 신약개발을 위한 타겟 단백질-단백질 상호작용을 저해하는 신약후보물질의 스크리닝 방법 | |
Wu et al. | Massively parallel characterization of CRISPR activator efficacy in human induced pluripotent stem cells and neurons | |
Chen et al. | Using Barcoded HIV Ensembles (B‐HIVE) for Single Provirus Transcriptomics | |
WO2022119294A1 (ko) | 사이토신 교정 활성이 제거된 아데닌 염기교정 유전자가위 및 이의 용도 | |
WO2022158906A1 (ko) | 표적 rna 및 rna-결합 단백질의 상호작용 분석용 조성물 | |
Philippe et al. | Genetic manipulation of giant viruses and their host, Acanthamoeba castellanii | |
Huang et al. | Development of clustered regularly interspaced short palindromic repeats/CRISPR-associated technology for potential clinical applications | |
WO2012002597A1 (ko) | Β형 간염 바이러스 진단용 프라이머, 프로브, 이를 포함하는 키트 및 상기 키트를 이용한 β형 간염 바이러스 진단 방법 | |
Ku et al. | XBP-1, a novel human T-lymphotropic virus type 1 (HTLV-1) tax binding protein, activates HTLV-1 basal and tax-activated transcription | |
Segawa et al. | The plasmid-encoded transcription factor ArdK contributes to the repression of the IMP-6 metallo-β-lactamase gene bla IMP-6, leading to a carbapenem-susceptible phenotype in the bla IMP-6-positive Escherichia coli strain A56-1S | |
Hiller et al. | The mRNA binding proteome of proliferating and differentiated muscle cells | |
WO2022197801A1 (en) | Systems and methods for determining barcodes and screening in situ | |
WO2021194172A1 (ko) | 신규한 가이드 rna 및 이를 이용한 코로나바이러스감염증 2019를 진단하는 방법 | |
Picchi-Constante et al. | Efficient CRISPR-Cas9-mediated genome editing for characterization of essential genes in Trypanosoma cruzi | |
Ali et al. | An emerging and variant viral promoter of HIV-1 subtype C exhibits low-level gene expression noise | |
Nakamura et al. | A cell-based method for screening RNA-protein interactions: identification of constitutive transport element-interacting proteins | |
Simon et al. | Applications of chimeric genes and hybrid proteins, Part A: Gene Expression and Protein Purification |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 22742882 Country of ref document: EP Kind code of ref document: A1 |
|
NENP | Non-entry into the national phase |
Ref country code: DE |
|
122 | Ep: pct application non-entry in european phase |
Ref document number: 22742882 Country of ref document: EP Kind code of ref document: A1 |