JP2024010112A - Pprモチーフを利用したrna結合性蛋白質の設計方法及びその利用 - Google Patents
Pprモチーフを利用したrna結合性蛋白質の設計方法及びその利用 Download PDFInfo
- Publication number
- JP2024010112A JP2024010112A JP2023183886A JP2023183886A JP2024010112A JP 2024010112 A JP2024010112 A JP 2024010112A JP 2023183886 A JP2023183886 A JP 2023183886A JP 2023183886 A JP2023183886 A JP 2023183886A JP 2024010112 A JP2024010112 A JP 2024010112A
- Authority
- JP
- Japan
- Prior art keywords
- rna
- ppr
- protein
- amino acids
- binding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title description 41
- 238000013461 design Methods 0.000 title description 7
- 102000044126 RNA-Binding Proteins Human genes 0.000 title description 6
- 101710159080 Aconitate hydratase A Proteins 0.000 title description 2
- 101710159078 Aconitate hydratase B Proteins 0.000 title description 2
- 101710105008 RNA-binding protein Proteins 0.000 title description 2
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 267
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 205
- 230000027455 binding Effects 0.000 claims abstract description 113
- 108090000765 processed proteins & peptides Proteins 0.000 claims abstract description 11
- 102000004196 processed proteins & peptides Human genes 0.000 claims abstract description 10
- 229920001184 polypeptide Polymers 0.000 claims abstract description 9
- 239000000203 mixture Substances 0.000 claims abstract description 4
- 150000001413 amino acids Chemical class 0.000 claims description 212
- 238000013519 translation Methods 0.000 claims description 5
- 230000021839 RNA stabilization Effects 0.000 claims description 2
- 235000001014 amino acid Nutrition 0.000 description 204
- 229940024606 amino acid Drugs 0.000 description 203
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 199
- 235000018102 proteins Nutrition 0.000 description 197
- 238000010357 RNA editing Methods 0.000 description 64
- 230000026279 RNA modification Effects 0.000 description 64
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Chemical compound OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 42
- 229960001230 asparagine Drugs 0.000 description 36
- 235000009582 asparagine Nutrition 0.000 description 36
- 108091028043 Nucleic acid sequence Proteins 0.000 description 33
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 31
- 235000003704 aspartic acid Nutrition 0.000 description 31
- 229960005261 aspartic acid Drugs 0.000 description 31
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 31
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 30
- 125000003275 alpha amino acid group Chemical group 0.000 description 29
- 230000035558 fertility Effects 0.000 description 27
- 230000006870 function Effects 0.000 description 25
- 230000004570 RNA-binding Effects 0.000 description 22
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 20
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 20
- 239000004473 Threonine Substances 0.000 description 20
- 235000006140 Raphanus sativus var sativus Nutrition 0.000 description 18
- 239000013615 primer Substances 0.000 description 18
- 241000219194 Arabidopsis Species 0.000 description 17
- 108020004414 DNA Proteins 0.000 description 17
- 238000004458 analytical method Methods 0.000 description 17
- 241000220259 Raphanus Species 0.000 description 15
- 229910052799 carbon Inorganic materials 0.000 description 15
- 210000004027 cell Anatomy 0.000 description 13
- 238000002474 experimental method Methods 0.000 description 13
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 12
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 12
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 12
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 12
- 230000001086 cytosolic effect Effects 0.000 description 12
- 239000000499 gel Substances 0.000 description 12
- 239000011159 matrix material Substances 0.000 description 12
- 239000004474 valine Substances 0.000 description 12
- 229960004295 valine Drugs 0.000 description 12
- 235000014393 valine Nutrition 0.000 description 12
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 10
- 241000196324 Embryophyta Species 0.000 description 10
- 230000015572 biosynthetic process Effects 0.000 description 10
- 210000003763 chloroplast Anatomy 0.000 description 10
- 238000006243 chemical reaction Methods 0.000 description 9
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 9
- RAXXELZNTBOGNW-UHFFFAOYSA-N imidazole Natural products C1=CNC=N1 RAXXELZNTBOGNW-UHFFFAOYSA-N 0.000 description 9
- 102000054765 polymorphisms of proteins Human genes 0.000 description 9
- 239000000243 solution Substances 0.000 description 9
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 8
- 206010021929 Infertility male Diseases 0.000 description 8
- 208000007466 Male Infertility Diseases 0.000 description 8
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 8
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 8
- 230000000694 effects Effects 0.000 description 8
- 150000007523 nucleic acids Chemical class 0.000 description 8
- 239000000758 substrate Substances 0.000 description 8
- 102000004190 Enzymes Human genes 0.000 description 7
- 108090000790 Enzymes Proteins 0.000 description 7
- 210000004899 c-terminal region Anatomy 0.000 description 7
- 229940088598 enzyme Drugs 0.000 description 7
- 230000002438 mitochondrial effect Effects 0.000 description 7
- 238000002360 preparation method Methods 0.000 description 7
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 6
- HEDRZPFGACZZDS-UHFFFAOYSA-N Chloroform Chemical compound ClC(Cl)Cl HEDRZPFGACZZDS-UHFFFAOYSA-N 0.000 description 6
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 6
- 239000004471 Glycine Substances 0.000 description 6
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 6
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 6
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 6
- ISWSIDIOOBJBQZ-UHFFFAOYSA-N Phenol Chemical compound OC1=CC=CC=C1 ISWSIDIOOBJBQZ-UHFFFAOYSA-N 0.000 description 6
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 6
- 210000000805 cytoplasm Anatomy 0.000 description 6
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 6
- 229960000310 isoleucine Drugs 0.000 description 6
- 235000014705 isoleucine Nutrition 0.000 description 6
- 210000003470 mitochondria Anatomy 0.000 description 6
- 108020004707 nucleic acids Proteins 0.000 description 6
- 102000039446 nucleic acids Human genes 0.000 description 6
- 239000002773 nucleotide Substances 0.000 description 6
- 125000003729 nucleotide group Chemical group 0.000 description 6
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 6
- 239000000047 product Substances 0.000 description 6
- 238000011144 upstream manufacturing Methods 0.000 description 6
- 238000012795 verification Methods 0.000 description 6
- 101000966742 Homo sapiens Leucine-rich PPR motif-containing protein, mitochondrial Proteins 0.000 description 5
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 5
- 102100040589 Leucine-rich PPR motif-containing protein, mitochondrial Human genes 0.000 description 5
- 108091034117 Oligonucleotide Proteins 0.000 description 5
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 5
- 239000000872 buffer Substances 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 230000014509 gene expression Effects 0.000 description 5
- 230000002068 genetic effect Effects 0.000 description 5
- 229930182817 methionine Natural products 0.000 description 5
- 238000012360 testing method Methods 0.000 description 5
- 101100464802 Arabidopsis thaliana CRR21 gene Proteins 0.000 description 4
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 4
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 4
- 208000006136 Leigh Disease Diseases 0.000 description 4
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 4
- 108700020471 RNA-Binding Proteins Proteins 0.000 description 4
- 235000005733 Raphanus sativus var niger Nutrition 0.000 description 4
- 240000001970 Raphanus sativus var. sativus Species 0.000 description 4
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 4
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 4
- 239000007983 Tris buffer Substances 0.000 description 4
- 238000009395 breeding Methods 0.000 description 4
- 229940104302 cytosine Drugs 0.000 description 4
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 4
- 238000000338 in vitro Methods 0.000 description 4
- 208000000509 infertility Diseases 0.000 description 4
- 230000036512 infertility Effects 0.000 description 4
- 208000021267 infertility disease Diseases 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000035772 mutation Effects 0.000 description 4
- 210000003463 organelle Anatomy 0.000 description 4
- 239000000126 substance Substances 0.000 description 4
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 4
- 229940035893 uracil Drugs 0.000 description 4
- 108700040094 Arabidopsis pentatricopeptide repeat Proteins 0.000 description 3
- 101100030365 Arabidopsis thaliana CRR4 gene Proteins 0.000 description 3
- 108020005133 Chloroplast RNA Proteins 0.000 description 3
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 3
- 239000004472 Lysine Substances 0.000 description 3
- 108020002230 Pancreatic Ribonuclease Proteins 0.000 description 3
- 102000005891 Pancreatic ribonuclease Human genes 0.000 description 3
- 241000195888 Physcomitrella Species 0.000 description 3
- 108700005079 Recessive Genes Proteins 0.000 description 3
- 102000052708 Recessive Genes Human genes 0.000 description 3
- 102000006382 Ribonucleases Human genes 0.000 description 3
- 108010083644 Ribonucleases Proteins 0.000 description 3
- 238000012300 Sequence Analysis Methods 0.000 description 3
- 230000005856 abnormality Effects 0.000 description 3
- 238000003776 cleavage reaction Methods 0.000 description 3
- 230000002860 competitive effect Effects 0.000 description 3
- 239000010432 diamond Substances 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 239000012634 fragment Substances 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 3
- 238000011084 recovery Methods 0.000 description 3
- 230000007017 scission Effects 0.000 description 3
- JLIDBLDQVAYHNE-YKALOCIXSA-N (+)-Abscisic acid Chemical compound OC(=O)/C=C(/C)\C=C\[C@@]1(O)C(C)=CC(=O)CC1(C)C JLIDBLDQVAYHNE-YKALOCIXSA-N 0.000 description 2
- 229930024421 Adenine Natural products 0.000 description 2
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 2
- 241000219195 Arabidopsis thaliana Species 0.000 description 2
- 108700003861 Dominant Genes Proteins 0.000 description 2
- 241000588724 Escherichia coli Species 0.000 description 2
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 2
- 229930194542 Keto Natural products 0.000 description 2
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 2
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 2
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 2
- 208000017507 Leigh syndrome Diseases 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 2
- 108020005196 Mitochondrial DNA Proteins 0.000 description 2
- 206010058799 Mitochondrial encephalomyopathy Diseases 0.000 description 2
- 101100247628 Mus musculus Rcl1 gene Proteins 0.000 description 2
- 101150093297 NAD4 gene Proteins 0.000 description 2
- PXHVJJICTQNCMI-UHFFFAOYSA-N Nickel Chemical compound [Ni] PXHVJJICTQNCMI-UHFFFAOYSA-N 0.000 description 2
- 101000708283 Oryza sativa subsp. indica Protein Rf1, mitochondrial Proteins 0.000 description 2
- 101000611441 Solanum lycopersicum Pathogenesis-related leaf protein 6 Proteins 0.000 description 2
- 108010073062 Transcription Activator-Like Effectors Proteins 0.000 description 2
- 229920004890 Triton X-100 Polymers 0.000 description 2
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 description 2
- 101710185494 Zinc finger protein Proteins 0.000 description 2
- 102100023597 Zinc finger protein 816 Human genes 0.000 description 2
- 239000012190 activator Substances 0.000 description 2
- 229960000643 adenine Drugs 0.000 description 2
- 230000001580 bacterial effect Effects 0.000 description 2
- 230000003197 catalytic effect Effects 0.000 description 2
- 238000005119 centrifugation Methods 0.000 description 2
- 238000000546 chi-square test Methods 0.000 description 2
- 238000010367 cloning Methods 0.000 description 2
- 239000000287 crude extract Substances 0.000 description 2
- 238000005520 cutting process Methods 0.000 description 2
- 230000006378 damage Effects 0.000 description 2
- 229910003460 diamond Inorganic materials 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 229940079593 drug Drugs 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 238000012869 ethanol precipitation Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 235000013922 glutamic acid Nutrition 0.000 description 2
- 239000004220 glutamic acid Substances 0.000 description 2
- 238000009396 hybridization Methods 0.000 description 2
- 238000001727 in vivo Methods 0.000 description 2
- 230000002401 inhibitory effect Effects 0.000 description 2
- 125000000468 ketone group Chemical group 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 238000013518 transcription Methods 0.000 description 2
- 230000035897 transcription Effects 0.000 description 2
- 230000014616 translation Effects 0.000 description 2
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 2
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 1
- GOJUJUVQIVIZAV-UHFFFAOYSA-N 2-amino-4,6-dichloropyrimidine-5-carbaldehyde Chemical group NC1=NC(Cl)=C(C=O)C(Cl)=N1 GOJUJUVQIVIZAV-UHFFFAOYSA-N 0.000 description 1
- 108700004057 Arabidopsis CRR4 Proteins 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 240000002791 Brassica napus Species 0.000 description 1
- 235000004977 Brassica sinapistrum Nutrition 0.000 description 1
- 108091026890 Coding region Proteins 0.000 description 1
- 108020004705 Codon Proteins 0.000 description 1
- 239000003155 DNA primer Substances 0.000 description 1
- 101000580317 Homo sapiens RNA 3'-terminal phosphate cyclase-like protein Proteins 0.000 description 1
- 102100034343 Integrase Human genes 0.000 description 1
- 101710203526 Integrase Proteins 0.000 description 1
- SRBFZHDQGSBBOR-HWQSCIPKSA-N L-arabinopyranose Chemical compound O[C@H]1COC(O)[C@H](O)[C@H]1O SRBFZHDQGSBBOR-HWQSCIPKSA-N 0.000 description 1
- 102000016943 Muramidase Human genes 0.000 description 1
- 108010014251 Muramidase Proteins 0.000 description 1
- 108010062010 N-Acetylmuramoyl-L-alanine Amidase Proteins 0.000 description 1
- 101710163270 Nuclease Proteins 0.000 description 1
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 241000219000 Populus Species 0.000 description 1
- 102000017742 Pumilio homology domains Human genes 0.000 description 1
- 108050005947 Pumilio homology domains Proteins 0.000 description 1
- 102100027566 RNA 3'-terminal phosphate cyclase-like protein Human genes 0.000 description 1
- 238000000505 RNA structure prediction Methods 0.000 description 1
- 108091028664 Ribonucleotide Proteins 0.000 description 1
- 241000195974 Selaginella Species 0.000 description 1
- VMHLLURERBWHNL-UHFFFAOYSA-M Sodium acetate Chemical compound [Na+].CC([O-])=O VMHLLURERBWHNL-UHFFFAOYSA-M 0.000 description 1
- 108091081024 Start codon Proteins 0.000 description 1
- 229930006000 Sucrose Natural products 0.000 description 1
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 1
- 101710137500 T7 RNA polymerase Proteins 0.000 description 1
- 102000004357 Transferases Human genes 0.000 description 1
- 108090000992 Transferases Proteins 0.000 description 1
- 239000013504 Triton X-100 Substances 0.000 description 1
- 235000010724 Wisteria floribunda Nutrition 0.000 description 1
- 108010017070 Zinc Finger Nucleases Proteins 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 238000002835 absorbance Methods 0.000 description 1
- 230000002378 acidificating effect Effects 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 239000013543 active substance Substances 0.000 description 1
- 239000011543 agarose gel Substances 0.000 description 1
- 125000000539 amino acid group Chemical group 0.000 description 1
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 1
- 229960000723 ampicillin Drugs 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 description 1
- 230000008436 biogenesis Effects 0.000 description 1
- 230000008827 biological function Effects 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- KGBXLFKZBHKPEV-UHFFFAOYSA-N boric acid Chemical compound OB(O)O KGBXLFKZBHKPEV-UHFFFAOYSA-N 0.000 description 1
- 239000004327 boric acid Substances 0.000 description 1
- 230000001488 breeding effect Effects 0.000 description 1
- 239000004202 carbamide Substances 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000036978 cell physiology Effects 0.000 description 1
- 230000030570 cellular localization Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000004440 column chromatography Methods 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 108091036078 conserved sequence Proteins 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- FCRACOPGPMPSHN-UHFFFAOYSA-N desoxyabscisic acid Natural products OC(=O)C=C(C)C=CC1C(C)=CC(=O)CC1(C)C FCRACOPGPMPSHN-UHFFFAOYSA-N 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 238000010494 dissociation reaction Methods 0.000 description 1
- 230000005593 dissociations Effects 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000009088 enzymatic function Effects 0.000 description 1
- 108020001507 fusion proteins Proteins 0.000 description 1
- 102000037865 fusion proteins Human genes 0.000 description 1
- 238000012239 gene modification Methods 0.000 description 1
- 238000010362 genome editing Methods 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 230000002209 hydrophobic effect Effects 0.000 description 1
- 230000002779 inactivation Effects 0.000 description 1
- 239000000411 inducer Substances 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 239000004325 lysozyme Substances 0.000 description 1
- 229960000274 lysozyme Drugs 0.000 description 1
- 235000010335 lysozyme Nutrition 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000013011 mating Effects 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 239000002207 metabolite Substances 0.000 description 1
- 108091064355 mitochondrial RNA Proteins 0.000 description 1
- 230000031574 mitochondrial mRNA modification Effects 0.000 description 1
- 230000009456 molecular mechanism Effects 0.000 description 1
- 239000000178 monomer Substances 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 229910052759 nickel Inorganic materials 0.000 description 1
- 230000036963 noncompetitive effect Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 102000044158 nucleic acid binding protein Human genes 0.000 description 1
- 108700020942 nucleic acid binding protein Proteins 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 230000029553 photosynthesis Effects 0.000 description 1
- 238000010672 photosynthesis Methods 0.000 description 1
- 239000013612 plasmid Substances 0.000 description 1
- 229920002401 polyacrylamide Polymers 0.000 description 1
- 238000002264 polyacrylamide gel electrophoresis Methods 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 108020001580 protein domains Proteins 0.000 description 1
- 239000011541 reaction mixture Substances 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 239000011347 resin Substances 0.000 description 1
- 229920005989 resin Polymers 0.000 description 1
- 230000029058 respiratory gaseous exchange Effects 0.000 description 1
- 238000010839 reverse transcription Methods 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 239000001632 sodium acetate Substances 0.000 description 1
- 235000017281 sodium acetate Nutrition 0.000 description 1
- 230000009870 specific binding Effects 0.000 description 1
- 239000005720 sucrose Substances 0.000 description 1
- 239000006228 supernatant Substances 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- -1 that is Proteins 0.000 description 1
- 238000010257 thawing Methods 0.000 description 1
- 210000001519 tissue Anatomy 0.000 description 1
- 230000009752 translational inhibition Effects 0.000 description 1
- 229910021642 ultra pure water Inorganic materials 0.000 description 1
- 239000012498 ultrapure water Substances 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B15/00—ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/415—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8216—Methods for controlling, regulating or enhancing expression of transgenes in plant cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8241—Phenotypically and genetically modified plants via recombinant DNA technology
- C12N15/8261—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
- C12N15/8287—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for fertility modification, e.g. apomixis
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8241—Phenotypically and genetically modified plants via recombinant DNA technology
- C12N15/8261—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
- C12N15/8287—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for fertility modification, e.g. apomixis
- C12N15/8289—Male sterility
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/53—Immunoassay; Biospecific binding assay; Materials therefor
- G01N33/5308—Immunoassay; Biospecific binding assay; Materials therefor for analytes not provided for elsewhere, e.g. nucleic acids, uric acid, worms, mites
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/30—Detection of binding sites or motifs
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/50—Mutagenesis
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
- G16B30/10—Sequence alignment; Homology search
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B35/00—ICT specially adapted for in silico combinatorial libraries of nucleic acids, proteins or peptides
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/60—In silico combinatorial chemistry
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/85—Fusion polypeptide containing an RNA binding domain
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2522/00—Reaction characterised by the use of non-enzymatic proteins
- C12Q2522/10—Nucleic acid binding proteins
- C12Q2522/101—Single or double stranded nucleic acid binding proteins
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Genetics & Genomics (AREA)
- Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Organic Chemistry (AREA)
- Theoretical Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Biomedical Technology (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- General Engineering & Computer Science (AREA)
- Biochemistry (AREA)
- Medical Informatics (AREA)
- Evolutionary Biology (AREA)
- Analytical Chemistry (AREA)
- Microbiology (AREA)
- Cell Biology (AREA)
- Plant Pathology (AREA)
- Medicinal Chemistry (AREA)
- Immunology (AREA)
- Crystallography & Structural Chemistry (AREA)
- Hematology (AREA)
- Urology & Nephrology (AREA)
- Gastroenterology & Hepatology (AREA)
- Botany (AREA)
- Computing Systems (AREA)
- Library & Information Science (AREA)
- Pathology (AREA)
- General Physics & Mathematics (AREA)
- Tropical Medicine & Parasitology (AREA)
- Food Science & Technology (AREA)
Abstract
【課題】RNA塩基選択的に、又はRNA塩基配列特異的に結合可能な蛋白質を含む組成物を提供する。【解決手段】本発明の蛋白質は、下記(式1)で表される30~38アミノ酸長のポリペプチドからなるPPRモチーフを1個以上(好ましくは2~14個)含む、蛋白質である。式中、Helix Aは、12アミノ酸長の、αヘリックス構造を形成可能な部分であり、Xは、存在しないか又は1~9アミノ酸長からなる部分であり、Helix Bは、11~13アミノ酸長からなる、αヘリックス構造を形成可能な部分であり、Lは、2~7アミノ酸長からなる部分である。JPEG2024010112000010.jpg12170【選択図】なし
Description
本発明は、意図したRNA塩基又はRNA配列に選択的又は特異的に結合可能な蛋白質に関する。本発明では、pentatricopeptide repeat(PPR)モチーフを利用する。本発明は、RNA結合性蛋白質の同定、設計、PPR蛋白質の標的RNAの同定、RNAの機能制御のために用いることができる。本発明は、医療分野、農学分野等で有用である。
近年、様々な解析より明らかになった核酸結合性の蛋白質因子を用いて、意図する配列に結合する技術が確立、利用されている。この配列特異的な結合を利用することで、標的とする核酸(DNA又はRNA)の細胞内局在の解析、標的とするDNA配列の除去、又はその下流に存在する蛋白質コード遺伝子の発現の制御(活性化、又は不活化)が可能になりつつある。
DNAに作用する蛋白質性因子として、ジンクフィンガー蛋白質(非特許文献1)やTAL effector(非特許文献2、特許文献1)を蛋白質工学的材料とした研究及び開発が行われているが、RNAに特異的に作用する蛋白質性因子の開発はいまだ非常に限定されている。これは、一般的に蛋白質を構成するアミノ酸配列が有するRNAとの親和性及び結合RNA配列との法則性がほとんど明らかになっていない、もしくは法則性が見いだせないためである。例外的に、38アミノ酸から成るpufモチーフの複数個の繰り返しで構成されるpumilio蛋白質に関して、pufモチーフ1個がRNA 1塩基に結合することが示されており(非特許文献3)、pumilio蛋白質を用いた新規RNA結合特性をもつ蛋白質、及びRNA結合特性の改変技術が試みられている(非特許文献4)。しかし、pufモチーフは高度に保存されており、かつ存在数が少ない。そのため、限られたRNA配列に作用する蛋白質因子の創成にしか用いられていない。
他方、ゲノム配列情報から、植物のみで500個もの大きなファミリーを形成する蛋白質、PPR蛋白質(pentatricopeptide repeat(PPR)モチーフを有するタンパク質)が同定された(非特許文献5)。PPR蛋白質は核コードであるが、専らオルガネラ(葉緑体とミトコンドリア)のRNAレベルでの制御、切断、翻訳、スプライシング、RNA編集、RNA安定性に遺伝子特異的に作用する。PPR蛋白質は、典型的には、保存性の低い35アミノ酸のモチーフ、すなわちPPRモチーフが約10個連続した構造を有しており、PPRモチーフの組み合わせが、RNAとの配列選択的な結合を担っていると考えられている。ほとんどのPPR蛋白質はPPRモチーフ約10個の繰り返しのみで構成されており、多くの場合、触媒作用を発揮するために必要なドメインが見いだせない。そのため、このPPR蛋白質の実体はRNAアダプターだと考えられている(非特許文献6)。
本発明者らは、このPPRモチーフを利用した、RNA結合性蛋白質の改変方法について、提案してきた(特許文献2)。
Maeder, M.L., Thibodeau-Beganny, S., Osiak, A., Wright, D.A., Anthony, R.M., Eichtinger, M., Jiang, T., Foley, J.E., Winfrey, R.J., Townsend, J.A., et al. (2008). Rapid "open-source" engineering of customized zinc-fingernucleases for highly efficient gene modification. Mol. Cell 31, 294-301.
Miller, J.C., Tan, S., Qiao, G., Barlow, K.A., Wang, J., Xia, D.F., Meng, X., Paschon, D.E., Leung, E., Hinkley, S.J., et al. (2011). A TALE nuclease architecture for efficient genome editing. Nature biotech. 29, 143-148.
Wang, X., McLachlan, J., Zamore, P.D., and Hall, T.M. (2002). Modular recognition of RNA by a human pumilio-homology domain. Cell 110, 501-512.
Cheong, C.G., and Hall, T.M. (2006). Engineering RNA sequence specificity of Pumilio repeats. Proc. Natl. Acad. Sci. USA 103, 13635-13639.
Small, I.D., and Peeters, N. (2000). The PPR motif - a TPR-related motif prevalent in plant organellar proteins. Trends Biochem. Sci. 25, 46-47.
Woodson, J.D., and Chory, J. (2008). Coordination of gene expression between organellar and nuclear genomes. Nature Rev. Genet. 9, 383-395.
PPR蛋白質のRNAアダプターとしての性質は、PPR蛋白質を構成するそれぞれのPPRモチーフの性質、及び複数個のPPRモチーフの組み合わせで決定されると予想される。しかしながら、そのアミノ酸構成と機能の相関関係はほとんど明らかでない。PPRモチーフがRNA結合特性を発揮する際に機能するアミノ酸を同定し、またPPRモチーフの構造と標的塩基との関係が明らかになれば、PPRモチーフの構造や複数のモチーフの組み合わせを人為的に操作することで、任意の配列、長さを有するRNAに結合可能な蛋白質を構築できる可能性がある。
本発明者らは、上記課題を解決するために、遺伝学的に解析されたPPR蛋白質、特にRNA編集(RNAレベルでの遺伝情報の改変、特にシトシン(以下C)からウラシル(以下U)への変換)に関わるPPR蛋白質とその標的RNA配列について検討してきた。そして、計算科学的手法を用いることで、PPRモチーフ中の、3つのアミノ酸(1番、4番、“ii”(-2)番のアミノ酸)に、特定のRNA塩基との結合を司る情報が含まれていることを明らかにした。より詳細には、本発明者らは、PPRモチーフの結合RNA塩基の選択性(特異性ということもある。)は、モチーフを構成する2つのαヘリックス構造のうち、最初のヘリックスに含まれる1番目及び4番目のアミノ酸、及び2つ目のヘリックスの後の、ループ構造を形成しうる部分において、後ろ(C末端側)から2番目のアミノ酸(“ii”;-2番)、の3箇所のアミノ酸で決定されることを見出し、本発明を完成した。
本発明は、以下を提供する:
[1]RNA塩基選択的に、又はRNA塩基配列特異的に結合可能な蛋白質を設計する方法であって;
蛋白質が、式1で表される30~38アミノ酸長のポリペプチドからなるPPRモチーフを1個以上(好ましくは2~14個)含む、蛋白質であり
[1]RNA塩基選択的に、又はRNA塩基配列特異的に結合可能な蛋白質を設計する方法であって;
蛋白質が、式1で表される30~38アミノ酸長のポリペプチドからなるPPRモチーフを1個以上(好ましくは2~14個)含む、蛋白質であり
Helix Aは、12アミノ酸長の、αヘリックス構造を形成可能な部分であって、式2で表され、
Xは、存在しないか又は1~9アミノ酸長からなる部分であり;
Helix Bは、11~13アミノ酸長からなる、αヘリックス構造を形成可能な部分であり;
Lは、2~7アミノ酸長の、式3で表される部分であり;
ただし、Liii~Lviiは存在しない場合がある。)
A1、A4、及びLiiの3つのアミノ酸の組み合わせ、又はA4、Liiの2つのアミノ酸の組み合わせを、対象RNA塩基又は塩基配列に応じたものとする、方法。
[2]A1、A4、及びLiiの3つのアミノ酸の組み合わせを、RNA塩基又は対象塩基配列に応じたものとする、[1]に記載の方法であって、アミノ酸の組み合わせが、下記のいずれかに基づいて決定される、方法:
(3-1) A1、A4、及びLiiの3つのアミノ酸が、順に、バリン、アスパラギン、アスパラギン酸であるとき、そのPPRモチーフは、U(ウラシル)に選択的に結合でき;
(3-2) A1、A4、及びLiiの3つのアミノ酸が、順に、バリン、トレオニン、アスパラギンであるとき、そのPPRモチーフは、A(アデニン)に選択的に結合でき;
(3-3) A1、A4、及びLiiの3つのアミノ酸が、順に、バリン、アスパラギン、アスパラギンであるとき、そのPPRモチーフは、C(シトシン)に選択的に結合でき;
(3-4) A1、A4、及びLiiの3つのアミノ酸が、順に、グルタミン酸、グリシン、アスパラギン酸であるとき、そのPPRモチーフは、G(グアニン)に選択的に結合でき;
(3-5) A1、A4、及びLiiの3つのアミノ酸が、順に、イソロイシン、アスパラギン、アスパラギンであるとき、そのPPRモチーフは、C又はUに選択的に結合でき;
(3-6) A1、A4、及びLiiの3つのアミノ酸が、順に、バリン、トレオニン、アスパラギン酸であるとき、そのPPRモチーフは、Gに選択的に結合でき;
(3-7) A1、A4、及びLiiの3つのアミノ酸が、順に、リジン、トレオニン、アスパラギン酸であるとき、そのPPRモチーフは、Gに選択的に結合でき;
(3-8) A1、A4、及びLiiの3つのアミノ酸が、順に、フェニルアラニン、セリン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合でき;
(3-9) A1、A4、及びLiiの3つのアミノ酸が、順に、バリン、アスパラギン、セリン、の場合であるとき、そのPPRモチーフは、Cに選択的に結合でき;
(3-10) A1、A4、及びLiiの3つのアミノ酸が、順に、フェニルアラニン、トレオニン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合でき;
(3-11) A1、A4、及びLiiの3つのアミノ酸が、順に、イソロイシン、アスパラギン、アスパラギン酸であるとき、そのPPRモチーフは、UまたはAに選択的に結合でき;
(3-12) A1、A4、及びLiiの3つのアミノ酸が、順に、トレオニン、トレオニン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合でき;
(3-13) A1、A4、及びLiiの3つのアミノ酸が、順に、イソロイシン、メチオニン、アスパラギン酸であるとき、そのPPRモチーフは、UまたはCに選択的に結合でき;
(3-14) A1、A4、及びLiiの3つのアミノ酸が、順に、フェニルアラニン、プロリン、アスパラギン酸であるとき、そのPPRモチーフは、Uに選択的に結合でき;
(3-15) A1、A4、及びLiiの3つのアミノ酸が、順に、チロシン、プロリン、アスパラギン酸であるとき、そのPPRモチーフは、Uに選択的に結合でき;
(3-16) A1、A4、及びLiiの3つのアミノ酸が、順に、ロイシン、トレオニン、アスパラギン酸であるとき、そのPPRモチーフは、Gに選択的に結合できる。
[3]A4、及びLiiの2つのアミノ酸の組み合わせを、RNA塩基又は対象塩基配列に応じたものとする、[1]に記載の方法であって、アミノ酸の組み合わせが、下記のいずれかに基づいて決定される、方法:
(2-1) A4、Liiが、順に、アスパラギン、アスパラギン酸であるとき、そのモチーフは、Uに選択的に結合でき;
(2-2) A4、Liiが、順に、アスパラギン、アスパラギンであるとき、そのモチーフは、Cに選択的に結合でき;
(2-3) A4、Liiが、順に、トレオニン、アスパラギンであるとき、そのモチーフは、Aに選択的に結合でき;
(2-4) A4、Liiが、順に、トレオニン、アスパラギン酸であるとき、そのモチーフは、Gに選択的に結合でき;
(2-5) A4、Liiが、順に、セリン、アスパラギンであるとき、そのモチーフは、Aに選択的に結合でき;
(2-6) A4、Liiが、順に、グリシン、アスパラギン酸であるとき、そのモチーフは、Gに選択的に結合でき;
(2-7) A4、Liiが、順に、アスパラギン、セリンであるとき、そのモチーフは、Cに選択的に結合でき;
(2-8) A4、Liiが、順に、プロリン、アスパラギン酸であるとき、そのモチーフは、Uに選択的に結合でき;
(2-9) A4、Liiが、順に、グリシン、アスパラギンであるとき、そのモチーフは、Aに選択的に結合でき;
(2-10) A4、Liiが、順に、メチオニン、アスパラギン酸であるとき、そのモチーフは、Uに選択的に結合でき;
(2-11) A4、Liiが、順に、ロイシン、アスパラギン酸であるとき、そのモチーフは、Cに選択的に結合でき;
(2-12) A4、Liiが、順に、バリン、トレオニンであるとき、そのモチーフは、Uに選択的に結合できる。
[4][1]に定義されたPPRモチーフを、1個以上(好ましくは2~14個)含む、RNA結合性蛋白質の標的となる塩基、又は塩基配列を同定する方法であって:
同定が、2に記載の(3-1)~(3-16)のいずれか、又は3に記載の(2-1)~(2-12)のいずれかに基づいて、PPRモチーフのA1、A4、及びLiiの3つのアミノ酸の組み合わせ、又はA4、Liiの2つのアミノ酸の組み合わせに応じた塩基の有無を認定することにより行われる、方法。
[5]標的RNA塩基、又は特定の塩基配列を有する標的RNAに結合可能な、[1]に定義されたPPRモチーフを1個以上(好ましくは2~14個)含む、PPR蛋白質を同定する方法であって:
同定が、2に記載の(3-1)~(3-16)のいずれか、又は3に記載の(2-1)~(2-12)のいずれかに基づいて、標的RNA塩基、又は標的RNAを構成する特定の塩基に応じた、PPRモチーフのA1、A4、及びLiiの3つのアミノ酸の組み合わせの有無を認定することにより行われる、方法。
[6][1]に記載された方法で設計された蛋白質を用いる、RNAの機能の制御方法。
[7][1]に記載された方法で設計された蛋白質からなる領域と機能性領域とが連結されてなる、複合体。
[8]以下の工程を含む、細胞の遺伝物質を改変する方法:
標的配列を有するRNAを含む細胞を準備し;そして
[7]に記載された複合体を細胞に導入することにより、複合体の蛋白質領域が標的配列を有するRNAに結合し、そのため機能性領域が、標的配列を有するRNAを改変する、方法。
[9]細胞質雄性不稔性の稔性回復因子として働くPPR蛋白質遺伝子において、様々な品種間で見られる当該遺伝子のアミノ酸多型を検出する工程;
当該遺伝子における多型と稔性との関連を特定する工程;
被検サンプルから得られたPPR蛋白質遺伝子の塩基配列を特定し、被検サンプルの稔性を決定する工程;
を含む、PPR蛋白質遺伝子の稔性を判定する方法。
[10]PPR蛋白質が、[1]において定義される式1で表される30~38アミノ酸長のポリペプチドからなるPPRモチーフを1個以上(好ましくは2~16個)含む、蛋白質である、[9]に記載の方法。
[11]アミノ多型をPPRモチーフごとの多型として特定することを特徴とする、[9]または[10]に記載の方法。
[12]PPRモチーフの多型が、式1のモチーフのA1、A4、及びLiiの3つのアミノ酸の組み合わせ、又はA4、Liiの2つのアミノ酸の組み合わせにより特定されるものである、[9]~[11]のいずれかに記載の方法。
[13]PPRモチーフの多型が、式1のモチーフの4番アミノ酸(A4)の多型により特定される、請求項12に記載の方法。
[14]PPR蛋白質遺伝子上のすべてのPPRモチーフの4番アミノ酸が、Enko Bの対応するすべてのPPRモチーフの4番アミノ酸と同一であることが、稔性であることを示す、請求項13に記載の方法。
[15]PPR蛋白質遺伝子が、orf687様遺伝子(すなわち、Enko Bをコードする「687遺伝子」と相同な遺伝子座に座乗するファミリー遺伝子、Enko Bと90%以上のアミノ酸配列同一性を有する遺伝子、Enko Bをコードする「ORF687遺伝子」90%以上の塩基配列同一性を有する遺伝子)である、請求項9~14のいずれか1項に記載の方法。
[16]様々な品種のorf687様遺伝子によりコードされる蛋白質が、配列番号:576~578、585~591のいずれかである、請求項9~15のいずれか1項に記載の方法。
本発明により、対象RNA塩基に結合可能なPPRモチーフ及びそれを含む蛋白質が提供できる。複数個のPPRモチーフを配することにより、任意の配列や長さを有する標的RNAに結合可能な蛋白質が提供できる。
本発明により、任意のPPR蛋白質の標的RNAを予測し、同定することができ、また逆に、任意のRNAに結合するPPR蛋白質を予測し、同定することができる。標的RNA配列を予測することで、その遺伝子的実体を明らかにし、また利用できる可能性が広がる。例えば、本発明においてPPR蛋白質の機能として稔性を考える場合、細胞質雄性不稔性の回復因子として働くような産業的に有用なPPR蛋白質遺伝子について、様々なアミノ酸多型を有した相同遺伝子の機能性をその標的RNA配列の相違から検定することができる。
また、本発明により提供されるPPRモチーフ又はPPR蛋白質に機能性を結合し、複合体を調製することができる。
さらに本発明により、上記の複合体を生体内にデリバリーし、機能させる方法、又は本発明により得られた蛋白質をコードする核酸配列(DNA、RNA)を用いた形質転換体の作製や、生物(細胞、組織、個体)における様々な場面での、特異的な改変、制御及び機能の付与に利用できる。
[PPR モチーフ及びPPR蛋白質]
本発明で「PPRモチーフ」というときは、特に記載した場合を除き、Web上の蛋白質ドメイン検索プログラムでアミノ酸配列を解析した際に、PfamにおいてPF01535、PrositeにおいてPS51375で得られるE値が所定値以下(望ましくはE-03)のアミノ酸配列をもつ30~38アミノ酸で構成されるポリペプチドをいう。本発明で定義するPPRモチーフを構成するアミノ酸の位置番号は、PF01535とほぼ同義である一方で、PS51375のアミノ酸の場所から2引いた数(例;本発明の1番→PS51375の3番)に相当する。ただし、“ii”(-2)番のアミノ酸というときは、PPRモチーフを構成するアミノ酸の後ろ(C末端側)から2番目のアミノ酸、又は次のPPRモチーフの1番アミノ酸に対して2コN末端側、すなわち-2番目のアミノ酸とする(図1)。次のPPRモチーフが明確に同定されない場合、次のヘリックス構造の1番目のアミノ酸に対して、2コ前のアミノ酸を“ii”とする。Pfamについてはhttp://pfam.sanger.ac.uk/、Prositeについては、http://www.expasy.org/prosite/を参照することができる。
本発明で「PPRモチーフ」というときは、特に記載した場合を除き、Web上の蛋白質ドメイン検索プログラムでアミノ酸配列を解析した際に、PfamにおいてPF01535、PrositeにおいてPS51375で得られるE値が所定値以下(望ましくはE-03)のアミノ酸配列をもつ30~38アミノ酸で構成されるポリペプチドをいう。本発明で定義するPPRモチーフを構成するアミノ酸の位置番号は、PF01535とほぼ同義である一方で、PS51375のアミノ酸の場所から2引いた数(例;本発明の1番→PS51375の3番)に相当する。ただし、“ii”(-2)番のアミノ酸というときは、PPRモチーフを構成するアミノ酸の後ろ(C末端側)から2番目のアミノ酸、又は次のPPRモチーフの1番アミノ酸に対して2コN末端側、すなわち-2番目のアミノ酸とする(図1)。次のPPRモチーフが明確に同定されない場合、次のヘリックス構造の1番目のアミノ酸に対して、2コ前のアミノ酸を“ii”とする。Pfamについてはhttp://pfam.sanger.ac.uk/、Prositeについては、http://www.expasy.org/prosite/を参照することができる。
PPRモチーフの保存アミノ酸配列は、アミノ酸レベルでの保存性は低いが、2次構造上で2つのαへリックスはよく保存されている。典型的なPPRモチーフは35アミノ酸で構成されるが、その長さは30~38アミノ酸と可変的である。
本発明でいうPPRモチーフは、より具体的には、式1で表される、30~38アミノ酸長のポリペプチドからなる。
Helix Aは、12アミノ酸長の、αヘリックス構造を形成可能な部分であって、式2で表され、
Xは、存在しないか又は1~9アミノ酸長からなる部分であり;
Helix Bは、11~13アミノ酸長からなる、αヘリックス構造を形成可能な部分であり;
Lは、2~7アミノ酸長の、式3で表される部分であり;
ただし、Liii~Lviiは存在しない場合がある。
本発明で「PPR蛋白質」というときは、特に記載した場合を除き、上述のPPRモチーフを、1個以上、好ましくは2個以上有するPPR蛋白質をいう。本明細書で「蛋白質」というときは、特に記載した場合を除き、ポリペプチド(複数のアミノ酸がペプチド結合した鎖)からなる物質全般をいい、比較的低分子のポリペプチドからなるものも含まれる。本発明で「アミノ酸」という場合、通常のアミノ酸分子を指すことがあるほか、ペプチド鎖を構成しているアミノ酸残基を指すことがある。いずれを指しているかは、文脈から、当業者には明らかである。
PPR蛋白質は植物に多く存在し、シロイヌナズナでは500蛋白質、約5000モチーフが見いだせる。イネ、ポプラ、イワヒバ等、多くの陸上植物にも多様なアミノ酸配列のPPRモチーフ及びPPR蛋白質が存在する。いくつかのPPR蛋白質は、花粉形成(雄性配偶子)の形成に働く稔性回復因子として、雑種強勢のためのF1種子取得のための重要な遺伝子であることが知られている。稔性回復と類似して、いくつかのPPR蛋白質は種分化に作用していることが明らかになっている。ほとんどのPPR蛋白質は、ミトコンドリアか葉緑体中のRNAに働くことも分かっている。
動物では、LRPPRCと同定されるPPR蛋白質の異常がLeigh syndromFrench Canadian (LSFC; リー症候群、亜急性壊死性脳脊髄症)を引き起こすことが知られている。
本発明で、PPRモチーフのRNA塩基との結合性に関し、「選択的」というときは、特に記載した場合を除き、RNA塩基のいずれか一つの塩基に対する結合活性が、他の塩基に対する結合活性より高いことをいう。この選択性は、当業者であれば実験を企画し、確認することができるほか、本明細書の実施例に開示されているように、計算により求めることもできる。
本発明でRNA塩基というときは、特に記載した場合を除き、RNAを構成するリボヌクレオチドの塩基を指し、具体的には、アデニン(A)、グアニン(G)、シトシン(C)、又はウラシル(U)のいずれかをいう。なおPPR蛋白質は、RNA中の塩基に対して選択性を有しうるが、核酸モノマーに結合するわけではない。
本発明以前には、PPRモチーフとしての保存アミノ酸の配列検索法は確立しているが、選択的なRNA塩基との結合に関する法則性は、まったく発見されていなかった。
本発明により、以下の知見が提供される。
(I) 選択的結合のために重要なアミノ酸の位置に関する情報。具体的には、PPRモチーフの、1、4、“ii”(-1)番の3つのアミノ酸の組み合わせ(A1、A4、Lii)、又は4、“ii”(-1)番の2つのアミノ酸の組み合わせ(A4、Lii)が、RNA塩基との選択的な結合のために重要であり、これらの組み合わせにより、結合するRNA塩基がいずれであるかを決定できる。
本発明は、本発明者らにより見出された、A1、A4、及びLiiの3つのアミノ酸の組み合わせ、及び/又はA4、及びLiiの2つのアミノ酸の組み合わせに関する知見に基づく。
(II) A
1
、A
4
、及びL
ii
の3つのアミノ酸の組み合わせとNA塩基との対応に関する情報。具体的には、下記のようなものである。
(3-1) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、バリン、アスパラギン及びアスパラギン酸の場合、そのPPRモチーフは、Uに強く結合し、次にCに、その次にA又はGに対して結合するという、選択的なRNA塩基結合能を有する。
(3-2) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、バリン、トレオニン、アスパラギンの場合、そのPPRモチーフは、Aに強く結合し、次にGに、その次にCに対して結合するが、Uには結合しないという、選択的なRNA塩基結合能を有する。
(3-3) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、バリン、アスパラギン、アスパラギンの場合、そのPPRモチーフは、Cに強く結合し、次にA又はUに対して結合するが、Gには結合しないという、選択的なRNA塩基結合能を有する。
(3-4) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、グルタミン酸、グリシン、アスパラギン酸の場合、そのPPRモチーフは、Gに強く結合するが、A、U及びCには結合しないという、選択的なRNA塩基結合能を有する。
(3-5) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、イソロイシン、アスパラギン、アスパラギンの場合、そのPPRモチーフは、Cに強く結合し、次にUに、その次にAに対して結合するが、Gには結合しないという、選択的なRNA塩基結合能を有する。
(3-6) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、バリン、トレオニン、アスパラギン酸の場合、そのPPRモチーフは、Gに強く結合し、次にUに対して結合するが、AとCには結合しないという、選択的なRNA塩基結合能を有する。
(3-7) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、リジン、トレオニン、アスパラギン酸、の場合、そのPPRモチーフは、Gに強く結合し、次にAに対して結合するが、U及びCには結合しないという、選択的なRNA塩基結合能を有する。
(3-8) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、フェニルアラニン、セリン、アスパラギンの場合、そのPPRモチーフは、Aに強く結合し、次にCに、その次にG及びUに対して結合するという、選択的なRNA塩基結合能を有する。
(3-9) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、バリン、アスパラギン、セリンの場合、そのPPRモチーフは、Cに強く結合し、次にUに対して結合するが、A及びGには結合しないという、選択的なRNA塩基結合能を有する。
(3-10) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、フェニルアラニン、トレオニン、アスパラギンの場合、そのPPRモチーフは、Aに強く結合するが、G、U及びCには結合しないという、選択的なRNA塩基結合能を有する。
(3-11) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、イソロイシン、アスパラギン、アスパラギン酸の場合、そのPPRモチーフは、Uに強く結合し、次にAに対して結合するが、G及びCには結合しないという、選択的なRNA塩基結合能を有する。
(3-12) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、トレオニン、トレオニン、アスパラギンの場合、そのPPRモチーフは、Aに強く結合するが、G、U及びCには結合しないという、選択的なRNA塩基結合能を有する。
(3-13) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、イソロイシン、メチオニン、アスパラギン酸の場合、そのPPRモチーフは、Uに強く結合し、次にCに対して結合するが、A及びGには結合しないという、選択的なRNA塩基結合能を有する。
(3-14) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、フェニルアラニン、プロリン、アスパラギン酸の場合PPR、そのモチーフは、Uに強く結合し、次にCに対して結合するが、A及びGには結合しないという、選択的なRNA塩基結合能を有する。
(3-15) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、チロシン、プロリン、アスパラギン酸の場合、そのPPRモチーフは、Uに強く結合するが、A、G及びCには結合しないという、選択的なRNA塩基結合能を有する。
(3-16) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、ロイシン、トレオニン、アスパラギン酸の場合、そのPPRモチーフは、Gに強く結合するが、A、U及びCには結合しないという、選択的なRNA塩基結合能を有する。
(3-1) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、バリン、アスパラギン及びアスパラギン酸の場合、そのPPRモチーフは、Uに強く結合し、次にCに、その次にA又はGに対して結合するという、選択的なRNA塩基結合能を有する。
(3-2) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、バリン、トレオニン、アスパラギンの場合、そのPPRモチーフは、Aに強く結合し、次にGに、その次にCに対して結合するが、Uには結合しないという、選択的なRNA塩基結合能を有する。
(3-3) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、バリン、アスパラギン、アスパラギンの場合、そのPPRモチーフは、Cに強く結合し、次にA又はUに対して結合するが、Gには結合しないという、選択的なRNA塩基結合能を有する。
(3-4) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、グルタミン酸、グリシン、アスパラギン酸の場合、そのPPRモチーフは、Gに強く結合するが、A、U及びCには結合しないという、選択的なRNA塩基結合能を有する。
(3-5) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、イソロイシン、アスパラギン、アスパラギンの場合、そのPPRモチーフは、Cに強く結合し、次にUに、その次にAに対して結合するが、Gには結合しないという、選択的なRNA塩基結合能を有する。
(3-6) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、バリン、トレオニン、アスパラギン酸の場合、そのPPRモチーフは、Gに強く結合し、次にUに対して結合するが、AとCには結合しないという、選択的なRNA塩基結合能を有する。
(3-7) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、リジン、トレオニン、アスパラギン酸、の場合、そのPPRモチーフは、Gに強く結合し、次にAに対して結合するが、U及びCには結合しないという、選択的なRNA塩基結合能を有する。
(3-8) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、フェニルアラニン、セリン、アスパラギンの場合、そのPPRモチーフは、Aに強く結合し、次にCに、その次にG及びUに対して結合するという、選択的なRNA塩基結合能を有する。
(3-9) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、バリン、アスパラギン、セリンの場合、そのPPRモチーフは、Cに強く結合し、次にUに対して結合するが、A及びGには結合しないという、選択的なRNA塩基結合能を有する。
(3-10) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、フェニルアラニン、トレオニン、アスパラギンの場合、そのPPRモチーフは、Aに強く結合するが、G、U及びCには結合しないという、選択的なRNA塩基結合能を有する。
(3-11) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、イソロイシン、アスパラギン、アスパラギン酸の場合、そのPPRモチーフは、Uに強く結合し、次にAに対して結合するが、G及びCには結合しないという、選択的なRNA塩基結合能を有する。
(3-12) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、トレオニン、トレオニン、アスパラギンの場合、そのPPRモチーフは、Aに強く結合するが、G、U及びCには結合しないという、選択的なRNA塩基結合能を有する。
(3-13) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、イソロイシン、メチオニン、アスパラギン酸の場合、そのPPRモチーフは、Uに強く結合し、次にCに対して結合するが、A及びGには結合しないという、選択的なRNA塩基結合能を有する。
(3-14) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、フェニルアラニン、プロリン、アスパラギン酸の場合PPR、そのモチーフは、Uに強く結合し、次にCに対して結合するが、A及びGには結合しないという、選択的なRNA塩基結合能を有する。
(3-15) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、チロシン、プロリン、アスパラギン酸の場合、そのPPRモチーフは、Uに強く結合するが、A、G及びCには結合しないという、選択的なRNA塩基結合能を有する。
(3-16) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、ロイシン、トレオニン、アスパラギン酸の場合、そのPPRモチーフは、Gに強く結合するが、A、U及びCには結合しないという、選択的なRNA塩基結合能を有する。
(II) A
4
、及びL
ii
の2つのアミノ酸の組み合わせとNA塩基との対応に関する情報。具体的には、下記のようなものである。
(2-1) A4、Liiが、順に、アスパラギン、アスパラギン酸の場合、そのPPRモチーフは、Uに強く結合し、次にC、その次にA及びGに対して結合するという、選択的なRNA塩基結合能を有する。
(2-2) A4、Liiが、順に、アスパラギン、アスパラギンの場合、そのPPRモチーフは、Cに強く結合し、次にU、その次にA及びGに対して結合するという、選択的なRNA塩基結合能を有する。
(2-3) A4、Liiが、順に、トレオニン、アスパラギンの場合、そのPPRモチーフは、Aに強く結合し、次にG、U及びCに対して弱く結合するという、選択的なRNA塩基結合能を有する。
(2-4) A4、Liiが、順に、トレオニン、アスパラギン酸の場合、そのPPRモチーフは、Gに強く結合し、次にA、U及びCに対して弱く結合するという、選択的なRNA塩基結合能を有する。
(2-5) A4、Liiが、順に、セリン、アスパラギンの場合、そのPPRモチーフは、Aに強く結合し、次にG、U及びCに対して結合するという、選択的なRNA塩基結合能を有する。
(2-6) A4、Liiが、順に、グリシン、アスパラギン酸の場合、そのPPRモチーフは、Gに強く結合し、次にU、その次にAと結合するが、Cに結合しないという、選択的なRNA塩基結合能を有する。
(2-7) A4、Liiが、順に、アスパラギン、セリンの場合、そのPPRモチーフは、Cに強く結合し、次にU、その次にA及びGに対して結合するという、選択的なRNA塩基結合能を有する。
(2-8) A4、Liiが、順に、プロリン、アスパラギン酸の場合、そのPPRモチーフは、Uに強く結合し、次にG、C及びCに対して結合するが、Aに結合しないという、選択的なRNA塩基結合能を有する。
(2-9) A4、Liiが、順に、グリシン、アスパラギンの場合、そのPPRモチーフは、Aに強く結合し、次にGに対して結合するが、C及びUに結合しないという、選択的なRNA塩基結合能を有する。
(2-10) A4、Liiが、順に、メチオニン、アスパラギン酸の場合、そのPPRモチーフは、Uに強く結合し、次にA、G及びCに対して弱く結合するという、選択的なRNA塩基結合能を有する。
(2-11) A4、Liiが、順に、ロイシン、アスパラギン酸の場合、そのPPRモチーフは、Cに強く結合し、次にUに対して結合するが、A及びGに結合しないという、選択的なRNA塩基結合能を有する。
(2-12) A4、Liiが、順に、バリン、トレオニンの場合、そのPPRモチーフは、Uに強く結合し、次にAに対して結合するが、G及びCに結合しないという、選択的なRNA塩基結合能を有する。
(2-1) A4、Liiが、順に、アスパラギン、アスパラギン酸の場合、そのPPRモチーフは、Uに強く結合し、次にC、その次にA及びGに対して結合するという、選択的なRNA塩基結合能を有する。
(2-2) A4、Liiが、順に、アスパラギン、アスパラギンの場合、そのPPRモチーフは、Cに強く結合し、次にU、その次にA及びGに対して結合するという、選択的なRNA塩基結合能を有する。
(2-3) A4、Liiが、順に、トレオニン、アスパラギンの場合、そのPPRモチーフは、Aに強く結合し、次にG、U及びCに対して弱く結合するという、選択的なRNA塩基結合能を有する。
(2-4) A4、Liiが、順に、トレオニン、アスパラギン酸の場合、そのPPRモチーフは、Gに強く結合し、次にA、U及びCに対して弱く結合するという、選択的なRNA塩基結合能を有する。
(2-5) A4、Liiが、順に、セリン、アスパラギンの場合、そのPPRモチーフは、Aに強く結合し、次にG、U及びCに対して結合するという、選択的なRNA塩基結合能を有する。
(2-6) A4、Liiが、順に、グリシン、アスパラギン酸の場合、そのPPRモチーフは、Gに強く結合し、次にU、その次にAと結合するが、Cに結合しないという、選択的なRNA塩基結合能を有する。
(2-7) A4、Liiが、順に、アスパラギン、セリンの場合、そのPPRモチーフは、Cに強く結合し、次にU、その次にA及びGに対して結合するという、選択的なRNA塩基結合能を有する。
(2-8) A4、Liiが、順に、プロリン、アスパラギン酸の場合、そのPPRモチーフは、Uに強く結合し、次にG、C及びCに対して結合するが、Aに結合しないという、選択的なRNA塩基結合能を有する。
(2-9) A4、Liiが、順に、グリシン、アスパラギンの場合、そのPPRモチーフは、Aに強く結合し、次にGに対して結合するが、C及びUに結合しないという、選択的なRNA塩基結合能を有する。
(2-10) A4、Liiが、順に、メチオニン、アスパラギン酸の場合、そのPPRモチーフは、Uに強く結合し、次にA、G及びCに対して弱く結合するという、選択的なRNA塩基結合能を有する。
(2-11) A4、Liiが、順に、ロイシン、アスパラギン酸の場合、そのPPRモチーフは、Cに強く結合し、次にUに対して結合するが、A及びGに結合しないという、選択的なRNA塩基結合能を有する。
(2-12) A4、Liiが、順に、バリン、トレオニンの場合、そのPPRモチーフは、Uに強く結合し、次にAに対して結合するが、G及びCに結合しないという、選択的なRNA塩基結合能を有する。
本明細書の実施例では、遺伝学的又は分子生物学的に、部分的には解析された蛋白質とその潜在的なRNA標的配列との結合を、さらに計算科学的に解析することにより、上記の知見を得ている。より詳細には、蛋白質とRNAとの結合又はその選択的な結合を、P値(probability;確率)を指標に解析している。本発明では、一般的な有意水準であるP値が0.05以下(5%以下の偶然性)のとき、好ましくはP値が0.01以下(1%以下の偶然性)、のとき、より好ましくはそれより有意なP値が算出されたとき、その蛋白質とRNAとが結合する確率が充分に高い、と評価している。このようなP値による判断は当業者間であれば充分に理解できる。
特定の位置のアミノ酸の特定の組み合わせとRNA塩基との結合性は、実験により確認することができる。このような目的での実験は、PPRモチーフ又は複数のPPRモチーフを含む蛋白質の調製、基質RNAの調製、及び結合性試験(例えば、ゲルシフト法)を含む。各々の実験は当業者にはよく知られているし、より具体的な手順・条件としては、例えば特許文献2を参考にすることができる。
[PPRモチーフ及びPPR蛋白質の利用]
同定及び設計:
一のPPRモチーフは、RNAの特定の塩基を認識しうる。そして、本発明に基づけば、特定の位置のアミノ酸を適切にすることで、A、U、G、Cそれぞれに選択的なPPRモチーフを選択又は設計することができ、さらにはそのようなPPRモチーフの適切な連続を含む蛋白質は、対応する特異的な配列を認識しうる。そのため、本発明に基づけば、特定の塩基配列を有するRNAに選択的に結合する天然型PPR蛋白質を予測・同定することができ、また逆に、PPR蛋白質の結合の標的となるRNAを予測・同定することができる。標的の予測・同定は、遺伝子的実体を明らかにするのに役立ち、また標的の利用可能性を拡大しうる点でも有用である。
同定及び設計:
一のPPRモチーフは、RNAの特定の塩基を認識しうる。そして、本発明に基づけば、特定の位置のアミノ酸を適切にすることで、A、U、G、Cそれぞれに選択的なPPRモチーフを選択又は設計することができ、さらにはそのようなPPRモチーフの適切な連続を含む蛋白質は、対応する特異的な配列を認識しうる。そのため、本発明に基づけば、特定の塩基配列を有するRNAに選択的に結合する天然型PPR蛋白質を予測・同定することができ、また逆に、PPR蛋白質の結合の標的となるRNAを予測・同定することができる。標的の予測・同定は、遺伝子的実体を明らかにするのに役立ち、また標的の利用可能性を拡大しうる点でも有用である。
さらに本発明により、所望のRNA塩基に選択的に結合可能なPPRモチーフ、及び所望のRNAに配列特異的に結合可能な、複数個のPPRモチーフを有する蛋白質を設計することができる。設計に際し、PPRモチーフ中の重要な位置のアミノ酸以外の部分は、天然型のPPRモチーフの配列情報を参考にすることができる。また、全体として天然型を用い、該当位置のアミノ酸だけを置換することにより、設計してもよい。PPRモチーフの繰り返し数は、標的配列に応じ、適宜とすることができるが、例えば2個以上とすることができ、2~20個とすることができる。
設計に際し、1、4、“ii”番アミノ酸の組み合わせ、又は4、“ii”番アミノ酸の組み合わせ以外に配慮してもよい。例えば、前掲特許文献2に記載された8番及び12番のアミノ酸の考慮は、RNA結合活性を呈するために重要である場合がある。本発明者らの検討に拠ると、あるPPRモチーフのA8と、それと同じPPRモチーフのA12とが、RNA結合において協同している可能性がある。A8は、塩基性アミノ酸、好ましくはリジン、又は酸性アミノ酸、好ましくはアスパラギン酸とすることができ、A12は、塩基性アミノ酸又は中性アミノ酸又は疎水性アミノ酸とすることができる。
設計されたモチーフ又は蛋白質は、当業者にはよく知られた方法により調製することができる。すなわち、本発明は、1、4、“ii”番アミノ酸の組み合わせ、又は4、“ii”番アミノ酸の組み合わせに着目した特定のRNA塩基に選択的に結合するPPRモチーフ、及び特定配列を有するRNAに特異的に結合するPPR蛋白質を提供する。中でも、PPR蛋白質の機能として稔性に対する作用を考えた場合、上記3アミノ酸の組み合わせまたは2アミノ酸の組み合わせのいずれの場合であっても、4番アミノ酸(A4)および“ii”番アミノ酸が有効であることが見出された。このようなモチーフ及び蛋白質は、当業者にはよく知られた方法で、比較的大量にも調製可能であり、そのような方法は、目的のモチーフ又は蛋白質が有するアミノ酸配列から、それをコードする核酸配列が決定し、クローニングし、目的のモチーフ又は蛋白質を生産する形質転換体を作製することを含みうる。
複合体の調製及びその利用:
本発明により提供されるPPRモチーフ又はPPR蛋白質は、機能性領域を連結し、複合体とすることができる。機能性領域とは、生体内又は細胞内で特定の生物学的機能、例えば酵素機能、触媒機能、阻害機能、亢進機能などの機能を有する部分、又は標識としての機能を有する部分をいう。そのような領域は、例えば、蛋白質、ペプチド、核酸、生理活性物質、薬剤からなる。機能性領域が蛋白質である場合の例は、リボヌクレアーゼ(RNase)である。RNaseの例は、RNase A(例えば、bovine pancreatic ribonuclease A: PDB 2AAS)、RNase Hである。このような複合体は天然には存在せず、新規なものである。
本発明により提供されるPPRモチーフ又はPPR蛋白質は、機能性領域を連結し、複合体とすることができる。機能性領域とは、生体内又は細胞内で特定の生物学的機能、例えば酵素機能、触媒機能、阻害機能、亢進機能などの機能を有する部分、又は標識としての機能を有する部分をいう。そのような領域は、例えば、蛋白質、ペプチド、核酸、生理活性物質、薬剤からなる。機能性領域が蛋白質である場合の例は、リボヌクレアーゼ(RNase)である。RNaseの例は、RNase A(例えば、bovine pancreatic ribonuclease A: PDB 2AAS)、RNase Hである。このような複合体は天然には存在せず、新規なものである。
さらに本発明により得られる複合体は、生体内又は細胞内に、RNA配列特異的に機能性領域をデリバリーし、機能させることができる可能性がある。これにより、ジンクフィンガー蛋白質(前掲非特許文献1)やTAL effector(前掲非特許文献2、前掲特許文献1)と同様、生体内又は細胞内において、RNA配列特異的に改変・破壊を行うことができる可能性があり、また新たな機能を付与できる可能性がある。さらにはRNA配列特異的に薬物を送達し、することができる可能性がある。したがって、本発明は、RNA配列特異的な機能性物質の送達方法を提供するものでもある。
いくつかのPPR蛋白質は、花粉形成(雄性配偶子)の形成に働く稔性回復因子として、雑種強勢のためのF1種子取得において重要であることが知られている。本発明により、未だ同定されていない稔性回復因子を同定し、さらにその因子を高度に利用する技術の開発が期待できる。例えば、本願実施例において明らかになった事例において、細胞質雄性不稔性の稔性回復因子として働くPPR蛋白質遺伝子において、特定のPPRモチーフにおけるアミノ酸多型を検出することにより、当該遺伝子における多型と稔性との関連に基づいて、被検サンプルのPPR蛋白質遺伝子が稔性に関する遺伝型か、不稔に関連する遺伝型かを判定することができる。この場合、多型を検出する対象であるPPR蛋白質遺伝子としては、例えばダイコンの場合、園紅のORF687蛋白質(Enko Bと命名)をコードする「ORF687遺伝子」と相同な遺伝子座に座乗するファミリー遺伝子、Enko Bと90%以上のアミノ酸配列同一性を有する遺伝子、Enko Bをコードする「ORF687遺伝子」90%以上の塩基配列同一性を有する遺伝子、とが含まれる。ここで、園紅のORF687蛋白質(Enko Bと命名)をコードする「ORF687遺伝子」と相同な遺伝子座に座乗するファミリー遺伝子という場合、図21及び図22に示す遺伝子(Kosena B、Comet B、Enko A、Comet A、Icicle CA、rrORF690-1、rrORF690-2、PC PPR-A、PC PPR-BL)がすべて含まれるが、これらには限定されない。また、Enko Bと90%以上のアミノ酸配列同一性を有する遺伝子、Enko Bをコードする「ORF687遺伝子」90%以上の塩基配列同一性を有する遺伝子は、遺伝子データベースを検索することにより、取得することができ、由来の種もダイコンには限定されない。またPPRモチーフとしては、上述した式1で表される30~38アミノ酸長のポリペプチドからなるPPRモチーフであり、PPR蛋白質は、その様なPPRモチーフを1個以上(好ましくは2~16個)含むことを特徴していてもよい。このPPRモチーフにおける多型という場合、それぞれのPPRモチーフでRNAへの結合を司っていることが本発明において明らかになった、1、4、“ii”番アミノ酸の組み合わせ、又は4、“ii”番アミノ酸の組み合わせに基づく多型を利用することができる。図4Bもしくは4Dで算出したP値が示す通り、このようなPPRモチーフのRNAへの結合を司っているアミノ酸の組み合わせのうち、4番アミノ酸がもっとも重要な役割を果たしており、次いで“ii”番アミノ酸が重要な役割を果たしている。そして、Enko BのPPR蛋白質と比較して、検定対象とする遺伝子のコードする蛋白質中のすべてのPPRモチーフの4番アミノ酸がEnko Bと同一であること、または対応するすべてのPPRモチーフの“ii”番アミノ酸がEnko Bと同一であることが、稔性回復因子としての機能に重要であることを明らかにした。また、稔性回復と類似して、いくつかのPPR蛋白質が種分化に作用していることが明らかになっている。当該PPR蛋白質の標的RNAの同定・改変は、今まで不可能だった種間の交配の可能性を期待させる。さらにほとんどのPPR蛋白質は、ミトコンドリア、葉緑体中のRNAに働くことから、本発明で提供される新規PPR蛋白質は、光合成、呼吸、有用代謝物の合成に関する機能の改変・向上に資するであろう。
一方、動物では、LRPPRCと同定されるPPR蛋白質の異常がLeigh syndromFrench Canadian (LSFC; リー症候群、亜急性壊死性脳脊髄症)を引き起こすことが知られている。本発明は、LSFCの処置(予防、治療、進行の抑制)に寄与しうる。
また、PPR蛋白質は、オルガネラで見られるすべてのRNA加工のステップ、切断、RNA編集、翻訳、スプライシング、RNA安定化に関与している。本発明により、PPRモチーフの結合塩基選択性を改変することで、所望のRNAの発現を改変することが期待できる。
本発明で材料にしたPPR蛋白質は、専らRNA編集(RNA上での遺伝情報の変換;多くの場合、C→U)の編集部位の指定に働く(後掲参照文献2及び3参照)。このタイプのPPR蛋白質は、RNA変種酵素と相互作用すると示唆される付加モチーフがC末端側に存在する。このような構造を有するPPR蛋白質により、塩基多型を導入すること、又は塩基多型に起因した疾患又は状態を処置することが期待できる。
また一部のPPR蛋白質のC末端側には、RNA切断酵素が付与されているものもある。N末端側のPPRモチーフの結合RNA塩基選択性を改変することで、RNA配列特異的なRNA切断酵素を構成しうる。また、GFP等の標識部分を連結した複合体は、所望のRNAを生体内で可視化するために用いうる。
他方、既存のPPR蛋白質のなかには、DNAに作用するものがある。一つはミトコンドリア遺伝子の転写活性化因子であり、他の一つは核に局在する転写活性化因子であると報告されている。したがって、本発明で得られた知見を基に、所望のDNA配列に結合する蛋白質因子の設計も可能であろう。
実施例1:RNA編集に関わるPPR蛋白質及びその標的配列の収集
図2に示した情報を参照し、これまでに解析されたシロイヌナズナのRNA編集に関わるPPR蛋白質(配列番号2~24)をシロイヌナズナゲノム情報データベース(MATDB: http://mips.gsf.de/proj/thal/db/index.html)、標的となるRNA編集部位の周辺配列(配列番号48、50、53、55、57、59、60、61、62、63、64、65、68、69、70、71、73、74、76、78、80、122、206、228、232、252、284、316、338、339、358、430、433、455、552、563)をRNA編集データベース(http://biologia.unical.it/py script/overview.html)より収集した。RNA配列は編集されるC(シトシン)残基を含む、その上流31塩基を収集した。収集した全ての蛋白質と、それぞれの蛋白質に対応するRNA編集部位を図2に示した。
図2に示した情報を参照し、これまでに解析されたシロイヌナズナのRNA編集に関わるPPR蛋白質(配列番号2~24)をシロイヌナズナゲノム情報データベース(MATDB: http://mips.gsf.de/proj/thal/db/index.html)、標的となるRNA編集部位の周辺配列(配列番号48、50、53、55、57、59、60、61、62、63、64、65、68、69、70、71、73、74、76、78、80、122、206、228、232、252、284、316、338、339、358、430、433、455、552、563)をRNA編集データベース(http://biologia.unical.it/py script/overview.html)より収集した。RNA配列は編集されるC(シトシン)残基を含む、その上流31塩基を収集した。収集した全ての蛋白質と、それぞれの蛋白質に対応するRNA編集部位を図2に示した。
蛋白質中のPPRモチーフ構造は、Uniprot データベース(http://www.uniprot.org/)の情報と共に、本発明で定義するアミノ酸番号を付与した。実験に用いたシロイヌナズナ24コ(配列番号2~25)のPPR蛋白質に含まれるPPRモチーフとそのアミノ酸番号を、図3に記す。
実施例2:結合塩基選択性を付与するアミノ酸の同定
これまでの研究から、RNA編集に関わるPPR蛋白質はそのC末端側に特定の保存アミノ酸配列を持つモチーフ(E、E+及びDYWモチーフ、ただしDYWはしばしば存在しない)を持つことが分かっている。E+モチーフ中の十数アミノ酸は、RNAとの選択的な結合でなく、C(シトシン)からU(ウラシル)への変換に必要なことが示唆されている(参照文献3)。また、編集されるCの認識に必要な情報は、その上流20塩基及び下流5塩基に含まれていることが過去の非特許論文によって示唆されている。すなわち、PPR蛋白質中の複数個のPPRモチーフは、編集されるCの上流配列の「どこか」を認識し、E+モチーフが編集されるCの近傍に位置すると予想できる。さらに、PPRモチーフ中の特定のアミノ酸が結合する上流配列のRNA残基を認識する可能性が考えられる(図4A)。
これまでの研究から、RNA編集に関わるPPR蛋白質はそのC末端側に特定の保存アミノ酸配列を持つモチーフ(E、E+及びDYWモチーフ、ただしDYWはしばしば存在しない)を持つことが分かっている。E+モチーフ中の十数アミノ酸は、RNAとの選択的な結合でなく、C(シトシン)からU(ウラシル)への変換に必要なことが示唆されている(参照文献3)。また、編集されるCの認識に必要な情報は、その上流20塩基及び下流5塩基に含まれていることが過去の非特許論文によって示唆されている。すなわち、PPR蛋白質中の複数個のPPRモチーフは、編集されるCの上流配列の「どこか」を認識し、E+モチーフが編集されるCの近傍に位置すると予想できる。さらに、PPRモチーフ中の特定のアミノ酸が結合する上流配列のRNA残基を認識する可能性が考えられる(図4A)。
この可能性を、実施例1で記したシロイヌナズナの24コのRNA編集PPR蛋白質とその標的RNA配列を用いて検証した。そこでまず、蛋白質中の最後のPPRモチーフを、編集されるCの一つ目の塩基に配置し、全てのPPRモチーフをRNA残基と、1対1の対応関係、かつ直線的な連続性、で整列させた(図4A、整列P1)。次にRNA配列を1塩基ずつ右側にずらすことで、P2~P6の整列を得た。この整列P1~P6のデータセットにおいて、それぞれのPPRモチーフと対応するRNA残基の情報を収集した。
1箇所のRNA編集部位に働くPPR蛋白質に対しては、出現したRNA残基(A、U、G or C)に1点を付与した。2箇所、又は3箇所のRNA編集に働くPPR蛋白質に対しては、出現したRNA残基にそれぞれ0.5点、又は0.3点を付与した。次にPPRモチーフ中のアミノ酸番号ごとにアミノ酸の種類で並べ替えを行った。通常、アミノ酸の種類と出現するRNA残基の種類は無作為(high-randomness or high-entropy)であると予測できる(例、図4Aの右上図)。しかし、もし、特定の箇所のアミノ酸が結合RNA塩基選択能力を有するとすると、正しい整列(上記P1~P6)において、対応するRNA塩基が一種類もしくは限定された種類に収束すると予測される(low randomness or low entropy;例、図4Aの右下図)。
上記で作成したP1~P6の整列のデータセットを対象に、PPRモチーフの全てのアミノ酸番号において、上記のlow randomnessを算出した。Low randomnesは、理論値(全ての塩基出現頻度の平均値)に対するカイ二乗検定によって算出した(例、図5)。
その結果、P4の整列における1番、4番、及び“ii”(-2)番アミノ酸において、有意値P< 0.01(1 %以下の確率(probability))が算出された(図4B)。すなわち、RNA編集PPR蛋白質中の最後のPPRモチーフが編集されるCの4コ前の塩基に配置され、3つのアミノ酸(1番、4番、及び“ii”番)が結合RNA塩基選択を司ることを示している。また、P3及びP5の整列において、有意なP値が算出されなかったことより、両脇のPPRモチーフからの干渉がない、すなわち、一つのPPRモチーフが一つのRNA残基を認識し、モチーフ構成に依存しないことを示している。整列P4の他のアミノ酸、及び他の整列の全てのアミノ酸において、有意なP値は得られなかった(図6)。また、プリン(AとG)又はピリミジン(CとU)(RY)でRNA塩基を分類し、同様の計算を行ったところ、4番アミノ酸のみで非常に有意なP値(P<0.01)、が得られた(図4C)。これは4番アミノ酸が結合するRNA塩基のプリン/ピリミジンを主に区別していることを示している。図4Cで示したPPRモチーフ中のRNA認識アミノ酸による結合塩基指定能力についてさらに詳細に解析を行った。その結果、4番アミノ酸が結合する塩基のプリン/ピリミジン(RY)を主に区別するする以外に、“ii”(-2)番アミノ酸が塩基のアミノ型(AおよびC)ケト型(GおよびU)(MK)の区別に働くことがわかった(図4D)。
3回以上使用されている3つのアミノ酸(1番、4番、及び“ii”番)の組み合わせをPPRモチーフのRNA認識コードのうち、triPPR codeとして、それぞれのP値を算出し、その結合RNA塩基指定能力を算出した。同定したtriPPR codeの一部を図4Eに示した。
当該3箇所のアミノ酸が非常に多様であるため、2箇所のアミノ酸(1&4、1&“ii”又は4&“ii”)での結合RNA塩基指定能力を算出したところ、4& “ii”番アミノ酸の組み合わせにおいて、顕著なP値が算出された(図7)。そのため、3回以上使用されている4&“ii”番アミノ酸の組み合わせを、PPRモチーフのRNA認識コードのうち、diPPR codeとした。同定したtriPPR code、diPPR codeを図8に示した。
実施例3:同定したRNA認識コードの検証
シロイヌナズナのRNA編集PPR蛋白質を用いて同定したPPRモチーフのRNA認識コードの検証をおこなった。検証には、ヒメツリガネゴケのRNA編集PPR蛋白質を用いた。ヒメツリガネゴケ(以下、コケ)では、計13箇所(ミトコンドリア11箇所、葉緑体2箇所;配列番号32~44)のRNA編集が行われることが既に明らかになっている。さらに、6コのPPR蛋白質(PpPPR 56, 71, 77, 78, 79, and 91)が9箇所のRNA編集にそれぞれ働くことが明らかになっている。蛋白質と対応するRNA編集部位を図9に示した。
シロイヌナズナのRNA編集PPR蛋白質を用いて同定したPPRモチーフのRNA認識コードの検証をおこなった。検証には、ヒメツリガネゴケのRNA編集PPR蛋白質を用いた。ヒメツリガネゴケ(以下、コケ)では、計13箇所(ミトコンドリア11箇所、葉緑体2箇所;配列番号32~44)のRNA編集が行われることが既に明らかになっている。さらに、6コのPPR蛋白質(PpPPR 56, 71, 77, 78, 79, and 91)が9箇所のRNA編集にそれぞれ働くことが明らかになっている。蛋白質と対応するRNA編集部位を図9に示した。
検証は図10に示すとおりに行った。まず、コケPPR蛋白質のアミノ酸配列情報を非特許論文より取得し(配列番号26~31;図2及び図9)、図1に定義したPPRモチーフモデルに従って、3つのアミノ酸(1番、4番、及び“ii”番)をそれぞれのPPRモチーフから抽出した。抽出した3つのアミノ酸の組み合わせが、シロイヌナズナより同定したtriPPR codeと一致する場合、そのcodeが呈する結合塩基得点行列(socring matrix)に置換した。次に、triPPR codeで変換できなかったPPRモチーフのうち、diPPR codeと一致する場合、当該モチーフをdiPPR codeの結合塩基得点行列に置換した。平行して、RNA編集部位周辺配列を(編集されるCを3’末端とする31 merの配列)を非特許論文より取得し(配列番号32~44;図2、図9、及び図16)、図10に示すようなRNA配列の数字行列に置換した。次に、上述の整列P4(最後のPPRモチーフが編集されるCの4つ前の塩基に対応)に従うように、蛋白質の結合塩基得点行列とRNA配列の数字行列のそれぞれのマス目通しでかけ算を行い、得られた値の和を蛋白質とRNA配列の適合値(Matching score)として算出した。この計算は、triPPR code、diPPR code、それぞれのPPR結合塩基得点行列(PPR scoring matrix)
において行った。
において行った。
一つの蛋白質に対して、この計算を全てのコケのRNA編集部位(13箇所)に対して行った。また、RNA編集部位周辺配列の参照配列としてシロイヌナズナ葉緑体のRNA編集部位のRNA配列34箇所(図16、配列番号45~78)についても同様の計算を行った。
次に、それぞれのRNA配列に対する蛋白質の適合値より、正規分布曲線を描き、それぞれのRNA配列に対する適合値の暫定P値をtriPPR code、及びdiPPR codeそれぞれ算出した。
最終的なP値(蛋白質とRNA配列の適合値)は、triPPR codeとdiPPR codeの暫定P値の積として求めた。
それぞれのコケPPR蛋白質と13箇所のコケRNA編集部位との適合値を図11に示す。解析の結果、7種の蛋白質のうち、6種の蛋白質が正しいRNA編集部位に計算的に特定された。すなわち、この解析は、3つのアミノ酸(1番、4番、及び“ii”番)にPPRモチーフの結合RNA塩基指定に関する情報が全て含まれることを意味している。言い換えると、図8に示した3つ、又は2つ、の組み合わせのアミノ酸の情報(triPPR、diPPR code)を参照することで、意図するRNA配列に結合するPPR蛋白質を探索できることを示している。同時に、当該アミノ酸情報を有したPPRモチーフを用いること、又は連結することで、意図したRNA配列に結合する人工タンパク質を合成できることを示している。
実施例4:未解析RNA編集PPR蛋白質の標的分子の同定
次に、コケより多くのRNA編集部位を含むシロイヌナズナを用いた解析を行った(葉緑体ゲノム34箇所(配列番号45~78)、ミトコンドリアゲノム488箇所(配列番号79~566)、図6を参照)。予測精度を検証するために、コード抽出に用いた24種のPPR蛋白質のRNA変種部位予測を行った。その結果、葉緑体局在PPR蛋白質では、13個中10個が最低1個の正しいRNA編集部位を最も高いP値で予測した。ミトコンドリア局在PPR蛋白質では、11個中8個が正しいRNA編集部位をトップ20以内で予測した(図12)。この予測精度検証を基に、機能未知PPR蛋白質の標的RNA編集部位の予測を行った。AHG11変異体は、アブシジン酸経路に異常をきたす変異体であり、その遺伝子(ahg11、at2g44880)がコードする蛋白質は典型的なRNA編集PPR蛋白質様のモチーフ構造を有する(図13;配列番号1)。RNA編集部位を予測し、トップ20を含むミトコンドリア405箇所、葉緑体30箇所のRNA編集を実験的に検証した。その結果、7番目に高いP値で予測されたミトコンドリアnad4 376のRNA編集のみが変異体で異常をきたしていることが明らかになった(図13)。
次に、コケより多くのRNA編集部位を含むシロイヌナズナを用いた解析を行った(葉緑体ゲノム34箇所(配列番号45~78)、ミトコンドリアゲノム488箇所(配列番号79~566)、図6を参照)。予測精度を検証するために、コード抽出に用いた24種のPPR蛋白質のRNA変種部位予測を行った。その結果、葉緑体局在PPR蛋白質では、13個中10個が最低1個の正しいRNA編集部位を最も高いP値で予測した。ミトコンドリア局在PPR蛋白質では、11個中8個が正しいRNA編集部位をトップ20以内で予測した(図12)。この予測精度検証を基に、機能未知PPR蛋白質の標的RNA編集部位の予測を行った。AHG11変異体は、アブシジン酸経路に異常をきたす変異体であり、その遺伝子(ahg11、at2g44880)がコードする蛋白質は典型的なRNA編集PPR蛋白質様のモチーフ構造を有する(図13;配列番号1)。RNA編集部位を予測し、トップ20を含むミトコンドリア405箇所、葉緑体30箇所のRNA編集を実験的に検証した。その結果、7番目に高いP値で予測されたミトコンドリアnad4 376のRNA編集のみが変異体で異常をきたしていることが明らかになった(図13)。
次に、オルガネラ全ゲノム配列、すなわち約3×105のRNA配列のデータセット、からの標的RNA配列の同定を試みた。この解析には、図8に示すPPR codeの蓋然性行列(probability matrix)を用いた。また、diPPR、triPPR コードと一致しないアミノ酸の組み合わせを持つモチーフには、background frequencyを適応した。作製した蛋白質の蓋然性行列は、シロイヌナズナの葉緑体全塩基配列(AP000423)と共に、MEME suiteのFIMO解析(http://meme.nbcr.net/meme4 6 1/fimo-intro.html)に供した。
その結果、CRR4とCRR21において、その標的RNA配列を正確に予測することが出来た。また、コケPPR蛋白質からもPPRコードの抽出を行うことでコードの改良を行ったところ(図15)、いくつかの蛋白質に置いて、その予測精度が大きく向上した。
これらの結果から、同定したPPRコードを用いることで、数十万パターンのRNA配列から一カ所の正しい標的配列を同定できることを示している。逆に言えば、コードに沿ったアミノ酸を当該位置(1、4、“ii”)に持つPPRモチーフ、を探索することで、意図する有用なRNA配列に結合する蛋白質を同定できる。もしくはPPRモチーフを連結させることで、高い配列選択性を有する人工RNA結合蛋白質を創出できることを示している。変異導入により、当該位置のアミノ酸をPPRコードに準じた組み合わせにすることで、意図したRNA結合選択性を獲得させることが可能なことも当業者であれば理解できる。
図15では、triPPR code、diPPR codeそれぞれの結合RNA塩基選択能力をP値で評価した。有意なP値(P <0.05)を示したPPRcodeは、高い結合RNA塩基選択能力を有すると推認できる。
実施例5:ダイコンRfの標的RNA配列の予測
次に本発明で得られた知見を基に、細胞質雄性不稔性の稔性回復因子として働くPPR蛋白質の機能判定を行った(実施例5~9)。
次に本発明で得られた知見を基に、細胞質雄性不稔性の稔性回復因子として働くPPR蛋白質の機能判定を行った(実施例5~9)。
細胞質雄性不稔(Cytoplasmic Male Sterility;CMS)は、細胞質のゲノム、特にミトコンドリアのゲノムの変異が原因で雄性配偶子が正常に機能しなくなる形質である。この形質は、しばしば核に存在する稔性回復遺伝子(Restorer of Fertility;Rf)によって打ち消され、雄性配偶子が正常になることが知られている。一代雑種育種法に利用されており、農業上重要な形質の一つである。このCMS-Rfシステムにおいて、Rf遺伝子は多くの場合、PPR蛋白質をコードすることが知られている。
ダイコンやナタネの一代雑種育種法に用いられるオグラ型(別名、コセナ型)細胞質は、ミトコンドリアゲノムのorf125遺伝子の発現に由来し、核コードのorf687遺伝子の存在によって不稔性が解除され、可稔となる。orf687遺伝子産物はPPR蛋白質であり、orf125を含むRNAに作用することで、その発現を不活化し、結果として不稔性が解除されると考えられている。
しかし、様々なダイコン系統が有するorf687様遺伝子にはアミノ酸多型が有ること、このアミノ酸多型が稔性回復因子としての遺伝子の機能性に影響を及ぼすことがこれまでの育種学的解析から明らかになってきた。しかし、当該遺伝子のアミノ酸配列からその機能性を類推する手法は確立されていない。
そこで、まず優性Rfとして働くことが知られているダイコン品種、園紅のORF687蛋白質(Enko Bと命名)のアミノ酸から、PPRモチーフを特定し、塩基指定能力を司るアミノ酸(1、4、ii)を抽出し、PPRコードに変換後、ミトコンドリアorf125を含む転写物に対して、標的RNA配列予測を行った(図19)。
平行して、優性Rfとして働くことが知られているダイコン品種、園紅のORF687蛋白質(Enko Bと命名)、同じく園紅中に含まれ、ORF687と良く似ているが、劣性の遺伝子として働くORF687様蛋白質(enko Aと命名)、異なるダイコン品種である小瀬菜ゲノム中に存在する園紅ORF687と相同な遺伝子(kosena Bと命名;劣性の遺伝子)、の3種のORF687様蛋白質を材料にその特徴を生化学的に解析した。
(5-1)ダイコンからのゲノムDNAの調製
ダイコンをムラシゲ・スクーク培地(2%ショ糖、0.5% Gellangamを含む)で3週間培養した。培養した植物の緑葉(0.5 g)をフェノール/クロロホルム抽出した後、エタノールを加えてDNAを不溶化した。回収したDNAを100μlのTE液(10 mM トリス・塩酸(pH 8.0)、1 mM EDTA)に溶解し、10ユニットのRNase A(DNase-free、タカラバイオ社)を加えて、37℃で30分反応させた。その後、反応液を再度フェノール/クロロホルム抽出した後、エタノール沈殿によりDNAを回収した。10μgのDNAが得られた。
ダイコンをムラシゲ・スクーク培地(2%ショ糖、0.5% Gellangamを含む)で3週間培養した。培養した植物の緑葉(0.5 g)をフェノール/クロロホルム抽出した後、エタノールを加えてDNAを不溶化した。回収したDNAを100μlのTE液(10 mM トリス・塩酸(pH 8.0)、1 mM EDTA)に溶解し、10ユニットのRNase A(DNase-free、タカラバイオ社)を加えて、37℃で30分反応させた。その後、反応液を再度フェノール/クロロホルム抽出した後、エタノール沈殿によりDNAを回収した。10μgのDNAが得られた。
(5-2)ORF687様蛋白質をコードする遺伝子のクローニング
ダイコンゲノムDNAを鋳型に、Enko Bはオリゴヌクレオチドプライマー(Enko B-FプライマーとEnko B-Rプライマー;それぞれ配列番号567、568に記載)、Kosena Bはオリゴヌクレオチドプライマー(kosena B-Fプライマーとkosena B-Rプライマー;それぞれ配列番号569、570に記載)、Enko Aはオリゴヌクレオチドプライマー(Enko A-FプライマーとEnko A-Rプライマー;それぞれ配列番号571、572に記載)、を用いて、50μlの反応液を95℃ 30秒、60℃ 30秒、72℃ 30秒の25サイクルでKOD-FX(TOYOBO社)をDNA 伸長酵素として用い、PCRすることによって、それぞれ増幅した。
ダイコンゲノムDNAを鋳型に、Enko Bはオリゴヌクレオチドプライマー(Enko B-FプライマーとEnko B-Rプライマー;それぞれ配列番号567、568に記載)、Kosena Bはオリゴヌクレオチドプライマー(kosena B-Fプライマーとkosena B-Rプライマー;それぞれ配列番号569、570に記載)、Enko Aはオリゴヌクレオチドプライマー(Enko A-FプライマーとEnko A-Rプライマー;それぞれ配列番号571、572に記載)、を用いて、50μlの反応液を95℃ 30秒、60℃ 30秒、72℃ 30秒の25サイクルでKOD-FX(TOYOBO社)をDNA 伸長酵素として用い、PCRすることによって、それぞれ増幅した。
得られたDNA断片は、pBAD/Thio-TOPO ベクター(Invitrogen社)を用いて、製品に添付するプロトコールに従ってクローニングした。DNA配列を決定し、目的と相当するDNA配列と相同な配列(Enko B、配列番号:573;kosena B、配列番号:574;Enko A、配列番号:575)であることを確認した。
(5-3)組換えORF687様蛋白質の調製
上で得られたプラスミドをEscherichia coli TOP10株(Invitrogen社)に形質転換した。この大腸菌をアンピシリンが100μg/mlの濃度で存在するLB培地300 ml(300 mL培地を含む1 L三角フラスコ)中で、37℃で培養した。培養液の濁度が波長600 nmでの吸光度が0.5に達した時に、誘導物質であるL-アラビノースを最終濃度が0.2%になるように添加し、さらに4時間培養を行った。
上で得られたプラスミドをEscherichia coli TOP10株(Invitrogen社)に形質転換した。この大腸菌をアンピシリンが100μg/mlの濃度で存在するLB培地300 ml(300 mL培地を含む1 L三角フラスコ)中で、37℃で培養した。培養液の濁度が波長600 nmでの吸光度が0.5に達した時に、誘導物質であるL-アラビノースを最終濃度が0.2%になるように添加し、さらに4時間培養を行った。
遠心による集菌後、菌体を1 mg/mlのリゾチームを含む200 mlのバッファーA(50 mMトリス・塩酸 pH 8.0、500 mM KCl、2 mMイミダゾール、10 mM MgCl2、0.5%Triton X100、10%グリセロール)に懸濁し、超音波破砕と凍結溶解により菌体を破壊した。15,000×g、20分間の遠心分離後に、上清を粗抽出液として回収した。
この粗抽出液をバッファーAで平衡化したニッケルカラム樹脂(ProBond A、Invitrogen社)を充填したカラムに供した。
カラムクロマトグラフィーは、20 mMイミダゾールを含むバッファーAで十分に洗浄した後、200 mMイミダゾールを含むバッファーAで目的タンパク質を溶出する二段階濃度勾配により行った。得られたタンパク質は、配列番号(Enko B、配列番号:576;kosena B、配列番号:577;Enko A、配列番号:578)に記載のアミノ酸配列を備えるとともに、N末端側に溶解性を高めるためのチオレドキンのアミノ酸配列、C末端側にヒスチジンタグ配列を備える融合タンパク質である。精製画分100μlを500 mLのバッファー E(20 mMトリス・塩酸 pH 7.9、60 mM KCl、12.5 mM MgCl2、0.1 mM EDTA、17%グリセロール、2 mM DTT)で透析した後、精製標品とした。
(5-4)基質RNAの調製
基質RNAとして、オグラ型細胞質ダイコンのミトコンドリアDNAの配列をふくむ3種のRNA、RNAa、RNAb、およびRNAcを用いた。
基質RNAとして、オグラ型細胞質ダイコンのミトコンドリアDNAの配列をふくむ3種のRNA、RNAa、RNAb、およびRNAcを用いた。
RNAaはオリゴヌクレオチドプライマーA-FプライマーとA-Rプライマー(それぞれ、配列番号579、580)、RNAbはオリゴヌクレオチドプライマーB-FプライマーとB-Rプライマー(それぞれ、配列番号581、582)、RNACはオリゴヌクレオチドプライマーC-FプライマーとC-Rプライマー(配列番号583、584)、を用いて、上記のオグラ型細胞質ダイコンDNA 10 ngを鋳型DNAとして含む50μlの反応液を95℃30秒、60℃30秒、72℃30秒の25サイクルでKOD FX(TOYOBO社)をDNA伸長酵素として用い、PCRすることによって増幅した。それぞれのフォワードプライマー(-F)には、基質RNAを試験管内で合成するためのT7プロモータ配列を付加した。
得られたDNA断片は、アガロースゲルで展開後、ゲルから切り出すことによって精製した。精製DNA断片を鋳型にNTP mix(10 nmol GTP、CTP、ATP、0.5 nmol UTP)、4μl [32P] α-UTP(GEヘルスケア社、3000 Ci/mmol)、T7 RNA polymerase(タカラバイオ社)を含む20μlの反応液を37℃60分間反応させることで、基質RNAを合成した。
基質RNAはフェノール/クロロホルム抽出、エタノール沈殿後、全量を6 M尿素を含む変性6%ポリアクリルアミドゲル電気泳動で展開し、X線フィルムで60秒間感光させることによって、32P標識RNAを検出した。
次に、32P標識RNAをゲルから切り出し、200μlのゲル溶出液(0.3 M酢酸ナトリウム、2.5 mM EDTA、0.01%SDS)中に、4℃で12時間浸し、RNAをゲルから溶出した。RNAのうち、1μlの放射活性を測定し、合成したRNAの総量を算出した。エタノール沈殿後、2500 cpm/μl(1 fmol/μl)になるように、RNAを超純水に溶解した。この調製方法で通常、2500 cpm/μlのRNAが約100μl得られた。
(5-5)蛋白質とRNAとの結合実験
Enko B(Rf)、Kosena B(rf)、およびEnko A(rf;園紅品種に存在するORF687様蛋白質)の組換え蛋白質を作製し、そのRNA結合活性を検証した。
Enko B(Rf)、Kosena B(rf)、およびEnko A(rf;園紅品種に存在するORF687様蛋白質)の組換え蛋白質を作製し、そのRNA結合活性を検証した。
作製した組換え蛋白質(Enko B(配列番号:576)、Kosena B(配列番号:577)、Enko A(配列番号:578))のRNA結合活性は、ゲルシフト法によって解析した。反応液(10 mMトリス・塩酸 pH 7.9、30 mM KCl、6 mM MgCl2、2 mM DTT、8%グリセロール、0.0067%Triton X-100)20μl中に上記の375 pM(7.5 fmol/20μL)の基質RNA(BD120)と0~2500 nMの組換え蛋白質を混合し、25℃で15分間反応した。その後、反応液に4μLの80%グリセロール液を添加し、10μLを1×TBE(89 mM Tris-HCl、89 mM Boric acid、2 mM EDTA)を含む10%未変性ポリアクリルアミドゲルで展開し、電気泳動後にゲルを乾燥させた。
ゲル中のRNAの放射活性をバイオイメージングアナライザーBAS2000(フジフィルム社)で測定した。
実施例6:組換え蛋白質を用いたRNA結合実験
図17は、Enko B蛋白質と細胞質雄性不稔(CMS)遺伝子を含むRNAとの結合解析を示す図である。このうち、図17Aは、ミトコンドリアorf125 近傍の模式図を示し、あわせて結合実験に用いたRNA a、RNA bc、RNA b、およびRNA c の領域を模式図で示した。図17Bは、Enko B蛋白質のRNA結合について示す図である。Enko Bタンパク質(1.4 nmol)と32P標識したRNA bc(0.1 ng)と共に、未標識のRNA a、RNA bc、RNA b、RNA c(RNA bc に対して、×5、×10 w/w;競合阻害物質として使用)を20μLの反応液中で反応させ、ゲルシフト競合実験を行った。図左のComplex(▽)はタンパク質とRNAとの複合体を、Free(▼)はRNA のみを示す。
図17は、Enko B蛋白質と細胞質雄性不稔(CMS)遺伝子を含むRNAとの結合解析を示す図である。このうち、図17Aは、ミトコンドリアorf125 近傍の模式図を示し、あわせて結合実験に用いたRNA a、RNA bc、RNA b、およびRNA c の領域を模式図で示した。図17Bは、Enko B蛋白質のRNA結合について示す図である。Enko Bタンパク質(1.4 nmol)と32P標識したRNA bc(0.1 ng)と共に、未標識のRNA a、RNA bc、RNA b、RNA c(RNA bc に対して、×5、×10 w/w;競合阻害物質として使用)を20μLの反応液中で反応させ、ゲルシフト競合実験を行った。図左のComplex(▽)はタンパク質とRNAとの複合体を、Free(▼)はRNA のみを示す。
これらの図に示すように、蛋白質とRNAの結合は、32P標識RNAの移動度の違いとして現れる。32P標識RNA・蛋白質複合体の分子量が、32P標識RNA単体の分子量より大きいため、電気泳動での移動度が遅くなるためである。
この実験では、EnkoBの組換え蛋白質を調製し、orf125を含むミトコンドリアRNAとの結合を競合ゲルシフト法で検証した。RI標識したRNAbと蛋白質を混合し、次に未標識RNAを添加した。すなわち、Complexで示した位置のバンドのシグナル強度がより減少したほうがcompetitorとして加えたRNAと蛋白質が結合する、すわなち、EnkoBが高い親和性で結合するRNA領域、であることを意味する。その結果、RNAbの領域にEnkoBは強く結合することが明らかとなった。
この実験では、EnkoBの組換え蛋白質を調製し、orf125を含むミトコンドリアRNAとの結合を競合ゲルシフト法で検証した。RI標識したRNAbと蛋白質を混合し、次に未標識RNAを添加した。すなわち、Complexで示した位置のバンドのシグナル強度がより減少したほうがcompetitorとして加えたRNAと蛋白質が結合する、すわなち、EnkoBが高い親和性で結合するRNA領域、であることを意味する。その結果、RNAbの領域にEnkoBは強く結合することが明らかとなった。
No.208の候補配列は図19に示す結合配列予測で一番有意なP値を示し、tRNAメチオニンの3’末端に正確に位置する。しかし、これまでの解析で、tRNA量およびorf125を含むRNAの形状(切断の有無)が不稔および回復系統において差が無いこと、in vitroの結合実験(図17B)でNo.208を含むRNAa配列とEnko Bが結合しないことから、この領域は、オグラ型細胞質の稔性・不稔性には関係ないと判断した。
よって、RNAb中に含まれるNo.316、352、373の領域に着目して解析を進めた。RNAbは125bから成る。scanning mutationにより、20b単位まで結合領域を絞り込もうと試みたが、単一の箇所に絞り込むことができなかった(データ未公開)。そのため、Enko Bの結合箇所は、RNAb中に複数ある可能性が考えられた。
実施例7:Rf様蛋白質のRNA結合活性
図18は、ORF687様蛋白質とRNAとの結合を示す。このうち、図18Aは、ORF687様蛋白質のRNA結合特性に関して、Enko B(Rf)、Kosena B(rf)、Enko A(rf)とRNAbとの結合をゲルシフト法で解析した結果を示す。図18Bは、(A)の結果をグラフ化したものであり、このグラフより、各蛋白質のRNA結合能力を表す解離定数(KD)を算出した。図18Cは、Enko B(Rf)、Kosena B(rf)、Enko A(rf)と潜在的な結合領域との適合値を図19と同様な方法で算出した。
図18は、ORF687様蛋白質とRNAとの結合を示す。このうち、図18Aは、ORF687様蛋白質のRNA結合特性に関して、Enko B(Rf)、Kosena B(rf)、Enko A(rf)とRNAbとの結合をゲルシフト法で解析した結果を示す。図18Bは、(A)の結果をグラフ化したものであり、このグラフより、各蛋白質のRNA結合能力を表す解離定数(KD)を算出した。図18Cは、Enko B(Rf)、Kosena B(rf)、Enko A(rf)と潜在的な結合領域との適合値を図19と同様な方法で算出した。
その結果、非競合状態では、3つの蛋白質(Enko B、Kosena B、Enko A)ともに、RNAbに高い親和性でRNAと結合した。Kosena Bに関しては競合状態でのRNA結合活性を解析したが、Enko Bと明確な差は見られなかった(図18Aおよび図18B)。
Kosena BはしばしばEnko Bより若干低いRNA結合活性を示す(KDで約2倍)。しかし、一般的なRNA結合における活性の強弱は10倍以上の差で検出されることが多く、この差が有意とは見なせない。
PPRコードに基づいた予測でも該当領域に対する適合スコアは、各蛋白質間で明確な差はない(図18C)。このことから、EnkoBとkosenaBの差は、単純なRNA結合親和性の違いではなく、結合した後の作用に違いがある可能性を検討することとした。
さらに、オグラ型細胞質に働く稔性回復因子の結合配列予測を図19に示す。ここで、図19Aは、PPRコードを用いたEnko B蛋白質の結合予測を示しており、図19A下図にCMS遺伝子orf125を含むRNAの構造を示す。図19A中のRNAa~RNAcの領域は図17を参照。この図19Aでは、有意な高いP値を示した領域のうち、No.208、230、316、352、373に着目した(図19A)。
次に、図19BにORF687蛋白質配列から予測された標的RNA配列(有意なP値を示した領域(No.208、316、352、373)の配列)のロゴ表記、候補となる結合RNA配列、劣性rfを持つダイコン品種、小瀬菜のORF687様蛋白質(Kosena B)配列から予測された標的RNA配列のロゴ表記、を示した。また、劣性rfであるKosena Bの予測結合塩基も示した。
EnkoBとKosenaBは、2及び3番目のPPRモチーフ中のアミノ酸多型により、指定塩基が異なることが明らかとなった(RfはUA、rfはGC)。この違いが、Rfとrfの機能的差異に直結すると予測できた。
実施例8:RNAの構造予測と解析
コンピュータ予測およびin vitro RNA結合実験より、RfはRNAbの領域、特にNo.316、352、373、に結合する可能性が考えられた。in vitroの解析からRNAb中に複数箇所の結合個所がある可能性も考えられた。そこで、RNAb配列の2次構造予測を行い、該当領域に着目した。
コンピュータ予測およびin vitro RNA結合実験より、RfはRNAbの領域、特にNo.316、352、373、に結合する可能性が考えられた。in vitroの解析からRNAb中に複数箇所の結合個所がある可能性も考えられた。そこで、RNAb配列の2次構造予測を行い、該当領域に着目した。
結果を図20に示す。ここで、図20は、ORF687様蛋白質の候補結合RNA領域の二次構造と構造変化を示す。図20Aは、No.306を含む領域の2次構造とORF687様蛋白質の予測結合サイトを示しており、各PPRモチーフをボックスで対応する塩基と共に示した。EnkoB(Rf)とKosena B(rf)で顕著な差がある2番目、3番目のPPRモチーフを強調した。図20Bは、No. 352および373を含む領域の2次構造とORF687様蛋白質の予測結合サイトを示した。図20Cは、RNAbのEnko Bによる構造変化しており、RNAbとEnko B蛋白質を混合し、その後、2本鎖選択的なRNA分解酵素(Rnase V1)を添加した。
その結果、No. 316領域は、orf125の開始コドン直下のステムループ構造に相当することが明らかとなった(図20A)。また、Enko BとKosena Bとで多型が見られる2番および3番PPRモチーフはステムループの根元の二本鎖に位置した。特に3番PPRモチーフの対応塩基はEnko BではAで有るのに対して、Kosena Bでは、Cとなっている(図19Bを参照)。これらのことから、EnkoBが当該領域に結合し、ステムループ構造形成を促進することで、orf125の翻訳を阻害する作業仮説が考えられた。
No.352および373領域でも2本鎖構造が予測され、Rf蛋白質が両側に結合することが考えられた(図20B)。しかし、この場合、Rf結合により、構造の破壊(1本鎖形成促進)が予測される。また。Rfとrfの違いである2番および3番PPRモチーフに対応する塩基と構造の違いは考えられず、具体的な分子機構の予測は出来なかった。
そこで、内部ラベルRNAを蛋白質と混合し、そこに、RNaseV1を添加し、標識RNAを限定分解した。RNaseV1はRNAの2本鎖領域のみを選択的に切断するRNaseである。その結果、蛋白質存在下で、基質RNAが早く分解されること、すわなち、Rf(Enko B)存在下で、2本鎖RNA形成が促進することが示された(図20C)。すなわち、Rfによるorf125 mRNAの2本鎖RNA形成による翻訳阻害が、オグラ型細胞質雄性不稔性の稔性回復の主原因と考えられた。
実施例9:ORF687様遺伝子の稔性回復能についての機能判定
これまでに様々なダイコン品種よりORF687様遺伝子が単離されており、交配実験により、そのRfとしての機能性が類推されている。しかし、それぞれのアミノ酸配列は非常に似ており、全体のアミノ酸保存性からRfとしての機能性を判定することは出来ない。
これまでに様々なダイコン品種よりORF687様遺伝子が単離されており、交配実験により、そのRfとしての機能性が類推されている。しかし、それぞれのアミノ酸配列は非常に似ており、全体のアミノ酸保存性からRfとしての機能性を判定することは出来ない。
本実施例においてはまず、ORF687様蛋白質の配列解析を行った。具体的には、配列番号576~578、および585~591に示す蛋白質配列を材料にPPR蛋白質としての配列解析を行った。全ての配列を問い合わせ配列に用いて、CLUSTALW(http://www.genome.jp/tools/clustalw/)によって、配列アライメントを得た。Web上のドメイン解析ソフト、
Pfam(http://pfam.sanger.ac.uk/)、
InterProScan(http://www.ebi.ac.uk/Tools/InterProScan/)、
Prosite(http://www.expasy.org/prosite/)、
を用いて、ORF687様蛋白質のアライメントを作成し、そしてそれぞれの蛋白質のPPRモチーフ構造を解析した。その結果を図21に示す。全てのORF687様遺伝子は16個のPPRモチーフから構成されている(図21)。
Pfam(http://pfam.sanger.ac.uk/)、
InterProScan(http://www.ebi.ac.uk/Tools/InterProScan/)、
Prosite(http://www.expasy.org/prosite/)、
を用いて、ORF687様蛋白質のアライメントを作成し、そしてそれぞれの蛋白質のPPRモチーフ構造を解析した。その結果を図21に示す。全てのORF687様遺伝子は16個のPPRモチーフから構成されている(図21)。
得られたPPRモチーフモデルと非特許文献5に示されるアミノ酸番号に従って、1、2、”ii”(-2)番アミノ酸を抽出し、ORF様蛋白質の稔性回復能機能判定に用いた。
そこで、9種のRf様遺伝子の機能判定をPPRコードを用いて行った。前述のEnkoBと同じように塩基指定能力を司るアミノ酸(1、4、ii)を抽出し、PPRコードに変換後、アミノ酸種をRNA binding windowとして、その機能性判定に用いた(図22)。Enko BとKosena Bは、全体で99.4%の相同性を示すが、RNA binding windowには2箇所のアミノ酸多型があり、これがORF687様遺伝子の稔性回復に対する優性/劣性に深く関与すると考えられた(非特許論文4)。一方、品種Comet中で、Enko Bと相同な遺伝子座に座乗する遺伝子Comet BはEnko Bと98.0%の相同性を示し、RNA binding windowは全く同一である。過去の交配試験で得られたCometBが優性遺伝子であるという知見を裏付けることができた。また、Enko AはEnko Bの近傍に座乗する重複遺伝子だが、RNA認識の観点からも劣性の遺伝子であることが示唆された。これらのデータから、ORF687様遺伝子の稔性回復に対する優性/劣性は、Enko BのRNA binding windowと比較した場合に、ORF687様遺伝子における対応するPPRモチーフすべてにおいて、塩基指定能力を司るアミノ酸(1、4、ii)が同一であること、特に同一の4番アミノ酸(A4)を有すること、あるいは同一の“ii”番アミノ酸を有すること、が重要であることが示唆された。中でも、特に同一の4番アミノ酸(A4)を有することが重要と考えられた。この点から、稔性に関する情報が未知である様々な系統のダイコンにおいて、Enko Bと相同な遺伝子座に座乗する遺伝子、rrORF690-1、rrORF690-2、icicle pprCA、PC PPR-A、PC PPR-BLについては、優性遺伝子であるEnko Bとは異なったRNA binding windowを持ち、これら遺伝子も劣性rfであると考えられた。
以上の結果は、本発明で示すPPRコードは、稔性回復因子として働くような産業上有用なPPR蛋白質の機能判定を高速化することができる。当該技術はCMS-Rfシステムを利用した一代雑種育種法に新しい系統を適用するさいに、候補Rf遺伝子の配列から、その稔性回復能の有無を判定することが可能である。発明者らは21種の新規ダイコン品種のORF687様遺伝子の機能判定を行い、19種のORF様遺伝子の稔性回復能の優性/劣性の判定に成功している(データ未公開)。本技術はオグラ型細胞質のダイコンに限らず、PPR蛋白質をRfとする様々な細胞質、植物種に適用可能である。
[実施例で引用した論文]
参照文献1:Small, I.D., and Peeters, N. (2000). The PPR motif - a TPR-related motif prevalent in plant organellar proteins. Trends Biochem. Sci. 25, 46-47.
参照文献2:Lurin, C., Andres, C., Aubourg, S., Bellaoui, M., Bitton, F., Bruyere, C., Caboche, M., Debast, C., Gualberto, J., Hoffmann, B., et al. (2004). Genome-wide analysis of Arabidopsis pentatricopeptide repeat proteins reveals their essential role in organelle biogenesis. Plant Cell 16, 2089-2103.
参照文献3:Okuda, K., Myouga, F., Motohashi, R., Shinozaki, K., and Shikanai, T. (2007). Conserved domain structure of pentatricopeptide repeat proteins involved in chloroplast RNA editing. Proc Natl Acad Sci USA 104, 8178-8183.
参照文献4:Koizuka N, Imai R, Fujimoto H, Hayakawa T, Kimura Y, et al. (2003) Genetic characterization of a pentatricopeptide repeat protein gene, orf687, that restores fertility in the cytoplasmic male-sterile Kosena radish. Plant J 34: 407-415.
参照文献5:Nakamura T, Yagi Y, Kobayashi K (2012) Mechanistic insight into pentatricopeptide repeat proteins as sequence-specific RNA-binding proteins for organellar RNAs in plants. Plant & Cell Physiology 53: 1171-1179
参照文献1:Small, I.D., and Peeters, N. (2000). The PPR motif - a TPR-related motif prevalent in plant organellar proteins. Trends Biochem. Sci. 25, 46-47.
参照文献2:Lurin, C., Andres, C., Aubourg, S., Bellaoui, M., Bitton, F., Bruyere, C., Caboche, M., Debast, C., Gualberto, J., Hoffmann, B., et al. (2004). Genome-wide analysis of Arabidopsis pentatricopeptide repeat proteins reveals their essential role in organelle biogenesis. Plant Cell 16, 2089-2103.
参照文献3:Okuda, K., Myouga, F., Motohashi, R., Shinozaki, K., and Shikanai, T. (2007). Conserved domain structure of pentatricopeptide repeat proteins involved in chloroplast RNA editing. Proc Natl Acad Sci USA 104, 8178-8183.
参照文献4:Koizuka N, Imai R, Fujimoto H, Hayakawa T, Kimura Y, et al. (2003) Genetic characterization of a pentatricopeptide repeat protein gene, orf687, that restores fertility in the cytoplasmic male-sterile Kosena radish. Plant J 34: 407-415.
参照文献5:Nakamura T, Yagi Y, Kobayashi K (2012) Mechanistic insight into pentatricopeptide repeat proteins as sequence-specific RNA-binding proteins for organellar RNAs in plants. Plant & Cell Physiology 53: 1171-1179
Claims (1)
- 標的RNA塩基又は特定の塩基配列を有する標的RNAと結合可能な蛋白質であって、
前記蛋白質が、1~20個のPPRモチーフからなり、
前記PPRモチーフは、30~38アミノ酸長のポリペプチドであって、式1:
Helix Aは、12アミノ酸長の、αヘリックス構造を形成可能な部分であって、
式2:
式1中Xは、存在しないか又は1~9アミノ酸長からなる部分であり、
式1中Helix Bは、11~13アミノ酸長からなる、αヘリックス構造を形成可能な部分であり、
式1中Lは、2~7アミノ酸長の、式3:
ただし、Liii~Lviiは存在しない場合がある。)で表され、
A1、A4、及びLiiの3つのアミノ酸の組み合わせ、又はA4、Liiの2つのアミノ酸の組み合わせが、標的RNA塩基又は標的RNA特定の塩基配列に応じたものである。)
で表されることを特徴とする、蛋白質を含み、翻訳、スプライシング、及びRNA安定化からなる群より選択されるいずれか一の改変のための、組成物。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011231346 | 2011-10-21 | ||
JP2011231346 | 2011-10-21 | ||
JP2021086108A JP7157483B2 (ja) | 2011-10-21 | 2021-05-21 | Pprモチーフを利用したrna結合性蛋白質の設計方法及びその利用 |
JP2022158241A JP7381133B2 (ja) | 2011-10-21 | 2022-09-30 | Pprモチーフを利用したrna結合性蛋白質の設計方法及びその利用 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022158241A Division JP7381133B2 (ja) | 2011-10-21 | 2022-09-30 | Pprモチーフを利用したrna結合性蛋白質の設計方法及びその利用 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2024010112A true JP2024010112A (ja) | 2024-01-23 |
JP2024010112A5 JP2024010112A5 (ja) | 2024-07-23 |
Family
ID=48141047
Family Applications (8)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013539727A Active JP6164488B2 (ja) | 2011-10-21 | 2012-10-22 | Pprモチーフを利用したrna結合性蛋白質の設計方法及びその利用 |
JP2017112765A Active JP6267388B2 (ja) | 2011-10-21 | 2017-06-07 | Pprモチーフを利用したrna結合性蛋白質の設計方法及びその利用 |
JP2017112764A Active JP6270192B2 (ja) | 2011-10-21 | 2017-06-07 | Pprモチーフを利用したrna結合性蛋白質の設計方法及びその利用 |
JP2017244766A Active JP6934644B2 (ja) | 2011-10-21 | 2017-12-21 | Pprモチーフを利用したrna結合性蛋白質の設計方法及びその利用 |
JP2017244765A Active JP6454398B2 (ja) | 2011-10-21 | 2017-12-21 | Pprモチーフを利用したrna結合性蛋白質の設計方法及びその利用 |
JP2021086108A Active JP7157483B2 (ja) | 2011-10-21 | 2021-05-21 | Pprモチーフを利用したrna結合性蛋白質の設計方法及びその利用 |
JP2022158241A Active JP7381133B2 (ja) | 2011-10-21 | 2022-09-30 | Pprモチーフを利用したrna結合性蛋白質の設計方法及びその利用 |
JP2023183886A Pending JP2024010112A (ja) | 2011-10-21 | 2023-10-26 | Pprモチーフを利用したrna結合性蛋白質の設計方法及びその利用 |
Family Applications Before (7)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013539727A Active JP6164488B2 (ja) | 2011-10-21 | 2012-10-22 | Pprモチーフを利用したrna結合性蛋白質の設計方法及びその利用 |
JP2017112765A Active JP6267388B2 (ja) | 2011-10-21 | 2017-06-07 | Pprモチーフを利用したrna結合性蛋白質の設計方法及びその利用 |
JP2017112764A Active JP6270192B2 (ja) | 2011-10-21 | 2017-06-07 | Pprモチーフを利用したrna結合性蛋白質の設計方法及びその利用 |
JP2017244766A Active JP6934644B2 (ja) | 2011-10-21 | 2017-12-21 | Pprモチーフを利用したrna結合性蛋白質の設計方法及びその利用 |
JP2017244765A Active JP6454398B2 (ja) | 2011-10-21 | 2017-12-21 | Pprモチーフを利用したrna結合性蛋白質の設計方法及びその利用 |
JP2021086108A Active JP7157483B2 (ja) | 2011-10-21 | 2021-05-21 | Pprモチーフを利用したrna結合性蛋白質の設計方法及びその利用 |
JP2022158241A Active JP7381133B2 (ja) | 2011-10-21 | 2022-09-30 | Pprモチーフを利用したrna結合性蛋白質の設計方法及びその利用 |
Country Status (8)
Country | Link |
---|---|
US (7) | US9513283B2 (ja) |
EP (2) | EP2784157B1 (ja) |
JP (8) | JP6164488B2 (ja) |
AU (4) | AU2012326971C1 (ja) |
DK (1) | DK2784157T3 (ja) |
ES (1) | ES2751126T3 (ja) |
PT (1) | PT2784157T (ja) |
WO (1) | WO2013058404A1 (ja) |
Families Citing this family (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2784157B1 (en) | 2011-10-21 | 2019-09-18 | Kyushu University, National University Corporation | Design method for rna-binding protein using ppr motif, and use thereof |
AU2013248928A1 (en) * | 2012-04-16 | 2014-12-04 | The State Board Of Higher Education On Behalf Of The University Of Oregon | Peptides for the binding of nucleotide targets |
KR102606057B1 (ko) * | 2013-04-22 | 2023-11-23 | 고쿠리쓰다이가쿠호진 규슈다이가쿠 | 피피알 단백질을 이용하여 dna 염기 또는 특정 염기서열을 가지는 dna를 동정, 인식 또는 표적화하는 방법 |
CN111471675A (zh) | 2014-03-05 | 2020-07-31 | 国立大学法人神户大学 | 特异性转变靶向dna序列的核酸碱基的基因组序列的修饰方法、及其使用的分子复合体 |
JP6664693B2 (ja) | 2015-09-09 | 2020-03-13 | 国立大学法人神戸大学 | 標的化したdna配列の核酸塩基を特異的に変換する、グラム陽性菌のゲノム配列の変換方法、及びそれに用いる分子複合体 |
CA3005968A1 (en) | 2015-11-23 | 2017-06-01 | The Regents Of The University Of California | Tracking and manipulating cellular rna via nuclear delivery of crispr/cas9 |
DK3382019T3 (da) | 2015-11-27 | 2022-05-30 | Univ Kobe Nat Univ Corp | Fremgangsmåde til omdannelse af enkimet plantegenomsekvens, hvori nukleinsyrebase i målrettet DNA-sekvens specifikt omdannes, og molekylært kompleks anvendt deri |
AU2017275184B2 (en) * | 2016-06-03 | 2021-05-06 | Kyushu University, National University Corporation | Fusion protein for improving protein expression from target mRNA |
BR112018075010A2 (pt) * | 2016-06-03 | 2019-03-12 | Kyushu University, National University Corporation | proteína de fusão para melhorar o nível de expressão de proteína a partir de rnam alvo |
WO2018030488A1 (ja) * | 2016-08-10 | 2018-02-15 | 和光純薬工業株式会社 | Pprモチーフを利用したdna結合性タンパク質およびその利用 |
CA3062595A1 (en) | 2017-05-10 | 2018-11-15 | The Regents Of The University Of California | Directed editing of cellular rna via nuclear delivery of crispr/cas9 |
CN108932400B (zh) * | 2017-05-24 | 2021-07-23 | 北京工业大学 | 一种考虑界面信息的有效的蛋白质-rna复合物结构预测方法 |
CN108959852B (zh) * | 2017-05-24 | 2021-12-24 | 北京工业大学 | 基于氨基酸-核苷酸成对偏好性信息的蛋白质上与rna结合模块的预测方法 |
KR20210058806A (ko) | 2018-06-08 | 2021-05-24 | 로카나바이오 인크. | Rna 표적화 융합 단백질 조성물 및 사용 방법 |
US20220289795A1 (en) * | 2019-05-29 | 2022-09-15 | Editforce, Inc. | Efficient method for preparing ppr protein and use of the same |
JP7308468B2 (ja) * | 2019-05-29 | 2023-07-14 | エディットフォース株式会社 | 凝集の少ないpprタンパク質及びその利用 |
JP2022540446A (ja) | 2019-07-10 | 2022-09-15 | ロックアネイビオ, インコーポレイテッド | Rna標的ノックダウン及び置換の組成物及び使用方法 |
WO2021201198A1 (ja) | 2020-03-31 | 2021-10-07 | エディットフォース株式会社 | 標的rnaを編集する方法 |
JP2023551874A (ja) | 2020-12-01 | 2023-12-13 | ロックアネイビオ, インコーポレイテッド | 筋強直性ジストロフィー1型を処置するためのrna標的化組成物および方法 |
EP4255470A1 (en) | 2020-12-01 | 2023-10-11 | Locanabio, Inc. | Rna-targeting compositions and methods for treating cag repeat diseases |
WO2022221278A1 (en) | 2021-04-12 | 2022-10-20 | Locanabio, Inc. | Compositions and methods comprising hybrid promoters |
WO2022226375A1 (en) | 2021-04-23 | 2022-10-27 | Locanabio, Inc. | Tissue-targeted modified aav capsids and methods of use thereof |
CA3216419A1 (en) | 2021-04-23 | 2022-10-27 | Greg NACHTRAB | Tissue-targeted modified aav capsids and methods of use thereof |
CN117597151A (zh) * | 2021-04-30 | 2024-02-23 | 日商基因编辑力股份有限公司 | 强直性肌肉营养不良1型治疗药 |
JP7125727B1 (ja) | 2021-09-07 | 2022-08-25 | 国立大学法人千葉大学 | 核酸配列改変用組成物および核酸配列の標的部位を改変する方法 |
WO2023154807A2 (en) | 2022-02-09 | 2023-08-17 | Locanabio, Inc. | Compositions and methods for modulating pre-mrna splicing |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002355041A (ja) * | 2001-04-25 | 2002-12-10 | Mitsubishi Chemicals Corp | 細胞質雄性不稔から可稔への回復に関与する遺伝子 |
JP4102099B2 (ja) | 2001-04-25 | 2008-06-18 | アンスティテュ ナシオナル ドゥ ラ ルシェルシュ アグロノミック | 細胞質雄性不稔から可稔への回復に関与するタンパク質及びそれをコードする遺伝子 |
US20040117868A1 (en) | 2002-01-29 | 2004-06-17 | Jun Imamura | Protein participating in restoration from cytoplasmic male sterility to fertility and gene encoding the same |
EP1382612B1 (en) | 2001-04-25 | 2011-07-27 | Institut National de la Recherche Agronomique | Protein participating in restoration from cytoplasmic male sterility to fertility and gene encoding the same |
US20060041961A1 (en) * | 2004-03-25 | 2006-02-23 | Abad Mark S | Genes and uses for pant improvement |
EP2258165A4 (en) | 2008-03-12 | 2011-04-13 | Univ Tohoku | FERTILITY RESTAURANT GENE AND FERTILITY RESTAURANT METHOD FOR CYTOPLASM RUST TYPE CW STERILE |
US8586363B2 (en) | 2009-12-10 | 2013-11-19 | Regents Of The University Of Minnesota | TAL effector-mediated DNA modification |
JP2013128413A (ja) * | 2010-03-11 | 2013-07-04 | Kyushu Univ | Pprモチーフを利用したrna結合性蛋白質の改変方法 |
EP2784157B1 (en) * | 2011-10-21 | 2019-09-18 | Kyushu University, National University Corporation | Design method for rna-binding protein using ppr motif, and use thereof |
AU2013248928A1 (en) * | 2012-04-16 | 2014-12-04 | The State Board Of Higher Education On Behalf Of The University Of Oregon | Peptides for the binding of nucleotide targets |
-
2012
- 2012-10-22 EP EP12841435.6A patent/EP2784157B1/en active Active
- 2012-10-22 JP JP2013539727A patent/JP6164488B2/ja active Active
- 2012-10-22 EP EP19191694.9A patent/EP3611261A1/en active Pending
- 2012-10-22 WO PCT/JP2012/077274 patent/WO2013058404A1/ja active Application Filing
- 2012-10-22 ES ES12841435T patent/ES2751126T3/es active Active
- 2012-10-22 PT PT128414356T patent/PT2784157T/pt unknown
- 2012-10-22 DK DK12841435.6T patent/DK2784157T3/da active
- 2012-10-22 AU AU2012326971A patent/AU2012326971C1/en active Active
- 2012-10-22 US US14/352,697 patent/US9513283B2/en active Active
-
2016
- 2016-10-26 US US15/335,243 patent/US9984202B2/en active Active
-
2017
- 2017-06-07 JP JP2017112765A patent/JP6267388B2/ja active Active
- 2017-06-07 JP JP2017112764A patent/JP6270192B2/ja active Active
- 2017-10-31 AU AU2017254874A patent/AU2017254874B2/en active Active
- 2017-12-21 JP JP2017244766A patent/JP6934644B2/ja active Active
- 2017-12-21 JP JP2017244765A patent/JP6454398B2/ja active Active
-
2018
- 2018-04-25 US US15/962,127 patent/US10340028B2/en active Active
-
2019
- 2019-06-04 US US16/431,429 patent/US10679731B2/en active Active
- 2019-12-11 AU AU2019280013A patent/AU2019280013B2/en active Active
-
2020
- 2020-06-05 US US16/894,295 patent/US10943671B2/en active Active
-
2021
- 2021-03-08 US US17/195,449 patent/US11742056B2/en active Active
- 2021-05-21 JP JP2021086108A patent/JP7157483B2/ja active Active
-
2022
- 2022-06-29 AU AU2022204654A patent/AU2022204654A1/en active Pending
- 2022-09-30 JP JP2022158241A patent/JP7381133B2/ja active Active
-
2023
- 2023-07-13 US US18/221,440 patent/US20240047005A1/en active Pending
- 2023-10-26 JP JP2023183886A patent/JP2024010112A/ja active Pending
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7381133B2 (ja) | Pprモチーフを利用したrna結合性蛋白質の設計方法及びその利用 | |
Iorizzo et al. | De novo assembly and characterization of the carrot transcriptome reveals novel genes, new markers, and genetic diversity | |
Qi et al. | Identification of a novel salt tolerance gene in wild soybean by whole-genome sequencing | |
JP2013128413A (ja) | Pprモチーフを利用したrna結合性蛋白質の改変方法 | |
CN114350687A (zh) | 一种水稻抗白叶枯病基因、蛋白及其应用 | |
Anisimova et al. | Nucleotide sequence polymorphism in the RFL-PPR genes of potato | |
Le Ret et al. | Efficient replication of the plastid genome requires an organellar thymidine kinase | |
JP5194250B2 (ja) | Rna分解酵素活性を有するタンパク質及びその利用 | |
CN116904482A (zh) | 一种影响陆地棉纤维性状的Kinesin基因及其SNP标记 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20231127 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240712 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20241008 |