JP2023036848A - 凝集の少ないpprタンパク質及びその利用 - Google Patents
凝集の少ないpprタンパク質及びその利用 Download PDFInfo
- Publication number
- JP2023036848A JP2023036848A JP2022208226A JP2022208226A JP2023036848A JP 2023036848 A JP2023036848 A JP 2023036848A JP 2022208226 A JP2022208226 A JP 2022208226A JP 2022208226 A JP2022208226 A JP 2022208226A JP 2023036848 A JP2023036848 A JP 2023036848A
- Authority
- JP
- Japan
- Prior art keywords
- ppr
- sequence
- amino acid
- amino acids
- ppr motif
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000002776 aggregation Effects 0.000 title claims abstract description 25
- 238000004220 aggregation Methods 0.000 title claims abstract description 25
- 235000001014 amino acid Nutrition 0.000 claims abstract description 452
- 229940024606 amino acid Drugs 0.000 claims abstract description 451
- 150000001413 amino acids Chemical class 0.000 claims abstract description 417
- 230000027455 binding Effects 0.000 claims abstract description 130
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Chemical compound OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 claims abstract description 129
- 238000009739 binding Methods 0.000 claims abstract description 128
- 229960001230 asparagine Drugs 0.000 claims abstract description 115
- 235000009582 asparagine Nutrition 0.000 claims abstract description 115
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 80
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 claims abstract description 79
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 claims abstract description 73
- 235000003704 aspartic acid Nutrition 0.000 claims abstract description 72
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 claims abstract description 72
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 69
- 235000018102 proteins Nutrition 0.000 claims abstract description 65
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 43
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 41
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 41
- 239000004471 Glycine Substances 0.000 claims abstract description 37
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 claims abstract description 30
- 235000013922 glutamic acid Nutrition 0.000 claims abstract description 30
- 239000004220 glutamic acid Substances 0.000 claims abstract description 30
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 claims abstract description 30
- 235000004554 glutamine Nutrition 0.000 claims abstract description 30
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 claims abstract description 24
- 239000004472 Lysine Substances 0.000 claims abstract description 24
- 235000018977 lysine Nutrition 0.000 claims abstract description 24
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 claims abstract description 20
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 claims abstract description 15
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 claims abstract description 15
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 claims description 89
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical group NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 claims description 62
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 claims description 58
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 claims description 56
- 210000004027 cell Anatomy 0.000 claims description 37
- 229930024421 Adenine Natural products 0.000 claims description 31
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 claims description 31
- 229960000643 adenine Drugs 0.000 claims description 31
- 229940104302 cytosine Drugs 0.000 claims description 31
- 229940035893 uracil Drugs 0.000 claims description 28
- 238000000034 method Methods 0.000 claims description 24
- 239000013598 vector Substances 0.000 claims description 21
- 108020001507 fusion proteins Proteins 0.000 claims description 20
- 102000037865 fusion proteins Human genes 0.000 claims description 20
- 125000000613 asparagine group Chemical group N[C@@H](CC(N)=O)C(=O)* 0.000 claims description 12
- 210000004899 c-terminal region Anatomy 0.000 claims description 7
- 108091006047 fluorescent proteins Proteins 0.000 claims description 7
- 102000034287 fluorescent proteins Human genes 0.000 claims description 7
- 108010077850 Nuclear Localization Signals Proteins 0.000 claims description 6
- 238000011017 operating method Methods 0.000 claims 1
- 229920005630 polypropylene random copolymer Polymers 0.000 description 284
- 229960005261 aspartic acid Drugs 0.000 description 65
- 125000003275 alpha amino acid group Chemical group 0.000 description 50
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 48
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 34
- 239000004474 valine Substances 0.000 description 34
- 229960004295 valine Drugs 0.000 description 34
- 235000014393 valine Nutrition 0.000 description 34
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 32
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 32
- 239000004473 Threonine Substances 0.000 description 32
- 229960002898 threonine Drugs 0.000 description 32
- 235000008521 threonine Nutrition 0.000 description 32
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 29
- 108090000765 processed proteins & peptides Proteins 0.000 description 26
- 102000004196 processed proteins & peptides Human genes 0.000 description 25
- 229920001184 polypeptide Polymers 0.000 description 24
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 20
- 235000004400 serine Nutrition 0.000 description 20
- 229960001153 serine Drugs 0.000 description 20
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 18
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 18
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 13
- 229960000310 isoleucine Drugs 0.000 description 13
- 235000014705 isoleucine Nutrition 0.000 description 13
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 13
- 238000004519 manufacturing process Methods 0.000 description 13
- 241000588724 Escherichia coli Species 0.000 description 12
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 11
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 11
- 235000005772 leucine Nutrition 0.000 description 11
- 108020004999 messenger RNA Proteins 0.000 description 11
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 10
- 230000006870 function Effects 0.000 description 10
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 10
- 235000008729 phenylalanine Nutrition 0.000 description 10
- 108020004414 DNA Proteins 0.000 description 9
- 239000011780 sodium chloride Substances 0.000 description 9
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 8
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 8
- 108010076504 Protein Sorting Signals Proteins 0.000 description 8
- 230000004570 RNA-binding Effects 0.000 description 8
- 235000013930 proline Nutrition 0.000 description 8
- 238000010828 elution Methods 0.000 description 7
- 239000013612 plasmid Substances 0.000 description 7
- 239000000126 substance Substances 0.000 description 7
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 6
- 239000004475 Arginine Substances 0.000 description 6
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 6
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 6
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 6
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 6
- 235000009697 arginine Nutrition 0.000 description 6
- 201000010099 disease Diseases 0.000 description 6
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 6
- 230000002209 hydrophobic effect Effects 0.000 description 6
- 229930182817 methionine Natural products 0.000 description 6
- 235000006109 methionine Nutrition 0.000 description 6
- 239000002773 nucleotide Substances 0.000 description 6
- 125000003729 nucleotide group Chemical group 0.000 description 6
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 6
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 6
- 235000002374 tyrosine Nutrition 0.000 description 6
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 5
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 5
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 5
- 235000018417 cysteine Nutrition 0.000 description 5
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 5
- 108010048367 enhanced green fluorescent protein Proteins 0.000 description 5
- 238000002474 experimental method Methods 0.000 description 5
- 238000001641 gel filtration chromatography Methods 0.000 description 5
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 5
- 235000014304 histidine Nutrition 0.000 description 5
- 125000002987 valine group Chemical group [H]N([H])C([H])(C(*)=O)C([H])(C([H])([H])[H])C([H])([H])[H] 0.000 description 5
- 238000002965 ELISA Methods 0.000 description 4
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 4
- TWRXJAOTZQYOKJ-UHFFFAOYSA-L Magnesium chloride Chemical compound [Mg+2].[Cl-].[Cl-] TWRXJAOTZQYOKJ-UHFFFAOYSA-L 0.000 description 4
- 241001465754 Metazoa Species 0.000 description 4
- 108091028043 Nucleic acid sequence Proteins 0.000 description 4
- PZBFGYYEXUXCOF-UHFFFAOYSA-N TCEP Chemical compound OC(=O)CCP(CCC(O)=O)CCC(O)=O PZBFGYYEXUXCOF-UHFFFAOYSA-N 0.000 description 4
- 238000005119 centrifugation Methods 0.000 description 4
- 210000002472 endoplasmic reticulum Anatomy 0.000 description 4
- 238000002523 gelfiltration Methods 0.000 description 4
- 238000001727 in vivo Methods 0.000 description 4
- 230000007326 intracellular aggregation Effects 0.000 description 4
- 238000004020 luminiscence type Methods 0.000 description 4
- 239000012139 lysis buffer Substances 0.000 description 4
- 230000035772 mutation Effects 0.000 description 4
- 239000000047 product Substances 0.000 description 4
- 239000000523 sample Substances 0.000 description 4
- 239000000243 solution Substances 0.000 description 4
- 238000013519 translation Methods 0.000 description 4
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 3
- 241000196324 Embryophyta Species 0.000 description 3
- 101000966742 Homo sapiens Leucine-rich PPR motif-containing protein, mitochondrial Proteins 0.000 description 3
- 208000006136 Leigh Disease Diseases 0.000 description 3
- 102100040589 Leucine-rich PPR motif-containing protein, mitochondrial Human genes 0.000 description 3
- 102000051619 SUMO-1 Human genes 0.000 description 3
- 108010090804 Streptavidin Proteins 0.000 description 3
- 210000004102 animal cell Anatomy 0.000 description 3
- 238000009395 breeding Methods 0.000 description 3
- 239000000872 buffer Substances 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 210000004748 cultured cell Anatomy 0.000 description 3
- 238000012258 culturing Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 238000002337 electrophoretic mobility shift assay Methods 0.000 description 3
- 238000002073 fluorescence micrograph Methods 0.000 description 3
- RAXXELZNTBOGNW-UHFFFAOYSA-N imidazole Natural products C1=CNC=N1 RAXXELZNTBOGNW-UHFFFAOYSA-N 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 230000001965 increasing effect Effects 0.000 description 3
- 230000003834 intracellular effect Effects 0.000 description 3
- 229940113082 thymine Drugs 0.000 description 3
- 239000011534 wash buffer Substances 0.000 description 3
- JKMHFZQWWAIEOD-UHFFFAOYSA-N 2-[4-(2-hydroxyethyl)piperazin-1-yl]ethanesulfonic acid Chemical compound OCC[NH+]1CCN(CCS([O-])(=O)=O)CC1 JKMHFZQWWAIEOD-UHFFFAOYSA-N 0.000 description 2
- 101710159080 Aconitate hydratase A Proteins 0.000 description 2
- 101710159078 Aconitate hydratase B Proteins 0.000 description 2
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 2
- 241000283690 Bos taurus Species 0.000 description 2
- 101000879203 Caenorhabditis elegans Small ubiquitin-related modifier Proteins 0.000 description 2
- 102000004190 Enzymes Human genes 0.000 description 2
- 108090000790 Enzymes Proteins 0.000 description 2
- 239000007995 HEPES buffer Substances 0.000 description 2
- 102100022823 Histone RNA hairpin-binding protein Human genes 0.000 description 2
- 101000825762 Homo sapiens Histone RNA hairpin-binding protein Proteins 0.000 description 2
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 2
- 208000017507 Leigh syndrome Diseases 0.000 description 2
- 102100040888 Malignant T-cell-amplified sequence 1 Human genes 0.000 description 2
- 101710120903 Malignant T-cell-amplified sequence 1 Proteins 0.000 description 2
- 206010058799 Mitochondrial encephalomyopathy Diseases 0.000 description 2
- 108020002230 Pancreatic Ribonuclease Proteins 0.000 description 2
- 102000005891 Pancreatic ribonuclease Human genes 0.000 description 2
- 108020004518 RNA Probes Proteins 0.000 description 2
- 238000010357 RNA editing Methods 0.000 description 2
- 230000026279 RNA modification Effects 0.000 description 2
- 239000003391 RNA probe Substances 0.000 description 2
- 230000021839 RNA stabilization Effects 0.000 description 2
- 102000044126 RNA-Binding Proteins Human genes 0.000 description 2
- 101710105008 RNA-binding protein Proteins 0.000 description 2
- 102000006382 Ribonucleases Human genes 0.000 description 2
- 108010083644 Ribonucleases Proteins 0.000 description 2
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 2
- -1 Sirius Proteins 0.000 description 2
- 102100029887 Translationally-controlled tumor protein Human genes 0.000 description 2
- 102100026231 Translocon-associated protein subunit alpha Human genes 0.000 description 2
- 235000004279 alanine Nutrition 0.000 description 2
- 230000003321 amplification Effects 0.000 description 2
- 230000001488 breeding effect Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 238000007876 drug discovery Methods 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 229940088598 enzyme Drugs 0.000 description 2
- 239000013613 expression plasmid Substances 0.000 description 2
- 239000013604 expression vector Substances 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 238000010362 genome editing Methods 0.000 description 2
- 238000005342 ion exchange Methods 0.000 description 2
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 2
- 239000006166 lysate Substances 0.000 description 2
- 229910001629 magnesium chloride Inorganic materials 0.000 description 2
- 230000014759 maintenance of location Effects 0.000 description 2
- 230000001404 mediated effect Effects 0.000 description 2
- 239000002609 medium Substances 0.000 description 2
- 239000012528 membrane Substances 0.000 description 2
- 244000005700 microbiome Species 0.000 description 2
- 239000000178 monomer Substances 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- YBYRMVIVWMBXKQ-UHFFFAOYSA-N phenylmethanesulfonyl fluoride Chemical compound FS(=O)(=O)CC1=CC=CC=C1 YBYRMVIVWMBXKQ-UHFFFAOYSA-N 0.000 description 2
- 108091033319 polynucleotide Proteins 0.000 description 2
- 102000040430 polynucleotide Human genes 0.000 description 2
- 239000002157 polynucleotide Substances 0.000 description 2
- 230000004845 protein aggregation Effects 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 210000003705 ribosome Anatomy 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 230000001629 suppression Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000014621 translational initiation Effects 0.000 description 2
- 230000005945 translocation Effects 0.000 description 2
- 230000032258 transport Effects 0.000 description 2
- 229960004799 tryptophan Drugs 0.000 description 2
- 238000005406 washing Methods 0.000 description 2
- HBZBAMXERPYTFS-SECBINFHSA-N (4S)-2-(6,7-dihydro-5H-pyrrolo[3,2-f][1,3]benzothiazol-2-yl)-4,5-dihydro-1,3-thiazole-4-carboxylic acid Chemical compound OC(=O)[C@H]1CSC(=N1)c1nc2cc3CCNc3cc2s1 HBZBAMXERPYTFS-SECBINFHSA-N 0.000 description 1
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 1
- 101001082110 Acanthamoeba polyphaga mimivirus Eukaryotic translation initiation factor 4E homolog Proteins 0.000 description 1
- 229920000936 Agarose Polymers 0.000 description 1
- 241000219195 Arabidopsis thaliana Species 0.000 description 1
- 101150004109 CYB5R3 gene Proteins 0.000 description 1
- 241000282465 Canis Species 0.000 description 1
- 241000282472 Canis lupus familiaris Species 0.000 description 1
- 102000014914 Carrier Proteins Human genes 0.000 description 1
- 241000282693 Cercopithecidae Species 0.000 description 1
- 101100007328 Cocos nucifera COS-1 gene Proteins 0.000 description 1
- 241000699800 Cricetinae Species 0.000 description 1
- 241000699802 Cricetulus griseus Species 0.000 description 1
- 241000195493 Cryptophyta Species 0.000 description 1
- 230000004568 DNA-binding Effects 0.000 description 1
- 101001082109 Danio rerio Eukaryotic translation initiation factor 4E-1B Proteins 0.000 description 1
- 101150088702 Denr gene Proteins 0.000 description 1
- 102100022692 Density-regulated protein Human genes 0.000 description 1
- 101710092028 Density-regulated protein Proteins 0.000 description 1
- 102000016911 Deoxyribonucleases Human genes 0.000 description 1
- 108010053770 Deoxyribonucleases Proteins 0.000 description 1
- 208000035240 Disease Resistance Diseases 0.000 description 1
- 239000006144 Dulbecco’s modified Eagle's medium Substances 0.000 description 1
- 108091005941 EBFP Proteins 0.000 description 1
- 108091005942 ECFP Proteins 0.000 description 1
- 241000283086 Equidae Species 0.000 description 1
- 101710091919 Eukaryotic translation initiation factor 4G Proteins 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 108700007698 Genetic Terminator Regions Proteins 0.000 description 1
- 101001023784 Heteractis crispa GFP-like non-fluorescent chromoprotein Proteins 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 101000998623 Homo sapiens NADH-cytochrome b5 reductase 3 Proteins 0.000 description 1
- 101001093116 Homo sapiens Protein transport protein Sec61 subunit beta Proteins 0.000 description 1
- 101000684503 Homo sapiens Sentrin-specific protease 3 Proteins 0.000 description 1
- 101000653679 Homo sapiens Translationally-controlled tumor protein Proteins 0.000 description 1
- 101000629937 Homo sapiens Translocon-associated protein subunit alpha Proteins 0.000 description 1
- 102100034343 Integrase Human genes 0.000 description 1
- 101710203526 Integrase Proteins 0.000 description 1
- 108060001084 Luciferase Proteins 0.000 description 1
- 239000005089 Luciferase Substances 0.000 description 1
- 102000016943 Muramidase Human genes 0.000 description 1
- 108010014251 Muramidase Proteins 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- 108010062010 N-Acetylmuramoyl-L-alanine Amidase Proteins 0.000 description 1
- ZBZXYUYUUDZCNB-UHFFFAOYSA-N N-cyclohexa-1,3-dien-1-yl-N-phenyl-4-[4-(N-[4-[4-(N-[4-[4-(N-phenylanilino)phenyl]phenyl]anilino)phenyl]phenyl]anilino)phenyl]aniline Chemical compound C1=CCCC(N(C=2C=CC=CC=2)C=2C=CC(=CC=2)C=2C=CC(=CC=2)N(C=2C=CC=CC=2)C=2C=CC(=CC=2)C=2C=CC(=CC=2)N(C=2C=CC=CC=2)C=2C=CC(=CC=2)C=2C=CC(=CC=2)N(C=2C=CC=CC=2)C=2C=CC=CC=2)=C1 ZBZXYUYUUDZCNB-UHFFFAOYSA-N 0.000 description 1
- 102100033153 NADH-cytochrome b5 reductase 3 Human genes 0.000 description 1
- 102000007999 Nuclear Proteins Human genes 0.000 description 1
- 108010089610 Nuclear Proteins Proteins 0.000 description 1
- 108020004711 Nucleic Acid Probes Proteins 0.000 description 1
- 239000012124 Opti-MEM Substances 0.000 description 1
- 102100036308 Protein transport protein Sec61 subunit beta Human genes 0.000 description 1
- 241000700159 Rattus Species 0.000 description 1
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 1
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 1
- 108700038981 SUMO-1 Proteins 0.000 description 1
- 102100023645 Sentrin-specific protease 3 Human genes 0.000 description 1
- 102100026900 Signal recognition particle receptor subunit alpha Human genes 0.000 description 1
- 101710126382 Signal recognition particle receptor subunit alpha Proteins 0.000 description 1
- 101710111458 Signal recognition particle receptor subunit alpha homolog Proteins 0.000 description 1
- 241000282887 Suidae Species 0.000 description 1
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 1
- 239000012505 Superdex™ Substances 0.000 description 1
- 101710157927 Translationally-controlled tumor protein Proteins 0.000 description 1
- 101710112880 Translocon-associated protein subunit alpha Proteins 0.000 description 1
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 238000002835 absorbance Methods 0.000 description 1
- 230000002378 acidificating effect Effects 0.000 description 1
- 239000013543 active substance Substances 0.000 description 1
- 125000000539 amino acid group Chemical group 0.000 description 1
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 1
- 229960000723 ampicillin Drugs 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 125000003118 aryl group Chemical group 0.000 description 1
- 230000037429 base substitution Effects 0.000 description 1
- 238000013357 binding ELISA Methods 0.000 description 1
- 108091008324 binding proteins Proteins 0.000 description 1
- 239000002551 biofuel Substances 0.000 description 1
- 230000008827 biological function Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000003197 catalytic effect Effects 0.000 description 1
- 238000005277 cation exchange chromatography Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 238000003776 cleavage reaction Methods 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 239000002537 cosmetic Substances 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000009402 cross-breeding Methods 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 108010082025 cyan fluorescent protein Proteins 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000000502 dialysis Methods 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000000975 dye Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000009088 enzymatic function Effects 0.000 description 1
- 108010021843 fluorescent protein 583 Proteins 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 239000003205 fragrance Substances 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 229960002449 glycine Drugs 0.000 description 1
- 238000002169 hydrotherapy Methods 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012482 interaction analysis Methods 0.000 description 1
- 239000000543 intermediate Substances 0.000 description 1
- 230000009878 intermolecular interaction Effects 0.000 description 1
- 210000003734 kidney Anatomy 0.000 description 1
- 238000012933 kinetic analysis Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 238000011068 loading method Methods 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 229960000274 lysozyme Drugs 0.000 description 1
- 235000010335 lysozyme Nutrition 0.000 description 1
- 239000004325 lysozyme Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000037353 metabolic pathway Effects 0.000 description 1
- 230000000813 microbial effect Effects 0.000 description 1
- 108091064355 mitochondrial RNA Proteins 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 229910052757 nitrogen Inorganic materials 0.000 description 1
- 230000005937 nuclear translocation Effects 0.000 description 1
- 239000002853 nucleic acid probe Substances 0.000 description 1
- 230000030648 nucleus localization Effects 0.000 description 1
- 210000003463 organelle Anatomy 0.000 description 1
- 210000001672 ovary Anatomy 0.000 description 1
- 239000008188 pellet Substances 0.000 description 1
- 239000012450 pharmaceutical intermediate Substances 0.000 description 1
- 230000000144 pharmacologic effect Effects 0.000 description 1
- 230000000704 physical effect Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 108020001580 protein domains Proteins 0.000 description 1
- 239000012460 protein solution Substances 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 230000007017 scission Effects 0.000 description 1
- 238000009394 selective breeding Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 150000003384 small molecules Chemical class 0.000 description 1
- 230000009870 specific binding Effects 0.000 description 1
- 210000000130 stem cell Anatomy 0.000 description 1
- 229910052717 sulfur Inorganic materials 0.000 description 1
- 239000011593 sulfur Substances 0.000 description 1
- 239000006228 supernatant Substances 0.000 description 1
- 239000012134 supernatant fraction Substances 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 230000014616 translation Effects 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 229960005486 vaccine Drugs 0.000 description 1
- 210000003501 vero cell Anatomy 0.000 description 1
- 239000013603 viral vector Substances 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
- 239000011701 zinc Substances 0.000 description 1
- 229910052725 zinc Inorganic materials 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K67/00—Rearing or breeding animals, not otherwise provided for; New or modified breeds of animals
- A01K67/027—New or modified breeds of vertebrates
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/46—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K19/00—Hybrid peptides, i.e. peptides covalently bound to nucleic acids, or non-covalently bound protein-protein complexes
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K7/00—Peptides having 5 to 20 amino acids in a fully defined sequence; Derivatives thereof
- C07K7/04—Linear peptides containing only normal peptide links
- C07K7/06—Linear peptides containing only normal peptide links having 5 to 11 amino acids
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K7/00—Peptides having 5 to 20 amino acids in a fully defined sequence; Derivatives thereof
- C07K7/04—Linear peptides containing only normal peptide links
- C07K7/08—Linear peptides containing only normal peptide links having 12 to 20 amino acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N5/00—Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
- C12N5/10—Cells modified by introduction of foreign genetic material
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/01—Fusion polypeptide containing a localisation/targetting motif
- C07K2319/02—Fusion polypeptide containing a localisation/targetting motif containing a signal sequence
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/60—Fusion polypeptide containing spectroscopic/fluorescent detection, e.g. green fluorescent protein [GFP]
Landscapes
- Chemical & Material Sciences (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Wood Science & Technology (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Medicinal Chemistry (AREA)
- Microbiology (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Gastroenterology & Hepatology (AREA)
- Toxicology (AREA)
- Cell Biology (AREA)
- Analytical Chemistry (AREA)
- Immunology (AREA)
- Environmental Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Animal Husbandry (AREA)
- Biodiversity & Conservation Biology (AREA)
- Crystallography & Structural Chemistry (AREA)
- Peptides Or Proteins (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
【課題】凝集の少ないPPRタンパク質を提供する。【解決手段】PPRタンパク質の凝集性を改善するために、N末端から1番目のPPRモチーフ(M1)のA6アミノ酸を、より親水性とする。さらにM1のA9アミノ酸を、親水性アミノ酸又はグリシンとする。A6アミノ酸は、好ましくはアスパラギン又はアスパラギン酸であり、A9アミノ酸は、好ましくはグルタミン、グルタミン酸、リジン、又はグリシンである。このようなPPRモチーフをM1モチーフとして含むタンパク質は、凝集性が改善されているのみならず、標的核酸に対する高い結合力を有しうる。【選択図】なし
Description
本発明は、意図した核酸に結合可能なタンパク質を用いる核酸操作技術に関する。本発明は、医療(創薬支援、疾患の治療)、農業(農産物生産、育種)、化学(生物学的物質生産)などの幅広い分野で有用である。
PPRタンパク質は、約35アミノ酸長からなるPPRモチーフの繰り返しを含むタンパク質で、PPRモチーフ1つが1つの塩基と特異的に結合することができる。PPRモチーフ内の1番目、4番目、ii番目(次のモチーフの2つ前)のアミノ酸の組み合わせによってアデニン、シトシン、グアニン、ウラシル(又はチミン)のうちのどれに結合するかが決まる(特許文献1、2)。
天然に存在するRNA結合PPRモチーフのうち、もっとも多く出現するそれぞれの塩基に対応した組み合わせは、アデニンは、1番目がバリン、4番目がトレオニン、ii番目がアスパラギン、シトシンは、1番目がバリン、4番目がアスパラギン、ii番目がセリン、グアニンは、1番目がバリン、4番目がトレオニン、ii番目がアスパラギン酸、ウラシルは、1番目が、バリン、4番目がアスパラギン、ii番目がアスパラギン酸である(非特許文献1~5)。これらのアミノ酸の組み合わせを利用することで任意の配列に特異的に結合できるPPRタンパク質の設計が可能である。
Coquille, S. et al. An artificial PPR scaffold for programmable RNA recognition. Nature Communications 5, Article number: 5729(2014)
Shen, C. et al. Specific RNA Recognition by Designer Pentatricopeptide Repeat Protein. Molecular Plant 8, 667-670(2015)
Shen, C. et al. Structural basis for specific single-stranded RNA recognition by designer pentatricopeptide repeat proteins. Nature Communications volume 7, Article number: 11285 (2016)
Miranda, R. G. et al. RNA-binding specificity landscapes of designer pentatricopeptide repeat proteins elucidate principlesof PPR?RNA interactions. Nucleic Acids Research, 46(5), 2613-2623(2018)
Yan, J. et al. Delineation of pentatricopeptide repeat codes for target RNA prediction. Nucleic Acids Research, gkz075(2019)
本発明者らは、上記のアミノ酸の組み合わせを利用し、高い性能を有し、また多くの、例えば15以上のPPRモチーフを連結したPPRタンパク質を作製することを検討してきた(特許文献3)。一方で、本発明者らの検討によると、このような方法で作製したPPRタンパク質の一部には、凝集性を示すものがあることが分かった。特に、PPRタンパク質を動物培養細胞で発現させた場合に、凝集が見られることがあった。
そこで、この点をPPRモチーフ内のアミノ酸変異により解決することを検討した。そしてPPRタンパク質の1モチーフ目(N末端側)の、6番目、好ましくは6番目と9番目のアミノ酸を親水性のアミノ酸にすることでPPRの凝集性を改善することができることを見出し、本発明を完成した。
本発明は以下を提供する。
[1] 下記のいずれか1つの、PPRモチーフ:
(C-1)配列番号:4~7のいずれか1の配列からなるPPRモチーフ;
(C-2)配列番号:4~7のいずれか1の配列において、位置1、4、6、及び34のアミノ酸以外のアミノ酸の1~9個を置換、欠失、又は付加した配列からなり、かつシトシン結合性であるPPRモチーフ;
(C-3)配列番号:4~7のいずれか1の配列と少なくとも80%の配列同一性を有し、ただし位置1、4、6、及び34のアミノ酸は同一であり、かつシトシン結合性であるPPRモチーフ;
(A-1)配列番号:8の配列からなるPPRモチーフにおいて、位置6のアミノ酸をアスパラギン又はアスパラギン酸に置換したPPRモチーフ;
(A-2)(A-1)の配列において、位置1、4、6、及び34のアミノ酸以外のアミノ酸の1~9個を置換、欠失、又は付加した配列からなり、かつアデニン結合性であるPPRモチーフ;
(A-3)(A-1)の配列と少なくとも80%の配列同一性を有し、ただし位置1、4、6、及び34のアミノ酸は同一であり、かつアデニン結合性であるPPRモチーフ;
(G-1)配列番号:9の配列からなるPPRモチーフにおいて、位置6のアミノ酸をアスパラギン又はアスパラギン酸に置換したPPRモチーフ;
(G-2)(G-1)の配列において、位置1、4、6、及び34のアミノ酸以外のアミノ酸の1~9個を置換、欠失、又は付加した配列からなり、かつグアニン結合性であるPPRモチーフ;
(G-3)(G-1)の配列と少なくとも80%の配列同一性を有し、ただし位置1、4、6、及び34のアミノ酸は同一であり、かつグアニン結合性であるPPRモチーフ;
(U-1)配列番号:10の配列からなるPPRモチーフにおいて、位置6のアミノ酸をアスパラギン又はアスパラギン酸に置換したPPRモチーフ;
(U-2)(U-1)の配列において、位置1、4、6、及び34のアミノ酸以外のアミノ酸の1~9個を置換、欠失、又は付加した配列からなり、かつウラシル結合性であるPPRモチーフ;
(U-3)(U-1)の配列と少なくとも80%の配列同一性を有し、ただし位置1、4、6、及び34のアミノ酸は同一であり、かつウラシル結合性であるPPRモチーフ。
[2] 下記のいずれか1つの、PPRモチーフ:
(C-1)配列番号:4~7のいずれか1の配列からなるPPRモチーフ;
(C-2)配列番号:4~7のいずれか1の配列において、位置1、4、6、9、及び34のアミノ酸以外のアミノ酸の1~9個を置換、欠失、又は付加した配列からなり、かつシトシン結合性であるPPRモチーフ;
(C-3)配列番号:4~7のいずれか1の配列と少なくとも80%の配列同一性を有し、ただし位置1、4、6、9、及び34のアミノ酸は同一であり、かつシトシン結合性であるPPRモチーフ;
(A-1)配列番号:8の配列において、位置6及び9のアミノ酸を、下記に定義した組み合わせのいずれか1つを満たすように置換したPPRモチーフ;
(A-2)(A-1)の配列において、位置1、4、6、9、及び34のアミノ酸以外のアミノ酸の1~9個を置換、欠失、又は付加した配列からなり、かつアデニン結合性であるPPRモチーフ;
(A-3)(A-1)の配列と少なくとも80%の配列同一性を有し、ただし位置1、4、6、9、及び34のアミノ酸は同一であり、かつアデニン結合性であるPPRモチーフ;
(G-1)配列番号:9の配列において、位置6及び9のアミノ酸を、下記に定義した組み合わせのいずれか1つを満たすように置換した配列からなるPPRモチーフ;
(G-2)(G-1)の配列において、位置1、4、6、9、及び34のアミノ酸以外のアミノ酸の1~9個を置換、欠失、又は付加した配列からなり、かつグアニン結合性であるPPRモチーフ;
(G-3)(G-1)の配列と少なくとも80%の配列同一性を有し、ただし位置1、4、6、9、及び34のアミノ酸は同一であり、かつグアニン結合性であるPPRモチーフ;
(U-1)配列番号:10の配列において、位置6及び9のアミノ酸を、下記に定義した組み合わせのいずれか1つを満たすように置換した配列からなるPPRモチーフ;
(U-2)(U-1)の配列において、位置1、4、6、9、及び34のアミノ酸以外のアミノ酸の1~9個を置換、欠失、又は付加した配列からなり、かつウラシル結合性であるPPRモチーフ;
(U-3)(U-1)の配列と少なくとも80%の配列同一性を有し、ただし位置1、4、6、9、及び34のアミノ酸は同一であり、かつウラシル結合性であるPPRモチーフ。
・位置6のアミノ酸がアスパラギンであり、かつ位置9のアミノ酸がグルタミン酸である組み合わせ
・位置6のアミノ酸がアスパラギンであり、かつ位置9のアミノ酸がグルタミンである組み合わせ
・位置6のアミノ酸がアスパラギンであり、かつ位置9のアミノ酸がリジンである組み合わせ
・位置6のアミノ酸アスパラギン酸であり、かつ位置9アミノ酸がグリシンである組み合わせ
[3] 下記のいずれか1つである、1又は2に記載のPPRモチーフ:
(C-4)配列番号:4の配列からなるPPRモチーフ;
(A-4)配列番号:58の配列からなるPPRモチーフ;
(G-4)配列番号:59の配列からなるPPRモチーフ;
(U-4)配列番号:60の配列からなるPPRモチーフ。
[4] 1~3のいずれか1項に記載のPPRモチーフの、PPRタンパク質におけるN末端から1番目のPPRモチーフとしての使用。
[5] PPRタンパク質の凝集性を減少させるための、4に記載の使用。
[6] 下記の式1で表されるPPRモチーフを1~30個含む、特定の塩基配列を有する標的核酸と結合可能なタンパク質において、N末端から1番目のPPRモチーフ(M1)のA6アミノ酸が、親水性アミノ酸である、タンパク質。
(式中:
Helix Aは、12アミノ酸長の、αヘリックス構造を形成可能な部分であって、式2で表され、
式2中、A1~A12はそれぞれ独立にアミノ酸を表し;
Xは、存在しないか又は1~9アミノ酸長からなる部分であり;
Helix Bは、11~13アミノ酸長からなる、αヘリックス構造を形成可能な部分であり;
Lは、2~7アミノ酸長の、式3で表される部分であり;
式3中、各アミノ酸は、“i” (-1)、“ii”(-2)、とC末端側からナンバリングされ、
ただし、Liii~Lviiは存在しない場合がある。)
[7] M1のA9アミノ酸が、親水性アミノ酸又はグリシンである、6に記載のタンパク質。
[8] M1のA6アミノ酸が、アスパラギン又はアスパラギン酸である、6又は7に記載のタンパク質。
[9] M1のA9アミノ酸が、グルタミン、グルタミン酸、リジン、又はグリシンである、6~8のいずれか1項に記載のタンパク質。
[10] M1のA6アミノ酸、及びM1のA9アミノ酸が、下記のいずれかの組み合わせである、6~9のいずれか1項に記載のタンパク質。
・A6アミノ酸がアスパラギンであり、かつA9アミノ酸がグルタミン酸である組み合わせ
・A6アミノ酸がアスパラギンであり、かつA9アミノ酸がグルタミンである組み合わせ
・A6アミノ酸がアスパラギンであり、かつA9アミノ酸がリジンである組み合わせ
・A6アミノ酸アスパラギン酸であり、かつA9アミノ酸がグリシンである組み合わせ
[11] 蛍光タンパク質、核移行シグナルペプチド、及びタグタンパク質からなる群より選択される少なくとも一つと、1~3のいずれか1項に記載のPPRモチーフをN末端から1番目のPPRモチーフとして含むPPRタンパク質、又は6~10のいずれか1項に記載のタンパク質との、融合タンパク質。
[12] 6に定義したPPRモチーフを含む、特定の塩基配列を有する標的核酸と結合可能なPPRタンパク質の、改質方法であって、N末端から1番目のPPRモチーフ(M1)のA6アミノ酸をより親水性とする、方法。
[13] 1~3のいずれか1項に記載のPPRモチーフをN末端から1番目のPPRモチーフとして含むPPRタンパク質、6~10のいずれか1項に記載のタンパク質、又は11に記載の融合タンパク質を用いることを特徴とする、核酸の検出方法。
[14] 1~3のいずれか1項に記載のPPRモチーフ、1~3のいずれか1項に記載のPPRモチーフをN末端から1番目のPPRモチーフとして含むPPRタンパク質、又は6~10のいずれか1項に記載のタンパク質をコードする核酸。
[15] 14に記載の核酸を含む、ベクター。
[16] 15に記載のベクターを含む、細胞(ヒト個体は除く。)。
[17] 1~3のいずれか1項に記載のPPRモチーフ、1~3のいずれか1項に記載のPPRモチーフをN末端から1番目のPPRモチーフとして含むPPRタンパク質、又は6~10のいずれか1項に記載のタンパク質、又は15に記載のベクターを用いる、核酸の操作方法(ヒト個体での実施を除く。)。
[18] 17に記載の操作方法を含む、生物の生産方法。
[1] 下記のいずれか1つの、PPRモチーフ:
(C-1)配列番号:4~7のいずれか1の配列からなるPPRモチーフ;
(C-2)配列番号:4~7のいずれか1の配列において、位置1、4、6、及び34のアミノ酸以外のアミノ酸の1~9個を置換、欠失、又は付加した配列からなり、かつシトシン結合性であるPPRモチーフ;
(C-3)配列番号:4~7のいずれか1の配列と少なくとも80%の配列同一性を有し、ただし位置1、4、6、及び34のアミノ酸は同一であり、かつシトシン結合性であるPPRモチーフ;
(A-1)配列番号:8の配列からなるPPRモチーフにおいて、位置6のアミノ酸をアスパラギン又はアスパラギン酸に置換したPPRモチーフ;
(A-2)(A-1)の配列において、位置1、4、6、及び34のアミノ酸以外のアミノ酸の1~9個を置換、欠失、又は付加した配列からなり、かつアデニン結合性であるPPRモチーフ;
(A-3)(A-1)の配列と少なくとも80%の配列同一性を有し、ただし位置1、4、6、及び34のアミノ酸は同一であり、かつアデニン結合性であるPPRモチーフ;
(G-1)配列番号:9の配列からなるPPRモチーフにおいて、位置6のアミノ酸をアスパラギン又はアスパラギン酸に置換したPPRモチーフ;
(G-2)(G-1)の配列において、位置1、4、6、及び34のアミノ酸以外のアミノ酸の1~9個を置換、欠失、又は付加した配列からなり、かつグアニン結合性であるPPRモチーフ;
(G-3)(G-1)の配列と少なくとも80%の配列同一性を有し、ただし位置1、4、6、及び34のアミノ酸は同一であり、かつグアニン結合性であるPPRモチーフ;
(U-1)配列番号:10の配列からなるPPRモチーフにおいて、位置6のアミノ酸をアスパラギン又はアスパラギン酸に置換したPPRモチーフ;
(U-2)(U-1)の配列において、位置1、4、6、及び34のアミノ酸以外のアミノ酸の1~9個を置換、欠失、又は付加した配列からなり、かつウラシル結合性であるPPRモチーフ;
(U-3)(U-1)の配列と少なくとも80%の配列同一性を有し、ただし位置1、4、6、及び34のアミノ酸は同一であり、かつウラシル結合性であるPPRモチーフ。
[2] 下記のいずれか1つの、PPRモチーフ:
(C-1)配列番号:4~7のいずれか1の配列からなるPPRモチーフ;
(C-2)配列番号:4~7のいずれか1の配列において、位置1、4、6、9、及び34のアミノ酸以外のアミノ酸の1~9個を置換、欠失、又は付加した配列からなり、かつシトシン結合性であるPPRモチーフ;
(C-3)配列番号:4~7のいずれか1の配列と少なくとも80%の配列同一性を有し、ただし位置1、4、6、9、及び34のアミノ酸は同一であり、かつシトシン結合性であるPPRモチーフ;
(A-1)配列番号:8の配列において、位置6及び9のアミノ酸を、下記に定義した組み合わせのいずれか1つを満たすように置換したPPRモチーフ;
(A-2)(A-1)の配列において、位置1、4、6、9、及び34のアミノ酸以外のアミノ酸の1~9個を置換、欠失、又は付加した配列からなり、かつアデニン結合性であるPPRモチーフ;
(A-3)(A-1)の配列と少なくとも80%の配列同一性を有し、ただし位置1、4、6、9、及び34のアミノ酸は同一であり、かつアデニン結合性であるPPRモチーフ;
(G-1)配列番号:9の配列において、位置6及び9のアミノ酸を、下記に定義した組み合わせのいずれか1つを満たすように置換した配列からなるPPRモチーフ;
(G-2)(G-1)の配列において、位置1、4、6、9、及び34のアミノ酸以外のアミノ酸の1~9個を置換、欠失、又は付加した配列からなり、かつグアニン結合性であるPPRモチーフ;
(G-3)(G-1)の配列と少なくとも80%の配列同一性を有し、ただし位置1、4、6、9、及び34のアミノ酸は同一であり、かつグアニン結合性であるPPRモチーフ;
(U-1)配列番号:10の配列において、位置6及び9のアミノ酸を、下記に定義した組み合わせのいずれか1つを満たすように置換した配列からなるPPRモチーフ;
(U-2)(U-1)の配列において、位置1、4、6、9、及び34のアミノ酸以外のアミノ酸の1~9個を置換、欠失、又は付加した配列からなり、かつウラシル結合性であるPPRモチーフ;
(U-3)(U-1)の配列と少なくとも80%の配列同一性を有し、ただし位置1、4、6、9、及び34のアミノ酸は同一であり、かつウラシル結合性であるPPRモチーフ。
・位置6のアミノ酸がアスパラギンであり、かつ位置9のアミノ酸がグルタミン酸である組み合わせ
・位置6のアミノ酸がアスパラギンであり、かつ位置9のアミノ酸がグルタミンである組み合わせ
・位置6のアミノ酸がアスパラギンであり、かつ位置9のアミノ酸がリジンである組み合わせ
・位置6のアミノ酸アスパラギン酸であり、かつ位置9アミノ酸がグリシンである組み合わせ
[3] 下記のいずれか1つである、1又は2に記載のPPRモチーフ:
(C-4)配列番号:4の配列からなるPPRモチーフ;
(A-4)配列番号:58の配列からなるPPRモチーフ;
(G-4)配列番号:59の配列からなるPPRモチーフ;
(U-4)配列番号:60の配列からなるPPRモチーフ。
[4] 1~3のいずれか1項に記載のPPRモチーフの、PPRタンパク質におけるN末端から1番目のPPRモチーフとしての使用。
[5] PPRタンパク質の凝集性を減少させるための、4に記載の使用。
[6] 下記の式1で表されるPPRモチーフを1~30個含む、特定の塩基配列を有する標的核酸と結合可能なタンパク質において、N末端から1番目のPPRモチーフ(M1)のA6アミノ酸が、親水性アミノ酸である、タンパク質。
Helix Aは、12アミノ酸長の、αヘリックス構造を形成可能な部分であって、式2で表され、
Xは、存在しないか又は1~9アミノ酸長からなる部分であり;
Helix Bは、11~13アミノ酸長からなる、αヘリックス構造を形成可能な部分であり;
Lは、2~7アミノ酸長の、式3で表される部分であり;
ただし、Liii~Lviiは存在しない場合がある。)
[7] M1のA9アミノ酸が、親水性アミノ酸又はグリシンである、6に記載のタンパク質。
[8] M1のA6アミノ酸が、アスパラギン又はアスパラギン酸である、6又は7に記載のタンパク質。
[9] M1のA9アミノ酸が、グルタミン、グルタミン酸、リジン、又はグリシンである、6~8のいずれか1項に記載のタンパク質。
[10] M1のA6アミノ酸、及びM1のA9アミノ酸が、下記のいずれかの組み合わせである、6~9のいずれか1項に記載のタンパク質。
・A6アミノ酸がアスパラギンであり、かつA9アミノ酸がグルタミン酸である組み合わせ
・A6アミノ酸がアスパラギンであり、かつA9アミノ酸がグルタミンである組み合わせ
・A6アミノ酸がアスパラギンであり、かつA9アミノ酸がリジンである組み合わせ
・A6アミノ酸アスパラギン酸であり、かつA9アミノ酸がグリシンである組み合わせ
[11] 蛍光タンパク質、核移行シグナルペプチド、及びタグタンパク質からなる群より選択される少なくとも一つと、1~3のいずれか1項に記載のPPRモチーフをN末端から1番目のPPRモチーフとして含むPPRタンパク質、又は6~10のいずれか1項に記載のタンパク質との、融合タンパク質。
[12] 6に定義したPPRモチーフを含む、特定の塩基配列を有する標的核酸と結合可能なPPRタンパク質の、改質方法であって、N末端から1番目のPPRモチーフ(M1)のA6アミノ酸をより親水性とする、方法。
[13] 1~3のいずれか1項に記載のPPRモチーフをN末端から1番目のPPRモチーフとして含むPPRタンパク質、6~10のいずれか1項に記載のタンパク質、又は11に記載の融合タンパク質を用いることを特徴とする、核酸の検出方法。
[14] 1~3のいずれか1項に記載のPPRモチーフ、1~3のいずれか1項に記載のPPRモチーフをN末端から1番目のPPRモチーフとして含むPPRタンパク質、又は6~10のいずれか1項に記載のタンパク質をコードする核酸。
[15] 14に記載の核酸を含む、ベクター。
[16] 15に記載のベクターを含む、細胞(ヒト個体は除く。)。
[17] 1~3のいずれか1項に記載のPPRモチーフ、1~3のいずれか1項に記載のPPRモチーフをN末端から1番目のPPRモチーフとして含むPPRタンパク質、又は6~10のいずれか1項に記載のタンパク質、又は15に記載のベクターを用いる、核酸の操作方法(ヒト個体での実施を除く。)。
[18] 17に記載の操作方法を含む、生物の生産方法。
本発明はまた以下を提供する。
[1] 下記のいずれか1つの、PPRモチーフ:
(C-1)配列番号:4~7のいずれか1の配列からなるPPRモチーフ;
(C-2)配列番号:4~7のいずれか1の配列において、位置1、4、6、及び34のアミノ酸以外のアミノ酸の1~9個を置換、欠失、又は付加した配列からなり、かつシトシン結合性であるPPRモチーフ;
(C-3)配列番号:4~7のいずれか1の配列と少なくとも80%の配列同一性を有し、ただし位置1、4、6、及び34のアミノ酸は同一であり、かつシトシン結合性であるPPRモチーフ;
(A-1)配列番号:8の配列からなるPPRモチーフにおいて、位置6のアミノ酸をアスパラギン又はアスパラギン酸に置換したPPRモチーフ;
(A-2)(A-1)の配列において、位置1、4、6、及び34のアミノ酸以外のアミノ酸の1~9個を置換、欠失、又は付加した配列からなり、かつアデニン結合性であるPPRモチーフ;
(A-3)(A-1)の配列と少なくとも80%の配列同一性を有し、ただし位置1、4、6、及び34のアミノ酸は同一であり、かつアデニン結合性であるPPRモチーフ;
(G-1)配列番号:9の配列からなるPPRモチーフにおいて、位置6のアミノ酸をアスパラギン又はアスパラギン酸に置換したPPRモチーフ;
(G-2)(G-1)の配列において、位置1、4、6、及び34のアミノ酸以外のアミノ酸の1~9個を置換、欠失、又は付加した配列からなり、かつグアニン結合性であるPPRモチーフ;
(G-3)(G-1)の配列と少なくとも80%の配列同一性を有し、ただし位置1、4、6、及び34のアミノ酸は同一であり、かつグアニン結合性であるPPRモチーフ;
(U-1)配列番号:10の配列からなるPPRモチーフにおいて、位置6のアミノ酸をアスパラギン又はアスパラギン酸に置換したPPRモチーフ;
(U-2)(U-1)の配列において、位置1、4、6、及び34のアミノ酸以外のアミノ酸の1~9個を置換、欠失、又は付加した配列からなり、かつウラシル結合性であるPPRモチーフ;
(U-3)(U-1)の配列と少なくとも80%の配列同一性を有し、ただし位置1、4、6、及び34のアミノ酸は同一であり、かつウラシル結合性であるPPRモチーフ。
[2] 下記のいずれか1つの、PPRモチーフ:
(C-1)配列番号:4~7のいずれか1の配列からなるPPRモチーフ;
(C-2)配列番号:4~7のいずれか1の配列において、位置1、4、6、9、及び34のアミノ酸以外のアミノ酸の1~9個を置換、欠失、又は付加した配列からなり、かつシトシン結合性であるPPRモチーフ;
(C-3)配列番号:4~7のいずれか1の配列と少なくとも80%の配列同一性を有し、ただし位置1、4、6、9、及び34のアミノ酸は同一であり、かつシトシン結合性であるPPRモチーフ;
(A-1)配列番号:8の配列において、位置6及び9のアミノ酸を、下記に定義した組み合わせのいずれか1つを満たすように置換したPPRモチーフ;
(A-2)(A-1)の配列において、位置1、4、6、9、及び34のアミノ酸以外のアミノ酸の1~9個を置換、欠失、又は付加した配列からなり、かつアデニン結合性であるPPRモチーフ;
(A-3)(A-1)の配列と少なくとも80%の配列同一性を有し、ただし位置1、4、6、9、及び34のアミノ酸は同一であり、かつアデニン結合性であるPPRモチーフ;
(G-1)配列番号:9の配列において、位置6及び9のアミノ酸を、下記に定義した組み合わせのいずれか1つを満たすように置換した配列からなるPPRモチーフ;
(G-2)(G-1)の配列において、位置1、4、6、9、及び34のアミノ酸以外のアミノ酸の1~9個を置換、欠失、又は付加した配列からなり、かつグアニン結合性であるPPRモチーフ;
(G-3)(G-1)の配列と少なくとも80%の配列同一性を有し、ただし位置1、4、6、9、及び34のアミノ酸は同一であり、かつグアニン結合性であるPPRモチーフ;
(U-1)配列番号:10の配列において、位置6及び9のアミノ酸を、下記に定義した組み合わせのいずれか1つを満たすように置換した配列からなるPPRモチーフ;
(U-2)(U-1)の配列において、位置1、4、6、9、及び34のアミノ酸以外のアミノ酸の1~9個を置換、欠失、又は付加した配列からなり、かつウラシル結合性であるPPRモチーフ;
(U-3)(U-1)の配列と少なくとも80%の配列同一性を有し、ただし位置1、4、6、9、及び34のアミノ酸は同一であり、かつウラシル結合性であるPPRモチーフ。
・位置6のアミノ酸がアスパラギンであり、かつ位置9のアミノ酸がグルタミン酸である組み合わせ
・位置6アミノ酸がアスパラギンであり、かつ位置9のアミノ酸がグルタミンである組み合わせ
・位置6アミノ酸がアスパラギンであり、かつ位置9のアミノ酸がリジンである組み合わせ
・位置6アミノ酸アスパラギン酸であり、かつ位置9アミノ酸がグリシンである組み合わせ
[3] 1又は2に記載のPPRモチーフの、PPRタンパク質におけるN末端から1番目のPPRモチーフとしての使用。
[4] PPRタンパク質の凝集性を減少させるための、3に記載の使用。
[5] 下記の式1で表されるPPRモチーフを1~30個含む、特定の塩基配列を有する標的核酸と結合可能なタンパク質において、N末端から1番目のPPRモチーフ(M1)のA6アミノ酸が、親水性アミノ酸である、タンパク質。
(式中:
Helix Aは、12アミノ酸長の、αヘリックス構造を形成可能な部分であって、式2で表され、
式2中、A1~A12はそれぞれ独立にアミノ酸を表し;
Xは、存在しないか又は1~9アミノ酸長からなる部分であり;
Helix Bは、11~13アミノ酸長からなる、αヘリックス構造を形成可能な部分であり;
Lは、2~7アミノ酸長の、式3で表される部分であり;
式3中、各アミノ酸は、“i” (-1)、“ii”(-2)、とC末端側からナンバリングされ、
ただし、Liii~Lviiは存在しない場合がある。)
[6] M1のA9アミノ酸が、親水性アミノ酸又はグリシンである、5に記載のタンパク質。
[7] M1のA6アミノ酸が、アスパラギン又はアスパラギン酸である、5又は6に記載のタンパク質。
[8] M1のA9アミノ酸が、グルタミン、グルタミン酸、リジン、又はグリシンである、5~7のいずれか1項に記載のタンパク質。
[9] M1のA6アミノ酸、及びM1のA9アミノ酸が、下記のいずれかの組み合わせである、5~8のいずれか1項に記載のタンパク質。
・A6のアミノ酸がアスパラギンであり、かつA9アミノ酸がグルタミン酸である組み合わせ
・A6のアミノ酸がアスパラギンであり、かつA9アミノ酸がグルタミンである組み合わせ
・A6のアミノ酸がアスパラギンであり、かつA9アミノ酸がリジンである組み合わせ
・A6のアミノ酸アスパラギン酸であり、かつA9アミノ酸がグリシンである組み合わせ
[10] 蛍光タンパク質、核移行シグナルペプチド、及びタグタンパク質からなる群より選択される少なくとも一つと、1若しくは2に記載のPPRモチーフをN末端から1番目のPPRモチーフとして含むPPRタンパク質、又は5~9のいずれか1項に記載のタンパク質との、融合タンパク質。
[11] 3に定義したPPRモチーフを含む、特定の塩基配列を有する標的核酸と結合可能なPPRタンパク質の、改質方法であって、N末端から1番目のPPRモチーフ(M1)のA6アミノ酸をより親水性とする、方法。
[12] 1若しくは2に記載のPPRモチーフをN末端から1番目のPPRモチーフとして含むPPRタンパク質、5~9のいずれか1項に記載のタンパク質、又は10に記載の融合タンパク質を用いることを特徴とする、核酸の検出方法。
[13] 1若しくは2に記載のPPRモチーフ、1若しくは2に記載のPPRモチーフをN末端から1番目のPPRモチーフとして含むPPRタンパク質、又は5~9のいずれか1項に記載のタンパク質をコードする核酸。
[14] 13に記載の核酸を含む、ベクター。
[15] 14に記載のベクターを含む、細胞(ヒト個体は除く。)。
[16] 1若しくは2に記載のPPRモチーフ、1若しくは2に記載のPPRモチーフをN末端から1番目のPPRモチーフとして含むPPRタンパク質、又は5~9のいずれか1項に記載のタンパク質、又は14に記載のベクターを用いる、核酸の操作方法(ヒト個体での実施を除く。)。
[17] 16に記載の操作方法を含む、生物の生産方法。
[1] 下記のいずれか1つの、PPRモチーフ:
(C-1)配列番号:4~7のいずれか1の配列からなるPPRモチーフ;
(C-2)配列番号:4~7のいずれか1の配列において、位置1、4、6、及び34のアミノ酸以外のアミノ酸の1~9個を置換、欠失、又は付加した配列からなり、かつシトシン結合性であるPPRモチーフ;
(C-3)配列番号:4~7のいずれか1の配列と少なくとも80%の配列同一性を有し、ただし位置1、4、6、及び34のアミノ酸は同一であり、かつシトシン結合性であるPPRモチーフ;
(A-1)配列番号:8の配列からなるPPRモチーフにおいて、位置6のアミノ酸をアスパラギン又はアスパラギン酸に置換したPPRモチーフ;
(A-2)(A-1)の配列において、位置1、4、6、及び34のアミノ酸以外のアミノ酸の1~9個を置換、欠失、又は付加した配列からなり、かつアデニン結合性であるPPRモチーフ;
(A-3)(A-1)の配列と少なくとも80%の配列同一性を有し、ただし位置1、4、6、及び34のアミノ酸は同一であり、かつアデニン結合性であるPPRモチーフ;
(G-1)配列番号:9の配列からなるPPRモチーフにおいて、位置6のアミノ酸をアスパラギン又はアスパラギン酸に置換したPPRモチーフ;
(G-2)(G-1)の配列において、位置1、4、6、及び34のアミノ酸以外のアミノ酸の1~9個を置換、欠失、又は付加した配列からなり、かつグアニン結合性であるPPRモチーフ;
(G-3)(G-1)の配列と少なくとも80%の配列同一性を有し、ただし位置1、4、6、及び34のアミノ酸は同一であり、かつグアニン結合性であるPPRモチーフ;
(U-1)配列番号:10の配列からなるPPRモチーフにおいて、位置6のアミノ酸をアスパラギン又はアスパラギン酸に置換したPPRモチーフ;
(U-2)(U-1)の配列において、位置1、4、6、及び34のアミノ酸以外のアミノ酸の1~9個を置換、欠失、又は付加した配列からなり、かつウラシル結合性であるPPRモチーフ;
(U-3)(U-1)の配列と少なくとも80%の配列同一性を有し、ただし位置1、4、6、及び34のアミノ酸は同一であり、かつウラシル結合性であるPPRモチーフ。
[2] 下記のいずれか1つの、PPRモチーフ:
(C-1)配列番号:4~7のいずれか1の配列からなるPPRモチーフ;
(C-2)配列番号:4~7のいずれか1の配列において、位置1、4、6、9、及び34のアミノ酸以外のアミノ酸の1~9個を置換、欠失、又は付加した配列からなり、かつシトシン結合性であるPPRモチーフ;
(C-3)配列番号:4~7のいずれか1の配列と少なくとも80%の配列同一性を有し、ただし位置1、4、6、9、及び34のアミノ酸は同一であり、かつシトシン結合性であるPPRモチーフ;
(A-1)配列番号:8の配列において、位置6及び9のアミノ酸を、下記に定義した組み合わせのいずれか1つを満たすように置換したPPRモチーフ;
(A-2)(A-1)の配列において、位置1、4、6、9、及び34のアミノ酸以外のアミノ酸の1~9個を置換、欠失、又は付加した配列からなり、かつアデニン結合性であるPPRモチーフ;
(A-3)(A-1)の配列と少なくとも80%の配列同一性を有し、ただし位置1、4、6、9、及び34のアミノ酸は同一であり、かつアデニン結合性であるPPRモチーフ;
(G-1)配列番号:9の配列において、位置6及び9のアミノ酸を、下記に定義した組み合わせのいずれか1つを満たすように置換した配列からなるPPRモチーフ;
(G-2)(G-1)の配列において、位置1、4、6、9、及び34のアミノ酸以外のアミノ酸の1~9個を置換、欠失、又は付加した配列からなり、かつグアニン結合性であるPPRモチーフ;
(G-3)(G-1)の配列と少なくとも80%の配列同一性を有し、ただし位置1、4、6、9、及び34のアミノ酸は同一であり、かつグアニン結合性であるPPRモチーフ;
(U-1)配列番号:10の配列において、位置6及び9のアミノ酸を、下記に定義した組み合わせのいずれか1つを満たすように置換した配列からなるPPRモチーフ;
(U-2)(U-1)の配列において、位置1、4、6、9、及び34のアミノ酸以外のアミノ酸の1~9個を置換、欠失、又は付加した配列からなり、かつウラシル結合性であるPPRモチーフ;
(U-3)(U-1)の配列と少なくとも80%の配列同一性を有し、ただし位置1、4、6、9、及び34のアミノ酸は同一であり、かつウラシル結合性であるPPRモチーフ。
・位置6のアミノ酸がアスパラギンであり、かつ位置9のアミノ酸がグルタミン酸である組み合わせ
・位置6アミノ酸がアスパラギンであり、かつ位置9のアミノ酸がグルタミンである組み合わせ
・位置6アミノ酸がアスパラギンであり、かつ位置9のアミノ酸がリジンである組み合わせ
・位置6アミノ酸アスパラギン酸であり、かつ位置9アミノ酸がグリシンである組み合わせ
[3] 1又は2に記載のPPRモチーフの、PPRタンパク質におけるN末端から1番目のPPRモチーフとしての使用。
[4] PPRタンパク質の凝集性を減少させるための、3に記載の使用。
[5] 下記の式1で表されるPPRモチーフを1~30個含む、特定の塩基配列を有する標的核酸と結合可能なタンパク質において、N末端から1番目のPPRモチーフ(M1)のA6アミノ酸が、親水性アミノ酸である、タンパク質。
Helix Aは、12アミノ酸長の、αヘリックス構造を形成可能な部分であって、式2で表され、
Xは、存在しないか又は1~9アミノ酸長からなる部分であり;
Helix Bは、11~13アミノ酸長からなる、αヘリックス構造を形成可能な部分であり;
Lは、2~7アミノ酸長の、式3で表される部分であり;
ただし、Liii~Lviiは存在しない場合がある。)
[6] M1のA9アミノ酸が、親水性アミノ酸又はグリシンである、5に記載のタンパク質。
[7] M1のA6アミノ酸が、アスパラギン又はアスパラギン酸である、5又は6に記載のタンパク質。
[8] M1のA9アミノ酸が、グルタミン、グルタミン酸、リジン、又はグリシンである、5~7のいずれか1項に記載のタンパク質。
[9] M1のA6アミノ酸、及びM1のA9アミノ酸が、下記のいずれかの組み合わせである、5~8のいずれか1項に記載のタンパク質。
・A6のアミノ酸がアスパラギンであり、かつA9アミノ酸がグルタミン酸である組み合わせ
・A6のアミノ酸がアスパラギンであり、かつA9アミノ酸がグルタミンである組み合わせ
・A6のアミノ酸がアスパラギンであり、かつA9アミノ酸がリジンである組み合わせ
・A6のアミノ酸アスパラギン酸であり、かつA9アミノ酸がグリシンである組み合わせ
[10] 蛍光タンパク質、核移行シグナルペプチド、及びタグタンパク質からなる群より選択される少なくとも一つと、1若しくは2に記載のPPRモチーフをN末端から1番目のPPRモチーフとして含むPPRタンパク質、又は5~9のいずれか1項に記載のタンパク質との、融合タンパク質。
[11] 3に定義したPPRモチーフを含む、特定の塩基配列を有する標的核酸と結合可能なPPRタンパク質の、改質方法であって、N末端から1番目のPPRモチーフ(M1)のA6アミノ酸をより親水性とする、方法。
[12] 1若しくは2に記載のPPRモチーフをN末端から1番目のPPRモチーフとして含むPPRタンパク質、5~9のいずれか1項に記載のタンパク質、又は10に記載の融合タンパク質を用いることを特徴とする、核酸の検出方法。
[13] 1若しくは2に記載のPPRモチーフ、1若しくは2に記載のPPRモチーフをN末端から1番目のPPRモチーフとして含むPPRタンパク質、又は5~9のいずれか1項に記載のタンパク質をコードする核酸。
[14] 13に記載の核酸を含む、ベクター。
[15] 14に記載のベクターを含む、細胞(ヒト個体は除く。)。
[16] 1若しくは2に記載のPPRモチーフ、1若しくは2に記載のPPRモチーフをN末端から1番目のPPRモチーフとして含むPPRタンパク質、又は5~9のいずれか1項に記載のタンパク質、又は14に記載のベクターを用いる、核酸の操作方法(ヒト個体での実施を除く。)。
[17] 16に記載の操作方法を含む、生物の生産方法。
[PPRモチーフ、PPRタンパク質]
(定義)
本発明でPPRモチーフというときは、特に記載した場合を除き、Web上のタンパク質ドメイン検索プログラムでアミノ酸配列を解析した際に、PfamにおいてPF01535、PrositeにおいてPS51375で得られるE値が所定値以下(望ましくはE-03)のアミノ酸配列をもつ30~38アミノ酸で構成されるポリペプチドをいう。本発明で定義するPPRモチーフを構成するアミノ酸の位置番号は、PF01535とほぼ同義である一方で、PS51375のアミノ酸の場所から2引いた数(例;本発明の1番→PS51375の3番)に相当する。ただし、“ii”(-2)番のアミノ酸というときは、PPRモチーフを構成するアミノ酸の後ろ(C末端側)から2番目のアミノ酸、又は次のPPRモチーフの1番アミノ酸に対して2個N末端側、すなわち-2番目のアミノ酸とする。次のPPRモチーフが明確に同定されない場合、次のヘリックス構造の1番目のアミノ酸に対して、2コ前のアミノ酸を“ii”とする。Pfamについてはhttp://pfam.sanger.ac.uk/、Prositeについては、http://www.expasy.org/prosite/を参照することができる。
(定義)
本発明でPPRモチーフというときは、特に記載した場合を除き、Web上のタンパク質ドメイン検索プログラムでアミノ酸配列を解析した際に、PfamにおいてPF01535、PrositeにおいてPS51375で得られるE値が所定値以下(望ましくはE-03)のアミノ酸配列をもつ30~38アミノ酸で構成されるポリペプチドをいう。本発明で定義するPPRモチーフを構成するアミノ酸の位置番号は、PF01535とほぼ同義である一方で、PS51375のアミノ酸の場所から2引いた数(例;本発明の1番→PS51375の3番)に相当する。ただし、“ii”(-2)番のアミノ酸というときは、PPRモチーフを構成するアミノ酸の後ろ(C末端側)から2番目のアミノ酸、又は次のPPRモチーフの1番アミノ酸に対して2個N末端側、すなわち-2番目のアミノ酸とする。次のPPRモチーフが明確に同定されない場合、次のヘリックス構造の1番目のアミノ酸に対して、2コ前のアミノ酸を“ii”とする。Pfamについてはhttp://pfam.sanger.ac.uk/、Prositeについては、http://www.expasy.org/prosite/を参照することができる。
PPRモチーフの保存アミノ酸配列は、アミノ酸レベルでの保存性は低いが、2次構造上で2つのαへリックスはよく保存されている。典型的なPPRモチーフは35アミノ酸で構成されるが、その長さは30~38アミノ酸と可変的である。
本発明でいうPPRモチーフは、より具体的には、式1で表される、30~38アミノ酸長のポリペプチドからなる。
Xは、存在しないか又は1~9アミノ酸長からなる部分であり;
Helix Bは、11~13アミノ酸長からなる、αヘリックス構造を形成可能な部分であり;
Lは、2~7アミノ酸長の、式3で表される部分であり;
本発明でPPRタンパク質というときは、特に記載した場合を除き、上述のPPRモチーフを、1個以上、好ましくは2個以上有するPPRタンパク質をいう。本明細書でタンパク質というときは、特に記載した場合を除き、ポリペプチド(複数のアミノ酸がペプチド結合した鎖)からなる物質全般をいい、比較的低分子のポリペプチドからなるものも含まれる。本発明でアミノ酸という場合、通常のアミノ酸分子を指すことがあるほか、ペプチド鎖を構成しているアミノ酸残基を指すことがある。いずれを指しているかは、文脈から、当業者には明らかである。
本発明で、PPRモチーフの標的核酸における塩基との結合性に関し、特異性/特異的というときは、特に記載した場合を除き、4種類のうちのいずれか一つの塩基に対する結合活性が、他の塩基に対する結合活性より高いことをいう。
本発明で核酸というときは、RNA又はDNAを指す。なおPPRタンパク質は、RNA又はDNA中の塩基に対して特異性を有しうるが、核酸モノマーに結合するわけではない。
PPRモチーフは、1、4、ii番の3つのアミノ酸の組み合わせが、塩基との特異的な結合のために重要であり、これらの組み合わせにより、結合する塩基がいずれであるかを決定できる(前掲特許文献1、2)。
具体的には、RNA結合性のPPRモチーフに関しては、1、4、ii番の3つのアミノ酸の組み合わせと結合可能な塩基との関係は、下記のとおりである(前掲特許文献1参照)。
(3-1) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、バリン、アスパラギン及びアスパラギン酸の場合、そのPPRモチーフは、Uに強く結合し、次にCに、その次にA又はGに対して結合するという、選択的なRNA塩基結合能を有する。
(3-2) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、バリン、トレオニン、アスパラギンの場合、そのPPRモチーフは、Aに強く結合し、次にGに、その次にCに対して結合するが、Uには結合しないという、選択的なRNA塩基結合能を有する。
(3-3) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、バリン、アスパラギン、アスパラギンの場合、そのPPRモチーフは、Cに強く結合し、次にA又はUに対して結合するが、Gには結合しないという、選択的なRNA塩基結合能を有する。
(3-4) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、グルタミン酸、グリシン、アスパラギン酸の場合、そのPPRモチーフは、Gに強く結合するが、A、U及びCには結合しないという、選択的なRNA塩基結合能を有する。
(3-5) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、イソロイシン、アスパラギン、アスパラギンの場合、そのPPRモチーフは、Cに強く結合し、次にUに、その次にAに対して結合するが、Gには結合しないという、選択的なRNA塩基結合能を有する。
(3-6) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、バリン、トレオニン、アスパラギン酸の場合、そのPPRモチーフは、Gに強く結合し、次にUに対して結合するが、AとCには結合しないという、選択的なRNA塩基結合能を有する。
(3-7) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、リジン、トレオニン、アスパラギン酸、の場合、そのPPRモチーフは、Gに強く結合し、次にAに対して結合するが、U及びCには結合しないという、選択的なRNA塩基結合能を有する。
(3-8) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、フェニルアラニン、セリン、アスパラギンの場合、そのPPRモチーフは、Aに強く結合し、次にCに、その次にG及びUに対して結合するという、選択的なRNA塩基結合能を有する。
(3-9) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、バリン、アスパラギン、セリンの場合、そのPPRモチーフは、Cに強く結合し、次にUに対して結合するが、A及びGには結合しないという、選択的なRNA塩基結合能を有する。
(3-10) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、フェニルアラニン、トレオニン、アスパラギンの場合、そのPPRモチーフは、Aに強く結合するが、G、U及びCには結合しないという、選択的なRNA塩基結合能を有する。
(3-11) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、イソロイシン、アスパラギン、アスパラギン酸の場合、そのPPRモチーフは、Uに強く結合し、次にAに対して結合するが、G及びCには結合しないという、選択的なRNA塩基結合能を有する。
(3-12) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、トレオニン、トレオニン、アスパラギンの場合、そのPPRモチーフは、Aに強く結合するが、G、U及びCには結合しないという、選択的なRNA塩基結合能を有する。
(3-13) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、イソロイシン、メチオニン、アスパラギン酸の場合、そのPPRモチーフは、Uに強く結合し、次にCに対して結合するが、A及びGには結合しないという、選択的なRNA塩基結合能を有する。
(3-14) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、フェニルアラニン、プロリン、アスパラギン酸の場合PPR、そのモチーフは、Uに強く結合し、次にCに対して結合するが、A及びGには結合しないという、選択的なRNA塩基結合能を有する。
(3-15) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、チロシン、プロリン、アスパラギン酸の場合、そのPPRモチーフは、Uに強く結合するが、A、G及びCには結合しないという、選択的なRNA塩基結合能を有する。
(3-16) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、ロイシン、トレオニン、アスパラギン酸の場合、そのPPRモチーフは、Gに強く結合するが、A、U及びCには結合しないという、選択的なRNA塩基結合能を有する。
(3-1) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、バリン、アスパラギン及びアスパラギン酸の場合、そのPPRモチーフは、Uに強く結合し、次にCに、その次にA又はGに対して結合するという、選択的なRNA塩基結合能を有する。
(3-2) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、バリン、トレオニン、アスパラギンの場合、そのPPRモチーフは、Aに強く結合し、次にGに、その次にCに対して結合するが、Uには結合しないという、選択的なRNA塩基結合能を有する。
(3-3) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、バリン、アスパラギン、アスパラギンの場合、そのPPRモチーフは、Cに強く結合し、次にA又はUに対して結合するが、Gには結合しないという、選択的なRNA塩基結合能を有する。
(3-4) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、グルタミン酸、グリシン、アスパラギン酸の場合、そのPPRモチーフは、Gに強く結合するが、A、U及びCには結合しないという、選択的なRNA塩基結合能を有する。
(3-5) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、イソロイシン、アスパラギン、アスパラギンの場合、そのPPRモチーフは、Cに強く結合し、次にUに、その次にAに対して結合するが、Gには結合しないという、選択的なRNA塩基結合能を有する。
(3-6) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、バリン、トレオニン、アスパラギン酸の場合、そのPPRモチーフは、Gに強く結合し、次にUに対して結合するが、AとCには結合しないという、選択的なRNA塩基結合能を有する。
(3-7) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、リジン、トレオニン、アスパラギン酸、の場合、そのPPRモチーフは、Gに強く結合し、次にAに対して結合するが、U及びCには結合しないという、選択的なRNA塩基結合能を有する。
(3-8) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、フェニルアラニン、セリン、アスパラギンの場合、そのPPRモチーフは、Aに強く結合し、次にCに、その次にG及びUに対して結合するという、選択的なRNA塩基結合能を有する。
(3-9) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、バリン、アスパラギン、セリンの場合、そのPPRモチーフは、Cに強く結合し、次にUに対して結合するが、A及びGには結合しないという、選択的なRNA塩基結合能を有する。
(3-10) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、フェニルアラニン、トレオニン、アスパラギンの場合、そのPPRモチーフは、Aに強く結合するが、G、U及びCには結合しないという、選択的なRNA塩基結合能を有する。
(3-11) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、イソロイシン、アスパラギン、アスパラギン酸の場合、そのPPRモチーフは、Uに強く結合し、次にAに対して結合するが、G及びCには結合しないという、選択的なRNA塩基結合能を有する。
(3-12) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、トレオニン、トレオニン、アスパラギンの場合、そのPPRモチーフは、Aに強く結合するが、G、U及びCには結合しないという、選択的なRNA塩基結合能を有する。
(3-13) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、イソロイシン、メチオニン、アスパラギン酸の場合、そのPPRモチーフは、Uに強く結合し、次にCに対して結合するが、A及びGには結合しないという、選択的なRNA塩基結合能を有する。
(3-14) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、フェニルアラニン、プロリン、アスパラギン酸の場合PPR、そのモチーフは、Uに強く結合し、次にCに対して結合するが、A及びGには結合しないという、選択的なRNA塩基結合能を有する。
(3-15) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、チロシン、プロリン、アスパラギン酸の場合、そのPPRモチーフは、Uに強く結合するが、A、G及びCには結合しないという、選択的なRNA塩基結合能を有する。
(3-16) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、ロイシン、トレオニン、アスパラギン酸の場合、そのPPRモチーフは、Gに強く結合するが、A、U及びCには結合しないという、選択的なRNA塩基結合能を有する。
具体的には、DNA結合性のPPRモチーフに関しては、1、4、ii番の3つのアミノ酸の組み合わせと結合可能な塩基との関係は、下記のとおりである(前掲特許文献2参照)。
(2-1) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、任意のアミノ酸、グリシン、アスパラギン酸であるとき、そのPPRモチーフは、Gに選択的に結合する;
(2-2) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、グルタミン酸、グリシン、アスパラギン酸であるとき、そのPPRモチーフは、Gに選択的に結合する;
(2-3) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、任意のアミノ酸、グリシン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
(2-4) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、グルタミン酸、グリシン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
(2-5) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、任意のアミノ酸、グリシン、セリンであるとき、そのPPRモチーフは、Aに選択的に結合し、次にCに対して結合する;
(2-6) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、任意のアミノ酸、イソロイシン、任意のアミノ酸であるとき、そのPPRモチーフは、T及びCに選択的に結合する;
(2-7) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、任意のアミノ酸、イソロイシン、アスパラギンであるとき、そのPPRモチーフは、Tに選択的に結合し、次にCに対して結合する;
(2-8) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、任意のアミノ酸、ロイシン、任意のアミノ酸であるとき、そのPPRモチーフは、T及びCに選択的に結合する;
(2-9) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、任意のアミノ酸、ロイシン、アスパラギン酸であるとき、そのPPRモチーフは、Cに選択的に結合する;
(2-10) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、任意のアミノ酸、ロイシン、リシンであるとき、そのPPRモチーフは、Tに選択的に結合する;
(2-11) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、任意のアミノ酸、メチオニン、任意のアミノ酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
(2-12) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、任意のアミノ酸、メチオニン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
(2-13) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、イソロイシン、メチオニン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合し、次にCに対して結合する;
(2-14) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、任意のアミノ酸、アスパラギン、任意のアミノ酸であるとき、そのPPRモチーフは、C及びTに選択的に結合する;
(2-15) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、任意のアミノ酸、アスパラギン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
(2-16) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、フェニルアラニン、アスパラギン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
(2-17) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、グリシン、アスパラギン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
(2-18) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、イソロイシン、アスパラギン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
(2-19) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、トレオニン、アスパラギン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
(2-20) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、バリン、アスパラギン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合し、次にCに対して結合する;
(2-21) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、チロシン、アスパラギン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合し、次にCに対して結合する;
(2-22) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、任意のアミノ酸、アスパラギン、アスパラギンであるとき、そのPPRモチーフは、Cに選択的に結合する;
(2-23) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、イソロイシン、アスパラギン、アスパラギンであるとき、そのPPRモチーフは、Cに選択的に結合する;
(2-24) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、セリン、アスパラギン、アスパラギンであるとき、そのPPRモチーフは、Cに選択的に結合する;
(2-25) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、バリン、アスパラギン、アスパラギンであるとき、そのPPRモチーフは、Cに選択的に結合する;
(2-26) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、任意のアミノ酸、アスパラギン、セリンであるとき、そのPPRモチーフは、Cに選択的に結合する;
(2-27) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、バリン、アスパラギン、セリンであるとき、そのPPRモチーフは、Cに選択的に結合する;
(2-28) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、任意のアミノ酸、アスパラギン、トレオニンであるとき、そのPPRモチーフは、Cに選択的に結合する;
(2-29) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、バリン、アスパラギン、トレオニンであるとき、そのPPRモチーフは、Cに選択的に結合する;
(2-30) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、任意のアミノ酸、アスパラギン、トリプトファンであるとき、そのPPRモチーフは、Cに選択的に結合し、次にTに対して結合する;
(2-31) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、イソロイシン、アスパラギン、トリプトファンであるとき、そのPPRモチーフは、Tに選択的に結合し、次にCに対して結合する;
(2-32) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、任意のアミノ酸、プロリン、任意のアミノ酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
(2-33) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、任意のアミノ酸、プロリン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
(2-34) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、フェニルアラニン、プロリン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
(2-35) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、チロシン、プロリン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
(2-36) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、任意のアミノ酸、セリン、任意のアミノ酸であるとき、そのPPRモチーフは、A及びGに選択的に結合する;
(2-37) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、任意のアミノ酸、セリン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
(2-38) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、フェニルアラニン、セリン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
(2-39) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、バリン、セリン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
(2-40) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、任意のアミノ酸、トレオニン、任意のアミノ酸であるとき、そのPPRモチーフは、A及びGに選択的に結合する;
(2-41) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、任意のアミノ酸、トレオニン、アスパラギン酸であるとき、そのPPRモチーフは、Gに選択的に結合する;
(2-42) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、バリン、トレオニン、アスパラギン酸であるとき、そのPPRモチーフは、Gに選択的に結合する;
(2-43) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、任意のアミノ酸、トレオニン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
(2-44) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、フェニルアラニン、トレオニン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
(2-45) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、イソロイシン、トレオニン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
(2-46) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、バリン、トレオニン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
(2-47) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、任意のアミノ酸、バリン、任意のアミノ酸であるとき、そのPPRモチーフは、A、C及びTに結合するが、Gには結合しない;
(2-48) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、イソロイシン、バリン、アスパラギン酸であるとき、そのPPRモチーフは、Cに選択的に結合し、次にAに対して結合する;
(2-49) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、任意のアミノ酸、バリン、グリシンであるとき、そのPPRモチーフは、Cに選択的に結合する;
(2-50) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、任意のアミノ酸、バリン、トレオニンであるとき、そのPPRモチーフは、Tに選択的に結合する;に基づいて決定される、タンパク質であって、選択的なDNA塩基結合能を有する。
(2-1) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、任意のアミノ酸、グリシン、アスパラギン酸であるとき、そのPPRモチーフは、Gに選択的に結合する;
(2-2) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、グルタミン酸、グリシン、アスパラギン酸であるとき、そのPPRモチーフは、Gに選択的に結合する;
(2-3) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、任意のアミノ酸、グリシン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
(2-4) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、グルタミン酸、グリシン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
(2-5) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、任意のアミノ酸、グリシン、セリンであるとき、そのPPRモチーフは、Aに選択的に結合し、次にCに対して結合する;
(2-6) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、任意のアミノ酸、イソロイシン、任意のアミノ酸であるとき、そのPPRモチーフは、T及びCに選択的に結合する;
(2-7) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、任意のアミノ酸、イソロイシン、アスパラギンであるとき、そのPPRモチーフは、Tに選択的に結合し、次にCに対して結合する;
(2-8) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、任意のアミノ酸、ロイシン、任意のアミノ酸であるとき、そのPPRモチーフは、T及びCに選択的に結合する;
(2-9) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、任意のアミノ酸、ロイシン、アスパラギン酸であるとき、そのPPRモチーフは、Cに選択的に結合する;
(2-10) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、任意のアミノ酸、ロイシン、リシンであるとき、そのPPRモチーフは、Tに選択的に結合する;
(2-11) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、任意のアミノ酸、メチオニン、任意のアミノ酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
(2-12) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、任意のアミノ酸、メチオニン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
(2-13) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、イソロイシン、メチオニン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合し、次にCに対して結合する;
(2-14) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、任意のアミノ酸、アスパラギン、任意のアミノ酸であるとき、そのPPRモチーフは、C及びTに選択的に結合する;
(2-15) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、任意のアミノ酸、アスパラギン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
(2-16) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、フェニルアラニン、アスパラギン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
(2-17) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、グリシン、アスパラギン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
(2-18) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、イソロイシン、アスパラギン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
(2-19) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、トレオニン、アスパラギン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
(2-20) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、バリン、アスパラギン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合し、次にCに対して結合する;
(2-21) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、チロシン、アスパラギン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合し、次にCに対して結合する;
(2-22) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、任意のアミノ酸、アスパラギン、アスパラギンであるとき、そのPPRモチーフは、Cに選択的に結合する;
(2-23) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、イソロイシン、アスパラギン、アスパラギンであるとき、そのPPRモチーフは、Cに選択的に結合する;
(2-24) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、セリン、アスパラギン、アスパラギンであるとき、そのPPRモチーフは、Cに選択的に結合する;
(2-25) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、バリン、アスパラギン、アスパラギンであるとき、そのPPRモチーフは、Cに選択的に結合する;
(2-26) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、任意のアミノ酸、アスパラギン、セリンであるとき、そのPPRモチーフは、Cに選択的に結合する;
(2-27) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、バリン、アスパラギン、セリンであるとき、そのPPRモチーフは、Cに選択的に結合する;
(2-28) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、任意のアミノ酸、アスパラギン、トレオニンであるとき、そのPPRモチーフは、Cに選択的に結合する;
(2-29) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、バリン、アスパラギン、トレオニンであるとき、そのPPRモチーフは、Cに選択的に結合する;
(2-30) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、任意のアミノ酸、アスパラギン、トリプトファンであるとき、そのPPRモチーフは、Cに選択的に結合し、次にTに対して結合する;
(2-31) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、イソロイシン、アスパラギン、トリプトファンであるとき、そのPPRモチーフは、Tに選択的に結合し、次にCに対して結合する;
(2-32) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、任意のアミノ酸、プロリン、任意のアミノ酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
(2-33) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、任意のアミノ酸、プロリン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
(2-34) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、フェニルアラニン、プロリン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
(2-35) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、チロシン、プロリン、アスパラギン酸であるとき、そのPPRモチーフは、Tに選択的に結合する;
(2-36) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、任意のアミノ酸、セリン、任意のアミノ酸であるとき、そのPPRモチーフは、A及びGに選択的に結合する;
(2-37) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、任意のアミノ酸、セリン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
(2-38) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、フェニルアラニン、セリン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
(2-39) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、バリン、セリン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
(2-40) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、任意のアミノ酸、トレオニン、任意のアミノ酸であるとき、そのPPRモチーフは、A及びGに選択的に結合する;
(2-41) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、任意のアミノ酸、トレオニン、アスパラギン酸であるとき、そのPPRモチーフは、Gに選択的に結合する;
(2-42) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、バリン、トレオニン、アスパラギン酸であるとき、そのPPRモチーフは、Gに選択的に結合する;
(2-43) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、任意のアミノ酸、トレオニン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
(2-44) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、フェニルアラニン、トレオニン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
(2-45) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、イソロイシン、トレオニン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
(2-46) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、バリン、トレオニン、アスパラギンであるとき、そのPPRモチーフは、Aに選択的に結合する;
(2-47) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、任意のアミノ酸、バリン、任意のアミノ酸であるとき、そのPPRモチーフは、A、C及びTに結合するが、Gには結合しない;
(2-48) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、イソロイシン、バリン、アスパラギン酸であるとき、そのPPRモチーフは、Cに選択的に結合し、次にAに対して結合する;
(2-49) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、任意のアミノ酸、バリン、グリシンであるとき、そのPPRモチーフは、Cに選択的に結合する;
(2-50) A1、A4、及びLiiの3つのアミノ酸の組み合わせが、順に、任意のアミノ酸、バリン、トレオニンであるとき、そのPPRモチーフは、Tに選択的に結合する;に基づいて決定される、タンパク質であって、選択的なDNA塩基結合能を有する。
(3つのアミノ酸の特に好ましい組み合わせ)
RNA結合性のPPRモチーフにおいては、各塩基を認識して特異的に結合可能な、代表的な1番目、4番目、ii番目のアミノ酸の組み合わせがある。具体的には、アデニンを認識する組み合わせは、1番目がバリン、4番目がトレオニン、ii番目がアスパラギン、シトシンを認識する組み合わせは、1番目がバリン、4番目がアスパラギン、ii番目がセリン、グアニンを認識する組み合わせは、1番目がバリン、4番目がトレオニン、ii番目がアスパラギン酸、ウラシルを認識する組み合わせは、1番目がバリン、4番目がアスパラギン、ii番目がアスパラギン酸である(前掲非特許文献1~5)。本発明の好ましい態様の一つでは、これらの組み合わせが用いられる。
RNA結合性のPPRモチーフにおいては、各塩基を認識して特異的に結合可能な、代表的な1番目、4番目、ii番目のアミノ酸の組み合わせがある。具体的には、アデニンを認識する組み合わせは、1番目がバリン、4番目がトレオニン、ii番目がアスパラギン、シトシンを認識する組み合わせは、1番目がバリン、4番目がアスパラギン、ii番目がセリン、グアニンを認識する組み合わせは、1番目がバリン、4番目がトレオニン、ii番目がアスパラギン酸、ウラシルを認識する組み合わせは、1番目がバリン、4番目がアスパラギン、ii番目がアスパラギン酸である(前掲非特許文献1~5)。本発明の好ましい態様の一つでは、これらの組み合わせが用いられる。
(凝集性の改善)
本発明者らは、天然に存在する既存のPPRモチーフのアミノ酸情報から、PPRモチーフの6番目の位置のアミノ酸は疎水性(特にロイシン)、9番目の位置のアミノ酸は非親水性のアミノ酸(特にグリシン)である場合が非常に多いことを見出した。すでに結晶構造が得られているPPRタンパク質の構造(非特許文献6:Coquille et al., 2014 Nat. Commun.; PDB ID: 4PJQ, 4WN4, 4WSL, 4PJR; 非特許文献7:Shen et al., 2015 Nat. Commun., PDB ID: 5I9D, 5I9F, 5I9G, 5I9H)から、1モチーフ目(N末側)のそれら6番目、9番目は外側に露出するため、その露出した疎水性アミノ酸が原因で凝集性を示すと想像した(図1A)。一方で、2モチーフ目以降においては、6番目、9番目のアミノ酸は、タンパク質内に埋もれ、疎水性コアを形成するため、すべてのモチーフの6番目、9番目に親水性残基を入れるとタンパク質構造が崩壊する可能性があると考えた。そこで1モチーフ目のみ、6番目、好ましくは6番目及び9番目のアミノ酸を親水性のアミノ酸(アスパラギン、アスパラギン酸、グルタミン、グルタミン酸、リジン、アルギニン、セリン、トレオニン)にすることでPPRの凝集性を減少させることとした。
本発明者らは、天然に存在する既存のPPRモチーフのアミノ酸情報から、PPRモチーフの6番目の位置のアミノ酸は疎水性(特にロイシン)、9番目の位置のアミノ酸は非親水性のアミノ酸(特にグリシン)である場合が非常に多いことを見出した。すでに結晶構造が得られているPPRタンパク質の構造(非特許文献6:Coquille et al., 2014 Nat. Commun.; PDB ID: 4PJQ, 4WN4, 4WSL, 4PJR; 非特許文献7:Shen et al., 2015 Nat. Commun., PDB ID: 5I9D, 5I9F, 5I9G, 5I9H)から、1モチーフ目(N末側)のそれら6番目、9番目は外側に露出するため、その露出した疎水性アミノ酸が原因で凝集性を示すと想像した(図1A)。一方で、2モチーフ目以降においては、6番目、9番目のアミノ酸は、タンパク質内に埋もれ、疎水性コアを形成するため、すべてのモチーフの6番目、9番目に親水性残基を入れるとタンパク質構造が崩壊する可能性があると考えた。そこで1モチーフ目のみ、6番目、好ましくは6番目及び9番目のアミノ酸を親水性のアミノ酸(アスパラギン、アスパラギン酸、グルタミン、グルタミン酸、リジン、アルギニン、セリン、トレオニン)にすることでPPRの凝集性を減少させることとした。
具体的には、次のようにする。
特定の塩基配列を有する標的核酸と結合可能なタンパク質において、N末端から1番目のPPRモチーフ(M1)において:
(1)A6アミノ酸を、親水性アミノ酸、好ましくはA6アミノ酸を、アスパラギン又はアスパラギン酸とする。
(2)さらに、A9アミノ酸を、親水性アミノ酸又はグリシン、好ましくはグルタミン、グルタミン酸、リジン、又はグリシンとする。
(3)あるいは、A6アミノ酸及びA9アミノ酸を、下記のいずれかの組み合わせとする。
・A6アミノ酸がアスパラギンであり、かつA9アミノ酸がグルタミン酸である組み合わせ
・A6アミノ酸がアスパラギンであり、かつA9アミノ酸がグルタミンである組み合わせ
・A6アミノ酸がアスパラギンであり、かつA9アミノ酸がリジンである組み合わせ
・A6アミノ酸アスパラギン酸であり、かつA9アミノ酸がグリシンである組み合わせ
特定の塩基配列を有する標的核酸と結合可能なタンパク質において、N末端から1番目のPPRモチーフ(M1)において:
(1)A6アミノ酸を、親水性アミノ酸、好ましくはA6アミノ酸を、アスパラギン又はアスパラギン酸とする。
(2)さらに、A9アミノ酸を、親水性アミノ酸又はグリシン、好ましくはグルタミン、グルタミン酸、リジン、又はグリシンとする。
(3)あるいは、A6アミノ酸及びA9アミノ酸を、下記のいずれかの組み合わせとする。
・A6アミノ酸がアスパラギンであり、かつA9アミノ酸がグルタミン酸である組み合わせ
・A6アミノ酸がアスパラギンであり、かつA9アミノ酸がグルタミンである組み合わせ
・A6アミノ酸がアスパラギンであり、かつA9アミノ酸がリジンである組み合わせ
・A6アミノ酸アスパラギン酸であり、かつA9アミノ酸がグリシンである組み合わせ
(新規PPRモチーフ)
本発明は、上記により見出された、凝集性の改善された新規なPPRモチーフ、及びそれを含む新規なPPRタンパク質を提供する。
本発明は、上記により見出された、凝集性の改善された新規なPPRモチーフ、及びそれを含む新規なPPRタンパク質を提供する。
本発明により提供される新規なPPRモチーフは、下記のものである。
(C-1)配列番号:4~7のいずれか1の配列からなるPPRモチーフ;
(C-2)配列番号:4~7のいずれか1の配列において、位置1、4、6、及び34のアミノ酸以外のアミノ酸の1~9個を置換、欠失、又は付加した配列からなり、かつシトシン結合性であるPPRモチーフ;
(C-3)配列番号:4~7のいずれか1の配列と少なくとも80%の配列同一性を有し、ただし位置1、4、6、及び34のアミノ酸は同一であり、かつシトシン結合性であるPPRモチーフ;
(A-1)配列番号:8の配列からなるPPRモチーフにおいて、位置6のアミノ酸をアスパラギン又はアスパラギン酸に置換したPPRモチーフ;
(A-2)(A-1)の配列において、位置1、4、6、及び34のアミノ酸以外のアミノ酸の1~9個を置換、欠失、又は付加した配列からなり、かつアデニン結合性であるPPRモチーフ;
(A-3)(A-1)の配列と少なくとも80%の配列同一性を有し、ただし位置1、4、6、及び34のアミノ酸は同一であり、かつアデニン結合性であるPPRモチーフ;
(G-1)配列番号:9の配列からなるPPRモチーフにおいて、位置6のアミノ酸をアスパラギン又はアスパラギン酸に置換したPPRモチーフ;
(G-2)(G-1)の配列において、位置1、4、6、及び34のアミノ酸以外のアミノ酸の1~9個を置換、欠失、又は付加した配列からなり、かつグアニン結合性であるPPRモチーフ;
(G-3)(G-1)の配列と少なくとも80%の配列同一性を有し、ただし位置1、4、6、及び34のアミノ酸は同一であり、かつグアニン結合性であるPPRモチーフ;
(U-1)配列番号:10の配列からなるPPRモチーフにおいて、位置6のアミノ酸をアスパラギン又はアスパラギン酸に置換したPPRモチーフ;
(U-2)(U-1)の配列において、位置1、4、6、及び34のアミノ酸以外のアミノ酸の1~9個を置換、欠失、又は付加した配列からなり、かつウラシル結合性であるPPRモチーフ;
(U-3)(U-1)の配列と少なくとも80%の配列同一性を有し、ただし位置1、4、6、及び34のアミノ酸は同一であり、かつウラシル結合性であるPPRモチーフ。
(C-1)配列番号:4~7のいずれか1の配列からなるPPRモチーフ;
(C-2)配列番号:4~7のいずれか1の配列において、位置1、4、6、及び34のアミノ酸以外のアミノ酸の1~9個を置換、欠失、又は付加した配列からなり、かつシトシン結合性であるPPRモチーフ;
(C-3)配列番号:4~7のいずれか1の配列と少なくとも80%の配列同一性を有し、ただし位置1、4、6、及び34のアミノ酸は同一であり、かつシトシン結合性であるPPRモチーフ;
(A-1)配列番号:8の配列からなるPPRモチーフにおいて、位置6のアミノ酸をアスパラギン又はアスパラギン酸に置換したPPRモチーフ;
(A-2)(A-1)の配列において、位置1、4、6、及び34のアミノ酸以外のアミノ酸の1~9個を置換、欠失、又は付加した配列からなり、かつアデニン結合性であるPPRモチーフ;
(A-3)(A-1)の配列と少なくとも80%の配列同一性を有し、ただし位置1、4、6、及び34のアミノ酸は同一であり、かつアデニン結合性であるPPRモチーフ;
(G-1)配列番号:9の配列からなるPPRモチーフにおいて、位置6のアミノ酸をアスパラギン又はアスパラギン酸に置換したPPRモチーフ;
(G-2)(G-1)の配列において、位置1、4、6、及び34のアミノ酸以外のアミノ酸の1~9個を置換、欠失、又は付加した配列からなり、かつグアニン結合性であるPPRモチーフ;
(G-3)(G-1)の配列と少なくとも80%の配列同一性を有し、ただし位置1、4、6、及び34のアミノ酸は同一であり、かつグアニン結合性であるPPRモチーフ;
(U-1)配列番号:10の配列からなるPPRモチーフにおいて、位置6のアミノ酸をアスパラギン又はアスパラギン酸に置換したPPRモチーフ;
(U-2)(U-1)の配列において、位置1、4、6、及び34のアミノ酸以外のアミノ酸の1~9個を置換、欠失、又は付加した配列からなり、かつウラシル結合性であるPPRモチーフ;
(U-3)(U-1)の配列と少なくとも80%の配列同一性を有し、ただし位置1、4、6、及び34のアミノ酸は同一であり、かつウラシル結合性であるPPRモチーフ。
このようなPPRモチーフのうち、特に好ましいものは、下記のものである。
(C-1)配列番号:4~7のいずれか1の配列からなるPPRモチーフ;
(C-2)配列番号:4~7のいずれか1の配列において、位置1、4、6、9、及び34のアミノ酸以外のアミノ酸の1~9個を置換、欠失、又は付加した配列からなり、かつシトシン結合性であるPPRモチーフ;
(C-3)配列番号:4~7のいずれか1の配列と少なくとも80%の配列同一性を有し、ただし位置1、4、6、9、及び34のアミノ酸は同一であり、かつシトシン結合性であるPPRモチーフ;
(A-1)配列番号:8の配列において、位置6及び9のアミノ酸を、下記に定義した組み合わせのいずれか1つを満たすように置換したPPRモチーフ;
(A-2)(A-1)の配列において、位置1、4、6、9、及び34のアミノ酸以外のアミノ酸の1~9個を置換、欠失、又は付加した配列からなり、かつアデニン結合性であるPPRモチーフ;
(A-3)(A-1)の配列と少なくとも80%の配列同一性を有し、ただし位置1、4、6、9、及び34のアミノ酸は同一であり、かつアデニン結合性であるPPRモチーフ;
(G-1)配列番号:9の配列において、位置6及び9のアミノ酸を、下記に定義した組み合わせのいずれか1つを満たすように置換した配列からなるPPRモチーフ;
(G-2)(G-1)の配列において、位置1、4、6、9、及び34のアミノ酸以外のアミノ酸の1~9個を置換、欠失、又は付加した配列からなり、かつグアニン結合性であるPPRモチーフ;
(G-3)(G-1)の配列と少なくとも80%の配列同一性を有し、ただし位置1、4、6、9、及び34のアミノ酸は同一であり、かつグアニン結合性であるPPRモチーフ;
(U-1)配列番号:10の配列において、位置6及び9のアミノ酸を、下記に定義した組み合わせのいずれか1つを満たすように置換した配列からなるPPRモチーフ;
(U-2)(U-1)の配列において、位置1、4、6、9、及び34のアミノ酸以外のアミノ酸の1~9個を置換、欠失、又は付加した配列からなり、かつウラシル結合性であるPPRモチーフ;
(U-3)(U-1)の配列と少なくとも80%の配列同一性を有し、ただし位置1、4、6、9、及び34のアミノ酸は同一であり、かつウラシル結合性であるPPRモチーフ。
・位置6のアミノ酸がアスパラギンであり、かつ位置9のアミノ酸がグルタミン酸である組み合わせ
・位置6のアミノ酸がアスパラギンであり、かつ位置9のアミノ酸がグルタミンである組み合わせ
・位置6のアミノ酸がアスパラギンであり、かつ位置9のアミノ酸がリジンである組み合わせ
・位置6のアミノ酸アスパラギン酸であり、かつ位置9アミノ酸がグリシンである組み合わせ
(C-1)配列番号:4~7のいずれか1の配列からなるPPRモチーフ;
(C-2)配列番号:4~7のいずれか1の配列において、位置1、4、6、9、及び34のアミノ酸以外のアミノ酸の1~9個を置換、欠失、又は付加した配列からなり、かつシトシン結合性であるPPRモチーフ;
(C-3)配列番号:4~7のいずれか1の配列と少なくとも80%の配列同一性を有し、ただし位置1、4、6、9、及び34のアミノ酸は同一であり、かつシトシン結合性であるPPRモチーフ;
(A-1)配列番号:8の配列において、位置6及び9のアミノ酸を、下記に定義した組み合わせのいずれか1つを満たすように置換したPPRモチーフ;
(A-2)(A-1)の配列において、位置1、4、6、9、及び34のアミノ酸以外のアミノ酸の1~9個を置換、欠失、又は付加した配列からなり、かつアデニン結合性であるPPRモチーフ;
(A-3)(A-1)の配列と少なくとも80%の配列同一性を有し、ただし位置1、4、6、9、及び34のアミノ酸は同一であり、かつアデニン結合性であるPPRモチーフ;
(G-1)配列番号:9の配列において、位置6及び9のアミノ酸を、下記に定義した組み合わせのいずれか1つを満たすように置換した配列からなるPPRモチーフ;
(G-2)(G-1)の配列において、位置1、4、6、9、及び34のアミノ酸以外のアミノ酸の1~9個を置換、欠失、又は付加した配列からなり、かつグアニン結合性であるPPRモチーフ;
(G-3)(G-1)の配列と少なくとも80%の配列同一性を有し、ただし位置1、4、6、9、及び34のアミノ酸は同一であり、かつグアニン結合性であるPPRモチーフ;
(U-1)配列番号:10の配列において、位置6及び9のアミノ酸を、下記に定義した組み合わせのいずれか1つを満たすように置換した配列からなるPPRモチーフ;
(U-2)(U-1)の配列において、位置1、4、6、9、及び34のアミノ酸以外のアミノ酸の1~9個を置換、欠失、又は付加した配列からなり、かつウラシル結合性であるPPRモチーフ;
(U-3)(U-1)の配列と少なくとも80%の配列同一性を有し、ただし位置1、4、6、9、及び34のアミノ酸は同一であり、かつウラシル結合性であるPPRモチーフ。
・位置6のアミノ酸がアスパラギンであり、かつ位置9のアミノ酸がグルタミン酸である組み合わせ
・位置6のアミノ酸がアスパラギンであり、かつ位置9のアミノ酸がグルタミンである組み合わせ
・位置6のアミノ酸がアスパラギンであり、かつ位置9のアミノ酸がリジンである組み合わせ
・位置6のアミノ酸アスパラギン酸であり、かつ位置9アミノ酸がグリシンである組み合わせ
配列番号:4~10の具体的な配列は、図1、及び配列表に示されている。
このようなPPRモチーフのうち、さらに好ましいものは、下記のものである。
(C-4)配列番号:4の配列からなるPPRモチーフ;
(A-4)配列番号:58の配列からなるPPRモチーフ;
(G-4)配列番号:59の配列からなるPPRモチーフ;
(U-4)配列番号:60の配列からなるPPRモチーフ。
(C-4)配列番号:4の配列からなるPPRモチーフ;
(A-4)配列番号:58の配列からなるPPRモチーフ;
(G-4)配列番号:59の配列からなるPPRモチーフ;
(U-4)配列番号:60の配列からなるPPRモチーフ。
配列番号:58~60の配列は、下記、及び配列表に示されている。
配列番号:58の配列 VTYTTNIDQLCKAGKVDEALELFKEMRSKGVKPNV
配列番号:59の配列 VTYTTNIDQLCKAGKVDEALELFDEMKERGIKPDV
配列番号:60の配列 VTYNTNIDQLCKAGRLDEAEELLEEMEEKGIKPDV
配列番号:58の配列 VTYTTNIDQLCKAGKVDEALELFKEMRSKGVKPNV
配列番号:59の配列 VTYTTNIDQLCKAGKVDEALELFDEMKERGIKPDV
配列番号:60の配列 VTYNTNIDQLCKAGRLDEAEELLEEMEEKGIKPDV
(凝集性が改善されたPPRタンパク質)
本発明はまた、上記により見出された、凝集性が改善されたPPRタンパク質を提供する。
本発明はまた、上記により見出された、凝集性が改善されたPPRタンパク質を提供する。
好ましい態様の一つでは、M1のA9アミノ酸は、M1 の他のアミノ酸がいずれの場合であっても、またM1以外のモチーフのアミノ酸配列がいずれの場合であっても、非疎水性アミノ酸又はグリシンである。非疎水性アミノ酸は、親水性アミノ酸、又はシステイン、若しくはヒスチジンであり;好ましくは親水性アミノ酸、すなわちアルギニン、アスパラギン、アスパラギン酸、グルタミン酸、グルタミン、リジン、セリン、又はトレオニンであり;より好ましくはグルタミン、グルタミン酸、リジンである。
好ましい態様の一つでは、M1のA9アミノ酸は、M1 の他のアミノ酸がいずれの場合であっても、またM1以外のモチーフのアミノ酸配列がいずれの場合であっても、グルタミン、グルタミン酸、リジン、又はグリシンである。
好ましい態様の一つでは、M1のA6アミノ酸は、M1 の他のアミノ酸がいずれの場合であっても、またM1以外のモチーフのアミノ酸配列がいずれの場合であっても、非疎水性アミノ酸である。非疎水性アミノ酸は、例えば親水性アミノ酸、又はシステイン、若しくはヒスチジンであり;好ましくは親水性アミノ酸、すなわちアルギニン、アスパラギン、アスパラギン酸、グルタミン酸、グルタミン、リジン、セリン、又はトレオニンであり;より好ましくはアスパラギン、又はアスパラギン酸である。
特に好ましい態様の一つでは、M1のA6アミノ酸及びA9アミノ酸は、M1 の他のアミノ酸がいずれの場合であっても、またM1以外のモチーフのアミノ酸配列がいずれの場合であっても、下記のいずれかの組み合わせである:
・A6アミノ酸がアスパラギンであり、かつA9アミノ酸がグルタミン酸である組み合わせ
・A6アミノ酸がアスパラギンであり、かつA9アミノ酸がグルタミンである組み合わせ
・A6アミノ酸がアスパラギンであり、かつA9アミノ酸がリジンである組み合わせ
・A6アミノ酸アスパラギン酸であり、かつA9アミノ酸がグリシンである組み合わせ
・A6アミノ酸がアスパラギンであり、かつA9アミノ酸がグルタミン酸である組み合わせ
・A6アミノ酸がアスパラギンであり、かつA9アミノ酸がグルタミンである組み合わせ
・A6アミノ酸がアスパラギンであり、かつA9アミノ酸がリジンである組み合わせ
・A6アミノ酸アスパラギン酸であり、かつA9アミノ酸がグリシンである組み合わせ
RNA結合性のタンパク質の好ましい態様の一つでは、M1のA6アミノ酸及びA9アミノ酸が上記の条件を満たし、かつ含まれるPPRモチーフの少なくとも一つ、好ましくは半数以上、より好ましくはすべてが、下記のいずれかを満たす:
・結合する塩基がシトシンである場合は、A1がバリンであり、A4がアスパラギンであり、かつAiiがセリンである
・結合する塩基がアデニンである場合は、A1がバリンであり、A4がトレオニンであり、かつAiiがアスパラギンである
・結合する塩基がグアニンである場合は、A1がバリンであり、A4がトレオニンであり、Aiiがアスパラギン酸である
・結合する塩基がウラシル又はチミンである場合は、A1がバリンであり、A4がアスパラギンであり、Aiiがアスパラギン酸である
・結合する塩基がシトシンである場合は、A1がバリンであり、A4がアスパラギンであり、かつAiiがセリンである
・結合する塩基がアデニンである場合は、A1がバリンであり、A4がトレオニンであり、かつAiiがアスパラギンである
・結合する塩基がグアニンである場合は、A1がバリンであり、A4がトレオニンであり、Aiiがアスパラギン酸である
・結合する塩基がウラシル又はチミンである場合は、A1がバリンであり、A4がアスパラギンであり、Aiiがアスパラギン酸である
RNA結合性のタンパク質の好ましい態様の一つでは、M1は上述した新規なPPRモチーフである。
特に好ましい態様の一つでは、M1が、下記のいずれか1つのポリペプチドからなるPPRモチーフであり、
・結合する塩基がシトシンである場合は、SEQ ID NOs:4-7のいずれか1の配列からなるポリペプチド
・結合する塩基がアデニンである場合は、SEQ ID NO:8の配列において、位置6及び9のアミノ酸を、次の段落に定義した組み合わせのいずれか1つを満たすように置換したポリペプチド
・結合する塩基がグアニンである場合は、SEQ ID NO:9の配列において、位置6及び9のアミノ酸を、次の段落に定義した組み合わせのいずれか1つを満たすように置換したポリペプチド
・結合する塩基がウラシルである場合は、SEQ ID NO:10の配列において、位置6及び9のアミノ酸を、次の段落に定義した組み合わせのいずれか1つを満たすように置換したポリペプチド
M1以外のPPRモチーフの少なくとも一つが、下記のいずれか1つのポリペプチドからなるPPRモチーフである:
・結合する塩基がシトシンである場合は、SEQ ID NO:2の配列からなるポリペプチド
・結合する塩基がアデニンである場合は、SEQ ID NO:8の配列からなるポリペプチド
・結合する塩基がグアニンである場合は、SEQ ID NO:9の配列からなるポリペプチド
・結合する塩基がウラシルである場合は、SEQ ID NO:10の配列からなるポリペプチド
・結合する塩基がシトシンである場合は、SEQ ID NOs:4-7のいずれか1の配列からなるポリペプチド
・結合する塩基がアデニンである場合は、SEQ ID NO:8の配列において、位置6及び9のアミノ酸を、次の段落に定義した組み合わせのいずれか1つを満たすように置換したポリペプチド
・結合する塩基がグアニンである場合は、SEQ ID NO:9の配列において、位置6及び9のアミノ酸を、次の段落に定義した組み合わせのいずれか1つを満たすように置換したポリペプチド
・結合する塩基がウラシルである場合は、SEQ ID NO:10の配列において、位置6及び9のアミノ酸を、次の段落に定義した組み合わせのいずれか1つを満たすように置換したポリペプチド
M1以外のPPRモチーフの少なくとも一つが、下記のいずれか1つのポリペプチドからなるPPRモチーフである:
・結合する塩基がシトシンである場合は、SEQ ID NO:2の配列からなるポリペプチド
・結合する塩基がアデニンである場合は、SEQ ID NO:8の配列からなるポリペプチド
・結合する塩基がグアニンである場合は、SEQ ID NO:9の配列からなるポリペプチド
・結合する塩基がウラシルである場合は、SEQ ID NO:10の配列からなるポリペプチド
上記の段落でいう組み合わせは、下記のいずれかである:
・A6アミノ酸がアスパラギンであり、かつA9アミノ酸がグルタミン酸である組み合わせ
・A6アミノ酸がアスパラギンであり、かつA9アミノ酸がグルタミンである組み合わせ
・A6アミノ酸がアスパラギンであり、かつA9アミノ酸がリジンである組み合わせ
・A6アミノ酸アスパラギン酸であり、かつA9アミノ酸がグリシンである組み合わせ
・A6アミノ酸がアスパラギンであり、かつA9アミノ酸がグルタミン酸である組み合わせ
・A6アミノ酸がアスパラギンであり、かつA9アミノ酸がグルタミンである組み合わせ
・A6アミノ酸がアスパラギンであり、かつA9アミノ酸がリジンである組み合わせ
・A6アミノ酸アスパラギン酸であり、かつA9アミノ酸がグリシンである組み合わせ
特に好ましい態様の一つでは、M1が、下記のいずれか1つのポリペプチドからなるPPRモチーフであり、
・結合する塩基がシトシンである場合は、SEQ ID NOs:4の配列からなるポリペプチド
・結合する塩基がアデニンである場合は、SEQ ID NO:58の配列からなるポリペプチド
・結合する塩基がグアニンである場合は、SEQ ID NO:59の配列からなるポリペプチド
・結合する塩基がウラシルである場合は、SEQ ID NO:60の配列からなるポリペプチド
M1以外のPPRモチーフの少なくとも一つが、下記のいずれか1つのポリペプチドからなるPPRモチーフである:
・結合する塩基がシトシンである場合は、SEQ ID NO:2の配列からなるポリペプチド
・結合する塩基がアデニンである場合は、SEQ ID NO:8の配列において、位置15のアミノ酸のリジンへの置換を行った配列からなるポリペプチド
・結合する塩基がグアニンである場合は、SEQ ID NO:9の配列からなるポリペプチド
・結合する塩基がウラシルである場合は、SEQ ID NO:10の配列からなるポリペプチド
・結合する塩基がシトシンである場合は、SEQ ID NOs:4の配列からなるポリペプチド
・結合する塩基がアデニンである場合は、SEQ ID NO:58の配列からなるポリペプチド
・結合する塩基がグアニンである場合は、SEQ ID NO:59の配列からなるポリペプチド
・結合する塩基がウラシルである場合は、SEQ ID NO:60の配列からなるポリペプチド
M1以外のPPRモチーフの少なくとも一つが、下記のいずれか1つのポリペプチドからなるPPRモチーフである:
・結合する塩基がシトシンである場合は、SEQ ID NO:2の配列からなるポリペプチド
・結合する塩基がアデニンである場合は、SEQ ID NO:8の配列において、位置15のアミノ酸のリジンへの置換を行った配列からなるポリペプチド
・結合する塩基がグアニンである場合は、SEQ ID NO:9の配列からなるポリペプチド
・結合する塩基がウラシルである場合は、SEQ ID NO:10の配列からなるポリペプチド
(性能の高いPPRモチーフの骨格の利用)
本発明の好ましい態様の一つでは、シトシン、アデニン、グアニン、ウラシル(又はチミン)それぞれに対するPPRモチーフにおいて、1、4、6、9、ii番目以外のアミノ酸を、特定のアミノ酸とすることができる。詳細には、シロイヌナズナのPPRモチーフ配列のうち、位置1、4、及びiiのアミノ酸の組み合わせがアデニンを認識するPPRモチーフのためにはVTN、シトシンを認識するPPRモチーフのためにはVSN、グアニンを認識するPPRモチーフのためにはVTD、ウラシルを認識するPPRモチーフのためにはVNDであるものを収集し、各位置に出現するアミノ酸の種類及びその数をまとめたときに、各位置において高頻度で出現するアミノ酸を選択することで、PPRモチーフの性能を高めることができる。
本発明の好ましい態様の一つでは、シトシン、アデニン、グアニン、ウラシル(又はチミン)それぞれに対するPPRモチーフにおいて、1、4、6、9、ii番目以外のアミノ酸を、特定のアミノ酸とすることができる。詳細には、シロイヌナズナのPPRモチーフ配列のうち、位置1、4、及びiiのアミノ酸の組み合わせがアデニンを認識するPPRモチーフのためにはVTN、シトシンを認識するPPRモチーフのためにはVSN、グアニンを認識するPPRモチーフのためにはVTD、ウラシルを認識するPPRモチーフのためにはVNDであるものを収集し、各位置に出現するアミノ酸の種類及びその数をまとめたときに、各位置において高頻度で出現するアミノ酸を選択することで、PPRモチーフの性能を高めることができる。
1、4、6、9、ii番目以外のアミノ酸を、上述のように高頻度でみられるアミノ酸とするとの観点からは、RNA結合性のPPRタンパク質を得るためには、下記のPPRモチーフのアミノ酸配列を参考にすることができる。
シトシンに対応するPPRモチーフとしては、SEQ ID NOs:4-7のいずれか1の配列からなるPPRモチーフ;
アデニンに対応するPPRモチーフとしては、SEQ ID NO:8のいずれか1の配列からなるPPRモチーフ;
グアニンに対応するPPRモチーフとしては、SEQ ID NO:9のいずれか1の配列からなるPPRモチーフ;
ウラシルに対応するPPRモチーフとしては、SEQ ID NO:10のいずれか1の配列からなるPPRモチーフ。
シトシンに対応するPPRモチーフとしては、SEQ ID NOs:4-7のいずれか1の配列からなるPPRモチーフ;
アデニンに対応するPPRモチーフとしては、SEQ ID NO:8のいずれか1の配列からなるPPRモチーフ;
グアニンに対応するPPRモチーフとしては、SEQ ID NO:9のいずれか1の配列からなるPPRモチーフ;
ウラシルに対応するPPRモチーフとしては、SEQ ID NO:10のいずれか1の配列からなるPPRモチーフ。
(用語の説明等)
本発明で塩基配列(ヌクレオチド配列ということもある。)又はアミノ酸配列に関し「同一性」というときは、特に記載した場合を除き、2つの配列を最適の態様で整列させた場合に、2つの配列間で共有する一致した塩基又はアミノ酸の個数の百分率を意味する。すなわち、同一性=(一致した位置の数/位置の全数)×100で算出でき、市販されているアルゴリズムを用いて計算することができる。また、このようなアルゴリズムは、Altschul et al., J.Mol.Biol. 215(1990) 403-410に記載されるNBLAST及びXBLASTプログラム中に組込まれている。より詳細には、塩基配列又はアミノ酸配列の同一性に関する検索・解析は、当業者には周知のアルゴリズム又はプログラム(例えば、BLASTN、BLASTP、BLASTX、ClustalW)により行うことができる。プログラムを用いる場合のパラメーターは、当業者であれば適切に設定することができ、また各プログラムのデフォルトパラメーターを用いてもよい。これらの解析方法の具体的な手法もまた、当業者には周知である。
本発明で塩基配列(ヌクレオチド配列ということもある。)又はアミノ酸配列に関し「同一性」というときは、特に記載した場合を除き、2つの配列を最適の態様で整列させた場合に、2つの配列間で共有する一致した塩基又はアミノ酸の個数の百分率を意味する。すなわち、同一性=(一致した位置の数/位置の全数)×100で算出でき、市販されているアルゴリズムを用いて計算することができる。また、このようなアルゴリズムは、Altschul et al., J.Mol.Biol. 215(1990) 403-410に記載されるNBLAST及びXBLASTプログラム中に組込まれている。より詳細には、塩基配列又はアミノ酸配列の同一性に関する検索・解析は、当業者には周知のアルゴリズム又はプログラム(例えば、BLASTN、BLASTP、BLASTX、ClustalW)により行うことができる。プログラムを用いる場合のパラメーターは、当業者であれば適切に設定することができ、また各プログラムのデフォルトパラメーターを用いてもよい。これらの解析方法の具体的な手法もまた、当業者には周知である。
本明細書において、塩基配列又はアミノ酸配列に関し、同一性がある(又は同一性が高い)というときは、特に記載した場合を除き、いずれの場合も少なくとも、70%、好ましくは80%以上、より好ましくは85%以上、さらに好ましくは90%以上、さらに好ましくは95%以上、さらに好ましくは97.5%以上さらに好ましくは99%以上の同一性がある場合を指す。
また、本発明でPPRモチーフ又はタンパク質に関し、「置換、欠失、又は付加した配列」というときの置換等されるアミノ酸の個数は、特に記載した場合を除き、いずれのモチーフ又はタンパク質においても、そのアミノ酸配列からなるモチーフ又はタンパク質が所望の機能を有する限り特に限定されないが、1~9個又は1~4個程度であるか、性質の似たアミノ酸への置換であれば、さらに多くの個数の置換等がありうる。このようなアミノ酸配列に係るポリヌクレオチド又はタンパク質を調製するための手段は、当業者にはよく知られている。
性質の似たアミノ酸とは、ハイドロパシー、荷電、pKa、溶解性等の物性が似ているアミノ酸をいい、例えば、次のようなものを指す。
疎水性アミノ酸;アラニン、バリン、グリシン、イソロイシン、ロイシン、フェニルアラニン、プロリン、トリプトファン、チロシン
非疎水性アミノ酸;アルギニン、アスパラギン、アスパラギン酸、グルタミン酸、グルタミン、リジン、セリン、トレオニン、システイン、ヒスチジン;
親水性アミノ酸;アルギニン、アスパラギン、アスパラギン酸、グルタミン酸、グルタミン、リジン、セリン、トレオニン;
酸性アミノ酸:アスパラギン酸、グルタミン酸;
塩基性アミノ酸:リジン、アルギニン、ヒスチジン;
中性アミノ酸:アラニン、アスパラギン、システイン、グルタミン、グリシン、イソロイシン、ロイシン、メチオニン、フェニルアラニン、プロリン、セリン、トレオニン、トリプトファン、チロシン、バリン;
含硫アミノ酸:メチオニン、システイン;
含芳香環アミノ酸:チロシン、トリプトファン、フェニルアラニン。
疎水性アミノ酸;アラニン、バリン、グリシン、イソロイシン、ロイシン、フェニルアラニン、プロリン、トリプトファン、チロシン
非疎水性アミノ酸;アルギニン、アスパラギン、アスパラギン酸、グルタミン酸、グルタミン、リジン、セリン、トレオニン、システイン、ヒスチジン;
親水性アミノ酸;アルギニン、アスパラギン、アスパラギン酸、グルタミン酸、グルタミン、リジン、セリン、トレオニン;
酸性アミノ酸:アスパラギン酸、グルタミン酸;
塩基性アミノ酸:リジン、アルギニン、ヒスチジン;
中性アミノ酸:アラニン、アスパラギン、システイン、グルタミン、グリシン、イソロイシン、ロイシン、メチオニン、フェニルアラニン、プロリン、セリン、トレオニン、トリプトファン、チロシン、バリン;
含硫アミノ酸:メチオニン、システイン;
含芳香環アミノ酸:チロシン、トリプトファン、フェニルアラニン。
遺伝子、核酸、ポリヌクレオチド、タンパク質、及びモチーフ等に関し、「作製」は、「生産」又は「製造」と言い換えることができる。また遺伝子等に関し、パーツを組み合わせて作製する場合に、「構築」ということがあるが、「構築」も、「生産」又は「製造」と言い換えることができる。
本発明のPPRモチーフ、それを含むタンパク質、又はそれらをコードする核酸は、当業者であれば、従来技術、及び本明細書の実施例の項の記載を利用して製造することができる。
[PPRタンパク質の特徴、用途]
(PPRタンパク質凝集性の改善)
本発明の新規 PPRモチーフを用いて作製したPPRタンパク質は、細胞内での凝集性が減少されている。PPRタンパク質の凝集性は、当業者であれば、PPRタンパク質を細胞内で発現させ、凝集の有無を確認することにより、評価できる。確認は、PPRタンパク質を蛍光タンパク質と融合させて発現すれば、より容易である。本発明者らの検討によると、PPRタンパク質の一番目のモチーフにおけるアミノ酸の適切な改変により、PPRタンパク質の細胞内での凝集性が改善され、核への移行性が向上している。
(PPRタンパク質凝集性の改善)
本発明の新規 PPRモチーフを用いて作製したPPRタンパク質は、細胞内での凝集性が減少されている。PPRタンパク質の凝集性は、当業者であれば、PPRタンパク質を細胞内で発現させ、凝集の有無を確認することにより、評価できる。確認は、PPRタンパク質を蛍光タンパク質と融合させて発現すれば、より容易である。本発明者らの検討によると、PPRタンパク質の一番目のモチーフにおけるアミノ酸の適切な改変により、PPRタンパク質の細胞内での凝集性が改善され、核への移行性が向上している。
(結合力)
本発明の新規 PPRモチーフを用いて作製したPPRタンパク質は、細胞内での凝集性が減少されているのみならず、同じ標的RNAに対する既存のPPRモチーフを用いて作製したPPRタンパク質と同等、又はそれより高いRNA結合性能を有しうる。同等とは、55%以上であることをいい、好ましくは75%程度であることをいう。
本発明の新規 PPRモチーフを用いて作製したPPRタンパク質は、細胞内での凝集性が減少されているのみならず、同じ標的RNAに対する既存のPPRモチーフを用いて作製したPPRタンパク質と同等、又はそれより高いRNA結合性能を有しうる。同等とは、55%以上であることをいい、好ましくは75%程度であることをいう。
標的配列に対する結合力は、EMSA(Electrophoretic Mobility Shift Assay)やBiacoreを用いた方法によって評価することができる。EMSAは、タンパク質と核酸が結合したサンプルを電気泳動した際、核酸分子の移動度が結合していない場合と比較して変化する性質を利用する方法である。Biacoreに代表される分子間相互作用解析機器は、反応速度論的解析ができるため、詳細なタンパク質-核酸結合解析が可能である。
標的配列に対する結合力はまた、固相化された標的核酸に、候補タンパク質を含む溶液を供し、標的核酸に結合したタンパク質を検出又は定量することによっても解析できる。この方法は、ELISA (Enzyme-Linked Immuno Sorbent Assay)を応用したものであることから、RPB-ELISA (RNA-protein binding ELISA)法と称することがある。固相化された標的核酸に、候補タンパク質を含む溶液を供する工程は、具体的には、プレートに固定された標的核酸分子に、対象結合タンパク質を含む溶液を流すことにより実施できる。標的核酸分子の固定化は、既存の種々の固定化方法が利用でき、例えばストレプトアビジンがコーティングされたウェルプレートに対して、ビオチン修飾した標的核酸分子を含む核酸プローブを与えることにより達成できる。詳細な実験条件は、本発明の実施例の項に詳述した実験方法を参考にすることができる。RPB-ELISAでは、対象PPRタンパク質とその標的RNAを加えたサンプルの発光量から、バックグラウンドシグナル(標的RNAを加えずに対象PPRタンパク質を加えた際の発光シグナル値)を差し引いた値を対象PPRタンパク質とその標的RNAとの結合力とすることができる。
[PPRタンパク質の利用]
(複合体、融合タンパク質)
本発明により提供されるPPRモチーフ又はPPRタンパク質は、機能性領域を連結し、複合体とすることができる。また、タンパク質性の機能性領域を連結し、融合タンパク質とすることができる。機能性領域とは、生体内又は細胞内で特定の生物学的機能、例えば酵素機能、触媒機能、阻害機能、亢進機能などの機能を有する部分、又は標識としての機能を有する部分をいう。そのような領域は、例えば、タンパク質、ペプチド、核酸、生理活性物質、薬剤からなる。なお、以下では、本発明を、複合体に関し、融合タンパク質を例に説明することがあるが、当業者であれば、その説明に準じて、融合タンパク質以外の複合体の場合についても理解することができる。
(複合体、融合タンパク質)
本発明により提供されるPPRモチーフ又はPPRタンパク質は、機能性領域を連結し、複合体とすることができる。また、タンパク質性の機能性領域を連結し、融合タンパク質とすることができる。機能性領域とは、生体内又は細胞内で特定の生物学的機能、例えば酵素機能、触媒機能、阻害機能、亢進機能などの機能を有する部分、又は標識としての機能を有する部分をいう。そのような領域は、例えば、タンパク質、ペプチド、核酸、生理活性物質、薬剤からなる。なお、以下では、本発明を、複合体に関し、融合タンパク質を例に説明することがあるが、当業者であれば、その説明に準じて、融合タンパク質以外の複合体の場合についても理解することができる。
好ましい態様の一つでは、機能性領域はリボヌクレアーゼ(RNase)である。RNaseの例は、RNase A(例えば、bovine pancreatic ribonuclease A: PDB 2AAS)、RNase Hである。
好ましい態様の一つでは、機能性領域は蛍光タンパク質である。蛍光タンパク質の例は、mCherry、EGFP、GFP、Sirius、EBFP、ECFP、mTurquoise、TagCFP、AmCyan、mTFP1、MidoriishiCyan、CFP、TurboGFP、AcGFP、TagGFP、Azami-Green、ZsGreen、EmGFP、HyPer、TagYFP、EYFP、Venus、YFP、PhiYFP、PhiYFP-m、TurboYFP、ZsYellow、mBanana、KusabiraOrange、mOrange、TurboRFP、DsRed-Express、DsRed2、TagRFP、DsRed-Monomer、AsRed2、mStrawberry、TurboFP602、mRFP1、JRed、KillerRed、HcRed、KeimaRed、mRasberry、mPlum、PS-CFP、Dendra2、Kaede、EosFP、KikumeGRである。融合タンパク質としての、凝集性の改善、及び/又は核への効率的な移行の観点から、好ましい例はmClover3である。
好ましい態様の一つでは、機能性領域は、標的がmRNAである場合に、標的mRNAからのタンパク質発現量を向上させる機能ドメインである(WO2017/209122)。mRNAからのタンパク質発現量を向上させる機能ドメインの例は、例えば、mRNAの翻訳を直接的又は間接的に促進することが知られているタンパク質の機能ドメインの全部又は機能的な一部であってよい。より具体的には、mRNAへリボソームを誘導するドメイン、mRNAの翻訳開始又は翻訳促進に関連するドメイン、mRNAの核外への輸送に関連するドメイン、小胞体膜への結合に関連するドメイン、小胞体保留シグナル(ER retention signal)配列を含むドメイン、又は、小胞体シグナル配列を含むドメインであってよい。 さらに具体的には、上記のmRNAへリボソームを誘導するドメインは、DENR(Density-regulated protein)、MCT-1(Malignant T-cell amplified sequence 1)、TPT1(Translationally-controlled tumor protein)、及び、Lerepo4(Zinc finger CCCH-domain)からなる群から選択されるポリペプチドの全部又は機能的な一部を含むドメインであってよい。また、上記のmRNAの翻訳開始又は翻訳促進に関連するドメインは、eIF4E及びeIF4Gからなる群から選択されるポリペプチドの全部又は機能的な一部を含むドメインであってよい。また、上記のmRNAの核外への輸送に関連するドメインは、SLBP(Stem-loop binding protein)の全部又は機能的な一部を含むドメインであってよい。また、上記の小胞体膜への結合に関連するドメインは、SEC61B、TRAP-alpha(Translocon associated protein alpha)、SR-alpha、Dia1(Cytochrome b5 reductase 3)、及び、p180からなる群から選択されるポリペプチドの全部又は機能的な一部を含むドメインであってよい。また、上記の小胞体保留シグナル(ER retention signal)配列は、KDEL(SEQ ID NO:55)またはKEEL(SEQ ID NO:56)配列を含むシグナル配列であってよい。また、前記小胞体シグナル配列は、MGWSCIILFLVATATGAHS(SEQ ID NO:57)を含むシグナル配列であってよい。
本発明において、機能性領域は、PPRタンパク質のN末端側に融合されてよく、C末端側に融合されてもよく、N末端側とC末端側の両方に融合されてもよい。また、複合体又は融合タンパク質は、複数の機能性領域(例えば、2~5個)を含んでよい。さらに、本発明の複合体又は融合タンパク質は、機能性領域とPPRタンパク質とがリンカー等を介して間接的に融合されていてもよい。
(PPRタンパク質等をコードする核酸、ベクター、細胞)
本発明は、上述の、PPRモチーフ、PPRタンパク質又は融合タンパク質をコードする核酸、核酸を含むベクター(例えば増幅のためのベクター、発現ベクター)も提供する。増幅のためのベクターは、大腸菌や酵母を宿主として用いうる。本明細書において、発現ベクターとは、例えば上流から、プロモーター配列を有するDNA、所望のタンパク質をコードするDNA、及びターミネーター配列を有するDNAを含むベクターを意味するが、所望の機能を発揮する限り、必ずしもこの順に配列されている必要はない。本発明においては、当業者が通常使用し得る様々なベクターを組み換えて使用することができる。
本発明は、上述の、PPRモチーフ、PPRタンパク質又は融合タンパク質をコードする核酸、核酸を含むベクター(例えば増幅のためのベクター、発現ベクター)も提供する。増幅のためのベクターは、大腸菌や酵母を宿主として用いうる。本明細書において、発現ベクターとは、例えば上流から、プロモーター配列を有するDNA、所望のタンパク質をコードするDNA、及びターミネーター配列を有するDNAを含むベクターを意味するが、所望の機能を発揮する限り、必ずしもこの順に配列されている必要はない。本発明においては、当業者が通常使用し得る様々なベクターを組み換えて使用することができる。
本発明のPPRタンパク質、又は融合タンパク質は、真核生物(例えば、動物、植物、微生物(酵母、等)、原生生物)の細胞で機能し得る。本発明の融合タンパク質は、特に、動物細胞内(in vitro又はin vivo)で機能し得る。本発明のPPRタンパク質、又は融合タンパク質、又はそれを発現するベクターを導入し得る動物細胞としては、例えば、ヒト、サル、ブタ、ウシ、ウマ、イヌ、ネコ、マウス、ラット由来の細胞を挙げることができる。また、本発明のPPRタンパク質、又は融合タンパク質、又はそれを発現するベクターを導入し得る培養細胞としては、例えば、チャイニーズハムスター卵巣(CHO)細胞、COS-1細胞、COS-7細胞、VERO(ATCC CCL-81)細胞、BHK細胞、イヌ腎由来MDCK細胞、ハムスターAV-12-664細胞、HeLa細胞、WI38細胞、293細胞、293T細胞、PER.C6細胞を挙げることができるが、これらに限定されない。
(用途)
本発明のPPRタンパク質、又は融合タンパク質は、生体内又は細胞内に、核酸配列特異的に機能性領域をデリバリーし、機能させることができる可能性がある。GFP等の標識部分を連結した複合体は、所望のRNAを生体内で可視化するために用いうる。
本発明のPPRタンパク質、又は融合タンパク質は、生体内又は細胞内に、核酸配列特異的に機能性領域をデリバリーし、機能させることができる可能性がある。GFP等の標識部分を連結した複合体は、所望のRNAを生体内で可視化するために用いうる。
また本発明のPPRタンパク質、又は融合タンパク質は、細胞内又は生体内において、核酸配列特異的に改変・破壊を行うことができ、また新たな機能を付与できる可能性がある。特にRNA結合性のPPRタンパク質は、オルガネラで見られるすべてのRNA加工のステップ、切断、RNA編集、翻訳、スプライシング、RNA安定化に関与している。したがって、本発明により提供されるPPRタンパク質の改質に関わる方法、及び本発明により提供されるPPRモチーフ及びPPRタンパク質は、様々な分野で、以下のような利用が期待できる。
(1)医療
・特定の疾患に関連した特定のRNAを認識し、結合するPPRタンパク質を作製する。また、特定のRNAに関し、標的配列を解析し、及び付随するタンパク質を解析する。それらの解析結果は、疾患の治療のための化合物の探索に用いうる。
・特定の疾患に関連した特定のRNAを認識し、結合するPPRタンパク質を作製する。また、特定のRNAに関し、標的配列を解析し、及び付随するタンパク質を解析する。それらの解析結果は、疾患の治療のための化合物の探索に用いうる。
例えば、動物では、LRPPRCと同定されるPPRタンパク質の異常がLeigh syndrom French Canadian (LSFC; リー症候群、亜急性壊死性脳脊髄症)を引き起こすことが知られている。本発明は、LSFCの処置(予防、治療、進行の抑制)に寄与しうる。既存のPPRタンパク質の多くは、RNA操作(RNA上での遺伝情報の変換;多くの場合、C→U)の編集部位の指定に働く。このタイプのPPRタンパク質は、RNA編集酵素と相互作用すると示唆される付加モチーフがC末端側に存在する。このような構造を有するPPRタンパク質により、塩基多型を導入すること、又は塩基多型に起因した疾患又は状態を処置することが期待できる。
・RNAの抑制・発現をコントロールした細胞を作製する。このような細胞には、分化・未分化状態をモニタリングした幹細胞(例えば、iPS細胞)、化粧品の評価用モデル細胞、創薬のメカニズム解明や薬理試験を目的として、機能性RNAの発現をON/OFFできる細胞が含まれる。
・特定の疾患に関連した特定のRNAに対して特異的に結合するPPRタンパク質を作製する。このようなPPRタンパク質を、プラスミド、ウイルスベクター、mRNA、精製タンパク質を用いて細胞へ導入し、そのPPRタンパク質が細胞内でその標的RNAと結合することで、疾患の原因であるRNA機能を変化(改善)させることができる。機能変化する手段は、例えば、結合によるRNA構造の変化、分解することによるノックダウン、スプライシングによるスプライシング反応の変化、塩基置換などが挙げられる。
(2)農林水産業
・農作物、林産物、水産物等において、収量や品質を改善する。
・耐病性の向上、環境耐性の向上、向上された又は新たな機能性を有した生物を育種する。
・農作物、林産物、水産物等において、収量や品質を改善する。
・耐病性の向上、環境耐性の向上、向上された又は新たな機能性を有した生物を育種する。
例えば、雑種第一代(F1)作物に関し、PPRタンパク質によるミトコンドリアRNAの安定化や翻訳制御を用いて人工的にF1作物を作出し、収率や品質を改善できる可能性がある。PPRタンパク質によるRNA操作及びゲノム編集は、従来技術よりも正確かつ迅速に、生物の品種改良、育種(生物を遺伝的に改良すること)が可能である。また、PPRタンパク質によるRNA操作及びゲノム編集は、遺伝子組み換えのように外来遺伝子により形質を転換するものではなく、元来動植物が有するRNAやゲノムを扱う技術である点で、変異体の選抜や戻し交雑という旧来の育種の手法に近いといえる。そのため、地球規模腕の食糧問題、環境問題にも、確実かつ迅速に対応しうる。
(3)化学
・微生物、培養細胞、植物体、動物体(例えば昆虫体)を利用した有用物質生産において、DNA、RNAの操作により、タンパク発現量を制御する。これにより、有用物質の生産性を向上することができる。有用物質の例は、抗体、ワクチン、酵素等のタンパク質性の物質のほか、医薬品の中間体、香料、色素等の比較的低分子の化合物である。
・微生物、培養細胞、植物体、動物体(例えば昆虫体)を利用した有用物質生産において、DNA、RNAの操作により、タンパク発現量を制御する。これにより、有用物質の生産性を向上することができる。有用物質の例は、抗体、ワクチン、酵素等のタンパク質性の物質のほか、医薬品の中間体、香料、色素等の比較的低分子の化合物である。
・藻類や微生物の代謝経路の改変により、バイオ燃料の産生効率を改善する。
[実施例1:蛍光タンパク質融合PPRタンパク質の細胞内解析]
(モチーフの設計)
標的配列は、CAG配列が6回繰り返したCAGCAGCAGCAGCAGCAG(SEQ ID NO:1)とした。PPRモチーフは、1番目、4番目、ii番目のアミノ酸配列によって認識される塩基が決定される。シトシンを認識するPPRモチーフには、1番目にバリン、4番目にアスパラギン、ii番目にセリン、アデニンを認識するPPRモチーフには、1番目にバリン、4番目にトレオニン、ii番目にアスパラギン、グアニンを認識するPPRモチーフには、1番目にバリン、4番目にトレオニン、ii番目にアスパラギン酸をそれぞれ配置した。なお、ウラシルを認識するPPRモチーフには、1番目はバリン、4番目はアスパラギン、ii番目はアスパラギン酸をそれぞれ配置すればよい。
(モチーフの設計)
標的配列は、CAG配列が6回繰り返したCAGCAGCAGCAGCAGCAG(SEQ ID NO:1)とした。PPRモチーフは、1番目、4番目、ii番目のアミノ酸配列によって認識される塩基が決定される。シトシンを認識するPPRモチーフには、1番目にバリン、4番目にアスパラギン、ii番目にセリン、アデニンを認識するPPRモチーフには、1番目にバリン、4番目にトレオニン、ii番目にアスパラギン、グアニンを認識するPPRモチーフには、1番目にバリン、4番目にトレオニン、ii番目にアスパラギン酸をそれぞれ配置した。なお、ウラシルを認識するPPRモチーフには、1番目はバリン、4番目はアスパラギン、ii番目はアスパラギン酸をそれぞれ配置すればよい。
さらに、シトシンを認識する1モチーフ目(図1Aの、Mutated motif)の6番目、9番目のアミノ酸に関しては、典型的な組み合わせとして、ロイシンとグリシン (C 6L9G, PPRcag 1、前掲SEQ ID NO:2)、変異型として、ロイシンとグルタミン酸(C 6L9E、PPRcag 2、SEQ ID NO:3)、アスパラギンとグルタミン(C 6N9Q、PPRcag 3、SEQ ID NO:4)、アスパラギンとグルタミン酸(C 6N9E、PPRcag 4、SEQ ID NO:5)、アスパラギンとリジン(C 6N9K、PPRcag 5、SEQ ID NO:6)、アスパラギン酸とグリシン(C 6D9G、PPRcag 6、SEQ ID NO:7)を選択した(図1B)。これらのPPRモチーフ配列を用いて、CAGCAGCAGCAGCAGCAG配列(前掲SEQ ID NO:1)に結合するように並べ、PPR遺伝子を作製した(SEQ ID NOs:11-16)。なお、各々のPPRモチーフをコードする18個のDNAを効率よく正確に連結させるために、シトシン、アデニン、グアニンそれぞれに対するPPRモチーフにおいて、1、4、6、9、ii番目以外のアミノ酸を、上述のように高頻度でみられるアミノ酸とした(SEQ ID NOs:8-9、前掲特許文献1参照)。
(プラスミドの作製)
PPR遺伝子を含むプラスミドは、Golden Gate法を利用して構築した。より詳細には、順番にシームレスで連結されるように設計された10種類の中間ベクターDest-a,b,c,d,e,f,g,h,i,jを準備し、1モチーフ及び2モチーフ(A、C、G、Uに対応するPPRモチーフ、AA、AC、AG、AU、CA、CC、CG、CU、GA、GC、GG、GU、UA、UC、UG、UUそれぞれの塩基組み合わせを認識する2つのPPRモチーフ)の20種類のモチーフ各々を、10種類のベクターに挿入することにより、200種類のパーツを作製した。
PPR遺伝子を含むプラスミドは、Golden Gate法を利用して構築した。より詳細には、順番にシームレスで連結されるように設計された10種類の中間ベクターDest-a,b,c,d,e,f,g,h,i,jを準備し、1モチーフ及び2モチーフ(A、C、G、Uに対応するPPRモチーフ、AA、AC、AG、AU、CA、CC、CG、CU、GA、GC、GG、GU、UA、UC、UG、UUそれぞれの塩基組み合わせを認識する2つのPPRモチーフ)の20種類のモチーフ各々を、10種類のベクターに挿入することにより、200種類のパーツを作製した。
Dest-aは、gaagacataaactccgtggtcacATACagagaccaaggtctcaGTGGtcacatacatgtcttc(SEQ ID NO:43)、
Dest-bは、gaagacatATACagagaccaaggtctcaGTGGtgacataatgtcttc(SEQ ID NO:44)、
Dest-cは、gaagacatcATACagagaccaaggtctcaGTGGttacatatgtcttc(SEQ ID NO:45)、
Dest-dは、gaagacatacATACagagaccaaggtctcaGTGGttacaatgtcttc(SEQ ID NO:46)、
Dest-eは、gaagacattacATACagagaccaaggtctcaGTGGtgacatgtcttc(SEQ ID NO:47)、
Dest-fは、gaagacattgacATACagagaccaaggtctcaGTGGttaatgtcttc(SEQ ID NO:48)、
Dest-gは、gaagacatgttacATACagagaccaaggtctcaGTGGtcatgtcttc(SEQ ID NO:49)、
Dest-hは、gaagacatggtcacATACagagaccaaggtctcaGTGGtatgtcttc(SEQ ID NO:50)、
Dest-iは、gaagacattggttacATACagagaccaaggtctcaGTGGatgtcttc(SEQ ID NO:51)、
Dest-jは、gaagacatgtggtgacATACagagaccaaggtctcaGTGGtcttc(SEQ ID NO:52)
を、遺伝子合成技術により作製し、pUC57-kanへクローニングすることにより準備した。
Dest-bは、gaagacatATACagagaccaaggtctcaGTGGtgacataatgtcttc(SEQ ID NO:44)、
Dest-cは、gaagacatcATACagagaccaaggtctcaGTGGttacatatgtcttc(SEQ ID NO:45)、
Dest-dは、gaagacatacATACagagaccaaggtctcaGTGGttacaatgtcttc(SEQ ID NO:46)、
Dest-eは、gaagacattacATACagagaccaaggtctcaGTGGtgacatgtcttc(SEQ ID NO:47)、
Dest-fは、gaagacattgacATACagagaccaaggtctcaGTGGttaatgtcttc(SEQ ID NO:48)、
Dest-gは、gaagacatgttacATACagagaccaaggtctcaGTGGtcatgtcttc(SEQ ID NO:49)、
Dest-hは、gaagacatggtcacATACagagaccaaggtctcaGTGGtatgtcttc(SEQ ID NO:50)、
Dest-iは、gaagacattggttacATACagagaccaaggtctcaGTGGatgtcttc(SEQ ID NO:51)、
Dest-jは、gaagacatgtggtgacATACagagaccaaggtctcaGTGGtcttc(SEQ ID NO:52)
を、遺伝子合成技術により作製し、pUC57-kanへクローニングすることにより準備した。
標的塩基配列に沿ってDest-aからDest-jを選択し、Golden Gate反応によりベクターへクローニングした。ここで使用するベクターは、18個連結されたPPR配列のN末端にMGNSV(SEQ ID NO:53)、C末端にELTYNTLISGLGKAGRARDPPV(SEQ ID NO:54)のアミノ酸配列が付加されるように設計した。正しいサイズの遺伝子がクローニングできていることを確認し、またクローニングされた遺伝子の配列をシーケンシングにて確認した。
(細胞内での発現の検出)
動物培養細胞での発現プラスミドpcDNA3.1は、CMVプロモーターとSV40 poly Aシグナル配列を含み、それらの間に発現させたい遺伝子を挿入することができる。細胞内でのPPRタンパク質の発現を検出するため、蛍光タンパク質を融合したPPRタンパク質を発現させ、その蛍光画像から細胞内での凝集性及び核への移行性を解析することとした。N末側から、EGFP、核移行シグナル配列、PPRタンパク質、FLAGエピトープタグの順番で融合したタンパク質遺伝子をpcDNA3.1へ挿入した(SEQ ID NOs:17-22)。また、N末側からmClover3、PPRタンパク質、核移行シグナル配列、FLAGエピトープタグの順番で融合したタンパク質遺伝子をpcDNA3.1へ挿入した(SEQ ID NOs:23-28)。コントロールとしてPPRを含まないプラスミドも作製した(SEQ ID NOs:35-36)。
動物培養細胞での発現プラスミドpcDNA3.1は、CMVプロモーターとSV40 poly Aシグナル配列を含み、それらの間に発現させたい遺伝子を挿入することができる。細胞内でのPPRタンパク質の発現を検出するため、蛍光タンパク質を融合したPPRタンパク質を発現させ、その蛍光画像から細胞内での凝集性及び核への移行性を解析することとした。N末側から、EGFP、核移行シグナル配列、PPRタンパク質、FLAGエピトープタグの順番で融合したタンパク質遺伝子をpcDNA3.1へ挿入した(SEQ ID NOs:17-22)。また、N末側からmClover3、PPRタンパク質、核移行シグナル配列、FLAGエピトープタグの順番で融合したタンパク質遺伝子をpcDNA3.1へ挿入した(SEQ ID NOs:23-28)。コントロールとしてPPRを含まないプラスミドも作製した(SEQ ID NOs:35-36)。
HEK293T細胞を9 mL DMEM, 1 mL FBS入りの10cm ディッシュに1 x 106 cells/well播種した。37℃、5%CO2環境下で2日間培養した後、細胞を回収した。回収した細胞をPLLコーティングされた96ウェルプレートへ1ウェルあたり、4 x 104 cells/wellで細胞播種し、37℃、5% CO2環境下で1日間培養した。200 ngプラスミドDNA、0.6 μL Fugene(登録商標)-HD (Promega、E2311)、200 μL Opti-MEMを混ぜ合わせ、全量ウェルへ加え、37℃、5%CO2環境下で1日間培養した。培養後、培地を取り除き、50 μL PBSで1回洗浄後、1 μL Hoechst (1mg/mL、同仁化学、346-07951)、50 μL PBSを加え、37℃、5%CO2環境下で10分間置き、その後、50 μL PBSで1回洗浄した。洗浄後、50 μL PBSを加えて、各ウェルのGFP蛍光及びHoechst蛍光画像を、蛍光顕微鏡 DMi8(Leica)を用いて取得した。
結果を図2に示す。EGFP及び核移行シグナル配列を融合したPPRの細胞内で発現を確認した結果、PPRcag 1 (6L9G)とPPRcag 2(6L9E)においては、核へ局在せず、核の周りで強く凝集する様子が確認された。一方で、PPRcag 3 (6N9Q), PPRcag 4(6N9E), PPRcag 5(6N9K), PPRcag 6(6D9G)においては、凝集性は低いものの核へ局在しなかった。mClover3を融合した場合、PPRcag 1 (6L9G)とPPRcag 2(6L9E)においては、核へ局在するものの、核の中で凝集する様子が確認された。PPRcag 3 (6N9Q), PPRcag 4(6N9E), PPRcag 5(6N9K), PPRcag 6(6D9G)においては、核へ局在し、かつ凝集性が見られなかった。したがって、凝集性を改善するためには、6N9E, 6N9Q, 6N9K, 6D9G変異が良く、また核へ効率的に局在させるためには、EGFPよりもmClover3を用いる方が良いことがわかった。
[実施例2:CAG結合PPRタンパク質のRNA結合解析]
PPRcag 1、PPRcag 2、PPRcag 3、PPRcag 4、PPRcag 5、PPRcag 6について、標的RNAとの結合を確認するため、組み換えタンパク質を作製し、結合実験を行った。
PPRcag 1、PPRcag 2、PPRcag 3、PPRcag 4、PPRcag 5、PPRcag 6について、標的RNAとの結合を確認するため、組み換えタンパク質を作製し、結合実験を行った。
それぞれのPPRタンパク質のN末側にルシフェラーゼ、C末側に6 x ヒスチジンタグ配列を融合したタンパク質遺伝子を設計し、大腸菌発現プラスミドへクローニングした(SEQ ID NOs:29-34)。またコントロールとしてPPRタンパク質を含まないNluc-Hisx6タンパク質遺伝子も作製した(SEQ ID NO:37)。
完成したプラスミドを大腸菌Rosetta(DE3)株へ形質転換した。この大腸菌を、2 mLの100 μg/mLアンピシリン入りLB培地で37℃、12時間培養し、OD600が、0.5から0.8に到達した時に、15℃のインキュベーターに培養液を移し、30分間静置させた。その後、100 μL (終濃度0.1 mM IPTG)を加え、15℃、16時間培養を行った。5,000 x g, 4℃, 10分間遠心によって、大腸菌ペレットを回収し、1.5 mLの溶解バッファー (20 mM Tris-HCl, pH8.0, 150 mM NaCl, 0.5% NP-40, 1 mM MgCl2, 2mg/ml リゾチーム, 1 mM PMSF, 2 ulのDNase) を加え、-80℃で20分間凍結させた。25℃、30分間浸透しながら細胞の凍結破砕をおこなった。続いて3700 rpm, 4℃, 15分間遠心操作を行い、可溶性のPPRタンパク質を含む上清(大腸菌ライセート)を回収した。
PPRタンパク質とRNAとの結合実験は、ストレプトアビジンプレート上でのPPRタンパク質とビオチン化RNAの結合実験方法により行った。
標的であるCAGx6配列、標的としないCGGx6、CUGx6、CCGx6、及びD1b(UGGUGUAUCUUGUCUUUA)配列(SEQ ID NO:42の8-25番)を含む30塩基のRNA(それぞれ順に、SEQ ID NOs:38-42)に5'末端をビオチン修飾したRNAプローブを合成した (Grainer)。 2.5 pmolビオチン化RNAプローブをストレプトアビジンコーティングプレート(Cat No. 15502, Thermo fisher)に加え、30分間、室温で反応させ、プローブ洗浄バッファー(20mM Tris-HCl (pH7.6)、 150 mM NaCl、 5 mM MgCl2、0.5% NP-40、1mM DTT、 0.1% BSA)で洗浄した。バックグラウンド測定のため、ビオチン化RNAを加えずに溶解bufferを加えたウェルも準備した(-Probe)。その後、ブロッキングバッファー(20 mM Tris-HCl (pH 7.6)、150 mM NaCl、5 mM MgCl2、0.5% NP-40、 1mM DTT、1% BSA)を加え、30分間、室温でプレート表面のブロッキングを行った。そこへ、1.5 x 108 LU/μL発光量を有するルシフェラーゼ融合PPRタンパク質が含まれる大腸菌ライセートを、100 μL 加え、30分間、室温で結合反応を行った。その後、200μLの洗浄バッファー(20 mM Tris -HCl (pH7.6)、150 mM NaCl、5 mM MgCl2, 0.5% NP-40、1mM DTT)で5回洗浄を行った。洗浄バッファーで、2500倍希釈したルシフェラーゼ基質(Promega, E151A)40 μLをウェルへ加えて5分間反応させた後、発光量をプレートリーダー(PerkinElmer, Cat No. 5103-35)で測定した。
その結果を図3に示す。全てのPPRにおいて、標的であるCAGx6へ特異的に結合することがわかった。標的配列への結合力は、PPRcag 1と比較してPPRcag 2は同程度、PPRcag 3は80%程度、PPRcag 4は60%程度、PPRcag 5は120%程度、PPRcag 6は130%程度であった。これらのことからPPRcag 4以外はほとんど変異による結合性能の変化は見られないことがわかった。
[実施例3:PPRタンパク質の凝集の制御]
V2モチーフを用いたPPRタンパク質(塩基配列はSEQ ID NO:61、アミノ酸配列はSEQ ID NO:62)と、v3.2モチーフを用いたPPRタンパク質(塩基配列はSEQ ID NO:63、アミノ酸配列はSEQ ID NO:64)それぞれを大腸菌発現系で作成し精製し、ゲルろ過クロマトグラフィーで分離した。なお、v2モチーフとは、SEQ ID NO:2、SEQ ID NOs:8~10の配列を有するPPRモチーフを指し、v3.2モチーフとは、N末端から1番目の場合はSEQ ID NO:4、SEQ ID NOs:58~60のいずれかの配列を有するPPRモチーフであり、それ以外の場合はアデニンに対してはSEQ ID NO:8において15番目のアスパラギン酸をリジンに置換したものであり、アデニン以外の塩基に対してはSEQ ID NOs:2, 9, 10から選択した配列を有するPPRモチーフを指す。
V2モチーフを用いたPPRタンパク質(塩基配列はSEQ ID NO:61、アミノ酸配列はSEQ ID NO:62)と、v3.2モチーフを用いたPPRタンパク質(塩基配列はSEQ ID NO:63、アミノ酸配列はSEQ ID NO:64)それぞれを大腸菌発現系で作成し精製し、ゲルろ過クロマトグラフィーで分離した。なお、v2モチーフとは、SEQ ID NO:2、SEQ ID NOs:8~10の配列を有するPPRモチーフを指し、v3.2モチーフとは、N末端から1番目の場合はSEQ ID NO:4、SEQ ID NOs:58~60のいずれかの配列を有するPPRモチーフであり、それ以外の場合はアデニンに対してはSEQ ID NO:8において15番目のアスパラギン酸をリジンに置換したものであり、アデニン以外の塩基に対してはSEQ ID NOs:2, 9, 10から選択した配列を有するPPRモチーフを指す。
(タンパク質の発現・精製)
目的のPPRをコードしたDNA配列を含むpE-SUMOpro Kanプラスミドを用いて、大腸菌Rosetta株を形質転換し、37度で培養後、OD600が0.6に達した時に20度に温度を下げ、終濃度0.5mMになるようにIPTGを加え、目的PPRタンパク質をSUMO融合タンパクつとして、大腸菌内で発現させた。1晩、培養後、菌体を遠心よって集菌し、Lysis Buffer (50mM Tris-HCl pH8.0, 500mM NaCl)で再懸濁した。超音波破砕によって、大腸菌を破砕し、17000g, 30minの遠心後、上清画分をNi-Agaroseカラムに供与し、20mM imidazoleを含むLysis Bufferでカラム洗浄後、400mM imidazoleを含むLysis Bufferで、SUMO融合目的PPRタンパク質を溶出させた。溶出後、Ulp1によるSUMOタンパク質を目的PPRタンパク質から切り離すと同時に、透析により、イオン交換Buffer(50mM Tris-Hcl pH8.0, 200mM NaCl)にタンパク溶液を置換した。その後、SPカラムを用いた陽イオン交換クロマトグラフィーを行った。カラム供与後、NaCl濃度を200mMから1Mまで徐々に上げることによって、タンパク質を溶出させた。目的PPRタンパク質を含む画分をSuperdex200カラムを用いたゲルろ過クロマトグラフィーによって最終精製を行った。 ゲルろ過Buffer(25mM HEPES pH7.5, 200mM NaCl, 0.5mM tris(2-carboxyethyl)phosphine (TCEP))で平衡化したゲルろ過カラムに、イオン交換から溶出した目的PPRタンパク質を供与した。最後に目的PPRタンパク質を含む画分を濃縮し、液体窒素で凍結し、次の分析に使用するまで-80度で保存した。
目的のPPRをコードしたDNA配列を含むpE-SUMOpro Kanプラスミドを用いて、大腸菌Rosetta株を形質転換し、37度で培養後、OD600が0.6に達した時に20度に温度を下げ、終濃度0.5mMになるようにIPTGを加え、目的PPRタンパク質をSUMO融合タンパクつとして、大腸菌内で発現させた。1晩、培養後、菌体を遠心よって集菌し、Lysis Buffer (50mM Tris-HCl pH8.0, 500mM NaCl)で再懸濁した。超音波破砕によって、大腸菌を破砕し、17000g, 30minの遠心後、上清画分をNi-Agaroseカラムに供与し、20mM imidazoleを含むLysis Bufferでカラム洗浄後、400mM imidazoleを含むLysis Bufferで、SUMO融合目的PPRタンパク質を溶出させた。溶出後、Ulp1によるSUMOタンパク質を目的PPRタンパク質から切り離すと同時に、透析により、イオン交換Buffer(50mM Tris-Hcl pH8.0, 200mM NaCl)にタンパク溶液を置換した。その後、SPカラムを用いた陽イオン交換クロマトグラフィーを行った。カラム供与後、NaCl濃度を200mMから1Mまで徐々に上げることによって、タンパク質を溶出させた。目的PPRタンパク質を含む画分をSuperdex200カラムを用いたゲルろ過クロマトグラフィーによって最終精製を行った。 ゲルろ過Buffer(25mM HEPES pH7.5, 200mM NaCl, 0.5mM tris(2-carboxyethyl)phosphine (TCEP))で平衡化したゲルろ過カラムに、イオン交換から溶出した目的PPRタンパク質を供与した。最後に目的PPRタンパク質を含む画分を濃縮し、液体窒素で凍結し、次の分析に使用するまで-80度で保存した。
(ゲルろ過クロマトグラフィー)
精製したリコンビナントPPRタンパク質を濃度1mg/mlに調整した。ゲルろ過クロマトグラフィーは、Superdex 200 increase 10/300 GL (GE Helthcare)を用いた。25mM HEPES pH7.5, 200mM NaCl, 0.5mM tris(2-carboxyethyl)phosphine (TCEP)で平衡化したゲルろ過カラムに、調整したタンパク質を供与し、ゲルろ過カラムより溶出してくる溶液を280nmの吸光度を測定することにより、タンパク質の性質を分析した。
精製したリコンビナントPPRタンパク質を濃度1mg/mlに調整した。ゲルろ過クロマトグラフィーは、Superdex 200 increase 10/300 GL (GE Helthcare)を用いた。25mM HEPES pH7.5, 200mM NaCl, 0.5mM tris(2-carboxyethyl)phosphine (TCEP)で平衡化したゲルろ過カラムに、調整したタンパク質を供与し、ゲルろ過カラムより溶出してくる溶液を280nmの吸光度を測定することにより、タンパク質の性質を分析した。
(結果)
結果を図4に示す。溶出画分(Elution vol.)が少ないほど分子サイズが大きい。V2では、8から10mLの溶出画分で溶出された一方で、v3.2では、12から14mLの溶出画分にピークが見られた。このことから、v2では、タンパク質サイズが大きくなっていることから凝集している可能性が示唆され、その凝集はv3.2において改善されていることが分かった。
結果を図4に示す。溶出画分(Elution vol.)が少ないほど分子サイズが大きい。V2では、8から10mLの溶出画分で溶出された一方で、v3.2では、12から14mLの溶出画分にピークが見られた。このことから、v2では、タンパク質サイズが大きくなっていることから凝集している可能性が示唆され、その凝集はv3.2において改善されていることが分かった。
Claims (18)
- 下記のいずれか1つの、PPRモチーフ:
(C-1)配列番号:4~7のいずれか1の配列からなるPPRモチーフ;
(C-2)配列番号:4~7のいずれか1の配列において、位置1、4、6、及び34のアミノ酸以外のアミノ酸の1~9個を置換、欠失、又は付加した配列からなり、かつシトシン結合性であるPPRモチーフ;
(C-3)配列番号:4~7のいずれか1の配列と少なくとも80%の配列同一性を有し、ただし位置1、4、6、及び34のアミノ酸は同一であり、かつシトシン結合性であるPPRモチーフ;
(A-1)配列番号:8の配列からなるPPRモチーフにおいて、位置6のアミノ酸をアスパラギン又はアスパラギン酸に置換したPPRモチーフ;
(A-2)(A-1)の配列において、位置1、4、6、及び34のアミノ酸以外のアミノ酸の1~9個を置換、欠失、又は付加した配列からなり、かつアデニン結合性であるPPRモチーフ;
(A-3)(A-1)の配列と少なくとも80%の配列同一性を有し、ただし位置1、4、6、及び34のアミノ酸は同一であり、かつアデニン結合性であるPPRモチーフ;
(G-1)配列番号:9の配列からなるPPRモチーフにおいて、位置6のアミノ酸をアスパラギン又はアスパラギン酸に置換したPPRモチーフ;
(G-2)(G-1)の配列において、位置1、4、6、及び34のアミノ酸以外のアミノ酸の1~9個を置換、欠失、又は付加した配列からなり、かつグアニン結合性であるPPRモチーフ;
(G-3)(G-1)の配列と少なくとも80%の配列同一性を有し、ただし位置1、4、6、及び34のアミノ酸は同一であり、かつグアニン結合性であるPPRモチーフ;
(U-1)配列番号:10の配列からなるPPRモチーフにおいて、位置6のアミノ酸をアスパラギン又はアスパラギン酸に置換したPPRモチーフ;
(U-2)(U-1)の配列において、位置1、4、6、及び34のアミノ酸以外のアミノ酸の1~9個を置換、欠失、又は付加した配列からなり、かつウラシル結合性であるPPRモチーフ;
(U-3)(U-1)の配列と少なくとも80%の配列同一性を有し、ただし位置1、4、6、及び34のアミノ酸は同一であり、かつウラシル結合性であるPPRモチーフ。 - 下記のいずれか1つの、PPRモチーフ:
(C-1)配列番号:4~7のいずれか1の配列からなるPPRモチーフ;
(C-2)配列番号:4~7のいずれか1の配列において、位置1、4、6、9、及び34のアミノ酸以外のアミノ酸の1~9個を置換、欠失、又は付加した配列からなり、かつシトシン結合性であるPPRモチーフ;
(C-3)配列番号:4~7のいずれか1の配列と少なくとも80%の配列同一性を有し、ただし位置1、4、6、9、及び34のアミノ酸は同一であり、かつシトシン結合性であるPPRモチーフ;
(A-1)配列番号:8の配列において、位置6及び9のアミノ酸を、下記に定義した組み合わせのいずれか1つを満たすように置換したPPRモチーフ;
(A-2)(A-1)の配列において、位置1、4、6、9、及び34のアミノ酸以外のアミノ酸の1~9個を置換、欠失、又は付加した配列からなり、かつアデニン結合性であるPPRモチーフ;
(A-3)(A-1)の配列と少なくとも80%の配列同一性を有し、ただし位置1、4、6、9、及び34のアミノ酸は同一であり、かつアデニン結合性であるPPRモチーフ;
(G-1)配列番号:9の配列において、位置6及び9のアミノ酸を、下記に定義した組み合わせのいずれか1つを満たすように置換した配列からなるPPRモチーフ;
(G-2)(G-1)の配列において、位置1、4、6、9、及び34のアミノ酸以外のアミノ酸の1~9個を置換、欠失、又は付加した配列からなり、かつグアニン結合性であるPPRモチーフ;
(G-3)(G-1)の配列と少なくとも80%の配列同一性を有し、ただし位置1、4、6、9、及び34のアミノ酸は同一であり、かつグアニン結合性であるPPRモチーフ;
(U-1)配列番号:10の配列において、位置6及び9のアミノ酸を、下記に定義した組み合わせのいずれか1つを満たすように置換した配列からなるPPRモチーフ;
(U-2)(U-1)の配列において、位置1、4、6、9、及び34のアミノ酸以外のアミノ酸の1~9個を置換、欠失、又は付加した配列からなり、かつウラシル結合性であるPPRモチーフ;
(U-3)(U-1)の配列と少なくとも80%の配列同一性を有し、ただし位置1、4、6、9、及び34のアミノ酸は同一であり、かつウラシル結合性であるPPRモチーフ。
・位置6のアミノ酸がアスパラギンであり、かつ位置9のアミノ酸がグルタミン酸である組み合わせ
・位置6のアミノ酸がアスパラギンであり、かつ位置9のアミノ酸がグルタミンである組み合わせ
・位置6のアミノ酸がアスパラギンであり、かつ位置9のアミノ酸がリジンである組み合わせ
・位置6のアミノ酸アスパラギン酸であり、かつ位置9アミノ酸がグリシンである組み合わせ - 下記のいずれか1つである、請求項1又は2に記載のPPRモチーフ:
(C-4)配列番号:4の配列からなるPPRモチーフ;
(A-4)配列番号:58の配列からなるPPRモチーフ;
(G-4)配列番号:59の配列からなるPPRモチーフ;
(U-4)配列番号:60の配列からなるPPRモチーフ。 - 請求項1~3のいずれか1項に記載のPPRモチーフの、PPRタンパク質におけるN末端から1番目のPPRモチーフとしての使用。
- PPRタンパク質の凝集性を減少させるための、請求項4に記載の使用。
- 下記の式1で表されるPPRモチーフを1~30個含む、特定の塩基配列を有する標的核酸と結合可能なタンパク質において、N末端から1番目のPPRモチーフ(M1)のA6アミノ酸が、親水性アミノ酸である、タンパク質。
Helix Aは、12アミノ酸長の、αヘリックス構造を形成可能な部分であって、式2で表され、
Xは、存在しないか又は1~9アミノ酸長からなる部分であり;
Helix Bは、11~13アミノ酸長からなる、αヘリックス構造を形成可能な部分であり;
Lは、2~7アミノ酸長の、式3で表される部分であり;
ただし、Liii~Lviiは存在しない場合がある。) - M1のA9アミノ酸が、親水性アミノ酸又はグリシンである、請求項6に記載のタンパク質。
- M1のA6アミノ酸が、アスパラギン又はアスパラギン酸である、請求項6又は7に記載のタンパク質。
- M1のA9アミノ酸が、グルタミン、グルタミン酸、リジン、又はグリシンである、請求項6~8のいずれか1項に記載のタンパク質。
- M1のA6アミノ酸、及びM1のA9アミノ酸が、下記のいずれかの組み合わせである、請求項6~9のいずれか1項に記載のタンパク質。
・A6アミノ酸がアスパラギンであり、かつA9アミノ酸がグルタミン酸である組み合わせ
・A6アミノ酸がアスパラギンであり、かつA9アミノ酸がグルタミンである組み合わせ
・A6アミノ酸がアスパラギンであり、かつA9アミノ酸がリジンである組み合わせ
・A6アミノ酸アスパラギン酸であり、かつA9アミノ酸がグリシンである組み合わせ - 蛍光タンパク質、核移行シグナルペプチド、及びタグタンパク質からなる群より選択される少なくとも一つと、請求項1~3のいずれか1項に記載のPPRモチーフをN末端から1番目のPPRモチーフとして含むPPRタンパク質、又は請求項6~10のいずれか1項に記載のタンパク質との、融合タンパク質。
- 請求項6に定義したPPRモチーフを含む、特定の塩基配列を有する標的核酸と結合可能なPPRタンパク質の、改質方法であって、N末端から1番目のPPRモチーフ(M1)のA6アミノ酸をより親水性とする、方法。
- 請求項1~3のいずれか1項に記載のPPRモチーフをN末端から1番目のPPRモチーフとして含むPPRタンパク質、請求項6~10のいずれか1項に記載のタンパク質、又は請求項11に記載の融合タンパク質を用いることを特徴とする、核酸の検出方法。
- 請求項1~3のいずれか1項に記載のPPRモチーフ、請求項1~3のいずれか1項に記載のPPRモチーフをN末端から1番目のPPRモチーフとして含むPPRタンパク質、又は請求項6~10のいずれか1項に記載のタンパク質をコードする核酸。
- 請求項14に記載の核酸を含む、ベクター。
- 請求項15に記載のベクターを含む、細胞(ヒト個体は除く。)。
- 請求項1~3のいずれか1項に記載のPPRモチーフ、請求項1~3のいずれか1項に記載のPPRモチーフをN末端から1番目のPPRモチーフとして含むPPRタンパク質、又は請求項6~10のいずれか1項に記載のタンパク質、又は請求項15に記載のベクターを用いる、核酸の操作方法(ヒト個体での実施を除く。)。
- 請求項17に記載の操作方法を含む、生物の生産方法。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019100553 | 2019-05-29 | ||
JP2019100553 | 2019-05-29 | ||
JP2021521908A JP7308468B2 (ja) | 2019-05-29 | 2020-05-29 | 凝集の少ないpprタンパク質及びその利用 |
PCT/JP2020/021473 WO2020241877A1 (ja) | 2019-05-29 | 2020-05-29 | 凝集の少ないpprタンパク質及びその利用 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021521908A Division JP7308468B2 (ja) | 2019-05-29 | 2020-05-29 | 凝集の少ないpprタンパク質及びその利用 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2023036848A true JP2023036848A (ja) | 2023-03-14 |
JP2023036848A5 JP2023036848A5 (ja) | 2023-06-05 |
Family
ID=73552159
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021521908A Active JP7308468B2 (ja) | 2019-05-29 | 2020-05-29 | 凝集の少ないpprタンパク質及びその利用 |
JP2022208226A Pending JP2023036848A (ja) | 2019-05-29 | 2022-12-26 | 凝集の少ないpprタンパク質及びその利用 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021521908A Active JP7308468B2 (ja) | 2019-05-29 | 2020-05-29 | 凝集の少ないpprタンパク質及びその利用 |
Country Status (11)
Country | Link |
---|---|
US (1) | US20220220166A1 (ja) |
EP (1) | EP3977849A4 (ja) |
JP (2) | JP7308468B2 (ja) |
KR (1) | KR20220023984A (ja) |
CN (1) | CN113966340A (ja) |
AU (1) | AU2020283367A1 (ja) |
BR (1) | BR112021023937A2 (ja) |
CA (1) | CA3142303A1 (ja) |
IL (1) | IL288417A (ja) |
SG (1) | SG11202113057XA (ja) |
WO (1) | WO2020241877A1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7125727B1 (ja) | 2021-09-07 | 2022-08-25 | 国立大学法人千葉大学 | 核酸配列改変用組成物および核酸配列の標的部位を改変する方法 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013058404A1 (ja) | 2011-10-21 | 2013-04-25 | 国立大学法人九州大学 | Pprモチーフを利用したrna結合性蛋白質の設計方法及びその利用 |
BR122020018292B1 (pt) * | 2013-04-22 | 2023-05-16 | Hiroshima University | Métodos para controlar uma função de dna tendo uma sequência alvo, para identificar uma base de dna ou sequência de base de dna, e para identificar uma proteína ppr |
KR102407776B1 (ko) | 2016-06-03 | 2022-06-10 | 고쿠리쓰다이가쿠호진 규슈다이가쿠 | 표적 mRNA로부터의 단백질 발현량을 향상시키기 위한 융합 단백질 |
JP6918686B2 (ja) | 2017-11-28 | 2021-08-11 | 東芝ライフスタイル株式会社 | 冷蔵庫 |
KR102568600B1 (ko) | 2018-02-19 | 2023-08-23 | 삼성디스플레이 주식회사 | 표시 장치, 이를 포함하는 적층 기판, 및 표시 장치 제조방법 |
AU2020283177A1 (en) * | 2019-05-29 | 2022-01-06 | Editforce, Inc. | Efficient method for preparing ppr protein and use of the same |
-
2020
- 2020-05-29 BR BR112021023937A patent/BR112021023937A2/pt unknown
- 2020-05-29 WO PCT/JP2020/021473 patent/WO2020241877A1/ja unknown
- 2020-05-29 EP EP20812826.4A patent/EP3977849A4/en active Pending
- 2020-05-29 SG SG11202113057XA patent/SG11202113057XA/en unknown
- 2020-05-29 CN CN202080040065.2A patent/CN113966340A/zh active Pending
- 2020-05-29 KR KR1020217040376A patent/KR20220023984A/ko not_active Application Discontinuation
- 2020-05-29 AU AU2020283367A patent/AU2020283367A1/en active Pending
- 2020-05-29 CA CA3142303A patent/CA3142303A1/en active Pending
- 2020-05-29 JP JP2021521908A patent/JP7308468B2/ja active Active
- 2020-05-29 US US17/614,236 patent/US20220220166A1/en active Pending
-
2021
- 2021-11-25 IL IL288417A patent/IL288417A/en unknown
-
2022
- 2022-12-26 JP JP2022208226A patent/JP2023036848A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
JP7308468B2 (ja) | 2023-07-14 |
BR112021023937A2 (pt) | 2022-04-19 |
AU2020283367A1 (en) | 2022-01-06 |
CN113966340A (zh) | 2022-01-21 |
EP3977849A4 (en) | 2023-06-28 |
EP3977849A1 (en) | 2022-04-06 |
KR20220023984A (ko) | 2022-03-03 |
IL288417A (en) | 2022-01-01 |
WO2020241877A1 (ja) | 2020-12-03 |
US20220220166A1 (en) | 2022-07-14 |
CA3142303A1 (en) | 2020-12-03 |
JPWO2020241877A1 (ja) | 2020-12-03 |
SG11202113057XA (en) | 2021-12-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Taipale et al. | HSP90 at the hub of protein homeostasis: emerging mechanistic insights | |
JP7290233B2 (ja) | Pprモチーフを利用したdna結合性タンパク質およびその利用 | |
Sehnke et al. | Interaction of a plant 14-3-3 protein with the signal peptide of a thylakoid-targeted chloroplast precursor protein and the presence of 14-3-3 isoforms in the chloroplast stroma | |
Kerppola | Bimolecular fluorescence complementation (BiFC) analysis as a probe of protein interactions in living cells | |
Antos et al. | Site‐specific protein labeling via sortase‐mediated transpeptidation | |
CN112004932B (zh) | 一种CRISPR/Cas效应蛋白及系统 | |
CN112105728A (zh) | CRISPR/Cas效应蛋白及系统 | |
JP2023036848A (ja) | 凝集の少ないpprタンパク質及びその利用 | |
JP2023145672A (ja) | 効率的なpprタンパク質の作製方法及びその利用 | |
Cross et al. | Fragment-linking peptide design yields a high-affinity ligand for microtubule-based transport | |
WO2020045281A1 (ja) | 新規ヌクレアーゼドメインおよびその利用 | |
Baumann et al. | Identification of a potential modification site in human stromal cell‐derived factor‐1 | |
Griffith et al. | A highly efficient, one-step purification of the Hsp70 chaperone Ssa1 | |
CN115261359A (zh) | 一种新型crispr酶和系统以及应用 | |
Bodey | Evaluation of Cell Permeability of Intact Histone Complexes in Mammalian Cells | |
McCluskey | Shiga-like Toxin 1: Molecular Mechanism of Toxicity and Discovery of Inhibitors | |
Fischer | Initial characterization of the ribosome-associated ATP binding cassette (ABC) protein YHIH from E. Coli | |
NZ752698B2 (en) | DNA-binding protein using PPR motif, and use thereof |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230526 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230526 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240507 |