BR122020018292B1 - Métodos para controlar uma função de dna tendo uma sequência alvo, para identificar uma base de dna ou sequência de base de dna, e para identificar uma proteína ppr - Google Patents
Métodos para controlar uma função de dna tendo uma sequência alvo, para identificar uma base de dna ou sequência de base de dna, e para identificar uma proteína ppr Download PDFInfo
- Publication number
- BR122020018292B1 BR122020018292B1 BR122020018292-0A BR122020018292A BR122020018292B1 BR 122020018292 B1 BR122020018292 B1 BR 122020018292B1 BR 122020018292 A BR122020018292 A BR 122020018292A BR 122020018292 B1 BR122020018292 B1 BR 122020018292B1
- Authority
- BR
- Brazil
- Prior art keywords
- ppr
- amino acids
- amino acid
- selectively binds
- ppr motif
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims description 36
- 150000001413 amino acids Chemical class 0.000 claims abstract description 462
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 167
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 160
- 108020004414 DNA Proteins 0.000 claims abstract description 131
- 235000001014 amino acid Nutrition 0.000 claims description 456
- 229940024606 amino acid Drugs 0.000 claims description 454
- 235000018102 proteins Nutrition 0.000 claims description 156
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 claims description 130
- 229960001230 asparagine Drugs 0.000 claims description 112
- 235000009582 asparagine Nutrition 0.000 claims description 112
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 claims description 94
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 claims description 70
- 235000003704 aspartic acid Nutrition 0.000 claims description 70
- 229960005261 aspartic acid Drugs 0.000 claims description 70
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 claims description 70
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 claims description 50
- 230000006870 function Effects 0.000 claims description 43
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 claims description 42
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 claims description 42
- 239000004474 valine Substances 0.000 claims description 42
- 229960004295 valine Drugs 0.000 claims description 42
- 235000014393 valine Nutrition 0.000 claims description 42
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 claims description 39
- 239000004473 Threonine Substances 0.000 claims description 39
- 229960002898 threonine Drugs 0.000 claims description 39
- 235000008521 threonine Nutrition 0.000 claims description 39
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 claims description 35
- 230000007018 DNA scission Effects 0.000 claims description 32
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 claims description 32
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 claims description 32
- 229960000310 isoleucine Drugs 0.000 claims description 32
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 claims description 32
- 235000014705 isoleucine Nutrition 0.000 claims description 32
- 229960001153 serine Drugs 0.000 claims description 32
- 235000004400 serine Nutrition 0.000 claims description 32
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 claims description 26
- 102000004190 Enzymes Human genes 0.000 claims description 26
- 108090000790 Enzymes Proteins 0.000 claims description 26
- 239000004471 Glycine Substances 0.000 claims description 25
- 210000004899 c-terminal region Anatomy 0.000 claims description 25
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 claims description 16
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 claims description 16
- 235000008729 phenylalanine Nutrition 0.000 claims description 16
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 claims description 14
- 235000013930 proline Nutrition 0.000 claims description 14
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 claims description 13
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 claims description 12
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 claims description 11
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 claims description 11
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 claims description 11
- 235000005772 leucine Nutrition 0.000 claims description 11
- 229930182817 methionine Natural products 0.000 claims description 11
- 235000006109 methionine Nutrition 0.000 claims description 11
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 8
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 claims description 8
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 claims description 8
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 claims description 8
- 235000013922 glutamic acid Nutrition 0.000 claims description 8
- 239000004220 glutamic acid Substances 0.000 claims description 8
- 235000002374 tyrosine Nutrition 0.000 claims description 8
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 claims description 7
- 101710163270 Nuclease Proteins 0.000 claims description 7
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 claims description 7
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 claims description 6
- 238000013461 design Methods 0.000 claims description 6
- 229960004799 tryptophan Drugs 0.000 claims description 6
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 claims description 5
- 239000004472 Lysine Substances 0.000 claims description 5
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 claims description 4
- 238000003780 insertion Methods 0.000 claims description 4
- 230000037431 insertion Effects 0.000 claims description 4
- 238000011144 upstream manufacturing Methods 0.000 claims description 4
- 229960002449 glycine Drugs 0.000 claims description 3
- 230000004568 DNA-binding Effects 0.000 abstract description 20
- 238000004458 analytical method Methods 0.000 abstract description 2
- 125000003275 alpha amino acid group Chemical group 0.000 description 40
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 36
- 230000027455 binding Effects 0.000 description 33
- 108091028043 Nucleic acid sequence Proteins 0.000 description 24
- 241000219195 Arabidopsis thaliana Species 0.000 description 20
- 150000007523 nucleic acids Chemical class 0.000 description 18
- 238000013518 transcription Methods 0.000 description 17
- 230000035897 transcription Effects 0.000 description 17
- 108020004707 nucleic acids Proteins 0.000 description 15
- 102000039446 nucleic acids Human genes 0.000 description 15
- 210000004027 cell Anatomy 0.000 description 13
- 101100083945 Arabidopsis thaliana GUN1 gene Proteins 0.000 description 11
- 230000000694 effects Effects 0.000 description 10
- 239000002773 nucleotide Substances 0.000 description 10
- 102100028629 Cytoskeleton-associated protein 4 Human genes 0.000 description 9
- 230000004570 RNA-binding Effects 0.000 description 9
- 238000010362 genome editing Methods 0.000 description 9
- 125000003729 nucleotide group Chemical group 0.000 description 9
- 239000013598 vector Substances 0.000 description 9
- 241000196324 Embryophyta Species 0.000 description 8
- 239000013604 expression vector Substances 0.000 description 8
- 108020001775 protein parts Proteins 0.000 description 8
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 8
- 102000052510 DNA-Binding Proteins Human genes 0.000 description 7
- 102100034579 Desmoglein-1 Human genes 0.000 description 7
- 101150046388 GRP23 gene Proteins 0.000 description 7
- 230000015572 biosynthetic process Effects 0.000 description 7
- 238000003776 cleavage reaction Methods 0.000 description 7
- 230000007017 scission Effects 0.000 description 7
- 101710096438 DNA-binding protein Proteins 0.000 description 6
- 238000010459 TALEN Methods 0.000 description 6
- 108010043645 Transcription Activator-Like Effector Nucleases Proteins 0.000 description 6
- 238000003556 assay Methods 0.000 description 6
- 238000002474 experimental method Methods 0.000 description 6
- 230000014509 gene expression Effects 0.000 description 6
- 238000012986 modification Methods 0.000 description 6
- 230000004048 modification Effects 0.000 description 6
- 238000002360 preparation method Methods 0.000 description 6
- 238000003786 synthesis reaction Methods 0.000 description 6
- 108090000331 Firefly luciferases Proteins 0.000 description 5
- 108060001084 Luciferase Proteins 0.000 description 5
- 239000005089 Luciferase Substances 0.000 description 5
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical class O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 5
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 5
- 108090000765 processed proteins & peptides Proteins 0.000 description 5
- 239000011701 zinc Substances 0.000 description 5
- 229910052725 zinc Inorganic materials 0.000 description 5
- 108010053770 Deoxyribonucleases Proteins 0.000 description 4
- 102000016911 Deoxyribonucleases Human genes 0.000 description 4
- 102000044126 RNA-Binding Proteins Human genes 0.000 description 4
- 108091023040 Transcription factor Proteins 0.000 description 4
- 102000040945 Transcription factor Human genes 0.000 description 4
- 108010017070 Zinc Finger Nucleases Proteins 0.000 description 4
- 210000003763 chloroplast Anatomy 0.000 description 4
- 239000003814 drug Substances 0.000 description 4
- 230000002068 genetic effect Effects 0.000 description 4
- 230000010076 replication Effects 0.000 description 4
- 239000000126 substance Substances 0.000 description 4
- 101710159080 Aconitate hydratase A Proteins 0.000 description 3
- 101710159078 Aconitate hydratase B Proteins 0.000 description 3
- 239000006144 Dulbecco’s modified Eagle's medium Substances 0.000 description 3
- 208000006136 Leigh Disease Diseases 0.000 description 3
- 101710105008 RNA-binding protein Proteins 0.000 description 3
- 230000004913 activation Effects 0.000 description 3
- 229940079593 drug Drugs 0.000 description 3
- 238000003670 luciferase enzyme activity assay Methods 0.000 description 3
- 239000002609 medium Substances 0.000 description 3
- 210000003470 mitochondria Anatomy 0.000 description 3
- 230000009456 molecular mechanism Effects 0.000 description 3
- 229920001184 polypeptide Polymers 0.000 description 3
- 102000004196 processed proteins & peptides Human genes 0.000 description 3
- 230000002194 synthesizing effect Effects 0.000 description 3
- 230000008685 targeting Effects 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 229940113082 thymine Drugs 0.000 description 3
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 2
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 2
- 101100393611 Arabidopsis thaliana GRP23 gene Proteins 0.000 description 2
- 101100189945 Arabidopsis thaliana PER63 gene Proteins 0.000 description 2
- 101100298241 Arabidopsis thaliana PTAC2 gene Proteins 0.000 description 2
- 241000894006 Bacteria Species 0.000 description 2
- 108091033409 CRISPR Proteins 0.000 description 2
- 101000966742 Homo sapiens Leucine-rich PPR motif-containing protein, mitochondrial Proteins 0.000 description 2
- 208000017507 Leigh syndrome Diseases 0.000 description 2
- 102100040589 Leucine-rich PPR motif-containing protein, mitochondrial Human genes 0.000 description 2
- 206010058799 Mitochondrial encephalomyopathy Diseases 0.000 description 2
- 108010052090 Renilla Luciferases Proteins 0.000 description 2
- 210000001744 T-lymphocyte Anatomy 0.000 description 2
- 108010073062 Transcription Activator-Like Effectors Proteins 0.000 description 2
- -1 VP64 Proteins 0.000 description 2
- 101710185494 Zinc finger protein Proteins 0.000 description 2
- 102100023597 Zinc finger protein 816 Human genes 0.000 description 2
- 239000012190 activator Substances 0.000 description 2
- 125000000539 amino acid group Chemical group 0.000 description 2
- 230000003197 catalytic effect Effects 0.000 description 2
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 230000035558 fertility Effects 0.000 description 2
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 2
- 210000005260 human cell Anatomy 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 239000013642 negative control Substances 0.000 description 2
- 210000002706 plastid Anatomy 0.000 description 2
- 108020001580 protein domains Proteins 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 108091008146 restriction endonucleases Proteins 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 230000009870 specific binding Effects 0.000 description 2
- 229940035893 uracil Drugs 0.000 description 2
- 229930024421 Adenine Natural products 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- 241000219194 Arabidopsis Species 0.000 description 1
- 108700022317 Arabidopsis GRP23 Proteins 0.000 description 1
- 101100520820 Arabidopsis thaliana DG1 gene Proteins 0.000 description 1
- 101000688247 Arabidopsis thaliana Pentatricopeptide repeat-containing protein At5g67570, chloroplastic Proteins 0.000 description 1
- 108090001008 Avidin Proteins 0.000 description 1
- 108020000946 Bacterial DNA Proteins 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 108091003079 Bovine Serum Albumin Proteins 0.000 description 1
- 238000010354 CRISPR gene editing Methods 0.000 description 1
- 238000010453 CRISPR/Cas method Methods 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 108700031407 Chloroplast Genes Proteins 0.000 description 1
- 102000053602 DNA Human genes 0.000 description 1
- 108010076804 DNA Restriction Enzymes Proteins 0.000 description 1
- 238000010442 DNA editing Methods 0.000 description 1
- 230000006820 DNA synthesis Effects 0.000 description 1
- 108700020911 DNA-Binding Proteins Proteins 0.000 description 1
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 1
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 1
- 108010037179 Endodeoxyribonucleases Proteins 0.000 description 1
- 102000011750 Endodeoxyribonucleases Human genes 0.000 description 1
- 108091029865 Exogenous DNA Proteins 0.000 description 1
- 108010068250 Herpes Simplex Virus Protein Vmw65 Proteins 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 102000007474 Multiprotein Complexes Human genes 0.000 description 1
- 108010085220 Multiprotein Complexes Proteins 0.000 description 1
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 108020002230 Pancreatic Ribonuclease Proteins 0.000 description 1
- 102000005891 Pancreatic ribonuclease Human genes 0.000 description 1
- 241000219000 Populus Species 0.000 description 1
- 102000017742 Pumilio homology domains Human genes 0.000 description 1
- 108050005947 Pumilio homology domains Proteins 0.000 description 1
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 1
- 102000009572 RNA Polymerase II Human genes 0.000 description 1
- 108010009460 RNA Polymerase II Proteins 0.000 description 1
- 238000010357 RNA editing Methods 0.000 description 1
- 230000026279 RNA modification Effects 0.000 description 1
- 108700020471 RNA-Binding Proteins Proteins 0.000 description 1
- APLHEOBEIBHCHW-YQEJDHNASA-N Selagine Natural products O=C1NC2=C([C@]3(N)/C(=C/C)/[C@@H](CC(C)=C3)C2)C=C1 APLHEOBEIBHCHW-YQEJDHNASA-N 0.000 description 1
- ZRJBHWIHUMBLCN-UHFFFAOYSA-N Shuangyiping Natural products N1C(=O)C=CC2=C1CC1C(=CC)C2(N)CC(C)=C1 ZRJBHWIHUMBLCN-UHFFFAOYSA-N 0.000 description 1
- 241000209140 Triticum Species 0.000 description 1
- 235000021307 Triticum Nutrition 0.000 description 1
- 241000589634 Xanthomonas Species 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 230000002378 acidificating effect Effects 0.000 description 1
- 239000013543 active substance Substances 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 230000003466 anti-cipated effect Effects 0.000 description 1
- 230000008827 biological function Effects 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 229960002685 biotin Drugs 0.000 description 1
- 235000020958 biotin Nutrition 0.000 description 1
- 239000011616 biotin Substances 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 238000000546 chi-square test Methods 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 238000000975 co-precipitation Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 108091036078 conserved sequence Proteins 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 108010004031 deoxyribonuclease A Proteins 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 239000000539 dimer Substances 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 239000012636 effector Substances 0.000 description 1
- 230000013020 embryo development Effects 0.000 description 1
- 230000008011 embryonic death Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000009088 enzymatic function Effects 0.000 description 1
- 239000012091 fetal bovine serum Substances 0.000 description 1
- 238000012239 gene modification Methods 0.000 description 1
- ZRJBHWIHUMBLCN-YQEJDHNASA-N huperzine A Chemical compound N1C(=O)C=CC2=C1C[C@H]1\C(=C/C)[C@]2(N)CC(C)=C1 ZRJBHWIHUMBLCN-YQEJDHNASA-N 0.000 description 1
- 230000002209 hydrophobic effect Effects 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 230000002779 inactivation Effects 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 230000003834 intracellular effect Effects 0.000 description 1
- 125000000468 ketone group Chemical group 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000004060 metabolic process Effects 0.000 description 1
- 239000000178 monomer Substances 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 210000004940 nucleus Anatomy 0.000 description 1
- 210000003463 organelle Anatomy 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- 229920005630 polypropylene random copolymer Polymers 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- ZRJBHWIHUMBLCN-BMIGLBTASA-N rac-huperzine A Natural products N1C(=O)C=CC2=C1C[C@@H]1C(=CC)[C@@]2(N)CC(C)=C1 ZRJBHWIHUMBLCN-BMIGLBTASA-N 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 210000001519 tissue Anatomy 0.000 description 1
- 238000001890 transfection Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- ZSDSQXJSNMTJDA-UHFFFAOYSA-N trifluralin Chemical compound CCCN(CCC)C1=C([N+]([O-])=O)C=C(C(F)(F)F)C=C1[N+]([O-])=O ZSDSQXJSNMTJDA-UHFFFAOYSA-N 0.000 description 1
- 150000003668 tyrosines Chemical class 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/415—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8201—Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
- C12N15/8213—Targeted insertion of genes into the plant genome by homologous recombination
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8216—Methods for controlling, regulating or enhancing expression of transgenes in plant cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8216—Methods for controlling, regulating or enhancing expression of transgenes in plant cells
- C12N15/8217—Gene switch
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/80—Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y301/00—Hydrolases acting on ester bonds (3.1)
- C12Y301/21—Endodeoxyribonucleases producing 5'-phosphomonoesters (3.1.21)
- C12Y301/21004—Type II site-specific deoxyribonuclease (3.1.21.4)
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- Biomedical Technology (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Biophysics (AREA)
- Microbiology (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Cell Biology (AREA)
- Medicinal Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Gastroenterology & Hepatology (AREA)
- Botany (AREA)
- Peptides Or Proteins (AREA)
- Analytical Chemistry (AREA)
- Enzymes And Modification Thereof (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Immunology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Organic Low-Molecular-Weight Compounds And Preparation Thereof (AREA)
- Investigating Or Analysing Biological Materials (AREA)
- Catching Or Destruction (AREA)
Abstract
[Problema] Com base na previsão de que as regras para reconhecimento de DNA dotadas de um motivo de PPR podem também ser usadas no reconhecimento de DNA, realizar a análise de proteína PPR que está ativa em ligação de DNA, e pesquisar uma proteína PPR que tem tais características. A presente invenção aborda o problema acima mencionado por meio de uma proteína que pode ligar seletivamente à base de DNA ou especificamente à sequência de base de DNA, e que contém uma pluralidade de, preferivelmente 2-30, mais preferivelmente 5-25, e ainda mais preferivelmente 9-15, motivos de PPR tendo a estrutura na fórmula 1 (na fórmula 1: Hélice A é uma parte que pode formar uma estrutura em a-hélice; X é uma parte que não existe ou que compreende 1-9 aminoácidos; Hélice B é uma parte que pode formar uma estrutura em a-hélice; e L é uma parte que compreende 2-7 aminoácidos), o motivo de PPR tendo uma combinação específica de três aminoácidos que correspondem à base de DNA ou sequência de bases alvo: primeiro A.A. de Hélice A e quarto A.A. da Hélice A na fórmula 1, juntamente com o "ii" (-2)-ésimo A.A. contido em L. (Hélice A)-X-(Hélice B)-L (fórmula 1).
Description
[001] A presente invenção se refere a uma proteína que pode seletiva ou especificamente se ligar a uma base de DNA ou sequência de DNA alvo. De acordo com a presente invenção, um motivo de repetição de pentatricopeptídeo (PPR) é utilizado. A presente invenção pode ser usada para identificação e projeto de uma proteína de ligação ao DNA, identificação de um DNA alvo de uma proteína com um motivo de PPR, e controle funcional de DNA. A presente invenção é útil nos campos de medicina, ciência agrícola, e assim por diante. A presente invenção também se refere a uma enzima de clivagem de DNA inédita que utiliza um complexo de uma proteína contendo um motivo de PPR e uma proteína que define uma região funcional.
[002] Nos últimos anos, técnicas de ligação de ácido nucleico - ligação de fatores de proteína elucidadas através de várias análises a uma sequência visada foram estabelecidas, e elas estão prestes a ser usadas. O uso desta ligação específica à sequência está possibilitando a análise de localização intracelular de um ácido nucleico alvo (DNA ou RNA), eliminação de uma sequência de DNA alvo, ou controle de expressão (ativação ou inativação) de um gene que codifica proteína existente à jusante de uma sequência de DNA alvo.
[003] Estão sendo conduzidas pesquisas e desenvolvimentos usando a proteína dedo de zinco (Documentos de não patente 1 e 2), efetor TAL (TALE, Documento de Não Patente 3, Documento de patente 1), e CRISPR (Documentos de não patente 4 e 5) como fatores de proteína que agem no DNA como materiais para projetar proteína. Entretanto, os tipos de tais fatores de proteína são ainda extremamente limitados.
[004] Por exemplo, a enzima artificial, nuclease dedo de zinco (ZFN), conhecida como uma enzima de clivagem de DNA artificial, é uma proteína quimera obtida ligando uma parte que é constituída ligando 3 a 6 dedos de zinco que reconhecem especificamente um DNA consistindo em 3 ou 4 nucleotídeos, e se liga nele, e reconhece uma sequência de nucleotídeos em uma unidade da sequência de 3 ou 4 nucleotídeos com um domínio de clivagem de DNA de uma enzima de clivagem de DNA bacteriana (por exemplo, FokI) (Documento de Não Patente 2). Em uma proteína quimera como esta, o domínio de dedo de zinco é um domínio de proteína que é conhecido por se ligar no DNA, e é baseado no conhecimento de que muitos fatores de transcrição têm o domínio supramencionado, e se ligam a uma sequência de DNA específica para controlar a expressão de um gene. Usando duas das ZFNs, cada qual com três dedos de zinco, clivagem de um sítio por 70 bilhões de nucleotídeos pode ser induzida na teoria.
[005] Entretanto, em virtude do alto custo exigido para a produção de ZFNs, etc., os métodos usando ZFNs não chegaram a ser amplamente usados ainda. Além disso, eficiência de classificação funcional de ZFNs é ruim, e é sugerido que os métodos têm um problema também a este respeito. Além disso, uma vez que um domínio de dedo de zinco consistindo em n dos dedos de zinco tende a reconhecer uma sequência de (GNN)n, os métodos também têm um problema de que o grau de liberdade para a sequência genética alvo é baixo.
[006] Uma enzima artificial, TALEN, foi também desenvolvida ligando uma proteína consistindo em uma sequência combinatória de partes de módulo que pode reconhecer cada nucleotídeo, efetor TAL (TALE), com um domínio de clivagem de DNA de uma enzima de clivagem de DNA bacteriana (por exemplo, FokI), e está sendo investigada como uma enzima artificial que pode substituir ZFNs (Documento de Não Patente 3). Esta TALEN é uma enzima gerada fundindo um domínio de ligação de DNA de um fator de transcrição de uma bactéria Xanthomonas de planta patogênica, e o domínio de clivagem de DNA da enzima de restrição de DNA FokI, e é conhecida por se ligar a uma sequência de DNA vizinha para formar um dímero e clivar um DNA de fita dupla. Uma vez que, como para esta molécula, o domínio de ligação de DNA de TALE encontrado de uma bactéria que infecta com plantas reconhece uma base com uma combinação de aminoácidos em dois sítios no motivo TALE consistindo em 34 resíduos de aminoácidos, ela tem uma característica de que a propriedade de ligação para um DNA alvo pode ser escolhida escolhendo-se a estrutura de repetição do módulo TALE. TALEN usando o domínio de ligação de DNA que tem uma característica como esta anteriormente mencionada tem uma característica de que ela permite introdução de mutação em um gene alvo, como ZFNs, mas a significante superioridade da mesma para ZFNs é que o grau de liberdade para o gene alvo (sequência de nucleotídeos) é notadamente melhorado, e o nucleotídeo no qual ela se liga pode ser definido com um código.
[007] Entretanto, uma vez que a conformação total de TALEN não foi elucidada, o sítio de clivagem de DNA de TALEN não foi identificado até hoje. Portanto, tem um problema de que sítio de clivagem de TALEN é impreciso, e não é fixo, comparado com ZFNs, e também cliva mesmo uma sequência similar. Portanto, tem um problema de que uma sequência de nucleotídeos não pode ser precisamente clivada em um sítio alvo visado com uma enzima de clivagem de DNA. Por esses motivos, é desejável desenvolver e fornecer uma enzima de clivagem de DNA artificial inédita livre dos problemas supramencionados.
[008] Com base na informação da sequência genômica, proteínas PPR (proteínas com um motivo de repetição de pentatricopeptídeo (PPR)) constituindo uma grande família de não menos que 500 membros somente para plantas que foram identificadas (Documento de Não Patente 6). As proteínas PPR são proteínas codificadas no núcleo, mas são conhecidas por agir ou estar envolvidas no controle, clivagem, tradução, união, edição de RNA e estabilidade de RNA principalmente a um nível de RNA em organelas (cloroplastos e mitocôndria) de uma maneira específica do gene. As proteínas PPR tipicamente têm uma estrutura consistindo em cerca de 10 motivos de 35 aminoácidos contíguos de baixa capacidade conservativa, isto é, motivos de PPR, e é considerado que a combinação do motivo de PPRs é responsável pela ligação seletiva da sequência com RNA. Praticamente todas as proteínas PPR consistem somente em repetição de cerca de 10 motivos de PPR, e qualquer domínio necessário para exibir uma ação catalítica não é encontrado em muitos casos. Portanto, considera-se que as proteínas PPR são essencialmente adaptadores de RNA (Documento de Não Patente 7).
[009] Em geral, ligação de uma proteína e DNA, e ligação de uma proteína e RNA são obtidas por diferentes mecanismos moleculares. Portanto, uma proteína de ligação ao DNA geralmente não se liga ao RNA, ao passo que uma proteína de ligação de RNA geralmente não se liga ao DNA. Por exemplo, no caso da proteína pumilio, que é conhecida como um fator de ligação de RNA, e pode codificar RNA para ser reconhecida, ligação da mesma no DNA não foi reportada (Documentos de não patente 8 e 9).
[0010] Entretanto, no processo de investigar propriedades de vários tipos de proteínas PPR, ficou claro que poderia ser sugerido que alguns tipos das proteínas PPR funcionaram como fatores de ligação de DNA.
[0011] A p63 de aveia é uma proteína de PPR com 9 motivos de PPR, e é sugerido pelo ensaio de deslocamento de gel que ele se liga a DNA de uma maneira específica à sequência (Documento de Não Patente 10).
[0012] A proteína GUN1 de Arabidopsis thaliana tem 11 motivos de PPR, e é sugerido pelo ensaio de coprecipitação que ela se liga com DNA (Documento de Não Patente 11).
[0013] Foi demonstrado pelo ensaio de transcrição instantânea que a Arabidopsis thaliana pTac2 (proteína com 15 motivos de PPR, Documento de Não Patente 12) e Arabidopsis thaliana DG1 (proteína com 10 motivos de PPR, Documento de Não Patente 12) participam diretamente na transcrição para gerar RNA usando DNA como um molde, e considera-se que eles se ligam ao DNA.
[0014] Uma cepa de Arabidopsis thaliana deficiente no gene de GRP23 (proteína com 11 motivos de PPR, Documento de Não Patente 14) mostra o fenótipo de morte embriônica. Foi demonstrado que esta proteína fisicamente interage com a subunidade principal da polimerase de transcrição de RNA 2 eucariótica, que é uma enzima de transcrição de RNA dependente de DNA e, portanto, considera-se que GRP23 também age para se ligar ao DNA.
[0015] Entretanto, ligações dessas proteínas PPR ao DNA foram sugeridas apenas indiretamente, e a real ligação específica à sequência não foi totalmente verificada. Além disso, mesmo se tais proteínas se ligarem com DNA, considera-se geralmente que a ligação de uma proteína e DNA, e a ligação de uma proteína e RNA são obtidas por diferentes mecanismos moleculares e, portanto, qual tipo de regra de sequência existe especificamente, com a qual a ligação é obtida, etc., não são mesmo absolutamente esperados. Referências da Tecnologia Anterior Documentos Patentes Documento de patente 1: WO2011/072246 Documento de patente 2: WO2011/111829 DOCUMENTOS DE NÃO PATENTES Documento de Não Patente 1: Maeder, M.L., et al. (2008) Rapid "open-source" engineering of customized zinc-finger nucleases for highly efficient gene modification, Mol. Cell 31, 294-301 Documento de Não Patente 2: Urnov, F.D., et al. (2010) Genome editing with engineered zinc finger nucleases, Nature Review Genetics, 11, 636-646 Documento de Não Patente 3: Miller, J.C., et al. (2011) A TALE nuclease architecture for efficient genome editing, Nature Biotech., 29, 143-148 Documento de Não Patente 4: Mali P., et al. (2013) RNA- guided human genome engineering via Cas9, Science, 339, 823-826 Documento de Não Patente 5: Cong L., et al. (2013) Multiplex genome engineering using CRISPR/Cas systems, Science, 339, 819-823 Documento de Não Patente 6: Small, I.D. and Peeters, N. (2000) The PPR motif - a TPR-related motif prevalent in plant organellar proteins, Trends Biochem. Sci., 25, 46-47 Documento de Não Patente 7: Woodson, J.D., and Chory, J. (2008) Coordination of gene expression between organellar and nuclear genomes, Nature Rev. Genet., 9, 383-395 Documento de Não Patente 8: Wang, X., et al. (2002) Modular recognition of RNA by a human pumilio-homology domain, Cell, 110, 501512 Documento de Não Patente 9: Cheong, C.G., and Hall and T.M. (2006) Engineering RNA sequence specificity of Pumilio repeats, Proc. Natl. Acad. Sci. USA 103, 13635-13639 Documento de Não Patente 10: Ikeda T.M. and Gray M.W. (1999) Characterization of a DNA-binding protein implicated in transcription in wheat mitochondria, Mol. Cell Bio., l19 (12):8113-8122 Documento de Não Patente 11: Koussevitzky S., et al. (2007) Signals from chloroplasts converge to regulate nuclear gene expression, Science, 316:715-719 Documento de Não Patente 12: Pfalz J, et al. (2006) PTAC2, - 6, and -12 are components of the transcriptionally active plastid chromosome that are required for plastid gene expression, Plant Cell 18:176-197 Documento de Não Patente 13: Chi W, et al. (2008) The pentatricopeptide repeat protein DELAYED GREENING1 is involved in the regulation of early chloroplast development and chloroplast gene expression in Arabidopsis, Plant Physiol., 147:573-584 Documento de Não Patente 14: Ding YH, et al. (2006) Arabidopsis GLUTAMINE-RICH PROTEIN 23 is essential for early embryogenesis and encodes a novel nuclear PPR motif protein that interacts with RNA polymerase II subunit III, Plant Cell, 18:815-830 Sumário da Invenção
[0016] Os inventores da presente invenção esperaram que as propriedades das proteínas PPR (proteínas com um motivo de PPR) como adaptadores de RNA seriam determinadas pela propriedade de cada motivo de PPR constituindo as proteínas PPR e combinação de uma pluralidade de motivos de PPR, e propuseram métodos para modificar proteínas de ligação de RNA usando tais motivos de PPR (Documento de patente 2). Então, eles elucidaram que um motivo de PPR e RNA se ligam em correspondência um para um, motivos de PPR contíguos reconhecem bases de RNA contíguas em uma sequência de RNA, e tal reconhecimento de RNA é determinado pela combinação de aminoácidos em três posições específicas entre os 35 aminoácidos que constituem o motivo de PPR, e depositaram um pedido de patente para um método para projetar uma proteína de ligação de RNA customizada utilizando códigos de reconhecimento de RNA de motivos de PPR e uso da mesma (PCT/JP2012/077274; Yagi, Y., et al. (2013) PLoS One, 8, e57286; e Barkan, A., et al. (2012) PLoS Genet., 8, e1002910).
[0017] Foi em geral considerado que a ligação de uma proteína e DNA, e a ligação de uma proteína e RNA são obtidas por diferentes mecanismos moleculares. Entretanto, os inventores da presente invenção previram que a regra de reconhecimento de RNA do motivo de PPR seria também utilizável para reconhecimento de DNA, e analisaram proteínas PPR que agem para se ligar com DNA visando recuperar proteínas PPR com uma característica como esta. Eles também visaram fornecer uma enzima artificial inédita preparando uma proteína de ligação ao DNA customizada que se liga a uma sequência desejada usando uma proteína de PPR como esta que se liga especificamente a um DNA obtido da maneira aqui descrita, e usá-la com uma proteína que define uma região funcional, e fornecer uma enzima de clivagem de DNA artificial inédita usando-a junto com uma região dotada de uma atividade de clivagem de DNA como a região funcional.
[0018] Como para as proteínas PPR, foi elucidado por vários programas de pesquisa de domínio (Pfam, Prosite, Interpro, etc.) que os motivos de PPR contidos nas proteínas PPR do tipo que liga a RNA comuns e os motivos de PPR contidos nas proteínas PPR de ligação ao DNA de alguns tipos anteriormente mencionados não são particularmente distintos. Portanto, foi considerado que proteínas PPR podem conter aminoácidos (grupo de aminoácido) que determinariam uma propriedade de ligação para DNA ou uma propriedade de ligação para RNA além dos aminoácidos exigidos para o reconhecimento de ácido nucleico.
[0019] Os inventores da presente invenção elucidaram que um motivo de PPR de ligação no RNA e RNA se ligam em correspondência um para um, motivos de PPR contíguos reconhecem bases de RNA contíguas em uma sequência de RNA e, em tal reconhecimento, ligação seletiva da base com RNA é determinada combinação de aminoácidos de reconhecimento de RNA em três posições específicas (ou seja, o primeiro e quarto aminoácidos da primeira hélice (Hélice A) entre as duas estruturas em a-hélice constituindo o motivo (A.A. No. 1 e A.A. No. 4), e o segundo aminoácido contado a partir do terminal C (A.A. No. “ii” (-2))), entre os 35 aminoácidos constituindo o motivo de PPR, e depositaram um pedido de patente para um método para projetar uma proteína de ligação de RNA customizada utilizando códigos de reconhecimento de RNA de motivos de PPR e uso dos mesmos (PCT/JP2012/077274).
[0020] Então, entre as proteínas PPR, para a p63 de aveia supramencionada (Documento de Não Patente 11, a sequência de aminoácidos da proteína homóloga de Arabidopsis thaliana está mostrada como SEQ ID NO: 1), proteína GUN1 de Arabidopsis thaliana (Documento de Não Patente 12, sequência de aminoácidos da mesma está mostrada como SEQ ID NO: 2), pTac2 de Arabidopsis thaliana (Documento de Não Patente 13, sequência de aminoácidos da mesma está mostrada como SEQ ID NO: 3), DG1 (Documento de Não Patente 14, sequência de aminoácidos da mesma está mostrada como SEQ ID NO: 4), e GRP23 de Arabidopsis thaliana (Documento de Não Patente 15, sequência de aminoácidos da mesma está mostrada como SEQ ID NO: 5), para as quais ligação com DNA foi sugerida, frequências de aminoácido dos aminoácidos em três posições que levam os códigos de reconhecimento de ácido nucleico no motivo de PPR considerado ser importante quando RNA é um alvo (A.A. No. 1, A.A. No. 4 e A.A. No. “ii” (-2)) foram comparadas com aquelas encontradas no motivo do tipo que se liga ao RNA. Como um resultado, ficou claro que as tendências das frequências de aminoácido encontradas nesses motivos de PPR anteriormente mencionadas, para as quais propriedade de ligação de DNA foi sugerida, e os motivos do tipo que se liga ao RNA concordam substancialmente um com o outro.
[0021] Os resultados apresentados sugerem que os códigos de reconhecimento de ácido nucleico dos motivos de PPR do tipo que se liga ao RNA podem também ser aplicado aos motivos de PPR do tipo que se liga ao DNA. Timina (T) é um derivado de uracila (U) com uma estrutura consistindo em uracila (U) da qual carbono da posição 5 é metilado, como é também denominada 5-metiluracila. Uma característica como esta da base que constitui o ácido nucleico sugere que a combinação dos aminoácidos que reconhecem uracila (U) de um motivo de PPR do tipo que se liga ao RNA é usada para reconhecimento de timina (T) em DNA.
[0022] Com base nas descobertas supramencionadas, foi elucidado que, usando o p63 supramencionado (sequência de aminoácidos de SEQ ID NO: 1), proteína GUN1de Arabidopsis thaliana (sequência de aminoácidos de SEQ ID NO: 2), pTac2 de Arabidopsis thaliana (sequência de aminoácidos de SEQ ID NO: 3), DG1 (sequência de aminoácidos de SEQ ID NO: 4), e GRP23 de Arabidopsis thaliana (sequência de aminoácidos de SEQ ID NO: 5), que são proteínas PPR do tipo que se liga ao DNA, como um molde, arranjando aminoácidos das três posições (A.A. No. 1, A.A. No. 4 e A.A. No. “ii” (-2)) com aplicação da observação obtida para tais proteínas PPR como um resultado do exame dos motivos de PPR do tipo que se liga ao PPR, uma proteína de ligação ao DNA customizada que se liga a uma sequência de base de DNA arbitrária poderia ser produzida.
[0023] Ou seja, os inventores da presente invenção forneceram uma proteína que compreende 2 ou mais, preferivelmente 2 a 30, mais preferivelmente 5 a 25, acima de tudo preferivelmente 9 a 15, de motivos de PPR com os aminoácidos específicos descritos a seguir como os aminoácidos nas três posições (A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2)) nos motivos de PPR, e podem se ligar ao DNA de uma maneira seletiva da base de DNA ou de uma maneira seletiva da sequência de base de DNA, da qual exemplos típicos são as sequências de aminoácidos de SEQ ID NOS: 1 a 5, e assim desenvolveram a presente invenção.
[0024] A presente invenção fornece o seguinte.
[0025] [1] Uma proteína que pode se ligar de uma maneira seletiva da base de DNA ou de uma maneira específica à sequência de DNA, que contém um ou mais motivos de PPR com uma estrutura da fórmula 1 seguinte: (em que, na fórmula 1: Hélice A é uma parte que pode formar uma estrutura em α- hélice; X não existe, ou é uma parte consistindo em 1 a 9 aminoácidos; Hélice B é uma parte que pode formar uma estrutura em α- hélice; e L é uma parte consistindo em 2 a 7 aminoácidos, em que, sob as definições seguintes: o primeiro aminoácido da Hélice A é referido como aminoácido No. 1 (A.A. No. 1), o quarto aminoácido como aminoácido No. 4 (A.A. No. 4), e - quando um motivo de PPR seguinte (Mn+1) existe contiguamente no lado do terminal C do motivo de PPR (Mn) (quando não há inserção de aminoácido entre os motivos de PPR), o -2o aminoácido contado a partir da extremidade (lado do terminal C) dos aminoácidos que constituem o motivo de PPR (Mn); - quando um motivo de não-PPR consistindo em 1 a 20 aminoácidos existe entre o motivo de PPR (Mn) e o motivo de PPR seguinte (Mn+1) no lado do terminal C, o aminoácido localizando à montante do primeiro aminoácido do motivo de PPR seguinte (Mn+1) por 2 posições, isto é, o -2o aminoácido; ou - quando qualquer motivo de PPR seguinte (Mn+1) não existir no lado do terminal C do motivo de PPR (Mn), ou 21 ou mais aminoácidos que constituem um motivo de não-PPR existir entre o motivo de PPR (Mn) e o motivo de PPR seguinte (Mn+1) no lado do terminal C, o 2o aminoácido contado a partir da extremidade (lado do terminal C) dos aminoácidos que constituem o motivo de PPR (Mn) é referido como aminoácido No. “ii” (-2) (A.A. No. “ii” (-2)), um motivo de PPR (Mn) contido na proteína é um motivo de PPR com uma combinação específica de aminoácidos correspondendo a uma base de DNA alvo ou sequência de base de DNA alvo como os três aminoácidos de A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2)
[0026] [2] A proteína de acordo com [1], em que a combinação dos três aminoácidos de A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2) é uma combinação correspondendo a uma base de DNA alvo ou sequência de base de DNA alvo, e a combinação de aminoácidos é determinada de acordo com qualquer uma das definições seguintes: (1-1) quando A.A. No. 4 é glicina (G), A.A. No. 1 pode ser um aminoácido arbitrário, e A.A. No. “ii” (-2) é ácido aspártico (D), asparagina (N), ou serina (S); (1-2) quando A.A. No. 4 é isoleucina (I), cada qual de A.A. No. 1 e A.A. No. “ii” (-2) pode ser um aminoácido arbitrário; (1-3) quando A.A. No. 4 é leucina (L), cada qual de A.A. No. 1 e A.A. No. “ii” (-2) pode ser um aminoácido arbitrário; (1-4) quando A.A. No. 4 é metionina (M), cada qual de A.A. No. 1 e A.A. No. “ii” (-2) pode ser um aminoácido arbitrário; (1-5) quando A.A. No. 4 é asparagina (N), cada qual de A.A. No. 1 e A.A. No. “ii” (-2) pode ser um aminoácido arbitrário; (1-6) quando A.A. No. 4 é prolina (P), cada qual de A.A. No. 1 e A.A. No. “ii” (-2) pode ser um aminoácido arbitrário; (1-7) quando A.A. No. 4 é serina (S), cada qual de A.A. No. 1 e A.A. No. “ii” (-2) pode ser um aminoácido arbitrário; (1-8) quando A.A. No. 4 é treonina (T), cada qual de A.A. No. 1 e A.A. No. “ii” (-2) pode ser um aminoácido arbitrário; e (1-9) quando A.A. No. 4 é valina (V), cada qual de A.A. No. 1 e A.A. No. “ii” (-2) pode ser um aminoácido arbitrário.
[0027] [3] A proteína de acordo com [1], em que a combinação dos três aminoácidos de A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2) é uma combinação correspondendo a uma base de DNA alvo ou sequência de base de DNA alvo, e a combinação de aminoácidos é determinada de acordo com qualquer uma das definições seguintes: (2-1) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2) são um aminoácido arbitrário, glicina, e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a G; (2-2) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são ácido glutâmico, glicina, e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a G; (2-3) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são um aminoácido arbitrário, glicina e asparagina, respectivamente, o motivo de PPR se liga seletivamente a A; (2-4) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são ácido glutâmico, glicina e asparagina, respectivamente, o motivo de PPR se liga seletivamente a A; (2-5) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são um aminoácido arbitrário, glicina e serina, respectivamente, o motivo de PPR se liga seletivamente a A, e em seguida se liga a C; (2-6) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são um aminoácido arbitrário, isoleucina e um aminoácido arbitrário, respectivamente, o motivo de PPR se liga seletivamente a T e C; (2-7) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são um aminoácido arbitrário, isoleucina e asparagina, respectivamente, o motivo de PPR se liga seletivamente a T, e em seguida se liga a C; (2-8) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são um aminoácido arbitrário, leucina e um aminoácido arbitrário, respectivamente, o motivo de PPR se liga seletivamente a T e C; (2-9) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são um aminoácido arbitrário, leucina e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a C; (2-10) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são um aminoácido arbitrário, leucina e lisina, respectivamente, o motivo de PPR se liga seletivamente a T; (2-11) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são um aminoácido arbitrário, metionina e um aminoácido arbitrário, respectivamente, o motivo de PPR se liga seletivamente a T; (2-12) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são um aminoácido arbitrário, metionina e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a T; (2-13) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são isoleucina, metionina e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a T, e em seguida se liga a C; (2-14) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são um aminoácido arbitrário, asparagina e um aminoácido arbitrário, respectivamente, o motivo de PPR se liga seletivamente a C e T; (2-15) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são um aminoácido arbitrário, asparagina e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a T; (2-16) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são fenilalanina, asparagina e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a T; (2-17) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são glicina, asparagina e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a T; (2-18) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são isoleucina, asparagina e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a T; (2-19) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são treonina, asparagina e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a T; (2-20) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2) são valina, asparagina e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a T, e em seguida se liga a C; (2-21) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2) são tirosina, asparagina e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a T, e em seguida se liga a C; (2-22) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são um aminoácido arbitrário, asparagina, e asparagina, respectivamente, o motivo de PPR se liga seletivamente a C; (2-23) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são isoleucina, asparagina, e asparagina, respectivamente, o motivo de PPR se liga seletivamente a C; (2-24) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são serina, asparagina, e asparagina, respectivamente, o motivo de PPR se liga seletivamente a C; (2-25) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são valina, asparagina, e asparagina, respectivamente, o motivo de PPR se liga seletivamente a C; (2-26) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são um aminoácido arbitrário, asparagina e serina, respectivamente, o motivo de PPR se liga seletivamente a C; (2-27) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são valina, asparagina e serina, respectivamente, o motivo de PPR se liga seletivamente a C; (2-28) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são um aminoácido arbitrário, asparagina e treonina, respectivamente, o motivo de PPR se liga seletivamente a C; (2-29) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são valina, asparagina e treonina, respectivamente, o motivo de PPR se liga seletivamente a C; (2-30) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são um aminoácido arbitrário, asparagina e triptofano, respectivamente, o motivo de PPR se liga seletivamente a C, e em seguida se liga a T; (2-31) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são isoleucina, asparagina e triptofano, respectivamente, o motivo de PPR se liga seletivamente a T, e em seguida se liga a C; (2-32) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são um aminoácido arbitrário, prolina e um aminoácido arbitrário, respectivamente, o motivo de PPR se liga seletivamente a T; (2-33) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são um aminoácido arbitrário, prolina e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a T; (2-34) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são fenilalanina, prolina e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a T; (2-35) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são tirosina, prolina e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a T; (2-36) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são um aminoácido arbitrário, serina e um aminoácido arbitrário, respectivamente, o motivo de PPR se liga seletivamente a A e G; (2-37) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são um aminoácido arbitrário, serina e asparagina, respectivamente, o motivo de PPR se liga seletivamente a A; (2-38) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são fenilalanina, serina e asparagina, respectivamente, o motivo de PPR se liga seletivamente a A; (2-39) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são valina, serina e asparagina, respectivamente, o motivo de PPR se liga seletivamente a A; (2-40) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são um aminoácido arbitrário, treonina e um aminoácido arbitrário, respectivamente, o motivo de PPR se liga seletivamente a A e G; (2-41) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são um aminoácido arbitrário, treonina e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a G; (2-42) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são valina, treonina e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a G; (2-43) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são um aminoácido arbitrário, treonina e asparagina, respectivamente, o motivo de PPR se liga seletivamente a A; (2-44) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são fenilalanina, treonina e asparagina, respectivamente, o motivo de PPR se liga seletivamente a A; (2-45) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são isoleucina, treonina e asparagina, respectivamente, o motivo de PPR se liga seletivamente a A; (2-46) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são valina, treonina e asparagina, respectivamente, o motivo de PPR se liga seletivamente a A; (2-47) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são um aminoácido arbitrário, valina e um aminoácido arbitrário, respectivamente, o motivo de PPR que se liga com A, C e T, mas não se liga a G; (2-48) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são isoleucina, valina e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a C, e em seguida se liga a UM; (2-49) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são um aminoácido arbitrário, valina e glicina, respectivamente, o motivo de PPR se liga seletivamente a C; e (2-50) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são um aminoácido arbitrário, valina e treonina, respectivamente, o motivo de PPR se liga seletivamente a T.
[0028] [4] A proteína de acordo com qualquer um de [1] a [3], que contém 2 a 30 dos motivos de PPR (Mn) como definidos em [1].
[0029] [5] A proteína de acordo com qualquer um de [1] a [3], que contém 5 a 25 dos motivos de PPR (Mn) como definidos em [1].
[0030] [6] A proteína de acordo com qualquer um de [1] a [3], que contém 9 a 15 dos motivos de PPR (Mn) como definidos em [1].
[0031] [7] A proteína de PPR de acordo com [6], que consiste em uma sequência selecionada a partir da sequência de aminoácidos de SEQ ID NO: 1 contendo 9 motivos de PPR, a sequência de aminoácidos de SEQ ID NO: 2 contendo 11 motivos de PPR, a sequência de aminoácidos de SEQ ID NO: 3 contendo 15 motivos de PPR, a sequência de aminoácidos de SEQ ID NO: 4 contendo 10 motivos de PPR, e a sequência de aminoácidos de SEQ ID NO: 5 contendo 11 motivos de PPR.
[0032] [8] Um método para identificar uma base de DNA ou sequência de base de DNA que serve como um alvo de uma proteína de ligação ao DNA contendo um ou mais (preferivelmente 2 a 30) motivos de PPR (Mn) como definidos em [1], em que: a base de DNA ou sequência de base de DNA é identificada através da determinação presença ou ausência de uma base de DNA que corresponde a uma combinação dos três aminoácidos de A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2) do motivo de PPR com base em qualquer uma das definições (1-1) a (1-9) mencionadas em [2], e (2-1) a (2-50) mencionadas em [3].
[0033] [9] Um método para identificar uma proteína de PPR contendo um ou mais (preferivelmente 2 a 30) motivos de PPR (Mn) como definidos em [1] que pode se ligar a uma base de DNA alvo ou DNA alvo com uma sequência de base específica, em que: a proteína de PPR é identificada através da determinação presença ou ausência de uma combinação dos três aminoácidos de A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2) que corresponde à base de DNA alvo ou uma base específica que constitui o DNA alvo com base em qualquer uma das definições (1-1) a (1-9) mencionadas em [2], e (2-1) a (2-50) mencionadas em [3].
[0034] [10] Um método para controlar uma função de DNA, que usa a proteína de acordo com [1].
[0035] [11] Um complexo consistindo em uma região compreendendo a proteína de acordo com [1], e uma região funcional juntamente ligada.
[0036] [12] O complexo de acordo com [11], em que a região funcional é fundida na proteína de acordo com [1] no lado do terminal C da proteína.
[0037] [13] O complexo de acordo com [11] ou [12], em que a região funcional é uma enzima de clivagem de DNA, ou um domínio de nuclease da mesma, ou um domínio de controle de transcrição, e o complexo funciona como uma enzima de clivagem de DNA alvo específica à sequência ou fator de controle de transcrição.
[0038] [14] O complexo de acordo com [13], em que a enzima de clivagem de DNA é o domínio de nuclease de FokI (SEQ ID NO: 6).
[0039] [15] Um método para modificar uma substância genética de uma célula compreendendo as seguintes etapas: preparar uma célula contendo um DNA tendo uma sequência alvo; e introduzir o complexo de acordo com [11] na célula de forma que a região do complexo consistindo na proteína se liga ao DNA tendo uma sequência alvo e, portanto, a região funcional modifica o DNA tendo uma sequência alvo.
[0040] [16] Um método para identificar, reconhecer ou alveja uma base de DNA ou DNA tendo uma sequência de base específica usando uma proteína de PPR contendo um ou mais motivos de PPR.
[0041] [17] O método de acordo com [16], em que a proteína contém um ou mais motivos de PPR nos quais três aminoácidos entre os aminoácidos que constituem o motivo constituem uma combinação específica de aminoácidos.
[0042] [18] O método de acordo com [16] ou [17], em que a proteína contém um ou mais motivos de PPR (Mn) como definidos em [1].
[0043] De acordo com a presente invenção, um motivo de PPR que pode se ligar a uma base de DNA alvo e uma proteína contendo-o podem ser providos. Pelo arranjo de dois ou mais motivos de PPR, uma proteína que pode se ligar a um DNA alvo com uma sequência ou comprimento arbitrário pode ser provida.
[0044] De acordo com a presente invenção, um DNA alvo de uma proteína de PPR arbitrária pode ser previsto e identificado e, ao contrário, uma proteína de PPR que se liga a um DNA arbitrário pode ser prevista e identificada. Previsão de uma sequência de DNA alvo como esta esclarece a identidade genética da mesma, e aumenta a possibilidade de uso da mesma. Além disso, de acordo com a presente invenção, funcionalidades de genes homólogos de um gene de uma proteína de PPR industrialmente útil que apresenta polimorfismo de aminoácido a um alto nível podem ser determinadas com base na diferença das sequências de base de DNA alvo da mesma.
[0045] Além disso, de acordo com a presente invenção, uma enzima de clivagem de DNA inédita usando um motivo de PPR pode também ser provida. Ou seja, ligando uma proteína como uma região funcional com o motivo de PPR ou proteína de PPR provida pela presente invenção, um complexo contendo uma proteína com uma atividade de ligação para uma sequência de ácido nucleico específica, e uma proteína com uma funcionalidade específica podem ser preparadas.
[0046] A região funcional utilizável na presente invenção é uma que pode conferir, entre várias funções, uma função para qualquer uma de clivagem, transcrição, replicação, restauração, síntese, modificação, etc. de DNA. Pela escolha da sequência dos motivos de PPR, que é a característica da presente invenção, para determinar uma sequência de base de DNA como um alvo, praticamente todas as sequências de DNA podem ser usadas como um alvo, e edição de genoma usando uma função da região funcional tais como aquelas para clivagem, transcrição, replicação, restauração, síntese, modificação, etc. de DNA pode ser realizada com um alvo como este.
[0047] Por exemplo, quando a região funcional tem uma função para clivar DNA, um complexo compreendendo uma parte de proteína de PPR preparada de acordo com a presente invenção e uma região de clivagem de DNA juntamente ligada é provido. Um complexo como este pode funcionar como uma enzima de clivagem de DNA artificial, que reconhece uma sequência de base de DNA como um alvo com a parte de proteína de PPR, e então cliva DNA com a região para clivar DNA. Quando a região funcional tem uma função de controle de transcrição, um complexo compreendendo uma parte de proteína de PPR preparada de acordo com a presente invenção e uma região de controle de transcrição para DNA juntamente ligada é provido. Um complexo como este pode funcionar como um fator de controle de transcrição artificial, que reconhece uma sequência de base de DNA como um alvo com a parte de proteína de PPR, e então promove transcrição do DNA alvo.
[0048] A presente invenção pode adicionalmente ser utilizada para um método para dispensar o complexo supramencionado em um corpo vivo de forma que o complexo funciona no corpo vivo, e preparação de transformantes utilizando uma sequência de ácido nucleico (DNA e RNA) que codifica uma proteína obtida de acordo com a presente invenção, bem como modificação, controle e comunicação específica de uma função em várias situações em organismos (células, tecidos e indivíduos).
[0049] [Fig. 1] Fig. 1 mostra sequências conservadas e números de aminoácido do motivo de PPR. Fig. 1A mostra os aminoácidos que constituem o motivo de PPR definido na presente invenção, e os números de aminoácido do mesmo. Fig. 1B mostra posições de três aminoácidos (A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2)) que controlam seletividade da base de ligação na estrutura prevista. Fig. 1C mostra dois exemplos da estrutura do motivo de PPR, e as posições dos aminoácidos na estrutura prevista para cada caso. A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2) são indicados com bastões de cor magenta (cinza escuro no caso de exibição monocrática) nos diagramas conformacionais da proteína.
[0050] [Fig. 2] Fig. 2 sumariza os esboços das estruturas de Arabidopsis thaliana p63 (sequência de aminoácidos de SEQ ID NO: 1), a proteína GUN1 de Arabidopsis thaliana (sequência de aminoácidos de SEQ ID NO: 2), pTac2 de Arabidopsis thaliana (sequência de aminoácidos de SEQ ID NO: 3), DG1 (sequência de aminoácidos de SEQ ID NO: 4), e GRP23 de Arabidopsis thaliana (sequência de aminoácidos de SEQ ID NO: 5), que são proteínas PPR do tipo que se liga ao DNA que funcionam no metabolismo de DNA, e o esboço do sistema de ensaio para demonstrar que elas se ligam ao DNA.
[0051] [Fig. 3] Fig. 3 sumariza as frequências de aminoácido dos aminoácidos nas três posições que levam os códigos de reconhecimento de ácido nucleico no motivo de PPR (A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (2)) para os motivos de PPR das proteínas PPR (SEQ ID NOS: 1 a 5), para os quais propriedade de ligação de DNA foi sugerida, e motivos do tipo de ligação ao RNA conhecidos.
[0052] [Fig. 4-1] Fig. 4-1 mostra as posições dos motivos de PPR incluídos no lado de fora das proteínas, e as posições dos três aminoácidos que levam os códigos de reconhecimento de ácido nucleico (A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2)) nos motivos de PPR para cada qual de (A) Arabidopsis thaliana p63 (sequência de aminoácidos de SEQ ID NO: 1) e (B) a proteína GUN1 de Arabidopsis thaliana (sequência de aminoácidos de SEQ ID NO: 2.
[0053] [Fig. 4-2] Fig. 4-2 mostra as posições dos motivos de PPR incluído no interior das proteínas, e as posições dos três aminoácidos que levam os códigos de reconhecimento de ácido nucleico (A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2)) nos motivos de PPR para cada qual de (C) pTac2 de Arabidopsis thaliana (sequência de aminoácidos de SEQ ID NO: 3), e (D) DG1 (sequência de aminoácidos de SEQ ID NO: 4).
[0054] [Fig. 4-3] Fig. 4-3 mostra as posições dos motivos de PPR incluído no interior das proteínas, e as posições dos três aminoácidos que levam os códigos de reconhecimento de ácido nucleico (A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2)) nos motivos de PPR para (E) GRP23 de Arabidopsis thaliana (sequência de aminoácidos de SEQ ID NO: 5).
[0055] [Fig. 5] Fig. 5 mostra a avaliação da capacidade de ligação de DNA específica à sequência das moléculas de PPR. Fatores de transcrição artificiais foram preparados focando cada qual dos três tipos de moléculas de PPR do tipo que liga a DNA (assim consideradas) com VP64, que é um domínio de ativação de transcrição, e se elas poderiam ativar um repórter da luciferase com cada sequência alvo foram examinados em uma célula cultivada de humano.
[0056] [Fig. 6] Fig. 6 mostra a comparação das atividades de luciferase observadas pela cointrodução de pTac2-VP64 ou GUN1-VP64 com pminCMV-luc2 como um controle negativo, ou um vetor repórter compreendendo 4 ou 8 sequências alvos. Como um resultado, foi observada uma tendência de que a atividade aumentou com o aumento da sequência alvo para ambas as moléculas, e assim verificou-se que essas moléculas PPR-VP64 se ligaram especificamente em cada sequência alvo para funcionar como um ativador de transcrição específico do sítio. Modos Para Realizar a Invenção [Motivo de PPR e proteína de PPR]
[0057] O "motivo de PPR" referido na presente invenção significa um polipeptídeo constituído com 30 a 38 aminoácidos e com uma sequência de aminoácidos que mostra, quando a sequência de aminoácidos é analisada com um programa de pesquisa de domínio de proteína na rede (por exemplo, Pfam, Prosite, Uniprot, etc.), um valor E não maior que um valor predeterminado (desejavelmente E-03) obtido em PF01535 no caso de Pfam (http://pfam.sanger.ac.uk/), ou PS51375 no caso de Prosite (http://www.expasy.org/Prosite/), a menos que de outra forma indicado. Os motivos de PPR em várias proteínas são também definidos na base de dados do Uniprot (http://www.uniprot.org).
[0058] Embora a sequência de aminoácidos do motivo de PPR não seja altamente conservada no motivo de PPR da presente invenção, uma estrutura secundária como esta de hélice, laço, hélice, e laço mostrada pela fórmula seguinte é igualmente conservada. [Fórmula 2] (Hélice A)-X-(Hélice B)-L (Fórmula 1)
[0059] Os números de posição dos aminoácidos que constituem o motivo de PPR definidos na presente invenção são de acordo com aqueles definidos em um trabalho dos inventores da presente invenção (Kobayashi K, et al., Nucleic Acids Res., 40, 2712-2723 (2012)). Ou seja, os números de posição dos aminoácidos que constituem o motivo de PPR definido na presente invenção são substancialmente os mesmos números de aminoácido definidos para PF01535 em Pfam, mas correspondem aos números obtidos subtraindo 2 dos números de aminoácido definidos para PS51375 em Prosite (por exemplo, a posição 1 de acordo com a presente invenção é a posição 3 de PS51375), e também correspondem aos números obtidos subtraindo 2 dos números de aminoácido do motivo de PPR definidos em Uniprot.
[0060] Mais precisamente, na presente invenção, o aminoácido No. 1 é o primeiro aminoácido a partir do qual a Hélice A mostrada na fórmula 1 se inicia. O aminoácido No. 4 é o quarto aminoácido contado a partir do aminoácido No. 1. Como para o "ii" (-2)-ésimo aminoácido, - quando um motivo de PPR seguinte (Mn+1) existe contiguamente no lado do terminal C do motivo de PPR (Mn) (quando não há inserção de aminoácido entre os motivos de PPR, como nos casos, por exemplo, dos Motivos Nos. 1, 2, 3, 4, 6 e 7 na Fig. 4-1 (A)), o -2o aminoácido contado a partir da extremidade (lado do terminal C) dos aminoácidos que constituem o motivo de PPR (Mn) é referido como aminoácido No. “ii” (-2); - quando um motivo de não-PPR (parte que não é o motivo de PPR) consistindo em 1 a 20 aminoácidos existe entre o motivo de PPR (Mn) e o motivo de PPR seguinte (Mn+1) no lado do terminal C (como nos casos, por exemplo, dos Motivos Nos. 5 e 8 na Fig. 4-1 (A), e Motivos Nos. 1, 2, 7 e 8 na Fig. 4-3 (D)), o aminoácido localizando à montante do primeiro aminoácido do motivo de PPR seguinte (Mn+1) por 2 posições, isto é, o -2o aminoácido, é referido como aminoácido No. “ii” (-2) (referir-se à Fig.1); ou - quando qualquer motivo de PPR seguinte (Mn+1) não existir no lado do terminal C do motivo de PPR (Mn) (como nos casos, por exemplo, do Motivo No. 9 na Fig. 4-1 (A), e o Motivo No. 11 na Fig. 4-1 (B)), ou 21 ou mais aminoácidos que constituem um motivo de não-PPR existir entre o motivo de PPR (Mn) e o motivo de PPR seguinte (Mn+1) no lado do terminal C, o 2o aminoácido contado a partir da extremidade (lado do terminal C) dos aminoácidos que constituem o motivo de PPR (Mn) é referido como aminoácido No. “ii” (-2).
[0061] A "proteína de PPR" referida na presente invenção significa uma proteína de PPR com dois ou mais dos motivos de PPR supramencionados, a menos que de outra forma indicado. O termo "proteína" usado nesta especificação significa qualquer substância consistindo em um polipeptídeo (cadeia consistindo em dois ou mais aminoácidos ligados através de ligações de peptídeo), e também inclui aqueles consistindo em um polipeptídeo de peso molecular relativamente baixo, a menos que de outra forma indicado. O "aminoácido" referido na presente invenção significa uma molécula de aminoácido usual, bem como um resíduo de aminoácido constituindo uma cadeia de peptídeo. O que o termo significa ficará aparente aos versados na técnica pelo contexto.
[0062] Muitas proteínas PPR existem em plantas, e 500 proteínas e cerca de 5000 motivos podem ser encontrados em Arabidopsis thaliana. Motivos de PPR e proteínas PPR de várias sequências de aminoácidos também existem em muitas plantas terrestres tais como arroz, álamo e selaginelácea. É sabido que algumas proteínas PPR são importantes fatores para obter sementes F1 para vigor híbrido tais como fatores de restauração de fertilidade que são envolvidos na formação de pólen (gameta masculino). Foi esclarecido que algumas proteínas PPR são envolvidas na evolução de novas espécies, similarmente na restauração da fertilidade. Foi também esclarecido que praticamente todas as proteínas PPR agem em RNA em mitocôndria ou cloroplastos.
[0063] É sabido que, em animais, anomalia da proteína de PPR identificada como LRPPRC causa síndrome de Leigh franco-canadense (LSFC, síndrome de Leigh, encefalomielopatia necrotizante subaguda).
[0064] O termo "seletivo" usado para uma propriedade de um motivo de PPR para ligação com uma base de DNA na presente invenção significa que uma atividade de ligação para qualquer uma base entre as bases de DNA é maior que as atividades de ligação para as outras bases, a menos que de outra forma indicado. Versados na técnica podem confirmar esta seletividade planejando um experimento, ou esta pode também ser obtida por cálculo, como descrito nos exemplos mencionados nesta especificação.
[0065] A base de DNA referida na presente invenção significa uma base de desoxirribonucleotídeo constituindo DNA e, especificamente, significa qualquer de adenina (A), guanina (G), citosina (C) e timina (T), a menos que de outra forma indicado. Embora a proteína de PPR possa ter seletividade para uma base em DNA, ela não se liga a um monômero de ácido nucleico.
[0066] Embora métodos de pesquisa de sequência de aminoácidos conservada como o motivo de PPR tenham sido estabelecidos antes que a presente invenção fosse concluída, qualquer regra concernente à ligação seletiva com base de DNA não foi absolutamente descoberta. [Descobertas providas pela presente invenção]
[0067] As descobertas seguintes são providas pela presente invenção. (1) Informação a respeito de posições de aminoácidos importantes para ligação seletiva
[0068] Especificamente, sob as definições seguintes: o primeiro aminoácido da Hélice A do motivo de PPR é referido como aminoácido No. 1 (A.A. No. 1), o quarto aminoácido como aminoácido No. 4 (A.A. No. 4), e - quando um motivo de PPR seguinte (Mn+1) existe contiguamente no lado do terminal C do motivo de PPR (Mn) (quando não há inserção de aminoácido entre os motivos de PPR), o -2o aminoácido contado a partir da extremidade (lado do terminal C) dos aminoácidos que constituem o motivo de PPR (Mn); - quando um motivo de não-PPR consistindo em 1 a 20 aminoácidos existe entre o motivo de PPR (Mn) e o motivo de PPR seguinte (Mn+1) no lado do terminal C, o aminoácido localizando à montante do primeiro aminoácido do motivo de PPR seguinte (Mn+1) por 2 posições, isto é, o -2o aminoácido; ou - quando qualquer motivo de PPR seguinte (Mn+1) não existir no lado do terminal C do motivo de PPR (Mn), ou 21 ou mais aminoácidos que constituem um motivo de não-PPR existir entre o motivo de PPR (Mn) e o motivo de PPR seguinte (Mn+1) no lado do terminal C, o 2o aminoácido contado a partir da extremidade (lado do terminal C) dos aminoácidos que constituem o motivo de PPR (Mn) é referido como aminoácido No. “ii” (-2) (A.A. No. “ii” (-2)), combinação dos três aminoácidos, o primeiro e quarto aminoácidos da hélice (Hélice A), e os aminoácidos No. i e No. 4, e A.A. No. “ii” (-2) definidos anteriormente (A.A. No. 1, A.A. No. 4 e A.A. No. “ii” (-2)), é importante para ligação seletiva a uma base de DNA, e em qual tipo de base de DNA o motivo se liga podem ser determinados com base na combinação.
[0069] A presente invenção é baseada nas descobertas relativas a combinação dos três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (2), descobertos pelos inventores da presente invenção. Especificamente: (1-1) quando A.A. No. 4 é glicina (G), A.A. No. 1 pode ser um aminoácido arbitrário, A.A. No. “ii” (-2) é ácido aspártico (D), asparagina (N), ou serina (S), e a combinação de A.A. No. 1, e A.A. No. “ii” (-2) pode ser, por exemplo: - uma combinação de um aminoácido arbitrário e ácido aspártico (D) (*GD), - preferivelmente uma combinação de ácido glutâmico (E) e ácido aspártico (D) (EGD), - uma combinação de um aminoácido arbitrário e asparagina (N) (*GN), - preferivelmente uma combinação de ácido glutâmico (E) e asparagina (N) (EGN), ou - uma combinação de um aminoácido arbitrário e serina (S) (*GS); - 1-2) quando A.A. No. 4 é isoleucina (I), cada qual de A.A. No. 1 e A.A. No. “ii” (-2) pode ser um aminoácido arbitrário, e a combinação de A.A. No. 1, e A.A. No. “ii” (-2) pode ser, por exemplo: - uma combinação de um aminoácido arbitrário e asparagina (N) (*EM); - 1-3) quando A.A. No. 4 é leucina (L), cada qual de A.A. No. 1 e A.A. No. “ii” (-2) pode ser um aminoácido arbitrário, e a combinação de A.A. No. 1, e A.A. No. “ii” (-2) pode ser, por exemplo: - uma combinação de um aminoácido arbitrário e ácido aspártico (D) (*LD), ou - uma combinação de um aminoácido arbitrário e lisina (K) (*LK); - 1-4) quando A.A. No. 4 é metionina (M), cada qual de A.A. No. 1 e A.A. No. “ii” (-2) pode ser um aminoácido arbitrário, e a combinação de A.A. No. 1, e A.A. No. “ii” (-2) pode ser, por exemplo: - uma combinação de um aminoácido arbitrário e ácido aspártico (D) (*MD), ou - uma combinação de isoleucina (I) e ácido aspártico (D) (IMD); - 1-5) quando A.A. No. 4 é asparagina (N), cada qual de A.A. No. 1 e A.A. No. “ii” (-2) pode ser um aminoácido arbitrário, e a combinação de A.A. No. 1, e A.A. No. “ii” (-2) pode ser, por exemplo: - uma combinação de um aminoácido arbitrário e ácido aspártico (D) (*ND), - uma combinação de qualquer um de fenilalanina (F), glicina (G), isoleucina (I), treonina (T), valina (V) e tirosinas (Y), e ácido aspártico (D) (FND, GND, IND, TND, VND ou YND), - uma combinação de um aminoácido arbitrário e asparagina (N) (*NN), - uma combinação de qualquer um de isoleucina (I), serina (S) e valina (V), e asparagina (N) (INN, SNN ou VNN) - uma combinação de um aminoácido arbitrário e serina (S) (*NS), - uma combinação de valina (V) e serina (S) (VNS), - uma combinação de um aminoácido arbitrário e treonina (T) (*NT), - uma combinação de valina (V) e treonina (T) (VNT), - uma combinação de um aminoácido arbitrário e triptofano (W) (*NW), ou - uma combinação de isoleucina (I) e triptofano (W) (INW); - 1-6) quando A.A. No. 4 é prolina (P), cada qual de A.A. No. 1 e A.A. No. “ii” (-2) pode ser um aminoácido arbitrário, e a combinação de A.A. No. 1, e A.A. No. “ii” (-2) pode ser, por exemplo: - uma combinação de um aminoácido arbitrário e ácido aspártico (D) (*PD), - uma combinação de fenilalanina (F) e ácido aspártico (D) (FPD), ou - uma combinação de tirosina (Y) e ácido aspártico (D) (YPD); - 1-7) quando A.A. No. 4 é serina (S), cada qual de A.A. No. 1 e A.A. No. “ii” (-2) pode ser um aminoácido arbitrário, e a combinação de A.A. No. 1, e A.A. No. “ii” (-2) pode ser, por exemplo: - uma combinação de um aminoácido arbitrário e asparagina (N) (*SN), - uma combinação de fenilalanina (F) e asparagina (N) (FSN), ou - uma combinação de valina (V) e asparagina (N) (VSN); - 1-8) quando A.A. No. 4 é treonina (T), cada qual de A.A. No. 1 e A.A. No. “ii” (-2) pode ser um aminoácido arbitrário, e a combinação de A.A. No. 1, e A.A. No. “ii” (-2) pode ser, por exemplo: - uma combinação de um aminoácido arbitrário e ácido aspártico (D) (*TD), - uma combinação de valina (V) e ácido aspártico (D) (VTD), - uma combinação de um aminoácido arbitrário e asparagina (N) (*TN), - uma combinação de fenilalanina (F) e asparagina (N) (FTN), - uma combinação de isoleucina (I) e asparagina (N) (ITN), ou - uma combinação de valina (V) e asparagina (N) (VTN); e (1-8) quando A.A. No. 4 é valina (V), cada qual de A.A. No. 1 e A.A. No. “ii” (-2) pode ser um aminoácido arbitrário, e a combinação de A.A. No. 1, e A.A. No. “ii” (-2) pode ser, por exemplo: - uma combinação de isoleucina (I) e ácido aspártico (D) (IVD), - uma combinação de um aminoácido arbitrário e glicina (G) (*VG), ou - uma combinação de um aminoácido arbitrário e treonina (T) (*VT). (II) Informação a respeito de correspondência da combinação de três aminoácidos de A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), e base de DNA
[0070] A proteína é uma proteína determinado com base, especificamente, nas definições seguintes, e com uma propriedade de ligação de base de DNA seletiva: (2-1) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são um aminoácido arbitrário, glicina, e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a G; (2-2) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são ácido glutâmico, glicina, e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a G; (2-3) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são um aminoácido arbitrário, glicina e asparagina, respectivamente, o motivo de PPR se liga seletivamente a A; (2-4) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são ácido glutâmico, glicina e asparagina, respectivamente, o motivo de PPR se liga seletivamente a A; (2-5) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são um aminoácido arbitrário, glicina e serina, respectivamente, o motivo de PPR se liga seletivamente a A, e em seguida se liga a C; (2-6) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são um aminoácido arbitrário, isoleucina e um aminoácido arbitrário, respectivamente, o motivo de PPR se liga seletivamente a T e C; (2-7) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são um aminoácido arbitrário, isoleucina e asparagina, respectivamente, o motivo de PPR se liga seletivamente a T, e em seguida se liga a C; (2-8) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são um aminoácido arbitrário, leucina e um aminoácido arbitrário, respectivamente, o motivo de PPR se liga seletivamente a T e C; (2-9) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são um aminoácido arbitrário, leucina e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a C; (2-10) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são um aminoácido arbitrário, leucina e lisina, respectivamente, o motivo de PPR se liga seletivamente a T; (2-11) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são um aminoácido arbitrário, metionina e um aminoácido arbitrário, respectivamente, o motivo de PPR se liga seletivamente a T; (2-12) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são um aminoácido arbitrário, metionina e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a T; (2-13) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são isoleucina, metionina e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a T, e em seguida se liga a C; (2-14) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são um aminoácido arbitrário, asparagina e um aminoácido arbitrário, respectivamente, o motivo de PPR se liga seletivamente a C e T; (2-15) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são um aminoácido arbitrário, asparagina e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a T; (2-16) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são fenilalanina, asparagina e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a T; (2-17) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são glicina, asparagina e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a T; (2-18) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são isoleucina, asparagina e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a T; (2-19) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são treonina, asparagina e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a T; (2-20) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2) são valina, asparagina e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a T, e em seguida se liga a C; (2-21) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2) são tirosina, asparagina e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a T, e em seguida se liga a C; (2-22) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são um aminoácido arbitrário, asparagina, e asparagina, respectivamente, o motivo de PPR se liga seletivamente a C; (2-23) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são isoleucina, asparagina, e asparagina, respectivamente, o motivo de PPR se liga seletivamente a C; (2-24) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são serina, asparagina, e asparagina, respectivamente, o motivo de PPR se liga seletivamente a C; (2-25) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são valina, asparagina, e asparagina, respectivamente, o motivo de PPR se liga seletivamente a C; (2-26) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são um aminoácido arbitrário, asparagina e serina, respectivamente, o motivo de PPR se liga seletivamente a C; (2-27) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são valina, asparagina e serina, respectivamente, o motivo de PPR se liga seletivamente a C; (2-28) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são um aminoácido arbitrário, asparagina e treonina, respectivamente, o motivo de PPR se liga seletivamente a C; (2-29) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são valina, asparagina e treonina, respectivamente, o motivo de PPR se liga seletivamente a C; (2-30) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são um aminoácido arbitrário, asparagina e triptofano, respectivamente, o motivo de PPR se liga seletivamente a C, e em seguida se liga a T; (2-31) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são isoleucina, asparagina e triptofano, respectivamente, o motivo de PPR se liga seletivamente a T, e em seguida se liga a C; (2-32) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são um aminoácido arbitrário, prolina e um aminoácido arbitrário, respectivamente, o motivo de PPR se liga seletivamente a T; (2-33) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são um aminoácido arbitrário, prolina e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a T; (2-34) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são fenilalanina, prolina e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a T; (2-35) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são tirosina, prolina e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a T; (2-36) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são um aminoácido arbitrário, serina e um aminoácido arbitrário, respectivamente, o motivo de PPR se liga seletivamente a A e G; (2-37) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são um aminoácido arbitrário, serina e asparagina, respectivamente, o motivo de PPR se liga seletivamente a A; (2-38) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são fenilalanina, serina e asparagina, respectivamente, o motivo de PPR se liga seletivamente a A; (2-39) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são valina, serina e asparagina, respectivamente, o motivo de PPR se liga seletivamente a A; (2-40) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são um aminoácido arbitrário, treonina e um aminoácido arbitrário, respectivamente, o motivo de PPR se liga seletivamente a A e G; (2-41) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são um aminoácido arbitrário, treonina e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a G; (2-42) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são valina, treonina e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a G; (2-43) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são um aminoácido arbitrário, treonina e asparagina, respectivamente, o motivo de PPR se liga seletivamente a A; (2-44) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são fenilalanina, treonina e asparagina, respectivamente, o motivo de PPR se liga seletivamente a A; (2-45) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são isoleucina, treonina e asparagina, respectivamente, o motivo de PPR se liga seletivamente a A; (2-46) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são valina, treonina e asparagina, respectivamente, o motivo de PPR se liga seletivamente a A; (2-47) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são um aminoácido arbitrário, valina e um aminoácido arbitrário, respectivamente, o motivo de PPR se liga com A, C e T, mas não se liga a G; (2-48) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são isoleucina, valina e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a C, e em seguida se liga a A; (2-49) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são um aminoácido arbitrário, valina e glicina, respectivamente, o motivo de PPR se liga seletivamente a C; e (2-50) quando os três aminoácidos, A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2), são um aminoácido arbitrário, valina e treonina, respectivamente, o motivo de PPR se liga seletivamente a T.
[0071] Combinação de aminoácidos de posições e propriedade de ligação específicas com uma base de DNA pode ser confirmada por experimentos. Experimentos para tais propósitos incluem preparação de um motivo de PPR ou uma proteína contendo dois ou mais motivos de PPR, preparação de um substrato DNA, e teste de propriedade de ligação (por exemplo, ensaio de deslocamento de gel). Esses experimentos são bem conhecidos pelos versados na técnica, e, para procedimentos e condições mais específicos, por exemplo, o Documento de patente 2 pode ser referido.
[0072] Um motivo de PPR reconhece um tipo específico de base de DNA, e dois ou mais motivos de PPR contíguos podem reconhecer bases contíguas em uma sequência de DNA. Adicionalmente, de acordo com a presente invenção, escolhendo-se apropriadamente aminoácidos em posições específicas, motivos de PPR seletivos para cada qual de A, T, G, e C podem ser escolhidos ou projetados, e uma proteína contendo uma continuação apropriada de tais motivos de PPR pode reconhecer uma sequência específica correspondente. Portanto, de acordo com a presente invenção, uma proteína de PPR de ocorrência natural que se liga seletivamente ao DNA com uma sequência de base específica pode ser prevista ou identificada, ou, ao contrário, DNA como um alvo de ligação de uma proteína de PPR pode ser previsto e identificado. Previsão ou identificação de um alvo como este é útil para esclarecer a identidade genética do alvo, e é também útil de um ponto de vista de que tal previsão ou identificação pode expandir a aplicabilidade do alvo.
[0073] Além disso, de acordo com a presente invenção, um motivo de PPR que pode se ligar seletivamente a uma base de DNA desejada, e uma proteína com dois ou mais motivos de PPR que pode se ligar a um DNA desejado de uma maneira específica à sequência pode ser projetada. Em tal projeto, como para a parte sem ser os aminoácidos nas posições importantes no motivo de PPR, informação de sequência nos motivos de PPR do tipo de ocorrência natural em proteínas PPR do tipo que se liga ao DNA tais como aquelas de SEQ ID NOS: 1 a 5 podem ser referidos. Adicionalmente, o motivo ou proteína pode também ser projetado usando um motivo ou proteína do tipo de ocorrência natural como um todo, e substituindo somente os aminoácidos das posições correspondentes. Embora o número de repetições de motivos de PPR possa ser apropriadamente escolhido de acordo com uma sequência alvo, ele pode ser, por exemplo, 2 ou mais, preferivelmente 2 a 30, mais preferivelmente 5 a 25, acima de tudo preferivelmente 9 a 15.
[0074] No projeto, aminoácidos sem ser aqueles da combinação dos aminoácidos de A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2) podem ser levados em consideração. Por exemplo, a seleção dos aminoácidos de No. 8 e No. 12 descritos no Documento de patente 2 anteriormente mencionado pode ser importante para apresentar uma atividade de ligação ao DNA. De acordo com as pesquisas dos inventores da presente invenção, o aminoácido No. 8 de um certo motivo de PPR e o aminoácido No. 12 do mesmo motivo de PPR podem cooperar na ligação com DNA. O aminoácido No. 8 pode ser um aminoácido básico, preferivelmente lisina, ou um aminoácido acídico, preferivelmente ácido aspártico, e o aminoácido No. 12 pode ser um aminoácido básico, aminoácido neutro, ou aminoácido hidrofóbico.
[0075] Um motivo projetado ou proteína pode ser preparado por métodos bem conhecidos pelos versados na técnica. Ou seja, a presente invenção fornece um motivo de PPR que se liga seletivamente a uma base específica de DNA, e uma proteína de PPR que se liga especificamente ao DNA com uma sequência específica, na qual atenção é dada à combinação dos aminoácidos de A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2). Um motivo e proteína como estes podem ser preparados mesmo em uma quantidade relativamente grande por métodos bem conhecidos pelos versados na técnica, e tais métodos podem compreender determinar uma sequência de ácido nucleico que codifica um motivo ou proteína alvo a partir da sequência de aminoácidos do motivo ou proteína alvo, cloná-lo, e preparar um transformante que produz o motivo ou proteína alvo.
[0076] O motivo de PPR ou proteína de PPR provido pela presente invenção pode ser feito em um complexo pela ligação a uma região funcional. A região funcional no geral se refere a uma parte com uma função como esta como uma função biológica específica exercida em um corpo vivo ou célula, por exemplo, função enzimática, função catalítica, função inibitória, função promotora, etc., ou uma função como um marcador. Uma região como esta consiste, por exemplo, em uma proteína, peptídeo, ácido nucleico, substância fisiologicamente ativa, ou medicamento.
[0077] De acordo com a presente invenção, pela ligação de uma região funcional na proteína de PPR, a função de ligação da sequência de DNA alvo exercida pela proteína de PPR, e a função exercida pela região funcional podem ser exibidas em combinação. Por exemplo, se uma proteína com uma função de clivagem de DNA (por exemplo, enzima de restrição tal como FokI) ou um domínio de nuclease da mesma for usada como a região funcional, o complexo pode funcionar como uma enzima de clivagem de DNA artificial.
[0078] A fim de produzir um complexo como este, métodos em geral disponíveis neste campo técnico podem ser usados, e é conhecido um método de sintetizar um complexo como este como uma molécula de proteína, um método de sintetizar separadamente dois ou mais elementos de proteínas, e então combiná-los para formar um complexo, e assim por diante.
[0079] No caso do método de sintetizar um complexo como uma molécula de proteína, por exemplo, um complexo de proteína pode ser projetado de maneira a compreender uma proteína de PPR e uma enzima de clivagem ligada no terminal C da proteína de PPR por meio de um adaptador de aminoácido, uma estrutura de vetor de expressão para expressar o complexo de proteína pode ser construída, e o complexo alvo pode ser expresso a partir da estrutura. Como um método de preparação como este, o método descrito no pedido de patente japonês No. 2011-242250, e assim por diante, pode ser usado.
[0080] Para ligar a proteína de PPR e a proteína da região funcional, qualquer meio de ligação conhecido neste campo técnico pode ser usado, incluindo ligação por meio de um adaptador de aminoácido, ligação utilizando afinidade específica tal como ligação entre avidina e biotina, ligação utilizando um outro adaptador químico, e assim por diante.
[0081] A região funcional utilizável na presente invenção se refere a uma região que pode conferir qualquer uma de várias funções tais como aquelas para clivagem, transcrição, replicação, restauração, síntese, ou modificação de DNA, e assim por diante. Pela escolha da sequência do motivo de PPR para definir uma sequência de base de DNA como um alvo, que é a característica da presente invenção, substancialmente qualquer sequência de DNA pode ser usada como o alvo e, com um alvo como este, edição de genoma utilizando a função da região funcional tais como aquelas para clivagem, transcrição, replicação, restauração, síntese, ou modificação de DNA pode ser realizada.
[0082] Por exemplo, quando a função da região funcional é uma função de clivagem de DNA, é provido um complexo compreendendo uma parte de proteína de PPR preparada de acordo com a presente invenção e uma região de clivagem de DNA juntamente ligadas. Um complexo como este pode funcionar como uma enzima de clivagem de DNA artificial que reconhece uma sequência de base de DNA como um alvo pela parte de proteína de PPR, e então cliva DNA pela região de clivagem de DNA.
[0083] Um exemplo da região funcional com uma função de clivagem utilizável para a presente invenção é uma desoxirribonuclease (DNase), que funciona como um endodesoxirribonuclease. Como uma DNase como esta, por exemplo, endodesoxirribonucleases tais como DNase A (por exemplo, ribonuclease pancreática bovina A, PDB 2AAS), DNase H e DNase I, enzimas de restrição derivadas de várias bactérias (por exemplo, FokI (SEQ ID NO: 6) etc.) e domínios de nuclease da mesma podem ser usadas. Um complexo como este compreendendo uma proteína de PPR e uma região funcional não existe na natureza, e é inédito.
[0084] Quando a função da região funcional é uma função de controle de transcrição, é provido um complexo compreendendo uma parte de proteína de PPR preparada de acordo com a presente invenção e uma região de controle de transcrição de DNA juntamente ligadas. Um complexo como este pode funcionar como um fator de controle de transcrição artificial, que reconhece uma sequência de base de DNA como um alvo pela parte de proteína de PPR, e então controla a transcrição do DNA alvo.
[0085] A região funcional com uma função de controle de transcrição utilizável para a presente invenção pode ser um domínio que ativa transcrição, ou pode ser um domínio que suprime transcrição. Exemplos do domínio de controle de transcrição incluem VP16, VP64, TA2, STAT-6 e p65. Um complexo como este compreendendo uma proteína de PPR e um domínio de controle de transcrição não existe na natureza, e é inédito.
[0086] Adicionalmente, o complexo obtenível de acordo com a presente invenção pode dispensar uma região funcional em um corpo ou célula viva de uma maneira específica à sequência de DNA, e permitir que ela funcione. Por meio disto é possível realizar modificação ou interrupção de uma maneira específica à sequência de DNA em um corpo ou célula viva, como complexos de proteína utilizando uma proteína dedo de zinco (Documentos de não patente 1 e 2 anteriormente mencionados) ou efetor TAL (Documento de Não Patente 3 e Documento de patente 1 anteriormente mencionados), e assim torna-se possível conferir uma função inédita, isto é, função para clivagem de DNA e edição de genoma utilizando essa função. Especificamente, com uma proteína de PPR compreendendo dois ou mais motivos de PPR que podem se ligar com uma base específica juntamente ligada, uma sequência de DNA específica pode ser reconhecida. Então, edição de genoma da região de DNA reconhecida pode ser realizada pela região funcional ligada à proteína de PPR usando a função da região funcional.
[0087] Além disso, pela ligação um medicamento à proteína de PPR que se liga a uma sequência de DNA de uma maneira específica à sequência de DNA, o medicamento pode ser dispensado na vizinhança da sequência de DNA como o alvo. Portanto, a presente invenção fornece um método para dispensação específica à sequência de DNA de uma substância funcional.
[0088] Foi esclarecido que a proteína de PPR usada como um material na presente invenção funciona para especificar uma posição de edição para edição de DNA, e um motivo de PPR como este com aminoácidos específicos arranjados nas posições dos resíduos de A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2) reconhece uma base específica no DNA, e então exibe a atividade de ligação de DNA da mesma. Com base em uma característica como esta, pode- se esperar que uma proteína de PPR deste tipo que tem aminoácidos específicos arranjados nas posições dos resíduos de A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2) reconheça uma base em DNA específico para cada proteína de PPR, e, como um resultado, introduz polimorfismo de base, ou que seja usada em um tratamento de uma doença ou condição resultante de um polimorfismo de base e, além do mais, é considerado que a combinação de uma proteína de PPR como esta com uma outra região funcional como esta, como anteriormente mencionado, contribui para modificação ou melhoria das funções para realizar clivagem de DNA para edição de genoma.
[0089] Além disso, uma enzima de clivagem de DNA exógena pode ser fundida no terminal C da proteína de PPR. Alternativamente, mela melhoria da seletividade da base de DNA de ligação do motivo de PPR no lado do terminal N, uma enzima de clivagem de DNA específica à sequência de DNA pode também ser constituída. Além disso, um complexo como este no qual uma parte do marcador tal como GFP é ligada pode também ser usado para visualização de um DNA desejada in vivo.
[0090] Referindo-se à informação provida nas referências da tecnologia anterior (Documentos de não patente 11 a 15), estruturas e funções da proteína p63 (SEQ ID NO: 1), proteína GUN1 (SEQ ID NO: 2), pTac2 proteína (SEQ ID NO: 3), proteína DG1 (SEQ ID NO: 4), e proteína GRP23 (SEQ ID NO: 5) foram analisadas.
[0091] Nas estruturas de motivo de PPR em tais proteínas, os números de aminoácido definidos na presente invenção foram conferidos junto com a informação da base de dados Uniprot (http://www.uniprot.org/). Os motivos de PPR contidos nos cinco tipos de proteínas PPR de Arabidopsis thaliana (SEQ ID NOS: 1 a 5) usados para o experimento, e os números de aminoácido dos mesmos estão mostrados na Fig. 3.
[0092] Especificamente, frequências de aminoácido para os aminoácidos nas três posições (A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2)) responsáveis pelos códigos de reconhecimento de ácido nucleico nos motivos de PPR considerados importantes no momento do alvejamento de RNA na proteína p63 supramencionada (SEQ ID NO: 1), proteína GUN1 (SEQ ID NO: 2), proteína pTac2 (SEQ ID NO: 3), proteína DG1 (SEQ ID NO: 4), e proteína GRP23 (SEQ ID NO: 5) foram comparadas com aquelas dos motivos do tipo de ligação ao RNA.
[0093] A proteína p63 de Arabidopsis thaliana (SEQ ID NO: 1) tem 9 motivos de PPR, e as posições dos resíduos de A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2) Na sequência de aminoácidos são da maneira sumarizada na tabela seguinte e Fig. 3.
[0094] A proteína GUN1 de Arabidopsis thaliana (SEQ ID NO: 2) tem 11 motivos de PPR, e as posições dos resíduos de A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2) na sequência de aminoácidos são da maneira sumarizada na tabela seguinte e Fig. 3.
[0095] A proteína pTac2 de Arabidopsis thaliana (SEQ ID NO: 3) tem 15 motivos de PPR, e as posições dos resíduos de A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2) na sequência de aminoácidos são da maneira sumarizada na tabela seguinte e Fig. 3. (B.G. significa fundo)
[0096] A proteína DG1 de Arabidopsis thaliana (SEQ ID NO: 4) tem 10 motivos de PPR, e as posições dos resíduos de A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2) na sequência de aminoácidos são da maneira sumarizada na tabela seguinte e Fig. 3. (B.G. significa fundo)
[0097] A proteína GRP23 de Arabidopsis thaliana (SEQ ID NO: 5) tem 11 motivos de PPR, e as posições dos resíduos de A.A. No. 1, A.A. No. 4, e A.A. No. “ii” (-2) na sequência de aminoácidos são da maneira sumarizada na tabela seguinte e Fig. 3. (B.G. significa fundo)
[0098] As frequências de aminoácido para essas posições foram confirmadas para cada proteína, e comparadas com as frequências de aminoácido para as mesmas posições dos motivos do tipo de ligação ao RNA. Os resultados estão mostrados na Fig. 2. Fica claro que as tendências das frequências de aminoácido nos motivos de PPR das proteínas PPR para as quais propriedade de ligação ao DNA é sugerida, e os motivos do tipo de ligação ao RNA substancialmente concordam entre si. Ou seja, fica claro que as proteínas PPR que agem para ligar ao DNA se ligam com ácido nucleicos de acordo com as mesmas regras de sequência daquelas das proteínas PPR que agem para se ligar ao RNA, e os códigos de reconhecimento de RNA descritos no pedido de patente pendente dos inventores da presente invenção (PCT/JP2012/077274) podem ser aplicados como os códigos de reconhecimento de DNA das proteínas PPR que agem para se ligar ao DNA.
[0099] Com referência aos códigos de reconhecimento de RNA descritos no Documento de Não Patente (Yagi, Y. et al., Plos One, 2013, 8, e57286), os motivos de PPR do tipo que liga ao DNA que se ligam seletivamente a cada base correspondente foram avaliados. Mais precisamente, um teste do qui-quadrado foi realizado com base nas frequências de nucleotídeo ocorridas mostradas na Tabela 6 e frequências de nucleotídeo esperadas calculadas a partir das frequências de fundo. O teste foi realizado para cada base (NT), purina ou pirimidina (AG ou CT, PY), grupo ligado no hidrogênio (AT ou GC, HB), ou forma amino ou ceto (AC ou GT). O valor significante foi definido como P < 0,06 (5E-02, 5% de nível de significância) e, quando um valor significante foi obtido em qualquer dos testes, a combinação de aminoácido No. 1, aminoácido No. 4, e aminoácido No. “ii” (-2) foi escolhida. [Tabela 6-1] Tabela 6: Seletividade de base do código de ligação ao DNA
[00100] Na Tabela 1, as combinações dos aminoácidos que apresentaram seletividade da base significante foram mencionadas. Ou seja, esses resultados significam que os motivos de PPR com as espécies de aminoácido do aminoácido No. 1, aminoácido No. 4, e aminoácido No. “ii” (2) ("NSRs (1, 4, e ii)" na tabela) que forneceram um valor P significante são motivos de PPR que conferem capacidade de ligação seletiva da base, e um maior valor "positivo" obtido depois da subtração do fundo significa maior seletividade de base para a base. Entre o aminoácido No. 1, aminoácido No. 4, e aminoácido No. “ii” (-2), o aminoácido No. 4 afeta mais fortemente a seletividade da base, o aminoácido No. “ii” (-2) afeta a seletividade da base menos fortemente, e o aminoácido No. 1 afeta mais fracamente a seletividade da base entre os três aminoácidos. Exemplo 2: Avaliação da capacidade de ligação de DNA específica à sequência de moléculas PPR
[00101] Neste exemplo, fatores de transcrição artificiais foram preparados fundindo VP64, que é um domínio de ativação de transcrição, nos três tipos de Moléculas PPR do tipo que liga ao DNA (supostamente), p63, pTac2, e GUN1, e examinando se elas podem ativar repórteres da luciferase, cada qual tendo uma sequência alvo correspondente em uma célula cultivada de humano, se as moléculas PPR tiveram ou não uma capacidade de ligação de DNA específica à sequência ou foi determinado (Fig. 5). (Método experimental) 1. Preparação de vetor de expressão de PPR-VP64
[00102] Somente as partes correspondentes aos motivos de PPR nas sequências de codificação de p63, pTac2 e GUN1 foram preparadas por síntese artificial. Para a síntese de DNA, o serviço de síntese genética artificial da Biomatik foi usado. O vetor pCS2P com o promoter CMV foi usado como um vetor da espinha dorsal, e cada sequência de PPR sintetizada foi inserida nele. Adicionalmente, o marcador Flag e sinal de transferência nuclear foram inseridos no terminal N da sequência PPR, e a sequência VP64 foi inserida no terminal C da mesma. As sequências produzidas de p63-VP64, pTac2-VP64, e GUN1-VP64 são mostradas na Listagem de Sequência como SEQ ID NOS: 7 a 9. 2. Preparação de vetor repórter com sequência alvo de PPR
[00103] Um vetor repórter (pminCMV-luc2, SEQ ID NO: 10) foi preparado, no qual o gene da luciferase do vagalume foi ligado à jusante do promotor CMV minimal, e um sítio multiclonagem foi colocado à montante do promotor. A sequência alvo prevista de cada PPR foi inserida no vetor no sítio multiclonagem. A sequência alvo de cada PPR (TCTATCACT para p63, AACTTTCGTCACTCA para pTac2, e AATTTGTCGAT para GUN1, SEQ ID NOS: 11 a 13 na Listagem de Sequência) foi determinada prevendo-se os códigos de reconhecimento de motivo-DNA do DNA do tipo que se liga a PPR a partir dos códigos de reconhecimento de motivo-RNA observados no PPR do tipo que se liga ao RNA. Para cada PPR, sequências contendo 4 ou 8 das sequências alvos foram preparadas, e usadas no ensaio seguinte. As sequências de nucleotídeos dos vetores são mostradas como SEQ ID NOS: 14 a 19 na Listagem de Sequência. 3. Transfecção em célula T HEK293
[00104] O vetor de expressão PPR-VP64 preparado na seção 1, o vetor de expressão da luciferase do vagalume preparado na seção 2, e o vetor pRL- CMV (vetor de expressão para Renilla luciferase, Promega) como uma referência foram introduzidos usando Lipofectamina LTX (Life Technologies). O meio DMEM (25 μL) foi adicionado a cada poço de uma placa de 96 poços, e uma mistura contendo o vetor de expressão de PPR- VP64 (400 ng), vetor de expressão da luciferase do vagalume (100 ng), e vetor pRL-CMV (20 ng) foi adicionalmente adicionada. Então, uma mistura do meio DMEM (25 μL) e Lipofectamina LTX (0,7 μL) foi adicionada a cada poço, a placa foi deixada descansar à temperatura ambiente por 30 minutos, então 6 x 104 das células T HEK293 suspensas no meio DMEM contendo 15% de soro fetal bovino (100 μL) foram adicionados, e as células foram cultivadas a 37°C em um incubador de CO2 por 24 horas. 4. Ensaio de Luciferase
[00105] Ensaio de luciferase foi realizado usando Dual-Glo Luciferase Assay System (Promega) de acordo com as instruções anexas no kit. Para a medição da atividade da luciferase, TriStar LB 941 Plate Reader (Berthold) foi usada. (Resultados e discussão)
[00106] A atividade da luciferase foi comparada para os casos de introdução de pTac2-VP64 ou GUN1-VP64 junto com pminCMV-luc2 para um controle negativo, ou o vetor repórter com 4 ou 8 sequências alvos (tabela mencionada a seguir, Fig. 6). A comparação da atividade foi realizada com base em pontuações padronizadas obtidas dividindo os valores medidos obtidos com Fluc (luciferase do vagalume) com o valor medido obtido com Rluc (Renilla luciferase) como a referência (Fluc/Rluc). Como um resultado, observou-se uma tendência de que a atividade aumentou com o aumento do número da sequência alvo para ambos os casos, e assim foi verificado que cada das moléculas PPR-VP64 especificamente ligadas a cada sequência alvo, e funcionou como um ativador de transcrição específico do sítio.
Claims (7)
1. Método para controlar uma função de DNA tendo uma sequência alvo, caracterizado pelo fato de que usa uma proteína que pode se ligar de uma maneira seletiva à base de DNA ou de uma maneira específica à sequência de base de DNA, o método compreendendo: projetar uma proteína que pode se ligar ao DNA possuindo a sequência alvo, e prepar a proteína desenhada para controlar o DNA, e em que o desenho é feito de tal forma que a proteína contém 2 a 30 motivos de PPR tendo uma estrutura da seguinte fórmula 1: (em que, na fórmula 1: Hélice A é uma parte que pode formar uma estrutura em α- hélice; X não existe ou é uma parte que consiste de 1 a 9 aminoácidos; Hélice B é uma parte que pode formar uma estrutura em α- hélice; e L é uma parte que consiste de 2 a 7 aminoácidos), em que, sob as seguintes definições: o primeiro aminoácido da Hélice A é referida como aminoácido No. 1 (A.A. No. 1), o quarto aminoácido como aminoácido No. 4 (A.A. No. 4), e - quando um seguinte motivo de PPR (Mn+1) existe contiguamente no lado do terminal C do motivo de PPR (Mn) (quando não há inserção de aminoácido entre os motivos de PPR), o -2° aminoácido contado a partir da extremidade (lado do terminal C) dos aminoácidos que constituem o motivo de PPR (Mn); - quando um motivo de não-PPR consistindo de 1 a 20 aminoácidos existe entre o motivo de PPR (Mn) e o seguinte motivo de PPR (Mn+1) no lado do terminal C, o aminoácido localizando a montante do primeiro aminoácido do seguinte motivo de PPR (Mn+1) por 2 posições, isto é, o -2° aminoácido; ou - quando qualquer seguinte motivo de PPR (Mn+1) não existe no lado do terminal C do motivo de PPR (Mn), ou 21 ou mais aminoácidos que constituem um motivo de não-PPR existir entre o motivo de PPR (Mn) e o seguinte motivo de PPR (Mn+1) no lado do terminal C, o segundo aminoácido contado a partir da extremidade (lado do terminal C) dos aminoácidos que constituem o motivo de PPR (Mn) é referido como No. "ii" (-2) aminoácido (A.A. No. "ii" (-2), cada motivo de PPR (Mn) contido na proteína é um motivo de PPR tendo uma combinação específica de aminoácidos como os três aminoácidos de A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2), em que a combinação dos três aminoácidos de A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2) é uma combinação correspondendo a uma base de DNA alvo do alvo, e a combinação de aminoácidos é determinada de acordo com qualquer uma das definições seguintes: (2-1) quando os três aminoácidos, A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2), são um aminoácido arbitrário, glicina, e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a G; (2-2) quando os três aminoácidos, A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2), são ácido glutâmico, glicina, e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a G; (2-3) quando os três aminoácidos, A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2), são um aminoácido arbitrário, glicina e asparagina, respectivamente, o motivo de PPR se liga seletivamente a A; (2-4) quando os três aminoácidos, A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2), são ácido glutâmico, glicina e asparagina, respectivamente, o motivo de PPR se liga seletivamente a A; (2-5) quando os três aminoácidos, A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2), são um aminoácido arbitrário, glicina e serina, respectivamente, o motivo de PPR se liga seletivamente a A; (2-6) quando os três aminoácidos, A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2), são um aminoácido arbitrário, isoleucina, e um aminoácido arbitrário, respectivamente, o motivo de PPR se liga seletivamente a T e C; (2-7) quando os três aminoácidos, A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2), são um aminoácido arbitrário, isoleucina e asparagina, respectivamente, o motivo de PPR se liga seletivamente a T; (2-8) quando os três aminoácidos, A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2), são um aminoácido arbitrário, leucina e um aminoácido arbitrário, respectivamente, o motivo de PPR se liga seletivamente a T e C; (2-9) quando os três aminoácidos, A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2), são um aminoácido arbitrário, leucina e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a C; (2-10) quando os três aminoácidos, A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2), são um aminoácido arbitrário, leucina e lisina, respectivamente, o motivo de PPR se liga seletivamente a T; (2-11) quando os três aminoácidos, A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2), são um aminoácido arbitrário, metionina, e um aminoácido arbitrário, respectivamente, o motivo de PPR se liga seletivamente a T; (2-12) quando os três aminoácidos, A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2), são um aminoácido arbitrário, metionina e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a T; (2-13) quando os três aminoácidos, A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2), são isoleucina, metionina e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a T; (2-14) quando os três aminoácidos, A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2), são um aminoácido arbitrário, asparagina, e um aminoácido arbitrário, respectivamente, o motivo de PPR se liga seletivamente a C e T; (2-15) quando os três aminoácidos, A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2), são um aminoácido arbitrário, asparagina e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a T; (2-16) quando os três aminoácidos, A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2), são fenilalanina, asparagina e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a T; (2-17) quando os três aminoácidos, A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2), são glicina, asparagina e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a T; (2-18) quando os três aminoácidos, A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2), são isoleucina, asparagina e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a T; (2-19) quando os três aminoácidos, A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2), são treonina, asparagina e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a T; (2-20) quando os três aminoácidos, A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2), são valina, asparagina e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a T; (2-21) quando os três aminoácidos, A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2), são tirosina, asparagina e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a T; (2-22) quando os três aminoácidos, A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2), são um aminoácido arbitrário, asparagina, e asparagina, respectivamente, o motivo de PPR se liga seletivamente a C; (2-23) quando os três aminoácidos, A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2), são isoleucina, asparagina, e asparagina, respectivamente, o motivo de PPR se liga seletivamente a C; (2-24) quando os três aminoácidos, A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2), são serina, asparagina, e asparagina, respectivamente, o motivo de PPR se liga seletivamente a C; (2-25) quando os três aminoácidos, A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2), são valina, asparagina, e asparagina, respectivamente, o motivo de PPR se liga seletivamente a C; (2-26) quando os três aminoácidos, A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2), são um aminoácido arbitrário, asparagina, e serina, respectivamente, o motivo de PPR se liga seletivamente a C; (2-27) quando os três aminoácidos, A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2), são valina, asparagina, e serina, respectivamente, o motivo de PPR se liga seletivamente a C; (2-28) quando os três aminoácidos, A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2), são um aminoácido arbitrário, asparagina e treonina, respectivamente, o motivo de PPR se liga seletivamente a C; (2-29) quando os três aminoácidos, A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2), são valina, asparagina, e treonina, respectivamente, o motivo de PPR se liga seletivamente a C; (2-30) quando os três aminoácidos, A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2), são um aminoácido arbitrário, asparagina e triptofano, respectivamente, o motivo de PPR se liga seletivamente a C; (2-31) quando os três aminoácidos, A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2), são isoleucina, asparagina e triptofano, respectivamente, o motivo de PPR se liga seletivamente a T; (2-32) quando os três aminoácidos, A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2), são um aminoácido arbitrário, prolina, e um aminoácido arbitrário, respectivamente, o motivo de PPR se liga seletivamente a T; (2-33) quando os três aminoácidos, A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2), são um aminoácido arbitrário, prolina, e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a T; (2-34) em que os três aminoácidos, A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2), são fenilalanina, prolina, e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a T; (2-35) quando os três aminoácidos, A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2), são tirosina, prolina, e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a T; (2-36) quando os três aminoácidos, A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2), são um aminoácido arbitrário, serina, e um aminoácido arbitrário, respectivamente, o motivo de PPR se liga seletivamente a A e G; (2-37) quando os três aminoácidos, A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2), são um aminoácido arbitrário, serina e asparagina, respectivamente, o motivo de PPR seletivamente se liga a A; (2-38) quando os três aminoácidos, A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2), são fenilalanina, serina e asparagina, respectivamente, o motivo de PPR se liga seletivamente a A; (2-39) quando os três aminoácidos, A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2), são valina, serina e asparagina, respectivamente, o motivo de PPR se liga seletivamente a A; (2-40) quando os três aminoácidos, A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2), são um aminoácido arbitrário, treonina, e um aminoácido arbitrário, respectivamente, o motivo de PPR se liga seletivamente a A e G; (2-41) quando os três aminoácidos, A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2), são um aminoácido arbitrário, treonina e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a G; (2-42) quando os três aminoácidos, A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2), são valina, treonina e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a G; (2-43) quando os três aminoácidos, A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2), são um aminoácido arbitrário, treonina e asparagina, respectivamente, o motivo de PPR seletivamente se liga a A; (2-44) quando os três aminoácidos, A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2), são fenilalanina, treonina e asparagina, respectivamente, o motivo de PPR se liga seletivamente a A; (2-45) quando os três aminoácidos, A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2), são isoleucina, treonina e asparagina, respectivamente, o motivo de PPR se liga seletivamente a A; (2-46) quando os três aminoácidos, A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2), são valina, treonina e asparagina, respectivamente, o motivo de PPR se liga seletivamente a A; (2-47) quando os três aminoácidos, A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2), são um aminoácido arbitrário, valina e um aminoácido arbitrário, respectivamente, o motivo de PPR se liga com A, C, e T, mas não se liga a G; (2-48) quando os três aminoácidos, A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2), são isoleucina, valina e ácido aspártico, respectivamente, o motivo de PPR se liga seletivamente a C; (2-49) quando os três aminoácidos, A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2), são um aminoácido arbitrário, valina e glicina, respectivamente, o motivo de PPR se liga seletivamente a C; e (2-50) quando os três aminoácidos, A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2), são um aminoácido arbitrário, valina e treonina, respectivamente, o motivo de PPR se liga seletivamente a T.
2. Método de acordo com a reivindicação 1, caracterizado pelo fato de que consiste de uma sequência selecionada a partir da sequência de aminoácidos de SEQ ID NO: 1 contendo 9 motivos de PPR, a sequência de aminoácidos de SEQ ID NO: 2 contendo 11 motivos de PPR, a sequência de aminoácidos de SEQ ID NO: 3 contendo 15 motivos de PPR, a sequência de aminoácidos de SEQ ID NO: 4 contendo 10 motivos de PPR e a sequência de aminoácidos de SEQ ID NO: 5 contendo 11 motivos de PPR.
3. Método, de acordo com a reivindicação 1 ou 2, caracterizado pelo fato de que a proteína é usada como um complexo que consiste em uma região compreendendo a proteína, e uma região funcional juntamente ligada, em que a região funcional é uma enzima de clivagem de DNA, ou um domínio de nuclease da mesma, ou um domínio de controle de transcrição, e o complexo funciona como uma enzima de clivagem de DNA específica da sequência alvo ou fator de controle de transcrição.
4. Método, de acordo com a reivindicação 3, caracterizado pelo fato de que a região funcional é fundida à proteína no lado do terminal C da proteína.
5. Método de acordo com a reivindicação 4, caracterizado pelo fato de que a enzima de clivagem de DNA é o domínio de nuclease de FokI (SEQ ID NO: 6).
6. Método para identificar uma sequência de base de DNA que serve como um alvo de uma proteína PPR existente contendo 2 a 30 dos motivos de PPR (Mn) como definidos na reivindicação 1, caracterizado pelo fato de que: a base de DNA ou sequência de base de DNA é identificada através da determinação da presença ou ausência de uma base de DNA que corresponde a uma combinação dos três aminoácidos de A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2) do motivo de PPR contido na proteína PPR com base em qualquer uma das definições (2-1) a (2-50) como definidas na reivindicação 1.
7. Método para identificar uma proteína PPR contendo 2 a 30 dos motivos de PPR (Mn) como definidos na reivindicação 1 que podem se ligar a um DNA existente tendo uma sequência alvo, caracterizado pelo fato de que: a proteína PPR é identificada através da determinação da presença ou ausência de uma combinação dos três aminoácidos de A.A. No. 1, A.A. No. 4 e A.A. No. "ii" (-2) que corresponde a uma base de DNA alvo da sequência alvo com base em qualquer uma das definições (2-1) a (2-50) como definidas na reivindicação 1.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013089840 | 2013-04-22 | ||
JP2013-089840 | 2013-04-22 | ||
PCT/JP2014/061329 WO2014175284A1 (ja) | 2013-04-22 | 2014-04-22 | Pprモチーフを利用したdna結合性タンパク質およびその利用 |
Publications (1)
Publication Number | Publication Date |
---|---|
BR122020018292B1 true BR122020018292B1 (pt) | 2023-05-16 |
Family
ID=51791855
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
BR122020018292-0A BR122020018292B1 (pt) | 2013-04-22 | 2014-04-22 | Métodos para controlar uma função de dna tendo uma sequência alvo, para identificar uma base de dna ou sequência de base de dna, e para identificar uma proteína ppr |
BR122020018288-1A BR122020018288B1 (pt) | 2013-04-22 | 2014-04-22 | Métodos para ligar uma proteína a um dna tendo uma sequência alvo, e, para modificar uma substância genética de uma célula |
BR112015026707-6A BR112015026707B1 (pt) | 2013-04-22 | 2014-04-22 | proteína ppr, e, complexo |
Family Applications After (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
BR122020018288-1A BR122020018288B1 (pt) | 2013-04-22 | 2014-04-22 | Métodos para ligar uma proteína a um dna tendo uma sequência alvo, e, para modificar uma substância genética de uma célula |
BR112015026707-6A BR112015026707B1 (pt) | 2013-04-22 | 2014-04-22 | proteína ppr, e, complexo |
Country Status (12)
Country | Link |
---|---|
US (3) | US10189879B2 (pt) |
EP (2) | EP3696186A1 (pt) |
JP (6) | JP5896547B2 (pt) |
KR (5) | KR20160007541A (pt) |
CN (6) | CN116425883A (pt) |
AU (5) | AU2014258386B2 (pt) |
BR (3) | BR122020018292B1 (pt) |
CA (1) | CA2910050A1 (pt) |
HK (2) | HK1221966A1 (pt) |
NZ (3) | NZ714264A (pt) |
SG (2) | SG10201802430VA (pt) |
WO (1) | WO2014175284A1 (pt) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
BR122020018292B1 (pt) * | 2013-04-22 | 2023-05-16 | Hiroshima University | Métodos para controlar uma função de dna tendo uma sequência alvo, para identificar uma base de dna ou sequência de base de dna, e para identificar uma proteína ppr |
DK3466978T3 (da) * | 2016-06-03 | 2021-04-26 | Univ Kyushu Nat Univ Corp | Fusionsprotein til forbedring af proteinekspression fra mål-mRNA |
SG11201810606TA (en) * | 2016-06-03 | 2018-12-28 | Univ Kyushu Nat Univ Corp | FUSION PROTEIN FOR IMPROVING PROTEIN EXPRESSION FROM TARGET mRNA |
EP3498726A4 (en) * | 2016-08-10 | 2020-03-25 | Fujifilm Wako Pure Chemical Corporation | DNA-BINDING PROTEIN WITH PPR MOTIF AND USE OF THE DNA-BINDING PROTEIN |
CN106591367B (zh) * | 2017-01-19 | 2019-05-07 | 中国人民解放军第二军医大学 | 一种在体内获得并纯化大量目的LncRNA的方法 |
US20230287060A1 (en) * | 2018-06-06 | 2023-09-14 | The University Of Western Australia | Proteins and their use for nucleotide binding |
CN111919257B (zh) * | 2018-07-27 | 2021-05-28 | 思勤有限公司 | 降低测序数据中的噪声的方法和系统及其实施和应用 |
KR20210062639A (ko) * | 2018-08-27 | 2021-05-31 | 고쿠리츠다이가쿠호진 히로시마다이가쿠 | 신규 뉴클레아제 도메인 및 그 이용 |
CN113646429A (zh) | 2019-04-05 | 2021-11-12 | 国立大学法人大阪大学 | 敲入细胞的制作方法 |
EP3977849A4 (en) * | 2019-05-29 | 2023-06-28 | Editforce, Inc. | Ppr protein with less aggregation and use thereof |
CN114729017A (zh) | 2019-05-29 | 2022-07-08 | 日商基因编辑力股份有限公司 | Ppr蛋白的有效制作方法及其应用 |
CN115698296A (zh) | 2020-03-31 | 2023-02-03 | 日商基因编辑力股份有限公司 | 编辑靶标rna的方法 |
EP4242237A1 (en) | 2020-11-06 | 2023-09-13 | Editforce, Inc. | Foki nuclease domain variant |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2510096B2 (en) | 2009-12-10 | 2018-02-07 | Regents of the University of Minnesota | Tal effector-mediated dna modification |
JP5485015B2 (ja) | 2010-05-18 | 2014-05-07 | 株式会社グローバル・ニュークリア・フュエル・ジャパン | 燃料集合体 |
JP2013128413A (ja) * | 2010-03-11 | 2013-07-04 | Kyushu Univ | Pprモチーフを利用したrna結合性蛋白質の改変方法 |
EP2784157B1 (en) | 2011-10-21 | 2019-09-18 | Kyushu University, National University Corporation | Design method for rna-binding protein using ppr motif, and use thereof |
BR122020018292B1 (pt) * | 2013-04-22 | 2023-05-16 | Hiroshima University | Métodos para controlar uma função de dna tendo uma sequência alvo, para identificar uma base de dna ou sequência de base de dna, e para identificar uma proteína ppr |
EP3498726A4 (en) * | 2016-08-10 | 2020-03-25 | Fujifilm Wako Pure Chemical Corporation | DNA-BINDING PROTEIN WITH PPR MOTIF AND USE OF THE DNA-BINDING PROTEIN |
-
2014
- 2014-04-22 BR BR122020018292-0A patent/BR122020018292B1/pt active IP Right Grant
- 2014-04-22 KR KR1020157033320A patent/KR20160007541A/ko not_active IP Right Cessation
- 2014-04-22 CN CN202310066485.3A patent/CN116425883A/zh active Pending
- 2014-04-22 WO PCT/JP2014/061329 patent/WO2014175284A1/ja active Application Filing
- 2014-04-22 EP EP20151941.0A patent/EP3696186A1/en active Pending
- 2014-04-22 NZ NZ714264A patent/NZ714264A/en unknown
- 2014-04-22 KR KR1020227013315A patent/KR102606057B1/ko active IP Right Grant
- 2014-04-22 KR KR1020237039952A patent/KR20230164213A/ko active Application Filing
- 2014-04-22 CN CN202310067824.XA patent/CN116444634A/zh active Pending
- 2014-04-22 CN CN202310064591.8A patent/CN116731137A/zh active Pending
- 2014-04-22 SG SG10201802430VA patent/SG10201802430VA/en unknown
- 2014-04-22 BR BR122020018288-1A patent/BR122020018288B1/pt active IP Right Grant
- 2014-04-22 JP JP2015500687A patent/JP5896547B2/ja active Active
- 2014-04-22 US US14/785,952 patent/US10189879B2/en active Active
- 2014-04-22 BR BR112015026707-6A patent/BR112015026707B1/pt active IP Right Grant
- 2014-04-22 CN CN202310070449.4A patent/CN116731198A/zh active Pending
- 2014-04-22 CN CN201480035686.6A patent/CN105392796A/zh active Pending
- 2014-04-22 NZ NZ752706A patent/NZ752706A/en unknown
- 2014-04-22 SG SG11201508730TA patent/SG11201508730TA/en unknown
- 2014-04-22 KR KR1020217009426A patent/KR102390485B1/ko active IP Right Grant
- 2014-04-22 CA CA2910050A patent/CA2910050A1/en active Pending
- 2014-04-22 NZ NZ752705A patent/NZ752705A/en unknown
- 2014-04-22 CN CN202310066077.8A patent/CN116589544A/zh active Pending
- 2014-04-22 AU AU2014258386A patent/AU2014258386B2/en active Active
- 2014-04-22 KR KR1020217016484A patent/KR102326842B1/ko active IP Right Grant
- 2014-04-22 EP EP14787853.2A patent/EP3020722A4/en not_active Withdrawn
-
2015
- 2015-09-28 JP JP2015190124A patent/JP6487306B2/ja active Active
-
2016
- 2016-08-29 HK HK16110233.8A patent/HK1221966A1/zh unknown
- 2016-10-26 HK HK16112290.4A patent/HK1223956A1/zh unknown
-
2018
- 2018-12-03 AU AU2018271425A patent/AU2018271425B2/en active Active
- 2018-12-11 US US16/216,617 patent/US20190169240A1/en not_active Abandoned
-
2019
- 2019-02-21 JP JP2019029017A patent/JP6806822B2/ja active Active
-
2020
- 2020-11-06 AU AU2020264412A patent/AU2020264412B2/en active Active
- 2020-12-04 JP JP2020201866A patent/JP7057983B2/ja active Active
-
2021
- 2021-07-01 US US17/365,090 patent/US20210324019A1/en active Pending
-
2022
- 2022-03-29 JP JP2022053594A patent/JP7290233B2/ja active Active
- 2022-04-27 AU AU2022202757A patent/AU2022202757A1/en not_active Abandoned
-
2023
- 2023-05-19 JP JP2023083041A patent/JP2023096153A/ja active Pending
-
2024
- 2024-04-04 AU AU2024202150A patent/AU2024202150A1/en active Pending
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20210324019A1 (en) | Dna-binding protein using ppr motif, and use thereof | |
US20210403861A1 (en) | Nucleotide-specific recognition sequences for designer tal effectors | |
EP3498726A1 (en) | Dna-binding protein using ppr motif and use of said dna-binding protein | |
JP2014522662A (ja) | オルガネラターゲッティングナノキャリア | |
JP2023036848A (ja) | 凝集の少ないpprタンパク質及びその利用 | |
US20220064229A1 (en) | Methods for designing dna binding protein containing ppr motifs, and use thereof | |
NZ752698B2 (en) | DNA-binding protein using PPR motif, and use thereof |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
B350 | Update of information on the portal [chapter 15.35 patent gazette] | ||
B07A | Application suspended after technical examination (opinion) [chapter 7.1 patent gazette] | ||
B09A | Decision: intention to grant [chapter 9.1 patent gazette] | ||
B16A | Patent or certificate of addition of invention granted [chapter 16.1 patent gazette] |
Free format text: PRAZO DE VALIDADE: 20 (VINTE) ANOS CONTADOS A PARTIR DE 22/04/2014, OBSERVADAS AS CONDICOES LEGAIS |