KR20220023984A - 응집이 적은 피피알 단백질 및 그의 이용 - Google Patents
응집이 적은 피피알 단백질 및 그의 이용 Download PDFInfo
- Publication number
- KR20220023984A KR20220023984A KR1020217040376A KR20217040376A KR20220023984A KR 20220023984 A KR20220023984 A KR 20220023984A KR 1020217040376 A KR1020217040376 A KR 1020217040376A KR 20217040376 A KR20217040376 A KR 20217040376A KR 20220023984 A KR20220023984 A KR 20220023984A
- Authority
- KR
- South Korea
- Prior art keywords
- misc
- feature
- sequence
- ppr
- amino acids
- Prior art date
Links
- 108090000623 proteins and genes Proteins 0.000 title claims abstract description 75
- 102000004169 proteins and genes Human genes 0.000 title claims abstract description 64
- 238000004220 aggregation Methods 0.000 title claims abstract description 25
- 235000001014 amino acid Nutrition 0.000 claims abstract description 450
- 229940024606 amino acid Drugs 0.000 claims abstract description 449
- 150000001413 amino acids Chemical class 0.000 claims abstract description 415
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Chemical compound OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 claims abstract description 134
- 229960001230 asparagine Drugs 0.000 claims abstract description 117
- 235000009582 asparagine Nutrition 0.000 claims abstract description 117
- 230000027455 binding Effects 0.000 claims abstract description 108
- 238000009739 binding Methods 0.000 claims abstract description 107
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 claims abstract description 74
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 claims abstract description 70
- 235000003704 aspartic acid Nutrition 0.000 claims abstract description 70
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 claims abstract description 70
- 235000018102 proteins Nutrition 0.000 claims abstract description 59
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 claims abstract description 44
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 41
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 40
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 40
- 239000004471 Glycine Substances 0.000 claims abstract description 37
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 claims abstract description 34
- 235000013922 glutamic acid Nutrition 0.000 claims abstract description 32
- 239000004220 glutamic acid Substances 0.000 claims abstract description 32
- 239000004472 Lysine Substances 0.000 claims abstract description 29
- 235000018977 lysine Nutrition 0.000 claims abstract description 29
- 230000002776 aggregation Effects 0.000 claims abstract description 24
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 claims abstract description 23
- 235000004554 glutamine Nutrition 0.000 claims abstract description 23
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 claims abstract description 22
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 claims abstract description 15
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 claims abstract description 13
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 claims description 89
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 claims description 60
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 claims description 56
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 claims description 56
- 210000004027 cell Anatomy 0.000 claims description 39
- 239000013598 vector Substances 0.000 claims description 33
- 229930024421 Adenine Natural products 0.000 claims description 31
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 claims description 31
- 229960000643 adenine Drugs 0.000 claims description 31
- 238000000034 method Methods 0.000 claims description 29
- 229940104302 cytosine Drugs 0.000 claims description 28
- 229940035893 uracil Drugs 0.000 claims description 28
- 108020001507 fusion proteins Proteins 0.000 claims description 20
- 102000037865 fusion proteins Human genes 0.000 claims description 20
- 108010076504 Protein Sorting Signals Proteins 0.000 claims description 17
- 125000000613 asparagine group Chemical group N[C@@H](CC(N)=O)C(=O)* 0.000 claims description 13
- 238000004519 manufacturing process Methods 0.000 claims description 11
- 239000002773 nucleotide Substances 0.000 claims description 10
- 125000003729 nucleotide group Chemical group 0.000 claims description 10
- 210000004899 c-terminal region Anatomy 0.000 claims description 8
- 108091006047 fluorescent proteins Proteins 0.000 claims description 7
- 102000034287 fluorescent proteins Human genes 0.000 claims description 7
- 230000007704 transition Effects 0.000 claims description 6
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 claims 1
- 229910052698 phosphorus Inorganic materials 0.000 claims 1
- 239000011574 phosphorus Substances 0.000 claims 1
- 230000001976 improved effect Effects 0.000 abstract description 11
- 229920005630 polypropylene random copolymer Polymers 0.000 description 303
- 229960005261 aspartic acid Drugs 0.000 description 63
- 125000003275 alpha amino acid group Chemical group 0.000 description 54
- 108020004414 DNA Proteins 0.000 description 53
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 43
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 34
- 235000014393 valine Nutrition 0.000 description 34
- 239000004474 valine Substances 0.000 description 34
- 229960004295 valine Drugs 0.000 description 34
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 33
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 30
- 239000004473 Threonine Substances 0.000 description 30
- 235000008521 threonine Nutrition 0.000 description 30
- 229960002898 threonine Drugs 0.000 description 30
- 108090000765 processed proteins & peptides Proteins 0.000 description 29
- 229920001184 polypeptide Polymers 0.000 description 27
- 102000004196 processed proteins & peptides Human genes 0.000 description 27
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 23
- NHHKSOGJYNQENP-SRVKXCTJSA-N Leu-Cys-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)O)N NHHKSOGJYNQENP-SRVKXCTJSA-N 0.000 description 22
- YLBNZCJFSVJDRJ-KJEVXHAQSA-N Val-Thr-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](Cc1ccc(O)cc1)C(O)=O YLBNZCJFSVJDRJ-KJEVXHAQSA-N 0.000 description 22
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 18
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 18
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 18
- 235000004400 serine Nutrition 0.000 description 18
- 229960001153 serine Drugs 0.000 description 18
- WLYPRKLMRIYGPP-JYJNAYRXSA-N Phe-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 WLYPRKLMRIYGPP-JYJNAYRXSA-N 0.000 description 16
- NKRJALPCDNXULF-BYULHYEWSA-N Ile-Asp-Gly Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O NKRJALPCDNXULF-BYULHYEWSA-N 0.000 description 15
- JVGDAEKKZKKZFO-RCWTZXSCSA-N Val-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C(C)C)N)O JVGDAEKKZKKZFO-RCWTZXSCSA-N 0.000 description 14
- 108010038633 aspartylglutamate Proteins 0.000 description 14
- YIFUFYZELCMPJP-YUMQZZPRSA-N Gly-Leu-Cys Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(O)=O YIFUFYZELCMPJP-YUMQZZPRSA-N 0.000 description 13
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 13
- KOSWSHVQIVTVQF-ZPFDUUQYSA-N Leu-Ile-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O KOSWSHVQIVTVQF-ZPFDUUQYSA-N 0.000 description 13
- 108010047857 aspartylglycine Proteins 0.000 description 13
- 229960000310 isoleucine Drugs 0.000 description 13
- 235000014705 isoleucine Nutrition 0.000 description 13
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 13
- VAWNQIGQPUOPQW-ACZMJKKPSA-N Asp-Glu-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O VAWNQIGQPUOPQW-ACZMJKKPSA-N 0.000 description 12
- 241000588724 Escherichia coli Species 0.000 description 12
- QVFGXCVIXXBFHO-AVGNSLFASA-N Leu-Glu-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O QVFGXCVIXXBFHO-AVGNSLFASA-N 0.000 description 12
- GPAHWYRSHCKICP-GUBZILKMSA-N Met-Glu-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O GPAHWYRSHCKICP-GUBZILKMSA-N 0.000 description 12
- 230000006870 function Effects 0.000 description 12
- 108010009298 lysylglutamic acid Proteins 0.000 description 12
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 11
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 11
- DTUZCYRNEJDKSR-NHCYSSNCSA-N Lys-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN DTUZCYRNEJDKSR-NHCYSSNCSA-N 0.000 description 11
- 108010039538 alanyl-glycyl-aspartyl-valine Proteins 0.000 description 11
- 235000005772 leucine Nutrition 0.000 description 11
- 108020004999 messenger RNA Proteins 0.000 description 11
- QCVXMEHGFUMKCO-YUMQZZPRSA-N Asp-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O QCVXMEHGFUMKCO-YUMQZZPRSA-N 0.000 description 10
- ITYRYNUZHPNCIK-GUBZILKMSA-N Glu-Ala-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O ITYRYNUZHPNCIK-GUBZILKMSA-N 0.000 description 10
- CGOHAEBMDSEKFB-FXQIFTODSA-N Glu-Glu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O CGOHAEBMDSEKFB-FXQIFTODSA-N 0.000 description 10
- GLYJPWIRLBAIJH-UHFFFAOYSA-N Ile-Lys-Pro Natural products CCC(C)C(N)C(=O)NC(CCCCN)C(=O)N1CCCC1C(O)=O GLYJPWIRLBAIJH-UHFFFAOYSA-N 0.000 description 10
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 10
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 10
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 10
- PRKWBYCXBBSLSK-GUBZILKMSA-N Pro-Ser-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O PRKWBYCXBBSLSK-GUBZILKMSA-N 0.000 description 10
- FLPZMPOZGYPBEN-PPCPHDFISA-N Thr-Leu-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FLPZMPOZGYPBEN-PPCPHDFISA-N 0.000 description 10
- BBPCSGKKPJUYRB-UVOCVTCTSA-N Thr-Thr-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O BBPCSGKKPJUYRB-UVOCVTCTSA-N 0.000 description 10
- VLOYGOZDPGYWFO-LAEOZQHASA-N Val-Asp-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VLOYGOZDPGYWFO-LAEOZQHASA-N 0.000 description 10
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 10
- 235000008729 phenylalanine Nutrition 0.000 description 10
- BLIMFWGRQKRCGT-YUMQZZPRSA-N Ala-Gly-Lys Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN BLIMFWGRQKRCGT-YUMQZZPRSA-N 0.000 description 9
- ZNFPUOSTMUMUDR-JRQIVUDYSA-N Tyr-Asn-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZNFPUOSTMUMUDR-JRQIVUDYSA-N 0.000 description 9
- 108010015792 glycyllysine Proteins 0.000 description 9
- 108010017391 lysylvaline Proteins 0.000 description 9
- 239000011780 sodium chloride Substances 0.000 description 9
- CCDFBRZVTDDJNM-GUBZILKMSA-N Ala-Leu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O CCDFBRZVTDDJNM-GUBZILKMSA-N 0.000 description 8
- RFXXUWGNVRJTNQ-QXEWZRGKSA-N Arg-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCCN=C(N)N)N RFXXUWGNVRJTNQ-QXEWZRGKSA-N 0.000 description 8
- OZHXXYOHPLLLMI-CIUDSAMLSA-N Cys-Lys-Ala Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O OZHXXYOHPLLLMI-CIUDSAMLSA-N 0.000 description 8
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 8
- BGZCJDGBBUUBHA-KKUMJFAQSA-N Leu-Lys-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O BGZCJDGBBUUBHA-KKUMJFAQSA-N 0.000 description 8
- PJWOOBTYQNNRBF-BZSNNMDCSA-N Leu-Phe-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)O)N PJWOOBTYQNNRBF-BZSNNMDCSA-N 0.000 description 8
- VQXAVLQBQJMENB-SRVKXCTJSA-N Lys-Glu-Met Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O VQXAVLQBQJMENB-SRVKXCTJSA-N 0.000 description 8
- XUSDDSLCRPUKLP-QXEWZRGKSA-N Pro-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 XUSDDSLCRPUKLP-QXEWZRGKSA-N 0.000 description 8
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 8
- WSTIOCFMWXNOCX-YUMQZZPRSA-N Ser-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CO)N WSTIOCFMWXNOCX-YUMQZZPRSA-N 0.000 description 8
- LVRFMARKDGGZMX-IZPVPAKOSA-N Thr-Tyr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CC1=CC=C(O)C=C1 LVRFMARKDGGZMX-IZPVPAKOSA-N 0.000 description 8
- KLQPIEVIKOQRAW-IZPVPAKOSA-N Tyr-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O KLQPIEVIKOQRAW-IZPVPAKOSA-N 0.000 description 8
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 8
- 210000002472 endoplasmic reticulum Anatomy 0.000 description 8
- 230000002209 hydrophobic effect Effects 0.000 description 8
- 235000013930 proline Nutrition 0.000 description 8
- 108010073969 valyllysine Proteins 0.000 description 8
- XFIHDSBIPWEYJJ-YUMQZZPRSA-N Lys-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN XFIHDSBIPWEYJJ-YUMQZZPRSA-N 0.000 description 7
- 108020004518 RNA Probes Proteins 0.000 description 7
- 239000003391 RNA probe Substances 0.000 description 7
- 230000004570 RNA-binding Effects 0.000 description 7
- 239000013612 plasmid Substances 0.000 description 7
- 239000000126 substance Substances 0.000 description 7
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 6
- AWZKCUCQJNTBAD-SRVKXCTJSA-N Ala-Leu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN AWZKCUCQJNTBAD-SRVKXCTJSA-N 0.000 description 6
- 239000004475 Arginine Substances 0.000 description 6
- WNRZUESNGGDCJX-JYJNAYRXSA-N Glu-Leu-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O WNRZUESNGGDCJX-JYJNAYRXSA-N 0.000 description 6
- AOCARQDSFTWWFT-DCAQKATOSA-N Glu-Met-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O AOCARQDSFTWWFT-DCAQKATOSA-N 0.000 description 6
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 6
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 6
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 6
- ZAVCJRJOQKIOJW-KKUMJFAQSA-N Leu-Phe-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=CC=C1 ZAVCJRJOQKIOJW-KKUMJFAQSA-N 0.000 description 6
- HAUUXTXKJNVIFY-ONGXEEELSA-N Lys-Gly-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HAUUXTXKJNVIFY-ONGXEEELSA-N 0.000 description 6
- OBZHNHBAAVEWKI-DCAQKATOSA-N Lys-Pro-Asn Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O OBZHNHBAAVEWKI-DCAQKATOSA-N 0.000 description 6
- SBQDRNOLGSYHQA-YUMQZZPRSA-N Lys-Ser-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SBQDRNOLGSYHQA-YUMQZZPRSA-N 0.000 description 6
- WPTHAGXMYDRPFD-SRVKXCTJSA-N Met-Lys-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O WPTHAGXMYDRPFD-SRVKXCTJSA-N 0.000 description 6
- 241001465754 Metazoa Species 0.000 description 6
- 108010047495 alanylglycine Proteins 0.000 description 6
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 6
- 235000009697 arginine Nutrition 0.000 description 6
- RAXXELZNTBOGNW-UHFFFAOYSA-N imidazole Natural products C1=CNC=N1 RAXXELZNTBOGNW-UHFFFAOYSA-N 0.000 description 6
- 108010064235 lysylglycine Proteins 0.000 description 6
- 229930182817 methionine Natural products 0.000 description 6
- 235000006109 methionine Nutrition 0.000 description 6
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 6
- 235000002374 tyrosine Nutrition 0.000 description 6
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 6
- JBDLMLZNDRLDIX-HJGDQZAQSA-N Asn-Thr-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O JBDLMLZNDRLDIX-HJGDQZAQSA-N 0.000 description 5
- OCJRHJZKGGSPRW-IUCAKERBSA-N Glu-Lys-Gly Chemical compound NCCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O OCJRHJZKGGSPRW-IUCAKERBSA-N 0.000 description 5
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 5
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 5
- 241000880493 Leptailurus serval Species 0.000 description 5
- KERCOYANYUPLHJ-XGEHTFHBSA-N Thr-Pro-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O KERCOYANYUPLHJ-XGEHTFHBSA-N 0.000 description 5
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 5
- 239000000872 buffer Substances 0.000 description 5
- 235000018417 cysteine Nutrition 0.000 description 5
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 5
- 201000010099 disease Diseases 0.000 description 5
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 5
- 238000010828 elution Methods 0.000 description 5
- 108010048367 enhanced green fluorescent protein Proteins 0.000 description 5
- 238000001641 gel filtration chromatography Methods 0.000 description 5
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 5
- 235000014304 histidine Nutrition 0.000 description 5
- 238000001727 in vivo Methods 0.000 description 5
- 239000000243 solution Substances 0.000 description 5
- 229960004799 tryptophan Drugs 0.000 description 5
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 4
- JOTRDIXZHNQYGP-DCAQKATOSA-N Arg-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N JOTRDIXZHNQYGP-DCAQKATOSA-N 0.000 description 4
- QYRMBFWDSFGSFC-OLHMAJIHSA-N Asn-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O QYRMBFWDSFGSFC-OLHMAJIHSA-N 0.000 description 4
- WQAOZCVOOYUWKG-LSJOCFKGSA-N Asn-Val-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CC(=O)N)N WQAOZCVOOYUWKG-LSJOCFKGSA-N 0.000 description 4
- LTXGDRFJRZSZAV-CIUDSAMLSA-N Asp-Glu-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)O)N LTXGDRFJRZSZAV-CIUDSAMLSA-N 0.000 description 4
- ZUNMTUPRQMWMHX-LSJOCFKGSA-N Asp-Val-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O ZUNMTUPRQMWMHX-LSJOCFKGSA-N 0.000 description 4
- 238000002965 ELISA Methods 0.000 description 4
- JHSRJMUJOGLIHK-GUBZILKMSA-N Glu-Met-Glu Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)O)N JHSRJMUJOGLIHK-GUBZILKMSA-N 0.000 description 4
- SOEPMWQCTJITPZ-SRVKXCTJSA-N Glu-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N SOEPMWQCTJITPZ-SRVKXCTJSA-N 0.000 description 4
- SCWYHUQOOFRVHP-MBLNEYKQSA-N Gly-Ile-Thr Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SCWYHUQOOFRVHP-MBLNEYKQSA-N 0.000 description 4
- PTIIBFKSLCYQBO-NHCYSSNCSA-N Gly-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)CN PTIIBFKSLCYQBO-NHCYSSNCSA-N 0.000 description 4
- FNXSYBOHALPRHV-ONGXEEELSA-N Gly-Val-Lys Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN FNXSYBOHALPRHV-ONGXEEELSA-N 0.000 description 4
- UDLAWRKOVFDKFL-PEFMBERDSA-N Ile-Asp-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N UDLAWRKOVFDKFL-PEFMBERDSA-N 0.000 description 4
- PHIXPNQDGGILMP-YVNDNENWSA-N Ile-Glu-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N PHIXPNQDGGILMP-YVNDNENWSA-N 0.000 description 4
- GLYJPWIRLBAIJH-FQUUOJAGSA-N Ile-Lys-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N GLYJPWIRLBAIJH-FQUUOJAGSA-N 0.000 description 4
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 4
- DRCILAJNUJKAHC-SRVKXCTJSA-N Lys-Glu-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O DRCILAJNUJKAHC-SRVKXCTJSA-N 0.000 description 4
- QBEPTBMRQALPEV-MNXVOIDGSA-N Lys-Ile-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN QBEPTBMRQALPEV-MNXVOIDGSA-N 0.000 description 4
- XIZQPFCRXLUNMK-BZSNNMDCSA-N Lys-Leu-Phe Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCCCN)N XIZQPFCRXLUNMK-BZSNNMDCSA-N 0.000 description 4
- WGILOYIKJVQUPT-DCAQKATOSA-N Lys-Pro-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O WGILOYIKJVQUPT-DCAQKATOSA-N 0.000 description 4
- QLFAPXUXEBAWEK-NHCYSSNCSA-N Lys-Val-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O QLFAPXUXEBAWEK-NHCYSSNCSA-N 0.000 description 4
- AHZNUGRZHMZGFL-GUBZILKMSA-N Met-Arg-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CCCNC(N)=N AHZNUGRZHMZGFL-GUBZILKMSA-N 0.000 description 4
- DDYIRGBOZVKRFR-AVGNSLFASA-N Phe-Asp-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N DDYIRGBOZVKRFR-AVGNSLFASA-N 0.000 description 4
- AHXPYZRZRMQOAU-QXEWZRGKSA-N Pro-Asn-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H]1CCCN1)C(O)=O AHXPYZRZRMQOAU-QXEWZRGKSA-N 0.000 description 4
- OWCVUSJMEBGMOK-YUMQZZPRSA-N Ser-Lys-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O OWCVUSJMEBGMOK-YUMQZZPRSA-N 0.000 description 4
- PZBFGYYEXUXCOF-UHFFFAOYSA-N TCEP Chemical compound OC(=O)CCP(CCC(O)=O)CCC(O)=O PZBFGYYEXUXCOF-UHFFFAOYSA-N 0.000 description 4
- 238000009395 breeding Methods 0.000 description 4
- 238000010276 construction Methods 0.000 description 4
- 210000004748 cultured cell Anatomy 0.000 description 4
- 238000002523 gelfiltration Methods 0.000 description 4
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 4
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 4
- 238000004020 luminiscence type Methods 0.000 description 4
- 108010056582 methionylglutamic acid Proteins 0.000 description 4
- 230000035772 mutation Effects 0.000 description 4
- 239000000523 sample Substances 0.000 description 4
- 238000013519 translation Methods 0.000 description 4
- 241000196324 Embryophyta Species 0.000 description 3
- NJCALAAIGREHDR-WDCWCFNPSA-N Glu-Leu-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NJCALAAIGREHDR-WDCWCFNPSA-N 0.000 description 3
- 206010018910 Haemolysis Diseases 0.000 description 3
- 101000966742 Homo sapiens Leucine-rich PPR motif-containing protein, mitochondrial Proteins 0.000 description 3
- ANTFEOSJMAUGIB-KNZXXDILSA-N Ile-Thr-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@@H]1C(=O)O)N ANTFEOSJMAUGIB-KNZXXDILSA-N 0.000 description 3
- HRTRLSRYZZKPCO-BJDJZHNGSA-N Leu-Ile-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O HRTRLSRYZZKPCO-BJDJZHNGSA-N 0.000 description 3
- 102100040589 Leucine-rich PPR motif-containing protein, mitochondrial Human genes 0.000 description 3
- WWWGMQHQSAUXBU-BQBZGAKWSA-N Met-Gly-Asn Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(N)=O WWWGMQHQSAUXBU-BQBZGAKWSA-N 0.000 description 3
- 102000051619 SUMO-1 Human genes 0.000 description 3
- CXWJFWAZIVWBOS-XQQFMLRXSA-N Val-Lys-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N CXWJFWAZIVWBOS-XQQFMLRXSA-N 0.000 description 3
- 230000001488 breeding effect Effects 0.000 description 3
- 238000005119 centrifugation Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 239000003814 drug Substances 0.000 description 3
- 238000002337 electrophoretic mobility shift assay Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 230000008588 hemolysis Effects 0.000 description 3
- 230000003834 intracellular effect Effects 0.000 description 3
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 3
- 230000004807 localization Effects 0.000 description 3
- 239000012139 lysis buffer Substances 0.000 description 3
- 244000005700 microbiome Species 0.000 description 3
- 239000000047 product Substances 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 229940113082 thymine Drugs 0.000 description 3
- 239000011534 wash buffer Substances 0.000 description 3
- GJLXVWOMRRWCIB-MERZOTPQSA-N (2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-acetamido-5-(diaminomethylideneamino)pentanoyl]amino]-3-(4-hydroxyphenyl)propanoyl]amino]-3-(4-hydroxyphenyl)propanoyl]amino]-5-(diaminomethylideneamino)pentanoyl]amino]-3-(1H-indol-3-yl)propanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanamide Chemical compound C([C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(N)=O)C1=CC=C(O)C=C1 GJLXVWOMRRWCIB-MERZOTPQSA-N 0.000 description 2
- JKMHFZQWWAIEOD-UHFFFAOYSA-N 2-[4-(2-hydroxyethyl)piperazin-1-yl]ethanesulfonic acid Chemical compound OCC[NH+]1CCN(CCS([O-])(=O)=O)CC1 JKMHFZQWWAIEOD-UHFFFAOYSA-N 0.000 description 2
- 101710159080 Aconitate hydratase A Proteins 0.000 description 2
- 101710159078 Aconitate hydratase B Proteins 0.000 description 2
- MCKSLROAGSDNFC-ACZMJKKPSA-N Ala-Asp-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MCKSLROAGSDNFC-ACZMJKKPSA-N 0.000 description 2
- WGDNWOMKBUXFHR-BQBZGAKWSA-N Ala-Gly-Arg Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N WGDNWOMKBUXFHR-BQBZGAKWSA-N 0.000 description 2
- 108010011667 Ala-Phe-Ala Proteins 0.000 description 2
- XRUJOVRWNMBAAA-NHCYSSNCSA-N Ala-Phe-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 XRUJOVRWNMBAAA-NHCYSSNCSA-N 0.000 description 2
- IORKCNUBHNIMKY-CIUDSAMLSA-N Ala-Pro-Glu Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O IORKCNUBHNIMKY-CIUDSAMLSA-N 0.000 description 2
- JUWQNWXEGDYCIE-YUMQZZPRSA-N Arg-Gln-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O JUWQNWXEGDYCIE-YUMQZZPRSA-N 0.000 description 2
- MZRBYBIQTIKERR-GUBZILKMSA-N Arg-Glu-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MZRBYBIQTIKERR-GUBZILKMSA-N 0.000 description 2
- YQGZIRIYGHNSQO-ZPFDUUQYSA-N Arg-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N YQGZIRIYGHNSQO-ZPFDUUQYSA-N 0.000 description 2
- UGZUVYDKAYNCII-ULQDDVLXSA-N Arg-Phe-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O UGZUVYDKAYNCII-ULQDDVLXSA-N 0.000 description 2
- NNMUHYLAYUSTTN-FXQIFTODSA-N Asn-Gln-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O NNMUHYLAYUSTTN-FXQIFTODSA-N 0.000 description 2
- NHSDEZURHWEZPN-SXTJYALSSA-N Asp-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H](CC(=O)O)N NHSDEZURHWEZPN-SXTJYALSSA-N 0.000 description 2
- PAYPSKIBMDHZPI-CIUDSAMLSA-N Asp-Leu-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O PAYPSKIBMDHZPI-CIUDSAMLSA-N 0.000 description 2
- QSFHZPQUAAQHAQ-CIUDSAMLSA-N Asp-Ser-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O QSFHZPQUAAQHAQ-CIUDSAMLSA-N 0.000 description 2
- WAEDSQFVZJUHLI-BYULHYEWSA-N Asp-Val-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O WAEDSQFVZJUHLI-BYULHYEWSA-N 0.000 description 2
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 2
- 241000283690 Bos taurus Species 0.000 description 2
- NIXHTNJAGGFBAW-CIUDSAMLSA-N Cys-Lys-Ser Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CS)N NIXHTNJAGGFBAW-CIUDSAMLSA-N 0.000 description 2
- 102100022692 Density-regulated protein Human genes 0.000 description 2
- 101710092028 Density-regulated protein Proteins 0.000 description 2
- 102000004190 Enzymes Human genes 0.000 description 2
- 108090000790 Enzymes Proteins 0.000 description 2
- BPDVTFBJZNBHEU-HGNGGELXSA-N Glu-Ala-His Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 BPDVTFBJZNBHEU-HGNGGELXSA-N 0.000 description 2
- NLKVNZUFDPWPNL-YUMQZZPRSA-N Glu-Arg-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O NLKVNZUFDPWPNL-YUMQZZPRSA-N 0.000 description 2
- MUSGDMDGNGXULI-DCAQKATOSA-N Glu-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O MUSGDMDGNGXULI-DCAQKATOSA-N 0.000 description 2
- LGYZYFFDELZWRS-DCAQKATOSA-N Glu-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O LGYZYFFDELZWRS-DCAQKATOSA-N 0.000 description 2
- ITZOBNKQDZEOCE-NHCYSSNCSA-N Gly-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)CN ITZOBNKQDZEOCE-NHCYSSNCSA-N 0.000 description 2
- OQQKUTVULYLCDG-ONGXEEELSA-N Gly-Lys-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCCN)NC(=O)CN)C(O)=O OQQKUTVULYLCDG-ONGXEEELSA-N 0.000 description 2
- 239000007995 HEPES buffer Substances 0.000 description 2
- FYTCLUIYTYFGPT-YUMQZZPRSA-N His-Gly-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FYTCLUIYTYFGPT-YUMQZZPRSA-N 0.000 description 2
- 108010093488 His-His-His-His-His-His Proteins 0.000 description 2
- VJJSDSNFXCWCEJ-DJFWLOJKSA-N His-Ile-Asn Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O VJJSDSNFXCWCEJ-DJFWLOJKSA-N 0.000 description 2
- 102100022823 Histone RNA hairpin-binding protein Human genes 0.000 description 2
- 101000825762 Homo sapiens Histone RNA hairpin-binding protein Proteins 0.000 description 2
- IDAHFEPYTJJZFD-PEFMBERDSA-N Ile-Asp-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N IDAHFEPYTJJZFD-PEFMBERDSA-N 0.000 description 2
- CDGLBYSAZFIIJO-RCOVLWMOSA-N Ile-Gly-Gly Chemical compound CC[C@H](C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O CDGLBYSAZFIIJO-RCOVLWMOSA-N 0.000 description 2
- GVNNAHIRSDRIII-AJNGGQMLSA-N Ile-Lys-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N GVNNAHIRSDRIII-AJNGGQMLSA-N 0.000 description 2
- CIDLJWVDMNDKPT-FIRPJDEBSA-N Ile-Phe-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)O)N CIDLJWVDMNDKPT-FIRPJDEBSA-N 0.000 description 2
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 2
- LHSGPCFBGJHPCY-UHFFFAOYSA-N L-leucine-L-tyrosine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-UHFFFAOYSA-N 0.000 description 2
- 208000006136 Leigh Disease Diseases 0.000 description 2
- ZYLJULGXQDNXDK-GUBZILKMSA-N Leu-Gln-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O ZYLJULGXQDNXDK-GUBZILKMSA-N 0.000 description 2
- WIDZHJTYKYBLSR-DCAQKATOSA-N Leu-Glu-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WIDZHJTYKYBLSR-DCAQKATOSA-N 0.000 description 2
- APFJUBGRZGMQFF-QWRGUYRKSA-N Leu-Gly-Lys Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN APFJUBGRZGMQFF-QWRGUYRKSA-N 0.000 description 2
- LZHJZLHSRGWBBE-IHRRRGAJSA-N Leu-Lys-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O LZHJZLHSRGWBBE-IHRRRGAJSA-N 0.000 description 2
- BJWKOATWNQJPSK-SRVKXCTJSA-N Leu-Met-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N BJWKOATWNQJPSK-SRVKXCTJSA-N 0.000 description 2
- 108060001084 Luciferase Proteins 0.000 description 2
- 239000005089 Luciferase Substances 0.000 description 2
- CNGOEHJCLVCJHN-SRVKXCTJSA-N Lys-Pro-Glu Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O CNGOEHJCLVCJHN-SRVKXCTJSA-N 0.000 description 2
- 101710120903 Malignant T-cell-amplified sequence 1 Proteins 0.000 description 2
- 102100040888 Malignant T-cell-amplified sequence 1 Human genes 0.000 description 2
- MTBVQFFQMXHCPC-CIUDSAMLSA-N Met-Glu-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MTBVQFFQMXHCPC-CIUDSAMLSA-N 0.000 description 2
- XKJUFUPCHARJKX-UWVGGRQHSA-N Met-Gly-His Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CNC=N1 XKJUFUPCHARJKX-UWVGGRQHSA-N 0.000 description 2
- 101100342977 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) leu-1 gene Proteins 0.000 description 2
- 108091028043 Nucleic acid sequence Proteins 0.000 description 2
- 108020002230 Pancreatic Ribonuclease Proteins 0.000 description 2
- 102000005891 Pancreatic ribonuclease Human genes 0.000 description 2
- VPEVBAUSTBWQHN-NHCYSSNCSA-N Pro-Glu-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O VPEVBAUSTBWQHN-NHCYSSNCSA-N 0.000 description 2
- 238000010357 RNA editing Methods 0.000 description 2
- 230000026279 RNA modification Effects 0.000 description 2
- 102000044126 RNA-Binding Proteins Human genes 0.000 description 2
- 101710105008 RNA-binding protein Proteins 0.000 description 2
- 108700038981 SUMO-1 Proteins 0.000 description 2
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 2
- BNFVPSRLHHPQKS-WHFBIAKZSA-N Ser-Asp-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O BNFVPSRLHHPQKS-WHFBIAKZSA-N 0.000 description 2
- OHKFXGKHSJKKAL-NRPADANISA-N Ser-Glu-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O OHKFXGKHSJKKAL-NRPADANISA-N 0.000 description 2
- GYDFRTRSSXOZCR-ACZMJKKPSA-N Ser-Ser-Glu Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O GYDFRTRSSXOZCR-ACZMJKKPSA-N 0.000 description 2
- HSWXBJCBYSWBPT-GUBZILKMSA-N Ser-Val-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CO)C(C)C)C(O)=O HSWXBJCBYSWBPT-GUBZILKMSA-N 0.000 description 2
- AAZOYLQUEQRUMZ-GSSVUCPTSA-N Thr-Thr-Asn Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(N)=O AAZOYLQUEQRUMZ-GSSVUCPTSA-N 0.000 description 2
- ZESGVALRVJIVLZ-VFCFLDTKSA-N Thr-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@@H]1C(=O)O)N)O ZESGVALRVJIVLZ-VFCFLDTKSA-N 0.000 description 2
- NJGMALCNYAMYCB-JRQIVUDYSA-N Thr-Tyr-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O NJGMALCNYAMYCB-JRQIVUDYSA-N 0.000 description 2
- 102100026231 Translocon-associated protein subunit alpha Human genes 0.000 description 2
- JWHOIHCOHMZSAR-QWRGUYRKSA-N Tyr-Asp-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 JWHOIHCOHMZSAR-QWRGUYRKSA-N 0.000 description 2
- 235000004279 alanine Nutrition 0.000 description 2
- 108010005233 alanylglutamic acid Proteins 0.000 description 2
- 230000003321 amplification Effects 0.000 description 2
- 210000004102 animal cell Anatomy 0.000 description 2
- 238000003556 assay Methods 0.000 description 2
- -1 celine Chemical compound 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 229940088598 enzyme Drugs 0.000 description 2
- 239000013613 expression plasmid Substances 0.000 description 2
- 239000013604 expression vector Substances 0.000 description 2
- 238000002073 fluorescence micrograph Methods 0.000 description 2
- 108010021843 fluorescent protein 583 Proteins 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 238000010362 genome editing Methods 0.000 description 2
- 108010057083 glutamyl-aspartyl-leucine Proteins 0.000 description 2
- 108010049041 glutamylalanine Proteins 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000001939 inductive effect Effects 0.000 description 2
- 230000000977 initiatory effect Effects 0.000 description 2
- 239000000543 intermediate Substances 0.000 description 2
- 238000005342 ion exchange Methods 0.000 description 2
- 108010034529 leucyl-lysine Proteins 0.000 description 2
- 108010012058 leucyltyrosine Proteins 0.000 description 2
- 239000006166 lysate Substances 0.000 description 2
- 125000003588 lysine group Chemical group [H]N([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 description 2
- 230000014759 maintenance of location Effects 0.000 description 2
- 239000002609 medium Substances 0.000 description 2
- 239000012528 membrane Substances 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 239000000178 monomer Substances 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- YBYRMVIVWMBXKQ-UHFFFAOYSA-N phenylmethanesulfonyl fluoride Chemical compound FS(=O)(=O)CC1=CC=CC=C1 YBYRMVIVWMBXKQ-UHFFFAOYSA-N 0.000 description 2
- 108091033319 polynucleotide Proteins 0.000 description 2
- 102000040430 polynucleotide Human genes 0.000 description 2
- 239000002157 polynucleotide Substances 0.000 description 2
- 108010025826 prolyl-leucyl-arginine Proteins 0.000 description 2
- 108010031719 prolyl-serine Proteins 0.000 description 2
- 230000001737 promoting effect Effects 0.000 description 2
- 238000012552 review Methods 0.000 description 2
- 230000005945 translocation Effects 0.000 description 2
- JBFQOLHAGBKPTP-NZATWWQASA-N (2s)-2-[[(2s)-4-carboxy-2-[[3-carboxy-2-[[(2s)-2,6-diaminohexanoyl]amino]propanoyl]amino]butanoyl]amino]-4-methylpentanoic acid Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)C(CC(O)=O)NC(=O)[C@@H](N)CCCCN JBFQOLHAGBKPTP-NZATWWQASA-N 0.000 description 1
- HBZBAMXERPYTFS-SECBINFHSA-N (4S)-2-(6,7-dihydro-5H-pyrrolo[3,2-f][1,3]benzothiazol-2-yl)-4,5-dihydro-1,3-thiazole-4-carboxylic acid Chemical compound OC(=O)[C@H]1CSC(=N1)c1nc2cc3CCNc3cc2s1 HBZBAMXERPYTFS-SECBINFHSA-N 0.000 description 1
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 1
- 101001082110 Acanthamoeba polyphaga mimivirus Eukaryotic translation initiation factor 4E homolog Proteins 0.000 description 1
- 229920000936 Agarose Polymers 0.000 description 1
- CBCCCLMNOBLBSC-XVYDVKMFSA-N Ala-His-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O CBCCCLMNOBLBSC-XVYDVKMFSA-N 0.000 description 1
- CHFFHQUVXHEGBY-GARJFASQSA-N Ala-Lys-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N CHFFHQUVXHEGBY-GARJFASQSA-N 0.000 description 1
- WNHNMKOFKCHKKD-BFHQHQDPSA-N Ala-Thr-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O WNHNMKOFKCHKKD-BFHQHQDPSA-N 0.000 description 1
- 241000219195 Arabidopsis thaliana Species 0.000 description 1
- MFAMTAVAFBPXDC-LPEHRKFASA-N Arg-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O MFAMTAVAFBPXDC-LPEHRKFASA-N 0.000 description 1
- ANPFQTJEPONRPL-UGYAYLCHSA-N Asn-Ile-Asp Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O ANPFQTJEPONRPL-UGYAYLCHSA-N 0.000 description 1
- HPASIOLTWSNMFB-OLHMAJIHSA-N Asn-Thr-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O HPASIOLTWSNMFB-OLHMAJIHSA-N 0.000 description 1
- 101150004109 CYB5R3 gene Proteins 0.000 description 1
- 101000879203 Caenorhabditis elegans Small ubiquitin-related modifier Proteins 0.000 description 1
- 241000282465 Canis Species 0.000 description 1
- 241000282472 Canis lupus familiaris Species 0.000 description 1
- 102000014914 Carrier Proteins Human genes 0.000 description 1
- 241000282693 Cercopithecidae Species 0.000 description 1
- 101100007328 Cocos nucifera COS-1 gene Proteins 0.000 description 1
- 241000699800 Cricetinae Species 0.000 description 1
- 241000699802 Cricetulus griseus Species 0.000 description 1
- 241000195493 Cryptophyta Species 0.000 description 1
- 230000004568 DNA-binding Effects 0.000 description 1
- 101001082109 Danio rerio Eukaryotic translation initiation factor 4E-1B Proteins 0.000 description 1
- 102000016911 Deoxyribonucleases Human genes 0.000 description 1
- 108010053770 Deoxyribonucleases Proteins 0.000 description 1
- 208000035240 Disease Resistance Diseases 0.000 description 1
- 239000006144 Dulbecco’s modified Eagle's medium Substances 0.000 description 1
- 108091005941 EBFP Proteins 0.000 description 1
- 108091005942 ECFP Proteins 0.000 description 1
- 241000283086 Equidae Species 0.000 description 1
- 241000206602 Eukaryota Species 0.000 description 1
- 101710091919 Eukaryotic translation initiation factor 4G Proteins 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 108700007698 Genetic Terminator Regions Proteins 0.000 description 1
- HHQCBFGKQDMWSP-GUBZILKMSA-N Gln-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)N)N HHQCBFGKQDMWSP-GUBZILKMSA-N 0.000 description 1
- ZYRXTRTUCAVNBQ-GVXVVHGQSA-N Glu-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N ZYRXTRTUCAVNBQ-GVXVVHGQSA-N 0.000 description 1
- CCBIBMKQNXHNIN-ZETCQYMHSA-N Gly-Leu-Gly Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O CCBIBMKQNXHNIN-ZETCQYMHSA-N 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 101000998623 Homo sapiens NADH-cytochrome b5 reductase 3 Proteins 0.000 description 1
- 101001093116 Homo sapiens Protein transport protein Sec61 subunit beta Proteins 0.000 description 1
- 101000684503 Homo sapiens Sentrin-specific protease 3 Proteins 0.000 description 1
- 101000629937 Homo sapiens Translocon-associated protein subunit alpha Proteins 0.000 description 1
- 108090000604 Hydrolases Proteins 0.000 description 1
- 102000004157 Hydrolases Human genes 0.000 description 1
- QSPLUJGYOPZINY-ZPFDUUQYSA-N Ile-Asp-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N QSPLUJGYOPZINY-ZPFDUUQYSA-N 0.000 description 1
- IOVUXUSIGXCREV-DKIMLUQUSA-N Ile-Leu-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 IOVUXUSIGXCREV-DKIMLUQUSA-N 0.000 description 1
- 102100034343 Integrase Human genes 0.000 description 1
- 101710203526 Integrase Proteins 0.000 description 1
- 208000017507 Leigh syndrome Diseases 0.000 description 1
- PBIPLDMFHAICIP-DCAQKATOSA-N Lys-Glu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PBIPLDMFHAICIP-DCAQKATOSA-N 0.000 description 1
- 101710186853 Malignant T-cell-amplified sequence 1 homolog Proteins 0.000 description 1
- MHQXIBRPDKXDGZ-ZFWWWQNUSA-N Met-Gly-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)CNC(=O)[C@@H](N)CCSC)C(O)=O)=CNC2=C1 MHQXIBRPDKXDGZ-ZFWWWQNUSA-N 0.000 description 1
- 206010058799 Mitochondrial encephalomyopathy Diseases 0.000 description 1
- 102000016943 Muramidase Human genes 0.000 description 1
- 108010014251 Muramidase Proteins 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- 108010062010 N-Acetylmuramoyl-L-alanine Amidase Proteins 0.000 description 1
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 1
- 102100033153 NADH-cytochrome b5 reductase 3 Human genes 0.000 description 1
- 108010077850 Nuclear Localization Signals Proteins 0.000 description 1
- 102000007999 Nuclear Proteins Human genes 0.000 description 1
- 108010089610 Nuclear Proteins Proteins 0.000 description 1
- 108020004711 Nucleic Acid Probes Proteins 0.000 description 1
- 239000012124 Opti-MEM Substances 0.000 description 1
- 102100036308 Protein transport protein Sec61 subunit beta Human genes 0.000 description 1
- 230000021839 RNA stabilization Effects 0.000 description 1
- 241000700159 Rattus Species 0.000 description 1
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 1
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 1
- 102100023645 Sentrin-specific protease 3 Human genes 0.000 description 1
- INCNPLPRPOYTJI-JBDRJPRFSA-N Ser-Cys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CO)N INCNPLPRPOYTJI-JBDRJPRFSA-N 0.000 description 1
- 102100026900 Signal recognition particle receptor subunit alpha Human genes 0.000 description 1
- 101710126382 Signal recognition particle receptor subunit alpha Proteins 0.000 description 1
- 101710111458 Signal recognition particle receptor subunit alpha homolog Proteins 0.000 description 1
- 241000282887 Suidae Species 0.000 description 1
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 1
- 239000012505 Superdex™ Substances 0.000 description 1
- 102100029887 Translationally-controlled tumor protein Human genes 0.000 description 1
- 101710157927 Translationally-controlled tumor protein Proteins 0.000 description 1
- 101710112880 Translocon-associated protein subunit alpha Proteins 0.000 description 1
- SLLKXDSRVAOREO-KZVJFYERSA-N Val-Ala-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H](C(C)C)N)O SLLKXDSRVAOREO-KZVJFYERSA-N 0.000 description 1
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 238000002835 absorbance Methods 0.000 description 1
- 230000002378 acidificating effect Effects 0.000 description 1
- 239000013543 active substance Substances 0.000 description 1
- 125000000539 amino acid group Chemical group 0.000 description 1
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 1
- 229960000723 ampicillin Drugs 0.000 description 1
- 125000003118 aryl group Chemical group 0.000 description 1
- 230000037429 base substitution Effects 0.000 description 1
- 238000013357 binding ELISA Methods 0.000 description 1
- 108091008324 binding proteins Proteins 0.000 description 1
- 239000002551 biofuel Substances 0.000 description 1
- 230000008827 biological function Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000003197 catalytic effect Effects 0.000 description 1
- 238000005277 cation exchange chromatography Methods 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 238000003776 cleavage reaction Methods 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 239000002537 cosmetic Substances 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 238000012258 culturing Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000000502 dialysis Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 238000009509 drug development Methods 0.000 description 1
- 238000007876 drug discovery Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000009088 enzymatic function Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 239000003205 fragrance Substances 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 229960002449 glycine Drugs 0.000 description 1
- 238000002169 hydrotherapy Methods 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 230000009878 intermolecular interaction Effects 0.000 description 1
- 230000007326 intracellular aggregation Effects 0.000 description 1
- 210000003734 kidney Anatomy 0.000 description 1
- 238000012933 kinetic analysis Methods 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 244000144972 livestock Species 0.000 description 1
- 229960000274 lysozyme Drugs 0.000 description 1
- 235000010335 lysozyme Nutrition 0.000 description 1
- 239000004325 lysozyme Substances 0.000 description 1
- 108010089256 lysyl-aspartyl-glutamyl-leucine Proteins 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000037353 metabolic pathway Effects 0.000 description 1
- 108091064355 mitochondrial RNA Proteins 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 239000002547 new drug Substances 0.000 description 1
- 229910052757 nitrogen Inorganic materials 0.000 description 1
- 239000002853 nucleic acid probe Substances 0.000 description 1
- 210000003463 organelle Anatomy 0.000 description 1
- 210000001672 ovary Anatomy 0.000 description 1
- 239000008188 pellet Substances 0.000 description 1
- 230000000144 pharmacologic effect Effects 0.000 description 1
- 230000000704 physical effect Effects 0.000 description 1
- 239000000049 pigment Substances 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 108010070643 prolylglutamic acid Proteins 0.000 description 1
- 230000004845 protein aggregation Effects 0.000 description 1
- 108020001580 protein domains Proteins 0.000 description 1
- 239000012460 protein solution Substances 0.000 description 1
- 230000029983 protein stabilization Effects 0.000 description 1
- 230000012743 protein tagging Effects 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 210000003705 ribosome Anatomy 0.000 description 1
- 229920002477 rna polymer Polymers 0.000 description 1
- 230000007017 scission Effects 0.000 description 1
- 125000003607 serino group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C(O[H])([H])[H] 0.000 description 1
- 150000003384 small molecules Chemical class 0.000 description 1
- 238000000527 sonication Methods 0.000 description 1
- 230000009870 specific binding Effects 0.000 description 1
- 210000000130 stem cell Anatomy 0.000 description 1
- 229910052717 sulfur Inorganic materials 0.000 description 1
- 239000011593 sulfur Substances 0.000 description 1
- 239000006228 supernatant Substances 0.000 description 1
- 239000012134 supernatant fraction Substances 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 208000011580 syndromic disease Diseases 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000014616 translation Effects 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 229960005486 vaccine Drugs 0.000 description 1
- 125000002987 valine group Chemical group [H]N([H])C([H])(C(*)=O)C([H])(C([H])([H])[H])C([H])([H])[H] 0.000 description 1
- 210000003501 vero cell Anatomy 0.000 description 1
- 239000013603 viral vector Substances 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
- 239000011701 zinc Substances 0.000 description 1
- 229910052725 zinc Inorganic materials 0.000 description 1
Images
Classifications
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K67/00—Rearing or breeding animals, not otherwise provided for; New or modified breeds of animals
- A01K67/027—New or modified breeds of vertebrates
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/46—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K19/00—Hybrid peptides, i.e. peptides covalently bound to nucleic acids, or non-covalently bound protein-protein complexes
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K7/00—Peptides having 5 to 20 amino acids in a fully defined sequence; Derivatives thereof
- C07K7/04—Linear peptides containing only normal peptide links
- C07K7/06—Linear peptides containing only normal peptide links having 5 to 11 amino acids
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K7/00—Peptides having 5 to 20 amino acids in a fully defined sequence; Derivatives thereof
- C07K7/04—Linear peptides containing only normal peptide links
- C07K7/08—Linear peptides containing only normal peptide links having 12 to 20 amino acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N5/00—Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
- C12N5/10—Cells modified by introduction of foreign genetic material
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/01—Fusion polypeptide containing a localisation/targetting motif
- C07K2319/02—Fusion polypeptide containing a localisation/targetting motif containing a signal sequence
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/60—Fusion polypeptide containing spectroscopic/fluorescent detection, e.g. green fluorescent protein [GFP]
Landscapes
- Chemical & Material Sciences (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Biochemistry (AREA)
- Zoology (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Medicinal Chemistry (AREA)
- Microbiology (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Gastroenterology & Hepatology (AREA)
- Toxicology (AREA)
- Analytical Chemistry (AREA)
- Cell Biology (AREA)
- Immunology (AREA)
- Environmental Sciences (AREA)
- Crystallography & Structural Chemistry (AREA)
- Animal Behavior & Ethology (AREA)
- Animal Husbandry (AREA)
- Biodiversity & Conservation Biology (AREA)
- Peptides Or Proteins (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
PPR 단백질의 응집성을 개선하기 위하여, N-말단으로부터 1번째 PPR 모티프(M1)의 A6 아미노산을 보다 친수성이 되도록 하고, M1의 A9 아미노산을 친수성 아미노산 또는 글리신이 되도록 한다. A6 아미노산은 바람직하게는 아스파라긴 또는 아스파라긴산이고, A9 아미노산은 바람직하게는 글루타민, 글루타민산, 리신 또는 글리신이다. 이러한 PPR 모티프를 M1 모티프로 하여 포함하는 단백질은 응집성이 개선될 뿐만 아니라, 표적 핵산에 대한 높은 결합력을 가질 수 있다.
Description
본 발명은 의도하는 핵산에 결합 가능한 단백질을 사용하는 핵산 조작기술에 관한 것이다. 본 발명은 의료(창약지원, 치료), 농업(농수축산물의 생산, 육종), 화학(생물학적 물질의 생산) 등과 같은 폭넓은 분야에서 유용하다.
피피알(PPR) 단백질은 약 35개 아미노산으로 구성된 PPR 모티프의 반복을 포함하는 단백질로서, PPR 모티프 하나가 하나의 염기와 특이하게 결합할 수 있다. PPR 모티프 중 1번, 4번, (ii)번(다음 모티프 이전 끝으로 부터 2번째) 아미노산의 조합에 따라, 아데닌, 시토신, 구아닌, 우라실(또는 티민) 중 어느 것에 결합하는가가 결정된다(참조: 특허문헌 1, 2).
천연 RNA 결합 PPR 모티프 중 가장 많이 출현하는 각각의 염기에 대응되는 조합은, 아데닌(A)은 1번이 발린, 4번이 트레오닌, (ii)번이 아스파라긴; 시토신(C)은 1번이 발린, 4번이 아스파라긴, (ii)번이 세린; 구아닌(G)은 1번이 발린, 4번이 트레오닌, (ii)번이 아스파라긴산; 우라실(U)은 1번이, 발린, 4번이 아스파라긴, (ii)번이 아스파라긴산이다(참조: 비특허문헌 1~5). 이들 아미노산의 조합을 이용함으로써, 임의 서열에 특이적으로 결합할 수 있는 PPR 단백질의 설계가 가능하다.
1. Coquille, S. et al. An Artificial PPR Scaffold for Programmable RNA Recognition. Nature Communications 5, Article number: 5729 (2014)
2. Shen, C. et al. Specific RNA Recognition by Designer Pentatricopeptide Repeat Protein. Molecular Plant 8, 667-670 (2015)
3. Shen, C. et al. Structural basis for Specific Single-stranded RNA Recognition by Designer Pentatricopeptide Repeat Proteins. Nature Communications, Volume 7, Article number: 11285 (2016)
4. Miranda, R. G. et al. RNA-binding Specificity Landscapes of Designer Pentatricopeptide Repeat Proteins Elucidate Principles of PPR-RNA Interactions. Nucleic Acids Research, 46 (5), 2613-2623 (2018)
5. Yan, J. et al. Delineation of Pentatricopeptide Repeat Codes for Target RNA Prediction. Nucleic Acids Research, gkz 075 (2019)
본 발명자들은 상기 아미노산의 조합을 이용하고 높은 성능을 지니며, 또한, 예를 들어 15개 이상의 많은 PPR 모티프를 연결한 PPR 단백질을 작제하는 것을 검토하였다(참조: 특허문헌 3). 본 발명자들의 검토에 따르면, 이러한 방법으로 작제한 PPR 단백질의 일부에서 응집성(aggregation property)이 나타나는 것을 알 수 있었다. 특히, PPR 단백질을 동물 배양세포에서 발현시킨 경우 응집이 나타났다.
이에, 이러한 점을 PPR 모티프 내의 아미노산 변이로 해결하는 것을 검토하였다. 그리고, PPR 단백질의 1번째 모티프(N-말단 측)의 6번째, 바람직하게는 6번째와 9번째의 아미노산을 친수성 아미노산(hydrophilic amino acid)으로 배치함으로써 PPR의 응집성을 개선할 수 있음을 알아내고, 본 발명을 완성하게 되었다.
본 발명은 이하를 제공한다.
[1] 다음 중 어느 하나의 PPR 모티프:
(C-1) 서열번호 4 내지 7 중 어느 하나의 서열로 구성되는 PPR 모티프;
(C-2) 서열번호 4 내지 7 중 어느 하나의 서열에 있어서 1, 4, 6, 및 34번 위치 아미노산 이외의 아미노산 1 내지 9개가 치환, 결실 또는 부가된 서열로 구성되고 시토신 결합성인 PPR 모티프;
(C-3) 서열번호 4 내지 7 중 어느 하나의 서열과 최소한 80%의 서열 동일성(sequence identity)을 가지되, 1, 4, 6, 및 34번 위치의 아미노산은 동일하고 시토신 결합성인 PPR 모티프;
(A-1) 서열번호 8의 서열로 구성되는 PPR 모티프에서 6번 위치의 아미노산이 아스파라긴 또는 아스파라긴산으로 치환된 PPR 모티프;
(A-2)(A-1)의 서열에 있어서 1, 4, 6, 및 34번 위치 아미노산 이외의 아미노산 1개 내지 9개가 치환, 결실 또는 부가된 서열로 구성되고 아데닌 결합성인 PPR 모티프;
(A-3)(A-1)의 서열과 최소한 80%의 서열 동일성을 가지되, 1, 4, 6, 및 34번 위치의 아미노산은 동일하고 아데닌 결합성인 PPR 모티프;
(G-1) 서열번호 9의 서열로 구성되는 PPR 모티프에서 6번 위치의 아미노산이 아스파라긴 또는 아스파라긴산으로 치환된 PPR 모티프;
(G-2)(G-1)의 서열에 있어서 1, 4, 6, 및 34번 위치 아미노산 이외의 아미노산 1개 내지 9개가 치환, 결실 또는 부가된 서열로 구성되고 구아닌 결합성인 PPR 모티프;
(G-3)(G-1)의 서열과 최소한 80%의 서열 동일성을 가지되, 1, 4, 6, 및 34번 위치의 아미노산은 동일하고 구아닌 결합성인 PPR 모티프;
(U-1) 서열번호 10의 서열로 구성되는 PPR 모티프에서 6번 위치의 아미노산이 아스파라긴 또는 아스파라긴산으로 치환된 PPR 모티프;
(U-2)(U-1)의 서열에 있어서 1, 4, 6, 및 34번 위치 아미노산 이외의 아미노산 1개 내지 9개가 치환, 결실 또는 부가된 서열로 구성되고 우라실 결합성인 PPR 모티프;
(U-3)(U-1)의 서열과 최소한 80%의 서열 동일성을 가지되, 1, 4, 6, 및 34번 위치의 아미노산은 동일하고 우라실 결합성인 PPR 모티프.
[2] 다음 중 어느 하나의 PPR 모티프:
(C-1) 서열번호 4 내지 7 중 어느 하나의 서열로 구성되는 PPR 모티프;
(C-2) 서열번호 4 내지 7 중 어느 하나의 서열에 있어서 1, 4, 6, 9, 및 34번 위치 아미노산 이외의 아미노산 1개 내지 9개가 치환, 결실 또는 부가된 서열로 구성되고 시토신 결합성인 PPR 모티프;
(C-3) 서열번호 4 내지 7 중 어느 하나의 서열과 최소한 80%의 서열 동일성을 가지되, 1, 4, 6, 9, 및 34번 위치의 아미노산은 동일하고 시토신 결합성인 PPR 모티프;
(A-1) 서열번호 8의 서열에 있어서 6번 및 9번 위치의 아미노산이 아래에 정의된 조합 중 어느 하나를 만족하도록 치환된 PPR 모티프;
(A-2)(A-1)의 서열에 있어서 1, 4, 6, 9, 및 34번 위치 아미노산 이외의 아미노산 1개 내지 9개가 치환, 결실 또는 부가된 서열로 구성되고 아데닌 결합성인 PPR 모티프;
(A-3)(A-1)의 서열과 최소한 80%의 서열 동일성을 가지되, 1, 4, 6, 9, 및 34번 위치의 아미노산은 동일하고 아데닌 결합성인 PPR 모티프;
(G-1) 서열번호 9의 서열에 있어서 6번 및 9번 위치의 아미노산이 아래에 정의된 조합 중 어느 하나를 만족하도록 치환된 서열로 구성되는 PPR 모티프;
(G-2)(G-1)의 서열에 있어서 1, 4, 6, 9, 및 34번 위치 아미노산 이외의 아미노산 1개 내지 9개가 치환, 결실 또는 부가된 서열로 구성되고 구아닌 결합성인 PPR 모티프;
(G-3)(G-1)의 서열과 최소한 80%의 서열 동일성을 가지되, 1, 4, 6, 9, 및 34번 위치의 아미노산은 동일하고 구아닌 결합성인 PPR 모티프;
(U-1) 서열번호 10의 서열에 있어서 6번 및 9번 위치의 아미노산이 아래에 정의된 조합 중 어느 하나를 만족하도록 치환된 서열로 구성되는 PPR 모티프;
(U-2)(U-1)의 서열에 있어서 1, 4, 6, 9, 및 34번 위치 아미노산 이외의 아미노산 1개 내지 9개가 치환, 결실 또는 부가된 서열로 구성되고 우라실 결합성인 PPR 모티프;
(U-3)(U-1)의 서열과 최소한 80%의 서열 동일성을 가지되, 1, 4, 6, 9, 및 34번 위치의 아미노산은 동일하고 우라실 결합성인 PPR 모티프.
·6번 위치의 아미노산이 아스파라긴이고, 9번 위치의 아미노산이 글루탐산인 조합
·6번 위치의 아미노산이 아스파라긴이고, 9번 위치의 아미노산이 글루타민인 조합
·6번 위치의 아미노산이 아스파라긴이고, 9번 위치의 아미노산이 리신인 조합
·6번 위치의 아미노산이 아스파라긴산이고, 9번 위치의 아미노산이 글리신인 조합.
[3] 다음 중 어느 하나인 [1] 또는 [2]에 기재된 PPR 모티프:
(C-4) 서열번호 4의 서열로 구성되는 PPR 모티프;
(A-4) 서열번호 58의 서열로 구성되는 PPR 모티프;
(G-4) 서열번호 59의 서열로 구성되는 PPR 모티프;
(U-4) 서열번호 60의 서열로 구성되는 PPR 모티프.
[4] [1]~[3]의 어느 하나에 기재된 PPR 모티프의, PPR 단백질의 N-말단으로부터 1번째 PPR 모티프로서 사용하기 위한 용도.
[5] PPR 단백질의 응집성을 감소시키기 위한 [4]에 기재된 용도.
[6] 하기 일반식(1)로 나타내는 PPR 모티프를 1개 내지 30개 포함하고 특정 염기서열을 가지는 표적핵산과 결합 가능하며, N-말단 측으로부터 1번째 PPR 모티프(M1)의 A6 아미노산이 친수성 아미노산인 단백질:
상기 일반식(1)에서,
Helix A는 12개 아미노산 길이의 α-헬릭스 구조를 형성할 수 있는 부분으로 하기 일반식(2)로 나타내고,
(상기 일반식(2)에서, A1 ~ A12는 각각 독립적으로 아미노산을 나타낸다)
X는 존재하지 않거나 1개 내지 9개 아미노산 길이로 구성되며;
Helix B는 11개 내지 13개 아미노산 길이로 이루어진 α-헬릭스 구조를 형성할 수 있는 부분이고;
L은 2개 내지 7개 아미노산 길이의, 하기 일반식(3)으로 나타내는 부분이다.
(상기 일반식(3)에서, 각 아미노산은 C-말단 측으로부터 "i"(-1), "ii"(-2)으로 넘버링되고, Liii 내지 Lvii는 존재하지 않을 수도 있다)
[7] M1의 A9 아미노산이 친수성 아미노산 또는 글리신인, [6]에 기재된 단백질.
[8] M1의 A6 아미노산이 아스파라긴 또는 아스파라긴산인, [6] 또는 [7]에 기재된 단백질.
[9] M1의 A9 아미노산이 글루타민, 글루타민산, 리신 또는 글리신인, [6]~[8]의 어느 하나에 기재된 단백질.
[10] M1의 A6 아미노산 및 M1의 A9 아미노산이 다음 중 어느 하나의 조합인, [6]~[9]의 어느 하나에 기재된 단백질:
·A6 아미노산이 아스파라긴이고, A9 아미노산이 글루탐산인 조합
·A6 아미노산이 아스파라긴이고, A9 아미노산이 글루타민인 조합
·A6 아미노산이 아스파라긴이고, A9 아미노산이 리신인 조합
·A6 아미노산이 아스파라긴산이고, A9 아미노산이 글리신인 조합.
[11] 형광 단백질, 핵이행 신호 펩티드 및 태그 단백질로 이루어진 군에서 선택되는 적어도 하나와, [1]~[3]의 어느 하나에 기재된 PPR 모티프를 N-말단으로부터 1번째 PPR 모티프로 포함하는 PPR 단백질, 또는 [6]~[10]의 어느 하나에 기재된 단백질과의 융합 단백질.
[12] [6]에 정의한 PPR 모티프를 포함하는 특정 염기서열을 가지는 표적 핵산과 결합 가능한 PPR 단백질의 개질방법에 있어서, N-말단으로부터 1번째 PPR 모티프(M1)의 A6 아미노산을 보다 친수성으로 만드는 방법.
[13] [1]~[3]의 어느 하나에 기재된 PPR 모티프를 N-말단으로부터 1번째 PPR 모티프로 포함하는 PPR 단백질, [6]~[10]의 어느 하나에 기재된 단백질, 또는 [11]에 기재된 융합 단백질을 사용하는 것을 특징으로 하는 핵산의 검출방법.
[14] [1]~[3]의 어느 하나에 기재된 PPR 모티프, [1]~[3]의 어느 하나에 기재된 PPR 모티프를 N-말단으로부터 1번째 PPR 모티프로서 포함하는 PPR 단백질, 또는 [6]~[10]의 어느 하나에 기재된 단백질을 암호화하는 핵산.
[15] [14]에 기재된 핵산을 포함하는 벡터.
[16] [15]에 기재된 벡터를 포함하는 세포(인간 개체는 제외).
[17] [1]~[3]의 어느 하나에 기재된 PPR 모티프, [1]~[3]의 어느 하나에 기재된 PPR 모티프를 N-말단으로부터 1번째 PPR 모티프로서 포함하는 PPR 단백질, 또는 [6]~[10]의 어느 하나에 기재된 단백질, 또는 [15]에 기재된 벡터를 이용하는 핵산 조작방법(인간 개체에서의 실시를 제외한다).
[18] [17]에 기재된 조작 방법을 포함하는 생물의 생산방법.
또한, 본 발명은 다음을 제공한다.
[1] 아래 중 어느 하나의 PPR 모티프:
(C-1) 서열번호 4 내지 7 중 어느 하나의 서열로 구성되는 PPR 모티프;
(C-2) 서열번호 4 내지 7 중 어느 하나의 서열에 있어서 1, 4, 6, 및 34번 위치 아미노산 이외의 아미노산 1개 내지 9개가 치환, 결실 또는 부가된 서열로 구성되고 시토신 결합성인 PPR 모티프;
(C-3) 서열번호 4 내지 7 중 어느 하나의 서열과 최소한 80%의 서열 동일성을 가지되, 1, 4, 6, 및 34번 위치의 아미노산은 동일하고 시토신 결합성인 PPR 모티프;
(A-1) 서열번호 8의 서열로 구성되는 PPR 모티프에서 6번 위치의 아미노산이 아스파라긴 또는 아스파라긴산으로 치환된 PPR 모티프;
(A-2)(A-1)의 서열에 있어서 1, 4, 6, 및 34번 위치 아미노산 이외의 아미노산 1개 내지 9개가 치환, 결실 또는 부가된 서열로 구성되고 아데닌 결합성인 PPR 모티프;
(A-3)(A-1)의 서열과 최소한 80%의 서열 동일성을 가지되, 1, 4, 6, 및 34번 위치의 아미노산은 동일하고 아데닌 결합성인 PPR 모티프;
(G-1) 서열번호 9의 서열로 구성되는 PPR 모티프에서 6번 위치의 아미노산이 아스파라긴 또는 아스파라긴산으로 치환된 PPR 모티프;
(G-2)(G-1)의 서열에 있어서 1, 4, 6, 및 34번 위치 아미노산 이외의 아미노산 1개 내지 9개가 치환, 결실 또는 부가된 서열로 구성되고 구아닌 결합성인 PPR 모티프;
(G-3)(G-1)의 서열과 최소한 80%의 서열 동일성을 가지되, 1, 4, 6, 및 34번 위치의 아미노산은 동일하고 구아닌 결합성인 PPR 모티프;
(U-1) 서열번호 10의 서열로 구성되는 PPR 모티프에서 6번 위치의 아미노산이 아스파라긴 또는 아스파라긴산으로 치환된 PPR 모티프;
(U-2)(U-1)의 서열에 있어서 1, 4, 6, 및 34번 위치 아미노산 이외의 아미노산 1개 내지 9개가 치환, 결실 또는 부가된 서열로 구성되고 우라실 결합성인 PPR 모티프;
(U-3)(U-1)의 서열과 최소한 80%의 서열 동일성을 가지되, 1, 4, 6, 및 34번 위치의 아미노산은 동일하고 우라실 결합성인 PPR 모티프.
[2] 아래 중 어느 하나의 PPR 모티프:
(C-1) 서열번호 4 내지 7 중 어느 하나의 서열로 구성되는 PPR 모티프;
(C-2) 서열번호 4 내지 7 중 어느 하나의 서열에 있어서 1, 4, 6, 9, 및 34번 위치 아미노산 이외의 아미노산 1개 내지 9개가 치환, 결실 또는 부가된 서열로 구성되고 시토신 결합성인 PPR 모티프;
(C-3) 서열번호 4 내지 7 중 어느 하나의 서열과 최소한 80%의 서열 동일성을 가지되, 1, 4, 6, 9, 및 34번 위치의 아미노산은 동일하고 시토신 결합성인 PPR 모티프;
(A-1) 서열번호 8의 서열에 있어서 6번 및 9번 위치의 아미노산이 아래에 정의된 조합 중 어느 하나를 만족하도록 치환된 PPR 모티프;
(A-2)(A-1)의 서열에 있어서 1, 4, 6, 9, 및 34번 위치 아미노산 이외의 아미노산 1개 내지 9개가 치환, 결실 또는 부가된 서열로 구성되고 아데닌 결합성인 PPR 모티프;
(A-3)(A-1)의 서열과 최소한 80%의 서열 동일성을 가지되, 1, 4, 6, 9, 및 34번 위치의 아미노산은 동일하고 아데닌 결합성인 PPR 모티프;
(G-1) 서열번호 9의 서열에 있어서 6번 및 9번 위치의 아미노산이 아래에 정의된 조합 중 어느 하나를 만족하도록 치환된 서열로 구성되는 PPR 모티프;
(G-2)(G-1)의 서열에 있어서 1, 4, 6, 9, 및 34번 위치 아미노산 이외의 아미노산 1개 내지 9개가 치환, 결실 또는 부가된 서열로 구성되고 구아닌 결합성인 PPR 모티프;
(G-3)(G-1)의 서열과 최소한 80%의 서열 동일성을 가지되, 1, 4, 6, 9, 및 34번 위치의 아미노산은 동일하고 구아닌 결합성인 PPR 모티프;
(U-1) 서열번호 10의 서열에 있어서 6번 및 9번 위치의 아미노산이 아래에 정의된 조합 중 어느 하나를 만족하도록 치환된 서열로 구성되는 PPR 모티프;
(U-2)(U-1)의 서열에 있어서 1, 4, 6, 9, 및 34번 위치 아미노산 이외의 아미노산 1개 내지 9개가 치환, 결실 또는 부가된 서열로 구성되고 우라실 결합성인 PPR 모티프;
(U-3)(U-1)의 서열과 최소한 80%의 서열 동일성을 가지되, 1, 4, 6, 9, 및 34번 위치의 아미노산은 동일하고 우라실 결합성인 PPR 모티프.
·6번 위치의 아미노산이 아스파라긴이고, 9번 위치의 아미노산이 글루탐산인 조합
·6번 위치의 아미노산이 아스파라긴이고, 9번 위치의 아미노산이 글루타민인 조합
·6번 위치의 아미노산이 아스파라긴이고, 9번 위치의 아미노산이 리신인 조합
·6번 위치의 아미노산이 아스파라긴산이고, 9번 위치의 아미노산이 글리신인 조합.
[3] [1] 또는 [2]에 기재된 PPR 모티프의, PPR 단백질의 N-말단으로부터 1번째 PPR 모티프로서 사용하기 위한 용도.
[4] PPR 단백질의 응집성을 감소시키기 위한 [3]에 기재된 용도.
[5] 하기 일반식(1)로 나타내는 PPR 모티프를 1개 내지 30개 포함하고 특정 염기서열을 가지는 표적핵산과 결합 가능하며, N-말단 측으로부터 1번째 PPR 모티프(M1)의 A6 아미노산이 친수성 아미노산인 단백질:
상기 일반식(1)에서,
Helix A는 12개 아미노산 길이의 α-헬릭스 구조를 형성할 수 있는 부분으로 하기 일반식(2)로 나타내고,
(상기 일반식(2)에서, A1 ~ A12는 각각 독립적으로 아미노산을 나타낸다)
X는 존재하지 않거나 1개 내지 9개 아미노산 길이로 구성되며;
Helix B는 11개 내지 13개 아미노산 길이로 이루어진 α-헬릭스 구조를 형성할 수 있는 부분이고;
L은 2개 내지 7개 아미노산 길이의, 하기 일반식(3)으로 나타내는 부분이며;
(상기 일반식(3)에서, 각 아미노산은 C-말단 측으로부터 "i"(-1), "ii"(-2)으로 넘버링되고, Liii 내지 Lvii는 존재하지 않을 수도 있다)
[6] M1의 A9 아미노산이 친수성 아미노산 또는 글리신인, [5]에 기재된 단백질.
[7] M1의 A6 아미노산이 아스파라긴 또는 아스파라긴산인, [5] 또는 [6]에 기재된 단백질.
[8] M1의 A9 아미노산이 글루타민, 글루타민산, 리신 또는 글리신인, [5]~[7]의 어느 하나에 기재된 단백질.
[9] M1의 A6 아미노산 및 M1의 A9 아미노산이 다음 중 어느 하나의 조합인, [5]~[8]의 어느 하나에 기재된 단백질:
·A6 아미노산이 아스파라긴이고, A9 아미노산이 글루탐산인 조합
·A6 아미노산이 아스파라긴이고, A9 아미노산이 글루타민인 조합
·A6 아미노산이 아스파라긴이고, A9 아미노산이 리신인 조합
·A6 아미노산이 아스파라긴산이고, A9 아미노산이 글리신인 조합.
[10] 형광 단백질, 핵이행 신호 펩티드 및 태그 단백질로 이루어진 군에서 선택되는 적어도 하나와, [1] 또는 [2]에 기재된 PPR 모티프를 N-말단으로부터 1번째 PPR 모티프로 포함하는 PPR 단백질, 또는 [5]~[9]의 어느 하나에 기재된 단백질과의 융합 단백질.
[11] [3]에 정의한 PPR 모티프를 포함하는 특정 염기서열을 가지는 표적 핵산과 결합 가능한 PPR 단백질의 개질방법에 있어서, N-말단으로부터 1번째 PPR 모티프(M1)의 A6 아미노산을 보다 친수성으로 만드는 방법.
[12] [1] 또는 [2]에 기재된 PPR 모티프를 N-말단으로부터 1번째 PPR 모티프로 포함하는 PPR 단백질, [5]~[9]의 어느 하나에 기재된 단백질, 또는 [10]에 기재된 융합 단백질을 사용하는 것을 특징으로 하는 핵산의 검출방법.
[13] [1] 또는 [2]에 기재된 PPR 모티프, [1] 또는 [2]에 기재된 PPR 모티프를 N-말단으로부터 1번째 PPR 모티프로서 포함하는 PPR 단백질, 또는 [5]~[9]의 어느 하나에 기재된 단백질을 암호화하는 핵산.
[14] [13]에 기재된 핵산을 포함하는 벡터.
[15] [14]에 기재된 벡터를 포함하는 세포(인간 개체는 제외).
[16] [1] 또는 [2]에 기재된 PPR 모티프, [1] 또는 [2]에 기재된 PPR 모티프를 N-말단으로부터 1번째 PPR 모티프로서 포함하는 PPR 단백질, 또는 [5]~[9]의 어느 하나에 기재된 단백질, 또는 [15]에 기재된 벡터를 이용하는, 핵산의 조작방법(인간 개체에서의 실시를 제외한다).
[17] [16]에 기재된 조작방법을 포함하는 생물의 생산방법.
도 1은 PPR 모티프의 설계방법을 도시한다.
A: 1번째 모티프의 6번째 및 9번째 아미노산은 바깥쪽으로 노출된다.
B: 시토신을 인식하는 1번째 모티프의 6번째, 9번째 아미노산은, 전형적인 조합으로서 류신과 글리신(C_6L9G), 변이형으로서 류신과 글루탐산(C_6L9E), 아스파라긴과 글루타민(C_6N9Q), 아스파라긴과 글루탐산(C_6N9Q), 아스파라긴과 글루탐산 (C_6N9Q), 아스파라긴과 글루탐산(C_6N9E), 아스파라긴과 리신(C_6N9K), 아스파라긴산과 글리신(C_6D9G)을 선택하였다.
도 2는 각 PPR 단백질의 응집성 및 핵내로의 이행을 도시한다.
GFP 및 핵이행 신호서열을 융합한 PPR 세포 내에서의 발현을 형광현미경 화상으로 확인하였다. EGFP를 융합한 경우, PPRcag_1(6L9G)과 PPRcag_2(6L9E)에서는 핵에 국재하지 않고, 핵 주위에서 강하게 응집하는 모습이 확인되었다. 한편, PPRcag_3(6N9Q), PPRcag_4(6N9E), PPRcag_5(6N9K), PPRcag_6(6D9G)에서는 응집성이낮기는 하지만, 핵에 국재하지 않았다. mClover3을 융합한 경우, PPRcag_1(6L9G)과 PPRcag_2(6L9E)에서는 핵에 국재하나, 핵내에서 응집하는 모습이 확인되었다. PPRcag_3(6N9Q), PPRcag_4(6N9E), PPRcag_5(6N9K), PPRcag_6(6D9G)에서는 핵에 국재하며 응집성을 찾아볼 수 없었다.
도 3은 PPR 단백질과 RNA의 결합실험 결과를 나타낸다.
6번째 및 9번째 아미노산 변이를 포함하는 모든 PPR에서 표적인 CAG x 6에 특이적으로 결합함을 알 수 있었다. 표적서열에 대한 결합력은 PPRcag_1과 비교하여 PPRcag_2는 같은 정도, PPRcag_3은 80% 정도, PPRcag_4는 60% 정도, PPRcag_5는 120% 정도, PPRcag_6은 130% 정도였다.
도 4는 N-말단 측으로부터 제1번째 PPR 모티프의 응집에 미치는 영향을 나타낸다.
각각의 PPR 단백질을 대장균 발현계로 작성하여 정제하고, 겔 여과 크로마토그래피로 분리하였다. 용출분획(Elution vol)이 적을수록 분자 크기가 크다. v2에서는 8mL 내지 10mL의 용출분획에서 용출된 반면, v3.2에서는 12mL 내지 14mL의 용출분획에서 피크가 나타났다. 이러한 점에서 v2에서는 단백질 사이즈가 커지고 있다는 점에서 응집하고 있을 가능성이 시사되며, 그 응집은 v3.2에서 개선되고 있음을 알 수 있었다.
A: 1번째 모티프의 6번째 및 9번째 아미노산은 바깥쪽으로 노출된다.
B: 시토신을 인식하는 1번째 모티프의 6번째, 9번째 아미노산은, 전형적인 조합으로서 류신과 글리신(C_6L9G), 변이형으로서 류신과 글루탐산(C_6L9E), 아스파라긴과 글루타민(C_6N9Q), 아스파라긴과 글루탐산(C_6N9Q), 아스파라긴과 글루탐산 (C_6N9Q), 아스파라긴과 글루탐산(C_6N9E), 아스파라긴과 리신(C_6N9K), 아스파라긴산과 글리신(C_6D9G)을 선택하였다.
도 2는 각 PPR 단백질의 응집성 및 핵내로의 이행을 도시한다.
GFP 및 핵이행 신호서열을 융합한 PPR 세포 내에서의 발현을 형광현미경 화상으로 확인하였다. EGFP를 융합한 경우, PPRcag_1(6L9G)과 PPRcag_2(6L9E)에서는 핵에 국재하지 않고, 핵 주위에서 강하게 응집하는 모습이 확인되었다. 한편, PPRcag_3(6N9Q), PPRcag_4(6N9E), PPRcag_5(6N9K), PPRcag_6(6D9G)에서는 응집성이낮기는 하지만, 핵에 국재하지 않았다. mClover3을 융합한 경우, PPRcag_1(6L9G)과 PPRcag_2(6L9E)에서는 핵에 국재하나, 핵내에서 응집하는 모습이 확인되었다. PPRcag_3(6N9Q), PPRcag_4(6N9E), PPRcag_5(6N9K), PPRcag_6(6D9G)에서는 핵에 국재하며 응집성을 찾아볼 수 없었다.
도 3은 PPR 단백질과 RNA의 결합실험 결과를 나타낸다.
6번째 및 9번째 아미노산 변이를 포함하는 모든 PPR에서 표적인 CAG x 6에 특이적으로 결합함을 알 수 있었다. 표적서열에 대한 결합력은 PPRcag_1과 비교하여 PPRcag_2는 같은 정도, PPRcag_3은 80% 정도, PPRcag_4는 60% 정도, PPRcag_5는 120% 정도, PPRcag_6은 130% 정도였다.
도 4는 N-말단 측으로부터 제1번째 PPR 모티프의 응집에 미치는 영향을 나타낸다.
각각의 PPR 단백질을 대장균 발현계로 작성하여 정제하고, 겔 여과 크로마토그래피로 분리하였다. 용출분획(Elution vol)이 적을수록 분자 크기가 크다. v2에서는 8mL 내지 10mL의 용출분획에서 용출된 반면, v3.2에서는 12mL 내지 14mL의 용출분획에서 피크가 나타났다. 이러한 점에서 v2에서는 단백질 사이즈가 커지고 있다는 점에서 응집하고 있을 가능성이 시사되며, 그 응집은 v3.2에서 개선되고 있음을 알 수 있었다.
[PPR 모티프, PPR 단백질]
(정의)
본 발명에서는 'PPR 모티프'는 특히 기재한 경우를 제외하고 Web 상의 단백질 도메인 검색 프로그램에서 아미노산 서열을 분석하였을 때, Pfam에서 PF01535, Prosite에서 PS51375로 얻을 수 있는 E값이 소정값 이하(바람직하게는 E-03)의 아미노산 서열을 갖는 30개 내지 38개 아미노산으로 구성되는 폴리펩티드를 의미한다. 본 발명에서 정의하는 PPR 모티프를 구성하는 아미노산의 위치번호는 PF01535와 거의 같은 의미이며, PS51375의 아미노산 위치에서 2를 뺀 수(예; 본 발명의 1번→PS51375의 3번)에 상당한다. 단, "ii"(-2)번 아미노산이라고 할 때는 PPR 모티프를 구성하는 아미노산 뒤(C 말단 쪽)에서 2번째 아미노산, 또는 다음 PPR 모티프의 1번째 아미노산에 대해 2개 N-말단 쪽, 즉 -2번째 아미노산을 의미한다. 다음의 PPR 모티프가 명확하게 동정되지 않는 경우, 다음 헬릭스 구조의 첫번째 아미노산에 대하여 2개 이전의 아미노산을 "ii"라 한다. Pfam에 대해서는 http://pfam. Sanger.ac.uk/, Prosite 에 대해서는, http://www.expasy.org/prosite/ 를 참조할 수 있다.
PPR 모티프의 보존된(conserved) 아미노산 서열은 아미노산 수준에서의 보존성은 낮지만, 2차 구조상으로 2개의 α-헬릭스는 잘 보존되어 있다. 전형적인 PPR 모티프는 35개 아미노산으로 구성되는데, 그 길이는 30개 내지 38개 아미노산의 범위에서 가변적이다.
보다 구체적으로, 본 발명의 PPR 모티프는 하기 일반식(1)로 나타내는 30개 내지 38개 아미노산 길이의 폴리펩티드로 이루어진다.
상기 일반식(1)에서,
Helix A는 12개 아미노산 길이의 α-헬릭스 구조를 형성할 수 있는 부분으로 하기 일반식(2)로 나타내고,
(상기 일반식(2)에서, A1 ~ A12는 각각 독립적으로 아미노산을 나타낸다)
X는 존재하지 않거나 1개 내지 9개 아미노산 길이로 구성되며;
Helix B는 11개 내지 13개 아미노산 길이로 이루어진 α-헬릭스 구조를 형성할 수 있는 부분이고;
L은 2개 내지 7개 아미노산 길이의, 하기 일반식(3)으로 나타내는 부분이다.
(상기 일반식(3)에서, 각 아미노산은 "i"(-1), "ii"(-2), C-말단 측으로부터 넘버링되고, Liii 내지 Lvii는 존재하지 않을 수도 있다)
본 명세서에서 "PPR 단백질"이라 함은, 특별히 기재한 경우를 제외하고 상술한 PPR 모티프를 1개 이상, 바람직하게는 2개 이상 갖는 PPR 단백질을 의미한다. 본 명세서에서 "단백질"이라 함은, 특별히 기재한 경우를 제외하고 폴리펩티드(복수의 아미노산이 펩티드 결합한 사슬)로 이루어진 물질을 의미하고, 비교적 저분자인 폴리펩티드로 이루어진 것도 포함된다. 본 발명에서는 "아미노산"이라 함은, 통상의 아미노산 분자를 의미하며, 펩티드 사슬을 구성하고 있는 아미노산 잔기를 가리키는 경우도 있다. 어느 쪽을 의미하는지는 문맥상 당업자에게 명백하다.
본 명세서에서 PPR 모티프의 표적 핵산에서의 염기와의 결합성에 관하여 "특이성(specificity)/특이적(specific)"이라 함은, 특별히 기재한 경우를 제외하고 4종의 염기 중 어느 하나의 염기에 대한 결합 활성이 다른 염기에 대한 결합 활성보다 높은 것을 의미한다.
본 명세서에서는 "핵산"이라 함은 RNA 또는 DNA를 의미한다. 또한, PPR 단백질은 RNA 또는 DNA 속의 염기에 대해 특이성을 가질 수 있으나, 핵산 단량체에 결합하지는 않는다.
PPR 모티프는 1, 4, (ii)번의 3가지 아미노산의 조합이 염기와의 특이한 결합을 위해 중요하며, 이들의 조합에 의해 결합하는 염기가 어느 것인지 결정할 수 있다(참조: 특허문헌 1, 2).
구체적으로, RNA 결합성의 PPR 모티프에 관해서는 1, 4, (ii)번의 3가지 아미노산의 조합과 결합 가능한 염기와의 관계는 다음과 같다(참조: 특허문헌 1).
(3-1) A1, A4 및 Lii의 3가지 아미노산의 조합이 순서대로 발린, 아스파라긴 및 아스파라긴산의 경우, 그 PPR 모티프는 U에 강하게 결합하고 다음으로 C에, 그 다음은 A 또는 G에 대하여 결합하는 선택적인 RNA 염기결합능을 가진다.
(3-2) A1, A4 및 Lii의 3가지 아미노산의 조합이 순서대로 발린, 트레오닌, 아스파라긴의 경우, 그 PPR 모티프는 A에 강하게 결합하고 다음으로 G에, 그 다음은 C에 대해 결합하나 U에는 결합하지 않는 선택적인 RNA 염기결합능을 가진다.
(3-3) A1, A4 및 Lii의 3가지 아미노산의 조합이 순서대로 발린, 아스파라긴, 아스파라긴의 경우, 그 PPR 모티프는 C에 강하게 결합하고 다음으로 A 또는 U에 대하여 결합하나 G에는 결합하지 않는 선택적인 RNA 염기결합능을 가진다.
(3-4) A1, A4 및 Lii의 3가지 아미노산의 조합이 순서대로 글루탐산, 글리신, 아스파라긴산의 경우, 그 PPR 모티프는 G에 강하게 결합하나 A, U 및 C에는 결합하지 않는 선택적인 RNA 염기결합능을 가진다.
(3-5) A1, A4 및 Lii의 3가지 아미노산 조합이 순서대로 이소류신, 아스파라긴, 아스파라긴의 경우, 그 PPR 모티프는 C에 강하게 결합하고 다음은 U에, 그 다음은 A에 대해 결합하나 G에는 결합하지 않는 선택적인 RNA 염기결합능을 가진다.
(3-6) A1, A4 및 Lii의 3가지 아미노산의 조합이 순서대로 발린, 트레오닌, 아스파라긴산의 경우, 그 PPR 모티프는 G에 강하게 결합하고 다음은 U에 대하여 결합하나 A와 C에는 결합하지 않는 선택적인 RNA 염기결합능을 가진다.
(3-7) A1, A4 및 Lii의 3가지 아미노산의 조합이 순서대로 리신, 트레오닌, 아스파라긴산의 경우, 그 PPR 모티프는 G에 강하게 결합하고 다음은 A에 대해 결합하나 U 및 C에는 결합하지 않는 선택적인 RNA 염기결합능을 가진다.
(3-8) A1, A4 및 Lii의 3가지 아미노산의 조합이 순서대로 페닐알라닌, 셀린, 아스파라긴의 경우, 그 PPR 모티프는 A에 강하게 결합하고 다음으로 C에, 그 다음은 G 및 U에 대하여 결합하는 선택적인 RNA 염기결합능을 가진다.
(3-9) A1, A4 및 Lii의 3가지 아미노산 조합이 순서대로 바린, 아스파라긴, 셀린의 경우, 그 PPR 모티프는 C에 강하게 결합하고 다음은 U에 대해 결합하나 A 및 G에는 결합하지 않는 선택적인 RNA 염기결합능을 가진다.
(3-10) A1, A4 및 Lii의 3가지 아미노산의 조합이 순서대로 페닐알라닌, 트레오닌, 아스파라긴의 경우, 그 PPR 모티프는 A에 강하게 결합하나 G, U 및 C에는 결합하지 않는 선택적인 RNA 염기결합능을 가진다.
(3-11) A1, A4 및 Lii의 3가지 아미노산의 조합이 순서대로 이소류신, 아스파라긴, 아스파라긴산의 경우, 그 PPR 모티프는 U에 강하게 결합하고 다음은 A에 대해 결합하나 G 및 C에는 결합하지 않는 선택적인 RNA 염기결합능을 가진다.
(3-12) A1, A4 및 Lii의 3가지 아미노산의 조합이 순서대로 트레오닌, 트레오닌, 아스파라긴의 경우, 그 PPR 모티프는 A에 강하게 결합하나 G, U 및 C에는 결합하지 않는 선택적인 RNA 염기결합능을 가진다.
(3-13) A1, A4 및 Lii의 3가지 아미노산의 조합이 순서대로 이소류신, 메티오닌, 아스파라긴산의 경우, 그 PPR 모티프는 U에 강하게 결합하고 다음은 C에 대해 결합하나 A 및 G에는 결합하지 않는 선택적인 RNA 염기결합능을 가진다.
(3-14) A1, A4 및 Lii의 3가지 아미노산의 조합이 순서대로 페닐알라닌, 프롤린, 아스파라긴산의 경우, 그 PPR 모티프는 U에 강하게 결합하고 다음은 C에 대하여 결합하나 A 및 G에는 결합하지 않는 선택적인 RNA 염기결합능을 가진다.
(3-15) A1, A4 및 Lii의 3가지 아미노산의 조합이 순서대로 티로신, 프롤린, 아스파라긴산의 경우, 그 PPR 모티프는 U에 강하게 결합하나 A, G 및 C에는 결합하지 않는 선택적인 RNA 염기결합능을 가진다.
(3-16) A1, A4 및 Lii의 3가지 아미노산의 조합이 순서대로 류신, 트레오닌, 아스파라긴산의 경우, 그 PPR 모티프는 G에 강하게 결합하나 A, U 및 C에는 결합하지 않는 선택적인 RNA 염기결합능을 가진다.
구체적으로, DNA 결합성의 PPR 모티프에 관해서는 1, 4, (ii)번의 3가지 아미노산의 조합과 결합 가능한 염기의 관계는 다음과 같다(참조: 특허문헌 2):
(2-1) A1, A4 및 Lii의 3개 아미노산이 순서대로 임의의 아미노산, 글리신, 아스파라긴산인 경우, 그 PPR 모티프는 G에 선택적으로 결합하고;
(2-2) A1, A4 및 Lii의 3개 아미노산이 순서대로 글루탐산, 글리신, 아스파라긴산인 경우, 그 PPR 모티프는 G에 선택적으로 결합하며;
(2-3) A1, A4 및 Lii의 3개 아미노산이 순서대로 임의의 아미노산, 글리신, 아스파라긴인 경우, 그 PPR 모티프는 A에 선택적으로 결합하고;
(2-4) A1, A4 및 Lii의 3개 아미노산이 순서대로 글루탐산, 글리신, 아스파라긴인 경우, 그 PPR 모티프는 A에 선택적으로 결합하며;
(2-5) A1, A4 및 Lii의 3개 아미노산이 순서대로 임의의 아미노산, 글리신, 세린인 경우, 그 PPR 모티프는 A에 선택적으로 결합하고, 다음으로 C에 결합하고;
(2-6) A1, A4 및 Lii의 3개 아미노산이 순서대로 임의의 아미노산, 이소류신, 임의의 아미노산인 경우, 그 PPR 모티프는 T 및 C에 선택적으로 결합하며;
(2-7) A1, A4 및 Lii의 3개 아미노산이 순서대로 임의의 아미노산, 이소류신, 아스파라긴인 경우, 그 PPR 모티프는 T에 선택적으로 결합하고, 다음으로 C에 결합하고;
(2-8) A1, A4 및 Lii의 3개 아미노산이 순서대로 임의의 아미노산, 류신, 임의의 아미노산인 경우, 그 PPR 모티프는 T 및 C에 선택적으로 결합하며;
(2-9) A1, A4 및 Lii의 3개 아미노산이 순서대로 임의의 아미노산, 류신, 아스파라긴산인 경우, 그 PPR 모티프는 C에 선택적으로 결합하고;
(2-10) A1, A4 및 Lii의 3개 아미노산이 순서대로 임의의 아미노산, 류신, 리신인 경우, 그 PPR 모티프는 T에 선택적으로 결합하며;
(2-11) A1, A4 및 Lii의 3개 아미노산이 순서대로 임의의 아미노산, 메티오닌, 임의의 아미노산인 경우, 그 PPR 모티프는 T에 선택적으로 결합하고;
(2-12) A1, A4 및 Lii의 3개 아미노산이 순서대로 임의의 아미노산, 메티오닌, 아스파라긴산인 경우, 그 PPR 모티프는 T에 선택적으로 결합하며;
(2-13) A1, A4 및 Lii의 3개 아미노산이 순서대로 이소류신, 메티오닌, 아스파라긴산인 경우, 그 PPR 모티프는 T에 선택적으로 결합하고, 다음으로 C에 결합하고;
(2-14) A1, A4 및 Lii의 3개 아미노산이 순서대로 임의의 아미노산, 아스파라긴, 임의의 아미노산인 경우, 그 PPR 모티프는 C 및 T에 선택적으로 결합하며;
(2-15) A1, A4 및 Lii 세 아미노산이 순서대로 임의의 아미노산, 아스파라긴, 아스파라긴산인 경우, 그 PPR 모티프는 T에 선택적으로 결합하고;
(2-16) A1, A4 및 Lii의 3개 아미노산이 순서대로 페닐알라닌, 아스파라긴, 아스파라긴산인 경우, 그 PPR 모티프는 T에 선택적으로 결합하며;
(2-17) A1, A4 및 Lii의 3개 아미노산이 순서대로 글리신, 아스파라긴, 아스파라긴산인 경우, 그 PPR 모티프는 T에 선택적으로 결합하고;
(2-18) A1, A4 및 Lii의 3개 아미노산이 순서대로 이소류신, 아스파라긴, 아스파라긴산인 경우, 그 PPR 모티프는 T에 선택적으로 결합하며;
(2-19) A1, A4 및 Lii의 3개 아미노산이 순서대로 트레오닌, 아스파라긴, 아스파라긴산인 경우, 그 PPR 모티프는 T에 선택적으로 결합하고;
(2-20) A1, A4 및 Lii의 3개 아미노산이 순서대로 발린, 아스파라긴, 아스파라긴산인 경우, 그 PPR 모티프는 T에 선택적으로 결합하고, 다음으로 C에 결합하며;
(2-21) A1, A4 및 Lii의 3개 아미노산이 순서대로 티로신, 아스파라긴, 아스파라긴산인 경우, 그 PPR 모티프는 T에 선택적으로 결합하고, 다음으로 C에 결합하고;
(2-22) A1, A4 및 Lii의 3개 아미노산이 순서대로 임의의 아미노산, 아스파라긴, 아스파라긴인 경우, 그 PPR 모티프는 C에 선택적으로 결합하며;
(2-23) A1, A4 및 Lii 3개 아미노산이 순서대로 이소류신, 아스파라긴, 아스파라긴인 경우, 그 PPR 모티프는 C에 선택적으로 결합하고;
(2-24) A1, A4 및 Lii의 3개 아미노산이 순서대로 세린, 아스파라긴, 아스파라긴인 경우, 그 PPR 모티프는 C에 선택적으로 결합하며;
(2-25) A1, A4 및 Lii의 3개 아미노산이 순서대로 발린, 아스파라긴, 아스파라긴인 경우, 그 PPR 모티프는 C에 선택적으로 결합하고;
(2-26) A1, A4 및 Lii의 3개 아미노산이 순서대로 임의의 아미노산, 아스파라긴, 세린인 경우, 그 PPR 모티프는 C에 선택적으로 결합하며;
(2-27) A1, A4 및 Lii의 3개 아미노산이 순서대로 발린, 아스파라긴, 세린인 경우, 그 PPR 모티프는 C에 선택적으로 결합하고;
(2-28) A1, A4 및 Lii의 3개 아미노산이 순서대로 임의의 아미노산, 아스파라긴, 트레오닌인 경우, 그 PPR 모티프는 C에 선택적으로 결합하며;
(2-29) A1, A4 및 Lii의 3개 아미노산이 순서대로 발린, 아스파라긴, 트레오닌인 경우, 그 PPR 모티프는 C에 선택적으로 결합하고;
(2-30) A1, A4 및 Lii의 3개 아미노산이 순서대로 임의의 아미노산, 아스파라긴, 트립토판인 경우, 그 PPR 모티프는 C에 선택적으로 결합하고, 다음으로 T에 결합하며;
(2-31) A1, A4 및 Lii의 3개 아미노산이 순서대로 이소류신, 아스파라긴, 트립토판인 경우, 그 PPR 모티프는 T에 선택적으로 결합하고, 다음으로 C에 결합하고;
(2-32) A1, A4 및 Lii의 3개 아미노산이 순서대로 임의의 아미노산, 프롤린, 임의의 아미노산인 경우, 그 PPR 모티프는 T에 선택적으로 결합하며;
(2-33) A1, A4 및 Lii의 3개 아미노산이 순서대로 임의의 아미노산, 프롤린, 아스파라긴산인 경우, 그 PPR 모티프는 T에 선택적으로 결합하고;
(2-34) A1, A4 및 Lii의 3개 아미노산이 순서대로 페닐알라닌, 프롤린, 아스파라긴산인 경우, 그 PPR 모티프는 T에 선택적으로 결합하며;
(2-35) A1, A4 및 Lii의 3개 아미노산이 순서대로 티로신, 프롤린, 아스파라긴산인 경우, 그 PPR 모티프는 T에 선택적으로 결합하고;
(2-36) A1, A4 및 Lii의 3개 아미노산이 순서대로 임의의 아미노산, 세린, 임의의 아미노산인 경우, 그 PPR 모티프는 A 및 G에 선택적으로 결합하며;
(2-37) A1, A4 및 Lii의 3개 아미노산이 순서대로 임의의 아미노산, 세린, 아스파라긴인 경우, 그 PPR 모티프는 A에 선택적으로 결합하고;
(2-38) A1, A4 및 Lii의 3개 아미노산이 순서대로 페닐알라닌, 세린, 아스파라긴인 경우, 그 PPR 모티프는 A에 선택적으로 결합하며;
(2-39) A1, A4 및 Lii의 3개 아미노산이 순서대로 발린, 세린, 아스파라긴인 경우, 그 PPR 모티프는 A에 선택적으로 결합하고;
(2-40) A1, A4 및 Lii의 3개 아미노산이 순서대로 임의의 아미노산, 트레오닌, 임의의 아미노산인 경우, 그 PPR 모티프는 A와 G에 선택적으로 결합하며;
(2-41) A1, A4 및 Lii의 3개 아미노산이 순서대로 임의의 아미노산, 트레오닌, 아스파라긴산인 경우, 그 PPR 모티프는 G에 선택적으로 결합하고;
(2-42) A1, A4 및 Lii의 3개 아미노산이 순서대로 발린, 트레오닌, 아스파라긴산인 경우, 그 PPR 모티프는 G에 선택적으로 결합하며;
(2-43) A1, A4 및 Lii의 3개 아미노산이 순서대로 임의의 아미노산, 트레오닌, 아스파라긴인 경우, 그 PPR 모티프는 A에 선택적으로 결합하고;
(2-44) A1, A4 및 Lii의 3개 아미노산이 순서대로 페닐알라닌, 트레오닌, 아스파라긴인 경우, 그 PPR 모티프는 A에 선택적으로 결합하며;
(2-45) A1, A4 및 Lii의 3개 아미노산이 순서대로 이소류신, 트레오닌, 아스파라긴인 경우, 그 PPR 모티프는 A에 선택적으로 결합하고;
(2-46) A1, A4 및 Lii의 3개 아미노산이 순서대로 발린, 트레오닌, 아스파라긴인 경우, 그 PPR 모티프는 A에 선택적으로 결합하며;
(2-47) A1, A4 및 Lii의 3개 아미노산이 순서대로 임의의 아미노산, 발린, 임의의 아미노산인 경우, 그 PPR 모티프는 A, C 및 T에 결합하지만 G에는 결합하지 않고;
(2-48) A1, A4 및 Lii의 3개 아미노산이 순서대로 이소류신, 발린, 아스파라긴산인 경우, 그 PPR 모티프는 C에 선택적으로 결합하고, 다음으로 A에 결합하며;
(2-49) A1, A4 및 Lii의 3개 아미노산이 순서대로 임의의 아미노산, 발린, 글리신인 경우, 그 PPR 모티프는 C에 선택적으로 결합하고; 및,
(2-50) A1, A4 및 Lii의 3개 아미노산이 순서대로 임의의 아미노산, 발린, 트레오닌인 경우, 그 PPR 모티프는 T에 선택적으로 결합한다
(3가지 아미노산의 특히 바람직한 조합)
RNA 결합성 PPR 모티프는 각 염기를 인식하고 특이하게 결합 가능한 대표적인 1번, 4번, (ii)번 아미노산의 조합이 있다: 구체적으로, 아데닌(A)을 인식하는 조합은 1번이 발린, 4번이 발린, (ii)번이 아스파라긴; 시토신(C)을 인식하는 조합은 1번이 발린, 4번이 아스파라긴, (ii)번이 세린; 구아닌(G)을 인식하는 조합은 1번이 발린, 4번이 트레오닌, (ii)번이 아스파라긴산; 우라실(U)을 인식하는 조합은 1번이 발린, 4번이 아스파라긴, (ii)번이 아스파라긴산이다(참조: 비특허문헌 1~5).
본 발명의 바람직한 실시태양의 하나에서는 이들 조합이 이용된다.
(응집성의 개선)
본 발명자들은 천연으로 존재하는 기존 PPR 모티프의 아미노산 정보에서 PPR 모티프의 6번째 위치의 아미노산은 소수성(특히, 류신), 9번째 위치의 아미노산은 비친수성 아미노산(특히, 글리신)인 경우가 매우 많음을 찾아냈다. 이미 결정구조가 알려진 PPR 단백질의 구조(비특허문헌 6: Coquille et al., 2014 Nat. Commun.; PDB ID: 4PJQ, 4WSL, 4PJR; 비특허문헌 7: Shen et al., 2015 Nat. Commun., PDB ID: 5I9D, 5I9F, 5I9G, 5I9H)에서 1번째 모티프(N-말단 측)의 6번째, 9번째 아미노산은 밖으로 노출되기 때문에, 그 노출된 소수성 아미노산이 원인으로 응집성을 나타낼 것으로 추정하였다(도 1A). 한편, 2번째 모티브 이후에서는 6번째, 9번째 아미노산은 단백질 내에 묻혀 소수성 코어(hydrophobic core)를 형성하기 때문에, 모든 모티브의 6번째, 9번째에 친수성 잔기를 넣으면 단백질 구조가 붕괴될 것으로 예상하였다. 따라서, 1번째 모티프에서만 6번째 아미노산을, 바람직하게는 6번째 및 9번째 아미노산을 친수성 아미노산(아스파라긴, 아스파라긴산, 글루타민, 글루탐산, 리신, 아르기닌, 세린, 트레오닌)으로 배치함으로써, PPR의 응집성을 감소시키고자 하였다.
구체적으로는 다음과 같이 한다.
특정 염기서열을 가지는 표적 핵산과 결합 가능한 단백질에서 N-말단으로부터 1번째 PPR 모티프(M1)에서 :
(1) A6 아미노산을 친수성 아미노산, 바람직하게는 A6 아미노산을 아스파라긴 또는 아스파라긴산으로 하고;
(2) 또한, A9 아미노산을 친수성 아미노산 또는 글리신, 바람직하게는 글루타민, 글루타민산, 리신 또는 글리신으로 하거나, 또는
(3) A6 아미노산 및 A9 아미노산을 다음 중 어느 하나의 조합으로 한다.
·A6 아미노산이 아스파라긴이고, A9 아미노산이 글루탐산인 조합
·A6 아미노산이 아스파라긴이고, A9 아미노산이 글루타민인 조합
·A6 아미노산이 아스파라긴이고, A9 아미노산이 리신인 조합
·A6 아미노산이 아스파라긴산이고, A9 아미노산이 글리신인 조합
(신규한 PPR 모티프)
본 발명은 위에서 도출된 응집성이 개선된 신규한 PPR 모티프 및 이를 포함하는 신규한 PPR 단백질을 제공한다.
본 발명에 의해 제공되는 신규한 PPR 모티프는 다음과 같다.
(C-1) 서열번호 4 내지 7 중 어느 하나의 서열로 구성되는 PPR 모티프;
(C-2) 서열번호 4 내지 7 중 어느 하나의 서열에 있어서 1, 4, 6, 및 34번 위치 아미노산 이외의 아미노산 1개 내지 9개가 치환, 결실 또는 부가된 서열로 구성되고 시토신 결합성인 PPR 모티프;
(C-3) 서열번호 4 내지 7 중 어느 하나의 서열과 최소한 80%의 서열 동일성을 가지되, 1, 4, 6, 및 34번 위치의 아미노산은 동일하고 시토신 결합성인 PPR 모티프;
(A-1) 서열번호 8의 서열로 구성되는 PPR 모티프에서 6번 위치의 아미노산이 아스파라긴 또는 아스파라긴산으로 치환된 PPR 모티프;
(A-2)(A-1)의 서열에 있어서 1, 4, 6, 및 34번 위치 아미노산 이외의 아미노산 1개 내지 9개가 치환, 결실 또는 부가된 서열로 구성되고 아데닌 결합성인 PPR 모티프;
(A-3)(A-1)의 서열과 최소한 80%의 서열 동일성을 가지되, 1, 4, 6, 및 34번 위치의 아미노산은 동일하고 아데닌 결합성인 PPR 모티프;
(G-1) 서열번호 9의 서열로 구성되는 PPR 모티프에서 6번 위치의 아미노산을 아스파라긴 또는 아스파라긴산으로 치환한 PPR 모티프;
(G-2)(G-1)의 서열에 있어서 1, 4, 6, 및 34번 위치 아미노산 이외의 아미노산 1개 내지 9개가 치환, 결실 또는 부가된 서열로 구성되고 구아닌 결합성인 PPR 모티프;
(G-3)(G-1)의 서열과 최소한 80%의 서열 동일성을 가지되, 1, 4, 6, 및 34번 위치의 아미노산은 동일하고 구아닌 결합성인 PPR 모티프;
(U-1) 서열번호 10의 서열로 구성되는 PPR 모티프에서 6번 위치의 아미노산을 아스파라긴 또는 아스파라긴산으로 치환한 PPR 모티프;
(U-2)(U-1)의 서열에 있어서 1, 4, 6, 및 34번 위치 아미노산 이외의 아미노산 1개 내지 9개가 치환, 결실 또는 부가된 서열로 구성되고 우라실 결합성인 PPR 모티프;
(U-3)(U-1)의 서열과 최소한 80%의 서열 동일성을 가지되, 1, 4, 6, 및 34번 위치의 아미노산은 동일하고 우라실 결합성인 PPR 모티프.
이러한 PPR 모티프 중 특히 바람직한 경우는 다음과 같다:
(C-1) 서열번호 4 내지 7 중 어느 하나의 서열로 구성되는 PPR 모티프;
(C-2) 서열번호 4 내지 7 중 어느 하나의 서열에 있어서 1, 4, 6, 9, 및 34번 위치 아미노산 이외의 아미노산 1개 내지 9개가 치환, 결실 또는 부가된 서열로 구성되고 시토신 결합성인 PPR 모티프;
(C-3) 서열번호 4 내지 7 중 어느 하나의 서열과 최소한 80%의 서열 동일성을 가지되, 1, 4, 6, 9, 및 34번 위치의 아미노산은 동일하고 시토신 결합성인 PPR 모티프;
(A-1) 서열번호 8의 서열에 있어서 6번 및 9번 위치의 아미노산을 아래에 정의된 조합 중 어느 하나를 만족하도록 치환한 PPR 모티프;
(A-2)(A-1)의 서열에 있어서 1, 4, 6, 9, 및 34번 위치 아미노산 이외의 아미노산 1개 내지 9개가 치환, 결실 또는 부가된 서열로 구성되고 아데닌 결합성인 PPR 모티프;
(A-3)(A-1)의 서열과 최소한 80%의 서열 동일성을 가지되, 1, 4, 6, 9, 및 34번 위치의 아미노산은 동일하고 아데닌 결합성인 PPR 모티프;
(G-1) 서열번호 9의 서열에 있어서 6번 및 9번 위치의 아미노산을 아래에 정의된 조합 중 어느 하나를 만족하도록 치환한 서열로 구성되는 PPR 모티프;
(G-2)(G-1)의 서열에 있어서 1, 4, 6, 9, 및 34번 위치 아미노산 이외의 아미노산 1개 내지 9개가 치환, 결실 또는 부가된 서열로 구성되고 구아닌 결합성인 PPR 모티프;
(G-3)(G-1)의 서열과 최소한 80%의 서열 동일성을 가지되, 1, 4, 6, 9, 및 34번 위치의 아미노산은 동일하고 구아닌 결합성인 PPR 모티프;
(U-1) 서열번호 10의 서열에 있어서 6번 및 9번 위치의 아미노산을 아래에 정의된 조합 중 어느 하나를 만족하도록 치환한 서열로 구성되는 PPR 모티프;
(U-2)(U-1)의 서열에 있어서 1, 4, 6, 9, 및 34번 위치 아미노산 이외의 아미노산 1개 내지 9개가 치환, 결실 또는 부가된 서열로 구성되고 우라실 결합성인 PPR 모티프;
(U-3)(U-1)의 서열과 최소한 80%의 서열 동일성을 가지되, 1, 4, 6, 9, 및 34번 위치의 아미노산은 동일하고 우라실 결합성인 PPR 모티프.
·6번 위치의 아미노산이 아스파라긴이고, 9번 위치의 아미노산이 글루탐산인 조합
·6번 위치의 아미노산이 아스파라긴이고, 9번 위치의 아미노산이 글루타민인 조합
·6번 위치의 아미노산이 아스파라긴이고, 9번 위치의 아미노산이 리신인 조합
·6번 위치의 아미노산이 아스파라긴산이고, 9번 위치 아미노산이 글리신인 조합
서열번호 4 내지 10의 구체적인 서열은 도 1 및 서열목록에 나타나 있다.
이러한 PPR 모티프 중 좀 더 바람직한 것은 다음과 같다.
(C-4) 서열번호 4의 서열로 구성되는 PPR 모티프;
(A-4) 서열번호 58의 서열로 구성되는 PPR 모티프;
(G-4) 서열번호 59의 서열로 구성되는 PPR 모티프;
(U-4) 서열번호 60의 서열로 구성되는 PPR 모티프.
서열번호 58 내지 60의 서열은 아래 및 서열목록에 나타나 있다.
서열번호 58의 서열 VTYTTNIDQLCKAGKVDEALELFKEMRSKGVKPNV
서열번호 59의 서열 VTYTTNIDQLCKAGKVDEALELFDEMKERGIKPDV
서열번호 60의 서열 VTYNTNIDQLCKAGRLDEAEELLEEMEEKGIKPDV
(응집성이 개선된 PPR 단백질)
또한, 본 발명은 상기에 의해 도출된 응집성이 개선된 PPR 단백질을 제공한다.
본 발명의 바람직한 실시태양 중 하나는, M1의 A9 아미노산이 M1의 다른 아미노산이 어떤 경우든, 또한 M1 이외 모티프의 아미노산 서열이 어떤 경우든, 비소수성(non-hydrophobic) 아미노산 또는 글리신이다. 비소수성 아미노산은 친수성(hydrophilic) 아미노산 또는 시스테인 혹은 히스티딘이고; 바람직하게는 친수성 아미노산, 즉 아르기닌, 아스파라긴, 아스파라긴산, 글루타민산, 글루타민, 리신, 세린 또는 트레오닌이며; 보다 바람직하게는 글루타민, 글루타민산, 글루타민, 리신이다.
본 발명의 바람직한 실시태양 중 하나는, M1의 A9 아미노산이 M1의 다른 아미노산이 어떤 경우든, 또한 M1 이외의 모티프의 아미노산 서열이 어떤 경우든, 글루타민, 글루탐산, 리신 또는 글리신이다.
본 발명의 바람직한 실시태양 중 하나는, M1의 A9 아미노산이 M1의 다른 아미노산이 어떤 경우든, 또한 M1 이외의 모티프의 아미노산 서열이 어떤 경우든, 비소수성(non-hydrophobic) 아미노산이다. 비소수성 아미노산은, 예를 들어 친수성 아미노산 또는 시스테인 혹은 히스티딘이고; 바람직하게는 친수성 아미노산 즉 아르기닌, 아스파라긴, 아스파라긴산, 글루타민산, 리신, 세린 또는 트레오닌이다.
본 발명의 가장 바람직한 실시태양의 하나는, M1의 A9 아미노산이 M1의 다른 아미노산이 어떤 경우든, 또한 M1 이외의 모티프의 아미노산 서열이 어떤 경우든, 다음 중 어느 하나의 조합이다:
·A6 아미노산이 아스파라긴이고, A9 아미노산이 글루탐산인 조합
·A6 아미노산이 아스파라긴이고, A9 아미노산이 글루타민인 조합
·A6 아미노산이 아스파라긴이고, A9 아미노산이 리신인 조합
·A6 아미노산이 아스파라긴산이고, A9 아미노산이 글리신인 조합
RNA 결합성 단백질의 바람직한 실시태양 중 어느 하나로는 M1의 A6 아미노산 및 A9 아미노산이 상기 조건을 충족하며 또한, 함유된 PPR 모티프 중 적어도 하나, 바람직하게는 반 이상, 더 바람직하게는 모두가 다음 중 어느 하나를 만족시킨다:
·결합하는 염기가 시토신인 경우, A1이 발린이고, A4가 아스파라긴이며, Aii가 세린이다.
·결합하는 염기가 아데닌인 경우, A1이 발린이고, A4가 트레오닌이고, Aii가 아스파라긴이다.
·결합하는 염기가 구아닌일 경우, A1이 발린이고, A4가 트레오닌이며, Aii가 아스파라긴산이다.
·결합하는 염기가 우라실 또는 티민일 경우, A1이 발린이고, A4가 아스파라긴이고, Aii가 아스파라긴산이다.
RNA 결합성 단백질의 바람직한 하나의 실시태양에 따르면, M1은 상술한 신규한 PPR 모티프이다.
특히 바람직한 하나의 실시태양에 따르면, M1은 다음 중 어느 하나의 폴리펩티드로 이루어진 PPR 모티프이고,
· 결합하는 염기가 시토신인 경우, 서열번호 4 내지 7 중 어느 하나의 서열로 구성된 폴리펩티드
· 결합하는 염기가 아데닌인 경우, 서열번호 8의 서열에 있어서 6번 및 9번 위치의 아미노산을 이하에서 정의한 조합 중 어느 하나를 만족하도록 치환한 폴리펩티드
· 결합하는 염기가 구아닌인 경우, 서열번호 9의 서열에 있어서 6번 및 9번 위치의 아미노산을 이하에서 정의한 조합 중 어느 하나를 만족하도록 치환한 폴리펩티드
· 결합하는 염기가 우라실인 경우, 서열번호 10의 서열에 있어서 6번 및 9번 위치의 아미노산을 이하에서 정의한 조합 중 어느 하나를 만족하도록 치환한 폴리펩티드
M1 이외의 PPR 모티프 중 적어도 하나가 다음 중 어느 하나의 폴리펩티드로 이루어진 PPR 모티프이다:
·결합하는 염기가 시토신인 경우, 서열번호 2의 서열로 구성된 폴리펩티드
·결합하는 염기가 아데닌인 경우, 서열번호 8의 서열로 구성된 폴리펩티드
·결합하는 염기가 구아닌인 경우, 서열번호 9의 서열로 구성된 폴리펩티드
·결합하는 염기가 우라실인 경우, 서열번호 10의 서열로 구성된 폴리펩티드
상술한 조합은 아래 중 어느 하나이다:
·A6 아미노산이 아스파라긴이고, A9 아미노산이 글루탐산인 조합
·A6 아미노산이 아스파라긴이고, A9 아미노산이 글루타민인 조합
·A6 아미노산이 아스파라긴이고, A9 아미노산이 리신인 조합
·A6 아미노산이 아스파라긴산이고, A9 아미노산이 글리신인 조합
본 발명의 특히 바람직한 하나의 실시태양은 M1이 다음 중 어느 하나의 폴리펩티드로 이루어진 PPR 모티프이고,
·결합하는 염기가 시토신인 경우, 서열번호 4의 서열로 구성된 폴리펩티드
·결합하는 염기가 아데닌인 경우, 서열번호 58의 서열로 구성된 폴리펩티드
·결합하는 염기가 구아닌인 경우, 서열번호 59의 서열로 구성된 폴리펩티드
·결합하는 염기가 우라실인 경우, 서열번호 60의 서열로 구성된 폴리펩티드
M1 이외의 PPR 모티프 중 적어도 하나가 다음 중 어느 하나의 폴리펩티드로 이루어진 PPR 모티프이다:
·결합하는 염기가 시토신인 경우, 서열번호 2의 서열로 구성된 폴리펩티드
·결합하는 염기가 아데닌인 경우, 서열번호 8의 서열에 있어서 15번 위치의 아미노산이 리신으로 치환된 서열로 구성된 폴리펩티드
·결합하는 염기가 구아닌인 경우, 서열번호 9의 서열로 구성된 폴리펩티드
·결합하는 염기가 우라실인 경우, 서열번호 10의 서열로 구성된 폴리펩티드
(고성능 PPR 모티프의 골격 이용)
본 발명의 한가지 바람직한 실시태양에 따르면, 시토신, 아데닌, 구아닌, 우라실(또는 티민) 각각에 대한 PPR 모티프에서 1, 4, 6, 9, (ii)번 이외의 아미노산을 특정 아미노산으로 배치한다. 구체적으로, 아기장대(Arabidopsis thaliana)의 PPR 모티프 서열 중, 1, 4, 및 (ii)번 위치의 아미노산 조합이 아데닌(A)을 인식하는 PPR 모티프를 위해서는 VTN, 시토신(C)을 인식하는 PPR 모티프를 위해서는 VSN, 구아닌(G)을 인식하는 PPR 모티프를 위해서는 VTD, 우라실(U)을 인식하는 PPR 모티프를 위해서는 VND인 것을 모아, 각 위치에 출현하는 아미노산의 종류 및 그 수를 정리하였을 때, 각 위치에서 높은 빈도로 출현하는 아미노산을 선택함으로써 PPR 모티프의 성능을 높일 수 있다.
1, 4, 6, 9, (ii)번 이외의 아미노산을 상술한 바와 같이 높은 빈도로 출현하는 아미노산으로 이용한다 하였을 경우, RNA 결합성의 PPR 단백질을 얻기 위해서는 다음과 같은 PPR 모티프의 아미노산 서열을 참고할 수 있다:
시토신에 대응하는 PPR 모티프로는 서열번호 4 내지 7 중 어느 하나의 서열로 구성되는 PPR 모티프;
아데닌에 대응하는 PPR 모티프로는 서열번호 8의 서열로 구성되는 PPR 모티프;
구아닌에 대응하는 PPR 모티프로는 서열번호 9의 서열로 구성되는 PPR 모티프;
우라실에 대응하는 PPR 모티프로는 서열번호 10의 서열로 구성되는 PPR 모티프.
(용어의 설명 등)
본 발명에서 염기서열(뉴클레오티드서열이라고도 함) 또는 아미노산 서열에 관하여 "동일성(identity)"이라 함은, 특별히 기재한 경우를 제외하고는 두 서열을 최적의 실시태양으로 정렬시킨 경우, 두 서열간에 공유하는 일치된 염기 또는 아미노산 개수의 백분율을 의미한다. 즉, 동일성=(일치한 위치의 수/위치의 전수)×100으로 산출할 수 있고, 시판되는 알고리즘을 이용해 계산할 수 있다. 또한, 이러한 알고리즘은 [Altschul et al., J. Mol. Biol. 215(1990) 403-410]에 기재된 NBLAST 및 XBLAST 프로그램에 포함되어 있다. 구체적으로, 염기서열 또는 아미노산 서열의 동일성에 관한 검색 및 분석은 당업계에 알려진 알고리즘 또는 프로그램(예를 들어, BLASTN, BLASTP, BLASTX, Clustal W)으로 수행할 수 있다. 프로그램을 이용할 경우의 파라미터는 해당 업체라면 적절하게 설정할 수 있고, 각 프로그램의 디폴트 파라미터(default parameter)를 이용해도 된다. 이들 분석 방법의 구체적인 기법도 당업자에 널리 알려져 있다.
본 명세서에서 염기서열 또는 아미노산 서열에 관해 동일성이 있다(또는 동일성이 높다)함은, 특별히 기재한 경우를 제외하고는 어느 경우나 최소한 70%, 바람직하게는 80% 이상, 보다 바람직하게는 85% 이상, 보다 더 바람직하게는 90% 이상, 보다 더 바람직하게는 95% 이상, 보다 더 바람직하게는 97.5% 이상, 가장 바람직하게는 99% 이상의 동일성을 가지는 경우를 일컫는다.
또한, 본 발명의 PPR 모티프 또는 단백질에 관하여, '치환, 결실 또는 부가된 서열'이라고 할 경우, 치환 등이 되는 아미노산의 개수는 특히 기재하였을 경우를 제외하고, 어느 모티프 또는 단백질에서도 그 아미노산 서열로 구성된 모티프 또는 단백질이 원하는 기능을 가지는 한 특별히 한정되는 것은 아니나, 1개 내지 9개 또는 1개 내지 4개 정도이다. 이러한 아미노산 서열과 관련된 폴리뉴클레오티드 또는 단백질을 제조하기 위한 수단은 당업자에게 잘 알려져 있다.
성질이 비슷한 아미노산은 하이드로파시(hydropathy), 하전(charge), pKa, 용해도(solubility) 등 물성이 유사한 아미노산을 의미하며, 예를 들어 다음과 같은 것을 가리킨다.
소수성(hydrophobic) 아미노산: 알라닌, 발린, 글리신, 이소류신, 류신, 페닐알라닌, 프롤린, 트립토판, 티로신
비소수성(non-hydrophobic) 아미노산: 아르기닌, 아스파라긴, 아스파라긴산, 글루타민산, 리신, 세린, 트레오닌, 시스테인, 히스티딘;
친수성(hydrophilic) 아미노산: 아르기닌, 아스파라긴, 아스파라긴산, 글루타민산, 리신, 세린, 트레오닌;
산성(acidic) 아미노산: 아스파라긴산, 글루탐산
염기성(basic) 아미노산: 리신, 아르기닌, 히스티딘
중성(neutral) 아미노산: 알라닌, 아스파라긴, 시스테인, 글루타민, 글리신,이소류신, 류신, 메티오닌, 페닐알라닌, 프롤린, 세린, 트립토판, 티로신, 발린
함황(sulfur-containing) 아미노산: 메티오닌, 시스테인
함방향환(aromatic ring-containing) 아미노산: 티로신, 트립토판, 페닐알라닌.
유전자, 핵산, 폴리뉴클레오티드, 단백질 및 모티프 등에 관하여, '작제(preparation)'라 함은 '생산(production)' 또는 '제조(manufacturing)'로 바꿔 말할 수 있다. 또한, 유전자 등과 관련하여 파트를 조합하여 작제하는 경우 '구축(construction)'이라고 할 수 있으나 '구축'도 '생산' 또는 '제조'라고도 말할 수 있다.
본 발명의 PPR 모티프, 그를 포함하는 단백질, 또는 이들을 암호화하는 핵산은 당업자라면 종래기술 및 본 명세서의 실시예의 기재를 이용하여 제조할 수 있다.
[PPR 단백질의 특성 및 용도]
(PPR 단백질 응집성 개선)
본 발명의 신규한 PPR 모티프를 사용하여 작제한 PPR 단백질은 세포 내에서의 감소된 응집성(aggregation property)을 나타낸다. PPR 단백질의 응집성은 당업자라면 PPR 단백질을 세포 내에서 발현시켜 응집 여부를 확인하는 것으로 평가할 수 있다. 확인은 PPR 단백질을 형광 단백질과 융합시켜서 발현하면 더욱 쉽다. 본 발명자들의 검토에 따르면, PPR 단백질의 첫번째 모티프에서 아미노산의 적절한 개변에 의해 PPR 단백질의 세포 내 응집성이 개선되어 핵으로의 이행성(localization)이 향상된다.
(결합력)
본 발명의 신규한 PPR 모티프를 사용하여 작제한 PPR 단백질은 세포 내에서 응집성이 감소되었을 뿐만 아니라, 동일한 표적 RNA에 대한 기존의 PPR 모티프를 사용하여 작제한 PPR 단백질과 동등하거나 그보다 높은 RNA 결합능을 갖는다. '동등(equivalent)'이란 55% 이상인 것을 의미하며, 바람직하게는 75% 정도인 것을 의미한다.
표적서열에 대한 결합력은 EMSA(Electrophoretic Mobility Shift Assay)나 Biacore를 이용한 방법에 따라 평가할 수 있다. EMSA는 단백질과 핵산이 결합된 시료를 전기영동시 핵산분자의 이동도가 결합되지 않은 경우와 비교하여 변화하는 성질을 이용하는 방법이다. Biacore로 대표되는 분자간 상호작용 분석기기는 반응속도론적 분석이 가능하므로, 상세한 단백질-핵산결합 분석이 가능하다.
표적서열에 대한 결합력은 또한 고상화된(solid-phased) 표적핵산에 후보 단백질을 포함하는 용액을 제공하여, 표적핵산에 결합한 단백질을 검출 또는 정량하는 것에 의해서도 분석할 수 있다. 이 방법은 ELISA(Enzyme-Linked Immuno Sorbent Assay)를 응용하므로, RPB-ELISA(RNA-protein binding ELISA)법이라 칭하는 경우가 있다. 고상화된 표적핵산에 후보 단백질을 포함하는 용액을 제공하는 공정은, 구체적으로는 플레이트에 고정된 표적핵산 분자에 대상결합 단백질을 포함하는 용액을 흘려보냄으로써 수행한다. 표적핵산 분자의 고정화는 기존의 여러가지 고정화 방법을 이용할 수 있는데, 예를 들어 스트렙토아비딘(streptoavidine)이 코팅된 웰 플레이트에 비오틴 수식된 표적핵산 분자를 포함하는 핵산 프로브를 부여함으로써 달성할 수 있다. 상세한 실험조건은 본 발명의 실시예에 상술한 실험방법을 참고할 수 있다. RPB-ELISA에서는 대상 PPR 단백질과 그 표적 RNA를 가한 시료의 발광량으로부터 백그라운드 시그널(표적 RNA를 가하지 않고 대상 PPR 단백질을 가하였을 때의 발광 시그널 값)을 공제한 값을 대상 PPR 단백질과 그 표적 RNA와의 결합력으로 할 수 있다.
[PPR 단백질의 이용]
(복합체, 융합 단백질)
본 발명에 의해 제공되는 PPR 모티프 또는 PPR 단백질은 기능성 영역(functional region)을 연결하여 복합체(complex)로 만들 수 있다. 또한, 단백질성의 기능성 영역을 연결하여 융합 단백질(fusion protein)로 만들 수 있다. 기능성 영역은 생체 내 또는 세포 내에서 특정한 생물학적 기능, 예를 들어 효소기능, 촉매기능, 저해기능, 항진기능 등의 기능을 가진 부분 또는 표지로서의 기능을 가진 부분을 의미한다. 이런 영역은 예를 들어, 단백질, 펩티드, 핵산, 생리활성물질, 약재로 이뤄진다. 이하에서는 본 발명을 복합체에 관하여 융합 단백질을 예로 들어 설명하였으나, 당업자라면 그 설명에 준하여 융합 단백질 이외의 복합체인 경우에 대해서도 이해할 수 있을 것이다.
본 발명의 바람직한 실시태양의 하나로서, 기능성 영역은 리보핵산 가수분해효소(RNase)이다. RNase의 예는 RNase A(예를 들어, bovine pancreatic ribonuclease A: PDB 2AAS), RNase H이다.
또 다른 바람직한 실시태양의 하나로서, 기능성 영역은 형광 단백질이다. 형광 단백질의 예로서는 mCherry, EGFP, GFP, Sirius, EBFP, ECFP, mTurquoise, TagCFP, AmCyan, mTFP 1, MidoriishiCyan, CFP, TurboGFP, AcGFP, TagGFP, Azami-Green, ZsGreen, EmGFP, HyPer, TagYFP, EYFP, Venus, YFP, PhiYFP, PhiYFP-m, TurboYFP, ZsYellow, mBanana, KusabiraOrange, mOrange, TurboRFP, DsRed-Express, DsRed 2, TagRFP, DsRed-Monomer, AsRed 2, mStrawberry, TurboFP 602, mRFP 1, JRed, KillerRed, HcRed, KeimaRed, mRasberry, mPlum, PS-CFP, Dendra 2, Kaede, EosFP, KikumeGR이다. 융합 단백질로서의 응집성 개선 및/또는 핵에 대한 효율적인 국재화(localization)의 관점에서 바람직한 예는 mClover3이다.
또 다른 바람직한 실시태양의 하나로서, 기능성 영역(functional region)은 표적이 mRNA인 경우 표적 mRNA에서의 단백질 발현량을 향상시키는 기능성 도메인(functional domain)이다(WO 2017/209122). mRNA로부터의 단백질 발현량을 향상시키는 기능성 도메인의 예로서는 mRNA의 번역을 직접적 또는 간접적으로 촉진하는 것으로 알려져 있는 단백질의 기능성 도메인이 있다. 보다 구체적으로, mRNA 리보솜을 유도하는 도메인, mRNA의 번역 시작 또는 번역 촉진과 관련된 도메인, mRNA의 핵 외부로의 수송과 관련된 도메인, 소포체(endoplasmic reticulum, ER) 막으로의 결합과 관련된 도메인, 소포체 잔류 신호(ER retention signal) 서열을 포함하는 도메인, 또는 소포체 신호서열을 포함하는 도메인 등을 예로 들 수 있다. 좀 더 구체적으로, 상기 mRNA 리보솜을 유도하는 도메인은, DENR(Density-regulated protein), MCT-1(Malignant T-cell amplified sequence 1), TPT1(Translationally-controlled tumor protein), 및 Lerepo4(Zinc finger CCCH-domain)로 이루어진 군에서 선택되는 폴리펩티드의 전부 또는 기능적 부분을 포함하는 도메인일 수 있다. 또한, 상기 mRNA 번역개시 또는 번역촉진에 관련된 도메인은 eIF4E 및 eIF4G로 이루어진 군으로부터 선택되는 폴리펩티드의 전부 또는 기능적인 부분을 포함하는 도메인일 수 있다. 또한, 상기 mRNA 핵 외부로의 수송과 관련된 도메인은 SLBP(Stem-loop binding protein)의 전부 또는 기능적 부분을 포함하는 도메인일 수 있다. 또한, 상기 소포체막으로의 결합과 관련된 도메인은 SEC61B, TRAP-alpha(Translocon associated protein alpha), SR-alpha, Dia1(Cytochrome b5 reductase 3), 및 p180로 이루어진 군으로부터 선택되는 폴리펩티드의 전부 또는 기능성 부분을 포함하는 도메인일 수 있다. 또한, 상기 소포체 잔류 신호서열은 KDEL(서열번호 55) 또는 KEEL(서열번호 56) 서열을 포함하는 신호서열이다. 또한, 상기 소포체 신호서열은 MGWSCIILFLVATATGAHS(서열번호 57)를 포함하는 신호서열일 수 있다.
본 발명의 기능성 영역은 PPR 단백질의 N-말단 측에 융합되어도 좋고, C-말단 측에 융합되어도 좋으며, N-말단 측과 C-말단 측의 양쪽에 융합되어도 무방하다. 또한, 복합체 또는 융합 단백질은 복수의 기능성 영역(예를 들어, 2개 내지 5개)을 포함해도 좋다. 또한, 본 발명의 복합체 또는 융합 단백질은 기능성 영역과 PPR 단백질이 링커 등을 통해 간접적으로 융합되어도 좋다.
(PPR 단백질 등을 암호화하는 핵산, 벡터, 세포)
본 발명은 상술한 PPR 모티프, PPR 단백질 또는 융합 단백질을 암호화하는 핵산, 핵산을 포함하는 벡터(예를 들어, 증폭을 위한 벡터, 발현 벡터)도 제공한다. 증폭을 위한 벡터는 대장균이나 효모를 숙주로 사용할 수 있다. 본 명세서에서 발현 벡터란, 예를 들어 상류에 프로모터 서열을 가지는 DNA, 원하는 단백질을 암호화하는 DNA 및 터미네이터 서열을 가지는 DNA를 포함하는 벡터를 의미하나, 원하는 기능을 발휘하는 한 반드시 이 순서로 서열화될 필요는 없다. 본 발명에서는 당업자가 통상 사용할 수 있는 여러가지 벡터를 재조합하여 사용할 수 있다.
본 발명의 PPR 단백질 또는 융합 단백질은 진핵생물(예를 들어, 동물, 식물, 미생물(효모 등), 원생생물)의 세포에서 기능할 수 있다. 본 발명의 융합 단백질은 특히 동물세포 내(실험실 조건 또는 생체 내 조건)에서 기능할 수 있다. 본 발명의 PPR 단백질 또는 융합 단백질, 또는 이를 발현하는 벡터를 도입할 수 있는 동물세포로는, 예를 들어 사람, 원숭이, 돼지, 소, 말, 개, 고양이, 마우스, 래트 유래의 세포를 들 수 있다. 또한, 본 발명의 PPR 단백질, 또는 융합 단백질, 또는 이를 발현하는 벡터를 도입할 수 있는 배양세포로는, 예를 들어 차이니즈 햄스터 난소(CHO) 세포, COS-1 세포, COS-7 세포, VERO(ATC CCL-81) 세포, BHK 세포, 개의 신장 유래 MDCK 세포, 햄스터 AV-12-664 세포, HeLa 세포, WI38 세포, 293 세포, 293T 세포, PER.C6 세포를 들 수 있지만, 이에 한정되는 것은 아니다.
(용도)
본 발명의 PPR 단백질, 또는 융합 단백질은 생체 내 또는 세포 내에 핵산서열 특이적으로 기능성 영역을 전달하고 기능을 발휘하게 할 수 있다. GFP 등의 마커 부분과 연결된 복합체는 원하는 RNA를 생체 내에서 가시화하기 위해 이용할 수 있다.
또한, 본 발명의 PPR 단백질 또는 융합 단백질은 세포 내 또는 생체 내에서 핵산서열 특이적으로 개변, 파괴할 수 있고 새로운 기능을 부여할 수 있다. 특히, RNA 결합성 PPR 단백질은 오르가넬(organelle)에서 볼 수 있는 RNA의 모든 가공 단계, 즉 절단(cleavage), RNA 편집(edition), 번역(translation), 접합(splicing), RNA 안정화(stabilization)에 관여한다. 따라서, 본 발명에 의해 제공되는 PPR 단백질의 개질과 관련된 방법 및 본 발명에 의해 제공되는 PPR 모티프 및 PPR 단백질은 다양한 분야에서 다음과 같은 이용을 기대할 수 있다.
(1) 의료
특정 질환과 관련된 특정 RNA를 인식하고 결합하는 PPR 단백질을 작제한다. 또한, 특정 RNA에 관하여 표적서열을 분석하고 부수되는 단백질을 분석한다. 이들 분석 결과는 질환의 치료를 위한 화합물 탐색에 이용될 수 있다.
예를 들어, 동물에서는 LRPPRC로 일컫어지는 PPR 단백질의 이상이 Leigh Syndrome French Canadian type(LSFC; 레이증후군, 아급성 괴사성 뇌척수증)을 일으키는 것으로 알려져 있다. 본 발명은 LSFC의 처치(예방, 치료, 진행 억제)에 기여할 수 있다. 기존의 PPR 단백질의 대부분은 RNA 조작(RNA 상에서의 유전정보 변환; 많은 경우 C→U)의 편집부위의 지정에 작용한다. 이런 타입의 PPR 단백질은 RNA 편집효소와 상호작용할 것으로 예상되는 부가적인 모티프가 C-말단 측에 존재한다. 이러한 구조를 가진 PPR 단백질로 염기다형(polymorphism)을 도입하거나 염기다형에 기인한 질환 또는 상태를 치료할 수 있을 것으로 기대된다.
·RNA의 억제·발현을 조절하는 세포를 작제한다. 이러한 세포에는 분화, 미분화 상태를 모니터링하는 줄기세포(예를 들어 iPS 세포), 화장품 평가용 모델세포, 신약개발 메커니즘 규명 및 약리시험을 목적으로 기능성 RNA의 발현을 ON/OFF할 수 있는 세포가 포함된다.
- 특정 질환과 관련된 특정 RNA에 특이적으로 결합하는 PPR 단백질을 작제한다. 이러한 PPR 단백질을 플라스미드, 바이러스 벡터, mRNA, 정제 단백질을 이용하여 세포에 도입하고, 그 PPR 단백질이 세포 내에서 표적 RNA와 결합함으로써 질환의 원인인 RNA 기능을 변화(개선)시킬 수 있다. 기능 변화 수단은 예를 들어 결합에 의한 RNA 구조의 변화, 분해(decomposition)에 따른 녹다운, 접합(splicing)에 의한 접합 반응의 변화, 염기치환 등을 들 수 있다.
(2) 농림수산업
·농작물, 임산물, 수산물 등에 있어서, 수량이나 품질을 개선한다.
·내병성의 향상, 환경내성의 향상, 향상되었거나 새로운 기능성을 가진 생물을 육종한다.
예를 들어, 잡종 제1대(F1) 작물에 관해 PPR 단백질에 의한 미토콘드리아 RNA의 안정화나 번역제어를 사용하여 인공적으로 F1 작물을 만들어 수율이나 품질을 개선할 수 있다. PPR 단백질에 의한 RNA 조작 및 게놈 편집은 이전 기술보다 정확하고 신속하게 생물의 품종 개량, 육종(생물을 유전적으로 개량하는 것)이 가능하다. 또한, PPR 단백질에 의한 RNA 조작과 게놈 편집은 유전자 조작처럼 외래 유전자에 의해 형질을 전환하는 것이 아니라, 원래 동식물이 갖는 RNA나 게놈을 취급하는 기술이라는 점에서, 변이체의 선발이나 되돌림 교잡(backcrossing)이라는 종래의 육종방법에 가깝다고 할 수 있다. 따라서, 전 지구 차원의 식량 문제, 환경 문제에도 확실하고 신속하게 대응할 수 있다.
(3) 화학
미생물, 배양세포, 식물체, 동물체(예를 들면, 곤충)를 이용한 유용물질 생산에서 DNA, RNA의 조작에 의해 단백질 발현량을 제어한다. 이로써, 유용 물질의 생산성을 개선할 수 있다. 유용물질의 예로는 항체, 백신, 효소 등의 단백질성 물질 외에 의약품의 중간체, 향료, 색소 등의 비교적 저분자 화합물이다.
·조류나 미생물의 대사경로 변경에 의해, 바이오 연료의 생산효율을 개선한다.
형광 단백질 융합 PPR 단백질의 세포 내 분석
(모티프 설계)
CAG 서열이 6회 반복된 CAGCAGCAGCAGCAGCAG(서열번호 1)을 표적서열로 하였다. PPR 모티프는 1번, 4번, (ii)번 아미노산 서열에 따라 인식되는 염기가 결정된다. 시토신(C)을 인식하는 PPR 모티프는 1번이 발린, 4번이 아스파라긴, (ii)번이 세린을, 아데닌(A)을 인식하는 PPR 모티프는 1번이 발린, 4번이 트레오닌, (ii)번이 아스파라긴을, 구아닌(G)을 인식하는 PPR 모티프는 1번이 아스파라긴, 4번이 트레오닌, (ii)번에는 아스파라긴산을 각각 배치하였다. 또한, 우라실(U)을 인식하는 PPR 모티프에는 1번이 발린, 4번이 아스파라긴, (ii)번에는 아스파라긴산을 배치하였다.
이어, 시토신을 인식하는 1번째 모티프(도 1A, Mutated motif)의 6번째, 9번째 아미노산에 관해서는 전형적인 조합으로, 류신과 글리신(C_6L9G, PPRcag_1, 서열번호 2), 변이체로서는 류신과 글루타민산(C_6L9E, PPRcag_2, 서열번호 3), 아스파라긴과 글루타민(C_6N9Q, PPRcag_3, 서열번호 4), 아스파라긴과 글루타민산(C_ 6N9E, PPRcag_4, 서열번호 5), 아스파라긴과 리신(C_6N9K, PPRcag_5, 서열번호 6), 아스파라긴산과 글리신(C_6D9G, PPRcag_6, 서열번호 7)을 선택하였다(도 1의 B). 이들의 PPR 모티프 서열을 이용하여, 상술한 CAGCAGCAGCAGCAGCAG(서열번호 1)에 결합하도록 나열하여 PPR 유전자를 작제하였다(서열번호 11 내지 16). 또한, 각각의 PPR 모티프를 암호화하는 18개의 DNA를 효율적이고 정확하게 연결시키기 위하여, 시토신, 아데닌, 구아닌 각각에 대한 PPR 모티프에서 1, 4, 6, 9, (ii)번 이외의 아미노산을 상술한 바와 같이 높은 빈도로 발견되는 아미노산으로 선택하였다(참조: 서열번호 8 내지 9, 특허문헌 1).
(플라스미드의 작제)
PPR 유전자를 포함하는 플라스미드를 Golden Gate법을 이용하여 구축하였다.구체적으로, 순서대로 매끄럽게(seamlessly) 연결되도록 설계된 10종의 중간 벡터 Dest-a, b, c, d, e, f, g, h, i, j를 준비하고, 1개 모티프 및 2개 모티프(A, C, G, U에 대응하는 1개의 PPR 모티프, AA, AC, AG, AU, CA, CC, CG, CU, GA, GC, GG, GU, UA, UC, UG, UU 각각의 염기조합을 인식하는 2개의 PPR 모티프)의 20종의 모티프 각각을 10가지 벡터에 삽입함으로써, 200가지 파트(part)를 작제하였다.
Dest-a는 gaagacataaactccgtggtcacATACagagaccaaggtctcaGTGGtcacatacatgtcttc(서열번호 43)
Dest-b는 gaagacatATACagagaccaaggtctcaGTGGtgacataatgtcttc(서열번호 44)
Dest-c는 gaagacatcATACagagaccaaggtctcaGTGGttacatatgtcttc(서열번호 45)
Dest-d는 gaagacatacATACagagaccaaggtctcaGTGGttacaatgtcttc(서열번호 46)
Dest-e는 gaagacattacATACagagaccaaggtctcaGTGGtgacatgtcttc(서열번호 47)
Dest-f는 gaagacattgacATACagagaccaaggtctcaGTGGttaatgtcttc(서열번호 48)
Dest-g는 gaagacatgttacATACagagaccaaggtctcaGTGGtcatgtcttc(서열번호 49)
Dest-h는 gaagacatggtcacATACagagaccaaggtctcaGTGGtatgtcttc(서열번호 50)
Dest-i는 gaagacattggttacATACagagaccaaggtctcaGTGGatgtcttc (서열번호 51)
Dest-j는 gaagacatgtggtgacATACagagaccaaggtctcaGTGGtcttc (서열번호 52)
를 각각 유전자 합성기술로 작제하고, pUC57-kan에 클로닝하였다.
표적 염기서열에 따라 Dest-a 내지 Dest-j를 선택하고, Golden Gate반응으로 벡터로 클로닝하였다. 여기서 사용하는 벡터는 18개의 연결된 PPR 서열의 N-말단에 MGNSV(서열번호 53), C-말단에 ELTYNTLISGLGKAGRARDPPV(서열번호 54)의 아미노산 서열이 부가되도록 설계하였다. 올바른 크기의 유전자가 클로닝된 것을 확인하고, 클로닝된 유전자의 서열을 확인하였다.
(세포 내 발현의 검출)
동물 배양세포에서의 발현 플라스미드 pcDNA 3.1은 CMV 프로모터와 SV40 poly A 신호서열을 포함하여 이들 사이에 발현시키고자 하는 유전자를 삽입할 수 있다. 세포 내에서의 PPR 단백질 발현을 검출하기 위하여, 형광 단백질을 융합한 PPR 단백질을 발현시켜 그 형광화상(fluorescent image)에서 세포 내에서의 응집성 및 핵으로의 이행성을 분석하기로 하였다. N-말단 측에서 EGFP, 핵이행 신호서열(nuclear localization signal sequence), PPR 단백질, FLAG 에피토프 태그(epitope tag)의 순서로 융합된 단백질 유전자를 pcDNA 3.1에 삽입하였다(서열번호 17 내지 22). 또한, N-말단 측에서 mClover3, PPR 단백질, 핵이행 신호서열, FLAG 에피토프 태그의 순서로 융합한 단백질 유전자 컨트롤로서 PPR을 포함하지 않는 플라스미드도 작제하였다(서열번호 35 내지 36).
HEK293T 세포를 9mL DMEM, 1mL FBS가 함유된 10cm 디쉬에 1 x 106 cells/well의 밀도로 파종하였다. 37℃, 5% CO2 환경 하에서 2일간 배양한 후 세포를 회수하였다. 회수한 세포를 PLL 코팅된 96웰 플레이트로 웰 당 4 x 104 cells/well의 밀도로 파종하고, 37℃, 5% CO2 조건으로 1일간 배양하였다. 200ng 플라스미드 DNA, 0.6μL Fugene(등록상표)-HD(Promega, E2311), 200μL Opti-MEM을 혼합하여 전량 웰에 가한 다음, 37℃, 5% CO2 환경 하에서 하루 동안 배양하였다. 배양 후 배지를 제거하고 50μL의 PBS로 1회 세정한 다음, 1μL의 Hoechst(1mg/mL, 동인화학, 346-07951), 50μL의 PBS를 가하고, 37℃, 5% CO2 환경 하에서 10분간 방치하였다. 이후, 50μL의 PBS로 1회 세척한 후, 50μL의 PBS를 가하고 각 웰의 GFP 형광 및 Hoechst 형광 이미지를 형광 현미경 DMi8(Leica)를 사용하여 획득하였다.
그 결과를 도 2에 나타내었다. EGFP 및 핵이행 신호서열을 융합한 PPR의 세포 내 발현을 확인한 결과, PPRcag_1(6L9G)과 PPRcag_2(6L9E)에서는 핵에 국재하지 않고, 핵 주위에서 강하게 응집하는 모습이 관찰되었다. 한편, PPRcag_3(6N9Q), PPRcag_4(6N9E), PPRcag_5(6N9K), PPRcag_6(6D9G)에서는 응집성은 낮기는 하지만, 핵에 국재하지 않았다. mClover3을 융합한 경우, PPRcag_1(6L9G)과 PPRcag_2(6L9E)에서는 핵에 국재하나, 핵 안에서 응집하는 모습이 확인되었다. PPRcag_3(6N9Q), PPRcag_4(6N9E), PPRcag_5(6N9K), PPRcag_6(6D9G)에서는 핵에 국재하고 또한 응집성을 볼 수 없었다. 따라서, 응집성을 개선하기 위해서는 6N9E, 6N9Q, 6N9K, 6D9G 변이가 바람직하고, 또한 핵에 효율적으로 국재화시키기 위해서는 EGFP보다 mClover3을 이용하는 것이 바람직함을 알 수 있었다.
CAG 결합 PPR 단백질의 RNA 결합 분석
PPRcag_1, PPRcag_2, PPRcag_3, PPRcag_4, PPRcag_5, PPRcag_6에 대해 표적 RNA와의 결합을 확인하기 위하여, 재조합 단백질을 작제하고 결합실험을 실시하였다.
각각의 PPR 단백질의 N-말단 측에 루시퍼라제, C-말단 측에 6x 히스티딘 태그 서열을 융합한 단백질 유전자를 설계하고, 대장균 발현 플라스미드로 클로닝하였다(서열번호 29 내지 34). 또한, 대조구로서 PPR 단백질을 포함하지 않는 Nluc-Hisx6 단백질 유전자도 작제하였다(서열번호 39).
완성된 플라스미드를 대장균 Rosetta(DE3)주로 형질전환하였다. 이 대장균을 2mL의 100μg/mL 앰피실린이 함유된 LB 배지에서 37℃에서 12시간 배양하고, OD600 값이 0.5에서 0.8에 도달하였을 때 15℃ 인큐베이터로 배양액을 옮겨 30분간 정치시켰다. 그런 다음 100μL의 IPTG(최종농도 0.1mM IPTG)를 가하고, 15℃에서 16시간 동안 배양하였다. 5,000 x g, 4℃의 조건으로 10분간 원심분리하여 대장균 펠렛을 회수하고, 1.5mL의 용해용 완충용액(20mM Tris-HCl, pH 8.0, 150mM NaCl, 0.5% NP-40, 1mM MgCl2, 2mg/ml 라이소자임, 1mM PMSF, 2μL의 DNase)을 가하여 -80℃에서 20분간 동결시켰다. 25℃에서 30분간 침투하면서 세포동결 파쇄시켰다. 이어, 3,700rpm, 4℃의 조건으로 15분간 원심분리하여 가용성 PPR 단백질을 포함하는 상등액(대장균 용균체)을 회수하였다.
PPR 단백질과 RNA의 결합실험은 스트렙토아비딘 플레이트 상에서의 PPR 단백질과 비오틴화 RNA의 결합실험 방법으로 수행하였다.
표적(target) CAGx6 서열, 비표적(untargeted) CGGx6, CUGx6, CCGx6, 및 D1b(UGGUGUAUCUUGUCUUUA) 서열(서열번호 42의 8 내지 25)을 포함하는 30개 염기의 RNA(각각 순서대로, 서열번호 38 내지 42)의 5'-말단에 비오틴 수식한 RNA 프로브를 합성하였다(Grainer). 2.5pmol의 비오틴화 RNA 프로브를 스트렙토아비딘 코팅 플레이트(Cat No. 15502, Thermo Fisher)에 가하고 30분간 실온에서 반응시킨 다음, 프로브 세척용 완충용액(20mM Tris-HCl(pH 7.6), 150mM NaCl, 5mM MgCl2, 0.5% NP-40, 1mM DTT, 0.1% BSA)으로 세척하였다. 백그라운드 측정을 위해 비오틴화 RNA를 가하지 않고, 용해용 완충용액을 가한 웰도 준비하였다(-Probe). 그 후, 정지용 완충용액(20mM Tris-HCl (pH 7.6), 150mM NaCl, 5mM MgCl2, 0.5% NP-40, 1mM DTT, 1% BSA)을 가하고, 실온에서 30분간 플레이트 표면의 블로킹을 행하였다. 그런 다음, 1.5 x 108 LU/μL의 발광량을 가진 루시퍼라제 융합 PPR 단백질이 포함된 대장균 용균체를 100μL 가하고, 30분간 실온에서 결합반응을 실시하였다. 이후, 200μL의 세척용 완충용액(20mM Tris-HCl(pH 7.6), 150mM NaCl, 5mM MgCl2, 0.5% NP-40, 1mM DTT)으로 5회 세척하였다. 세척용 완충용액으로 2,500배 희석한 루시퍼라제 기질(Promega, E151A) 40μL을 웰에 가하고 5분간 반응시킨 후, 발광량을 플레이트 리더기(Perkin Elmer, Cat No. 5103-35)로 측정하였다.
그 결과를 도 3에 나타내었다. 모든 PPR에서 표적인 CAG x 6에 특이적으로 결합함을 알 수 있었다. 표적서열에 대한 결합력은 PPRcag_1과 비교할때 PPRcag_2는 같은 정도, PPRcag_3은 80% 정도, PPRcag_4는 60% 정도, PPRcag_5는 120% 정도, PPRcag_6은 130% 정도였다. PPRcag_4 이외에는 거의 변이에 의한 결합능의 변화는 나타나지 않음을 알 수 있었다.
PPR 단백질의 응집 제어
v2 모티프를 이용한 PPR 단백질(염기서열은 서열번호 61, 아미노산 서열은 서열번호 62)과 v3.2 모티프를 이용한 PPR 단백질(염기서열은 서열번호 63, 아미노산 서열은 서열번호 64) 각각을 대장균 발현계에서 제조하고 정제하여 겔여과 크로마토그래피로 분리하였다. 여기서 v2 모티프는 서열번호 2 및 서열번호 8 내지 10중 어느 하나의 서열을 가지는 PPR 모티프를 의미하고; v3.2 모티프는 N-말단으로부터 첫번째 모티프의 경우는 서열번호 4, 서열번호 58 내지 60의 서열을 가지는 PPR 모티프를 의미하며, 그 이외의 경우는 아데닌에 대해서는 서열번호 8에 있어서 15번째 아스파라긴산이 리신으로 치환된 것이고, 아데닌 이외의 염기에 대해서는 서열번호 2, 9, 10으로부터 선택되는 서열을 가지는 PPR 모티프를 의미한다.
(단백질의 발현·정제)
목적으로 하는 PPR 단백질을 암호화하는 DNA 서열을 포함하는 pE-SUMOpro Kan 플라스미드를 이용하여 대장균 Rosetta주를 형질전환시켜 37℃에서 배양한 다음, OD600 값이 0.6에 이르렀을 때 20℃로 온도를 낮추어 최종농도 0.5mM이 되도록 IPTG를 가하고, 목적하는 PPR 단백질을 SUMO 융합 단백질로 하여 대장균 내에서 발현시켰다. 하룻밤 배양 후 균체를 원심분리하여 집균하고, 용혈용 완충용액(50mM Tris-HCl pH 8.0, 500mM NaCl)에 재현탁시켰다. 초음파 파쇄를 통해 대장균을 파쇄하여 17,000g로 30분간 원심분리한 상등액 분획을 Ni-Agarose 컬럼에 적용하고 20mM 이미다졸을 함유하는 용혈용 완충용액으로 컬럼을 세척한 다음, 400mM 이미다졸을 함유하는 용혈용 완충용액으로 SUMO 단백질 융합(SUMO-fused) 목적 PPR 단백질을 용출시켰다. 용출 후 Ulp1에 의한 SUMO 단백질을 목적 PPR 단백질에서 떼어내는 동시에, 투석으로 이온교환 완충용액(50mM Tris-Hcl pH 8.0, 200mM NaCl)으로 단백질 용액을 치환하였다. 그런 다음, SP 컬럼을 이용한 양이온 교환 크로마토그래피를 실시하였다. 컬럼 공여 후 NaCl 농도를 200mM에서 1M까지 서서히 높임으로써 단백질을 용출시켰다. 목적하는 PPR 단백질을 포함하는 분획을 Superdex200 컬럼을 이용한 겔여과 크로마토그래피로 최종 정제하였다. 겔여과 완충용액(25mM HEPES pH 7.5, 200mM NaCl, 0.5mM tris(2-carboxyethyl)phosphine(TCEP))으로 평형화한 겔여과 컬럼에, 이온교환에서 용출된 목적 PPR 단백질을 공여하였다. 끝으로, 목적하는 PPR 단백질을 포함하는 분획을 농축하여 액체 질소로 동결하고, 다음 분석에 사용할 때까지 -80℃에서 보존하였다.
(겔여과 크로마토그래피)
정제한 재조합 PPR 단백질을 농도 1mg/ml로 조정하였다. 겔여과 크로마토그래피는 Superdex 200 increase 10/300 GL(GE Healthcare)를 이용하였다. 25mM HEPES pH 7.5, 200mM NaCl, 0.5mM tris(2-carboxyethyl)phosphine(TCEP)으로 평형화된 겔여과 컬럼에, 제조된 단백질을 공여하고 겔여과 컬럼에서 용출되는 용액을 280nm에서의 흡광도를 측정함으로써, 단백질의 성질을 분석하였다.
(결과)
결과를 도 4 에 나타내었다. 용출분획(Elution vol)이 적을수록 분자 크기가 크다. v2에서는 8mL 내지 10mL의 용출분획으로 용출된 반면, v3.2에서는 12mL 내지 14mL의 용출분획에 피크가 나타났다. 이러한 결과로부터, v2에서는 단백질 크기가 커지고 있다는 점에서 응집하고 있을 가능성이 시사되며, 그 응집은 v3.2에서 개선되고 있음을 알 수 있었다.
SEQUENCE LISTING
<110> EditForce Inc.
Kyushu University
<120> Low-cohesive PPR Proteins and Use thereof
<130> F20689K
<150> JP2019-100553
<151> 2019-05-29
<160> 64
<170> PatentIn version 3.5
<210> 1
<211> 18
<212> DNA
<213> Artificial sequence
<220>
<223> target sequence
<400> 1
cagcagcagc agcagcag 18
<210> 2
<211> 35
<212> PRT
<213> Artificial sequence
<220>
<223> PPR motif
<400> 2
Val Thr Tyr Asn Thr Leu Ile Asp Gly Leu Cys Lys Ser Gly Lys Ile
1 5 10 15
Glu Glu Ala Leu Lys Leu Phe Lys Glu Met Glu Glu Lys Gly Ile Thr
20 25 30
Pro Ser Val
35
<210> 3
<211> 35
<212> PRT
<213> Artificial sequence
<220>
<223> PPR motif
<400> 3
Val Thr Tyr Asn Thr Leu Ile Asp Glu Leu Cys Lys Ser Gly Lys Ile
1 5 10 15
Glu Glu Ala Leu Lys Leu Phe Lys Glu Met Glu Glu Lys Gly Ile Thr
20 25 30
Pro Ser Val
35
<210> 4
<211> 35
<212> PRT
<213> Artificial sequence
<220>
<223> PPR motif, 1st_U (v3.2_U)
<400> 4
Val Thr Tyr Asn Thr Asn Ile Asp Gln Leu Cys Lys Ser Gly Lys Ile
1 5 10 15
Glu Glu Ala Leu Lys Leu Phe Lys Glu Met Glu Glu Lys Gly Ile Thr
20 25 30
Pro Ser Val
35
<210> 5
<211> 35
<212> PRT
<213> Artificial sequence
<220>
<223> PPR motif
<400> 5
Val Thr Tyr Asn Thr Asn Ile Asp Glu Leu Cys Lys Ser Gly Lys Ile
1 5 10 15
Glu Glu Ala Leu Lys Leu Phe Lys Glu Met Glu Glu Lys Gly Ile Thr
20 25 30
Pro Ser Val
35
<210> 6
<211> 35
<212> PRT
<213> Artificial sequence
<220>
<223> PPR motif
<400> 6
Val Thr Tyr Asn Thr Asn Ile Asp Lys Leu Cys Lys Ser Gly Lys Ile
1 5 10 15
Glu Glu Ala Leu Lys Leu Phe Lys Glu Met Glu Glu Lys Gly Ile Thr
20 25 30
Pro Ser Val
35
<210> 7
<211> 35
<212> PRT
<213> Artificial sequence
<220>
<223> PPR motif
<400> 7
Val Thr Tyr Asn Thr Asp Ile Asp Gly Leu Cys Lys Ser Gly Lys Ile
1 5 10 15
Glu Glu Ala Leu Lys Leu Phe Lys Glu Met Glu Glu Lys Gly Ile Thr
20 25 30
Pro Ser Val
35
<210> 8
<211> 35
<212> PRT
<213> Artificial sequence
<220>
<223> PPR motif
<400> 8
Val Thr Tyr Thr Thr Leu Ile Asp Gly Leu Cys Lys Ala Gly Asp Val
1 5 10 15
Asp Glu Ala Leu Glu Leu Phe Lys Glu Met Arg Ser Lys Gly Val Lys
20 25 30
Pro Asn Val
35
<210> 9
<211> 35
<212> PRT
<213> Artificial sequence
<220>
<223> PPR motif
<400> 9
Val Thr Tyr Thr Thr Leu Ile Asp Gly Leu Cys Lys Ala Gly Lys Val
1 5 10 15
Asp Glu Ala Leu Glu Leu Phe Asp Glu Met Lys Glu Arg Gly Ile Lys
20 25 30
Pro Asp Val
35
<210> 10
<211> 35
<212> PRT
<213> Artificial sequence
<220>
<223> PPR motif
<400> 10
Val Thr Tyr Asn Thr Leu Ile Asp Gly Leu Cys Lys Ala Gly Arg Leu
1 5 10 15
Asp Glu Ala Glu Glu Leu Leu Glu Glu Met Glu Glu Lys Gly Ile Lys
20 25 30
Pro Asp Val
35
<210> 11
<211> 2303
<212> DNA
<213> Artificial sequence
<220>
<223> PPR gene
<220>
<221> misc_feature
<222> (1894)..(1894)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (1935)..(1935)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (1963)..(1963)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2004)..(2004)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2032)..(2032)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2073)..(2073)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2101)..(2101)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2142)..(2142)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2170)..(2170)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2211)..(2211)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2239)..(2239)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2280)..(2280)
<223> n is a, c, g, t or u
<400> 11
gtcacataca acaccctgat cgacggcctg tgcaagagcg gcaagatcga ggaggccctg 60
aagctgttca aggagatgga ggagaagggc atcaccccca gcgtggtcac atacaccaca 120
ctgatcgacg gactgtgtaa agccggcgac gtggacgaag ccctcgagct gttcaaagag 180
atgcggagca agggcgtgaa gcccaacgtg gtgacataca ccaccctgat cgacggcctg 240
tgcaaggccg gcaaagtgga cgaggccctg gagctgttcg acgagatgaa ggagaggggc 300
atcaagcccg acgtggtcac atacaacacc ctgatcgacg gcctgtgcaa gagcggcaag 360
atcgaggagg ccctgaagct gttcaaggag atggaggaga agggcatcac ccccagcgtg 420
gttacataca ccacactgat cgacggactg tgtaaagccg gcgacgtgga cgaagccctc 480
gagctgttca aagagatgcg gagcaagggc gtgaagccca acgtggtcac atacaccacc 540
ctgatcgacg gcctgtgcaa ggccggcaag gtggatgagg ccctggagct gttcgacgag 600
atgaaggaga ggggcatcaa gcccgacgtg gttacataca acaccctgat cgacggcctg 660
tgcaagagcg gcaagatcga ggaggccctg aagctgttca aggagatgga ggagaagggc 720
atcaccccca gcgtggtcac atacaccaca ctgatcgacg gactgtgtaa agccggcgac 780
gtggacgaag ccctcgagct gttcaaagag atgcggagca agggcgtgaa gcccaacgtg 840
gtgacataca ccaccctgat cgacggcctg tgcaaggccg gcaaagtgga cgaggccctg 900
gagctgttcg acgagatgaa ggagaggggc atcaagcccg acgtggtcac atacaacacc 960
ctgatcgacg gcctgtgcaa gagcggcaag atcgaggagg ccctgaagct gttcaaggag 1020
atggaggaga agggcatcac ccccagcgtg gttacataca ccacactgat cgacggactg 1080
tgtaaagccg gcgacgtgga cgaagccctc gagctgttca aagagatgcg gagcaagggc 1140
gtgaagccca acgtggtcac atacaccacc ctgatcgacg gcctgtgcaa ggccggcaag 1200
gtggatgagg ccctggagct gttcgacgag atgaaggaga ggggcatcaa gcccgacgtg 1260
gtcacataca acaccctgat cgacggcctg tgcaagagcg gcaagatcga ggaggccctg 1320
aagctgttca aggagatgga ggagaagggc atcaccccca gcgtggtcac atacaccaca 1380
ctgatcgacg gactgtgtaa agccggcgac gtggacgaag ccctcgagct gttcaaagag 1440
atgcggagca agggcgtgaa gcccaacgtg gttacataca ccaccctgat cgacggcctg 1500
tgcaaggccg gcaaagtgga cgaggccctg gagctgttcg acgagatgaa ggagaggggc 1560
atcaagcccg acgtggtcac atacaacacc ctgatcgacg gcctgtgcaa gagcggcaag 1620
atcgaggagg ccctgaagct gttcaaggag atggaggaga agggcatcac ccccagcgtg 1680
gtgacataca ccacactgat cgacggactg tgtaaagccg gcgacgtgga cgaagccctc 1740
gagctgttca aagagatgcg gagcaagggc gtgaagccca acgtggtcac atacaccacc 1800
ctgatcgacg gcctgtgcaa ggccggcaag gtggatgagg ccctggagct gttcgacgag 1860
atgaaggaga ggggcatcaa gcccgacgag vtyntdgcks gkakkmkgts vvtyttdgck 1920
agdvdakmrs kgvknvvtyt tdgckagkvd admkrgkdvv tyntdgcksg kakkmkgtsv 1980
vtyttdgcka gdvdakmrsk gvknvvtytt dgckagkvda dmkrgkdvvt yntdgcksgk 2040
akkmkgtsvv tyttdgckag dvdakmrskg vknvvtyttd gckagkvdad mkrgkdvvty 2100
ntdgcksgka kkmkgtsvvt yttdgckagd vdakmrskgv knvvtyttdg ckagkvdadm 2160
krgkdvvtyn tdgcksgkak kmkgtsvvty ttdgckagdv dakmrskgvk nvvtyttdgc 2220
kagkvdadmk rgkdvvtynt dgcksgkakk mkgtsvvtyt tdgckagdvd akmrskgvkn 2280
vvtyttdgck agkvdadmkr gkd 2303
<210> 12
<211> 2302
<212> DNA
<213> Artificial sequence
<220>
<223> PPR gene
<220>
<221> misc_feature
<222> (1894)..(1894)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (1934)..(1934)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (1962)..(1962)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2003)..(2003)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2031)..(2031)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2072)..(2072)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2100)..(2100)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2141)..(2141)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2169)..(2169)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2210)..(2210)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2238)..(2238)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2279)..(2279)
<223> n is a, c, g, t or u
<400> 12
gtcacataca acaccctgat cgacgaactg tgcaagagcg gcaagatcga ggaggccctg 60
aagctgttca aggagatgga ggagaagggc atcaccccca gcgtggtcac atacaccaca 120
ctgatcgacg gactgtgtaa agccggcgac gtggacgaag ccctcgagct gttcaaagag 180
atgcggagca agggcgtgaa gcccaacgtg gtgacataca ccaccctgat cgacggcctg 240
tgcaaggccg gcaaagtgga cgaggccctg gagctgttcg acgagatgaa ggagaggggc 300
atcaagcccg acgtggtcac atacaacacc ctgatcgacg gcctgtgcaa gagcggcaag 360
atcgaggagg ccctgaagct gttcaaggag atggaggaga agggcatcac ccccagcgtg 420
gttacataca ccacactgat cgacggactg tgtaaagccg gcgacgtgga cgaagccctc 480
gagctgttca aagagatgcg gagcaagggc gtgaagccca acgtggtcac atacaccacc 540
ctgatcgacg gcctgtgcaa ggccggcaag gtggatgagg ccctggagct gttcgacgag 600
atgaaggaga ggggcatcaa gcccgacgtg gttacataca acaccctgat cgacggcctg 660
tgcaagagcg gcaagatcga ggaggccctg aagctgttca aggagatgga ggagaagggc 720
atcaccccca gcgtggtcac atacaccaca ctgatcgacg gactgtgtaa agccggcgac 780
gtggacgaag ccctcgagct gttcaaagag atgcggagca agggcgtgaa gcccaacgtg 840
gtgacataca ccaccctgat cgacggcctg tgcaaggccg gcaaagtgga cgaggccctg 900
gagctgttcg acgagatgaa ggagaggggc atcaagcccg acgtggtcac atacaacacc 960
ctgatcgacg gcctgtgcaa gagcggcaag atcgaggagg ccctgaagct gttcaaggag 1020
atggaggaga agggcatcac ccccagcgtg gttacataca ccacactgat cgacggactg 1080
tgtaaagccg gcgacgtgga cgaagccctc gagctgttca aagagatgcg gagcaagggc 1140
gtgaagccca acgtggtcac atacaccacc ctgatcgacg gcctgtgcaa ggccggcaag 1200
gtggatgagg ccctggagct gttcgacgag atgaaggaga ggggcatcaa gcccgacgtg 1260
gtcacataca acaccctgat cgacggcctg tgcaagagcg gcaagatcga ggaggccctg 1320
aagctgttca aggagatgga ggagaagggc atcaccccca gcgtggtcac atacaccaca 1380
ctgatcgacg gactgtgtaa agccggcgac gtggacgaag ccctcgagct gttcaaagag 1440
atgcggagca agggcgtgaa gcccaacgtg gttacataca ccaccctgat cgacggcctg 1500
tgcaaggccg gcaaagtgga cgaggccctg gagctgttcg acgagatgaa ggagaggggc 1560
atcaagcccg acgtggtcac atacaacacc ctgatcgacg gcctgtgcaa gagcggcaag 1620
atcgaggagg ccctgaagct gttcaaggag atggaggaga agggcatcac ccccagcgtg 1680
gtgacataca ccacactgat cgacggactg tgtaaagccg gcgacgtgga cgaagccctc 1740
gagctgttca aagagatgcg gagcaagggc gtgaagccca acgtggtcac atacaccacc 1800
ctgatcgacg gcctgtgcaa ggccggcaag gtggatgagg ccctggagct gttcgacgag 1860
atgaaggaga ggggcatcaa gcccgacgag vtyntdcksg kakkmkgtsv vtyttdgcka 1920
gdvdakmrsk gvknvvtytt dgckagkvda dmkrgkdvvt yntdgcksgk akkmkgtsvv 1980
tyttdgckag dvdakmrskg vknvvtyttd gckagkvdad mkrgkdvvty ntdgcksgka 2040
kkmkgtsvvt yttdgckagd vdakmrskgv knvvtyttdg ckagkvdadm krgkdvvtyn 2100
tdgcksgkak kmkgtsvvty ttdgckagdv dakmrskgvk nvvtyttdgc kagkvdadmk 2160
rgkdvvtynt dgcksgkakk mkgtsvvtyt tdgckagdvd akmrskgvkn vvtyttdgck 2220
agkvdadmkr gkdvvtyntd gcksgkakkm kgtsvvtytt dgckagdvda kmrskgvknv 2280
vtyttdgcka gkvdadmkrg kd 2302
<210> 13
<211> 2303
<212> DNA
<213> Artificial sequence
<220>
<223> PPR gene
<220>
<221> misc_feature
<222> (1894)..(1894)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (1896)..(1896)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (1935)..(1935)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (1963)..(1963)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2004)..(2004)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2032)..(2032)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2073)..(2073)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2101)..(2101)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2142)..(2142)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2170)..(2170)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2211)..(2211)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2239)..(2239)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2280)..(2280)
<223> n is a, c, g, t or u
<400> 13
gtcacataca acaccaacat cgaccagctg tgcaagagcg gcaagatcga ggaggccctg 60
aagctgttca aggagatgga ggagaagggc atcaccccca gcgtggtcac atacaccaca 120
ctgatcgacg gactgtgtaa agccggcgac gtggacgaag ccctcgagct gttcaaagag 180
atgcggagca agggcgtgaa gcccaacgtg gtgacataca ccaccctgat cgacggcctg 240
tgcaaggccg gcaaagtgga cgaggccctg gagctgttcg acgagatgaa ggagaggggc 300
atcaagcccg acgtggtcac atacaacacc ctgatcgacg gcctgtgcaa gagcggcaag 360
atcgaggagg ccctgaagct gttcaaggag atggaggaga agggcatcac ccccagcgtg 420
gttacataca ccacactgat cgacggactg tgtaaagccg gcgacgtgga cgaagccctc 480
gagctgttca aagagatgcg gagcaagggc gtgaagccca acgtggtcac atacaccacc 540
ctgatcgacg gcctgtgcaa ggccggcaag gtggatgagg ccctggagct gttcgacgag 600
atgaaggaga ggggcatcaa gcccgacgtg gttacataca acaccctgat cgacggcctg 660
tgcaagagcg gcaagatcga ggaggccctg aagctgttca aggagatgga ggagaagggc 720
atcaccccca gcgtggtcac atacaccaca ctgatcgacg gactgtgtaa agccggcgac 780
gtggacgaag ccctcgagct gttcaaagag atgcggagca agggcgtgaa gcccaacgtg 840
gtgacataca ccaccctgat cgacggcctg tgcaaggccg gcaaagtgga cgaggccctg 900
gagctgttcg acgagatgaa ggagaggggc atcaagcccg acgtggtcac atacaacacc 960
ctgatcgacg gcctgtgcaa gagcggcaag atcgaggagg ccctgaagct gttcaaggag 1020
atggaggaga agggcatcac ccccagcgtg gttacataca ccacactgat cgacggactg 1080
tgtaaagccg gcgacgtgga cgaagccctc gagctgttca aagagatgcg gagcaagggc 1140
gtgaagccca acgtggtcac atacaccacc ctgatcgacg gcctgtgcaa ggccggcaag 1200
gtggatgagg ccctggagct gttcgacgag atgaaggaga ggggcatcaa gcccgacgtg 1260
gtcacataca acaccctgat cgacggcctg tgcaagagcg gcaagatcga ggaggccctg 1320
aagctgttca aggagatgga ggagaagggc atcaccccca gcgtggtcac atacaccaca 1380
ctgatcgacg gactgtgtaa agccggcgac gtggacgaag ccctcgagct gttcaaagag 1440
atgcggagca agggcgtgaa gcccaacgtg gttacataca ccaccctgat cgacggcctg 1500
tgcaaggccg gcaaagtgga cgaggccctg gagctgttcg acgagatgaa ggagaggggc 1560
atcaagcccg acgtggtcac atacaacacc ctgatcgacg gcctgtgcaa gagcggcaag 1620
atcgaggagg ccctgaagct gttcaaggag atggaggaga agggcatcac ccccagcgtg 1680
gtgacataca ccacactgat cgacggactg tgtaaagccg gcgacgtgga cgaagccctc 1740
gagctgttca aagagatgcg gagcaagggc gtgaagccca acgtggtcac atacaccacc 1800
ctgatcgacg gcctgtgcaa ggccggcaag gtggatgagg ccctggagct gttcgacgag 1860
atgaaggaga ggggcatcaa gcccgacgag vtyntndcks gkakkmkgts vvtyttdgck 1920
agdvdakmrs kgvknvvtyt tdgckagkvd admkrgkdvv tyntdgcksg kakkmkgtsv 1980
vtyttdgcka gdvdakmrsk gvknvvtytt dgckagkvda dmkrgkdvvt yntdgcksgk 2040
akkmkgtsvv tyttdgckag dvdakmrskg vknvvtyttd gckagkvdad mkrgkdvvty 2100
ntdgcksgka kkmkgtsvvt yttdgckagd vdakmrskgv knvvtyttdg ckagkvdadm 2160
krgkdvvtyn tdgcksgkak kmkgtsvvty ttdgckagdv dakmrskgvk nvvtyttdgc 2220
kagkvdadmk rgkdvvtynt dgcksgkakk mkgtsvvtyt tdgckagdvd akmrskgvkn 2280
vvtyttdgck agkvdadmkr gkd 2303
<210> 14
<211> 2303
<212> DNA
<213> Artificial sequence
<220>
<223> PPR gene
<220>
<221> misc_feature
<222> (1894)..(1894)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (1896)..(1896)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (1935)..(1935)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (1963)..(1963)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2004)..(2004)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2032)..(2032)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2073)..(2073)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2101)..(2101)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2142)..(2142)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2170)..(2170)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2211)..(2211)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2239)..(2239)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2280)..(2280)
<223> n is a, c, g, t or u
<400> 14
gtcacataca acaccaacat cgacgaactg tgcaagagcg gcaagatcga ggaggccctg 60
aagctgttca aggagatgga ggagaagggc atcaccccca gcgtggtcac atacaccaca 120
ctgatcgacg gactgtgtaa agccggcgac gtggacgaag ccctcgagct gttcaaagag 180
atgcggagca agggcgtgaa gcccaacgtg gtgacataca ccaccctgat cgacggcctg 240
tgcaaggccg gcaaagtgga cgaggccctg gagctgttcg acgagatgaa ggagaggggc 300
atcaagcccg acgtggtcac atacaacacc ctgatcgacg gcctgtgcaa gagcggcaag 360
atcgaggagg ccctgaagct gttcaaggag atggaggaga agggcatcac ccccagcgtg 420
gttacataca ccacactgat cgacggactg tgtaaagccg gcgacgtgga cgaagccctc 480
gagctgttca aagagatgcg gagcaagggc gtgaagccca acgtggtcac atacaccacc 540
ctgatcgacg gcctgtgcaa ggccggcaag gtggatgagg ccctggagct gttcgacgag 600
atgaaggaga ggggcatcaa gcccgacgtg gttacataca acaccctgat cgacggcctg 660
tgcaagagcg gcaagatcga ggaggccctg aagctgttca aggagatgga ggagaagggc 720
atcaccccca gcgtggtcac atacaccaca ctgatcgacg gactgtgtaa agccggcgac 780
gtggacgaag ccctcgagct gttcaaagag atgcggagca agggcgtgaa gcccaacgtg 840
gtgacataca ccaccctgat cgacggcctg tgcaaggccg gcaaagtgga cgaggccctg 900
gagctgttcg acgagatgaa ggagaggggc atcaagcccg acgtggtcac atacaacacc 960
ctgatcgacg gcctgtgcaa gagcggcaag atcgaggagg ccctgaagct gttcaaggag 1020
atggaggaga agggcatcac ccccagcgtg gttacataca ccacactgat cgacggactg 1080
tgtaaagccg gcgacgtgga cgaagccctc gagctgttca aagagatgcg gagcaagggc 1140
gtgaagccca acgtggtcac atacaccacc ctgatcgacg gcctgtgcaa ggccggcaag 1200
gtggatgagg ccctggagct gttcgacgag atgaaggaga ggggcatcaa gcccgacgtg 1260
gtcacataca acaccctgat cgacggcctg tgcaagagcg gcaagatcga ggaggccctg 1320
aagctgttca aggagatgga ggagaagggc atcaccccca gcgtggtcac atacaccaca 1380
ctgatcgacg gactgtgtaa agccggcgac gtggacgaag ccctcgagct gttcaaagag 1440
atgcggagca agggcgtgaa gcccaacgtg gttacataca ccaccctgat cgacggcctg 1500
tgcaaggccg gcaaagtgga cgaggccctg gagctgttcg acgagatgaa ggagaggggc 1560
atcaagcccg acgtggtcac atacaacacc ctgatcgacg gcctgtgcaa gagcggcaag 1620
atcgaggagg ccctgaagct gttcaaggag atggaggaga agggcatcac ccccagcgtg 1680
gtgacataca ccacactgat cgacggactg tgtaaagccg gcgacgtgga cgaagccctc 1740
gagctgttca aagagatgcg gagcaagggc gtgaagccca acgtggtcac atacaccacc 1800
ctgatcgacg gcctgtgcaa ggccggcaag gtggatgagg ccctggagct gttcgacgag 1860
atgaaggaga ggggcatcaa gcccgacgag vtyntndcks gkakkmkgts vvtyttdgck 1920
agdvdakmrs kgvknvvtyt tdgckagkvd admkrgkdvv tyntdgcksg kakkmkgtsv 1980
vtyttdgcka gdvdakmrsk gvknvvtytt dgckagkvda dmkrgkdvvt yntdgcksgk 2040
akkmkgtsvv tyttdgckag dvdakmrskg vknvvtyttd gckagkvdad mkrgkdvvty 2100
ntdgcksgka kkmkgtsvvt yttdgckagd vdakmrskgv knvvtyttdg ckagkvdadm 2160
krgkdvvtyn tdgcksgkak kmkgtsvvty ttdgckagdv dakmrskgvk nvvtyttdgc 2220
kagkvdadmk rgkdvvtynt dgcksgkakk mkgtsvvtyt tdgckagdvd akmrskgvkn 2280
vvtyttdgck agkvdadmkr gkd 2303
<210> 15
<211> 2304
<212> DNA
<213> Artificial sequence
<220>
<223> PPR gene
<220>
<221> misc_feature
<222> (1894)..(1894)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (1896)..(1896)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (1936)..(1936)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (1964)..(1964)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2005)..(2005)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2033)..(2033)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2074)..(2074)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2102)..(2102)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2143)..(2143)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2171)..(2171)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2212)..(2212)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2240)..(2240)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2281)..(2281)
<223> n is a, c, g, t or u
<400> 15
gtcacataca acaccaacat cgacaaactg tgcaagagcg gcaagatcga ggaggccctg 60
aagctgttca aggagatgga ggagaagggc atcaccccca gcgtggtcac atacaccaca 120
ctgatcgacg gactgtgtaa agccggcgac gtggacgaag ccctcgagct gttcaaagag 180
atgcggagca agggcgtgaa gcccaacgtg gtgacataca ccaccctgat cgacggcctg 240
tgcaaggccg gcaaagtgga cgaggccctg gagctgttcg acgagatgaa ggagaggggc 300
atcaagcccg acgtggtcac atacaacacc ctgatcgacg gcctgtgcaa gagcggcaag 360
atcgaggagg ccctgaagct gttcaaggag atggaggaga agggcatcac ccccagcgtg 420
gttacataca ccacactgat cgacggactg tgtaaagccg gcgacgtgga cgaagccctc 480
gagctgttca aagagatgcg gagcaagggc gtgaagccca acgtggtcac atacaccacc 540
ctgatcgacg gcctgtgcaa ggccggcaag gtggatgagg ccctggagct gttcgacgag 600
atgaaggaga ggggcatcaa gcccgacgtg gttacataca acaccctgat cgacggcctg 660
tgcaagagcg gcaagatcga ggaggccctg aagctgttca aggagatgga ggagaagggc 720
atcaccccca gcgtggtcac atacaccaca ctgatcgacg gactgtgtaa agccggcgac 780
gtggacgaag ccctcgagct gttcaaagag atgcggagca agggcgtgaa gcccaacgtg 840
gtgacataca ccaccctgat cgacggcctg tgcaaggccg gcaaagtgga cgaggccctg 900
gagctgttcg acgagatgaa ggagaggggc atcaagcccg acgtggtcac atacaacacc 960
ctgatcgacg gcctgtgcaa gagcggcaag atcgaggagg ccctgaagct gttcaaggag 1020
atggaggaga agggcatcac ccccagcgtg gttacataca ccacactgat cgacggactg 1080
tgtaaagccg gcgacgtgga cgaagccctc gagctgttca aagagatgcg gagcaagggc 1140
gtgaagccca acgtggtcac atacaccacc ctgatcgacg gcctgtgcaa ggccggcaag 1200
gtggatgagg ccctggagct gttcgacgag atgaaggaga ggggcatcaa gcccgacgtg 1260
gtcacataca acaccctgat cgacggcctg tgcaagagcg gcaagatcga ggaggccctg 1320
aagctgttca aggagatgga ggagaagggc atcaccccca gcgtggtcac atacaccaca 1380
ctgatcgacg gactgtgtaa agccggcgac gtggacgaag ccctcgagct gttcaaagag 1440
atgcggagca agggcgtgaa gcccaacgtg gttacataca ccaccctgat cgacggcctg 1500
tgcaaggccg gcaaagtgga cgaggccctg gagctgttcg acgagatgaa ggagaggggc 1560
atcaagcccg acgtggtcac atacaacacc ctgatcgacg gcctgtgcaa gagcggcaag 1620
atcgaggagg ccctgaagct gttcaaggag atggaggaga agggcatcac ccccagcgtg 1680
gtgacataca ccacactgat cgacggactg tgtaaagccg gcgacgtgga cgaagccctc 1740
gagctgttca aagagatgcg gagcaagggc gtgaagccca acgtggtcac atacaccacc 1800
ctgatcgacg gcctgtgcaa ggccggcaag gtggatgagg ccctggagct gttcgacgag 1860
atgaaggaga ggggcatcaa gcccgacgag vtyntndkck sgkakkmkgt svvtyttdgc 1920
kagdvdakmr skgvknvvty ttdgckagkv dadmkrgkdv vtyntdgcks gkakkmkgts 1980
vvtyttdgck agdvdakmrs kgvknvvtyt tdgckagkvd admkrgkdvv tyntdgcksg 2040
kakkmkgtsv vtyttdgcka gdvdakmrsk gvknvvtytt dgckagkvda dmkrgkdvvt 2100
yntdgcksgk akkmkgtsvv tyttdgckag dvdakmrskg vknvvtyttd gckagkvdad 2160
mkrgkdvvty ntdgcksgka kkmkgtsvvt yttdgckagd vdakmrskgv knvvtyttdg 2220
ckagkvdadm krgkdvvtyn tdgcksgkak kmkgtsvvty ttdgckagdv dakmrskgvk 2280
nvvtyttdgc kagkvdadmk rgkd 2304
<210> 16
<211> 2304
<212> DNA
<213> Artificial sequence
<220>
<223> PPR gene
<220>
<221> misc_feature
<222> (1894)..(1894)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (1936)..(1936)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (1964)..(1964)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2005)..(2005)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2033)..(2033)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2074)..(2074)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2102)..(2102)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2143)..(2143)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2171)..(2171)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2212)..(2212)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2240)..(2240)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2281)..(2281)
<223> n is a, c, g, t or u
<400> 16
gtcacataca acaccgatat cgacggcctg tgcaagagcg gcaagatcga ggaggccctg 60
aagctgttca aggagatgga ggagaagggc atcaccccca gcgtggtcac atacaccaca 120
ctgatcgacg gactgtgtaa agccggcgac gtggacgaag ccctcgagct gttcaaagag 180
atgcggagca agggcgtgaa gcccaacgtg gtgacataca ccaccctgat cgacggcctg 240
tgcaaggccg gcaaagtgga cgaggccctg gagctgttcg acgagatgaa ggagaggggc 300
atcaagcccg acgtggtcac atacaacacc ctgatcgacg gcctgtgcaa gagcggcaag 360
atcgaggagg ccctgaagct gttcaaggag atggaggaga agggcatcac ccccagcgtg 420
gttacataca ccacactgat cgacggactg tgtaaagccg gcgacgtgga cgaagccctc 480
gagctgttca aagagatgcg gagcaagggc gtgaagccca acgtggtcac atacaccacc 540
ctgatcgacg gcctgtgcaa ggccggcaag gtggatgagg ccctggagct gttcgacgag 600
atgaaggaga ggggcatcaa gcccgacgtg gttacataca acaccctgat cgacggcctg 660
tgcaagagcg gcaagatcga ggaggccctg aagctgttca aggagatgga ggagaagggc 720
atcaccccca gcgtggtcac atacaccaca ctgatcgacg gactgtgtaa agccggcgac 780
gtggacgaag ccctcgagct gttcaaagag atgcggagca agggcgtgaa gcccaacgtg 840
gtgacataca ccaccctgat cgacggcctg tgcaaggccg gcaaagtgga cgaggccctg 900
gagctgttcg acgagatgaa ggagaggggc atcaagcccg acgtggtcac atacaacacc 960
ctgatcgacg gcctgtgcaa gagcggcaag atcgaggagg ccctgaagct gttcaaggag 1020
atggaggaga agggcatcac ccccagcgtg gttacataca ccacactgat cgacggactg 1080
tgtaaagccg gcgacgtgga cgaagccctc gagctgttca aagagatgcg gagcaagggc 1140
gtgaagccca acgtggtcac atacaccacc ctgatcgacg gcctgtgcaa ggccggcaag 1200
gtggatgagg ccctggagct gttcgacgag atgaaggaga ggggcatcaa gcccgacgtg 1260
gtcacataca acaccctgat cgacggcctg tgcaagagcg gcaagatcga ggaggccctg 1320
aagctgttca aggagatgga ggagaagggc atcaccccca gcgtggtcac atacaccaca 1380
ctgatcgacg gactgtgtaa agccggcgac gtggacgaag ccctcgagct gttcaaagag 1440
atgcggagca agggcgtgaa gcccaacgtg gttacataca ccaccctgat cgacggcctg 1500
tgcaaggccg gcaaagtgga cgaggccctg gagctgttcg acgagatgaa ggagaggggc 1560
atcaagcccg acgtggtcac atacaacacc ctgatcgacg gcctgtgcaa gagcggcaag 1620
atcgaggagg ccctgaagct gttcaaggag atggaggaga agggcatcac ccccagcgtg 1680
gtgacataca ccacactgat cgacggactg tgtaaagccg gcgacgtgga cgaagccctc 1740
gagctgttca aagagatgcg gagcaagggc gtgaagccca acgtggtcac atacaccacc 1800
ctgatcgacg gcctgtgcaa ggccggcaag gtggatgagg ccctggagct gttcgacgag 1860
atgaaggaga ggggcatcaa gcccgacgag vtyntddgck sgkakkmkgt svvtyttdgc 1920
kagdvdakmr skgvknvvty ttdgckagkv dadmkrgkdv vtyntdgcks gkakkmkgts 1980
vvtyttdgck agdvdakmrs kgvknvvtyt tdgckagkvd admkrgkdvv tyntdgcksg 2040
kakkmkgtsv vtyttdgcka gdvdakmrsk gvknvvtytt dgckagkvda dmkrgkdvvt 2100
yntdgcksgk akkmkgtsvv tyttdgckag dvdakmrskg vknvvtyttd gckagkvdad 2160
mkrgkdvvty ntdgcksgka kkmkgtsvvt yttdgckagd vdakmrskgv knvvtyttdg 2220
ckagkvdadm krgkdvvtyn tdgcksgkak kmkgtsvvty ttdgckagdv dakmrskgvk 2280
nvvtyttdgc kagkvdadmk rgkd 2304
<210> 17
<211> 3481
<212> DNA
<213> Artificial sequence
<220>
<223> PPR vector
<220>
<221> misc_feature
<222> (2858)..(2858)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2914)..(2914)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2926)..(2926)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2934)..(2934)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2939)..(2939)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2941)..(2941)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2944)..(2944)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2952)..(2952)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2956)..(2956)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2960)..(2960)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2969)..(2969)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2976)..(2976)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2986)..(2986)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3023)..(3023)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3029)..(3029)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3070)..(3070)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3098)..(3098)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3139)..(3139)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3167)..(3167)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3208)..(3208)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3236)..(3236)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3277)..(3277)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3305)..(3305)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3346)..(3346)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3374)..(3374)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3415)..(3415)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3441)..(3441)
<223> n is a, c, g, t or u
<400> 17
atggccggag tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat cctggtcgag 60
ctggacggcg acgtaaacgg ccacaagttc agcgtgtccg gcgagggcga gggcgatgcc 120
acctacggca agctgaccct gaagttcatc tgcaccaccg gcaagctgcc cgtgccctgg 180
cccaccctcg tgaccaccct gacctacggc gtgcagtgct tcagccgcta ccccgaccac 240
atgaagcagc acgacttctt caagtccgcc atgcccgaag gctacgtcca ggagcgcacc 300
atcttcttca aggacgacgg caactacaag acccgcgccg aggtgaagtt cgagggcgac 360
accctggtga accgcatcga gctgaagggc atcgacttca aggaggacgg caacatcctg 420
gggcacaagc tggagtacaa ctacaacagc cacaacgtct atatcatggc cgacaagcag 480
aagaacggca tcaaggtgaa cttcaagatc cgccacaaca tcgaggacgg cagcgtgcag 540
ctcgccgacc actaccagca gaacaccccc atcggcgacg gccccgtgct gctgcccgac 600
aaccactacc tgagcaccca gtccgccctg agcaaagacc ccaacgagaa gcgcgatcac 660
atggtcctgc tggagttcgt gaccgccgcc gggatcactc tcggcatgga cgagctgtac 720
aagccaaaga aaaagagaaa ggttagccat ggctccggcg gcagcggggg agggctccat 780
atgggaaact ccgtggtcac atacaacacc ctgatcgacg gcctgtgcaa gagcggcaag 840
atcgaggagg ccctgaagct gttcaaggag atggaggaga agggcatcac ccccagcgtg 900
gtcacataca ccacactgat cgacggactg tgtaaagccg gcgacgtgga cgaagccctc 960
gagctgttca aagagatgcg gagcaagggc gtgaagccca acgtggtgac atacaccacc 1020
ctgatcgacg gcctgtgcaa ggccggcaaa gtggacgagg ccctggagct gttcgacgag 1080
atgaaggaga ggggcatcaa gcccgacgtg gtcacataca acaccctgat cgacggcctg 1140
tgcaagagcg gcaagatcga ggaggccctg aagctgttca aggagatgga ggagaagggc 1200
atcaccccca gcgtggttac atacaccaca ctgatcgacg gactgtgtaa agccggcgac 1260
gtggacgaag ccctcgagct gttcaaagag atgcggagca agggcgtgaa gcccaacgtg 1320
gtcacataca ccaccctgat cgacggcctg tgcaaggccg gcaaggtgga tgaggccctg 1380
gagctgttcg acgagatgaa ggagaggggc atcaagcccg acgtggttac atacaacacc 1440
ctgatcgacg gcctgtgcaa gagcggcaag atcgaggagg ccctgaagct gttcaaggag 1500
atggaggaga agggcatcac ccccagcgtg gtcacataca ccacactgat cgacggactg 1560
tgtaaagccg gcgacgtgga cgaagccctc gagctgttca aagagatgcg gagcaagggc 1620
gtgaagccca acgtggtgac atacaccacc ctgatcgacg gcctgtgcaa ggccggcaaa 1680
gtggacgagg ccctggagct gttcgacgag atgaaggaga ggggcatcaa gcccgacgtg 1740
gtcacataca acaccctgat cgacggcctg tgcaagagcg gcaagatcga ggaggccctg 1800
aagctgttca aggagatgga ggagaagggc atcaccccca gcgtggttac atacaccaca 1860
ctgatcgacg gactgtgtaa agccggcgac gtggacgaag ccctcgagct gttcaaagag 1920
atgcggagca agggcgtgaa gcccaacgtg gtcacataca ccaccctgat cgacggcctg 1980
tgcaaggccg gcaaggtgga tgaggccctg gagctgttcg acgagatgaa ggagaggggc 2040
atcaagcccg acgtggtcac atacaacacc ctgatcgacg gcctgtgcaa gagcggcaag 2100
atcgaggagg ccctgaagct gttcaaggag atggaggaga agggcatcac ccccagcgtg 2160
gtcacataca ccacactgat cgacggactg tgtaaagccg gcgacgtgga cgaagccctc 2220
gagctgttca aagagatgcg gagcaagggc gtgaagccca acgtggttac atacaccacc 2280
ctgatcgacg gcctgtgcaa ggccggcaaa gtggacgagg ccctggagct gttcgacgag 2340
atgaaggaga ggggcatcaa gcccgacgtg gtcacataca acaccctgat cgacggcctg 2400
tgcaagagcg gcaagatcga ggaggccctg aagctgttca aggagatgga ggagaagggc 2460
atcaccccca gcgtggtgac atacaccaca ctgatcgacg gactgtgtaa agccggcgac 2520
gtggacgaag ccctcgagct gttcaaagag atgcggagca agggcgtgaa gcccaacgtg 2580
gtcacataca ccaccctgat cgacggcctg tgcaaggccg gcaaggtgga tgaggccctg 2640
gagctgttcg acgagatgaa ggagaggggc atcaagcccg acgagctgac ctacaacacc 2700
ctgatcagcg gcctgggcaa ggccggcaga gccagagacc cccccgtgct cagtagcggg 2760
gactataagg accacgacgg agactacaag gatcatgata ttgattacaa agacgatgac 2820
gataagatgg ccggacgcta gmagvskgtg vvvdgdvngh ksvsgggdat ygktkcttgk 2880
vwtvtttygv csrydhmkhd ksamgyvrtk ddgnyktrav kgdtvnrkgd kdgnghkyny 2940
nshnvymadk kngkvnkrhn dgsvadhynt gdgvdnhyst saskdnkrdh mvvtaagtgm 3000
dykkkkrkvs hgsggsgggh mgnsvvtynt dgcksgkakk mkgtsvvtyt tdgckagdvd 3060
akmrskgvkn vvtyttdgck agkvdadmkr gkdvvtyntd gcksgkakkm kgtsvvtytt 3120
dgckagdvda kmrskgvknv vtyttdgcka gkvdadmkrg kdvvtyntdg cksgkakkmk 3180
gtsvvtyttd gckagdvdak mrskgvknvv tyttdgckag kvdadmkrgk dvvtyntdgc 3240
ksgkakkmkg tsvvtyttdg ckagdvdakm rskgvknvvt yttdgckagk vdadmkrgkd 3300
vvtyntdgck sgkakkmkgt svvtyttdgc kagdvdakmr skgvknvvty ttdgckagkv 3360
dadmkrgkdv vtyntdgcks gkakkmkgts vvtyttdgck agdvdakmrs kgvknvvtyt 3420
tdgckagkvd admkrgkdty ntsggkagra rdvssgdykd hdgdykdhdd ykddddkmag 3480
r 3481
<210> 18
<211> 3480
<212> DNA
<213> Artificial sequence
<220>
<223> PPR vector
<220>
<221> misc_feature
<222> (2858)..(2858)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2914)..(2914)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2926)..(2926)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2934)..(2934)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2939)..(2939)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2941)..(2941)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2944)..(2944)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2952)..(2952)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2956)..(2956)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2960)..(2960)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2969)..(2969)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2976)..(2976)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2986)..(2986)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3023)..(3023)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3029)..(3029)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3069)..(3069)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3097)..(3097)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3138)..(3138)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3166)..(3166)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3207)..(3207)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3235)..(3235)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3276)..(3276)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3304)..(3304)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3345)..(3345)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3373)..(3373)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3414)..(3414)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3440)..(3440)
<223> n is a, c, g, t or u
<400> 18
atggccggag tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat cctggtcgag 60
ctggacggcg acgtaaacgg ccacaagttc agcgtgtccg gcgagggcga gggcgatgcc 120
acctacggca agctgaccct gaagttcatc tgcaccaccg gcaagctgcc cgtgccctgg 180
cccaccctcg tgaccaccct gacctacggc gtgcagtgct tcagccgcta ccccgaccac 240
atgaagcagc acgacttctt caagtccgcc atgcccgaag gctacgtcca ggagcgcacc 300
atcttcttca aggacgacgg caactacaag acccgcgccg aggtgaagtt cgagggcgac 360
accctggtga accgcatcga gctgaagggc atcgacttca aggaggacgg caacatcctg 420
gggcacaagc tggagtacaa ctacaacagc cacaacgtct atatcatggc cgacaagcag 480
aagaacggca tcaaggtgaa cttcaagatc cgccacaaca tcgaggacgg cagcgtgcag 540
ctcgccgacc actaccagca gaacaccccc atcggcgacg gccccgtgct gctgcccgac 600
aaccactacc tgagcaccca gtccgccctg agcaaagacc ccaacgagaa gcgcgatcac 660
atggtcctgc tggagttcgt gaccgccgcc gggatcactc tcggcatgga cgagctgtac 720
aagccaaaga aaaagagaaa ggttagccat ggctccggcg gcagcggggg agggctccat 780
atgggaaact ccgtggtcac atacaacacc ctgatcgacg aactgtgcaa gagcggcaag 840
atcgaggagg ccctgaagct gttcaaggag atggaggaga agggcatcac ccccagcgtg 900
gtcacataca ccacactgat cgacggactg tgtaaagccg gcgacgtgga cgaagccctc 960
gagctgttca aagagatgcg gagcaagggc gtgaagccca acgtggtgac atacaccacc 1020
ctgatcgacg gcctgtgcaa ggccggcaaa gtggacgagg ccctggagct gttcgacgag 1080
atgaaggaga ggggcatcaa gcccgacgtg gtcacataca acaccctgat cgacggcctg 1140
tgcaagagcg gcaagatcga ggaggccctg aagctgttca aggagatgga ggagaagggc 1200
atcaccccca gcgtggttac atacaccaca ctgatcgacg gactgtgtaa agccggcgac 1260
gtggacgaag ccctcgagct gttcaaagag atgcggagca agggcgtgaa gcccaacgtg 1320
gtcacataca ccaccctgat cgacggcctg tgcaaggccg gcaaggtgga tgaggccctg 1380
gagctgttcg acgagatgaa ggagaggggc atcaagcccg acgtggttac atacaacacc 1440
ctgatcgacg gcctgtgcaa gagcggcaag atcgaggagg ccctgaagct gttcaaggag 1500
atggaggaga agggcatcac ccccagcgtg gtcacataca ccacactgat cgacggactg 1560
tgtaaagccg gcgacgtgga cgaagccctc gagctgttca aagagatgcg gagcaagggc 1620
gtgaagccca acgtggtgac atacaccacc ctgatcgacg gcctgtgcaa ggccggcaaa 1680
gtggacgagg ccctggagct gttcgacgag atgaaggaga ggggcatcaa gcccgacgtg 1740
gtcacataca acaccctgat cgacggcctg tgcaagagcg gcaagatcga ggaggccctg 1800
aagctgttca aggagatgga ggagaagggc atcaccccca gcgtggttac atacaccaca 1860
ctgatcgacg gactgtgtaa agccggcgac gtggacgaag ccctcgagct gttcaaagag 1920
atgcggagca agggcgtgaa gcccaacgtg gtcacataca ccaccctgat cgacggcctg 1980
tgcaaggccg gcaaggtgga tgaggccctg gagctgttcg acgagatgaa ggagaggggc 2040
atcaagcccg acgtggtcac atacaacacc ctgatcgacg gcctgtgcaa gagcggcaag 2100
atcgaggagg ccctgaagct gttcaaggag atggaggaga agggcatcac ccccagcgtg 2160
gtcacataca ccacactgat cgacggactg tgtaaagccg gcgacgtgga cgaagccctc 2220
gagctgttca aagagatgcg gagcaagggc gtgaagccca acgtggttac atacaccacc 2280
ctgatcgacg gcctgtgcaa ggccggcaaa gtggacgagg ccctggagct gttcgacgag 2340
atgaaggaga ggggcatcaa gcccgacgtg gtcacataca acaccctgat cgacggcctg 2400
tgcaagagcg gcaagatcga ggaggccctg aagctgttca aggagatgga ggagaagggc 2460
atcaccccca gcgtggtgac atacaccaca ctgatcgacg gactgtgtaa agccggcgac 2520
gtggacgaag ccctcgagct gttcaaagag atgcggagca agggcgtgaa gcccaacgtg 2580
gtcacataca ccaccctgat cgacggcctg tgcaaggccg gcaaggtgga tgaggccctg 2640
gagctgttcg acgagatgaa ggagaggggc atcaagcccg acgagctgac ctacaacacc 2700
ctgatcagcg gcctgggcaa ggccggcaga gccagagacc cccccgtgct cagtagcggg 2760
gactataagg accacgacgg agactacaag gatcatgata ttgattacaa agacgatgac 2820
gataagatgg ccggacgcta gmagvskgtg vvvdgdvngh ksvsgggdat ygktkcttgk 2880
vwtvtttygv csrydhmkhd ksamgyvrtk ddgnyktrav kgdtvnrkgd kdgnghkyny 2940
nshnvymadk kngkvnkrhn dgsvadhynt gdgvdnhyst saskdnkrdh mvvtaagtgm 3000
dykkkkrkvs hgsggsgggh mgnsvvtynt dcksgkakkm kgtsvvtytt dgckagdvda 3060
kmrskgvknv vtyttdgcka gkvdadmkrg kdvvtyntdg cksgkakkmk gtsvvtyttd 3120
gckagdvdak mrskgvknvv tyttdgckag kvdadmkrgk dvvtyntdgc ksgkakkmkg 3180
tsvvtyttdg ckagdvdakm rskgvknvvt yttdgckagk vdadmkrgkd vvtyntdgck 3240
sgkakkmkgt svvtyttdgc kagdvdakmr skgvknvvty ttdgckagkv dadmkrgkdv 3300
vtyntdgcks gkakkmkgts vvtyttdgck agdvdakmrs kgvknvvtyt tdgckagkvd 3360
admkrgkdvv tyntdgcksg kakkmkgtsv vtyttdgcka gdvdakmrsk gvknvvtytt 3420
dgckagkvda dmkrgkdtyn tsggkagrar dvssgdykdh dgdykdhddy kddddkmagr 3480
<210> 19
<211> 3481
<212> DNA
<213> Artificial sequence
<220>
<223> PPR vector
<220>
<221> misc_feature
<222> (2858)..(2858)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2914)..(2914)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2926)..(2926)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2934)..(2934)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2939)..(2939)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2941)..(2941)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2944)..(2944)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2952)..(2952)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2956)..(2956)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2960)..(2960)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2969)..(2969)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2976)..(2976)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2986)..(2986)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3023)..(3023)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3029)..(3029)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3031)..(3031)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3070)..(3070)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3098)..(3098)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3139)..(3139)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3167)..(3167)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3208)..(3208)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3236)..(3236)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3277)..(3277)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3305)..(3305)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3346)..(3346)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3374)..(3374)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3415)..(3415)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3441)..(3441)
<223> n is a, c, g, t or u
<400> 19
atggccggag tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat cctggtcgag 60
ctggacggcg acgtaaacgg ccacaagttc agcgtgtccg gcgagggcga gggcgatgcc 120
acctacggca agctgaccct gaagttcatc tgcaccaccg gcaagctgcc cgtgccctgg 180
cccaccctcg tgaccaccct gacctacggc gtgcagtgct tcagccgcta ccccgaccac 240
atgaagcagc acgacttctt caagtccgcc atgcccgaag gctacgtcca ggagcgcacc 300
atcttcttca aggacgacgg caactacaag acccgcgccg aggtgaagtt cgagggcgac 360
accctggtga accgcatcga gctgaagggc atcgacttca aggaggacgg caacatcctg 420
gggcacaagc tggagtacaa ctacaacagc cacaacgtct atatcatggc cgacaagcag 480
aagaacggca tcaaggtgaa cttcaagatc cgccacaaca tcgaggacgg cagcgtgcag 540
ctcgccgacc actaccagca gaacaccccc atcggcgacg gccccgtgct gctgcccgac 600
aaccactacc tgagcaccca gtccgccctg agcaaagacc ccaacgagaa gcgcgatcac 660
atggtcctgc tggagttcgt gaccgccgcc gggatcactc tcggcatgga cgagctgtac 720
aagccaaaga aaaagagaaa ggttagccat ggctccggcg gcagcggggg agggctccat 780
atgggaaact ccgtggtcac atacaacacc aacatcgacc agctgtgcaa gagcggcaag 840
atcgaggagg ccctgaagct gttcaaggag atggaggaga agggcatcac ccccagcgtg 900
gtcacataca ccacactgat cgacggactg tgtaaagccg gcgacgtgga cgaagccctc 960
gagctgttca aagagatgcg gagcaagggc gtgaagccca acgtggtgac atacaccacc 1020
ctgatcgacg gcctgtgcaa ggccggcaaa gtggacgagg ccctggagct gttcgacgag 1080
atgaaggaga ggggcatcaa gcccgacgtg gtcacataca acaccctgat cgacggcctg 1140
tgcaagagcg gcaagatcga ggaggccctg aagctgttca aggagatgga ggagaagggc 1200
atcaccccca gcgtggttac atacaccaca ctgatcgacg gactgtgtaa agccggcgac 1260
gtggacgaag ccctcgagct gttcaaagag atgcggagca agggcgtgaa gcccaacgtg 1320
gtcacataca ccaccctgat cgacggcctg tgcaaggccg gcaaggtgga tgaggccctg 1380
gagctgttcg acgagatgaa ggagaggggc atcaagcccg acgtggttac atacaacacc 1440
ctgatcgacg gcctgtgcaa gagcggcaag atcgaggagg ccctgaagct gttcaaggag 1500
atggaggaga agggcatcac ccccagcgtg gtcacataca ccacactgat cgacggactg 1560
tgtaaagccg gcgacgtgga cgaagccctc gagctgttca aagagatgcg gagcaagggc 1620
gtgaagccca acgtggtgac atacaccacc ctgatcgacg gcctgtgcaa ggccggcaaa 1680
gtggacgagg ccctggagct gttcgacgag atgaaggaga ggggcatcaa gcccgacgtg 1740
gtcacataca acaccctgat cgacggcctg tgcaagagcg gcaagatcga ggaggccctg 1800
aagctgttca aggagatgga ggagaagggc atcaccccca gcgtggttac atacaccaca 1860
ctgatcgacg gactgtgtaa agccggcgac gtggacgaag ccctcgagct gttcaaagag 1920
atgcggagca agggcgtgaa gcccaacgtg gtcacataca ccaccctgat cgacggcctg 1980
tgcaaggccg gcaaggtgga tgaggccctg gagctgttcg acgagatgaa ggagaggggc 2040
atcaagcccg acgtggtcac atacaacacc ctgatcgacg gcctgtgcaa gagcggcaag 2100
atcgaggagg ccctgaagct gttcaaggag atggaggaga agggcatcac ccccagcgtg 2160
gtcacataca ccacactgat cgacggactg tgtaaagccg gcgacgtgga cgaagccctc 2220
gagctgttca aagagatgcg gagcaagggc gtgaagccca acgtggttac atacaccacc 2280
ctgatcgacg gcctgtgcaa ggccggcaaa gtggacgagg ccctggagct gttcgacgag 2340
atgaaggaga ggggcatcaa gcccgacgtg gtcacataca acaccctgat cgacggcctg 2400
tgcaagagcg gcaagatcga ggaggccctg aagctgttca aggagatgga ggagaagggc 2460
atcaccccca gcgtggtgac atacaccaca ctgatcgacg gactgtgtaa agccggcgac 2520
gtggacgaag ccctcgagct gttcaaagag atgcggagca agggcgtgaa gcccaacgtg 2580
gtcacataca ccaccctgat cgacggcctg tgcaaggccg gcaaggtgga tgaggccctg 2640
gagctgttcg acgagatgaa ggagaggggc atcaagcccg acgagctgac ctacaacacc 2700
ctgatcagcg gcctgggcaa ggccggcaga gccagagacc cccccgtgct cagtagcggg 2760
gactataagg accacgacgg agactacaag gatcatgata ttgattacaa agacgatgac 2820
gataagatgg ccggacgcta gmagvskgtg vvvdgdvngh ksvsgggdat ygktkcttgk 2880
vwtvtttygv csrydhmkhd ksamgyvrtk ddgnyktrav kgdtvnrkgd kdgnghkyny 2940
nshnvymadk kngkvnkrhn dgsvadhynt gdgvdnhyst saskdnkrdh mvvtaagtgm 3000
dykkkkrkvs hgsggsgggh mgnsvvtynt ndcksgkakk mkgtsvvtyt tdgckagdvd 3060
akmrskgvkn vvtyttdgck agkvdadmkr gkdvvtyntd gcksgkakkm kgtsvvtytt 3120
dgckagdvda kmrskgvknv vtyttdgcka gkvdadmkrg kdvvtyntdg cksgkakkmk 3180
gtsvvtyttd gckagdvdak mrskgvknvv tyttdgckag kvdadmkrgk dvvtyntdgc 3240
ksgkakkmkg tsvvtyttdg ckagdvdakm rskgvknvvt yttdgckagk vdadmkrgkd 3300
vvtyntdgck sgkakkmkgt svvtyttdgc kagdvdakmr skgvknvvty ttdgckagkv 3360
dadmkrgkdv vtyntdgcks gkakkmkgts vvtyttdgck agdvdakmrs kgvknvvtyt 3420
tdgckagkvd admkrgkdty ntsggkagra rdvssgdykd hdgdykdhdd ykddddkmag 3480
r 3481
<210> 20
<211> 3481
<212> DNA
<213> Artificial sequence
<220>
<223> PPR vector
<220>
<221> misc_feature
<222> (2858)..(2858)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2914)..(2914)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2926)..(2926)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2934)..(2934)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2939)..(2939)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2941)..(2941)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2944)..(2944)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2952)..(2952)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2956)..(2956)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2960)..(2960)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2969)..(2969)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2976)..(2976)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2986)..(2986)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3023)..(3023)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3029)..(3029)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3031)..(3031)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3070)..(3070)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3098)..(3098)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3139)..(3139)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3167)..(3167)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3208)..(3208)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3236)..(3236)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3277)..(3277)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3305)..(3305)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3346)..(3346)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3374)..(3374)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3415)..(3415)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3441)..(3441)
<223> n is a, c, g, t or u
<400> 20
atggccggag tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat cctggtcgag 60
ctggacggcg acgtaaacgg ccacaagttc agcgtgtccg gcgagggcga gggcgatgcc 120
acctacggca agctgaccct gaagttcatc tgcaccaccg gcaagctgcc cgtgccctgg 180
cccaccctcg tgaccaccct gacctacggc gtgcagtgct tcagccgcta ccccgaccac 240
atgaagcagc acgacttctt caagtccgcc atgcccgaag gctacgtcca ggagcgcacc 300
atcttcttca aggacgacgg caactacaag acccgcgccg aggtgaagtt cgagggcgac 360
accctggtga accgcatcga gctgaagggc atcgacttca aggaggacgg caacatcctg 420
gggcacaagc tggagtacaa ctacaacagc cacaacgtct atatcatggc cgacaagcag 480
aagaacggca tcaaggtgaa cttcaagatc cgccacaaca tcgaggacgg cagcgtgcag 540
ctcgccgacc actaccagca gaacaccccc atcggcgacg gccccgtgct gctgcccgac 600
aaccactacc tgagcaccca gtccgccctg agcaaagacc ccaacgagaa gcgcgatcac 660
atggtcctgc tggagttcgt gaccgccgcc gggatcactc tcggcatgga cgagctgtac 720
aagccaaaga aaaagagaaa ggttagccat ggctccggcg gcagcggggg agggctccat 780
atgggaaact ccgtggtcac atacaacacc aacatcgacg aactgtgcaa gagcggcaag 840
atcgaggagg ccctgaagct gttcaaggag atggaggaga agggcatcac ccccagcgtg 900
gtcacataca ccacactgat cgacggactg tgtaaagccg gcgacgtgga cgaagccctc 960
gagctgttca aagagatgcg gagcaagggc gtgaagccca acgtggtgac atacaccacc 1020
ctgatcgacg gcctgtgcaa ggccggcaaa gtggacgagg ccctggagct gttcgacgag 1080
atgaaggaga ggggcatcaa gcccgacgtg gtcacataca acaccctgat cgacggcctg 1140
tgcaagagcg gcaagatcga ggaggccctg aagctgttca aggagatgga ggagaagggc 1200
atcaccccca gcgtggttac atacaccaca ctgatcgacg gactgtgtaa agccggcgac 1260
gtggacgaag ccctcgagct gttcaaagag atgcggagca agggcgtgaa gcccaacgtg 1320
gtcacataca ccaccctgat cgacggcctg tgcaaggccg gcaaggtgga tgaggccctg 1380
gagctgttcg acgagatgaa ggagaggggc atcaagcccg acgtggttac atacaacacc 1440
ctgatcgacg gcctgtgcaa gagcggcaag atcgaggagg ccctgaagct gttcaaggag 1500
atggaggaga agggcatcac ccccagcgtg gtcacataca ccacactgat cgacggactg 1560
tgtaaagccg gcgacgtgga cgaagccctc gagctgttca aagagatgcg gagcaagggc 1620
gtgaagccca acgtggtgac atacaccacc ctgatcgacg gcctgtgcaa ggccggcaaa 1680
gtggacgagg ccctggagct gttcgacgag atgaaggaga ggggcatcaa gcccgacgtg 1740
gtcacataca acaccctgat cgacggcctg tgcaagagcg gcaagatcga ggaggccctg 1800
aagctgttca aggagatgga ggagaagggc atcaccccca gcgtggttac atacaccaca 1860
ctgatcgacg gactgtgtaa agccggcgac gtggacgaag ccctcgagct gttcaaagag 1920
atgcggagca agggcgtgaa gcccaacgtg gtcacataca ccaccctgat cgacggcctg 1980
tgcaaggccg gcaaggtgga tgaggccctg gagctgttcg acgagatgaa ggagaggggc 2040
atcaagcccg acgtggtcac atacaacacc ctgatcgacg gcctgtgcaa gagcggcaag 2100
atcgaggagg ccctgaagct gttcaaggag atggaggaga agggcatcac ccccagcgtg 2160
gtcacataca ccacactgat cgacggactg tgtaaagccg gcgacgtgga cgaagccctc 2220
gagctgttca aagagatgcg gagcaagggc gtgaagccca acgtggttac atacaccacc 2280
ctgatcgacg gcctgtgcaa ggccggcaaa gtggacgagg ccctggagct gttcgacgag 2340
atgaaggaga ggggcatcaa gcccgacgtg gtcacataca acaccctgat cgacggcctg 2400
tgcaagagcg gcaagatcga ggaggccctg aagctgttca aggagatgga ggagaagggc 2460
atcaccccca gcgtggtgac atacaccaca ctgatcgacg gactgtgtaa agccggcgac 2520
gtggacgaag ccctcgagct gttcaaagag atgcggagca agggcgtgaa gcccaacgtg 2580
gtcacataca ccaccctgat cgacggcctg tgcaaggccg gcaaggtgga tgaggccctg 2640
gagctgttcg acgagatgaa ggagaggggc atcaagcccg acgagctgac ctacaacacc 2700
ctgatcagcg gcctgggcaa ggccggcaga gccagagacc cccccgtgct cagtagcggg 2760
gactataagg accacgacgg agactacaag gatcatgata ttgattacaa agacgatgac 2820
gataagatgg ccggacgcta gmagvskgtg vvvdgdvngh ksvsgggdat ygktkcttgk 2880
vwtvtttygv csrydhmkhd ksamgyvrtk ddgnyktrav kgdtvnrkgd kdgnghkyny 2940
nshnvymadk kngkvnkrhn dgsvadhynt gdgvdnhyst saskdnkrdh mvvtaagtgm 3000
dykkkkrkvs hgsggsgggh mgnsvvtynt ndcksgkakk mkgtsvvtyt tdgckagdvd 3060
akmrskgvkn vvtyttdgck agkvdadmkr gkdvvtyntd gcksgkakkm kgtsvvtytt 3120
dgckagdvda kmrskgvknv vtyttdgcka gkvdadmkrg kdvvtyntdg cksgkakkmk 3180
gtsvvtyttd gckagdvdak mrskgvknvv tyttdgckag kvdadmkrgk dvvtyntdgc 3240
ksgkakkmkg tsvvtyttdg ckagdvdakm rskgvknvvt yttdgckagk vdadmkrgkd 3300
vvtyntdgck sgkakkmkgt svvtyttdgc kagdvdakmr skgvknvvty ttdgckagkv 3360
dadmkrgkdv vtyntdgcks gkakkmkgts vvtyttdgck agdvdakmrs kgvknvvtyt 3420
tdgckagkvd admkrgkdty ntsggkagra rdvssgdykd hdgdykdhdd ykddddkmag 3480
r 3481
<210> 21
<211> 3482
<212> DNA
<213> Artificial sequence
<220>
<223> PPR vector
<220>
<221> misc_feature
<222> (2858)..(2858)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2914)..(2914)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2926)..(2926)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2934)..(2934)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2939)..(2939)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2941)..(2941)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2944)..(2944)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2952)..(2952)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2956)..(2956)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2960)..(2960)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2969)..(2969)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2976)..(2976)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2986)..(2986)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3023)..(3023)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3029)..(3029)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3031)..(3031)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3071)..(3071)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3099)..(3099)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3140)..(3140)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3168)..(3168)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3209)..(3209)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3237)..(3237)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3278)..(3278)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3306)..(3306)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3347)..(3347)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3375)..(3375)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3416)..(3416)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3442)..(3442)
<223> n is a, c, g, t or u
<400> 21
atggccggag tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat cctggtcgag 60
ctggacggcg acgtaaacgg ccacaagttc agcgtgtccg gcgagggcga gggcgatgcc 120
acctacggca agctgaccct gaagttcatc tgcaccaccg gcaagctgcc cgtgccctgg 180
cccaccctcg tgaccaccct gacctacggc gtgcagtgct tcagccgcta ccccgaccac 240
atgaagcagc acgacttctt caagtccgcc atgcccgaag gctacgtcca ggagcgcacc 300
atcttcttca aggacgacgg caactacaag acccgcgccg aggtgaagtt cgagggcgac 360
accctggtga accgcatcga gctgaagggc atcgacttca aggaggacgg caacatcctg 420
gggcacaagc tggagtacaa ctacaacagc cacaacgtct atatcatggc cgacaagcag 480
aagaacggca tcaaggtgaa cttcaagatc cgccacaaca tcgaggacgg cagcgtgcag 540
ctcgccgacc actaccagca gaacaccccc atcggcgacg gccccgtgct gctgcccgac 600
aaccactacc tgagcaccca gtccgccctg agcaaagacc ccaacgagaa gcgcgatcac 660
atggtcctgc tggagttcgt gaccgccgcc gggatcactc tcggcatgga cgagctgtac 720
aagccaaaga aaaagagaaa ggttagccat ggctccggcg gcagcggggg agggctccat 780
atgggaaact ccgtggtcac atacaacacc aacatcgaca aactgtgcaa gagcggcaag 840
atcgaggagg ccctgaagct gttcaaggag atggaggaga agggcatcac ccccagcgtg 900
gtcacataca ccacactgat cgacggactg tgtaaagccg gcgacgtgga cgaagccctc 960
gagctgttca aagagatgcg gagcaagggc gtgaagccca acgtggtgac atacaccacc 1020
ctgatcgacg gcctgtgcaa ggccggcaaa gtggacgagg ccctggagct gttcgacgag 1080
atgaaggaga ggggcatcaa gcccgacgtg gtcacataca acaccctgat cgacggcctg 1140
tgcaagagcg gcaagatcga ggaggccctg aagctgttca aggagatgga ggagaagggc 1200
atcaccccca gcgtggttac atacaccaca ctgatcgacg gactgtgtaa agccggcgac 1260
gtggacgaag ccctcgagct gttcaaagag atgcggagca agggcgtgaa gcccaacgtg 1320
gtcacataca ccaccctgat cgacggcctg tgcaaggccg gcaaggtgga tgaggccctg 1380
gagctgttcg acgagatgaa ggagaggggc atcaagcccg acgtggttac atacaacacc 1440
ctgatcgacg gcctgtgcaa gagcggcaag atcgaggagg ccctgaagct gttcaaggag 1500
atggaggaga agggcatcac ccccagcgtg gtcacataca ccacactgat cgacggactg 1560
tgtaaagccg gcgacgtgga cgaagccctc gagctgttca aagagatgcg gagcaagggc 1620
gtgaagccca acgtggtgac atacaccacc ctgatcgacg gcctgtgcaa ggccggcaaa 1680
gtggacgagg ccctggagct gttcgacgag atgaaggaga ggggcatcaa gcccgacgtg 1740
gtcacataca acaccctgat cgacggcctg tgcaagagcg gcaagatcga ggaggccctg 1800
aagctgttca aggagatgga ggagaagggc atcaccccca gcgtggttac atacaccaca 1860
ctgatcgacg gactgtgtaa agccggcgac gtggacgaag ccctcgagct gttcaaagag 1920
atgcggagca agggcgtgaa gcccaacgtg gtcacataca ccaccctgat cgacggcctg 1980
tgcaaggccg gcaaggtgga tgaggccctg gagctgttcg acgagatgaa ggagaggggc 2040
atcaagcccg acgtggtcac atacaacacc ctgatcgacg gcctgtgcaa gagcggcaag 2100
atcgaggagg ccctgaagct gttcaaggag atggaggaga agggcatcac ccccagcgtg 2160
gtcacataca ccacactgat cgacggactg tgtaaagccg gcgacgtgga cgaagccctc 2220
gagctgttca aagagatgcg gagcaagggc gtgaagccca acgtggttac atacaccacc 2280
ctgatcgacg gcctgtgcaa ggccggcaaa gtggacgagg ccctggagct gttcgacgag 2340
atgaaggaga ggggcatcaa gcccgacgtg gtcacataca acaccctgat cgacggcctg 2400
tgcaagagcg gcaagatcga ggaggccctg aagctgttca aggagatgga ggagaagggc 2460
atcaccccca gcgtggtgac atacaccaca ctgatcgacg gactgtgtaa agccggcgac 2520
gtggacgaag ccctcgagct gttcaaagag atgcggagca agggcgtgaa gcccaacgtg 2580
gtcacataca ccaccctgat cgacggcctg tgcaaggccg gcaaggtgga tgaggccctg 2640
gagctgttcg acgagatgaa ggagaggggc atcaagcccg acgagctgac ctacaacacc 2700
ctgatcagcg gcctgggcaa ggccggcaga gccagagacc cccccgtgct cagtagcggg 2760
gactataagg accacgacgg agactacaag gatcatgata ttgattacaa agacgatgac 2820
gataagatgg ccggacgcta gmagvskgtg vvvdgdvngh ksvsgggdat ygktkcttgk 2880
vwtvtttygv csrydhmkhd ksamgyvrtk ddgnyktrav kgdtvnrkgd kdgnghkyny 2940
nshnvymadk kngkvnkrhn dgsvadhynt gdgvdnhyst saskdnkrdh mvvtaagtgm 3000
dykkkkrkvs hgsggsgggh mgnsvvtynt ndkcksgkak kmkgtsvvty ttdgckagdv 3060
dakmrskgvk nvvtyttdgc kagkvdadmk rgkdvvtynt dgcksgkakk mkgtsvvtyt 3120
tdgckagdvd akmrskgvkn vvtyttdgck agkvdadmkr gkdvvtyntd gcksgkakkm 3180
kgtsvvtytt dgckagdvda kmrskgvknv vtyttdgcka gkvdadmkrg kdvvtyntdg 3240
cksgkakkmk gtsvvtyttd gckagdvdak mrskgvknvv tyttdgckag kvdadmkrgk 3300
dvvtyntdgc ksgkakkmkg tsvvtyttdg ckagdvdakm rskgvknvvt yttdgckagk 3360
vdadmkrgkd vvtyntdgck sgkakkmkgt svvtyttdgc kagdvdakmr skgvknvvty 3420
ttdgckagkv dadmkrgkdt yntsggkagr ardvssgdyk dhdgdykdhd dykddddkma 3480
gr 3482
<210> 22
<211> 3482
<212> DNA
<213> Artificial sequence
<220>
<223> PPR vector
<220>
<221> misc_feature
<222> (2858)..(2858)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2914)..(2914)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2926)..(2926)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2934)..(2934)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2939)..(2939)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2941)..(2941)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2944)..(2944)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2952)..(2952)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2956)..(2956)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2960)..(2960)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2969)..(2969)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2976)..(2976)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2986)..(2986)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3023)..(3023)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3029)..(3029)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3071)..(3071)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3099)..(3099)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3140)..(3140)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3168)..(3168)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3209)..(3209)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3237)..(3237)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3278)..(3278)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3306)..(3306)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3347)..(3347)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3375)..(3375)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3416)..(3416)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3442)..(3442)
<223> n is a, c, g, t or u
<400> 22
atggccggag tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat cctggtcgag 60
ctggacggcg acgtaaacgg ccacaagttc agcgtgtccg gcgagggcga gggcgatgcc 120
acctacggca agctgaccct gaagttcatc tgcaccaccg gcaagctgcc cgtgccctgg 180
cccaccctcg tgaccaccct gacctacggc gtgcagtgct tcagccgcta ccccgaccac 240
atgaagcagc acgacttctt caagtccgcc atgcccgaag gctacgtcca ggagcgcacc 300
atcttcttca aggacgacgg caactacaag acccgcgccg aggtgaagtt cgagggcgac 360
accctggtga accgcatcga gctgaagggc atcgacttca aggaggacgg caacatcctg 420
gggcacaagc tggagtacaa ctacaacagc cacaacgtct atatcatggc cgacaagcag 480
aagaacggca tcaaggtgaa cttcaagatc cgccacaaca tcgaggacgg cagcgtgcag 540
ctcgccgacc actaccagca gaacaccccc atcggcgacg gccccgtgct gctgcccgac 600
aaccactacc tgagcaccca gtccgccctg agcaaagacc ccaacgagaa gcgcgatcac 660
atggtcctgc tggagttcgt gaccgccgcc gggatcactc tcggcatgga cgagctgtac 720
aagccaaaga aaaagagaaa ggttagccat ggctccggcg gcagcggggg agggctccat 780
atgggaaact ccgtggtcac atacaacacc gatatcgacg gcctgtgcaa gagcggcaag 840
atcgaggagg ccctgaagct gttcaaggag atggaggaga agggcatcac ccccagcgtg 900
gtcacataca ccacactgat cgacggactg tgtaaagccg gcgacgtgga cgaagccctc 960
gagctgttca aagagatgcg gagcaagggc gtgaagccca acgtggtgac atacaccacc 1020
ctgatcgacg gcctgtgcaa ggccggcaaa gtggacgagg ccctggagct gttcgacgag 1080
atgaaggaga ggggcatcaa gcccgacgtg gtcacataca acaccctgat cgacggcctg 1140
tgcaagagcg gcaagatcga ggaggccctg aagctgttca aggagatgga ggagaagggc 1200
atcaccccca gcgtggttac atacaccaca ctgatcgacg gactgtgtaa agccggcgac 1260
gtggacgaag ccctcgagct gttcaaagag atgcggagca agggcgtgaa gcccaacgtg 1320
gtcacataca ccaccctgat cgacggcctg tgcaaggccg gcaaggtgga tgaggccctg 1380
gagctgttcg acgagatgaa ggagaggggc atcaagcccg acgtggttac atacaacacc 1440
ctgatcgacg gcctgtgcaa gagcggcaag atcgaggagg ccctgaagct gttcaaggag 1500
atggaggaga agggcatcac ccccagcgtg gtcacataca ccacactgat cgacggactg 1560
tgtaaagccg gcgacgtgga cgaagccctc gagctgttca aagagatgcg gagcaagggc 1620
gtgaagccca acgtggtgac atacaccacc ctgatcgacg gcctgtgcaa ggccggcaaa 1680
gtggacgagg ccctggagct gttcgacgag atgaaggaga ggggcatcaa gcccgacgtg 1740
gtcacataca acaccctgat cgacggcctg tgcaagagcg gcaagatcga ggaggccctg 1800
aagctgttca aggagatgga ggagaagggc atcaccccca gcgtggttac atacaccaca 1860
ctgatcgacg gactgtgtaa agccggcgac gtggacgaag ccctcgagct gttcaaagag 1920
atgcggagca agggcgtgaa gcccaacgtg gtcacataca ccaccctgat cgacggcctg 1980
tgcaaggccg gcaaggtgga tgaggccctg gagctgttcg acgagatgaa ggagaggggc 2040
atcaagcccg acgtggtcac atacaacacc ctgatcgacg gcctgtgcaa gagcggcaag 2100
atcgaggagg ccctgaagct gttcaaggag atggaggaga agggcatcac ccccagcgtg 2160
gtcacataca ccacactgat cgacggactg tgtaaagccg gcgacgtgga cgaagccctc 2220
gagctgttca aagagatgcg gagcaagggc gtgaagccca acgtggttac atacaccacc 2280
ctgatcgacg gcctgtgcaa ggccggcaaa gtggacgagg ccctggagct gttcgacgag 2340
atgaaggaga ggggcatcaa gcccgacgtg gtcacataca acaccctgat cgacggcctg 2400
tgcaagagcg gcaagatcga ggaggccctg aagctgttca aggagatgga ggagaagggc 2460
atcaccccca gcgtggtgac atacaccaca ctgatcgacg gactgtgtaa agccggcgac 2520
gtggacgaag ccctcgagct gttcaaagag atgcggagca agggcgtgaa gcccaacgtg 2580
gtcacataca ccaccctgat cgacggcctg tgcaaggccg gcaaggtgga tgaggccctg 2640
gagctgttcg acgagatgaa ggagaggggc atcaagcccg acgagctgac ctacaacacc 2700
ctgatcagcg gcctgggcaa ggccggcaga gccagagacc cccccgtgct cagtagcggg 2760
gactataagg accacgacgg agactacaag gatcatgata ttgattacaa agacgatgac 2820
gataagatgg ccggacgcta gmagvskgtg vvvdgdvngh ksvsgggdat ygktkcttgk 2880
vwtvtttygv csrydhmkhd ksamgyvrtk ddgnyktrav kgdtvnrkgd kdgnghkyny 2940
nshnvymadk kngkvnkrhn dgsvadhynt gdgvdnhyst saskdnkrdh mvvtaagtgm 3000
dykkkkrkvs hgsggsgggh mgnsvvtynt ddgcksgkak kmkgtsvvty ttdgckagdv 3060
dakmrskgvk nvvtyttdgc kagkvdadmk rgkdvvtynt dgcksgkakk mkgtsvvtyt 3120
tdgckagdvd akmrskgvkn vvtyttdgck agkvdadmkr gkdvvtyntd gcksgkakkm 3180
kgtsvvtytt dgckagdvda kmrskgvknv vtyttdgcka gkvdadmkrg kdvvtyntdg 3240
cksgkakkmk gtsvvtyttd gckagdvdak mrskgvknvv tyttdgckag kvdadmkrgk 3300
dvvtyntdgc ksgkakkmkg tsvvtyttdg ckagdvdakm rskgvknvvt yttdgckagk 3360
vdadmkrgkd vvtyntdgck sgkakkmkgt svvtyttdgc kagdvdakmr skgvknvvty 3420
ttdgckagkv dadmkrgkdt yntsggkagr ardvssgdyk dhdgdykdhd dykddddkma 3480
gr 3482
<210> 23
<211> 3551
<212> DNA
<213> Artificial sequence
<220>
<223> PPR vector
<220>
<221> misc_feature
<222> (2912)..(2912)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2925)..(2925)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2982)..(2982)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2990)..(2990)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2995)..(2996)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3007)..(3007)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3011)..(3011)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3015)..(3015)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3025)..(3025)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3032)..(3032)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3042)..(3042)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3066)..(3066)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3072)..(3072)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3113)..(3113)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3141)..(3141)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3182)..(3182)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3210)..(3210)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3251)..(3251)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3279)..(3279)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3320)..(3320)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3348)..(3348)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3389)..(3389)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3417)..(3417)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3458)..(3458)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3484)..(3484)
<223> n is a, c, g, t or u
<400> 23
atggccggag tgtccaaagg cgaggagctg tttaccggcg tcgtgcctat tctggtggag 60
ctggacggcg acgtgaacgg ccacaagttc tccgtgaggg gcgagggcga aggcgatgcc 120
acaaacggca agctgaccct caagttcatc tgcaccactg gtaaactgcc cgttccttgg 180
cccacactgg tgaccacctt cggctacggc gtggcttgtt tctctcgtta ccccgaccat 240
atgaagcagc acgacttctt caagtccgcc atgcccgagg gatacgtgca agaaaggacc 300
atctccttca aggacgatgg cacctacaag accagagccg aggtgaagtt cgagggcgac 360
acactggtga atcgtatcga actgaagggc atcgacttca aagaggacgg caacattctg 420
ggccacaagc tggagtacaa cttcaacagc cactacgtgt acatcaccgc cgataagcag 480
aagaactgca tcaaggccaa cttcaagatt cgtcacaacg tggaggatgg ctccgtgcag 540
ctggccgatc actaccagca gaacacaccc atcggcgatg gacccgtttt actgcccgac 600
aaccactatt taagccacca gagcaagctg tccaaggacc ccaacgagaa gcgtgatcat 660
atggtgctgc tcgagtttgt gaccgccgcc ggcatcaccc atggaatgga cgagctgtac 720
aagagccggc tccatatggg aaactccgtg gtcacataca acaccctgat cgacggcctg 780
tgcaagagcg gcaagatcga ggaggccctg aagctgttca aggagatgga ggagaagggc 840
atcaccccca gcgtggtcac atacaccaca ctgatcgacg gactgtgtaa agccggcgac 900
gtggacgaag ccctcgagct gttcaaagag atgcggagca agggcgtgaa gcccaacgtg 960
gtgacataca ccaccctgat cgacggcctg tgcaaggccg gcaaagtgga cgaggccctg 1020
gagctgttcg acgagatgaa ggagaggggc atcaagcccg acgtggtcac atacaacacc 1080
ctgatcgacg gcctgtgcaa gagcggcaag atcgaggagg ccctgaagct gttcaaggag 1140
atggaggaga agggcatcac ccccagcgtg gttacataca ccacactgat cgacggactg 1200
tgtaaagccg gcgacgtgga cgaagccctc gagctgttca aagagatgcg gagcaagggc 1260
gtgaagccca acgtggtcac atacaccacc ctgatcgacg gcctgtgcaa ggccggcaag 1320
gtggatgagg ccctggagct gttcgacgag atgaaggaga ggggcatcaa gcccgacgtg 1380
gttacataca acaccctgat cgacggcctg tgcaagagcg gcaagatcga ggaggccctg 1440
aagctgttca aggagatgga ggagaagggc atcaccccca gcgtggtcac atacaccaca 1500
ctgatcgacg gactgtgtaa agccggcgac gtggacgaag ccctcgagct gttcaaagag 1560
atgcggagca agggcgtgaa gcccaacgtg gtgacataca ccaccctgat cgacggcctg 1620
tgcaaggccg gcaaagtgga cgaggccctg gagctgttcg acgagatgaa ggagaggggc 1680
atcaagcccg acgtggtcac atacaacacc ctgatcgacg gcctgtgcaa gagcggcaag 1740
atcgaggagg ccctgaagct gttcaaggag atggaggaga agggcatcac ccccagcgtg 1800
gttacataca ccacactgat cgacggactg tgtaaagccg gcgacgtgga cgaagccctc 1860
gagctgttca aagagatgcg gagcaagggc gtgaagccca acgtggtcac atacaccacc 1920
ctgatcgacg gcctgtgcaa ggccggcaag gtggatgagg ccctggagct gttcgacgag 1980
atgaaggaga ggggcatcaa gcccgacgtg gtcacataca acaccctgat cgacggcctg 2040
tgcaagagcg gcaagatcga ggaggccctg aagctgttca aggagatgga ggagaagggc 2100
atcaccccca gcgtggtcac atacaccaca ctgatcgacg gactgtgtaa agccggcgac 2160
gtggacgaag ccctcgagct gttcaaagag atgcggagca agggcgtgaa gcccaacgtg 2220
gttacataca ccaccctgat cgacggcctg tgcaaggccg gcaaagtgga cgaggccctg 2280
gagctgttcg acgagatgaa ggagaggggc atcaagcccg acgtggtcac atacaacacc 2340
ctgatcgacg gcctgtgcaa gagcggcaag atcgaggagg ccctgaagct gttcaaggag 2400
atggaggaga agggcatcac ccccagcgtg gtgacataca ccacactgat cgacggactg 2460
tgtaaagccg gcgacgtgga cgaagccctc gagctgttca aagagatgcg gagcaagggc 2520
gtgaagccca acgtggtcac atacaccacc ctgatcgacg gcctgtgcaa ggccggcaag 2580
gtggatgagg ccctggagct gttcgacgag atgaaggaga ggggcatcaa gcccgacgag 2640
ctgacctaca acaccctgat cagcggcctg ggcaaggccg gcagagccag agaccccccc 2700
gtgctcagta gccccaagaa gaaacgcaaa gtcgaggatc caaagaagaa aaggaaggtt 2760
gaagacccca agaaaaagag gaaggtgggt tccgactata aggaccacga cggagactac 2820
aaggatcatg atattgatta caaagacgat gacgataaga tggccccaaa gaagaagcgg 2880
aaggtcggac gctagmagvs kgtgvvvdgd vnghksvrgg gdatngktkc ttgkvwtvtt 2940
gygvacsryd hmkhdksamg yvrtskddgt yktravkgdt vnrkgdkdgn ghkynnshyv 3000
ytadkkncka nkrhnvdgsv adhyntgdgv dnhyshsksk dnkrdhmvvt aagthgmdyk 3060
srhmgnsvvt yntdgcksgk akkmkgtsvv tyttdgckag dvdakmrskg vknvvtyttd 3120
gckagkvdad mkrgkdvvty ntdgcksgka kkmkgtsvvt yttdgckagd vdakmrskgv 3180
knvvtyttdg ckagkvdadm krgkdvvtyn tdgcksgkak kmkgtsvvty ttdgckagdv 3240
dakmrskgvk nvvtyttdgc kagkvdadmk rgkdvvtynt dgcksgkakk mkgtsvvtyt 3300
tdgckagdvd akmrskgvkn vvtyttdgck agkvdadmkr gkdvvtyntd gcksgkakkm 3360
kgtsvvtytt dgckagdvda kmrskgvknv vtyttdgcka gkvdadmkrg kdvvtyntdg 3420
cksgkakkmk gtsvvtyttd gckagdvdak mrskgvknvv tyttdgckag kvdadmkrgk 3480
dtyntsggka grardvsskk krkvdkkkrk vdkkkrkvgs dykdhdgdyk dhddykdddd 3540
kmakkkrkvg r 3551
<210> 24
<211> 3550
<212> DNA
<213> Artificial sequence
<220>
<223> PPR vector
<220>
<221> misc_feature
<222> (2912)..(2912)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2925)..(2925)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2982)..(2982)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2990)..(2990)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2995)..(2996)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3007)..(3007)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3011)..(3011)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3015)..(3015)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3025)..(3025)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3032)..(3032)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3042)..(3042)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3066)..(3066)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3072)..(3072)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3112)..(3112)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3140)..(3140)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3181)..(3181)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3209)..(3209)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3250)..(3250)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3278)..(3278)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3319)..(3319)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3347)..(3347)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3388)..(3388)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3416)..(3416)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3457)..(3457)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3483)..(3483)
<223> n is a, c, g, t or u
<400> 24
atggccggag tgtccaaagg cgaggagctg tttaccggcg tcgtgcctat tctggtggag 60
ctggacggcg acgtgaacgg ccacaagttc tccgtgaggg gcgagggcga aggcgatgcc 120
acaaacggca agctgaccct caagttcatc tgcaccactg gtaaactgcc cgttccttgg 180
cccacactgg tgaccacctt cggctacggc gtggcttgtt tctctcgtta ccccgaccat 240
atgaagcagc acgacttctt caagtccgcc atgcccgagg gatacgtgca agaaaggacc 300
atctccttca aggacgatgg cacctacaag accagagccg aggtgaagtt cgagggcgac 360
acactggtga atcgtatcga actgaagggc atcgacttca aagaggacgg caacattctg 420
ggccacaagc tggagtacaa cttcaacagc cactacgtgt acatcaccgc cgataagcag 480
aagaactgca tcaaggccaa cttcaagatt cgtcacaacg tggaggatgg ctccgtgcag 540
ctggccgatc actaccagca gaacacaccc atcggcgatg gacccgtttt actgcccgac 600
aaccactatt taagccacca gagcaagctg tccaaggacc ccaacgagaa gcgtgatcat 660
atggtgctgc tcgagtttgt gaccgccgcc ggcatcaccc atggaatgga cgagctgtac 720
aagagccggc tccatatggg aaactccgtg gtcacataca acaccctgat cgacgaactg 780
tgcaagagcg gcaagatcga ggaggccctg aagctgttca aggagatgga ggagaagggc 840
atcaccccca gcgtggtcac atacaccaca ctgatcgacg gactgtgtaa agccggcgac 900
gtggacgaag ccctcgagct gttcaaagag atgcggagca agggcgtgaa gcccaacgtg 960
gtgacataca ccaccctgat cgacggcctg tgcaaggccg gcaaagtgga cgaggccctg 1020
gagctgttcg acgagatgaa ggagaggggc atcaagcccg acgtggtcac atacaacacc 1080
ctgatcgacg gcctgtgcaa gagcggcaag atcgaggagg ccctgaagct gttcaaggag 1140
atggaggaga agggcatcac ccccagcgtg gttacataca ccacactgat cgacggactg 1200
tgtaaagccg gcgacgtgga cgaagccctc gagctgttca aagagatgcg gagcaagggc 1260
gtgaagccca acgtggtcac atacaccacc ctgatcgacg gcctgtgcaa ggccggcaag 1320
gtggatgagg ccctggagct gttcgacgag atgaaggaga ggggcatcaa gcccgacgtg 1380
gttacataca acaccctgat cgacggcctg tgcaagagcg gcaagatcga ggaggccctg 1440
aagctgttca aggagatgga ggagaagggc atcaccccca gcgtggtcac atacaccaca 1500
ctgatcgacg gactgtgtaa agccggcgac gtggacgaag ccctcgagct gttcaaagag 1560
atgcggagca agggcgtgaa gcccaacgtg gtgacataca ccaccctgat cgacggcctg 1620
tgcaaggccg gcaaagtgga cgaggccctg gagctgttcg acgagatgaa ggagaggggc 1680
atcaagcccg acgtggtcac atacaacacc ctgatcgacg gcctgtgcaa gagcggcaag 1740
atcgaggagg ccctgaagct gttcaaggag atggaggaga agggcatcac ccccagcgtg 1800
gttacataca ccacactgat cgacggactg tgtaaagccg gcgacgtgga cgaagccctc 1860
gagctgttca aagagatgcg gagcaagggc gtgaagccca acgtggtcac atacaccacc 1920
ctgatcgacg gcctgtgcaa ggccggcaag gtggatgagg ccctggagct gttcgacgag 1980
atgaaggaga ggggcatcaa gcccgacgtg gtcacataca acaccctgat cgacggcctg 2040
tgcaagagcg gcaagatcga ggaggccctg aagctgttca aggagatgga ggagaagggc 2100
atcaccccca gcgtggtcac atacaccaca ctgatcgacg gactgtgtaa agccggcgac 2160
gtggacgaag ccctcgagct gttcaaagag atgcggagca agggcgtgaa gcccaacgtg 2220
gttacataca ccaccctgat cgacggcctg tgcaaggccg gcaaagtgga cgaggccctg 2280
gagctgttcg acgagatgaa ggagaggggc atcaagcccg acgtggtcac atacaacacc 2340
ctgatcgacg gcctgtgcaa gagcggcaag atcgaggagg ccctgaagct gttcaaggag 2400
atggaggaga agggcatcac ccccagcgtg gtgacataca ccacactgat cgacggactg 2460
tgtaaagccg gcgacgtgga cgaagccctc gagctgttca aagagatgcg gagcaagggc 2520
gtgaagccca acgtggtcac atacaccacc ctgatcgacg gcctgtgcaa ggccggcaag 2580
gtggatgagg ccctggagct gttcgacgag atgaaggaga ggggcatcaa gcccgacgag 2640
ctgacctaca acaccctgat cagcggcctg ggcaaggccg gcagagccag agaccccccc 2700
gtgctcagta gccccaagaa gaaacgcaaa gtcgaggatc caaagaagaa aaggaaggtt 2760
gaagacccca agaaaaagag gaaggtgggt tccgactata aggaccacga cggagactac 2820
aaggatcatg atattgatta caaagacgat gacgataaga tggccccaaa gaagaagcgg 2880
aaggtcggac gctagmagvs kgtgvvvdgd vnghksvrgg gdatngktkc ttgkvwtvtt 2940
gygvacsryd hmkhdksamg yvrtskddgt yktravkgdt vnrkgdkdgn ghkynnshyv 3000
ytadkkncka nkrhnvdgsv adhyntgdgv dnhyshsksk dnkrdhmvvt aagthgmdyk 3060
srhmgnsvvt yntdcksgka kkmkgtsvvt yttdgckagd vdakmrskgv knvvtyttdg 3120
ckagkvdadm krgkdvvtyn tdgcksgkak kmkgtsvvty ttdgckagdv dakmrskgvk 3180
nvvtyttdgc kagkvdadmk rgkdvvtynt dgcksgkakk mkgtsvvtyt tdgckagdvd 3240
akmrskgvkn vvtyttdgck agkvdadmkr gkdvvtyntd gcksgkakkm kgtsvvtytt 3300
dgckagdvda kmrskgvknv vtyttdgcka gkvdadmkrg kdvvtyntdg cksgkakkmk 3360
gtsvvtyttd gckagdvdak mrskgvknvv tyttdgckag kvdadmkrgk dvvtyntdgc 3420
ksgkakkmkg tsvvtyttdg ckagdvdakm rskgvknvvt yttdgckagk vdadmkrgkd 3480
tyntsggkag rardvsskkk rkvdkkkrkv dkkkrkvgsd ykdhdgdykd hddykddddk 3540
makkkrkvgr 3550
<210> 25
<211> 3551
<212> DNA
<213> Artificial sequence
<220>
<223> PPR vector
<220>
<221> misc_feature
<222> (2912)..(2912)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2925)..(2925)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2982)..(2982)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2990)..(2990)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2995)..(2996)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3007)..(3007)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3011)..(3011)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3015)..(3015)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3025)..(3025)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3032)..(3032)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3042)..(3042)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3066)..(3066)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3072)..(3072)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3074)..(3074)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3113)..(3113)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3141)..(3141)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3182)..(3182)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3210)..(3210)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3251)..(3251)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3279)..(3279)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3320)..(3320)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3348)..(3348)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3389)..(3389)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3417)..(3417)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3458)..(3458)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3484)..(3484)
<223> n is a, c, g, t or u
<400> 25
atggccggag tgtccaaagg cgaggagctg tttaccggcg tcgtgcctat tctggtggag 60
ctggacggcg acgtgaacgg ccacaagttc tccgtgaggg gcgagggcga aggcgatgcc 120
acaaacggca agctgaccct caagttcatc tgcaccactg gtaaactgcc cgttccttgg 180
cccacactgg tgaccacctt cggctacggc gtggcttgtt tctctcgtta ccccgaccat 240
atgaagcagc acgacttctt caagtccgcc atgcccgagg gatacgtgca agaaaggacc 300
atctccttca aggacgatgg cacctacaag accagagccg aggtgaagtt cgagggcgac 360
acactggtga atcgtatcga actgaagggc atcgacttca aagaggacgg caacattctg 420
ggccacaagc tggagtacaa cttcaacagc cactacgtgt acatcaccgc cgataagcag 480
aagaactgca tcaaggccaa cttcaagatt cgtcacaacg tggaggatgg ctccgtgcag 540
ctggccgatc actaccagca gaacacaccc atcggcgatg gacccgtttt actgcccgac 600
aaccactatt taagccacca gagcaagctg tccaaggacc ccaacgagaa gcgtgatcat 660
atggtgctgc tcgagtttgt gaccgccgcc ggcatcaccc atggaatgga cgagctgtac 720
aagagccggc tccatatggg aaactccgtg gtcacataca acaccaacat cgaccagctg 780
tgcaagagcg gcaagatcga ggaggccctg aagctgttca aggagatgga ggagaagggc 840
atcaccccca gcgtggtcac atacaccaca ctgatcgacg gactgtgtaa agccggcgac 900
gtggacgaag ccctcgagct gttcaaagag atgcggagca agggcgtgaa gcccaacgtg 960
gtgacataca ccaccctgat cgacggcctg tgcaaggccg gcaaagtgga cgaggccctg 1020
gagctgttcg acgagatgaa ggagaggggc atcaagcccg acgtggtcac atacaacacc 1080
ctgatcgacg gcctgtgcaa gagcggcaag atcgaggagg ccctgaagct gttcaaggag 1140
atggaggaga agggcatcac ccccagcgtg gttacataca ccacactgat cgacggactg 1200
tgtaaagccg gcgacgtgga cgaagccctc gagctgttca aagagatgcg gagcaagggc 1260
gtgaagccca acgtggtcac atacaccacc ctgatcgacg gcctgtgcaa ggccggcaag 1320
gtggatgagg ccctggagct gttcgacgag atgaaggaga ggggcatcaa gcccgacgtg 1380
gttacataca acaccctgat cgacggcctg tgcaagagcg gcaagatcga ggaggccctg 1440
aagctgttca aggagatgga ggagaagggc atcaccccca gcgtggtcac atacaccaca 1500
ctgatcgacg gactgtgtaa agccggcgac gtggacgaag ccctcgagct gttcaaagag 1560
atgcggagca agggcgtgaa gcccaacgtg gtgacataca ccaccctgat cgacggcctg 1620
tgcaaggccg gcaaagtgga cgaggccctg gagctgttcg acgagatgaa ggagaggggc 1680
atcaagcccg acgtggtcac atacaacacc ctgatcgacg gcctgtgcaa gagcggcaag 1740
atcgaggagg ccctgaagct gttcaaggag atggaggaga agggcatcac ccccagcgtg 1800
gttacataca ccacactgat cgacggactg tgtaaagccg gcgacgtgga cgaagccctc 1860
gagctgttca aagagatgcg gagcaagggc gtgaagccca acgtggtcac atacaccacc 1920
ctgatcgacg gcctgtgcaa ggccggcaag gtggatgagg ccctggagct gttcgacgag 1980
atgaaggaga ggggcatcaa gcccgacgtg gtcacataca acaccctgat cgacggcctg 2040
tgcaagagcg gcaagatcga ggaggccctg aagctgttca aggagatgga ggagaagggc 2100
atcaccccca gcgtggtcac atacaccaca ctgatcgacg gactgtgtaa agccggcgac 2160
gtggacgaag ccctcgagct gttcaaagag atgcggagca agggcgtgaa gcccaacgtg 2220
gttacataca ccaccctgat cgacggcctg tgcaaggccg gcaaagtgga cgaggccctg 2280
gagctgttcg acgagatgaa ggagaggggc atcaagcccg acgtggtcac atacaacacc 2340
ctgatcgacg gcctgtgcaa gagcggcaag atcgaggagg ccctgaagct gttcaaggag 2400
atggaggaga agggcatcac ccccagcgtg gtgacataca ccacactgat cgacggactg 2460
tgtaaagccg gcgacgtgga cgaagccctc gagctgttca aagagatgcg gagcaagggc 2520
gtgaagccca acgtggtcac atacaccacc ctgatcgacg gcctgtgcaa ggccggcaag 2580
gtggatgagg ccctggagct gttcgacgag atgaaggaga ggggcatcaa gcccgacgag 2640
ctgacctaca acaccctgat cagcggcctg ggcaaggccg gcagagccag agaccccccc 2700
gtgctcagta gccccaagaa gaaacgcaaa gtcgaggatc caaagaagaa aaggaaggtt 2760
gaagacccca agaaaaagag gaaggtgggt tccgactata aggaccacga cggagactac 2820
aaggatcatg atattgatta caaagacgat gacgataaga tggccccaaa gaagaagcgg 2880
aaggtcggac gctagmagvs kgtgvvvdgd vnghksvrgg gdatngktkc ttgkvwtvtt 2940
gygvacsryd hmkhdksamg yvrtskddgt yktravkgdt vnrkgdkdgn ghkynnshyv 3000
ytadkkncka nkrhnvdgsv adhyntgdgv dnhyshsksk dnkrdhmvvt aagthgmdyk 3060
srhmgnsvvt yntndcksgk akkmkgtsvv tyttdgckag dvdakmrskg vknvvtyttd 3120
gckagkvdad mkrgkdvvty ntdgcksgka kkmkgtsvvt yttdgckagd vdakmrskgv 3180
knvvtyttdg ckagkvdadm krgkdvvtyn tdgcksgkak kmkgtsvvty ttdgckagdv 3240
dakmrskgvk nvvtyttdgc kagkvdadmk rgkdvvtynt dgcksgkakk mkgtsvvtyt 3300
tdgckagdvd akmrskgvkn vvtyttdgck agkvdadmkr gkdvvtyntd gcksgkakkm 3360
kgtsvvtytt dgckagdvda kmrskgvknv vtyttdgcka gkvdadmkrg kdvvtyntdg 3420
cksgkakkmk gtsvvtyttd gckagdvdak mrskgvknvv tyttdgckag kvdadmkrgk 3480
dtyntsggka grardvsskk krkvdkkkrk vdkkkrkvgs dykdhdgdyk dhddykdddd 3540
kmakkkrkvg r 3551
<210> 26
<211> 3551
<212> DNA
<213> Artificial sequence
<220>
<223> PPR vector
<220>
<221> misc_feature
<222> (2912)..(2912)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2925)..(2925)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2982)..(2982)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2990)..(2990)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2995)..(2996)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3007)..(3007)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3011)..(3011)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3015)..(3015)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3025)..(3025)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3032)..(3032)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3042)..(3042)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3066)..(3066)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3072)..(3072)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3074)..(3074)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3113)..(3113)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3141)..(3141)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3182)..(3182)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3210)..(3210)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3251)..(3251)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3279)..(3279)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3320)..(3320)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3348)..(3348)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3389)..(3389)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3417)..(3417)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3458)..(3458)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3484)..(3484)
<223> n is a, c, g, t or u
<400> 26
atggccggag tgtccaaagg cgaggagctg tttaccggcg tcgtgcctat tctggtggag 60
ctggacggcg acgtgaacgg ccacaagttc tccgtgaggg gcgagggcga aggcgatgcc 120
acaaacggca agctgaccct caagttcatc tgcaccactg gtaaactgcc cgttccttgg 180
cccacactgg tgaccacctt cggctacggc gtggcttgtt tctctcgtta ccccgaccat 240
atgaagcagc acgacttctt caagtccgcc atgcccgagg gatacgtgca agaaaggacc 300
atctccttca aggacgatgg cacctacaag accagagccg aggtgaagtt cgagggcgac 360
acactggtga atcgtatcga actgaagggc atcgacttca aagaggacgg caacattctg 420
ggccacaagc tggagtacaa cttcaacagc cactacgtgt acatcaccgc cgataagcag 480
aagaactgca tcaaggccaa cttcaagatt cgtcacaacg tggaggatgg ctccgtgcag 540
ctggccgatc actaccagca gaacacaccc atcggcgatg gacccgtttt actgcccgac 600
aaccactatt taagccacca gagcaagctg tccaaggacc ccaacgagaa gcgtgatcat 660
atggtgctgc tcgagtttgt gaccgccgcc ggcatcaccc atggaatgga cgagctgtac 720
aagagccggc tccatatggg aaactccgtg gtcacataca acaccaacat cgacgaactg 780
tgcaagagcg gcaagatcga ggaggccctg aagctgttca aggagatgga ggagaagggc 840
atcaccccca gcgtggtcac atacaccaca ctgatcgacg gactgtgtaa agccggcgac 900
gtggacgaag ccctcgagct gttcaaagag atgcggagca agggcgtgaa gcccaacgtg 960
gtgacataca ccaccctgat cgacggcctg tgcaaggccg gcaaagtgga cgaggccctg 1020
gagctgttcg acgagatgaa ggagaggggc atcaagcccg acgtggtcac atacaacacc 1080
ctgatcgacg gcctgtgcaa gagcggcaag atcgaggagg ccctgaagct gttcaaggag 1140
atggaggaga agggcatcac ccccagcgtg gttacataca ccacactgat cgacggactg 1200
tgtaaagccg gcgacgtgga cgaagccctc gagctgttca aagagatgcg gagcaagggc 1260
gtgaagccca acgtggtcac atacaccacc ctgatcgacg gcctgtgcaa ggccggcaag 1320
gtggatgagg ccctggagct gttcgacgag atgaaggaga ggggcatcaa gcccgacgtg 1380
gttacataca acaccctgat cgacggcctg tgcaagagcg gcaagatcga ggaggccctg 1440
aagctgttca aggagatgga ggagaagggc atcaccccca gcgtggtcac atacaccaca 1500
ctgatcgacg gactgtgtaa agccggcgac gtggacgaag ccctcgagct gttcaaagag 1560
atgcggagca agggcgtgaa gcccaacgtg gtgacataca ccaccctgat cgacggcctg 1620
tgcaaggccg gcaaagtgga cgaggccctg gagctgttcg acgagatgaa ggagaggggc 1680
atcaagcccg acgtggtcac atacaacacc ctgatcgacg gcctgtgcaa gagcggcaag 1740
atcgaggagg ccctgaagct gttcaaggag atggaggaga agggcatcac ccccagcgtg 1800
gttacataca ccacactgat cgacggactg tgtaaagccg gcgacgtgga cgaagccctc 1860
gagctgttca aagagatgcg gagcaagggc gtgaagccca acgtggtcac atacaccacc 1920
ctgatcgacg gcctgtgcaa ggccggcaag gtggatgagg ccctggagct gttcgacgag 1980
atgaaggaga ggggcatcaa gcccgacgtg gtcacataca acaccctgat cgacggcctg 2040
tgcaagagcg gcaagatcga ggaggccctg aagctgttca aggagatgga ggagaagggc 2100
atcaccccca gcgtggtcac atacaccaca ctgatcgacg gactgtgtaa agccggcgac 2160
gtggacgaag ccctcgagct gttcaaagag atgcggagca agggcgtgaa gcccaacgtg 2220
gttacataca ccaccctgat cgacggcctg tgcaaggccg gcaaagtgga cgaggccctg 2280
gagctgttcg acgagatgaa ggagaggggc atcaagcccg acgtggtcac atacaacacc 2340
ctgatcgacg gcctgtgcaa gagcggcaag atcgaggagg ccctgaagct gttcaaggag 2400
atggaggaga agggcatcac ccccagcgtg gtgacataca ccacactgat cgacggactg 2460
tgtaaagccg gcgacgtgga cgaagccctc gagctgttca aagagatgcg gagcaagggc 2520
gtgaagccca acgtggtcac atacaccacc ctgatcgacg gcctgtgcaa ggccggcaag 2580
gtggatgagg ccctggagct gttcgacgag atgaaggaga ggggcatcaa gcccgacgag 2640
ctgacctaca acaccctgat cagcggcctg ggcaaggccg gcagagccag agaccccccc 2700
gtgctcagta gccccaagaa gaaacgcaaa gtcgaggatc caaagaagaa aaggaaggtt 2760
gaagacccca agaaaaagag gaaggtgggt tccgactata aggaccacga cggagactac 2820
aaggatcatg atattgatta caaagacgat gacgataaga tggccccaaa gaagaagcgg 2880
aaggtcggac gctagmagvs kgtgvvvdgd vnghksvrgg gdatngktkc ttgkvwtvtt 2940
gygvacsryd hmkhdksamg yvrtskddgt yktravkgdt vnrkgdkdgn ghkynnshyv 3000
ytadkkncka nkrhnvdgsv adhyntgdgv dnhyshsksk dnkrdhmvvt aagthgmdyk 3060
srhmgnsvvt yntndcksgk akkmkgtsvv tyttdgckag dvdakmrskg vknvvtyttd 3120
gckagkvdad mkrgkdvvty ntdgcksgka kkmkgtsvvt yttdgckagd vdakmrskgv 3180
knvvtyttdg ckagkvdadm krgkdvvtyn tdgcksgkak kmkgtsvvty ttdgckagdv 3240
dakmrskgvk nvvtyttdgc kagkvdadmk rgkdvvtynt dgcksgkakk mkgtsvvtyt 3300
tdgckagdvd akmrskgvkn vvtyttdgck agkvdadmkr gkdvvtyntd gcksgkakkm 3360
kgtsvvtytt dgckagdvda kmrskgvknv vtyttdgcka gkvdadmkrg kdvvtyntdg 3420
cksgkakkmk gtsvvtyttd gckagdvdak mrskgvknvv tyttdgckag kvdadmkrgk 3480
dtyntsggka grardvsskk krkvdkkkrk vdkkkrkvgs dykdhdgdyk dhddykdddd 3540
kmakkkrkvg r 3551
<210> 27
<211> 3552
<212> DNA
<213> Artificial sequence
<220>
<223> PPR vector
<220>
<221> misc_feature
<222> (2912)..(2912)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2925)..(2925)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2982)..(2982)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2990)..(2990)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2995)..(2996)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3007)..(3007)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3011)..(3011)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3015)..(3015)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3025)..(3025)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3032)..(3032)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3042)..(3042)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3066)..(3066)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3072)..(3072)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3074)..(3074)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3114)..(3114)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3142)..(3142)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3183)..(3183)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3211)..(3211)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3252)..(3252)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3280)..(3280)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3321)..(3321)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3349)..(3349)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3390)..(3390)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3418)..(3418)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3459)..(3459)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3485)..(3485)
<223> n is a, c, g, t or u
<400> 27
atggccggag tgtccaaagg cgaggagctg tttaccggcg tcgtgcctat tctggtggag 60
ctggacggcg acgtgaacgg ccacaagttc tccgtgaggg gcgagggcga aggcgatgcc 120
acaaacggca agctgaccct caagttcatc tgcaccactg gtaaactgcc cgttccttgg 180
cccacactgg tgaccacctt cggctacggc gtggcttgtt tctctcgtta ccccgaccat 240
atgaagcagc acgacttctt caagtccgcc atgcccgagg gatacgtgca agaaaggacc 300
atctccttca aggacgatgg cacctacaag accagagccg aggtgaagtt cgagggcgac 360
acactggtga atcgtatcga actgaagggc atcgacttca aagaggacgg caacattctg 420
ggccacaagc tggagtacaa cttcaacagc cactacgtgt acatcaccgc cgataagcag 480
aagaactgca tcaaggccaa cttcaagatt cgtcacaacg tggaggatgg ctccgtgcag 540
ctggccgatc actaccagca gaacacaccc atcggcgatg gacccgtttt actgcccgac 600
aaccactatt taagccacca gagcaagctg tccaaggacc ccaacgagaa gcgtgatcat 660
atggtgctgc tcgagtttgt gaccgccgcc ggcatcaccc atggaatgga cgagctgtac 720
aagagccggc tccatatggg aaactccgtg gtcacataca acaccaacat cgacaaactg 780
tgcaagagcg gcaagatcga ggaggccctg aagctgttca aggagatgga ggagaagggc 840
atcaccccca gcgtggtcac atacaccaca ctgatcgacg gactgtgtaa agccggcgac 900
gtggacgaag ccctcgagct gttcaaagag atgcggagca agggcgtgaa gcccaacgtg 960
gtgacataca ccaccctgat cgacggcctg tgcaaggccg gcaaagtgga cgaggccctg 1020
gagctgttcg acgagatgaa ggagaggggc atcaagcccg acgtggtcac atacaacacc 1080
ctgatcgacg gcctgtgcaa gagcggcaag atcgaggagg ccctgaagct gttcaaggag 1140
atggaggaga agggcatcac ccccagcgtg gttacataca ccacactgat cgacggactg 1200
tgtaaagccg gcgacgtgga cgaagccctc gagctgttca aagagatgcg gagcaagggc 1260
gtgaagccca acgtggtcac atacaccacc ctgatcgacg gcctgtgcaa ggccggcaag 1320
gtggatgagg ccctggagct gttcgacgag atgaaggaga ggggcatcaa gcccgacgtg 1380
gttacataca acaccctgat cgacggcctg tgcaagagcg gcaagatcga ggaggccctg 1440
aagctgttca aggagatgga ggagaagggc atcaccccca gcgtggtcac atacaccaca 1500
ctgatcgacg gactgtgtaa agccggcgac gtggacgaag ccctcgagct gttcaaagag 1560
atgcggagca agggcgtgaa gcccaacgtg gtgacataca ccaccctgat cgacggcctg 1620
tgcaaggccg gcaaagtgga cgaggccctg gagctgttcg acgagatgaa ggagaggggc 1680
atcaagcccg acgtggtcac atacaacacc ctgatcgacg gcctgtgcaa gagcggcaag 1740
atcgaggagg ccctgaagct gttcaaggag atggaggaga agggcatcac ccccagcgtg 1800
gttacataca ccacactgat cgacggactg tgtaaagccg gcgacgtgga cgaagccctc 1860
gagctgttca aagagatgcg gagcaagggc gtgaagccca acgtggtcac atacaccacc 1920
ctgatcgacg gcctgtgcaa ggccggcaag gtggatgagg ccctggagct gttcgacgag 1980
atgaaggaga ggggcatcaa gcccgacgtg gtcacataca acaccctgat cgacggcctg 2040
tgcaagagcg gcaagatcga ggaggccctg aagctgttca aggagatgga ggagaagggc 2100
atcaccccca gcgtggtcac atacaccaca ctgatcgacg gactgtgtaa agccggcgac 2160
gtggacgaag ccctcgagct gttcaaagag atgcggagca agggcgtgaa gcccaacgtg 2220
gttacataca ccaccctgat cgacggcctg tgcaaggccg gcaaagtgga cgaggccctg 2280
gagctgttcg acgagatgaa ggagaggggc atcaagcccg acgtggtcac atacaacacc 2340
ctgatcgacg gcctgtgcaa gagcggcaag atcgaggagg ccctgaagct gttcaaggag 2400
atggaggaga agggcatcac ccccagcgtg gtgacataca ccacactgat cgacggactg 2460
tgtaaagccg gcgacgtgga cgaagccctc gagctgttca aagagatgcg gagcaagggc 2520
gtgaagccca acgtggtcac atacaccacc ctgatcgacg gcctgtgcaa ggccggcaag 2580
gtggatgagg ccctggagct gttcgacgag atgaaggaga ggggcatcaa gcccgacgag 2640
ctgacctaca acaccctgat cagcggcctg ggcaaggccg gcagagccag agaccccccc 2700
gtgctcagta gccccaagaa gaaacgcaaa gtcgaggatc caaagaagaa aaggaaggtt 2760
gaagacccca agaaaaagag gaaggtgggt tccgactata aggaccacga cggagactac 2820
aaggatcatg atattgatta caaagacgat gacgataaga tggccccaaa gaagaagcgg 2880
aaggtcggac gctagmagvs kgtgvvvdgd vnghksvrgg gdatngktkc ttgkvwtvtt 2940
gygvacsryd hmkhdksamg yvrtskddgt yktravkgdt vnrkgdkdgn ghkynnshyv 3000
ytadkkncka nkrhnvdgsv adhyntgdgv dnhyshsksk dnkrdhmvvt aagthgmdyk 3060
srhmgnsvvt yntndkcksg kakkmkgtsv vtyttdgcka gdvdakmrsk gvknvvtytt 3120
dgckagkvda dmkrgkdvvt yntdgcksgk akkmkgtsvv tyttdgckag dvdakmrskg 3180
vknvvtyttd gckagkvdad mkrgkdvvty ntdgcksgka kkmkgtsvvt yttdgckagd 3240
vdakmrskgv knvvtyttdg ckagkvdadm krgkdvvtyn tdgcksgkak kmkgtsvvty 3300
ttdgckagdv dakmrskgvk nvvtyttdgc kagkvdadmk rgkdvvtynt dgcksgkakk 3360
mkgtsvvtyt tdgckagdvd akmrskgvkn vvtyttdgck agkvdadmkr gkdvvtyntd 3420
gcksgkakkm kgtsvvtytt dgckagdvda kmrskgvknv vtyttdgcka gkvdadmkrg 3480
kdtyntsggk agrardvssk kkrkvdkkkr kvdkkkrkvg sdykdhdgdy kdhddykddd 3540
dkmakkkrkv gr 3552
<210> 28
<211> 3552
<212> DNA
<213> Artificial sequence
<220>
<223> PPR vector
<220>
<221> misc_feature
<222> (2912)..(2912)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2925)..(2925)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2982)..(2982)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2990)..(2990)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2995)..(2996)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3007)..(3007)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3011)..(3011)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3015)..(3015)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3025)..(3025)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3032)..(3032)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3042)..(3042)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3066)..(3066)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3072)..(3072)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3114)..(3114)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3142)..(3142)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3183)..(3183)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3211)..(3211)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3252)..(3252)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3280)..(3280)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3321)..(3321)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3349)..(3349)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3390)..(3390)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3418)..(3418)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3459)..(3459)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3485)..(3485)
<223> n is a, c, g, t or u
<400> 28
atggccggag tgtccaaagg cgaggagctg tttaccggcg tcgtgcctat tctggtggag 60
ctggacggcg acgtgaacgg ccacaagttc tccgtgaggg gcgagggcga aggcgatgcc 120
acaaacggca agctgaccct caagttcatc tgcaccactg gtaaactgcc cgttccttgg 180
cccacactgg tgaccacctt cggctacggc gtggcttgtt tctctcgtta ccccgaccat 240
atgaagcagc acgacttctt caagtccgcc atgcccgagg gatacgtgca agaaaggacc 300
atctccttca aggacgatgg cacctacaag accagagccg aggtgaagtt cgagggcgac 360
acactggtga atcgtatcga actgaagggc atcgacttca aagaggacgg caacattctg 420
ggccacaagc tggagtacaa cttcaacagc cactacgtgt acatcaccgc cgataagcag 480
aagaactgca tcaaggccaa cttcaagatt cgtcacaacg tggaggatgg ctccgtgcag 540
ctggccgatc actaccagca gaacacaccc atcggcgatg gacccgtttt actgcccgac 600
aaccactatt taagccacca gagcaagctg tccaaggacc ccaacgagaa gcgtgatcat 660
atggtgctgc tcgagtttgt gaccgccgcc ggcatcaccc atggaatgga cgagctgtac 720
aagagccggc tccatatggg aaactccgtg gtcacataca acaccgatat cgacggcctg 780
tgcaagagcg gcaagatcga ggaggccctg aagctgttca aggagatgga ggagaagggc 840
atcaccccca gcgtggtcac atacaccaca ctgatcgacg gactgtgtaa agccggcgac 900
gtggacgaag ccctcgagct gttcaaagag atgcggagca agggcgtgaa gcccaacgtg 960
gtgacataca ccaccctgat cgacggcctg tgcaaggccg gcaaagtgga cgaggccctg 1020
gagctgttcg acgagatgaa ggagaggggc atcaagcccg acgtggtcac atacaacacc 1080
ctgatcgacg gcctgtgcaa gagcggcaag atcgaggagg ccctgaagct gttcaaggag 1140
atggaggaga agggcatcac ccccagcgtg gttacataca ccacactgat cgacggactg 1200
tgtaaagccg gcgacgtgga cgaagccctc gagctgttca aagagatgcg gagcaagggc 1260
gtgaagccca acgtggtcac atacaccacc ctgatcgacg gcctgtgcaa ggccggcaag 1320
gtggatgagg ccctggagct gttcgacgag atgaaggaga ggggcatcaa gcccgacgtg 1380
gttacataca acaccctgat cgacggcctg tgcaagagcg gcaagatcga ggaggccctg 1440
aagctgttca aggagatgga ggagaagggc atcaccccca gcgtggtcac atacaccaca 1500
ctgatcgacg gactgtgtaa agccggcgac gtggacgaag ccctcgagct gttcaaagag 1560
atgcggagca agggcgtgaa gcccaacgtg gtgacataca ccaccctgat cgacggcctg 1620
tgcaaggccg gcaaagtgga cgaggccctg gagctgttcg acgagatgaa ggagaggggc 1680
atcaagcccg acgtggtcac atacaacacc ctgatcgacg gcctgtgcaa gagcggcaag 1740
atcgaggagg ccctgaagct gttcaaggag atggaggaga agggcatcac ccccagcgtg 1800
gttacataca ccacactgat cgacggactg tgtaaagccg gcgacgtgga cgaagccctc 1860
gagctgttca aagagatgcg gagcaagggc gtgaagccca acgtggtcac atacaccacc 1920
ctgatcgacg gcctgtgcaa ggccggcaag gtggatgagg ccctggagct gttcgacgag 1980
atgaaggaga ggggcatcaa gcccgacgtg gtcacataca acaccctgat cgacggcctg 2040
tgcaagagcg gcaagatcga ggaggccctg aagctgttca aggagatgga ggagaagggc 2100
atcaccccca gcgtggtcac atacaccaca ctgatcgacg gactgtgtaa agccggcgac 2160
gtggacgaag ccctcgagct gttcaaagag atgcggagca agggcgtgaa gcccaacgtg 2220
gttacataca ccaccctgat cgacggcctg tgcaaggccg gcaaagtgga cgaggccctg 2280
gagctgttcg acgagatgaa ggagaggggc atcaagcccg acgtggtcac atacaacacc 2340
ctgatcgacg gcctgtgcaa gagcggcaag atcgaggagg ccctgaagct gttcaaggag 2400
atggaggaga agggcatcac ccccagcgtg gtgacataca ccacactgat cgacggactg 2460
tgtaaagccg gcgacgtgga cgaagccctc gagctgttca aagagatgcg gagcaagggc 2520
gtgaagccca acgtggtcac atacaccacc ctgatcgacg gcctgtgcaa ggccggcaag 2580
gtggatgagg ccctggagct gttcgacgag atgaaggaga ggggcatcaa gcccgacgag 2640
ctgacctaca acaccctgat cagcggcctg ggcaaggccg gcagagccag agaccccccc 2700
gtgctcagta gccccaagaa gaaacgcaaa gtcgaggatc caaagaagaa aaggaaggtt 2760
gaagacccca agaaaaagag gaaggtgggt tccgactata aggaccacga cggagactac 2820
aaggatcatg atattgatta caaagacgat gacgataaga tggccccaaa gaagaagcgg 2880
aaggtcggac gctagmagvs kgtgvvvdgd vnghksvrgg gdatngktkc ttgkvwtvtt 2940
gygvacsryd hmkhdksamg yvrtskddgt yktravkgdt vnrkgdkdgn ghkynnshyv 3000
ytadkkncka nkrhnvdgsv adhyntgdgv dnhyshsksk dnkrdhmvvt aagthgmdyk 3060
srhmgnsvvt yntddgcksg kakkmkgtsv vtyttdgcka gdvdakmrsk gvknvvtytt 3120
dgckagkvda dmkrgkdvvt yntdgcksgk akkmkgtsvv tyttdgckag dvdakmrskg 3180
vknvvtyttd gckagkvdad mkrgkdvvty ntdgcksgka kkmkgtsvvt yttdgckagd 3240
vdakmrskgv knvvtyttdg ckagkvdadm krgkdvvtyn tdgcksgkak kmkgtsvvty 3300
ttdgckagdv dakmrskgvk nvvtyttdgc kagkvdadmk rgkdvvtynt dgcksgkakk 3360
mkgtsvvtyt tdgckagdvd akmrskgvkn vvtyttdgck agkvdadmkr gkdvvtyntd 3420
gcksgkakkm kgtsvvtytt dgckagdvda kmrskgvknv vtyttdgcka gkvdadmkrg 3480
kdtyntsggk agrardvssk kkrkvdkkkr kvdkkkrkvg sdykdhdgdy kdhddykddd 3540
dkmakkkrkv gr 3552
<210> 29
<211> 3189
<212> DNA
<213> Artificial sequence
<220>
<223> NL_PPRcag_1
<220>
<221> misc_feature
<222> (2626)..(2626)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2634)..(2634)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2644)..(2644)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2678)..(2678)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2698)..(2698)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2700)..(2700)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2704)..(2704)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2711)..(2711)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2740)..(2740)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2746)..(2746)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2787)..(2787)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2815)..(2815)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2856)..(2856)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2884)..(2884)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2925)..(2925)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2953)..(2953)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2994)..(2994)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3022)..(3022)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3063)..(3063)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3091)..(3091)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3132)..(3132)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3158)..(3158)
<223> n is a, c, g, t or u
<400> 29
atggccggag tgttcacact ggaggacttc gtgggcgact ggagacagac cgccggctac 60
aacctggacc aggtgctgga gcagggcgga gtgagcagcc tgtttcagaa cctgggcgtg 120
agcgtcaccc ccatccagag gatcgtgctg tccggcgaga atggcctgaa gatcgacatc 180
cacgtcatca tcccctacga gggcctgagc ggcgatcaga tgggccagat cgagaagatc 240
ttcaaggtgg tgtatcccgt cgacgaccac cacttcaagg tgatcctgca ttacggcacc 300
ctcgtgatcg acggcgtgac ccctaacatg atcgactact tcggcaggcc ctacgaggga 360
atcgccgtgt tcgacggaaa gaagatcacc gtgaccggca ccctgtggaa cggaaacaag 420
atcatcgacg agaggctgat caaccccgac ggctccctgc tgttcagggt gaccatcaat 480
ggcgtgaccg gctggagact gtgcgagaga atcctggccg gaggcggagg aagcctcgtg 540
cccagaggat ccggcggagg cggctccagc cggctccata tgggaaactc cgtggtcaca 600
tacaacaccc tgatcgacgg cctgtgcaag agcggcaaga tcgaggaggc cctgaagctg 660
ttcaaggaga tggaggagaa gggcatcacc cccagcgtgg tcacatacac cacactgatc 720
gacggactgt gtaaagccgg cgacgtggac gaagccctcg agctgttcaa agagatgcgg 780
agcaagggcg tgaagcccaa cgtggtgaca tacaccaccc tgatcgacgg cctgtgcaag 840
gccggcaaag tggacgaggc cctggagctg ttcgacgaga tgaaggagag gggcatcaag 900
cccgacgtgg tcacatacaa caccctgatc gacggcctgt gcaagagcgg caagatcgag 960
gaggccctga agctgttcaa ggagatggag gagaagggca tcacccccag cgtggttaca 1020
tacaccacac tgatcgacgg actgtgtaaa gccggcgacg tggacgaagc cctcgagctg 1080
ttcaaagaga tgcggagcaa gggcgtgaag cccaacgtgg tcacatacac caccctgatc 1140
gacggcctgt gcaaggccgg caaggtggat gaggccctgg agctgttcga cgagatgaag 1200
gagaggggca tcaagcccga cgtggttaca tacaacaccc tgatcgacgg cctgtgcaag 1260
agcggcaaga tcgaggaggc cctgaagctg ttcaaggaga tggaggagaa gggcatcacc 1320
cccagcgtgg tcacatacac cacactgatc gacggactgt gtaaagccgg cgacgtggac 1380
gaagccctcg agctgttcaa agagatgcgg agcaagggcg tgaagcccaa cgtggtgaca 1440
tacaccaccc tgatcgacgg cctgtgcaag gccggcaaag tggacgaggc cctggagctg 1500
ttcgacgaga tgaaggagag gggcatcaag cccgacgtgg tcacatacaa caccctgatc 1560
gacggcctgt gcaagagcgg caagatcgag gaggccctga agctgttcaa ggagatggag 1620
gagaagggca tcacccccag cgtggttaca tacaccacac tgatcgacgg actgtgtaaa 1680
gccggcgacg tggacgaagc cctcgagctg ttcaaagaga tgcggagcaa gggcgtgaag 1740
cccaacgtgg tcacatacac caccctgatc gacggcctgt gcaaggccgg caaggtggat 1800
gaggccctgg agctgttcga cgagatgaag gagaggggca tcaagcccga cgtggtcaca 1860
tacaacaccc tgatcgacgg cctgtgcaag agcggcaaga tcgaggaggc cctgaagctg 1920
ttcaaggaga tggaggagaa gggcatcacc cccagcgtgg tcacatacac cacactgatc 1980
gacggactgt gtaaagccgg cgacgtggac gaagccctcg agctgttcaa agagatgcgg 2040
agcaagggcg tgaagcccaa cgtggttaca tacaccaccc tgatcgacgg cctgtgcaag 2100
gccggcaaag tggacgaggc cctggagctg ttcgacgaga tgaaggagag gggcatcaag 2160
cccgacgtgg tcacatacaa caccctgatc gacggcctgt gcaagagcgg caagatcgag 2220
gaggccctga agctgttcaa ggagatggag gagaagggca tcacccccag cgtggtgaca 2280
tacaccacac tgatcgacgg actgtgtaaa gccggcgacg tggacgaagc cctcgagctg 2340
ttcaaagaga tgcggagcaa gggcgtgaag cccaacgtgg tcacatacac caccctgatc 2400
gacggcctgt gcaaggccgg caaggtggat gaggccctgg agctgttcga cgagatgaag 2460
gagaggggca tcaagcccga cgagctgacc tacaacaccc tgatcagcgg cctgggcaag 2520
gccggcagag ccagagaccc ccccgtgctc agtagcggct ccggcggcag cgggggaggc 2580
gggcatcatc accatcacca cggacgctag magvtdvgdw rtagyndvgg vssngvsvtr 2640
vsgngkdhvy gsgdmgkkvv yvddhhkvhy gtvdgvtnmd ygrygavdgk ktvtgtwngn 2700
kdrndgsrvt ngvtgwrcra ggggsvrgsg gggssrhmgn svvtyntdgc ksgkakkmkg 2760
tsvvtyttdg ckagdvdakm rskgvknvvt yttdgckagk vdadmkrgkd vvtyntdgck 2820
sgkakkmkgt svvtyttdgc kagdvdakmr skgvknvvty ttdgckagkv dadmkrgkdv 2880
vtyntdgcks gkakkmkgts vvtyttdgck agdvdakmrs kgvknvvtyt tdgckagkvd 2940
admkrgkdvv tyntdgcksg kakkmkgtsv vtyttdgcka gdvdakmrsk gvknvvtytt 3000
dgckagkvda dmkrgkdvvt yntdgcksgk akkmkgtsvv tyttdgckag dvdakmrskg 3060
vknvvtyttd gckagkvdad mkrgkdvvty ntdgcksgka kkmkgtsvvt yttdgckagd 3120
vdakmrskgv knvvtyttdg ckagkvdadm krgkdtynts ggkagrardv ssgsggsggg 3180
ghhhhhhgr 3189
<210> 30
<211> 3188
<212> DNA
<213> Artificial sequence
<220>
<223> NL_PPRcag_2
<220>
<221> misc_feature
<222> (2626)..(2626)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2634)..(2634)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2644)..(2644)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2678)..(2678)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2698)..(2698)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2700)..(2700)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2704)..(2704)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2711)..(2711)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2740)..(2740)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2746)..(2746)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2786)..(2786)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2814)..(2814)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2855)..(2855)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2883)..(2883)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2924)..(2924)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2952)..(2952)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2993)..(2993)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3021)..(3021)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3062)..(3062)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3090)..(3090)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3131)..(3131)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3157)..(3157)
<223> n is a, c, g, t or u
<400> 30
atggccggag tgttcacact ggaggacttc gtgggcgact ggagacagac cgccggctac 60
aacctggacc aggtgctgga gcagggcgga gtgagcagcc tgtttcagaa cctgggcgtg 120
agcgtcaccc ccatccagag gatcgtgctg tccggcgaga atggcctgaa gatcgacatc 180
cacgtcatca tcccctacga gggcctgagc ggcgatcaga tgggccagat cgagaagatc 240
ttcaaggtgg tgtatcccgt cgacgaccac cacttcaagg tgatcctgca ttacggcacc 300
ctcgtgatcg acggcgtgac ccctaacatg atcgactact tcggcaggcc ctacgaggga 360
atcgccgtgt tcgacggaaa gaagatcacc gtgaccggca ccctgtggaa cggaaacaag 420
atcatcgacg agaggctgat caaccccgac ggctccctgc tgttcagggt gaccatcaat 480
ggcgtgaccg gctggagact gtgcgagaga atcctggccg gaggcggagg aagcctcgtg 540
cccagaggat ccggcggagg cggctccagc cggctccata tgggaaactc cgtggtcaca 600
tacaacaccc tgatcgacga actgtgcaag agcggcaaga tcgaggaggc cctgaagctg 660
ttcaaggaga tggaggagaa gggcatcacc cccagcgtgg tcacatacac cacactgatc 720
gacggactgt gtaaagccgg cgacgtggac gaagccctcg agctgttcaa agagatgcgg 780
agcaagggcg tgaagcccaa cgtggtgaca tacaccaccc tgatcgacgg cctgtgcaag 840
gccggcaaag tggacgaggc cctggagctg ttcgacgaga tgaaggagag gggcatcaag 900
cccgacgtgg tcacatacaa caccctgatc gacggcctgt gcaagagcgg caagatcgag 960
gaggccctga agctgttcaa ggagatggag gagaagggca tcacccccag cgtggttaca 1020
tacaccacac tgatcgacgg actgtgtaaa gccggcgacg tggacgaagc cctcgagctg 1080
ttcaaagaga tgcggagcaa gggcgtgaag cccaacgtgg tcacatacac caccctgatc 1140
gacggcctgt gcaaggccgg caaggtggat gaggccctgg agctgttcga cgagatgaag 1200
gagaggggca tcaagcccga cgtggttaca tacaacaccc tgatcgacgg cctgtgcaag 1260
agcggcaaga tcgaggaggc cctgaagctg ttcaaggaga tggaggagaa gggcatcacc 1320
cccagcgtgg tcacatacac cacactgatc gacggactgt gtaaagccgg cgacgtggac 1380
gaagccctcg agctgttcaa agagatgcgg agcaagggcg tgaagcccaa cgtggtgaca 1440
tacaccaccc tgatcgacgg cctgtgcaag gccggcaaag tggacgaggc cctggagctg 1500
ttcgacgaga tgaaggagag gggcatcaag cccgacgtgg tcacatacaa caccctgatc 1560
gacggcctgt gcaagagcgg caagatcgag gaggccctga agctgttcaa ggagatggag 1620
gagaagggca tcacccccag cgtggttaca tacaccacac tgatcgacgg actgtgtaaa 1680
gccggcgacg tggacgaagc cctcgagctg ttcaaagaga tgcggagcaa gggcgtgaag 1740
cccaacgtgg tcacatacac caccctgatc gacggcctgt gcaaggccgg caaggtggat 1800
gaggccctgg agctgttcga cgagatgaag gagaggggca tcaagcccga cgtggtcaca 1860
tacaacaccc tgatcgacgg cctgtgcaag agcggcaaga tcgaggaggc cctgaagctg 1920
ttcaaggaga tggaggagaa gggcatcacc cccagcgtgg tcacatacac cacactgatc 1980
gacggactgt gtaaagccgg cgacgtggac gaagccctcg agctgttcaa agagatgcgg 2040
agcaagggcg tgaagcccaa cgtggttaca tacaccaccc tgatcgacgg cctgtgcaag 2100
gccggcaaag tggacgaggc cctggagctg ttcgacgaga tgaaggagag gggcatcaag 2160
cccgacgtgg tcacatacaa caccctgatc gacggcctgt gcaagagcgg caagatcgag 2220
gaggccctga agctgttcaa ggagatggag gagaagggca tcacccccag cgtggtgaca 2280
tacaccacac tgatcgacgg actgtgtaaa gccggcgacg tggacgaagc cctcgagctg 2340
ttcaaagaga tgcggagcaa gggcgtgaag cccaacgtgg tcacatacac caccctgatc 2400
gacggcctgt gcaaggccgg caaggtggat gaggccctgg agctgttcga cgagatgaag 2460
gagaggggca tcaagcccga cgagctgacc tacaacaccc tgatcagcgg cctgggcaag 2520
gccggcagag ccagagaccc ccccgtgctc agtagcggct ccggcggcag cgggggaggc 2580
gggcatcatc accatcacca cggacgctag magvtdvgdw rtagyndvgg vssngvsvtr 2640
vsgngkdhvy gsgdmgkkvv yvddhhkvhy gtvdgvtnmd ygrygavdgk ktvtgtwngn 2700
kdrndgsrvt ngvtgwrcra ggggsvrgsg gggssrhmgn svvtyntdck sgkakkmkgt 2760
svvtyttdgc kagdvdakmr skgvknvvty ttdgckagkv dadmkrgkdv vtyntdgcks 2820
gkakkmkgts vvtyttdgck agdvdakmrs kgvknvvtyt tdgckagkvd admkrgkdvv 2880
tyntdgcksg kakkmkgtsv vtyttdgcka gdvdakmrsk gvknvvtytt dgckagkvda 2940
dmkrgkdvvt yntdgcksgk akkmkgtsvv tyttdgckag dvdakmrskg vknvvtyttd 3000
gckagkvdad mkrgkdvvty ntdgcksgka kkmkgtsvvt yttdgckagd vdakmrskgv 3060
knvvtyttdg ckagkvdadm krgkdvvtyn tdgcksgkak kmkgtsvvty ttdgckagdv 3120
dakmrskgvk nvvtyttdgc kagkvdadmk rgkdtyntsg gkagrardvs sgsggsgggg 3180
hhhhhhgr 3188
<210> 31
<211> 3189
<212> DNA
<213> Artificial sequence
<220>
<223> NL_PPRcag_3
<220>
<221> misc_feature
<222> (2626)..(2626)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2634)..(2634)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2644)..(2644)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2678)..(2678)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2698)..(2698)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2700)..(2700)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2704)..(2704)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2711)..(2711)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2740)..(2740)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2746)..(2746)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2748)..(2748)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2787)..(2787)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2815)..(2815)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2856)..(2856)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2884)..(2884)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2925)..(2925)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2953)..(2953)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2994)..(2994)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3022)..(3022)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3063)..(3063)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3091)..(3091)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3132)..(3132)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3158)..(3158)
<223> n is a, c, g, t or u
<400> 31
atggccggag tgttcacact ggaggacttc gtgggcgact ggagacagac cgccggctac 60
aacctggacc aggtgctgga gcagggcgga gtgagcagcc tgtttcagaa cctgggcgtg 120
agcgtcaccc ccatccagag gatcgtgctg tccggcgaga atggcctgaa gatcgacatc 180
cacgtcatca tcccctacga gggcctgagc ggcgatcaga tgggccagat cgagaagatc 240
ttcaaggtgg tgtatcccgt cgacgaccac cacttcaagg tgatcctgca ttacggcacc 300
ctcgtgatcg acggcgtgac ccctaacatg atcgactact tcggcaggcc ctacgaggga 360
atcgccgtgt tcgacggaaa gaagatcacc gtgaccggca ccctgtggaa cggaaacaag 420
atcatcgacg agaggctgat caaccccgac ggctccctgc tgttcagggt gaccatcaat 480
ggcgtgaccg gctggagact gtgcgagaga atcctggccg gaggcggagg aagcctcgtg 540
cccagaggat ccggcggagg cggctccagc cggctccata tgggaaactc cgtggtcaca 600
tacaacacca acatcgacca gctgtgcaag agcggcaaga tcgaggaggc cctgaagctg 660
ttcaaggaga tggaggagaa gggcatcacc cccagcgtgg tcacatacac cacactgatc 720
gacggactgt gtaaagccgg cgacgtggac gaagccctcg agctgttcaa agagatgcgg 780
agcaagggcg tgaagcccaa cgtggtgaca tacaccaccc tgatcgacgg cctgtgcaag 840
gccggcaaag tggacgaggc cctggagctg ttcgacgaga tgaaggagag gggcatcaag 900
cccgacgtgg tcacatacaa caccctgatc gacggcctgt gcaagagcgg caagatcgag 960
gaggccctga agctgttcaa ggagatggag gagaagggca tcacccccag cgtggttaca 1020
tacaccacac tgatcgacgg actgtgtaaa gccggcgacg tggacgaagc cctcgagctg 1080
ttcaaagaga tgcggagcaa gggcgtgaag cccaacgtgg tcacatacac caccctgatc 1140
gacggcctgt gcaaggccgg caaggtggat gaggccctgg agctgttcga cgagatgaag 1200
gagaggggca tcaagcccga cgtggttaca tacaacaccc tgatcgacgg cctgtgcaag 1260
agcggcaaga tcgaggaggc cctgaagctg ttcaaggaga tggaggagaa gggcatcacc 1320
cccagcgtgg tcacatacac cacactgatc gacggactgt gtaaagccgg cgacgtggac 1380
gaagccctcg agctgttcaa agagatgcgg agcaagggcg tgaagcccaa cgtggtgaca 1440
tacaccaccc tgatcgacgg cctgtgcaag gccggcaaag tggacgaggc cctggagctg 1500
ttcgacgaga tgaaggagag gggcatcaag cccgacgtgg tcacatacaa caccctgatc 1560
gacggcctgt gcaagagcgg caagatcgag gaggccctga agctgttcaa ggagatggag 1620
gagaagggca tcacccccag cgtggttaca tacaccacac tgatcgacgg actgtgtaaa 1680
gccggcgacg tggacgaagc cctcgagctg ttcaaagaga tgcggagcaa gggcgtgaag 1740
cccaacgtgg tcacatacac caccctgatc gacggcctgt gcaaggccgg caaggtggat 1800
gaggccctgg agctgttcga cgagatgaag gagaggggca tcaagcccga cgtggtcaca 1860
tacaacaccc tgatcgacgg cctgtgcaag agcggcaaga tcgaggaggc cctgaagctg 1920
ttcaaggaga tggaggagaa gggcatcacc cccagcgtgg tcacatacac cacactgatc 1980
gacggactgt gtaaagccgg cgacgtggac gaagccctcg agctgttcaa agagatgcgg 2040
agcaagggcg tgaagcccaa cgtggttaca tacaccaccc tgatcgacgg cctgtgcaag 2100
gccggcaaag tggacgaggc cctggagctg ttcgacgaga tgaaggagag gggcatcaag 2160
cccgacgtgg tcacatacaa caccctgatc gacggcctgt gcaagagcgg caagatcgag 2220
gaggccctga agctgttcaa ggagatggag gagaagggca tcacccccag cgtggtgaca 2280
tacaccacac tgatcgacgg actgtgtaaa gccggcgacg tggacgaagc cctcgagctg 2340
ttcaaagaga tgcggagcaa gggcgtgaag cccaacgtgg tcacatacac caccctgatc 2400
gacggcctgt gcaaggccgg caaggtggat gaggccctgg agctgttcga cgagatgaag 2460
gagaggggca tcaagcccga cgagctgacc tacaacaccc tgatcagcgg cctgggcaag 2520
gccggcagag ccagagaccc ccccgtgctc agtagcggct ccggcggcag cgggggaggc 2580
gggcatcatc accatcacca cggacgctag magvtdvgdw rtagyndvgg vssngvsvtr 2640
vsgngkdhvy gsgdmgkkvv yvddhhkvhy gtvdgvtnmd ygrygavdgk ktvtgtwngn 2700
kdrndgsrvt ngvtgwrcra ggggsvrgsg gggssrhmgn svvtyntndc ksgkakkmkg 2760
tsvvtyttdg ckagdvdakm rskgvknvvt yttdgckagk vdadmkrgkd vvtyntdgck 2820
sgkakkmkgt svvtyttdgc kagdvdakmr skgvknvvty ttdgckagkv dadmkrgkdv 2880
vtyntdgcks gkakkmkgts vvtyttdgck agdvdakmrs kgvknvvtyt tdgckagkvd 2940
admkrgkdvv tyntdgcksg kakkmkgtsv vtyttdgcka gdvdakmrsk gvknvvtytt 3000
dgckagkvda dmkrgkdvvt yntdgcksgk akkmkgtsvv tyttdgckag dvdakmrskg 3060
vknvvtyttd gckagkvdad mkrgkdvvty ntdgcksgka kkmkgtsvvt yttdgckagd 3120
vdakmrskgv knvvtyttdg ckagkvdadm krgkdtynts ggkagrardv ssgsggsggg 3180
ghhhhhhgr 3189
<210> 32
<211> 3189
<212> DNA
<213> Artificial sequence
<220>
<223> NL_PPRcag_4
<220>
<221> misc_feature
<222> (2626)..(2626)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2634)..(2634)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2644)..(2644)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2678)..(2678)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2698)..(2698)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2700)..(2700)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2704)..(2704)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2711)..(2711)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2740)..(2740)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2746)..(2746)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2748)..(2748)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2787)..(2787)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2815)..(2815)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2856)..(2856)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2884)..(2884)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2925)..(2925)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2953)..(2953)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2994)..(2994)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3022)..(3022)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3063)..(3063)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3091)..(3091)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3132)..(3132)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3158)..(3158)
<223> n is a, c, g, t or u
<400> 32
atggccggag tgttcacact ggaggacttc gtgggcgact ggagacagac cgccggctac 60
aacctggacc aggtgctgga gcagggcgga gtgagcagcc tgtttcagaa cctgggcgtg 120
agcgtcaccc ccatccagag gatcgtgctg tccggcgaga atggcctgaa gatcgacatc 180
cacgtcatca tcccctacga gggcctgagc ggcgatcaga tgggccagat cgagaagatc 240
ttcaaggtgg tgtatcccgt cgacgaccac cacttcaagg tgatcctgca ttacggcacc 300
ctcgtgatcg acggcgtgac ccctaacatg atcgactact tcggcaggcc ctacgaggga 360
atcgccgtgt tcgacggaaa gaagatcacc gtgaccggca ccctgtggaa cggaaacaag 420
atcatcgacg agaggctgat caaccccgac ggctccctgc tgttcagggt gaccatcaat 480
ggcgtgaccg gctggagact gtgcgagaga atcctggccg gaggcggagg aagcctcgtg 540
cccagaggat ccggcggagg cggctccagc cggctccata tgggaaactc cgtggtcaca 600
tacaacacca acatcgacga actgtgcaag agcggcaaga tcgaggaggc cctgaagctg 660
ttcaaggaga tggaggagaa gggcatcacc cccagcgtgg tcacatacac cacactgatc 720
gacggactgt gtaaagccgg cgacgtggac gaagccctcg agctgttcaa agagatgcgg 780
agcaagggcg tgaagcccaa cgtggtgaca tacaccaccc tgatcgacgg cctgtgcaag 840
gccggcaaag tggacgaggc cctggagctg ttcgacgaga tgaaggagag gggcatcaag 900
cccgacgtgg tcacatacaa caccctgatc gacggcctgt gcaagagcgg caagatcgag 960
gaggccctga agctgttcaa ggagatggag gagaagggca tcacccccag cgtggttaca 1020
tacaccacac tgatcgacgg actgtgtaaa gccggcgacg tggacgaagc cctcgagctg 1080
ttcaaagaga tgcggagcaa gggcgtgaag cccaacgtgg tcacatacac caccctgatc 1140
gacggcctgt gcaaggccgg caaggtggat gaggccctgg agctgttcga cgagatgaag 1200
gagaggggca tcaagcccga cgtggttaca tacaacaccc tgatcgacgg cctgtgcaag 1260
agcggcaaga tcgaggaggc cctgaagctg ttcaaggaga tggaggagaa gggcatcacc 1320
cccagcgtgg tcacatacac cacactgatc gacggactgt gtaaagccgg cgacgtggac 1380
gaagccctcg agctgttcaa agagatgcgg agcaagggcg tgaagcccaa cgtggtgaca 1440
tacaccaccc tgatcgacgg cctgtgcaag gccggcaaag tggacgaggc cctggagctg 1500
ttcgacgaga tgaaggagag gggcatcaag cccgacgtgg tcacatacaa caccctgatc 1560
gacggcctgt gcaagagcgg caagatcgag gaggccctga agctgttcaa ggagatggag 1620
gagaagggca tcacccccag cgtggttaca tacaccacac tgatcgacgg actgtgtaaa 1680
gccggcgacg tggacgaagc cctcgagctg ttcaaagaga tgcggagcaa gggcgtgaag 1740
cccaacgtgg tcacatacac caccctgatc gacggcctgt gcaaggccgg caaggtggat 1800
gaggccctgg agctgttcga cgagatgaag gagaggggca tcaagcccga cgtggtcaca 1860
tacaacaccc tgatcgacgg cctgtgcaag agcggcaaga tcgaggaggc cctgaagctg 1920
ttcaaggaga tggaggagaa gggcatcacc cccagcgtgg tcacatacac cacactgatc 1980
gacggactgt gtaaagccgg cgacgtggac gaagccctcg agctgttcaa agagatgcgg 2040
agcaagggcg tgaagcccaa cgtggttaca tacaccaccc tgatcgacgg cctgtgcaag 2100
gccggcaaag tggacgaggc cctggagctg ttcgacgaga tgaaggagag gggcatcaag 2160
cccgacgtgg tcacatacaa caccctgatc gacggcctgt gcaagagcgg caagatcgag 2220
gaggccctga agctgttcaa ggagatggag gagaagggca tcacccccag cgtggtgaca 2280
tacaccacac tgatcgacgg actgtgtaaa gccggcgacg tggacgaagc cctcgagctg 2340
ttcaaagaga tgcggagcaa gggcgtgaag cccaacgtgg tcacatacac caccctgatc 2400
gacggcctgt gcaaggccgg caaggtggat gaggccctgg agctgttcga cgagatgaag 2460
gagaggggca tcaagcccga cgagctgacc tacaacaccc tgatcagcgg cctgggcaag 2520
gccggcagag ccagagaccc ccccgtgctc agtagcggct ccggcggcag cgggggaggc 2580
gggcatcatc accatcacca cggacgctag magvtdvgdw rtagyndvgg vssngvsvtr 2640
vsgngkdhvy gsgdmgkkvv yvddhhkvhy gtvdgvtnmd ygrygavdgk ktvtgtwngn 2700
kdrndgsrvt ngvtgwrcra ggggsvrgsg gggssrhmgn svvtyntndc ksgkakkmkg 2760
tsvvtyttdg ckagdvdakm rskgvknvvt yttdgckagk vdadmkrgkd vvtyntdgck 2820
sgkakkmkgt svvtyttdgc kagdvdakmr skgvknvvty ttdgckagkv dadmkrgkdv 2880
vtyntdgcks gkakkmkgts vvtyttdgck agdvdakmrs kgvknvvtyt tdgckagkvd 2940
admkrgkdvv tyntdgcksg kakkmkgtsv vtyttdgcka gdvdakmrsk gvknvvtytt 3000
dgckagkvda dmkrgkdvvt yntdgcksgk akkmkgtsvv tyttdgckag dvdakmrskg 3060
vknvvtyttd gckagkvdad mkrgkdvvty ntdgcksgka kkmkgtsvvt yttdgckagd 3120
vdakmrskgv knvvtyttdg ckagkvdadm krgkdtynts ggkagrardv ssgsggsggg 3180
ghhhhhhgr 3189
<210> 33
<211> 3190
<212> DNA
<213> Artificial sequence
<220>
<223> NL_PPRcag_5
<220>
<221> misc_feature
<222> (2626)..(2626)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2634)..(2634)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2644)..(2644)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2678)..(2678)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2698)..(2698)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2700)..(2700)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2704)..(2704)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2711)..(2711)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2740)..(2740)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2746)..(2746)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2748)..(2748)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2788)..(2788)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2816)..(2816)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2857)..(2857)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2885)..(2885)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2926)..(2926)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2954)..(2954)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2995)..(2995)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3023)..(3023)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3064)..(3064)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3092)..(3092)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3133)..(3133)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3159)..(3159)
<223> n is a, c, g, t or u
<400> 33
atggccggag tgttcacact ggaggacttc gtgggcgact ggagacagac cgccggctac 60
aacctggacc aggtgctgga gcagggcgga gtgagcagcc tgtttcagaa cctgggcgtg 120
agcgtcaccc ccatccagag gatcgtgctg tccggcgaga atggcctgaa gatcgacatc 180
cacgtcatca tcccctacga gggcctgagc ggcgatcaga tgggccagat cgagaagatc 240
ttcaaggtgg tgtatcccgt cgacgaccac cacttcaagg tgatcctgca ttacggcacc 300
ctcgtgatcg acggcgtgac ccctaacatg atcgactact tcggcaggcc ctacgaggga 360
atcgccgtgt tcgacggaaa gaagatcacc gtgaccggca ccctgtggaa cggaaacaag 420
atcatcgacg agaggctgat caaccccgac ggctccctgc tgttcagggt gaccatcaat 480
ggcgtgaccg gctggagact gtgcgagaga atcctggccg gaggcggagg aagcctcgtg 540
cccagaggat ccggcggagg cggctccagc cggctccata tgggaaactc cgtggtcaca 600
tacaacacca acatcgacaa actgtgcaag agcggcaaga tcgaggaggc cctgaagctg 660
ttcaaggaga tggaggagaa gggcatcacc cccagcgtgg tcacatacac cacactgatc 720
gacggactgt gtaaagccgg cgacgtggac gaagccctcg agctgttcaa agagatgcgg 780
agcaagggcg tgaagcccaa cgtggtgaca tacaccaccc tgatcgacgg cctgtgcaag 840
gccggcaaag tggacgaggc cctggagctg ttcgacgaga tgaaggagag gggcatcaag 900
cccgacgtgg tcacatacaa caccctgatc gacggcctgt gcaagagcgg caagatcgag 960
gaggccctga agctgttcaa ggagatggag gagaagggca tcacccccag cgtggttaca 1020
tacaccacac tgatcgacgg actgtgtaaa gccggcgacg tggacgaagc cctcgagctg 1080
ttcaaagaga tgcggagcaa gggcgtgaag cccaacgtgg tcacatacac caccctgatc 1140
gacggcctgt gcaaggccgg caaggtggat gaggccctgg agctgttcga cgagatgaag 1200
gagaggggca tcaagcccga cgtggttaca tacaacaccc tgatcgacgg cctgtgcaag 1260
agcggcaaga tcgaggaggc cctgaagctg ttcaaggaga tggaggagaa gggcatcacc 1320
cccagcgtgg tcacatacac cacactgatc gacggactgt gtaaagccgg cgacgtggac 1380
gaagccctcg agctgttcaa agagatgcgg agcaagggcg tgaagcccaa cgtggtgaca 1440
tacaccaccc tgatcgacgg cctgtgcaag gccggcaaag tggacgaggc cctggagctg 1500
ttcgacgaga tgaaggagag gggcatcaag cccgacgtgg tcacatacaa caccctgatc 1560
gacggcctgt gcaagagcgg caagatcgag gaggccctga agctgttcaa ggagatggag 1620
gagaagggca tcacccccag cgtggttaca tacaccacac tgatcgacgg actgtgtaaa 1680
gccggcgacg tggacgaagc cctcgagctg ttcaaagaga tgcggagcaa gggcgtgaag 1740
cccaacgtgg tcacatacac caccctgatc gacggcctgt gcaaggccgg caaggtggat 1800
gaggccctgg agctgttcga cgagatgaag gagaggggca tcaagcccga cgtggtcaca 1860
tacaacaccc tgatcgacgg cctgtgcaag agcggcaaga tcgaggaggc cctgaagctg 1920
ttcaaggaga tggaggagaa gggcatcacc cccagcgtgg tcacatacac cacactgatc 1980
gacggactgt gtaaagccgg cgacgtggac gaagccctcg agctgttcaa agagatgcgg 2040
agcaagggcg tgaagcccaa cgtggttaca tacaccaccc tgatcgacgg cctgtgcaag 2100
gccggcaaag tggacgaggc cctggagctg ttcgacgaga tgaaggagag gggcatcaag 2160
cccgacgtgg tcacatacaa caccctgatc gacggcctgt gcaagagcgg caagatcgag 2220
gaggccctga agctgttcaa ggagatggag gagaagggca tcacccccag cgtggtgaca 2280
tacaccacac tgatcgacgg actgtgtaaa gccggcgacg tggacgaagc cctcgagctg 2340
ttcaaagaga tgcggagcaa gggcgtgaag cccaacgtgg tcacatacac caccctgatc 2400
gacggcctgt gcaaggccgg caaggtggat gaggccctgg agctgttcga cgagatgaag 2460
gagaggggca tcaagcccga cgagctgacc tacaacaccc tgatcagcgg cctgggcaag 2520
gccggcagag ccagagaccc ccccgtgctc agtagcggct ccggcggcag cgggggaggc 2580
gggcatcatc accatcacca cggacgctag magvtdvgdw rtagyndvgg vssngvsvtr 2640
vsgngkdhvy gsgdmgkkvv yvddhhkvhy gtvdgvtnmd ygrygavdgk ktvtgtwngn 2700
kdrndgsrvt ngvtgwrcra ggggsvrgsg gggssrhmgn svvtyntndk cksgkakkmk 2760
gtsvvtyttd gckagdvdak mrskgvknvv tyttdgckag kvdadmkrgk dvvtyntdgc 2820
ksgkakkmkg tsvvtyttdg ckagdvdakm rskgvknvvt yttdgckagk vdadmkrgkd 2880
vvtyntdgck sgkakkmkgt svvtyttdgc kagdvdakmr skgvknvvty ttdgckagkv 2940
dadmkrgkdv vtyntdgcks gkakkmkgts vvtyttdgck agdvdakmrs kgvknvvtyt 3000
tdgckagkvd admkrgkdvv tyntdgcksg kakkmkgtsv vtyttdgcka gdvdakmrsk 3060
gvknvvtytt dgckagkvda dmkrgkdvvt yntdgcksgk akkmkgtsvv tyttdgckag 3120
dvdakmrskg vknvvtyttd gckagkvdad mkrgkdtynt sggkagrard vssgsggsgg 3180
gghhhhhhgr 3190
<210> 34
<211> 3190
<212> DNA
<213> Artificial sequence
<220>
<223> NL_PPRcag_1
<220>
<221> misc_feature
<222> (2626)..(2626)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2634)..(2634)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2644)..(2644)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2678)..(2678)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2698)..(2698)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2700)..(2700)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2704)..(2704)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2711)..(2711)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2740)..(2740)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2746)..(2746)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2788)..(2788)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2816)..(2816)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2857)..(2857)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2885)..(2885)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2926)..(2926)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2954)..(2954)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2995)..(2995)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3023)..(3023)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3064)..(3064)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3092)..(3092)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3133)..(3133)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3159)..(3159)
<223> n is a, c, g, t or u
<400> 34
atggccggag tgttcacact ggaggacttc gtgggcgact ggagacagac cgccggctac 60
aacctggacc aggtgctgga gcagggcgga gtgagcagcc tgtttcagaa cctgggcgtg 120
agcgtcaccc ccatccagag gatcgtgctg tccggcgaga atggcctgaa gatcgacatc 180
cacgtcatca tcccctacga gggcctgagc ggcgatcaga tgggccagat cgagaagatc 240
ttcaaggtgg tgtatcccgt cgacgaccac cacttcaagg tgatcctgca ttacggcacc 300
ctcgtgatcg acggcgtgac ccctaacatg atcgactact tcggcaggcc ctacgaggga 360
atcgccgtgt tcgacggaaa gaagatcacc gtgaccggca ccctgtggaa cggaaacaag 420
atcatcgacg agaggctgat caaccccgac ggctccctgc tgttcagggt gaccatcaat 480
ggcgtgaccg gctggagact gtgcgagaga atcctggccg gaggcggagg aagcctcgtg 540
cccagaggat ccggcggagg cggctccagc cggctccata tgggaaactc cgtggtcaca 600
tacaacaccg atatcgacgg cctgtgcaag agcggcaaga tcgaggaggc cctgaagctg 660
ttcaaggaga tggaggagaa gggcatcacc cccagcgtgg tcacatacac cacactgatc 720
gacggactgt gtaaagccgg cgacgtggac gaagccctcg agctgttcaa agagatgcgg 780
agcaagggcg tgaagcccaa cgtggtgaca tacaccaccc tgatcgacgg cctgtgcaag 840
gccggcaaag tggacgaggc cctggagctg ttcgacgaga tgaaggagag gggcatcaag 900
cccgacgtgg tcacatacaa caccctgatc gacggcctgt gcaagagcgg caagatcgag 960
gaggccctga agctgttcaa ggagatggag gagaagggca tcacccccag cgtggttaca 1020
tacaccacac tgatcgacgg actgtgtaaa gccggcgacg tggacgaagc cctcgagctg 1080
ttcaaagaga tgcggagcaa gggcgtgaag cccaacgtgg tcacatacac caccctgatc 1140
gacggcctgt gcaaggccgg caaggtggat gaggccctgg agctgttcga cgagatgaag 1200
gagaggggca tcaagcccga cgtggttaca tacaacaccc tgatcgacgg cctgtgcaag 1260
agcggcaaga tcgaggaggc cctgaagctg ttcaaggaga tggaggagaa gggcatcacc 1320
cccagcgtgg tcacatacac cacactgatc gacggactgt gtaaagccgg cgacgtggac 1380
gaagccctcg agctgttcaa agagatgcgg agcaagggcg tgaagcccaa cgtggtgaca 1440
tacaccaccc tgatcgacgg cctgtgcaag gccggcaaag tggacgaggc cctggagctg 1500
ttcgacgaga tgaaggagag gggcatcaag cccgacgtgg tcacatacaa caccctgatc 1560
gacggcctgt gcaagagcgg caagatcgag gaggccctga agctgttcaa ggagatggag 1620
gagaagggca tcacccccag cgtggttaca tacaccacac tgatcgacgg actgtgtaaa 1680
gccggcgacg tggacgaagc cctcgagctg ttcaaagaga tgcggagcaa gggcgtgaag 1740
cccaacgtgg tcacatacac caccctgatc gacggcctgt gcaaggccgg caaggtggat 1800
gaggccctgg agctgttcga cgagatgaag gagaggggca tcaagcccga cgtggtcaca 1860
tacaacaccc tgatcgacgg cctgtgcaag agcggcaaga tcgaggaggc cctgaagctg 1920
ttcaaggaga tggaggagaa gggcatcacc cccagcgtgg tcacatacac cacactgatc 1980
gacggactgt gtaaagccgg cgacgtggac gaagccctcg agctgttcaa agagatgcgg 2040
agcaagggcg tgaagcccaa cgtggttaca tacaccaccc tgatcgacgg cctgtgcaag 2100
gccggcaaag tggacgaggc cctggagctg ttcgacgaga tgaaggagag gggcatcaag 2160
cccgacgtgg tcacatacaa caccctgatc gacggcctgt gcaagagcgg caagatcgag 2220
gaggccctga agctgttcaa ggagatggag gagaagggca tcacccccag cgtggtgaca 2280
tacaccacac tgatcgacgg actgtgtaaa gccggcgacg tggacgaagc cctcgagctg 2340
ttcaaagaga tgcggagcaa gggcgtgaag cccaacgtgg tcacatacac caccctgatc 2400
gacggcctgt gcaaggccgg caaggtggat gaggccctgg agctgttcga cgagatgaag 2460
gagaggggca tcaagcccga cgagctgacc tacaacaccc tgatcagcgg cctgggcaag 2520
gccggcagag ccagagaccc ccccgtgctc agtagcggct ccggcggcag cgggggaggc 2580
gggcatcatc accatcacca cggacgctag magvtdvgdw rtagyndvgg vssngvsvtr 2640
vsgngkdhvy gsgdmgkkvv yvddhhkvhy gtvdgvtnmd ygrygavdgk ktvtgtwngn 2700
kdrndgsrvt ngvtgwrcra ggggsvrgsg gggssrhmgn svvtyntddg cksgkakkmk 2760
gtsvvtyttd gckagdvdak mrskgvknvv tyttdgckag kvdadmkrgk dvvtyntdgc 2820
ksgkakkmkg tsvvtyttdg ckagdvdakm rskgvknvvt yttdgckagk vdadmkrgkd 2880
vvtyntdgck sgkakkmkgt svvtyttdgc kagdvdakmr skgvknvvty ttdgckagkv 2940
dadmkrgkdv vtyntdgcks gkakkmkgts vvtyttdgck agdvdakmrs kgvknvvtyt 3000
tdgckagkvd admkrgkdvv tyntdgcksg kakkmkgtsv vtyttdgcka gdvdakmrsk 3060
gvknvvtytt dgckagkvda dmkrgkdvvt yntdgcksgk akkmkgtsvv tyttdgckag 3120
dvdakmrskg vknvvtyttd gckagkvdad mkrgkdtynt sggkagrard vssgsggsgg 3180
gghhhhhhgr 3190
<210> 35
<211> 1066
<212> DNA
<213> Artificial sequence
<220>
<223> GFPnls
<220>
<221> misc_feature
<222> (878)..(878)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (934)..(934)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (946)..(946)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (954)..(954)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (959)..(959)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (961)..(961)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (964)..(964)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (972)..(972)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (976)..(976)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (980)..(980)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (989)..(989)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (996)..(996)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (1006)..(1006)
<223> n is a, c, g, t or u
<400> 35
atggccggag tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat cctggtcgag 60
ctggacggcg acgtaaacgg ccacaagttc agcgtgtccg gcgagggcga gggcgatgcc 120
acctacggca agctgaccct gaagttcatc tgcaccaccg gcaagctgcc cgtgccctgg 180
cccaccctcg tgaccaccct gacctacggc gtgcagtgct tcagccgcta ccccgaccac 240
atgaagcagc acgacttctt caagtccgcc atgcccgaag gctacgtcca ggagcgcacc 300
atcttcttca aggacgacgg caactacaag acccgcgccg aggtgaagtt cgagggcgac 360
accctggtga accgcatcga gctgaagggc atcgacttca aggaggacgg caacatcctg 420
gggcacaagc tggagtacaa ctacaacagc cacaacgtct atatcatggc cgacaagcag 480
aagaacggca tcaaggtgaa cttcaagatc cgccacaaca tcgaggacgg cagcgtgcag 540
ctcgccgacc actaccagca gaacaccccc atcggcgacg gccccgtgct gctgcccgac 600
aaccactacc tgagcaccca gtccgccctg agcaaagacc ccaacgagaa gcgcgatcac 660
atggtcctgc tggagttcgt gaccgccgcc gggatcactc tcggcatgga cgagctgtac 720
aagccaaaga aaaagagaaa ggttagccat ggctccggcg gcagcggggg aggtagcggg 780
gactataagg accacgacgg agactacaag gatcatgata ttgattacaa agacgatgac 840
gataagatgg ccggacgcta gmagvskgtg vvvdgdvngh ksvsgggdat ygktkcttgk 900
vwtvtttygv csrydhmkhd ksamgyvrtk ddgnyktrav kgdtvnrkgd kdgnghkyny 960
nshnvymadk kngkvnkrhn dgsvadhynt gdgvdnhyst saskdnkrdh mvvtaagtgm 1020
dykkkkrkvs hgsggsgggs gdykdhdgdy kdhddykddd dkmagr 1066
<210> 36
<211> 1170
<212> DNA
<213> Artificial sequence
<220>
<223> mClover3nls
<220>
<221> misc_feature
<222> (959)..(959)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (972)..(972)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (1029)..(1029)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (1037)..(1037)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (1042)..(1043)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (1054)..(1054)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (1058)..(1058)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (1062)..(1062)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (1072)..(1072)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (1079)..(1079)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (1089)..(1089)
<223> n is a, c, g, t or u
<400> 36
atggccggag tgtccaaagg cgaggagctg tttaccggcg tcgtgcctat tctggtggag 60
ctggacggcg acgtgaacgg ccacaagttc tccgtgaggg gcgagggcga aggcgatgcc 120
acaaacggca agctgaccct caagttcatc tgcaccactg gtaaactgcc cgttccttgg 180
cccacactgg tgaccacctt cggctacggc gtggcttgtt tctctcgtta ccccgaccat 240
atgaagcagc acgacttctt caagtccgcc atgcccgagg gatacgtgca agaaaggacc 300
atctccttca aggacgatgg cacctacaag accagagccg aggtgaagtt cgagggcgac 360
acactggtga atcgtatcga actgaagggc atcgacttca aagaggacgg caacattctg 420
ggccacaagc tggagtacaa cttcaacagc cactacgtgt acatcaccgc cgataagcag 480
aagaactgca tcaaggccaa cttcaagatt cgtcacaacg tggaggatgg ctccgtgcag 540
ctggccgatc actaccagca gaacacaccc atcggcgatg gacccgtttt actgcccgac 600
aaccactatt taagccacca gagcaagctg tccaaggacc ccaacgagaa gcgtgatcat 660
atggtgctgc tcgagtttgt gaccgccgcc ggcatcaccc atggaatgga cgagctgtac 720
aagagccggc tccatatggg atccggcgga ctcagtagcc ccaagaagaa acgcaaagtc 780
gaggatccaa agaagaaaag gaaggttgaa gaccccaaga aaaagaggaa ggtgggttcc 840
gactataagg accacgacgg agactacaag gatcatgata ttgattacaa agacgatgac 900
gataagatgg ccccaaagaa gaagcggaag gtcggacgct agmagvskgt gvvvdgdvng 960
hksvrgggda tngktkcttg kvwtvttgyg vacsrydhmk hdksamgyvr tskddgtykt 1020
ravkgdtvnr kgdkdgnghk ynnshyvyta dkknckankr hnvdgsvadh yntgdgvdnh 1080
yshskskdnk rdhmvvtaag thgmdyksrh mgsggsskkk rkvdkkkrkv dkkkrkvgsd 1140
ykdhdgdykd hddykddddk makkkrkvgr 1170
<210> 37
<211> 862
<212> DNA
<213> Artificial sequence
<220>
<223> NL control
<220>
<221> misc_feature
<222> (674)..(674)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (730)..(730)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (742)..(742)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (750)..(750)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (755)..(755)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (757)..(757)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (760)..(760)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (768)..(768)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (772)..(772)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (776)..(776)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (785)..(785)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (792)..(792)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (802)..(802)
<223> n is a, c, g, t or u
<400> 37
atggccggag tgttcacact ggaggacttc gtgggcgact ggagacagac cgccggctac 60
aacctggacc aggtgctgga gcagggcgga gtgagcagcc tgtttcagaa cctgggcgtg 120
agcgtcaccc ccatccagag gatcgtgctg tccggcgaga atggcctgaa gatcgacatc 180
cacgtcatca tcccctacga gggcctgagc ggcgatcaga tgggccagat cgagaagatc 240
ttcaaggtgg tgtatcccgt cgacgaccac cacttcaagg tgatcctgca ttacggcacc 300
ctcgtgatcg acggcgtgac ccctaacatg atcgactact tcggcaggcc ctacgaggga 360
atcgccgtgt tcgacggaaa gaagatcacc gtgaccggca ccctgtggaa cggaaacaag 420
atcatcgacg agaggctgat caaccccgac ggctccctgc tgttcagggt gaccatcaat 480
ggcgtgaccg gctggagact gtgcgagaga atcctggccg gaggcggagg aagcctcgtg 540
cccagaggat ccggcggagg cggctccagc cggctccata tgggatccgg cggactcagt 600
agcggctccg gcggcagcgg gggaggcggg catcatcacc atcaccacgg acgctagmag 660
vskgtgvvvd gdvnghksvs gggdatygkt kcttgkvwtv tttygvcsry dhmkhdksam 720
gyvrtkddgn yktravkgdt vnrkgdkdgn ghkynynshn vymadkkngk vnkrhndgsv 780
adhyntgdgv dnhystsask dnkrdhmvvt aagtgmdykk kkrkvshgsg gsgggsgdyk 840
dhdgdykdhd dykddddkma gr 862
<210> 38
<211> 30
<212> DNA
<213> Artificial sequence
<220>
<223> RNA probe
<400> 38
gacaugccag cagcagcagc agcaggacug 30
<210> 39
<211> 30
<212> DNA
<213> Artificial sequence
<220>
<223> RNA probe
<400> 39
gacaugccgg cggcggcggc ggcgggacug 30
<210> 40
<211> 30
<212> DNA
<213> Artificial sequence
<220>
<223> RNA probe
<400> 40
gacacugcug cugcugcugc ugcugaugca 30
<210> 41
<211> 30
<212> DNA
<213> Artificial sequence
<220>
<223> RNA probe
<400> 41
gacaccgccg ccgccgccgc cgccggacug 30
<210> 42
<211> 30
<212> DNA
<213> Artificial sequence
<220>
<223> RNA probe
<400> 42
gacaugcugg uguaucuugu cuuuagacug 30
<210> 43
<211> 63
<212> DNA
<213> Artificial sequence
<220>
<223> Dest-a
<400> 43
gaagacataa actccgtggt cacatacaga gaccaaggtc tcagtggtca catacatgtc 60
ttc 63
<210> 44
<211> 47
<212> DNA
<213> Artificial sequence
<220>
<223> Dest-b
<400> 44
gaagacatat acagagacca aggtctcagt ggtgacataa tgtcttc 47
<210> 45
<211> 47
<212> DNA
<213> Artificial sequence
<220>
<223> Dest-c
<400> 45
gaagacatca tacagagacc aaggtctcag tggttacata tgtcttc 47
<210> 46
<211> 47
<212> DNA
<213> Artificial sequence
<220>
<223> Dest-d
<400> 46
gaagacatac atacagagac caaggtctca gtggttacaa tgtcttc 47
<210> 47
<211> 47
<212> DNA
<213> Artificial sequence
<220>
<223> Dest-e
<400> 47
gaagacatta catacagaga ccaaggtctc agtggtgaca tgtcttc 47
<210> 48
<211> 47
<212> DNA
<213> Artificial sequence
<220>
<223> Dest-f
<400> 48
gaagacattg acatacagag accaaggtct cagtggttaa tgtcttc 47
<210> 49
<211> 47
<212> DNA
<213> Artificial sequence
<220>
<223> Dest-g
<400> 49
gaagacatgt tacatacaga gaccaaggtc tcagtggtca tgtcttc 47
<210> 50
<211> 47
<212> DNA
<213> Artificial sequence
<220>
<223> Dest-h
<400> 50
gaagacatgg tcacatacag agaccaaggt ctcagtggta tgtcttc 47
<210> 51
<211> 47
<212> DNA
<213> Artificial sequence
<220>
<223> Dest-i
<400> 51
gaagacattg gttacataca gagaccaagg tctcagtgga tgtcttc 47
<210> 52
<211> 45
<212> DNA
<213> Artificial sequence
<220>
<223> Dest-j
<400> 52
gaagacatgt ggtgacatac agagaccaag gtctcagtgg tcttc 45
<210> 53
<211> 5
<212> PRT
<213> Artificial sequence
<220>
<223> signal sequence
<400> 53
Met Gly Asn Ser Val
1 5
<210> 54
<211> 22
<212> PRT
<213> Artificial sequence
<220>
<223> signal sequence
<400> 54
Glu Leu Thr Tyr Asn Thr Leu Ile Ser Gly Leu Gly Lys Ala Gly Arg
1 5 10 15
Ala Arg Asp Pro Pro Val
20
<210> 55
<211> 4
<212> PRT
<213> Artificial sequence
<220>
<223> signal sequence
<400> 55
Lys Asp Glu Leu
1
<210> 56
<211> 4
<212> PRT
<213> Artificial sequence
<220>
<223> signal sequence
<400> 56
Lys Glu Glu Leu
1
<210> 57
<211> 19
<212> PRT
<213> Artificial sequence
<220>
<223> signal sequence
<400> 57
Met Gly Trp Ser Cys Ile Ile Leu Phe Leu Val Ala Thr Ala Thr Gly
1 5 10 15
Ala His Ser
<210> 58
<211> 35
<212> PRT
<213> Artificial Sequence
<220>
<223> 1st_A (v3.2_A)
<400> 58
Val Thr Tyr Thr Thr Asn Ile Asp Gln Leu Cys Lys Ala Gly Lys Val
1 5 10 15
Asp Glu Ala Leu Glu Leu Phe Lys Glu Met Arg Ser Lys Gly Val Lys
20 25 30
Pro Asn Val
35
<210> 59
<211> 35
<212> PRT
<213> Artificial Sequence
<220>
<223> 1st_G (v3.2_G)
<400> 59
Val Thr Tyr Thr Thr Asn Ile Asp Gln Leu Cys Lys Ala Gly Lys Val
1 5 10 15
Asp Glu Ala Leu Glu Leu Phe Asp Glu Met Lys Glu Arg Gly Ile Lys
20 25 30
Pro Asp Val
35
<210> 60
<211> 35
<212> PRT
<213> Artificial Sequence
<220>
<223> 1st_U (v3.2_U)
<400> 60
Val Thr Tyr Asn Thr Asn Ile Asp Gln Leu Cys Lys Ala Gly Arg Leu
1 5 10 15
Asp Glu Ala Glu Glu Leu Leu Glu Glu Met Glu Glu Lys Gly Ile Lys
20 25 30
Pro Asp Val
35
<210> 61
<211> 2271
<212> DNA
<213> Artificial Sequence
<220>
<223> v2_polypucleotide
<400> 61
atgggtcatc accatcatca tcacgggtcc ctgcaggact cagaagtcaa tcaagaagct 60
aagccagagg tcaagccaga agtcaagcct gagactcaca tcaatttaaa ggtgtccgat 120
ggatcttcag agatcttctt caagatcaaa aagaccactc ctttaagaag gctgatggaa 180
gcgttcgcta aaagacaggg taaggaaatg gactccttaa gattcttgta cgacggtatt 240
agaattcaag ctgatcaggc ccctgaagat ttggacatgg aggataacga tattattgag 300
gctcaccgcg aacagattgg aggtatggga aactccgtgg tcacatacaa caccctgatc 360
gacggcctgt gcaagagcgg caagatcgag gaggccctga agctgttcaa ggagatggag 420
gagaagggca tcacccccag cgtggtcaca tacaccacac tgatcgacgg actgtgtaaa 480
gccggcgacg tggacgaagc cctcgagctg ttcaaagaga tgcggagcaa gggcgtgaag 540
cccaacgtgg tgacatacac caccctgatc gacggcctgt gcaaggccgg caaagtggac 600
gaggccctgg agctgttcga cgagatgaag gagaggggca tcaagcccga cgtggtcaca 660
tacaacaccc tgatcgacgg cctgtgcaag agcggcaaga tcgaggaggc cctgaagctg 720
ttcaaggaga tggaggagaa gggcatcacc cccagcgtgg ttacatacac cacactgatc 780
gacggactgt gtaaagccgg cgacgtggac gaagccctcg agctgttcaa agagatgcgg 840
agcaagggcg tgaagcccaa cgtggtcaca tacaccaccc tgatcgacgg cctgtgcaag 900
gccggcaagg tggatgaggc cctggagctg ttcgacgaga tgaaggagag gggcatcaag 960
cccgacgtgg ttacatacaa caccctgatc gacggcctgt gcaagagcgg caagatcgag 1020
gaggccctga agctgttcaa ggagatggag gagaagggca tcacccccag cgtggtcaca 1080
tacaccacac tgatcgacgg actgtgtaaa gccggcgacg tggacgaagc cctcgagctg 1140
ttcaaagaga tgcggagcaa gggcgtgaag cccaacgtgg tgacatacac caccctgatc 1200
gacggcctgt gcaaggccgg caaagtggac gaggccctgg agctgttcga cgagatgaag 1260
gagaggggca tcaagcccga cgtggtcaca tacaacaccc tgatcgacgg cctgtgcaag 1320
agcggcaaga tcgaggaggc cctgaagctg ttcaaggaga tggaggagaa gggcatcacc 1380
cccagcgtgg ttacatacac cacactgatc gacggactgt gtaaagccgg cgacgtggac 1440
gaagccctcg agctgttcaa agagatgcgg agcaagggcg tgaagcccaa cgtggtcaca 1500
tacaccaccc tgatcgacgg cctgtgcaag gccggcaagg tggatgaggc cctggagctg 1560
ttcgacgaga tgaaggagag gggcatcaag cccgacgtgg tcacatacaa caccctgatc 1620
gacggcctgt gcaagagcgg caagatcgag gaggccctga agctgttcaa ggagatggag 1680
gagaagggca tcacccccag cgtggtcaca tacaccacac tgatcgacgg actgtgtaaa 1740
gccggcgacg tggacgaagc cctcgagctg ttcaaagaga tgcggagcaa gggcgtgaag 1800
cccaacgtgg ttacatacac caccctgatc gacggcctgt gcaaggccgg caaagtggac 1860
gaggccctgg agctgttcga cgagatgaag gagaggggca tcaagcccga cgtggtcaca 1920
tacaacaccc tgatcgacgg cctgtgcaag agcggcaaga tcgaggaggc cctgaagctg 1980
ttcaaggaga tggaggagaa gggcatcacc cccagcgtgg tgacatacac cacactgatc 2040
gacggactgt gtaaagccgg cgacgtggac gaagccctcg agctgttcaa agagatgcgg 2100
agcaagggcg tgaagcccaa cgtggtcaca tacaccaccc tgatcgacgg cctgtgcaag 2160
gccggcaagg tggatgaggc cctggagctg ttcgacgaga tgaaggagag gggcatcaag 2220
cccgacgagc tgacctacaa caccctgatc agcggcctgg gcaaggccgg c 2271
<210> 62
<211> 757
<212> PRT
<213> Artificial Sequence
<220>
<223> v2_protein
<400> 62
Met Gly His His His His His His Gly Ser Leu Gln Asp Ser Glu Val
1 5 10 15
Asn Gln Glu Ala Lys Pro Glu Val Lys Pro Glu Val Lys Pro Glu Thr
20 25 30
His Ile Asn Leu Lys Val Ser Asp Gly Ser Ser Glu Ile Phe Phe Lys
35 40 45
Ile Lys Lys Thr Thr Pro Leu Arg Arg Leu Met Glu Ala Phe Ala Lys
50 55 60
Arg Gln Gly Lys Glu Met Asp Ser Leu Arg Phe Leu Tyr Asp Gly Ile
65 70 75 80
Arg Ile Gln Ala Asp Gln Ala Pro Glu Asp Leu Asp Met Glu Asp Asn
85 90 95
Asp Ile Ile Glu Ala His Arg Glu Gln Ile Gly Gly Met Gly Asn Ser
100 105 110
Val Val Thr Tyr Asn Thr Leu Ile Asp Gly Leu Cys Lys Ser Gly Lys
115 120 125
Ile Glu Glu Ala Leu Lys Leu Phe Lys Glu Met Glu Glu Lys Gly Ile
130 135 140
Thr Pro Ser Val Val Thr Tyr Thr Thr Leu Ile Asp Gly Leu Cys Lys
145 150 155 160
Ala Gly Asp Val Asp Glu Ala Leu Glu Leu Phe Lys Glu Met Arg Ser
165 170 175
Lys Gly Val Lys Pro Asn Val Val Thr Tyr Thr Thr Leu Ile Asp Gly
180 185 190
Leu Cys Lys Ala Gly Lys Val Asp Glu Ala Leu Glu Leu Phe Asp Glu
195 200 205
Met Lys Glu Arg Gly Ile Lys Pro Asp Val Val Thr Tyr Asn Thr Leu
210 215 220
Ile Asp Gly Leu Cys Lys Ser Gly Lys Ile Glu Glu Ala Leu Lys Leu
225 230 235 240
Phe Lys Glu Met Glu Glu Lys Gly Ile Thr Pro Ser Val Val Thr Tyr
245 250 255
Thr Thr Leu Ile Asp Gly Leu Cys Lys Ala Gly Asp Val Asp Glu Ala
260 265 270
Leu Glu Leu Phe Lys Glu Met Arg Ser Lys Gly Val Lys Pro Asn Val
275 280 285
Val Thr Tyr Thr Thr Leu Ile Asp Gly Leu Cys Lys Ala Gly Lys Val
290 295 300
Asp Glu Ala Leu Glu Leu Phe Asp Glu Met Lys Glu Arg Gly Ile Lys
305 310 315 320
Pro Asp Val Val Thr Tyr Asn Thr Leu Ile Asp Gly Leu Cys Lys Ser
325 330 335
Gly Lys Ile Glu Glu Ala Leu Lys Leu Phe Lys Glu Met Glu Glu Lys
340 345 350
Gly Ile Thr Pro Ser Val Val Thr Tyr Thr Thr Leu Ile Asp Gly Leu
355 360 365
Cys Lys Ala Gly Asp Val Asp Glu Ala Leu Glu Leu Phe Lys Glu Met
370 375 380
Arg Ser Lys Gly Val Lys Pro Asn Val Val Thr Tyr Thr Thr Leu Ile
385 390 395 400
Asp Gly Leu Cys Lys Ala Gly Lys Val Asp Glu Ala Leu Glu Leu Phe
405 410 415
Asp Glu Met Lys Glu Arg Gly Ile Lys Pro Asp Val Val Thr Tyr Asn
420 425 430
Thr Leu Ile Asp Gly Leu Cys Lys Ser Gly Lys Ile Glu Glu Ala Leu
435 440 445
Lys Leu Phe Lys Glu Met Glu Glu Lys Gly Ile Thr Pro Ser Val Val
450 455 460
Thr Tyr Thr Thr Leu Ile Asp Gly Leu Cys Lys Ala Gly Asp Val Asp
465 470 475 480
Glu Ala Leu Glu Leu Phe Lys Glu Met Arg Ser Lys Gly Val Lys Pro
485 490 495
Asn Val Val Thr Tyr Thr Thr Leu Ile Asp Gly Leu Cys Lys Ala Gly
500 505 510
Lys Val Asp Glu Ala Leu Glu Leu Phe Asp Glu Met Lys Glu Arg Gly
515 520 525
Ile Lys Pro Asp Val Val Thr Tyr Asn Thr Leu Ile Asp Gly Leu Cys
530 535 540
Lys Ser Gly Lys Ile Glu Glu Ala Leu Lys Leu Phe Lys Glu Met Glu
545 550 555 560
Glu Lys Gly Ile Thr Pro Ser Val Val Thr Tyr Thr Thr Leu Ile Asp
565 570 575
Gly Leu Cys Lys Ala Gly Asp Val Asp Glu Ala Leu Glu Leu Phe Lys
580 585 590
Glu Met Arg Ser Lys Gly Val Lys Pro Asn Val Val Thr Tyr Thr Thr
595 600 605
Leu Ile Asp Gly Leu Cys Lys Ala Gly Lys Val Asp Glu Ala Leu Glu
610 615 620
Leu Phe Asp Glu Met Lys Glu Arg Gly Ile Lys Pro Asp Val Val Thr
625 630 635 640
Tyr Asn Thr Leu Ile Asp Gly Leu Cys Lys Ser Gly Lys Ile Glu Glu
645 650 655
Ala Leu Lys Leu Phe Lys Glu Met Glu Glu Lys Gly Ile Thr Pro Ser
660 665 670
Val Val Thr Tyr Thr Thr Leu Ile Asp Gly Leu Cys Lys Ala Gly Asp
675 680 685
Val Asp Glu Ala Leu Glu Leu Phe Lys Glu Met Arg Ser Lys Gly Val
690 695 700
Lys Pro Asn Val Val Thr Tyr Thr Thr Leu Ile Asp Gly Leu Cys Lys
705 710 715 720
Ala Gly Lys Val Asp Glu Ala Leu Glu Leu Phe Asp Glu Met Lys Glu
725 730 735
Arg Gly Ile Lys Pro Asp Glu Leu Thr Tyr Asn Thr Leu Ile Ser Gly
740 745 750
Leu Gly Lys Ala Gly
755
<210> 63
<211> 2274
<212> DNA
<213> Artificial Sequence
<220>
<223> v3.2_polypucleotide
<400> 63
atgggtcatc accatcatca tcacgggtcc ctgcaggact cagaagtcaa tcaagaagct 60
aagccagagg tcaagccaga agtcaagcct gagactcaca tcaatttaaa ggtgtccgat 120
ggatcttcag agatcttctt caagatcaaa aagaccactc ctttaagaag gctgatggaa 180
gcgttcgcta aaagacaggg taaggaaatg gactccttaa gattcttgta cgacggtatt 240
agaattcaag ctgatcaggc ccctgaagat ttggacatgg aggataacga tattattgag 300
gctcaccgcg aacagattgg aggtatggga aactccgtgg tcacatacaa caccaacatc 360
gaccagctgt gcaagagcgg caagatcgag gaggccctga agctgttcaa ggagatggag 420
gagaagggca tcacccccag cgtggtcaca tacaccacac tgatcgacgg actgtgtaaa 480
gccggcgacg tggacgaagc cctcgagctg ttcaaagaga tgcggagcaa gggcgtgaag 540
cccaacgtgg tgacatacac caccctgatc gacggcctgt gcaaggccgg caaagtggac 600
gaggccctgg agctgttcga cgagatgaag gagaggggca tcaagcccga cgtggtcaca 660
tacaacaccc tgatcgacgg cctgtgcaag agcggcaaga tcgaggaggc cctgaagctg 720
ttcaaggaga tggaggagaa gggcatcacc cccagcgtgg ttacatacac cacactgatc 780
gacggactgt gtaaagccgg cgacgtggac gaagccctcg agctgttcaa agagatgcgg 840
agcaagggcg tgaagcccaa cgtggtcaca tacaccaccc tgatcgacgg cctgtgcaag 900
gccggcaagg tggatgaggc cctggagctg ttcgacgaga tgaaggagag gggcatcaag 960
cccgacgtgg ttacatacaa caccctgatc gacggcctgt gcaagagcgg caagatcgag 1020
gaggccctga agctgttcaa ggagatggag gagaagggca tcacccccag cgtggtcaca 1080
tacaccacac tgatcgacgg actgtgtaaa gccggcgacg tggacgaagc cctcgagctg 1140
ttcaaagaga tgcggagcaa gggcgtgaag cccaacgtgg tgacatacac caccctgatc 1200
gacggcctgt gcaaggccgg caaagtggac gaggccctgg agctgttcga cgagatgaag 1260
gagaggggca tcaagcccga cgtggtcaca tacaacaccc tgatcgacgg cctgtgcaag 1320
agcggcaaga tcgaggaggc cctgaagctg ttcaaggaga tggaggagaa gggcatcacc 1380
cccagcgtgg ttacatacac cacactgatc gacggactgt gtaaagccgg cgacgtggac 1440
gaagccctcg agctgttcaa agagatgcgg agcaagggcg tgaagcccaa cgtggtcaca 1500
tacaccaccc tgatcgacgg cctgtgcaag gccggcaagg tggatgaggc cctggagctg 1560
ttcgacgaga tgaaggagag gggcatcaag cccgacgtgg tcacatacaa caccctgatc 1620
gacggcctgt gcaagagcgg caagatcgag gaggccctga agctgttcaa ggagatggag 1680
gagaagggca tcacccccag cgtggtcaca tacaccacac tgatcgacgg actgtgtaaa 1740
gccggcgacg tggacgaagc cctcgagctg ttcaaagaga tgcggagcaa gggcgtgaag 1800
cccaacgtgg ttacatacac caccctgatc gacggcctgt gcaaggccgg caaagtggac 1860
gaggccctgg agctgttcga cgagatgaag gagaggggca tcaagcccga cgtggtcaca 1920
tacaacaccc tgatcgacgg cctgtgcaag agcggcaaga tcgaggaggc cctgaagctg 1980
ttcaaggaga tggaggagaa gggcatcacc cccagcgtgg tgacatacac cacactgatc 2040
gacggactgt gtaaagccgg cgacgtggac gaagccctcg agctgttcaa agagatgcgg 2100
agcaagggcg tgaagcccaa cgtggtcaca tacaccaccc tgatcgacgg cctgtgcaag 2160
gccggcaagg tggatgaggc cctggagctg ttcgacgaga tgaaggagag gggcatcaag 2220
cccgacgagg agctgaccta caacaccctg atcagcggcc tgggcaaggc cggc 2274
<210> 64
<211> 757
<212> PRT
<213> Artificial Sequence
<220>
<223> v3.2_protein
<400> 64
Met Gly His His His His His His Gly Ser Leu Gln Asp Ser Glu Val
1 5 10 15
Asn Gln Glu Ala Lys Pro Glu Val Lys Pro Glu Val Lys Pro Glu Thr
20 25 30
His Ile Asn Leu Lys Val Ser Asp Gly Ser Ser Glu Ile Phe Phe Lys
35 40 45
Ile Lys Lys Thr Thr Pro Leu Arg Arg Leu Met Glu Ala Phe Ala Lys
50 55 60
Arg Gln Gly Lys Glu Met Asp Ser Leu Arg Phe Leu Tyr Asp Gly Ile
65 70 75 80
Arg Ile Gln Ala Asp Gln Ala Pro Glu Asp Leu Asp Met Glu Asp Asn
85 90 95
Asp Ile Ile Glu Ala His Arg Glu Gln Ile Gly Gly Met Gly Asn Ser
100 105 110
Val Val Thr Tyr Asn Thr Asn Ile Asp Gln Leu Cys Lys Ser Gly Lys
115 120 125
Ile Glu Glu Ala Leu Lys Leu Phe Lys Glu Met Glu Glu Lys Gly Ile
130 135 140
Thr Pro Ser Val Val Thr Tyr Thr Thr Leu Ile Asp Gly Leu Cys Lys
145 150 155 160
Ala Gly Asp Val Asp Glu Ala Leu Glu Leu Phe Lys Glu Met Arg Ser
165 170 175
Lys Gly Val Lys Pro Asn Val Val Thr Tyr Thr Thr Leu Ile Asp Gly
180 185 190
Leu Cys Lys Ala Gly Lys Val Asp Glu Ala Leu Glu Leu Phe Asp Glu
195 200 205
Met Lys Glu Arg Gly Ile Lys Pro Asp Val Val Thr Tyr Asn Thr Leu
210 215 220
Ile Asp Gly Leu Cys Lys Ser Gly Lys Ile Glu Glu Ala Leu Lys Leu
225 230 235 240
Phe Lys Glu Met Glu Glu Lys Gly Ile Thr Pro Ser Val Val Thr Tyr
245 250 255
Thr Thr Leu Ile Asp Gly Leu Cys Lys Ala Gly Asp Val Asp Glu Ala
260 265 270
Leu Glu Leu Phe Lys Glu Met Arg Ser Lys Gly Val Lys Pro Asn Val
275 280 285
Val Thr Tyr Thr Thr Leu Ile Asp Gly Leu Cys Lys Ala Gly Lys Val
290 295 300
Asp Glu Ala Leu Glu Leu Phe Asp Glu Met Lys Glu Arg Gly Ile Lys
305 310 315 320
Pro Asp Val Val Thr Tyr Asn Thr Leu Ile Asp Gly Leu Cys Lys Ser
325 330 335
Gly Lys Ile Glu Glu Ala Leu Lys Leu Phe Lys Glu Met Glu Glu Lys
340 345 350
Gly Ile Thr Pro Ser Val Val Thr Tyr Thr Thr Leu Ile Asp Gly Leu
355 360 365
Cys Lys Ala Gly Asp Val Asp Glu Ala Leu Glu Leu Phe Lys Glu Met
370 375 380
Arg Ser Lys Gly Val Lys Pro Asn Val Val Thr Tyr Thr Thr Leu Ile
385 390 395 400
Asp Gly Leu Cys Lys Ala Gly Lys Val Asp Glu Ala Leu Glu Leu Phe
405 410 415
Asp Glu Met Lys Glu Arg Gly Ile Lys Pro Asp Val Val Thr Tyr Asn
420 425 430
Thr Leu Ile Asp Gly Leu Cys Lys Ser Gly Lys Ile Glu Glu Ala Leu
435 440 445
Lys Leu Phe Lys Glu Met Glu Glu Lys Gly Ile Thr Pro Ser Val Val
450 455 460
Thr Tyr Thr Thr Leu Ile Asp Gly Leu Cys Lys Ala Gly Asp Val Asp
465 470 475 480
Glu Ala Leu Glu Leu Phe Lys Glu Met Arg Ser Lys Gly Val Lys Pro
485 490 495
Asn Val Val Thr Tyr Thr Thr Leu Ile Asp Gly Leu Cys Lys Ala Gly
500 505 510
Lys Val Asp Glu Ala Leu Glu Leu Phe Asp Glu Met Lys Glu Arg Gly
515 520 525
Ile Lys Pro Asp Val Val Thr Tyr Asn Thr Leu Ile Asp Gly Leu Cys
530 535 540
Lys Ser Gly Lys Ile Glu Glu Ala Leu Lys Leu Phe Lys Glu Met Glu
545 550 555 560
Glu Lys Gly Ile Thr Pro Ser Val Val Thr Tyr Thr Thr Leu Ile Asp
565 570 575
Gly Leu Cys Lys Ala Gly Asp Val Asp Glu Ala Leu Glu Leu Phe Lys
580 585 590
Glu Met Arg Ser Lys Gly Val Lys Pro Asn Val Val Thr Tyr Thr Thr
595 600 605
Leu Ile Asp Gly Leu Cys Lys Ala Gly Lys Val Asp Glu Ala Leu Glu
610 615 620
Leu Phe Asp Glu Met Lys Glu Arg Gly Ile Lys Pro Asp Val Val Thr
625 630 635 640
Tyr Asn Thr Leu Ile Asp Gly Leu Cys Lys Ser Gly Lys Ile Glu Glu
645 650 655
Ala Leu Lys Leu Phe Lys Glu Met Glu Glu Lys Gly Ile Thr Pro Ser
660 665 670
Val Val Thr Tyr Thr Thr Leu Ile Asp Gly Leu Cys Lys Ala Gly Asp
675 680 685
Val Asp Glu Ala Leu Glu Leu Phe Lys Glu Met Arg Ser Lys Gly Val
690 695 700
Lys Pro Asn Val Val Thr Tyr Thr Thr Leu Ile Asp Gly Leu Cys Lys
705 710 715 720
Ala Gly Lys Val Asp Glu Ala Leu Glu Leu Phe Asp Glu Met Lys Glu
725 730 735
Arg Gly Ile Lys Pro Asp Glu Leu Thr Tyr Asn Thr Leu Ile Ser Gly
740 745 750
Leu Gly Lys Ala Gly
Claims (18)
- 다음 중 어느 하나의 PPR 모티프:
(C-1) 서열번호 4 내지 7 중 어느 하나의 서열로 구성되는 PPR 모티프;
(C-2) 서열번호 4 내지 7 중 어느 하나의 서열에 있어서 1, 4, 6, 및 34번 위치 아미노산 이외의 아미노산 1 내지 9개가 치환, 결실 또는 부가된 서열로 구성되고 시토신 결합성인 PPR 모티프;
(C-3) 서열번호 4 내지 7 중 어느 하나의 서열과 최소한 80%의 서열 동일성(sequence identity)을 가지되, 1, 4, 6, 및 34번 위치의 아미노산은 동일하고 시토신 결합성인 PPR 모티프;
(A-1) 서열번호 8의 서열로 구성되는 PPR 모티프에서 6번 위치의 아미노산이 아스파라긴 또는 아스파라긴산으로 치환된 PPR 모티프;
(A-2)(A-1)의 서열에 있어서 1, 4, 6, 및 34번 위치 아미노산 이외의 아미노산 1개 내지 9개가 치환, 결실 또는 부가된 서열로 구성되고 아데닌 결합성인 PPR 모티프;
(A-3)(A-1)의 서열과 최소한 80%의 서열 동일성을 가지되, 1, 4, 6, 및 34번 위치의 아미노산은 동일하고 아데닌 결합성인 PPR 모티프;
(G-1) 서열번호 9의 서열로 구성되는 PPR 모티프에서 6번 위치의 아미노산이 아스파라긴 또는 아스파라긴산으로 치환된 PPR 모티프;
(G-2)(G-1)의 서열에 있어서 1, 4, 6, 및 34번 위치 아미노산 이외의 아미노산 1개 내지 9개가 치환, 결실 또는 부가된 서열로 구성되고 구아닌 결합성인 PPR 모티프;
(G-3)(G-1)의 서열과 최소한 80%의 서열 동일성을 가지되, 1, 4, 6, 및 34번 위치의 아미노산은 동일하고 구아닌 결합성인 PPR 모티프;
(U-1) 서열번호 10의 서열로 구성되는 PPR 모티프에서 6번 위치의 아미노산이 아스파라긴 또는 아스파라긴산으로 치환된 PPR 모티프;
(U-2)(U-1)의 서열에 있어서 1, 4, 6, 및 34번 위치 아미노산 이외의 아미노산 1개 내지 9개가 치환, 결실 또는 부가된 서열로 구성되고 우라실 결합성인 PPR 모티프;
(U-3)(U-1)의 서열과 최소한 80%의 서열 동일성을 가지되, 1, 4, 6, 및 34번 위치의 아미노산은 동일하고 우라실 결합성인 PPR 모티프.
- 다음 중 어느 하나의 PPR 모티프:
(C-1) 서열번호 4 내지 7 중 어느 하나의 서열로 구성되는 PPR 모티프;
(C-2) 서열번호 4 내지 7 중 어느 하나의 서열에 있어서 1, 4, 6, 9, 및 34번 위치 아미노산 이외의 아미노산 1개 내지 9개가 치환, 결실 또는 부가된 서열로 구성되고 시토신 결합성인 PPR 모티프;
(C-3) 서열번호 4 내지 7 중 어느 하나의 서열과 최소한 80%의 서열 동일성을 가지되, 1, 4, 6, 9, 및 34번 위치의 아미노산은 동일하고 시토신 결합성인 PPR 모티프;
(A-1) 서열번호 8의 서열에 있어서 6번 및 9번 위치의 아미노산이 아래에 정의된 조합 중 어느 하나를 만족하도록 치환된 PPR 모티프;
(A-2)(A-1)의 서열에 있어서 1, 4, 6, 9, 및 34번 위치 아미노산 이외의 아미노산 1개 내지 9개가 치환, 결실 또는 부가된 서열로 구성되고 아데닌 결합성인 PPR 모티프;
(A-3)(A-1)의 서열과 최소한 80%의 서열 동일성을 가지되, 1, 4, 6, 9, 및 34번 위치의 아미노산은 동일하고 아데닌 결합성인 PPR 모티프;
(G-1) 서열번호 9의 서열에 있어서 6번 및 9번 위치의 아미노산이 아래에 정의된 조합 중 어느 하나를 만족하도록 치환된 서열로 구성되는 PPR 모티프;
(G-2)(G-1)의 서열에 있어서 1, 4, 6, 9, 및 34번 위치 아미노산 이외의 아미노산 1개 내지 9개가 치환, 결실 또는 부가된 서열로 구성되고 구아닌 결합성인 PPR 모티프;
(G-3)(G-1)의 서열과 최소한 80%의 서열 동일성을 가지되, 1, 4, 6, 9, 및 34번 위치의 아미노산은 동일하고 구아닌 결합성인 PPR 모티프;
(U-1) 서열번호 10의 서열에 있어서 6번 및 9번 위치의 아미노산이 아래에 정의된 조합 중 어느 하나를 만족하도록 치환된 서열로 구성되는 PPR 모티프;
(U-2)(U-1)의 서열에 있어서 1, 4, 6, 9, 및 34번 위치 아미노산 이외의 아미노산 1개 내지 9개가 치환, 결실 또는 부가된 서열로 구성되고 우라실 결합성인 PPR 모티프;
(U-3)(U-1)의 서열과 최소한 80%의 서열 동일성을 가지되, 1, 4, 6, 9, 및 34번 위치의 아미노산은 동일하고 우라실 결합성인 PPR 모티프
·6번 위치의 아미노산이 아스파라긴이고, 9번 위치의 아미노산이 글루탐산인 조합
·6번 위치의 아미노산이 아스파라긴이며, 9번 위치의 아미노산이 글루타민인 조합
·6번 위치의 아미노산이 아스파라긴이고, 9번 위치의 아미노산이 리신인 조합
·6번 위치의 아미노산이 아스파라긴산이며, 9번 위치의 아미노산이 글리신인 조합.
- 제1항 또는 제2항에 있어서,
다음 중 어느 하나인 PPR 모티프:
(C-4) 서열번호 4의 서열로 구성되는 PPR 모티프;
(A-4) 서열번호 58의 서열로 구성되는 PPR 모티프;
(G-4) 서열번호 59의 서열로 구성되는 PPR 모티프;
(U-4) 서열번호 60의 서열로 구성되는 PPR 모티프.
- 제1항 내지 제3항의 어느 한 항에 기재된 PPR 모티프의, PPR 단백질의 N-말단으로부터 1번째 PPR 모티프로서 사용하기 위한 용도.
- 제4항에 있어서,
PPR 단백질의 응집성을 감소시키기 위한 것을 특징으로 하는 용도.
- 하기 일반식(1)로 나타내는 PPR 모티프를 1개 내지 30개 포함하고 특정 염기서열을 가지는 표적핵산과 결합 가능하며, N-말단 측으로부터 1번째 PPR 모티프(M1)의 A6 아미노산이 친수성 아미노산인 단백질:
.... (1)
상기 일반식(1)에서,
Helix A는 12개 아미노산 길이의 α-헬릭스 구조를 형성할 수 있는 부분으로 하기 일반식(2)로 나타내고,
.... (2)
(상기 일반식(2)에서, A1 ~ A12는 각각 독립적으로 아미노산을 나타낸다)
X는 존재하지 않거나 1개 내지 9개 아미노산 길이로 구성되며;
Helix B는 11개 내지 13개 아미노산 길이로 이루어진 α-헬릭스 구조를 형성할 수 있는 부분이고;
L은 2개 내지 7개 아미노산 길이의, 하기 일반식(3)으로 나타내는 부분이다.
.... (3)
(상기 일반식(3)에서, 각 아미노산은 C-말단 측으로부터 "i"(-1), "ii"(-2)으로 넘버링되고, Liii 내지 Lvii는 존재하지 않을 수도 있다)
- 제6항에 있어서,
M1의 A9 아미노산이 친수성 아미노산 또는 글리신인 것을 특징으로 하는 단백질.
- 제6항 또는 제7항에 있어서,
M1의 A6 아미노산이 아스파라긴 또는 아스파라긴산인 것을 특징으로 하는 단백질.
- 제6항 내지 제8항 중 어느 한 항에 있어서,
M1의 A9 아미노산이 글루타민, 글루타민산, 리신 또는 글리신인 것을 특징으로 하는 단백질.
- 제6항 내지 제9항 중 어느 한 항에 있어서,
M1의 A6 아미노산 및 M1의 A9 아미노산이 다음 중 어느 하나의 조합인 것을 특징으로 하는 단백질:
·A6 아미노산이 아스파라긴이고, A9 아미노산이 글루탐산인 조합
·A6 아미노산이 아스파라긴이고, A9 아미노산이 글루타민인 조합
·A6 아미노산이 아스파라긴이고, A9 아미노산이 리신인 조합
·A6 아미노산이 아스파라긴산이고, A9 아미노산이 글리신인 조합.
- 형광 단백질, 핵이행 신호 펩티드 및 태그 단백질로 이루어진 군에서 선택되는 적어도 하나와, 제1항 내지 제3항 중 어느 한 항에 기재된 PPR 모티프를 N-말단으로부터 1번째 PPR 모티프로서 포함하는 PPR 단백질, 또는 제6항 내지 제10항 중 어느 한 항에 기재된 단백질과의 융합 단백질.
- 제6항에 정의한 PPR 모티프를 포함하는 특정 염기서열을 가지는 표적 핵산과 결합 가능한 PPR 단백질의 개질방법에 있어서, N-말단으로부터 1번째 PPR 모티프(M1)의 A6 아미노산을 보다 친수성으로 만드는 것을 특징으로 하는 방법.
- 제1항 내지 제3항 중 어느 한 항에 기재된 PPR 모티프를 N-말단으로부터 1번째 PPR 모티프로 포함하는 PPR 단백질, 제6항 내지 제10항 중 어느 한 항에 기재된 단백질, 또는 제11항에 기재된 융합 단백질을 사용하는 것을 특징으로 하는 핵산의 검출방법.
- 제1항 내지 제3항 중 어느 한 항에 기재된 PPR 모티프, 제1항 내지 제3항 중의 어느 한 항에 기재된 PPR 모티프를 N-말단으로부터 1번째 PPR 모티프로 포함하는 PPR 단백질, 또는 제6항 내지 제10항 중 어느 한 항에 기재된 단백질을 암호화하는 핵산.
- 제14항에 기재된 핵산을 포함하는 벡터.
- 제15항에 기재된 벡터를 포함하는 세포(인간 개체는 제외).
- 제1항 내지 제3항 중 어느 한 항에 기재된 PPR 모티프, 제1항 내지 제3항 중어느 한 항에 기재된 PPR 모티프를 N-말단으로부터 1번째 PPR 모티프로 포함하는 PPR 단백질, 또는 제6항 내지 제10항 중 어느 한 항에 기재된 단백질, 또는 제15항에 기재된 벡터를 이용하는, 핵산의 조작방법(인간 개체에서의 실시를 제외한다).
- 제17항에 기재된 조작방법을 포함하는 생물의 생산방법.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JPJP-P-2019-100553 | 2019-05-29 | ||
JP2019100553 | 2019-05-29 | ||
PCT/JP2020/021473 WO2020241877A1 (ja) | 2019-05-29 | 2020-05-29 | 凝集の少ないpprタンパク質及びその利用 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20220023984A true KR20220023984A (ko) | 2022-03-03 |
Family
ID=73552159
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020217040376A KR20220023984A (ko) | 2019-05-29 | 2020-05-29 | 응집이 적은 피피알 단백질 및 그의 이용 |
Country Status (11)
Country | Link |
---|---|
US (1) | US20220220166A1 (ko) |
EP (1) | EP3977849A4 (ko) |
JP (2) | JP7308468B2 (ko) |
KR (1) | KR20220023984A (ko) |
CN (1) | CN113966340A (ko) |
AU (1) | AU2020283367A1 (ko) |
BR (1) | BR112021023937A2 (ko) |
CA (1) | CA3142303A1 (ko) |
IL (2) | IL288417B1 (ko) |
SG (1) | SG11202113057XA (ko) |
WO (1) | WO2020241877A1 (ko) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7125727B1 (ja) | 2021-09-07 | 2022-08-25 | 国立大学法人千葉大学 | 核酸配列改変用組成物および核酸配列の標的部位を改変する方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013058404A1 (ja) | 2011-10-21 | 2013-04-25 | 国立大学法人九州大学 | Pprモチーフを利用したrna結合性蛋白質の設計方法及びその利用 |
WO2014175284A1 (ja) | 2013-04-22 | 2014-10-30 | 国立大学法人九州大学 | Pprモチーフを利用したdna結合性タンパク質およびその利用 |
KR20190100551A (ko) | 2018-02-19 | 2019-08-29 | 삼성디스플레이 주식회사 | 표시 장치, 이를 포함하는 적층 기판, 및 표시 장치 제조방법 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006188507A (ja) * | 2004-12-10 | 2006-07-20 | Tokyo Univ Of Agriculture & Technology | 蛋白質の溶解度向上方法 |
KR102407776B1 (ko) | 2016-06-03 | 2022-06-10 | 고쿠리쓰다이가쿠호진 규슈다이가쿠 | 표적 mRNA로부터의 단백질 발현량을 향상시키기 위한 융합 단백질 |
EP3498726A4 (en) * | 2016-08-10 | 2020-03-25 | Fujifilm Wako Pure Chemical Corporation | DNA-BINDING PROTEIN WITH PPR MOTIF AND USE OF THE DNA-BINDING PROTEIN |
JP6918686B2 (ja) | 2017-11-28 | 2021-08-11 | 東芝ライフスタイル株式会社 | 冷蔵庫 |
SG11202113055UA (en) * | 2019-05-29 | 2021-12-30 | Editforce Inc | Efficient method for preparing ppr protein and use of the same |
-
2020
- 2020-05-29 EP EP20812826.4A patent/EP3977849A4/en active Pending
- 2020-05-29 JP JP2021521908A patent/JP7308468B2/ja active Active
- 2020-05-29 IL IL288417A patent/IL288417B1/en unknown
- 2020-05-29 AU AU2020283367A patent/AU2020283367A1/en active Pending
- 2020-05-29 CA CA3142303A patent/CA3142303A1/en active Pending
- 2020-05-29 SG SG11202113057XA patent/SG11202113057XA/en unknown
- 2020-05-29 BR BR112021023937A patent/BR112021023937A2/pt unknown
- 2020-05-29 WO PCT/JP2020/021473 patent/WO2020241877A1/ja unknown
- 2020-05-29 CN CN202080040065.2A patent/CN113966340A/zh active Pending
- 2020-05-29 US US17/614,236 patent/US20220220166A1/en active Pending
- 2020-05-29 IL IL312349A patent/IL312349A/en unknown
- 2020-05-29 KR KR1020217040376A patent/KR20220023984A/ko not_active Application Discontinuation
-
2022
- 2022-12-26 JP JP2022208226A patent/JP2023036848A/ja active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013058404A1 (ja) | 2011-10-21 | 2013-04-25 | 国立大学法人九州大学 | Pprモチーフを利用したrna結合性蛋白質の設計方法及びその利用 |
WO2014175284A1 (ja) | 2013-04-22 | 2014-10-30 | 国立大学法人九州大学 | Pprモチーフを利用したdna結合性タンパク質およびその利用 |
KR20190100551A (ko) | 2018-02-19 | 2019-08-29 | 삼성디스플레이 주식회사 | 표시 장치, 이를 포함하는 적층 기판, 및 표시 장치 제조방법 |
Non-Patent Citations (5)
Title |
---|
1. Coquille, S. et al. An Artificial PPR Scaffold for Programmable RNA Recognition. Nature Communications 5, Article number: 5729 (2014) |
2. Shen, C. et al. Specific RNA Recognition by Designer Pentatricopeptide Repeat Protein. Molecular Plant 8, 667-670 (2015) |
3. Shen, C. et al. Structural basis for Specific Single-stranded RNA Recognition by Designer Pentatricopeptide Repeat Proteins. Nature Communications, Volume 7, Article number: 11285 (2016) |
4. Miranda, R. G. et al. RNA-binding Specificity Landscapes of Designer Pentatricopeptide Repeat Proteins Elucidate Principles of PPR-RNA Interactions. Nucleic Acids Research, 46 (5), 2613-2623 (2018) |
5. Yan, J. et al. Delineation of Pentatricopeptide Repeat Codes for Target RNA Prediction. Nucleic Acids Research, gkz 075 (2019) |
Also Published As
Publication number | Publication date |
---|---|
US20220220166A1 (en) | 2022-07-14 |
JP7308468B2 (ja) | 2023-07-14 |
JPWO2020241877A1 (ko) | 2020-12-03 |
EP3977849A4 (en) | 2023-06-28 |
WO2020241877A1 (ja) | 2020-12-03 |
IL312349A (en) | 2024-06-01 |
AU2020283367A1 (en) | 2022-01-06 |
BR112021023937A2 (pt) | 2022-04-19 |
IL288417A (en) | 2022-01-01 |
JP2023036848A (ja) | 2023-03-14 |
IL288417B1 (en) | 2024-06-01 |
EP3977849A1 (en) | 2022-04-06 |
SG11202113057XA (en) | 2021-12-30 |
CA3142303A1 (en) | 2020-12-03 |
CN113966340A (zh) | 2022-01-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Versele et al. | Protein–protein interactions governing septin heteropentamer assembly and septin filament organization in Saccharomyces cerevisiae | |
Grozdanov et al. | SHQ1 is required prior to NAF1 for assembly of H/ACA small nucleolar and telomerase RNPs | |
CN112004932B (zh) | 一种CRISPR/Cas效应蛋白及系统 | |
BR122020018292B1 (pt) | Métodos para controlar uma função de dna tendo uma sequência alvo, para identificar uma base de dna ou sequência de base de dna, e para identificar uma proteína ppr | |
CN112105728A (zh) | CRISPR/Cas效应蛋白及系统 | |
Cornell et al. | Detection of specific protein–protein interactions in nanocages by engineering bipartite FlAsH binding sites | |
Turnšek et al. | Proximity proteomics in a marine diatom reveals a putative cell surface-to-chloroplast iron trafficking pathway | |
JP2023036848A (ja) | 凝集の少ないpprタンパク質及びその利用 | |
JP2023145672A (ja) | 効率的なpprタンパク質の作製方法及びその利用 | |
KR20210062639A (ko) | 신규 뉴클레아제 도메인 및 그 이용 | |
ES2525573T3 (es) | Trampas de SUMO de alta afinidad | |
JP2000508174A (ja) | タンパク質の相互作用を検出するための相互作用トラップシステム | |
KR20080113247A (ko) | 단백질 가용화를 위한 단백질 s 융합물의 용도 | |
KR102407776B1 (ko) | 표적 mRNA로부터의 단백질 발현량을 향상시키기 위한 융합 단백질 | |
CN114057861A (zh) | 一种靶向UBE2C的bio-PROTAC人工蛋白 | |
CA2830805A1 (fr) | Constructions et procede pour reguler l'expression des genes ou pour detecter et controler un locus d'adn chez les eucaryotes | |
US7879578B2 (en) | Self-assembled proteins and related methods and protein structures | |
US20130023643A1 (en) | Nuclear localization signal peptides derived from vp2 protein of chicken anemia virus and uses of said peptides | |
US20230295638A1 (en) | Modular platform for programmable spatiotemporal biomolecule clustering with applications including enhanced metabolic yield | |
JP5371306B2 (ja) | 負の超らせんdna結合ドメイン | |
CN115261359A (zh) | 一种新型crispr酶和系统以及应用 | |
CN115786373A (zh) | 一种用于检测protac分子的重组核酸分子 | |
Fischer | Initial characterization of the ribosome-associated ATP binding cassette (ABC) protein YHIH from E. Coli | |
CN114703215A (zh) | 使用真核细胞发酵表达血管紧张素转化酶2的方法 | |
Witosch | Structural characterization of the Timeless-Tipin-RPA Complex and its interaction with ssDNA |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
A302 | Request for accelerated examination | ||
E902 | Notification of reason for refusal |