KR20220165747A - 표적 rna의 편집방법 - Google Patents

표적 rna의 편집방법 Download PDF

Info

Publication number
KR20220165747A
KR20220165747A KR1020227037296A KR20227037296A KR20220165747A KR 20220165747 A KR20220165747 A KR 20220165747A KR 1020227037296 A KR1020227037296 A KR 1020227037296A KR 20227037296 A KR20227037296 A KR 20227037296A KR 20220165747 A KR20220165747 A KR 20220165747A
Authority
KR
South Korea
Prior art keywords
leu
glu
lys
gly
val
Prior art date
Application number
KR1020227037296A
Other languages
English (en)
Inventor
미즈호 이치노세
베르나드 구트만
유스케 야지
유미 아카이와
야스카 시마지리
타카히로 나카무라
Original Assignee
에딧포스 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 에딧포스 인코포레이티드 filed Critical 에딧포스 인코포레이티드
Publication of KR20220165747A publication Critical patent/KR20220165747A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/415Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/74Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • C12N15/81Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N5/00Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
    • C12N5/10Cells modified by introduction of foreign genetic material
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2510/00Genetically modified cells

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Botany (AREA)
  • Medicinal Chemistry (AREA)
  • Mycology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Cell Biology (AREA)
  • Peptides Or Proteins (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Saccharide Compounds (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

표적 RNA에 포함되어 있는 편집 표적 C를 U로, 또는 편집 표적 U를 C로 변환하는 방법을 제공한다. 하기 a, b, c 및 bc 중 어느 하나의 폴리펩티드로 구성된 DYW 도메인을 포함하는 인공 DYW 단백질을 표적 RNA에 적용하는 것을 특징으로 하는 표적 RNA를 편집하는 방법(서열 중 x는 임의의 아미노산을 나타내고, …는 임의의 폴리펩티드 단편을 나타낸다): a. xa1PGxa2SWIEXa3-xa16HP…HxaaE…Cxa17xa18CH…DYW를 가지고 서열번호: 1의 서열과 최소한 40%의 서열 동일성을 가지며, C-to-U/U-to-C 편집활성을 가지는 폴리펩티드; b. xb1PGxb2SWWTDxb3-xb16HP…HxbbE…Cxb17xb18CH…DYW를 가지고 서열번호: 2의 서열과 최소한 40%의 서열 동일성을 가지며, C-to-U/U-to-C 편집활성을 가지는 폴리펩티드; c. KPAxc1Axc2IExc3…HxccE…Cxc4xc5CH…xc6xc7xc8을 가지고 서열번호: 3의 서열과 최소한 40%의 서열 동일성을 가지며, C-to-U/U-to-C 편집활성을 가지는 폴리펩티드; 및, bc. xb1PGxb2SWWTDxb3-xb16HP…HxccE…Cxc4xc5CH…Dxbc1xbc2를 가지고 서열번호: 2의 서열과 최소한 40%의 서열 동일성을 가지며, C-to-U/U-to-C 편집활성을 가지는 폴리펩티드.

Description

표적 RNA의 편집방법
본 발명은 표적 RNA에 결합가능한 단백질을 이용하는 RNA 편집기술에 관한 것이다. 본 발명은 의료(창약지원, 치료), 농업(농수축산물 생산, 육종), 화학(생물학적 물질생산) 등의 폭넓은 분야에서 유용하다.
식물의 미토콘드리아 및 엽록체에서는 게놈 중의 특정 염기가 RNA 수준에서 치환되는 RNA 편집(RNA editing)이 빈번하게 일어나며, 이 현상에 RNA 결합 단백질인 펜타트리코펩티드 리피트(pentatricopeptide repeat, PPR) 단백질이 관여하고 있는 것으로 알려져 있다.
PPR 단백질은 이 단백질을 구성하는 PPR 모티프의 구조에 따라, P와 PLS의 두 패밀리로 분류된다(참조: 비특허문헌 1). P클래스의 PPR 단백질이 표준 35개 아미노산 PPR 모티프(P)의 단순 반복으로 구성된 반면, PLS 단백질은 P 이외에 이와 유사한 L 및 S로 불리는 2가지 모티프를 포함한다. PLS 단백질의 PPR 어레이(PPR 모티프의 나열)는 P1(약 35개 아미노산), L1(약 35개 아미노산), 및 S1(약 31개 아미노산)의 3가지 PPR 모티프가 P-L-S의 반복단위로 구성되며, 그 P1L1S1의 C-말단측에 약간 서열이 다른 P-L-S, 즉 P2(35개 아미노산), L2(36개 아미노산), 및 S2(32개 아미노산) 모티프가 이어진다. 또한, P-L-S의 반복단위로 구성되어 있는 것과는 별도로, SS(31개 아미노산)가 반복되고 있는 경우도 있다. 아울러, 이 마지막 P2L2S2 모티프의 C-말단에 E1 및 E2라고 불리는 2개의 PPR 유사 모티프(PPR-like motif), 및 136개 아미노산의 시티딘 디아미나제 도메인 유사 서열을 가지는 DYW 도메인(DYW domain)이 이어지는 경우가 있다(참조: 비특허문헌 2).
PPR 단백질과 RNA의 상호작용은 각 PPR 모티프 중 여러 곳의 아미노산의 조합에 따라 결합 RNA 염기를 지정하는 PPR 코드에 의해 규정되며, 이들 아미노산이 수소결합을 통해 대응하는 뉴클레오티드와 결합한다(참조: 특허문헌 1, 특허문헌 2, 비특허문헌 3, 비특허문헌 4, 비특허문헌 5, 비특허문헌 6, 비특허문헌 7, 비특허문헌 8).
[특허문헌 1] 국제공개 WO2013/058404 [특허문헌 2] 국제공개 WO 2014/175284
[비특허문헌 1] Lurin, C., Andres, C., Aubourg, S., Bellaoui, M., Bitton, F., Bruyere, C., Caboche, M., Debast, C., Gualberto, J., Hoffmann, B., et al.(2004). Genome-wide analysis of Arabidopsis pentatricopeptide repeat proteins reveals their essential role in organelle biogenesis. Plant Cell 16:2089-2103.    [비특허문헌 2] Cheng, S., Gutmann, B., Zhong, X., Ye, Y., Fisher, M. F., Bai, F., Castleden, I., Song, Y., Song, B., Huang, J., et al.(2016). Redefining the structural motifs that determine RNA binding and RNA editing by pentatricopeptide repeat proteins in land plants. Plant J. 85:532-547.    [비특허문헌 3] Barkan, A., Rojas, M., Fujii, S., Yap, A., Chong, Y. S., Bond, C. S., and Small, I.(2012). A combinatorial amino acid code for RNA recognition by pentatricopeptide repeat proteins. PLoS Genet. 8:e1002910.    [비특허문헌 4] Shen, C., Zhang, D., Guan, Z., Liu, Y., Yang, Z., Yang, Y., Wang, X., Wang, Q. Zhang, Q. Fan, S., et al.(2016). Structural basis for specific single-stranded RNA recognition by designer pentatricopeptide repeat proteins. Nat. Commun. 7:11285.    [비특허문헌 5] Yagi, Y., Hayashi, S., Kobayashi, K., Hirayama, T., and Nakamura, T.(2013). Elucidation of the RNA recognition code for pentatricopeptide repeat proteins involved in organelle RNA editing in plants. PLoS One 8:e57286.    [비특허문헌 6] Kobayashi, T., Yagi, Y., and Nakamura, T.(2019). Comprehensive Prediction of Target RNA Editing Sites for PLS-Class PPR Proteins in Arabidopsis thaliana. Plant Cell Physiol. 60:862-874.    [비특허문헌 7] Yan, J., Yao, Y., Hong, S., Yang, Y., Shen, C., Zhang, Q. Zhang, D., Zou, T., and Yin, P.(2019). Delineation of pentatricopeptide repeat codes for target RNA prediction. Nucleic Acids Res. 47:3728-3738.    [비특허문헌 8] Takenaka, M., Zehrmann, A., Brennicke, A., and Graichen, K.(2013). Improved computational target site prediction for pentatricopeptide repeat RNA editing factors. PLoS One 8:e65343.    [비특허문헌 9] Knie, N., Grewe, F., Fischer, S., and Knoop, V.(2016). Reverse U-to-C editing exceeds C-to-U RNA editing in some ferns-a monilophyte-wide comparison of chloroplast and mitochondrial RNA editing suggests independent evolution of the two processes in both organelles. BMC Evol. Biol. 16:134.    [비특허문헌 10] Gerke, P., Szovenyi, P., Neubauer, A., Lenz, H., Gutmann, B., McDowell, R., Small, I., Schallenberg-Rudinger, M., and Knoop, V.(2020). Towards a plant model for enigmatic U-to-C RNA editing:the organelle genomes, transcriptomes, editomes and candidate RNA editing factors in the hornwort Anthoceros agrestis. New Phytologist 225:1974-1992.    [비특허문헌 11] Gutmann B., Royan S., Schallenberg-Rudinger M., Lenz H., Castleden IR, McDowell R., Vacher MA, Tonti-Filippini J., Bond CS, Knoop V., and Small ID(2020). The Expansion and Diversification of Pentatricopeptide Repeat RNA-Editing Factors in Plants. Molecular Plant 13:215-230    [비특허문헌 12] Oldenkott, B., Yang, Y., Lesch, E., Knoop, V., and Schallenberg-Rudinger, M.(2019). Plant-type pentatricopeptide repeat proteins with a DYW domain drive C-to-U RNA editing in Escherichia coli. Communications Biology 2:85.
육상식물의 세포기관에서는, RNA 염기가 시티딘에서 유리딘으로 치환되는 C-to-U RNA 편집이 일반적으로 일어난다. 그러나, 이끼류(hornwort)나, 소엽류(lycophyte) 및 양치식물(fern) 일부에서는, 유리딘이 시티딘으로 치환되는 U-to-C RNA 편집도 볼 수 있다(참조: 비특허문헌 9). 2개의 서로 다른 생물정보학 연구 결과에 따르면, U-to-C RNA 편집을 가지는 식물에서 표준 DYW 도메인과 서열이 다른 독특한 DYW 도메인이 발견되었다(참조: 비특허문헌 10, 비특허문헌 11).
이끼(Physcomitrella patens) 유래의 2종의 DYW:PG 단백질이 대장균내에서 C로부터 U로의 RNA 편집활성을 나타내는 것이 보고되었다(참조: 비특허문헌 12). 육상식물의 진화 초기에 분화된 식물군에서 DYW 도메인은 크게 두 그룹으로 분류된다. 첫 번째는 DYW:PG/WW 그룹으로 불리우며, 여기에는 표준 DYW 도메인인 DYW:PG형 및 PG 박스에 트립토판(W)이 하나 부가된 DYW:WW형이 포함된다. 두 번째 그룹은 DYW:KP라 불리우며, 이 DYW 도메인은 PG 박스와 C-말단의 3개의 아미노산 서열이 PG/WW 그룹과 다른 서열을 가지며, U-to-C RNA 편집을 가지는 식물에만 존재한다. 임의의 RNA 서열 내의 1개 염기를 특정 염기로 변환하는 기술은 유전자 치료나 산업 이용에 있어서의 유전자 변이도입 기술에 있어서 유용하다. 지금까지 다양한 RNA 결합분자가 개발되었지만, DYW 도메인과 인공적인 RNA 결합 단백질을 이용함으로써 임의의 표적 RNA의 시티딘(C)을 유리딘(U)으로, 혹은 그 반대인 유리딘(U)을 시티딘(C)으로 변환하는 분자의 설계방법은 확립되어 있지 않다.
본 발명자들은 PPR-DYW 단백질의 C-말단 DYW 도메인을 포함하는 부분이 RNA 편집 모듈러 도메인(modular editing domain)으로 이용 가능함을 밝혀 내었다. 본 발명에서 설계한 3종의 DYW 도메인을 각각 PPR-P 또는 PLS 어레이와 융합시키는 경우, DYW:PG 및 DYW:WW 도메인은 C-to-U, DYW:KP는 U-to-C의 RNA 편집활성을 나타내었다.
본 발명은 다음을 제공한다.
[1] 하기 a, b, c 및 bc 중 어느 하나의 폴리펩티드로 구성된 DYW 도메인을 포함하는 인공 DYW 단백질을 표적 RNA에 적용하는, 표적 RNA를 편집하는 방법(각 서열에서, x는 임의의 아미노산을 나타내고, …는 임의의 폴리펩티드 단편을 나타낸다):
a. xa1PGxa2SWIExa3-xa16HP…HxaaE…Cxa17xa18CH…DYW를 가지고 서열번호: 1의 서열과 최소한 40%의 서열 동일성을 가지며, C-to-U/U-to-C 편집활성을 가지는 폴리펩티드;
b. xb1PGxb2SWWTDxb3-xb16HP…HxbbE…Cxb17xb18CH…DYW를 가지고 서열번호: 2의 서열과 최소한 40%의 서열 동일성을 가지며, C-to-U/U-to-C 편집활성을 가지는 폴리펩티드;
c. KPAxc1Axc2IExc3 …HxccE…Cxc4xc5CH…xc6xc7xc8을 가지고 서열번호: 3의 서열과 최소한 40%의 서열 동일성을 가지며, C-to-U/U-to-C 편집활성을 가지는 폴리펩티드; 및,
bc. xb1PGxb2SWWTDxb3-xb16HP…HxccE…Cxc4xc5CH…Dxbc1xbc2를 가지고 서열번호: 2의 서열과 최소한 40%의 서열 동일성을 가지며, C-to-U/U-to-C 편집활성을 가지는 폴리펩티드.
[2] 하기 a, b, c 및 bc 중 어느 하나의 폴리펩티드로 구성된 DYW 도메인.
a. xa1PGxa2SWIExa3-xa16HP…HxaaE…Cxa17xa18CH…DYW를 가지고 서열번호: 1의 서열과 최소한 40%의 서열 동일성을 가지며, C-to-U/U-to-C 편집활성을 가지는 폴리펩티드;
b. xb1PGxb2SWWTDxb3-xb16HP…HxbbE…Cxb17xb18CH…DYW를 가지고 서열번호: 2의 서열과 최소한 40%의 서열 동일성을 가지며, C-to-U/U-to-C 편집활성을 가지는 폴리펩티드;
c. KPAxc1Axc2IExc3 …HxccE…Cxc4xc5CH…xc6xc7xc8을 가지고 서열번호: 3의 서열과 최소한 40%의 서열 동일성을 가지며, C-to-U/U-to-C 편집활성을 가지는 폴리펩티드; 및,
bc. xb1PGxb2SWWTDxb3-xb16HP…HxccE…Cxc4xc5CH…Dxbc1xbc2를 가지고 서열번호: 2의 서열과 최소한 40%의 서열 동일성을 가지며, C-to-U/U-to-C 편집활성을 가지는 폴리펩티드.
[3] 적어도 1개의 PPR 모티프를 포함하고, 표적 RNA에 서열 특이적으로 결합가능한 RNA 결합 도메인 및 [2]항에 기재된 DYW 도메인을 포함하는 DYW 단백질.
[4] RNA 결합 도메인이 PLS형인, [2]항에 기재된 DYW 단백질.
[5] 하기 c 또는 bc의 폴리펩티드로 구성된 DYW 도메인을 표적 RNA에 적용하여 편집 표적 U를 C로 변환하는 공정을 포함하는 표적 RNA를 편집하는 방법:. 
c. KPAxc1Axc2IExc3…HxccE…Cxc4xc5CH…xc6xc7xc8을 가지고 서열번호: 3의 서열과 최소한 40%의 서열 동일성을 가지며, C-to-U/U-to-C 편집활성을 가지는 폴리펩티드; 및,
bc. xb1PGxb2SWWTDxb3-xb16HP…HxccE…Cxc4xc5CH…Dxbc1xbc2를 가지고 서열번호: 2의 서열과 최소한 40%의 서열 동일성을 가지며, C-to-U/U-to-C 편집활성을 가지는 폴리펩티드.
[6] DYW 도메인이 적어도 하나의 PPR 모티프를 포함하고, PPR-code 규칙에 따라 표적 RNA에 서열 특이적으로 결합가능한 RNA 결합 도메인에 융합되는 [5]항에 기재된 방법.
[7] [2]항에 기재된 DYW 도메인을 포함하는 진핵세포에서 RNA를 편집하기 위한 조성물.
[8] [2]항에 기재된 DYW 도메인, 또는 [3]항 또는 [4]항에 기재된 DYW 단백질을 암호화하는 핵산.
[9] [8]항에 기재된 핵산을 포함하는 벡터.
[10] [9]항에 기재된 벡터를 포함하는 세포(사람의 세포는 제외).
[1] 하기 a 내지 c 중 어느 하나의 폴리펩티드로 구성된 DYW 도메인을 포함하는 인공 DYW 단백질을 표적 RNA에 적용하는, 표적 RNA를 편집하는 방법(각 서열에서, x는 임의의 아미노산을 나타내고, …는 임의의 폴리펩티드 단편을 나타낸다):
a. xa1PGxa2SWIEXa3-xa16HP…HS…Cxa17xa18CH…DYW를 가지고 서열번호: 1의 서열과 최소한 40%의 서열 동일성을 가지며, C-to-U/U-to-C 편집활성을 가지는 폴리펩티드;
b. xb1PGxb2SWWTDxb3-xb16HP…HSE…Cxb17xb18CH…DYW를 가지고 서열번호: 2의 서열과 최소한 40%의 서열 동일성을 가지며, C-to-U/U-to-C 편집활성을 가지는 폴리펩티드; 및,
c. KPAxc1Axc2IExc…HAE…Cxc4xc5CH…Dxc6xc7을 가지고 서열번호: 3의 서열과 최소한 40%의 서열 동일성을 가지며, C-to-U/U-to-C 편집활성을 가지는 폴리펩티드.
[2] 하기 a 내지 c 중 하나의 폴리펩티드로 구성된 DYW 도메인.
a. xa1PGxa2SWIExa3-xa16HP…HSE…Cxa17xa18CH…DYW를 가지고 서열번호: 1의 서열과 최소한 40%의 서열 동일성을 가지며, C-to-U/U-to-C 편집활성을 가지는 폴리펩티드;
b. xb1PGxb2SWWTDxb3-xb16HP…HSE…Cxb17xb18CH…DYW를 가지고 서열번호: 2의 서열과 최소한 40%의 서열 동일성을 가지며, C-to-U/U-to-C 편집활성을 가지는 폴리펩티드; 및,
c. KPAxc1Axc2IExc3…HAE…Cxc4xc5CH…Dxc6xc7을 가지고 서열번호: 3의 서열과 최소한 40%의 서열 동일성을 가지며, C-to-U/U-to-C 편집활성을 가지는 폴리펩티드.
[3] 적어도 1개의 PPR 모티프를 포함하고, 표적 RNA에 서열 특이적으로 결합가능한 RNA 결합 도메인 및 [2]항에 기재된 DYW 도메인을 포함하는 DYW 단백질.
[4] RNA 결합 도메인이 PLS형인, [2]항에 기재된 DYW 단백질.
[5] 하기 c의 폴리펩티드로 구성된 DYW 도메인을 표적 RNA에 적용하여 편집 표적 U를 C로 변환하는 공정을 포함하는 표적 RNA를 편집하는 방법:
c. KPAxc1Axc2IExc3…HAE…Cxc4xc5CH…Dxc6xc7을 가지고 서열번호: 3의 서열과 최소한 40%의 서열 동일성을 가지며, C-to-U/U-to-C 편집활성을 가지는 폴리펩티드.
[6] DYW 도메인이 적어도 하나의 PPR 모티프를 포함하고, PPR-code 규칙에 따라 표적 RNA에 서열 특이적으로 결합가능한 RNA 결합 도메인에 융합되는 [5]항에 기재된 방법.
[7] [2]항에 기재된 DYW 도메인을 포함하는 진핵세포에서 RNA를 편집하기 위한 조성물.
[8] [2]항에 기재된 DYW 도메인, 또는 [3]항 또는 [4]항에 기재된 DYW 단백질을 암호화하는 핵산.
[9] [8]항에 기재된 핵산을 포함하는 벡터.
[10] [9]항에 기재된 벡터를 포함하는 세포(사람의 세포는 제외).
본 발명에 따르면, 표적 RNA에 포함되는 편집 표적 C를 U로, 또는 편집 표적 U를 C로 변환할 수 있다.
[도 1] DYW 단백질에 있어서 C-말단 도메인의 근사적 최우 계통수(approximate maximum likelihood phylogenetic tree)
(a) DYW:PG 형,(b) DYW:WW 형 및(c) DYW:KP 형 도메인의 계통수를 FastTree를 이용하여 작성하였다. DYW:PG 도메인은 소엽류에서 유래한 DYW:PG 단백질을 바탕으로 설계하였다. DYW:WW 및 DYW:KP 도메인을 설계하기 위해서 선택한 단백질 계통군(분기군, clade)을 검은 선으로 나타내었다. 계통수는 iTOL(참조: Letunic, I. and Bork, P.(2016) Nucleic Acids Res. 44 W242-245)을 사용하여 가시화하였고, 빨강은 이끼류(hornwort), 녹색은 소엽류(lycophyte), 파랑색은 양치식물(fern) 유래의 단백질을 나타낸다.
[도 2] 본 발명에서 설계한 PPR 단백질의 구성
(a) PPR 단백질은 N-말단에 티오레독신(thioredoxin), His-태그 및 TEV 위치, 그에 이어 P 또는 PLS 모티프로 구성된 PPR 어레이, 마지막으로 DYW 도메인(DYW:PG, DYW:WW 또는 DYW:KP)을 포함한다. PPR 단백질의 표적서열(RNA 편집부위를 포함)은 종결 코돈의 하류에 삽입하였다.
(b) P, P1, L1, S1 및 P2 모티프 내의 RNA 인식에 관련된 4번째와 ii번째 아미노산. L2, S2, E1 및 E2의 4번째와 ii번째 아미노산은 CLB19의 것과 같다(참조: Chateigner-Boutin, AL, et al.(2008). Plant J. 56 590-602).
[도 3] 대장균을 이용한 RNA 편집검정(RNA editing assay) 결과
(a) 각 PPR-DYW의 DNA 상에서 표적염기(C 또는 T).
(b) PPR-DYW:PG 및 WW의 C-to-U RNA 편집활성과 (c) PPR-DYW:KP의 U-to-C RNA 편집활성을 나타낸다. 3회 독립하여 수행한 실험결과 중 1개를 예로서 나타내었다. (d) C-to-U 및 (e) U-to-C RNA 편집효율(editing efficiency)을 3회 측정한 평균치(단, P-DYW:KP는 2회). 에러 바는 표준편차를 나타낸다.
[도 4] 선발한 각 DYW 도메인 계통 군의 아미노산의 출현빈도
[도 4a] (a) DYW:PG, WebLogo에 의하여 작성한 시퀀스 로고(sequence logo)로 가시화하였다. 도 4b 및 도 4c에서도 동일하다.
[도 4b] (b) DYW:WW
[도 4c] (c) DYW:KP
[도 5] HEK293T 세포에서의 RNA 편집활성(editing activity, C to U 또는 U to C). PLS 형에 PG1 또는 WW1 도메인(a) 또는 KP1 도메인(b)을 융합하였을 때의 표적부위의 서열결정 결과. 3회의 독립된 실험에서 RNA 편집활성(c).
막대 그래프는 평균을 나타내고, 각 점은 3회의 실험에서의 RNA 편집활성을 나타낸다. 좌측의 막대 그래프는 C to U 편집활성, 오른쪽 막대 그래프는 U to C 편집활성을 나타낸다.
[도 6] 도메인 스와핑(domain swapping)에 의한 KP 도메인 성능 향상
KP1의 Active site(HxExnCxxCH)를 포함하는 중앙부분을 남기고, 전후 도메인에 대해 WW1 도메인과 스와핑한 키메라 KP1a(chimeric KP1a)의 RNA 편집활성에 대해 조사하였다. 도메인 스와핑의 모식도(a), 실제 RNA 편집활성(b,c).
[도 7] KP 도메인 변이체의 RNA 편집활성 측정
KP1, KP2, KP3, KP4의 대장균에서의 RNA 편집활성(a)과 HEK293T에서의 RNA 편집활성(b), KP5 내지 KP23의 HEK293T에서의 RNA 편집활성(c).
[도 8] PG 도메인 변이체의 RNA 편집활성 측정
PG1, PG2의 대장균에서의 RNA 편집활성(a)과 HEK293T에서의 RNA 편집활성(b). PG3 내지 PG13의 HEK293T에서의 RNA 편집활성(c)
[도 9] WW 도메인 변이체의 RNA 편집활성 측정
WW1, WW2의 대장균에서의 RNA 편집활성(a)과 HEK293T에서의 RNA 편집활성(b). WW3 내지 WW14의 HEK293T에서의 RNA 편집활성(c)
[도 10] 사람 미토콘드리아 RNA 편집
표적서열 정보(a). RNA 편집활성(b,c)
본 발명은 하기 a, b, c 및 bc 중 어느 하나의 폴리펩티드로 구성된 DYW 도메인을 포함하는 DYW 단백질을 표적 RNA에 적용하여, 표적 RNA를 편집하는 방법에 관한 것이다:
a. xa1PGxa2SWIEXa3-xa16HP…HxaaE…Cxa17xa18CH…DYW를 가지고 서열번호: 1의 서열과 최소한 40%의 서열 동일성을 가지며, C-to-U/U-to-C 편집활성을 가지는 폴리펩티드;
b. xb1PGxb2SWWTDxb3-xb16HP…HxbbE…Cxb17xb18CH…DYW를 가지고 서열번호: 2의 서열과 최소한 40%의 서열 동일성을 가지며, C-to-U/U-to-C 편집활성을 가지는 폴리펩티드;
c. KPAxc1Axc2IExc3…HxccE…Cxc4xc5CH…xc6xc7xc8을 가지고 서열번호: 3의 서열과 최소한 40%의 서열 동일성을 가지며, C-to-U/U-to-C 편집활성을 가지는 폴리펩티드; 및,
bc. xb1PGxb2SWWTDxb3-xb16HP…HxccE…Cxc4xc5CH…Dxbc1xbc2를 가지고 서열번호: 2의 서열과 최소한 40%의 서열 동일성을 가지며, C-to-U/U-to-C 편집활성을 가지는 폴리펩티드.
본 발명에 있어서, C-to-U/U-to-C 편집활성(editing activity)은 대상 폴리펩티드를 표적 RNA에 서열 특이적으로 결합가능한 RNA 결합 도메인의 C-말단에 연결하여 편집검정을 실시하였을 때, 표적 RNA에 포함되는 편집 표적 C를 U에, 또는 편집 표적 U를 C로 변환하는 활성을 의미한다. 변환은 적절한 조건에서 편집 표적 염기의 적어도 약 3%, 바람직하게는 약 5%가 목적하는 염기로 전환되면 된다.
[DYW 도메인]
xa1PGxa2SWIExa3-xa16HP…HxaaE…Cxa17xa18CH…DYW, xb1PGxb2SWWTDxb3-xb16HP…HxbbE…Cxb17xb18CH…DYW, KPAxc1Axc2IExc3…HxccE…Cxc4xc5CH…xc6xc7xc8은 모두 아미노산 서열을 나타낸다. 서열 중 x은 각각 독립적으로 임의의 아미노산을 표시하고, …는 각각 독립적으로 임의 길이의 임의 아미노산 서열로 구성된 폴리펩티드 단편을 나타낸다. 본 발명에 있어서, DYW 도메인은 이들 3개의 아미노산 서열의 하나로 나타낼 수 있다. 특히, xa1PGxa2SWIExa3-xa16HP…HxaaE…Cxa17xa18CH…DYW로 구성된 DYW 도메인을 DYW:PG, xb1PGxb2SWWTDxb3-xb16HP…HxbbE…Cxb17xb18CH…DYW로 구성된 DYW 도메인을 DYW:WW 및 KPAxc1Axc2IExc3…HxccE…Cxc4xc5CH…xc6xc7xc8로 구성된 DYW 도메인을 DYW:KP로 각각 나타낸다.
DYW 도메인은 N-말단의 약 15개 아미노산으로 구성된 PG 박스를 포함하는 영역, 중심부의 zinc 결합 도메인(HxExnCxxCH, xn은 임의 아미노산의 임의의 수 n개의 연결이다), 및 C-말단의 DYW의 3개 영역을 가진다. zinc 결합 도메인은 또한 HxE 영역과 CxxCH 영역으로 나눌 수 있다. 각 DYW 도메인의 이들의 영역은 하기 표와 같이 나타낼 수 있다.
PG 박스를 포함하는 영역 HxE 영역 CxxCH 영역 DYW
DYW:PG xa1PGxa2SWIExa3-xa16HP HxaaE Cxa17xa18CH DYW
DYW:WW xb1PGxb2SWWTDxb3-xb16HP HxbbE Cxb17xb18CH DYW
DYW:KP KPAxc1Axc2IExc3 HxccE Cxc4xc5CH xc6xc7xc8
(DYW:PG)
DYW:PG는 xa1PGxa2SWIExa3-xa16HP…HxaaE…Cxa17xa18CH…DYW로 이루어진 폴리펩티드이다. 바람직하게는, xa1PGxa2SWIExa3-xa16HP…HxaaE…Cxa17xa18CH…DYW를 가지고, 서열번호: 1의 서열과 서열 동일성([용어] 항목에서 상세히 기술한다)를 가지며, C-to-U/U-to-C 편집활성을 가지는 폴리펩티드이다. DYW:PG는 편집 표적 C를 U로 변환하는 활성(C-to-U 편집활성)을 가지고 있다. 서열번호: 1에는 본 명세서의 실시예에 제시한 실험에서 사용한 길이 136개의 아미노산으로 구성된 DYW:PG의 서열을 나타내었다. 이 서열은 본원에서 처음 공개하는 것이고, 신규한 것이다.
DYW:PG의 길이는 C-to-U 편집활성을 나타내는 한 특별히 한정되지 않으나, 예를 들면 110개 내지 160개 아미노산 길이, 바람직하게는 124개 내지 148개 아미노산 길이, 보다 바람직하게는 128개 내지 144개 아미노산 길이, 보다 더 바람직하게는 132개 내지 140개 아미노산 길이이다.
DYW:PG의 PG 박스를 포함하는 영역(xa1PGxa2SWIExa3-xa16HP)에 있어서:
xa1는 DYW:PG로 C-to-U 편집활성을 나타내는 한 특별히 한정되지 않으나, 바람직하게는 E(글루탐산) 또는 이와 성질이 유사한 아미노산, 보다 바람직하게는 G이다.
xa2는 DYW:PG로 C-to-U 편집활성을 나타내는 한 특별히 한정되지 않으나, 바람직하게는 C(시스테인) 또는 이와 성질이 유사한 아미노산, 보다 바람직하게는 C이다.
xa3-xa16의 각각의 아미노산은 DYW:PG로 C-to-U 편집활성을 나타내는 한 특별히 한정되지 않으나, 바람직하게는 서열번호: 1의 서열 위치 9 내지 22에 대응하는 아미노산과 같거나 또는 대응하는 아미노산과 성질이 유사한 아미노산, 보다 바람직하게는 서열번호: 1의 서열 위치 9 내지 22에 대응하는 아미노산과 같은 아미노산이다.
본 발명의 바람직한 일 실시태양에 따르면, DYW:PG의 HxE 영역은 다른 영역이 어떠한 경우에도 HSE이다.
DYW:PG의 CxxCH 영역, 즉 Cxa17xa18CH에 있어서:
xa17은 DYW:PG로 C-to-U 편집활성을 나타내는 한 특별히 한정되지 않으나, 바람직하게는 G(글리신) 또는 이와 성질이 유사한 아미노산, 보다 바람직하게는 G이다.
xa18은 DYW:PG로 C-to-U 편집활성을 나타내는 한 특별히 한정되지 않으나, 바람직하게는 D(아스파라긴산) 또는 이와 성질이 유사한 아미노산, 보다 바람직하게는 D이다.
DYW:PG에서 PG 박스를 포함한 영역과 HxaaE을 결합하고 부분, HxaaE 영역과 CxxCH 영역을 결합하고 부분, 및 CxxCH 영역과 DYW를 연결하는 부분을 차례로 제1 연결부, 제2 연결부 및 제3 연결부로 한다(다른 DYW 도메인에 있어서도 동일하다).
DYW:PG의 제1 연결부의 전체 길이는 DYW:PG로서 C-to-U 편집활성을 나타내는 한 특별히 한정되지 않으나, 예를 들어, 39개 내지 47개 아미노산 길이, 바람직하게는 40개 내지 46개 아미노산 길이, 보다 바람직하게는 41개 내지 45개 아미노산 길이, 보다 더 바람직하게는 42개 내지 44개 아미노산 길이이다. 제1 연결부의 아미노산 서열은 DYW:PG로서 C-to-U 편집활성을 나타내는 한 특별히 한정되지 않으나, 바람직하게는 서열번호: 1의 서열 위치 25 내지 67의 부분과 같거나 그 부분서열에서 1개 내지 22개의 아미노산을 치환, 결실 또는 부가한 서열이거나 그 부분서열과 서열 동일성을 갖는 서열, 보다 바람직하게는 그 부분서열과 동일한 서열이다.
본 발명의 바람직한 일 실시태양에 따르면, DYW:PG의 제1 연결부는 DYW 도메인의 다른 부분의 서열이 어떠한 경우에도 43개 아미노산 길이의 하기 식으로 표시되는 폴리펩티드이다.
 Na25-Na26-Na27-…-Na65-Na66-Na67
상기 폴리펩티드는 바람직하게는 서열번호: 1의 서열 위치 25 내지 67 부분과 같거나, DYW:PG가 C-to-U 편집활성을 나타내도록 그 부분서열에서 복수개의 아미노산이 치환된 서열이다. 이때, 아미노산의 치환은 도 4의 대응하는 위치에서 bits 값이 큰 아미노산(예를 들어, Na29, Na30, Na32, Na33, Na35, Na36, Na40, Na44, Na45, Na47, Na48, Na52, Na53, Na54, Na55, Na58, Na61, Na65, Na67)은 도 4와 같고, 그 이외의 아미노산이 치환되도록 하는 것이 바람직하다.
DYW:PG의 제2 연결부의 전체 길이는 DYW:PG로서 C-to-U 편집활성을 나타내는 한 특별히 한정되지 않으나, 예를 들어, 21개 내지 29개 아미노산 길이, 바람직하게는 22개 내지 28개 아미노산 길이, 보다 바람직하게는 23개 내지 27개 아미노산 길이, 보다 더 바람직하게는 24개 내지 26개 아미노산 길이이다. 제2 연결부의 아미노산 서열은 DYW:PG로서 C-to-U 편집활성을 나타내는 한 특별히 한정되지 않으나, 바람직하게는 서열번호: 1의 서열 위치 71 내지 95의 부분과 같거나 그 부분서열에서 1개 내지 13개의 아미노산을 치환, 결실 또는 부가한 서열이거나, 그 부분서열과 서열 동일성을 갖는 서열, 보다 바람직하게는 그 부분서열과 동일한 서열이다.
본 발명의 바람직한 일 실시태양에 따르면, DYW:PG의 제2 연결부는 DYW 도메인의 다른 부분의 서열이 어떠한 경우에도 25개 아미노산 길이의 하기 식으로 표시되는 폴리펩티드이다.
 Na71-Na72-Na73-…-Na93-Na94-Na95
상기 폴리펩티드는 바람직하게는 서열번호: 1의 서열 위치 71 내지 95 부분과 같거나 그 부분서열에서 복수개의 아미노산이 치환된 서열인, DYW:PG로서 C-to-U 편집활성을 나타낸다. 이때, 아미노산의 치환은 도 4의 대응하는 위치에서 bits 값이 큰 아미노산(예를 들어, Na71, Na72, Na73, Na76, Na77, Na78, Na79, Na81, Na82, Na86, Na88, Na89, Na91, Na92, Na93, Na94)은 도 4와 동일하며, 그 이외의 아미노산이 치환되도록 하는 것이 바람직하다.
DYW:PG의 제3 연결부의 전체 길이는 DYW:PG로서 C-to-U 편집활성을 나타내는 한 특별히 한정되지 않으나, 예를 들어, 29개 내지 37개 아미노산 길이, 바람직하게는 30개 내지 36개 아미노산 길이, 보다 바람직하게는 31개 내지 35개 아미노산 길이, 보다 더 바람직하게는 32개 내지 34개 아미노산 길이이다. 제3 연결부의 아미노산 서열은 DYW:PG로서 C-to-U 편집활성을 나타내는 한 특별히 한정되지 않으나, 바람직하게는 서열번호: 1의 서열 위치 101 내지 133의 부분과 같거나, 그 부분 서열에서 1개 내지 17개의 아미노산을 치환, 결실 또는 부가한 서열이거나, 그 부분 서열과 서열 동일성을 갖는 서열, 보다 바람직하게는 그 부분 서열과 동일한 서열이다.
본 발명의 바람직한 일 실시태양에 따르면, DYW:PG의 제3 연결부는 DYW 도메인의 다른 부분의 서열이 어떠한 경우에도 33개 아미노산 길이의 하기 식으로 표시되는 폴리펩티드이다.
 Na101-Na102-Na103-…-Na131-Na132-Na133
상기 폴리펩티드는 바람직하게는 서열번호: 1의 서열 위치 101 내지 133의 부분과 같거나 그 부분서열에서 복수개의 아미노산이 치환된 서열인, DYW:PG로서 C-to-U 편집활성을 나타낸다. 이때, 아미노산의 치환은 도 4의 대응하는 위치에서 bits 값이 큰 아미노산(예를 들어, Na102, Na104, Na107, Na112, Na114, Na117, Na118, Na121, Na122, Na123, Na124, Na125, Na128, Na130, Na131, Na132)은 도 4와 같고, 그 이외의 아미노산이 치환되도록 하는 것이 바람직하다.
서열번호: 1의 서열로 이루어진 PG 도메인에 변이를 도입함으로써 RNA 편집활성을 향상시킬 수 있다. 이러한 변이를 도입한 도메인의 바람직한 예는 본 명세서의 실시예에 제시한 PG11(서열번호: 50의 아미노산 서열로 이루어진 폴리펩티드)이다.
(DYW:WW)
DYW:WW는 xb1PGxb2SWWTDxb3-xb16HP…HxbbE…Cxb17xb18CH…DYW로 이루어진 폴리펩티드이다. 바람직하게는 xb1PGxb2SWWTDxb3-xb16HP…HxbbE…Cxb17xb18CH…DYW를 가지고 서열번호: 2의 서열과 서열 동일성을 가지며, C-to-U/U-to-C 편집활성을 가지는 폴리펩티드이다. DYW:WW는 편집 표적 C를 U로 변환하는 활성(C-to-U 편집활성)을 가진다. 서열번호: 2에는 본 명세서의 실시예에 기재된 실험에서 사용한 전체 길이 137개 아미노산 길이로 이루어진 DYW:WW의 서열을 나타낸다. 이 서열은 본원에서 처음으로 공개하는 것으로, 신규한 것이다.
DYW:WW의 전체 길이는 C-to-U 편집활성을 나타내는 한 특별히 한정되지 않으나, 예를 들어, 110개 내지 160개 아미노산 길이, 바람직하게는 125개 내지 149개 아미노산 길이, 보다 바람직하게는 129개 내지 145개 아미노산 길이, 보다 더 바람직하게는 133개 내지 141개 아미노산 길이이다.
DYW:WW의 PG 박스를 포함하는 영역, 즉 xb1PGxb2SWWTDxb3-xb16HP에서 WTD로 이루어진 부분은 WSD이어도 무방하다.
DYW:WW의 PG 박스를 포함한 영역에 있어서:
xb1은 DYW:WW로서 C-to-U 편집활성을 나타내는 한 특별히 한정되지 않으나, 바람직하게는 K(리신) 또는 그와 성질이 유사한 아미노산이고, 보다 바람직하게는 K이다.
xb2는 DYW:WW로서 C-to-U 편집활성을 나타내는 한 특별히 한정되지 않으나, 바람직하게는 Q(글루타민) 또는 그와 성질이 유사한 아미노산이고, 보다 바람직하게는 Q이다.
xb3-xb16 각각의 아미노산은 DYW:WW로서 C-to-U 편집활성을 나타내는 한 특별히 한정되지 않으나, 바람직하게는 서열번호: 2의 서열 위치 10 내지 23에 대응하는 아미노산과 같거나 대응하는 아미노산과 성질이 유사한 아미노산이고, 보다 바람직하게는 서열번호: 2의 서열 위치 10 내지 23에 대응하는 아미노산과 같은 아미노산이다.
본 발명의 바람직한 일 실시태양에 따르면, DYW:WW의 HxE 영역은 다른 부분의 서열이 어떠한 경우라도 HSE이다.
DYW:WW의 CxxCH 영역, 즉 Cxb17xb18CH에 있어서:
xb17은 DYW:WW로서 C-to-U 편집활성을 나타내는 한 특별히 한정되지 않으나, 바람직하게는 D(아스파라긴산) 또는 이와 성질이 유사한 아미노산이고, 보다 바람직하게는 D이다.
xb18은 DYW:WW로서 C-to-U 편집활성을 나타내는 한 특별히 한정되지 않으나, 바람직하게는 D 또는 그와 성질이 유사한 아미노산이고, 더 바람직하게는 D이다.
DYW:WW의 제1 연결부의 전체 길이는 DYW:WW로서 C-to-U 편집활성을 나타내는 한 특별히 한정되지 않으나, 예를 들어, 39개 내지 47개 아미노산 길이, 바람직하게는 40개 내지 46개 아미노산 길이, 보다 바람직하게는 41개 내지 45개 아미노산 길이, 보다 더 바람직하게는 42개 내지 44개 아미노산 길이이다. 제1 연결부의 아미노산 서열은 DYW:WW로서 C-to-U 편집활성을 나타내는 한 특별히 한정되지 않으나, 바람직하게는 서열번호: 2의 서열 위치 25 내지 67의 부분과 같거나 그 부분 서열에서 1개 내지 22개의 아미노산을 치환, 결실 또는 부가한 서열이거나 그 부분 서열과 서열 동일성을 갖는 서열, 보다 바람직하게는 그 부분 서열과 동일한 서열이다.
본 발명의 바람직한 일 실시태양에 따르면, DYW:WW의 제1 연결부는 DYW 도메인의 다른 부분의 서열이 어떠한 경우에도 43개 아미노산 길이의 하기 식으로 표시되는 폴리펩티드이다.
 Nb26-Nb27-Nb28-…-Nb66-Nb67-Nb68
상기 폴리펩티드는 바람직하게는 서열번호: 2의 서열 위치 26 내지 68의 부분과 같거나 그 부분서열에서 복수개의 아미노산이 치환된 서열인, DYW:PG로서 C-to-U 편집활성을 나타낸다. 이때, 아미노산의 치환은 도 4의 대응하는 위치에서 bits 값이 큰 아미노산(예를 들어, Nb26, Nb30, Nb33, Nb34, Nb37, Nb41, Nb45, Nb46, Nb48, Nb49, Nb51, Nb52, Nb53, Nb55, Nb56, Nb57, Nb59, Nb61, Nb62, Nb63, Nb64, Nb66, Nb67, Nb68)은 도 4와 같고, 그외의 아미노산이 치환되도록 하는 것이 바람직하다.
DYW:WW의 제2 연결부의 전체 길이는 DYW:WW로서 C-to-U 편집활성을 나타내는 한 특별히 한정되지 않으나, 예를 들어, 21개 내지 29개 아미노산 길이, 바람직하게는 22개 내지 28개 아미노산 길이, 보다 바람직하게는 23개 내지 27개 아미노산 길이, 보다 더 바람직하게는 24개 내지 26개 아미노산 길이이다. 제2 연결부의 아미노산 서열은 DYW:WW로서 C-to-U 편집활성을 나타내는 한 특별히 한정되지 않으나, 바람직하게는 서열번호: 2의 서열 위치 71 내지 95의 부분과 같거나 그 부분서열에서 1개 내지 13개의 아미노산을 치환, 결실 또는 부가한 서열이거나 그 부분서열과 서열 동일성을 갖는 서열, 보다 바람직하게는 그 부분서열과 동일한 서열이다.
 
본 발명의 바람직한 일 실시태양에 따르면, DYW:WW의 제2 연결부는 DYW 도메인의 다른 부분의 서열이 어떠한 경우에도 25개 아미노산 길이의 하기 식으로 표시되는 폴리펩티드이다.
 Nb72-Nb73-Nb74-…-Nb94-Nb95-Nb96
상기 폴리펩티드는 바람직하게는 서열번호: 2의 서열 위치 72 내지 96 부분과 같거나 그 부분서열에서 복수개의 아미노산이 치환된 서열인, DYW:WW로서 C-to-U 편집활성을 나타낸다. 이때, 아미노산의 치환은 도 4의 대응하는 위치에서 bits 값이 큰 아미노산(예를 들어, Nb72, Nb73, Nb74, Nb75, Nb77, Nb78, Nb79, Nb81, Nb82, Nb84, Nb88, Nb89, Nb90, Nb91, Nb92, Nb93, Nb94, Nb95, Nb96)은 도 4와 같고, 그 이외의 아미노산이 치환되도록 하는 것이 바람직하다.
DYW:WW의 제3 연결부의 전체 길이는 DYW:WW로서 C-to-U 편집활성을 나타내는 한 특별히 한정되지 않으나, 예를 들어, 29개 내지 37개 아미노산 길이, 바람직하게는 30개 내지 36개 아미노산 길이, 보다 바람직하게는 31 내지 35개 아미노산 길이, 보다 더 바람직하게는 32개 내지 34개 아미노산 길이이다. 제3 연결부의 아미노산 서열은 DYW:WW로서 C-to-U 편집활성을 나타내는 한 특별히 한정되지 않으나, 바람직하게는 서열번호: 2의 서열 위치 101 내지 133의 부분과 같거나 그 부분서열에서 1개 내지 17개의 아미노산을 치환, 결실 또는 부가한 서열이거나 그 부분서열과 서열 동일성을 갖는 서열, 보다 바람직하게는 그 부분서열과 동일한 서열이다.
본 발명의 바람직한 일 실시태양에 따르면, DYW:WW의 제3 연결부는 DYW 도메인의 다른 부분의 서열이 어떠한 경우에도 33개 아미노산 길이의 하기 식으로 표시되는 폴리펩티드이다.
 Nb102-Nb103-Nb104-…-Nb132-Nb133-Nb134
상기 폴리펩티드는 바람직하게는 서열번호: 2의 서열 위치 102 내지 134의 부분과 같거나 그 부분서열에서 복수개의 아미노산이 치환된 서열인, DYW:WW로서 C-to-U 편집활성을 나타낸다. 이때, 아미노산의 치환은 도 4의 대응하는 위치에서 bits 값이 큰 아미노산(예를 들어, Nb104, Nb105, Nb107, Nb108, Nb109, Nb110, Nb111, Nb113, Nb115, Nb116, Nb117, Nb118, Nb119, Nb121, Nb122, Nb123, Nb124, Nb126, Nb129, Nb131, Nb132, Nb133, Nb134)은 도 4와 같고, 그 이외의 아미노산이 치환되도록 하는 것이 바람직하다.
서열번호: 2의 서열로 이루어진 WW 도메인에 변이를 도입함으로써 RNA 편집활성을 향상시킬 수 있다. 이러한 변이를 도입한 도메인의 바람직한 예는 본 명세서의 실시예에 기재된 WW2 내지 WW11 및 WW13이며, 특히 편집활성이 높은 것은 WW11(서열번호: 63의 아미노산 서열로 이루어진 폴리펩티드)이다.
(DYW:KP)
DYW:KP는 KPAxc1Axc2IExc3…HxccE…Cxc4xc5CH…xc6xc7xc8로 이루어진 폴리펩티드이다. 바람직하게는 KPAxc1Axc2IExc3…HxccE…Cxc4xc5CH…xc6xc7xc8을 가지고, 서열번호: 3의 서열과 서열 동일성을 가지며, C-to-U/U-to-C 편집활성을 가지는 폴리펩티드이다. DYW:KP는 편집 표적 U를 C로 변환하는 활성(U-to-C 편집활성)을 가진다. 서열번호: 3에는 본 명세서의 실시예에 기재된 실험에서 사용한 전체 길이 133개 아미노산 길이로 이루어진 DYW:KP의 서열을 나타냈다. 이 서열은 본원에서 처음으로 공개하는 것으로, 신규한 것이다.
DYW:KP의 전체 길이는 U-to-C 편집활성을 나타내는 한 특별히 한정되지 않으나, 예를 들어, 110개 내지 160개 아미노산 길이, 바람직하게는 121개 내지 145개 아미노산 길이, 보다 바람직하게는 125개 내지 141개 아미노산 길이, 더욱 바람직하게는 129개 내지 137개 아미노산 길이이다.
DYW: KP의 PG 박스를 포함하는 영역, 즉 KPAxc1Axc2IExc3에 있어서:
xc1은 DYW:KP로서 U-to-C 편집활성을 나타내는 한 특별히 한정되지 않으나, 바람직하게는 S(세린) 또는 그와 성질이 유사한 아미노산이고, 보다 바람직하게는 S이다.
xc2는 DYW:KP로서 U-to-C 편집활성을 나타내는 한 특별히 한정되지 않으나, 바람직하게는 L(류신) 또는 그와 성질이 유사한 아미노산이고, 보다 바람직하게는 L이다.
xc3는 DYW:KP로서 U-to-C 편집활성을 나타내는 한 특별히 한정되지 않으나, 바람직하게는 V(발린) 또는 그와 성질이 유사한 아미노산이고, 보다 바람직하게는 V이다.
본 발명의 바람직한 일 실시태양에 따르면, DYW:KP의 HxE 영역은 다른 부분의 서열이 어떠한 경우에도 HAE이다.
DYW:KP의 CxxCH 영역, 즉 Cxc4xc5CH에 있어서:
xc4는 DYW:KP로 U-to-C 편집활성을 나타내는 한 특별히 한정되지 않으나, 바람직하게는 N(아스파라긴) 또는 이와 성질이 유사한 아미노산, 보다 바람직하게는 N이다.
xb5는 DYW:KP로 U-to-C 편집활성을 나타내는 한 특별히 한정되지 않으나, 바람직하게는 D(아스파라긴산) 또는 이와 성질이 유사한 아미노산, 보다 바람직하게는 D이다.
DYW:KP의 DYW에 해당하는 부분, 즉 xc6xc7xc8에 있어서:
xc6은 DYW:KP로 U-to-C 편집활성을 나타내는 한 특별히 한정되지 않으나, 바람직하게는 D(아스파라긴산) 또는 이와 성질이 유사한 아미노산, 보다 바람직하게는 D이다.
xc7은 DYW:KP로 U-to-C 편집활성을 나타내는 한 특별히 한정되지 않으나, 바람직하게는 M(메티오닌) 또는 이와 성질이 유사한 아미노산, 보다 바람직하게는 M이다.
xb8은 DYW:KP로 U-to-C 편집활성을 나타내는 한 특별히 한정되지 않으나, 바람직하게는 F(페닐알라닌) 또는 이와 성질이 유사한 아미노산, 보다 바람직하게는 F이다.
본 발명의 바람직한 일 실시태양에 따르면, xc6xc7xc8는 다른 부분의 서열이 어떠한 경우에도 Dxc7xc8이다.
본 발명의 다른 바람직한 실시태양에 따르면, xc6xc7xc8는 다른 부분의 서열이 어떠한 경우에도 GRP이다.
DYW:KP의 제1 연결부의 길이는 DYW:KP로 U-to-C 편집활성을 나타내는 한 특별히 한정되지 않으나, 예를 들면 51개 내지 59개 아미노산 길이, 바람직하게는 52개 내지 58개 아미노산 길이, 보다 바람직하게는 53개 내지 57개 아미노산 길이, 보다 더 바람직하게는 54개 내지 56개 아미노산 길이이다. 제1 연결부의 아미노산 서열은 DYW:KP로 U-to-C 편집활성을 나타내는 한 특별히 한정되지 않으나, 바람직하게는 서열번호: 3의 서열 위치 10 내지 64의 부분과 같거나 그 부분 서열에서 1개 내지 28개의 아미노산을 치환, 결실, 또는 부가한 서열이거나 또는 그 부분 서열과 서열 동일성을 가진 서열, 보다 바람직하게는는 해당 부분 서열과 같은 서열이다.
DYW:KP의 제1 연결부의 바람직한 형태의 하나는 DYW 도메인의 다른 부분의 서열이 어떠한 경우에도 55개 아미노산 길이의 하기 식으로 표시되는 폴리펩티드이다.
 Nc10-Nc11-Nc12-…-Nc62-Nc63-Nc64
상기 폴리펩티드는 바람직한는 서열번호: 3의 서열 위치 10 내지 64 부분과 같거나 그 부분 서열에서 여러개의 아미노산이 치환된 서열인, DYW;KP로서 U-to-C 편집활성을 나타낸다. 이때, 아미노산 치환은 도 4에 대응하는 위치에서 bits값이 큰 아미노산(예를 들면, Nc10, Nc13, Nc14, Nc15, Nc16, Nc17, Nc18, Nc19, Nc25, Nc26, Nc29, Nc30, Nc33, Nc34, Nc36, Nc38, Nc41, Nc42, Nc44, Nc45, Nc47, N49, Nc55, Nc58, Nc59, Nc62, Nc63, Nc64)는 도 4와 같고, 그 이외의 아미노산이 치환되도록 하는 것이 바람직하다.
DYW:KP의 제2 연결부의 길이는 DYW:KP로 U-to-C 편집활성을 나타내는 한 특별히 한정되지 않으나, 예를 들면 21개 내지 29개 아미노산 길이, 바람직하게는 22개 내지 28개 아미노산 길이, 보다 바람직하게는 23개 내지 27개 아미노산 길이, 보다 더 바람직하게는 24개 내지 26개 아미노산 길이이다. 제2 연결부의 아미노산서열은 DYW:KP로서 U-to-C 편집활성을 나타내는 한 특별히 한정되지 않으나, 바람직하게는 서열번호: 3의 서열 위치 68 내지 92의 부분과 같거나 그 부분서열에서 1개 내지 13개의 아미노산을 치환, 결실 또는 부가한 서열이거나 그 부분서열과 서열 동일성을 갖는 서열, 보다 바람직하게는 그 부분서열과 동일한 서열이다.
본 발명의 바람직한 일 실시태양에 따르면, DYW:KP의 제2 연결부는 DYW 도메인의 다른 부분의 서열이 어떠한 경우에도 25개 아미노산 길이의 하기 식으로 표시되는 폴리펩티드이다.
 Nc68-Nc69-Nc70-…-Nc90-Nc91-Nc92
상기 폴리펩티드는 바람직하게는 서열번호: 3의 서열 위치 68 내지 92의 부분과 같거나 그 부분서열에서 복수개의 아미노산이 치환된 서열인, DYW:KP로서 U-to-C 편집활성을 나타낸다. 이때, 아미노산의 치환은 도 4의 대응하는 위치에서 bits 값이 큰 아미노산(예를 들어, Nc68, Nc70, Nc71, Nc72, Nc73, Nc74, Nc75, Nc76, Nc77, Nc78, Nc79, Nc80, Nc81, Nc83, Nc84, Nc85, Nc86, Nc87, Nc88, Nc89, NC90, Nc91, NC92)은 도 4와 같고, 그 이외의 아미노산이 치환되도록 하는 것이 바람직하다.
DYW:KP의 제3 연결부의 전체 길이는 DYW:KP로서 U-to-C 편집활성을 나타내는 한 특별히 한정되지 않으나, 예를 들어, 29개 내지 37개 아미노산 길이, 바람직하게는 30개 내지 36개 아미노산, 보다 바람직하게는 31개 내지 35개 아미노산 길이, 가장 바람직하게는 32개 내지 34개 아미노산 길이이다. 제3 연결부의 아미노산 서열은 DYW:KP로서 U-to-C 편집활성을 나타내는 한 특별히 한정되지 않으나, 바람직하게는 서열번호: 3의 서열 위치 98 내지 130의 부분과 같거나 그 부분서열에서 1개 내지 17개의 아미노산을 치환, 결실 또는 부가한 서열이거나 그 부분서열과 서열 동일성을 갖는 서열, 보다 바람직하게는 그 부분서열과 같은 서열이다.
본 발명의 바람직한 일 실시태양에 따르면, DYW:KP의 제3 연결부는 DYW 도메인의 다른 부분의 서열이 어떠한 경우에도 33개 아미노산 길이의 하기 식으로 표시되는 폴리펩티드이다.
 Nc98-Nc99-Nc100-…-Nc128-Nc129-Nc130
상기 폴리펩티드는 바람직하게는 서열번호: 3의 서열 위치 98 내지 130의 부분과 같거나 그 부분서열에서 복수개의 아미노산이 치환된 서열인, DYW:KP로서 U-to-C 편집활성을 나타낸다. 이때, 아미노산의 치환은 도 4의 대응하는 위치에서 bits 값이 큰 아미노산(예를 들어, Nc98, Nc100, Nc101, Nc103, Nc104, Nc105, Nc107, Nc109, Nc110, Nc111, Nc112, Nc114, Nc115, Nc117, Nc118, Nc119, Nc120, Nc121, Nc122, Nc123, Nc124, Nc125, Nc127, Nc129, Nc130)은 도 4와 같고, 그외의 아미노산이 치환되는 것이 바람직하다.
서열번호: 3의 서열로 이루어진 KP 도메인에 변이를 도입함으로써 편집활성을 향상시킬 수 있다. 이러한 변이를 도입한 도메인의 바람직한 예는 본 명세서의 실시예에 제시한 KP2 내지 KP23(서열번호: 68 내지 89)이다. KP22(서열번호: 88)가 가장 U to C로의 편집활성이 높고, 또한 C to U로의 편집활성이 낮으며, 서열번호: 3의 서열로 이루어진 KP 도메인과 비교하여 RNA 편집활성이 개선되었다.
(키메라 DYW)
DYW 도메인은 아미노산 서열의 보존성에서 몇 개의 영역으로 구분할 수 있다. 이러한 각 영역을 교환한 키메라 DYW(chimeric DYW)에 의해 C-to-U 편집활성 또는 U-to-C 편집활성을 향상시킬 수 있다. 본 발명의 바람직한 일 실시태양에 따르면, DYW:WW의 PG 박스를 포함하는 영역, 즉 xb1PGxb2SWWTDxb3-xb16HP와 DYW를 DYW:KP 이외의 영역(…HxccE…Cxc4xc5CH…)에 융합한 것이다. 이때, xb1, xb2, xb3-xb16은 DYW:WW에 대하여 상술한 바와 같다. 또한, 제1 연결부, 제2 연결부, 제3 연결부는 DYW:KP에 대한 상기 설명과 같다. DYW 부분은 Dxbc1xbc2이어도 된다. 전체 길이는 U-to-C 편집활성을 나타내는 한 특별히 한정되지 않으나, 예를 들어, 110개 내지 160개 아미노산 길이, 바람직하게는 125개 내지 149개 아미노산 길이, 보다 바람직하게는 129개 내지 145개 아미노산 길이, 가장 바람직하게는 133개 내지 141개 아미노산 길이이다.
바람직한 키메라 도메인 중 하나는 xb1PGxb2SWWTDxb3-xb16HP…HxccE…Cxc4xc5CH…Dxbc1xbc2를 가지고 서열번호: 2의 90 서열과 적어도 40%의 서열 동일성을 가지며, C-to-U/U-to-C 편집활성을 갖는 폴리펩티드로 구성된다.
특히 바람직한 키메라 도메인 중 하나는 서열번호: 90의 서열과 서열 동일성을 가지면서 U-to-C 편집활성을 가지는 폴리펩티드이다. 서열번호: 90에는 본 명세서의 실시예에 기재된 실험에서 사용한 키메라 도메인의 서열을 나타냈다. 이 도메인은 서열번호: 3의 서열로 이루어진 DYW:KP보다 높은 U to C 편집활성이 인정되며, 더욱이 C to U 편집활성이 거의 없다.
(공지서열과의 비교)
 상술한 바와 같이, 서열번호: 1, 2, 3의 서열로 이루어진 DYW 도메인은 신규한 것이다. PPR 데이터베이스(https://ppr.plantenergy.uwa.edu.au/onekp/; 상기 비특허문헌 11)를 이용하여 조사한 결과를 이하에 나타내었다.
DYW:PG(서열번호: 1)
서열명칭 유 래 동일성
- PYHZ-2068577-R Isoetes, 소엽류 78%
- ENQF-2003735-R Lycopodium annotinum, 소엽류
DYW:WW(서열번호: 2)
- ANON-2000164-R Leiosporoceros dussii, 이끼류


84%


- ANON-2000163-R
- ANON-2004532-F
- ANON-2001227-F
DYW:KP(서열번호: 3)

- UWOD-2140463-R
Plagiogyria japonica, 양치식물 86%
따라서, 본 발명은 또한 하기 d 내지 i 중 하나의 폴리펩티드를 제공한다:
d. 서열번호: 1의 서열과 78%를 초과하는 서열 동일성을 가지고, 바람직하게는 80% 이상, 보다 바람직하게는 90%, 보다 더 바람직하게는 95%, 가장 바람직하게는 97%의 서열 동일성을 가지며, C-to-U 편집활성을 가지는 폴리펩티드;
e. 서열번호: 2의 서열과 84%를 초과하는 서열 동일성을 가지고, 바람직하게는 85% 이상, 보다 바람직하게는 90%, 가장 바람직하게는 97%의 서열 동일성을 가지며, C-to-U 편집활성을 가지는 폴리펩티드;
f. 서열번호: 3의 서열과 86%를 초과하는 서열 동일성을 가지고, 바람직하게는 87% 이상, 보다 바람직하게는 90%, 가장 바람직하게는 97%의 서열 동일성을 가지며, U-to-C 편집활성을 가지는 폴리펩티드;
g. 서열번호: 1의 서열에서 1개 내지 29개, 바람직하게는 1개 내지 25개, 보다 바람직하게는 1개 내지 21개, 보다 더 바람직하게는 1개 내지 17개, 더욱 바람직하게는 1개 내지 13개, 더욱 더 바람직하게는 1개 내지 9개, 가장 바람직하게는 1개 내지 5개의 아미노산을, 치환, 결실 또는 부가한 서열을 가지고, C-to-U 편집활성을 가지는 폴리펩티드;
h. 서열번호: 2의 서열에서 1개 내지 21개, 바람직하게는 1개 내지 18개, 보다 바람직하게는 1개 내지 15개, 보다 더 바람직하게는 1개 내지 12개, 더욱 바람직하게는 1개 내지 9개, 가장 바람직하게는 1개 내지 6개의 아미노산을 치환, 결실 또는 부가한 서열을 가지고, C-to-U 편집활성을 가지는 폴리펩티드;
i. 서열번호: 3의 서열에서 1개 내지 18개, 바람직하게는 1개 내지 16개, 보다 바람직하게는 1개 내지 14개, 보다 더 바람직하게는 1개 내지 12개, 더욱 바람직하게는 1개 내지 10개, 더욱 더 바람직하게는 1개 내지 8개의 아미노산을, 가장 바람직하게는 1개 내지 6개의 아미노산을 치환, 결실 또는 부가한 서열을 가지고, U-to-C 편집활성을 가지는 폴리펩티드.
또한, 이러한 서열의 얼라인먼트를 아래 표에 나타낸다. 얼라인먼트는 AliView를 이용하여 작성하였다(참조: Larsson, A. (2014). AliView: a fast and lightweight alignment viewer and editor for large data sets. Bioinformatics, 30(22):3276-3278. http://dx. Doi.org/10.1093/bioinformatics/btu531). 또한, 동일한 아미노산은 도트(dot)로 표시하였다.
Figure pct00001
[RNA 결합 도메인]
본 발명에서는 DYW 도메인을 이용하여 편집 표적을 변환할 경우, 편집 표적이 포함된 RNA를 표적화하기 위하여, RNA 결합 단백질이 RNA 결합 도메인으로 사용된다.
RNA 결합 도메인으로 이용되는 RNA 결합 단백질의 바람직한 예는 PPR 모티프로 구성되는 PPR 단백질이다.
(PPR 모티프)
PPR 모티프는 특별히 기재한 경우를 제외하고, Web상의 단백질 도메인 검색 프로그램에서 아미노산 서열을 분석하였을 때, Pfam에서 PF01535, Prosite에서 PS51375로 얻을 수 있는 E값이 소정치 이하(바람직하게는 E-03)인 아미노산 서열을 갖는 30개 내지 38개 아미노산으로 구성되는 폴리펩티드를 의미한다. 본 발명에서 정의하는 PPR 모티프를 구성하는 아미노산의 위치 번호는 PF01535와 거의 동일하고, PS51375의 아미노산 위치로부터 2를 뺀 수(예; 본 발명의 1번→PS51375의 3번)에 해당한다. 단, "ii"(-2)번의 아미노산이라고 할 때는 PPR 모티프를 구성하는 아미노산의 뒤(C-말단측)로부터 2번째 아미노산, 또는 다음 PPR 모티프의 1번 아미노산에 대하여 2개 N-말단측, 즉 -2번째 아미노산으로 한다. 후속하는 PPR 모티프가 명확하게 동정되지 않을 경우, 다음 헬릭스 구조의 첫 번째 아미노산에 대하여 2개 앞의 아미노산을 "ii"라고 한다. Pfam에 대해서는 http://pfam.sanger.ac.uk/, Prosite에 대해서는 http://www.expasy.org/prosite/를 참조할 수 있다.
PPR 모티프의 보존 아미노산 서열은 아미노산 수준에서의 보존성은 낮으나, 2차 구조상에서 2개의 α-헬릭스는 잘 보존되고 있다. 전형적인 PPR 모티프는 35개 아미노산으로 구성되는데, 그 길이는 30개 내지 38개 아미노산으로 가변적이다.
보다 구체적으로, PPR 모티프는 하기 일반식(1)로 나타내는 30개 내지 38개 아미노산 길이의 폴리펩티드로 구성된다:
Figure pct00002
 상기 식에서,
Helix A는 12개 아미노산 길이의 α-헬릭스 구조를 형성할 수 있는 부분으로 하기 일반식(2)로 나타내고,
Figure pct00003
(상기 식에서, A1 내지 A12는 각각 독립적으로 아미노산을 나타낸다)
  X는 존재하지 않거나 1개 내지 9개 아미노산 길이로 이루어진 부분이며;
  Helix B는 11개 내지 13개 아미노산 길이로 이루어진 α-헬릭스 구조를 형성할 수 있는 부분이고;
L은 2개 내지 7개 아미노산 길이의 하기 일반식(3)으로 나타내는 부분이다.
Figure pct00004
(상기 식에서, 각 아미노산은 'i'(-1), 'ii'(-2) 등으로 C-말단으로부터 넘버링되고, Liii 내지 Lvii는 존재하지 않을 수도 있다)
(PPR-code)
PPR 모티프는 1, 4, (ii)번 위치의 3가지 아미노산 조합이 염기와의 특이한 결합을 위하여 중요하며, 이들의 조합에 의해 결합하는 염기가 어느 것인지 결정할 수 있다. 1번, 4번, (ii)번 위치의 3가지 아미노산의 조합과 결합이 가능한 염기의 관계는 PPR-code로 알려져 있으며(상기 특허문헌 2), 다음과 같다:
(1) A1, A4 및 Lii의 3가지 아미노산의 조합이 순서대로 발린, 아스파라긴 및 아스파라긴산의 경우, 그 PPR 모티프는 U에 강하게 결합하고 다음으로 C에, 그 다음에 A 또는 G에 결합하는 선택적인 RNA 염기 결합능력을 가진다.
(2) A1, A4 및 Lii의 3가지 아미노산의 조합이 순서대로 발린, 트레오닌, 아스파라긴의 경우, 그 PPR 모티프는 A에 강하게 결합하고 다음으로 G에, 그 다음에 C에 결합하나 U에는 결합하지 않는 선택적인 RNA 염기 결합능력을 가진다.
(3) A1, A4 및 Lii의 3가지 아미노산의 조합이 순서대로 발린, 아스파라긴, 아스파라긴의 경우, 그 PPR 모티프는 C에 강하게 결합하고 다음으로 A 또는 U에 결합하나 G에는 결합하지 않는 선택적인 RNA 염기 결합능력을 가진다.
(4) A1, A4 및 Lii의 3가지 아미노산의 조합이 순서대로 글루탐산, 글리신, 아스파라긴산의 경우, 그 PPR 모티프는 G에 강하게 결합하나 A, U 및 C에는 결합하지 않는 선택적인 RNA 염기 결합능력을 가진다.
(5) A1, A4 및 Lii의 3가지 아미노산 조합이 순서대로 이소류신, 아스파라긴, 아스파라긴의 경우, 그 PPR 모티프는 C에 강하게 결합하고 다음 U에, 그 다음 A에 결합하나 G에는 결합하지 않는 선택적인 RNA 염기 결합능력을 가진다.
(6) A1, A4 및 Lii의 3가지 아미노산의 조합이 순서대로 발린, 트레오닌, 아스파라긴산의 경우, 그 PPR 모티프는 G에 강하게 결합하고 다음에 U에 결합하나 A와 C에는 결합하지 않는 선택적인 RNA 염기 결합능력을 가진다.
(7) A1, A4 및 Lii의 3가지 아미노산의 조합이 순서대로 리신, 트레오닌, 아스파라긴산의 경우, 그 PPR 모티프는 G에 강하게 결합하고 다음에 A에 결합하나 U 및 C에는 결합하지 않는 선택적인 RNA 염기 결합능력을 가진다.
(8) A1, A4 및 Lii의 3가지 아미노산의 조합이 순서대로 페닐알라닌, 셀린, 아스파라긴의 경우, 그 PPR 모티프는 A에 강하게 결합하고 다음으로 C에, 그 다음으로 G 및 U에 결합하는 선택적인 RNA 염기 결합능력을 가진다.
(9) A1, A4 및 Lii의 3가지 아미노산 조합이 순서대로 바린, 아스파라긴, 셀린의 경우, 그 PPR 모티프는 C에 강하게 결합하고 다음에 U에 결합하나 A 및 G에는 결합하지 않는 선택적인 RNA 염기 결합능력을 가진다.
(10) A1, A4 및 Lii의 3가지 아미노산의 조합이 순서대로 페닐알라닌, 트레오닌, 아스파라긴의 경우, 그 PPR 모티프는 A에 강하게 결합하나 G, U 및 C에는 결합하지 않는 선택적인 RNA 염기 결합능력을 가진다.
(11) A1, A4 및 Lii의 3가지 아미노산의 조합이 순서대로 이소류신, 아스파라긴, 아스파라긴산의 경우, 그 PPR 모티프는 U에 강하게 결합하고 다음에 A에 결합하나 G 및 C에는 결합하지 않는 선택적인 RNA 염기 결합능력을 가진다.
(12) A1, A4 및 Lii의 3가지 아미노산의 조합이 순서대로 트레오닌, 트레오닌, 아스파라긴의 경우, 그 PPR 모티프는 A에 강하게 결합하나 G, U 및 C에는 결합하지 않는 선택적인 RNA 염기 결합능력을 가진다.
(13) A1, A4 및 Lii의 3가지 아미노산의 조합이 순서대로 이소류신, 메티오닌, 아스파라긴산의 경우, 그 PPR 모티프는 U에 강하게 결합하고 다음에 C에 결합하나 A 및 G에는 결합하지 않는 선택적인 RNA 염기 결합능력을 가진다.
(14) A1, A4 및 Lii의 3가지 아미노산의 조합이 순서대로 페닐알라닌, 프롤린, 아스파라긴산의 경우, 그 PPR 모티프는 U에 강하게 결합하고 다음에 C에 결합하나 A 및 G에는 결합하지 않는 선택적인 RNA 염기 결합능력을 가진다.
(15) A1, A4 및 Lii의 3가지 아미노산의 조합이 순서대로 티로신, 프롤린, 아스파라긴산의 경우, 그 PPR 모티프는 U에 강하게 결합하나 A, G 및 C에는 결합하지 않는 선택적인 RNA 염기 결합능력을 가진다.
(16) A1, A4 및 Lii의 3가지 아미노산의 조합이 순서대로 류신, 트레오닌, 아스파라긴산의 경우, 그 PPR 모티프는 G에 강하게 결합하나 A, U 및 C에는 결합하지 않는 선택적인 RNA 염기 결합능력을 가진다.
(P 어레이)
PPR 단백질은 구성하는 PPR 모티프 구조에 따라 P와 PLS 두 패밀리로 분류된다.
P형 PPR 단백질은 표준 35개 아미노산 PPR 모티프(P)의 단순 반복(P 어레이)으로 구성된다. 본 발명의 DYW 도메인은 P형의 PPR 단백질에 연결하여 사용할 수 있다.
(PLS 어레이)
PLS형 PPR 단백질의 PPR 모티프는 P1, L1 및 S1의 3가지 PPR 모티프의 반복단위로 구성되며, 그 반복적인 C-말단 쪽으로 P2, L2 및 S2 모티프가 이어진다. 아울러, 마지막 P2L2S2 모티프의 C-말단 쪽에 E1 및 E2라 불리는 2개의 PPR 유사 모티프, 그리고 DYW 도메인이 이어지는 경우가 있다.
P1의 전체 길이는 표적염기에 결합할 수 있는 한 특별히 한정되지 않으나, 예를 들어, 33개 내지 37개 아미노산 길이, 바람직하게는 34개 내지 36개 아미노산 길이, 보다 바람직하게는 35개 아미노산 길이이다. L1의 전체 길이는 표적염기에 결합할 수 있는 한 특별히 한정되지 않으나, 예를 들어, 33개 내지 37개 아미노산 길이, 바람직하게는 34개 내지 36개 아미노산 길이, 보다 바람직하게는 35개 아미노산 길이이다. S1의 전체 길이는 표적염기에 결합할 수 있는 한 특별히 한정되지 않으나, 예를 들어, 30개 내지 33개 아미노산 길이, 바람직하게는 30개 내지 32개 아미노산 길이, 보다 바람직하게는 31개 아미노산 길이이다.
P2의 전체 길이는 표적염기에 결합할 수 있는 한 특별히 한정되지 않으나, 예를 들어, 33개 내지 37개 아미노산 길이, 바람직하게는 34개 내지 36개 아미노산 길이, 보다 바람직하게는 35개 아미노산 길이이다. L2의 전체 길이는 표적염기에 결합할 수 있는 한 특별히 한정되지 않으나, 예를 들어, 34개 내지 38개 아미노산 길이이고, 바람직하게는 35 내지 37개 아미노산 길이, 보다 바람직하게는 36개 아미노산 길이이다. S2의 전체 길이는 표적염기에 결합할 수 있는 한 특별히 한정되지 않으나, 예를 들어, 30개 내지 34개 아미노산 길이, 바람직하게는 31 내지 33개 아미노산 길이, 보다 바람직하게는 32개 아미노산 길이이다. 서열번호: 17, 22 및 27에는 본 명세서의 실시예에서 사용한 P2의 서열을 나타낸다. 서열번호: 18, 23 및 28에는 본 명세서의 실시예에서 사용한 L2의 서열을 나타낸다. 서열번호: 19, 24 및 29에는 본 명세서의 실시예에서 사용한 S2의 서열을 나타낸다.
E1의 전체 길이는 표적염기에 결합할 수 있는 한 특별히 한정되지 않으나, 예를 들어, 32개 내지 36개 아미노산 길이, 바람직하게는 33개 내지 35개 아미노산 길이, 보다 바람직하게는 34개 아미노산 길이이다. 서열번호: 20, 25, 30에는 본 명세서의 실시예에서 사용한 E1의 서열을 나타낸다.
E2의 전체 길이는 표적염기에 결합할 수 있는 한 특별히 한정되지 않으나, 예를 들어, 30개 내지 34개 아미노산 길이, 바람직하게는 31 내지 33개 아미노산 길이, 보다 바람직하게는 33개 아미노산 길이이다. 서열번호: 21, 26, 31에는 본 명세서의 실시예에서 사용한 E2의 서열을 나타낸다.
PLS형 PPR 단백질에서 P1L1S1의 반복 부분과 P2까지의 부분은 상술한 PPR-code의 규칙에 따라 표적 RNA의 서열에 따라 설계할 수 있다.
S2 모티프는 ii의 아미노산(서열번호 19의 31번째 N)이 대응하는 뉴클레오티드와 상관이 있다(참조: 상기 비특허문헌 8). 또한, S2 모티프의 표적염기의 4개 오른쪽 C 또는 U가 DYW 도메인에 의한 편집 표적염기라는 점에 유의하여, PLS형 PPR 단백질에 포함시킬 수 있다.
E1 모티프에서 뉴클레오티드와의 상관관계는 4번째(서열번호: 20의 4번째 G) 아미노산에서만 볼 수 있다(참조: Ruwe et al.(2019) New Phytol. 222:218-229).
E2 모티프 중 4번째(서열번호: 21의 4번째 V) 및 마지막(서열번호: 21의 33번째 K) 아미노산은 고도로 보존되어 있으며, 특정 PPR-RNA 인식에는 관여하지 않는다(참조: 상기 비특허문헌 2).
P1L1S1의 반복수는 표적염기 서열에 결합할 수 있는 한 특별히 한정되지 않으나, 예를 들어, 1 내지 5이고 바람직하게는 2 내지 4이고, 보다 바람직하게는 3이다. 원리적으로는 1단위(3개)도 이용할 수 있다. PPR 모티프가 5개로 구성되는 MEF8(L1-S1-P2-L2-S2-E-DYW)은 약 60개소의 편집과 관련된 것으로 알려져 있다.
천연 PPR 단백질에서 처음과 끝에 위치한 P1L1S1은 특정 위치에 있는 아미노산 잔기에 뚜렷한 차이를 보여 내부 P1L1S1과 다르다. 천연에 존재하는 것에 되도록 가까운 인공 PLS 어레이를 설계한다는 관점에서는, 첫 번째(N-말단)에 위치하는 P1L1S1, 내부에 위치하는 P1L1S1, 그리고 P2L2S2의 직전에 위치하는 마지막(C-말단)의 P1L1S1로 나누어, PPR 모티프의 위치에 따른 3 종류의 P1L1S1을 설계하면 좋다. 또한, 천연에는 P-L-S의 반복단위로 구성되어 있는 것과는 별도로 SS(31개 아미노산)가 반복되고 있는 경우도 있으며, 이러한 것도 본 발명에 이용할 수 있다.
[DYW 단백질]
본 발명은 적어도 하나의 PPR 모티프를 포함하며 PPR-code의 규칙에 따라 표적 RNA에 서열 특이적으로 결합가능한 RNA 결합 도메인 및 상술한 DYW:PG, DYW:WW 또는 DYW:KP 중 하나인 DYW 도메인을 포함하는 표적 RNA를 편집하기 위한 DYW 단백질을 제공한다.
이러한 DYW 단백질은 인공의 것일 수 있다. 인공이란 천연물이 아닌 인위적으로 합성한 것임을 의미한다. 인공인 것은 예를 들어, 천연에는 없는 서열 DYW 도메인을 가질 경우, 천연에는 없는 서열의 PPR 결합 도메인을 가지는 경우, RNA 결합 도메인과 DYW 도메인과 천연에는 없는 조합을 가지는 경우, 동물 세포에서의 RNA 편집용 단백질이 식물 유래의 천연 DYW 단백질에 존재하지 않는 부분, 예컨대 핵이행 신호, 사람 미토콘드리아 이행 신호가 추가로 부가되어 있는 경우가 해당된다. 핵이행 신호서열(nuclear transition signal sequence)의 예로서는, SV40 대형 T 항원(SV40 large T antigen), PKKKRKV(서열번호: 32), 뉴클레오플라스민(nucleoplasmin)의 NLS인 KRPAATKKAGQAKKKK(서열번호: 33) 등을 들 수 있다.
PPR 모티프의 수는 표적으로 하는 RNA의 서열에 응하고 적절하다고 할 수 있다. PPR 모티프의 수는 최소한 1개면 되고 2개 이상이라도 무방하다. PPR 모티프가 2개로 RNA와 결합하는 것이 알려져 있다(참조: Nucleic Acids Research, 2012, Vol. 40, No. 6, 2712-2723).
DYW 단백질의 바람직한 일 실시태양은 다음과 같다.
적어도 1개, 바람직하게는 2개 내지 25개, 보다 바람직하게는 5개 내지 20개, 보다 더 바람직하게는 10개 내지 18개의 PPR 모티프를 포함하고, PPR-code 규칙에 따라서 표적 RNA에 서열 특이적으로 결합가능한 RNA 결합 도메인 및 상술한 DYW:PG, DYW:WW 또는 DYW:KP의 어느 하나인 DYW 도메인을 포함하는, 표적 RNA를 편집하기 위한 인공 DYW 단백질.
다른 DYW 단백질의 바람직한 일 실시태양은 다음과 같다.
적어도 1개, 바람직하게는 2개 내지 25개, 보다 바람직하게는 5개 내지 20개, 보다 더 바람직하게는 10개 내지 18개의 PPR 모티프를 포함하고, PPR-code 규칙에 따라서 동물의 표적 RNA에 서열 특이적으로 결합가능한 RNA 결합 도메인(바람직하게는, PLS형 PPR 단백질인 RNA 결합 도메인) 및 상술한 DYW:PG, DYW:WW 또는 DYW:KP의 어느 하나인 DYW 도메인을 포함하는, 표적 RNA를 편집하기 위한 DYW 단백질.
본 발명의 DYW 도메인, RNA 결합 도메인인 PPR 단백질 및 DYW 단백질은 당업계에 주지된 방법으로 비교적 대량으로 제조할 수 있다. 이러한 방법은 목적으로 하는 도메인 또는 단백질의 아미노산 서열에서 그것을 암호화하는 핵산서열을 결정하고, 복제하여, 목적으로 하는 도메인 또는 단백질을 생산하는 형질전환체를 작제하는 것을 포함할 수 있다.
[DYW 단백질의 이용]
(DYW 단백질 등을 암호화하는 핵산, 벡터, 세포)
본 발명은 상술의 PPR 모티프, DYW 단백질 또는 DYW 단백질을 암호화하는 핵산, 핵산을 포함한 벡터(예를 들면, 증폭을 위한 벡터, 발현벡터)도 제공한다. 벡터에는 바이러스 벡터도 포함된다. 증폭을 위한 벡터로는 대장균이나 효모를 숙주로 이용할 수 있다. 본 명세서에서 발현벡터(expression vector)란 예를 들어, 상류에 프로모터 서열(promoter sequence)을 갖는 DNA, 원하는 단백질을 암호화하는 DNA 및 종결 서열(terminator sequence)을 갖는 DNA를 포함하는 벡터를 의미하나, 원하는 기능을 발휘하는 한 반드시 이 순서로 서열되어 있을 필요는 없다. 본 발명에서는 당업계에서 통상적으로 사용되는 다양한 벡터를 재조합하여 사용할 수 있다.
구체적으로, 본 발명은 적어도 1개의 PPR 모티프를 포함하며 PPR-code의 규칙에 따라 표적 RNA(바람직하게는, 동물의 표적 RNA)에 서열 특이적으로 결합가능한 RNA 결합 도메인(바람직하게는, PLS형 PPR 단백질인 RNA 결합 도메인) 및 상술한 DYW:PG, DYW:WW 또는 DYW:KP 중 하나인 DYW 도메인을 포함하는 DYW 단백질을 암호화하는 뉴클레오티드 서열을 제공한다.
또한 구체적으로, 본 발명은 적어도 1개의 PPR 모티프를 포함하며 PPR-code의 규칙에 따라 표적 RNA(바람직하게는, 동물의 표적 RNA)에 서열 특이적으로 결합가능한 RNA 결합 도메인(바람직하게는, PLS형 PPR 단백질인 RNA 결합 도메인), 및 상술한 DYW:PG, DYW:WW 또는 DYW:KP 중 하나인 DYW 도메인을 포함하는 DYW 단백질을 암호화하는 뉴클레오티드 서열을 포함하는 표적 RNA를 편집하기 위한 벡터를 제공한다.
본 발명의 DYW 단백질은 진핵생물(예를 들어, 동물, 식물, 미생물(효모 등), 원생생물)의 세포에서 기능을 발휘할 수 있다. 본 발명의 DYW 단백질은 특히 동물세포 내(실험실 조건 또는 생체내 조건)에서 기능을 발휘할 수 있다. 본 발명에서의 DYW 단백질 또는 DYW 단백질을 발현하는 벡터를 도입할 수 있는 동물 세포로는, 예를 들어, 사람, 원숭이, 돼지, 소, 말, 개, 고양이, 마우스, 래트 유래의 세포를 들 수 있다. 또한, 본 발명의 DYW 단백질 또는 DYW 단백질을 발현하는 벡터를 도입할 수 있는 배양세포로는, 예를 들어, 차이니즈 햄스터 난소(CHO) 세포, COS-1 세포, COS-7 세포, VERO(ATCC CCL-81) 세포, BHK 세포, 개의 신장 유래 MDCK 세포, 햄스터 AV-12-664 세포, HeLa 세포, WI38 세포, 293 세포, 293T 세포, PER.C6 세포를 들 수 있지만, 이들에 국한되는 것은 아니다.
(용도)
본 발명의 DYW 단백질에 의해 표적 RNA에 포함되는 편집 표적 C를 U로, 또는 편집 표적 U를 C로 변환할 수 있다. RNA 결합성 PPR 단백질은 세포기관(organelle)에서 볼 수 있는 RNA의 모든 가공 단계, 즉 절단(cleavage), RNA 편집(edition), 번역(translation), 접합(splicing), RNA 안정화(stabilization)에 관여한다.
또한, 본 발명의 DYW 단백질에 의해 미토콘드리아의 RNA1 염기 편집을 할 수 있다. 미토콘드리아는 독자적인 게놈을 가지고 있으며 호흡 및 ATP 생산에 관련된 중요한 복합체의 구성 단백질이 암호화되어 있다. 이들의 변이로 인해 다양한 질병이 발병하는 것으로 알려져 있다. 본 발명을 이용한 변이 수복에 의해 다양한 질병의 처치를 기대할 수 있다.
한편, CRISPR-Cas 시스템은 Cas 단백질을 변형한 ADAR 도메인에 융합시킴으로써 세포질에서의 C-to-U RNA 편집 툴로서 개발되고 있다(참조: Abudayyeh et al., 2019년). 그러나, CRISPR-Cas 시스템은 단백질과 가이드 RNA로 구성되어 있어 가이드 RNA의 효율적인 미토콘드리아 수송이 어렵다. 한편, PPR 단백질은 1분자로 RNA 편집이 가능하며, 일반적으로 단백질은 N-말단측에 미토콘드리아 국재 시그널 서열(localization signal sequence)을 융합함으로써 미토콘드리아로의 송달이 가능하다. 이에, 본 발명이 미토콘드리아의 RNA 편집에 이용될 수 있는지를 확인하기 위해, MT-ND2와 MT-ND5를 표적하는 PPR을 설계하고 PG 또는 WW 도메인을 융합한 유전자를 작제하였다(도 10의 a).
미토콘드리아 표적서열(MTS)과 PPR-P 서열로 이루어진 이들 단백질은 HEK293T 세포에 악영향을 주지 않도록, MT-ND2와 MT-ND5의 178번째와 301번째 코돈의 3번째 위치를 표적으로 한다(도 10의 a). HEK293T 세포에 플라스미드로 도입한 후, MT-ND2와 MT-ND5의 mRNA 내에서 편집을 확인하였다(도 10의 b,c). 이들 4개 단백질은 표적에 대해 최고 70%의 편집활성이 검출되었으며, 같은 mRNA 분자에 대해 오프타겟 변이(off-target mutation)는 검출되지 않았다(도 10의 b,c).
따라서, 본 발명에 따라 제공되는 RNA 염기 편집방법은 다양한 분야에서 다음과 같은 이용을 기대할 수 있다.
(1) 의료
·특정 질환과 관련된 특정 RNA를 인식하고 편집한다. 본 발명을 이용하여 1개의 염기변이에 의한 유전병을 처치할 수 있다. 유전병에서 많은 변이 방향은 C에서 U로의 변이이다. 따라서, 특별히 U를 C로 변환할 수 있는 본 발명의 방법은 유용하다.
·RNA의 억제·발현이 조절되는 세포를 작제한다. 이러한 세포에는 분화·미분화 상태를 모니터링한 줄기세포(예를 들어, iPS 세포), 화장품 평가용 모델세포, 창약의 메커니즘 해명이나 약리시험을 목적으로 기능성 RNA의 발현을 ON/OFF 할 수 있는 세포가 포함된다.
(2) 농림 수산업
·농작물, 임산물, 수산물 등에서, 수량이나 품질을 개선한다.
·내병성의 향상, 환경내성의 향상, 향상된 또는 새로운 기능성을 가진 생물을 육종한다.
예를 들어, 잡종 제1대(F1) 작물에 관해 DYW 단백질에 의한 미토콘드리아 RNA의 편집을 통해 인공적으로 F1 작물을 만들어 수율과 품질을 개선할 수 있다. DYW 단백질에 의한 RNA 편집은 기존 기술보다 정확하고 신속하게 생물의 품종 개량, 육종(생물을 유전적으로 개량하는 것)이 가능하다. 또한, DYW 단백질에 의한 RNA 편집은 유전자 조작과 같이 외래 유전자에 의해 형질을 전환하는 것이 아니기 때문에, 변이체의 선발이나 되돌림 교잡(backcrossing)이라는 종래의 육종방법에 가깝다고 할 수 있다. 따라서, 전 지구 차원의 식량 문제, 환경 문제에도 확실하고 신속하게 대응할 수 있다.
(3) 화학
미생물, 배양세포, 식물체, 동물체(예를 들면, 곤충체)를 이용한 유용물질 생산에서 RNA의 조작에 의해 단백질 발현량을 제어한다. 이로써, 유용 물질의 생산성을 개선할 수 있다. 유용물질의 예로는 항체, 백신, 효소 등의 단백질성 물질 외에 의약품의 중간체, 향료, 색소 등의 비교적 저분자 화합물이다.
·조류나 미생물의 대사경로 변경에 의해, 바이오 연료의 생산효율을 개선한다.
[용어]
수치범위 'x 내지 y'는 특별히 기재한 경우를 제외하고, 양단의 값 x 및 y를 포함한다.
단백질이나 폴리펩티드의 아미노산 서열과 관련하여, 아미노산 잔기를 단순히 아미노산이라 한다.
염기 서열(뉴클레오티드 서열이라고도 함) 또는 아미노산 서열에 관하여 '동일성(identity)'이란 용어는, 특별히 기재한 경우를 제외하고, 2개의 서열을 최적의 상태로 정렬시킨 경우에 2개의 서열간에 공유하는 일치된 염기 또는 아미노산 개수의 백분율을 의미한다. 즉, [동일성=(일치한 위치의 수/위치의 전수)×100]으로 산출할 수 있으며, 시판되고 있는 알고리즘을 이용해 계산할 수 있다. 또한, 이러한 알고리즘은 [Altschul et al., J. Mol. Biol. 215(1990) 403-410]에 기재된 NBLAST 및 XBLAST 프로그램 중에 포함되어 있다. 보다 구체적으로, 염기서열 또는 아미노산 서열의 동일성에 관한 검색·해석은 해당 업체에는 알려진 알고리즘 또는 프로그램(예를 들어, BLASTN, BLASTP, BLASTX, Clustal W)을 통해 수행할 수 있다. 프로그램을 이용할 경우의 파라미터는 해당 업체라면 적절히 설정할 수 있고, 또한 각 프로그램의 디폴트 파라미터를 이용해도 된다. 이들 해석방법의 구체적인 방법 또한 당업계에 주지되어 있다.
염기 서열 또는 아미노산 서열과 관련하여 서열 동일성은, 특별히 기재한 경우를 제외하고는, 높은 것이 바람직하다. 구체적으로는 40% 이상인 것이 바람직하고, 45% 이상인 것이 보다 바람직하며, 50% 이상인 것이 보다 더 바람직하고, 55% 이상인 것이 더욱 바람직하며, 60% 이상인 것이 더욱 더 바람직하고, 65% 이상인 것이 더욱 더 바람직하다. 또한, 70% 이상인 것이 바람직하고, 80% 이상인 것이 보다 바람직하며, 85% 이상인 것이 보다 더 바람직하고, 90% 이상인 것이 더욱 바람직하며, 95% 이상인 것이 더욱 더 바람직하고, 97.5% 이상인 것이 가장 바람직하다.
또한, 본 발명에서의 PPR 모티프 또는 단백질에 관하여, '치환, 결실 또는 부가된 서열'이라고 할 경우, 치환 등이 되는 아미노산의 개수는 특별히 기재하였을 경우를 제외하고, 어느 모티프 또는 단백질에서도 그 아미노산 서열로 구성된 모티프 또는 단백질이 원하는 기능을 가지는 한 특별히 한정되지 않으나, 1개 내지 9개 또는 1개 내지 4개 정도이다. 이러한 아미노산 서열과 관련된 폴리뉴클레오티드 또는 단백질을 제조하기 위한 수단은 당업자에게 잘 알려져 있다.
성질이 유사한 아미노산이라 함은 하이드로파시(hydropathy), 하전(charge), pKa, 용해도(solubility) 등 물성이 유사한 아미노산을 의미하며, 예를 들어 다음과 같은 것을 가리킨다.
소수성(hydrophobic) 아미노산: 알라닌, 발린, 글리신, 이소류신, 류신, 페닐알라닌, 프롤린, 트립토판, 티로신;
비소수성(non-hydrophobic) 아미노산: 아르기닌, 아스파라긴, 아스파라긴산, 글루타민산, 리신, 세린, 트레오닌, 시스테인, 히스티딘;
친수성(hydrophilic) 아미노산: 아르기닌, 아스파라긴, 아스파라긴산, 글루타민산, 리신, 세린, 트레오닌;
산성(acidic) 아미노산: 아스파라긴산, 글루탐산;
염기성(basic) 아미노산: 리신, 아르기닌, 히스티딘;
중성(neutral) 아미노산: 알라닌, 아스파라긴, 시스테인, 글루타민, 글리신,이소류신, 류신, 메티오닌, 페닐알라닌, 프롤린, 세린, 트립토판, 티로신, 발린;
함황(sulfur-containing) 아미노산: 메티오닌, 시스테인;
함방향환(aromatic ring-containing) 아미노산: 티로신, 트립토판, 페닐알라닌.
DYW 도메인 설계와 대장균 내에서의 RNA 편집활성 측정
[결과]
(DYW 도메인 설계)
현재 이용가능한 식물의 유전체 정보 대부분이 피자식물의 것이기 때문에, 인공 DYW 단백질의 개발은 DYW:PG 형에 한정된다. 한편, 전사체(transcriptome) 데이터는 부분 서열이지만, C-to-U 및 U-to-C RNA 편집을 모두 갖는 초기의 육상식물종 정보를 포함한다. 이에, 본 발명자들은 1000 Plants(1KP) 국제 컨소시엄에 의해 작성된 트랜스크립톰 데이터셋(transcriptome dataset)에 기초하여 구축된 PPR 단백질 데이터베이스(상기 비특허문헌 11)를 이용하여, 완전한 인공 DYW 도메인을 설계하였다.
인공 DYW 도메인을 설계함에 있어, 시티딘 디아미나제 유사 DYW 도메인에 더해 PPR(P2 및 L2) 모티프와 PPR 유사(S2, E1 및 E2) 모티프를 설계에 추가하였다. 이는 이들 모티프가 RNA 편집활성에 미치는 중요성을 현 시점에서 알 수 없기 때문이다. 본 발명자들은 이끼류, 소엽류 및 양치식물의 DYW 도메인 계통수를 작성하여, DYW:PG, DYW:WW 및 DYW:KP의 3개 그룹으로 분류하였다. 이어, 이들 그룹별 DYW 도메인에 대해 새롭게 계통수를 작성하여, 인공 DYW 도메인 설계에 이용 가능한 단백질 계통군을 선발하였다(도 1). DYW:PG 그룹은 서열 간 차이가 크기 때문에, 설계에 이용하는 단백질 계통군을 선택하는 것이 어려웠다(도 1의 a). 소엽류의 단백질 서열이 다양하고 수도 많았기 때문에, 본 발명자들은 이 단백질에 초점을 맞추기로 하였다(PG1). DYW:WW 도메인 설계에는 이끼류에서만 볼 수 있는 분지가 짧은 단백질 계통군을 선택하였다(도 1의 b, WW1). 이 계통군은 분지(branch)가 짧은 단백질 간 유전자 변이가 작을 것으로 추정된다. 아울러, DYW:KP 도메인 설계에는 양치식물에 특이적인 DYW 도메인 계통군에 주목하였다. 이 계통군에 포함된 단백질의 서열은 아미노산의 변이는 크지만 길이는 보존되어 있다(도 1의 c, KP1).
(RNA 결합 도메인 설계)
본 발명자들은 각 DYW 도메인을 식물의 게놈 정보로부터 동정된 PPR 모티프 서열(상기 비특허문헌 2)에 근거해 설계한 인공 P 또는 PLS 어레이와 융합시켰다(도 2의 a). P 어레이 PPR 모티프는 35개 아미노산의 P 모티프 얼라인먼트로부터 얻은 공통 서열을 기반으로 구축한 것이고, RNA 인식을 높이기 위하여 몇 개의 아미노산을 치환한 것이다. PLS 어레이의 설계에는 표준 길이의 35개 아미노산 모티프(P1 및 L1)와 31개 아미노산 모티프(S1)를 선택하였다. 천연 PPR 단백질에서 처음과 끝에 위치한 P1L1S1은 특정 위치에 있는 아미노산 잔기에 뚜렷한 차이를 보여 내부 P1L1S1과 다르다. 천연에 존재하는 것에 되도록 가까운 인공 PLS 어레이를 설계하기 위해서, 처음(N-말단)에 위치하는 P1L1S1, 내부에 위치하는 P1L1S1, 그리고 P2L2S2의 직전에 위치하는 마지막(C-말단)의 P1L1S1로 나누어, PPR 모티프의 위치에 따른 3 종류의 P1L1S1을 설계하였다. 이후에서는, 이러한 단백질을 그 구조에 근거해 명명한다. 예를 들면, P 어레이에 DYW:WW 도메인을 융합시킨 것은 'P-DYW:WW'로 명명하였다.
(인공 DYW 단백질은 표적서열을 특이적으로 편집 가능하다)
애기장대(Arabidopsis thaliana)에서 PPR 단백질 CLB19는 엽록체 rpoA 및 clpPRNA 상에 있는 RNA 편집 부위를 인식한다. 본 발명자들은 rpoA 편집 부위를 표적으로 하는 PPR 단백질을 설계하기로 하였다. P1, L1, S1 및 P2 모티프에서의 4번째와 ii번째 아미노산은 PPR 코드를 따랐다. 한편, C-말단 PPR 유사 모티프(L2, S2, E1, E2)에 관한 PPR 코드는 알려져 있지 않기 때문에, L2, S2, E1 및 E2 모티프에 관해서는 CLB19의 4번째와 ii번째 아미노산을 사용하였다(도 2의 b).
재조합 인공 DYW 단백질을 암호화하는 유전자 영역을 발현벡터에 클로닝하고, 그 종결 코돈 하류에 표적서열을 부가하였다. 과거에 행해진 히메츠리가네이끼 (Physcomitrella patens)의 2종류 PPR 단백질(PPR56, PPR65)에 관한 연구를 토대로(상기 비특허문헌 12), 설계한 PPR 단백질의 RNA 편집활성을 대장균 내에서 시험하는 방법을 개발하였다. 설계한 PLS-DYW:PG1 및 PLS-DYW:WW1은 DNA에 대해 편집활성을 볼 수 없었던 반면, RNA에 대해서는 90%를 웃도는 편집효율로 시티딘을 유리딘으로 치환하였다(도 3의 a, b, d). PLS 도메인 대신 P 어레이를 이용하였을 경우, 편집효율이 10% 내지 40% 떨어졌다. 한편, P-DYW:KP 및 PLS-DYW:KP 양쪽에서 U-to-C RNA 편집활성을 볼 수 있었다(도 3의 c, e). 그러나, 그 편집활성은 DYW:PG 및 DYW:WW와 비교해 떨어졌다.
[방법]
(계통수)
DYW 도메인(최단 132개 아미노산)을 포함하는 P2-L2-S2-E1-E2-DYW 도메인을 PPR 데이터베이스(https://ppr.plantenergy.uwa.edu.au/onekp/; 상기 비특허문헌 11)로부터 추출하였다. 얻어진 서열 얼라인먼트를 MAFFT L-INS-i(v7.407 automatic mode)(참조: K. Katoh, D.M. Standley(2013). Mol Biol Evol.30(4): 772-780)을 사용하여 작제하고, 그 후 trimAl(v.1.4.rev15)(참조: Salvador Capella-Gutierrez, et al.(2009). Bioinformatics.25(15); 1972-1973)를 이용하여 트리밍하였다. 트리밍에서는 파라미터를 gt0.2 cons20으로 하였다. 활성부위(HxExnCxCH)에 변이를 갖는 서열은 얼라인먼트에서 제외하였다(도 4).
나머지 서열로부터 Fast Tree(v2.1.10) (참조: Price, M.N., et al. (2010). PLoS One 5:e9490)를 사용하여 계통수를 작성하고, DYW:PG, DYW:WW 및 DYW:KP를 동정하였다. 이때의 파라미터는 wag 및 cat8로 하였다.
(Trx-PPR-DYW 단백질 및 표적서열 클로닝)
각 DYW 도메인(P2, L2, S2, E1, E2를 포함)의 공통서열(consensus sequence)을 EMBOSS:cons(v.6.6.0.0)를 사용하여 설계하였다. 단백질 발현용 벡터는 pET21b+PA를 변형하여 원래의 Esp3I와 BpiI 제한효소 부위를 제거하고, 클로닝 사이트로 2개의 Esp3I 부위를 부가하였다. 유전자는 4개의 섹션(Trx, PPR 어레이, DYW 도메인 및 RNA 편집부위)으로 나누어, 2단계의 Golden Gate법을 사용하여 구축하였다. 우선, 개변 pET21b 벡터의 Esp3I 부위에 1) 티오레독신-6×His-TEV 유전자 영역(3'에 BpiI 제한효소 부위 포함), 2) P2-L2-S2-E1-E2-DYW 유전자 영역(5'에 BpiI 제한효소 부위 포함), 및 3) RNA 편집 부위의 암호화 서열 영역의 3부분을 클로닝하였다. 이어서, BpiI 부위에 전체 길이 PLS 도메인 또는 P 도메인을 클로닝하여, PLS:DYW(서열번호: 35 내지 37) 또는 P:DYW(서열번호: 38 내지 40) 단백질을 작제하였다.
(대장균 내에서의 RNA 편집활성 측정)
Oldenkott 등에 의해 개발된 프로토콜(상기 비특허문헌 12)을 변형하여, 재조합 단백질의 RNA 편집활성을 대장균 내에서 분석하였다. 위에서 작제한 플라스미드 DNA를 대장균 Rosetta 2주에 도입하고, 1mL의 LB 배지(카르베니실린 50μg/mL 및 클로람페니콜 17μg/mL 함유)에서 37℃의 온도조건에서 하룻밤 배양하였다. 5mL의 적절한 항생제를 함유한 LB 배지를 심층 24웰 플레이트에 준비하고 전배양액 100μL를 여기에 접종하였다. 이 배양액을 흡광도(OD600)가 0.4 내지 0.6에 이를 때까지 37℃의 온도조건으로 200rpm에서 생육시킨 다음, 플레이트를 4℃에서 10분 내지 15분간 냉각시켰다. 이어, 0.4mM의 ZnSO4와 0.4mM의 IPTG를 가하고, 16℃, 180rpm의 조건에서 18시간 동안 배양하였다. 배양액 750μL를 취하여 원심분리한 다음, 균체 펠릿을 액체질소 안에서 동결시켜 -80℃에서 저장하였다.
동결된 세포괴를 200μL의 1-티오글리세롤/균질화 용액에 재현탁하고 40W로 10초간 초음파 처리해 세포를 분리한 다음, 200μL의 용해용 완충용액을 가하였다. Maxwell(등록상표) RSC simplyRNA Tissue Kit(프로메가)를 사용하여 RNA를 추출하였다. RNA를 DNase I(다카라바이오)로 처리하고, SuperScript(등록상표) III Reverse Transcriptase(인비트로젠)를 사용하여, 처리한 RNA 1μg와 1.25μM의 랜덤 프라이머(6mer)를 이용하여 cDNA를 합성하였다. NEBNext High-Fidelity 2x PCR Master Mix(뉴잉글랜드 바이오랩), 1μL의 cDNA 및 티오레독신과 T7 종결서열 프라이머를 사용하여 편집 부위를 포함하는 영역을 증폭하였다. Nucleo Spin(등록상표) Gel and PCR Cleanup(다카라바이오)에서 PCR 산물을 정제하고, DYW 도메인 서열에 특이적인 포워드 프라이머를 이용하여 서열분석을 행하여 RNA 편집 부위의 염기를 결정하였다. RNA 편집효율 측정에는 편집부위의 C와 U의 파형 피크(waveform peak) 높이의 비를 이용하여, C-to-U RNA 편집효율은 U/(C+U)×100, U-to-C 편집효율은 C/(C+U)×100으로 산출하였다. 독립된 실험을 세 차례 반복하였다.
[인용된 서열목록]
Figure pct00005
DYW:PG 서열번호
P2 VSWNAMIAAYAQHGHGKEALQLFQQMQQEGVKPSE 17
L2 VTFTSILSACSHAGLVDEGHHYFESMSPDYGITPRV 18
S2 EHYGCMVDLLGRAGRLDEAEDLIKSMPFQPNV 19
E1 VVWGTLLGACRVHGDVERGERAAERILELDPESA 20
E2 APYVLLSNIYAAAGRWDEAAKVRKLMKERGVKK 21
DYW EPGCSWIEVNNKVHEFVAGDKSHPQTKEIYAELERLSKQMKEAGYVPDTKFVLHDVEEEEKEQLLCYHSEKLAIAFGLISTPPGTPLRIIKNLRVCGDCHTATKFISKIVGREIVVRDANRFHHFKDGVCSCGDYW 1
DYW:WW 서열번호
P2 VTWNALIAGYARQGESDLVFHLLERMRQEGIQPSG 22
L2 VTFTSVLTVCSHAGLVDEGQKYFDAMSEDYGITPRI 23
S2 EHYGCMVDLLGRAGQMDEAVAMVEKMPFQPNL 24
E1 VTWGTLLGACRKWNNVEIGRHAFECAVRLDEKSA 25
E2 AAYVLMSNIYADAHMWEERDKIQAMRKNARAWK 26
DYW KPGQSWWTDTGGIVHTFVVGDTKHPQSQDIYAKLKDLYVKMKEEGYVPHLDCVLWDISDDEKEDALCGHSEKLAIACALINTPPGTPIRIVKNLRVCDDCHKAIALISKIEGRNIICRDASRFHNYKDGKCSCGDYW 2
DYW:KP 서열번호
P2 VAWNSMIKGYGMNHEGKMAVQCFEDMQKQGVKPSA 27
L2 VTFTCLLTACSHASLVSEGQEYFKMMREEYGIAPRV 28
S2 EHYGCMVDLLARSGHLYEAEKFLEMLCPPNE 29
E1 GTWGALLSACKTYGEVELGLRCFQQLVQLNPESA 30
E2 AWYVLMADIYAGAGRWDDAYRIEELRKHAGAKK 31
DYW KPASALIEVNKKVHEFVVGNNQSEEISAMLKSLNSRMKEEGHVPNLDLVLKPVSDEEKEAALCEHAEKLAIAFGLLNTPQGQTLRVTKNLRMCNDCHNASKIISKIERREIILRDDCCIHHFKDGLCSCGDMF 3
Figure pct00006
동물 배양세포에서의 실시예
[결과]
PLS 형 PPR과 각 DYW 도메인(PG1(서열번호: 1), WW1(서열번호: 2), KP1(서열번호: 3)을 융합한 유전자와 표적서열을 포함하는 플라스미드를 HEK293T 세포에 형질도입하고 배양하여 RNA를 회수하였다. 표적부위의 시티딘(C)에서 유리딘(U), 또는 유리딘(U)에서 시티딘(C)으로의 변환효율을 생거(Sanger)의 서열분석법으로 분석하였다(도 5). PG1 또는 WW1 도메인을 융합한 경우 90% 이상의 C to U 활성이 있었으며, U to C 활성은 검출되지 않았다(도 5의 a, c). KP1 도메인을 융합한 경우 U to C 활성이 25% 검출되었는데, C to U 활성도 10% 정도 검출되었다(도 5의 b, c). 이를 통해 동물 배양세포에서도 편집 효소가 기능을 발휘하는 것으로 나타났다.
[방법]
(동물 배양세포 시험용 PPR 발현 플라스미드 작제)
도 3에서 사용한 플라스미드에서 6xHis-PPR-DYW 단백질(대장균에서의 실험에 이용한 것과 동일한 단백질(서열번호: 35 내지 37) 유전자 서열과 편집 사이트를 포함하는 영역(서열번호: 34)을 PCR로 증폭하여, Golden Gate Assembly법에 의해 동물세포 발현벡터로 클로닝하였다. 벡터는 CMV 프로모터와 사람 베타-글로빈 키메라 인트론(human β-globin chimeric intron)을 포함하는 프로모터의 조절에 의해 PPR을 발현시키며, SV40 폴리아데닐화 신호(polyadenylation signal)에 의해 poly A 시그널이 부가된다.
(HEK293T 세포배양)
HEK293T 세포는 고 글루코스(content glucose), 글루타민, 페놀 레드, 피루브산 나트륨(후지필름 화광순약주식회사)을 포함하는 Dulbecco's Modified Eagle Medium(DMEM) 배지에 10% 우태아 혈청(카프리콤)과 1% 페니실린-스트렙토마이신(후지필름 화광순약주식회사)을 가한 것을 이용하여, 37℃, 5% CO2의 조건으로 배양하였다. 세포는 80 내지 90% 콘플루언트가 된 시점에서 2일 내지 3일마다 계대배양하였다.
(형질도입)
RNA 편집 분석에서는 24웰 평저 세포배양 플레이트의 각 웰에 HEK293T 세포를 약 8.0x104 개씩 넣어 37℃, 5% CO2에서 24시간 배양하였다. 각 웰에 500ng의 플라스미드를 18.5μl의 Opti-MEM(등록상표) I Reduced Serum Medium(Thermo Fisher)과 1.5μl의 FuGENE(등록상표) HD Transfection Reagent(Promega)를 가하여, 최종적으로 25μl의 용량으로 만들었다. 혼합액은 세포에 첨가하기 전 실온에서 10분간 배양하였다. 형질도입 24시간 후에 세포를 회수하였다.
(RNA 추출, 역전사, 서열결정)
상술한 대장균에서의 분석과 동일하게 실시하였다. 또한, 다음 실시예에서는 특별히 기재한 경우를 제외하고는, 대장균에서의 분석 및 본 실시예와 동일한 방법으로 실험을 실시하였다.
RNA 편집활성에 미치는 도메인 스와핑(domain swapping)의 영향
DYW 도메인은 아미노산 서열의 보존성(conservation)에서 몇 개의 영역으로 구분할 수 있으나, 이들 RNA 편집활성과의 연관성은 알려져 있지 않다. 여기에서는 KP1과 WW1 도메인 일부를 스와핑하여 HEK239T 세포 중에서 RNA 편집활성에 미치는 영향을 조사하였다(도 6). WW1 도메인의 PG 박스와 DYW를 KP1 도메인의 활성부위(active site)를 포함하는 중앙 부위에 융합한 것(chimKP1a, 서열번호: 90)에서 KP1 도메인보다 높은 50% 가까운 U to C 활성을 나타내었고, 나아가 C to U 활성이 거의 없어지는 것으로 나타났다. 도메인 스와핑으로 KP 도메인의 U to C 편집 성능을 개선하는 데 성공하였다.
변이도입(mutagenesis)을 통한 KP 도메인의 RNA 편집활성 개선 
KP 도메인의 RNA 편집활성을 향상시키기 위하여, KP 도메인에 다양한 변이를 도입하였다. KP2 내지 KP23(서열번호: 68 내지 89)을 설계하고, C to U 또는 U to C의 RNA 편집활성을 대장균(도 7의 a) 및 HEK293T 세포(도 7의 b, c)로 조사하였다. KP22(서열번호: 88)가 가장 U to C로의 편집활성이 높고 C to U로의 편집활성이 낮아, KP1과 비교해 RNA 편집활성을 개선하는 데 성공하였다.
변이도입을 통한 PG 도메인 RNA 편집활성 개선
PG 도메인의 RNA 편집활성을 향상시키기 위하여, PG 도메인에 다양한 변이를 도입하였다. PG2 내지 PG13(서열번호:41 내지 53)을 설계하고, C to U의 RNA 편집활성을 대장균(도 8의 a) 및 HEK293T 세포(도 8의 b, c)에서 조사하였다. PG11(서열번호: 50)이 가장 C to U에 대한 편집활성이 높아, RNA 편집활성을 개선하는 데 성공하였다.
변이도입을 통한 WW 도메인 RNA 편집활성 개선
WW 도메인의 RNA 편집활성을 향상시키기 위하여, WW 도메인에 다양한 변이를 도입하였다. WW2 내지 W14를 설계하여, C to U의 RNA 편집활성을 대장균(도 9의 a) 및 HEK 293T 세포(도 9의 b, c)에서 조사하였다. WW11(서열번호: 63)이 가장 C to U로의 편집활성이 높아, WW1과 비교해 RNA 편집활성을 개선하는 데 성공하였다.
PPR 단백질을 이용한 사람 미토콘드리아 RNA 편집
[결과]
미토콘드리아는 독자적인 게놈을 가지고 있으며, 호흡 및 ATP 생산에 관련된 중요한 복합체의 구성 단백질이 암호화되어 있다. 이러한 변이로 인해 다양한 질병이 발병하는 것으로 알려져 있어, 변이수복 방법이 요구되고 있다
CRISPR-Cas 시스템은 Cas 단백질로 바뀐 ADAR 도메인에 접목시킴으로써, 세포질에서의 C-to-U RNA 편집도구로 개발되었다(참조: Abudayyeh et al. 2019 Science Vol.365, Issue 6451, pp.382-386). 그러나, CRISPR-Cas 시스템은 단백질과 가이드 RNA(guide RNA)로 구성되어 있으므로, 가이드 RNA의 효율적인 미토콘드리아 수송이 어렵다. 한편, PPR 단백질은 1분자로 RNA 편집이 가능하며, 일반적으로 단백질은 N-말단에 미토콘드리아 국재 시그널 서열(localization signal sequence)을 융합함으로써 미토콘드리아로의 송달이 가능하다. 이에, 본 기술이 미토콘드리아의 RNA 편집에 이용될 수 있는지를 확인하기 위하여, MT-ND2와 MT-ND5를 표적하는 PPR을 설계하고, PG1 또는 WW1 도메인을 융합한 유전자를 작제하였다(도 10a).
미토콘드리아 표적서열(MTS)과 P-DYW 서열로 이루어진 이들 단백질은 HEK293T 세포에 악영향을 주지 않도록, MT-ND2와 MT-ND5의 178번째와 301번째 코돈의 3번째 위치를 표적으로 하고 있다(도 10의 a). HEK293T 세포에 플라스미드로 도입한 후, MT-ND2와 MT-ND5mRNA 내에서 편집을 확인하였다(도 10의 b, c). 이들 4개 단백질은 표적에 대해 최고 70%의 편집활성이 검출되었으며, 같은 mRNA 분자에 대해 오프타겟 변이는 검출되지 않았다(도 10의 b, c).
[방법]
(미토콘드리아 편집을 위한 클로닝)
Zea mays의 LOC100282174 단백질로부터의 미토콘드리아 표적서열(참조: Chin et al. 2018), 10개의 PPR-P 및 PPR 유사 모티프 및 DYW 도메인 부분(DYW 도메인은 PG1과 WW1 사용)을, GCMV 프로모터에 의해 조절되는 발현 플라스미드에 olden Gate Assembly 방법에 의해 클로닝하였다(서열번호: 91 내지 94).
[인용된 서열목록]
Figure pct00007
Figure pct00008
Figure pct00009
Figure pct00010
SEQUENCE LISTING <110> EditForce, Inc. NATIONAL UNIVERSITY CORPORATION TOKAI NATIONAL HIGHER EDUCATION AND RESEARCH SYSTEM KYUSHU UNIVERSITY, NATIONAL UNIVERSITY CORPORATION <120> Methods for Editing Target RNA <130> F20840K-WO <150> JP 2020-065065 <151> 2020-03-31 <160> 96 <170> PatentIn version 3.5 <210> 1 <211> 136 <212> PRT <213> Artificial Sequence <220> <223> DYW:PG <400> 1 Glu Pro Gly Cys Ser Trp Ile Glu Val Asn Asn Lys Val His Glu Phe 1 5 10 15 Val Ala Gly Asp Lys Ser His Pro Gln Thr Lys Glu Ile Tyr Ala Glu 20 25 30 Leu Glu Arg Leu Ser Lys Gln Met Lys Glu Ala Gly Tyr Val Pro Asp 35 40 45 Thr Lys Phe Val Leu His Asp Val Glu Glu Glu Glu Lys Glu Gln Leu 50 55 60 Leu Cys Tyr His Ser Glu Lys Leu Ala Ile Ala Phe Gly Leu Ile Ser 65 70 75 80 Thr Pro Pro Gly Thr Pro Leu Arg Ile Ile Lys Asn Leu Arg Val Cys 85 90 95 Gly Asp Cys His Thr Ala Thr Lys Phe Ile Ser Lys Ile Val Gly Arg 100 105 110 Glu Ile Val Val Arg Asp Ala Asn Arg Phe His His Phe Lys Asp Gly 115 120 125 Val Cys Ser Cys Gly Asp Tyr Trp 130 135 <210> 2 <211> 137 <212> PRT <213> Artificial Sequence <220> <223> DYW:WW <400> 2 Lys Pro Gly Gln Ser Trp Trp Thr Asp Thr Gly Gly Ile Val His Thr 1 5 10 15 Phe Val Val Gly Asp Thr Lys His Pro Gln Ser Gln Asp Ile Tyr Ala 20 25 30 Lys Leu Lys Asp Leu Tyr Val Lys Met Lys Glu Glu Gly Tyr Val Pro 35 40 45 His Leu Asp Cys Val Leu Trp Asp Ile Ser Asp Asp Glu Lys Glu Asp 50 55 60 Ala Leu Cys Gly His Ser Glu Lys Leu Ala Ile Ala Cys Ala Leu Ile 65 70 75 80 Asn Thr Pro Pro Gly Thr Pro Ile Arg Ile Val Lys Asn Leu Arg Val 85 90 95 Cys Asp Asp Cys His Lys Ala Ile Ala Leu Ile Ser Lys Ile Glu Gly 100 105 110 Arg Asn Ile Ile Cys Arg Asp Ala Ser Arg Phe His Asn Tyr Lys Asp 115 120 125 Gly Lys Cys Ser Cys Gly Asp Tyr Trp 130 135 <210> 3 <211> 133 <212> PRT <213> Artificial Sequence <220> <223> DYW:KP <400> 3 Lys Pro Ala Ser Ala Leu Ile Glu Val Asn Lys Lys Val His Glu Phe 1 5 10 15 Val Val Gly Asn Asn Gln Ser Glu Glu Ile Ser Ala Met Leu Lys Ser 20 25 30 Leu Asn Ser Arg Met Lys Glu Glu Gly His Val Pro Asn Leu Asp Leu 35 40 45 Val Leu Lys Pro Val Ser Asp Glu Glu Lys Glu Ala Ala Leu Cys Glu 50 55 60 His Ala Glu Lys Leu Ala Ile Ala Phe Gly Leu Leu Asn Thr Pro Gln 65 70 75 80 Gly Gln Thr Leu Arg Val Thr Lys Asn Leu Arg Met Cys Asn Asp Cys 85 90 95 His Asn Ala Ser Lys Ile Ile Ser Lys Ile Glu Arg Arg Glu Ile Ile 100 105 110 Leu Arg Asp Asp Cys Cys Ile His His Phe Lys Asp Gly Leu Cys Ser 115 120 125 Cys Gly Asp Met Phe 130 <210> 4 <211> 35 <212> PRT <213> Artificial Sequence <220> <223> P1 motif <400> 4 Phe Ser Trp Asn Ser Met Ile Arg Gly Tyr Ala Arg Ser Gly Gln Pro 1 5 10 15 Glu Glu Ala Leu Ser Leu Phe Ser Gln Met Arg Arg Ser Gly Ile Lys 20 25 30 Pro Asp Ser 35 <210> 5 <211> 35 <212> PRT <213> Artificial Sequence <220> <223> L1 motif <400> 5 Tyr Thr Phe Pro Phe Val Leu Lys Ala Cys Ala Ser Leu Ser Ser Leu 1 5 10 15 Glu Glu Gly Lys Gln Ile His Ala His Val Ile Lys Ser Gly Phe Glu 20 25 30 Ser Asp Val 35 <210> 6 <211> 31 <212> PRT <213> Artificial Sequence <220> <223> S1 motif <400> 6 Tyr Val Gln Ser Ser Leu Ile Asp Met Tyr Ala Lys Cys Gly Ser Leu 1 5 10 15 Glu Asp Ala Arg Lys Val Phe Asp Glu Met Pro Glu Arg Asn Val 20 25 30 <210> 7 <211> 35 <212> PRT <213> Artificial Sequence <220> <223> P1 motif <400> 7 Val Ser Trp Asn Ala Met Ile Ser Gly Tyr Ala Gln Asn Gly Gln Ser 1 5 10 15 Glu Glu Ala Leu Glu Leu Phe Arg Glu Met Gln Lys Glu Gly Ile Lys 20 25 30 Pro Ser Glu 35 <210> 8 <211> 35 <212> PRT <213> Artificial Sequence <220> <223> L1 motif <400> 8 Phe Thr Phe Cys Ser Val Leu Lys Ala Cys Ala Ser Leu Gly Ser Leu 1 5 10 15 Glu Met Gly Lys Gln Ile His Gly Tyr Val Ile Lys Ser Gly Phe Glu 20 25 30 Ser Ile Val 35 <210> 9 <211> 31 <212> PRT <213> Artificial Sequence <220> <223> S1 motif <400> 9 Phe Val Gly Asn Ala Leu Ile Asp Met Tyr Ala Lys Cys Gly Ser Leu 1 5 10 15 Glu Asp Ala Arg Lys Val Phe Asp Glu Met Pro Glu Arg Thr Val 20 25 30 <210> 10 <211> 35 <212> PRT <213> Artificial Sequence <220> <223> P1 motif <400> 10 Val Ser Trp Thr Ala Met Ile Ser Gly Tyr Ala Gln Asn Gly Gln Ser 1 5 10 15 Glu Glu Ala Leu Glu Leu Phe Arg Glu Met Gln Arg Glu Gly Val Lys 20 25 30 Pro Asp Glu 35 <210> 11 <211> 35 <212> PRT <213> Artificial Sequence <220> <223> L1 motif <400> 11 Val Thr Leu Pro Ser Val Leu Ser Ala Cys Ala Asn Leu Gly Ala Leu 1 5 10 15 Glu Gln Gly Lys Gln Ile His Ala Tyr Val Ile Lys Asn Gly Phe Glu 20 25 30 Ser Asp Val 35 <210> 12 <211> 31 <212> PRT <213> Artificial Sequence <220> <223> S1 motif <400> 12 Phe Val Gly Ser Ala Leu Ile Asp Met Tyr Ala Lys Cys Gly Ser Ile 1 5 10 15 Glu Glu Ala Arg Lys Val Phe Asp Glu Met Pro Glu Lys Asp Val 20 25 30 <210> 13 <211> 35 <212> PRT <213> Artificial Sequence <220> <223> P motif <400> 13 Val Thr Tyr Thr Thr Leu Ile Asp Gly Leu Cys Lys Ala Gly Lys Val 1 5 10 15 Asp Glu Ala Leu Glu Leu Phe Lys Glu Met Arg Ser Lys Gly Val Lys 20 25 30 Pro Asn Val 35 <210> 14 <211> 35 <212> PRT <213> Artificial Sequence <220> <223> P motif <400> 14 Val Thr Tyr Asn Thr Leu Ile Asp Gly Leu Cys Lys Ala Gly Arg Leu 1 5 10 15 Asp Glu Ala Glu Glu Leu Leu Glu Glu Met Glu Glu Lys Gly Ile Lys 20 25 30 Pro Asp Val 35 <210> 15 <211> 35 <212> PRT <213> Artificial Sequence <220> <223> P motif <400> 15 Val Thr Tyr Asn Thr Leu Ile Asp Gly Leu Cys Lys Ser Gly Lys Ile 1 5 10 15 Glu Glu Ala Leu Lys Leu Phe Lys Glu Met Glu Glu Lys Gly Ile Thr 20 25 30 Pro Ser Val 35 <210> 16 <211> 35 <212> PRT <213> Artificial Sequence <220> <223> P motif <400> 16 Val Thr Tyr Thr Thr Leu Ile Asp Gly Leu Cys Lys Ala Gly Lys Val 1 5 10 15 Asp Glu Ala Leu Glu Leu Phe Asp Glu Met Lys Glu Arg Gly Ile Lys 20 25 30 Pro Asp Val 35 <210> 17 <211> 35 <212> PRT <213> Artificial Sequence <220> <223> P2 motif <400> 17 Val Ser Trp Asn Ala Met Ile Ala Ala Tyr Ala Gln His Gly His Gly 1 5 10 15 Lys Glu Ala Leu Gln Leu Phe Gln Gln Met Gln Gln Glu Gly Val Lys 20 25 30 Pro Ser Glu 35 <210> 18 <211> 36 <212> PRT <213> Artificial Sequence <220> <223> L2 motif <400> 18 Val Thr Phe Thr Ser Ile Leu Ser Ala Cys Ser His Ala Gly Leu Val 1 5 10 15 Asp Glu Gly His His Tyr Phe Glu Ser Met Ser Pro Asp Tyr Gly Ile 20 25 30 Thr Pro Arg Val 35 <210> 19 <211> 32 <212> PRT <213> Artificial Sequence <220> <223> S2 motif <400> 19 Glu His Tyr Gly Cys Met Val Asp Leu Leu Gly Arg Ala Gly Arg Leu 1 5 10 15 Asp Glu Ala Glu Asp Leu Ile Lys Ser Met Pro Phe Gln Pro Asn Val 20 25 30 <210> 20 <211> 34 <212> PRT <213> Artificial Sequence <220> <223> E1 motif <400> 20 Val Val Trp Gly Thr Leu Leu Gly Ala Cys Arg Val His Gly Asp Val 1 5 10 15 Glu Arg Gly Glu Arg Ala Ala Glu Arg Ile Leu Glu Leu Asp Pro Glu 20 25 30 Ser Ala <210> 21 <211> 33 <212> PRT <213> Artificial Sequence <220> <223> E2 motif <400> 21 Ala Pro Tyr Val Leu Leu Ser Asn Ile Tyr Ala Ala Ala Gly Arg Trp 1 5 10 15 Asp Glu Ala Ala Lys Val Arg Lys Leu Met Lys Glu Arg Gly Val Lys 20 25 30 Lys <210> 22 <211> 35 <212> PRT <213> Artificial Sequence <220> <223> P2 motif <400> 22 Val Thr Trp Asn Ala Leu Ile Ala Gly Tyr Ala Arg Gln Gly Glu Ser 1 5 10 15 Asp Leu Val Phe His Leu Leu Glu Arg Met Arg Gln Glu Gly Ile Gln 20 25 30 Pro Ser Gly 35 <210> 23 <211> 36 <212> PRT <213> Artificial Sequence <220> <223> L2 motif <400> 23 Val Thr Phe Thr Ser Val Leu Thr Val Cys Ser His Ala Gly Leu Val 1 5 10 15 Asp Glu Gly Gln Lys Tyr Phe Asp Ala Met Ser Glu Asp Tyr Gly Ile 20 25 30 Thr Pro Arg Ile 35 <210> 24 <211> 32 <212> PRT <213> Artificial Sequence <220> <223> S2 motif <400> 24 Glu His Tyr Gly Cys Met Val Asp Leu Leu Gly Arg Ala Gly Gln Met 1 5 10 15 Asp Glu Ala Val Ala Met Val Glu Lys Met Pro Phe Gln Pro Asn Leu 20 25 30 <210> 25 <211> 34 <212> PRT <213> Artificial Sequence <220> <223> E1 motif <400> 25 Val Thr Trp Gly Thr Leu Leu Gly Ala Cys Arg Lys Trp Asn Asn Val 1 5 10 15 Glu Ile Gly Arg His Ala Phe Glu Cys Ala Val Arg Leu Asp Glu Lys 20 25 30 Ser Ala <210> 26 <211> 33 <212> PRT <213> Artificial Sequence <220> <223> E2 motif <400> 26 Ala Ala Tyr Val Leu Met Ser Asn Ile Tyr Ala Asp Ala His Met Trp 1 5 10 15 Glu Glu Arg Asp Lys Ile Gln Ala Met Arg Lys Asn Ala Arg Ala Trp 20 25 30 Lys <210> 27 <211> 35 <212> PRT <213> Artificial Sequence <220> <223> P2 motif <400> 27 Val Ala Trp Asn Ser Met Ile Lys Gly Tyr Gly Met Asn His Glu Gly 1 5 10 15 Lys Met Ala Val Gln Cys Phe Glu Asp Met Gln Lys Gln Gly Val Lys 20 25 30 Pro Ser Ala 35 <210> 28 <211> 36 <212> PRT <213> Artificial Sequence <220> <223> L2 motif <400> 28 Val Thr Phe Thr Cys Leu Leu Thr Ala Cys Ser His Ala Ser Leu Val 1 5 10 15 Ser Glu Gly Gln Glu Tyr Phe Lys Met Met Arg Glu Glu Tyr Gly Ile 20 25 30 Ala Pro Arg Val 35 <210> 29 <211> 31 <212> PRT <213> Artificial Sequence <220> <223> S2 motif <400> 29 Glu His Tyr Gly Cys Met Val Asp Leu Leu Ala Arg Ser Gly His Leu 1 5 10 15 Tyr Glu Ala Glu Lys Phe Leu Glu Met Leu Cys Pro Pro Asn Glu 20 25 30 <210> 30 <211> 34 <212> PRT <213> Artificial Sequence <220> <223> E1 motif <400> 30 Gly Thr Trp Gly Ala Leu Leu Ser Ala Cys Lys Thr Tyr Gly Glu Val 1 5 10 15 Glu Leu Gly Leu Arg Cys Phe Gln Gln Leu Val Gln Leu Asn Pro Glu 20 25 30 Ser Ala <210> 31 <211> 33 <212> PRT <213> Artificial Sequence <220> <223> E2 motif <400> 31 Ala Trp Tyr Val Leu Met Ala Asp Ile Tyr Ala Gly Ala Gly Arg Trp 1 5 10 15 Asp Asp Ala Tyr Arg Ile Glu Glu Leu Arg Lys His Ala Gly Ala Lys 20 25 30 Lys <210> 32 <211> 7 <212> PRT <213> Simian virus 40 <400> 32 Pro Lys Lys Lys Arg Lys Val 1 5 <210> 33 <211> 16 <212> PRT <213> Artificial Sequence <220> <223> nucleoplasmin NLS <400> 33 Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys 1 5 10 15 <210> 34 <211> 17 <212> RNA <213> Artificial Sequence <220> <223> Taget sequence <400> 34 auuacacgug caaaauy 17 <210> 35 <211> 610 <212> PRT <213> Artificial Sequence <220> <223> PLS array (3 P1L1S1 triplets) + DYW:PG-lyc <400> 35 Val Phe Ser Trp Asn Ser Met Ile Arg Gly Tyr Ala Arg Asn Gly Gln 1 5 10 15 Pro Glu Glu Ala Leu Ser Leu Tyr Ser Gln Met Arg Arg Ser Gly Ile 20 25 30 Lys Pro Asp Asn Tyr Thr Phe Pro Phe Val Leu Lys Ala Cys Ala Ser 35 40 45 Leu Ser Ser Leu Lys Glu Gly Lys Gln Ile His Gly His Val Ile Lys 50 55 60 Ser Gly Phe Glu Ser Asp Val Tyr Val Gln Ser Ala Leu Ile Asp Met 65 70 75 80 Tyr Ala Lys Cys Gly Glu Leu Glu Asp Ala Arg Lys Val Phe Asp Glu 85 90 95 Met Pro Glu Arg Asn Val Val Ser Trp Asn Ala Met Ile Ser Gly Tyr 100 105 110 Ala Gln Asn Gly Gln Ser Glu Glu Ala Leu Glu Leu Phe Arg Glu Met 115 120 125 Gln Gln Glu Gly Ile Lys Pro Ser Glu Phe Thr Phe Cys Ser Val Leu 130 135 140 Ser Ala Cys Ala Ser Leu Gly Ser Leu Glu Met Gly Lys Gln Ile His 145 150 155 160 Gly Tyr Val Ile Lys Ser Gly Phe Glu Ser Ile Val Phe Val Gly Asn 165 170 175 Ala Leu Ile Asp Met Tyr Ala Lys Cys Gly Ser Ile Glu Asp Ala Arg 180 185 190 Lys Val Phe Asp Glu Met Pro Glu Arg Thr Val Val Ser Trp Thr Ala 195 200 205 Met Ile Ser Gly Tyr Ala Gln Asn Gly Gln Ser Glu Glu Ala Leu Glu 210 215 220 Leu Phe Arg Glu Met Gln Arg Glu Gly Val Lys Pro Asp Glu Val Thr 225 230 235 240 Leu Pro Ser Val Leu Ser Ala Cys Ala Asn Leu Gly Ala Leu Glu Gln 245 250 255 Gly Lys Gln Ile His Ala Tyr Val Ile Lys Ser Gly Phe Glu Ser Asp 260 265 270 Val Phe Val Gly Ser Ala Leu Ile Asp Met Tyr Ala Lys Cys Gly Ser 275 280 285 Ile Glu Asp Ala Arg Lys Val Phe Asp Lys Met Pro Glu Arg Asp Val 290 295 300 Val Ser Trp Asn Ala Met Ile Ala Ala Tyr Ala Gln His Gly His Gly 305 310 315 320 Lys Glu Ala Leu Gln Leu Phe Gln Gln Met Gln Gln Glu Gly Val Lys 325 330 335 Pro Ser Glu Val Thr Phe Thr Ser Ile Leu Ser Ala Cys Ser His Ala 340 345 350 Gly Leu Val Asp Glu Gly His His Tyr Phe Glu Ser Met Ser Pro Asp 355 360 365 Tyr Gly Ile Thr Pro Arg Val Glu His Tyr Gly Cys Met Val Asp Leu 370 375 380 Leu Gly Arg Ala Gly Arg Leu Asp Glu Ala Glu Asp Leu Ile Lys Ser 385 390 395 400 Met Pro Phe Gln Pro Asn Val Val Val Trp Gly Thr Leu Leu Gly Ala 405 410 415 Cys Arg Val His Gly Asp Val Glu Arg Gly Glu Arg Ala Ala Glu Arg 420 425 430 Ile Leu Glu Leu Asp Pro Glu Ser Ala Ala Pro Tyr Val Leu Leu Ser 435 440 445 Asn Ile Tyr Ala Ala Ala Gly Arg Trp Asp Glu Ala Ala Lys Val Arg 450 455 460 Lys Leu Met Lys Glu Arg Gly Val Lys Lys Glu Pro Gly Cys Ser Trp 465 470 475 480 Ile Glu Val Asn Asn Lys Val His Glu Phe Val Ala Gly Asp Lys Ser 485 490 495 His Pro Gln Thr Lys Glu Ile Tyr Ala Glu Leu Glu Arg Leu Ser Lys 500 505 510 Gln Met Lys Glu Ala Gly Tyr Val Pro Asp Thr Lys Phe Val Leu His 515 520 525 Asp Val Glu Glu Glu Glu Lys Glu Gln Leu Leu Cys Tyr His Ser Glu 530 535 540 Lys Leu Ala Ile Ala Phe Gly Leu Ile Ser Thr Pro Pro Gly Thr Pro 545 550 555 560 Leu Arg Ile Ile Lys Asn Leu Arg Val Cys Gly Asp Cys His Thr Ala 565 570 575 Thr Lys Phe Ile Ser Lys Ile Val Gly Arg Glu Ile Val Val Arg Asp 580 585 590 Ala Asn Arg Phe His His Phe Lys Asp Gly Val Cys Ser Cys Gly Asp 595 600 605 Tyr Trp 610 <210> 36 <211> 611 <212> PRT <213> Artificial Sequence <220> <223> PLS array (3 P1L1S1 triplets) + DYW:WW-WW5 <400> 36 Val Phe Ser Trp Asn Ser Met Ile Arg Gly Tyr Ala Arg Asn Gly Gln 1 5 10 15 Pro Glu Glu Ala Leu Ser Leu Tyr Ser Gln Met Arg Arg Ser Gly Ile 20 25 30 Lys Pro Asp Asn Tyr Thr Phe Pro Phe Val Leu Lys Ala Cys Ala Ser 35 40 45 Leu Ser Ser Leu Lys Glu Gly Lys Gln Ile His Gly His Val Ile Lys 50 55 60 Ser Gly Phe Glu Ser Asp Val Tyr Val Gln Ser Ala Leu Ile Asp Met 65 70 75 80 Tyr Ala Lys Cys Gly Glu Leu Glu Asp Ala Arg Lys Val Phe Asp Glu 85 90 95 Met Pro Glu Arg Asn Val Val Ser Trp Asn Ala Met Ile Ser Gly Tyr 100 105 110 Ala Gln Asn Gly Gln Ser Glu Glu Ala Leu Glu Leu Phe Arg Glu Met 115 120 125 Gln Gln Glu Gly Ile Lys Pro Ser Glu Phe Thr Phe Cys Ser Val Leu 130 135 140 Ser Ala Cys Ala Ser Leu Gly Ser Leu Glu Met Gly Lys Gln Ile His 145 150 155 160 Gly Tyr Val Ile Lys Ser Gly Phe Glu Ser Ile Val Phe Val Gly Asn 165 170 175 Ala Leu Ile Asp Met Tyr Ala Lys Cys Gly Ser Ile Glu Asp Ala Arg 180 185 190 Lys Val Phe Asp Glu Met Pro Glu Arg Thr Val Val Ser Trp Thr Ala 195 200 205 Met Ile Ser Gly Tyr Ala Gln Asn Gly Gln Ser Glu Glu Ala Leu Glu 210 215 220 Leu Phe Arg Glu Met Gln Arg Glu Gly Val Lys Pro Asp Glu Val Thr 225 230 235 240 Leu Pro Ser Val Leu Ser Ala Cys Ala Asn Leu Gly Ala Leu Glu Gln 245 250 255 Gly Lys Gln Ile His Ala Tyr Val Ile Lys Ser Gly Phe Glu Ser Asp 260 265 270 Val Phe Val Gly Ser Ala Leu Ile Asp Met Tyr Ala Lys Cys Gly Ser 275 280 285 Ile Glu Asp Ala Arg Lys Val Phe Asp Lys Met Pro Glu Arg Asp Val 290 295 300 Val Thr Trp Asn Ala Leu Ile Ala Gly Tyr Ala Arg Gln Gly Glu Ser 305 310 315 320 Asp Leu Val Phe His Leu Leu Glu Arg Met Arg Gln Glu Gly Ile Gln 325 330 335 Pro Ser Gly Val Thr Phe Thr Ser Val Leu Thr Val Cys Ser His Ala 340 345 350 Gly Leu Val Asp Glu Gly Gln Lys Tyr Phe Asp Ala Met Ser Glu Asp 355 360 365 Tyr Gly Ile Thr Pro Arg Ile Glu His Tyr Gly Cys Met Val Asp Leu 370 375 380 Leu Gly Arg Ala Gly Gln Met Asp Glu Ala Val Ala Met Val Glu Lys 385 390 395 400 Met Pro Phe Gln Pro Asn Leu Val Thr Trp Gly Thr Leu Leu Gly Ala 405 410 415 Cys Arg Lys Trp Asn Asn Val Glu Ile Gly Arg His Ala Phe Glu Cys 420 425 430 Ala Val Arg Leu Asp Glu Lys Ser Ala Ala Ala Tyr Val Leu Met Ser 435 440 445 Asn Ile Tyr Ala Asp Ala His Met Trp Glu Glu Arg Asp Lys Ile Gln 450 455 460 Ala Met Arg Lys Asn Ala Arg Ala Trp Lys Lys Pro Gly Gln Ser Trp 465 470 475 480 Trp Thr Asp Thr Gly Gly Ile Val His Thr Phe Val Val Gly Asp Thr 485 490 495 Lys His Pro Gln Ser Gln Asp Ile Tyr Ala Lys Leu Lys Asp Leu Tyr 500 505 510 Val Lys Met Lys Glu Glu Gly Tyr Val Pro His Leu Asp Cys Val Leu 515 520 525 Trp Asp Ile Ser Asp Asp Glu Lys Glu Asp Ala Leu Cys Gly His Ser 530 535 540 Glu Lys Leu Ala Ile Ala Cys Ala Leu Ile Asn Thr Pro Pro Gly Thr 545 550 555 560 Pro Ile Arg Ile Val Lys Asn Leu Arg Val Cys Asp Asp Cys His Lys 565 570 575 Ala Ile Ala Leu Ile Ser Lys Ile Glu Gly Arg Asn Ile Ile Cys Arg 580 585 590 Asp Ala Ser Arg Phe His Asn Tyr Lys Asp Gly Lys Cys Ser Cys Gly 595 600 605 Asp Tyr Trp 610 <210> 37 <211> 606 <212> PRT <213> Artificial Sequence <220> <223> PLS array (P1L1S1 triplets) + DYW:KP-lepto <400> 37 Val Phe Ser Trp Asn Ser Met Ile Arg Gly Tyr Ala Arg Asn Gly Gln 1 5 10 15 Pro Glu Glu Ala Leu Ser Leu Tyr Ser Gln Met Arg Arg Ser Gly Ile 20 25 30 Lys Pro Asp Asn Tyr Thr Phe Pro Phe Val Leu Lys Ala Cys Ala Ser 35 40 45 Leu Ser Ser Leu Lys Glu Gly Lys Gln Ile His Gly His Val Ile Lys 50 55 60 Ser Gly Phe Glu Ser Asp Val Tyr Val Gln Ser Ala Leu Ile Asp Met 65 70 75 80 Tyr Ala Lys Cys Gly Glu Leu Glu Asp Ala Arg Lys Val Phe Asp Glu 85 90 95 Met Pro Glu Arg Asn Val Val Ser Trp Asn Ala Met Ile Ser Gly Tyr 100 105 110 Ala Gln Asn Gly Gln Ser Glu Glu Ala Leu Glu Leu Phe Arg Glu Met 115 120 125 Gln Gln Glu Gly Ile Lys Pro Ser Glu Phe Thr Phe Cys Ser Val Leu 130 135 140 Ser Ala Cys Ala Ser Leu Gly Ser Leu Glu Met Gly Lys Gln Ile His 145 150 155 160 Gly Tyr Val Ile Lys Ser Gly Phe Glu Ser Ile Val Phe Val Gly Asn 165 170 175 Ala Leu Ile Asp Met Tyr Ala Lys Cys Gly Ser Ile Glu Asp Ala Arg 180 185 190 Lys Val Phe Asp Glu Met Pro Glu Arg Thr Val Val Ser Trp Thr Ala 195 200 205 Met Ile Ser Gly Tyr Ala Gln Asn Gly Gln Ser Glu Glu Ala Leu Glu 210 215 220 Leu Phe Arg Glu Met Gln Arg Glu Gly Val Lys Pro Asp Glu Val Thr 225 230 235 240 Leu Pro Ser Val Leu Ser Ala Cys Ala Asn Leu Gly Ala Leu Glu Gln 245 250 255 Gly Lys Gln Ile His Ala Tyr Val Ile Lys Ser Gly Phe Glu Ser Asp 260 265 270 Val Phe Val Gly Ser Ala Leu Ile Asp Met Tyr Ala Lys Cys Gly Ser 275 280 285 Ile Glu Asp Ala Arg Lys Val Phe Asp Lys Met Pro Glu Arg Asp Val 290 295 300 Val Ala Trp Asn Ser Met Ile Lys Gly Tyr Gly Met Asn His Glu Gly 305 310 315 320 Lys Met Ala Val Gln Cys Phe Glu Asp Met Gln Lys Gln Gly Val Lys 325 330 335 Pro Ser Ala Val Thr Phe Thr Cys Leu Leu Thr Ala Cys Ser His Ala 340 345 350 Ser Leu Val Ser Glu Gly Gln Glu Tyr Phe Lys Met Met Arg Glu Glu 355 360 365 Tyr Gly Ile Ala Pro Arg Val Glu His Tyr Gly Cys Met Val Asp Leu 370 375 380 Leu Ala Arg Ser Gly His Leu Tyr Glu Ala Glu Lys Phe Leu Glu Met 385 390 395 400 Leu Cys Pro Pro Asn Glu Gly Thr Trp Gly Ala Leu Leu Ser Ala Cys 405 410 415 Lys Thr Tyr Gly Glu Val Glu Leu Gly Leu Arg Cys Phe Gln Gln Leu 420 425 430 Val Gln Leu Asn Pro Glu Ser Ala Ala Trp Tyr Val Leu Met Ala Asp 435 440 445 Ile Tyr Ala Gly Ala Gly Arg Trp Asp Asp Ala Tyr Arg Ile Glu Glu 450 455 460 Leu Arg Lys His Ala Gly Ala Lys Lys Lys Pro Ala Ser Ala Leu Ile 465 470 475 480 Glu Val Asn Lys Lys Val His Glu Phe Val Val Gly Asn Asn Gln Ser 485 490 495 Glu Glu Ile Ser Ala Met Leu Lys Ser Leu Asn Ser Arg Met Lys Glu 500 505 510 Glu Gly His Val Pro Asn Leu Asp Leu Val Leu Lys Pro Val Ser Asp 515 520 525 Glu Glu Lys Glu Ala Ala Leu Cys Glu His Ala Glu Lys Leu Ala Ile 530 535 540 Ala Phe Gly Leu Leu Asn Thr Pro Gln Gly Gln Thr Leu Arg Val Thr 545 550 555 560 Lys Asn Leu Arg Met Cys Asn Asp Cys His Asn Ala Ser Lys Ile Ile 565 570 575 Ser Lys Ile Glu Arg Arg Glu Ile Ile Leu Arg Asp Asp Cys Cys Ile 580 585 590 His His Phe Lys Asp Gly Leu Cys Ser Cys Gly Asp Met Phe 595 600 605 <210> 38 <211> 657 <212> PRT <213> Artificial Sequence <220> <223> P array (10 PPR motifs) + DYW:PG-lyc <400> 38 Val Val Thr Tyr Thr Thr Leu Ile Asp Gly Leu Cys Lys Ala Gly Lys 1 5 10 15 Val Asp Glu Ala Leu Glu Leu Phe Lys Glu Met Arg Ser Lys Gly Val 20 25 30 Lys Pro Asn Val Val Thr Tyr Asn Thr Leu Ile Asp Gly Leu Cys Lys 35 40 45 Ala Gly Arg Leu Asp Glu Ala Glu Glu Leu Leu Glu Glu Met Glu Glu 50 55 60 Lys Gly Ile Lys Pro Asp Val Val Thr Tyr Asn Thr Leu Ile Asp Gly 65 70 75 80 Leu Cys Lys Ala Gly Arg Leu Asp Glu Ala Glu Glu Leu Leu Glu Glu 85 90 95 Met Glu Glu Lys Gly Ile Lys Pro Asp Val Val Thr Tyr Thr Thr Leu 100 105 110 Ile Asp Gly Leu Cys Lys Ala Gly Lys Val Asp Glu Ala Leu Glu Leu 115 120 125 Phe Lys Glu Met Arg Ser Lys Gly Val Lys Pro Asn Val Val Thr Tyr 130 135 140 Asn Thr Leu Ile Asp Gly Leu Cys Lys Ser Gly Lys Ile Glu Glu Ala 145 150 155 160 Leu Lys Leu Phe Lys Glu Met Glu Glu Lys Gly Ile Thr Pro Ser Val 165 170 175 Val Thr Tyr Thr Thr Leu Ile Asp Gly Leu Cys Lys Ala Gly Lys Val 180 185 190 Asp Glu Ala Leu Glu Leu Phe Lys Glu Met Arg Ser Lys Gly Val Lys 195 200 205 Pro Asn Val Val Thr Tyr Asn Thr Leu Ile Asp Gly Leu Cys Lys Ser 210 215 220 Gly Lys Ile Glu Glu Ala Leu Lys Leu Phe Lys Glu Met Glu Glu Lys 225 230 235 240 Gly Ile Thr Pro Ser Val Val Thr Tyr Thr Thr Leu Ile Asp Gly Leu 245 250 255 Cys Lys Ala Gly Lys Val Asp Glu Ala Leu Glu Leu Phe Asp Glu Met 260 265 270 Lys Glu Arg Gly Ile Lys Pro Asp Val Val Thr Tyr Asn Thr Leu Ile 275 280 285 Asp Gly Leu Cys Lys Ala Gly Arg Leu Asp Glu Ala Glu Glu Leu Leu 290 295 300 Glu Glu Met Glu Glu Lys Gly Ile Lys Pro Asp Val Val Thr Tyr Thr 305 310 315 320 Thr Leu Ile Asp Gly Leu Cys Lys Ala Gly Lys Val Asp Glu Ala Leu 325 330 335 Glu Leu Phe Asp Glu Met Lys Glu Arg Gly Ile Lys Pro Asp Val Val 340 345 350 Ser Trp Asn Ala Met Ile Ala Ala Tyr Ala Gln His Gly His Gly Lys 355 360 365 Glu Ala Leu Gln Leu Phe Gln Gln Met Gln Gln Glu Gly Val Lys Pro 370 375 380 Ser Glu Val Thr Phe Thr Ser Ile Leu Ser Ala Cys Ser His Ala Gly 385 390 395 400 Leu Val Asp Glu Gly His His Tyr Phe Glu Ser Met Ser Pro Asp Tyr 405 410 415 Gly Ile Thr Pro Arg Val Glu His Tyr Gly Cys Met Val Asp Leu Leu 420 425 430 Gly Arg Ala Gly Arg Leu Asp Glu Ala Glu Asp Leu Ile Lys Ser Met 435 440 445 Pro Phe Gln Pro Asn Val Val Val Trp Gly Thr Leu Leu Gly Ala Cys 450 455 460 Arg Val His Gly Asp Val Glu Arg Gly Glu Arg Ala Ala Glu Arg Ile 465 470 475 480 Leu Glu Leu Asp Pro Glu Ser Ala Ala Pro Tyr Val Leu Leu Ser Asn 485 490 495 Ile Tyr Ala Ala Ala Gly Arg Trp Asp Glu Ala Ala Lys Val Arg Lys 500 505 510 Leu Met Lys Glu Arg Gly Val Lys Lys Glu Pro Gly Cys Ser Trp Ile 515 520 525 Glu Val Asn Asn Lys Val His Glu Phe Val Ala Gly Asp Lys Ser His 530 535 540 Pro Gln Thr Lys Glu Ile Tyr Ala Glu Leu Glu Arg Leu Ser Lys Gln 545 550 555 560 Met Lys Glu Ala Gly Tyr Val Pro Asp Thr Lys Phe Val Leu His Asp 565 570 575 Val Glu Glu Glu Glu Lys Glu Gln Leu Leu Cys Tyr His Ser Glu Lys 580 585 590 Leu Ala Ile Ala Phe Gly Leu Ile Ser Thr Pro Pro Gly Thr Pro Leu 595 600 605 Arg Ile Ile Lys Asn Leu Arg Val Cys Gly Asp Cys His Thr Ala Thr 610 615 620 Lys Phe Ile Ser Lys Ile Val Gly Arg Glu Ile Val Val Arg Asp Ala 625 630 635 640 Asn Arg Phe His His Phe Lys Asp Gly Val Cys Ser Cys Gly Asp Tyr 645 650 655 Trp <210> 39 <211> 658 <212> PRT <213> Artificial Sequence <220> <223> P array (10 PPR motifs) + DYW:WW-WW5 <400> 39 Val Val Thr Tyr Thr Thr Leu Ile Asp Gly Leu Cys Lys Ala Gly Lys 1 5 10 15 Val Asp Glu Ala Leu Glu Leu Phe Lys Glu Met Arg Ser Lys Gly Val 20 25 30 Lys Pro Asn Val Val Thr Tyr Asn Thr Leu Ile Asp Gly Leu Cys Lys 35 40 45 Ala Gly Arg Leu Asp Glu Ala Glu Glu Leu Leu Glu Glu Met Glu Glu 50 55 60 Lys Gly Ile Lys Pro Asp Val Val Thr Tyr Asn Thr Leu Ile Asp Gly 65 70 75 80 Leu Cys Lys Ala Gly Arg Leu Asp Glu Ala Glu Glu Leu Leu Glu Glu 85 90 95 Met Glu Glu Lys Gly Ile Lys Pro Asp Val Val Thr Tyr Thr Thr Leu 100 105 110 Ile Asp Gly Leu Cys Lys Ala Gly Lys Val Asp Glu Ala Leu Glu Leu 115 120 125 Phe Lys Glu Met Arg Ser Lys Gly Val Lys Pro Asn Val Val Thr Tyr 130 135 140 Asn Thr Leu Ile Asp Gly Leu Cys Lys Ser Gly Lys Ile Glu Glu Ala 145 150 155 160 Leu Lys Leu Phe Lys Glu Met Glu Glu Lys Gly Ile Thr Pro Ser Val 165 170 175 Val Thr Tyr Thr Thr Leu Ile Asp Gly Leu Cys Lys Ala Gly Lys Val 180 185 190 Asp Glu Ala Leu Glu Leu Phe Lys Glu Met Arg Ser Lys Gly Val Lys 195 200 205 Pro Asn Val Val Thr Tyr Asn Thr Leu Ile Asp Gly Leu Cys Lys Ser 210 215 220 Gly Lys Ile Glu Glu Ala Leu Lys Leu Phe Lys Glu Met Glu Glu Lys 225 230 235 240 Gly Ile Thr Pro Ser Val Val Thr Tyr Thr Thr Leu Ile Asp Gly Leu 245 250 255 Cys Lys Ala Gly Lys Val Asp Glu Ala Leu Glu Leu Phe Asp Glu Met 260 265 270 Lys Glu Arg Gly Ile Lys Pro Asp Val Val Thr Tyr Asn Thr Leu Ile 275 280 285 Asp Gly Leu Cys Lys Ala Gly Arg Leu Asp Glu Ala Glu Glu Leu Leu 290 295 300 Glu Glu Met Glu Glu Lys Gly Ile Lys Pro Asp Val Val Thr Tyr Thr 305 310 315 320 Thr Leu Ile Asp Gly Leu Cys Lys Ala Gly Lys Val Asp Glu Ala Leu 325 330 335 Glu Leu Phe Asp Glu Met Lys Glu Arg Gly Ile Lys Pro Asp Val Val 340 345 350 Thr Trp Asn Ala Leu Ile Ala Gly Tyr Ala Arg Gln Gly Glu Ser Asp 355 360 365 Leu Val Phe His Leu Leu Glu Arg Met Arg Gln Glu Gly Ile Gln Pro 370 375 380 Ser Gly Val Thr Phe Thr Ser Val Leu Thr Val Cys Ser His Ala Gly 385 390 395 400 Leu Val Asp Glu Gly Gln Lys Tyr Phe Asp Ala Met Ser Glu Asp Tyr 405 410 415 Gly Ile Thr Pro Arg Ile Glu His Tyr Gly Cys Met Val Asp Leu Leu 420 425 430 Gly Arg Ala Gly Gln Met Asp Glu Ala Val Ala Met Val Glu Lys Met 435 440 445 Pro Phe Gln Pro Asn Leu Val Thr Trp Gly Thr Leu Leu Gly Ala Cys 450 455 460 Arg Lys Trp Asn Asn Val Glu Ile Gly Arg His Ala Phe Glu Cys Ala 465 470 475 480 Val Arg Leu Asp Glu Lys Ser Ala Ala Ala Tyr Val Leu Met Ser Asn 485 490 495 Ile Tyr Ala Asp Ala His Met Trp Glu Glu Arg Asp Lys Ile Gln Ala 500 505 510 Met Arg Lys Asn Ala Arg Ala Trp Lys Lys Pro Gly Gln Ser Trp Trp 515 520 525 Thr Asp Thr Gly Gly Ile Val His Thr Phe Val Val Gly Asp Thr Lys 530 535 540 His Pro Gln Ser Gln Asp Ile Tyr Ala Lys Leu Lys Asp Leu Tyr Val 545 550 555 560 Lys Met Lys Glu Glu Gly Tyr Val Pro His Leu Asp Cys Val Leu Trp 565 570 575 Asp Ile Ser Asp Asp Glu Lys Glu Asp Ala Leu Cys Gly His Ser Glu 580 585 590 Lys Leu Ala Ile Ala Cys Ala Leu Ile Asn Thr Pro Pro Gly Thr Pro 595 600 605 Ile Arg Ile Val Lys Asn Leu Arg Val Cys Asp Asp Cys His Lys Ala 610 615 620 Ile Ala Leu Ile Ser Lys Ile Glu Gly Arg Asn Ile Ile Cys Arg Asp 625 630 635 640 Ala Ser Arg Phe His Asn Tyr Lys Asp Gly Lys Cys Ser Cys Gly Asp 645 650 655 Tyr Trp <210> 40 <211> 653 <212> PRT <213> Artificial Sequence <220> <223> P array (10 PPR motifs) + DYW:KP-lepto <400> 40 Val Val Thr Tyr Thr Thr Leu Ile Asp Gly Leu Cys Lys Ala Gly Lys 1 5 10 15 Val Asp Glu Ala Leu Glu Leu Phe Lys Glu Met Arg Ser Lys Gly Val 20 25 30 Lys Pro Asn Val Val Thr Tyr Asn Thr Leu Ile Asp Gly Leu Cys Lys 35 40 45 Ala Gly Arg Leu Asp Glu Ala Glu Glu Leu Leu Glu Glu Met Glu Glu 50 55 60 Lys Gly Ile Lys Pro Asp Val Val Thr Tyr Asn Thr Leu Ile Asp Gly 65 70 75 80 Leu Cys Lys Ala Gly Arg Leu Asp Glu Ala Glu Glu Leu Leu Glu Glu 85 90 95 Met Glu Glu Lys Gly Ile Lys Pro Asp Val Val Thr Tyr Thr Thr Leu 100 105 110 Ile Asp Gly Leu Cys Lys Ala Gly Lys Val Asp Glu Ala Leu Glu Leu 115 120 125 Phe Lys Glu Met Arg Ser Lys Gly Val Lys Pro Asn Val Val Thr Tyr 130 135 140 Asn Thr Leu Ile Asp Gly Leu Cys Lys Ser Gly Lys Ile Glu Glu Ala 145 150 155 160 Leu Lys Leu Phe Lys Glu Met Glu Glu Lys Gly Ile Thr Pro Ser Val 165 170 175 Val Thr Tyr Thr Thr Leu Ile Asp Gly Leu Cys Lys Ala Gly Lys Val 180 185 190 Asp Glu Ala Leu Glu Leu Phe Lys Glu Met Arg Ser Lys Gly Val Lys 195 200 205 Pro Asn Val Val Thr Tyr Asn Thr Leu Ile Asp Gly Leu Cys Lys Ser 210 215 220 Gly Lys Ile Glu Glu Ala Leu Lys Leu Phe Lys Glu Met Glu Glu Lys 225 230 235 240 Gly Ile Thr Pro Ser Val Val Thr Tyr Thr Thr Leu Ile Asp Gly Leu 245 250 255 Cys Lys Ala Gly Lys Val Asp Glu Ala Leu Glu Leu Phe Asp Glu Met 260 265 270 Lys Glu Arg Gly Ile Lys Pro Asp Val Val Thr Tyr Asn Thr Leu Ile 275 280 285 Asp Gly Leu Cys Lys Ala Gly Arg Leu Asp Glu Ala Glu Glu Leu Leu 290 295 300 Glu Glu Met Glu Glu Lys Gly Ile Lys Pro Asp Val Val Thr Tyr Thr 305 310 315 320 Thr Leu Ile Asp Gly Leu Cys Lys Ala Gly Lys Val Asp Glu Ala Leu 325 330 335 Glu Leu Phe Asp Glu Met Lys Glu Arg Gly Ile Lys Pro Asp Val Val 340 345 350 Ala Trp Asn Ser Met Ile Lys Gly Tyr Gly Met Asn His Glu Gly Lys 355 360 365 Met Ala Val Gln Cys Phe Glu Asp Met Gln Lys Gln Gly Val Lys Pro 370 375 380 Ser Ala Val Thr Phe Thr Cys Leu Leu Thr Ala Cys Ser His Ala Ser 385 390 395 400 Leu Val Ser Glu Gly Gln Glu Tyr Phe Lys Met Met Arg Glu Glu Tyr 405 410 415 Gly Ile Ala Pro Arg Val Glu His Tyr Gly Cys Met Val Asp Leu Leu 420 425 430 Ala Arg Ser Gly His Leu Tyr Glu Ala Glu Lys Phe Leu Glu Met Leu 435 440 445 Cys Pro Pro Asn Glu Gly Thr Trp Gly Ala Leu Leu Ser Ala Cys Lys 450 455 460 Thr Tyr Gly Glu Val Glu Leu Gly Leu Arg Cys Phe Gln Gln Leu Val 465 470 475 480 Gln Leu Asn Pro Glu Ser Ala Ala Trp Tyr Val Leu Met Ala Asp Ile 485 490 495 Tyr Ala Gly Ala Gly Arg Trp Asp Asp Ala Tyr Arg Ile Glu Glu Leu 500 505 510 Arg Lys His Ala Gly Ala Lys Lys Lys Pro Ala Ser Ala Leu Ile Glu 515 520 525 Val Asn Lys Lys Val His Glu Phe Val Val Gly Asn Asn Gln Ser Glu 530 535 540 Glu Ile Ser Ala Met Leu Lys Ser Leu Asn Ser Arg Met Lys Glu Glu 545 550 555 560 Gly His Val Pro Asn Leu Asp Leu Val Leu Lys Pro Val Ser Asp Glu 565 570 575 Glu Lys Glu Ala Ala Leu Cys Glu His Ala Glu Lys Leu Ala Ile Ala 580 585 590 Phe Gly Leu Leu Asn Thr Pro Gln Gly Gln Thr Leu Arg Val Thr Lys 595 600 605 Asn Leu Arg Met Cys Asn Asp Cys His Asn Ala Ser Lys Ile Ile Ser 610 615 620 Lys Ile Glu Arg Arg Glu Ile Ile Leu Arg Asp Asp Cys Cys Ile His 625 630 635 640 His Phe Lys Asp Gly Leu Cys Ser Cys Gly Asp Met Phe 645 650 <210> 41 <211> 136 <212> PRT <213> Artificial Sequence <220> <223> PG2 <400> 41 Gln Pro Gly Cys Ser Ser Ile Glu Val Asp Asn Lys Val His Glu Phe 1 5 10 15 Ile Val Gly Asp Arg Ser His Pro Gln Thr Glu Glu Ile Tyr Ala Glu 20 25 30 Leu Glu Arg Leu Asn Lys Gln Met Lys Glu Ala Gly Tyr Val Pro Asp 35 40 45 Thr Arg Leu Val Leu His Asp Val Asp Glu Glu Glu Lys Glu His Leu 50 55 60 Leu Cys His His Ser Glu Lys Leu Ala Ile Ala Phe Gly Leu Ile Ser 65 70 75 80 Thr Pro Pro Gly Thr Pro Leu Arg Ile Ile Lys Asn Leu Arg Val Cys 85 90 95 Gly Asp Cys His Thr Ala Thr Lys Tyr Ile Ser Lys Ile Val Gly Arg 100 105 110 Glu Ile Ile Val Arg Asp Ala Asn Arg Phe His His Phe Lys Asp Gly 115 120 125 Val Cys Ser Cys Gly Asp Tyr Trp 130 135 <210> 42 <211> 136 <212> PRT <213> Artificial Sequence <220> <223> PG3 <400> 42 Lys Pro Gly Cys Ser Trp Ile Glu Val Asn Asn Lys Val His Glu Phe 1 5 10 15 Val Ala Gly Asp Lys Ser His Pro Gln Thr Lys Glu Ile Tyr Ala Glu 20 25 30 Leu Glu Arg Leu Ser Lys Gln Met Lys Glu Ala Gly Tyr Val Pro Asp 35 40 45 Thr Lys Phe Val Leu His Asp Val Glu Glu Glu Glu Lys Glu Gln Leu 50 55 60 Leu Cys Tyr His Ser Glu Lys Leu Ala Ile Ala Phe Gly Leu Ile Ser 65 70 75 80 Thr Pro Pro Gly Thr Pro Leu Arg Ile Ile Lys Asn Leu Arg Val Cys 85 90 95 Gly Asp Cys His Thr Ala Thr Lys Phe Ile Ser Lys Ile Val Gly Arg 100 105 110 Glu Ile Val Val Arg Asp Ala Asn Arg Phe His His Phe Lys Asp Gly 115 120 125 Val Cys Ser Cys Gly Asp Tyr Trp 130 135 <210> 43 <211> 136 <212> PRT <213> Artificial Sequence <220> <223> PG4 <400> 43 Glu Pro Ala Cys Ser Trp Ile Glu Val Asn Asn Lys Val His Glu Phe 1 5 10 15 Val Ala Gly Asp Lys Ser His Pro Gln Thr Lys Glu Ile Tyr Ala Glu 20 25 30 Leu Glu Arg Leu Ser Lys Gln Met Lys Glu Ala Gly Tyr Val Pro Asp 35 40 45 Thr Lys Phe Val Leu His Asp Val Glu Glu Glu Glu Lys Glu Gln Leu 50 55 60 Leu Cys Tyr His Ser Glu Lys Leu Ala Ile Ala Phe Gly Leu Ile Ser 65 70 75 80 Thr Pro Pro Gly Thr Pro Leu Arg Ile Ile Lys Asn Leu Arg Val Cys 85 90 95 Gly Asp Cys His Thr Ala Thr Lys Phe Ile Ser Lys Ile Val Gly Arg 100 105 110 Glu Ile Val Val Arg Asp Ala Asn Arg Phe His His Phe Lys Asp Gly 115 120 125 Val Cys Ser Cys Gly Asp Tyr Trp 130 135 <210> 44 <211> 136 <212> PRT <213> Artificial Sequence <220> <223> PG5 <400> 44 Glu Pro Gly Cys Ala Trp Ile Glu Val Asn Asn Lys Val His Glu Phe 1 5 10 15 Val Ala Gly Asp Lys Ser His Pro Gln Thr Lys Glu Ile Tyr Ala Glu 20 25 30 Leu Glu Arg Leu Ser Lys Gln Met Lys Glu Ala Gly Tyr Val Pro Asp 35 40 45 Thr Lys Phe Val Leu His Asp Val Glu Glu Glu Glu Lys Glu Gln Leu 50 55 60 Leu Cys Tyr His Ser Glu Lys Leu Ala Ile Ala Phe Gly Leu Ile Ser 65 70 75 80 Thr Pro Pro Gly Thr Pro Leu Arg Ile Ile Lys Asn Leu Arg Val Cys 85 90 95 Gly Asp Cys His Thr Ala Thr Lys Phe Ile Ser Lys Ile Val Gly Arg 100 105 110 Glu Ile Val Val Arg Asp Ala Asn Arg Phe His His Phe Lys Asp Gly 115 120 125 Val Cys Ser Cys Gly Asp Tyr Trp 130 135 <210> 45 <211> 136 <212> PRT <213> Artificial Sequence <220> <223> PG6 <400> 45 Glu Pro Gly Cys Ser Thr Ile Glu Val Asn Asn Lys Val His Glu Phe 1 5 10 15 Val Ala Gly Asp Lys Ser His Pro Gln Thr Lys Glu Ile Tyr Ala Glu 20 25 30 Leu Glu Arg Leu Ser Lys Gln Met Lys Glu Ala Gly Tyr Val Pro Asp 35 40 45 Thr Lys Phe Val Leu His Asp Val Glu Glu Glu Glu Lys Glu Gln Leu 50 55 60 Leu Cys Tyr His Ser Glu Lys Leu Ala Ile Ala Phe Gly Leu Ile Ser 65 70 75 80 Thr Pro Pro Gly Thr Pro Leu Arg Ile Ile Lys Asn Leu Arg Val Cys 85 90 95 Gly Asp Cys His Thr Ala Thr Lys Phe Ile Ser Lys Ile Val Gly Arg 100 105 110 Glu Ile Val Val Arg Asp Ala Asn Arg Phe His His Phe Lys Asp Gly 115 120 125 Val Cys Ser Cys Gly Asp Tyr Trp 130 135 <210> 46 <211> 136 <212> PRT <213> Artificial Sequence <220> <223> PG7 <400> 46 Glu Pro Gly Cys Ser Trp Ile Glu Val Asn Asn Lys Val His Glu Phe 1 5 10 15 Val Ala Gly Asp Lys Ser His Pro Gln Thr Lys Glu Ile Tyr Ala Glu 20 25 30 Leu Glu Arg Leu Asn Lys Gln Met Lys Glu Ala Gly Tyr Val Pro Asp 35 40 45 Thr Lys Phe Val Leu His Asp Val Glu Glu Glu Glu Lys Glu Gln Leu 50 55 60 Leu Cys Tyr His Ser Glu Lys Leu Ala Ile Ala Phe Gly Leu Ile Ser 65 70 75 80 Thr Pro Pro Gly Thr Pro Leu Arg Ile Ile Lys Asn Leu Arg Val Cys 85 90 95 Gly Asp Cys His Thr Ala Thr Lys Phe Ile Ser Lys Ile Val Gly Arg 100 105 110 Glu Ile Val Val Arg Asp Ala Asn Arg Phe His His Phe Lys Asp Gly 115 120 125 Val Cys Ser Cys Gly Asp Tyr Trp 130 135 <210> 47 <211> 136 <212> PRT <213> Artificial Sequence <220> <223> PG8 <400> 47 Glu Pro Gly Cys Ser Trp Ile Glu Val Asn Asn Lys Val His Glu Phe 1 5 10 15 Val Ala Gly Asp Lys Ser His Pro Gln Thr Lys Glu Ile Tyr Ala Glu 20 25 30 Leu Glu Arg Leu Ser Lys Gln Met Lys Glu Ala Gly His Val Pro Asp 35 40 45 Thr Lys Phe Val Leu His Asp Val Glu Glu Glu Glu Lys Glu Gln Leu 50 55 60 Leu Cys Tyr His Ser Glu Lys Leu Ala Ile Ala Phe Gly Leu Ile Ser 65 70 75 80 Thr Pro Pro Gly Thr Pro Leu Arg Ile Ile Lys Asn Leu Arg Val Cys 85 90 95 Gly Asp Cys His Thr Ala Thr Lys Phe Ile Ser Lys Ile Val Gly Arg 100 105 110 Glu Ile Val Val Arg Asp Ala Asn Arg Phe His His Phe Lys Asp Gly 115 120 125 Val Cys Ser Cys Gly Asp Tyr Trp 130 135 <210> 48 <211> 136 <212> PRT <213> Artificial Sequence <220> <223> PG9 <400> 48 Glu Pro Gly Cys Ser Trp Ile Glu Val Asn Asn Lys Val His Glu Phe 1 5 10 15 Val Ala Gly Asp Lys Ser His Pro Gln Thr Lys Glu Ile Tyr Ala Glu 20 25 30 Leu Glu Arg Leu Ser Lys Gln Met Lys Glu Ala Gly Tyr Val Pro Asp 35 40 45 Thr Lys Phe Val Leu His Pro Val Glu Glu Glu Glu Lys Glu Gln Leu 50 55 60 Leu Cys Tyr His Ser Glu Lys Leu Ala Ile Ala Phe Gly Leu Ile Ser 65 70 75 80 Thr Pro Pro Gly Thr Pro Leu Arg Ile Ile Lys Asn Leu Arg Val Cys 85 90 95 Gly Asp Cys His Thr Ala Thr Lys Phe Ile Ser Lys Ile Val Gly Arg 100 105 110 Glu Ile Val Val Arg Asp Ala Asn Arg Phe His His Phe Lys Asp Gly 115 120 125 Val Cys Ser Cys Gly Asp Tyr Trp 130 135 <210> 49 <211> 136 <212> PRT <213> Artificial Sequence <220> <223> PG10 <400> 49 Glu Pro Gly Cys Ser Trp Ile Glu Val Asn Asn Lys Val His Glu Phe 1 5 10 15 Val Ala Gly Asp Lys Ser His Pro Gln Thr Lys Glu Ile Tyr Ala Glu 20 25 30 Leu Glu Arg Leu Ser Lys Gln Met Lys Glu Ala Gly Tyr Val Pro Asp 35 40 45 Thr Lys Phe Val Leu His Asp Val Glu Glu Glu Glu Lys Glu Gln Leu 50 55 60 Leu Cys Tyr His Ser Glu Lys Leu Ala Ile Ala Phe Gly Leu Ile Ser 65 70 75 80 Thr Pro Pro Gly Thr Pro Leu Arg Val Thr Lys Asn Leu Arg Val Cys 85 90 95 Gly Asp Cys His Thr Ala Thr Lys Phe Ile Ser Lys Ile Val Gly Arg 100 105 110 Glu Ile Val Val Arg Asp Ala Asn Arg Phe His His Phe Lys Asp Gly 115 120 125 Val Cys Ser Cys Gly Asp Tyr Trp 130 135 <210> 50 <211> 136 <212> PRT <213> Artificial Sequence <220> <223> PG11 <400> 50 Glu Pro Gly Cys Ser Trp Ile Glu Val Asn Asn Lys Val His Glu Phe 1 5 10 15 Val Ala Gly Asp Lys Ser His Pro Gln Thr Lys Glu Ile Tyr Ala Glu 20 25 30 Leu Glu Arg Leu Ser Lys Gln Met Lys Glu Ala Gly Tyr Val Pro Asp 35 40 45 Thr Lys Phe Val Leu His Asp Val Glu Glu Glu Glu Lys Glu Gln Leu 50 55 60 Leu Cys Tyr His Ser Glu Lys Leu Ala Ile Ala Phe Gly Leu Ile Ser 65 70 75 80 Thr Pro Pro Gly Thr Pro Leu Arg Ile Ile Lys Asn Leu Arg Met Cys 85 90 95 Gly Asp Cys His Thr Ala Thr Lys Phe Ile Ser Lys Ile Val Gly Arg 100 105 110 Glu Ile Val Val Arg Asp Ala Asn Arg Phe His His Phe Lys Asp Gly 115 120 125 Val Cys Ser Cys Gly Asp Tyr Trp 130 135 <210> 51 <211> 136 <212> PRT <213> Artificial Sequence <220> <223> PG12 <400> 51 Glu Pro Gly Cys Ser Trp Ile Glu Val Asn Asn Lys Val His Glu Phe 1 5 10 15 Val Ala Gly Asp Lys Ser His Pro Gln Thr Lys Glu Ile Tyr Ala Glu 20 25 30 Leu Glu Arg Leu Ser Lys Gln Met Lys Glu Ala Gly Tyr Val Pro Asp 35 40 45 Thr Lys Phe Val Leu His Asp Val Glu Glu Glu Glu Lys Glu Gln Leu 50 55 60 Leu Cys Tyr His Ser Glu Lys Leu Ala Ile Ala Phe Gly Leu Ile Ser 65 70 75 80 Thr Pro Pro Gly Thr Pro Leu Arg Ile Ile Lys Asn Leu Arg Val Cys 85 90 95 Gly Asp Cys His Thr Ala Thr Lys Phe Ile Ser Lys Ile Val Lys Arg 100 105 110 Glu Ile Val Val Arg Asp Ala Asn Arg Phe His His Phe Lys Asp Gly 115 120 125 Val Cys Ser Cys Gly Asp Tyr Trp 130 135 <210> 52 <211> 136 <212> PRT <213> Artificial Sequence <220> <223> PG13 <400> 52 Glu Pro Gly Cys Ser Trp Ile Glu Val Asn Asn Lys Val His Glu Phe 1 5 10 15 Val Ala Gly Asp Lys Ser His Pro Gln Thr Lys Glu Ile Tyr Ala Glu 20 25 30 Leu Glu Arg Leu Ser Lys Gln Met Lys Glu Ala Gly Tyr Val Pro Asp 35 40 45 Thr Lys Phe Val Leu His Asp Val Glu Glu Glu Glu Lys Glu Gln Leu 50 55 60 Leu Cys Tyr His Ser Glu Lys Leu Ala Ile Ala Phe Gly Leu Ile Ser 65 70 75 80 Thr Pro Pro Gly Thr Pro Leu Arg Ile Ile Lys Asn Leu Arg Val Cys 85 90 95 Gly Asp Cys His Thr Ala Thr Lys Phe Ile Ser Lys Ile Val Gly Arg 100 105 110 Glu Ile Val Val Arg Asp Asp Cys Arg Phe His His Phe Lys Asp Gly 115 120 125 Val Cys Ser Cys Gly Asp Tyr Trp 130 135 <210> 53 <211> 136 <212> PRT <213> Artificial Sequence <220> <223> PG14 <400> 53 Glu Pro Gly Cys Ser Trp Ile Glu Val Asn Asn Lys Val His Glu Phe 1 5 10 15 Val Ala Gly Asp Lys Ser His Pro Gln Thr Lys Glu Ile Tyr Ala Glu 20 25 30 Leu Glu Arg Leu Ser Lys Gln Met Lys Glu Ala Gly Tyr Val Pro Asp 35 40 45 Thr Lys Phe Val Leu His Asp Val Glu Glu Glu Glu Lys Glu Gln Leu 50 55 60 Leu Cys Tyr His Ser Glu Lys Leu Ala Ile Ala Phe Gly Leu Ile Ser 65 70 75 80 Thr Pro Pro Gly Thr Pro Leu Arg Ile Ile Lys Asn Leu Arg Val Cys 85 90 95 Gly Asp Cys His Thr Ala Thr Lys Phe Ile Ser Lys Ile Val Gly Arg 100 105 110 Glu Ile Val Val Arg Asp Ala Asn Cys Val His His Phe Lys Asp Gly 115 120 125 Val Cys Ser Cys Gly Asp Tyr Trp 130 135 <210> 54 <211> 137 <212> PRT <213> Artificial Sequence <220> <223> WW2 <400> 54 Gln Pro Gly Gln Ser Trp Trp Thr Asp Met Gly Gly Val Val His Thr 1 5 10 15 Phe Val Val Gly Asp Arg Glu His Pro Glu Ser Gln Asp Ile Tyr Ala 20 25 30 Lys Leu Lys Asp Leu Ile Val Lys Met Lys Lys Glu Gly Tyr Val Pro 35 40 45 His Leu Asp Ser Val Leu Arg Asp Ile Pro Asp Asp Glu Lys Glu Asp 50 55 60 Ala Leu Cys Gly His Ser Glu Lys Leu Ala Ile Ala Tyr Ala Leu Leu 65 70 75 80 Lys Thr Pro Glu Gly Thr Thr Ile Arg Val Val Lys Asn Leu Arg Val 85 90 95 Cys Glu Asp Cys His Thr Ala Thr Ala Leu Ile Ser Lys Ile Glu Gln 100 105 110 Arg Thr Ile Ile Cys Arg Asp Ala Ser Arg Phe His Val Tyr Lys Asp 115 120 125 Gly Lys Cys Ser Cys Gly Asp Tyr Trp 130 135 <210> 55 <211> 137 <212> PRT <213> Artificial Sequence <220> <223> WW3 <400> 55 Glu Pro Gly Gln Ser Trp Trp Thr Asp Thr Gly Gly Ile Val His Thr 1 5 10 15 Phe Val Val Gly Asp Thr Lys His Pro Gln Ser Gln Asp Ile Tyr Ala 20 25 30 Lys Leu Lys Asp Leu Tyr Val Lys Met Lys Glu Glu Gly Tyr Val Pro 35 40 45 His Leu Asp Cys Val Leu Trp Asp Ile Ser Asp Asp Glu Lys Glu Asp 50 55 60 Ala Leu Cys Gly His Ser Glu Lys Leu Ala Ile Ala Cys Ala Leu Ile 65 70 75 80 Asn Thr Pro Pro Gly Thr Pro Ile Arg Ile Val Lys Asn Leu Arg Val 85 90 95 Cys Asp Asp Cys His Lys Ala Ile Ala Leu Ile Ser Lys Ile Glu Gly 100 105 110 Arg Asn Ile Ile Cys Arg Asp Ala Ser Arg Phe His Asn Tyr Lys Asp 115 120 125 Gly Lys Cys Ser Cys Gly Asp Tyr Trp 130 135 <210> 56 <211> 137 <212> PRT <213> Artificial Sequence <220> <223> WW4 <400> 56 Lys Pro Ala Gln Ser Trp Trp Thr Asp Thr Gly Gly Ile Val His Thr 1 5 10 15 Phe Val Val Gly Asp Thr Lys His Pro Gln Ser Gln Asp Ile Tyr Ala 20 25 30 Lys Leu Lys Asp Leu Tyr Val Lys Met Lys Glu Glu Gly Tyr Val Pro 35 40 45 His Leu Asp Cys Val Leu Trp Asp Ile Ser Asp Asp Glu Lys Glu Asp 50 55 60 Ala Leu Cys Gly His Ser Glu Lys Leu Ala Ile Ala Cys Ala Leu Ile 65 70 75 80 Asn Thr Pro Pro Gly Thr Pro Ile Arg Ile Val Lys Asn Leu Arg Val 85 90 95 Cys Asp Asp Cys His Lys Ala Ile Ala Leu Ile Ser Lys Ile Glu Gly 100 105 110 Arg Asn Ile Ile Cys Arg Asp Ala Ser Arg Phe His Asn Tyr Lys Asp 115 120 125 Gly Lys Cys Ser Cys Gly Asp Tyr Trp 130 135 <210> 57 <211> 137 <212> PRT <213> Artificial Sequence <220> <223> WW5 <400> 57 Lys Pro Gly Gln Ala Trp Trp Thr Asp Thr Gly Gly Ile Val His Thr 1 5 10 15 Phe Val Val Gly Asp Thr Lys His Pro Gln Ser Gln Asp Ile Tyr Ala 20 25 30 Lys Leu Lys Asp Leu Tyr Val Lys Met Lys Glu Glu Gly Tyr Val Pro 35 40 45 His Leu Asp Cys Val Leu Trp Asp Ile Ser Asp Asp Glu Lys Glu Asp 50 55 60 Ala Leu Cys Gly His Ser Glu Lys Leu Ala Ile Ala Cys Ala Leu Ile 65 70 75 80 Asn Thr Pro Pro Gly Thr Pro Ile Arg Ile Val Lys Asn Leu Arg Val 85 90 95 Cys Asp Asp Cys His Lys Ala Ile Ala Leu Ile Ser Lys Ile Glu Gly 100 105 110 Arg Asn Ile Ile Cys Arg Asp Ala Ser Arg Phe His Asn Tyr Lys Asp 115 120 125 Gly Lys Cys Ser Cys Gly Asp Tyr Trp 130 135 <210> 58 <211> 137 <212> PRT <213> Artificial Sequence <220> <223> WW6 <400> 58 Lys Pro Gly Gln Ser Thr Trp Thr Asp Thr Gly Gly Ile Val His Thr 1 5 10 15 Phe Val Val Gly Asp Thr Lys His Pro Gln Ser Gln Asp Ile Tyr Ala 20 25 30 Lys Leu Lys Asp Leu Tyr Val Lys Met Lys Glu Glu Gly Tyr Val Pro 35 40 45 His Leu Asp Cys Val Leu Trp Asp Ile Ser Asp Asp Glu Lys Glu Asp 50 55 60 Ala Leu Cys Gly His Ser Glu Lys Leu Ala Ile Ala Cys Ala Leu Ile 65 70 75 80 Asn Thr Pro Pro Gly Thr Pro Ile Arg Ile Val Lys Asn Leu Arg Val 85 90 95 Cys Asp Asp Cys His Lys Ala Ile Ala Leu Ile Ser Lys Ile Glu Gly 100 105 110 Arg Asn Ile Ile Cys Arg Asp Ala Ser Arg Phe His Asn Tyr Lys Asp 115 120 125 Gly Lys Cys Ser Cys Gly Asp Tyr Trp 130 135 <210> 59 <211> 136 <212> PRT <213> Artificial Sequence <220> <223> WW7 <400> 59 Lys Pro Gly Gln Ser Trp Thr Asp Thr Gly Gly Ile Val His Thr Phe 1 5 10 15 Val Val Gly Asp Thr Lys His Pro Gln Ser Gln Asp Ile Tyr Ala Lys 20 25 30 Leu Lys Asp Leu Tyr Val Lys Met Lys Glu Glu Gly Tyr Val Pro His 35 40 45 Leu Asp Cys Val Leu Trp Asp Ile Ser Asp Asp Glu Lys Glu Asp Ala 50 55 60 Leu Cys Gly His Ser Glu Lys Leu Ala Ile Ala Cys Ala Leu Ile Asn 65 70 75 80 Thr Pro Pro Gly Thr Pro Ile Arg Ile Val Lys Asn Leu Arg Val Cys 85 90 95 Asp Asp Cys His Lys Ala Ile Ala Leu Ile Ser Lys Ile Glu Gly Arg 100 105 110 Asn Ile Ile Cys Arg Asp Ala Ser Arg Phe His Asn Tyr Lys Asp Gly 115 120 125 Lys Cys Ser Cys Gly Asp Tyr Trp 130 135 <210> 60 <211> 137 <212> PRT <213> Artificial Sequence <220> <223> WW8 <400> 60 Lys Pro Gly Gln Ser Trp Trp Thr Asp Thr Gly Gly Ile Val His Thr 1 5 10 15 Phe Val Val Gly Asp Thr Lys His Pro Gln Ser Gln Asp Ile Tyr Ala 20 25 30 Lys Leu Lys Asp Leu Asn Val Lys Met Lys Glu Glu Gly Tyr Val Pro 35 40 45 His Leu Asp Cys Val Leu Trp Asp Ile Ser Asp Asp Glu Lys Glu Asp 50 55 60 Ala Leu Cys Gly His Ser Glu Lys Leu Ala Ile Ala Cys Ala Leu Ile 65 70 75 80 Asn Thr Pro Pro Gly Thr Pro Ile Arg Ile Val Lys Asn Leu Arg Val 85 90 95 Cys Asp Asp Cys His Lys Ala Ile Ala Leu Ile Ser Lys Ile Glu Gly 100 105 110 Arg Asn Ile Ile Cys Arg Asp Ala Ser Arg Phe His Asn Tyr Lys Asp 115 120 125 Gly Lys Cys Ser Cys Gly Asp Tyr Trp 130 135 <210> 61 <211> 137 <212> PRT <213> Artificial Sequence <220> <223> WW9 <400> 61 Lys Pro Gly Gln Ser Trp Trp Thr Asp Thr Gly Gly Ile Val His Thr 1 5 10 15 Phe Val Val Gly Asp Thr Lys His Pro Gln Ser Gln Asp Ile Tyr Ala 20 25 30 Lys Leu Lys Asp Leu Tyr Val Lys Met Lys Glu Glu Gly His Val Pro 35 40 45 His Leu Asp Cys Val Leu Trp Asp Ile Ser Asp Asp Glu Lys Glu Asp 50 55 60 Ala Leu Cys Gly His Ser Glu Lys Leu Ala Ile Ala Cys Ala Leu Ile 65 70 75 80 Asn Thr Pro Pro Gly Thr Pro Ile Arg Ile Val Lys Asn Leu Arg Val 85 90 95 Cys Asp Asp Cys His Lys Ala Ile Ala Leu Ile Ser Lys Ile Glu Gly 100 105 110 Arg Asn Ile Ile Cys Arg Asp Ala Ser Arg Phe His Asn Tyr Lys Asp 115 120 125 Gly Lys Cys Ser Cys Gly Asp Tyr Trp 130 135 <210> 62 <211> 137 <212> PRT <213> Artificial Sequence <220> <223> WW10 <400> 62 Lys Pro Gly Gln Ser Trp Trp Thr Asp Thr Gly Gly Ile Val His Thr 1 5 10 15 Phe Val Val Gly Asp Thr Lys His Pro Gln Ser Gln Asp Ile Tyr Ala 20 25 30 Lys Leu Lys Asp Leu Tyr Val Lys Met Lys Glu Glu Gly Tyr Val Pro 35 40 45 His Leu Asp Cys Val Leu Trp Pro Ile Ser Asp Asp Glu Lys Glu Asp 50 55 60 Ala Leu Cys Gly His Ser Glu Lys Leu Ala Ile Ala Cys Ala Leu Ile 65 70 75 80 Asn Thr Pro Pro Gly Thr Pro Ile Arg Ile Val Lys Asn Leu Arg Val 85 90 95 Cys Asp Asp Cys His Lys Ala Ile Ala Leu Ile Ser Lys Ile Glu Gly 100 105 110 Arg Asn Ile Ile Cys Arg Asp Ala Ser Arg Phe His Asn Tyr Lys Asp 115 120 125 Gly Lys Cys Ser Cys Gly Asp Tyr Trp 130 135 <210> 63 <211> 137 <212> PRT <213> Artificial Sequence <220> <223> WW11 <400> 63 Lys Pro Gly Gln Ser Trp Trp Thr Asp Thr Gly Gly Ile Val His Thr 1 5 10 15 Phe Val Val Gly Asp Thr Lys His Pro Gln Ser Gln Asp Ile Tyr Ala 20 25 30 Lys Leu Lys Asp Leu Tyr Val Lys Met Lys Glu Glu Gly Tyr Val Pro 35 40 45 His Leu Asp Cys Val Leu Trp Asp Ile Ser Asp Asp Glu Lys Glu Asp 50 55 60 Ala Leu Cys Gly His Ser Glu Lys Leu Ala Ile Ala Cys Ala Leu Ile 65 70 75 80 Asn Thr Pro Pro Gly Thr Pro Ile Arg Val Thr Lys Asn Leu Arg Val 85 90 95 Cys Asp Asp Cys His Lys Ala Ile Ala Leu Ile Ser Lys Ile Glu Gly 100 105 110 Arg Asn Ile Ile Cys Arg Asp Ala Ser Arg Phe His Asn Tyr Lys Asp 115 120 125 Gly Lys Cys Ser Cys Gly Asp Tyr Trp 130 135 <210> 64 <211> 137 <212> PRT <213> Artificial Sequence <220> <223> WW12 <400> 64 Lys Pro Gly Gln Ser Trp Trp Thr Asp Thr Gly Gly Ile Val His Thr 1 5 10 15 Phe Val Val Gly Asp Thr Lys His Pro Gln Ser Gln Asp Ile Tyr Ala 20 25 30 Lys Leu Lys Asp Leu Tyr Val Lys Met Lys Glu Glu Gly Tyr Val Pro 35 40 45 His Leu Asp Cys Val Leu Trp Asp Ile Ser Asp Asp Glu Lys Glu Asp 50 55 60 Ala Leu Cys Gly His Ser Glu Lys Leu Ala Ile Ala Cys Ala Leu Ile 65 70 75 80 Asn Thr Pro Pro Gly Thr Pro Ile Arg Ile Val Lys Asn Leu Arg Met 85 90 95 Cys Asp Asp Cys His Lys Ala Ile Ala Leu Ile Ser Lys Ile Glu Gly 100 105 110 Arg Asn Ile Ile Cys Arg Asp Ala Ser Arg Phe His Asn Tyr Lys Asp 115 120 125 Gly Lys Cys Ser Cys Gly Asp Tyr Trp 130 135 <210> 65 <211> 137 <212> PRT <213> Artificial Sequence <220> <223> WW13 <400> 65 Lys Pro Gly Gln Ser Trp Trp Thr Asp Thr Gly Gly Ile Val His Thr 1 5 10 15 Phe Val Val Gly Asp Thr Lys His Pro Gln Ser Gln Asp Ile Tyr Ala 20 25 30 Lys Leu Lys Asp Leu Tyr Val Lys Met Lys Glu Glu Gly Tyr Val Pro 35 40 45 His Leu Asp Cys Val Leu Trp Asp Ile Ser Asp Asp Glu Lys Glu Asp 50 55 60 Ala Leu Cys Gly His Ser Glu Lys Leu Ala Ile Ala Cys Ala Leu Ile 65 70 75 80 Asn Thr Pro Pro Gly Thr Pro Ile Arg Ile Val Lys Asn Leu Arg Val 85 90 95 Cys Asp Asp Cys His Lys Ala Ile Ala Leu Ile Ser Lys Ile Glu Lys 100 105 110 Arg Asn Ile Ile Cys Arg Asp Ala Ser Arg Phe His Asn Tyr Lys Asp 115 120 125 Gly Lys Cys Ser Cys Gly Asp Tyr Trp 130 135 <210> 66 <211> 137 <212> PRT <213> Artificial Sequence <220> <223> WW14 <400> 66 Lys Pro Gly Gln Ser Trp Trp Thr Asp Thr Gly Gly Ile Val His Thr 1 5 10 15 Phe Val Val Gly Asp Thr Lys His Pro Gln Ser Gln Asp Ile Tyr Ala 20 25 30 Lys Leu Lys Asp Leu Tyr Val Lys Met Lys Glu Glu Gly Tyr Val Pro 35 40 45 His Leu Asp Cys Val Leu Trp Asp Ile Ser Asp Asp Glu Lys Glu Asp 50 55 60 Ala Leu Cys Gly His Ser Glu Lys Leu Ala Ile Ala Cys Ala Leu Ile 65 70 75 80 Asn Thr Pro Pro Gly Thr Pro Ile Arg Ile Val Lys Asn Leu Arg Val 85 90 95 Cys Asp Asp Cys His Lys Ala Ile Ala Leu Ile Ser Lys Ile Glu Gly 100 105 110 Arg Asn Ile Ile Cys Arg Asp Asp Cys Arg Phe His Asn Tyr Lys Asp 115 120 125 Gly Lys Cys Ser Cys Gly Asp Tyr Trp 130 135 <210> 67 <211> 137 <212> PRT <213> Artificial Sequence <220> <223> WW15 <400> 67 Lys Pro Gly Gln Ser Trp Trp Thr Asp Thr Gly Gly Ile Val His Thr 1 5 10 15 Phe Val Val Gly Asp Thr Lys His Pro Gln Ser Gln Asp Ile Tyr Ala 20 25 30 Lys Leu Lys Asp Leu Tyr Val Lys Met Lys Glu Glu Gly Tyr Val Pro 35 40 45 His Leu Asp Cys Val Leu Trp Asp Ile Ser Asp Asp Glu Lys Glu Asp 50 55 60 Ala Leu Cys Gly His Ser Glu Lys Leu Ala Ile Ala Cys Ala Leu Ile 65 70 75 80 Asn Thr Pro Pro Gly Thr Pro Ile Arg Ile Val Lys Asn Leu Arg Val 85 90 95 Cys Asp Asp Cys His Lys Ala Ile Ala Leu Ile Ser Lys Ile Glu Gly 100 105 110 Arg Asn Ile Ile Cys Arg Asp Ala Ser Cys Val His Asn Tyr Lys Asp 115 120 125 Gly Lys Cys Ser Cys Gly Asp Tyr Trp 130 135 <210> 68 <211> 133 <212> PRT <213> Artificial Sequence <220> <223> KP2 <400> 68 Lys Pro Ala Val Ala Gly Ile Glu Val Asp Arg His Val His Thr Phe 1 5 10 15 Val Val Gly Glu Glu Arg Gly Asp Ile Ser Cys Lys Val Arg Ser Met 20 25 30 Asn Thr Arg Leu Lys Glu Glu Gly Gly His Val Pro His Thr Glu Leu 35 40 45 Val Leu Lys Pro Leu Ser Glu Lys Glu Lys Glu Asp Glu Leu Cys Gly 50 55 60 His Ala Glu Lys Leu Ala Leu Ala Tyr Gly Leu Leu Asn Thr Pro Asp 65 70 75 80 Gly Thr Pro Leu Leu Val Thr Lys Asn Leu Arg Met Cys Arg Asp Cys 85 90 95 His Ser Ser Thr Glu Ile Met Ser Arg Ile Glu Lys Arg Glu Ile Val 100 105 110 Val Arg Asp Ala His Arg Val His Arg Phe Val Asp Gly Ser Cys Ser 115 120 125 Cys Gly Gly Arg Pro 130 <210> 69 <211> 133 <212> PRT <213> Artificial Sequence <220> <223> KP3 <400> 69 Lys Pro Ala Val Ala Thr Ile Glu Val Asn Lys Gln Val His Arg Phe 1 5 10 15 Leu Val Gly Glu Arg Arg Glu Asp Ile Ala Leu Lys Val Glu Ser Thr 20 25 30 Asn Ala Arg Leu Lys Gln Glu Gly Gly His Val Pro His Thr Lys Leu 35 40 45 Val Leu Lys Pro Leu Cys Glu Lys Glu Lys Glu Asp Ala Leu Cys Gly 50 55 60 His Ala Glu Lys Leu Ala Leu Ala Phe Gly Leu Leu Asn Thr Pro Ser 65 70 75 80 Gly Thr Pro Leu Val Val Thr Lys Asn Leu Arg Met Cys Ser Asp Cys 85 90 95 His Ser Ser Thr Glu Ile Met Ser Arg Leu Glu Gln Arg Asp Ile Val 100 105 110 Val Arg Asp Gly Tyr Arg Val His Arg Phe Ala Ala Gly Cys Cys Ser 115 120 125 Cys Lys Gly Arg Pro 130 <210> 70 <211> 133 <212> PRT <213> Artificial Sequence <220> <223> KP4 <400> 70 Lys Pro Ala Val Ala Thr Ile Glu Val Asn Lys Gln Val His Arg Phe 1 5 10 15 Leu Val Gly Glu Arg Arg Glu Asp Ile Ala Leu Lys Val Glu Ser Thr 20 25 30 Asn Ala Arg Leu Lys Gln Glu Gly Gly His Val Pro His Thr Lys Leu 35 40 45 Val Leu Lys Pro Leu Cys Glu Lys Glu Lys Glu Asp Val Leu Cys Gly 50 55 60 His Ala Glu Lys Leu Ala Leu Ala Phe Gly Leu Leu Asn Thr Pro Ser 65 70 75 80 Gly Thr Pro Leu Val Val Thr Lys Asn Leu Arg Met Cys Ser Asp Cys 85 90 95 His Ser Ser Thr Glu Ile Met Ser Arg Leu Glu Gln Arg Asp Ile Val 100 105 110 Val Arg Asp Gly Tyr Arg Val His Arg Phe Ala Asn Gly Cys Cys Ser 115 120 125 Cys Lys Gly Arg Pro 130 <210> 71 <211> 133 <212> PRT <213> Artificial Sequence <220> <223> KP5 <400> 71 Lys Pro Gly Ser Ala Leu Ile Glu Val Asn Lys Lys Val His Glu Phe 1 5 10 15 Val Val Gly Asn Asn Gln Ser Glu Glu Ile Ser Ala Met Leu Lys Ser 20 25 30 Leu Asn Ser Arg Met Lys Glu Glu Gly His Val Pro Asn Leu Asp Leu 35 40 45 Val Leu Lys Pro Val Ser Asp Glu Glu Lys Glu Ala Ala Leu Cys Glu 50 55 60 His Ala Glu Lys Leu Ala Ile Ala Phe Gly Leu Leu Asn Thr Pro Gln 65 70 75 80 Gly Gln Thr Leu Arg Val Thr Lys Asn Leu Arg Met Cys Asn Asp Cys 85 90 95 His Asn Ala Ser Lys Ile Ile Ser Lys Ile Glu Arg Arg Glu Ile Ile 100 105 110 Leu Arg Asp Asp Cys Cys Ile His His Phe Lys Asp Gly Leu Cys Ser 115 120 125 Cys Gly Asp Met Phe 130 <210> 72 <211> 137 <212> PRT <213> Artificial Sequence <220> <223> KP6 <400> 72 Lys Pro Ala Gln Ser Trp Trp Thr Asp Thr Gly Gly Ile Val His Thr 1 5 10 15 Phe Val Val Gly Asp Thr Lys His Pro Gln Ser Glu Glu Ile Ser Ala 20 25 30 Met Leu Lys Ser Leu Asn Ser Arg Met Lys Glu Glu Gly His Val Pro 35 40 45 Asn Leu Asp Leu Val Leu Lys Pro Val Ser Asp Glu Glu Lys Glu Ala 50 55 60 Ala Leu Cys Glu His Ala Glu Lys Leu Ala Ile Ala Phe Gly Leu Leu 65 70 75 80 Asn Thr Pro Gln Gly Gln Thr Leu Arg Val Thr Lys Asn Leu Arg Met 85 90 95 Cys Asn Asp Cys His Asn Ala Ser Lys Ile Ile Ser Lys Ile Glu Arg 100 105 110 Arg Glu Ile Ile Leu Arg Asp Asp Cys Cys Ile His His Phe Lys Asp 115 120 125 Gly Leu Cys Ser Cys Gly Asp Tyr Trp 130 135 <210> 73 <211> 133 <212> PRT <213> Artificial Sequence <220> <223> KP7 <400> 73 Lys Pro Ala Ser Ser Leu Ile Glu Val Asn Lys Lys Val His Glu Phe 1 5 10 15 Val Val Gly Asn Asn Gln Ser Glu Glu Ile Ser Ala Met Leu Lys Ser 20 25 30 Leu Asn Ser Arg Met Lys Glu Glu Gly His Val Pro Asn Leu Asp Leu 35 40 45 Val Leu Lys Pro Val Ser Asp Glu Glu Lys Glu Ala Ala Leu Cys Glu 50 55 60 His Ala Glu Lys Leu Ala Ile Ala Phe Gly Leu Leu Asn Thr Pro Gln 65 70 75 80 Gly Gln Thr Leu Arg Val Thr Lys Asn Leu Arg Met Cys Asn Asp Cys 85 90 95 His Asn Ala Ser Lys Ile Ile Ser Lys Ile Glu Arg Arg Glu Ile Ile 100 105 110 Leu Arg Asp Asp Cys Cys Ile His His Phe Lys Asp Gly Leu Cys Ser 115 120 125 Cys Gly Asp Met Phe 130 <210> 74 <211> 137 <212> PRT <213> Artificial Sequence <220> <223> KP8 <400> 74 Lys Pro Gly Gln Ala Trp Trp Thr Asp Thr Gly Gly Ile Val His Thr 1 5 10 15 Phe Val Val Gly Asp Thr Lys His Pro Gln Ser Glu Glu Ile Ser Ala 20 25 30 Met Leu Lys Ser Leu Asn Ser Arg Met Lys Glu Glu Gly His Val Pro 35 40 45 Asn Leu Asp Leu Val Leu Lys Pro Val Ser Asp Glu Glu Lys Glu Ala 50 55 60 Ala Leu Cys Glu His Ala Glu Lys Leu Ala Ile Ala Phe Gly Leu Leu 65 70 75 80 Asn Thr Pro Gln Gly Gln Thr Leu Arg Val Thr Lys Asn Leu Arg Met 85 90 95 Cys Asn Asp Cys His Asn Ala Ser Lys Ile Ile Ser Lys Ile Glu Arg 100 105 110 Arg Glu Ile Ile Leu Arg Asp Asp Cys Cys Ile His His Phe Lys Asp 115 120 125 Gly Leu Cys Ser Cys Gly Asp Tyr Trp 130 135 <210> 75 <211> 133 <212> PRT <213> Artificial Sequence <220> <223> KP9 <400> 75 Lys Pro Ala Ser Ala Trp Ile Glu Val Asn Lys Lys Val His Glu Phe 1 5 10 15 Val Val Gly Asn Asn Gln Ser Glu Glu Ile Ser Ala Met Leu Lys Ser 20 25 30 Leu Asn Ser Arg Met Lys Glu Glu Gly His Val Pro Asn Leu Asp Leu 35 40 45 Val Leu Lys Pro Val Ser Asp Glu Glu Lys Glu Ala Ala Leu Cys Glu 50 55 60 His Ala Glu Lys Leu Ala Ile Ala Phe Gly Leu Leu Asn Thr Pro Gln 65 70 75 80 Gly Gln Thr Leu Arg Val Thr Lys Asn Leu Arg Met Cys Asn Asp Cys 85 90 95 His Asn Ala Ser Lys Ile Ile Ser Lys Ile Glu Arg Arg Glu Ile Ile 100 105 110 Leu Arg Asp Asp Cys Cys Ile His His Phe Lys Asp Gly Leu Cys Ser 115 120 125 Cys Gly Asp Met Phe 130 <210> 76 <211> 137 <212> PRT <213> Artificial Sequence <220> <223> KP10 <400> 76 Lys Pro Gly Gln Ser Thr Trp Thr Asp Thr Gly Gly Ile Val His Thr 1 5 10 15 Phe Val Val Gly Asp Thr Lys His Pro Gln Ser Glu Glu Ile Ser Ala 20 25 30 Met Leu Lys Ser Leu Asn Ser Arg Met Lys Glu Glu Gly His Val Pro 35 40 45 Asn Leu Asp Leu Val Leu Lys Pro Val Ser Asp Glu Glu Lys Glu Ala 50 55 60 Ala Leu Cys Glu His Ala Glu Lys Leu Ala Ile Ala Phe Gly Leu Leu 65 70 75 80 Asn Thr Pro Gln Gly Gln Thr Leu Arg Val Thr Lys Asn Leu Arg Met 85 90 95 Cys Asn Asp Cys His Asn Ala Ser Lys Ile Ile Ser Lys Ile Glu Arg 100 105 110 Arg Glu Ile Ile Leu Arg Asp Asp Cys Cys Ile His His Phe Lys Asp 115 120 125 Gly Leu Cys Ser Cys Gly Asp Tyr Trp 130 135 <210> 77 <211> 136 <212> PRT <213> Artificial Sequence <220> <223> KP11 <400> 77 Lys Pro Gly Gln Ser Trp Thr Asp Thr Gly Gly Ile Val His Thr Phe 1 5 10 15 Val Val Gly Asp Thr Lys His Pro Gln Ser Glu Glu Ile Ser Ala Met 20 25 30 Leu Lys Ser Leu Asn Ser Arg Met Lys Glu Glu Gly His Val Pro Asn 35 40 45 Leu Asp Leu Val Leu Lys Pro Val Ser Asp Glu Glu Lys Glu Ala Ala 50 55 60 Leu Cys Glu His Ala Glu Lys Leu Ala Ile Ala Phe Gly Leu Leu Asn 65 70 75 80 Thr Pro Gln Gly Gln Thr Leu Arg Val Thr Lys Asn Leu Arg Met Cys 85 90 95 Asn Asp Cys His Asn Ala Ser Lys Ile Ile Ser Lys Ile Glu Arg Arg 100 105 110 Glu Ile Ile Leu Arg Asp Asp Cys Cys Ile His His Phe Lys Asp Gly 115 120 125 Leu Cys Ser Cys Gly Asp Tyr Trp 130 135 <210> 78 <211> 137 <212> PRT <213> Artificial Sequence <220> <223> KP12 <400> 78 Lys Pro Gly Gln Ser Trp Trp Thr Asp Thr Gly Gly Ile Val His Thr 1 5 10 15 Phe Val Val Gly Asp Thr Lys His Pro Gln Ser Glu Glu Ile Ser Ala 20 25 30 Met Leu Lys Ser Leu Ser Ser Arg Met Lys Glu Glu Gly His Val Pro 35 40 45 Asn Leu Asp Leu Val Leu Lys Pro Val Ser Asp Glu Glu Lys Glu Ala 50 55 60 Ala Leu Cys Glu His Ala Glu Lys Leu Ala Ile Ala Phe Gly Leu Leu 65 70 75 80 Asn Thr Pro Gln Gly Gln Thr Leu Arg Val Thr Lys Asn Leu Arg Met 85 90 95 Cys Asn Asp Cys His Asn Ala Ser Lys Ile Ile Ser Lys Ile Glu Arg 100 105 110 Arg Glu Ile Ile Leu Arg Asp Asp Cys Cys Ile His His Phe Lys Asp 115 120 125 Gly Leu Cys Ser Cys Gly Asp Tyr Trp 130 135 <210> 79 <211> 133 <212> PRT <213> Artificial Sequence <220> <223> KP13 <400> 79 Lys Pro Ala Ser Ala Leu Ile Glu Val Asn Lys Lys Val His Glu Phe 1 5 10 15 Val Val Gly Asn Asn Gln Ser Glu Glu Ile Ser Ala Met Leu Lys Ser 20 25 30 Leu Asn Ser Arg Met Lys Glu Glu Gly Tyr Val Pro Asn Leu Asp Leu 35 40 45 Val Leu Lys Pro Val Ser Asp Glu Glu Lys Glu Ala Ala Leu Cys Glu 50 55 60 His Ala Glu Lys Leu Ala Ile Ala Phe Gly Leu Leu Asn Thr Pro Gln 65 70 75 80 Gly Gln Thr Leu Arg Val Thr Lys Asn Leu Arg Met Cys Asn Asp Cys 85 90 95 His Asn Ala Ser Lys Ile Ile Ser Lys Ile Glu Arg Arg Glu Ile Ile 100 105 110 Leu Arg Asp Asp Cys Cys Ile His His Phe Lys Asp Gly Leu Cys Ser 115 120 125 Cys Gly Asp Met Phe 130 <210> 80 <211> 137 <212> PRT <213> Artificial Sequence <220> <223> KP14 <400> 80 Lys Pro Gly Gln Ser Trp Trp Thr Asp Thr Gly Gly Ile Val His Thr 1 5 10 15 Phe Val Val Gly Asp Thr Lys His Pro Gln Ser Glu Glu Ile Ser Ala 20 25 30 Met Leu Lys Ser Leu Asn Ser Arg Met Lys Glu Glu Gly Tyr Val Pro 35 40 45 Asn Leu Asp Leu Val Leu Lys Pro Val Ser Asp Glu Glu Lys Glu Ala 50 55 60 Ala Leu Cys Glu His Ala Glu Lys Leu Ala Ile Ala Phe Gly Leu Leu 65 70 75 80 Asn Thr Pro Gln Gly Gln Thr Leu Arg Val Thr Lys Asn Leu Arg Met 85 90 95 Cys Asn Asp Cys His Asn Ala Ser Lys Ile Ile Ser Lys Ile Glu Arg 100 105 110 Arg Glu Ile Ile Leu Arg Asp Asp Cys Cys Ile His His Phe Lys Asp 115 120 125 Gly Leu Cys Ser Cys Gly Asp Tyr Trp 130 135 <210> 81 <211> 137 <212> PRT <213> Artificial Sequence <220> <223> KP15 <400> 81 Lys Pro Gly Gln Ser Trp Trp Thr Asp Thr Gly Gly Ile Val His Thr 1 5 10 15 Phe Val Val Gly Asp Thr Lys His Pro Gln Ser Glu Glu Ile Ser Ala 20 25 30 Met Leu Lys Ser Leu Asn Ser Arg Met Lys Glu Glu Gly His Val Pro 35 40 45 Asn Leu Asp Leu Val Leu Lys Asp Val Ser Asp Glu Glu Lys Glu Ala 50 55 60 Ala Leu Cys Glu His Ala Glu Lys Leu Ala Ile Ala Phe Gly Leu Leu 65 70 75 80 Asn Thr Pro Gln Gly Gln Thr Leu Arg Val Thr Lys Asn Leu Arg Met 85 90 95 Cys Asn Asp Cys His Asn Ala Ser Lys Ile Ile Ser Lys Ile Glu Arg 100 105 110 Arg Glu Ile Ile Leu Arg Asp Asp Cys Cys Ile His His Phe Lys Asp 115 120 125 Gly Leu Cys Ser Cys Gly Asp Tyr Trp 130 135 <210> 82 <211> 137 <212> PRT <213> Artificial Sequence <220> <223> KP16 <400> 82 Lys Pro Gly Gln Ser Trp Trp Thr Asp Thr Gly Gly Ile Val His Thr 1 5 10 15 Phe Val Val Gly Asp Thr Lys His Pro Gln Ser Glu Glu Ile Ser Ala 20 25 30 Met Leu Lys Ser Leu Asn Ser Arg Met Lys Glu Glu Gly His Val Pro 35 40 45 Asn Leu Asp Leu Val Leu Lys Pro Val Ser Asp Glu Glu Lys Glu Ala 50 55 60 Ala Leu Cys Glu His Ala Glu Lys Leu Ala Ile Ala Phe Gly Leu Leu 65 70 75 80 Asn Thr Pro Gln Gly Gln Thr Leu Arg Ile Val Lys Asn Leu Arg Met 85 90 95 Cys Asn Asp Cys His Asn Ala Ser Lys Ile Ile Ser Lys Ile Glu Arg 100 105 110 Arg Glu Ile Ile Leu Arg Asp Asp Cys Cys Ile His His Phe Lys Asp 115 120 125 Gly Leu Cys Ser Cys Gly Asp Tyr Trp 130 135 <210> 83 <211> 133 <212> PRT <213> Artificial Sequence <220> <223> KP17 <400> 83 Lys Pro Ala Ser Ala Leu Ile Glu Val Asn Lys Lys Val His Glu Phe 1 5 10 15 Val Val Gly Asn Asn Gln Ser Glu Glu Ile Ser Ala Met Leu Lys Ser 20 25 30 Leu Asn Ser Arg Met Lys Glu Glu Gly His Val Pro Asn Leu Asp Leu 35 40 45 Val Leu Lys Pro Val Ser Asp Glu Glu Lys Glu Ala Ala Leu Cys Glu 50 55 60 His Ala Glu Lys Leu Ala Ile Ala Phe Gly Leu Leu Asn Thr Pro Gln 65 70 75 80 Gly Gln Thr Leu Arg Val Thr Lys Asn Leu Arg Met Cys Asn Asp Cys 85 90 95 His Asn Ala Ser Lys Ile Ile Ser Lys Ile Glu Gly Arg Glu Ile Ile 100 105 110 Leu Arg Asp Asp Cys Cys Ile His His Phe Lys Asp Gly Leu Cys Ser 115 120 125 Cys Gly Asp Met Phe 130 <210> 84 <211> 137 <212> PRT <213> Artificial Sequence <220> <223> KP18 <400> 84 Lys Pro Gly Gln Ser Trp Trp Thr Asp Thr Gly Gly Ile Val His Thr 1 5 10 15 Phe Val Val Gly Asp Thr Lys His Pro Gln Ser Glu Glu Ile Ser Ala 20 25 30 Met Leu Lys Ser Leu Asn Ser Arg Met Lys Glu Glu Gly His Val Pro 35 40 45 Asn Leu Asp Leu Val Leu Lys Pro Val Ser Asp Glu Glu Lys Glu Ala 50 55 60 Ala Leu Cys Glu His Ala Glu Lys Leu Ala Ile Ala Phe Gly Leu Leu 65 70 75 80 Asn Thr Pro Gln Gly Gln Thr Leu Arg Val Thr Lys Asn Leu Arg Met 85 90 95 Cys Asn Asp Cys His Asn Ala Ser Lys Ile Ile Ser Lys Ile Glu Gly 100 105 110 Arg Glu Ile Ile Leu Arg Asp Asp Cys Cys Ile His His Phe Lys Asp 115 120 125 Gly Leu Cys Ser Cys Gly Asp Tyr Trp 130 135 <210> 85 <211> 133 <212> PRT <213> Artificial Sequence <220> <223> KP19 <400> 85 Lys Pro Ala Ser Ala Leu Ile Glu Val Asn Lys Lys Val His Glu Phe 1 5 10 15 Val Val Gly Asn Asn Gln Ser Glu Glu Ile Ser Ala Met Leu Lys Ser 20 25 30 Leu Asn Ser Arg Met Lys Glu Glu Gly His Val Pro Asn Leu Asp Leu 35 40 45 Val Leu Lys Pro Val Ser Asp Glu Glu Lys Glu Ala Ala Leu Cys Glu 50 55 60 His Ala Glu Lys Leu Ala Ile Ala Phe Gly Leu Leu Asn Thr Pro Gln 65 70 75 80 Gly Gln Thr Leu Arg Val Thr Lys Asn Leu Arg Met Cys Asn Asp Cys 85 90 95 His Asn Ala Ser Lys Ile Ile Ser Lys Ile Glu Arg Arg Glu Ile Ile 100 105 110 Leu Arg Asp Ala Ser Cys Ile His His Phe Lys Asp Gly Leu Cys Ser 115 120 125 Cys Gly Asp Met Phe 130 <210> 86 <211> 137 <212> PRT <213> Artificial Sequence <220> <223> KP20 <400> 86 Lys Pro Gly Gln Ser Trp Trp Thr Asp Thr Gly Gly Ile Val His Thr 1 5 10 15 Phe Val Val Gly Asp Thr Lys His Pro Gln Ser Glu Glu Ile Ser Ala 20 25 30 Met Leu Lys Ser Leu Asn Ser Arg Met Lys Glu Glu Gly His Val Pro 35 40 45 Asn Leu Asp Leu Val Leu Lys Pro Val Ser Asp Glu Glu Lys Glu Ala 50 55 60 Ala Leu Cys Glu His Ala Glu Lys Leu Ala Ile Ala Phe Gly Leu Leu 65 70 75 80 Asn Thr Pro Gln Gly Gln Thr Leu Arg Val Thr Lys Asn Leu Arg Met 85 90 95 Cys Asn Asp Cys His Asn Ala Ser Lys Ile Ile Ser Lys Ile Glu Arg 100 105 110 Arg Glu Ile Ile Leu Arg Asp Ala Ser Cys Ile His His Phe Lys Asp 115 120 125 Gly Leu Cys Ser Cys Gly Asp Tyr Trp 130 135 <210> 87 <211> 137 <212> PRT <213> Artificial Sequence <220> <223> KP21 <400> 87 Lys Pro Gly Gln Ser Trp Trp Thr Asp Thr Gly Gly Ile Val His Thr 1 5 10 15 Phe Val Val Gly Asp Thr Lys His Pro Gln Ser Glu Glu Ile Ser Ala 20 25 30 Met Leu Lys Ser Leu Asn Ser Arg Met Lys Glu Glu Gly His Val Pro 35 40 45 Asn Leu Asp Leu Val Leu Lys Pro Val Ser Asp Glu Glu Lys Glu Ala 50 55 60 Ala Leu Cys Glu His Ala Glu Lys Leu Ala Ile Ala Phe Gly Leu Leu 65 70 75 80 Asn Thr Pro Gln Gly Gln Thr Leu Arg Val Thr Lys Asn Leu Arg Met 85 90 95 Cys Asn Asp Cys His Asn Ala Ser Lys Ile Ile Ser Lys Ile Glu Arg 100 105 110 Arg Glu Ile Ile Leu Arg Asp Asp Cys Cys Ile His His Phe Lys Asp 115 120 125 Gly Leu Cys Ser Cys Gly Asp Met Phe 130 135 <210> 88 <211> 137 <212> PRT <213> Artificial Sequence <220> <223> KP22 <400> 88 Lys Pro Gly Gln Ser Trp Trp Thr Asp Thr Gly Gly Ile Val His Thr 1 5 10 15 Phe Val Val Gly Asp Thr Lys His Pro Gln Ser Gln Asp Ile Tyr Ala 20 25 30 Lys Leu Lys Ser Leu Asn Ser Arg Met Lys Glu Glu Gly His Val Pro 35 40 45 Asn Leu Asp Leu Val Leu Lys Pro Val Ser Asp Glu Glu Lys Glu Ala 50 55 60 Ala Leu Cys Glu His Ala Glu Lys Leu Ala Ile Ala Phe Gly Leu Leu 65 70 75 80 Asn Thr Pro Gln Gly Gln Thr Leu Arg Val Thr Lys Asn Leu Arg Met 85 90 95 Cys Asn Asp Cys His Asn Ala Ser Lys Ile Ile Ser Lys Ile Glu Arg 100 105 110 Arg Glu Ile Ile Leu Arg Asp Asp Cys Cys Ile His His Phe Lys Asp 115 120 125 Gly Leu Cys Ser Cys Gly Asp Met Phe 130 135 <210> 89 <211> 137 <212> PRT <213> Artificial Sequence <220> <223> KP23 <400> 89 Lys Pro Gly Gln Ser Trp Trp Thr Asp Thr Gly Gly Ile Val His Thr 1 5 10 15 Phe Val Val Gly Asp Thr Lys His Pro Gln Ser Gln Asp Ile Tyr Ala 20 25 30 Lys Leu Lys Ser Leu Asn Ser Arg Met Lys Glu Glu Gly His Val Pro 35 40 45 Asn Leu Asp Leu Val Leu Lys Pro Val Ser Asp Glu Glu Lys Glu Ala 50 55 60 Ala Leu Cys Glu His Ala Glu Lys Leu Ala Ile Ala Phe Gly Leu Leu 65 70 75 80 Asn Thr Pro Gln Gly Gln Thr Leu Arg Val Thr Lys Asn Leu Arg Met 85 90 95 Cys Asn Asp Cys His Asn Ala Ser Lys Ile Ile Ser Lys Ile Glu Arg 100 105 110 Arg Glu Ile Ile Leu Arg Asp Asp Cys Cys Ile His His Phe Lys Asp 115 120 125 Gly Leu Cys Ser Cys Gly Asp Tyr Trp 130 135 <210> 90 <211> 137 <212> PRT <213> Artificial Sequence <220> <223> Chimeric KP1a <400> 90 Lys Pro Gly Gln Ser Trp Trp Thr Asp Thr Gly Gly Ile Val His Thr 1 5 10 15 Phe Val Val Gly Asp Thr Lys His Pro Gln Ser Glu Glu Ile Ser Ala 20 25 30 Met Leu Lys Ser Leu Asn Ser Arg Met Lys Glu Glu Gly His Val Pro 35 40 45 Asn Leu Asp Leu Val Leu Lys Pro Val Ser Asp Glu Glu Lys Glu Ala 50 55 60 Ala Leu Cys Glu His Ala Glu Lys Leu Ala Ile Ala Phe Gly Leu Leu 65 70 75 80 Asn Thr Pro Gln Gly Gln Thr Leu Arg Val Thr Lys Asn Leu Arg Met 85 90 95 Cys Asn Asp Cys His Asn Ala Ser Lys Ile Ile Ser Lys Ile Glu Arg 100 105 110 Arg Glu Ile Ile Leu Arg Asp Asp Cys Cys Ile His His Phe Lys Asp 115 120 125 Gly Leu Cys Ser Cys Gly Asp Tyr Trp 130 135 <210> 91 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> ND2 <400> 91 cccagcuacg caaaaucuua gc 22 <210> 92 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> ND5 <400> 92 augacaucaa aaaaaucgua gc 22 <210> 93 <211> 830 <212> PRT <213> Artificial Sequence <220> <223> MTS-P-PG1_ND2 <400> 93 Met Ala Leu Leu Arg Ala Ala Val Ser Glu Leu Arg Arg Arg Gly Arg 1 5 10 15 Gly Ala Leu Thr Pro Leu Pro Ala Leu Ser Ser Leu Leu Ser Ser Leu 20 25 30 Ser Pro Arg Ser Pro Ala Ser Thr Arg Pro Glu Pro Asn Asn Pro His 35 40 45 Ala Asp Arg Arg His Val Ile Ala Leu Arg Arg Cys Pro Pro Leu Pro 50 55 60 Ala Ser Ala Val Leu Ala Pro Glu Leu Leu His Ala Arg Gly Leu Leu 65 70 75 80 Pro Arg His Trp Ser His Ala Ser Pro Leu Ser Thr Ser Ser Ser Ser 85 90 95 Ser Arg Pro Ala Asp Lys Ala Gln Leu Thr Trp Val Asp Lys Trp Ile 100 105 110 Pro Glu Ala Ala Arg Pro Tyr Ser His Gly Ser Gly Gly Ser Gly Gly 115 120 125 Gly Leu His Met Gly Ser Gly Gly Leu Ser Ser Gly Asp Tyr Lys Asp 130 135 140 His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp Tyr Lys Asp Asp Asp 145 150 155 160 Asp Lys Gly Ser Gly Gly Ser Gly Gly Ser Gly Asn Ser Val Val Thr 165 170 175 Tyr Asn Thr Leu Ile Asp Gly Leu Cys Lys Ser Gly Lys Ile Glu Glu 180 185 190 Ala Leu Lys Leu Phe Lys Glu Met Glu Glu Lys Gly Ile Thr Pro Ser 195 200 205 Val Val Thr Tyr Asn Thr Leu Ile Asp Gly Leu Cys Lys Ser Gly Lys 210 215 220 Ile Glu Glu Ala Leu Lys Leu Phe Lys Glu Met Glu Glu Lys Gly Ile 225 230 235 240 Thr Pro Ser Val Val Thr Tyr Asn Thr Leu Ile Asp Gly Leu Cys Lys 245 250 255 Ser Gly Lys Ile Glu Glu Ala Leu Lys Leu Phe Lys Glu Met Glu Glu 260 265 270 Lys Gly Ile Thr Pro Ser Val Val Thr Tyr Thr Thr Leu Ile Asp Gly 275 280 285 Leu Cys Lys Ala Gly Lys Val Asp Glu Ala Leu Glu Leu Phe Lys Glu 290 295 300 Met Arg Ser Lys Gly Val Lys Pro Asn Val Val Thr Tyr Thr Thr Leu 305 310 315 320 Ile Asp Gly Leu Cys Lys Ala Gly Lys Val Asp Glu Ala Leu Glu Leu 325 330 335 Phe Asp Glu Met Lys Glu Arg Gly Ile Lys Pro Asp Val Val Thr Tyr 340 345 350 Asn Thr Leu Ile Asp Gly Leu Cys Lys Ser Gly Lys Ile Glu Glu Ala 355 360 365 Leu Lys Leu Phe Lys Glu Met Glu Glu Lys Gly Ile Thr Pro Ser Val 370 375 380 Val Thr Tyr Asn Thr Leu Ile Asp Gly Leu Cys Lys Ala Gly Arg Leu 385 390 395 400 Asp Glu Ala Glu Glu Leu Leu Glu Glu Met Glu Glu Lys Gly Ile Lys 405 410 415 Pro Asp Val Val Thr Tyr Thr Thr Leu Ile Asp Gly Leu Cys Lys Ala 420 425 430 Gly Lys Val Asp Glu Ala Leu Glu Leu Phe Lys Glu Met Arg Ser Lys 435 440 445 Gly Val Lys Pro Asn Val Val Thr Tyr Asn Thr Leu Ile Asp Gly Leu 450 455 460 Cys Lys Ser Gly Lys Ile Glu Glu Ala Leu Lys Leu Phe Lys Glu Met 465 470 475 480 Glu Glu Lys Gly Ile Thr Pro Ser Val Val Thr Tyr Thr Thr Leu Ile 485 490 495 Asp Gly Leu Cys Lys Ala Gly Lys Val Asp Glu Ala Leu Glu Leu Phe 500 505 510 Asp Glu Met Lys Glu Arg Gly Ile Lys Pro Asp Val Val Ser Trp Asn 515 520 525 Ala Met Ile Ala Ala Tyr Ala Gln His Gly His Gly Lys Glu Ala Leu 530 535 540 Gln Leu Phe Gln Gln Met Gln Gln Glu Gly Val Lys Pro Ser Glu Val 545 550 555 560 Thr Phe Thr Ser Ile Leu Ser Ala Cys Ser His Ala Gly Leu Val Asp 565 570 575 Glu Gly His His Tyr Phe Glu Ser Met Ser Pro Asp Tyr Gly Ile Thr 580 585 590 Pro Arg Val Glu His Tyr Gly Cys Met Val Asp Leu Leu Gly Arg Ala 595 600 605 Gly Arg Leu Asp Glu Ala Glu Asp Leu Ile Lys Ser Met Pro Phe Gln 610 615 620 Pro Asn Val Val Val Trp Gly Thr Leu Leu Gly Ala Cys Arg Val His 625 630 635 640 Gly Asp Val Glu Arg Gly Glu Arg Ala Ala Glu Arg Ile Leu Glu Leu 645 650 655 Asp Pro Glu Ser Ala Ala Pro Tyr Val Leu Leu Ser Asn Ile Tyr Ala 660 665 670 Ala Ala Gly Arg Trp Asp Glu Ala Ala Lys Val Arg Lys Leu Met Lys 675 680 685 Glu Arg Gly Val Lys Lys Glu Pro Gly Cys Ser Trp Ile Glu Val Asn 690 695 700 Asn Lys Val His Glu Phe Val Ala Gly Asp Lys Ser His Pro Gln Thr 705 710 715 720 Lys Glu Ile Tyr Ala Glu Leu Glu Arg Leu Ser Lys Gln Met Lys Glu 725 730 735 Ala Gly Tyr Val Pro Asp Thr Lys Phe Val Leu His Asp Val Glu Glu 740 745 750 Glu Glu Lys Glu Gln Leu Leu Cys Tyr His Ser Glu Lys Leu Ala Ile 755 760 765 Ala Phe Gly Leu Ile Ser Thr Pro Pro Gly Thr Pro Leu Arg Ile Ile 770 775 780 Lys Asn Leu Arg Val Cys Gly Asp Cys His Thr Ala Thr Lys Phe Ile 785 790 795 800 Ser Lys Ile Val Gly Arg Glu Ile Val Val Arg Asp Ala Asn Arg Phe 805 810 815 His His Phe Lys Asp Gly Val Cys Ser Cys Gly Asp Tyr Trp 820 825 830 <210> 94 <211> 831 <212> PRT <213> Artificial Sequence <220> <223> MTS-P-WW1_ND2 <400> 94 Met Ala Leu Leu Arg Ala Ala Val Ser Glu Leu Arg Arg Arg Gly Arg 1 5 10 15 Gly Ala Leu Thr Pro Leu Pro Ala Leu Ser Ser Leu Leu Ser Ser Leu 20 25 30 Ser Pro Arg Ser Pro Ala Ser Thr Arg Pro Glu Pro Asn Asn Pro His 35 40 45 Ala Asp Arg Arg His Val Ile Ala Leu Arg Arg Cys Pro Pro Leu Pro 50 55 60 Ala Ser Ala Val Leu Ala Pro Glu Leu Leu His Ala Arg Gly Leu Leu 65 70 75 80 Pro Arg His Trp Ser His Ala Ser Pro Leu Ser Thr Ser Ser Ser Ser 85 90 95 Ser Arg Pro Ala Asp Lys Ala Gln Leu Thr Trp Val Asp Lys Trp Ile 100 105 110 Pro Glu Ala Ala Arg Pro Tyr Ser His Gly Ser Gly Gly Ser Gly Gly 115 120 125 Gly Leu His Met Gly Ser Gly Gly Leu Ser Ser Gly Asp Tyr Lys Asp 130 135 140 His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp Tyr Lys Asp Asp Asp 145 150 155 160 Asp Lys Gly Ser Gly Gly Ser Gly Gly Ser Gly Asn Ser Val Val Thr 165 170 175 Tyr Asn Thr Leu Ile Asp Gly Leu Cys Lys Ser Gly Lys Ile Glu Glu 180 185 190 Ala Leu Lys Leu Phe Lys Glu Met Glu Glu Lys Gly Ile Thr Pro Ser 195 200 205 Val Val Thr Tyr Asn Thr Leu Ile Asp Gly Leu Cys Lys Ser Gly Lys 210 215 220 Ile Glu Glu Ala Leu Lys Leu Phe Lys Glu Met Glu Glu Lys Gly Ile 225 230 235 240 Thr Pro Ser Val Val Thr Tyr Asn Thr Leu Ile Asp Gly Leu Cys Lys 245 250 255 Ser Gly Lys Ile Glu Glu Ala Leu Lys Leu Phe Lys Glu Met Glu Glu 260 265 270 Lys Gly Ile Thr Pro Ser Val Val Thr Tyr Thr Thr Leu Ile Asp Gly 275 280 285 Leu Cys Lys Ala Gly Lys Val Asp Glu Ala Leu Glu Leu Phe Lys Glu 290 295 300 Met Arg Ser Lys Gly Val Lys Pro Asn Val Val Thr Tyr Thr Thr Leu 305 310 315 320 Ile Asp Gly Leu Cys Lys Ala Gly Lys Val Asp Glu Ala Leu Glu Leu 325 330 335 Phe Asp Glu Met Lys Glu Arg Gly Ile Lys Pro Asp Val Val Thr Tyr 340 345 350 Asn Thr Leu Ile Asp Gly Leu Cys Lys Ser Gly Lys Ile Glu Glu Ala 355 360 365 Leu Lys Leu Phe Lys Glu Met Glu Glu Lys Gly Ile Thr Pro Ser Val 370 375 380 Val Thr Tyr Asn Thr Leu Ile Asp Gly Leu Cys Lys Ala Gly Arg Leu 385 390 395 400 Asp Glu Ala Glu Glu Leu Leu Glu Glu Met Glu Glu Lys Gly Ile Lys 405 410 415 Pro Asp Val Val Thr Tyr Thr Thr Leu Ile Asp Gly Leu Cys Lys Ala 420 425 430 Gly Lys Val Asp Glu Ala Leu Glu Leu Phe Lys Glu Met Arg Ser Lys 435 440 445 Gly Val Lys Pro Asn Val Val Thr Tyr Asn Thr Leu Ile Asp Gly Leu 450 455 460 Cys Lys Ser Gly Lys Ile Glu Glu Ala Leu Lys Leu Phe Lys Glu Met 465 470 475 480 Glu Glu Lys Gly Ile Thr Pro Ser Val Val Thr Tyr Thr Thr Leu Ile 485 490 495 Asp Gly Leu Cys Lys Ala Gly Lys Val Asp Glu Ala Leu Glu Leu Phe 500 505 510 Asp Glu Met Lys Glu Arg Gly Ile Lys Pro Asp Val Val Thr Trp Asn 515 520 525 Ala Leu Ile Ala Gly Tyr Ala Arg Gln Gly Glu Ser Asp Leu Val Phe 530 535 540 His Leu Leu Glu Arg Met Arg Gln Glu Gly Ile Gln Pro Ser Gly Val 545 550 555 560 Thr Phe Thr Ser Val Leu Thr Val Cys Ser His Ala Gly Leu Val Asp 565 570 575 Glu Gly Gln Lys Tyr Phe Asp Ala Met Ser Glu Asp Tyr Gly Ile Thr 580 585 590 Pro Arg Ile Glu His Tyr Gly Cys Met Val Asp Leu Leu Gly Arg Ala 595 600 605 Gly Gln Met Asp Glu Ala Val Ala Met Val Glu Lys Met Pro Phe Gln 610 615 620 Pro Asn Leu Val Thr Trp Gly Thr Leu Leu Gly Ala Cys Arg Lys Trp 625 630 635 640 Asn Asn Val Glu Ile Gly Arg His Ala Phe Glu Cys Ala Val Arg Leu 645 650 655 Asp Glu Lys Ser Ala Ala Ala Tyr Val Leu Met Ser Asn Ile Tyr Ala 660 665 670 Asp Ala His Met Trp Glu Glu Arg Asp Lys Ile Gln Ala Met Arg Lys 675 680 685 Asn Ala Arg Ala Trp Lys Lys Pro Gly Gln Ser Trp Trp Thr Asp Thr 690 695 700 Gly Gly Ile Val His Thr Phe Val Val Gly Asp Thr Lys His Pro Gln 705 710 715 720 Ser Gln Asp Ile Tyr Ala Lys Leu Lys Asp Leu Tyr Val Lys Met Lys 725 730 735 Glu Glu Gly Tyr Val Pro His Leu Asp Cys Val Leu Trp Asp Ile Ser 740 745 750 Asp Asp Glu Lys Glu Asp Ala Leu Cys Gly His Ser Glu Lys Leu Ala 755 760 765 Ile Ala Cys Ala Leu Ile Asn Thr Pro Pro Gly Thr Pro Ile Arg Ile 770 775 780 Val Lys Asn Leu Arg Val Cys Asp Asp Cys His Lys Ala Ile Ala Leu 785 790 795 800 Ile Ser Lys Ile Glu Gly Arg Asn Ile Ile Cys Arg Asp Ala Ser Arg 805 810 815 Phe His Asn Tyr Lys Asp Gly Lys Cys Ser Cys Gly Asp Tyr Trp 820 825 830 <210> 95 <211> 830 <212> PRT <213> Artificial Sequence <220> <223> MTS-P-PG1_ND5 <400> 95 Met Ala Leu Leu Arg Ala Ala Val Ser Glu Leu Arg Arg Arg Gly Arg 1 5 10 15 Gly Ala Leu Thr Pro Leu Pro Ala Leu Ser Ser Leu Leu Ser Ser Leu 20 25 30 Ser Pro Arg Ser Pro Ala Ser Thr Arg Pro Glu Pro Asn Asn Pro His 35 40 45 Ala Asp Arg Arg His Val Ile Ala Leu Arg Arg Cys Pro Pro Leu Pro 50 55 60 Ala Ser Ala Val Leu Ala Pro Glu Leu Leu His Ala Arg Gly Leu Leu 65 70 75 80 Pro Arg His Trp Ser His Ala Ser Pro Leu Ser Thr Ser Ser Ser Ser 85 90 95 Ser Arg Pro Ala Asp Lys Ala Gln Leu Thr Trp Val Asp Lys Trp Ile 100 105 110 Pro Glu Ala Ala Arg Pro Tyr Ser His Gly Ser Gly Gly Ser Gly Gly 115 120 125 Gly Leu His Met Gly Ser Gly Gly Leu Ser Ser Gly Asp Tyr Lys Asp 130 135 140 His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp Tyr Lys Asp Asp Asp 145 150 155 160 Asp Lys Gly Ser Gly Gly Ser Gly Gly Ser Gly Asn Ser Val Val Thr 165 170 175 Tyr Thr Thr Leu Ile Asp Gly Leu Cys Lys Ala Gly Lys Val Asp Glu 180 185 190 Ala Leu Glu Leu Phe Lys Glu Met Arg Ser Lys Gly Val Lys Pro Asn 195 200 205 Val Val Thr Tyr Asn Thr Leu Ile Asp Gly Leu Cys Lys Ala Gly Arg 210 215 220 Leu Asp Glu Ala Glu Glu Leu Leu Glu Glu Met Glu Glu Lys Gly Ile 225 230 235 240 Lys Pro Asp Val Val Thr Tyr Thr Thr Leu Ile Asp Gly Leu Cys Lys 245 250 255 Ala Gly Lys Val Asp Glu Ala Leu Glu Leu Phe Asp Glu Met Lys Glu 260 265 270 Arg Gly Ile Lys Pro Asp Val Val Thr Tyr Thr Thr Leu Ile Asp Gly 275 280 285 Leu Cys Lys Ala Gly Lys Val Asp Glu Ala Leu Glu Leu Phe Lys Glu 290 295 300 Met Arg Ser Lys Gly Val Lys Pro Asn Val Val Thr Tyr Asn Thr Leu 305 310 315 320 Ile Asp Gly Leu Cys Lys Ser Gly Lys Ile Glu Glu Ala Leu Lys Leu 325 330 335 Phe Lys Glu Met Glu Glu Lys Gly Ile Thr Pro Ser Val Val Thr Tyr 340 345 350 Thr Thr Leu Ile Asp Gly Leu Cys Lys Ala Gly Lys Val Asp Glu Ala 355 360 365 Leu Glu Leu Phe Lys Glu Met Arg Ser Lys Gly Val Lys Pro Asn Val 370 375 380 Val Thr Tyr Asn Thr Leu Ile Asp Gly Leu Cys Lys Ala Gly Arg Leu 385 390 395 400 Asp Glu Ala Glu Glu Leu Leu Glu Glu Met Glu Glu Lys Gly Ile Lys 405 410 415 Pro Asp Val Val Thr Tyr Asn Thr Leu Ile Asp Gly Leu Cys Lys Ser 420 425 430 Gly Lys Ile Glu Glu Ala Leu Lys Leu Phe Lys Glu Met Glu Glu Lys 435 440 445 Gly Ile Thr Pro Ser Val Val Thr Tyr Thr Thr Leu Ile Asp Gly Leu 450 455 460 Cys Lys Ala Gly Lys Val Asp Glu Ala Leu Glu Leu Phe Lys Glu Met 465 470 475 480 Arg Ser Lys Gly Val Lys Pro Asn Val Val Thr Tyr Thr Thr Leu Ile 485 490 495 Asp Gly Leu Cys Lys Ala Gly Lys Val Asp Glu Ala Leu Glu Leu Phe 500 505 510 Lys Glu Met Arg Ser Lys Gly Val Lys Pro Asn Val Val Ser Trp Thr 515 520 525 Ala Met Ile Ala Ala Tyr Ala Gln His Gly His Gly Lys Glu Ala Leu 530 535 540 Gln Leu Phe Gln Gln Met Gln Gln Glu Gly Val Lys Pro Asn Glu Val 545 550 555 560 Thr Phe Thr Ser Ile Leu Ser Ala Cys Ser His Ala Gly Leu Val Asp 565 570 575 Glu Gly His His Tyr Phe Glu Ser Met Ser Pro Asp Tyr Gly Ile Thr 580 585 590 Pro Arg Val Glu His Tyr Gly Cys Met Val Asp Leu Leu Gly Arg Ala 595 600 605 Gly Arg Leu Asp Glu Ala Glu Asp Leu Ile Lys Ser Met Pro Phe Gln 610 615 620 Pro Asn Val Val Val Trp Gly Thr Leu Leu Gly Ala Cys Arg Val His 625 630 635 640 Gly Asp Val Glu Arg Gly Glu Arg Ala Ala Glu Arg Ile Leu Glu Leu 645 650 655 Asp Pro Glu Ser Ala Ala Pro Tyr Val Leu Leu Ser Asn Ile Tyr Ala 660 665 670 Ala Ala Gly Arg Trp Asp Glu Ala Ala Lys Val Arg Lys Leu Met Lys 675 680 685 Glu Arg Gly Val Lys Lys Glu Pro Gly Cys Ser Trp Ile Glu Val Asn 690 695 700 Asn Lys Val His Glu Phe Val Ala Gly Asp Lys Ser His Pro Gln Thr 705 710 715 720 Lys Glu Ile Tyr Ala Glu Leu Glu Arg Leu Ser Lys Gln Met Lys Glu 725 730 735 Ala Gly Tyr Val Pro Asp Thr Lys Phe Val Leu His Asp Val Glu Glu 740 745 750 Glu Glu Lys Glu Gln Leu Leu Cys Tyr His Ser Glu Lys Leu Ala Ile 755 760 765 Ala Phe Gly Leu Ile Ser Thr Pro Pro Gly Thr Pro Leu Arg Ile Ile 770 775 780 Lys Asn Leu Arg Val Cys Gly Asp Cys His Thr Ala Thr Lys Phe Ile 785 790 795 800 Ser Lys Ile Val Gly Arg Glu Ile Val Val Arg Asp Ala Asn Arg Phe 805 810 815 His His Phe Lys Asp Gly Val Cys Ser Cys Gly Asp Tyr Trp 820 825 830 <210> 96 <211> 831 <212> PRT <213> Artificial Sequence <220> <223> MTS-P-WW1_ND5 <400> 96 Met Ala Leu Leu Arg Ala Ala Val Ser Glu Leu Arg Arg Arg Gly Arg 1 5 10 15 Gly Ala Leu Thr Pro Leu Pro Ala Leu Ser Ser Leu Leu Ser Ser Leu 20 25 30 Ser Pro Arg Ser Pro Ala Ser Thr Arg Pro Glu Pro Asn Asn Pro His 35 40 45 Ala Asp Arg Arg His Val Ile Ala Leu Arg Arg Cys Pro Pro Leu Pro 50 55 60 Ala Ser Ala Val Leu Ala Pro Glu Leu Leu His Ala Arg Gly Leu Leu 65 70 75 80 Pro Arg His Trp Ser His Ala Ser Pro Leu Ser Thr Ser Ser Ser Ser 85 90 95 Ser Arg Pro Ala Asp Lys Ala Gln Leu Thr Trp Val Asp Lys Trp Ile 100 105 110 Pro Glu Ala Ala Arg Pro Tyr Ser His Gly Ser Gly Gly Ser Gly Gly 115 120 125 Gly Leu His Met Gly Ser Gly Gly Leu Ser Ser Gly Asp Tyr Lys Asp 130 135 140 His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp Tyr Lys Asp Asp Asp 145 150 155 160 Asp Lys Gly Ser Gly Gly Ser Gly Gly Ser Gly Asn Ser Val Val Thr 165 170 175 Tyr Thr Thr Leu Ile Asp Gly Leu Cys Lys Ala Gly Lys Val Asp Glu 180 185 190 Ala Leu Glu Leu Phe Lys Glu Met Arg Ser Lys Gly Val Lys Pro Asn 195 200 205 Val Val Thr Tyr Asn Thr Leu Ile Asp Gly Leu Cys Lys Ala Gly Arg 210 215 220 Leu Asp Glu Ala Glu Glu Leu Leu Glu Glu Met Glu Glu Lys Gly Ile 225 230 235 240 Lys Pro Asp Val Val Thr Tyr Thr Thr Leu Ile Asp Gly Leu Cys Lys 245 250 255 Ala Gly Lys Val Asp Glu Ala Leu Glu Leu Phe Asp Glu Met Lys Glu 260 265 270 Arg Gly Ile Lys Pro Asp Val Val Thr Tyr Thr Thr Leu Ile Asp Gly 275 280 285 Leu Cys Lys Ala Gly Lys Val Asp Glu Ala Leu Glu Leu Phe Lys Glu 290 295 300 Met Arg Ser Lys Gly Val Lys Pro Asn Val Val Thr Tyr Asn Thr Leu 305 310 315 320 Ile Asp Gly Leu Cys Lys Ser Gly Lys Ile Glu Glu Ala Leu Lys Leu 325 330 335 Phe Lys Glu Met Glu Glu Lys Gly Ile Thr Pro Ser Val Val Thr Tyr 340 345 350 Thr Thr Leu Ile Asp Gly Leu Cys Lys Ala Gly Lys Val Asp Glu Ala 355 360 365 Leu Glu Leu Phe Lys Glu Met Arg Ser Lys Gly Val Lys Pro Asn Val 370 375 380 Val Thr Tyr Asn Thr Leu Ile Asp Gly Leu Cys Lys Ala Gly Arg Leu 385 390 395 400 Asp Glu Ala Glu Glu Leu Leu Glu Glu Met Glu Glu Lys Gly Ile Lys 405 410 415 Pro Asp Val Val Thr Tyr Asn Thr Leu Ile Asp Gly Leu Cys Lys Ser 420 425 430 Gly Lys Ile Glu Glu Ala Leu Lys Leu Phe Lys Glu Met Glu Glu Lys 435 440 445 Gly Ile Thr Pro Ser Val Val Thr Tyr Thr Thr Leu Ile Asp Gly Leu 450 455 460 Cys Lys Ala Gly Lys Val Asp Glu Ala Leu Glu Leu Phe Lys Glu Met 465 470 475 480 Arg Ser Lys Gly Val Lys Pro Asn Val Val Thr Tyr Thr Thr Leu Ile 485 490 495 Asp Gly Leu Cys Lys Ala Gly Lys Val Asp Glu Ala Leu Glu Leu Phe 500 505 510 Lys Glu Met Arg Ser Lys Gly Val Lys Pro Asn Val Val Thr Trp Thr 515 520 525 Ala Leu Ile Ala Gly Tyr Ala Arg Gln Gly Glu Ser Asp Leu Val Phe 530 535 540 His Leu Leu Glu Arg Met Arg Gln Glu Gly Ile Gln Pro Asn Gly Val 545 550 555 560 Thr Phe Thr Ser Val Leu Thr Val Cys Ser His Ala Gly Leu Val Asp 565 570 575 Glu Gly Gln Lys Tyr Phe Asp Ala Met Ser Glu Asp Tyr Gly Ile Thr 580 585 590 Pro Arg Ile Glu His Tyr Gly Cys Met Val Asp Leu Leu Gly Arg Ala 595 600 605 Gly Gln Met Asp Glu Ala Val Ala Met Val Glu Lys Met Pro Phe Gln 610 615 620 Pro Asn Leu Val Thr Trp Gly Thr Leu Leu Gly Ala Cys Arg Lys Trp 625 630 635 640 Asn Asn Val Glu Ile Gly Arg His Ala Phe Glu Cys Ala Val Arg Leu 645 650 655 Asp Glu Lys Ser Ala Ala Ala Tyr Val Leu Met Ser Asn Ile Tyr Ala 660 665 670 Asp Ala His Met Trp Glu Glu Arg Asp Lys Ile Gln Ala Met Arg Lys 675 680 685 Asn Ala Arg Ala Trp Lys Lys Pro Gly Gln Ser Trp Trp Thr Asp Thr 690 695 700 Gly Gly Ile Val His Thr Phe Val Val Gly Asp Thr Lys His Pro Gln 705 710 715 720 Ser Gln Asp Ile Tyr Ala Lys Leu Lys Asp Leu Tyr Val Lys Met Lys 725 730 735 Glu Glu Gly Tyr Val Pro His Leu Asp Cys Val Leu Trp Asp Ile Ser 740 745 750 Asp Asp Glu Lys Glu Asp Ala Leu Cys Gly His Ser Glu Lys Leu Ala 755 760 765 Ile Ala Cys Ala Leu Ile Asn Thr Pro Pro Gly Thr Pro Ile Arg Ile 770 775 780 Val Lys Asn Leu Arg Val Cys Asp Asp Cys His Lys Ala Ile Ala Leu 785 790 795 800 Ile Ser Lys Ile Glu Gly Arg Asn Ile Ile Cys Arg Asp Ala Ser Arg 805 810 815 Phe His Asn Tyr Lys Asp Gly Lys Cys Ser Cys Gly Asp Tyr Trp 820 825 830

Claims (10)

  1. 하기 a, b, c 및 bc 중 어느 하나의 폴리펩티드로 구성된 DYW 도메인을 포함하는 인공 DYW 단백질을 표적 RNA에 적용하는 것을 특징으로 하는 표적 RNA를 편집하는 방법(각 서열에서, x는 임의의 아미노산을 나타내고, …는 임의의 폴리펩티드 단편을 나타낸다):
    a. xa1PGxa2SWIExa3-xa16HP…HxaaE…Cxa17xa18CH…DYW를 가지고 서열번호: 1의 서열과 최소한 40%의 서열 동일성을 가지며, C-to-U/U-to-C 편집활성을 가지는 폴리펩티드;
    b. xb1PGxb2SWWTDxb3-xb16HP…HxbbE…Cxb17xb18CH…DYW를 가지고 서열번호: 2의 서열과 최소한 40%의 서열 동일성을 가지며, C-to-U/U-to-C 편집활성을 가지는 폴리펩티드;
    c. KPAxc1Axc2IExc3…HxccE…Cxc4xc5CH…xc6xc7xc8을 가지고 서열번호: 3의 서열과 최소한 40%의 서열 동일성을 가지며, C-to-U/U-to-C 편집활성을 가지는 폴리펩티드; 및,
    bc. xb1PGxb2SWWTDxb3-xb16HP…HxccE…Cxc4xc5CH…Dxbc1xbc2를 가지고 서열번호: 2의 서열과 최소한 40%의 서열 동일성을 가지며, C-to-U/U-to-C 편집활성을 가지는 폴리펩티드.
  2. 하기 a, b, c 및 bc 중 어느 하나의 폴리펩티드로 구성된 DYW 도메인:
    a. xa1PGxa2SWIExa3-xa16HP…HxaaE…Cxa17xa18CH…DYW를 가지고 서열번호: 1의 서열과 최소한 40%의 서열 동일성을 가지며, C-to-U/U-to-C 편집활성을 가지는 폴리펩티드;
    b. xb1PGxb2SWWTDxb3-xb16HP…HxbbE…Cxb17xb18CH…DYW를 가지고 서열번호: 2의 서열과 최소한 40%의 서열 동일성을 가지며, C-to-U/U-to-C 편집활성을 가지는 폴리펩티드;
    c. KPAxc1Axc2IExc…HxccE…Cxc4xc5CH…xc6xc7xc8을 가지고 서열번호: 3의 서열과 최소한 40%의 서열 동일성을 가지며, C-to-U/U-to-C 편집활성을 가지는 폴리펩티드; 및,
    bc. xb1PGxb2SWWTDxb3-xb16HP…HxccE…Cxc4xc5CH…Dxbc1xbc2를 가지고 서열번호: 2의 서열과 최소한 40%의 서열 동일성을 가지며, C-to-U/U-to-C 편집활성을 가지는 폴리펩티드.
  3. 적어도 1개의 PPR 모티프를 포함하고 표적 RNA에 서열 특이적으로 결합가능한 RNA 결합 도메인 및 제2항에 기재된 DYW 도메인을 포함하는 DYW 단백질.
  4. 제2항에 있어서,
    RNA 결합 도메인이 PLS형인 것을 특징으로하는
    DYW 단백질.
  5. 하기 c 또는 bc의 폴리펩티드로 구성된 DYW 도메인을 표적 RNA에 적용하여 편집 표적 U를 C로 변환하는 공정을 포함하는 표적 RNA를 편집하는 방법:
    c. KPAxc1Axc2IExc…HxccE…Cxc4xc5CH…xc6xc7xc8을 가지고 서열번호: 3의 서열과 최소한 40%의 서열 동일성을 가지며, C-to-U/U-to-C 편집활성을 가지는 폴리펩티드; 및,
    bc. xb1PGxb2SWWTDxb3-xb16HP…HxccE…Cxc4xc5CH…Dxbc1xbc2를 가지고 서열번호: 2의 90 서열과 최소한 40%의 서열 동일성을 가지며, C-to-U/U-to-C 편집활성을 가지는 폴리펩티드.
  6. 제5항에 있어서,
    DYW 도메인이 적어도 하나의 PPR 모티프를 포함하고 PPR-code 규칙에 따라 표적 RNA에 서열 특이적으로 결합가능한 RNA 결합 도메인에 융합되는 것을 특징으로 하는 방법.
  7. 제2항에 기재된 DYW 도메인을 포함하는 진핵세포에서 RNA를 편집하기 위한 조성물.
  8. 제2항에 기재된 DYW 도메인 또는 제3항 또는 제4항에 기재된 DYW 단백질을 암호화하는 핵산.
  9. 제8항에 기재된 핵산을 포함하는 벡터.
  10. 제9항에 기재된 벡터를 포함하는 세포(사람의 세포는 제외).


KR1020227037296A 2020-03-31 2021-03-31 표적 rna의 편집방법 KR20220165747A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2020065065 2020-03-31
JPJP-P-2020-065065 2020-03-31
PCT/JP2021/014096 WO2021201198A1 (ja) 2020-03-31 2021-03-31 標的rnaを編集する方法

Publications (1)

Publication Number Publication Date
KR20220165747A true KR20220165747A (ko) 2022-12-15

Family

ID=77930108

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020227037296A KR20220165747A (ko) 2020-03-31 2021-03-31 표적 rna의 편집방법

Country Status (11)

Country Link
US (1) US20230125942A1 (ko)
EP (1) EP4130274A4 (ko)
JP (2) JPWO2021201198A1 (ko)
KR (1) KR20220165747A (ko)
CN (1) CN115698296A (ko)
AU (1) AU2021248204A1 (ko)
BR (1) BR112022019571A2 (ko)
CA (1) CA3179365A1 (ko)
IL (1) IL296955A (ko)
TW (1) TW202204382A (ko)
WO (1) WO2021201198A1 (ko)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4331619A1 (en) * 2021-04-30 2024-03-06 Editforce, Inc. Therapeutic drug for myotonic dystrophy type 1
CN118715322A (zh) * 2021-12-24 2024-09-27 株式会社GeCoRT 酶、复合体、重组载体、遗传性疾病治疗药以及多核苷酸
CN117384884B (zh) * 2023-11-30 2024-03-08 辉大(上海)生物科技有限公司 IscB多肽及其用途

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013058404A1 (ja) 2011-10-21 2013-04-25 国立大学法人九州大学 Pprモチーフを利用したrna結合性蛋白質の設計方法及びその利用
WO2014175284A1 (ja) 2013-04-22 2014-10-30 国立大学法人九州大学 Pprモチーフを利用したdna結合性タンパク質およびその利用

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013058404A1 (ja) 2011-10-21 2013-04-25 国立大学法人九州大学 Pprモチーフを利用したrna結合性蛋白質の設計方法及びその利用
WO2014175284A1 (ja) 2013-04-22 2014-10-30 国立大学法人九州大学 Pprモチーフを利用したdna結合性タンパク質およびその利用

Non-Patent Citations (12)

* Cited by examiner, † Cited by third party
Title
[비특허문헌 1] Lurin, C., Andres, C., Aubourg, S., Bellaoui, M., Bitton, F., Bruyere, C., Caboche, M., Debast, C., Gualberto, J., Hoffmann, B., et al.(2004). Genome-wide analysis of Arabidopsis pentatricopeptide repeat proteins reveals their essential role in organelle biogenesis. Plant Cell 16:2089-2103.
[비특허문헌 10] Gerke, P., Szovenyi, P., Neubauer, A., Lenz, H., Gutmann, B., McDowell, R., Small, I., Schallenberg-Rudinger, M., and Knoop, V.(2020). Towards a plant model for enigmatic U-to-C RNA editing:the organelle genomes, transcriptomes, editomes and candidate RNA editing factors in the hornwort Anthoceros agrestis. New Phytologist 225:1974-1992.
[비특허문헌 11] Gutmann B., Royan S., Schallenberg-Rudinger M., Lenz H., Castleden IR, McDowell R., Vacher MA, Tonti-Filippini J., Bond CS, Knoop V., and Small ID(2020). The Expansion and Diversification of Pentatricopeptide Repeat RNA-Editing Factors in Plants. Molecular Plant 13:215-230
[비특허문헌 12] Oldenkott, B., Yang, Y., Lesch, E., Knoop, V., and Schallenberg-Rudinger, M.(2019). Plant-type pentatricopeptide repeat proteins with a DYW domain drive C-to-U RNA editing in Escherichia coli. Communications Biology 2:85.
[비특허문헌 2] Cheng, S., Gutmann, B., Zhong, X., Ye, Y., Fisher, M. F., Bai, F., Castleden, I., Song, Y., Song, B., Huang, J., et al.(2016). Redefining the structural motifs that determine RNA binding and RNA editing by pentatricopeptide repeat proteins in land plants. Plant J. 85:532-547.
[비특허문헌 3] Barkan, A., Rojas, M., Fujii, S., Yap, A., Chong, Y. S., Bond, C. S., and Small, I.(2012). A combinatorial amino acid code for RNA recognition by pentatricopeptide repeat proteins. PLoS Genet. 8:e1002910.
[비특허문헌 4] Shen, C., Zhang, D., Guan, Z., Liu, Y., Yang, Z., Yang, Y., Wang, X., Wang, Q. Zhang, Q. Fan, S., et al.(2016). Structural basis for specific single-stranded RNA recognition by designer pentatricopeptide repeat proteins. Nat. Commun. 7:11285.
[비특허문헌 5] Yagi, Y., Hayashi, S., Kobayashi, K., Hirayama, T., and Nakamura, T.(2013). Elucidation of the RNA recognition code for pentatricopeptide repeat proteins involved in organelle RNA editing in plants. PLoS One 8:e57286.
[비특허문헌 6] Kobayashi, T., Yagi, Y., and Nakamura, T.(2019). Comprehensive Prediction of Target RNA Editing Sites for PLS-Class PPR Proteins in Arabidopsis thaliana. Plant Cell Physiol. 60:862-874.
[비특허문헌 7] Yan, J., Yao, Y., Hong, S., Yang, Y., Shen, C., Zhang, Q. Zhang, D., Zou, T., and Yin, P.(2019). Delineation of pentatricopeptide repeat codes for target RNA prediction. Nucleic Acids Res. 47:3728-3738.
[비특허문헌 8] Takenaka, M., Zehrmann, A., Brennicke, A., and Graichen, K.(2013). Improved computational target site prediction for pentatricopeptide repeat RNA editing factors. PLoS One 8:e65343.
[비특허문헌 9] Knie, N., Grewe, F., Fischer, S., and Knoop, V.(2016). Reverse U-to-C editing exceeds C-to-U RNA editing in some ferns-a monilophyte-wide comparison of chloroplast and mitochondrial RNA editing suggests independent evolution of the two processes in both organelles. BMC Evol. Biol. 16:134.

Also Published As

Publication number Publication date
EP4130274A4 (en) 2024-05-22
JP2024096897A (ja) 2024-07-17
AU2021248204A1 (en) 2022-11-10
CA3179365A1 (en) 2021-10-07
IL296955A (en) 2022-12-01
CN115698296A (zh) 2023-02-03
JPWO2021201198A1 (ko) 2021-10-07
BR112022019571A2 (pt) 2022-12-06
TW202204382A (zh) 2022-02-01
US20230125942A1 (en) 2023-04-27
WO2021201198A1 (ja) 2021-10-07
EP4130274A1 (en) 2023-02-08

Similar Documents

Publication Publication Date Title
KR20220165747A (ko) 표적 rna의 편집방법
CN110845603B (zh) 人胶原蛋白17型多肽、其生产方法和用途
JP7246100B2 (ja) 新規融合タンパク質の調製およびそのタンパク質合成の向上における使用
AU2017286477A1 (en) Variants of a DNA polymerase of the polX family
KR20180029953A (ko) 세포 또는 유기체의 게놈으로의 DNA 서열의 표적화 혼입을 위한 Cas 9 레트로바이러스 인테그라제 시스템 및 Cas 9 재조합효소 시스템
KR102461666B1 (ko) 혈청 알부민 결합 피브로넥틴 iii 형 도메인
JP6619650B2 (ja) 新規のpcsk9結合タンパク質
Virgili et al. Structural analysis of the DAP5 MIF4G domain and its interaction with eIF4A
JP2012522501A5 (ko)
KR101219628B1 (ko) 인터날린 단백질의 n-말단 및 lrr 패밀리 단백질이 융합된 수용성 융합 폴리펩타이드 및 이의 제조 방법
CN110551700B (zh) Adh蛋白家族突变体及其应用
CN110408635A (zh) 一种含有链霉亲和素元件的核酸构建物在蛋白质表达、纯化中的应用
CN109152808A (zh) 用于核酸序列的特异性靶向的二聚蛋白质
JP2023145672A (ja) 効率的なpprタンパク質の作製方法及びその利用
US20170218060A1 (en) Novel polypeptide for binding to complement protein c5a, and use of same
Baumann et al. Identification of a potential modification site in human stromal cell‐derived factor‐1
US20220220166A1 (en) Ppr protein causing less aggregation and use of the same
CN108623690A (zh) 一种促血小板生成素的融合蛋白及其制备方法和应用
US20180346539A1 (en) Cyclized cytokines and method for producing same
CA3233224A1 (en) Chimeric protein and expression system
KR101624703B1 (ko) 적색 형광단백질에 결합하는 신규한 폴리펩타이드
KR101582655B1 (ko) 광활성 메티오닌 모사체 표지 단백질 생합성을 위한 메티오닐 tRNA 합성효소 변이체
JPWO2021110846A5 (ko)
CA2873095A1 (en) Artificial forisome body with seo-f fusion proteins, vectors which code for seo-f fusion proteins, and plant or yeast cells comprising said vectors