KR20230135047A - 아데노신 데아미나제 및 관련 생체물질과 응용 - Google Patents

아데노신 데아미나제 및 관련 생체물질과 응용 Download PDF

Info

Publication number
KR20230135047A
KR20230135047A KR1020237020153A KR20237020153A KR20230135047A KR 20230135047 A KR20230135047 A KR 20230135047A KR 1020237020153 A KR1020237020153 A KR 1020237020153A KR 20237020153 A KR20237020153 A KR 20237020153A KR 20230135047 A KR20230135047 A KR 20230135047A
Authority
KR
South Korea
Prior art keywords
leu
lys
glu
ile
asp
Prior art date
Application number
KR1020237020153A
Other languages
English (en)
Inventor
환빈 저우
팡 옌
빈 런
다치 옌
랑 리우
Original Assignee
인스티튜트 오브 플랜트 프로텍션, 차이니즈 아카데미 오브 애그리컬쳐럴 사이언스
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 인스티튜트 오브 플랜트 프로텍션, 차이니즈 아카데미 오브 애그리컬쳐럴 사이언스 filed Critical 인스티튜트 오브 플랜트 프로텍션, 차이니즈 아카데미 오브 애그리컬쳐럴 사이언스
Publication of KR20230135047A publication Critical patent/KR20230135047A/ko

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/78Hydrolases (3) acting on carbon to nitrogen bonds other than peptide bonds (3.5)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells
    • C12N15/8218Antisense, co-suppression, viral induced gene silencing [VIGS], post-transcriptional induced gene silencing [PTGS]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y305/00Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
    • C12Y305/04Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in cyclic amidines (3.5.4)
    • C12Y305/04004Adenosine deaminase (3.5.4.4)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/09Fusion polypeptide containing a localisation/targetting motif containing a nuclear localisation signal

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Medicinal Chemistry (AREA)
  • Cell Biology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Virology (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)

Abstract

아데노신 데아미나제 및 관련 생체물질과 응용이 제공된다. 이 아데노신 데아미나제는 아미노산 서열이 서열 목록 중 서열 2의 위치 1-167인 단백질로, 명칭은 TadA9이다. TadA9은 SpCas9(D10A), SpCas9-NG(D10A), ScCas9(D10A) 및 SpRY(D10A)와 융합 후 매개 아데닌 염기 편집 기술의 편집 효율이 TadA7.10 및 TadA-R 돌연변이체 매개 아데닌 염기 편집 기술에 비해 현저히 높고, 편집 활성 창을 확장할 수 있어, 아데닌 염기 편집 기술의 효율성을 향상시키고 응용 범위를 넓혔다.

Description

아데노신 데아미나제 및 관련 생체물질과 응용
본 발명은 아데노신 데아미나제 및 관련 생체물질과 응용에 관한 것이다.
게놈 편집 기술은 인공 뉴클레아제를 이용하여 유기체 게놈의 특정 위치를 개조하는 유전 공학 기술이다. 이 과정은 주로 특정 뉴클레아제에 의존하여 표적 부위를 절단하여 DNA 이중 가닥 절단을 생성한 다음, 비-상동성 말단 연결(Non-homologous end-joining, NHEJ) 복구 또는 상동성 지시된 복구(Homology-directed repair, HDR) 방식으로 염기 결실, 삽입 및 불일치 등의 현상을 도입함으로써 돌연변이 목적을 달성한다. 최근 몇 년 동안 ZFN, TALEN 및 CRISPR 위주의 인공 뉴클레아제 기술이 잇따라 연구개발에 성공하였다. 특히 CRISPR/Cas 기술은 조작이 편리하고 효율이 높으며 범용성이 있어, 연구자들로부터 많은 관심을 받고 있다.
단일 뉴클레오티드 다형성(Single-nucleotide polymorphism, SNP)은 작물 농업 형질의 유전적 기초로서, 식물의 여러 가지 중요한 농업 형질은 단일 뉴클레오티드 부위에 의해 결정된다. 현재 식물 표현형 형질의 스크리닝에 SNP가 점점 더 많이 발견 및 사용되고 있다. CRISPR/Cas 기술이 발달함에 따라, 이를 기반으로 게놈에 단일 염기 변화를 일으키는 단일 염기 편집 기술인 사이토신 염기 편집 시스템 및 아데닌 염기 편집 시스템이 구축되어 식물의 표적 염기 치환을 유도하는데 사용되고 있다. 염기 편집 기술은 효율이 높고 DNA 이중 가닥 절단에 의존하지 않으면서도 기증자 DNA가 필요하지 않아, 개발 이래 동식물 등 다양한 유기체에 성공적으로 응용되었다. 식물 염기 편집 시스템에 성공적으로 응용된 사이티딘 데아미나제로는 APOBEC1, APOBEC3, AID 등이 있으며, 아데노신 데아미나제로는 TadA7.10이 있다.
아데노신 데아미나제를 기반으로 하는 아데닌 염기 편집 기술은 주로 절개 효소 Cas9n(D10A)과 아데노신 데아미나제를 결합하여 융합 단백질을 구성하고, sgRNA의 유도 하에 염기 편집 활성 창 내에 위치한 표적 염기 A를 탈아미노화하여 하이포크산틴 I을 형성한 후, DNA 복구 및 복제 후 점차 G로 치환하여 최종적으로 A에서 G로의 방향성 치환(A>G)을 형성하는 기술이다. 그러나 현재 식물 아데닌 염기 편집 기술은 주로 아데노신 데아미나제 TadA7.10(Yan, et al. Molecular Plant, 2018, 11:631-634) 및 TadA8e(Li, et al. Molecular Plant, 2021, 14:352-360)를 사용하고 있어 편집 효율이 낮고 다양한 Cas 단백질과의 호환성이 좋지 않으며, 염기 편집 활성 창 내에 존재하는 표적 부위조차도 여전히 효과적인 염기 편집 이벤트를 달성하지 못한다.
본 발명이 해결하고자 하는 기술 문제는 식물 아데닌 염기 편집의 효율성을 향상시키는 방법, 및/또는 현재 기술로 완성할 수 없는 원하는 아데닌 염기 편집을 구현하는 방법이다.
상기 기술 문제를 해결하기 위하여, 본 발명은 아데노신 데아미나제를 제공한다.
본 발명에서 제공하는 TadA9라는 명칭의 아데노신 데아미나제는 비천연 단백질로, 대장균 tRNA 아데노신 데아미나제 TadA의 돌연변이체인 TadA7.10에 인공 돌연변이를 일으켜 얻은 고활성 아데노신 데아미나제이다. 아데노신 데아미나제는 아미노산 서열이 서열 목록 중 서열 2(SEQ ID No.2)의 위치 1-167인 단백질(즉, 서열 목록 중 서열 1의 위치 7-507인 뉴클레오티드(CDS)에 의해 암호화된 단백질)이다. 상기 기술 문제를 해결하기 위하여, 본 발명은 또한 상기 TadA9와 관련된 생체물질을 제공한다.
본 발명에서 제공하는 상기 TadA9 관련 생체물질은 다음 B1) 내지 B7) 중 적어도 하나일 수 있다.
B1) 상기 단백질을 암호화하는 핵산 분자;
B2) B1)에 따른 핵산 분자를 포함하는 발현 카세트;
B3) B1)에 따른 핵산 분자를 포함하는 재조합 벡터 또는 B2)에 따른 발현 카세트를 포함하는 재조합 벡터;
B4) B1)에 따른 핵산 분자를 포함하는 재조합 미생물, B2)에 따른 발현 카세트를 포함하는 재조합 미생물 또는 B3)에 따른 재조합 벡터를 포함하는 재조합 미생물;
B5) B1)에 따른 핵산 분자를 포함하는 형질전환 식물 세포주, B2)에 따른 발현 카세트를 포함하는 형질전환 식물 세포주 또는 B3)에 따른 재조합 벡터를 포함하는 형질전환 식물 세포주;
B6) B1)에 따른 핵산 분자를 포함하는 형질전환 식물 조직, B2)에 따른 발현 카세트를 포함하는 형질전환 식물 조직 또는 B3)에 따른 재조합 벡터를 포함하는 형질전환 식물 조직;
B7) B1)에 따른 핵산 분자를 포함하는 형질전환 식물 기관, B2)에 따른 발현 카세트를 포함하는 형질전환 식물 기관 또는 B3)에 따른 재조합 벡터를 포함하는 형질전환 식물 기관.
상기 생체물질 중, B1)에 따른 핵산 분자는 다음과 같이 B11) 또는 B12)에 표시된 유전자일 수 있다.
B11) 암호화 가닥의 암호화 서열(CDS)이 서열 1의 위치 7-507에 표시된 cDNA 분자 또는 DNA 분자인 유전자;
B12) B11)에 정의된 뉴클레오티드 서열과 80% 이상의 동일성을 가지며 상기 단백질의 cDNA 분자 또는 DNA 분자를 암호화하는 유전자.
본 발명은 또한 아데닌 염기 편집기를 제공한다.
본 발명에 의해 제공되는 아데닌 염기 편집기는 Cas 단백질 및 아데노신 데아미나제를 함유하는 단백질인 융합 단백질이며, 상기 아데노신 데아미나제는 상기 TadA9이다.
상기 아데닌 염기 편집기에서, 상기 Cas 단백질은 SpCas9(D10A), SpCas9-NG(D10A), ScCas9(D10A) 또는 SpRY(D10A)일 수 있다.
상기 아데닌 염기 편집기에서, 상기 SpCas9(D10A)은 아미노산 서열이 서열 2의 위치 200-1567인 단백질(즉, 서열 목록 중 서열 1의 위치 604-4707 뉴클레오티드(CDS)에 의해 암호화된 단백질)이고, SpCas9-NG(D10A)는 아미노산 서열이 서열 4의 위치 200-1567인 단백질(즉, 서열 목록 중 서열 3의 위치 604-4707 뉴클레오티드(CDS)에 의해 암호화된 단백질)이고, ScCas9(D10A)는 아미노산 서열이 서열 6의 위치 200-1574인 단백질(즉, 서열 목록 중 서열 5의 위치 604-4728 뉴클레오티드(CDS)에 의해 암호화된 단백질)이고, SpRY(D10A)는 아미노산 서열이 서열 8의 위치 200-1567인 단백질(즉, 서열 목록 중 서열 7의 위치 604-4707 뉴클레오티드(CDS)에 의해 암호화된 단백질)이다.
상기 아데닌 염기 편집기에서, 상기 아데닌 염기 편집기는 상기 아데노신 데아미나제, 상기 Cas 단백질 및 핵 국소화 신호(nuclear localization signal, NLS)로 연결된 단백질일 수 있다.
상기 아데닌 염기 편집기에서, 상기 아데닌 염기 편집기는 구체적으로 TadA9-SpCas9(D10A), TadA9-SpCas9-NG(D10A) TadA9-ScCas9(D10A) 또는 TadA9-SpRY(D10A)일 수 있다. 상기 TadA9-SpCas9(D10A)는 아미노산 서열이 서열 2인 단백질(즉, 서열 목록 중 서열 1의 위치 7-4737 뉴클레오티드(CDS)에 의해 암호화된 단백질)이고, 상기 TadA9-SpCas9-NG(D10A)는 아미노산 서열이 서열 4인 단백질(즉, 서열 목록 중 서열 3의 위치 7-4737 뉴클레오티드(CDS)에 의해 암호화된 단백질)이고, 상기 TadA9-ScCas9(D10A)는 아미노산 서열이 서열 6인 단백질(즉, 서열 목록 중 서열 5의 위치 7-4758 뉴클레오티드(CDS)에 의해 암호화된 단백질)이고, 상기 TadA9-SpRY(D10A)는 아미노산 서열이 서열 8인 단백질(즉, 서열 목록 중 서열 7의 위치 7-4737 뉴클레오티드(CDS)에 의해 암호화된 단백질)이다.
상기 아데닌 염기 편집기와 관련된 생체물질 역시 본 발명의 보호 범위에 속한다.
상기 아데닌 염기 편집기와 관련된 생체물질은 구체적으로 다음 D1) 내지 D7) 중 적어도 하나일 수 있다.
D1) 상기 아데닌 염기 편집기를 암호화하는 핵산 분자;
D2) D1)에 따른 핵산 분자를 포함하는 발현 카세트;
D3) D1)에 따른 핵산 분자를 포함하는 재조합 벡터 또는 D2)에 따른 발현 카세트를 포함하는 재조합 벡터;
D4) D1)에 따른 핵산 분자를 포함하는 재조합 미생물, D2)에 따른 발현 카세트를 포함하는 재조합 미생물 또는 D3)에 따른 재조합 벡터를 포함하는 재조합 미생물;
D5) D1)에 따른 핵산 분자를 포함하는 형질전환 식물 세포주, D2)에 따른 발현 카세트를 포함하는 형질전환 식물 세포주 또는 D3)에 따른 재조합 벡터를 포함하는 형질전환 식물 세포주;
D6) D1)에 따른 핵산 분자를 포함하는 형질전환 식물 조직, D2)에 따른 발현 카세트를 포함하는 형질전환 식물 조직 또는 D3)에 따른 재조합 벡터를 포함하는 형질전환 식물 조직;
D7) D1)에 따른 핵산 분자를 포함하는 형질전환 식물 기관, D2)에 따른 발현 카세트를 포함하는 형질전환 식물 기관 또는 D3)에 따른 재조합 벡터를 포함하는 형질전환 식물 기관.
상기 아데닌 염기 편집기와 관련된 생체물질 중, D1)에 따른 핵산 분자는 TadA9-SpCas9(D10A)의 암호화 유전자, TadA9-SpCas9-NG(D10A)의 암호화 유전자, TadA9-ScCas9(D10A)의 암호화 유전자 또는 TadA9-SpRY(D10A)의 암호화 유전자일 수 있다.
상기 TadA9-SpCas9(D10A)의 암호화 유전자는 다음과 같은 유전자 중 어느 하나일 수 있다.
D131) 암호화 가닥의 암호화 서열(CDS)이 서열 1의 위치 7-4737에 표시된 cDNA 분자 또는 DNA 분자인 유전자;
D132) D131)에 정의된 뉴클레오티드 서열과 80% 이상의 동일성을 가지며 상기 TadA9-SpCas9(D10A)의 cDNA 분자 또는 DNA 분자를 암호화하는 유전자.
상기 TadA9-SpCas9-NG(D10A)의 암호화 유전자는 다음과 같은 유전자 중 어느 하나일 수 있다.
D141) 암호화 가닥의 암호화 서열(CDS)이 서열 3의 위치 7-4737에 표시된 cDNA 분자 또는 DNA 분자인 유전자;
D142) D141)에 정의된 뉴클레오티드 서열과 80% 이상의 동일성을 가지며 상기 TadA9-SpCas9(D10A)의 cDNA 분자 또는 DNA 분자를 암호화하는 유전자.
상기 TadA9-ScCas9(D10A)의 암호화 유전자는 다음과 같은 유전자 중 어느 하나일 수 있다.
D111) 암호화 가닥의 암호화 서열(CDS)이 서열 5의 위치 7-4758에 표시된 cDNA 분자 또는 DNA 분자인 유전자;
D112) D111)에 정의된 뉴클레오티드 서열과 80% 이상의 동일성을 가지며 상기 TadA9-ScCas9(D10A)의 cDNA 분자 또는 DNA 분자를 암호화하는 유전자.
상기 TadA9-SpRY(D10A)의 암호화 유전자는 다음과 같은 유전자 중 어느 하나일 수 있다.
D121) 암호화 가닥의 암호화 서열(CDS)이 서열 7의 위치 7-4737에 표시된 cDNA 분자 또는 DNA 분자인 유전자;
D122) D121)에 정의된 뉴클레오티드 서열과 80% 이상의 동일성을 가지며 상기 TadA9-SpRY(D10A)의 cDNA 분자 또는 DNA 분자를 암호화하는 유전자.
위에서, 상기 발현 카세트는 숙주 세포(예: 식물 세포)에서 상기 단백질을 발현할 수 있는 DNA를 의미하며, 상기 DNA는 단백질 유전자의 전사를 시작하는 프로모터뿐만 아니라 상기 단백질 유전자의 전사를 종료하는 터미네이터를 포함할 수 있다. 더 나아가, 상기 발현 카세트는 인핸서 서열을 포함할 수도 있다. 본 발명에 사용할 수 있는 프로모터로는 구성형 프로모터, 조직, 기관 및 발달 특이적 프로모터, 및 유도형 프로모터를 포함하나 이에 한정되지 않는다. 프로모터의 예로는, 옥수수의 Ubiquitin 프로모터, 콜리플라워 모자이크 바이러스의 구성형 프로모터 35S; 토마토의 외상 유도형 프로모터, 류신 아미노펩티다제("LAP", Chao 외(1999) Plant Physiology 120:979-992); 담배의 화학 유도형 프로모터, 질병 경과 관련 단백질 1(PR1)(살리실산 및 BTH(벤조티아디아졸-7-티오카복시산 S-메틸)에 의해 유도됨); 토마토 프로테아제 억제제 II 프로모터(PIN2) 또는 LAP 프로모터(모두 메틸 자스모네이트로 유도 가능); 열 충격 프로모터(미국 특허 5,187,267); 테트라사이클린 유도형 프로모터(미국 특허 5,057,422); 곡물 종자 특이성 프로모터 pF128(CN101063139B(중국 특허 200710099169.7)), 종자 저장 단백질 특이성 프로모터(예: 파세올린, napin, oleosin 및 대두 beta conglycin의 프로모터(Beachy 외(1985) EMBO J. 4:3047-3053)와 같은 종자 특이성 프로모터를 포함하나 이에 한정되지 않는다. 이들 물질은 단독으로 사용하거나 다른 식물 프로모터와 함께 사용할 수 있다. 여기에 인용된 모든 참고 문헌은 전문이 인용된다. 적합한 전사 터미네이터로는, 아그로박테리움 노팔린 신타아제 터미네이터(NOS 터미네이터), 콜리플라워 모자이크 바이러스 CaMV35S 터미네이터, tml 터미네이터, 완두콩 rbcS E9 터미네이터, 노팔린 및 옥토파인 신타아제 터미네이터를 포함하나 이에 한정되지 않는다(예: Odell 외(I985) Nature 313:810; Rosenberg 외(1987) Gene, 56:125, Guerineau 외(1991) Mol. Gen. Genet, 262:141; Prodfoot(1991) Cell, 64:671; Sanfacon 외 Genes Dev., 5:141; Mogen 외(1990) Plant Cell, 2:1261; Munroe 외(1990) Gene, 91:151; Ballad 외(1989) Nucleic Acids Res. 17:7891; Joshi 외(1987) Nucleic Acid Res., 15:9627 참조).
본 발명의 일 실시예에서, 상기 발현 카세트는 Ubip 프로모터(뉴클레오티드 서열은 서열 9), 상기 아데닌 염기 편집기를 암호화하는 핵산 분자 및 NOS 터미네이터(뉴클레오티드 서열은 서열 10)가 연결되어 형성된다.
여기에서 사용된 "동일성"이라는 용어는 핵산 서열 간의 서열 유사성을 나타낸다. 동일성은 육안 또는 컴퓨터 소프트웨어로 평가할 수 있다. 컴퓨터 소프트웨어를 사용하면 2개 이상의 서열 간의 동일성을 백분율(%)로 표시할 수 있으며, 이를 통해 관련 서열 간의 동일성을 평가할 수 있다. 상술한 80% 이상의 동일성은 85%, 90%, 95%, 96%, 97%, 98%, 99% 이상의 동일성일 수 있다.
위에서, 상기 재조합 미생물은 구체적으로 박테리아, 효모, 조류 및 곰팡이일 수 있다.
다음 중 어느 하나의 응용 역시 본 발명의 보호 범위에 속한다.
1) 식물 단일 염기 편집에서의 TadA9의 응용,
2) 식물 단일 염기 편집에서의 TadA9 관련 생체물질의 응용,
3) 식물 단일 염기 편집에서의 상기 아데닌 염기 편집기의 응용.
4) 식물 단일 염기 편집에서의 상기 아데닌 염기 편집기 관련 생체물질의 응용.
상기 기술 문제를 해결하기 위하여, 본 발명은 식물 게놈 상의 A를 G로 부위지정 돌연변이시키는 방법을 제공한다.
본 발명에서 제공하는 식물 게놈 상의 A를 G로 부위지정 돌연변이시키는 방법은, 상기 아데닌 염기 편집기 및 sgRNA를 발현하는 DNA 분자를 수용체 식물에 도입하여 A를 G로 부위지정 돌연변이시킨 표적 식물을 얻는 단계를 포함한다. 상기 sgRNA의 표적 서열은 이고, 상기 N19-20은 19-20개의 N이고, 상기 PAM(protospacer adjacent motif)은 3개의 N이다. 상기 N은 A, G, C 또는 T이다.
상기 아데닌 염기 편집기 및 sgRNA를 발현하는 DNA 분자를 수용체 식물에 도입할 때, PEG 매개 형질전환 방법을 사용하거나 유전자 총 또는 아그로박테리움 감염법 중 하나를 사용하여 상기 유전자 편집 키트를 벼 원형질체 또는 캘러스에 도입할 수 있으며, 이는 당업자가 쉽게 이해할 수 있다. 벼 게놈 DNA는 두 가닥으로 구성되므로 상기 표적 뉴클레오티드 서열은 상보적인 임의의 한 가닥에 위치할 수 있다는 점은 당업자에게 잘 알려져 있다. 예를 들어, 상기 표적 뉴클레오티드 서열이 특정 기능 유전자의 센스 가닥에 위치할 때, 이 기능 유전자의 특정 부위의 A가 부위지정에 의해 G로 돌연변이된 후 돌연변이 중 하나가 해당 기능 단백질 중 예상되는 아미노산을 얻을 수 있는 경우에도 이 시스템을 사용해 구현할 수 있다. 즉, 센스 가닥의 염기 치환을 직접 진행하여 삼중 코돈의 A를 G로 치환함으로써 벼 유전자 기능의 "교정" 돌연변이체를 얻을 수 있다. 또는 상기 표적 뉴클레오티드 서열이 특정 기능 유전자의 안티센스 가닥에 위치할 때, 이 기능 유전자의 특정 부위의 T가 부위지정에 의해 C로 돌연변이된 후 돌연변이 중 하나가 해당 기능 단백질 중 예상되는 아미노산을 얻을 수 있는 경우 이 시스템을 사용해 구현할 수 있다. 즉, 이 안티센스 가닥의 A를 부위지정에 의해 G로 돌연변이시키고 센스 가닥 중 상응하는 상보적 T를 C로 대체하여 센스 가닥의 상기 삼중 코돈 암호화 아미노산을 변경하여, 벼 유전자 기능의 "교정" 돌연변이체를 얻을 수 있다.
위에서, 상기 식물은 쌍떡잎 식물 또는 외떡잎 식물일 수 있다. 상기 외떡잎 식물은 벼일 수 있다. 상기 단일 염기 편집은 아데닌 A를 구아닌 G로 대체할 수 있다.
도 1은 pUbi-rBE의 스펙트럼이다.
도 2는 pENTR4:sgRNA의 스펙트럼이다.
도 3은 pUbi-rBE-sgRNA의 스펙트럼이다.
도 4는 rBE14, rBE46b 및 rBE49b 매개 벼 내인성 유전자 OsTms9의 아데닌 염기 편집 돌연변이 효과를 나타낸 도면이다. 도면에서 ref는 뉴클레오티드 서열 14인 벼 참조 게놈의 상응 서열을 나타내고, WT는 뉴클레오티드 서열 14인 유전자 편집을 하지 않은 벼 자포니카 품종 Kitaake의 상응 서열을 나타내고, T>C는 뉴클레오티드 서열 15인 돌연변이 균주의 상응 서열을 나타낸다.
도 5는 rBE14, rBE46b 및 rBE49b 매개 벼 내인성 유전자 OsWRKY45의 아데닌 염기 편집 돌연변이 효과를 나타낸 도면이다. 도면에서 ref는 뉴클레오티드 서열 16인 벼 참조 게놈의 상응 서열을 나타내고, WT는 뉴클레오티드 서열 16인 유전자 편집을 하지 않은 벼 자포니카 품종 Kitaake의 상응 서열을 나타내고, A>G는 뉴클레오티드 서열 17인 돌연변이 균주의 상응 서열을 나타낸다.
도 6은 rBE23, rBE50 및 rBE53 매개 벼 내인성 유전자 OsDEP2의 아데닌 염기 편집 돌연변이 효과를 나타낸 도면이다. 도면에서 ref는 뉴클레오티드 서열 18인 벼 참조 게놈의 상응 서열을 나타내고, WT는 뉴클레오티드 서열 18인 유전자 편집을 하지 않은 벼 자포니카 품종 Kitaake의 상응 서열을 나타내고, 2A>2G는 뉴클레오티드 서열 19인 돌연변이 균주의 상응 서열을 나타낸다.
도 7은 rBE23, rBE50 및 rBE53 매개 벼 내인성 유전자 OsWRKY45의 아데닌 염기 편집 돌연변이 효과를 나타낸 도면이다. 도면에서 ref는 뉴클레오티드 서열 20인 벼 참조 게놈의 상응 서열을 나타내고, WT는 뉴클레오티드 서열 20인 유전자 편집을 하지 않은 벼 자포니카 품종 Kitaake의 상응 서열을 나타내고, T>C는 뉴클레오티드 서열 21인 돌연변이 균주의 상응 서열을 나타낸다.
도 8은 rBE26, rBE54 및 rBE57 매개 벼 내인성 유전자 OsGS1의 아데닌 염기 편집 돌연변이 효과를 나타낸 도면이다. 도면에서 ref는 뉴클레오티드 서열 22인 벼 참조 게놈의 상응 서열을 나타내고, WT는 뉴클레오티드 서열 22인 유전자 편집을 하지 않은 벼 자포니카 품종 Kitaake의 상응 서열을 나타내고, 3A>3G는 뉴클레오티드 서열 23인 돌연변이 균주의 상응 서열을 나타내고, 4A>4G는 뉴클레오티드 서열 24인 돌연변이 균주의 상응 서열을 나타낸다.
도 9는 rBE54 및 rBE57 매개 벼 내인성 유전자 OsSERK2의 아데닌 염기 편집 돌연변이 효과를 나타낸 도면이다. 도면에서 ref는 뉴클레오티드 서열 25인 벼 참조 게놈의 상응 서열을 나타내고, WT는 뉴클레오티드 서열 25인 유전자 편집을 하지 않은 벼 자포니카 품종 Kitaake의 상응 서열을 나타내고, 2T>2C는 뉴클레오티드 서열 26인 돌연변이 균주의 상응 서열을 나타낸다.
도 10은 rBE62 및 rBE65 매개 벼 내인성 유전자 OsMPK13의 아데닌 염기 편집 돌연변이 효과를 나타낸 도면이다. 도면에서 ref는 뉴클레오티드 서열 27인 벼 참조 게놈의 상응 서열을 나타내고, WT는 뉴클레오티드 서열 27인 유전자 편집을 하지 않은 벼 자포니카 품종 Kitaake의 상응 서열을 나타내고, A>G는 뉴클레오티드 서열 28인 돌연변이 균주의 상응 서열을 나타내고, 2A>2G는 뉴클레오티드 서열 29인 돌연변이 균주의 상응 서열을 나타낸다.
도 11은 rBE62 및 rBE65 매개 벼 내인성 유전자 OsGSK4의 아데닌 염기 편집 돌연변이 효과를 나타낸 도면이다. 도면에서 ref는 뉴클레오티드 서열 30인 벼 참조 게놈의 상응 서열을 나타내고, WT는 뉴클레오티드 서열 30인 유전자 편집을 하지 않은 벼 자포니카 품종 Kitaake의 상응 서열을 나타내고, T>C는 뉴클레오티드 서열 31인 돌연변이 균주의 상응 서열을 나타내고, 2T>2C는 뉴클레오티드 서열 32인 돌연변이 균주의 상응 서열을 나타내고, 4T>4C는 뉴클레오티드 서열 33인 돌연변이 균주의 상응 서열을 나타낸다.
도 12는 rBE62 및 rBE65 매개 벼 내인성 유전자 OsJAR1의 아데닌 염기 편집 돌연변이 효과를 나타낸 도면이다. 도면에서 ref는 뉴클레오티드 서열 34인 벼 참조 게놈의 상응 서열을 나타내고, WT는 뉴클레오티드 서열 34인 유전자 편집을 하지 않은 벼 자포니카 품종 Kitaake의 상응 서열을 나타내고, 2T>2C는 뉴클레오티드 서열 35인 돌연변이 균주의 상응 서열을 나타내고, 3T>3C는 뉴클레오티드 서열 36인 돌연변이 균주의 상응 서열을 나타낸다.
도 13은 각 표적 유전자의 표적 뉴클레오티드 서열 정보를 나타낸다. 도면에서 이중 가닥 DNA 단편 합성에 필요한 올리고뉴클레오티드 가닥의 대문자는 attB1-sgRNA 발현 카세트-attB2의 N19에 해당하고, 소문자 gtgt는 BsaI 부위에 해당하고, 소문자 tgtt는 BtgZI 부위에 해당한다.
도 14는 각 표적 유전자의 측정 프라이머이다.
이하 구체적인 실시방식을 조합하여 본 발명에 대해 보다 상세하게 설명한다. 제공된 실시예는 본 발명을 명확히 설명하기 위한 것일 뿐, 본 발명의 범위를 한정하기 위한 것은 아니다. 이하 제공된 실시예는 당업자가 추가 개선을 하기 위한 지침으로 사용될 수 있으며, 본 발명의 제한을 구성하지 않는다.
이하 실시예에 따른 실험 방법은 특별한 설명이 없는 한 모두 통상적인 방법으로, 본 분야 내의 문헌에 기술된 기술 또는 조건에 따라, 또는 제품 설명서에 따라 진행된다. 이하 실시예에서 사용된 재료, 시약 등은 특별한 설명이 없는 한 상업적 경로를 통해 얻을 수 있다.
다음 실시예의 pUbi-Cas9은 발명자가 있는 실험실에서 저장 및 제공하였다(H.Zhou, B.Liu, D.P.Weeks, M.H.Spalding & B.Yang.Large chromosomal deletions and heritable small genetic changes induced by CRISPR/Cas9 in rice.Nucleic Acids Res.2014, 42(17): 10903-10914). 대중은 발명자가 있는 실험실에서 이 생체물질을 얻을 수 있다. 이 생체물질은 본 발명의 관련 실험을 반복하기 위해 사용될 뿐, 다른 용도로는 사용될 수 없다.
실시예 1: 벼 게놈의 A를 G로 부위지정 돌연변이
본 실시예는 아데노신 데아미나제 TadA7.10(이하, TadA7.10)의 인공 돌연변이체, 즉 아데노신 데아미나제 TadA9(이하, TadA9)를 제공한다. TadA7.10은 서열 12의 위치 598-1095 뉴클레오티드에 의해 암호화된 단백질이다. TadA9의 아미노산 서열은 서열 목록 중 서열 2의 위치 1-167이다. TadA9의 아미노산 서열은 TadA7.10과 비교하여 다음과 같은 돌연변이가 있다.
V81S/A108S/T110R/D118N/H121N/Y146D/F148Y/Q153R/T165I/D166N
본 실시예는 아데닌 염기 편집을 위한 두 가지 대조군 아데노신 데아미나제를 TadA9 대조군으로 제공하며, 각각 WtTadA-TadA7.10(서열 12의 위치 1-1095 뉴클레오티드에 의해 암호화된 단백질) 및 TadA-R(서열 13의 위치 1-501 뉴클레오티드에 의해 암호화된 단백질)이다. wtTadA-TadA7.10은 식물에 일반적으로 사용되는 기존의 아데노신 데아미나제 다이머이다. TadA-R의 아미노산 서열은 TadA9와 비교하여 2개의 돌연변이, 즉 V81S 및 Q153R이 적고, TadA7.10과 비교하여 돌연변이 A108S/T110R/D118N/H121N/Y146D/F148Y/T165I/D166N이 있다.
본 실시예는 TadA9를 포함하는 4개의 벼 아데닌 염기 편집기 발현 벡터 pUbi-rBE(도 1)를 제공하며, 각각 pUbi-rBE49b, pUbi-rBE53, pUbi-rBE57 및 pUbi-rBE65로 명명된다. pUbi-rBE49b로 발현된 아데닌 염기 편집기는 rBE49b로 명명된 융합 단백질(TadA9-SpCas9(D10A)라고도 함)로, TadA9로 명명된 아데노신 데아미나제, SpCas9(D10A)로 명명된 Cas 단백질 및 NLS로 명명된 핵 국소화 신호로 연결된 단백질이다. rBE49b의 아미노산 서열은 서열 2이다. 서열 2에서 위치 1-167은 TadA9의 아미노산 서열이고, 위치 168-199는 링커 펩타이드의 아미노산 서열이고, 위치 200-1567은 SpCas9(D10A)의 아미노산 서열이고, 위치 1568-1576은 NLS의 아미노산 서열이다. 벼 코돈 사용 선호도 및 이종 단백질 발현 코돈 최적화 전략에 따라 키메라 유전자 rBE49b 유전자의 뉴클레오티드 서열을 코돈 최적화하고, Sangon Biotech(Shanghai)사에 의뢰하여 4743bp의 rBE49b 유전자 인공합성을 완료하였다. pUbi-Cas9의 다른 뉴클레오티드는 변경하지 않고 유지한 채, pUbi-Cas9의 BamHI 및 BcuI 인식 부위 사이의 작은 단편(Cas9)을 서열 1의 위치 7-4737에 표시된 rBE49b 유전자로 대체하여 rBE49b 유전자 발현 벡터 pUbi-rBE49b를 얻었다. 서열 1에서, 위치 1-6은 BamHI 인식 부위이고, 위치 7-507은 TadA9의 CDS이고, 위치 508-603은 링커 펩타이드의 CDS이고, 위치 604-4707은 SpCas9(D10A)의 CDS이고, 위치 4708-4734는 NLS의 CDS이고, 위치 4735-4737은 정지 코돈 TGA이고, 위치 4738-4743은 BcuI 인식 부위이다. pUbi-rBE49b는 LR 반응을 위한 요소 attR1-ccdB-attR2를 포함한다.
pUbi-rBE53로 발현된 아데닌 염기 편집기는 rBE53로 명명된 융합 단백질(TadA9-SpCas9-NG(D10A)라고도 함)로, TadA9로 명명된 아데노신 데아미나제, SpCas9-NG로 명명된 Cas 단백질 및 NLS로 명명된 핵 국소화 신호로 연결된 단백질이다. rBE50의 아미노산 서열은 서열 목록 중 서열 4이다. 서열 4에서 위치 1-167은 TadA9의 아미노산 서열이고, 위치 168-199는 링커 펩타이드의 아미노산 서열이고, 위치 200-1567은 SpCas9-NG(D10A)의 아미노산 서열이고, 위치 1568-1576은 NLS의 아미노산 서열이다. 벼 코돈 사용 선호도에 따라 키메라 유전자 rBE53 유전자의 뉴클레오티드 서열을 코돈 최적화하고, Sangon Biotech(Shanghai)사에 의뢰하여 4743bp의 rBE53 유전자 인공합성을 완료하였다. pUbi-Cas9의 다른 뉴클레오티드는 변경하지 않고 유지한 채, pUbi-Cas9의 BamHI 및 BcuI 인식 부위 사이의 작은 단편(Cas9)을 서열 3의 위치 7-4737에 표시된 rBE53 유전자로 대체하여 rBE53 유전자 발현 벡터 pUbi-rBE53를 얻었다. 서열 3에서, 위치 1-6은 BamHI 인식 부위이고, 위치 7-507은 TadA9의 CDS이고, 위치 508-603은 링커 펩타이드의 CDS이고, 위치 604-4707은 SpCas9-NG(D10A)의 CDS이고, 위치 4708-4734는 NLS의 CDS이고, 위치 4735-4737은 정지 코돈 TGA이고, 위치 4738-4743은 BcuI 인식 부위이다. pUbi-rBE50는 LR 반응을 위한 요소 attR1-ccdB-attR2를 포함한다.
pUbi-rBE57로 발현된 아데닌 염기 편집기는 rBE57로 명명된 융합 단백질(TadA9-ScCas9(D10A)라고도 함)로, TadA9로 명명된 아데노신 데아미나제, ScCas9(D10A)로 명명된 Cas 단백질 및 NLS로 명명된 핵 국소화 신호로 연결된 단백질이다. rBE57의 아미노산 서열은 서열 목록 중 서열 6이다. 서열 6에서 위치 1-167은 TadA9의 아미노산 서열이고, 위치 168-199는 링커 펩타이드의 아미노산 서열이고, 위치 200-1574은 ScCas9(D10A)의 아미노산 서열이고, 위치 1575-1583은 NLS의 아미노산 서열이다. 벼 코돈 사용 선호도에 따라 키메라 유전자 rBE57 유전자의 뉴클레오티드 서열을 코돈 최적화하고, Sangon Biotech(Shanghai)사에 의뢰하여 4764bp의 rBE57 유전자 인공합성을 완료하였다. pUbi-Cas9의 다른 뉴클레오티드는 변경하지 않고 유지한 채, pUbi-Cas9의 BamHI 및 BcuI 인식 부위 사이의 작은 단편(Cas9)을 서열 5의 위치 7-4758에 표시된 rBE57 유전자로 대체하여 rBE57 유전자 발현 벡터 rBE57를 얻었다. 서열 5에서, 위치 1-6은 BamHI 인식 부위이고, 위치 7-507은 TadA9의 CDS이고, 위치 508-603은 링커 펩타이드의 CDS이고, 위치 604-4728은 ScCas9(D10A)의 CDS이고, 위치 4729-4755는 NLS의 CDS이고, 위치 4756-4758은 정지 코돈 TGA이고, 위치 4759-4764는 BcuI 인식 부위이다. pUbi-rBE57은 LR 반응을 위한 요소 attR1-ccdB-attR2를 포함한다.
pUbi-rBE65로 발현된 아데닌 염기 편집기는 rBE65로 명명된 융합 단백질(TadA9-SpRY(D10A)라고도 함)로, TadA9로 명명된 아데노신 데아미나제, SpRY(D10A)로 명명된 Cas 단백질 및 NLS로 명명된 핵 국소화 신호로 연결된 단백질이다. rBE65의 아미노산 서열은 서열 목록 중 서열 8이다. 서열 8에서 위치 1-167은 TadA9의 아미노산 서열이고, 위치 168-199는 링커 펩타이드의 아미노산 서열이고, 위치 200-1567은 SpRY(D10A)의 아미노산 서열이고, 위치 1568-1576은 NLS의 아미노산 서열이다. 벼 코돈 사용 선호도에 따라 키메라 유전자 rBE65 유전자의 뉴클레오티드 서열을 코돈 최적화하고, Sangon Biotech(Shanghai)사에 의뢰하여 4743bp의 rBE65 유전자 인공합성을 완료하였다. pUbi-Cas9의 다른 뉴클레오티드는 변경하지 않고 유지한 채, pUbi-Cas9의 BamHI 및 BcuI 인식 부위 사이의 작은 단편(Cas9)을 서열 7의 위치 7-4737에 표시된 rBE65 유전자로 대체하여 rBE65 유전자 발현 벡터 pUbi-rBE65를 얻었다. 서열 7에서, 위치 1-6은 BamHI 인식 부위이고, 위치 7-507은 TadA9의 CDS이고, 위치 508-603은 링커 펩타이드의 CDS이고, 위치 604-4707은 SPRY(D10A)의 CDS이고, 위치 4708-4734는 NLS의 CDS이고, 위치 4735-4737은 정지 코돈 TGA이고, 위치 4738-4743은 BcuI 인식 부위이다. pUbi-rBE65는 LR 반응을 위한 요소 attR1-ccdB-attR2를 포함한다.
pUbi-rBE49b, pUbi-rBE53, pUbi-rBE57 및 pUbi-rBE65는 아데닌 염기 편집기 rBE의 코딩 유전자만 서로 다르다. rBE49b, rBE53, rBE57 및 rBE65의 4가지 아데닌 염기 편집기는 Cas 단백질만 서로 다르다.
벡터 pUbi-rBE49b, pUbi-rBE53, pUbi-rBE57 및 pUbi-rBE65의 주요 구성 요소는 다음과 같다. RB T-DNA repeat 서열(뉴클레오티드 서열은 genbank 등록번호 LC506530.1의 위치 13973 내지 13997, 2020년 3월 20일), attR1(뉴클레오티드 서열은 genbank 등록번호 KR233518.1의 위치 2055 내지 2179, 2015년 8월 8일), ccdB 발현 카세트(뉴클레오티드 서열은 genbank 등록번호 KR233518.1의 위치 3289 내지 3594, 2015년 8월 8일), attR2(뉴클레오티드 서열은 genbank 등록번호 KR233518.1의 위치 3635 내지 3759, 2015년 8월 8일), Ubip 프로모터(뉴클레오티드 서열은 서열 9), 벼 아데닌 염기 편집기 rBE 유전자(rBE49b 유전자(뉴클레오티드 서열 1의 위치 7-4737), rBE53 유전자(뉴클레오티드 서열 3의 위치 7-4737), rBE57 유전자(뉴클레오티드 서열 5의 위치 7-4758) 또는 rBE65 유전자(뉴클레오티드 서열 7의 위치 7-4737), NOS 터미네이터(뉴클레오티드 서열은 서열 10), CaMV35S 프로모터(뉴클레오티드 서열은 genbank 등록번호 FJ362600.1의 위치 10414 내지 11092, 2008년 11월 26일),하이그로마이신 유전자(뉴클레오티드 서열은 genbank 등록번호 KY420085.1의 위치 511 내지 1536, 2017년 7월 10일), CaMV poly(A) 터미네이터(뉴클레오티드 서열은 genbank 등록번호 MK896900.1의 위치 8618~8792, 2019년 9월 4일), LB T-DNA repeat(뉴클레오티드 서열은 genbank 등록번호 LC506530.1, 위치 3635 내지 3795, 2020년 3월 20일).
본 실시예는 또한 7종의 벼 아데닌 염기 편집기 발현 벡터를 대조 벡터로 제공한다. 본 발명의 pUbi-rBE49b의 대조 벡터 명칭은 pUbi-rBE14 및 pUbi-rBE46b이고, 본 발명의 pUbi-rBE53의 대조 벡터 명칭은 pUbi-rBE23 및 pUbi-rBE50이고, 본 발명의 pUbi-rBE57의 대조 벡터 명칭은 pUbi-rBE26 및 pUbi-rBE54이고, 본 발명의 pUbi-rBE65의 대조 벡터 명칭은 pUbi-rBE62이다.
pUbi-rBE14로 발현된 아데닌 염기 편집기는 rBE14로 명명된 융합 단백질(wtTadA-TadA 7.10-SpCas9(D10A)-NLS라고도 함)로, wtTadA로 명명된 야생형 아데노신 데아미나제, TadA7.10으로 명명된 돌연변이 아데노신 데아미나제, SpCas9(D10A)로 명명된 Cas 단백질 및 NLS로 명명된 핵 국소화 신호로 연결된 단백질이다. rBE14와 rBE49b가 아미노산 서열상에서 다른 점은, rBE49b 중 TadA9로 명명된 아데노신 데아미나제가 wtTadA로 명명된 야생형 아데노신 데아미나제 및 TadA7.10으로 명명된 돌연변이형 아데노신 데아미나제로 연결된 단백질 wtTadA-TadA7.10으로 대체되었다는 점뿐이며, 다른 아미노산은 완전히 동일하다. rBE14 유전자는 rBE49b 유전자(뉴클레오티드 서열은 서열 1의 위치 7-4737) 중 TadA9의 CDS(뉴클레오티드 서열은 서열 1의 위치 7-507)를 서열 12에 표시된 wtTadA-TadA7.10 유전자로 대체하면서 서열 1의 다른 뉴클레오티드는 변경하지 않고 얻은 DNA 분자이다. 서열 12는 단백질 wtTadA-TadA7.10의 암호화 유전자로, CDS는 서열 12이며, 서열 12 중 위치 1-501은 wtTadA의 CDS이고, 위치 502-597은 링커 펩타이드의 CDS이고, 위치 598-1095는 TadA7.10의 CDS이다. pUbi-rBE14는 pUbi-rBE49b의 다른 뉴클레오티드를 변경하지 않고 유지한 채, pUbi-rBE49b의 rBE49b 유전자를 rBE14 유전자로 대체하여 얻은 rBE14 유전자 발현 벡터이다.
pUbi-rBE46b로 발현된 아데닌 염기 편집기는 rBE46b로 명명된 융합 단백질(TadA-R-SpCas9(D10A)-NLS라고도 함)로, TadA-R로 명명된 돌연변이형 아데노신 데아미나제, SpCas9(D10A)로 명명된 Cas 단백질 및 NLS로 명명된 핵 국소화 신호로 연결된 단백질이다. rBE46b와 rBE49b가 아미노산 서열상에서 다른 점은, rBE49b 중 TadA9로 명명된 아데노신 데아미나제가 TadA-R로 명명된 돌연변이형 아데노신 데아미나제로 대체되었다는 점뿐이며, 다른 아미노산은 완전히 동일하다. rBE46b 유전자는 rBE49b 유전자(뉴클레오티드 서열은 서열 1의 위치 7-4737) 중 TadA9의 CDS(뉴클레오티드 서열은 서열 1의 위치 7-507)를 서열 13에 표시된 TadA-R 유전자 서열로 대체하면서 서열 1의 다른 뉴클레오티드는 변경하지 않고 얻은 DNA 분자이다. pUbi-rBE46b는 pUbi-rBE49b의 다른 뉴클레오티드를 변경하지 않고 유지한 채, pUbi-rBE49b의 rBE49b 유전자를 rBE46b 유전자로 대체하여 얻은 rBE46b 유전자 발현 벡터이다.
pUbi-rBE23로 발현된 아데닌 염기 편집기는 rBE23로 명명된 융합 단백질(wtTadA-Tada7.10-SpCas9-NG(D10A)-NLS라고도 함)로, wtTadA로 명명된 야생형 아데닌 데아미나제, TadA7.10으로 명명된 돌연변이 아데닌 데아미나제, SpCas9-NG(D10A)로 명명된 Cas 단백질 및 NLS로 명명된 핵 국소화 신호로 연결된 단백질이다. rBE23와 rBE53가 아미노산 서열상에서 다른 점은, rBE53 중 TadA9로 명명된 아데닌 데아미나제가 wtTadA로 명명된 야생형 아데닌 데아미나제 및 TadA7.10으로 명명된 돌연변이형 아데닌 데아미나제로 연결된 단백질 wtTadA-TadA7.10으로 대체되었다는 점뿐이며, 다른 아미노산은 완전히 동일하다. rBE23 유전자는 rBE53 유전자(뉴클레오티드 서열은 서열 3의 위치 7-4737) 중 TadA9의 CDS(뉴클레오티드 서열은 서열 3의 위치 7-507)를 서열 12에 표시된 wtTadA-TadA7.10 유전자로 대체하면서 서열 3의 다른 뉴클레오티드는 변경하지 않고 얻은 DNA 분자이다. pUbi-rBE23는 pUbi-rBE53의 다른 뉴클레오티드를 변경하지 않고 유지한 채, pUbi-rBE53의 rBE53 유전자를 rBE23 유전자로 대체하여 얻은 rBE23 유전자 발현 벡터이다.
pUbi-rBE50으로 발현된 아데닌 염기 편집기는 rBE50으로 명명된 융합 단백질(wtTadA-TadA7.10-SpCas9-NG(D10A)-NLS라고도 함)로, TadA-R로 명명된 돌연변이형 아데노신 데아미나제, SpCas9-NG(D10A)로 명명된 Cas 단백질 및 NLS로 명명된 핵 국소화 신호로 연결된 단백질이다. rBE50과 rBE53이 아미노산 서열상에서 다른 점은, rBE53 중 TadA9로 명명된 아데노신 데아미나제가 TadA-R로 명명된 돌연변이형 아데노신 데아미나제로 대체되었다는 점뿐이며, 다른 아미노산은 완전히 동일하다. rBE50 유전자는 rBE53 유전자(뉴클레오티드 서열은 서열 3의 위치 7-4737) 중 TadA9의 CDS(뉴클레오티드 서열은 서열 1의 위치 7-507)를 서열 13에 표시된 TadA-R 유전자로 대체하면서 서열 3의 다른 뉴클레오티드는 변경하지 않고 얻은 DNA 분자이다. pUbi-rBE50은 pUbi-rBE53의 다른 뉴클레오티드를 변경하지 않고 유지한 채, pUbi-rBE53의 rBE53 유전자를 rBE50 유전자로 대체하여 얻은 rBE50 유전자 발현 벡터이다.
pUbi-rBE26으로 발현된 아데닌 염기 편집기는 rBE26으로 명명된 융합 단백질(wtTadA-Tada7.10-ScCas9(D10A)-NLS라고도 함)로, wtTadA로 명명된 야생형 아데닌 데아미나제, TadA7.10으로 명명된 돌연변이 아데닌 데아미나제, ScCas9(D10A)로 명명된 Cas 단백질 및 NLS로 명명된 핵 국소화 신호로 연결된 단백질이다. rBE26과 rBE57이 아미노산 서열상에서 다른 점은, rBE57 중 TadA9로 명명된 아데닌 데아미나제가 wtTadA로 명명된 야생형 아데닌 데아미나제 및 TadA7.10으로 명명된 돌연변이형 아데닌 데아미나제로 연결된 단백질 wtTadA-TadA7.10으로 대체되었다는 점뿐이며, 다른 아미노산은 완전히 동일하다. rBE26 유전자는 rBE57 유전자(뉴클레오티드 서열은 서열 5의 위치 7-4758) 중 TadA9의 CDS(뉴클레오티드 서열은 서열 5의 위치 7-507)를 서열 12에 표시된 wtTadA-TadA7.10 유전자로 대체하면서 서열 5의 다른 뉴클레오티드는 변경하지 않고 얻은 DNA 분자이다. pUbi-rBE26은 pUbi-rBE57의 다른 뉴클레오티드를 변경하지 않고 유지한 채, pUbi-rBE57의 rBE57 유전자를 rBE26 유전자로 대체하여 얻은 rBE26 유전자 발현 벡터이다.
pUbi-rBE54로 발현된 아데닌 염기 편집기는 rBE54로 명명된 융합 단백질(TadA-R- ScCas9(D10A)-NLS)라고도 함)로, TadA-R로 명명된 돌연변이형 아데노신 데아미나제, ScCas9(D10A)로 명명된 Cas 단백질 및 NLS로 명명된 핵 국소화 신호로 연결된 단백질이다. rBE54와 rBE57이 아미노산 서열상에서 다른 점은, rBE57 중 TadA9로 명명된 아데노신 데아미나제가 TadA-R로 명명된 돌연변이형 아데노신 데아미나제로 대체되었다는 점뿐이며, 다른 아미노산은 완전히 동일하다. rBE54 유전자는 rBE57 유전자(뉴클레오티드 서열은 서열 5의 위치 7-4758) 중 TadA9의 CDS(뉴클레오티드 서열은 서열 5의 위치 7-507)를 서열 13에 표시된 TadA-R 유전자 서열로 대체하면서 서열 5의 다른 뉴클레오티드는 변경하지 않고 얻은 DNA 분자이다. pUbi-rBE54는 pUbi-rBE57의 다른 뉴클레오티드를 변경하지 않고 유지한 채, pUbi-rBE57의 rBE57 유전자를 rBE54 유전자로 대체하여 얻은 rBE54 유전자 발현 벡터이다.
pUbi-rBE62로 발현된 아데닌 염기 편집기는 rBE62로 명명된 융합 단백질(TadA-R-SpRY(D10A)-NLS라고도 함)로, TadA-R로 명명된 돌연변이형 아데노신 데아미나제, SpRY(D10A)로 명명된 Cas 단백질 및 NLS로 명명된 핵 국소화 신호로 연결된 단백질이다. rBE62와 rBE65가 아미노산 서열상에서 다른 점은, rBE65 중 TadA9로 명명된 아데노신 데아미나제가 TadA-R로 명명된 돌연변이형 아데노신 데아미나제로 대체되었다는 점뿐이며, 다른 아미노산은 완전히 동일하다. rBE62 유전자는 rBE65 유전자(뉴클레오티드 서열은 서열 7의 위치 7-4737) 중 TadA9의 CDS(뉴클레오티드 서열은 서열 7의 위치 7-507)를 서열 13에 표시된 TadA-R 유전자 서열로 대체하면서 서열 7의 다른 뉴클레오티드는 변경하지 않고 얻은 DNA 분자이다. pUbi-rBE62는 pUbi-rBE65의 다른 뉴클레오티드를 변경하지 않고 유지한 채, pUbi-rBE65의 rBE65 유전자를 rBE62 유전자로 대체하여 얻은 rBE62 유전자 발현 벡터이다.
실시예 2. 벼 아데닌 염기 편집기 발현 벡터를 이용한 벼 내인성 유전자의 표적 염기 A>G 대체
1. 표적 서열에 대한 유전자 편집 벡터 pUbi-rBE-sgRNA 구축
선택된 표적 유전자(도 13 참조)의 게놈 DNA 서열은 벼 게놈 데이터베이스(https://rapdb.dna.affrc.go.jp/)에서 얻었으며, 각 염기 편집기의 PAM 식별 요구에 대응하여 상응하는 표적 서열, 및 정방향 및 역방향 올리고뉴클레오티드 가닥을 설계하였다. 도 13의 각 표적 서열()의 정방향 및 역방향 올리고뉴클레오티드 가닥(구체적인 서열은 도 13 참조)을 Sangon Biotech(Shanghai)사에 인공합성하도록 의뢰한 후, T4 폴리뉴클레오티드 키나제를 사용하여 프라이머를 인산화하고, 어닐링하여 이중 가닥 DNA 단편(sgRNA를 포함하는 표적 서열 )을 형성하였다. 이중 가닥 DNA 단편을 각각 pENTR4:sgRNA(도 2, attL1-sgRNA 발현 카세트-attL2) 벡터의 2개의 BtgZI 또는 2개의 BsaI 절단 부위에 클로닝하고, 프라이머 U6p-F1((서열 37))을 시퀀싱하여 삽입 단편이 완전히 올바른지 확인한 후(삽입 단편은 sgRNA의 표적 서열 중 을 포함함), 얻은 플라스미드를 AatII 효소로 분해하여 선형화하고, Gateway의 LR 반응을 통해 sgRNA 발현 카세트(sgRNA를 포함하는 코딩 DNA)를 각각 벼 아데닌 염기 편집기 발현 벡터 pUbi-rBE(도 1)의 attR1-ccdB-attR2에 클로닝하여, 각 표적 서열의 유전자 편집 벡터 pUbi-rBE-sgRNA(도 3)를 얻었다. pUbi-rBE-sgRNA는 pUbi-rBE의 다른 뉴클레오티드는 변경하지 않고 유지한 채, pUbi-rBE의 요소 attR1-ccdB-attR2를 attB1-sgRNA 발현 카세트-attB2로 대체하여 얻은 재조합 발현 벡터이다. OsTms9 유전자를 표적으로 하는 3가지 염기 편집 벡터는 각각 pUbi-rBE49b-sgRNA-OsTms9, pUbi-rBE14-sgRNA-OsTms9 및 pUbi-rBE46b-sgRNA-OsTms9이다. OsWRKY45 유전자를 표적으로 하는 표적 서열 1(서열 76, NGG PAM 포함)의 3가지 염기 편집 벡터는 각각 pUbi-rBE49b-sgRNA-OsWRKY45, pUbi-rBE14-sgRNA-OsWRKY45 및 pUbi-rBE46b-sgRNA-OsWRKY45이다. OsDEP2 유전자를 표적으로 하는 3가지 염기 편집 벡터는 각각 pUbi-rBE53-sgRNA-OsDEP2, pUbi-rBE23-sgRNA-OsDEP2 및 pUbi-rBE50-sgRNA-OsDEP2이다. OsWRKY45 유전자를 표적으로 하는 표적 서열 2(서열 79, NGT PAM 포함)의 3가지 염기 편집 벡터는 각각 pUbi-rBE53-sgRNA-OsWRKY45, pUbi-rBE23-sgRNA-OsWRKY45 및 pUbi-rBE50-sgRNA-OsWRKY45이다. OsGS1 유전자를 표적으로 하는 3가지 염기 편집 벡터는 각각 pUbi-rBE57-sgRNA-OsGS1, pUbi-rBE54-sgRNA-OsGS1 및 pUbi-rBE26-sgRNA-OsGS1이다. OsSERK2 유전자를 표적으로 하는 2가지 염기 편집 벡터는 pUbi-rBE57-sgRNA-OsSERK2 및 pUbi-rBE54-sgRNA-OsSERK2이다. OsMPK13 유전자를 표적으로 하는 2가지 염기 편집 벡터는 pUbi-rBE65-sgRNA-OsMPK13 및 pUbi-rBE62-sgRNA-OsMPK13이다. OsGSK4 유전자를 표적으로 하는 2가지 염기 편집 벡터는 pUbi-rBE65-sgRNA-OsGSK4 및 pUbi-rBE62-sgRNA-OsGSK4이다. OsJAR1 유전자를 표적으로 하는 2가지 염기 편집 벡터는 pUbi-rBE65-sgRNA-OsJAR1 및 pUbi-rBE62-sgRNA-OsJAR1이다.
여기에서, pENTR4:sgRNA의 구축 방법은 다음과 같다.
말단에서 말단 방향으로 순서대로 연결된 U6 프로모터 서열 1, 2개의 BtgZI 절단 부위를 포함하는 뉴클레오티드 서열, sgRNA Scaffold 서열, (T)8 터미네이터 서열, U6 프로모터 서열 2, 2개의 BsaI 절단 부위를 포함하는 뉴클레오티드 서열, sgRNA Scaffold 서열, (T)8 터미네이터 서열을 sgRNA 발현 카세트와 조합하고, Sangon Biotech(Shanghai)사에 인공합성을 의뢰하였다. 이 회사에서 합성한 유전자를 템플릿으로 하여, 프라이머 쌍((서열 38) 및 (서열 39))을 증폭하여 1kb의 sgRNA 발현 카세트 단편(뉴클레오티드 서열은 서열 목록 중 서열 11)을 얻고, pENTR4(Invitrogen) 벡터를 템플릿으로 하여 (서열 40) 및 (서열 41)을 사용하여 2.2kb pENTR4 벡터 프레임워크(pENTR4의 ccdB 유전자 발현 카세트 단편을 제거하여 얻은 DNA 단편)을 증폭하고, 키트 ClonExpress II One Step Cloning Kit(Nanjing Vazyme Biotech 주식회사에서 구입)의 도움으로 sgRNA 발현 키트 단편과 pENTR4 벡터 프레임워크를 infusion연결하여 벡터 pENTR4:sgRNA를 얻었다(도 2). 이들 중 2개의 BtgZI 또는 2개의 BsaI 절단 부위를 클론 중 특정 유전자의 인식 서열(sgRNA의 표적 서열에서 )에 사용하였다. 서열 11에서, 위치 27-348은 U6 프로모터 서열 1이고, 위치 349-389는 2개의 BtgZI 부위를 포함하는 뉴클레오티드 단편이고, 위치 390-465는 sgRNA Scaffold 서열이고, 위치 466-473은 (T)8 터미네이터 서열이고, 위치 474-782는 U6 프로모터 서열이고, 위치 783-806은 2개의 BsaI 부위를 포함하는 뉴클레오티드 단편이고, 위치 807-882는 sgRNA Scaffold 서열이고, 위치 883-890은 (T)8 터미네이터 서열이다.
2. 아그로박테리움이 매개하는 벼의 안정적인 유전적 형질전환
얻은 각 표적 유전자 염기 편집 벡터를 전기충격법을 통해 아그로박테리움 EHA105로 형질전환하고(EHA105 전기충격 감응 세포는 Beijing Biomed Gene Technology 주식회사에서 구입), Hiei 등(Hiei Y., Ohta S., Komari T., and Kumashiro T. (1994). Efficient transformation of rice (Oryzasativa L.) mediated by Agrobacterium and sequence analysis of the boundaries of the T-DNA. Plant J. 6:271-282.)이 공개한 방법을 참고하여 벼 아그로박테리움 매개의 유전적 형질전환을 진행하여, 각 표적 유전자 염기 편집 벼 재료의 TO세대를 얻었다.
3. T0세대 형질전환 벼 표적 유전자 부위의 염기 편집 효율 측정
기존 CTAB 방법을 사용하여 T0세대 형질전환 벼 재료의 게놈 DNA를 추출하였다.
각 표적 유전자의 표적 서열 정보 및 측정 프라이머는 도 14와 같으며, 모든 프라이머는 Sangon Biotech(Shanghai)사에 인공합성을 의뢰하였다. 측정 시 관련된 PCR 반응은 모두 고충실도 PCR 마스터 믹스 I-5™2×High-Fidelity Master Mix(클로닝(베이징) 바이오테크놀로지 주식회사에서 구입)를 이용하여 표적 단편을 PCR 증폭하였으며, PCR 생성물은 직접 Sangon Biotech(Shanghai)사에 Sanger 시퀀싱을 의뢰하였다. 시퀀싱 결과는 다음과 같았다.
염기 편집기 rBE14는 OsTms9의 NGG PAM 표적에 대하여 0%의 표적 염기 편집 효율을 보였고, 염기 편집기 rBE46b는 OsTms9의 NGG PAM 표적에 대하여 64.58%의 표적 염기 편집 효율을 보였고, 염기 편집기 rBE49b는 OsTms9의 NGG PAM 표적에 대하여 97.92%의 표적 염기 편집 효율을 보였다(표 1). 측정한 54주 T0세대 형질전환 pUbi-rBE14-sgRNA-OsTms9 벼 중 0주의 아데닌 A가 탈아미노화되어 구아닌 G로 대체되었고, 측정한 48주 T0세대 형질전환 pUbi-rBE46b-sgRNA-OsTms9 벼 중 31주의 아데닌 A가 탈아미노화되어 구아닌 G로 대체되었으며, 모두 표적 서열의 에서 방향의 5번째 위치인 A(도 4의 T5에 해당)가 탈아미노화되어 G로 대체될 수 있었다. 측정한 48주 T0세대 형질전환 pUbi-rBE49b-sgRNA-OsTms9 벼 중 47주의 아데닌 A가 탈아미노화되어 구아닌 G로 대체되었으며, 모두 표적 서열의 에서 방향의 5번째 위치인 A(도 4의 T5에 해당)가 탈아미노화되어 G로 대체될 수 있었다.
염기 편집기 rBE14는 OsWRKY45의 NGG PAM 표적에 대하여 0.00%의 표적 염기 편집 효율을 보였고, 염기 편집기 rBE46b는 OsWRKY45의 NGG PAM 표적에 대하여 0.00%의 표적 염기 편집 효율을 보였고, 염기 편집기 rBE49b는 OsWRKY45의 NGG PAM 표적에 대하여 2.86%의 표적 염기 편집 효율을 보였다(표 1). 측정한 53주 T0세대 형질전환 pUbi-rBE14-sgRNA-OsWRKY45 벼 중 0주의 아데닌 A가 탈아미노화되어 구아닌 G로 대체되었고, 측정한 48주 T0세대 형질전환 pUbi-rBE46b-sgRNA-OsWRKY45 벼 중 0주의 아데닌 A가 탈아미노화되어 구아닌 G로 대체되었고, 측정한 35주 T0세대 형질전환 pUbi-rBE49b-sgRNA-OsWRKY45 벼 중 1주의 아데닌 A가 탈아미노화되어 구아닌 G로 대체되었고, 모두 표적 서열의 에서 방향의 4번째 위치인 A가 탈아미노화되어 G로 대체될 수 있었다(도 5의 A4에 해당).
염기 편집기 rBE23은 OsDEP2의 NGA PAM 표적에 대하여 0.00%의 표적 염기 편집 효율을 보였고, 염기 편집기 rBE50은 OsDEP2의 NGA PAM 표적에 대하여 27.08%의 표적 염기 편집 효율을 보였고, 염기 편집기 rBE53은 OsDEP2의 NGA PAM 표적에 대하여 78.72%의 표적 염기 편집 효율을 보였다(표 2). 측정한 96주 T0세대 형질전환 pUbi-rBE23-sgRNA-OsDEP2 벼 중 0주의 아데닌 A가 탈아미노화되어 구아닌 G로 대체되었고, 측정한 48주 T0세대 형질전환 pUbi-rBE50-sgRNA-OsDEP2 벼 중 13주의 아데닌 A가 탈아미노화되어 구아닌 G로 대체되었으며, 표적 서열의 에서 방향의 4번째 및 6번째 위치인 A가 탈아미노화되어 G로 대체될 수 있었다. 여기에서, 10주의 4번째 위치 아데닌 A(도 6의 A4에 해당)는 탈아미노화되어 G로 대체되었고, 13주의 6번째 위치 아데닌 A(도 6의 A6에 해당)는 탈아미노화되어 G로 대체되었다. 측정한 47주 T0세대 형질전환 pUbi-rBE53-sgRNA-OsDEP2 벼 중 37주의 아데닌 A가 탈아미노화되어 구아닌 G로 대체되었으며, 표적 서열의 에서 방향의 4번째 및 6번째 위치인 A가 탈아미노화되어 G로 대체될 수 있었다. 여기에서, 37주의 4번째 위치 아데닌 A(도 6의 A4에 해당)는 탈아미노화되어 G로 대체되었고, 28주의 6번째 위치 아데닌 A(도 6의 A6에 해당)는 탈아미노화되어 G로 대체되었다.
염기 편집기 rBE23은 OsWRKY45의 NGT PAM 표적에 대하여 0%의 표적 염기 편집 효율을 보였고, 염기 편집기 rBE50은 OsWRKY45의 NGT PAM 표적에 대하여 89.36%의 표적 염기 편집 효율을 보였고, 염기 편집기 rBE53은 OsWRKY45의 NGT PAM 표적에 대하여 93.75%의 표적 염기 편집 효율을 보였다(표 2). 측정한 52주 T0세대 형질전환 pUbi-rBE23-sgRNA-OsWRKY45 벼 중 0주의 아데닌 A가 탈아미노화되어 구아닌 G로 대체되었고, 측정한 47주 T0세대 형질전환 pUbi-rBE50-sgRNA-OsWRKY45 벼 중 42주의 아데닌 A가 탈아미노화되어 구아닌 G로 대체되었고, 모두 표적 서열의 에서 방향의 5번째 위치인 A가 탈아미노화되어 G로 대체될 수 있었다(도 7의 T5에 해당). 측정한 48주 T0세대 형질전환 pUbi-rBE53-sgRNA-OsWRKY45 벼 중 45주의 아데닌 A가 탈아미노화되어 구아닌 G로 대체되었고, 모두 표적 서열의 에서 방향의 5번째 위치인 A가 탈아미노화되어 G로 대체될 수 있었다(도 7의 T5에 해당).
염기 편집기 rBE26은 OsGS1의 NAG PAM 표적에 대하여 0.00%의 표적 염기 편집 효율을 보였고, 염기 편집기 rBE54는 OsGS1의 NAG PAM 표적에 대하여 25.00%의 표적 염기 편집 효율을 보였고, 염기 편집기 rBE57은 OsGS1의 NAG PAM 표적에 대하여 54.17%의 표적 염기 편집 효율을 보였다(표 3). 측정한 36주 T0세대 형질전환 pUbi-rBE26-sgRNA-OsGS1 벼 중 0주의 아데닌 A가 탈아미노화되어 구아닌 G로 대체되었고, 측정한 48주 T0세대 형질전환 pUbi-rBE54-sgRNA-OsGS1 벼 중 12주의 아데닌 A가 탈아미노화되어 구아닌 G로 대체되었으며, 표적 서열의 에서 방향의 3번째, 6번째 및 9번째 위치인 A가 탈아미노화되어 G로 대체될 수 있었다. 여기에서, 3주의 3번째 위치 아데닌 A(도 8의 A3에 해당)는 탈아미노화되어 G로 대체되었고, 11주의 6번째 위치 아데닌 A(도 8의 A6에 해당)는 탈아미노화되어 G로 대체되었으며, 12주의 9번째 위치 아데닌 A(도 8의 A9에 해당)는 탈아미노화되어 G로 대체되었다. 측정한 48주 T0세대 형질전환 pUbi-rBE57-sgRNA-OsGS1 벼 중 26주의 아데닌 A가 탈아미노화되어 구아닌 G로 대체되었으며, 표적 서열의 에서 방향의 3번째, 4번째, 6번째, 9번째 및 11번째 위치인 A가 탈아미노화되어 G로 대체될 수 있었다. 여기에서, 26주의 3번째 위치 아데닌 A(도 8의 A3에 해당)는 탈아미노화되어 G로 대체되었고, 13주의 4번째 위치 아데닌 A(도 8의 A4에 해당)는 탈아미노화되어 G로 대체되었고, 26주의 6번째 위치 아데닌 A(도 8의 A6에 해당)는 탈아미노화되어 G로 대체되었고, 26주의 9번째 위치 아데닌 A(도 8의 A9에 해당)는 탈아미노화되어 G로 대체되었고, 1주의 11번째 위치 아데닌 A(도 8의 A11에 해당)는 탈아미노화되어 G로 대체되었다.
염기 편집기 rBE54는 OsSERK2의 NAG PAM 표적에 대하여 28.26%의 표적 염기 편집 효율을 보였고, 염기 편집기 rBE57은 OsSERK2의 NAG PAM 표적에 대하여 72.34%의 표적 염기 편집 효율을 보였다(표 3). 측정한 46주 T0세대 형질전환 pUbi-rBE54-sgRNA-OsSERK2 벼 중 13주의 아데닌 A가 탈아미노화되어 구아닌 G로 대체되었으며, 표적 서열의 에서 방향의 4번째 및 6번째 위치인 A가 탈아미노화되어 G로 대체될 수 있었다. 여기에서, 3주의 4번째 위치 아데닌 A(도 9의 T4에 해당)는 탈아미노화되어 G로 대체되었고, 13주의 6번째 위치 아데닌 A(도 9의 T6에 해당)는 탈아미노화되어 G로 대체되었다. 측정한 47주 T0세대 형질전환 pUbi-rBE57-sgRNA-OsSERK2 벼 중 34주의 아데닌 A가 탈아미노화되어 구아닌 G로 대체되었으며, 표적 서열의 에서 방향의 4번째 및 6번째 위치인 A가 탈아미노화되어 G로 대체될 수 있었다. 여기에서, 34주의 4번째 위치 아데닌 A(도 9의 T4에 해당)는 탈아미노화되어 G로 대체되었고, 34주의 6번째 위치 아데닌 A(도 9의 T6에 해당)는 탈아미노화되어 G로 대체되었다.
염기 편집기 rBE62는 OsMPK13의 NAA PAM 표적에 대하여 29.17%의 표적 염기 편집 효율을 보였고, 염기 편집기 rBE65는 OsMPK13의 NAA PAM 표적에 대하여 31.91%의 표적 염기 편집 효율을 보였다(표 4). 측정한 48주 T0세대 형질전환 pUbi-rBE62-sgRNA-OsMPK13 벼 중 14주의 아데닌 A가 탈아미노화되어 구아닌 G로 대체되었으며, 모두 표적 서열의 에서 방향의 6번째 위치인 A(도 10의 A6에 해당)가 동시에 탈아미노화되어 G로 대체되었다. 측정한 47주 T0세대 형질전환 pUbi-rBE65-sgRNA-OsMPK13 벼 중 15주의 아데닌 A가 탈아미노화되어 구아닌 G로 대체되었으며, 표적 서열의 에서 방향의 4번째 및 6번째 위치인 A가 탈아미노화되어 G로 대체될 수 있었다. 여기에서, 2주의 4번째 위치 아데닌 A(도 10의 A4에 해당)는 탈아미노화되어 G로 대체되었고, 15주의 6번째 위치 아데닌 A(도 10의 A6에 해당)는 탈아미노화되어 G로 대체되었다.
염기 편집기 rBE26은 OsGSK4의 NAC PAM 표적에 대하여 51.28%의 표적 염기 편집 효율을 보였고, 염기 편집기 rBE65는 OsGSK4의 NAC PAM 표적에 대하여 73.17%의 표적 염기 편집 효율을 보였다(표 4). 측정한 39주 T0세대 형질전환 pUbi-rBE62-sgRNA-OsGSK4 벼 중 20주의 아데닌 A가 탈아미노화되어 구아닌 G로 대체되었으며, 표적 서열의 에서 방향의 4번째 및 11번째 위치인 A가 탈아미노화되어 G로 대체될 수 있었다. 여기에서, 20주의 4번째 위치 아데닌 A(도 11의 T4에 해당)는 탈아미노화되어 G로 대체되었고, 2주의 11번째 위치 아데닌 A(도 11의 T11에 해당)는 탈아미노화되어 G로 대체되었다. 측정한 41주 T0세대 형질전환 pUbi-rBE65-sgRNA-OsGSK4 벼 중 30주의 아데닌 A가 탈아미노화되어 구아닌 G로 대체되었으며, 표적 서열의 에서 방향의 4번째, 8번째, 9번째 및 11번째 위치인 A가 탈아미노화되어 G로 대체될 수 있었다. 여기에서, 30주의 4번째 위치 아데닌 A(도 11의 T4에 해당)는 탈아미노화되어 G로 대체되었고, 1주의 8번째 위치 아데닌 A(도 11의 T8에 해당)는 탈아미노화되어 G로 대체되었고, 1주의 9번째 위치 아데닌 A(도 11의 T9에 해당)는 탈아미노화되어 G로 대체되었고, 9주의 11번째 위치 아데닌 A(도 11의 T11에 해당)는 탈아미노화되어 G로 대체되었다.
염기 편집기 rBE62는 OsJAR1의 NAT PAM 표적에 대하여 36.17%의 표적 염기 편집 효율을 보였고, 염기 편집기 rBE65는 OsJAR1의 NAT PAM 표적에 대하여 45.00%의 표적 염기 편집 효율을 보였다(표 4). 측정한 47주 T0세대 형질전환 pUbi-rBE62-sgRNA-OsJAR1 벼 중 17주의 아데닌 A가 탈아미노화되어 구아닌 G로 대체되었으며, 표적 서열의 에서 방향의 4번째 및 6번째 위치인 A가 탈아미노화되어 G로 대체될 수 있었다. 여기에서, 17주의 4번째 위치 아데닌 A(도 12의 T4에 해당)는 탈아미노화되어 G로 대체되었고, 9주의 6번째 위치 아데닌 A(도 12의 T6에 해당)는 탈아미노화되어 G로 대체되었다. 측정한 40주 T0세대 형질전환 pUbi-rBE65-sgRNA-OsJAR1 벼 중 18주의 아데닌 A가 탈아미노화되어 구아닌 G로 대체되었으며, 표적 서열의 에서 방향의 2번째, 4번째 및 6번째 위치인 A가 탈아미노화되어 G로 대체될 수 있었다. 여기에서, 3주의 2번째 위치 아데닌 A(도 12의 T2에 해당)는 탈아미노화되어 G로 대체되었고, 18주의 4번째 위치 아데닌 A(도 12의 T4에 해당)는 탈아미노화되어 G로 대체되었으며, 18주의 6번째 위치 아데닌 A(도 12의 T6에 해당)는 탈아미노화되어 G로 대체되었다.
기 결과는, 본 발명에서 TadA9와 SpCas9n/ScCas9/SpCas9-NG/SpRY의 융합에 의해 매개되는 아데닌 염기 편집 기술의 편집 효율이 TadA7.10과 같은 TadA-R 돌연변이체에 의해 매개되는 아데닌 염기 편집 기술보다 훨씬 높으며, 편집 활성 창을 확장하여 아데닌 염기 편집 기술의 효율성을 향상시키고 응용 범위를 넓힐 수 있다는 것을 보여준다.
표 1. 아데노신 데아미나제와 SpCas9(D10A)의 융합 벡터의 편집 효율
표 2. 아데노신 데아미나제와 SpCas9-NG(D10A)의 융합 벡터의 편집 효율
표 3. 아데노신 데아미나제와 ScCas9(D10A) 융합 벡터의 편집 효율
참고: "\", 이 부위의 편집 효율은 앞서 많은 데이터에서 TadA7.10을 매개로 한 염기 편집 효율이 TadA-R 및 TadA9에 비해 현저히 낮음을 보여주었으므로 다시 테스트하지 않았음.
표 4. 아데노신 데아미나제와 SpRY(D10A) 융합 벡터의 편집 효율
이상 본 발명에 대하여 상세히 설명하였다. 본 발명의 취지 및 범위를 벗어나지 않고 불필요한 실험을 진행하지 않는 상황에서, 당업자는 동등한 매개변수, 농도 및 조건 하에 넓은 범위에서 본 발명을 실시할 수 있다. 본 발명에서 특정 실시예를 제시하였으나, 본 발명을 보다 개선할 수 있음을 이해해야 한다. 요약하면, 본 발명의 원리에 따라, 본 출원은 본 출원에 개시된 범위를 벗어나 본 분야에 공지된 통상적인 기술을 사용하여 실시한 변경을 포함하여, 본 발명에 대한 변경, 용도 또는 개선을 포함하고자 한다. 이하 첨부된 청구범위의 범위에 따라 몇 가지 기본 특징을 응용할 수 있다.
본 발명은 TadA 단백질의 인공 돌연변이를 통해 고활성 돌연변이 TadA9를 얻고, 이를 이용하여 새로운 CRISPR/Cas 유전자 편집 키트를 개발하였다. 본 발명의 TadA9은 SpCas9(D10A), SpCas9-NG(D10A), ScCas9(D10A) 및 SpRY(D10A)와 융합 후 매개 아데닌 염기 편집 기술의 편집 효율이 TadA7.10 및 TadA-R 돌연변이체 매개 아데닌 염기 편집 기술에 비해 현저히 높고, 편집 활성 창을 확장할 수 있어, 아데닌 염기 편집 기술의 효율성을 향상시키고 응용 범위를 넓혔다. 특히 TadA7.10 매개 염기 편집 벡터로 편집할 수 없는 표적의 아데닌 염기 편집 문제를 해결하고 식물 게놈 부위지정 편집에 대한 사용 범위를 확장하여, 식물 연구 및 작물 유전자 개량 분야 연구개발자들에게 중요한 유전자 기능 연구 및 교정 도구를 제공하였다. 본 발명은 아데닌 염기 편집의 효율성을 향상시키고 표적 부위의 염기 돌연변이를 정확하게 매개할 수 있으며, 벼 뿐만 아니라 기타 식물 세포에 널리 적용될 수 있다.
SEQUENCE LISTING <110> Institute of Plant Protection, Chinese Academy of Agricultural Sciences <120> Adenosine Deaminase and Related Biomaterial and Application Thereof <160> 84 <170> PatentIn version 3.5 <210> 1 <211> 4743 <212> DNA <213> Artificial sequence <400> 1 ggatccatgt cagaagtcga gttctcccat gagtattgga tgaggcacgc cctcactctt 60 gcgaagaggg ccagggacga gagggaggtg ccggtcggtg ctgtcctggt cttgaataac 120 agggtgatag gcgaaggttg gaacagggct attggccttc atgaccctac tgctcatgcg 180 gaaatcatgg cacttagaca ggggggcctc gttatgcaaa attaccgcct gatcgacgcc 240 actctttatt ccacatttga accatgtgtt atgtgtgcgg gcgctatgat ccattcacgc 300 ataggtcgcg tggtttttgg agttcgcaac agtaaacgtg gggctgcagg ctctctgatg 360 aacgttttga attatccggg aatgaaccat agagtcgaaa tcacagaagg gattttggca 420 gacgaatgcg cggctcttct ttgtgatttt tacagaatgc cccgccgtgt gtttaatgct 480 caaaagaaag cgcagagtag catcaactcg gggggatctt ctgggggctc gtctggttcc 540 gagactcccg gaacttccga gtcggcaaca cctgaatcct ccggcggctc ttcgggcgga 600 tctgacaaaa aatactcaat tggtctggct attgggacaa actctgtggg ctgggcggta 660 attaccgacg agtacaaggt gcctagtaag aaatttaaag tgctcggaaa cactgacagg 720 cactctataa agaagaacct gatcggggca ctgcttttcg actccggaga gacggcggag 780 gcgacgcgtc tcaagcgtac cgcgcgccgc aggtacacaa gaaggaagaa taggatctgc 840 tacttgcagg aaatcttcag taacgagatg gcgaaggtcg acgatagttt ctttcatcgg 900 ttggaagaat cgttcctcgt agaggaggac aaaaagcacg agcgtcaccc aatattcggg 960 aatattgttg acgaggttgc ctaccatgag aaatatccta caatatatca cctccgtaag 1020 aagcttgtcg attcaactga taaggctgat ctcagactca tctatcttgc cctcgcacat 1080 atgattaagt ttcgtggcca cttcttgatt gaaggcgacc tcaacccgga caactcagat 1140 gttgacaagc tttttataca gctcgtccag acatataacc agctgtttga agagaatccc 1200 atcaatgcga gtggggttga tgctaacgcc attttgtccg ccaggttgtc caaatctcgc 1260 agactggaaa acctgatcgc acagcttccc ggtgaaaaga aaaacgggct cttcggcaat 1320 ctcatcgcac tgtccctcgg cctcacccca aacttcaagt ctaacttcga cctggccgag 1380 gatgcgaagc tccagctgtc aaaagataca tacgacgacg atttggacaa tctgcttgcg 1440 caaataggcg accagtatgc ggacctgttc ctggctgcca aaaatctgtc agatgcaatc 1500 ctcctgtccg atatattgcg tgtgaacacc gaaatcacga aggcaccgct tagcgcatcc 1560 atgatcaaga gatacgacga gcaccatcag gacctcacac tcctcaaggc gcttgttcgt 1620 cagcagcttc ccgagaaata taaggaaatt tttttcgatc aaagcaagaa tggatatgct 1680 ggctatattg acggtggcgc ttcgcaggag gagttctata aattcattaa gccgattctg 1740 gagaagatgg acggaacgga ggagctcctc gtcaagctta accgggaaga cctgttgcgg 1800 aagcagagga cttttgataa cggctctatt ccgcaccaaa tccatctggg tgagttgcac 1860 gcaatcttga gaagacaaga ggatttctac ccgttcctta aggataacag agagaagata 1920 gaaaaaatac tgaccttcag gataccatac tatgtgggcc cactggcgcg cggaaatagt 1980 cgtttcgcat ggatgactag aaagtccgaa gaaacgatca cgccatggaa ttttgaggaa 2040 gtggtcgaca agggcgcctc tgcccagagc ttcatcgaaa ggatgaccaa ttttgacaaa 2100 aatctgccta acgaaaaggt gcttccgaag cacagcctgt tgtatgaata cttcacagtt 2160 tataacgagc tcactaaggt caagtacgtc acggagggca tgcgtaagcc tgctttcctg 2220 tctggtgaac aaaaaaaggc gattgtggac ctccttttca agacgaaccg taaagttact 2280 gtgaagcaac tgaaagagga ttactttaag aaaattgagt gcttcgacag tgtggagatt 2340 tccggtgtcg aggaccggtt taacgccagc ctgggtacgt atcatgacct gcttaaaatt 2400 atcaaggata aagatttcct ggataatgaa gagaacgaag atatactgga ggacattgtg 2460 ttgactttga ccctcttcga ggacagagag atgattgagg aaagactgaa gacctacgca 2520 cacctttttg atgacaaggt catgaaacaa ctcaagcgcc ggcgctatac tggctggggc 2580 cggctttctc gcaagctcat caatgggatt cgggataagc aatcaggcaa gacaattttg 2640 gacttcctca aatccgacgg attcgcaaat aggaatttta tgcagctgat acatgacgac 2700 tctttgacat tcaaagaaga catacagaag gctcaggtct ccggccaagg agattctttg 2760 cacgagcata tcgctaactt ggcaggtagc cccgccataa aaaagggcat tcttcaaacg 2820 gtaaaagttg ttgacgaact cgtgaaggtt atgggccgtc ataagccgga aaacattgtt 2880 attgaaatgg ctagggaaaa tcagacgacc cagaagggac agaaaaatag cagggagcgg 2940 atgaagagaa ttgaagaggg aattaaggag cttggatctc agattcttaa ggagcaccct 3000 gtggagaaca cccaacttca gaatgaaaag ctctaccttt actaccttca aaacggccgg 3060 gatatgtacg tcgatcagga acttgacatt aaccggttga gcgattatga cgttgacgct 3120 attgtgcccc aatctttcct taaagacgac tctatcgaca ataaagtgct gacgcgcagc 3180 gataaaaatc gcggtaagtc ggataatgtc ccgtcggaag aggtggttaa aaaaatgaag 3240 aactattgga ggcaactcct gaatgccaag ctgatcactc agaggaaatt cgacaatctc 3300 accaaggcag aaaggggtgg acttagcgag ctcgacaagg ccggttttat caaaagacag 3360 ctggtggaga cacgccaaat caccaaacac gttgcccaga tcctggattc gaggatgaac 3420 acgaagtatg acgagaacga caagttgatt agggaagtca aggtcatcac tttgaagtcc 3480 aagctggtga gcgactttcg caaagacttc cagttttaca aagtcaggga aattaataac 3540 taccaccacg cccacgacgc ctaccttaac gccgtggttg gcacagcact catcaagaaa 3600 taccctaagc tcgaatctga gttcgtctat ggcgactata aggtctacga cgttagaaaa 3660 atgatcgcga aatctgagca ggaaataggc aaggcaactg ccaagtactt cttctattcc 3720 aatatcatga acttttttaa gacggagatt accctggcga atggtgagat ccgcaagcgc 3780 cctttgattg agacaaacgg agaaacagga gagatcgtat gggacaaagg gcgggacttt 3840 gctactgtta ggaaggtgct ctctatgcca caagttaaca ttgtcaaaaa aactgaagtg 3900 cagacaggtg ggtttagcaa ggaatctatc ctgccgaaga ggaactctga caagctgatc 3960 gcccgcaaga aagattggga tccgaaaaag tacggaggat tcgactcccc cacagttgcg 4020 tactccgtgc ttgtcgtggc caaagtggag aagggcaagt ctaagaagct caagagcgtc 4080 aaagagttgt tggggatcac gattatggag cggtcgtctt tcgaaaagaa tccgatagat 4140 tttctcgagg ccaagggtta taaagaagtc aagaaggatc ttatcatcaa gctccctaag 4200 tactccctct ttgagcttga aaacggacgg aaaagaatgc tggcttcagc gggtgaactt 4260 cagaagggta atgaactcgc tctgccctca aaatatgtga atttccttta cctggcatca 4320 cactatgaga agcttaaggg gtctccagag gacaacgagc agaagcaact gttcgttgaa 4380 caacacaagc actaccttga cgagattatc gagcaaatca gcgagtttag caagcgcgtt 4440 atactggcag acgcaaatct tgataaggtc cttagcgcct acaacaagca tagagacaaa 4500 cccatccggg agcaggccga gaacattatt catctcttca ccttgacgaa tcttggggcc 4560 ccggccgcgt tcaagtactt cgatactacc atagacagaa agcgctatac atcgacaaag 4620 gaagttcttg acgccacgct gatccaccaa agtataacag gcctctatga gacacgcatc 4680 gacctttcgc agttgggcgg tgaccgcccc aaaaagaaga ggaaagttgg cgggtgaact 4740 agt 4743 <210> 2 <211> 1576 <212> PRT <213> Artificial sequence <400> 2 Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu 1 5 10 15 Thr Leu Ala Lys Arg Ala Arg Asp Glu Arg Glu Val Pro Val Gly Ala 20 25 30 Val Leu Val Leu Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Ala 35 40 45 Ile Gly Leu His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg 50 55 60 Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu 65 70 75 80 Tyr Ser Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His 85 90 95 Ser Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ser Lys Arg Gly 100 105 110 Ala Ala Gly Ser Leu Met Asn Val Leu Asn Tyr Pro Gly Met Asn His 115 120 125 Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu 130 135 140 Leu Cys Asp Phe Tyr Arg Met Pro Arg Arg Val Phe Asn Ala Gln Lys 145 150 155 160 Lys Ala Gln Ser Ser Ile Asn Ser Gly Gly Ser Ser Gly Gly Ser Ser 165 170 175 Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser 180 185 190 Gly Gly Ser Ser Gly Gly Ser Asp Lys Lys Tyr Ser Ile Gly Leu Ala 195 200 205 Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys 210 215 220 Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser 225 230 235 240 Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr 245 250 255 Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg 260 265 270 Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met 275 280 285 Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu 290 295 300 Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile 305 310 315 320 Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu 325 330 335 Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile 340 345 350 Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile 355 360 365 Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile 370 375 380 Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn 385 390 395 400 Ala Ser Gly Val Asp Ala Asn Ala Ile Leu Ser Ala Arg Leu Ser Lys 405 410 415 Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys 420 425 430 Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro 435 440 445 Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu 450 455 460 Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile 465 470 475 480 Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp 485 490 495 Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys 500 505 510 Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln 515 520 525 Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys 530 535 540 Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr 545 550 555 560 Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro 565 570 575 Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn 580 585 590 Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile 595 600 605 Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln 610 615 620 Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys 625 630 635 640 Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly 645 650 655 Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr 660 665 670 Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser 675 680 685 Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys 690 695 700 Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn 705 710 715 720 Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala 725 730 735 Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys 740 745 750 Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys 755 760 765 Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg 770 775 780 Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys 785 790 795 800 Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp 805 810 815 Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu 820 825 830 Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln 835 840 845 Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu 850 855 860 Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe 865 870 875 880 Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His 885 890 895 Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser 900 905 910 Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser 915 920 925 Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu 930 935 940 Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu 945 950 955 960 Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg 965 970 975 Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln 980 985 990 Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys 995 1000 1005 Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp 1010 1015 1020 Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp Ala 1025 1030 1035 Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys 1040 1045 1050 Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val 1055 1060 1065 Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln 1070 1075 1080 Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu 1085 1090 1095 Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly 1100 1105 1110 Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His 1115 1120 1125 Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu 1130 1135 1140 Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser 1145 1150 1155 Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val 1160 1165 1170 Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn 1175 1180 1185 Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu 1190 1195 1200 Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys 1205 1210 1215 Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys 1220 1225 1230 Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile 1235 1240 1245 Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr 1250 1255 1260 Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe 1265 1270 1275 Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val 1280 1285 1290 Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile 1295 1300 1305 Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp 1310 1315 1320 Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala 1325 1330 1335 Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys 1340 1345 1350 Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu 1355 1360 1365 Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys 1370 1375 1380 Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys 1385 1390 1395 Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala 1400 1405 1410 Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser 1415 1420 1425 Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu 1430 1435 1440 Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu 1445 1450 1455 Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu 1460 1465 1470 Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val 1475 1480 1485 Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln 1490 1495 1500 Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala 1505 1510 1515 Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg 1520 1525 1530 Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln 1535 1540 1545 Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu 1550 1555 1560 Gly Gly Asp Arg Pro Lys Lys Lys Arg Lys Val Gly Gly 1565 1570 1575 <210> 3 <211> 4743 <212> DNA <213> Artificial sequence <400> 3 ggatccatgt cagaagtcga gttctcccat gagtattgga tgaggcacgc cctcactctt 60 gcgaagaggg ccagggacga gagggaggtg ccggtcggtg ctgtcctggt cttgaataac 120 agggtgatag gcgaaggttg gaacagggct attggccttc atgaccctac tgctcatgcg 180 gaaatcatgg cacttagaca ggggggcctc gttatgcaaa attaccgcct gatcgacgcc 240 actctttatt ccacatttga accatgtgtt atgtgtgcgg gcgctatgat ccattcacgc 300 ataggtcgcg tggtttttgg agttcgcaac agtaaacgtg gggctgcagg ctctctgatg 360 aacgttttga attatccggg aatgaaccat agagtcgaaa tcacagaagg gattttggca 420 gacgaatgcg cggctcttct ttgtgatttt tacagaatgc cccgccgtgt gtttaatgct 480 caaaagaaag cgcagagtag catcaactcg gggggatctt ctgggggctc gtctggttcc 540 gagactcccg gaacttccga gtcggcaaca cctgaatcct ccggcggctc ttcgggcgga 600 tctgacaaaa aatactcaat tggtctggct attgggacaa actctgtggg ctgggcggta 660 attaccgacg agtacaaggt gcctagtaag aaatttaaag tgctcggaaa cactgacagg 720 cactctataa agaagaacct gatcggggca ctgcttttcg actccggaga gacggcggag 780 gcgacgcgtc tcaagcgtac cgcgcgccgc aggtacacaa gaaggaagaa taggatctgc 840 tacttgcagg aaatcttcag taacgagatg gcgaaggtcg acgatagttt ctttcatcgg 900 ttggaagaat cgttcctcgt agaggaggac aaaaagcacg agcgtcaccc aatattcggg 960 aatattgttg acgaggttgc ctaccatgag aaatatccta caatatatca cctccgtaag 1020 aagcttgtcg attcaactga taaggctgat ctcagactca tctatcttgc cctcgcacat 1080 atgattaagt ttcgtggcca cttcttgatt gaaggcgacc tcaacccgga caactcagat 1140 gttgacaagc tttttataca gctcgtccag acatataacc agctgtttga agagaatccc 1200 atcaatgcga gtggggttga tgctaaagcc attttgtccg ccaggttgtc caaatctcgc 1260 agactggaaa acctgatcgc acagcttccc ggtgaaaaga aaaacgggct cttcggcaat 1320 ctcatcgcac tgtccctcgg cctcacccca aacttcaagt ctaacttcga cctggccgag 1380 gatgcgaagc tccagctgtc aaaagataca tacgacgacg atttggacaa tctgcttgcg 1440 caaataggcg accagtatgc ggacctgttc ctggctgcca aaaatctgtc agatgcaatc 1500 ctcctgtccg atatattgcg tgtgaacacc gaaatcacga aggcaccgct tagcgcatcc 1560 atgatcaaga gatacgacga gcaccatcag gacctcacac tcctcaaggc gcttgttcgt 1620 cagcagcttc ccgagaaata taaggaaatt tttttcgatc aaagcaagaa tggatatgct 1680 ggctatattg acggtggcgc ttcgcaggag gagttctata aattcattaa gccgattctg 1740 gagaagatgg acggaacgga ggagctcctc gtcaagctta accgggaaga cctgttgcgg 1800 aagcagagga cttttgataa cggctctatt ccgcaccaaa tccatctggg tgagttgcac 1860 gcaatcttga gaagacaaga ggatttctac ccgttcctta aggataacag agagaagata 1920 gaaaaaatac tgaccttcag gataccatac tatgtgggcc cactggcgcg cggaaatagt 1980 cgtttcgcat ggatgactag aaagtccgaa gaaacgatca cgccatggaa ttttgaggaa 2040 gtggtcgaca agggcgcctc tgcccagagc ttcatcgaaa ggatgaccaa ttttgacaaa 2100 aatctgccta acgaaaaggt gcttccgaag cacagcctgt tgtatgaata cttcacagtt 2160 tataacgagc tcactaaggt caagtacgtc acggagggca tgcgtaagcc tgctttcctg 2220 tctggtgaac aaaaaaaggc gattgtggac ctccttttca agacgaaccg taaagttact 2280 gtgaagcaac tgaaagagga ttactttaag aaaattgagt gcttcgacag tgtggagatt 2340 tccggtgtcg aggaccggtt taacgccagc ctgggtacgt atcatgacct gcttaaaatt 2400 atcaaggata aagatttcct ggataatgaa gagaacgaag atatactgga ggacattgtg 2460 ttgactttga ccctcttcga ggacagagag atgattgagg aaagactgaa gacctacgca 2520 cacctttttg atgacaaggt catgaaacaa ctcaagcgcc ggcgctatac tggctggggc 2580 cggctttctc gcaagctcat caatgggatt cgggataagc aatcaggcaa gacaattttg 2640 gacttcctca aatccgacgg attcgcaaat aggaatttta tgcagctgat acatgacgac 2700 tctttgacat tcaaagaaga catacagaag gctcaggtca gcggccaagg agattctttg 2760 cacgagcata tcgctaactt ggcaggtagc cccgccataa aaaagggcat tcttcaaacg 2820 gtaaaagttg ttgacgaact cgtgaaggtt atgggccgtc ataagccgga aaacattgtt 2880 attgaaatgg ctagggaaaa tcagacgacc cagaagggac agaaaaatag cagggagcgg 2940 atgaagagaa ttgaagaggg aattaaggag cttggatctc agattcttaa ggagcaccct 3000 gtggagaaca cccaacttca gaatgaaaag ctctaccttt actaccttca aaacggccgg 3060 gatatgtacg tcgatcagga acttgacatt aaccggttga gcgattatga cgttgaccat 3120 attgtgcccc aatctttcct taaagacgac tctatcgaca ataaagtgct gacgcgcagc 3180 gataaaaatc gcggtaagtc ggataatgtc ccgtcggaag aggtggttaa aaaaatgaag 3240 aactattgga ggcaactcct gaatgccaag ctgatcactc agaggaaatt cgacaatctc 3300 accaaggcag aaaggggtgg acttagcgag ctcgacaagg ccggttttat caaaagacag 3360 ctggtggaga cacgccaaat caccaaacac gttgcccaga tcctggattc gaggatgaac 3420 acgaagtatg acgagaacga caagttgatt agggaagtca aggtcatcac tttgaagtcc 3480 aagctggtga gcgactttcg caaagacttc cagttttaca aagtcaggga aattaataac 3540 taccaccacg cccacgacgc ctaccttaac gccgtggttg gcacagcact catcaagaaa 3600 taccctaagc tcgaatctga gttcgtctat ggcgactata aggtctacga cgttagaaaa 3660 atgatcgcga aatctgagca ggaaataggc aaggcaactg ccaagtactt cttctattcc 3720 aatatcatga acttttttaa gacggagatt accctggcga atggtgagat ccgcaagcgc 3780 cctttgattg agacaaacgg agaaacagga gagatcgtat gggacaaagg gcgggacttt 3840 gctactgtta ggaaggtgct ctctatgcca caagttaaca ttgtcaaaaa aactgaagtg 3900 cagacaggtg ggtttagcaa ggaatctatc cgcccgaaga ggaactctga caagctgatc 3960 gcccgcaaga aagattggga cccgaaaaag tacggaggat tcgtttcccc cacagttgcg 4020 tactccgtgc ttgtcgtggc caaagtggag aagggcaagt ctaagaagct caagagcgtc 4080 aaagagttgt tggggatcac gattatggag cggtcgtctt tcgaaaagaa tccgatagat 4140 tttctcgagg ccaagggtta taaagaagtc aagaaggatc ttatcatcaa gctccctaag 4200 tactccctct ttgagcttga aaacggacgg aaaagaatgc tggcttcagc gcgctttctt 4260 cagaagggta atgaactcgc tctgccctca aaatatgtga atttccttta cctggcatca 4320 cactatgaga agcttaaggg ttctccagag gacaacgagc agaagcaact gttcgttgaa 4380 caacacaagc actaccttga cgagattatc gagcaaatca gcgagtttag caagcgcgtt 4440 atactggcag acgcaaatct tgataaggtc cttagcgcct acaacaagca tagagacaaa 4500 cccatccggg agcaggccga gaacattatt catctcttca ccttgacgaa tcttggggcc 4560 ccgcgcgcgt tcaagtactt cgatactacc atagacagaa aggtctatcg ctcgacaaag 4620 gaagttcttg acgccacgct gatccaccaa agtataacag gcctctatga gacacgcatc 4680 gacctttcgc agttgggcgg tgaccgcccc aaaaagaaga ggaaagttgg cgggtgaact 4740 agt 4743 <210> 4 <211> 1576 <212> PRT <213> Artificial sequence <400> 4 Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu 1 5 10 15 Thr Leu Ala Lys Arg Ala Arg Asp Glu Arg Glu Val Pro Val Gly Ala 20 25 30 Val Leu Val Leu Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Ala 35 40 45 Ile Gly Leu His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg 50 55 60 Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu 65 70 75 80 Tyr Ser Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His 85 90 95 Ser Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ser Lys Arg Gly 100 105 110 Ala Ala Gly Ser Leu Met Asn Val Leu Asn Tyr Pro Gly Met Asn His 115 120 125 Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu 130 135 140 Leu Cys Asp Phe Tyr Arg Met Pro Arg Arg Val Phe Asn Ala Gln Lys 145 150 155 160 Lys Ala Gln Ser Ser Ile Asn Ser Gly Gly Ser Ser Gly Gly Ser Ser 165 170 175 Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser 180 185 190 Gly Gly Ser Ser Gly Gly Ser Asp Lys Lys Tyr Ser Ile Gly Leu Ala 195 200 205 Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys 210 215 220 Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser 225 230 235 240 Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr 245 250 255 Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg 260 265 270 Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met 275 280 285 Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu 290 295 300 Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile 305 310 315 320 Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu 325 330 335 Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile 340 345 350 Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile 355 360 365 Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile 370 375 380 Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn 385 390 395 400 Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys 405 410 415 Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys 420 425 430 Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro 435 440 445 Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu 450 455 460 Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile 465 470 475 480 Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp 485 490 495 Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys 500 505 510 Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln 515 520 525 Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys 530 535 540 Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr 545 550 555 560 Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro 565 570 575 Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn 580 585 590 Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile 595 600 605 Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln 610 615 620 Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys 625 630 635 640 Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly 645 650 655 Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr 660 665 670 Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser 675 680 685 Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys 690 695 700 Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn 705 710 715 720 Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala 725 730 735 Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys 740 745 750 Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys 755 760 765 Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg 770 775 780 Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys 785 790 795 800 Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp 805 810 815 Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu 820 825 830 Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln 835 840 845 Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu 850 855 860 Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe 865 870 875 880 Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His 885 890 895 Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser 900 905 910 Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser 915 920 925 Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu 930 935 940 Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu 945 950 955 960 Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg 965 970 975 Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln 980 985 990 Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys 995 1000 1005 Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp 1010 1015 1020 Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp His 1025 1030 1035 Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys 1040 1045 1050 Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val 1055 1060 1065 Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln 1070 1075 1080 Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu 1085 1090 1095 Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly 1100 1105 1110 Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His 1115 1120 1125 Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu 1130 1135 1140 Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser 1145 1150 1155 Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val 1160 1165 1170 Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn 1175 1180 1185 Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu 1190 1195 1200 Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys 1205 1210 1215 Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys 1220 1225 1230 Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile 1235 1240 1245 Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr 1250 1255 1260 Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe 1265 1270 1275 Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val 1280 1285 1290 Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile 1295 1300 1305 Arg Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp 1310 1315 1320 Trp Asp Pro Lys Lys Tyr Gly Gly Phe Val Ser Pro Thr Val Ala 1325 1330 1335 Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys 1340 1345 1350 Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu 1355 1360 1365 Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys 1370 1375 1380 Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys 1385 1390 1395 Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala 1400 1405 1410 Ser Ala Arg Phe Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser 1415 1420 1425 Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu 1430 1435 1440 Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu 1445 1450 1455 Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu 1460 1465 1470 Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val 1475 1480 1485 Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln 1490 1495 1500 Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala 1505 1510 1515 Pro Arg Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Val 1520 1525 1530 Tyr Arg Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln 1535 1540 1545 Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu 1550 1555 1560 Gly Gly Asp Arg Pro Lys Lys Lys Arg Lys Val Gly Gly 1565 1570 1575 <210> 5 <211> 4764 <212> DNA <213> Artificial sequence <400> 5 ggatccatgt cagaagtcga gttctcccat gagtattgga tgaggcacgc cctcactctt 60 gcgaagaggg ccagggacga gagggaggtg ccggtcggtg ctgtcctggt cttgaataac 120 agggtgatag gcgaaggttg gaacagggct attggccttc atgaccctac tgctcatgcg 180 gaaatcatgg cacttagaca ggggggcctc gttatgcaaa attaccgcct gatcgacgcc 240 actctttatt ccacatttga accatgtgtt atgtgtgcgg gcgctatgat ccattcacgc 300 ataggtcgcg tggtttttgg agttcgcaac agtaaacgtg gggctgcagg ctctctgatg 360 aacgttttga attatccggg aatgaaccat agagtcgaaa tcacagaagg gattttggca 420 gacgaatgcg cggctcttct ttgtgatttt tacagaatgc cccgccgtgt gtttaatgct 480 caaaagaaag cgcagagtag catcaactcg gggggatctt ctgggggctc gtctggttcc 540 gagactcccg gaacttccga gtcggcaaca cctgaatcct ccggcggctc ttcgggcgga 600 tctgagaaaa aatactcaat tggtctggct attggaacca attcggttgg gtgggcagtc 660 ataaccgatg actataaagt tccgagcaaa aaatttaagg tccttggtaa taccaacagg 720 aaaagcataa aaaagaatct gatgggtgct ttgctgttcg attcaggtga gacagccgag 780 gctacccggc ttaagcggac cgctcgcaga aggtacaccc ggagaaaaaa tcgcatccgc 840 tatctccagg aaattttcgc gaatgaaatg gcaaagttgg acgatagttt cttccagagg 900 ctggaagaat ccttccttgt cgaagaagat aagaaaaacg agagacaccc tatcttcgga 960 aacctggcag acgaagtggc gtaccataga aactacccta cgatttatca tctcaggaaa 1020 aagctggcag attcaccgga gaaagccgac ctcaggttga tatacttggc actcgcgcac 1080 attattaaat ttagaggtca cttccttatc gaagggaaac tgaatgcaga aaactcggat 1140 gttgctaaac ttttttatca gttgatacaa acttacaatc agctgtttga agaatcccct 1200 ttggacgaaa tcgaggttga tgctaagggc attctttctg ctaggttgtc aaagagcaaa 1260 aggctcgaaa agctcattgc tgtctttccc aacgaaaaga agaatggact ttttgggaac 1320 attatagctc ttgccctcgg cctgactcca aacttcaaaa gcaactttga tttgactgag 1380 gacgccaaac tccaattgtc aaaggatact tacgatgacg acctggacga actcttgggt 1440 cagatcgggg atcaatacgc ggatcttttc agtgctgcaa agaatctctc cgacgctatt 1500 cttctttcag acatcctgcg ctcaaatagt gaggtcacta aggctccgtt gtccgcgtcg 1560 atggttaaac ggtatgatga acatcaccag gacctcgcgc ttctgaaaac actcgtccgg 1620 caacagttcc ctgaaaagta tgcagaaata ttcaaagacg acacaaaaaa tggttacgct 1680 gggtacgtcg ggattggcat caagcataga aaacggacta ctaaacttgc tacccaagag 1740 gagttctaca agtttattaa gccaatcctg gaaaaaatgg atggcgcgga agaactcctt 1800 gccaagttga atagggatga cctcctccgg aagcaacgca cttttgacaa cggctctatc 1860 ccgcatcaga ttcacttgaa agagttgcac gcaatactcc gccgccaaga ggaattttac 1920 ccatttctca aggagaacag ggagaaaata gagaaaatct tgacgttcag gattccttac 1980 tatgtggggc ctcttgctcg gggtaattct cgctttgcct ggttgacaag aaaatctgaa 2040 gaagctatca ccccgtggaa tttcgaagaa gtcgttgata aaggcgccag cgctcaatct 2100 ttcattgagc ggatgacaaa cttcgacgag cagttgccga ataaaaaggt tctgccaaag 2160 cactcactgc tttatgagta ttttaccgtc tacaacgagt tgacgaaggt caaatacgtg 2220 actgagagga tgcggaaacc tgagtttttg tctggtgagc agaagaaagc cattgttgac 2280 cttcttttca agaccaaccg gaaggtgact gttaagcaac tcaaggaaga ttatttcaag 2340 aaaattgaat gcttcgactc cgttgagata ataggtgttg aggaccgctt caatgcgtca 2400 ctcggaacct atcacgactt gctcaaaata atcaaggaca aagactttct tgataacgaa 2460 gaaaatgaag acatattgga ggatatagtg ctcaccctta cattgttcga ggacagagaa 2520 atgatcgagg agcggcttaa gacctacgcg catctgttcg atgataaggt tatgaagcag 2580 ctgaagagga gacattacac gggttggggc cggctttcca ggaagatgat taacggtatc 2640 cgggataaac agtcaggaaa aactatactg gactttttga aatcagacgg tttctcaaac 2700 agaaacttca tgcaattgat tcatgacgat agtcttactt ttaaagagga aatcgagaag 2760 gcgcaagtga gcggacaagg agactcgctg cacgagcaaa tcgccgacct ggctgggtcg 2820 ccggctataa agaagggtat attgcagacc gtcaaaatcg tggacgagct ggtgaaggtt 2880 atggggcaca aacctgaaaa tattgttatt gagatggcta gggagaatca gactactacg 2940 aagggattgc aacagtctcg cgagcgcaag aaaaggatcg aggaaggtat taaggaactt 3000 gaatcccaga tactcaagga gaatcccgtc gagaacacac aacttcagaa cgaaaaactc 3060 tatctttact atcttcaaaa tggcagagat atgtatgtgg accaagagct ggatattaat 3120 aggctctctg attacgatgt tgaccatatc gtgccgcagt catttattaa agatgactct 3180 attgataaca aggtcctcac tcgctccgtc gaaaatcgcg gtaaatcaga caatgtcccc 3240 tcggaggaag tcgtgaagaa aatgaagaac tactggaggc agctgcttaa cgcaaagttg 3300 attactcagc gcaagtttga caacttgaca aaggccgaga ggggaggact ctctgaggcg 3360 gacaaggcag gtttcatcaa gcgccaactc gtcgagacac ggcagataac caaacacgtc 3420 gcaaggatat tggatagcag aatgaacaca aagagagata agaacgacaa accaatacgc 3480 gaagtgaaag tcatcacatt gaagtccaaa ttggttagtg atttccgcaa ggacttccaa 3540 ctgtacaaag tgagagacat caacaactac catcatgctc acgatgcata tctgaatgct 3600 gtcgtcggca cagctcttat aaagaaatac ccgaaactcg aatcggagtt cgtttatggg 3660 gattataagg tttatgacgt taggaagatg attgccaagt cagaacaaga aatcgggaag 3720 gctacagcga aacgcttttt ttattcgaac ataatgaatt tctttaaaac ggaggtcaaa 3780 cttgcgaacg gggaaatccg gaaacgcccg cttatcgaga caaatggaga aacaggtgaa 3840 gtcgtgtgga ataaagaaaa ggacttcgcc accgttcgga aagttctcgc catgccgcag 3900 gtcaacattg tcaagaaaac ggaggtccaa accgggggct tctccaagga atccattctc 3960 tcaaagaggg agagtgcaaa gctcatacct aggaagaagg gttgggacac acgcaaatac 4020 ggcgggtttg gcagtcccac ggtggcatac tctatccttg tggtcgccaa agtcgaaaag 4080 ggcaaggcga aaaaattgaa gagcgttaaa gtgcttgtcg ggatcaccat aatggagaag 4140 ggctcctacg agaaggaccc tatcgggttc ttggaagcga agggttataa agacattaag 4200 aaagagctga tcttcaaatt gccgaaatac agcctgttcg aactggagaa cggcaggcgg 4260 cgcatgttgg cgagtgccac cgagcttcag aaggctaatg agcttgtttt gccgcagcat 4320 ctcgtccgcc tcctctatta tacgcaaaat attagtgcta ctactgggtc aaataacctc 4380 ggatatattg aacaacatag ggaggagttt aaggagatat ttgagaaaat catagacttc 4440 tctgaaaagt atatactgaa aaataaggtg aactccaatc tcaagtcttc ctttgacgaa 4500 cagtttgctg tgtcggactc catacttctc agcaattctt tcgtttccct gttgaaatat 4560 acgtcatttg gcgcttccgg gggatttacc tttcttgatc ttgacgttaa acagggtagg 4620 ctcagatacc agactgtcac ggaagtgctc gatgccactc ttatatacca atcaattacg 4680 ggcctgtacg aaacgcggac agatttgtcc cagctcggcg gcgaccggcc aaagaagaag 4740 cggaaagtcg gaggctgaac tagt 4764 <210> 6 <211> 1583 <212> PRT <213> Artificial sequence <400> 6 Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu 1 5 10 15 Thr Leu Ala Lys Arg Ala Arg Asp Glu Arg Glu Val Pro Val Gly Ala 20 25 30 Val Leu Val Leu Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Ala 35 40 45 Ile Gly Leu His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg 50 55 60 Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu 65 70 75 80 Tyr Ser Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His 85 90 95 Ser Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ser Lys Arg Gly 100 105 110 Ala Ala Gly Ser Leu Met Asn Val Leu Asn Tyr Pro Gly Met Asn His 115 120 125 Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu 130 135 140 Leu Cys Asp Phe Tyr Arg Met Pro Arg Arg Val Phe Asn Ala Gln Lys 145 150 155 160 Lys Ala Gln Ser Ser Ile Asn Ser Gly Gly Ser Ser Gly Gly Ser Ser 165 170 175 Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser 180 185 190 Gly Gly Ser Ser Gly Gly Ser Glu Lys Lys Tyr Ser Ile Gly Leu Ala 195 200 205 Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Asp Tyr Lys 210 215 220 Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asn Arg Lys Ser 225 230 235 240 Ile Lys Lys Asn Leu Met Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr 245 250 255 Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg 260 265 270 Arg Lys Asn Arg Ile Arg Tyr Leu Gln Glu Ile Phe Ala Asn Glu Met 275 280 285 Ala Lys Leu Asp Asp Ser Phe Phe Gln Arg Leu Glu Glu Ser Phe Leu 290 295 300 Val Glu Glu Asp Lys Lys Asn Glu Arg His Pro Ile Phe Gly Asn Leu 305 310 315 320 Ala Asp Glu Val Ala Tyr His Arg Asn Tyr Pro Thr Ile Tyr His Leu 325 330 335 Arg Lys Lys Leu Ala Asp Ser Pro Glu Lys Ala Asp Leu Arg Leu Ile 340 345 350 Tyr Leu Ala Leu Ala His Ile Ile Lys Phe Arg Gly His Phe Leu Ile 355 360 365 Glu Gly Lys Leu Asn Ala Glu Asn Ser Asp Val Ala Lys Leu Phe Tyr 370 375 380 Gln Leu Ile Gln Thr Tyr Asn Gln Leu Phe Glu Glu Ser Pro Leu Asp 385 390 395 400 Glu Ile Glu Val Asp Ala Lys Gly Ile Leu Ser Ala Arg Leu Ser Lys 405 410 415 Ser Lys Arg Leu Glu Lys Leu Ile Ala Val Phe Pro Asn Glu Lys Lys 420 425 430 Asn Gly Leu Phe Gly Asn Ile Ile Ala Leu Ala Leu Gly Leu Thr Pro 435 440 445 Asn Phe Lys Ser Asn Phe Asp Leu Thr Glu Asp Ala Lys Leu Gln Leu 450 455 460 Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Glu Leu Leu Gly Gln Ile 465 470 475 480 Gly Asp Gln Tyr Ala Asp Leu Phe Ser Ala Ala Lys Asn Leu Ser Asp 485 490 495 Ala Ile Leu Leu Ser Asp Ile Leu Arg Ser Asn Ser Glu Val Thr Lys 500 505 510 Ala Pro Leu Ser Ala Ser Met Val Lys Arg Tyr Asp Glu His His Gln 515 520 525 Asp Leu Ala Leu Leu Lys Thr Leu Val Arg Gln Gln Phe Pro Glu Lys 530 535 540 Tyr Ala Glu Ile Phe Lys Asp Asp Thr Lys Asn Gly Tyr Ala Gly Tyr 545 550 555 560 Val Gly Ile Gly Ile Lys His Arg Lys Arg Thr Thr Lys Leu Ala Thr 565 570 575 Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp 580 585 590 Gly Ala Glu Glu Leu Leu Ala Lys Leu Asn Arg Asp Asp Leu Leu Arg 595 600 605 Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu 610 615 620 Lys Glu Leu His Ala Ile Leu Arg Arg Gln Glu Glu Phe Tyr Pro Phe 625 630 635 640 Leu Lys Glu Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile 645 650 655 Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp 660 665 670 Leu Thr Arg Lys Ser Glu Glu Ala Ile Thr Pro Trp Asn Phe Glu Glu 675 680 685 Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr 690 695 700 Asn Phe Asp Glu Gln Leu Pro Asn Lys Lys Val Leu Pro Lys His Ser 705 710 715 720 Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys 725 730 735 Tyr Val Thr Glu Arg Met Arg Lys Pro Glu Phe Leu Ser Gly Glu Gln 740 745 750 Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr 755 760 765 Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp 770 775 780 Ser Val Glu Ile Ile Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly 785 790 795 800 Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp 805 810 815 Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr 820 825 830 Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala 835 840 845 His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg His Tyr 850 855 860 Thr Gly Trp Gly Arg Leu Ser Arg Lys Met Ile Asn Gly Ile Arg Asp 865 870 875 880 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe 885 890 895 Ser Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe 900 905 910 Lys Glu Glu Ile Glu Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu 915 920 925 His Glu Gln Ile Ala Asp Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly 930 935 940 Ile Leu Gln Thr Val Lys Ile Val Asp Glu Leu Val Lys Val Met Gly 945 950 955 960 His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr 965 970 975 Thr Thr Lys Gly Leu Gln Gln Ser Arg Glu Arg Lys Lys Arg Ile Glu 980 985 990 Glu Gly Ile Lys Glu Leu Glu Ser Gln Ile Leu Lys Glu Asn Pro Val 995 1000 1005 Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu 1010 1015 1020 Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn 1025 1030 1035 Arg Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe 1040 1045 1050 Ile Lys Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Val 1055 1060 1065 Glu Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val 1070 1075 1080 Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu 1085 1090 1095 Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly 1100 1105 1110 Gly Leu Ser Glu Ala Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu 1115 1120 1125 Val Glu Thr Arg Gln Ile Thr Lys His Val Ala Arg Ile Leu Asp 1130 1135 1140 Ser Arg Met Asn Thr Lys Arg Asp Lys Asn Asp Lys Pro Ile Arg 1145 1150 1155 Glu Val Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp Phe 1160 1165 1170 Arg Lys Asp Phe Gln Leu Tyr Lys Val Arg Asp Ile Asn Asn Tyr 1175 1180 1185 His His Ala His Asp Ala Tyr Leu Asn Ala Val Val Gly Thr Ala 1190 1195 1200 Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val Tyr Gly 1205 1210 1215 Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys Ser Glu 1220 1225 1230 Gln Glu Ile Gly Lys Ala Thr Ala Lys Arg Phe Phe Tyr Ser Asn 1235 1240 1245 Ile Met Asn Phe Phe Lys Thr Glu Val Lys Leu Ala Asn Gly Glu 1250 1255 1260 Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu 1265 1270 1275 Val Val Trp Asn Lys Glu Lys Asp Phe Ala Thr Val Arg Lys Val 1280 1285 1290 Leu Ala Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln 1295 1300 1305 Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Ser Lys Arg Glu Ser 1310 1315 1320 Ala Lys Leu Ile Pro Arg Lys Lys Gly Trp Asp Thr Arg Lys Tyr 1325 1330 1335 Gly Gly Phe Gly Ser Pro Thr Val Ala Tyr Ser Ile Leu Val Val 1340 1345 1350 Ala Lys Val Glu Lys Gly Lys Ala Lys Lys Leu Lys Ser Val Lys 1355 1360 1365 Val Leu Val Gly Ile Thr Ile Met Glu Lys Gly Ser Tyr Glu Lys 1370 1375 1380 Asp Pro Ile Gly Phe Leu Glu Ala Lys Gly Tyr Lys Asp Ile Lys 1385 1390 1395 Lys Glu Leu Ile Phe Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu 1400 1405 1410 Glu Asn Gly Arg Arg Arg Met Leu Ala Ser Ala Thr Glu Leu Gln 1415 1420 1425 Lys Ala Asn Glu Leu Val Leu Pro Gln His Leu Val Arg Leu Leu 1430 1435 1440 Tyr Tyr Thr Gln Asn Ile Ser Ala Thr Thr Gly Ser Asn Asn Leu 1445 1450 1455 Gly Tyr Ile Glu Gln His Arg Glu Glu Phe Lys Glu Ile Phe Glu 1460 1465 1470 Lys Ile Ile Asp Phe Ser Glu Lys Tyr Ile Leu Lys Asn Lys Val 1475 1480 1485 Asn Ser Asn Leu Lys Ser Ser Phe Asp Glu Gln Phe Ala Val Ser 1490 1495 1500 Asp Ser Ile Leu Leu Ser Asn Ser Phe Val Ser Leu Leu Lys Tyr 1505 1510 1515 Thr Ser Phe Gly Ala Ser Gly Gly Phe Thr Phe Leu Asp Leu Asp 1520 1525 1530 Val Lys Gln Gly Arg Leu Arg Tyr Gln Thr Val Thr Glu Val Leu 1535 1540 1545 Asp Ala Thr Leu Ile Tyr Gln Ser Ile Thr Gly Leu Tyr Glu Thr 1550 1555 1560 Arg Thr Asp Leu Ser Gln Leu Gly Gly Asp Arg Pro Lys Lys Lys 1565 1570 1575 Arg Lys Val Gly Gly 1580 <210> 7 <211> 4743 <212> DNA <213> Artificial sequence <400> 7 ggatccatgt cagaagtcga gttctcccat gagtattgga tgaggcacgc cctcactctt 60 gcgaagaggg ccagggacga gagggaggtg ccggtcggtg ctgtcctggt cttgaataac 120 agggtgatag gcgaaggttg gaacagggct attggccttc atgaccctac tgctcatgcg 180 gaaatcatgg cacttagaca ggggggcctc gttatgcaaa attaccgcct gatcgacgcc 240 actctttatt ccacatttga accatgtgtt atgtgtgcgg gcgctatgat ccattcacgc 300 ataggtcgcg tggtttttgg agttcgcaac agtaaacgtg gggctgcagg ctctctgatg 360 aacgttttga attatccggg aatgaaccat agagtcgaaa tcacagaagg gattttggca 420 gacgaatgcg cggctcttct ttgtgatttt tacagaatgc cccgccgtgt gtttaatgct 480 caaaagaaag cgcagagtag catcaactcg gggggatctt ctgggggctc gtctggttcc 540 gagactcccg gaacttccga gtcggcaaca cctgaatcct ccggcggctc ttcgggcgga 600 tctgacaaaa aatactcaat tggtctggct attgggacaa actctgtggg ctgggcggta 660 attaccgacg agtacaaggt gcctagtaag aaatttaaag tgctcggaaa cactgacagg 720 cactctataa agaagaacct gatcggggca ctgcttttcg actccggaga gacggcggag 780 aggacgcgtc tcaagcgtac cgcgcgccgc aggtacacaa gaaggaagaa taggatctgc 840 tacttgcagg aaatcttcag taacgagatg gcgaaggtcg acgatagttt ctttcatcgg 900 ttggaagaat cgttcctcgt agaggaggac aaaaagcacg agcgtcaccc aatattcggg 960 aatattgttg acgaggttgc ctaccatgag aaatatccta caatatatca cctccgtaag 1020 aagcttgtcg attcaactga taaggctgat ctcagactca tctatcttgc cctcgcacat 1080 atgattaagt ttcgtggcca cttcttgatt gaaggcgacc tcaacccgga caactcagat 1140 gttgacaagc tttttataca gctcgtccag acatataacc agctgtttga agagaatccc 1200 atcaatgcga gtggggttga tgctaaagcc attttgtccg ccaggttgtc caaatctcgc 1260 agactggaaa acctgatcgc acagcttccc ggtgaaaaga aaaacgggct cttcggcaat 1320 ctcatcgcac tgtccctcgg cctcacccca aacttcaagt ctaacttcga cctggccgag 1380 gatgcgaagc tccagctgtc aaaagataca tacgacgacg atttggacaa tctgcttgcg 1440 caaataggcg accagtatgc ggacctgttc ctggctgcca aaaatctgtc agatgcaatc 1500 ctcctgtccg atatattgcg tgtgaacacc gaaatcacga aggcaccgct tagcgcatcc 1560 atgatcaaga gatacgacga gcaccatcag gacctcacac tcctcaaggc gcttgttcgt 1620 cagcagcttc ccgagaaata taaggaaatt tttttcgatc aaagcaagaa tggatatgct 1680 ggctatattg acggtggcgc ttcgcaggag gagttctata aattcattaa gccgattctg 1740 gagaagatgg acggaacgga ggagctcctc gtcaagctta accgggaaga cctgttgcgg 1800 aagcagagga cttttgataa cggctctatt ccgcaccaaa tccatctggg tgagttgcac 1860 gcaatcttga gaagacaaga ggatttctac ccgttcctta aggataacag agagaagata 1920 gaaaaaatac tgaccttcag gataccatac tatgtgggcc cactggcgcg cggaaatagt 1980 cgtttcgcat ggatgactag aaagtccgaa gaaacgatca cgccatggaa ttttgaggaa 2040 gtggtcgaca agggcgcctc tgcccagagc ttcatcgaaa ggatgaccaa ttttgacaaa 2100 aatctgccta acgaaaaggt gcttccgaag cacagcctgt tgtatgaata cttcacagtt 2160 tataacgagc tcactaaggt caagtacgtc acggagggca tgcgtaagcc tgctttcctg 2220 tctggtgaac aaaaaaaggc gattgtggac ctccttttca agacgaaccg taaagttact 2280 gtgaagcaac tgaaagagga ttactttaag aaaattgagt gcttcgacag tgtggagatt 2340 tccggtgtcg aggaccggtt taacgccagc ctgggtacgt atcatgacct gcttaaaatt 2400 atcaaggata aagatttcct ggataatgaa gagaacgaag atatactgga ggacattgtg 2460 ttgactttga ccctcttcga ggacagagag atgattgagg aaagactgaa gacctacgca 2520 cacctttttg atgacaaggt catgaaacaa ctcaagcgcc ggcgctatac tggctggggc 2580 cggctttctc gcaagctcat caatgggatt cgggataagc aatcaggcaa gacaattttg 2640 gacttcctca aatccgacgg attcgcaaat aggaatttta tgcagctgat acatgacgac 2700 tctttgacat tcaaagaaga catacagaag gctcaggtct ccggccaagg agattctttg 2760 cacgagcata tcgctaactt ggcaggtagc cccgccataa aaaagggcat tcttcaaacg 2820 gtaaaagttg ttgacgaact cgtgaaggtt atgggccgtc ataagccgga aaacattgtt 2880 attgaaatgg ctagggaaaa tcagacgacc cagaagggac agaaaaatag cagggagcgg 2940 atgaagagaa ttgaagaggg aattaaggag cttggatctc agattcttaa ggagcaccct 3000 gtggagaaca cccaacttca gaatgaaaag ctctaccttt actaccttca aaacggccgg 3060 gatatgtacg tcgatcagga acttgacatt aaccggttga gcgattatga cgttgaccat 3120 attgtgcccc aatctttcct taaagacgac tctatcgaca ataaagtgct gacgcgcagc 3180 gataaaaatc gcggtaagtc ggataatgtc ccgtcggaag aggtggttaa aaaaatgaag 3240 aactattgga ggcaactcct gaatgccaag ctgatcactc agaggaaatt cgacaatctc 3300 accaaggcag aaaggggtgg acttagcgag ctcgacaagg ccggttttat caaaagacag 3360 ctggtggaga cacgccaaat caccaaacac gttgcccaga tcctggattc gaggatgaac 3420 acgaagtatg acgagaacga caagttgatt agggaagtca aggtcatcac tttgaagtcc 3480 aagctggtga gcgactttcg caaagacttc cagttttaca aagtcaggga aattaataac 3540 taccaccacg cccacgacgc ctaccttaac gccgtggttg gcacagcact catcaagaaa 3600 taccctaagc tcgaatctga gttcgtctat ggcgactata aggtctacga cgttagaaaa 3660 atgatcgcga aatctgagca ggaaataggc aaggcaactg ccaagtactt cttctattcc 3720 aatatcatga acttttttaa gacggagatt accctggcga atggtgagat ccgcaagcgc 3780 cctttgattg agacaaacgg agaaacagga gagatcgtat gggacaaagg gcgggacttt 3840 gctactgtta ggaaggtgct ctctatgcca caagttaaca ttgtcaaaaa aactgaagtg 3900 cagacaggtg ggtttagcaa ggaatctatc aggccgaaga ggaactctga caagctgatc 3960 gcccgcaaga aagattggga cccgaaaaag tacggaggat tcttgtggcc cacagttgcg 4020 tactccgtgc ttgtcgtggc caaagtggag aagggcaagt ctaagaagct caagagcgtc 4080 aaagagttgt tggggatcac gattatggag cggtcgtctt tcgaaaagaa tccgatagat 4140 tttctcgagg ccaagggtta taaagaagtc aagaaggatc ttatcatcaa gctccctaag 4200 tactccctct ttgagcttga aaacggacgg aaaagaatgc tggcttcagc gaagcagctt 4260 cagaagggta atgaactcgc tctgccctca aaatatgtga atttccttta cctggcatca 4320 cactatgaga agcttaaggg gtctccagag gacaacgagc agaagcaact gttcgttgaa 4380 caacacaagc actaccttga cgagattatc gagcaaatca gcgagtttag caagcgcgtt 4440 atactggcag acgcaaatct tgataaggtc cttagcgcct acaacaagca tagagacaaa 4500 cccatccggg agcaggccga gaacattatt catctcttca ccttgacgag gcttggggcc 4560 ccgagagcgt tcaagtactt cgatactacc atagacccaa agcaatatcg gtcgacaaag 4620 gaagttcttg acgccacgct gatccaccaa agtataacag gcctctatga gacacgcatc 4680 gacctttcgc agttgggcgg tgaccgcccc aaaaagaaga ggaaagttgg cgggtgaact 4740 agt 4743 <210> 8 <211> 1576 <212> PRT <213> Artificial sequence <400> 8 Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu 1 5 10 15 Thr Leu Ala Lys Arg Ala Arg Asp Glu Arg Glu Val Pro Val Gly Ala 20 25 30 Val Leu Val Leu Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Ala 35 40 45 Ile Gly Leu His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg 50 55 60 Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu 65 70 75 80 Tyr Ser Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His 85 90 95 Ser Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ser Lys Arg Gly 100 105 110 Ala Ala Gly Ser Leu Met Asn Val Leu Asn Tyr Pro Gly Met Asn His 115 120 125 Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu 130 135 140 Leu Cys Asp Phe Tyr Arg Met Pro Arg Arg Val Phe Asn Ala Gln Lys 145 150 155 160 Lys Ala Gln Ser Ser Ile Asn Ser Gly Gly Ser Ser Gly Gly Ser Ser 165 170 175 Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser 180 185 190 Gly Gly Ser Ser Gly Gly Ser Asp Lys Lys Tyr Ser Ile Gly Leu Ala 195 200 205 Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys 210 215 220 Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser 225 230 235 240 Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr 245 250 255 Ala Glu Arg Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg 260 265 270 Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met 275 280 285 Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu 290 295 300 Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile 305 310 315 320 Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu 325 330 335 Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile 340 345 350 Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile 355 360 365 Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile 370 375 380 Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn 385 390 395 400 Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys 405 410 415 Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys 420 425 430 Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro 435 440 445 Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu 450 455 460 Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile 465 470 475 480 Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp 485 490 495 Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys 500 505 510 Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln 515 520 525 Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys 530 535 540 Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr 545 550 555 560 Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro 565 570 575 Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn 580 585 590 Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile 595 600 605 Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln 610 615 620 Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys 625 630 635 640 Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly 645 650 655 Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr 660 665 670 Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser 675 680 685 Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys 690 695 700 Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn 705 710 715 720 Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala 725 730 735 Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys 740 745 750 Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys 755 760 765 Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg 770 775 780 Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys 785 790 795 800 Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp 805 810 815 Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu 820 825 830 Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln 835 840 845 Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu 850 855 860 Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe 865 870 875 880 Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His 885 890 895 Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser 900 905 910 Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser 915 920 925 Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu 930 935 940 Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu 945 950 955 960 Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg 965 970 975 Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln 980 985 990 Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys 995 1000 1005 Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp 1010 1015 1020 Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp His 1025 1030 1035 Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys 1040 1045 1050 Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val 1055 1060 1065 Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln 1070 1075 1080 Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu 1085 1090 1095 Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly 1100 1105 1110 Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His 1115 1120 1125 Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu 1130 1135 1140 Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser 1145 1150 1155 Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val 1160 1165 1170 Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn 1175 1180 1185 Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu 1190 1195 1200 Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys 1205 1210 1215 Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys 1220 1225 1230 Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile 1235 1240 1245 Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr 1250 1255 1260 Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe 1265 1270 1275 Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val 1280 1285 1290 Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile 1295 1300 1305 Arg Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp 1310 1315 1320 Trp Asp Pro Lys Lys Tyr Gly Gly Phe Leu Trp Pro Thr Val Ala 1325 1330 1335 Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys 1340 1345 1350 Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu 1355 1360 1365 Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys 1370 1375 1380 Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys 1385 1390 1395 Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala 1400 1405 1410 Ser Ala Lys Gln Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser 1415 1420 1425 Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu 1430 1435 1440 Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu 1445 1450 1455 Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu 1460 1465 1470 Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val 1475 1480 1485 Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln 1490 1495 1500 Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Arg Leu Gly Ala 1505 1510 1515 Pro Arg Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Pro Lys Gln 1520 1525 1530 Tyr Arg Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln 1535 1540 1545 Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu 1550 1555 1560 Gly Gly Asp Arg Pro Lys Lys Lys Arg Lys Val Gly Gly 1565 1570 1575 <210> 9 <211> 1765 <212> DNA <213> Artificial sequence <400> 9 gcagcgtgac ccggtcgtgc ccctctctag agataatgag cattgcatgt ctaagttata 60 aaaaattacc acatattttt tttgtcacac ttgtttgaag tgcagtttat ctatctttat 120 acatatattt aaactttact ctacgaataa tataatctat agtactacaa taatatcagt 180 gttttagaga atcatataaa tgaacagtta gacatggtct aaaggacaat tgagtatttt 240 gacaacagga ctctacagtt ttatcttttt agtgtgcatg tgttctcctt tttttttgca 300 aatagcttca cctatataat acttcatcca ttttattagt acatccattt agggtttagg 360 gttaatggtt tttatagact aattttttta gtacatctat tttattctat tttagcctct 420 aaattaagaa aactaaaact ctattttagt ttttttattt aataatttag atataaaata 480 gaataaaata aagtgactaa aaattaaaca aatacccttt aagaaattaa aaaaactaag 540 gaaacatttt tcttgtttcg agtagataat gccagcctgt taaacgccgt cgacgagtct 600 aacggacacc aaccagcgaa ccagcagcgt cgcgtcgggc caagcgaagc agacggcacg 660 gcatctctgt cgctgcctct ggacccctct cgagagttcc gctccaccgt tggacttgct 720 ccgctgtcgg catccagaaa ttgcgtggcg gagcggcaga cgtgagccgg cacggcaggc 780 ggcctcctcc tcctctcacg gcacggcagc tacgggggat tcctttccca ccgctccttc 840 gctttccctt cctcgcccgc cgtaataaat agacaccccc tccacaccct ctttccccaa 900 cctcgtgttg ttcggagcgc acacacacac aaccagatct cccccaaatc cacccgtcgg 960 cacctccgct tcaaggtacg ccgctcgtcc tccccccccc cccctctcta ccttctctag 1020 atcggcgttc cggtccatgg ttagggcccg gtagttctac ttctgttcat gtttgtgtta 1080 gatccgtgtt tgtgttagat ccgtgctgct agcgttcgta cacggatgcg acctgtacgt 1140 cagacacgtt ctgattgcta acttgccagt gtttctcttt ggggaatcct gggatggctc 1200 tagccgttcc gcagacggga tcgatttcat gatttttttt gtttcgttgc atagggtttg 1260 gtttgccctt ttcctttatt tcaatatatg ccgtgcactt gtttgtcggg tcatcttttc 1320 atgctttttt tttgtcttgg ttgtgatgat gtggtgtggt tgggcggtcg ttcattcgtt 1380 ctagatcgga gtagaatact gtttcaaact acctggtgta tttattaatt ttggaactgt 1440 atgtgtgtgt catacatctt catagttacg agtttaagat ggatggaaat atcgatctag 1500 gataggtata catgttgatg tgggttttac tgatgcatat acatgatggc atatgcagca 1560 tctattcata tgctctaacc ttgagtacct atctattata ataaacaagt atgttttata 1620 attattttga tcttgatata cttggatgat ggcatatgca gcagctatat gtggattttt 1680 ttagccctgc cttcatacgc tatttatttg cttggtactg tttcttttgt cgatgctcac 1740 cctgttgttt ggtgttactt ctgca 1765 <210> 10 <211> 253 <212> DNA <213> Artificial sequence <400> 10 gatcgttcaa acatttggca ataaagtttc ttaagattga atcctgttgc cggtcttgcg 60 atgattatca tataatttct gttgaattac gttaagcatg taataattaa catgtaatgc 120 atgacgttat ttatgagatg ggtttttatg attagagtcc cgcaattata catttaatac 180 gcgatagaaa acaaaatata gcgcgcaaac taggataaat tatcgcgcgc ggtgtcatct 240 atgttactag atc 253 <210> 11 <211> 990 <212> DNA <213> Artificial sequence <400> 11 gcaggctgtc gactggatcc aagcttaaga acgaactaag ccggacaaaa aaaggagcac 60 atatacaaac cggttttatt catgaatggt cacgatggat gatggggctc agacttgagc 120 tacgaggccg caggcgagag aagcctagtg tgctctctgc ttgtttgggc cgtaacggag 180 gatacggccg acgagcgtgt actaccgcgc gggatgccgc tgggcgctgc gggggccgtt 240 ggatggggat cggtgggtcg cgggagcgtt gaggggagac aggtttagta ccacctcgcc 300 taccgaacaa tgaagaaccc accttataac cccgcgcgct gccgcttgtg ttggctagga 360 tccatcgcag tcagcgatga gtacagcaag ttttagagct agaaatagca agttaaaata 420 aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtgcttttt tttgagattt 480 ccaaccaggt ccctggagcc catagtctag taacggccgc cagtgtgctg gaattgccct 540 tggatcatga accaacggcc tggctgtatt tggtggttgt gtagggagat ggggagaaga 600 aaagcccgat tctcttcgct gtgatgggct ggatgcatgc gggggagcgg gaggcccaag 660 tacgtgcacg gtgagcggcc cacagggcga gtgtgagcgc gagaggcggg aggaacagtt 720 tagtaccaca ttgcccagct aactcgaacg cgaccaactt ataaacccgc gcgctgtcgc 780 ttgtgtagag accaaaggag gtctcagttt tagagctaga aatagcaagt taaaataagg 840 ctagtccgtt atcaacttga aaaagtggca ccgagtcggt gctttttttt gtcccttcga 900 agggcaattc tgcagatatc catcacactg gcggccgctc gaggtcgacg gtatcgataa 960 gcttgatatc gaattcaccc agctttcttg 990 <210> 12 <211> 1095 <212> DNA <213> Artificial sequence <400> 12 atgtccgaag tggaatttag ccatgaatat tggatgcggc acgccctcac gcttgccaag 60 agagcctggg atgagaggga ggttcccgtc ggtgccgtgt tggtccataa caacagggtg 120 attggggaag gatggaacag acccattggg cgccatgatc caactgccca tgcagagatt 180 atggcgctca ggcaaggggg gttggttatg caaaactacc ggcttattga cgcaaccctg 240 tatgtcaccc ttgaaccctg tgttatgtgc gcgggggcca tgatacactc tcggataggg 300 cgggtggtgt tcggggctcg ggatgctaag accggagctg ctggttccct catggatgtc 360 ttgcatcatc ctggtatgaa ccatagagtc gagattactg aaggcattct cgcagacgaa 420 tgcgctgccc ttctctcaga tttctttaga atgcgcagac aggaaataaa ggctcaaaaa 480 aaagcacaga gttccacgga ttccggcggg tcgagcggtg gcagctccgg ctccgagaca 540 cccggtacga gtgaatccgc tacgcccgaa tcctcggggg gaagctctgg aggctcatca 600 gaagtcgagt tctcccatga gtattggatg aggcacgccc tcactcttgc gaagagggcc 660 agggacgaga gggaggtgcc ggtcggtgct gtcctggtct tgaataacag ggtgataggc 720 gaaggttgga acagggctat tggccttcat gaccctactg ctcatgcgga aatcatggca 780 cttagacagg ggggcctcgt tatgcaaaat taccgcctga tcgacgccac tctttatgtc 840 acatttgaac catgtgttat gtgtgcgggc gctatgatcc attcacgcat aggtcgcgtg 900 gtttttggag ttcgcaacgc gaaaacaggg gctgcaggct ctctgatgga cgttttgcac 960 tatccgggaa tgaaccatag agtcgaaatc acagaaggga ttttggcaga cgaatgcgcg 1020 gctcttcttt gttatttttt cagaatgccc cgccaagtgt ttaatgctca aaagaaagcg 1080 cagagtagca cagac 1095 <210> 13 <211> 501 <212> DNA <213> Artificial sequence <400> 13 atgtcagaag tcgagttctc ccatgagtat tggatgaggc acgccctcac tcttgcgaag 60 agggccaggg acgagaggga ggtgccggtc ggtgctgtcc tggtcttgaa taacagggtg 120 ataggcgaag gttggaacag ggctattggc cttcatgacc ctactgctca tgcggaaatc 180 atggcactta gacagggggg cctcgttatg caaaattacc gcctgatcga cgccactctt 240 tatgtcacat ttgaaccatg tgttatgtgt gcgggcgcta tgatccattc acgcataggt 300 cgcgtggttt ttggagttcg caacagtaaa cgtggggctg caggctctct gatgaacgtt 360 ttgaattatc cgggaatgaa ccatagagtc gaaatcacag aagggatttt ggcagacgaa 420 tgcgcggctc ttctttgtga tttttacaga atgccccgcc aagtgtttaa tgctcaaaag 480 aaagcgcaga gtagcatcaa c 501 <210> 14 <211> 30 <212> DNA <213> Artificial sequence <400> 14 gcggccacaa gctgctcagc ctcggcgacc 30 <210> 15 <211> 30 <212> DNA <213> Artificial sequence <400> 15 gcggccacaa gctgctcagc cccggcgacc 30 <210> 16 <211> 30 <212> DNA <213> Artificial sequence <400> 16 cagcctcacg cccggcagct ccgcggcgcg 30 <210> 17 <211> 30 <212> DNA <213> Artificial sequence <400> 17 cagcctcgcg cccggcagct ccgcggcgcg 30 <210> 18 <211> 31 <212> DNA <213> Artificial sequence <400> 18 gtgcaagaca ggataaacat gtttgagagt a 31 <210> 19 <211> 31 <212> DNA <213> Artificial sequence <400> 19 gtgcaaggcg ggataaacat gtttgagagt a 31 <210> 20 <211> 31 <212> DNA <213> Artificial sequence <400> 20 ccggaccagg gcgatgtcac gtcctccctg c 31 <210> 21 <211> 31 <212> DNA <213> Artificial sequence <400> 21 ccggaccagg gcgatgtcac gccctccctg c 31 <210> 22 <211> 30 <212> DNA <213> Artificial sequence <400> 22 ttgagcaaga gtacaccctc ctccagaagg 30 <210> 23 <211> 30 <212> DNA <213> Artificial sequence <400> 23 ttgagcgagg gtgcaccctc ctccagaagg 30 <210> 24 <211> 30 <212> DNA <213> Artificial sequence <400> 24 ttgagcgggg gtgcaccctc ctccagaagg 30 <210> 25 <211> 30 <212> DNA <213> Artificial sequence <400> 25 caatctccgg gcaatggagc tgtccggccc 30 <210> 26 <211> 30 <212> DNA <213> Artificial sequence <400> 26 caatctccgg gcaatggagc cgcccggccc 30 <210> 27 <211> 27 <212> DNA <213> Artificial sequence <400> 27 atcggacatg gagttcttta cggaata 27 <210> 28 <211> 27 <212> DNA <213> Artificial sequence <400> 28 atcggacgtg gagttcttta cggaata 27 <210> 29 <211> 27 <212> DNA <213> Artificial sequence <400> 29 atcgggcgtg gagttcttta cggaata 27 <210> 30 <211> 27 <212> DNA <213> Artificial sequence <400> 30 tttgtcctct agactattag ctatatg 27 <210> 31 <211> 27 <212> DNA <213> Artificial sequence <400> 31 tttgtcctct agactattag ccatatg 27 <210> 32 <211> 27 <212> DNA <213> Artificial sequence <400> 32 tttgtcctct agaccattag ccatatg 27 <210> 33 <211> 27 <212> DNA <213> Artificial sequence <400> 33 tttgtcctct agaccaccag ccatatg 27 <210> 34 <211> 28 <212> DNA <213> Artificial sequence <400> 34 caaatcctgc atcccattgt gtgtgcac 28 <210> 35 <211> 28 <212> DNA <213> Artificial sequence <400> 35 caaatcctgc atcccattgc gcgtgcac 28 <210> 36 <211> 28 <212> DNA <213> Artificial sequence <400> 36 caaatcctgc atcccattgc gcgcgcac 28 <210> 37 <211> 20 <212> DNA <213> Artificial sequence <400> 37 aagaacgaac taagccggac 20 <210> 38 <211> 42 <212> DNA <213> Artificial sequence <400> 38 gcaggctgtc gactggatcc aagcttaaga acgaactaag cc 42 <210> 39 <211> 42 <212> DNA <213> Artificial sequence <400> 39 caagaaagct gggtgaattc gatatcaagc ttatcgatac cg 42 <210> 40 <211> 42 <212> DNA <213> Artificial sequence <400> 40 cgaattcacc cagctttctt gtacaaagtt ggcattataa ga 42 <210> 41 <211> 55 <212> DNA <213> Artificial sequence <400> 41 cttagttcgt tcttaagctt ggatccagtc gacagcctgc ttttttgtac aaagt 55 <210> 42 <211> 23 <212> DNA <213> Artificial sequence <400> 42 gtgtgccgag gctgagcagc ttg 23 <210> 43 <211> 23 <212> DNA <213> Artificial sequence <400> 43 aaaccaagct gctcagcctc ggc 23 <210> 44 <211> 24 <212> DNA <213> Artificial sequence <400> 44 aaaccggagc tgccgggcgt gagc 24 <210> 45 <211> 24 <212> DNA <213> Artificial sequence <400> 45 gtgtggcaag agtacaccct cctc 24 <210> 46 <211> 24 <212> DNA <213> Artificial sequence <400> 46 aaacgaggag ggtgtactct tgcc 24 <210> 47 <211> 24 <212> DNA <213> Artificial sequence <400> 47 gtgtgcggac agctccattg cccg 24 <210> 48 <211> 24 <212> DNA <213> Artificial sequence <400> 48 aaaccgggca atggagctgt ccgc 24 <210> 49 <211> 24 <212> DNA <213> Artificial sequence <400> 49 tgttggagga cgtgacatcg ccct 24 <210> 50 <211> 24 <212> DNA <213> Artificial sequence <400> 50 aaacagggcg atgtcacgtc ctcc 24 <210> 51 <211> 24 <212> DNA <213> Artificial sequence <400> 51 gtgtgaagac aggataaaca tgtt 24 <210> 52 <211> 24 <212> DNA <213> Artificial sequence <400> 52 aaacaacatg tttatcctgt cttc 24 <210> 53 <211> 24 <212> DNA <213> Artificial sequence <400> 53 gtgtgggaca tggagttctt tacg 24 <210> 54 <211> 24 <212> DNA <213> Artificial sequence <400> 54 aaaccgtaaa gaactccatg tccc 24 <210> 55 <211> 24 <212> DNA <213> Artificial sequence <400> 55 gtgtgggaga agaagacgcg gatc 24 <210> 56 <211> 24 <212> DNA <213> Artificial sequence <400> 56 aaacgatccg cgtcttcttc tccc 24 <210> 57 <211> 24 <212> DNA <213> Artificial sequence <400> 57 gtgtgcacac acaatgggat gcag 24 <210> 58 <211> 24 <212> DNA <213> Artificial sequence <400> 58 aaacctgcat cccattgtgt gtgc 24 <210> 59 <211> 19 <212> DNA <213> Artificial sequence <400> 59 acatggagct gaggctgct 19 <210> 60 <211> 19 <212> DNA <213> Artificial sequence <400> 60 tgagcacgaa gtcgaggag 19 <210> 61 <211> 18 <212> DNA <213> Artificial sequence <400> 61 acgaccagca cgatcacc 18 <210> 62 <211> 21 <212> DNA <213> Artificial sequence <400> 62 tgctagcatg tctgcagctt a 21 <210> 63 <211> 24 <212> DNA <213> Artificial sequence <400> 63 gcgatcatct gttctaccta acct 24 <210> 64 <211> 22 <212> DNA <213> Artificial sequence <400> 64 tcccactgaa aaaccgatca ca 22 <210> 65 <211> 20 <212> DNA <213> Artificial sequence <400> 65 gcacgcatga cttagcaaaa 20 <210> 66 <211> 20 <212> DNA <213> Artificial sequence <400> 66 cctccagatt tgccagctat 20 <210> 67 <211> 20 <212> DNA <213> Artificial sequence <400> 67 aggtgcatcc agcaacaaat 20 <210> 68 <211> 20 <212> DNA <213> Artificial sequence <400> 68 cctccaaatt ggcagatgtt 20 <210> 69 <211> 21 <212> DNA <213> Artificial sequence <400> 69 tgtgtgccat tacagtttcc a 21 <210> 70 <211> 20 <212> DNA <213> Artificial sequence <400> 70 cctgaactcc cttcgggtag 20 <210> 71 <211> 21 <212> DNA <213> Artificial sequence <400> 71 ggaaatgatc cagtcacagg t 21 <210> 72 <211> 20 <212> DNA <213> Artificial sequence <400> 72 tcgggaacaa actccatgac 20 <210> 73 <211> 20 <212> DNA <213> Artificial sequence <400> 73 accattctga tgccaactcc 20 <210> 74 <211> 20 <212> DNA <213> Artificial sequence <400> 74 cgtgtgttgt accggaactg 20 <210> 75 <211> 22 <212> DNA <213> Artificial sequence <400> 75 gccgaggctg agcagcttgt gg 22 <210> 76 <211> 22 <212> DNA <213> Artificial sequence <400> 76 ctcacgcccg gcagctccgc gg 22 <210> 77 <211> 22 <212> DNA <213> Artificial sequence <400> 77 gcaagagtac accctcctcc ag 22 <210> 78 <211> 22 <212> DNA <213> Artificial sequence <400> 78 cggacagctc cattgcccgg ag 22 <210> 79 <211> 22 <212> DNA <213> Artificial sequence <400> 79 gaggacgtga catcgccctg gt 22 <210> 80 <211> 22 <212> DNA <213> Artificial sequence <400> 80 aagacaggat aaacatgttt ga 22 <210> 81 <211> 22 <212> DNA <213> Artificial sequence <400> 81 ggacatggag ttctttacgg aa 22 <210> 82 <211> 22 <212> DNA <213> Artificial sequence <400> 82 ggagaagaag acgcggatcc ac 22 <210> 83 <211> 22 <212> DNA <213> Artificial sequence <400> 83 cacacacaat gggatgcagg at 22 <210> 84 <211> 24 <212> DNA <213> Artificial sequence <400> 84 gtgtgctcac gcccggcagc tccg 24

Claims (12)

  1. 단백질에 있어서,
    상기 단백질의 아미노산 서열이 서열 목록 중 서열 2(SEQ ID No.2)의 위치 1-167인 것을 특징으로 하는 단백질.
  2. 제1항에 따른 단백질 관련 생체물질에 있어서,
    이하 B1) 내지 B7) 중 적어도 하나이고,
    B1) 상기 단백질을 암호화하는 핵산 분자;
    B2) B1)에 따른 핵산 분자를 포함하는 발현 카세트;
    B3) B1)에 따른 핵산 분자를 포함하는 재조합 벡터 또는 B2)에 따른 발현 카세트를 포함하는 재조합 벡터;
    B4) B1)에 따른 핵산 분자를 포함하는 재조합 미생물, B2)에 따른 발현 카세트를 포함하는 재조합 미생물 또는 B3)에 따른 재조합 벡터를 포함하는 재조합 미생물;
    B5) B1)에 따른 핵산 분자를 포함하는 형질전환 식물 세포주, B2)에 따른 발현 카세트를 포함하는 형질전환 식물 세포주 또는 B3)에 따른 재조합 벡터를 포함하는 형질전환 식물 세포주;
    B6) B1)에 따른 핵산 분자를 포함하는 형질전환 식물 조직, B2)에 따른 발현 카세트를 포함하는 형질전환 식물 조직 또는 B3)에 따른 재조합 벡터를 포함하는 형질전환 식물 조직;
    B7) B1)에 따른 핵산 분자를 포함하는 형질전환 식물 기관, B2)에 따른 발현 카세트를 포함하는 형질전환 식물 기관 또는 B3)에 따른 재조합 벡터를 포함하는 형질전환 식물 기관'인 것을 특징으로 하는 생체물질.
  3. 제2항에 있어서,
    B1)에 따른 핵산 분자는 다음과 같이 B11) 또는 B12)에 표시된 유전자이고,
    B11) 암호화 가닥의 암호화 서열(CDS)이 서열 1의 위치 7-507에 표시된 cDNA 분자 또는 DNA 분자인 유전자;
    B12) B11)에 정의된 뉴클레오티드 서열과 80% 이상의 동일성을 가지며 상기 단백질의 cDNA 분자 또는 DNA 분자를 암호화하는 유전자인 것을 특징으로 하는 생체물질.
  4. 융합 단백질에 있어서,
    상기 융합 단백질은 Cas 단백질 및 아데노신 데아미나제를 함유하는 단백질이며, 상기 아데노신 데아미나제는 제1항에 따른 단백질인 것을 특징으로 하는 융합 단백질.
  5. 제4항에 있어서,
    상기 Cas 단백질은 ScCas9(D10A), SpRY(D10A), SpCas9(D10A) 또는 SpCas9-NG(D10A)인 것을 특징으로 하는 융합 단백질.
  6. 제4항 또는 제5항에 있어서,
    상기 융합 단백질은 상기 아데노신 데아미나제, 상기 Cas 단백질 및 핵 국소화 신호로 연결된 단백질인 것을 특징으로 하는 융합 단백질.
  7. 제6항에 있어서,
    상기 융합 단백질은 TadA9-ScCas9(D10A), TadA9-SpRY(D10A), TadA9-SpCas9(D10A) 또는 TadA9-SpCas9-NG(D10A)이고, 상기 TadA9-SpCas9(D10A)는 아미노산 서열이 서열 2인 단백질이고, 상기 TadA9-SpCas9-NG(D10A)는 아미노산 서열이 서열 4인 단백질이고, 상기 TadA9-ScCas9(D10A)는 아미노산 서열이 서열 6인 단백질이고, 상기 TadA9-SpRY(D10A)는 아미노산 서열이 서열 8인 단백질인 것을 특징으로 하는 융합 단백질.
  8. 제4항 내지 제7항 중 어느 한 항에 따른 융합 단백질 관련 생체물질에 있어서,
    이하 D1) 내지 D7) 중 적어도 하나이고,
    D1) 상기 아데닌 염기 편집기를 암호화하는 핵산 분자;
    D2) D1)에 따른 핵산 분자를 포함하는 발현 카세트;
    D3) D1)에 따른 핵산 분자를 포함하는 재조합 벡터 또는 D2)에 따른 발현 카세트를 포함하는 재조합 벡터;
    D4) D1)에 따른 핵산 분자를 포함하는 재조합 미생물, D2)에 따른 발현 카세트를 포함하는 재조합 미생물 또는 D3)에 따른 재조합 벡터를 포함하는 재조합 미생물;
    D5) D1)에 따른 핵산 분자를 포함하는 형질전환 식물 세포주, D2)에 따른 발현 카세트를 포함하는 형질전환 식물 세포주 또는 D3)에 따른 재조합 벡터를 포함하는 형질전환 식물 세포주;
    D6) D1)에 따른 핵산 분자를 포함하는 형질전환 식물 조직, D2)에 따른 발현 카세트를 포함하는 형질전환 식물 조직 또는 D3)에 따른 재조합 벡터를 포함하는 형질전환 식물 조직;
    D7) D1)에 따른 핵산 분자를 포함하는 형질전환 식물 기관, D2)에 따른 발현 카세트를 포함하는 형질전환 식물 기관 또는 D3)에 따른 재조합 벡터를 포함하는 형질전환 식물 기관;인 것을 특징으로 하는 생체물질.
  9. 제8항에 있어서,
    D1)에 따른 DNA 분자는 제4항에 따른 TadA9-ScCas9(D10A)의 암호화 유전자, TadA9-SpRY(D10A)의 암호화 유전자, TadA9-SpCas9(D10A)의 암호화 유전자 또는 TadA9-SpCas9-NG(D10A)의 암호화 유전자이고,
    상기 TadA9-SpCas9(D10A)의 암호화 유전자는 다음과 같은 유전자 중 어느 하나일 수 있고,
    D131) 암호화 가닥의 암호화 서열이 서열 1의 위치 7-4737에 표시된 cDNA 분자 또는 DNA 분자인 유전자;
    D132) D131)에 정의된 뉴클레오티드 서열과 80% 이상의 동일성을 가지며 상기 TadA9-SpCas9(D10A)의 cDNA 분자 또는 DNA 분자를 암호화하는 유전자;
    상기 TadA9-SpCas9-NG(D10A)의 암호화 유전자는 다음과 같은 유전자 중 어느 하나일 수 있고,
    D141) 암호화 가닥의 암호화 서열이 서열 3의 위치 7-4737에 표시된 cDNA 분자 또는 DNA 분자인 유전자;
    D142) D141)에 정의된 뉴클레오티드 서열과 80% 이상의 동일성을 가지며 상기 TadA9-SpCas9(D10A)의 cDNA 분자 또는 DNA 분자를 암호화하는 유전자;
    상기 TadA9-ScCas9(D10A)의 암호화 유전자는 다음과 같은 유전자 중 어느 하나일 수 있고,
    D111) 암호화 가닥의 암호화 서열이 서열 5의 위치 7-4758에 표시된 cDNA 분자 또는 DNA 분자인 유전자,
    D112) D111)에 정의된 뉴클레오티드 서열과 80% 이상의 동일성을 가지며 상기 TadA9-ScCas9(D10A)의 cDNA 분자 또는 DNA 분자를 암호화하는 유전자;
    상기 TadA9-SpRY(D10A)의 암호화 유전자는 다음과 같은 유전자 중 어느 하나일 수 있고,
    D121) 암호화 가닥의 암호화 서열이 서열 7의 위치 7-4737에 표시된 cDNA 분자 또는 DNA 분자인 유전자;
    D122) D121)에 정의된 뉴클레오티드 서열과 80% 이상의 동일성을 가지며 상기 TadA9-SpRY(D10A)의 cDNA 분자 또는 DNA 분자를 암호화하는 유전자;인 것을 특징으로 하는 생체물질.
  10. 제1항에 따른 단백질, 제2항 또는 제3항에 따른 생체물질, 제4항 내지 제7항 중 어느 한 항에 따른 융합 단백질 또는 제8항 또는 제9항에 따른 생체물질의 식물 단일 염기 편집에서의 응용.
  11. 제10항에 있어서,
    상기 식물 단일 염기 편집은 식물 게놈의 A를 G로 부위지정 돌연변이시키는 것을 특징으로 하는 응용.
  12. 식물 게놈 상의 A를 G로 부위지정 돌연변이시키는 방법에 있어서,
    상기 아데닌 염기 편집기 및 sgRNA를 발현하는 DNA 분자를 수용체 식물에 도입하여 A를 G로 부위지정 돌연변이시킨 표적 식물을 얻는 단계를 포함하고; 상기 sgRNA의 표적 서열은 이고, 상기 N19-20은 19-20개의 N이고, 상기 PAM은 3개의 N이고; 상기 N은 A, G, C 또는 T인 것을 특징으로 하는 식물 게놈 상의 A를 G로 부위지정 돌연변이시키는 방법
KR1020237020153A 2020-11-20 2021-06-03 아데노신 데아미나제 및 관련 생체물질과 응용 KR20230135047A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN202011308944.7A CN112126637B (zh) 2020-11-20 2020-11-20 腺苷脱氨酶及其相关生物材料与应用
CN202011308944.7 2020-11-20
PCT/CN2021/098034 WO2022105190A1 (zh) 2020-11-20 2021-06-03 腺苷脱氨酶及其相关生物材料与应用

Publications (1)

Publication Number Publication Date
KR20230135047A true KR20230135047A (ko) 2023-09-22

Family

ID=73852107

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020237020153A KR20230135047A (ko) 2020-11-20 2021-06-03 아데노신 데아미나제 및 관련 생체물질과 응용

Country Status (4)

Country Link
JP (1) JP2023550932A (ko)
KR (1) KR20230135047A (ko)
CN (2) CN112126637B (ko)
WO (1) WO2022105190A1 (ko)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112126637B (zh) * 2020-11-20 2021-02-09 中国农业科学院植物保护研究所 腺苷脱氨酶及其相关生物材料与应用
CN113699135B (zh) * 2021-08-10 2022-05-24 国家卫生健康委科学技术研究所 一种无pam限制的腺嘌呤碱基编辑器融合蛋白及应用
CN114438110B (zh) * 2022-01-25 2023-08-04 浙江大学杭州国际科创中心 一种精确无pam限制的腺嘌呤碱基编辑器及其构建方法
WO2023163806A1 (en) * 2022-02-22 2023-08-31 Massachusetts Institute Of Technology Engineered nucleases and methods of use thereof
CN114606227B (zh) * 2022-02-22 2024-03-08 复旦大学 高精度腺嘌呤碱基编辑器及其应用
WO2023187027A1 (en) * 2022-03-30 2023-10-05 BASF Agricultural Solutions Seed US LLC Optimized base editors
CN115725533B (zh) * 2022-11-18 2023-08-25 中国农业科学院作物科学研究所 一种获得抗草甘膦水稻的方法及其所用双碱基融合编辑系统

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019226953A1 (en) * 2018-05-23 2019-11-28 The Broad Institute, Inc. Base editors and uses thereof
CN110607320B (zh) * 2018-11-23 2023-05-12 电子科技大学 一种植物基因组定向碱基编辑骨架载体及其应用
WO2020214842A1 (en) * 2019-04-17 2020-10-22 The Broad Institute, Inc. Adenine base editors with reduced off-target effects
CN110029096B (zh) * 2019-05-09 2023-05-12 上海科技大学 一种腺嘌呤碱基编辑工具及其用途
CN112126637B (zh) * 2020-11-20 2021-02-09 中国农业科学院植物保护研究所 腺苷脱氨酶及其相关生物材料与应用

Also Published As

Publication number Publication date
WO2022105190A1 (zh) 2022-05-27
CN112852791A (zh) 2021-05-28
CN112126637B (zh) 2021-02-09
CN112852791B (zh) 2022-05-24
CN112126637A (zh) 2020-12-25
JP2023550932A (ja) 2023-12-06

Similar Documents

Publication Publication Date Title
KR20230135047A (ko) 아데노신 데아미나제 및 관련 생체물질과 응용
AU2021231074C1 (en) Class II, type V CRISPR systems
CN112143753A (zh) 一套腺嘌呤碱基编辑器及其相关生物材料与应用
KR20200078685A (ko) 부위-특이적인 뉴클레오티드 치환을 통해 글리포세이트-내성 벼를 수득하는 방법
CN107027313A (zh) 用于多元rna引导的基因组编辑和其它rna技术的方法和组合物
CN105132451A (zh) 一种CRISPR/Cas9单一转录单元定向修饰骨架载体及其应用
JP2015500648A (ja) 所定の標的核酸配列を修飾するための組成物及び方法
CN110526993B (zh) 一种用于基因编辑的核酸构建物
CN115315516B (zh) 一种提高植物遗传转化和基因编辑效率的方法
WO2019205939A1 (zh) 一种重复片段介导的植物定点重组方法
WO2021178934A1 (en) Class ii, type v crispr systems
JP2022534381A (ja) ゲノム編集を使用してドミナントアレルを生成する方法及び組成物
US20220315938A1 (en) AUGMENTED sgRNAS AND METHODS FOR THEIR USE TO ENHANCE SOMATIC AND GERMLINE PLANT GENOME ENGINEERING
JP2023515116A (ja) ゲノム編集のための新規なcrispr-casシステム
KR102151064B1 (ko) 매칭된 5&#39; 뉴클레오타이드를 포함하는 가이드 rna를 포함하는 유전자 교정용 조성물 및 이를 이용한 유전자 교정 방법
JP2020533989A (ja) ポテックスウイルスベクターの安定性を改善する方法
CN112080513A (zh) 一套编辑范围扩展的水稻人工基因组编辑系统及其应用
CN115851784B (zh) 一种利用Lbcpf1变体构建的植物胞嘧啶碱基编辑系统及其应用
US20230272408A1 (en) Plastid transformation by complementation of plastid mutations
CN116478993A (zh) 一种植物cgbe碱基编辑系统及其应用
CN117222741A (zh) 位点特异性基因组修饰技术
EP4244343A1 (en) Methods to improve site-directed integration frequency
EP1458872A1 (en) An efficient system for rna silencing
CN112105732A (zh) 用于多核苷酸的靶向编辑的方法和组合物
CA2689535A1 (en) Viral vector and use thereof