KR20220066111A - Dna 염기 편집을 위한 방법 및 조성물 - Google Patents

Dna 염기 편집을 위한 방법 및 조성물 Download PDF

Info

Publication number
KR20220066111A
KR20220066111A KR1020227012388A KR20227012388A KR20220066111A KR 20220066111 A KR20220066111 A KR 20220066111A KR 1020227012388 A KR1020227012388 A KR 1020227012388A KR 20227012388 A KR20227012388 A KR 20227012388A KR 20220066111 A KR20220066111 A KR 20220066111A
Authority
KR
South Korea
Prior art keywords
lys
leu
glu
ile
ser
Prior art date
Application number
KR1020227012388A
Other languages
English (en)
Inventor
지안핑 쑤
지앙 리
Original Assignee
신젠타 크롭 프로텍션 아게
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 신젠타 크롭 프로텍션 아게 filed Critical 신젠타 크롭 프로텍션 아게
Publication of KR20220066111A publication Critical patent/KR20220066111A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/62DNA sequences coding for fusion proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/01Preparation of mutants without inserting foreign genetic material therein; Screening processes therefor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8201Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
    • C12N15/8213Targeted insertion of genes into the plant genome by homologous recombination
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8242Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
    • C12N15/8243Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine
    • C12N15/8245Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine involving modified carbohydrate or sugar alcohol metabolism, e.g. starch biosynthesis
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/78Hydrolases (3) acting on carbon to nitrogen bonds other than peptide bonds (3.5)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y305/00Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
    • C12Y305/04Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in cyclic amidines (3.5.4)
    • C12Y305/04005Cytidine deaminase (3.5.4.5)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/09Fusion polypeptide containing a localisation/targetting motif containing a nuclear localisation signal
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/80Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Cell Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Nutrition Science (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Peptides Or Proteins (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

본 발명은 세포의 게놈에서 표적 부위를 변형시키기 위한 방법 및 조성물에 관한 것이다. 개선된 링커 서열에 의해 연결된, 하나 이상의 DNA 결합 도메인 및 하나 이상의 이종성 도메인, 예컨대, DNA 변형 도메인을 포함하는 융합 단백질이 제공된다. 개선된 링커 서열에 의해 연결된 하나 이상의 DNA 결합 도메인 및 하나 이상의 이종성 도메인을 포함하는 융합 단백질을 인코딩하는 코돈 최적화된 폴리뉴클레오티드가 제공된다.

Description

DNA 염기 편집을 위한 방법 및 조성물
발명의 분야
본 발명은 세포의 게놈에서 표적화된 뉴클레오티드 염기 편집을 위한 방법 및 조성물에 관한 것이다.
서열 목록의 전자 제출에 관한 진술
37 C.F.R. § 1.821하에서 제출된, 약 702 킬로바이트인 2020년 9월 18일에 생성된 "81945_ST25"라는 명칭의 ASCII 텍스트 형식의 서열 목록은 명세서와 함께 첨부되고 파일링되었으며, 본원에 참고로 포함된다.
농업에서는 유리한 대립 유전자를 생성하기 위해 식물의 게놈을 편집할 수 있는 능력을 갖는 것이 매우 필요하다. 수확량을 늘리거나 질병을 예방하는 것이 가능할 수 있다. 게놈 편집은 식물의 발전이 뒤처지고 있는 새로운 분야이다. 또한, 의도된 변경 이외의 게놈에 대한 변경은 요망되는 변경의 적용을 제한하는 문제가 된다. CRISPR-CAS9는 DNA에 이중 가닥 절단을 가함으로써 작용한다. 이러한 파손은 비-상동성 말단 접합 또는 상동성 의존적 복구에 의해 복구되기 때문에, DNA 염기 삽입 또는 결실이 발생할 수 있다. 염기 편집이라 불리는 전략은 절단 및 삽입 및 결실의 생성 없이 DNA를 변경한다. 한 버전에서, 시티딘 데아미나제라 불리는 효소는 DNA를 절단할 수 없도록 변경된 CAS9(Shimatani et al, 2017. Nat. Biotechnol. 35, 441-443) 또는 CAS12a(Li et al, 2018. Nat. Biotechnol. 36, 324-327) 효소에 의해 특정 염기에 표적화된다. 시티딘 데아미나제 및 뉴클레아제 결핍 CAS9 또는 CAS12a는 아미노산 링커를 통해 연결에 의해 함께 융합된다. 링커 연결의 개선은, 예컨대, 표적외 염기 변경을 감소시킴으로써 절단의 정밀도를 개선함으로써 융합 단백질의 기능을 개선할 수 있다.
개선을 위해 이러한 요구를 충족시키기 위해, 최적화되고 개선된 Cas12a 효소 및 작제물이 제공된다. 구체적으로, 이종성 도메인, 제1 링커 서열, 및 V형 CRISPR-Cas 효소를 포함하는 융합 단백질이 제공된다. 제1 링커 서열은 반복된 GGGGS 서열을 포함한다. 이종성 도메인은 데아미나제, 폴리머라제, 뉴클레아제, 릴랙사제, 알킬트랜스퍼라제, 메틸트랜스퍼라제, 아데노신 데아미나제, 시티딘 데아미나제, 옥시다제, 티민 알킬트랜스퍼라제, 아데닌 옥시다제, 아데노신 메틸트랜스퍼라제, 글리코실라제 또는 핵 국재화 신호일 수 있다. 염기 편집을 위해, 이종성 도메인은 데아미나제 도메인, 예컨대, 시티딘 데아미나제 또는 아데닌 데아미나제이다. 시티딘 데아미나제 도메인은, 예컨대, 데아미나제의 APOBEC1 패밀리로부터의 활성화-유도 시티딘 데아미나제("AID"), 또는 아포리포단백질 B mRNA-편집 복합체("APOBEC") 도메인일 수 있다. 일부 맥락에서, APOBEC 도메인은 SEQ ID NO: 1과 적어도 70% 동일한 서열을 포함한다. 아데닌 데아미나제가 필요한 경우, 아데닌 데아미나제는 SEQ ID NO: 92와 적어도 70% 동일한 아미노산 서열을 포함하는 TadA 도메인일 수 있다.
V형 CRISPR-Cas 효소가 V-A형("Cas12a") 효소인 경우, Cas12a는 SEQ ID NO: 3, SEQ ID NO: 6, SEQ ID NO: 22, SEQ ID NO: 45, SEQ ID NO: 46, SEQ ID NO: 47, 및 SEQ ID NO: 48로 구성된 군으로부터 선택된다. Cas12a 도메인은 촉매적 비활성일 수 있지만, 여전히 표적 DNA에 결합하고, 이종성 도메인이 작동되게 한다. Cas12a가 비활성인 경우, 이의 서열은 SEQ ID NO: 3, SEQ ID NO: 6, 또는 SEQ ID NO: 22이다.
이종성 도메인과 Cas12a 효소 사이의 제1 링커 서열은 적어도 3 회 반복된 GGGGS를 포함할 수 있다. 다른 사용에서, 제1 링커 서열은 적어도 6 회 반복된 GGGGS를 포함할 수 있다.
융합 단백질은 SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 13, 또는 SEQ ID NO: 44를 포함할 수 있고, 이는 또한 우라실 DNA 글리코실라제 억제제("UGI") 도메인(SEQ ID NO: 8로 표현된 바와 같음)을 포함할 수 있다. UGI 도메인은 서열 SGGS를 포함하는 제2 링커에 의해 Cas12a 효소에 연결될 수 있다. 융합 단백질은 SEQ ID NO: 17, SEQ ID NO: 24, SEQ ID NO: 35, SEQ ID NO: 39, SEQ ID NO: 43, SEQ ID NO: 50, SEQ ID NO: 52, SEQ ID NO: 54, SEQ ID NO: 56, SEQ ID NO: 81, SEQ ID NO: 83, SEQ ID NO: 85, SEQ ID NO:87, 또는 SEQ ID NO:89를 포함할 수 있다. 이들 융합 단백질은, DNA와 접촉될 때, 반복된 GGGGS 서열의 제1 링커 서열이 결여된 종래 기술의 융합 단백질에 비해, 증가된 빈도로 표적내 편집을 생성하고 감소된 빈도로 표적외 편집을 생성한다.
또한, 식물 게놈 DNA를 (a) 선택적으로 UGI 도메인을 포함하여 상기 양태들 중 하나에 의해 기재된 바와 같은 융합 단백질; 및 (b) 단계 (a)의 융합 단백질을 식물 게놈 DNA의 표적 DNA 서열에 표적화하는 가이드 RNA("gRNA")와 접촉시킴으로써 식물 게놈 DNA를 편집하는 방법으로서, 편집된 식물 게놈 DNA는 반복된 GGGGS 서열 이외의 제1 링커를 갖는 융합 단백질에 의해 편집된 식물 게놈 DNA에 비해 감소된 표적외 편집을 포함하는, 방법이 제공된다.
또한, 식물 게놈 DNA를 (a) 선택적으로 UGI 도메인을 포함하여 상기 양태들 중 하나에 의해 기재된 바와 같은 융합 단백질; 및 (b) 단계 (a)의 융합 단백질을 식물 게놈 DNA의 표적 DNA 서열에 표적화하는 가이드 RNA("gRNA")와 접촉시킴으로써 감소된 표적외 편집으로 식물 게놈 DNA를 편집하는 방법으로서, 편집된 식물 게놈 DNA는 반복된 GGGGS 서열 이외의 제1 링커를 갖는 융합 단백질에 의해 편집된 식물 게놈 DNA에 비해 감소된 표적외 편집을 포함하는, 방법이 제공된다. 일 양태에서, 융합 단백질은 SEQ ID NO: 24를 포함한다.
또한, (a) 편집될 게놈 DNA를 포함하는 식물 세포 집단을 수득하는 단계; (b) 상기 양태들 중 하나 및 선택적으로 UGI 도메인에 의해 기술된 바와 같은 융합 단백질을 인코딩하는 뉴클레오티드 서열을 수득하는 단계; (c) 식물 세포의 집단을 단계 (b)의 뉴클레오티드 서열로 형질 전환함으로써, 식물 세포의 집단 내에서 핵산 서열에 의해 인코딩되는 융합 단백질을 발현하는 단계; (d) 형질 전환된 식물 세포 집단을 식물로 성장시키는 단계로서, 식물의 적어도 하나가 편집되는 단계; 및 (e) 단계 (d)의 생성물로부터 적어도 하나의 편집된 식물을 선택함으로써, 편집된 식물의 집단을 수득하는 단계로서, 편집된 식물의 집단은 반복된 GGGGS 서열 이외의 제1 링커를 갖는 융합 단백질에 의해 편집된 식물에 비해 감소된 표적외 편집을 포함하는 단계에 의해, 감소된 표적외 편집으로 편집된 식물의 집단을 수득하는 방법이 제공된다. 일 양태에서, 융합 단백질을 인코딩하는 뉴클레오티드 서열은 SEQ ID NO: 17, SEQ ID NO: 24, SEQ ID NO: 35, SEQ ID NO: 39, SEQ ID NO: 43, SEQ ID NO: 50, SEQ ID NO: 52, SEQ ID NO: 54, SEQ ID NO: 56, SEQ ID NO: 81, SEQ ID NO: 83, SEQ ID NO: 85, SEQ ID NO:87, 또는 SEQ ID NO:89를 포함한다.
도 1은 Cas12aBE에 대한 세 가지 버전의 DNA 작제물의 개략도를 보여주는 것이다. (1)은 프로모터를 나타내고; (2)는 핵 국재화 신호를 나타내고; (3)은 데아미나제, 예를 들어, APOBEC 데아미나제이고; (4)는 XTEN 링커이고; (5)는 LbCas12a이고; (6)은 SGGS 링커이고; (7)은 우라실 글리코실라제 억제제이고; (8)은 긴 링커, 예를 들어, (G4S)6 링커이고; (9)는 Mb2Cas12a이고; (10)은 가이드 RNA-인코딩 요소이다. 도 1a는 5'에서 3' 방향의 LbCas12aBE + 가이드 RNA 작제물을 보여주는 것이고, 여기서 데아미나제(3)는 XTEN 링커(4)에 의해 LbCas12a(5)에 작동 가능하게 연결된다. 도 1b는 5'에서 3' 방향의 LbCas12aBE + 가이드 RNA 작제물을 보여주는 것이고, 여기서 데아미나제(3)는 (G4S)6 링커(8)에 의해 LbCas12a(5)에 작동 가능하게 연결된다. 도 1c는 5'에서 3' 방향으로 Mb2Cas12aBE + 가이드 RNA 작제물을 보여주는 것이고, 여기서 데아미나제(3)는 (G4S)6 링커(8)에 의해 Mb2Cas12a(9)에 작동 가능하게 연결된다.
도 2는 Cas12aBE 및 다중화된 가이드 RNA를 포함하는 5'에서 3' 방향의 DNA 작제물의 개략도를 보여주는 것이다. (1)은 프로모터를 나타내고; (2)는 핵 국재화 신호이고; (3)은 데아미나제, 예를 들어, APOBEC 데아미나제이고; (6)은 SGGS 링커이고; (7)은 우라실 글리코실라제 억제제이고; (8)은 긴 링커, 예를 들어, (G4S)6 링커이고; (9)는 Cas12a이고; (10)은 제1 가이드 RNA-인코딩 요소이고; (11)은 제2 가이드 RNA-인코딩 요소이고; (12)는 제3 가이드 RNA-인코딩 요소이다. 각각의 가이드 RNA-인코딩 요소는 게놈 표적 DNA 서열에 혼성화될 수 있는 crRNA 세그먼트 및 표적 서열 세그먼트를 포함한다.
서열 목록의 서열에 대한 간략한 설명
SEQ ID NO: 1은 Apobec1의 아미노산 서열이다.
SEQ ID NO: 2는 Apobec1의 뉴클레오티드 서열이다.
SEQ ID NO: 3은 촉매적 비활성 Mb2Cas12a의 아미노산 서열이다.
SEQ ID NO: 4는 촉매적 비활성 Mb2Cas12a의 뉴클레오티드 서열이다.
SEQ ID NO: 5는 촉매적 비활성 cLbCas12aBE의 뉴클레오티드 서열이다.
SEQ ID NO: 6은 촉매적 비활성 cLbCas12aBE의 아미노산 서열이다.
SEQ ID NO: 7은 우라실 DNA 글리코실라제 억제제(UGI)의 뉴클레오티드 서열이다.
SEQ ID NO: 8은 우라실 DNA 글리코실라제 억제제(UGI)의 아미노산 서열이다.
SEQ ID NO: 9는 발현 카세트 prSoUbi4:SV40NLS:cLbCas12aBE:GS6링커:SV40NLS:SGGS링커:UGI:SGGS링커:SV40NLS:tNOS를 포함하는 뉴클레오티드 서열이다.
SEQ ID NO: 10은 뉴클레오티드 서열 최적화된 (G4S)x6 링커이다.
SEQ ID NO: 11은 최적화된 (G4S)x6 링커에 대한 아미노산 서열이다.
SEQ ID NO: 12는 18 aa 링커-SX에 대한 아미노산 서열이다.
SEQ ID NO: 13은 15 aa 링커-(G4S)X3에 대한 아미노산 서열이다.
SEQ ID NO: 14는 작제물 25057로부터의 융합 단백질 cLBCas12aBE-07을 포함하는 뉴클레오티드 서열이다.
SEQ ID NO: 15는 작제물 25057로부터의 융합 단백질 cLBCas12aBE-07을 포함하는 아미노산 서열이다.
SEQ ID NO: 16은 작제물 25058로부터의 융합 단백질 cLBCas12aBE-08을 포함하는 뉴클레오티드 서열이다.
SEQ ID NO: 17은 작제물 25058로부터의 융합 단백질 cLBCas12aBE-08을 포함하는 아미노산 서열이다.
SEQ ID NO: 18은 작제물 24524로부터의 융합 단백질 cLBCas12aBE-01을 포함하는 뉴클레오티드 서열이다.
SEQ ID NO: 19는 작제물 24524로부터의 융합 단백질 cLBCas12aBE-01을 포함하는 아미노산 서열이다.
SEQ ID NO: 20은 cCas9BE-02에 대한 뉴클레오티드 서열이다.
SEQ ID NO: 21은 cCas9BE-02에 대한 아미노산 서열이다.
SEQ ID NO: 22는 촉매적 비활성 AsCas12a에 대한 아미노산 서열이다.
SEQ ID NO: 23은 작제물 24904로부터의 융합 단백질 cLBCas12aBE-06을 포함하는 뉴클레오티드 서열이다.
SEQ ID NO: 24는 작제물 24904로부터의 융합 단백질 cLBCas12aBE-06을 포함하는 아미노산 서열이다.
SEQ ID NO: 25는 프로모터 prSoUbi4-02를 포함하는 뉴클레오티드 서열이다.
SEQ ID NO: 26은 Cas12a gRNA waxy1 표적 서열을 포함하는 뉴클레오티드 서열이다.
SEQ ID NO: 27은 Cas9 gRNA waxy1 표적 서열을 포함하는 뉴클레오티드 서열이다.
SEQ ID NO: 28은 ZmWaxy1 유전자 엑손 4를 포함하는 뉴클레오티드 서열이다.
SEQ ID NO: 29는 ZmWaxy1에 대한 포워드 프라이머이다.
SEQ ID NO: 30은 ZmWaxy1에 대한 리버스 프라이머이다.
SEQ ID NO: 31은 ZmWaxy1에 대한 시퀀싱 프라이머이다.
SEQ ID NO: 32는 작제물 24523로부터의 융합 단백질 cLbCpf1-02를 포함하는 뉴클레오티드 서열이다.
SEQ ID NO: 33은 작제물 24523로부터의 융합 단백질 cLbCpf1-02를 포함하는 아미노산 서열이다.
SEQ ID NO: 34는 작제물 25181로부터의 융합 단백질 cLbCas12a-05를 포함하는 뉴클레오티드 서열이다.
SEQ ID NO: 35는 작제물 25181로부터의 융합 단백질 cLbCas12a-05를 포함하는 아미노산 서열이다.
SEQ ID NO: 36은 작제물 25205로부터의 융합 단백질 cLbCas12a-02를 포함하는 뉴클레오티드 서열이다.
SEQ ID NO: 37은 작제물 25205로부터의 융합 단백질 cLbCas12a-02를 포함하는 아미노산 서열이다.
SEQ ID NO: 38은 작제물 25513으로부터의 융합 단백질 cLbCas12a-25를 포함하는 뉴클레오티드 서열이다.
SEQ ID NO: 39는 작제물 25513으로부터의 융합 단백질 cLbCas12a-25를 포함하는 아미노산 서열이다.
SEQ ID NO: 40은 작제물 25220으로부터의 융합 단백질 cMb2Cas12a-01을 포함하는 뉴클레오티드 서열이다.
SEQ ID NO: 41은 작제물 25220으로부터의 융합 단백질 cMb2Cas12a-01을 포함하는 아미노산 서열이다.
SEQ ID NO: 42는 작제물 25382으로부터의 융합 단백질 cMb2Cas12a-02를 포함하는 뉴클레오티드 서열이다.
SEQ ID NO: 43은 작제물 25382로부터의 융합 단백질 cMb2Cas12a-02를 포함하는 아미노산 서열이다.
SEQ ID NO: 44는 최적화된 (G4SG)x6 링커에 대한 아미노산 서열이다.
SEQ ID NO: 45는 활성 LbCas12a에 대한 아미노산 서열이다.
SEQ ID NO: 46은 활성 Mb2Cas12a에 대한 아미노산 서열이다.
SEQ ID NO: 47은 활성 AsCas12a에 대한 아미노산 서열이다.
SEQ ID NO: 48은 활성 FnCas12a에 대한 아미노산 서열이다.
SEQ ID NO: 49는 작제물 25457로부터의 융합 단백질 cMb2Cas12a-BE-01을 포함하는 뉴클레오티드 서열이다.
SEQ ID NO: 50은 작제물 25457로부터의 융합 단백질 cMb2Cas12a-BE-01을 포함하는 아미노산 서열이다.
SEQ ID NO: 51은 작제물 25268로부터의 융합 단백질 cLbCas12a-BE-08을 포함하는 뉴클레오티드 서열이다.
SEQ ID NO: 52는 작제물 25268로부터의 융합 단백질 cLbCas12a-BE-08을 포함하는 아미노산 서열이다.
SEQ ID NO: 53은 작제물 25173으로부터의 융합 단백질 cLbCas12a-05를 포함하는 뉴클레오티드 서열이다.
SEQ ID NO: 54는 작제물 25173으로부터의 융합 단백질 cLbCas12a-05를 포함하는 아미노산 서열이다.
SEQ ID NO: 55는 작제물 25175으로부터의 융합 단백질 cLbCas12a-05를 포함하는 뉴클레오티드 서열이다.
SEQ ID NO: 56은 작제물 25175로부터의 융합 단백질 cLbCas12a-05를 포함하는 아미노산 서열이다.
SEQ ID NO: 57은 최적화된 (G4SG)6 링커를 갖는 촉매적 비활성 LbCas12a의 아미노산 서열이다.
SEQ ID NO: 58은 최적화된 (G4S)6 링커를 갖는 활성 Mb2Cas12a의 아미노산 서열이다.
SEQ ID NO: 59는 XTEN 링커를 갖는 촉매적 비활성 Mb2Cas12a의 아미노산 서열이다.
SEQ ID NO: 60은 XTEN 링커를 갖는 활성 AsCas12a의 아미노산 서열이다.
SEQ ID NO: 61은 XTEN 링커를 갖는 촉매적 비활성 AsCas12a의 아미노산 서열이다.
SEQ ID NO: 62는 XTEN 링커를 갖는 활성 FnCas12a의 아미노산 서열이다.
SEQ ID NO: 63은 최적화된 (G4S)6 링커를 갖는 활성 AsCas12a의 아미노산 서열이다.
SEQ ID NO: 64는 최적화된 (G4S)6 링커를 갖는 촉매적 비활성 AsCas12a의 아미노산 서열이다.
SEQ ID NO: 65는 최적화된 (G4S)6 링커를 갖는 활성 FnCas12a의 아미노산 서열이다.
SEQ ID NO: 66은 최적화된 (G4SG)6 링커를 갖는 촉매적 비활성 Mb2Cas12a의 아미노산 서열이다.
SEQ ID NO: 67은 최적화된 (G4SG)6 링커를 갖는 활성 AsCas12a의 아미노산 서열이다.
SEQ ID NO: 68은 최적화된 (G4SG)6 링커를 갖는 촉매적 비활성 AsCas12a의 아미노산 서열이다.
SEQ ID NO: 69는 최적화된 (G4SG)6 링커를 갖는 활성 FnCas12a의 아미노산 서열이다.
SEQ ID NO: 70은 XTEN 링커의 아미노산 서열이다.
SEQ ID NO: 71은 Cas12a gRNA SBEII 표적 서열을 포함하는 뉴클레오티드 서열이다.
SEQ ID NO: 72는 Cas12a gRNA GL2 표적 서열을 포함하는 뉴클레오티드 서열이다.
SEQ ID NO: 73은 Cas12a gRNA Fad2 표적 서열을 포함하는 뉴클레오티드 서열이다.
SEQ ID NO: 74는 waxy1, SBEII, 및 Fad2 표적 서열과 사용된 Cas12a crRNA 서열을 포함하는 뉴클레오티드 서열이다.
SEQ ID NO: 75는 GL2 표적 서열과 함께 사용된 Cas12a crRNA 서열을 포함하는 뉴클레오티드 서열이다.
SEQ ID NO: 76은 작제물 24785로부터의 융합 단백질 cCas9ABE-01을 포함하는 뉴클레오티드 서열이다.
SEQ ID NO: 77은 작제물 24785로부터의 융합 단백질 cCas9ABE-01을 포함하는 아미노산 서열이다.
SEQ ID NO: 78은 작제물 25459로부터의 융합 단백질 cLbCas1aABE-01을 포함하는 뉴클레오티드 서열이다.
SEQ ID NO: 79는 작제물 25459로부터의 융합 단백질 cLbCas1aABE-01을 포함하는 아미노산 서열이다.
SEQ ID NO: 80은 작제물 25504로부터의 융합 단백질 cLbCas12aABE-02를 포함하는 뉴클레오티드 서열이다.
SEQ ID NO: 81은 작제물 25504로부터의 융합 단백질 cLbCas12aABE-02를 포함하는 아미노산 서열이다.
SEQ ID NO: 82는 작제물 25289로부터의 융합 단백질 cLbCas12aBE-09를 포함하는 뉴클레오티드 서열이다.
SEQ ID NO: 83은 작제물 25289로부터의 융합 단백질 cLbCas12aBE-09를 포함하는 아미노산 서열이다.
SEQ ID NO: 84는 작제물 25658로부터의 융합 단백질 cdLbCas12a-ABE-CBE-01을 포함하는 뉴클레오티드 서열이다.
SEQ ID NO: 85는 작제물 25658로부터의 융합 단백질 cdLbCas12a-ABE-CBE-01을 포함하는 아미노산 서열이다.
SEQ ID NO: 86은 작제물 25701로부터의 융합 단백질 cdLbCas12a-ABE-CBE-02를 포함하는 뉴클레오티드 서열이다.
SEQ ID NO: 87은 작제물 25701로부터의 융합 단백질 cdLbCas12a-ABE-CBE-02를 포함하는 아미노산 서열이다.
SEQ ID NO: 88은 작제물 25702로부터의 융합 단백질 cdLbCas12a-ABE-CBE-03을 포함하는 뉴클레오티드 서열이다.
SEQ ID NO: 89는 작제물 25702로부터의 융합 단백질 cdLbCas12a-ABE-CBE-03을 포함하는 아미노산 서열이다.
SEQ ID NO: 90은 Cas12a gRNA ADH1 표적 서열을 포함하는 뉴클레오티드 서열이다.
SEQ ID NO: 91은 TadA 이량체를 포함하는 뉴클레오티드 서열이다.
SEQ ID NO: 92는 TadA 이량체를 포함하는 아미노산 서열이다.
이 설명은 본 발명이 구현될 수 있는 모든 다양한 방식 또는 본 발명에 추가될 수 있는 모든 특징의 상세한 카탈로그임을 뜻하는 것은 아니다. 예를 들어, 일 구현예에 대해 예시된 특징은 다른 구현예에 통합될 수 있고, 특정 구현예에 대해 예시된 특징은 그 구현예로부터 삭제될 수 있다. 또한, 본원에 제시된 다양한 구현예로의 많은 변화 및 추가가 본 개시를 고려하여 당업자에게 명백할 것이며, 이는 본 발명을 벗어나지 않는다. 따라서, 하기 설명은 본 발명의 일부 특정 구현예를 예시하고자 하는 것이며, 그의 모든 순열, 조합 및 변화를 망라적으로 명시하고자 하는 것이 아니다.
정의
달리 정의되지 않는 한, 본원에 사용되는 모든 기술적 및 학술적 용어는 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 갖는다. 본원의 발명의 설명에 사용된 용어는 특정 구현예를 설명하기 위한 것이며 본 발명을 제한하려는 것이 아니다. 본원에 언급된 모든 간행물, 특허 출원, 특허, 및 기타 참고 문헌은 그 전체가 참고로 포함된다.
하기 정의 및 방법은 본 발명을 더 잘 규정하고 본 발명의 실시에 있어서 당업자를 안내하기 위해 제공된다. 달리 언급되지 않는 한, 본 명세서에 사용된 용어는 관련 기술 분야의 통상의 지식을 가진 자에 의해 통상적인 용법에 따라 이해되어야 한다. 분자 생물학의 일반 용어의 정의는 문헌[Rieger et al., Glossary of Genetics: Classical and Molecular, 5th edition, Springer-Verlag, New York, 1994]에서도 찾을 수 있다.
본원에 사용되는 바와 같이, 용어 "긴 링커"는 관심있는 단백질에 이종성 도메인을 연결하는 데 사용된 적어도 10개 아미노산의 폴리펩티드 사슬을 지칭한다. 비제한적인 예로서, 긴 링커는 달리 (G4S)6 또는 (G4S)x6 또는 (G4S)*6으로 표현되는 서열 GGGGSGGGGSGGGGSGGGGSGGGGSGGGGS(SEQ ID NO: 11)을 포함할 수 있다. 긴 링커는 달리 (G4SG)6 또는 (G4SG)x6 또는 (G4SG)*6으로 표현되는 GGGGSGGGGGSGGGGGSGGGGGSGGGGGSGGGGGSG(SEQ ID NO: 44)를 포함할 수 있다. 단백질에 긴 링커에 의해 연결된 이종성 도메인은 시티딘 데아미나제, 구아닌 데아미나제, 우라실 글리코실라제 억제제("UGI"), 뉴클레아제, 및 관심있는 단백질에 이종성 방식으로 작동 가능하게 연결될 수 있는 임의의 다른 단백성 도메인을 포함한다. 관심있는 이러한 단백질은 부위-지정 뉴클레아제(예를 들어, Cas9, Cas12a, Cas12b, Cas12i, Cas12j, 또는 다른 CRISPR 뉴클레아제), 징크-핑거, 메가뉴클레아제, 전사 활성자-유사 이펙터 뉴클레아제("TALEN") 등을 포함하지만 이로 한정되지 않는다.
본 발명의 구현예의 설명 및 첨부된 청구 범위에 사용된 바와 같이, 단수 형태는 문맥이 달리 명확하게 지시하지 않는 한 복수 형태도 포함하도록 하고자 한다.
본원에 사용되는 바와 같이, "및/또는"은 하나 이상의 열거된 관련 항목들의 임의의 및 모든 가능한 조합을 지칭하고 이를 포함한다.
화합물의 양, 용량, 시간, 온도 등과 같은 측정 가능한 값을 지칭할 때 본원에 사용되는 바와 같은 용어 "약"은 명시된 양의 20%, 10%, 5%, 1%, 0.5%, 또는 심지어 0.1%의 변화를 포함하는 것을 의미한다.
본 명세서에서 사용될 때 "포함하다(comprise)", "포함하다(comprises)" 및/또는 "포함하는(comprising)"이라는 용어는 언급된 특징, 정수, 단계, 동작, 요소, 및/또는 구성 요소의 존재를 명시하지만, 하나 이상의 다른 특징, 정수, 단계, 동작, 요소, 구성 요소, 및/또는 그들의 그룹의 존재 또는 추가를 배제하지 않는다.
본원에 사용되는 바와 같이, "본질적으로 구성되는(consisting essentially of)"이라는 이행 문구는 청구항의 범주가 청구항에 언급된 특정 재료 또는 단계 및 청구된 발명의 기본 및 신규 특성(들)에 실질적으로 영향을 미치지 않는 재료 또는 단계를 포함하도록 해석되어야 함을 의미한다. 따라서, 본 발명의 청구항에 사용될 때 "본질적으로 구성되는"이라는 용어는 "포함하는"과 동등한 것으로 해석되는 것을 뜻하지 않는다.
본원에 사용되는 바와 같이, 용어 "증폭된"은 핵산 분자 중 적어도 하나를 주형으로 사용하여 핵산 분자의 다수의 카피 또는 핵산 분자에 상보적인 다수의 카피가 작제됨을 의미한다. 예를 들어, 문헌[Diagnostic Molecular Microbiology: Principles and Applications, D. H. Persing et al., Ed., American Society for Microbiology, Washington, D.C. (1993)]을 참조한다. 증폭의 산물은 앰플리콘으로 명명된다.
"코딩 서열"은 mRNA, rRNA, tRNA, snRNA, 센스 RNA 또는 안티센스 RNA와 같은 RNA로 전사되는 핵산 서열이다. 일부 구현예에서, RNA는 이어서 유기체에서 번역되어 단백질을 생성한다.
본원에 사용되는 바와 같은 트랜스제닉 "사건"이라는 용어는 이종 DNA를 갖는 단일 식물 세포의 형질 전환 및 재생, 예를 들어, 관심있는 하나 이상의 유전자(예를 들어, 트랜스진)를 포함하는 발현 카세트에 의해 생산된 재조합 식물을 지칭한다. 용어 "사건"은 본래의 형질 전환체 및/또는 이종 DNA를 포함하는 형질 전환체의 자손을 지칭한다. 용어 "사건"은 또한 형질 전환체와 또 다른 계통 사이의 성적 교배에 의해 생산된 자손을 지칭한다. 반복친에 대한 반복적인 역교배 후에도, 형질 전환된 모체로부터 삽입된 DNA 및 측접한 DNA는 동일한 염색체 위치에서 교배의 자손에 존재한다. 정상적으로, 식물 조직의 형질 전환은, 각각 식물 세포 게놈에서 상이한 위치에 DNA 작제물을 삽입하는 것을 나타내는 여러 사건을 생성한다. 트랜스진의 발현 또는 기타 바람직한 특성에 기초하여, 특정 사건이 선택된다. 따라서, 본원에 사용되는 바와 같은 "사건 MIR604," "MIR604" 또는 "MIR604 사건"은 본래의 MIR604 형질 전환체 및/또는 MIR604 형질 전환체의 자손을 의미한다(본원에 참고로 포함된 미국 특허 제7,361,813호, 제7,897,748호, 제8,354,519호, 및 제8,884,102호).
본원에 사용되는 바와 같은 "발현 카세트"는, 종결 신호에 작동 가능하게 연결된 관심있는 뉴클레오티드 서열, 전형적으로 코딩 영역에 작동 가능하게 연결된 프로모터를 포함하는, 적절한 숙주 세포에서 특정 뉴클레오티드 서열의 발현을 지시할 수 있는 핵산 분자를 의미한다. 이는 또한 전형적으로 뉴클레오티드 서열의 적절한 번역에 필요한 서열을 포함한다. 코딩 영역은 일반적으로 관심있는 단백질을 코딩하지만, 관심있는 기능적 RNA, 예를 들어 안티센스 RNA 또는 비번역 RNA도 코딩할 수 있다. 발현 카세트는 또한 관심있는 뉴클레오티드 서열의 직접적인 발현에 필요하지 않지만 발현 벡터로부터의 카세트의 제거를 위한 편리한 제한 부위로 인해 존재하는 서열을 포함할 수 있다. 관심있는 뉴클레오티드 서열을 포함하는 발현 카세트는 키메라일 수 있으며, 이는 그의 구성 요소들 중 적어도 하나가 그의 다른 구성 요소들 중 적어도 하나에 대해 이종성임을 의미한다. 발현 카세트는 또한, 자연 발생적이지만 이종성 발현에 유용한 재조합 형태로 수득된 것일 수 있다. 그러나, 전형적으로, 발현 카세트는 숙주에 대해 이종성이며, 즉, 발현 카세트의 특정 핵산 서열은 숙주 세포에서 자연적으로 발생하지 않은 것이며 당업계에 알려진 형질 전환 과정에 의해 숙주 세포 또는 숙주 세포의 조상에 도입되었던 것이어야 한다. 발현 카세트에서 뉴클레오티드 서열의 발현은 항시성 프로모터의 제어, 또는 숙주 세포가 어떤 특정 외부 자극에 노출된 경우에만 전사를 개시하는 유도성 프로모터의 제어하에 있을 수 있다. 식물과 같은 다세포 유기체의 경우, 프로모터는 또한 특정 조직, 또는 기관, 또는 발달기에 특이적일 수 있다. 발현 카세트 또는 그의 단편은 또한 식물 내로 형질 전환될 때 "삽입된 서열" 또는 "삽입 서열"로 지칭될 수 있다.
"유전자"는, 게놈 내에 위치하며, 앞서 언급된 코딩 핵산 서열 외에, 코딩 부분의 발현, 즉, 전사 및 번역의 제어를 담당하는 주로 조절 핵산 서열인 다른 핵산 서열을 포함하는 규정된 영역이다. 유전자는 코딩 및 비-코딩 영역(예를 들어, 인트론, 조절 요소, 프로모터, 인핸서, 종결 서열 및 5' 및 3' 비번역 영역) 둘 모두를 포함할 수 있다. 유전자는 전형적으로 mRNA, 기능성 RNA, 또는 조절 서열을 포함하는 특정 단백질을 발현한다. 유전자는 기능성 단백질을 생성하는 데 사용 가능하거나 사용 가능하지 않을 수 있다. 일부 구현예에서, 유전자는 코딩 영역만을 지칭한다. 용어 "천연 유전자"는 자연계에서 발견되는 유전자를 지칭한다. 용어 "키메라 유전자"는 1) 자연계에서 함께 발견되지 않는 조절 및 코딩 서열을 포함하는 DNA 서열, 또는 2) 자연적으로 결합되지 않은 단백질의 일부를 인코딩하는 서열, 또는 3) 자연적으로 결합되지 않은 프로모터의 일부를 함유하는 임의의 유전자를 지칭한다. 따라서, 키메라 유전자는 상이한 공급원으로부터 유래된 조절 서열 및 코딩 서열을 포함할 수 있거나, 동일한 공급원으로부터 유래되지만 자연계에서 발견되는 것과 상이한 방식으로 배열된 조절 서열 및 코딩 서열을 포함할 수 있다. 유전자는 "분리"될 수 있으며, 이는 정상적으로 자연 상태에서 핵산 분자와 결부된 상태로 발견되는 구성 요소가 실질적으로 또는 본질적으로 없는 핵산 분자를 의미한다. 그러한 구성 요소는 다른 세포 물질, 재조합 생산으로부터의 배양 배지, 및/또는 핵산 분자를 화학적으로 합성하는 데 사용되는 다양한 화학 물질을 포함한다.
폴리뉴클레오티드 코딩 서열을 "발현하는" 또는 그의 "발현"이라는 용어는 서열이 전사되고 선택적으로 번역됨을 의미한다.
"관심있는 유전자" 또는 "관심있는 뉴클레오티드 서열"은 식물로 전달될 때 식물에 항생제 저항성, 바이러스 저항성, 곤충 저항성, 질병 저항성, 또는 다른 해충에 대한 저항성, 제초제 내성, 영양가 개선, 산업적 공정에서의 성능 개선 또는 생식 능력 변경과 같은 원하는 특성을 부여하는 임의의 유전자를 지칭한다. "관심있는 유전자"는 또한 식물에서 상업적으로 가치있는 효소 또는 대사 산물의 생산을 위해 식물로 전달되는 것일 수 있다.
본원에 사용되는 바와 같이, "이종성"은, 자연 발생적 핵산 서열의 다수의 비-자연 발생적 카피를 포함하는, 또 다른 종으로부터 유래하거나 동일한 종 또는 유기체로부터 비롯되지만 원래 형태 또는 세포에서 주로 발현되는 형태로부터 변형된, 도입되는 숙주 세포와 자연적으로 결부되어 있지 않은 핵산 분자 또는 뉴클레오티드 서열을 지칭한다. 따라서, 뉴클레오티드 서열이 도입된 세포와 상이한 유기체 또는 종으로부터 유래된 뉴클레오티드 서열은 그 세포 및 세포의 후손에 대해 이종성이다. 또한, 이종성 뉴클레오티드 서열은, 동일한 천연의 원래 세포 유형으로부터 유래되어 그로 삽입되지만 비천연 상태로 존재하는, 예를 들어, 핵산 분자의 천연 상태에서 발견되는 것과 상이한 카피 수로 존재하고/하거나 상이한 조절 서열의 제어하에 있는 뉴클레오티드 서열을 포함한다. 핵산 서열은 또한, 예를 들어 발현 벡터와 같은 핵산 작제물에서 이것이 결부될 수 있는 다른 핵산 서열에 이종성일 수 있다. 하나의 비-제한적 예로서, 프로모터는, 그 특정 프로모터와 결부된 상태로 자연적으로 발생하지 않는, 즉, 프로모터에 대해 이종성인 하나 이상의 조절 요소 및/또는 코딩 서열과 조합되어 핵산 작제물에 존재할 수 있다.
"상동성" 핵산 서열은 이것이 도입되는 숙주 세포와 자연적으로 결부된 핵산 서열이다. 상동성 핵산 서열은 또한, 예를 들어, 핵산 작제물에 존재할 수 있는 다른 핵산 서열과 자연적으로 결부된 핵산 서열일 수 있다. 하나의 비-제한적 예로서, 프로모터는, 그 특정 프로모터와 결부된 상태로 자연적으로 발생하는, 즉, 프로모터에 대해 상동성인 하나 이상의 조절 요소 및/또는 코딩 서열과 조합되어 핵산 작제물에 존재할 수 있다.
"작동 가능하게 연결된"은 단일 핵산 서열 상에서 핵산 서열들이 결부됨으로써 하나의 핵산 서열의 기능이 다른 하나의 핵산 서열의 기능에 영향을 미침을 지칭한다. 예를 들어, 프로모터는 이것이 코딩 서열 또는 기능적 RNA의 발현에 영향을 미칠 수 있는(즉, 코딩 서열 또는 기능적 RNA가 프로모터의 전사 제어하에 있는) 경우 그 코딩 서열 또는 기능적 RNA와 작동 가능하게 연결된 것이다. 센스 또는 안티센스 배향의 코딩 서열은 조절 서열에 작동 가능하게 연결될 수 있다. 따라서, 뉴클레오티드 서열과 작동적으로 결부된 조절 또는 제어 서열(예를 들어, 프로모터)은 뉴클레오티드 서열의 발현을 수행할 수 있다. 예를 들어, GFP를 인코딩하는 뉴클레오티드 서열에 작동 가능하게 연결된 프로모터는 그 GFP 뉴클레오티드 서열의 발현을 수행할 수 있을 것이다.
제어 서열은 관심있는 뉴클레오티드 서열의 발현을 지시하는 기능을 하는 한 그 뉴클레오티드 서열과 인접할 필요는 없다. 따라서, 예를 들어, 번역되지 않았지만 전사된 개재 서열이 프로모터와 코딩 서열 사이에 존재할 수 있고, 프로모터 서열은 여전히 코딩 서열에 "작동 가능하게 연결된"것으로 간주될 수 있다.
본원에 사용되는 바와 같은 "프라이머"는, 핵산 하이브리드화에 의해 상보적 표적 DNA 가닥에 어닐링되어 프라이머와 표적 DNA 가닥 사이에 하이브리드를 형성하고, 이어서 DNA 중합 효소와 같은 중합 효소에 의해 표적 DNA 가닥을 따라 신장되는 분리된 핵산이다. 프라이머 쌍 또는 세트는, 예를 들어, 중합 효소 연쇄 반응(PCR) 또는 다른 핵산 증폭 방법에 의한 핵산 분자의 증폭에 사용될 수 있다.
"프로브"는 표적 핵산 분자의 일부에 상보적인 분리된 핵산 분자이며, 전형적으로 표적 핵산 분자를 검출하고/하거나 정량화하는 데 사용된다. 따라서, 일부 구현예에서, 프로브는 방사성 동위 원소, 리간드, 화학 발광제, 형광제 또는 효소와 같은 검출 가능한 모이어티 또는 리포터 분자가 부착된 분리된 핵산 분자일 수 있다. 본 발명에 따른 프로브는 데옥시리보핵산 또는 리보핵산뿐만 아니라 폴리아미드, 및 표적 핵산 서열에 특이적으로 결합하는 다른 프로브 물질을 포함할 수 있으며, 그 표적 핵산의 존재를 검출하고/하거나 그 표적 핵산의 양을 정량화하는 데 사용될 수 있다.
TaqMan 프로브는 특이적 프라이머 세트에 의해 증폭된 DNA 영역 내에서 어닐링되도록 설계된다. Taq 중합 효소가 프라이머를 신장시키고 상보적 가닥의 3'에서 5'로 단일-가닥 주형으로부터 초기 가닥을 합성함에 따라, 중합 효소의 5'→3' 엑소뉴클레아제는 프로브를 통해 초기 가닥을 신장시키고 결과적으로 주형에 어닐링된 프로브를 분해한다. 프로브의 분해는 그로부터 형광단을 방출하고 켄처에 대한 밀접 근접성을 깨뜨림으로써 켄칭 효과를 완화하고 형광단의 형광을 허용한다. 따라서, 정량적 PCR 써멀 사이클러(thermal cycler)에서 검출된 형광은 방출된 형광단, 및 PCR에 존재하는 DNA 주형의 양에 정비례한다.
프라이머 및 프로브는 일반적으로 길이가 5개 내지 100개 이상의 뉴클레오티드 길이이다. 일부 구현예에서, 프라이머 및 프로브는 적어도 20개 이상의 뉴클레오티드 길이, 또는 적어도 25개 이상의 뉴클레오티드 길이, 또는 적어도 30개 이상의 뉴클레오티드 길이일 수 있다. 그러한 프라이머 및 프로브는 당업계에 알려진 바와 같은 최적의 하이브리드화 조건하에서 표적 서열에 특이적으로 하이브리드화된다. 본 발명에 따른 프라이머 및 프로브는 표적 서열과의 완전한 서열 상보성을 가질 수 있지만, 표적 서열과 다르며 표적 서열에 하이브리드화되는 능력을 보유하는 프로브가 본 발명에 따른 통상적인 방법에 의해 설계될 수 있다.
프로브 및 프라이머를 제조하고 사용하는 방법은, 예를 들어, 문헌[Molecular Cloning: A Laboratory Manual, 2nd ed., vol. 1-3, ed. Sambrook et al., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y., 1989]에 기술되어 있다. PCR-프라이머 쌍은, 예를 들어, 그 목적을 위해 의도된 컴퓨터 프로그램을 사용함으로써 알려진 서열로부터 유도될 수 있다.
중합 효소 연쇄 반응(PCR)은 특정 DNA 조각을 "증폭"시키는 기법이다. PCR을 수행하기 위해서는, 복제하려는 DNA 분자의 뉴클레오티드 서열의 적어도 일부가 알려져 있어야 한다. 일반적으로, 증폭하려는 DNA의 각 가닥의 3' 말단에 있는 뉴클레오티드 서열(알려진 서열)에 상보적인(예를 들어, 실질적으로 상보적이거나 완전히 상보적인) 프라이머 또는 짧은 올리고뉴클레오티드가 사용된다. DNA 샘플을 가열하여 그의 가닥들을 분리하고, 이를 프라이머와 혼합한다. 프라이머들은 DNA 샘플에서 그들의 상보적 서열에 하이브리드화된다. 합성은 원래 DNA 가닥을 주형으로 사용하여 (5'에서 3' 방향으로) 시작된다. 반응 혼합물은 4개의 데옥시뉴클레오티드 트리포스페이트(dATP, dCTP, dGTP 및 dTTP) 및 DNA 중합 효소를 모두 함유해야 한다. 중합은 새로 합성된 각 가닥이 다른 프라이머에 의해 인식되는 서열을 포함할 정도로 충분히 진행될 때까지 계속된다. 일단 이것이 발생하면, 원래 분자와 동일한 2개의 DNA 분자가 생성된다. 이러한 2개의 분자를 가열하여 그들의 가닥을 분리하고, 과정을 반복한다. 각 사이클은 DNA 분자의 수를 배증시킨다. 자동화된 장비를 사용하면, 각 복제 사이클이 5분 미만 내에 완료될 수 있다. 30회 사이클 후, DNA의 단일 분자로 시작된 것이 10억 개(230 = 1.02 x 109) 초과의 카피로 증폭되었다.
올리고뉴클레오티드 프라이머 쌍의 올리고뉴클레오티드는, 반대 DNA 가닥에 위치하고 증폭될 영역에 측접한 DNA 서열에 상보적이다. 어닐링된 프라이머는 새로 합성된 DNA 가닥에 하이브리드화된다. 제1 증폭 사이클은 5' 말단이 올리고뉴클레오티드 프라이머의 위치에 의해 고정되지만 3' 말단이 가변적인('고르지 않은' 3' 말단) 두 개의 새로운 DNA 가닥을 생성할 것이다. 두 개의 새로운 가닥은 결국 요망되는 길이의 상보적 가닥의 합성을 위한 주형으로서 작용할 수 있다(5' 말단은 프라이머에 의해 한정되고, 3' 말단은 고정되는데, 그 이유는 합성이 반대 프라이머의 말단을 지나 진행될 수 없기 때문이다). 몇 사이클 후에, 요망되는 고정된 길이의 산물이 우세하기 시작한다.
실시간 중합 효소 연쇄 반응으로도 지칭되는 정량적 중합 효소 연쇄 반응(qPCR)은 실시간으로 PCR 반응으로부터의 DNA 산물의 축적을 모니터링한다. qPCR은 중합 효소 연쇄 반응(PCR)에 기반한 분자 생물학의 실험실용 기법으로서, 표적화된 DNA 분자를 증폭하고 동시에 정량화하는 데 사용된다. 특정 서열의 1개 카피라도 PCR에서 증폭되어 검출될 수 있다. PCR 반응은 DNA 주형의 카피를 기하급수적으로 생성한다. 이는 출발 표적 서열의 양과 임의의 특정 사이클에서 축적된 PCR 산물의 양 사이의 정량적 관계를 초래한다. 주형과 함께 발견되는 중합 효소 반응의 억제제, 시약 제한 또는 피로포스페이트 분자의 축적으로 인해, PCR 반응은 결국 기하급수적 속도로 주형 생성을 멈추며(즉, 안정기), 이는 PCR 산물의 종점 정량화를 신뢰할 수 없게 한다. 따라서, 중복(duplicate) 반응은 가변적인 양의 PCR 산물을 생성할 수 있다. PCR 반응의 대수기 동안에만 주형 서열의 출발 수량을 결정하기 위해 역외삽에 의해 추정하는 것이 가능하다. PCR 산물이 축적됨에 따른 그의 측정(즉, 실시간 정량적 PCR)은 반응의 대수기에서의 정량화를 가능하게 하며, 그에 따라 통상적인 PCR과 관련된 가변성을 제거한다. 실시간 PCR 검정에서, 양성 반응은 형광 신호의 축적에 의해 검출된다. DNA 샘플 내의 하나 이상의 특정 서열에 대해, 정량적 PCR은 검출 및 정량화 둘 모두를 가능하게 한다. 수량은 절대 카피 수, 또는 DNA 입력 또는 추가 정규화 유전자에 대해 정규화될 때의 상대적인 양일 수 있다. 실시간 PCR이 최초로 기록된 이래로, 이는 mRNA 발현 연구, 게놈 또는 바이러스 DNA에서 DNA 카피 수 측정, 대립 형질 식별 검정, 유전자의 특정 스플라이스 변이체의 발현 분석 및 파라핀-포매 조직 및 레이저 포획된 미세-절제 세포에서의 유전자 발현을 포함하는 점점 더 많은 다양한 응용 분야에 사용되어 왔다.
본원에 사용되는 바와 같이, "Ct 값"이라는 문구는 "증폭된 표적의 양이 고정된 임계값에 이르는 부분 사이클 수"로서 규정되는 "임계 사이클"을 지칭한다. 일부 구현예에서, 이는 증폭 곡선과 임계선 사이의 교차점을 나타낸다. 증폭 곡선은 전형적으로 주어진 사이클(X-축)에서 각 반응의 상대 형광 변화(Y-축)를 지시하는 "S" 모양이며, 이는 일부 구현예에서 PCR 동안 실시간 PCR 기기에 의해 기록된다. 임계선은 일부 구현예에서 반응이 배경보다 높은 형광 강도에 이르는 검출 수준이다. 문헌[Livak & Schmittgen (2001) 25 Methods 402-408]을 참조한다. 이는 PCR에서 표적의 농도의 상대 척도이다. 일반적으로, qPCR과 같은 정량적 검정에 대한 우수한 Ct 값은 일부 구현예에서, 주어진 참조 유전자의 경우 10 내지 40의 범위이다. Ct 수준은 샘플 중 표적 핵산의 양에 반비례한다(즉, Ct 수준이 낮을수록 샘플에서 검출 가능한 표적 핵산의 양이 많아진다). 추가적으로, qPCR과 같은 정량적 검정에 대한 우수한 Ct 값은 표적 gDNA의 비례 희석으로 선형 반응 범위를 나타낸다.
일부 구현예에서, qPCR은 Ct 값이 정량적 분석에 대하여 실시간으로 수집될 수 있는 조건 하에 수행된다. 예를 들어, 전형적인 qPCR 실험에서, DNA 증폭은 확장기 동안 PCR의 각 사이클에 모니터링된다. 형광의 양은 일반적으로 DNA가 증폭의 로그 선형 단계에 있을 때 배경보다 높게 증가한다. 일부 구현예에서, 이 시점에 Ct 값이 수집된다.
본원에 사용되는 바와 같이, 용어 "세포"는 임의의 살아있는 세포를 지칭한다. 세포는 원핵 또는 진핵 세포일 수 있다. 세포는 분리된 것일 수 있다. 세포는 유기체로 재생될 수 있거나 재생되지 않을 수 있다. 세포는 조직, 캘러스, 배양물, 기관, 또는 부분과 관련하여 존재할 수 있다. 일부 구현예에서, 세포는 식물 세포일 수 있다. 본 발명의 식물 세포는 분리된 단일 세포의 형태로 존재할 수 있거나, 배양된 세포일 수 있거나, 예를 들어 식물 조직 또는 식물 기관과 같은 상위-체계 단위의 일부일 수 있다. 식물 세포는 속씨식물 또는 겉씨식물로부터 유래되거나 그 일부일 수 있다. 추가 구현예에서, 식물 세포는 외떡잎 식물 세포, 쌍떡잎 식물 세포일 수 있다. 외떡잎 식물 세포는, 예를 들어, 메이즈(maize), 벼, 수수, 사탕 수수, 보리, 밀, 귀리, 떼잔디(turf grass), 또는 장식용 잔디 세포일 수 있다. 쌍떡잎 식물 세포는, 예를 들어, 담배, 후추, 가지, 해바라기, 십자화과 식물, 아마, 감자, 면화, 대두, 슈가 비(sugar bee), 또는 유채 세포일 수 있다.
본원에 사용된 바와 같은 용어 "식물 부분"은 배아, 꽃가루, 밑씨, 종자, 잎, 줄기, 싹, 꽃, 가지, 열매, 속씨, 이삭, 속대, 겉껍질, 대(stalk), 뿌리, 뿌리 끝, 꽃밥, 식물 및/또는 식물의 일부에서 온전한 식물 세포를 비롯한 식물 세포, 식물 원형질체, 식물 조직, 식물 세포 조직 배양, 식물 캘리, 식물 클럼프 등을 포함하지만, 이로 한정되지 않는다. 본원에 사용되는 바와 같이, "싹"은 잎과 줄기를 포함하는 지상 부분을 지칭한다. 또한, 본원에 사용되는 바와 같이, "식물 세포"는 세포벽을 포함하는 식물의 구조적 및 생리학적 단위를 지칭하며, 원형질체를 또한 지칭할 수 있다.
세포, 원핵 세포, 박테리아 세포, 진핵 세포, 식물 세포, 식물 및/또는 식물 부분과 관련하여 용어 "도입하는(introducing)" 또는 "도입하다(introduce)"는, 핵산 분자가 세포, 진핵 세포, 식물 세포 및/또는 식물 및/또는 식물 부분의 세포의 내부에 접근하게 하는 방식으로, 핵산 분자를 세포, 진핵 세포, 식물, 식물 부분, 및/또는 식물 세포와 접촉시키는 것을 의미한다. 하나 초과의 핵산 분자가 도입되어야 하는 경우, 이들 핵산 분자는 단일 폴리뉴클레오티드 또는 핵산 작제물의 일부로서 조립되거나 별개의 폴리뉴클레오티드 또는 핵산 작제물로서 조립될 수 있으며, 동일하거나 상이한 핵산 작제물 상에 위치할 수 있다. 따라서, 이들 폴리뉴클레오티드는 단일 형질 전환 사건으로, 별개의 형질 전환 사건으로, 또는 예를 들어, 육종 프로토콜의 일부로서 식물 세포에 도입될 수 있다.
본원에 사용되는 바와 같이, 용어 "형질 전환된" 및 "트랜스제닉"은, 적어도 하나의 재조합(예를 들어, 이종성) 폴리뉴클레오티드의 전부 또는 일부를 함유하는 임의의 세포, 원핵 세포, 진핵 세포, 식물, 식물 세포, 캘러스, 식물 조직, 또는 식물 부분을 지칭한다. 일부 구현예에서, 재조합 폴리뉴클레오티드의 전부 또는 일부는 염색체 또는 안정한 염색체 외 요소에 안정적으로 통합되며, 그에 따라 후속 세대로 전달된다. 본 발명의 목적을 위해, 용어 "재조합 폴리뉴클레오티드"는 유전자 조작에 의해 변경되거나, 재배열되거나, 변형된 폴리뉴클레오티드를 지칭한다. 예에는 이종성 서열에 연결되거나 결합된 임의의 클로닝된 폴리뉴클레오티드 또는 폴리뉴클레오티드들이 포함된다. 용어 "재조합"은 자연 발생적 사건, 예컨대 자발적 돌연변이에 기인하거나, 비-자발적 돌연변이 유발에 이은 선택적 육종에 기인한 폴리뉴클레오티드의 변경을 지칭하지 않는다.
본원에 사용되는 바와 같은 용어 "형질 전환"은 세포로의 이종성 핵산의 도입을 지칭한다. 세포의 형질 전환은 안정적이거나 일시적일 수 있다. 따라서, 본 발명의 트랜스제닉 세포, 식물 세포, 식물 및/또는 식물 부분은 안정적으로 형질 전환되거나 일시적으로 형질 전환될 수 있다. 형질 전환은, 유전자적으로 안정한 유전을 초래하는, 숙주 세포의 게놈 내로의 핵산 분자의 전달을 지칭할 수 있다. 일부 구현예에서, 식물, 식물 부분 및/또는 식물 세포로의 도입은 박테리아-매개 형질 전환, 입자 충격 형질 전환, 칼슘-포스페이트-매개 형질 전환, 사이클로덱스트린-매개 형질 전환, 전기 천공, 리포솜-매개 형질 전환, 나노 입자-매개 형질 전환, 중합체-매개 형질 전환, 바이러스-매개 핵산 전달, 위스커(whisker)-매개 핵산 전달, 미세 주입, 초음파 처리, 침투, 폴리에틸렌 글리콜-매개 형질 전환, 원형질체 형질 전환, 또는 식물, 식물 부분 및/또는 그의 세포로의 핵산의 도입을 초래하는 임의의 다른 전기적, 화학적, 물리적 및/또는 생물학적 메커니즘, 또는 그들의 임의의 조합을 통해 이루어진다.
식물을 형질 전환하는 절차는 당업계에 잘 알려져 있고 일상적이며, 문헌 전반에 걸쳐 기술되어 있다. 식물의 형질 전환을 위한 방법의 비-제한적 예에는 (예를 들어, 아그로박테리움 속 박테리아를 통한) 박테리아-매개 핵산 전달, 바이러스-매개 핵산 전달, 탄화 규소 또는 핵산 위스커-매개 핵산 전달, 리포솜 매개된 핵산 전달, 미세 주입, 미세 입자 충격, 칼슘 포스페이트-매개 형질 전환, 사이클로덱스트린-매개 형질 전환, 전기 천공, 나노 입자-매개 형질 전환, 초음파 처리, 침투, PEG-매개 핵산 흡수뿐만 아니라 식물 세포로의 핵산의 도입을 초래하는 임의의 다른 전기적, 화학적, 물리적(기계적) 및/또는 생물학적 메커니즘(그들의 임의의 조합을 포함함)을 통한 형질 전환이 포함된다. 당업계에 알려진 다양한 식물 형질 전환 방법에 대한 일반적인 가이드에는 문헌[Miki et al. ("Procedures for Introducing Foreign DNA into Plants" in Methods in Plant Molecular Biology and Biotechnology, Glick, B. R. and Thompson, J. E., Eds. (CRC Press, Inc., Boca Raton, 1993), pages 67-88)] 및 문헌[Rakowoczy-Trojanowska (Cell Mol Biol Lett 7:849-858 (2002))]이 포함된다.
아그로박테리움-매개 형질 전환은 그의 높은 형질 전환 효율, 및 많은 다양한 종과 관련된 그의 광범위한 유용성으로 인해 식물을 형질 전환하는 데 일반적으로 사용되는 방법이다. 아그로박테리움-매개 형질 전환은 전형적으로, 함께 존재하는(co-resident) Ti 플라스미드 상에 또는 염색체에 숙주 아그로박테리움 균주에 의해 운반되는 vir 유전자의 상보체에 의존할 수 있는 적절한 아그로박테리움 균주로의 관심있는 외래 DNA를 지닌 이원 벡터의 전달을 포함한다(문헌[Uknes et al. 1993, Plant Cell 5:159-169]). 아그로박테리움으로의 재조합 이원 벡터의 전달은, 표적 아그로박테리움 균주로 재조합 이원 벡터를 동원할 수 있는 플라스미드를 지닌 헬퍼(helper) 이. 콜라이(E. coli) 균주인 재조합 이원 벡터를 지닌 에스케리키아 콜라이(Escherichia coli)를 사용하는 트리-페어런탈 메이팅(tri-parental mating) 절차에 의해 달성될 수 있다. 대안적으로, 재조합 이원 벡터는 핵산 형질 전환에 의해 아그로박테리움으로 전달될 수 있다(문헌[
Figure pct00001
and Willmitzer 1988, Nucleic Acids Res 16:9877]).
재조합 아그로박테리움에 의한 식물의 형질 전환은 일반적으로 식물로부터의 외식편과 아그로박테리움의 공동-배양을 포함하며 당업계에 잘 알려진 방법을 따른다. 형질 전환된 조직은 전형적으로 이원 플라스미드 T-DNA 경계 사이에 항생제 또는 제초제 저항성 마커를 지닌 선택 배지 상에서 재생된다.
식물, 식물 부분 및 식물 세포를 형질 전환하는 또 다른 방법은 식물 조직 및 세포에서 비활성 또는 생물학적 활성 입자를 추진시키는 단계를 포함한다. 예를 들어, 미국 특허 제4,945,050호; 제5,036,006호 및 제5,100,792호를 참조한다. 일반적으로, 이 방법은 세포의 외부 표면을 관통하여 그의 내부로의 혼입을 제공하기에 효과적인 조건하에서 식물 세포에서 비활성 또는 생물학적 활성 입자를 추진시키는 단계를 포함한다. 비활성 입자가 이용될 때, 벡터는 관심있는 핵산을 함유하는 벡터로 입자를 코팅함으로써 세포에 도입될 수 있다. 대안적으로, 입자의 후류에 의해 벡터가 세포 내로 운반되도록 세포 또는 세포들이 벡터에 의해 둘러싸일 수 있다. 생물학적 활성 입자(예를 들어, 도입하고자 하는 하나 이상의 핵산을 각각 함유하는, 건조된 효모 세포, 건조된 박테리아 또는 박테리오파지)가 또한 식물 조직 내로 추진될 수 있다.
폴리뉴클레오티드와 관련하여 "일시적 형질 전환"은 폴리뉴클레오티드가 세포에는 도입되고 세포의 게놈에는 통합되지 않음을 의미한다.
본원에 사용되는 바와 같이, 세포에 도입되는 폴리뉴클레오티드와 관련하여 "안정적으로 도입하는", "안정적으로 도입된", "안정적인 형질 전환" 또는 "안정적으로 형질 전환된"은 도입된 폴리뉴클레오티드가 세포의 게놈에 안정적으로 통합되며, 그에 따라 세포가 폴리뉴클레오티드로 안정적으로 형질 전환됨을 의미한다. 그와 같이, 통합된 폴리뉴클레오티드는 그의 자손에 의해, 보다 구체적으로, 다수의 후속 세대의 자손에 의해 유전될 수 있다. 본원에 사용되는 바와 같은 "게놈"은 핵 및/또는 색소체 게놈을 포함하며, 그에 따라, 예를 들어, 엽록체 게놈으로의 폴리뉴클레오티드의 통합을 포함한다. 본원에 사용되는 바와 같은 안정적인 형질 전환은 또한 염색체 외에서, 예를 들어, 미니 염색체(minichromosome)로서 유지되는 폴리뉴클레오티드를 지칭할 수 있다.
일시적 형질 전환은, 예를 들어, 효소-연결 면역 흡착 검정(ELISA) 또는 웨스턴 블롯에 의해 검출될 수 있으며, 이는 유기체에 도입된 하나 이상의 핵산 분자에 의해 인코딩되는 펩티드 또는 폴리펩티드의 존재를 검출할 수 있다. 세포의 안정적인 형질 전환은, 예를 들어, 유기체(예를 들어, 식물)에 도입된 핵산 분자의 뉴클레오티드 서열과 특이적으로 하이브리드화되는 핵산 서열을 사용한 세포의 게놈 DNA의 서던 블롯 하이브리드화 검정에 의해 검출될 수 있다. 세포의 안정적인 형질 전환은, 예를 들어, 식물 또는 다른 유기체에 도입된 핵산 분자의 뉴클레오티드 서열과 특이적으로 하이브리드화되는 핵산 서열을 사용한 세포의 RNA의 노던 블롯 하이브리드화 검정에 의해 검출될 수 있다. 세포의 안정적인 형질 전환은 또한, 예를 들어, 핵산 분자의 표적 서열(들)과 하이브리드화되어 표준 방법에 따라 검출될 수 있는 표적 서열(들)의 증폭을 초래하는 특이적 프라이머 서열을 사용하는, 중합 효소 연쇄 반응(PCR) 또는 당업계에 잘 알려진 바와 같은 다른 증폭 반응에 의해 검출될 수 있다. 형질 전환은 또한 당업계에 잘 알려진 직접 시퀀싱 및/또는 하이브리드화 프로토콜에 의해 검출될 수 있다.
따라서, 본 발명의 특정 구현예에서 식물 세포는, 당업계에 알려져 있으며 본원에 기술된 바와 같은 임의의 방법에 의해 형질 전환될 수 있고, 다양한 알려진 기법 중 임의의 것을 사용하여 이러한 형질 전환된 세포로부터 온전한 식물이 재생될 수 있다. 식물 세포, 식물 조직 배양물 및/또는 배양된 원형질체로부터의 식물 재생은, 예를 들어, 문헌[Evans et al. (Handbook of Plant Cell Cultures, Vol. 1, MacMilan Publishing Co. New York (1983))]; 및 문헌[Vasil I. R. (ed.) (Cell Culture and Somatic Cell Genetics of Plants, Acad. Press, Orlando, Vol. I (1984), and Vol. II (1986))]에 기술되어 있다. 형질 전환된 트랜스제닉 식물, 식물 세포 및/또는 식물 조직 배양물을 선택하는 방법은 당업계에서는 일상적인 것이며, 본원에 제공되는 본 발명의 방법에서 사용될 수 있다.
"형질 전환 및 재생 과정"은 트랜스진을 식물 세포에 안정적으로 도입하고 트랜스제닉 식물 세포로부터 식물을 재생시키는 과정을 지칭한다. 본원에 사용되는 바와 같이, 형질 전환 및 재생은 선택 과정을 포함하며, 이에 의해 트랜스진은 선택 가능 마커를 포함하고 형질 전환된 세포는 트랜스진을 통합하여 이를 발현함으로써, 형질 전환된 세포가 선택제의 존재하에 생존하고 발육상 번성할 것이다. "재생"은 식물 세포, 일단의 식물 세포, 또는 식물 조각으로부터, 예컨대 원형질체, 캘러스, 또는 조직 부분으로부터 전체 식물을 성장시키는 것을 지칭한다.
용어 "뉴클레오티드 서열" "핵산", "핵산 서열", "핵산 분자", "올리고뉴클레오티드" 및 "폴리뉴클레오티드"는, 뉴클레오티드의 이종 중합체를 지칭하고 cDNA, 게놈 DNA, mRNA, 합성(예를 들어, 화학적으로 합성된) DNA 또는 RNA 및 RNA와 DNA의 키메라를 비롯한 RNA 및 DNA 둘 모두를 포함하도록 본원에서 상호 교환적으로 사용된다. 핵산 분자라는 용어는 사슬의 길이와 관계없이 뉴클레오티드 사슬을 지칭한다. 뉴클레오티드는 당, 포스페이트, 및 퓨린 또는 피리미딘인 염기를 함유한다. 핵산 분자는 이중-가닥 또는 단일-가닥일 수 있다. 단일-가닥인 경우, 핵산 분자는 센스 가닥 또는 안티센스 가닥일 수 있다. 핵산 분자는 올리고뉴클레오티드 유사체 또는 유도체(예를 들어, 이노신 또는 포스포로티오에이트 뉴클레오티드)를 사용하여 합성될 수 있다. 그러한 올리고뉴클레오티드는, 예를 들어, 염기쌍 형성 능력이 변경되거나 뉴클레아제에 대한 저항성이 증가된 핵산 분자를 제조하기 위해 사용될 수 있다. 본원에 제공된 핵산 서열은 왼쪽에서 오른쪽으로 5'*?*방향으로 본원에 제시되며, 미국 서열 규칙 37 CFR §§1.821 내지 1.825 및 세계지적재산기구(World Intellectual Property Organization, WIPO) 표준 ST.25에 명시된 바와 같은 뉴클레오티드 문자를 나타내는 표준 코드를 사용하여 표시된다.
"핵산 단편"은 주어진 핵산 분자의 일부이다. "RNA 단편"은 주어진 RNA 분자의 분획이다. "DNA 단편"은 주어진 DNA 분자의 분획이다. "핵산 세그먼트"는 주어진 핵산 분자의 분획이며, 분자로부터 분리되지 않는다. "RNA 세그먼트"는 주어진 RNA 분자의 분획이며, 분자로부터 분리되지 않는다. "DNA 세그먼트"은 주어진 DNA 분자의 분획이며, 분자로부터 분리되지 않는다. 폴리뉴클레오티드의 세그먼트는 임의의 길이, 예를 들어, 적어도 5개, 10개, 15개, 20개, 25개, 30개, 40개, 50개, 7 5개, 100개, 150개, 200개, 300개 또는 500개 이상의 뉴클레오티드 길이일 수 있다. 가이드 서열의 세그먼트 또는 일부는 가이드 서열의 약 50%, 40%, 30%, 20%, 10%, 예를 들어, 가이드 서열의 1/3 이하, 예를 들어 7개, 6개, 5개, 4개, 3개, 또는 2개 뉴클레오티드 길이일 수 있다.
분자와 관련하여 용어 "~로부터 유래된"은 모(parent) 분자 또는 그 모 분자로부터의 정보를 사용하여 분리되거나 만들어진 분자를 지칭한다. 예를 들어, Cas9 단일 돌연변이 닉카제 및 Cas9 이중 돌연변이 null-뉴클레아제는 야생형 Cas9 단백질로부터 유래된다.
고등 식물에서, 데옥시리보핵산(DNA)은 유전 물질인 한편, 리보핵산(RNA)은 DNA 내에 포함된 정보의 단백질로의 전달에 관여한다. "게놈"은 유기체의 각 세포에 포함된 유전 물질의 완전체(entire body)이다. 달리 지시되지 않는 한, 본 발명의 특정 핵산 서열은, 명시적으로 지시된 서열뿐만 아니라, 또한 그의 보존적으로 변형된 변이체(예를 들어, 축퇴성 코돈 치환체) 및 상보적 서열을 암시적으로 포함한다. 구체적으로, 축퇴성 코돈 치환체는 하나 이상의 선택된(또는 모든) 코돈의 세 번째 위치가 혼합-염기 및/또는 데옥시이노신 잔기로 치환된 서열을 생성함으로써 달성될 수 있다(문헌[Batzer et al., Nucleic Acid Res. 19:5081 (1991)]; 문헌[Ohtsuka et al., J. Biol. Chem. 260:2605-2608 (1985)]; 및 문헌[Rossolini et al., Mol. Cell. Probes 8:91-98 (1994)]). 핵산 분자라는 용어는 유전자, cDNA, 및 유전자에 의해 인코딩된 mRNA와 상호 교환적으로 사용된다.
본원에 사용되는 바와 같이, "서열 동일성"은 2개의 최적으로 정렬된 폴리뉴클레오티드 또는 펩티드 서열이 구성 요소, 예를 들어, 뉴클레오티드 또는 아미노산의 정렬 윈도우 전체에 걸쳐 불변하는 정도를 지칭한다. "동일성"은 하기 문헌에 기술된 방법을 포함하지만 이로 한정되지 않는 알려진 방법에 의해 용이하게 계산될 수 있다: 문헌[Computational Molecular Biology (Lesk, A. M., ed.) Oxford University Press, New York (1988)]; 문헌[Biocomputing: Informatics and Genome Projects (Smith, D. W., ed.) Academic Press, New York (1993)]; 문헌[Computer Analysis of Sequence Data, Part I (Griffin, A. M., and Griffin, H. G., eds.) Humana Press, New Jersey (1994)]; 문헌[Sequence Analysis in Molecular Biology (von Heinje, G., ed.) Academic Press (1987)]; 및 문헌[Sequence Analysis Primer (Gribskov, M. and Devereux, J., eds.) Stockton Press, New York (1991)].
본원에 사용되는 바와 같이, 용어 "서열 동일성 퍼센트" 또는 "동일성 퍼센트"는 시험("대상") 폴리뉴클레오티드 분자(또는 그의 상보적 가닥)와 비교한 기준("질의(query)") 폴리뉴클레오티드 분자(또는 그의 상보적 가닥)의 선형 폴리뉴클레오티드 서열에서의 동일한 뉴클레오티드의 백분율(두 서열이 최적으로 정렬된 경우)을 지칭한다. 일부 구현예에서, "동일성 퍼센트"는 아미노산 서열에서 동일한 아미노산의 백분율을 지칭할 수 있다.
본원에 사용되는 바와 같이, 2개의 핵산 분자, 뉴클레오티드 서열 또는 단백질 서열과 관련하여 "실질적으로 동일한"이라는 문구는, 하기 서열 비교 알고리즘들 중 하나를 사용하거나 육안 검사에 의해 측정되는 바와 같이, 최대 일치를 위해 비교되고 정렬되는 경우 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99%의 뉴클레오티드 또는 아미노산 잔기 동일성을 갖는 2개 이상의 서열 또는 하위서열(subsequence)을 지칭한다. 본 발명의 일부 구현예에서, 실질적 동일성은 적어도 약 50개 잔기 내지 약 150개 잔기 길이인 서열 영역에 걸쳐 존재한다. 따라서, 본 발명의 일부 구현예에서, 실질적 동일성은 적어도 약 50개, 약 60개, 약 70개, 약 80개, 약 90개, 약 100개, 약 110개, 약 120개, 약 130개, 약 140개, 약 150개, 또는 그 초과의 잔기 길이인 서열 영역에 걸쳐 존재한다. 일부 특정 구현예에서, 서열은 적어도 약 150개의 잔기에 걸쳐 실질적으로 동일하다. 추가 구현예에서, 서열은 코딩 영역의 전체 길이에 걸쳐 실질적으로 동일하다. 또한, 대표적인 구현예에서, 실질적으로 동일한 뉴클레오티드 또는 단백질 서열은 실질적으로 동일한 기능(예를 들어, 특정 게놈 표적으로의 안내, 특정 게놈 표적 부위의 엔도뉴클레아제 절단)을 수행한다.
서열 비교를 위해, 전형적으로 하나의 서열이 시험 서열과 비교되는 기준 서열로 작용한다. 서열 비교 알고리즘을 사용하는 경우, 시험 및 기준 서열을 컴퓨터에 입력하고, 필요에 따라 하위서열 좌표를 지정하고, 서열 알고리즘 프로그램 파라미터를 지정한다. 이어서 서열 비교 알고리즘은 지정된 프로그램 파라미터에 기초하여 기준 서열에 비한 시험 서열(들)에 대한 서열 동일성 퍼센트를 계산한다.
비교 윈도우를 정렬하기 위한 서열들의 최적 정렬은 당업자에게 잘 알려져 있으며, Smith 및 Waterman의 국소 상동성 알고리즘, Needleman 및 Wunsch의 상동성 정렬 알고리즘, Pearson 및 Lipman의 유사성 검색 방법과 같은 도구에 의해, 및 선택적으로 GCG® Wisconsin Package®(미국 캘리포니아주 샌디에고 소재의 Accelrys Inc.)의 일부로 이용 가능한 GAP, BESTFIT, FASTA, 및 TFASTA와 같은 이러한 알고리즘의 컴퓨터화된 구현에 의해 수행될 수 있다. 시험 서열과 기준 서열의 정렬된 세그먼트에 대한 "동일성 분율"은 두 정렬된 서열에 의해 공유되는 동일한 구성 요소 수를 기준 서열 세그먼트 내의 총 구성 요소 수, 즉, 전체 기준 서열 또는 기준 서열의 더 작은 규정된 부분으로 나눈 것이다. 서열 동일성 퍼센트는 동일성 분율에 100을 곱한 것으로 표시된다. 하나 이상의 폴리뉴클레오티드 서열의 비교는 전장 폴리뉴클레오티드 서열 또는 그의 일부에 대한 것이거나, 더 긴 폴리뉴클레오티드 서열에 대한 것일 수 있다. 본 발명의 목적을 위해 "동일성 퍼센트"는 또한 번역된 뉴클레오티드 서열의 경우 BLASTX 버전 2.0을 사용하고 폴리뉴클레오티드 서열의 경우 BLASTN 버전 2.0을 사용하여 결정될 수 있다.
BLAST 분석을 수행하기 위한 소프트웨어는 미국 국립생물공학정보센터(National Center for Biotechnology Information)를 통해 공개적으로 이용 가능하다. 이 알고리즘은 먼저 질의 서열에서 길이 W의 짧은 단어들을 확인함으로써 고득점 서열 쌍(high scoring sequence pair, HSP)을 확인하는 것을 포함하며, 이는 데이터베이스 서열 내의 동일한 길이의 단어와 정렬된 경우 어떤 양의(positive) 임계값 점수 T와 일치하거나 이를 충족한다. T는 이웃 단어 점수 임계값으로 지칭된다(문헌[Altschul et al., 1990]). 이러한 초기 이웃 단어 히트(hit)는 이를 포함하는 더 긴 HSP를 찾기 위해 검색을 개시하기 위한 시드(seed) 역할을 한다. 이어서, 단어 히트는 누적 정렬 점수가 증가될 수 있는 한 각 서열을 따라 양방향 모두로 확장된다. 뉴클레오티드 서열의 경우, 파라미터 M(일치하는 잔기 쌍에 대한 보상 점수; 항상 0보다 큼) 및 N(불일치 잔기에 대한 페널티 점수; 항상 0보다 작음)을 사용하여 누적 점수가 계산된다. 아미노산 서열의 경우, 누적 점수를 계산하기 위해 스코어링 행렬(scoring matrix)이 사용된다. 누적 정렬 점수가 그의 최대 달성 값으로부터 수량 X만큼 하락하거나, 하나 이상의 음의 점수를 내는 잔기 정렬의 축적으로 인해 누적 점수가 0 이하로 되거나, 어느 한쪽의 서열의 단부에 도달한 경우, 각 방향에서의 단어 히트의 확장이 중단된다. BLAST 알고리즘 파라미터 W, T 및 X는 정렬의 감도 및 속도를 결정한다. BLASTN 프로그램(뉴클레오티드 서열용)은 디폴트로서 11의 단어길이(W), 10의 기대값(E), 100의 컷오프, M = 5, N = -4, 및 두 가닥 모두의 비교를 사용한다. 아미노산 서열의 경우, BLASTP 프로그램은 디폴트로서 3의 단어길이(W), 10의 기대값(E), 및 BLOSUM62 스코어링 행렬을 사용한다(문헌[Henikoff & Henikoff, Proc. Natl. Acad. Sci. USA 89: 10915 (1989)] 참조).
서열 동일성 퍼센트를 계산하는 것 외에, BLAST 알고리즘은 또한 두 서열 사이의 유사성에 관한 통계적 분석을 수행한다(예를 들어, 문헌[Karlin & Altschul, Proc. Nat'l. Acad. Sci. USA 90: 5873-5787 (1993)] 참조). BLAST 알고리즘에 의해 제공되는 유사성의 한 가지 척도는 최소 합 확률(P(N))이며, 이는 두 뉴클레오티드 또는 아미노산 서열 사이의 일치가 우연히 발생할 확률의 지표를 제공한다. 예를 들어, 시험 뉴클레오티드 서열과 기준 뉴클레오티드 서열의 비교에서 최소 합 확률이 약 0.1 미만 내지 약 0.001 미만인 경우 시험 핵산 서열은 기준 서열과 유사한 것으로 간주된다. 따라서, 본 발명의 일부 구현예에서, 시험 뉴클레오티드 서열과 기준 뉴클레오티드 서열의 비교에서 최소 합 확률은 약 0.001 미만이다.
두 뉴클레오티드 서열은, 두 서열이 엄격한 조건하에서 서로 하이브리드화될 때 실질적으로 동일한 것으로 또한 간주될 수 있다. 일부 대표적인 구현예에서, 실질적으로 동일한 것으로 간주되는 두 뉴클레오티드 서열은 매우 엄격한 조건하에서 서로 하이브리드화된다.
서던 및 노던 하이브리드화와 같은 핵산 하이브리드화 실험과 관련하여 "엄격한 하이브리드화 조건" 및 "엄격한 하이브리드화 세척 조건"은 서열 의존적이며, 다양한 환경 파라미터하에서 다양하다. 핵산의 하이브리드화에 대한 포괄적인 가이드는 문헌[Tijssen Laboratory Techniques in Biochemistry and Molecular Biology-Hybridization with Nucleic Acid Probes part I chapter 2 "Overview of principles of hybridization and the strategy of nucleic acid probe assays" Elsevier, New York (1993)]에서 발견된다. 일반적으로, 매우 엄격한 하이브리드화 및 세척 조건은 규정된 이온 강도 및 pH에서의 특정 서열에 대한 열 융점(Tm)보다 약 5℃ 낮도록 선택된다.
Tm은 완벽하게 일치하는 프로브에 표적 서열의 50%가 하이브리드화되는 (규정된 이온 강도 및 pH하의) 온도이다. 매우 엄격한 조건은 특정 프로브에 대한 Tm과 동일하도록 선택된다. 서던 또는 노던 블롯에서 필터 상에 100개를 초과하는 상보적 잔기를 갖는 상보적 뉴클레오티드 서열의 하이브리드화를 위한 엄격한 하이브리드화 조건의 예는 42℃에서 1 mg의 헤파린을 갖는 50% 포름아미드이며, 하이브리드화는 밤새 수행된다. 매우 엄격한 세척 조건의 예는 약 15분 동안 72℃에서 0.1 5 M NaCl이다. 엄격한 세척 조건의 예는 15분 동안 65℃에서 0.2x SSC 세척이다(SSC 완충액에 대한 설명에 대해서는 하기 문헌[Sambrook] 참조). 종종, 백그라운드 프로브 신호를 제거하기 위해 높은 엄격도 세척에 앞서 낮은 엄격도 세척이 수행된다. 예를 들어, 100개 초과의 뉴클레오티드의 이중체에 대한 중간 엄격도 세척의 예는 15분 동안 45℃에서 1x SSC이다. 예를 들어, 100개 초과의 뉴클레오티드의 이중체에 대한 낮은 엄격도 세척의 예는 15분 동안 40℃에서 4 내지 6x SSC이다. 짧은 프로브(예를 들어, 약 10개 내지 50개 뉴클레오티드)의 경우, 엄격한 조건은 전형적으로 pH 7.0 내지 8.3에서 약 1.0 M 미만의 Na 이온의 염 농도, 전형적으로 약 0.01 내지 1.0 M Na 이온 농도(또는 다른 염)를 포함하고, 온도는 전형적으로 적어도 약 30℃이다. 엄격한 조건은 또한 포름아미드와 같은 불안정화제를 첨가하여 달성될 수 있다. 일반적으로, 특정 하이브리드화 검정에서 관련없는 프로브에 대해 관찰된 것보다 2x(또는 그 초과)의 신호 대 잡음비는 특이적 하이브리드화의 검출을 나타낸다. 엄격한 조건하에서 서로 하이브리드화되지 않은 뉴클레오티드 서열들은, 이들이 인코딩하는 단백질이 실질적으로 동일한 경우 여전히 실질적으로 동일하다. 이는, 예를 들어, 뉴클레오티드 서열의 카피가 유전자 코드에 의해 허용되는 최대 코돈 축퇴성을 사용하여 생성되는 경우 일어난다.
다음은 본 발명의 기준 뉴클레오티드 서열과 실질적으로 동일한 상동성 뉴클레오티드 서열을 클로닝하기 위해 사용될 수 있는 하이브리드화/세척 조건 세트의 예이다. 일 구현예에서, 기준 뉴클레오티드 서열은 50℃에서 7% 소듐 도데실 설페이트(SDS), 0.5 M NaPO4, 1 mM EDTA 중에서 "시험" 뉴클레오티드 서열에 하이브리드화되며 50℃에서 2X SSC, 0.1% SDS 중에서 세척된다. 또 다른 구현예에서, 기준 뉴클레오티드 서열은 50℃에서 7% 소듐 도데실 설페이트(SDS), 0.5 M NaPO4, 1 mM EDTA 중에서 "시험" 뉴클레오티드 서열에 하이브리드화되며 50℃에서 1X SSC, 0.1% SDS 중에서 세척되거나, 50℃에서 7% 소듐 도데실 설페이트(SDS), 0.5 M NaPO4, 1 mM EDTA 중에서 "시험" 뉴클레오티드 서열에 하이브리드화되며 50℃에서 0.5X SSC, 0.1% SDS 중에서 세척된다. 추가 구현예에서, 기준 뉴클레오티드 서열은 50℃에서 7% 소듐 도데실 설페이트(SDS), 0.5 M NaPO4, 1 mM EDTA 중에서 "시험" 뉴클레오티드 서열에 하이브리드화되며 50℃에서 0.1X SSC, 0.1% SDS 중에서 세척되거나, 50℃에서 7% 소듐 도데실 설페이트(SDS), 0.5 M NaPO4, 1 mM EDTA 중에서 "시험" 뉴클레오티드 서열에 하이브리드화되며 65℃에서 0.1X SSC, 0.1% SDS 중에서 세척된다.
"분리된" 핵산 분자 또는 뉴클레오티드 서열 또는 "분리된" 폴리펩티드는, 인위적으로 그의 천연 환경과는 별도로 존재하게 되고/되거나 그의 천연 환경에서의 기능과 비교하여 상이하고/하거나, 변형되고/되거나, 변조되고/되거나, 변경된 기능을 갖게 된 핵산 분자, 뉴클레오티드 서열 또는 폴리펩티드이며, 그에 따라 자연적인 산물이 아니다. 분리된 핵산 분자 또는 분리된 폴리펩티드는 정제된 형태로 존재할 수 있거나, 예를 들어 재조합 숙주 세포와 같은 비-천연 환경에 존재할 수 있다. 따라서, 예를 들어, 폴리뉴클레오티드와 관련하여, 분리된이라는 용어는 그것이 자연적으로 발생하는 염색체 및/또는 세포로부터 분리된 것임을 의미한다. 폴리뉴클레오티드는 또한 그것이 자연적으로 발생하는 염색체 및/또는 세포로부터 분리되고, 이어서 그것이 자연적으로 발생하지 않는 유전자 컨텍스트(genetic context), 염색체, 염색체 위치, 및/또는 세포에 삽입되는 경우 분리된 것이다. 본 발명의 재조합 핵산 분자 및 뉴클레오티드 서열은 상기 정의된 바와 같이 "분리된" 것으로 간주될 수 있다.
따라서, "분리된 핵산 분자" 또는 "분리된 뉴클레오티드 서열"은, 유기체의 자연 발생 게놈(유기체로부터 유래됨)에서 바로 인접한(5' 말단에 하나 및 3' 말단에 하나) 뉴클레오티드 서열과 바로 인접하지 않은 핵산 분자 또는 뉴클레오티드 서열이다. 이에 따라, 일 구현예에서, 분리된 핵산은 코딩 서열에 바로 인접한 5' 비-코딩(예를 들어, 프로모터) 서열의 일부 또는 전부를 포함한다. 따라서, 이 용어는, 예를 들어, 벡터로, 자율 복제 플라스미드 또는 바이러스로, 또는 원핵생물 또는 진핵생물의 게놈 DNA로 혼입되거나, 다른 서열과는 관계없이 별개의 분자로 존재하는 재조합 핵산(예를 들어, PCR 또는 제한 엔도뉴클레아제 처리에 의해 생산된 cDNA 또는 게놈 DNA 단편)을 포함한다. 이는 또한 추가의 폴리펩티드 또는 펩티드 서열을 인코딩하는 하이브리드 핵산 분자의 일부인 재조합 핵산을 포함한다. "분리된 핵산 분자" 또는 "분리된 뉴클레오티드 서열"은, 동일한 천연의 원래 세포 유형으로부터 유래되어 그로 삽입되지만 비천연 상태로 존재하는, 예를 들어, 핵산 분자의 천연 상태에서 발견되는 것과 상이한 카피 수로 존재하고/하거나 상이한 조절 서열의 제어하에 있는 뉴클레오티드 서열도 포함할 수 있다.
용어 "분리된"은 세포 물질, 바이러스 물질, 및/또는 배양 배지(예를 들어, 재조합 DNA 기법에 의해 생산되는 경우), 또는 화학적 전구체 또는 다른 화학물질(예를 들어, 화학적으로 합성되는 경우)을 실질적으로 함유하지 않는 핵산 분자, 뉴클레오티드 서열, 폴리펩티드, 펩티드 또는 단편을 추가로 지칭할 수 있다. 더욱이, "분리된 단편"은 단편으로서 자연 발생하지 않고 이에 따라 천연 상태에서 발견되지 않을 핵산 분자, 뉴클레오티드 서열 또는 폴리펩티드의 단편이다. "분리된"은 제제가 반드시 기술적으로 순수하다는 것(동형이라는 것)을 의미하는 것은 아니며, 의도된 목적으로 사용될 수 있는 형태로 폴리펩티드 또는 핵산을 제공하기에 충분히 순수하다는 것을 의미한다.
본 발명의 대표적인 구현예에서, "분리된" 핵산 분자, 뉴클레오티드 서열, 및/또는 폴리펩티드는 적어도 약 5%, 10%, 15%, 20%, 25%, 30%, 40%, 50%, 60%, 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99%(w/w) 이상 순수하다. 다른 구현예에서, "분리된" 핵산, 뉴클레오티드 서열, 및/또는 폴리펩티드는 출발 물질과 비교하여 적어도 약 5-배, 10-배, 25-배, 100-배, 1000-배, 10,000-배, 100,000-배 이상의 핵산 농축도(w/w)가 달성된다는 것을 나타낸다.
"야생형" 뉴클레오티드 서열 또는 아미노산 서열은 자연 발생적("천연") 또는 내인성 뉴클레오티드 서열 또는 아미노산 서열을 지칭한다. 따라서, 예를 들어, "야생형 mRNA"는 유기체에서 자연적으로 발생하거나 유기체에 내인성인 mRNA이다. "상동성" 뉴클레오티드 서열은 그것이 도입되는 숙주 세포와 자연적으로 결부된 뉴클레오티드 서열이다.
용어 "오픈 리딩 프레임" 및 "ORF"는 코딩 서열의 번역 개시 코돈과 종결 코돈 사이에서 인코딩되는 아미노산 서열을 지칭한다. 용어 "개시 코돈" 및 "종결 코돈"은 각각 단백질 합성(mRNA 번역)의 개시 및 사슬 종결을 특정하는 코딩 서열 내의 3개의 인접 뉴클레오티드 단위('코돈')를 지칭한다.
"프로모터"는 일반적으로 그의 코딩 서열의 업스트림(5')에 있는 뉴클레오티드 서열을 지칭하며, 이는 RNA 중합 효소 및 적절한 전사에 필요한 다른 인자에 대한 인식을 제공함으로써 코딩 서열의 발현을 제어한다. "프로모터 조절 서열"은 근위 업스트림 요소 및 보다 원위의 업스트림 요소로 구성된다. 프로모터 조절 서열은 결부된 코딩 서열의 전사, RNA 가공 또는 안정성, 또는 번역에 영향을 미친다. 조절 서열은 인핸서, 프로모터, 비번역 선도 서열, 인트론, 및 폴리아데닐화 신호 서열을 포함한다. 이는 천연 및 합성 서열뿐만 아니라 합성 서열과 천연 서열의 조합일 수 있는 서열을 포함한다. "인핸서"는 프로모터 활성을 자극할 수 있는 DNA 서열이며, 프로모터의 고유 요소이거나 프로모터의 수준 또는 조직 특이성을 향상시키기 위해 삽입된 이종성 요소일 수 있다. 이는 두 배향 모두(정상 배향 또는 뒤집힌(flipped) 배향)로 작동할 수 있으며, 프로모터의 업스트림 또는 다운스트림으로 이동하더라도 기능할 수 있다. 용어 "프로모터"의 의미는 "프로모터 조절 서열"을 포함한다.
"1차 형질 전환체" 및 "T0 세대"는 초기에 형질 전환된 조직과 동일한 유전적 세대인(즉, 형질 전환 이래로 감수 분열 및 수정을 거치지 않은) 트랜스제닉 식물을 지칭한다. "2차 형질 전환체" 및 "T1, T2, T3 등의 세대"는 1회 이상의 감수 분열 및 수정 주기를 통해 1차 형질 전환체로부터 유래된 트랜스제닉 식물을 지칭한다. 이는 1차 또는 2차 형질 전환체의 자가 수정에 의해 또는 1차 또는 2차 형질 전환체와, 형질 전환되거나 형질 전환되지 않은 다른 식물과의 교배에 의해 유래될 수 있다.
"트랜스진"은 형질 전환에 의해 게놈에 도입되어 안정적으로 유지되는 핵산 분자를 지칭한다. 트랜스진은 적어도 하나의 발현 카세트를 포함할 수 있으며, 전형적으로 적어도 2개의 발현 카세트를 포함하고, 10개 이상의 발현 카세트를 포함할 수 있다. 트랜스진은, 예를 들어, 형질 전환될 특정 식물의 유전자에 대해 이종성 또는 상동성인 유전자를 포함할 수 있다. 추가로, 트랜스진은 비-천연 유기체에 삽입된 천연 유전자 또는 키메라 유전자를 포함할 수 있다. 용어 "내인성 유전자"는 유기체의 게놈에서 그의 천연 위치에 있는 천연 유전자를 지칭한다. "외래" 유전자는 숙주 유기체에서 정상적으로는 발견되지 않지만 유전자 전달에 의해 유기체로 도입된 유전자를 지칭한다.
"인트론"은 거의 배타적으로 진핵 유전자 내에서 발생하지만 유전자 산물에서 아미노산 서열로 번역되지 않는 DNA의 개재 섹션을 지칭한다. 인트론은, 엑손은 그대로 두는 스플라이싱(splicing)으로 일컬어지는 과정을 통해 성숙전(pre-mature) mRNA로부터 제거되어 mRNA를 형성한다. 본 발명의 목적을 위해, 용어 "인트론"의 정의는 표적 유전자로부터 유래된 인트론의 뉴클레오티드 서열에 대한 변형을 포함하며, 단, 변형된 인트론은 그의 결부된 5' 조절 서열의 활성을 유의하게 감소시키지 않는다.
"엑손"은 단백질 또는 그의 일부에 대한 코딩 서열을 지닌 DNA의 섹션을 지칭한다. 엑손은 개재하는 비-코딩 서열(인트론)에 의해 분리되어 있다. 본 발명의 목적을 위해, 용어 "엑손"의 정의는 표적 유전자로부터 유래된 엑손의 뉴클레오티드 서열에 대한 변형을 포함하며, 단, 변형된 엑손은 그의 결부된 5' 조절 서열의 활성을 유의하게 감소시키지 않는다.
용어 "절단" 또는 "절단하는"은 폴리뉴클레오티드의 리보실포스포디에스테르 백본에서 공유 포스포디에스테르 결합의 파손을 지칭한다. 용어 "절단" 또는 "절단하는"은 단일-가닥 파손 및 이중-가닥 파손 둘 모두를 포함한다. 이중-가닥 절단은 2개의 구별되는 단일-가닥 절단 사건의 결과로 발생할 수 있다. 절단은 블런트형(blunt) 단부 또는 스태거형(staggered) 단부의 생성을 초래할 수 있다. "뉴클레아제 절단 부위" 또는 "게놈 뉴클레아제 절단 부위"는, 하나 또는 둘 모두의 가닥에서 게놈 DNA의 뉴클레오티드 서열을 절단하는 역할을 하는 특정 뉴클레아제에 의해 인식되는 뉴클레아제 절단 서열을 포함하는 뉴클레오티드의 영역이다. 뉴클레아제 효소에 의한 그러한 절단은 세포 내에서 DNA 복구 메커니즘을 개시하며, 이는 상동성 재조합이 발생하게 하는 환경을 조성한다.
본 발명은 데아미나제 도메인과 부위-지정 DNA-결합 도메인 사이에 개선된 링커를 갖는 융합 단백질을 제공하고, 이는 편집 효율의 증가 및 돌연변이 빈도의 감소를 제공한다. 본 발명의 일부 구현예에서, 데아미나제 도메인은 시티딘 데아미나제이다. 본 발명의 다른 구현예에서, 데아미나제 도메인은 아데닌 데아미나제이다. 일부 구현예에서, 시티딘 데아미나제 도메인은 활성화-유도 시티딘 데아미나제("AID")이다. 본 발명의 일부 구현예에서, 시티딘 데아미나제 도메인은 아포리포단백질 B mRNA-편집 복합체("APOBEC") 도메인이다. 일부 구현예에서, APOBEC 도메인은 APOBEC1 패밀리 데아미나제이다.
"시티딘 데아미나제"는 각각 시티딘 및 데옥시시티딘에서 우리딘 및 데옥시우리딘으로의 비가역적 가수분해 탈아민화를 촉매작용하는 효소를 지칭한다. 시티딘 데아미나제는 세포 피리미딘 풀을 유지한다. 시티딘 데아미나제의 패밀리는 APOBEC("아포리포단백질 B mRNA 편집 효소, 촉매적 폴리펩티드-유사")이다. 이러한 패밀리의 구성원은 C의 U로의 편집 효소이다. APOBEC 유사 단백질의 N-말단 도메인은 촉매 도메인인 반면, C-말단 도메인은 유사촉매 도메인이다. 보다 구체적으로, 촉매 도메인은 아연 의존적 시티딘 데아미나제 도메인이고, 시티딘 탈아민화에 있어서 중요하다. APOBEC1에 의한 RNA 편집은 동종이량체화를 필요로 하고, 이러한 복합체는 RNA 결합 단백질과 상호작용하여 에디토좀을 형성한다. APOBEC 단백질의 비-제한적인 예는 APOBEC1, APOBEC2, APOBEC3A, APOBEC3B, APOBEC3C, APOBEC3D, APOBEC3F, APOBEC3G, APOBEC3H, APOBEC4, 및 활성화-유도 (시티딘) 데아미나제를 포함한다. 염기 편집기에 대해 상이한 편집 특징을 야기하는 APOBEC 단백질의 다양한 돌연변이체가 또한 알려져 있다. 예를 들어, 인간 APOBEC3A의 경우, 특정 돌연변이체(예를 들어, Y130F, Y132D, W104A 및 D131Y)는 심지어 편집 효율 측면에서 야생형 인간 APOBEC3A를 능가한다. 따라서, 용어 APOBEC 및 이의 각각의 패밀리 구성원은 또한 상응하는 야생형 APOBEC 단백질에 대해 특정 수준(예를 들어, 70%, 75%, 80%, 85%, 90%, 95%, 98%, 99%)의 서열 동일성을 갖고 시티딘 탈아민화 활성을 보유하는 변이체 및 돌연변이체를 포괄한다. 변이체 및 돌연변이체는 아미노산 추가, 결실 및/또는 치환으로 유도될 수 있다. 이러한 치환은, 일부 구현예에서, 보존적 치환이다.
"시토신 염기 편집기"("CBE")는 C·G 염기쌍을 T·A 염기쌍으로 전환시킨다.
"아데닌 데아미나제"는 아데노신에서 이노신으로의 가수분해 탈아민화를 촉매작용하는 효소를 지칭한다. 이노신은 C와 쌍을 형성하므로, G로 읽거나 복제된다. 예시적인 효소로는 동종이량체로 작용하는 이. 콜라이로부터의 TadA이다.
"아데닌 염기 편집기"("ABE")는 A·T 염기쌍을 G·C 염기쌍으로 전환시킨다.
라크노스피라세아이 박테리움(Lachnospiraceae bacterium) Cpf1(LbCpf1)은 큰 그룹의 다수 Cpf1 단백질 중 하나이다. 용어 "Cpf1" 및 "Cas12a"는 전반에 걸쳐 상호교환 가능하게 사용된다. Cpf1은 Cas 단백질이다. 용어 "Cas 단백질" 또는 "클러스터링된 규칙적으로 간격을 둔 짧은 회문 반복(CRISPR)-관련(Cas) 단백질"은, 예를 들어, 스트렙토코쿠스 피오게네스(Streptococcus pyogenes), 뿐만 아니라 기타 세균에서 발견되는 적응 면역계인 CRISPR(클러스터링된 규칙적으로 간격을 둔 짧은 회문 반복)과 관련된 RNA 가이드 DNA 엔도뉴클레아제 효소를 지칭한다. Cas 단백질은 Cas9, Cas12a, Cas12b, Cas12i, Cas12j 등을 포함한다. 본 발명의 일부 구현예에서, 부위 지정 DNA 결합 도메인은 라크노스피라세아이 박테리움으로부터의 촉매적 비활성 Cas12a("dLbCas12a")이다. 다른 구현예에서, 부위 지정 DNA 결합 도메인은 라크노스피라세아이 박테리움("LbCas12a") 또는 모락셀라 보보쿨리(Moraxella bovoculi) AAX08_00205("Mb2Cas12a")로부터 촉매적 활성이다. 본 발명의 일부 구현예에서, 라크노스피라세아이 박테리움, 아키다미노코쿠스(Acidaminococcus) 종, 모락셀라 보보쿨리, 티오미크로스피라(Thiomicrospira) 종, 모락셀라 라쿠나타(Moraxella lacunata), 메타노메틸로필루스 알부스(Methanomethylophilus alvus), 브타이리비브리오(Btyrivibrio) 종, 또는 박테로이데테소랄(Bacteroidetesoral) 종으로부터의 Cas12a 단백질은 융합 단백질의 부위 지정 DNA-결합 도메인으로서 제공된다.
융합 단백질은 우라실 DNA 글리코실라제 억제제(UGI) 및 핵 국재화 서열(NLS)과 같은 다른 단편을 포함할 수 있다.
바실러스 서브틸리스 박테리오파지 PBS1로부터 제조될 수 있는 "우라실 글리코실라제 억제제"(UGI)는 이. 콜라이 우라실-DNA 글리코실라제(UDG)뿐만 아니라 다른 종으로부터의 UDG를 억제하는 작은 단백질(9.5 kDa)이다. UDG의 억제는 1:1의 UGD: UGI 화학량론으로 결합하는 가역적 단백질에 의해 발생한다. UGI는 UDG-DNA 복합체를 해리할 수 있다. UGI의 비-제한적 예는 바실러스 파지 AR9(YP_009283008.1)에서 발견된다. 일부 구현예에서, UGI는 SEQ ID NO: 8의 아미노산 서열을 포함하거나 SEQ ID NO: 8에 대해 적어도 적어도 70%, 75%, 80%, 85%, 90% 또는 95% 서열 동일성을 갖고, 우라실 글리코실라제 억제 활성을 보유한다.
일부 구현예에서, UGI는 시티딘 데아미나제-Cpf1 부분의 C-말단 측에 위치한다. 일부 구현예에서, 융합 단백질은 적어도 2개의 UGI를 포함한다.
일부 구현예에서, 적어도 하나의 핵 국재화 신호("NLS")는 제1 및 제2 단편(시티딘 데아미나제-Cpf1 부분)에 대해, 예를 들어, 제2 단편(Cpf1 포함)과 UGI 사이에서 C-말단에 위치한다. 일부 구현예에서, 적어도 2개의 NLS는 제2 단편과 UGI 사이에 위치한다. 일부 구현예에서, 적어도 3개의 NLS는 제2 단편과 UGI 사이에 위치한다. 일부 구현예에서, 적어도 하나의 NLS는 제1 단편 및 제2 단편(시티딘 데아미나제-Cpf1 부분)에 대해 N-말단에 위치한다.
융합 단백질에서 구성요소의 비-제한적인 예시적 배열은, N-말단에서 C-말단으로, (a) NLS, 시티딘 데아미나제, Cas12a, NLS, UGI, NLS, 2A, 및 UGI; (b) NLS, 시티딘 데아미나제, Cas12a, NLS, NLS, UGI, NLS, 2A, 및 UGI; (c) NLS, 시티딘 데아미나제, Cas12a, NLS, UGI, NLS, 2A, UGI, 2A, 및 UGI; (d) NLS, 시티딘 데아미나제, Cas12a, NLS, UGI, NLS, 2A, UGI, 2A, UGI, 2A 및 UGI를 포함한다.
일부 구현예에서, 펩티드 링커는 선택적으로 융합 단백질에서 각각의 단편들 사이에 제공된다. 일부 구현예에서, 펩티드 링커는 1개 내지 100개(또는, 제한 없이, 3개 내지 20개, 4개 내지 15개) 아미노산 잔기를 갖는다. 일부 구현예에서, 펩티드 링커의 아미노산 잔기의 적어도 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80% 또는 90%는 알라닌, 글리신, 시스테인, 및 세린으로 이루어진 군으로부터 선택된 아미노산 잔기이다.
본 발명은 또한 본 발명의 가이드 RNA를 인코딩하는 핵산 서열을 포함하는 핵산 분자를 제공한다. 핵산 분자는 DNA 또는 RNA 분자일 수 있다. 일부 구현예에서, 핵산 분자는 원형화된다. 다른 구현예에서, 핵산 분자는 선형이다. 일부 구현예에서, 핵산 분자는 단일 가닥이거나, 부분적으로 이중-가닥이거나, 이중-가닥이다. 일부 구현예에서, 핵산 분자는 적어도 하나의 폴리펩티드와 복합체화된다. 폴리펩티드는 핵산 인식 또는 핵산 결합 도메인을 가질 수 있다. 일부 구현예에서, 폴리펩티드는, 예를 들어, 본 발명의 키메라 RNA, 및 선택적으로 뉴클레아제의 전달을 매개하기 위한 셔틀이다. 일부 구현예에서, 폴리펩티드는 Feldan Shuttle(본원에 참고로 포함된 미국 특허 공개 제20160298078호)이다.
"표적내 편집"은 gRNA에 의해 표적화된 PAM 부위 이후 영역의 시토신에서 티민으로의 치환이다. 주요 편집 범위는 PAM 부위 이후 8개 내지 13개 염기이다. "표적외 편집"은 gRNA 표적화된 영역 내부의 C에서 T로의 변경 이외의 인델 또는 염기 변경 또는 gRNA 표적화된 영역 외부의 염기 변경 또는 인델이다.
"부위-지정 변형 폴리펩티드"는 표적 DNA(예를 들어, 표적 DNA의 절단 또는 메틸화) 및/또는 표적 DNA와 결부된 폴리펩티드(예를 들어, 히스톤 꼬리의 메틸화 또는 아세틸화)를 변형시킨다. 부위-지정 변형 폴리펩티드는 또한 본원에서 "부위-지정 폴리펩티드" 또는 "RNA 결합 부위-지정 변형 폴리펩티드"로 지칭된다. 부위-지정 변형 폴리펩티드는 단일 RNA 분자 또는 적어도 두 개의 RNA 분자의 RNA 이중체인 가이드 RNA와 상호 작용하고, 가이드 RNA와의 이의 회합에 의해 DNA 서열(예를 들어, 염색체 서열 또는 염색체 외 서열, 예를 들어, 에피솜 서열, 미니서클 서열, 미토콘드리아 서열, 엽록체 서열 등)에 가이딩된다.
일부 경우에, 부위-지정 변형 폴리펩티드는 자연 발생적 변형 폴리펩티드이다. 다른 경우에, 부위-지정 변형 폴리펩티드는 자연 발생적 폴리펩티드가 아니다(예를 들어, 변형, 예를 들어, 돌연변이, 결실, 삽입된 키메라 폴리펩티드 또는 자연 발생적 폴리펩티드). 예시적인 자연 발생적 부위-지정 변형 폴리펩티드는 당업계에 알려져 있다(예를 들어, 둘 모두 본원에 참고로 포함된 문헌[Makarova et al., 2017, Cell 168: 328-328.e1] 및 문헌[Shmakov et al., 2017, Nat Rev Microbiol 15(3): 169-182]을 참조함). 이러한 자연 발생적 폴리펩티드는 DNA-표적화 RNA에 결합하고, 그에 따라 표적 DNA 내의 특정 서열로 지향되고, 표적 DNA를 절단하여 이중 가닥 파손을 생성한다.
부위-지정 변형 폴리펩티드는 RNA-결합 부분과 활성 부분의 두 부분을 포함한다. 일부 구현예에서, 부위-지정 변형 폴리펩티드는 다음을 포함한다: (i) DNA-표적화 RNA와 상호 작용하는 RNA-결합 부분으로서, DNA-표적화 RNA는 표적 DNA 내의 서열에 상보적인 뉴클레오티드 서열을 포함하는, RNA-결합 부분; 및 (ii) 부위-지정 효소 활성(예를 들어, DNA 메틸화를 위한 활성, DNA 절단을 위한 활성, 히스톤 아세틸화를 위한 활성, 히스톤 메틸화를 위한 활성 등)을 나타내는 활성 부분으로서, 효소 활성 부위는 DNA-표적화 RNA에 의해 결정되는, 활성 부분. 다른 구현예에서, 부위-지정 변형 폴리펩티드는 다음을 포함한다: (i) DNA-표적화 RNA와 상호 작용하는 RNA-결합 부분으로서, DNA-표적화 RNA는 표적 DNA 내의 서열에 상보적인 뉴클레오티드 서열을 포함하는, RNA-결합 부분; 및 (ii) 표적 DNA 내에서 전사를 조절하는(예를 들어, 전사를 증가시키거나 감소시키는) 활성 부분으로서, 표적 DNA 내의 조절되는 전사 부위는 DNA-표적화 RNA에 의해 결정되는, 활성 부분.
일부 경우에, 부위-지정 변형 폴리펩티드는 작동 가능하게-연결된 이종성 도메인을 갖는다. 이종성 도메인은 효소 또는 신호 펩티드일 수 있다. 이종성 도메인이 효소 도메인인 양태에서, 도메인은 표적 핵산을 변형시키는 효소 활성(예를 들어, 뉴클레아제 활성, 메틸트랜스퍼라제 활성, 데메틸라제 활성, DNA 복구 활성, DNA 손상 활성, 탈아미노화 활성, 역전사효소 활성, 디스뮤타제 활성, 알킬화 활성, 메틸화 활성, 탈퓨린화 활성, 산화 활성, 피리미딘 이량체 형성 활성, 인테그라제 활성, 트랜스포사제 활성, 재조합 효소 활성, 중합 효소 활성, 리가제 활성, 헬리카제 활성, 광분해 효소 활성 또는 글리코실라제 활성)을 지닌다. 다른 경우에, 부위-지정 변형 폴리펩티드는 효소 활성이 표적 DNA와 결부된 폴리펩티드(예를 들어, 히스톤)를 변형시키는 작동 가능하게 연결된 효소 도메인(예를 들어, 메틸트랜스퍼라제 활성, 데메틸라제 활성, 아세틸트랜스퍼라제 활성, 데아세틸라제 활성, 키나제 활성, 포스파타제 활성, 유비퀴틴 리가제 활성, 탈유비퀴틴화 활성, 아데닐화 활성, 탈아데닐화 활성, 수모일화(SUMOylating) 활성, 탈수모일화(deSUMOylating) 활성, 리보실화 활성, 탈리보실화 활성, 미리스토일화 활성 또는 탈미리스토일화 활성)을 갖는다. 예시적인 효소 도메인은, 단독으로 또는 다른 효소 도메인과 조합되는지의 여부에 상관없이 아데노신 데아미나제, 옥시다제, 티민 알킬트랜스퍼라제, 아데닌 옥시다제, 아데노신 메틸트랜스퍼라제, 아데노신 데아미나제, 글리코실라제를 포함한다. 이종성 도메인이 신호 펩티드인 양태에서, 신호 펩티드는 핵 국재화 신호("NLS"), 예컨대, SV40 NLS일 수 있다.
일부 경우에, 다양한 부위-지정 변형 폴리펩티드, 예를 들어, 다양한 Cas9 단백질(즉, 다양한 종으로부터의 Cas9 단백질)이 다양한 Cas9 단백질의 다양한 효소 특성을 이용하기 위해(예를 들어, 다양한 PAM 서열 선호를 위해; 효소 활성의 증가 또는 감소를 위해; 세포 독성 수준의 증가 또는 감소를 위해; NHEJ, 상동성-지정 복구, 단일 가닥 파손, 이중 가닥 파손 사이의 균형을 변화시키기 위해 등) 본 발명의 다양한 제공된 방법에서 사용하기에 유리할 수 있다. 다양한 종으로부터의 Cas9 단백질(예를 들어, 문헌[Shmakov et al., 2017]에 개시된 것들, 또는 그로부터 유래된 폴리펩티드들)은 표적 DNA 내의 다양한 PAM 서열을 필요로 할 수 있다. 따라서, 선택된 특정 Cas9 효소의 경우, PAM 서열 요건은 Cas9 활성을 위해 필요한 것으로 알려진 5'-N GG-3' 서열(여기서, N은 A, T, C 또는 G임)과 상이할 수 있다. 매우 다양한 종으로부터의 많은 Cas9 오르토로그가 본원에서 확인되었고, 단백질들은 몇 개의 동일한 아미노산을 공유한다. 모든 확인된 Cas9 오르토로그는 중심 HNH 엔도뉴클레아제 도메인 및 스플릿(split) RuvC/RNaseH 도메인을 갖는 동일한 도메인 아키텍처(architecture)를 갖는다. Cas9 단백질은 보존된 아키텍처를 갖는 4개의 핵심 모티프를 공유하는데, 모티프 1, 2 및 4는 RuvC 유사 모티프인 한편, 모티프 3은 HNH-모티프이다. 대조적으로, 다양한 종으로부터의 Cas12a 단백질은 TTTV의 LbCas12a 정규 PAM과 비교하여 상이한 PAM 서열 요건을 가질 수 있다.
부위-지정 변형 폴리펩티드는 또한 키메라 및 변형된 CRISPR/Cas 뉴클레아제일 수 있다. 예를 들어, 이는 변형된 Cas9 "염기 편집기"일 수 있다. 염기 편집은 DNA 절단 또는 공여자 DNA 분자를 필요로 하지 않고 프로그래밍 가능한 방식으로 하나의 표적 DNA 염기의 또 다른 염기로의 직접적이고 비가역적인 전환을 가능하게 한다. 예를 들어, 문헌[Komor et al (2016, Nature, 533: 420-424)]에는 Cas9-시티딘 데아미나제 융합이 교시되어 있으며, 여기서 Cas9는 또한 비활성화되어 이중-가닥 DNA 파손을 유도하지 않도록 조작되었다. 추가로, 문헌[Gaudelli et al (2017, Nature, doi:10.1038/nature24644)]에는 tRNA 아데노신 데아미나제에 융합된 촉매 활성이 손상된(catalytically impaired) Cas9가 교시되어 있으며, 이는 표적 DNA 서열에서 A/T의 G/C로의 전환을 매개할 수 있다. 본 발명의 방법 및 조성물에서 부위-지정 변형 폴리펩티드로 작용할 수 있는 또 다른 부류의 조작된 Cas9 뉴클레아제는, NG, GAA, 및 GAT를 비롯한 광범위한 PAM 서열을 인식할 수 있는 변이체이다(문헌[Hu et al., 2018, Nature, doi:10.1038/nature26155]).
구현예
일 구현예에서, N-말단에서 C-말단 방향으로, 이종성 도메인, 제1 링커 서열, 및 V형 CRISPR-Cas 효소를 포함하는 융합 단백질이 제공되고, 여기서 제1 링커 서열은 반복된 GGGGS 서열을 포함한다. 일 양태에서, 이종성 도메인은 데아미나제, 폴리머라제, 뉴클레아제, 릴랙사제, 알킬트랜스퍼라제, 메틸트랜스퍼라제, 아데노신 데아미나제, 시티딘 데아미나제, 옥시다제, 티민 알킬트랜스퍼라제, 아데닌 옥시다제, 아데노신 메틸트랜스퍼라제, 글리코실라제 또는 핵 국재화 신호이다. 또 다른 양태에서, 이종성 도메인은 데아미나제 도메인이다. 추가의 또 다른 양태에서, 데아미나제 도메인은 시티딘 데아미나제이다. 또 다른 양태에서, 시티딘 데아미나제 도메인은 활성화-유도 시티딘 데아미나제("AID")이다. 추가의 또 다른 양태에서, 시티딘 데아미나제 도메인은 아포리포단백질 B mRNA-편집 복합체("APOBEC") 도메인이다. 또 다른 양태에서, APOBEC 도메인은 APOBEC1 패밀리 데아미나제이다. 추가의 또 다른 양태에서, APOBEC 도메인은 SEQ ID NO: 1과 적어도 70% 동일한 서열을 포함한다. 또 다른 양태에서, 데아미나제 도메인은 아데닌 데아미나제이다. 추가의 또 다른 양태에서, 아데닌 데아미나제는 SEQ ID NO: 92와 적어도 70% 동일한 서열을 포함하는 TadA 도메인이다.
일 양태에서, V형 CRISPR-Cas 효소는 V-A형("Cas12a") 효소이다. 또 다른 양태에서, Cas12a 도메인은 SEQ ID NO: 3, SEQ ID NO: 6, SEQ ID NO: 22, SEQ ID NO: 45, SEQ ID NO: 46, SEQ ID NO: 47, 및 SEQ ID NO: 48로 구성된 군으로부터 선택된다. 추가의 또 다른 양태에서, Cas12a 도메인은 촉매적 비활성이고, SEQ ID NO: 3, SEQ ID NO: 6, 및 SEQ ID NO: 22로 구성된 군으로부터 선택된다.
일 양태에서, 제1 링커 서열은 적어도 3 회 반복된 GGGGS를 포함한다. 일 양태에서, 제1 링커 서열은 적어도 6 회 반복된 GGGGS를 포함한다.
일 양태에서, 융합 단백질은 SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 13, 및 SEQ ID NO: 44로 이루어진 군으로부터 선택된 서열을 포함한다. 또 다른 양태에서, 융합 단백질은 우라실 DNA 글리코실라제 억제제("UGI") 도메인을 추가로 포함한다. 추가의 또 다른 양태에서, UGI 도메인은 SEQ ID NO: 8을 포함한다. 또 다른 양태에서, UGI 도메인은 서열 SGGS를 포함하는 제2 링커에 의해 Cas12a 효소에 연결된다. 추가의 또 다른 양태에서, 융합 단백질은 SEQ ID NO: 17, SEQ ID NO: 24, SEQ ID NO: 35, SEQ ID NO: 39, SEQ ID NO: 43, SEQ ID NO: 50, SEQ ID NO: 52, SEQ ID NO: 54, SEQ ID NO: 56, SEQ ID NO: 81, SEQ ID NO: 83, SEQ ID NO: 85, SEQ ID NO:87, 및 SEQ ID NO:89로 이루어진 군으로부터 선택된 서열을 포함한다. 또 다른 양태에서, 융합 단백질은 DNA와 접촉될 때, 반복된 GGGGS 서열 이외의 제1 링커 서열을 갖는 융합 단백질에 비해 증가된 빈도로 표적내 편집을 생성하고 감소된 빈도로 표적외 편집을 생성한다.
또 다른 구현예에서, 식물 게놈 DNA를 편집하는 방법으로서, 상기 방법은 식물 게놈 DNA를 (a) 선택적으로 UGI 도메인을 포함하여 상기 양태들의 융합 단백질; 및 (b) 단계 (a)의 융합 단백질을 식물 게놈 DNA의 표적 DNA 서열에 표적화하는 가이드 RNA("gRNA")와 접촉시키는 단계를 포함하고, 여기서 편집된 식물 게놈 DNA는 반복된 GGGGS 서열 이외의 제1 링커를 갖는 융합 단백질에 의해 편집된 식물 게놈 DNA에 비해 감소된 표적외 편집을 포함하는, 방법이 제공된다.
또 다른 구현예에서, 감소된 표적외 편집으로 식물 게놈 DNA를 편집하는 방법으로서, 상기 방법은 식물 게놈 DNA를 (a) 선택적으로 UGI 도메인을 포함하여 상기 양태들 중 하나의 융합 단백질; 및 (b) 단계 (a)의 융합 단백질을 식물 게놈 DNA의 표적 DNA 서열에 표적화하는 가이드 RNA("gRNA")와 접촉시키는 단계를 포함하고, 여기서 편집된 식물 게놈 DNA는 반복된 GGGGS 서열 이외의 제1 링커를 갖는 융합 단백질에 의해 편집된 식물 게놈 DNA에 비해 감소된 표적외 편집을 포함하는, 방법이 제공된다. 양태에서, 융합 단백질은 SEQ ID NO: 24를 포함한다.
또 다른 구현예에서, 감소된 표적외 편집으로 편집된 식물의 집단을 수득하는 방법으로서, 상기 방법은 (a) 편집될 게놈 DNA를 포함하는 식물 세포 집단을 수득하는 단계; (b) 상기 양태들 및 선택적으로 UGI 도메인의 융합 단백질을 인코딩하는 뉴클레오티드 서열을 수득하는 단계; (c) 식물 세포의 집단을 단계 (b)의 뉴클레오티드 서열로 형질 전환함으로써, 식물 세포의 집단 내에서 핵산 서열에 의해 인코딩되는 융합 단백질을 발현하는 단계; (d) 형질 전환된 식물 세포 집단을 식물로 성장시키는 단계로서, 식물의 적어도 하나가 편집되는 단계; 및 (e) 단계 (d)의 생성물로부터 적어도 하나의 편집된 식물을 선택함으로써, 편집된 식물의 집단을 수득하는 단계로서, 편집된 식물의 집단은 반복된 GGGGS 서열 이외의 제1 링커를 갖는 융합된 단백질에 의해 편집된 식물에 비해 감소된 표적외 편집을 포함하는 단계를 포함하는, 방법이 제공된다. 일 양태에서, 융합 단백질을 인코딩하는 뉴클레오티드 서열은 SEQ ID NO: 17, SEQ ID NO: 24, SEQ ID NO: 35, SEQ ID NO: 39, SEQ ID NO: 43, SEQ ID NO: 50, SEQ ID NO: 52, SEQ ID NO: 54, SEQ ID NO: 56, SEQ ID NO: 81, SEQ ID NO: 83, SEQ ID NO: 85, SEQ ID NO:87, 및 SEQ ID NO:89를 포함한다. 일부 구현예에서, 개선된 링커 서열에 의해 연결된 하나 이상의 DNA 결합 도메인 및 하나 이상의 DNA 변형 도메인을 포함하는 융합 단백질을 인코딩하는 코돈 최적화된 폴리뉴클레오티드가 제공된다.
실시예
하기 실시예는 예시적인 구현예를 제공한다. 본 개시 및 당 분야의 일반적인 수준의 기술에 비추어, 당업자는 하기 실시예가 단지 예시적인 것으로 의도되고, 본원에 개시된 요지의 범위로부터 벗어남 없이 다수의 수정, 변형 및 변경이 이용될 수 있음을 이해할 것이다.
실시예 1. dLbCas12a-BE를 위한 벡터의 구축 및 가이드 RNA 발현
식물에서 염기 편집에 유익한 성질을 이용하는 한 단백질로서 아미노산 링커에 의해 연결된, D832A/E925A/D1148A 돌연변이, 랫트 시티딘 데아미나제(APOBEC1) 및 우라실 DNA 글리코실라제 억제제(UGI)를 함유한 촉매적 비활성 라크노스피라세아이 박테리움 Cas12a(이하에서 "dLbCas12a," 이전에 dLbCpf1로 공지됨)을 융합하였다. 융합 작제물을 제아 메이즈(Zea mays) 코돈에 대해 최적화하고, 상업적으로 합성하고(GenScript, 난징, 중국), 사탕수수 유비퀴틴-4(SoUbi4) 유전자 프로모터 하에 클로닝하여 dLbCas12a-BE를 구성적으로 생성하였다.
작제물 24524의 dLbCas12a-BE에서, 핵 국재화 신호(SV40-NLS)는 XTEN 단백질 링커에 의해 dLbCas12a에 연결된 APOBEC1, 및 이어서 SGGS 링커에 의해 UGI에 연결된 SV40-NLS로 진행되었다. SV40-NLS를 또한 SGGS 링커에 의해 UGI의 C-말단에 도입하여 융합 단백질의 핵 내 표적화를 개선하였다. 메이즈 최적화된 코돈으로 제조된 dLbCas12a-BE에 대한 합성 서열은 SEQ ID NO: 18에 기재되어 있다.
작제물 24904의 dLbCas12a-BE에서, SV40-NLS는 (G4S)x6로도 지칭되는 6개 GGGGS 아미노산 반복부를 갖는 30개 아미노산 링커 GGGGS GGGGS GGGGS GGGGS GGGGS GGGGS(SEQ ID NO: 11)에 의해 dLbCas12a에 연결된 APOBEC1, 및 이어서 SGGS 링커에 의해 UGI에 연결된 SV40NLS로 진행되었다. SV40-NLS를 또한 SGGS 링커에 의해 UGI의 C-말단에 도입하여 융합 단백질의 핵 내 표적화를 개선하였다. 메이즈 최적화된 코돈으로 제조된 dLbCas12a-BE에 대한 합성 서열은 SEQ ID NO: 23에 기재되어 있다.
작제물 25057의 dLbCas12a-BE에서, SV40-NLS는 XTEN 단백질 링커에 의해 dLbCas12a에 연결된 APOBEC1, 및 이어서 SX로 지칭되는 18개 아미노산 링커 GGSTG GGSGG GSGGG SSG(SEQ ID NO: 12)에 의해 UGI에 연결된 SV40-NLS로 진행되었다. SV40-NLS를 또한 (G4S)x3로 지칭되는 15개 아미노산 링커 GGGGS GGGGS에 의해 UGI의 C-말단에 도입하여 dLbCas12a-BE의 핵 내 표적화를 개선하였다. 메이즈 최적화된 코돈으로 제조된 dLbCas12a-BE에 대한 합성 서열은 SEQ ID NO: 14에 기재되어 있다.
작제물 25058의 dLbCas12a-BE에서, SV40-NLS는 30개 아미노산 링커 (G4S)x6에 의해 dLbCas12a에 연결된 APOBEC1, 및 이어서 SX 링커에 의해 UGI에 연결된 SV40-NLS로 진행되었다. SV40-NLS를 또한 (G4S)x3에 의해 UGI의 C-말단에 도입하여 dLbCas12a-BE의 핵 내 표적화를 개선하였다. 메이즈 최적화된 코돈으로 제조된 dLbCas12a-BE에 대한 합성 서열은 SEQ ID NO: 16에 기재되어 있다.
dLbCas12a-BE 작제물에서, CRISPR/Cas12a 가이드 RNA 전사체는 엑손4에서 PAM 서열 후에 T로 C9, C10 또는 C22를 변경하도록 옥수수 Waxy1 제4 엑손 영역을 표적화하는 SoUbi4 프로모터의 제어 하에 발현되었다. 이는 또한 스캐폴드로서 LbCrRNA의 직접적인 반복부를 포함하였다. 가이드 RNA에 대한 합성 서열은 SEQ ID NO: 26에 기재되어 있다.
작제물 24784에서, 핵 국재화 신호(xSV40NLS-06)는 xXTEN-02에 의해 메이즈-최적화된 Cas9 유전자(cCas9BE-02)에 연결된 시티딘 데아미나제(xAPOBEC1-01), 및 이어서 xSGGS링커-02에 의해 핵 국재화 신호 xSV40NLS-07에 연결된 우라실 DNA 글리코실라제 억제제 xUGI-02에 xSGGS링커-02에 의해 연결된 핵 국재화 신호(xSV40NLS-04)로 진행되었다. 융합 단백질은 사탕수수 유비퀴틴-4 프로모터(prSoUbi4-02) 및 이어서 NOS 종결자(tNOS-05-01)의 제어 하에 구동되었다. Cas9 단백질은 랫트 APOBEC1 및 우라실 DNA 글리코실라제 억제제(UGI)에 융합된 D10A를 갖는 니카제 Cas9 돌연변이이다. 핵 국재화 신호를 또한 Cas9의 C-말단에 도입하여 핵으로의 이의 표적화를 개선하였다. cCas9BE-02에 대한 합성 서열은 SEQ ID NO: 20에 기재되어 있다.
실시예 2. 옥수수 배아의 아그로박테리움-매개된 형질 전환
메이즈 Wx1에서 편집된 잠재적인 사건을 생성하기 위해, 엘리트 메이즈 형질 전환 변종 NP2222를 기재된 바와 같이(WO16106121, 본원에 참고로 포함됨) 모든 실험에 대해 선택하였다.
옥수수 변종 NP2222를 옥수수 형질 전환에 사용하였다. 미성숙 배아가 약 1.2 mm일 때 GH로부터 옥수수 이삭을 수확한 다음, 20분 동안 20% Clorox 용액으로 이삭을 멸균하고, 멸균수로 3 회 헹구었다.
전기천공에 의해 벡터를 보유하는 아그로박테리움 투메파시엔스(Agrobacterium tumefaciens) 균주 LBA4404 17740 RecA-를 Gent(25 μg/ml) 및 Spec(100 μg/ml) 항생제를 함유하는 YP 배지에서 스트리킹하고, 28℃에서 2일 동안 성장시켰다. 형질 전환 전에, 단일 콜로니를 선택하고, 신선한 YP 플레이트 상에 스트리킹하고 28℃에서 1일 동안 성장시켰다. 아그로박테리움을 접종 배지를 사용하여 재현탁시켰다. OD660을 0.25로 조정하였다.
배유를 제거한 후, 미성숙 배아를 멸균된 메스로 분리하고 함께 수집하여 아그로박테리움 현탁액에 2분 내지 3분 동안 주입하였다. 감염된 미성숙 배아를 22℃ 에서 2일 내지 4일 동안 공동-배양 배지로 옮겼다.
공동-배양 단계 후, 배아를 28℃ 암흑 조건 하에 4주 동안 선택제와 함께 배지로 옮겼다. 저항성 배아 캘리를 재생 배지로 옮기고, 16/8 광 주기 조건으로 28℃에서 배양하였다. 약 3주 후, 재생된 묘목을 동일한 배양 온도 및 광 조건 하에서 발근 배지가 있는 성장 용기로 옮겼다.
실시예 3. 표적화된 영역에서 편집된 염기의 분석
Phire Plant Direct PCR Master Mix(Thermo Fisher, F160L)를 사용하여 옥수수 잎 샘플로부터 직접적으로 표적화된 영역을 함유하는 DNA 단편을 약 410 bp 증폭시켰다. PCR 전에 DNA 정제가 필요하지 않았다. 증폭된 DNA 단편을 Sanger DNA 시퀀싱에 의해 수행하여 표적 부위의 돌연변이를 분석하였다.
DNA 추출 및 PCR 증폭을 제조업체의 권고에 따라 수행하였다. 어린 잎 조각(예를 들어, 직경이 약 2 mm인 펀치)을 30 μL의 희석 완충액에 넣었다. 잎 샘플을 튜브 벽에 대고 잠시 누르고 20 μL의 희석 완충액을 첨가함으로써 100 μL 피펫 팁으로 파쇄하였다. 잎을 파쇄한 후, 용액은 녹색을 띠었다. 식물 물질을 원심분리기에서 회전시키고, 1 μL의 상청액을 20 μL PCR 반응을 위한 주형으로 사용하였다.
PCR 시스템은 하기로 이루어졌다:
Figure pct00002
ZmWaxy1에 대한 PCR 프라이머:
포워드 프라이머: 5'-AGATGGGAGACGGGTACGAGACGG-3' (SEQ ID NO: 29)
리버스 프라이머: 5'-GTATGGGTTGTTGTTGAGGCTCAGG-3' (SEQ ID NO: 30)
DNA 시퀀싱 프라이머: 5'-GACCACCCACTGTTCCTGGAGAGGG-3' (SEQ ID NO: 31)
PCR 조건:
5분 동안 98℃;
5초 동안 98℃, 및 이어서 5초 동안 60℃의 35 회 사이클;
20초 동안 72℃;
1분 동안 72℃; 및
분석 준비까지 4℃에서 유지.
시퀀싱:
PCR 산물을 아가로스 겔 전기영동에 의해 분리하고, 특정 프라이머에 의한 Sanger DNA 시퀀싱 전에 정제하였다. 이종접합 돌연변이의 경우, 동종접합 돌연변이로 여겨지는 대조군과 상이한 독특한 단일 피크와 함께 표적 뉴클레오티드 위치에서 이중 피크가 관찰되었다. 작제물 24524, 24904 및 24784에 대한 트랜스제닉 사건을 이용하여 시퀀싱을 위한 ZmWxy1 엑손 4 영역을 증폭시킴으로써 염기 편집을 평가하였다.
[표 1] 시티딘 데아미나제와 니카제 Cas9("nCas9-CBE") 사이에 XTEN 링커를 포함하는 CRISPR/Cas 시티딘 염기 편집기("CBE") APOBEC
Figure pct00003
편집된 뉴클레오티드는 회색 음영으로 나타나 있다. 상기 나타낸 바와 같이, APOBEC 도메인과 부위-지정 뉴클레아제 사이에 XTEN 링커를 포함하는 이러한 버전의 Cas12a 염기 편집기는 위치 5 및 위치 6에서 시스테인을 티아민으로 가장 효율적으로 편집하였다. 그러나, 위치 -2, 7, 및 49에 구아닌에서 아데닌으로 편집하는 경우가 있었다. 위치를 PAM 부위의 시작점에서 떨어져 있는 뉴클레오티드의 수에 의해 결정하였다.
[표 2] APOBEC 데아미나제와 dLbCas12a 사이에 XTEN 링커를 포함하는 CRISPR/Cas 시티딘 염기 편집기
Figure pct00004
편집된 뉴클레오티드는 회색 음영으로 나타나 있다. 이러한 버전에서, APOBEC 도메인과 탈활성화된 부위-지정 뉴클레아제 사이에 XTEN 링커를 포함하는, Cas12a 염기 편집기는 위치 9, 10, 및 22에서 시스테인을 티아민으로 편집하고, 위치 39, 44, 52, 및 특히 53에서 구아닌을 아데닌으로 편집하였다. 구아닌이 아데닌으로 편집되는 곳은 상보체 가닥 상에서 편집이 발생했다는 것을 지시한다.
[표 3] 데아미나제와 dLbCas12a 사이에 긴 링커를 포함하는 CRISPR/Cas 시티딘 염기 편집기
Figure pct00005
편집된 뉴클레오티드는 회색 음영으로 나타나 있다. 이러한 버전에서, APOBEC 도메인과 탈활성화된 부위-지정 뉴클레아제 사이에 (G4S)6을 포함하는 긴 링커를 포함하는, Cas12a 염기 편집기는 위치 9 및 10에서 시스테인을 티아민으로 편집하고, 위치 19, 및 53에서 구아닌을 아데닌으로 편집하였다. 구아닌이 아데닌으로 편집되는 곳은 상보체 가닥 상에서 편집이 발생했다는 것을 지시한다.
실시예 4. 편집 효율 측정.
[표 4] 옥수수 Wxy1 by dLbCas12a-CBE 시스템의 염기 편집 효율.
Figure pct00006
표 4는 긴 링커를 사용한 Cas12a의 염기 편집 효율이 Cas9의 염기 편집 효율과 비슷하다는 것을 보여준다. 최적화 없이, Cas12aBE는 Cas9(87%)보다 훨씬 낮게 대략 5%의 불량한 편집 효율을 가졌다. 그러나, 데아미나제를 촉매적 비활성 Cas12a에 작동 가능하게 연결하도록 긴 링커를 추가함으로써, 편집 효율은 12배까지 향상되었다.
[표 5] 긴 링커를 사용한 LbCas12a에 의한 SBEIIb의 편집 효율.
Figure pct00007
표 5는 XTEN 링커 또는 긴 링커에 작동 가능하게 연결될 때 LbCas12a 염기 편집기의 편집 효율 간의 직접적인 비교를 보여준다. 어려운 표적의 편집 효율은 데아미나제를 긴 링커, 예컨대, (G4S)6에 의해 부위-지정 뉴클레아제에 작동 가능하게 연결하는 경우 거의 5배 향상되었다.
[표 6] 긴 링커를 사용한 LbCas12a에 의한 Waxy1의 편집 효율.
Figure pct00008
[표 7] 긴 링커를 사용한 LbCas12a에 의한 SBEIIb, Waxy1, 및 Glossy2의 다중화된 편집.
Figure pct00009
동일한 작제물 내 여러 가이드 RNA 분자를 사용("다중화" 또는 "다중화된 편집")할 뿐만 아니라 아니라 핵 국재화 신호와 활성 Cas12a 사이에 긴 링커를 갖는 다중의 동시적인 편집은 높은 편집 효율을 달성하였다. SBEIIb와 같은 난제의 표적조차도 다중화된 편집 실험 설계의 일부일 때 허용 가능한 편집 효율을 달성하였다.
실시예 5. 대두에서의 편집 향상.
긴 링커와 Cas12a 조합을 사용한 대두 편집이 또한 크게 향상되었다. 표준 Cas12a 및 긴 링커-Cas12a에 의한 GmFAD2 편집은 거의 7배까지 향상되었다.
[표 8] GmFAD2 편집
Figure pct00010
실시예 6. 옥수수에서 Mb2Cas12a 편집을 향상시킨 긴 링커.
긴 링커는 또한 Mb2Cas12a와 같은 추가 Cas12 효소의 편집 효율을 향상시켰다.
[표 9] 긴 링커를 사용한 Mb2Cas12a에 의한 편집.
Figure pct00011
긴 링커 없이, Mb2Cas12a는 표적 서열을 편집하지 않았다. 그러나, 긴 링커를 사용하여, 편집 효율은 유의하게 향상되었다.
실시예 7. 긴 링커에 의해 연결되는 Cas12a에 작동 가능하게 연결된 기타 이종성 도메인.
긴 링커를 통해 Cas12a에 이종성 도메인(APOBEC 데아미나제만을 넘어서)을 테더링하는 것은 본 발명의 범위 내에 있다. 이러한 이종성 도메인은 데아미나제, 폴리머라제, 뉴클레아제, 릴랙사제, 알킬트랜스퍼라제, 메틸트랜스퍼라제, 아데노신 데아미나제, 시티딘 데아미나제, 옥시다제, 티민 알킬트랜스퍼라제, 아데닌 옥시다제, 아데노신 메틸트랜스퍼라제, 글리코실라제 또는 핵 국재화 신호를 포함하지만, 이로 한정되지 않는다.
아데닌 데아미나제를 Cas12a에 작동 가능하게 연결하여 Cas12a 아데닌 염기 편집기("Cas12a-ABE")를 생성하였다. 촉매적 비활성 LbCas12a(D832A, E925A, 및 D1148A 돌연변이 함유)를 아미노산 링커에 의해 작동 가능하게 연결된 이. 콜라이 야생형 아데닌 데아미나제(W23R, H36L, P48A, R51L, L84F, A106V, D108N, H123Y, S146C, D147Y, R152P, E155V, I156F, 및 K157N 아미노산 치환을 함유하도록 조작된 "TadA")에 융합하였다. 융합 작제물을 제아 메이즈(Zea mays) 코돈에 대해 최적화하고, 상업적으로 합성하고(GenScript, 난징, 중국), 사탕수수 유비퀴틴-4(SoUbi4) 유전자 프로모터 하에 함유하고 클로닝하여 dLbCa12a-ABE를 구성적으로 생성하였다.
작제물 25459의 dLbCas12a-ABE에서, 189 bp 감자 인트론을 XTEN 단백질 링커에 의해 연결된 TadA 변이체에 의해 진행된 TadA 코딩 서열에 삽입하여 TadA 이량체를 형성하였다. 이를 dLbCas12a에 융합하고, SV40-NLS를 또한 GS 링커에 의해 dLbCas12a의 C-말단에 도입하여 융합 단백질의 핵 내 표적화를 개선하였다. 메이즈 최적화된 코돈으로 제조된 dLbCas12a-ABE에 대한 합성 서열은 SEQ ID NO: 79에 기재되어 있다.
작제물 25504의 dLbCas12a-ABE에서, 189 bp 감자 인트론을 TadA 변이체에 의해 진행된 TadA 코딩 서열에 삽입하여 TadA 이량체를 형성하였다. 이를 dLbCas12a에 또한 30개 아미노산 링커 (G4S)x6 단백질 링커에 의해 연결하고, SV40-NLS를 또한 GS 링커에 의해 dLbCas12a의 C-말단에 도입하여 융합 단백질의 핵 내 표적화를 개선하였다. 메이즈 최적화된 코돈으로 제조된 dLbCas12a-ABE에 대한 합성 서열은 SEQ ID NO: 81에 기재되어 있다.
dLbCas12a-ABE 작제물에서, CRISPR/Cas12a 가이드 RNA 전사체는 옥수수 Waxy1 유전자를 표적화하는 SoUbi4 프로모터의 제어 하에 발현되었다. 이는 또한 스캐폴드로서 LbCrRNA의 직접적인 반복부를 포함하였다. 가이드 RNA에 대한 합성 서열은 SEQ ID NO: 74에 기재되어 있다.
작제물 25459(아데닌 데아미나제는 XTEN 링커에 의해 dLbCas12a에 연결되었음)로의 실험에서, 메이즈 식물에 사용될 때 검출 가능한 편집이 얻어지지 않았다. (G4S)*6 긴 링커에 의해 아데닌 데아미나제가 dLbCas12a에 연결된 작제물 25504로의 실험에서, Cas9ABE 대조군(작제물 24785)의 대략 절반으로 7% 편집 효율이 얻어졌다. 표 10을 참조한다.
[표 10] dLbCas12aABE
Figure pct00012
이는 처음으로 Cas12aABE가 식물에서 작용한 것이 밝혀졌음을 나타내는 것으로 생각된다. 아데닌 데아미나제를 Cas12a에 작동 가능하게 연결하기 위해 긴 링커를 사용하는 것이 이러한 기술적 성공의 원인이라고 생각된다.
실시예 8. 메이즈에서의 이중 염기 편집기
이중 염기 편집기(Cas 효소에 융합된 시티딘 데아미나제 도메인 및 아데닌 데아미나제 도메인). 이러한 개념에서, 작물 유전자의 표적화된 포화 돌연변이유발은 동일한 표적 영역에서 향상된 농경학적 성능, 예를 들어, C:G > T:A 및 A:T > G:C 치환을 갖는 유전적 변이체를 생성하기 위해 적용될 수 있다. 4개의 가이드 RNA를 다중화하였다: 하나는 ZmWaxy1 유전자를 표적화하고, 3개의 별개의 가이드 RNA는 ZmADH 유전자를 표적화하였다.
[표 11] 메이즈에서 이중 CBE-ABE Cas12a에 의한 편집 빈도.
Figure pct00013
[표 12] 메이즈에서 이중 CBE-ABE Cas12a에 의한 편집.
Figure pct00014
전체적으로, dLbCas12a를 기반으로 한 CBE-ABE는 1% C에서 T로, 및 A에서 G로의 돌연변이이다. 인트론을 추가하면 벡터 안정성이 증가하지만, 비효율적인 스플라이싱으로 인해 효소 활성이 감소될 수 있다. 이는 Cas12a를 사용한 식물에서 이중 CBE-ABE 편집의 첫 번째 경우인 것으로 생각된다.
요약 표
Figure pct00015
Figure pct00016
상기 표에서, 대부분의 Cas12aBE 작제물은 이종성 효소 도메인-링커-Cas 효소의 패턴을 따랐다. 이러한 패턴에 대한 예외는 다음과 같다: 25702[TadA 이량체-링커-PmCDA-링커-Cas 효소], 25701[PmCDA-링커-TadA 이량체-링커-Cas 효소], 및 25658[TadA 이량체-링커-Cas 효소-PmCDA]. 추가의 핵 국재화 서열, 우라실 글리코실라제 억제제, 및 다른 구성 요소가 존재할 수 있지만, 상기 표에는 나타나 있지 않을 수 있다. 이러한 세부 사항은 첨부된 서열 목록에 제공된 서열에서 제시된다.
본원에 제공된 실시예 및 구현예는 청구항의 비-제한적 예시이고, 유일한 작업예로 해석되어서는 안된다. 추가 변형이 당업자에 의해 실시될 수 있다.
SEQUENCE LISTING <110> Syngenta Li, Jiang Xu, Jianping <120> METHODS AND COMPOSITIONS FOR DNA BASE EDITING <130> Attorney Docket Number 81945 <160> 92 <170> PatentIn version 3.5 <210> 1 <211> 229 <212> PRT <213> Rattus norvegicus <400> 1 Met Ser Ser Glu Thr Gly Pro Val Ala Val Asp Pro Thr Leu Arg Arg 1 5 10 15 Arg Ile Glu Pro His Glu Phe Glu Val Phe Phe Asp Pro Arg Glu Leu 20 25 30 Arg Lys Glu Thr Cys Leu Leu Tyr Glu Ile Asn Trp Gly Gly Arg His 35 40 45 Ser Ile Trp Arg His Thr Ser Gln Asn Thr Asn Lys His Val Glu Val 50 55 60 Asn Phe Ile Glu Lys Phe Thr Thr Glu Arg Tyr Phe Cys Pro Asn Thr 65 70 75 80 Arg Cys Ser Ile Thr Trp Phe Leu Ser Trp Ser Pro Cys Gly Glu Cys 85 90 95 Ser Arg Ala Ile Thr Glu Phe Leu Ser Arg Tyr Pro His Val Thr Leu 100 105 110 Phe Ile Tyr Ile Ala Arg Leu Tyr His His Ala Asp Pro Arg Asn Arg 115 120 125 Gln Gly Leu Arg Asp Leu Ile Ser Ser Gly Val Thr Ile Gln Ile Met 130 135 140 Thr Glu Gln Glu Ser Gly Tyr Cys Trp Arg Asn Phe Val Asn Tyr Ser 145 150 155 160 Pro Ser Asn Glu Ala His Trp Pro Arg Tyr Pro His Leu Trp Val Arg 165 170 175 Leu Tyr Val Leu Glu Leu Tyr Cys Ile Ile Leu Gly Leu Pro Pro Cys 180 185 190 Leu Asn Ile Leu Arg Arg Lys Gln Pro Gln Leu Thr Phe Phe Thr Ile 195 200 205 Ala Leu Gln Ser Cys His Tyr Gln Arg Leu Pro Pro His Ile Leu Trp 210 215 220 Ala Thr Gly Leu Lys 225 <210> 2 <211> 687 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 2 atgtccagcg agaccggccc cgtggcggtg gaccccaccc tgcgcaggcg catcgagccg 60 cacgagttcg aggtgttctt cgaccccagg gagctccgca aggagacctg cctcctgtac 120 gagatcaact ggggcggcag gcactccatc tggaggcaca cgagccagaa caccaacaag 180 cacgtcgagg tgaacttcat cgagaagttc accacggaga ggtacttctg cccgaacacg 240 cgctgctcca tcacgtggtt cctctcgtgg agcccatgcg gcgagtgctc cagggcgatc 300 acggagttcc tcagccgcta cccgcacgtg accctgttca tctacatcgc taggctctac 360 caccacgcgg accccaggaa caggcagggc ctcagggacc tgatctccag cggcgtcacg 420 atccagatca tgaccgagca ggagtccggc tactgctgga ggaacttcgt gaactactcc 480 ccgagcaacg aggcccactg gccccgctac ccgcacctct gggtccgcct ctacgtgctc 540 gagctgtact gcatcatcct cggcctgccg ccctgcctca acatcctgag gcgcaagcag 600 ccccagctga cgttcttcac catcgccctg cagagctgcc actaccagag gctcccgccc 660 cacatcctgt gggcgaccgg gctcaag 687 <210> 3 <211> 1251 <212> PRT <213> Moraxella bovis <400> 3 Met Leu Phe Gln Asp Phe Thr His Leu Tyr Pro Leu Ser Lys Thr Val 1 5 10 15 Arg Phe Glu Leu Lys Pro Ile Gly Arg Thr Leu Glu His Ile His Ala 20 25 30 Lys Asn Phe Leu Ser Gln Asp Glu Thr Met Ala Asp Met Tyr Gln Lys 35 40 45 Val Lys Val Ile Leu Asp Asp Tyr His Arg Asp Phe Ile Ala Asp Met 50 55 60 Met Gly Glu Val Lys Leu Thr Lys Leu Ala Glu Phe Tyr Asp Val Tyr 65 70 75 80 Leu Lys Phe Arg Lys Asn Pro Lys Asp Asp Gly Leu Gln Lys Gln Leu 85 90 95 Lys Asp Leu Gln Ala Val Leu Arg Lys Glu Ser Val Lys Pro Ile Gly 100 105 110 Ser Gly Gly Lys Tyr Lys Thr Gly Tyr Asp Arg Leu Phe Gly Ala Lys 115 120 125 Leu Phe Lys Asp Gly Lys Glu Leu Gly Asp Leu Ala Lys Phe Val Ile 130 135 140 Ala Gln Glu Gly Glu Ser Ser Pro Lys Leu Ala His Leu Ala His Phe 145 150 155 160 Glu Lys Phe Ser Thr Tyr Phe Thr Gly Phe His Asp Asn Arg Lys Asn 165 170 175 Met Tyr Ser Asp Glu Asp Lys His Thr Ala Ile Ala Tyr Arg Leu Ile 180 185 190 His Glu Asn Leu Pro Arg Phe Ile Asp Asn Leu Gln Ile Leu Thr Thr 195 200 205 Ile Lys Gln Lys His Ser Ala Leu Tyr Asp Gln Ile Ile Asn Glu Leu 210 215 220 Thr Ala Ser Gly Leu Asp Val Ser Leu Ala Ser His Leu Asp Gly Tyr 225 230 235 240 His Lys Leu Leu Thr Gln Glu Gly Ile Thr Ala Tyr Asn Arg Ile Ile 245 250 255 Gly Glu Val Asn Gly Tyr Thr Asn Lys His Asn Gln Ile Cys His Lys 260 265 270 Ser Glu Arg Ile Ala Lys Leu Arg Pro Leu His Lys Gln Ile Leu Ser 275 280 285 Asp Gly Met Gly Val Ser Phe Leu Pro Ser Lys Phe Ala Asp Asp Ser 290 295 300 Glu Met Cys Gln Ala Val Asn Glu Phe Tyr Arg His Tyr Thr Asp Val 305 310 315 320 Phe Ala Lys Val Gln Ser Leu Phe Asp Gly Phe Asp Asp His Gln Lys 325 330 335 Asp Gly Ile Tyr Val Glu His Lys Asn Leu Asn Glu Leu Ser Lys Gln 340 345 350 Ala Phe Gly Asp Phe Ala Leu Leu Gly Arg Val Leu Asp Gly Tyr Tyr 355 360 365 Val Asp Val Val Asn Pro Glu Phe Asn Glu Arg Phe Ala Lys Ala Lys 370 375 380 Thr Asp Asn Ala Lys Ala Lys Leu Thr Lys Glu Lys Asp Lys Phe Ile 385 390 395 400 Lys Gly Val His Ser Leu Ala Ser Leu Glu Gln Ala Ile Glu His His 405 410 415 Thr Ala Arg His Asp Asp Glu Ser Val Gln Ala Gly Lys Leu Gly Gln 420 425 430 Tyr Phe Lys His Gly Leu Ala Gly Val Asp Asn Pro Ile Gln Lys Ile 435 440 445 His Asn Asn His Ser Thr Ile Lys Gly Phe Leu Glu Arg Glu Arg Pro 450 455 460 Ala Gly Glu Arg Ala Leu Pro Lys Ile Lys Ser Gly Lys Asn Pro Glu 465 470 475 480 Met Thr Gln Leu Arg Gln Leu Lys Glu Leu Leu Asp Asn Ala Leu Asn 485 490 495 Val Ala His Phe Ala Lys Leu Leu Thr Thr Lys Thr Thr Leu Asp Asn 500 505 510 Gln Asp Gly Asn Phe Tyr Gly Glu Phe Gly Val Leu Tyr Asp Glu Leu 515 520 525 Ala Lys Ile Pro Thr Leu Tyr Asn Lys Val Arg Asp Tyr Leu Ser Gln 530 535 540 Lys Pro Phe Ser Thr Glu Lys Tyr Lys Leu Asn Phe Gly Asn Pro Thr 545 550 555 560 Leu Leu Asn Gly Trp Asp Leu Asn Lys Glu Lys Asp Asn Phe Gly Val 565 570 575 Ile Leu Gln Lys Asp Gly Cys Tyr Tyr Leu Ala Leu Leu Asp Lys Ala 580 585 590 His Lys Lys Val Phe Asp Asn Ala Pro Asn Thr Gly Lys Asn Val Tyr 595 600 605 Gln Lys Met Val Tyr Lys Leu Leu Pro Gly Pro Asn Lys Met Leu Pro 610 615 620 Lys Val Phe Phe Ala Lys Ser Asn Leu Asp Tyr Tyr Asn Pro Ser Ala 625 630 635 640 Glu Leu Leu Asp Lys Tyr Ala Lys Gly Thr His Lys Lys Gly Asp Asn 645 650 655 Phe Asn Leu Lys Asp Cys His Ala Leu Ile Asp Phe Phe Lys Ala Gly 660 665 670 Ile Asn Lys His Pro Glu Trp Gln His Phe Gly Phe Lys Phe Ser Pro 675 680 685 Thr Ser Ser Tyr Arg Asp Leu Ser Asp Phe Tyr Arg Glu Val Glu Pro 690 695 700 Gln Gly Tyr Gln Val Lys Phe Val Asp Ile Asn Ala Asp Tyr Ile Asp 705 710 715 720 Glu Leu Val Glu Gln Gly Lys Leu Tyr Leu Phe Gln Ile Tyr Asn Lys 725 730 735 Asp Phe Ser Pro Lys Ala His Gly Lys Pro Asn Leu His Thr Leu Tyr 740 745 750 Phe Lys Ala Leu Phe Ser Glu Asp Asn Leu Ala Asp Pro Ile Tyr Lys 755 760 765 Leu Asn Gly Glu Ala Gln Ile Phe Tyr Arg Lys Ala Ser Leu Asp Met 770 775 780 Asn Glu Thr Thr Ile His Arg Ala Gly Glu Val Leu Glu Asn Lys Asn 785 790 795 800 Pro Asp Asn Pro Lys Lys Arg Gln Phe Val Tyr Asp Ile Ile Lys Asp 805 810 815 Lys Arg Tyr Thr Gln Asp Lys Phe Met Leu His Val Pro Ile Thr Met 820 825 830 Asn Phe Gly Val Gln Gly Met Thr Ile Lys Glu Phe Asn Lys Lys Val 835 840 845 Asn Gln Ser Ile Gln Gln Tyr Asp Glu Val Asn Val Ile Gly Ile Asp 850 855 860 Arg Gly Glu Arg His Leu Leu Tyr Leu Thr Val Ile Asn Ser Lys Gly 865 870 875 880 Glu Ile Leu Glu Gln Arg Ser Leu Asn Asp Ile Thr Thr Ala Ser Ala 885 890 895 Asn Gly Thr Gln Val Thr Thr Pro Tyr His Lys Ile Leu Asp Lys Arg 900 905 910 Glu Ile Glu Arg Leu Asn Ala Arg Val Gly Trp Gly Glu Ile Glu Thr 915 920 925 Ile Lys Glu Leu Lys Ser Gly Tyr Leu Ser His Val Val His Gln Ile 930 935 940 Asn Gln Leu Met Leu Lys Tyr Asn Ala Ile Val Val Leu Glu Asp Leu 945 950 955 960 Asn Phe Gly Phe Lys Arg Gly Arg Phe Lys Val Glu Lys Gln Ile Tyr 965 970 975 Gln Asn Phe Glu Asn Ala Leu Ile Lys Lys Leu Asn His Leu Val Leu 980 985 990 Lys Asp Lys Ala Asp Asp Glu Ile Gly Ser Tyr Lys Asn Ala Leu Gln 995 1000 1005 Leu Thr Asn Asn Phe Thr Asp Leu Lys Ser Ile Gly Lys Gln Thr 1010 1015 1020 Gly Phe Leu Phe Tyr Val Pro Ala Trp Asn Thr Ser Lys Ile Asp 1025 1030 1035 Pro Glu Thr Gly Phe Val Asp Leu Leu Lys Pro Arg Tyr Glu Asn 1040 1045 1050 Ile Ala Gln Ser Gln Ala Phe Phe Gly Lys Phe Asp Lys Ile Cys 1055 1060 1065 Tyr Asn Thr Asp Lys Gly Tyr Phe Glu Phe His Ile Asp Tyr Ala 1070 1075 1080 Lys Phe Thr Asp Lys Ala Lys Asn Ser Arg Gln Lys Trp Ala Ile 1085 1090 1095 Cys Ser His Gly Asp Lys Arg Tyr Val Tyr Asp Lys Thr Ala Asn 1100 1105 1110 Gln Asn Lys Gly Ala Ala Lys Gly Ile Asn Val Asn Asp Glu Leu 1115 1120 1125 Lys Ser Leu Phe Ala Arg Tyr His Ile Asn Asp Lys Gln Pro Asn 1130 1135 1140 Leu Val Met Asp Ile Cys Gln Asn Asn Asp Lys Glu Phe His Lys 1145 1150 1155 Ser Leu Met Cys Leu Leu Lys Thr Leu Leu Ala Leu Arg Tyr Ser 1160 1165 1170 Asn Ala Ser Ser Asp Glu Asp Phe Ile Leu Ser Pro Val Ala Asn 1175 1180 1185 Asp Glu Gly Val Phe Phe Asn Ser Ala Leu Ala Asp Asp Thr Gln 1190 1195 1200 Pro Gln Asn Ala Asp Ala Asn Gly Ala Tyr His Ile Ala Leu Lys 1205 1210 1215 Gly Leu Trp Leu Leu Asn Glu Leu Lys Asn Ser Asp Asp Leu Asn 1220 1225 1230 Lys Val Lys Leu Ala Ile Asp Asn Gln Thr Trp Leu Asn Phe Ala 1235 1240 1245 Gln Asn Arg 1250 <210> 4 <211> 3753 <212> DNA <213> Artificial Sequence <220> <223> Codon optimized <400> 4 gctctgtttc aagattttac acatctgtac ccgctgagta aaacagtgcg gttcgagctg 60 aaacccatag gaaggaccct cgagcacatc cacgcgaaga attttctgag ccaggatgaa 120 actatggctg atatgtatca aaaagttaag gtcattttgg acgactatca tcgcgatttt 180 attgccgaca tgatgggaga ggtgaaactc acgaagcttg ctgaatttta cgacgtctat 240 ctgaagttca ggaaaaatcc taaggacgat gggctgcaaa aacagcttaa agaccttcaa 300 gctgtccttc ggaaggaatc ggtgaagcct atagggtcag gtgggaagta caaaacaggc 360 tacgatagac tctttggggc aaaactcttc aaagatggaa aagagttggg tgacctcgca 420 aaattcgtta tagcccaaga aggtgagtct tctccgaagc tggctcatct tgctcatttt 480 gagaagttca gcacgtattt tactggattt cacgataatc ggaagaatat gtactcggat 540 gaagacaagc atactgcaat agcgtacagg ctcatccatg agaatttgcc gagattcatc 600 gacaatctgc aaatcttgac aacaatcaaa caaaagcata gcgccctcta tgatcagata 660 atcaacgagc tcacggcctc cgggctcgac gtctccttgg cttctcatct tgacgggtat 720 cacaagctcc ttacacaaga ggggatcacg gcatacaaca ggatcatagg agaggtgaat 780 ggatatacaa ataagcataa ccagatatgc cacaagagcg agcgcatagc gaaacttaga 840 cccttgcaca agcaaatcct ttctgacgga atgggagtgt cattccttcc gtctaagttc 900 gcggatgata gtgagatgtg ccaagcggtc aacgaatttt atcgccatta tactgacgtg 960 ttcgcaaagg tgcaaagtct ctttgacgga tttgatgatc accagaaaga cgggatctat 1020 gttgaacaca aaaaccttaa tgaactgagc aaacaggcgt tcggcgactt tgctttgctg 1080 gggagggtcc ttgatggata ctacgtggac gttgtcaatc cggagttcaa tgagcggttc 1140 gcaaaggcca agactgacaa tgcgaaagcc aagcttacaa aagaaaagga caaattcatt 1200 aaaggagtcc actcactggc ttccctcgaa caagcaatag aacaccatac agctagacac 1260 gacgatgaga gtgttcaagc cggaaaactt ggccagtact tcaaacacgg tttggcgggg 1320 gttgacaacc cgattcagaa aattcacaat aaccattcga cgattaaagg gtttctggaa 1380 agggaaaggc ctgctgggga acgggcgctc ccgaagatca agtcaggaaa aaacccagaa 1440 atgacacagc tcaggcagct gaaggaactt ttggacaacg cattgaatgt ggcgcacttc 1500 gctaagctgc tgacaactaa aacaaccttg gacaaccagg atggaaattt ttacggggag 1560 tttggggtgc tttacgacga gctggctaaa attccaactc tctacaataa ggttagagat 1620 tatctctctc aaaagccctt ttctaccgaa aagtataagc tcaacttcgg caatccgacc 1680 cttctcaatg ggtgggacct gaacaaagag aaagataact ttggggttat acttcagaag 1740 gatggatgct attacttggc gcttcttgat aaggctcata aaaaagtttt cgacaacgcc 1800 cctaacactg gtaagaacgt ctaccaaaag atggtctaca aactgttgcc cggccccaac 1860 aaaatgcttc ctaaagtgtt tttcgcaaaa tcgaatctcg actattataa tccatctgcc 1920 gagctccttg acaaatatgc taaggggacc cataaaaagg gtgataattt caacctgaag 1980 gactgccacg cgcttatcga ctttttcaaa gccgggataa ataagcatcc ggagtggcaa 2040 cattttggtt ttaaattttc gccaacgtcg tcctatcgcg acctttccga tttctatagg 2100 gaagttgaac ctcaggggta ccaggtcaaa tttgttgaca ttaatgcgga ctacattgat 2160 gaattggtgg agcaagggaa gctctacctc tttcaaatat ataacaaaga tttctcgcca 2220 aaagcgcatg gtaaaccgaa tcttcatacc ttgtacttta aagcactttt ttcagaagat 2280 aacttggcgg acccgatcta caagctgaat ggggaagctc agatcttcta caggaaagct 2340 tcgttggaca tgaacgagac taccatacat cgcgcgggag aggtgcttga gaacaaaaat 2400 cccgacaacc cgaaaaagcg gcaattcgtt tacgacatca tcaaagacaa acggtacacg 2460 caggacaaat ttatgctcca cgtccccatt accatgaatt ttggagtcca aggcatgacc 2520 attaaggaat tcaacaaaaa ggtcaaccaa agtattcagc aatacgatga agtcaatgtc 2580 ataggcatag atcggggaga aaggcatctg ttgtatctta ccgtgattaa ctctaagggt 2640 gaaatactgg agcaacggtc acttaacgat ataaccacgg cgtccgcgaa cggtacacaa 2700 gtgaccactc cctaccacaa aatattggat aaaagggaga tagaacgctt gaatgcccgc 2760 gttggctggg gtgagattga gaccatcaaa gagcttaaat cgggatattt gtctcacgtc 2820 gttcatcaaa ttaaccaact catgcttaag tacaatgcaa tcgttgtgct cgaggacctg 2880 aactttggtt tcaaaagagg gaggttcaag gtggaaaaac aaatttacca gaactttgaa 2940 aacgcgctta tcaagaaatt gaatcacctt gttttgaaag ataaggcaga tgacgaaatc 3000 gggtcgtata aaaatgcact ccagttgaca aataatttca cggatttgaa gtcgatcggc 3060 aagcaaacag ggttcctctt ttatgtgcca gcgtggaata catcaaaaat tgatccggag 3120 acgggatttg tcgacttgct gaagcctagg tatgagaaca ttgcccaatc tcaggccttt 3180 ttcggcaaat tcgataaaat atgctacaac acagacaaag gttattttga atttcacatt 3240 gattacgcca aatttacaga taaggcgaaa aacagcagac agaaatgggc tatctgttct 3300 catggggaca aacgctatgt ctacgataag acggctaatc aaaataaagg cgccgcaaaa 3360 ggtattaatg tgaatgatga gctgaaaagc ttgtttgccc gctaccatat caatgataaa 3420 caaccaaact tggtgatgga catatgccag aacaatgaca aagaattcca caagtcactc 3480 atgtgcctgc ttaaaaccct tttggcgctg cggtatagca atgcatctag cgatgaagac 3540 tttattttga gtcccgtggc caacgacgag ggcgtgtttt ttaattcagc cttggcggac 3600 gatacgcagc cccagaatgc ggacgcaaac ggcgcgtacc acattgcact gaagggactg 3660 tggcttctga acgagctgaa aaatagcgac gacctgaata aagtcaagtt ggccattgac 3720 aatcaaacct ggttgaattt cgctcaaaat aga 3753 <210> 5 <211> 4367 <212> DNA <213> Artificial Sequence <220> <223> Codon optimized fusion protein <400> 5 atgtccagcg agaccggccc cgtggcggtg gaccccaccc tgcgcaggcg catcgagccg 60 cacgagttcg aggtgttctt cgaccccagg gagctccgca aggagacctg cctcctgtac 120 gagatcaact ggggcggcag gcactccatc tggaggcaca cgagccagaa caccaacaag 180 cacgtcgagg tgaacttcat cgagaagttc accacggaga ggtacttctg cccgaacacg 240 cgctgctcca tcacgtggtt cctctcgtgg agcccatgcg gcgagtgctc cagggcgatc 300 acggagttcc tcagccgcta cccgcacgtg accctgttca tctacatcgc taggctctac 360 caccacgcgg accccaggaa caggcagggc ctcagggacc tgatctccag cggcgtcacg 420 atccagatca tgaccgagca ggagtccggc tactgctgga ggaacttcgt gaactactcc 480 ccgagcaacg aggcccactg gccccgctac ccgcacctct gggtccgcct ctacgtgctc 540 gagctgtact gcatcatcct cggcctgccg ccctgcctca acatcctgag gcgcaagcag 600 ccccagctga cgttcttcac catcgccctg cagagctgcc actaccagag gctcccgccc 660 cacatcctgt gggcgaccgg gctcaagggg ggcgggggct caggcggggg cgggagcggc 720 ggcgggggct ctgggggcgg cggcagcggc gggggcggca gcgggggcgg cgggtcgatg 780 agcaagctgg agaagttcac gaactgctac tccctcagca agaccctgag gttcaaggcg 840 atcccggtcg gcaagaccca ggagaacatc gacaacaagc ggctgctggt ggaggacgag 900 aagagggctg aggactacaa gggcgtgaag aagctcctgg accgctacta cctgtccttc 960 atcaacgacg tgctccacag catcaagctc aagaacctga acaactacat cagcctcttc 1020 aggaagaaga cgcgcaccga gaaggagaac aaggagctcg agaacctgga gatcaacctg 1080 aggaaggaga tcgccaaggc gttcaagggc aacgagggct acaagtccct cttcaagaag 1140 gacatcatcg agacgatcct cccggagttc ctggacgaca aggacgagat cgccctggtc 1200 aactccttca acggcttcac cacggcgttc accggcttct tcgacaaccg cgagaacatg 1260 ttcagcgagg aggccaagtc cacgagcatc gcgttcaggt gcatcaacga gaacctcacc 1320 cgctacatct ccaacatgga catcttcgag aaggtcgacg cgatcttcga caagcacgag 1380 gtgcaggaga tcaaggagaa gatcctgaac agcgactacg acgtcgagga cttcttcgag 1440 ggcgagttct tcaacttcgt cctcacgcag gagggcatcg acgtgtacaa cgccatcatc 1500 ggtggcttcg tgaccgagtc cggcgagaag atcaagggcc tgaacgagta catcaacctc 1560 tacaaccaga agaccaagca gaagctgccg aagttcaagc ccctgtacaa gcaggtgctc 1620 tccgacaggg agtccctcag cttctacggc gagggctaca cgagcgacga ggaggtcctg 1680 gaggtgttcc gcaacaccct caacaagaac agcgagatct tctccagcat caagaagctc 1740 gagaagctgt tcaagaactt cgacgagtac tccagcgccg gcatcttcgt caagaacggc 1800 ccggcgatct ccacgatcag caaggacatc ttcggcgagt ggaacgtgat ccgcgacaag 1860 tggaacgccg agtacgacga catccacctc aagaagaagg cggtggtcac cgagaagtac 1920 gaggacgaca ggcgcaagtc cttcaagaag atcggctcct tcagcctcga gcagctgcag 1980 gagtacgccg acgcggacct gagcgtggtc gagaagctca aggagatcat catccagaag 2040 gtcgacgaga tctacaaggt gtacggctcc agcgagaagc tcttcgacgc ggacttcgtc 2100 ctcgagaagt ccctgaagaa gaacgacgcc gtggtcgcga tcatgaagga cctcctggac 2160 tccgtgaaga gcttcgagaa ttacatcaag gccttcttcg gcgagggcaa ggagacgaac 2220 agggacgagt ccttctacgg cgacttcgtc ctggcctacg acatcctcct gaaggtggac 2280 cacatctacg acgcgatccg caactacgtg acccagaagc cgtacagcaa ggacaagttc 2340 aagctctact tccagaaccc ccagttcatg ggcggctggg acaaggacaa ggagacggac 2400 tacagggcga ccatcctgcg ctacggcagc aagtactacc tcgccatcat ggacaagaag 2460 tacgcgaagt gcctgcagaa gatcgacaag gacgacgtca acggcaacta cgagaagatc 2520 aactacaagc tcctgccggg ccccaacaag atgctcccga aggtgttctt ctccaagaag 2580 tggatggcct actacaaccc cagcgaggac atccagaaga tctacaagaa cggcacgttc 2640 aagaagggcg acatgttcaa cctgaacgac tgccacaagc tcatcgactt cttcaaggac 2700 tccatcagcc gctacccgaa gtggtccaac gcctacgact tcaacttcag cgagaccgag 2760 aagtacaagg acatcgcggg cttctaccgc gaggtcgagg agcagggcta caaggtgtcc 2820 ttcgagtccg ccagcaagaa ggaggtcgac aagctggtgg aggagggcaa gctctacatg 2880 ttccagatct acaacaagga cttctccgac aagagccacg gcacgcccaa cctgcacacc 2940 atgtacttca agctcctgtt cgacgagaac aaccacggcc agatcaggct gtccggcggc 3000 gccgagctct tcatgaggag ggcgagcctg aagaaggagg agctggtggt ccaccccgct 3060 aacagcccaa tcgcgaacaa gaacccggac aaccccaaga agaccacgac cctgtcctac 3120 gacgtgtaca aggacaagag gttcagcgag gaccagtacg agctccacat cccgatcgcg 3180 atcaacaagt gccccaagaa catcttcaag atcaacaccg aggtccgcgt gctcctgaag 3240 cacgacgaca acccctacgt gatcggcatc gctaggggcg agaggaacct cctgtacatc 3300 gtggtcgtgg acggcaaggg caacatcgtg gagcagtact ccctcaacga gatcatcaac 3360 aacttcaacg gcatcaggat caagacggac taccacagcc tcctggacaa gaaggagaag 3420 gagaggttcg aggcccgcca gaactggacc tccatcgaga acatcaagga gctgaaggcg 3480 ggctacatca gccaggtcgt gcacaagatc tgcgagctcg tcgagaagta cgacgccgtg 3540 atcgccctcg cggacctgaa ctccggcttc aagaacagcc gcgtcaaggt ggagaagcag 3600 gtctaccaga agttcgagaa gatgctcatc gacaagctga actacatggt ggacaagaag 3660 tccaacccct gcgctacggg cggcgcgctg aagggctacc agatcaccaa caagttcgag 3720 agcttcaagt ccatgagcac tcagaacggc ttcatcttct acatcccggc gtggctcacg 3780 tccaagatcg accccagcac cggcttcgtc aacctcctga agacgaagta cacctccatc 3840 gccgacagca agaagttcat ctccagcttc gaccgcatca tgtatgtgcc ggaggaggac 3900 ctgttcgagt tcgccctcga ctacaagaac ttctcccgca cggacgcgga ctacatcaag 3960 aagtggaagc tgtacagcta cggcaaccgc atccgcatct tcaggaaccc caagaagaac 4020 aacgtcttcg actgggagga ggtgtgcctg acctccgcgt acaaggagct cttcaacaag 4080 tacggcatca actaccagca gggcgacatc agggctctcc tgtgcgagca gagcgacaag 4140 gccttctact ccagcttcat ggcgctgatg tccctcatgc tgcagatgag gaactcgatc 4200 accggcagga cggacgtggc cttcctcatc tccccggtga agaacagcga cggcatcttc 4260 tacgactcca ggaactacga ggcccaggag aacgcgatcc tcccaaagaa cgcggacgcc 4320 aacggcgcct acaacatcgc caggaaggtc ctctgggcta tcggcca 4367 <210> 6 <211> 1455 <212> PRT <213> Artificial Sequence <220> <223> Fusion protein <400> 6 Met Ser Ser Glu Thr Gly Pro Val Ala Val Asp Pro Thr Leu Arg Arg 1 5 10 15 Arg Ile Glu Pro His Glu Phe Glu Val Phe Phe Asp Pro Arg Glu Leu 20 25 30 Arg Lys Glu Thr Cys Leu Leu Tyr Glu Ile Asn Trp Gly Gly Arg His 35 40 45 Ser Ile Trp Arg His Thr Ser Gln Asn Thr Asn Lys His Val Glu Val 50 55 60 Asn Phe Ile Glu Lys Phe Thr Thr Glu Arg Tyr Phe Cys Pro Asn Thr 65 70 75 80 Arg Cys Ser Ile Thr Trp Phe Leu Ser Trp Ser Pro Cys Gly Glu Cys 85 90 95 Ser Arg Ala Ile Thr Glu Phe Leu Ser Arg Tyr Pro His Val Thr Leu 100 105 110 Phe Ile Tyr Ile Ala Arg Leu Tyr His His Ala Asp Pro Arg Asn Arg 115 120 125 Gln Gly Leu Arg Asp Leu Ile Ser Ser Gly Val Thr Ile Gln Ile Met 130 135 140 Thr Glu Gln Glu Ser Gly Tyr Cys Trp Arg Asn Phe Val Asn Tyr Ser 145 150 155 160 Pro Ser Asn Glu Ala His Trp Pro Arg Tyr Pro His Leu Trp Val Arg 165 170 175 Leu Tyr Val Leu Glu Leu Tyr Cys Ile Ile Leu Gly Leu Pro Pro Cys 180 185 190 Leu Asn Ile Leu Arg Arg Lys Gln Pro Gln Leu Thr Phe Phe Thr Ile 195 200 205 Ala Leu Gln Ser Cys His Tyr Gln Arg Leu Pro Pro His Ile Leu Trp 210 215 220 Ala Thr Gly Leu Lys Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly 225 230 235 240 Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly 245 250 255 Gly Gly Ser Met Ser Lys Leu Glu Lys Phe Thr Asn Cys Tyr Ser Leu 260 265 270 Ser Lys Thr Leu Arg Phe Lys Ala Ile Pro Val Gly Lys Thr Gln Glu 275 280 285 Asn Ile Asp Asn Lys Arg Leu Leu Val Glu Asp Glu Lys Arg Ala Glu 290 295 300 Asp Tyr Lys Gly Val Lys Lys Leu Leu Asp Arg Tyr Tyr Leu Ser Phe 305 310 315 320 Ile Asn Asp Val Leu His Ser Ile Lys Leu Lys Asn Leu Asn Asn Tyr 325 330 335 Ile Ser Leu Phe Arg Lys Lys Thr Arg Thr Glu Lys Glu Asn Lys Glu 340 345 350 Leu Glu Asn Leu Glu Ile Asn Leu Arg Lys Glu Ile Ala Lys Ala Phe 355 360 365 Lys Gly Asn Glu Gly Tyr Lys Ser Leu Phe Lys Lys Asp Ile Ile Glu 370 375 380 Thr Ile Leu Pro Glu Phe Leu Asp Asp Lys Asp Glu Ile Ala Leu Val 385 390 395 400 Asn Ser Phe Asn Gly Phe Thr Thr Ala Phe Thr Gly Phe Phe Asp Asn 405 410 415 Arg Glu Asn Met Phe Ser Glu Glu Ala Lys Ser Thr Ser Ile Ala Phe 420 425 430 Arg Cys Ile Asn Glu Asn Leu Thr Arg Tyr Ile Ser Asn Met Asp Ile 435 440 445 Phe Glu Lys Val Asp Ala Ile Phe Asp Lys His Glu Val Gln Glu Ile 450 455 460 Lys Glu Lys Ile Leu Asn Ser Asp Tyr Asp Val Glu Asp Phe Phe Glu 465 470 475 480 Gly Glu Phe Phe Asn Phe Val Leu Thr Gln Glu Gly Ile Asp Val Tyr 485 490 495 Asn Ala Ile Ile Gly Gly Phe Val Thr Glu Ser Gly Glu Lys Ile Lys 500 505 510 Gly Leu Asn Glu Tyr Ile Asn Leu Tyr Asn Gln Lys Thr Lys Gln Lys 515 520 525 Leu Pro Lys Phe Lys Pro Leu Tyr Lys Gln Val Leu Ser Asp Arg Glu 530 535 540 Ser Leu Ser Phe Tyr Gly Glu Gly Tyr Thr Ser Asp Glu Glu Val Leu 545 550 555 560 Glu Val Phe Arg Asn Thr Leu Asn Lys Asn Ser Glu Ile Phe Ser Ser 565 570 575 Ile Lys Lys Leu Glu Lys Leu Phe Lys Asn Phe Asp Glu Tyr Ser Ser 580 585 590 Ala Gly Ile Phe Val Lys Asn Gly Pro Ala Ile Ser Thr Ile Ser Lys 595 600 605 Asp Ile Phe Gly Glu Trp Asn Val Ile Arg Asp Lys Trp Asn Ala Glu 610 615 620 Tyr Asp Asp Ile His Leu Lys Lys Lys Ala Val Val Thr Glu Lys Tyr 625 630 635 640 Glu Asp Asp Arg Arg Lys Ser Phe Lys Lys Ile Gly Ser Phe Ser Leu 645 650 655 Glu Gln Leu Gln Glu Tyr Ala Asp Ala Asp Leu Ser Val Val Glu Lys 660 665 670 Leu Lys Glu Ile Ile Ile Gln Lys Val Asp Glu Ile Tyr Lys Val Tyr 675 680 685 Gly Ser Ser Glu Lys Leu Phe Asp Ala Asp Phe Val Leu Glu Lys Ser 690 695 700 Leu Lys Lys Asn Asp Ala Val Val Ala Ile Met Lys Asp Leu Leu Asp 705 710 715 720 Ser Val Lys Ser Phe Glu Asn Tyr Ile Lys Ala Phe Phe Gly Glu Gly 725 730 735 Lys Glu Thr Asn Arg Asp Glu Ser Phe Tyr Gly Asp Phe Val Leu Ala 740 745 750 Tyr Asp Ile Leu Leu Lys Val Asp His Ile Tyr Asp Ala Ile Arg Asn 755 760 765 Tyr Val Thr Gln Lys Pro Tyr Ser Lys Asp Lys Phe Lys Leu Tyr Phe 770 775 780 Gln Asn Pro Gln Phe Met Gly Gly Trp Asp Lys Asp Lys Glu Thr Asp 785 790 795 800 Tyr Arg Ala Thr Ile Leu Arg Tyr Gly Ser Lys Tyr Tyr Leu Ala Ile 805 810 815 Met Asp Lys Lys Tyr Ala Lys Cys Leu Gln Lys Ile Asp Lys Asp Asp 820 825 830 Val Asn Gly Asn Tyr Glu Lys Ile Asn Tyr Lys Leu Leu Pro Gly Pro 835 840 845 Asn Lys Met Leu Pro Lys Val Phe Phe Ser Lys Lys Trp Met Ala Tyr 850 855 860 Tyr Asn Pro Ser Glu Asp Ile Gln Lys Ile Tyr Lys Asn Gly Thr Phe 865 870 875 880 Lys Lys Gly Asp Met Phe Asn Leu Asn Asp Cys His Lys Leu Ile Asp 885 890 895 Phe Phe Lys Asp Ser Ile Ser Arg Tyr Pro Lys Trp Ser Asn Ala Tyr 900 905 910 Asp Phe Asn Phe Ser Glu Thr Glu Lys Tyr Lys Asp Ile Ala Gly Phe 915 920 925 Tyr Arg Glu Val Glu Glu Gln Gly Tyr Lys Val Ser Phe Glu Ser Ala 930 935 940 Ser Lys Lys Glu Val Asp Lys Leu Val Glu Glu Gly Lys Leu Tyr Met 945 950 955 960 Phe Gln Ile Tyr Asn Lys Asp Phe Ser Asp Lys Ser His Gly Thr Pro 965 970 975 Asn Leu His Thr Met Tyr Phe Lys Leu Leu Phe Asp Glu Asn Asn His 980 985 990 Gly Gln Ile Arg Leu Ser Gly Gly Ala Glu Leu Phe Met Arg Arg Ala 995 1000 1005 Ser Leu Lys Lys Glu Glu Leu Val Val His Pro Ala Asn Ser Pro 1010 1015 1020 Ile Ala Asn Lys Asn Pro Asp Asn Pro Lys Lys Thr Thr Thr Leu 1025 1030 1035 Ser Tyr Asp Val Tyr Lys Asp Lys Arg Phe Ser Glu Asp Gln Tyr 1040 1045 1050 Glu Leu His Ile Pro Ile Ala Ile Asn Lys Cys Pro Lys Asn Ile 1055 1060 1065 Phe Lys Ile Asn Thr Glu Val Arg Val Leu Leu Lys His Asp Asp 1070 1075 1080 Asn Pro Tyr Val Ile Gly Ile Ala Arg Gly Glu Arg Asn Leu Leu 1085 1090 1095 Tyr Ile Val Val Val Asp Gly Lys Gly Asn Ile Val Glu Gln Tyr 1100 1105 1110 Ser Leu Asn Glu Ile Ile Asn Asn Phe Asn Gly Ile Arg Ile Lys 1115 1120 1125 Thr Asp Tyr His Ser Leu Leu Asp Lys Lys Glu Lys Glu Arg Phe 1130 1135 1140 Glu Ala Arg Gln Asn Trp Thr Ser Ile Glu Asn Ile Lys Glu Leu 1145 1150 1155 Lys Ala Gly Tyr Ile Ser Gln Val Val His Lys Ile Cys Glu Leu 1160 1165 1170 Val Glu Lys Tyr Asp Ala Val Ile Ala Leu Ala Asp Leu Asn Ser 1175 1180 1185 Gly Phe Lys Asn Ser Arg Val Lys Val Glu Lys Gln Val Tyr Gln 1190 1195 1200 Lys Phe Glu Lys Met Leu Ile Asp Lys Leu Asn Tyr Met Val Asp 1205 1210 1215 Lys Lys Ser Asn Pro Cys Ala Thr Gly Gly Ala Leu Lys Gly Tyr 1220 1225 1230 Gln Ile Thr Asn Lys Phe Glu Ser Phe Lys Ser Met Ser Thr Gln 1235 1240 1245 Asn Gly Phe Ile Phe Tyr Ile Pro Ala Trp Leu Thr Ser Lys Ile 1250 1255 1260 Asp Pro Ser Thr Gly Phe Val Asn Leu Leu Lys Thr Lys Tyr Thr 1265 1270 1275 Ser Ile Ala Asp Ser Lys Lys Phe Ile Ser Ser Phe Asp Arg Ile 1280 1285 1290 Met Tyr Val Pro Glu Glu Asp Leu Phe Glu Phe Ala Leu Asp Tyr 1295 1300 1305 Lys Asn Phe Ser Arg Thr Asp Ala Asp Tyr Ile Lys Lys Trp Lys 1310 1315 1320 Leu Tyr Ser Tyr Gly Asn Arg Ile Arg Ile Phe Arg Asn Pro Lys 1325 1330 1335 Lys Asn Asn Val Phe Asp Trp Glu Glu Val Cys Leu Thr Ser Ala 1340 1345 1350 Tyr Lys Glu Leu Phe Asn Lys Tyr Gly Ile Asn Tyr Gln Gln Gly 1355 1360 1365 Asp Ile Arg Ala Leu Leu Cys Glu Gln Ser Asp Lys Ala Phe Tyr 1370 1375 1380 Ser Ser Phe Met Ala Leu Met Ser Leu Met Leu Gln Met Arg Asn 1385 1390 1395 Ser Ile Thr Gly Arg Thr Asp Val Ala Phe Leu Ile Ser Pro Val 1400 1405 1410 Lys Asn Ser Asp Gly Ile Phe Tyr Asp Ser Arg Asn Tyr Glu Ala 1415 1420 1425 Gln Glu Asn Ala Ile Leu Pro Lys Asn Ala Asp Ala Asn Gly Ala 1430 1435 1440 Tyr Asn Ile Ala Arg Lys Val Leu Trp Ala Ile Gly 1445 1450 1455 <210> 7 <211> 249 <212> DNA <213> Artificial Sequence <220> <223> Codon Optimized <400> 7 acgaacctgt ccgacatcat cgagaaggag accggcaagc agctcgtgat ccaggagagc 60 atcctcatgc tgccggagga ggtcgaggag gtcatcggca acaagcccga gtccgacatc 120 ctcgtccaca cggcctacga cgagtccacc gacgagaacg tgatgctcct gacctcggac 180 gctcccgagt acaagccatg ggccctggtc atccaggaca gcaacggcga gaacaagatc 240 aagatgctc 249 <210> 8 <211> 83 <212> PRT <213> Bacillus subtilis phage PBSX <400> 8 Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly Lys Gln Leu Val 1 5 10 15 Ile Gln Glu Ser Ile Leu Met Leu Pro Glu Glu Val Glu Glu Val Ile 20 25 30 Gly Asn Lys Pro Glu Ser Asp Ile Leu Val His Thr Ala Tyr Asp Glu 35 40 45 Ser Thr Asp Glu Asn Val Met Leu Leu Thr Ser Asp Ala Pro Glu Tyr 50 55 60 Lys Pro Trp Ala Leu Val Ile Gln Asp Ser Asn Gly Glu Asn Lys Ile 65 70 75 80 Lys Met Leu <210> 9 <211> 6882 <212> DNA <213> Artificial Sequence <220> <223> Codon optimized fusion <400> 9 gaattcatta tgtggtctag gtaggttcta tatataagaa aacttgaaat gttctaaaaa 60 aaaattcaag cccatgcatg attgaagcaa acggtatagc aacggtgtta acctgatcta 120 gtgatctctt gcaatcctta acggccacct accgcaggta gcaaacggcg tccccctcct 180 cgatatctcc gcggcgacct ctggcttttt ccgcggaatt gcgcggtggg gacggattcc 240 acgagaccgc gacgcaaccg cctctcgccg ctgggcccca caccgctcgg tgccgtagcc 300 tcacgggact ctttctccct cctcccccgt tataaattgg cttcatcccc tccttgcctc 360 atccatccaa atcccagtcc ccaatcccat cccttcgtag gagaaattca tcgaagctaa 420 gcgaatcctc gcgatcctct caaggtactg cgagttttcg atccccctct cgacccctcg 480 tatgtttgtg tttgtcgtag cgtttgatta ggtatgcttt ccctgtttgt gttcgtcgta 540 gcgtttgatt aggtatgctt tccctgttcg tgttcatcgt agtgtttgat taggtcgtgt 600 gaggcgatgg cctgctcgcg tccttcgatc tgtagtcgat ttgcgggtcg tggtgtagat 660 ctgcgggctg tgatgaagtt atttggtgtg atctgctcgc ctgattctgc gggttggctc 720 gagtagatat gatggttgga ccggttggtt cgtttaccgc gctagggttg ggctgggatg 780 atgttgcatg cgccgttgcg cgtgatcccg cagcaggact tgcgtttgat tgccagatct 840 cgttacgatt atgtgatttg gtttggactt tttagatctg tagcttctgc ttatgtgcca 900 gatgcgccta ctgctcatat gcctgatgat aatcataaat ggctgtggaa ctaactagtt 960 gattgcggag tcatgtatca gctacaggtg tagggactag ctacaggtgt agggacttgc 1020 gtctaattgt ttggtccttt actcatgttg caattatgca atttagttta gattgtttgt 1080 tccactcatc taggctgtaa aagggacact gcttagattg ctgtttaatc tttttagtag 1140 attatattat attggtaact tattacccct attacatgcc atacgtgact tctgctcatg 1200 cctgatgata atcatagatc actgtggaat taattagttg attgttgaat catgtttcat 1260 gtacatacca cggcacaatt gcttagttcc ttaacaaatg caaattttac tgatccatgt 1320 atgatttgcg tggttctcta atgtgaaata ctatagctac ttgttagtaa gaatcaggtt 1380 cgtatgctta atgctgtatg tgccttctgc tcatgcctga tgataatcat atatcactgg 1440 aattaattag ttgatcgttt aatcatatat caagtacata ccatgccaca atttttagtc 1500 acttaaccca tgcagattga actggtccct gcatgttttg ctaaattgtt ctattctgat 1560 tagaccatat atcatgtatt tttttttggt aatggttctc ttattttaaa tgctatatag 1620 ttctggtact tgttagaaag atctgcttca tagtttagtt gcctatccct cgaattagga 1680 tgctgagcag ctgatcctat agctttgttt catgtatcaa ttcttttgtg ttcaacagtc 1740 agtttttgtt agattcattg taacttatgg tcgcttactc ttctggtcct caatgcttgc 1800 agggatcccc taaatagacc atgccgaaga agaagcgcaa ggtcatgtcc agcgagaccg 1860 gccccgtggc ggtggacccc accctgcgca ggcgcatcga gccgcacgag ttcgaggtgt 1920 tcttcgaccc cagggagctc cgcaaggaga cctgcctcct gtacgagatc aactggggcg 1980 gcaggcactc catctggagg cacacgagcc agaacaccaa caagcacgtc gaggtgaact 2040 tcatcgagaa gttcaccacg gagaggtact tctgcccgaa cacgcgctgc tccatcacgt 2100 ggttcctctc gtggagccca tgcggcgagt gctccagggc gatcacggag ttcctcagcc 2160 gctacccgca cgtgaccctg ttcatctaca tcgctaggct ctaccaccac gcggacccca 2220 ggaacaggca gggcctcagg gacctgatct ccagcggcgt cacgatccag atcatgaccg 2280 agcaggagtc cggctactgc tggaggaact tcgtgaacta ctccccgagc aacgaggccc 2340 actggccccg ctacccgcac ctctgggtcc gcctctacgt gctcgagctg tactgcatca 2400 tcctcggcct gccgccctgc ctcaacatcc tgaggcgcaa gcagccccag ctgacgttct 2460 tcaccatcgc cctgcagagc tgccactacc agaggctccc gccccacatc ctgtgggcga 2520 ccgggctcaa ggggggcggg ggctcaggcg ggggcgggag cggcggcggg ggctctgggg 2580 gcggcggcag cggcgggggc ggcagcgggg gcggcgggtc gatgagcaag ctggagaagt 2640 tcacgaactg ctactccctc agcaagaccc tgaggttcaa ggcgatcccg gtcggcaaga 2700 cccaggagaa catcgacaac aagcggctgc tggtggagga cgagaagagg gctgaggact 2760 acaagggcgt gaagaagctc ctggaccgct actacctgtc cttcatcaac gacgtgctcc 2820 acagcatcaa gctcaagaac ctgaacaact acatcagcct cttcaggaag aagacgcgca 2880 ccgagaagga gaacaaggag ctcgagaacc tggagatcaa cctgaggaag gagatcgcca 2940 aggcgttcaa gggcaacgag ggctacaagt ccctcttcaa gaaggacatc atcgagacga 3000 tcctcccgga gttcctggac gacaaggacg agatcgccct ggtcaactcc ttcaacggct 3060 tcaccacggc gttcaccggc ttcttcgaca accgcgagaa catgttcagc gaggaggcca 3120 agtccacgag catcgcgttc aggtgcatca acgagaacct cacccgctac atctccaaca 3180 tggacatctt cgagaaggtc gacgcgatct tcgacaagca cgaggtgcag gagatcaagg 3240 agaagatcct gaacagcgac tacgacgtcg aggacttctt cgagggcgag ttcttcaact 3300 tcgtcctcac gcaggagggc atcgacgtgt acaacgccat catcggtggc ttcgtgaccg 3360 agtccggcga gaagatcaag ggcctgaacg agtacatcaa cctctacaac cagaagacca 3420 agcagaagct gccgaagttc aagcccctgt acaagcaggt gctctccgac agggagtccc 3480 tcagcttcta cggcgagggc tacacgagcg acgaggaggt cctggaggtg ttccgcaaca 3540 ccctcaacaa gaacagcgag atcttctcca gcatcaagaa gctcgagaag ctgttcaaga 3600 acttcgacga gtactccagc gccggcatct tcgtcaagaa cggcccggcg atctccacga 3660 tcagcaagga catcttcggc gagtggaacg tgatccgcga caagtggaac gccgagtacg 3720 acgacatcca cctcaagaag aaggcggtgg tcaccgagaa gtacgaggac gacaggcgca 3780 agtccttcaa gaagatcggc tccttcagcc tcgagcagct gcaggagtac gccgacgcgg 3840 acctgagcgt ggtcgagaag ctcaaggaga tcatcatcca gaaggtcgac gagatctaca 3900 aggtgtacgg ctccagcgag aagctcttcg acgcggactt cgtcctcgag aagtccctga 3960 agaagaacga cgccgtggtc gcgatcatga aggacctcct ggactccgtg aagagcttcg 4020 agaattacat caaggccttc ttcggcgagg gcaaggagac gaacagggac gagtccttct 4080 acggcgactt cgtcctggcc tacgacatcc tcctgaaggt ggaccacatc tacgacgcga 4140 tccgcaacta cgtgacccag aagccgtaca gcaaggacaa gttcaagctc tacttccaga 4200 acccccagtt catgggcggc tgggacaagg acaaggagac ggactacagg gcgaccatcc 4260 tgcgctacgg cagcaagtac tacctcgcca tcatggacaa gaagtacgcg aagtgcctgc 4320 agaagatcga caaggacgac gtcaacggca actacgagaa gatcaactac aagctcctgc 4380 cgggccccaa caagatgctc ccgaaggtgt tcttctccaa gaagtggatg gcctactaca 4440 accccagcga ggacatccag aagatctaca agaacggcac gttcaagaag ggcgacatgt 4500 tcaacctgaa cgactgccac aagctcatcg acttcttcaa ggactccatc agccgctacc 4560 cgaagtggtc caacgcctac gacttcaact tcagcgagac cgagaagtac aaggacatcg 4620 cgggcttcta ccgcgaggtc gaggagcagg gctacaaggt gtccttcgag tccgccagca 4680 agaaggaggt cgacaagctg gtggaggagg gcaagctcta catgttccag atctacaaca 4740 aggacttctc cgacaagagc cacggcacgc ccaacctgca caccatgtac ttcaagctcc 4800 tgttcgacga gaacaaccac ggccagatca ggctgtccgg cggcgccgag ctcttcatga 4860 ggagggcgag cctgaagaag gaggagctgg tggtccaccc cgctaacagc ccaatcgcga 4920 acaagaaccc ggacaacccc aagaagacca cgaccctgtc ctacgacgtg tacaaggaca 4980 agaggttcag cgaggaccag tacgagctcc acatcccgat cgcgatcaac aagtgcccca 5040 agaacatctt caagatcaac accgaggtcc gcgtgctcct gaagcacgac gacaacccct 5100 acgtgatcgg catcgctagg ggcgagagga acctcctgta catcgtggtc gtggacggca 5160 agggcaacat cgtggagcag tactccctca acgagatcat caacaacttc aacggcatca 5220 ggatcaagac ggactaccac agcctcctgg acaagaagga gaaggagagg ttcgaggccc 5280 gccagaactg gacctccatc gagaacatca aggagctgaa ggcgggctac atcagccagg 5340 tcgtgcacaa gatctgcgag ctcgtcgaga agtacgacgc cgtgatcgcc ctcgcggacc 5400 tgaactccgg cttcaagaac agccgcgtca aggtggagaa gcaggtctac cagaagttcg 5460 agaagatgct catcgacaag ctgaactaca tggtggacaa gaagtccaac ccctgcgcta 5520 cgggcggcgc gctgaagggc taccagatca ccaacaagtt cgagagcttc aagtccatga 5580 gcactcagaa cggcttcatc ttctacatcc cggcgtggct cacgtccaag atcgacccca 5640 gcaccggctt cgtcaacctc ctgaagacga agtacacctc catcgccgac agcaagaagt 5700 tcatctccag cttcgaccgc atcatgtatg tgccggagga ggacctgttc gagttcgccc 5760 tcgactacaa gaacttctcc cgcacggacg cggactacat caagaagtgg aagctgtaca 5820 gctacggcaa ccgcatccgc atcttcagga accccaagaa gaacaacgtc ttcgactggg 5880 aggaggtgtg cctgacctcc gcgtacaagg agctcttcaa caagtacggc atcaactacc 5940 agcagggcga catcagggct ctcctgtgcg agcagagcga caaggccttc tactccagct 6000 tcatggcgct gatgtccctc atgctgcaga tgaggaactc gatcaccggc aggacggacg 6060 tggccttcct catctccccg gtgaagaaca gcgacggcat cttctacgac tccaggaact 6120 acgaggccca ggagaacgcg atcctcccaa agaacgcgga cgccaacggc gcctacaaca 6180 tcgccaggaa ggtcctctgg gctatcggcc agttcaagaa ggcggaggac gagaagctgg 6240 acaaggtgaa gatcgccatc agcaacaagg agtggctcga gtacgcccag acctcggtca 6300 agcacggcag cccgaagaag aagcgcaagg tgtccggcgg cagcacgaac ctgtccgaca 6360 tcatcgagaa ggagaccggc aagcagctcg tgatccagga gagcatcctc atgctgccgg 6420 aggaggtcga ggaggtcatc ggcaacaagc ccgagtccga catcctcgtc cacacggcct 6480 acgacgagtc caccgacgag aacgtgatgc tcctgacctc ggacgctccc gagtacaagc 6540 catgggccct ggtcatccag gacagcaacg gcgagaacaa gatcaagatg ctctccggcg 6600 gcagcccgaa gaagaagcgc aaagtgtgag atcgttcaaa catttggcaa taaagtttct 6660 taagattgaa tcctgttgcc ggtcttgcga tgattatcat ataatttctg ttgaattacg 6720 ttaagcatgt aataattaac atgtaatgca tgacgttatt tatgagatgg gtttttatga 6780 ttagagtccc gcaattatac atttaatacg cgatagaaaa caaaatatag cgcgcaaact 6840 aggataaatt atcgcgcgcg gtgtcatcta tgttactaga tc 6882 <210> 10 <211> 90 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 10 gggggcgggg gctcaggcgg gggcgggagc ggcggcgggg gctctggggg cggcggcagc 60 ggcgggggcg gcagcggggg cggcgggtcg 90 <210> 11 <211> 30 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 11 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly 1 5 10 15 Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser 20 25 30 <210> 12 <211> 18 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 12 Gly Gly Ser Thr Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser 1 5 10 15 Ser Gly <210> 13 <211> 15 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 13 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser 1 5 10 15 <210> 14 <211> 4842 <212> DNA <213> Artificial Sequence <220> <223> Codon optimized fusion <400> 14 atgccgaaga agaagcgcaa ggtcatgtcc agcgagaccg gccccgtggc ggtggacccc 60 accctgcgca ggcgcatcga gccgcacgag ttcgaggtgt tcttcgaccc cagggagctc 120 cgcaaggaga cctgcctcct gtacgagatc aactggggcg gcaggcactc catctggagg 180 cacacgagcc agaacaccaa caagcacgtc gaggtgaact tcatcgagaa gttcaccacg 240 gagaggtact tctgcccgaa cacgcgctgc tccatcacgt ggttcctctc gtggagccca 300 tgcggcgagt gctccagggc gatcacggag ttcctcagcc gctacccgca cgtgaccctg 360 ttcatctaca tcgctaggct ctaccaccac gcggacccca ggaacaggca gggcctcagg 420 gacctgatct ccagcggcgt cacgatccag atcatgaccg agcaggagtc cggctactgc 480 tggaggaact tcgtgaacta ctccccgagc aacgaggccc actggccccg ctacccgcac 540 ctctgggtcc gcctctacgt gctcgagctg tactgcatca tcctcggcct gccgccctgc 600 ctcaacatcc tgaggcgcaa gcagccccag ctgacgttct tcaccatcgc cctgcagagc 660 tgccactacc agaggctccc gccccacatc ctgtgggcga ccgggctcaa gtcgggcagc 720 gagacccccg gcacctccga gtcggctacc ccagagtcca tgagcaagct ggagaagttc 780 acgaactgct actccctcag caagaccctg aggttcaagg cgatcccggt cggcaagacc 840 caggagaaca tcgacaacaa gcggctgctg gtggaggacg agaagagggc tgaggactac 900 aagggcgtga agaagctcct ggaccgctac tacctgtcct tcatcaacga cgtgctccac 960 agcatcaagc tcaagaacct gaacaactac atcagcctct tcaggaagaa gacgcgcacc 1020 gagaaggaga acaaggagct cgagaacctg gagatcaacc tgaggaagga gatcgccaag 1080 gcgttcaagg gcaacgaggg ctacaagtcc ctcttcaaga aggacatcat cgagacgatc 1140 ctcccggagt tcctggacga caaggacgag atcgccctgg tcaactcctt caacggcttc 1200 accacggcgt tcaccggctt cttcgacaac cgcgagaaca tgttcagcga ggaggccaag 1260 tccacgagca tcgcgttcag gtgcatcaac gagaacctca cccgctacat ctccaacatg 1320 gacatcttcg agaaggtcga cgcgatcttc gacaagcacg aggtgcagga gatcaaggag 1380 aagatcctga acagcgacta cgacgtcgag gacttcttcg agggcgagtt cttcaacttc 1440 gtcctcacgc aggagggcat cgacgtgtac aacgccatca tcggtggctt cgtgaccgag 1500 tccggcgaga agatcaaggg cctgaacgag tacatcaacc tctacaacca gaagaccaag 1560 cagaagctgc cgaagttcaa gcccctgtac aagcaggtgc tctccgacag ggagtccctc 1620 agcttctacg gcgagggcta cacgagcgac gaggaggtcc tggaggtgtt ccgcaacacc 1680 ctcaacaaga acagcgagat cttctccagc atcaagaagc tcgagaagct gttcaagaac 1740 ttcgacgagt actccagcgc cggcatcttc gtcaagaacg gcccggcgat ctccacgatc 1800 agcaaggaca tcttcggcga gtggaacgtg atccgcgaca agtggaacgc cgagtacgac 1860 gacatccacc tcaagaagaa ggcggtggtc accgagaagt acgaggacga caggcgcaag 1920 tccttcaaga agatcggctc cttcagcctc gagcagctgc aggagtacgc cgacgcggac 1980 ctgagcgtgg tcgagaagct caaggagatc atcatccaga aggtcgacga gatctacaag 2040 gtgtacggct ccagcgagaa gctcttcgac gcggacttcg tcctcgagaa gtccctgaag 2100 aagaacgacg ccgtggtcgc gatcatgaag gacctcctgg actccgtgaa gagcttcgag 2160 aattacatca aggccttctt cggcgagggc aaggagacga acagggacga gtccttctac 2220 ggcgacttcg tcctggccta cgacatcctc ctgaaggtgg accacatcta cgacgcgatc 2280 cgcaactacg tgacccagaa gccgtacagc aaggacaagt tcaagctcta cttccagaac 2340 ccccagttca tgggcggctg ggacaaggac aaggagacgg actacagggc gaccatcctg 2400 cgctacggca gcaagtacta cctcgccatc atggacaaga agtacgcgaa gtgcctgcag 2460 aagatcgaca aggacgacgt caacggcaac tacgagaaga tcaactacaa gctcctgccg 2520 ggccccaaca agatgctccc gaaggtgttc ttctccaaga agtggatggc ctactacaac 2580 cccagcgagg acatccagaa gatctacaag aacggcacgt tcaagaaggg cgacatgttc 2640 aacctgaacg actgccacaa gctcatcgac ttcttcaagg actccatcag ccgctacccg 2700 aagtggtcca acgcctacga cttcaacttc agcgagaccg agaagtacaa ggacatcgcg 2760 ggcttctacc gcgaggtcga ggagcagggc tacaaggtgt ccttcgagtc cgccagcaag 2820 aaggaggtcg acaagctggt ggaggagggc aagctctaca tgttccagat ctacaacaag 2880 gacttctccg acaagagcca cggcacgccc aacctgcaca ccatgtactt caagctcctg 2940 ttcgacgaga acaaccacgg ccagatcagg ctgtccggcg gcgccgagct cttcatgagg 3000 agggcgagcc tgaagaagga ggagctggtg gtccaccccg ctaacagccc aatcgcgaac 3060 aagaacccgg acaaccccaa gaagaccacg accctgtcct acgacgtgta caaggacaag 3120 aggttcagcg aggaccagta cgagctccac atcccgatcg cgatcaacaa gtgccccaag 3180 aacatcttca agatcaacac cgaggtccgc gtgctcctga agcacgacga caacccctac 3240 gtgatcggca tcgctagggg cgagaggaac ctcctgtaca tcgtggtcgt ggacggcaag 3300 ggcaacatcg tggagcagta ctccctcaac gagatcatca acaacttcaa cggcatcagg 3360 atcaagacgg actaccacag cctcctggac aagaaggaga aggagaggtt cgaggcccgc 3420 cagaactgga cctccatcga gaacatcaag gagctgaagg cgggctacat cagccaggtc 3480 gtgcacaaga tctgcgagct cgtcgagaag tacgacgccg tgatcgccct cgcggacctg 3540 aactccggct tcaagaacag ccgcgtcaag gtggagaagc aggtctacca gaagttcgag 3600 aagatgctca tcgacaagct gaactacatg gtggacaaga agtccaaccc ctgcgctacg 3660 ggcggcgcgc tgaagggcta ccagatcacc aacaagttcg agagcttcaa gtccatgagc 3720 actcagaacg gcttcatctt ctacatcccg gcgtggctca cgtccaagat cgaccccagc 3780 accggcttcg tcaacctcct gaagacgaag tacacctcca tcgccgacag caagaagttc 3840 atctccagct tcgaccgcat catgtatgtg ccggaggagg acctgttcga gttcgccctc 3900 gactacaaga acttctcccg cacggacgcg gactacatca agaagtggaa gctgtacagc 3960 tacggcaacc gcatccgcat cttcaggaac cccaagaaga acaacgtctt cgactgggag 4020 gaggtgtgcc tgacctccgc gtacaaggag ctcttcaaca agtacggcat caactaccag 4080 cagggcgaca tcagggctct cctgtgcgag cagagcgaca aggccttcta ctccagcttc 4140 atggcgctga tgtccctcat gctgcagatg aggaactcga tcaccggcag gacggacgtg 4200 gccttcctca tctccccggt gaagaacagc gacggcatct tctacgactc caggaactac 4260 gaggcccagg agaacgcgat cctcccaaag aacgcggacg ccaacggcgc ctacaacatc 4320 gccaggaagg tcctctgggc tatcggccag ttcaagaagg cggaggacga gaagctggac 4380 aaggtgaaga tcgccatcag caacaaggag tggctcgagt acgcccagac ctcggtcaag 4440 cacggcagcc cgaagaagaa gcgcaaggtg ggagggtcga caggaggcgg ttctggcgga 4500 ggttcaggtg gaggctcgag tggtacgaac ctgtccgaca tcatcgagaa ggagaccggc 4560 aagcagctcg tgatccagga gagcatcctc atgctgccgg aggaggtcga ggaggtcatc 4620 ggcaacaagc ccgagtccga catcctcgtc cacacggcct acgacgagtc caccgacgag 4680 aacgtgatgc tcctgacctc ggacgctccc gagtacaagc catgggccct ggtcatccag 4740 gacagcaacg gcgagaacaa gatcaagatg ctcggtggag gcggttcagg cggaggtggc 4800 tctggcggtg gcggatcgcc gaagaagaag cgcaaagtgt ga 4842 <210> 15 <211> 1613 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 15 Met Pro Lys Lys Lys Arg Lys Val Met Ser Ser Glu Thr Gly Pro Val 1 5 10 15 Ala Val Asp Pro Thr Leu Arg Arg Arg Ile Glu Pro His Glu Phe Glu 20 25 30 Val Phe Phe Asp Pro Arg Glu Leu Arg Lys Glu Thr Cys Leu Leu Tyr 35 40 45 Glu Ile Asn Trp Gly Gly Arg His Ser Ile Trp Arg His Thr Ser Gln 50 55 60 Asn Thr Asn Lys His Val Glu Val Asn Phe Ile Glu Lys Phe Thr Thr 65 70 75 80 Glu Arg Tyr Phe Cys Pro Asn Thr Arg Cys Ser Ile Thr Trp Phe Leu 85 90 95 Ser Trp Ser Pro Cys Gly Glu Cys Ser Arg Ala Ile Thr Glu Phe Leu 100 105 110 Ser Arg Tyr Pro His Val Thr Leu Phe Ile Tyr Ile Ala Arg Leu Tyr 115 120 125 His His Ala Asp Pro Arg Asn Arg Gln Gly Leu Arg Asp Leu Ile Ser 130 135 140 Ser Gly Val Thr Ile Gln Ile Met Thr Glu Gln Glu Ser Gly Tyr Cys 145 150 155 160 Trp Arg Asn Phe Val Asn Tyr Ser Pro Ser Asn Glu Ala His Trp Pro 165 170 175 Arg Tyr Pro His Leu Trp Val Arg Leu Tyr Val Leu Glu Leu Tyr Cys 180 185 190 Ile Ile Leu Gly Leu Pro Pro Cys Leu Asn Ile Leu Arg Arg Lys Gln 195 200 205 Pro Gln Leu Thr Phe Phe Thr Ile Ala Leu Gln Ser Cys His Tyr Gln 210 215 220 Arg Leu Pro Pro His Ile Leu Trp Ala Thr Gly Leu Lys Ser Gly Ser 225 230 235 240 Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Met Ser Lys 245 250 255 Leu Glu Lys Phe Thr Asn Cys Tyr Ser Leu Ser Lys Thr Leu Arg Phe 260 265 270 Lys Ala Ile Pro Val Gly Lys Thr Gln Glu Asn Ile Asp Asn Lys Arg 275 280 285 Leu Leu Val Glu Asp Glu Lys Arg Ala Glu Asp Tyr Lys Gly Val Lys 290 295 300 Lys Leu Leu Asp Arg Tyr Tyr Leu Ser Phe Ile Asn Asp Val Leu His 305 310 315 320 Ser Ile Lys Leu Lys Asn Leu Asn Asn Tyr Ile Ser Leu Phe Arg Lys 325 330 335 Lys Thr Arg Thr Glu Lys Glu Asn Lys Glu Leu Glu Asn Leu Glu Ile 340 345 350 Asn Leu Arg Lys Glu Ile Ala Lys Ala Phe Lys Gly Asn Glu Gly Tyr 355 360 365 Lys Ser Leu Phe Lys Lys Asp Ile Ile Glu Thr Ile Leu Pro Glu Phe 370 375 380 Leu Asp Asp Lys Asp Glu Ile Ala Leu Val Asn Ser Phe Asn Gly Phe 385 390 395 400 Thr Thr Ala Phe Thr Gly Phe Phe Asp Asn Arg Glu Asn Met Phe Ser 405 410 415 Glu Glu Ala Lys Ser Thr Ser Ile Ala Phe Arg Cys Ile Asn Glu Asn 420 425 430 Leu Thr Arg Tyr Ile Ser Asn Met Asp Ile Phe Glu Lys Val Asp Ala 435 440 445 Ile Phe Asp Lys His Glu Val Gln Glu Ile Lys Glu Lys Ile Leu Asn 450 455 460 Ser Asp Tyr Asp Val Glu Asp Phe Phe Glu Gly Glu Phe Phe Asn Phe 465 470 475 480 Val Leu Thr Gln Glu Gly Ile Asp Val Tyr Asn Ala Ile Ile Gly Gly 485 490 495 Phe Val Thr Glu Ser Gly Glu Lys Ile Lys Gly Leu Asn Glu Tyr Ile 500 505 510 Asn Leu Tyr Asn Gln Lys Thr Lys Gln Lys Leu Pro Lys Phe Lys Pro 515 520 525 Leu Tyr Lys Gln Val Leu Ser Asp Arg Glu Ser Leu Ser Phe Tyr Gly 530 535 540 Glu Gly Tyr Thr Ser Asp Glu Glu Val Leu Glu Val Phe Arg Asn Thr 545 550 555 560 Leu Asn Lys Asn Ser Glu Ile Phe Ser Ser Ile Lys Lys Leu Glu Lys 565 570 575 Leu Phe Lys Asn Phe Asp Glu Tyr Ser Ser Ala Gly Ile Phe Val Lys 580 585 590 Asn Gly Pro Ala Ile Ser Thr Ile Ser Lys Asp Ile Phe Gly Glu Trp 595 600 605 Asn Val Ile Arg Asp Lys Trp Asn Ala Glu Tyr Asp Asp Ile His Leu 610 615 620 Lys Lys Lys Ala Val Val Thr Glu Lys Tyr Glu Asp Asp Arg Arg Lys 625 630 635 640 Ser Phe Lys Lys Ile Gly Ser Phe Ser Leu Glu Gln Leu Gln Glu Tyr 645 650 655 Ala Asp Ala Asp Leu Ser Val Val Glu Lys Leu Lys Glu Ile Ile Ile 660 665 670 Gln Lys Val Asp Glu Ile Tyr Lys Val Tyr Gly Ser Ser Glu Lys Leu 675 680 685 Phe Asp Ala Asp Phe Val Leu Glu Lys Ser Leu Lys Lys Asn Asp Ala 690 695 700 Val Val Ala Ile Met Lys Asp Leu Leu Asp Ser Val Lys Ser Phe Glu 705 710 715 720 Asn Tyr Ile Lys Ala Phe Phe Gly Glu Gly Lys Glu Thr Asn Arg Asp 725 730 735 Glu Ser Phe Tyr Gly Asp Phe Val Leu Ala Tyr Asp Ile Leu Leu Lys 740 745 750 Val Asp His Ile Tyr Asp Ala Ile Arg Asn Tyr Val Thr Gln Lys Pro 755 760 765 Tyr Ser Lys Asp Lys Phe Lys Leu Tyr Phe Gln Asn Pro Gln Phe Met 770 775 780 Gly Gly Trp Asp Lys Asp Lys Glu Thr Asp Tyr Arg Ala Thr Ile Leu 785 790 795 800 Arg Tyr Gly Ser Lys Tyr Tyr Leu Ala Ile Met Asp Lys Lys Tyr Ala 805 810 815 Lys Cys Leu Gln Lys Ile Asp Lys Asp Asp Val Asn Gly Asn Tyr Glu 820 825 830 Lys Ile Asn Tyr Lys Leu Leu Pro Gly Pro Asn Lys Met Leu Pro Lys 835 840 845 Val Phe Phe Ser Lys Lys Trp Met Ala Tyr Tyr Asn Pro Ser Glu Asp 850 855 860 Ile Gln Lys Ile Tyr Lys Asn Gly Thr Phe Lys Lys Gly Asp Met Phe 865 870 875 880 Asn Leu Asn Asp Cys His Lys Leu Ile Asp Phe Phe Lys Asp Ser Ile 885 890 895 Ser Arg Tyr Pro Lys Trp Ser Asn Ala Tyr Asp Phe Asn Phe Ser Glu 900 905 910 Thr Glu Lys Tyr Lys Asp Ile Ala Gly Phe Tyr Arg Glu Val Glu Glu 915 920 925 Gln Gly Tyr Lys Val Ser Phe Glu Ser Ala Ser Lys Lys Glu Val Asp 930 935 940 Lys Leu Val Glu Glu Gly Lys Leu Tyr Met Phe Gln Ile Tyr Asn Lys 945 950 955 960 Asp Phe Ser Asp Lys Ser His Gly Thr Pro Asn Leu His Thr Met Tyr 965 970 975 Phe Lys Leu Leu Phe Asp Glu Asn Asn His Gly Gln Ile Arg Leu Ser 980 985 990 Gly Gly Ala Glu Leu Phe Met Arg Arg Ala Ser Leu Lys Lys Glu Glu 995 1000 1005 Leu Val Val His Pro Ala Asn Ser Pro Ile Ala Asn Lys Asn Pro 1010 1015 1020 Asp Asn Pro Lys Lys Thr Thr Thr Leu Ser Tyr Asp Val Tyr Lys 1025 1030 1035 Asp Lys Arg Phe Ser Glu Asp Gln Tyr Glu Leu His Ile Pro Ile 1040 1045 1050 Ala Ile Asn Lys Cys Pro Lys Asn Ile Phe Lys Ile Asn Thr Glu 1055 1060 1065 Val Arg Val Leu Leu Lys His Asp Asp Asn Pro Tyr Val Ile Gly 1070 1075 1080 Ile Ala Arg Gly Glu Arg Asn Leu Leu Tyr Ile Val Val Val Asp 1085 1090 1095 Gly Lys Gly Asn Ile Val Glu Gln Tyr Ser Leu Asn Glu Ile Ile 1100 1105 1110 Asn Asn Phe Asn Gly Ile Arg Ile Lys Thr Asp Tyr His Ser Leu 1115 1120 1125 Leu Asp Lys Lys Glu Lys Glu Arg Phe Glu Ala Arg Gln Asn Trp 1130 1135 1140 Thr Ser Ile Glu Asn Ile Lys Glu Leu Lys Ala Gly Tyr Ile Ser 1145 1150 1155 Gln Val Val His Lys Ile Cys Glu Leu Val Glu Lys Tyr Asp Ala 1160 1165 1170 Val Ile Ala Leu Ala Asp Leu Asn Ser Gly Phe Lys Asn Ser Arg 1175 1180 1185 Val Lys Val Glu Lys Gln Val Tyr Gln Lys Phe Glu Lys Met Leu 1190 1195 1200 Ile Asp Lys Leu Asn Tyr Met Val Asp Lys Lys Ser Asn Pro Cys 1205 1210 1215 Ala Thr Gly Gly Ala Leu Lys Gly Tyr Gln Ile Thr Asn Lys Phe 1220 1225 1230 Glu Ser Phe Lys Ser Met Ser Thr Gln Asn Gly Phe Ile Phe Tyr 1235 1240 1245 Ile Pro Ala Trp Leu Thr Ser Lys Ile Asp Pro Ser Thr Gly Phe 1250 1255 1260 Val Asn Leu Leu Lys Thr Lys Tyr Thr Ser Ile Ala Asp Ser Lys 1265 1270 1275 Lys Phe Ile Ser Ser Phe Asp Arg Ile Met Tyr Val Pro Glu Glu 1280 1285 1290 Asp Leu Phe Glu Phe Ala Leu Asp Tyr Lys Asn Phe Ser Arg Thr 1295 1300 1305 Asp Ala Asp Tyr Ile Lys Lys Trp Lys Leu Tyr Ser Tyr Gly Asn 1310 1315 1320 Arg Ile Arg Ile Phe Arg Asn Pro Lys Lys Asn Asn Val Phe Asp 1325 1330 1335 Trp Glu Glu Val Cys Leu Thr Ser Ala Tyr Lys Glu Leu Phe Asn 1340 1345 1350 Lys Tyr Gly Ile Asn Tyr Gln Gln Gly Asp Ile Arg Ala Leu Leu 1355 1360 1365 Cys Glu Gln Ser Asp Lys Ala Phe Tyr Ser Ser Phe Met Ala Leu 1370 1375 1380 Met Ser Leu Met Leu Gln Met Arg Asn Ser Ile Thr Gly Arg Thr 1385 1390 1395 Asp Val Ala Phe Leu Ile Ser Pro Val Lys Asn Ser Asp Gly Ile 1400 1405 1410 Phe Tyr Asp Ser Arg Asn Tyr Glu Ala Gln Glu Asn Ala Ile Leu 1415 1420 1425 Pro Lys Asn Ala Asp Ala Asn Gly Ala Tyr Asn Ile Ala Arg Lys 1430 1435 1440 Val Leu Trp Ala Ile Gly Gln Phe Lys Lys Ala Glu Asp Glu Lys 1445 1450 1455 Leu Asp Lys Val Lys Ile Ala Ile Ser Asn Lys Glu Trp Leu Glu 1460 1465 1470 Tyr Ala Gln Thr Ser Val Lys His Gly Ser Pro Lys Lys Lys Arg 1475 1480 1485 Lys Val Gly Gly Ser Thr Gly Gly Gly Ser Gly Gly Gly Ser Gly 1490 1495 1500 Gly Gly Ser Ser Gly Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu 1505 1510 1515 Thr Gly Lys Gln Leu Val Ile Gln Glu Ser Ile Leu Met Leu Pro 1520 1525 1530 Glu Glu Val Glu Glu Val Ile Gly Asn Lys Pro Glu Ser Asp Ile 1535 1540 1545 Leu Val His Thr Ala Tyr Asp Glu Ser Thr Asp Glu Asn Val Met 1550 1555 1560 Leu Leu Thr Ser Asp Ala Pro Glu Tyr Lys Pro Trp Ala Leu Val 1565 1570 1575 Ile Gln Asp Ser Asn Gly Glu Asn Lys Ile Lys Met Leu Gly Gly 1580 1585 1590 Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Pro Lys 1595 1600 1605 Lys Lys Arg Lys Val 1610 <210> 16 <211> 5145 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 16 atgccgaaga agaagcgcaa ggtcatgtcc agcgagaccg gccccgtggc ggtggacccc 60 accctgcgca ggcgcatcga gccgcacgag ttcgaggtgt tcttcgaccc cagggagctc 120 cgcaaggaga cctgcctcct gtacgagatc aactggggcg gcaggcactc catctggagg 180 cacacgagcc agaacaccaa caagcacgtc gaggtgaact tcatcgagaa gttcaccacg 240 gagaggtact tctgcccgaa cacgcgctgc tccatcacgt ggttcctctc gtggagccca 300 tgcggcgagt gctccagggc gatcacggag ttcctcagcc gctacccgca cgtgaccctg 360 ttcatctaca tcgctaggct ctaccaccac gcggacccca ggaacaggca gggcctcagg 420 gacctgatct ccagcggcgt cacgatccag atcatgaccg agcaggagtc cggctactgc 480 tggaggaact tcgtgaacta ctccccgagc aacgaggccc actggccccg ctacccgcac 540 ctctgggtcc gcctctacgt gctcgagctg tactgcatca tcctcggcct gccgccctgc 600 ctcaacatcc tgaggcgcaa gcagccccag ctgacgttct tcaccatcgc cctgcagagc 660 tgccactacc agaggctccc gccccacatc ctgtgggcga ccgggctcaa ggggggcggg 720 ggctcaggcg ggggcgggag cggcggcggg ggctctgggg gcggcggcag cggcgggggc 780 ggcagcgggg gcggcgggtc gatgagcaag ctggagaagt tcacgaactg ctactccctc 840 agcaagaccc tgaggttcaa ggcgatcccg gtcggcaaga cccaggagaa catcgacaac 900 aagcggctgc tggtggagga cgagaagagg gctgaggact acaagggcgt gaagaagctc 960 ctggaccgct actacctgtc cttcatcaac gacgtgctcc acagcatcaa gctcaagaac 1020 ctgaacaact acatcagcct cttcaggaag aagacgcgca ccgagaagga gaacaaggag 1080 ctcgagaacc tggagatcaa cctgaggaag gagatcgcca aggcgttcaa gggcaacgag 1140 ggctacaagt ccctcttcaa gaaggacatc atcgagacga tcctcccgga gttcctggac 1200 gacaaggacg agatcgccct ggtcaactcc ttcaacggct tcaccacggc gttcaccggc 1260 ttcttcgaca accgcgagaa catgttcagc gaggaggcca agtccacgag catcgcgttc 1320 aggtgcatca acgagaacct cacccgctac atctccaaca tggacatctt cgagaaggtc 1380 gacgcgatct tcgacaagca cgaggtgcag gagatcaagg agaagatcct gaacagcgac 1440 tacgacgtcg aggacttctt cgagggcgag ttcttcaact tcgtcctcac gcaggagggc 1500 atcgacgtgt acaacgccat catcggtggc ttcgtgaccg agtccggcga gaagatcaag 1560 ggcctgaacg agtacatcaa cctctacaac cagaagacca agcagaagct gccgaagttc 1620 aagcccctgt acaagcaggt gctctccgac agggagtccc tcagcttcta cggcgagggc 1680 tacacgagcg acgaggaggt cctggaggtg ttccgcaaca ccctcaacaa gaacagcgag 1740 atcttctcca gcatcaagaa gctcgagaag ctgttcaaga acttcgacga gtactccagc 1800 gccggcatct tcgtcaagaa cggcccggcg atctccacga tcagcaagga catcttcggc 1860 gagtggaacg tgatccgcga caagtggaac gccgagtacg acgacatcca cctcaagaag 1920 aaggcggtgg tcaccgagaa gtacgaggac gacaggcgca agtccttcaa gaagatcggc 1980 tccttcagcc tcgagcagct gcaggagtac gccgacgcgg acctgagcgt ggtcgagaag 2040 ctcaaggaga tcatcatcca gaaggtcgac gagatctaca aggtgtacgg ctccagcgag 2100 aagctcttcg acgcggactt cgtcctcgag aagtccctga agaagaacga cgccgtggtc 2160 gcgatcatga aggacctcct ggactccgtg aagagcttcg agaattacat caaggccttc 2220 ttcggcgagg gcaaggagac gaacagggac gagtccttct acggcgactt cgtcctggcc 2280 tacgacatcc tcctgaaggt ggaccacatc tacgacgcga tccgcaacta cgtgacccag 2340 aagccgtaca gcaaggacaa gttcaagctc tacttccaga acccccagtt catgggcggc 2400 tgggacaagg acaaggagac ggactacagg gcgaccatcc tgcgctacgg cagcaagtac 2460 tacctcgcca tcatggacaa gaagtacgcg aagtgcctgc agaagatcga caaggacgac 2520 gtcaacggca actacgagaa gatcaactac aagctcctgc cgggccccaa caagatgctc 2580 ccgaaggtgt tcttctccaa gaagtggatg gcctactaca accccagcga ggacatccag 2640 aagatctaca agaacggcac gttcaagaag ggcgacatgt tcaacctgaa cgactgccac 2700 aagctcatcg acttcttcaa ggactccatc agccgctacc cgaagtggtc caacgcctac 2760 gacttcaact tcagcgagac cgagaagtac aaggacatcg cgggcttcta ccgcgaggtc 2820 gaggagcagg gctacaaggt gtccttcgag tccgccagca agaaggaggt cgacaagctg 2880 gtggaggagg gcaagctcta catgttccag atctacaaca aggacttctc cgacaagagc 2940 cacggcacgc ccaacctgca caccatgtac ttcaagctcc tgttcgacga gaacaaccac 3000 ggccagatca ggctgtccgg cggcgccgag ctcttcatga ggagggcgag cctgaagaag 3060 gaggagctgg tggtccaccc cgctaacagc ccaatcgcga acaagaaccc ggacaacccc 3120 aagaagacca cgaccctgtc ctacgacgtg tacaaggaca agaggttcag cgaggaccag 3180 tacgagctcc acatcccgat cgcgatcaac aagtgcccca agaacatctt caagatcaac 3240 accgaggtcc gcgtgctcct gaagcacgac gacaacccct acgtgatcgg catcgctagg 3300 ggcgagagga acctcctgta catcgtggtc gtggacggca agggcaacat cgtggagcag 3360 tactccctca acgagatcat caacaacttc aacggcatca ggatcaagac ggactaccac 3420 agcctcctgg acaagaagga gaaggagagg ttcgaggccc gccagaactg gacctccatc 3480 gagaacatca aggagctgaa ggcgggctac atcagccagg tcgtgcacaa gatctgcgag 3540 ctcgtcgaga agtacgacgc cgtgatcgcc ctcgcggacc tgaactccgg cttcaagaac 3600 agccgcgtca aggtggagaa gcaggtctac cagaagttcg agaagatgct catcgacaag 3660 ctgaactaca tggtggacaa gaagtccaac ccctgcgcta cgggcggcgc gctgaagggc 3720 taccagatca ccaacaagtt cgagagcttc aagtccatga gcactcagaa cggcttcatc 3780 ttctacatcc cggcgtggct cacgtccaag atcgacccca gcaccggctt cgtcaacctc 3840 ctgaagacga agtacacctc catcgccgac agcaagaagt tcatctccag cttcgaccgc 3900 atcatgtatg tgccggagga ggacctgttc gagttcgccc tcgactacaa gaacttctcc 3960 cgcacggacg cggactacat caagaagtgg aagctgtaca gctacggcaa ccgcatccgc 4020 atcttcagga accccaagaa gaacaacgtc ttcgactggg aggaggtgtg cctgacctcc 4080 gcgtacaagg agctcttcaa caagtacggc atcaactacc agcagggcga catcagggct 4140 ctcctgtgcg agcagagcga caaggccttc tactccagct tcatggcgct gatgtccctc 4200 atgctgcaga tgaggaactc gatcaccggc aggacggacg tggccttcct catctccccg 4260 gtgaagaaca gcgacggcat cttctacgac tccaggaact acgaggccca ggagaacgcg 4320 atcctcccaa agaacgcgga cgccaacggc gcctacaaca tcgccaggaa ggtcctctgg 4380 gctatcggcc agttcaagaa ggcggaggac gagaagctgg acaaggtgaa gatcgccatc 4440 agcaacaagg agtggctcga gtacgcccag acctcggtca agcacggcag cccgaagaag 4500 aagcgcaagg tgggagggtc gacaggaggc ggttctggcg gaggttcagg tggaggctcg 4560 agtggtacga acctgtccga catcatcgag aaggagaccg gcaagcagct cgtgatccag 4620 gagagcatcc tcatgctgcc ggaggaggtc gaggaggtca tcggcaacaa gcccgagtcc 4680 gacatcctcg tccacacggc ctacgacgag tccaccgacg agaacgtgat gctcctgacc 4740 tcggacgctc ccgagtacaa gccatgggcc ctggtcatcc aggacagcaa cggcgagaac 4800 aagatcaaga tgctcggtgg aggcggttca ggcggaggtg gctctggcgg tggcggatcg 4860 acgaacctgt ccgacatcat cgagaaggag accggcaagc agctcgtgat ccaggagagc 4920 atcctcatgc tgccggagga ggtcgaggag gtcatcggca acaagcccga gtccgacatc 4980 ctcgtccaca cggcctacga cgagtccacc gacgagaacg tgatgctcct gacctcggac 5040 gctcccgagt acaagccatg ggccctggtc atccaggaca gcaacggcga gaacaagatc 5100 aagatgctct ccggcggcag cccgaagaag aagcgcaaag tgtga 5145 <210> 17 <211> 1714 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 17 Met Pro Lys Lys Lys Arg Lys Val Met Ser Ser Glu Thr Gly Pro Val 1 5 10 15 Ala Val Asp Pro Thr Leu Arg Arg Arg Ile Glu Pro His Glu Phe Glu 20 25 30 Val Phe Phe Asp Pro Arg Glu Leu Arg Lys Glu Thr Cys Leu Leu Tyr 35 40 45 Glu Ile Asn Trp Gly Gly Arg His Ser Ile Trp Arg His Thr Ser Gln 50 55 60 Asn Thr Asn Lys His Val Glu Val Asn Phe Ile Glu Lys Phe Thr Thr 65 70 75 80 Glu Arg Tyr Phe Cys Pro Asn Thr Arg Cys Ser Ile Thr Trp Phe Leu 85 90 95 Ser Trp Ser Pro Cys Gly Glu Cys Ser Arg Ala Ile Thr Glu Phe Leu 100 105 110 Ser Arg Tyr Pro His Val Thr Leu Phe Ile Tyr Ile Ala Arg Leu Tyr 115 120 125 His His Ala Asp Pro Arg Asn Arg Gln Gly Leu Arg Asp Leu Ile Ser 130 135 140 Ser Gly Val Thr Ile Gln Ile Met Thr Glu Gln Glu Ser Gly Tyr Cys 145 150 155 160 Trp Arg Asn Phe Val Asn Tyr Ser Pro Ser Asn Glu Ala His Trp Pro 165 170 175 Arg Tyr Pro His Leu Trp Val Arg Leu Tyr Val Leu Glu Leu Tyr Cys 180 185 190 Ile Ile Leu Gly Leu Pro Pro Cys Leu Asn Ile Leu Arg Arg Lys Gln 195 200 205 Pro Gln Leu Thr Phe Phe Thr Ile Ala Leu Gln Ser Cys His Tyr Gln 210 215 220 Arg Leu Pro Pro His Ile Leu Trp Ala Thr Gly Leu Lys Gly Gly Gly 225 230 235 240 Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly 245 250 255 Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Met Ser Lys Leu Glu 260 265 270 Lys Phe Thr Asn Cys Tyr Ser Leu Ser Lys Thr Leu Arg Phe Lys Ala 275 280 285 Ile Pro Val Gly Lys Thr Gln Glu Asn Ile Asp Asn Lys Arg Leu Leu 290 295 300 Val Glu Asp Glu Lys Arg Ala Glu Asp Tyr Lys Gly Val Lys Lys Leu 305 310 315 320 Leu Asp Arg Tyr Tyr Leu Ser Phe Ile Asn Asp Val Leu His Ser Ile 325 330 335 Lys Leu Lys Asn Leu Asn Asn Tyr Ile Ser Leu Phe Arg Lys Lys Thr 340 345 350 Arg Thr Glu Lys Glu Asn Lys Glu Leu Glu Asn Leu Glu Ile Asn Leu 355 360 365 Arg Lys Glu Ile Ala Lys Ala Phe Lys Gly Asn Glu Gly Tyr Lys Ser 370 375 380 Leu Phe Lys Lys Asp Ile Ile Glu Thr Ile Leu Pro Glu Phe Leu Asp 385 390 395 400 Asp Lys Asp Glu Ile Ala Leu Val Asn Ser Phe Asn Gly Phe Thr Thr 405 410 415 Ala Phe Thr Gly Phe Phe Asp Asn Arg Glu Asn Met Phe Ser Glu Glu 420 425 430 Ala Lys Ser Thr Ser Ile Ala Phe Arg Cys Ile Asn Glu Asn Leu Thr 435 440 445 Arg Tyr Ile Ser Asn Met Asp Ile Phe Glu Lys Val Asp Ala Ile Phe 450 455 460 Asp Lys His Glu Val Gln Glu Ile Lys Glu Lys Ile Leu Asn Ser Asp 465 470 475 480 Tyr Asp Val Glu Asp Phe Phe Glu Gly Glu Phe Phe Asn Phe Val Leu 485 490 495 Thr Gln Glu Gly Ile Asp Val Tyr Asn Ala Ile Ile Gly Gly Phe Val 500 505 510 Thr Glu Ser Gly Glu Lys Ile Lys Gly Leu Asn Glu Tyr Ile Asn Leu 515 520 525 Tyr Asn Gln Lys Thr Lys Gln Lys Leu Pro Lys Phe Lys Pro Leu Tyr 530 535 540 Lys Gln Val Leu Ser Asp Arg Glu Ser Leu Ser Phe Tyr Gly Glu Gly 545 550 555 560 Tyr Thr Ser Asp Glu Glu Val Leu Glu Val Phe Arg Asn Thr Leu Asn 565 570 575 Lys Asn Ser Glu Ile Phe Ser Ser Ile Lys Lys Leu Glu Lys Leu Phe 580 585 590 Lys Asn Phe Asp Glu Tyr Ser Ser Ala Gly Ile Phe Val Lys Asn Gly 595 600 605 Pro Ala Ile Ser Thr Ile Ser Lys Asp Ile Phe Gly Glu Trp Asn Val 610 615 620 Ile Arg Asp Lys Trp Asn Ala Glu Tyr Asp Asp Ile His Leu Lys Lys 625 630 635 640 Lys Ala Val Val Thr Glu Lys Tyr Glu Asp Asp Arg Arg Lys Ser Phe 645 650 655 Lys Lys Ile Gly Ser Phe Ser Leu Glu Gln Leu Gln Glu Tyr Ala Asp 660 665 670 Ala Asp Leu Ser Val Val Glu Lys Leu Lys Glu Ile Ile Ile Gln Lys 675 680 685 Val Asp Glu Ile Tyr Lys Val Tyr Gly Ser Ser Glu Lys Leu Phe Asp 690 695 700 Ala Asp Phe Val Leu Glu Lys Ser Leu Lys Lys Asn Asp Ala Val Val 705 710 715 720 Ala Ile Met Lys Asp Leu Leu Asp Ser Val Lys Ser Phe Glu Asn Tyr 725 730 735 Ile Lys Ala Phe Phe Gly Glu Gly Lys Glu Thr Asn Arg Asp Glu Ser 740 745 750 Phe Tyr Gly Asp Phe Val Leu Ala Tyr Asp Ile Leu Leu Lys Val Asp 755 760 765 His Ile Tyr Asp Ala Ile Arg Asn Tyr Val Thr Gln Lys Pro Tyr Ser 770 775 780 Lys Asp Lys Phe Lys Leu Tyr Phe Gln Asn Pro Gln Phe Met Gly Gly 785 790 795 800 Trp Asp Lys Asp Lys Glu Thr Asp Tyr Arg Ala Thr Ile Leu Arg Tyr 805 810 815 Gly Ser Lys Tyr Tyr Leu Ala Ile Met Asp Lys Lys Tyr Ala Lys Cys 820 825 830 Leu Gln Lys Ile Asp Lys Asp Asp Val Asn Gly Asn Tyr Glu Lys Ile 835 840 845 Asn Tyr Lys Leu Leu Pro Gly Pro Asn Lys Met Leu Pro Lys Val Phe 850 855 860 Phe Ser Lys Lys Trp Met Ala Tyr Tyr Asn Pro Ser Glu Asp Ile Gln 865 870 875 880 Lys Ile Tyr Lys Asn Gly Thr Phe Lys Lys Gly Asp Met Phe Asn Leu 885 890 895 Asn Asp Cys His Lys Leu Ile Asp Phe Phe Lys Asp Ser Ile Ser Arg 900 905 910 Tyr Pro Lys Trp Ser Asn Ala Tyr Asp Phe Asn Phe Ser Glu Thr Glu 915 920 925 Lys Tyr Lys Asp Ile Ala Gly Phe Tyr Arg Glu Val Glu Glu Gln Gly 930 935 940 Tyr Lys Val Ser Phe Glu Ser Ala Ser Lys Lys Glu Val Asp Lys Leu 945 950 955 960 Val Glu Glu Gly Lys Leu Tyr Met Phe Gln Ile Tyr Asn Lys Asp Phe 965 970 975 Ser Asp Lys Ser His Gly Thr Pro Asn Leu His Thr Met Tyr Phe Lys 980 985 990 Leu Leu Phe Asp Glu Asn Asn His Gly Gln Ile Arg Leu Ser Gly Gly 995 1000 1005 Ala Glu Leu Phe Met Arg Arg Ala Ser Leu Lys Lys Glu Glu Leu 1010 1015 1020 Val Val His Pro Ala Asn Ser Pro Ile Ala Asn Lys Asn Pro Asp 1025 1030 1035 Asn Pro Lys Lys Thr Thr Thr Leu Ser Tyr Asp Val Tyr Lys Asp 1040 1045 1050 Lys Arg Phe Ser Glu Asp Gln Tyr Glu Leu His Ile Pro Ile Ala 1055 1060 1065 Ile Asn Lys Cys Pro Lys Asn Ile Phe Lys Ile Asn Thr Glu Val 1070 1075 1080 Arg Val Leu Leu Lys His Asp Asp Asn Pro Tyr Val Ile Gly Ile 1085 1090 1095 Ala Arg Gly Glu Arg Asn Leu Leu Tyr Ile Val Val Val Asp Gly 1100 1105 1110 Lys Gly Asn Ile Val Glu Gln Tyr Ser Leu Asn Glu Ile Ile Asn 1115 1120 1125 Asn Phe Asn Gly Ile Arg Ile Lys Thr Asp Tyr His Ser Leu Leu 1130 1135 1140 Asp Lys Lys Glu Lys Glu Arg Phe Glu Ala Arg Gln Asn Trp Thr 1145 1150 1155 Ser Ile Glu Asn Ile Lys Glu Leu Lys Ala Gly Tyr Ile Ser Gln 1160 1165 1170 Val Val His Lys Ile Cys Glu Leu Val Glu Lys Tyr Asp Ala Val 1175 1180 1185 Ile Ala Leu Ala Asp Leu Asn Ser Gly Phe Lys Asn Ser Arg Val 1190 1195 1200 Lys Val Glu Lys Gln Val Tyr Gln Lys Phe Glu Lys Met Leu Ile 1205 1210 1215 Asp Lys Leu Asn Tyr Met Val Asp Lys Lys Ser Asn Pro Cys Ala 1220 1225 1230 Thr Gly Gly Ala Leu Lys Gly Tyr Gln Ile Thr Asn Lys Phe Glu 1235 1240 1245 Ser Phe Lys Ser Met Ser Thr Gln Asn Gly Phe Ile Phe Tyr Ile 1250 1255 1260 Pro Ala Trp Leu Thr Ser Lys Ile Asp Pro Ser Thr Gly Phe Val 1265 1270 1275 Asn Leu Leu Lys Thr Lys Tyr Thr Ser Ile Ala Asp Ser Lys Lys 1280 1285 1290 Phe Ile Ser Ser Phe Asp Arg Ile Met Tyr Val Pro Glu Glu Asp 1295 1300 1305 Leu Phe Glu Phe Ala Leu Asp Tyr Lys Asn Phe Ser Arg Thr Asp 1310 1315 1320 Ala Asp Tyr Ile Lys Lys Trp Lys Leu Tyr Ser Tyr Gly Asn Arg 1325 1330 1335 Ile Arg Ile Phe Arg Asn Pro Lys Lys Asn Asn Val Phe Asp Trp 1340 1345 1350 Glu Glu Val Cys Leu Thr Ser Ala Tyr Lys Glu Leu Phe Asn Lys 1355 1360 1365 Tyr Gly Ile Asn Tyr Gln Gln Gly Asp Ile Arg Ala Leu Leu Cys 1370 1375 1380 Glu Gln Ser Asp Lys Ala Phe Tyr Ser Ser Phe Met Ala Leu Met 1385 1390 1395 Ser Leu Met Leu Gln Met Arg Asn Ser Ile Thr Gly Arg Thr Asp 1400 1405 1410 Val Ala Phe Leu Ile Ser Pro Val Lys Asn Ser Asp Gly Ile Phe 1415 1420 1425 Tyr Asp Ser Arg Asn Tyr Glu Ala Gln Glu Asn Ala Ile Leu Pro 1430 1435 1440 Lys Asn Ala Asp Ala Asn Gly Ala Tyr Asn Ile Ala Arg Lys Val 1445 1450 1455 Leu Trp Ala Ile Gly Gln Phe Lys Lys Ala Glu Asp Glu Lys Leu 1460 1465 1470 Asp Lys Val Lys Ile Ala Ile Ser Asn Lys Glu Trp Leu Glu Tyr 1475 1480 1485 Ala Gln Thr Ser Val Lys His Gly Ser Pro Lys Lys Lys Arg Lys 1490 1495 1500 Val Gly Gly Ser Thr Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly 1505 1510 1515 Gly Ser Ser Gly Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu Thr 1520 1525 1530 Gly Lys Gln Leu Val Ile Gln Glu Ser Ile Leu Met Leu Pro Glu 1535 1540 1545 Glu Val Glu Glu Val Ile Gly Asn Lys Pro Glu Ser Asp Ile Leu 1550 1555 1560 Val His Thr Ala Tyr Asp Glu Ser Thr Asp Glu Asn Val Met Leu 1565 1570 1575 Leu Thr Ser Asp Ala Pro Glu Tyr Lys Pro Trp Ala Leu Val Ile 1580 1585 1590 Gln Asp Ser Asn Gly Glu Asn Lys Ile Lys Met Leu Gly Gly Gly 1595 1600 1605 Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Thr Asn Leu 1610 1615 1620 Ser Asp Ile Ile Glu Lys Glu Thr Gly Lys Gln Leu Val Ile Gln 1625 1630 1635 Glu Ser Ile Leu Met Leu Pro Glu Glu Val Glu Glu Val Ile Gly 1640 1645 1650 Asn Lys Pro Glu Ser Asp Ile Leu Val His Thr Ala Tyr Asp Glu 1655 1660 1665 Ser Thr Asp Glu Asn Val Met Leu Leu Thr Ser Asp Ala Pro Glu 1670 1675 1680 Tyr Lys Pro Trp Ala Leu Val Ile Gln Asp Ser Asn Gly Glu Asn 1685 1690 1695 Lys Ile Lys Met Leu Ser Gly Gly Ser Pro Lys Lys Lys Arg Lys 1700 1705 1710 Val <210> 18 <211> 4767 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 18 atgccgaaga agaagcgcaa ggtcatgtcc agcgagaccg gccccgtggc ggtggacccc 60 accctgcgca ggcgcatcga gccgcacgag ttcgaggtgt tcttcgaccc cagggagctc 120 cgcaaggaga cctgcctcct gtacgagatc aactggggcg gcaggcactc catctggagg 180 cacacgagcc agaacaccaa caagcacgtc gaggtgaact tcatcgagaa gttcaccacg 240 gagaggtact tctgcccgaa cacgcgctgc tccatcacgt ggttcctctc gtggagccca 300 tgcggcgagt gctccagggc gatcacggag ttcctcagcc gctacccgca cgtgaccctg 360 ttcatctaca tcgctaggct ctaccaccac gcggacccca ggaacaggca gggcctcagg 420 gacctgatct ccagcggcgt cacgatccag atcatgaccg agcaggagtc cggctactgc 480 tggaggaact tcgtgaacta ctccccgagc aacgaggccc actggccccg ctacccgcac 540 ctctgggtcc gcctctacgt gctcgagctg tactgcatca tcctcggcct gccgccctgc 600 ctcaacatcc tgaggcgcaa gcagccccag ctgacgttct tcaccatcgc cctgcagagc 660 tgccactacc agaggctccc gccccacatc ctgtgggcga ccgggctcaa gtcgggcagc 720 gagacccccg gcacctccga gtcggctacc ccagagtcca tgagcaagct ggagaagttc 780 acgaactgct actccctcag caagaccctg aggttcaagg cgatcccggt cggcaagacc 840 caggagaaca tcgacaacaa gcggctgctg gtggaggacg agaagagggc tgaggactac 900 aagggcgtga agaagctcct ggaccgctac tacctgtcct tcatcaacga cgtgctccac 960 agcatcaagc tcaagaacct gaacaactac atcagcctct tcaggaagaa gacgcgcacc 1020 gagaaggaga acaaggagct cgagaacctg gagatcaacc tgaggaagga gatcgccaag 1080 gcgttcaagg gcaacgaggg ctacaagtcc ctcttcaaga aggacatcat cgagacgatc 1140 ctcccggagt tcctggacga caaggacgag atcgccctgg tcaactcctt caacggcttc 1200 accacggcgt tcaccggctt cttcgacaac cgcgagaaca tgttcagcga ggaggccaag 1260 tccacgagca tcgcgttcag gtgcatcaac gagaacctca cccgctacat ctccaacatg 1320 gacatcttcg agaaggtcga cgcgatcttc gacaagcacg aggtgcagga gatcaaggag 1380 aagatcctga acagcgacta cgacgtcgag gacttcttcg agggcgagtt cttcaacttc 1440 gtcctcacgc aggagggcat cgacgtgtac aacgccatca tcggtggctt cgtgaccgag 1500 tccggcgaga agatcaaggg cctgaacgag tacatcaacc tctacaacca gaagaccaag 1560 cagaagctgc cgaagttcaa gcccctgtac aagcaggtgc tctccgacag ggagtccctc 1620 agcttctacg gcgagggcta cacgagcgac gaggaggtcc tggaggtgtt ccgcaacacc 1680 ctcaacaaga acagcgagat cttctccagc atcaagaagc tcgagaagct gttcaagaac 1740 ttcgacgagt actccagcgc cggcatcttc gtcaagaacg gcccggcgat ctccacgatc 1800 agcaaggaca tcttcggcga gtggaacgtg atccgcgaca agtggaacgc cgagtacgac 1860 gacatccacc tcaagaagaa ggcggtggtc accgagaagt acgaggacga caggcgcaag 1920 tccttcaaga agatcggctc cttcagcctc gagcagctgc aggagtacgc cgacgcggac 1980 ctgagcgtgg tcgagaagct caaggagatc atcatccaga aggtcgacga gatctacaag 2040 gtgtacggct ccagcgagaa gctcttcgac gcggacttcg tcctcgagaa gtccctgaag 2100 aagaacgacg ccgtggtcgc gatcatgaag gacctcctgg actccgtgaa gagcttcgag 2160 aattacatca aggccttctt cggcgagggc aaggagacga acagggacga gtccttctac 2220 ggcgacttcg tcctggccta cgacatcctc ctgaaggtgg accacatcta cgacgcgatc 2280 cgcaactacg tgacccagaa gccgtacagc aaggacaagt tcaagctcta cttccagaac 2340 ccccagttca tgggcggctg ggacaaggac aaggagacgg actacagggc gaccatcctg 2400 cgctacggca gcaagtacta cctcgccatc atggacaaga agtacgcgaa gtgcctgcag 2460 aagatcgaca aggacgacgt caacggcaac tacgagaaga tcaactacaa gctcctgccg 2520 ggccccaaca agatgctccc gaaggtgttc ttctccaaga agtggatggc ctactacaac 2580 cccagcgagg acatccagaa gatctacaag aacggcacgt tcaagaaggg cgacatgttc 2640 aacctgaacg actgccacaa gctcatcgac ttcttcaagg actccatcag ccgctacccg 2700 aagtggtcca acgcctacga cttcaacttc agcgagaccg agaagtacaa ggacatcgcg 2760 ggcttctacc gcgaggtcga ggagcagggc tacaaggtgt ccttcgagtc cgccagcaag 2820 aaggaggtcg acaagctggt ggaggagggc aagctctaca tgttccagat ctacaacaag 2880 gacttctccg acaagagcca cggcacgccc aacctgcaca ccatgtactt caagctcctg 2940 ttcgacgaga acaaccacgg ccagatcagg ctgtccggcg gcgccgagct cttcatgagg 3000 agggcgagcc tgaagaagga ggagctggtg gtccaccccg ctaacagccc aatcgcgaac 3060 aagaacccgg acaaccccaa gaagaccacg accctgtcct acgacgtgta caaggacaag 3120 aggttcagcg aggaccagta cgagctccac atcccgatcg cgatcaacaa gtgccccaag 3180 aacatcttca agatcaacac cgaggtccgc gtgctcctga agcacgacga caacccctac 3240 gtgatcggca tcgctagggg cgagaggaac ctcctgtaca tcgtggtcgt ggacggcaag 3300 ggcaacatcg tggagcagta ctccctcaac gagatcatca acaacttcaa cggcatcagg 3360 atcaagacgg actaccacag cctcctggac aagaaggaga aggagaggtt cgaggcccgc 3420 cagaactgga cctccatcga gaacatcaag gagctgaagg cgggctacat cagccaggtc 3480 gtgcacaaga tctgcgagct cgtcgagaag tacgacgccg tgatcgccct cgcggacctg 3540 aactccggct tcaagaacag ccgcgtcaag gtggagaagc aggtctacca gaagttcgag 3600 aagatgctca tcgacaagct gaactacatg gtggacaaga agtccaaccc ctgcgctacg 3660 ggcggcgcgc tgaagggcta ccagatcacc aacaagttcg agagcttcaa gtccatgagc 3720 actcagaacg gcttcatctt ctacatcccg gcgtggctca cgtccaagat cgaccccagc 3780 accggcttcg tcaacctcct gaagacgaag tacacctcca tcgccgacag caagaagttc 3840 atctccagct tcgaccgcat catgtatgtg ccggaggagg acctgttcga gttcgccctc 3900 gactacaaga acttctcccg cacggacgcg gactacatca agaagtggaa gctgtacagc 3960 tacggcaacc gcatccgcat cttcaggaac cccaagaaga acaacgtctt cgactgggag 4020 gaggtgtgcc tgacctccgc gtacaaggag ctcttcaaca agtacggcat caactaccag 4080 cagggcgaca tcagggctct cctgtgcgag cagagcgaca aggccttcta ctccagcttc 4140 atggcgctga tgtccctcat gctgcagatg aggaactcga tcaccggcag gacggacgtg 4200 gccttcctca tctccccggt gaagaacagc gacggcatct tctacgactc caggaactac 4260 gaggcccagg agaacgcgat cctcccaaag aacgcggacg ccaacggcgc ctacaacatc 4320 gccaggaagg tcctctgggc tatcggccag ttcaagaagg cggaggacga gaagctggac 4380 aaggtgaaga tcgccatcag caacaaggag tggctcgagt acgcccagac ctcggtcaag 4440 cacggcagcc cgaagaagaa gcgcaaggtg tccggcggca gcacgaacct gtccgacatc 4500 atcgagaagg agaccggcaa gcagctcgtg atccaggaga gcatcctcat gctgccggag 4560 gaggtcgagg aggtcatcgg caacaagccc gagtccgaca tcctcgtcca cacggcctac 4620 gacgagtcca ccgacgagaa cgtgatgctc ctgacctcgg acgctcccga gtacaagcca 4680 tgggccctgg tcatccagga cagcaacggc gagaacaaga tcaagatgct ctccggcggc 4740 agcccgaaga agaagcgcaa agtgtga 4767 <210> 19 <211> 1588 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 19 Met Pro Lys Lys Lys Arg Lys Val Met Ser Ser Glu Thr Gly Pro Val 1 5 10 15 Ala Val Asp Pro Thr Leu Arg Arg Arg Ile Glu Pro His Glu Phe Glu 20 25 30 Val Phe Phe Asp Pro Arg Glu Leu Arg Lys Glu Thr Cys Leu Leu Tyr 35 40 45 Glu Ile Asn Trp Gly Gly Arg His Ser Ile Trp Arg His Thr Ser Gln 50 55 60 Asn Thr Asn Lys His Val Glu Val Asn Phe Ile Glu Lys Phe Thr Thr 65 70 75 80 Glu Arg Tyr Phe Cys Pro Asn Thr Arg Cys Ser Ile Thr Trp Phe Leu 85 90 95 Ser Trp Ser Pro Cys Gly Glu Cys Ser Arg Ala Ile Thr Glu Phe Leu 100 105 110 Ser Arg Tyr Pro His Val Thr Leu Phe Ile Tyr Ile Ala Arg Leu Tyr 115 120 125 His His Ala Asp Pro Arg Asn Arg Gln Gly Leu Arg Asp Leu Ile Ser 130 135 140 Ser Gly Val Thr Ile Gln Ile Met Thr Glu Gln Glu Ser Gly Tyr Cys 145 150 155 160 Trp Arg Asn Phe Val Asn Tyr Ser Pro Ser Asn Glu Ala His Trp Pro 165 170 175 Arg Tyr Pro His Leu Trp Val Arg Leu Tyr Val Leu Glu Leu Tyr Cys 180 185 190 Ile Ile Leu Gly Leu Pro Pro Cys Leu Asn Ile Leu Arg Arg Lys Gln 195 200 205 Pro Gln Leu Thr Phe Phe Thr Ile Ala Leu Gln Ser Cys His Tyr Gln 210 215 220 Arg Leu Pro Pro His Ile Leu Trp Ala Thr Gly Leu Lys Ser Gly Ser 225 230 235 240 Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Met Ser Lys 245 250 255 Leu Glu Lys Phe Thr Asn Cys Tyr Ser Leu Ser Lys Thr Leu Arg Phe 260 265 270 Lys Ala Ile Pro Val Gly Lys Thr Gln Glu Asn Ile Asp Asn Lys Arg 275 280 285 Leu Leu Val Glu Asp Glu Lys Arg Ala Glu Asp Tyr Lys Gly Val Lys 290 295 300 Lys Leu Leu Asp Arg Tyr Tyr Leu Ser Phe Ile Asn Asp Val Leu His 305 310 315 320 Ser Ile Lys Leu Lys Asn Leu Asn Asn Tyr Ile Ser Leu Phe Arg Lys 325 330 335 Lys Thr Arg Thr Glu Lys Glu Asn Lys Glu Leu Glu Asn Leu Glu Ile 340 345 350 Asn Leu Arg Lys Glu Ile Ala Lys Ala Phe Lys Gly Asn Glu Gly Tyr 355 360 365 Lys Ser Leu Phe Lys Lys Asp Ile Ile Glu Thr Ile Leu Pro Glu Phe 370 375 380 Leu Asp Asp Lys Asp Glu Ile Ala Leu Val Asn Ser Phe Asn Gly Phe 385 390 395 400 Thr Thr Ala Phe Thr Gly Phe Phe Asp Asn Arg Glu Asn Met Phe Ser 405 410 415 Glu Glu Ala Lys Ser Thr Ser Ile Ala Phe Arg Cys Ile Asn Glu Asn 420 425 430 Leu Thr Arg Tyr Ile Ser Asn Met Asp Ile Phe Glu Lys Val Asp Ala 435 440 445 Ile Phe Asp Lys His Glu Val Gln Glu Ile Lys Glu Lys Ile Leu Asn 450 455 460 Ser Asp Tyr Asp Val Glu Asp Phe Phe Glu Gly Glu Phe Phe Asn Phe 465 470 475 480 Val Leu Thr Gln Glu Gly Ile Asp Val Tyr Asn Ala Ile Ile Gly Gly 485 490 495 Phe Val Thr Glu Ser Gly Glu Lys Ile Lys Gly Leu Asn Glu Tyr Ile 500 505 510 Asn Leu Tyr Asn Gln Lys Thr Lys Gln Lys Leu Pro Lys Phe Lys Pro 515 520 525 Leu Tyr Lys Gln Val Leu Ser Asp Arg Glu Ser Leu Ser Phe Tyr Gly 530 535 540 Glu Gly Tyr Thr Ser Asp Glu Glu Val Leu Glu Val Phe Arg Asn Thr 545 550 555 560 Leu Asn Lys Asn Ser Glu Ile Phe Ser Ser Ile Lys Lys Leu Glu Lys 565 570 575 Leu Phe Lys Asn Phe Asp Glu Tyr Ser Ser Ala Gly Ile Phe Val Lys 580 585 590 Asn Gly Pro Ala Ile Ser Thr Ile Ser Lys Asp Ile Phe Gly Glu Trp 595 600 605 Asn Val Ile Arg Asp Lys Trp Asn Ala Glu Tyr Asp Asp Ile His Leu 610 615 620 Lys Lys Lys Ala Val Val Thr Glu Lys Tyr Glu Asp Asp Arg Arg Lys 625 630 635 640 Ser Phe Lys Lys Ile Gly Ser Phe Ser Leu Glu Gln Leu Gln Glu Tyr 645 650 655 Ala Asp Ala Asp Leu Ser Val Val Glu Lys Leu Lys Glu Ile Ile Ile 660 665 670 Gln Lys Val Asp Glu Ile Tyr Lys Val Tyr Gly Ser Ser Glu Lys Leu 675 680 685 Phe Asp Ala Asp Phe Val Leu Glu Lys Ser Leu Lys Lys Asn Asp Ala 690 695 700 Val Val Ala Ile Met Lys Asp Leu Leu Asp Ser Val Lys Ser Phe Glu 705 710 715 720 Asn Tyr Ile Lys Ala Phe Phe Gly Glu Gly Lys Glu Thr Asn Arg Asp 725 730 735 Glu Ser Phe Tyr Gly Asp Phe Val Leu Ala Tyr Asp Ile Leu Leu Lys 740 745 750 Val Asp His Ile Tyr Asp Ala Ile Arg Asn Tyr Val Thr Gln Lys Pro 755 760 765 Tyr Ser Lys Asp Lys Phe Lys Leu Tyr Phe Gln Asn Pro Gln Phe Met 770 775 780 Gly Gly Trp Asp Lys Asp Lys Glu Thr Asp Tyr Arg Ala Thr Ile Leu 785 790 795 800 Arg Tyr Gly Ser Lys Tyr Tyr Leu Ala Ile Met Asp Lys Lys Tyr Ala 805 810 815 Lys Cys Leu Gln Lys Ile Asp Lys Asp Asp Val Asn Gly Asn Tyr Glu 820 825 830 Lys Ile Asn Tyr Lys Leu Leu Pro Gly Pro Asn Lys Met Leu Pro Lys 835 840 845 Val Phe Phe Ser Lys Lys Trp Met Ala Tyr Tyr Asn Pro Ser Glu Asp 850 855 860 Ile Gln Lys Ile Tyr Lys Asn Gly Thr Phe Lys Lys Gly Asp Met Phe 865 870 875 880 Asn Leu Asn Asp Cys His Lys Leu Ile Asp Phe Phe Lys Asp Ser Ile 885 890 895 Ser Arg Tyr Pro Lys Trp Ser Asn Ala Tyr Asp Phe Asn Phe Ser Glu 900 905 910 Thr Glu Lys Tyr Lys Asp Ile Ala Gly Phe Tyr Arg Glu Val Glu Glu 915 920 925 Gln Gly Tyr Lys Val Ser Phe Glu Ser Ala Ser Lys Lys Glu Val Asp 930 935 940 Lys Leu Val Glu Glu Gly Lys Leu Tyr Met Phe Gln Ile Tyr Asn Lys 945 950 955 960 Asp Phe Ser Asp Lys Ser His Gly Thr Pro Asn Leu His Thr Met Tyr 965 970 975 Phe Lys Leu Leu Phe Asp Glu Asn Asn His Gly Gln Ile Arg Leu Ser 980 985 990 Gly Gly Ala Glu Leu Phe Met Arg Arg Ala Ser Leu Lys Lys Glu Glu 995 1000 1005 Leu Val Val His Pro Ala Asn Ser Pro Ile Ala Asn Lys Asn Pro 1010 1015 1020 Asp Asn Pro Lys Lys Thr Thr Thr Leu Ser Tyr Asp Val Tyr Lys 1025 1030 1035 Asp Lys Arg Phe Ser Glu Asp Gln Tyr Glu Leu His Ile Pro Ile 1040 1045 1050 Ala Ile Asn Lys Cys Pro Lys Asn Ile Phe Lys Ile Asn Thr Glu 1055 1060 1065 Val Arg Val Leu Leu Lys His Asp Asp Asn Pro Tyr Val Ile Gly 1070 1075 1080 Ile Ala Arg Gly Glu Arg Asn Leu Leu Tyr Ile Val Val Val Asp 1085 1090 1095 Gly Lys Gly Asn Ile Val Glu Gln Tyr Ser Leu Asn Glu Ile Ile 1100 1105 1110 Asn Asn Phe Asn Gly Ile Arg Ile Lys Thr Asp Tyr His Ser Leu 1115 1120 1125 Leu Asp Lys Lys Glu Lys Glu Arg Phe Glu Ala Arg Gln Asn Trp 1130 1135 1140 Thr Ser Ile Glu Asn Ile Lys Glu Leu Lys Ala Gly Tyr Ile Ser 1145 1150 1155 Gln Val Val His Lys Ile Cys Glu Leu Val Glu Lys Tyr Asp Ala 1160 1165 1170 Val Ile Ala Leu Ala Asp Leu Asn Ser Gly Phe Lys Asn Ser Arg 1175 1180 1185 Val Lys Val Glu Lys Gln Val Tyr Gln Lys Phe Glu Lys Met Leu 1190 1195 1200 Ile Asp Lys Leu Asn Tyr Met Val Asp Lys Lys Ser Asn Pro Cys 1205 1210 1215 Ala Thr Gly Gly Ala Leu Lys Gly Tyr Gln Ile Thr Asn Lys Phe 1220 1225 1230 Glu Ser Phe Lys Ser Met Ser Thr Gln Asn Gly Phe Ile Phe Tyr 1235 1240 1245 Ile Pro Ala Trp Leu Thr Ser Lys Ile Asp Pro Ser Thr Gly Phe 1250 1255 1260 Val Asn Leu Leu Lys Thr Lys Tyr Thr Ser Ile Ala Asp Ser Lys 1265 1270 1275 Lys Phe Ile Ser Ser Phe Asp Arg Ile Met Tyr Val Pro Glu Glu 1280 1285 1290 Asp Leu Phe Glu Phe Ala Leu Asp Tyr Lys Asn Phe Ser Arg Thr 1295 1300 1305 Asp Ala Asp Tyr Ile Lys Lys Trp Lys Leu Tyr Ser Tyr Gly Asn 1310 1315 1320 Arg Ile Arg Ile Phe Arg Asn Pro Lys Lys Asn Asn Val Phe Asp 1325 1330 1335 Trp Glu Glu Val Cys Leu Thr Ser Ala Tyr Lys Glu Leu Phe Asn 1340 1345 1350 Lys Tyr Gly Ile Asn Tyr Gln Gln Gly Asp Ile Arg Ala Leu Leu 1355 1360 1365 Cys Glu Gln Ser Asp Lys Ala Phe Tyr Ser Ser Phe Met Ala Leu 1370 1375 1380 Met Ser Leu Met Leu Gln Met Arg Asn Ser Ile Thr Gly Arg Thr 1385 1390 1395 Asp Val Ala Phe Leu Ile Ser Pro Val Lys Asn Ser Asp Gly Ile 1400 1405 1410 Phe Tyr Asp Ser Arg Asn Tyr Glu Ala Gln Glu Asn Ala Ile Leu 1415 1420 1425 Pro Lys Asn Ala Asp Ala Asn Gly Ala Tyr Asn Ile Ala Arg Lys 1430 1435 1440 Val Leu Trp Ala Ile Gly Gln Phe Lys Lys Ala Glu Asp Glu Lys 1445 1450 1455 Leu Asp Lys Val Lys Ile Ala Ile Ser Asn Lys Glu Trp Leu Glu 1460 1465 1470 Tyr Ala Gln Thr Ser Val Lys His Gly Ser Pro Lys Lys Lys Arg 1475 1480 1485 Lys Val Ser Gly Gly Ser Thr Asn Leu Ser Asp Ile Ile Glu Lys 1490 1495 1500 Glu Thr Gly Lys Gln Leu Val Ile Gln Glu Ser Ile Leu Met Leu 1505 1510 1515 Pro Glu Glu Val Glu Glu Val Ile Gly Asn Lys Pro Glu Ser Asp 1520 1525 1530 Ile Leu Val His Thr Ala Tyr Asp Glu Ser Thr Asp Glu Asn Val 1535 1540 1545 Met Leu Leu Thr Ser Asp Ala Pro Glu Tyr Lys Pro Trp Ala Leu 1550 1555 1560 Val Ile Gln Asp Ser Asn Gly Glu Asn Lys Ile Lys Met Leu Ser 1565 1570 1575 Gly Gly Ser Pro Lys Lys Lys Arg Lys Val 1580 1585 <210> 20 <211> 5229 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 20 atgccgaaga agaagcgcaa ggtgtccagc gagaccggcc ccgtggcggt cgaccccacc 60 ctgcgcaggc gcatcgagcc gcacgagttc gaggtcttct tcgaccccag ggagctccgc 120 aaggagacct gcctcctgta cgagatcaac tggggcggca ggcactccat ctggaggcac 180 accagccaga acacgaacaa gcacgtggag gtcaacttca tcgagaagtt caccacggag 240 aggtacttct gcccgaacac ccgctgctcc atcacctggt tcctctcgtg gagcccatgc 300 ggcgagtgct ccagggcgat cacggagttc ctcagccgct acccgcacgt gaccctcttc 360 atctacatcg ctaggctgta ccaccacgcg gaccccagga acaggcaggg gctcagggac 420 ctgatctcca gcggcgtgac catccagatc atgacggagc aggagtccgg ctactgctgg 480 cgcaacttcg tcaactactc cccgagcaac gaggcccact ggccccgcta cccgcacctg 540 tgggtgcgcc tctacgtcct cgagctgtac tgcatcatcc tcggcctgcc gccctgcctc 600 aacatcctga ggcgcaagca gccccagctc accttcttca cgatcgccct gcagagctgc 660 cactaccagc ggctgccgcc ccacatcctc tgggccaccg gcctgaagtc gggcagcgag 720 acgcccggca cgtccgagtc ggctacccca gagctcaagg acaagaagta cagcatcggc 780 ctggcaatcg gcaccaacag cgtgggctgg gccgtgatca ccgacgagta caaggtgccg 840 agcaagaagt tcaaggtgct gggcaacacc gacaggcaca gcatcaagaa gaacctgatc 900 ggcgccctgc tgttcgacag cggcgagacc gccgaggcca ccaggctgaa gaggaccgcc 960 aggaggaggt acaccaggag gaagaacagg atctgctacc tgcaggagat cttcagcaac 1020 gagatggcca aggtggacga cagcttcttc cacaggctgg aggagagctt cctggtggag 1080 gaggacaaga agcacgagag gcacccgatc ttcggcaaca tcgtggacga ggtggcctac 1140 cacgagaagt acccgaccat ctaccacctg aggaagaagc tggtggacag caccgacaag 1200 gccgacctga ggctgatcta cctggccctg gcccacatga tcaagttcag gggccacttc 1260 ctgatcgagg gcgacctgaa cccggacaac agcgacgtgg acaagctgtt catccagctg 1320 gtgcagacct acaaccagct gttcgaggag aacccgatca acgccagcgg cgtggacgcc 1380 aaggccatcc tgagcgccag gctgagcaag agcaggaggc tggagaacct gatcgcccag 1440 ctgccgggcg agaagaagaa cggcctgttc ggcaacctga tcgccctgag cctgggcctg 1500 accccgaact tcaagagcaa cttcgacctg gccgaggacg ccaagctgca gctgagcaag 1560 gacacctacg acgacgacct ggacaacctg ctggcccaga tcggcgacca gtacgccgac 1620 ctgttcctgg ccgccaagaa cctgagcgac gccatcctgc tgagcgacat cctgagggtg 1680 aacaccgaga tcaccaaggc cccgctgagc gccagcatga tcaagaggta cgacgagcac 1740 caccaggacc tgaccctgct gaaggccctg gtgaggcagc agctgccgga gaagtacaag 1800 gagatcttct tcgaccagag caagaacggc tacgccggct acatcgacgg cggcgccagc 1860 caggaggagt tctacaagtt catcaagccg atcctggaga agatggacgg caccgaggag 1920 ctgctggtga agctgaacag ggaggacctg ctgaggaagc agaggacctt cgacaacggc 1980 agcatcccgc accagatcca cctgggcgag ctgcacgcca tcctgaggag gcaggaggac 2040 ttctacccgt tcctgaagga caacagggag aagatcgaga agatcctgac cttccgcatc 2100 ccgtactacg tgggcccgct ggccaggggc aacagcaggt tcgcctggat gaccaggaag 2160 agcgaggaga ccatcacccc gtggaacttc gaggaggtgg tggacaaggg cgccagcgcc 2220 cagagcttca tcgagaggat gaccaacttc gacaagaacc tgccgaacga gaaggtgctg 2280 ccgaagcaca gcctgctgta cgagtacttc accgtgtaca acgagctgac caaggtgaag 2340 tacgtgaccg agggcatgag gaagccggcc ttcctgagcg gcgagcagaa gaaggccatc 2400 gtggacctgc tgttcaagac caacaggaag gtgaccgtga agcagctgaa ggaggactac 2460 ttcaagaaga tcgagtgctt cgacagcgtg gagatcagcg gcgtggagga caggttcaac 2520 gccagcctgg gcacctacca cgacctgctg aagatcatca aggacaagga cttcctggac 2580 aacgaggaga acgaggacat cctggaggac atcgtgctga ccctgaccct gttcgaggac 2640 agggagatga tcgaggagag gctgaagacc tacgcccacc tgttcgacga caaggtgatg 2700 aagcagctga agaggaggag gtacaccggc tggggcaggc tgagcaggaa gctgatcaac 2760 ggcatcaggg acaagcagag cggcaagacc atcctggact tcctgaagag cgacggcttc 2820 gccaacagga acttcatgca gctgatccac gacgacagcc tgaccttcaa ggaggacatc 2880 cagaaggccc aggtgagcgg ccagggcgac agcctgcacg agcacatcgc caacctggcc 2940 ggcagcccgg ccatcaagaa gggcatcctg cagaccgtga aggtggtgga cgagctggtg 3000 aaggtgatgg gcaggcacaa gccggagaac atcgtgatcg agatggccag ggagaaccag 3060 accacccaga agggccagaa gaacagcagg gagaggatga agaggatcga ggagggcatc 3120 aaggagctgg gcagccagat cctgaaggag cacccggtgg agaacaccca gctgcagaac 3180 gagaagctgt acctgtacta cctgcagaac ggcagggaca tgtacgtgga ccaggagctg 3240 gacatcaaca ggctgagcga ctacgacgtg gaccacatcg tgccgcagag cttcctgaag 3300 gacgacagca tcgacaacaa ggtgctgacc aggagcgaca agaacagggg caagagcgac 3360 aacgtgccga gcgaggaggt ggtgaagaag atgaaaaact actggaggca gctgctgaac 3420 gccaagctga tcacccagag gaagttcgac aacctgacca aggccgagag gggcggcctg 3480 agcgagctgg acaaggccgg cttcattaaa aggcagctgg tggagaccag gcagatcacc 3540 aagcacgtgg cccagatcct ggacagcagg atgaacacca agtacgacga gaacgacaag 3600 ctgatcaggg aggtgaaggt gatcaccctg aagagcaagc tggtgagcga cttcaggaag 3660 gacttccagt tctacaaggt gagggagatc aataattacc accacgccca cgacgcctac 3720 ctgaacgccg tggtgggcac cgccctgatt aaaaagtacc cgaagctgga gagcgagttc 3780 gtgtacggcg actacaaggt gtacgacgtg aggaagatga tcgccaagag cgagcaggag 3840 atcggcaagg ccaccgccaa gtacttcttc tacagcaaca tcatgaactt cttcaagacc 3900 gagatcaccc tggccaacgg cgagatcagg aagaggccgc tgatcgagac caacggcgag 3960 accggcgaga tcgtgtggga caagggcagg gacttcgcca ccgtgaggaa ggtgctgtcc 4020 atgccgcagg tgaacatcgt gaagaagacc gaggtgcaga ccggcggctt cagcaaggag 4080 agcatcctgc cgaagaggaa cagcgacaag ctgatcgcca ggaagaagga ctgggatccg 4140 aagaagtacg gcggcttcga cagcccgacc gtggcctaca gcgtgctggt ggtggccaag 4200 gtggagaagg gcaagagcaa gaagctgaag agcgtgaagg agctggtggg catcaccatc 4260 atggagagga gcagcttcga gaagaaccca gtggacttcc tggaggccaa gggctacaag 4320 gaggtgaaga aggacctgat cattaaactg ccgaagtaca gcctgttcga gctggagaac 4380 ggcaggaaga ggatgctggc cagcgccggc gagctgcaga agggcaacga gctggccctg 4440 ccgagcaagt acgtgaactt cctgtacctg gccagccact acgagaagct gaagggcagc 4500 ccggaggaca acgagcagaa gcagctgttc gtggagcagc acaagcacta cctggacgag 4560 atcatcgagc agatcagcga gttcagcaag agggtgatcc tggccgacgc caacctggac 4620 aaggtgctga gcgcctacaa caagcacagg gacaagccga tcagggagca ggccgagaac 4680 atcatccacc tgttcaccct gaccaacctg ggcgccccgg ccgccttcaa gtacttcgac 4740 accaccatcg acaggaagag gtacaccagc accaaggagg tgctggacgc caccctgatc 4800 caccagagca tcaccggcct gtacgagacc aggatcgacc tgagccagct gggcggcgac 4860 agcagcccgc cgaagaagaa gaggaaggtg agctggaagg acgccagcgg ctggagcagg 4920 atgaccaggg actccggcgg cagcaccaac ctctccgaca tcatcgagaa ggagacgggc 4980 aagcagctcg tgatccagga gagcatcctc atgctgccgg aggaggtgga ggaggtcatc 5040 ggcaacaagc ccgagtccga catcctcgtg cacacggcct acgacgagtc caccgacgag 5100 aacgtcatgc tcctgacctc ggacgctccc gagtacaagc catgggccct cgtgatccag 5160 gacagcaacg gcgagaacaa gatcaagatg ctctccggcg gcagcccgaa gaagaagcgc 5220 aaagtctga 5229 <210> 21 <211> 1742 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 21 Met Pro Lys Lys Lys Arg Lys Val Ser Ser Glu Thr Gly Pro Val Ala 1 5 10 15 Val Asp Pro Thr Leu Arg Arg Arg Ile Glu Pro His Glu Phe Glu Val 20 25 30 Phe Phe Asp Pro Arg Glu Leu Arg Lys Glu Thr Cys Leu Leu Tyr Glu 35 40 45 Ile Asn Trp Gly Gly Arg His Ser Ile Trp Arg His Thr Ser Gln Asn 50 55 60 Thr Asn Lys His Val Glu Val Asn Phe Ile Glu Lys Phe Thr Thr Glu 65 70 75 80 Arg Tyr Phe Cys Pro Asn Thr Arg Cys Ser Ile Thr Trp Phe Leu Ser 85 90 95 Trp Ser Pro Cys Gly Glu Cys Ser Arg Ala Ile Thr Glu Phe Leu Ser 100 105 110 Arg Tyr Pro His Val Thr Leu Phe Ile Tyr Ile Ala Arg Leu Tyr His 115 120 125 His Ala Asp Pro Arg Asn Arg Gln Gly Leu Arg Asp Leu Ile Ser Ser 130 135 140 Gly Val Thr Ile Gln Ile Met Thr Glu Gln Glu Ser Gly Tyr Cys Trp 145 150 155 160 Arg Asn Phe Val Asn Tyr Ser Pro Ser Asn Glu Ala His Trp Pro Arg 165 170 175 Tyr Pro His Leu Trp Val Arg Leu Tyr Val Leu Glu Leu Tyr Cys Ile 180 185 190 Ile Leu Gly Leu Pro Pro Cys Leu Asn Ile Leu Arg Arg Lys Gln Pro 195 200 205 Gln Leu Thr Phe Phe Thr Ile Ala Leu Gln Ser Cys His Tyr Gln Arg 210 215 220 Leu Pro Pro His Ile Leu Trp Ala Thr Gly Leu Lys Ser Gly Ser Glu 225 230 235 240 Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Leu Lys Asp Lys Lys 245 250 255 Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val 260 265 270 Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly 275 280 285 Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu 290 295 300 Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala 305 310 315 320 Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu 325 330 335 Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe Phe His Arg 340 345 350 Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His Glu Arg His 355 360 365 Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr 370 375 380 Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys 385 390 395 400 Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe 405 410 415 Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp 420 425 430 Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe 435 440 445 Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu 450 455 460 Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln 465 470 475 480 Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu 485 490 495 Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu 500 505 510 Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp 515 520 525 Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala 530 535 540 Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val 545 550 555 560 Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg 565 570 575 Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg 580 585 590 Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys 595 600 605 Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe 610 615 620 Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu 625 630 635 640 Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr 645 650 655 Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly Glu Leu His 660 665 670 Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn 675 680 685 Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val 690 695 700 Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys 705 710 715 720 Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys 725 730 735 Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys 740 745 750 Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu 755 760 765 Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu 770 775 780 Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile 785 790 795 800 Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu 805 810 815 Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile 820 825 830 Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp 835 840 845 Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn 850 855 860 Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu Phe Glu Asp 865 870 875 880 Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His Leu Phe Asp 885 890 895 Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly 900 905 910 Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly 915 920 925 Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn 930 935 940 Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile 945 950 955 960 Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His Glu His Ile 965 970 975 Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr 980 985 990 Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg His Lys Pro 995 1000 1005 Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr Thr Gln 1010 1015 1020 Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu Glu 1025 1030 1035 Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val 1040 1045 1050 Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu 1055 1060 1065 Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn 1070 1075 1080 Arg Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe 1085 1090 1095 Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp 1100 1105 1110 Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val 1115 1120 1125 Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu 1130 1135 1140 Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly 1145 1150 1155 Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu 1160 1165 1170 Val Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp 1175 1180 1185 Ser Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg 1190 1195 1200 Glu Val Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp Phe 1205 1210 1215 Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn Tyr 1220 1225 1230 His His Ala His Asp Ala Tyr Leu Asn Ala Val Val Gly Thr Ala 1235 1240 1245 Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val Tyr Gly 1250 1255 1260 Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys Ser Glu 1265 1270 1275 Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn 1280 1285 1290 Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu 1295 1300 1305 Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu 1310 1315 1320 Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val 1325 1330 1335 Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln 1340 1345 1350 Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser 1355 1360 1365 Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr 1370 1375 1380 Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu Val Val 1385 1390 1395 Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser Val Lys 1400 1405 1410 Glu Leu Val Gly Ile Thr Ile Met Glu Arg Ser Ser Phe Glu Lys 1415 1420 1425 Asn Pro Val Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val Lys 1430 1435 1440 Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu 1445 1450 1455 Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu Leu Gln 1460 1465 1470 Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe Leu 1475 1480 1485 Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro Glu Asp 1490 1495 1500 Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His Tyr Leu 1505 1510 1515 Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val Ile 1520 1525 1530 Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys 1535 1540 1545 His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His 1550 1555 1560 Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr 1565 1570 1575 Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu 1580 1585 1590 Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr 1595 1600 1605 Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp Ser Ser Pro 1610 1615 1620 Pro Lys Lys Lys Arg Lys Val Ser Trp Lys Asp Ala Ser Gly Trp 1625 1630 1635 Ser Arg Met Thr Arg Asp Ser Gly Gly Ser Thr Asn Leu Ser Asp 1640 1645 1650 Ile Ile Glu Lys Glu Thr Gly Lys Gln Leu Val Ile Gln Glu Ser 1655 1660 1665 Ile Leu Met Leu Pro Glu Glu Val Glu Glu Val Ile Gly Asn Lys 1670 1675 1680 Pro Glu Ser Asp Ile Leu Val His Thr Ala Tyr Asp Glu Ser Thr 1685 1690 1695 Asp Glu Asn Val Met Leu Leu Thr Ser Asp Ala Pro Glu Tyr Lys 1700 1705 1710 Pro Trp Ala Leu Val Ile Gln Asp Ser Asn Gly Glu Asn Lys Ile 1715 1720 1725 Lys Met Leu Ser Gly Gly Ser Pro Lys Lys Lys Arg Lys Val 1730 1735 1740 <210> 22 <211> 1316 <212> PRT <213> Acidaminococcus fermentans <400> 22 Met Thr Gln Phe Glu Gly Phe Thr Asn Leu Tyr Gln Val Ser Lys Thr 1 5 10 15 Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Lys His Ile Gln 20 25 30 Glu Gln Gly Phe Ile Glu Glu Asp Lys Ala Arg Asn Asp His Tyr Lys 35 40 45 Glu Leu Lys Pro Ile Ile Asp Arg Ile Tyr Lys Thr Tyr Ala Asp Gln 50 55 60 Cys Leu Gln Leu Val Gln Leu Asp Trp Glu Asn Leu Ser Ala Ala Ile 65 70 75 80 Asp Ser Tyr Arg Lys Glu Lys Thr Glu Glu Thr Arg Asn Ala Leu Ile 85 90 95 Glu Glu Gln Ala Thr Tyr Arg Asn Ala Ile His Asp Tyr Phe Ile Gly 100 105 110 Arg Thr Asp Asn Leu Thr Asp Ala Ile Asn Lys Arg His Ala Glu Ile 115 120 125 Tyr Lys Gly Leu Phe Lys Ala Glu Leu Phe Asn Gly Lys Val Leu Lys 130 135 140 Gln Leu Gly Thr Val Thr Thr Thr Glu His Glu Asn Ala Leu Leu Arg 145 150 155 160 Ser Phe Asp Lys Phe Thr Thr Tyr Phe Ser Gly Phe Tyr Glu Asn Arg 165 170 175 Lys Asn Val Phe Ser Ala Glu Asp Ile Ser Thr Ala Ile Pro His Arg 180 185 190 Ile Val Gln Asp Asn Phe Pro Lys Phe Lys Glu Asn Cys His Ile Phe 195 200 205 Thr Arg Leu Ile Thr Ala Val Pro Ser Leu Arg Glu His Phe Glu Asn 210 215 220 Val Lys Lys Ala Ile Gly Ile Phe Val Ser Thr Ser Ile Glu Glu Val 225 230 235 240 Phe Ser Phe Pro Phe Tyr Asn Gln Leu Leu Thr Gln Thr Gln Ile Asp 245 250 255 Leu Tyr Asn Gln Leu Leu Gly Gly Ile Ser Arg Glu Ala Gly Thr Glu 260 265 270 Lys Ile Lys Gly Leu Asn Glu Val Leu Asn Leu Ala Ile Gln Lys Asn 275 280 285 Asp Glu Thr Ala His Ile Ile Ala Ser Leu Pro His Arg Phe Ile Pro 290 295 300 Leu Phe Lys Gln Ile Leu Ser Asp Arg Asn Thr Leu Ser Phe Ile Leu 305 310 315 320 Glu Glu Phe Lys Ser Asp Glu Glu Val Ile Gln Ser Phe Cys Lys Tyr 325 330 335 Lys Thr Leu Leu Arg Asn Glu Asn Val Leu Glu Thr Ala Glu Ala Leu 340 345 350 Phe Asn Glu Leu Asn Ser Ile Asp Leu Thr His Ile Phe Ile Ser His 355 360 365 Lys Lys Leu Glu Thr Ile Ser Ser Ala Leu Cys Asp His Trp Asp Thr 370 375 380 Leu Arg Asn Ala Leu Tyr Glu Arg Arg Ile Ser Glu Leu Thr Gly Lys 385 390 395 400 Ile Thr Lys Ser Ala Lys Glu Lys Val Gln Arg Ser Leu Lys His Glu 405 410 415 Asp Ile Asn Leu Gln Glu Ile Ile Ser Ala Ala Gly Lys Glu Leu Ser 420 425 430 Glu Ala Phe Lys Gln Lys Thr Ser Glu Ile Leu Ser His Ala His Ala 435 440 445 Ala Leu Asp Gln Pro Leu Pro Thr Thr Leu Lys Lys Gln Glu Glu Lys 450 455 460 Glu Ile Leu Lys Ser Gln Leu Asp Ser Leu Leu Gly Leu Tyr His Leu 465 470 475 480 Leu Asp Trp Phe Ala Val Asp Glu Ser Asn Glu Val Asp Pro Glu Phe 485 490 495 Ser Ala Arg Leu Thr Gly Ile Lys Leu Glu Met Glu Pro Ser Leu Ser 500 505 510 Phe Tyr Asn Lys Ala Arg Asn Tyr Ala Thr Lys Lys Pro Tyr Ser Val 515 520 525 Glu Lys Phe Lys Leu Asn Phe Gln Met Pro Thr Leu Ala Ser Gly Trp 530 535 540 Asp Val Asn Lys Glu Lys Asn Asn Gly Ala Ile Leu Phe Val Lys Asn 545 550 555 560 Gly Leu Tyr Tyr Leu Gly Ile Met Pro Lys Gln Lys Gly Arg Tyr Lys 565 570 575 Ala Leu Ser Phe Glu Pro Thr Glu Lys Thr Ser Glu Gly Phe Asp Lys 580 585 590 Met Tyr Tyr Asp Tyr Phe Pro Asp Ala Ala Lys Met Ile Pro Lys Cys 595 600 605 Ser Thr Gln Leu Lys Ala Val Thr Ala His Phe Gln Thr His Thr Thr 610 615 620 Pro Ile Leu Leu Ser Asn Asn Phe Ile Glu Pro Leu Glu Ile Thr Lys 625 630 635 640 Glu Ile Tyr Asp Leu Asn Asn Pro Glu Lys Glu Pro Lys Lys Phe Gln 645 650 655 Thr Ala Tyr Ala Lys Lys Thr Gly Asp Gln Lys Gly Tyr Arg Glu Ala 660 665 670 Leu Cys Lys Trp Ile Asp Phe Thr Arg Asp Phe Leu Ser Lys Tyr Thr 675 680 685 Lys Thr Thr Ser Ile Asp Leu Ser Ser Leu Arg Pro Ser Ser Gln Tyr 690 695 700 Lys Asp Leu Gly Glu Tyr Tyr Ala Glu Leu Asn Pro Leu Leu Tyr His 705 710 715 720 Ile Ser Phe Gln Arg Ile Ala Glu Lys Glu Ile Met Asp Ala Val Glu 725 730 735 Thr Gly Lys Leu Tyr Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ala Lys 740 745 750 Gly His His Gly Lys Pro Asn Leu His Thr Leu Tyr Trp Thr Gly Leu 755 760 765 Phe Ser Pro Glu Asn Leu Ala Lys Thr Ser Ile Lys Leu Asn Gly Gln 770 775 780 Ala Glu Leu Phe Tyr Arg Pro Lys Ser Arg Met Lys Arg Met Ala His 785 790 795 800 Arg Leu Gly Glu Lys Met Leu Asn Lys Lys Leu Lys Asp Gln Lys Thr 805 810 815 Pro Ile Pro Asp Thr Leu Tyr Gln Glu Leu Tyr Asp Tyr Val Asn His 820 825 830 Arg Leu Ser His Asp Leu Ser Asp Glu Ala Arg Ala Leu Leu Pro Asn 835 840 845 Val Ile Thr Lys Glu Val Ser His Glu Ile Ile Lys Asp Arg Arg Phe 850 855 860 Thr Ser Asp Lys Phe Phe Phe His Val Pro Ile Thr Leu Asn Tyr Gln 865 870 875 880 Ala Ala Asn Ser Pro Ser Lys Phe Asn Gln Arg Val Asn Ala Tyr Leu 885 890 895 Lys Glu His Pro Glu Thr Pro Ile Ile Gly Ile Ala Arg Gly Glu Arg 900 905 910 Asn Leu Ile Tyr Ile Thr Val Ile Asp Ser Thr Gly Lys Ile Leu Glu 915 920 925 Gln Arg Ser Leu Asn Thr Ile Gln Gln Phe Asp Tyr Gln Lys Lys Leu 930 935 940 Asp Asn Arg Glu Lys Glu Arg Val Ala Ala Arg Gln Ala Trp Ser Val 945 950 955 960 Val Gly Thr Ile Lys Asp Leu Lys Gln Gly Tyr Leu Ser Gln Val Ile 965 970 975 His Glu Ile Val Asp Leu Met Ile His Tyr Gln Ala Val Val Val Leu 980 985 990 Ala Asn Leu Asn Phe Gly Phe Lys Ser Lys Arg Thr Gly Ile Ala Glu 995 1000 1005 Lys Ala Val Tyr Gln Gln Phe Glu Lys Met Leu Ile Asp Lys Leu 1010 1015 1020 Asn Cys Leu Val Leu Lys Asp Tyr Pro Ala Glu Lys Val Gly Gly 1025 1030 1035 Val Leu Asn Pro Tyr Gln Leu Thr Asp Gln Phe Thr Ser Phe Ala 1040 1045 1050 Lys Met Gly Thr Gln Ser Gly Phe Leu Phe Tyr Val Pro Ala Pro 1055 1060 1065 Tyr Thr Ser Lys Ile Asp Pro Leu Thr Gly Phe Val Asp Pro Phe 1070 1075 1080 Val Trp Lys Thr Ile Lys Asn His Glu Ser Arg Lys His Phe Leu 1085 1090 1095 Glu Gly Phe Asp Phe Leu His Tyr Asp Val Lys Thr Gly Asp Phe 1100 1105 1110 Ile Leu His Phe Lys Met Asn Arg Asn Leu Ser Phe Gln Arg Gly 1115 1120 1125 Leu Pro Gly Phe Met Pro Ala Trp Asp Ile Val Phe Glu Lys Asn 1130 1135 1140 Glu Thr Gln Phe Asp Ala Lys Gly Thr Pro Phe Ile Ala Gly Lys 1145 1150 1155 Arg Ile Val Pro Val Ile Glu Asn His Arg Phe Thr Gly Arg Tyr 1160 1165 1170 Arg Asp Leu Tyr Pro Ala Asn Glu Leu Ile Ala Leu Leu Glu Glu 1175 1180 1185 Lys Gly Ile Val Phe Arg Asp Gly Ser Asn Ile Leu Pro Lys Leu 1190 1195 1200 Leu Glu Asn Asp Asp Ser His Ala Ile Asp Thr Met Val Ala Leu 1205 1210 1215 Ile Arg Ser Val Leu Gln Met Arg Asn Ser Asn Ala Ala Thr Gly 1220 1225 1230 Glu Ala Tyr Ile Asn Ser Pro Val Arg Asp Leu Asn Gly Val Cys 1235 1240 1245 Phe Asp Ser Arg Phe Gln Asn Pro Glu Trp Pro Met Asp Ala Asp 1250 1255 1260 Ala Asn Gly Ala Tyr His Ile Ala Leu Lys Gly Gln Leu Leu Leu 1265 1270 1275 Asn His Leu Lys Glu Ser Lys Asp Leu Lys Leu Gln Asn Gly Ile 1280 1285 1290 Ser Asn Gln Asp Trp Leu Ala Tyr Ile Gln Glu Leu Arg Asn Gly 1295 1300 1305 Ser Pro Lys Lys Lys Arg Lys Val 1310 1315 <210> 23 <211> 4809 <212> DNA <213> Artificial Sequence <220> <223> Codon Optimized <400> 23 atgccgaaga agaagcgcaa ggtcatgtcc agcgagaccg gccccgtggc ggtggacccc 60 accctgcgca ggcgcatcga gccgcacgag ttcgaggtgt tcttcgaccc cagggagctc 120 cgcaaggaga cctgcctcct gtacgagatc aactggggcg gcaggcactc catctggagg 180 cacacgagcc agaacaccaa caagcacgtc gaggtgaact tcatcgagaa gttcaccacg 240 gagaggtact tctgcccgaa cacgcgctgc tccatcacgt ggttcctctc gtggagccca 300 tgcggcgagt gctccagggc gatcacggag ttcctcagcc gctacccgca cgtgaccctg 360 ttcatctaca tcgctaggct ctaccaccac gcggacccca ggaacaggca gggcctcagg 420 gacctgatct ccagcggcgt cacgatccag atcatgaccg agcaggagtc cggctactgc 480 tggaggaact tcgtgaacta ctccccgagc aacgaggccc actggccccg ctacccgcac 540 ctctgggtcc gcctctacgt gctcgagctg tactgcatca tcctcggcct gccgccctgc 600 ctcaacatcc tgaggcgcaa gcagccccag ctgacgttct tcaccatcgc cctgcagagc 660 tgccactacc agaggctccc gccccacatc ctgtgggcga ccgggctcaa ggggggcggg 720 ggctcaggcg ggggcgggag cggcggcggg ggctctgggg gcggcggcag cggcgggggc 780 ggcagcgggg gcggcgggtc gatgagcaag ctggagaagt tcacgaactg ctactccctc 840 agcaagaccc tgaggttcaa ggcgatcccg gtcggcaaga cccaggagaa catcgacaac 900 aagcggctgc tggtggagga cgagaagagg gctgaggact acaagggcgt gaagaagctc 960 ctggaccgct actacctgtc cttcatcaac gacgtgctcc acagcatcaa gctcaagaac 1020 ctgaacaact acatcagcct cttcaggaag aagacgcgca ccgagaagga gaacaaggag 1080 ctcgagaacc tggagatcaa cctgaggaag gagatcgcca aggcgttcaa gggcaacgag 1140 ggctacaagt ccctcttcaa gaaggacatc atcgagacga tcctcccgga gttcctggac 1200 gacaaggacg agatcgccct ggtcaactcc ttcaacggct tcaccacggc gttcaccggc 1260 ttcttcgaca accgcgagaa catgttcagc gaggaggcca agtccacgag catcgcgttc 1320 aggtgcatca acgagaacct cacccgctac atctccaaca tggacatctt cgagaaggtc 1380 gacgcgatct tcgacaagca cgaggtgcag gagatcaagg agaagatcct gaacagcgac 1440 tacgacgtcg aggacttctt cgagggcgag ttcttcaact tcgtcctcac gcaggagggc 1500 atcgacgtgt acaacgccat catcggtggc ttcgtgaccg agtccggcga gaagatcaag 1560 ggcctgaacg agtacatcaa cctctacaac cagaagacca agcagaagct gccgaagttc 1620 aagcccctgt acaagcaggt gctctccgac agggagtccc tcagcttcta cggcgagggc 1680 tacacgagcg acgaggaggt cctggaggtg ttccgcaaca ccctcaacaa gaacagcgag 1740 atcttctcca gcatcaagaa gctcgagaag ctgttcaaga acttcgacga gtactccagc 1800 gccggcatct tcgtcaagaa cggcccggcg atctccacga tcagcaagga catcttcggc 1860 gagtggaacg tgatccgcga caagtggaac gccgagtacg acgacatcca cctcaagaag 1920 aaggcggtgg tcaccgagaa gtacgaggac gacaggcgca agtccttcaa gaagatcggc 1980 tccttcagcc tcgagcagct gcaggagtac gccgacgcgg acctgagcgt ggtcgagaag 2040 ctcaaggaga tcatcatcca gaaggtcgac gagatctaca aggtgtacgg ctccagcgag 2100 aagctcttcg acgcggactt cgtcctcgag aagtccctga agaagaacga cgccgtggtc 2160 gcgatcatga aggacctcct ggactccgtg aagagcttcg agaattacat caaggccttc 2220 ttcggcgagg gcaaggagac gaacagggac gagtccttct acggcgactt cgtcctggcc 2280 tacgacatcc tcctgaaggt ggaccacatc tacgacgcga tccgcaacta cgtgacccag 2340 aagccgtaca gcaaggacaa gttcaagctc tacttccaga acccccagtt catgggcggc 2400 tgggacaagg acaaggagac ggactacagg gcgaccatcc tgcgctacgg cagcaagtac 2460 tacctcgcca tcatggacaa gaagtacgcg aagtgcctgc agaagatcga caaggacgac 2520 gtcaacggca actacgagaa gatcaactac aagctcctgc cgggccccaa caagatgctc 2580 ccgaaggtgt tcttctccaa gaagtggatg gcctactaca accccagcga ggacatccag 2640 aagatctaca agaacggcac gttcaagaag ggcgacatgt tcaacctgaa cgactgccac 2700 aagctcatcg acttcttcaa ggactccatc agccgctacc cgaagtggtc caacgcctac 2760 gacttcaact tcagcgagac cgagaagtac aaggacatcg cgggcttcta ccgcgaggtc 2820 gaggagcagg gctacaaggt gtccttcgag tccgccagca agaaggaggt cgacaagctg 2880 gtggaggagg gcaagctcta catgttccag atctacaaca aggacttctc cgacaagagc 2940 cacggcacgc ccaacctgca caccatgtac ttcaagctcc tgttcgacga gaacaaccac 3000 ggccagatca ggctgtccgg cggcgccgag ctcttcatga ggagggcgag cctgaagaag 3060 gaggagctgg tggtccaccc cgctaacagc ccaatcgcga acaagaaccc ggacaacccc 3120 aagaagacca cgaccctgtc ctacgacgtg tacaaggaca agaggttcag cgaggaccag 3180 tacgagctcc acatcccgat cgcgatcaac aagtgcccca agaacatctt caagatcaac 3240 accgaggtcc gcgtgctcct gaagcacgac gacaacccct acgtgatcgg catcgctagg 3300 ggcgagagga acctcctgta catcgtggtc gtggacggca agggcaacat cgtggagcag 3360 tactccctca acgagatcat caacaacttc aacggcatca ggatcaagac ggactaccac 3420 agcctcctgg acaagaagga gaaggagagg ttcgaggccc gccagaactg gacctccatc 3480 gagaacatca aggagctgaa ggcgggctac atcagccagg tcgtgcacaa gatctgcgag 3540 ctcgtcgaga agtacgacgc cgtgatcgcc ctcgcggacc tgaactccgg cttcaagaac 3600 agccgcgtca aggtggagaa gcaggtctac cagaagttcg agaagatgct catcgacaag 3660 ctgaactaca tggtggacaa gaagtccaac ccctgcgcta cgggcggcgc gctgaagggc 3720 taccagatca ccaacaagtt cgagagcttc aagtccatga gcactcagaa cggcttcatc 3780 ttctacatcc cggcgtggct cacgtccaag atcgacccca gcaccggctt cgtcaacctc 3840 ctgaagacga agtacacctc catcgccgac agcaagaagt tcatctccag cttcgaccgc 3900 atcatgtatg tgccggagga ggacctgttc gagttcgccc tcgactacaa gaacttctcc 3960 cgcacggacg cggactacat caagaagtgg aagctgtaca gctacggcaa ccgcatccgc 4020 atcttcagga accccaagaa gaacaacgtc ttcgactggg aggaggtgtg cctgacctcc 4080 gcgtacaagg agctcttcaa caagtacggc atcaactacc agcagggcga catcagggct 4140 ctcctgtgcg agcagagcga caaggccttc tactccagct tcatggcgct gatgtccctc 4200 atgctgcaga tgaggaactc gatcaccggc aggacggacg tggccttcct catctccccg 4260 gtgaagaaca gcgacggcat cttctacgac tccaggaact acgaggccca ggagaacgcg 4320 atcctcccaa agaacgcgga cgccaacggc gcctacaaca tcgccaggaa ggtcctctgg 4380 gctatcggcc agttcaagaa ggcggaggac gagaagctgg acaaggtgaa gatcgccatc 4440 agcaacaagg agtggctcga gtacgcccag acctcggtca agcacggcag cccgaagaag 4500 aagcgcaagg tgtccggcgg cagcacgaac ctgtccgaca tcatcgagaa ggagaccggc 4560 aagcagctcg tgatccagga gagcatcctc atgctgccgg aggaggtcga ggaggtcatc 4620 ggcaacaagc ccgagtccga catcctcgtc cacacggcct acgacgagtc caccgacgag 4680 aacgtgatgc tcctgacctc ggacgctccc gagtacaagc catgggccct ggtcatccag 4740 gacagcaacg gcgagaacaa gatcaagatg ctctccggcg gcagcccgaa gaagaagcgc 4800 aaagtgtga 4809 <210> 24 <211> 1602 <212> PRT <213> Artificial Sequence <220> <223> Fusion Protein <400> 24 Met Pro Lys Lys Lys Arg Lys Val Met Ser Ser Glu Thr Gly Pro Val 1 5 10 15 Ala Val Asp Pro Thr Leu Arg Arg Arg Ile Glu Pro His Glu Phe Glu 20 25 30 Val Phe Phe Asp Pro Arg Glu Leu Arg Lys Glu Thr Cys Leu Leu Tyr 35 40 45 Glu Ile Asn Trp Gly Gly Arg His Ser Ile Trp Arg His Thr Ser Gln 50 55 60 Asn Thr Asn Lys His Val Glu Val Asn Phe Ile Glu Lys Phe Thr Thr 65 70 75 80 Glu Arg Tyr Phe Cys Pro Asn Thr Arg Cys Ser Ile Thr Trp Phe Leu 85 90 95 Ser Trp Ser Pro Cys Gly Glu Cys Ser Arg Ala Ile Thr Glu Phe Leu 100 105 110 Ser Arg Tyr Pro His Val Thr Leu Phe Ile Tyr Ile Ala Arg Leu Tyr 115 120 125 His His Ala Asp Pro Arg Asn Arg Gln Gly Leu Arg Asp Leu Ile Ser 130 135 140 Ser Gly Val Thr Ile Gln Ile Met Thr Glu Gln Glu Ser Gly Tyr Cys 145 150 155 160 Trp Arg Asn Phe Val Asn Tyr Ser Pro Ser Asn Glu Ala His Trp Pro 165 170 175 Arg Tyr Pro His Leu Trp Val Arg Leu Tyr Val Leu Glu Leu Tyr Cys 180 185 190 Ile Ile Leu Gly Leu Pro Pro Cys Leu Asn Ile Leu Arg Arg Lys Gln 195 200 205 Pro Gln Leu Thr Phe Phe Thr Ile Ala Leu Gln Ser Cys His Tyr Gln 210 215 220 Arg Leu Pro Pro His Ile Leu Trp Ala Thr Gly Leu Lys Gly Gly Gly 225 230 235 240 Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly 245 250 255 Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Met Ser Lys Leu Glu 260 265 270 Lys Phe Thr Asn Cys Tyr Ser Leu Ser Lys Thr Leu Arg Phe Lys Ala 275 280 285 Ile Pro Val Gly Lys Thr Gln Glu Asn Ile Asp Asn Lys Arg Leu Leu 290 295 300 Val Glu Asp Glu Lys Arg Ala Glu Asp Tyr Lys Gly Val Lys Lys Leu 305 310 315 320 Leu Asp Arg Tyr Tyr Leu Ser Phe Ile Asn Asp Val Leu His Ser Ile 325 330 335 Lys Leu Lys Asn Leu Asn Asn Tyr Ile Ser Leu Phe Arg Lys Lys Thr 340 345 350 Arg Thr Glu Lys Glu Asn Lys Glu Leu Glu Asn Leu Glu Ile Asn Leu 355 360 365 Arg Lys Glu Ile Ala Lys Ala Phe Lys Gly Asn Glu Gly Tyr Lys Ser 370 375 380 Leu Phe Lys Lys Asp Ile Ile Glu Thr Ile Leu Pro Glu Phe Leu Asp 385 390 395 400 Asp Lys Asp Glu Ile Ala Leu Val Asn Ser Phe Asn Gly Phe Thr Thr 405 410 415 Ala Phe Thr Gly Phe Phe Asp Asn Arg Glu Asn Met Phe Ser Glu Glu 420 425 430 Ala Lys Ser Thr Ser Ile Ala Phe Arg Cys Ile Asn Glu Asn Leu Thr 435 440 445 Arg Tyr Ile Ser Asn Met Asp Ile Phe Glu Lys Val Asp Ala Ile Phe 450 455 460 Asp Lys His Glu Val Gln Glu Ile Lys Glu Lys Ile Leu Asn Ser Asp 465 470 475 480 Tyr Asp Val Glu Asp Phe Phe Glu Gly Glu Phe Phe Asn Phe Val Leu 485 490 495 Thr Gln Glu Gly Ile Asp Val Tyr Asn Ala Ile Ile Gly Gly Phe Val 500 505 510 Thr Glu Ser Gly Glu Lys Ile Lys Gly Leu Asn Glu Tyr Ile Asn Leu 515 520 525 Tyr Asn Gln Lys Thr Lys Gln Lys Leu Pro Lys Phe Lys Pro Leu Tyr 530 535 540 Lys Gln Val Leu Ser Asp Arg Glu Ser Leu Ser Phe Tyr Gly Glu Gly 545 550 555 560 Tyr Thr Ser Asp Glu Glu Val Leu Glu Val Phe Arg Asn Thr Leu Asn 565 570 575 Lys Asn Ser Glu Ile Phe Ser Ser Ile Lys Lys Leu Glu Lys Leu Phe 580 585 590 Lys Asn Phe Asp Glu Tyr Ser Ser Ala Gly Ile Phe Val Lys Asn Gly 595 600 605 Pro Ala Ile Ser Thr Ile Ser Lys Asp Ile Phe Gly Glu Trp Asn Val 610 615 620 Ile Arg Asp Lys Trp Asn Ala Glu Tyr Asp Asp Ile His Leu Lys Lys 625 630 635 640 Lys Ala Val Val Thr Glu Lys Tyr Glu Asp Asp Arg Arg Lys Ser Phe 645 650 655 Lys Lys Ile Gly Ser Phe Ser Leu Glu Gln Leu Gln Glu Tyr Ala Asp 660 665 670 Ala Asp Leu Ser Val Val Glu Lys Leu Lys Glu Ile Ile Ile Gln Lys 675 680 685 Val Asp Glu Ile Tyr Lys Val Tyr Gly Ser Ser Glu Lys Leu Phe Asp 690 695 700 Ala Asp Phe Val Leu Glu Lys Ser Leu Lys Lys Asn Asp Ala Val Val 705 710 715 720 Ala Ile Met Lys Asp Leu Leu Asp Ser Val Lys Ser Phe Glu Asn Tyr 725 730 735 Ile Lys Ala Phe Phe Gly Glu Gly Lys Glu Thr Asn Arg Asp Glu Ser 740 745 750 Phe Tyr Gly Asp Phe Val Leu Ala Tyr Asp Ile Leu Leu Lys Val Asp 755 760 765 His Ile Tyr Asp Ala Ile Arg Asn Tyr Val Thr Gln Lys Pro Tyr Ser 770 775 780 Lys Asp Lys Phe Lys Leu Tyr Phe Gln Asn Pro Gln Phe Met Gly Gly 785 790 795 800 Trp Asp Lys Asp Lys Glu Thr Asp Tyr Arg Ala Thr Ile Leu Arg Tyr 805 810 815 Gly Ser Lys Tyr Tyr Leu Ala Ile Met Asp Lys Lys Tyr Ala Lys Cys 820 825 830 Leu Gln Lys Ile Asp Lys Asp Asp Val Asn Gly Asn Tyr Glu Lys Ile 835 840 845 Asn Tyr Lys Leu Leu Pro Gly Pro Asn Lys Met Leu Pro Lys Val Phe 850 855 860 Phe Ser Lys Lys Trp Met Ala Tyr Tyr Asn Pro Ser Glu Asp Ile Gln 865 870 875 880 Lys Ile Tyr Lys Asn Gly Thr Phe Lys Lys Gly Asp Met Phe Asn Leu 885 890 895 Asn Asp Cys His Lys Leu Ile Asp Phe Phe Lys Asp Ser Ile Ser Arg 900 905 910 Tyr Pro Lys Trp Ser Asn Ala Tyr Asp Phe Asn Phe Ser Glu Thr Glu 915 920 925 Lys Tyr Lys Asp Ile Ala Gly Phe Tyr Arg Glu Val Glu Glu Gln Gly 930 935 940 Tyr Lys Val Ser Phe Glu Ser Ala Ser Lys Lys Glu Val Asp Lys Leu 945 950 955 960 Val Glu Glu Gly Lys Leu Tyr Met Phe Gln Ile Tyr Asn Lys Asp Phe 965 970 975 Ser Asp Lys Ser His Gly Thr Pro Asn Leu His Thr Met Tyr Phe Lys 980 985 990 Leu Leu Phe Asp Glu Asn Asn His Gly Gln Ile Arg Leu Ser Gly Gly 995 1000 1005 Ala Glu Leu Phe Met Arg Arg Ala Ser Leu Lys Lys Glu Glu Leu 1010 1015 1020 Val Val His Pro Ala Asn Ser Pro Ile Ala Asn Lys Asn Pro Asp 1025 1030 1035 Asn Pro Lys Lys Thr Thr Thr Leu Ser Tyr Asp Val Tyr Lys Asp 1040 1045 1050 Lys Arg Phe Ser Glu Asp Gln Tyr Glu Leu His Ile Pro Ile Ala 1055 1060 1065 Ile Asn Lys Cys Pro Lys Asn Ile Phe Lys Ile Asn Thr Glu Val 1070 1075 1080 Arg Val Leu Leu Lys His Asp Asp Asn Pro Tyr Val Ile Gly Ile 1085 1090 1095 Ala Arg Gly Glu Arg Asn Leu Leu Tyr Ile Val Val Val Asp Gly 1100 1105 1110 Lys Gly Asn Ile Val Glu Gln Tyr Ser Leu Asn Glu Ile Ile Asn 1115 1120 1125 Asn Phe Asn Gly Ile Arg Ile Lys Thr Asp Tyr His Ser Leu Leu 1130 1135 1140 Asp Lys Lys Glu Lys Glu Arg Phe Glu Ala Arg Gln Asn Trp Thr 1145 1150 1155 Ser Ile Glu Asn Ile Lys Glu Leu Lys Ala Gly Tyr Ile Ser Gln 1160 1165 1170 Val Val His Lys Ile Cys Glu Leu Val Glu Lys Tyr Asp Ala Val 1175 1180 1185 Ile Ala Leu Ala Asp Leu Asn Ser Gly Phe Lys Asn Ser Arg Val 1190 1195 1200 Lys Val Glu Lys Gln Val Tyr Gln Lys Phe Glu Lys Met Leu Ile 1205 1210 1215 Asp Lys Leu Asn Tyr Met Val Asp Lys Lys Ser Asn Pro Cys Ala 1220 1225 1230 Thr Gly Gly Ala Leu Lys Gly Tyr Gln Ile Thr Asn Lys Phe Glu 1235 1240 1245 Ser Phe Lys Ser Met Ser Thr Gln Asn Gly Phe Ile Phe Tyr Ile 1250 1255 1260 Pro Ala Trp Leu Thr Ser Lys Ile Asp Pro Ser Thr Gly Phe Val 1265 1270 1275 Asn Leu Leu Lys Thr Lys Tyr Thr Ser Ile Ala Asp Ser Lys Lys 1280 1285 1290 Phe Ile Ser Ser Phe Asp Arg Ile Met Tyr Val Pro Glu Glu Asp 1295 1300 1305 Leu Phe Glu Phe Ala Leu Asp Tyr Lys Asn Phe Ser Arg Thr Asp 1310 1315 1320 Ala Asp Tyr Ile Lys Lys Trp Lys Leu Tyr Ser Tyr Gly Asn Arg 1325 1330 1335 Ile Arg Ile Phe Arg Asn Pro Lys Lys Asn Asn Val Phe Asp Trp 1340 1345 1350 Glu Glu Val Cys Leu Thr Ser Ala Tyr Lys Glu Leu Phe Asn Lys 1355 1360 1365 Tyr Gly Ile Asn Tyr Gln Gln Gly Asp Ile Arg Ala Leu Leu Cys 1370 1375 1380 Glu Gln Ser Asp Lys Ala Phe Tyr Ser Ser Phe Met Ala Leu Met 1385 1390 1395 Ser Leu Met Leu Gln Met Arg Asn Ser Ile Thr Gly Arg Thr Asp 1400 1405 1410 Val Ala Phe Leu Ile Ser Pro Val Lys Asn Ser Asp Gly Ile Phe 1415 1420 1425 Tyr Asp Ser Arg Asn Tyr Glu Ala Gln Glu Asn Ala Ile Leu Pro 1430 1435 1440 Lys Asn Ala Asp Ala Asn Gly Ala Tyr Asn Ile Ala Arg Lys Val 1445 1450 1455 Leu Trp Ala Ile Gly Gln Phe Lys Lys Ala Glu Asp Glu Lys Leu 1460 1465 1470 Asp Lys Val Lys Ile Ala Ile Ser Asn Lys Glu Trp Leu Glu Tyr 1475 1480 1485 Ala Gln Thr Ser Val Lys His Gly Ser Pro Lys Lys Lys Arg Lys 1490 1495 1500 Val Ser Gly Gly Ser Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu 1505 1510 1515 Thr Gly Lys Gln Leu Val Ile Gln Glu Ser Ile Leu Met Leu Pro 1520 1525 1530 Glu Glu Val Glu Glu Val Ile Gly Asn Lys Pro Glu Ser Asp Ile 1535 1540 1545 Leu Val His Thr Ala Tyr Asp Glu Ser Thr Asp Glu Asn Val Met 1550 1555 1560 Leu Leu Thr Ser Asp Ala Pro Glu Tyr Lys Pro Trp Ala Leu Val 1565 1570 1575 Ile Gln Asp Ser Asn Gly Glu Asn Lys Ile Lys Met Leu Ser Gly 1580 1585 1590 Gly Ser Pro Lys Lys Lys Arg Lys Val 1595 1600 <210> 25 <211> 1802 <212> DNA <213> Saccharum officinarum <400> 25 gaattcatta tgtggtctag gtaggttcta tatataagaa aacttgaaat gttctaaaaa 60 aaaattcaag cccatgcatg attgaagcaa acggtatagc aacggtgtta acctgatcta 120 gtgatctctt gcaatcctta acggccacct accgcaggta gcaaacggcg tccccctcct 180 cgatatctcc gcggcgacct ctggcttttt ccgcggaatt gcgcggtggg gacggattcc 240 acgagaccgc gacgcaaccg cctctcgccg ctgggcccca caccgctcgg tgccgtagcc 300 tcacgggact ctttctccct cctcccccgt tataaattgg cttcatcccc tccttgcctc 360 atccatccaa atcccagtcc ccaatcccat cccttcgtag gagaaattca tcgaagctaa 420 gcgaatcctc gcgatcctct caaggtactg cgagttttcg atccccctct cgacccctcg 480 tatgtttgtg tttgtcgtag cgtttgatta ggtatgcttt ccctgtttgt gttcgtcgta 540 gcgtttgatt aggtatgctt tccctgttcg tgttcatcgt agtgtttgat taggtcgtgt 600 gaggcgatgg cctgctcgcg tccttcgatc tgtagtcgat ttgcgggtcg tggtgtagat 660 ctgcgggctg tgatgaagtt atttggtgtg atctgctcgc ctgattctgc gggttggctc 720 gagtagatat gatggttgga ccggttggtt cgtttaccgc gctagggttg ggctgggatg 780 atgttgcatg cgccgttgcg cgtgatcccg cagcaggact tgcgtttgat tgccagatct 840 cgttacgatt atgtgatttg gtttggactt tttagatctg tagcttctgc ttatgtgcca 900 gatgcgccta ctgctcatat gcctgatgat aatcataaat ggctgtggaa ctaactagtt 960 gattgcggag tcatgtatca gctacaggtg tagggactag ctacaggtgt agggacttgc 1020 gtctaattgt ttggtccttt actcatgttg caattatgca atttagttta gattgtttgt 1080 tccactcatc taggctgtaa aagggacact gcttagattg ctgtttaatc tttttagtag 1140 attatattat attggtaact tattacccct attacatgcc atacgtgact tctgctcatg 1200 cctgatgata atcatagatc actgtggaat taattagttg attgttgaat catgtttcat 1260 gtacatacca cggcacaatt gcttagttcc ttaacaaatg caaattttac tgatccatgt 1320 atgatttgcg tggttctcta atgtgaaata ctatagctac ttgttagtaa gaatcaggtt 1380 cgtatgctta atgctgtatg tgccttctgc tcatgcctga tgataatcat atatcactgg 1440 aattaattag ttgatcgttt aatcatatat caagtacata ccatgccaca atttttagtc 1500 acttaaccca tgcagattga actggtccct gcatgttttg ctaaattgtt ctattctgat 1560 tagaccatat atcatgtatt tttttttggt aatggttctc ttattttaaa tgctatatag 1620 ttctggtact tgttagaaag atctgcttca tagtttagtt gcctatccct cgaattagga 1680 tgctgagcag ctgatcctat agctttgttt catgtatcaa ttcttttgtg ttcaacagtc 1740 agtttttgtt agattcattg taacttatgg tcgcttactc ttctggtcct caatgcttgc 1800 ag 1802 <210> 26 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 26 gggaaagacc gaggagaaga tct 23 <210> 27 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 27 aagaccgagg agaagatcta 20 <210> 28 <211> 90 <212> DNA <213> Zea mays <400> 28 gtttggggaa agaccgagga gaagatctac gggcctgtcg ctggaacgga ctacagggac 60 aaccagctgc ggttcagcct gctatgccag 90 <210> 29 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 29 agatgggaga cgggtacgag acgg 24 <210> 30 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 30 gtatgggttg ttgttgaggc tcagg 25 <210> 31 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 31 gaccacccac tgttcctgga gaggg 25 <210> 32 <211> 3783 <212> DNA <213> Artificial Sequence <220> <223> Synethic <400> 32 atggctccta agaagaagcg gaaggttggt attcacgggg tgcctgcggc ttcaaagctc 60 gagaaattca ccaactgtta ttcgttgagc aaaacactgc ggtttaaagc gattccagtc 120 ggcaagactc aagagaatat agacaataag cggctgttgg tggaagatga aaagcgcgcg 180 gaagactaca aaggggtgaa gaagttgttg gacagatact acctctcttt tatcaatgat 240 gtcttgcact caatcaaatt gaagaatctg aacaactaca tctccctctt cagaaagaaa 300 acaaggacag aaaaggagaa taaggaactt gaaaatttgg agatcaatct gaggaaagag 360 atcgcgaaag cctttaaagg caacgaagga tacaaaagtc tgttcaagaa ggatataatt 420 gagacaattt tgccagagtt cctcgatgac aaggacgaga ttgcgctggt caattcgttc 480 aacggattca caacagcatt cacaggcttc tttgataatc gggaaaatat gttctctgag 540 gaggcaaagt ccacttctat tgcgttcagg tgtatcaatg agaatctcac taggtacatt 600 tccaacatgg atatctttga gaaggttgac gcaatttttg acaagcacga agttcaggag 660 attaaggaga agatcctcaa ttccgattat gacgttgagg acttcttcga gggtgagttt 720 tttaatttcg tgctcactca agagggtatc gacgtgtata atgcgatcat cggtgggttc 780 gtgactgagt ccggtgaaaa gattaaggga ttgaacgagt atatcaacct ttacaaccaa 840 aagacgaaac agaagctgcc aaagttcaag cctctttaca aacaggttct ttcagaccgc 900 gagtcactct cgttctatgg ggagggctac acttcggatg aggaagtcct ggaggtgttc 960 aggaatactc tcaataagaa ttcggagatt ttctcttcta taaaaaaact ggaaaagttg 1020 tttaagaatt ttgacgaata ctctagcgcc ggcatatttg tgaaaaacgg cccggccata 1080 tcaacgataa gtaaagatat cttcggcgaa tggaacgtga tcagagacaa atggaacgcg 1140 gagtatgacg atattcacct gaagaagaag gctgtcgtaa cggagaagta cgaggatgat 1200 cgcaggaaaa gcttcaaaaa gatcggaagt ttcagcctgg aacagttgca ggagtatgct 1260 gacgccgatc ttagcgtcgt cgagaagttg aaggagataa tcatccaaaa ggtcgacgag 1320 atatataaag tctatggatc aagtgaaaaa ctgttcgacg ccgacttcgt tttggagaag 1380 tccctgaaga agaacgacgc tgttgttgcc attatgaagg atctgctcga cagcgtgaag 1440 agtttcgaga actatattaa ggcttttttc ggggagggga aggagactaa cagagatgag 1500 tccttctacg gagacttcgt cctcgcgtac gatatactcc ttaaggtaga ccacatctac 1560 gacgcaatca gaaattacgt gacacaaaag ccgtacagca aggacaagtt caaactctac 1620 ttccagaacc cccagttcat gggcggctgg gacaaggaca aggaaacgga ttacagggct 1680 acgatcctga ggtatggttc aaaatactac ttggcgatta tggacaagaa gtacgccaag 1740 tgtctccaga agattgacaa agacgatgtc aatggcaatt atgagaagat caactacaag 1800 ctgcttccgg gtccgaacaa gatgctccca aaggttttct tcagcaagaa atggatggcc 1860 tactataacc caagcgagga catccagaag atttataaga acggtacgtt caagaagggc 1920 gacatgttca atcttaacga ctgtcacaag ctgatcgact tcttcaaaga ctcaattagc 1980 cggtacccaa agtggtctaa cgcctatgac ttcaactttt cggaaaccga gaagtacaag 2040 gatatagccg gattttatag agaggtggaa gagcagggct acaaggtgtc attcgagtcc 2100 gccagcaaga aggaagtgga caagctcgtg gaagagggta agctctacat gttccagatt 2160 tataataaag actttagcga taagagccac gggacaccta atctccacac aatgtatttc 2220 aagctgctct tcgacgagaa taaccacggc caaatcaggt tgtcaggagg ggctgaactc 2280 ttcatgcggc gcgctagcct taagaaggag gagcttgtag tccaccctgc gaatagtcca 2340 attgcgaata agaacccgga caatcctaaa aagactacaa cattgagcta cgacgtgtac 2400 aaggataaga ggttttccga ggatcagtac gagctccaca tcccgattgc gatcaacaag 2460 tgcccaaaga atattttcaa gataaacaca gaggtgcgtg tactcctgaa gcatgacgac 2520 aatccttacg tcattgggat tgatcggggc gagaggaacc tcctctatat tgtggtggtg 2580 gacgggaagg ggaacatagt cgaacagtac tcccttaacg aaataattaa caatttcaac 2640 ggcatccgta tcaagaccga ctaccattcg ttgctggaca agaaggagaa ggagagattt 2700 gaggcgcggc aaaattggac aagtatcgag aacatcaagg aactcaaagc aggttatatc 2760 tctcaagttg tgcataagat atgcgagctg gttgagaagt atgacgcagt gatcgctctt 2820 gaggacctca actcgggctt taagaattct agagttaaag tggagaagca ggtctatcaa 2880 aagttcgaga agatgcttat agataagctc aactacatgg tcgataagaa atcgaaccca 2940 tgtgccaccg gcggcgcact caaaggttac caaataacaa acaaattcga gtccttcaaa 3000 tcgatgagta ctcagaatgg gttcatattt tatataccgg cgtggcttac gtctaagatc 3060 gacccgtcaa ctggttttgt caacctgttg aagacgaaat acacgtccat tgccgattca 3120 aaaaagttca tatctagttt tgatcgtatt atgtacgtcc cagaggaaga tcttttcgag 3180 tttgctctcg actacaaaaa cttttcgcgc accgatgcgg attacattaa aaaatggaaa 3240 ctctattcgt acggcaacag aatcaggatt tttcgcaacc ctaagaagaa taacgtcttt 3300 gattgggagg aagtttgctt gactagcgcg tacaaggagc tctttaataa gtatggcatt 3360 aactaccaac agggtgatat cagagcactg ctttgcgaac aatctgacaa ggctttctac 3420 tcatccttca tggctttgat gagcctgatg ctccagatga gaaattcaat tacaggcaga 3480 accgacgtgg atttcttgat ctccccggtt aaaaattctg atggcatctt ttacgatagc 3540 aggaactatg aagcgcaaga gaatgcgatt ctgccaaaaa atgcagacgc caacggtgcc 3600 tataacatcg ccaggaaagt cctgtgggcg atcggccagt tcaaaaaggc cgaagacgaa 3660 aaattggaca aggtcaaaat cgctatcagc aacaaagagt ggctggagta tgctcagaca 3720 tccgtaaagc ataagcgtcc tgctgccacc aaaaaggccg gacaggctaa gaaaaagaag 3780 tga 3783 <210> 33 <211> 1260 <212> PRT <213> Artificial Sequence <220> <223> Fusion protein <400> 33 Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala 1 5 10 15 Ala Ser Lys Leu Glu Lys Phe Thr Asn Cys Tyr Ser Leu Ser Lys Thr 20 25 30 Leu Arg Phe Lys Ala Ile Pro Val Gly Lys Thr Gln Glu Asn Ile Asp 35 40 45 Asn Lys Arg Leu Leu Val Glu Asp Glu Lys Arg Ala Glu Asp Tyr Lys 50 55 60 Gly Val Lys Lys Leu Leu Asp Arg Tyr Tyr Leu Ser Phe Ile Asn Asp 65 70 75 80 Val Leu His Ser Ile Lys Leu Lys Asn Leu Asn Asn Tyr Ile Ser Leu 85 90 95 Phe Arg Lys Lys Thr Arg Thr Glu Lys Glu Asn Lys Glu Leu Glu Asn 100 105 110 Leu Glu Ile Asn Leu Arg Lys Glu Ile Ala Lys Ala Phe Lys Gly Asn 115 120 125 Glu Gly Tyr Lys Ser Leu Phe Lys Lys Asp Ile Ile Glu Thr Ile Leu 130 135 140 Pro Glu Phe Leu Asp Asp Lys Asp Glu Ile Ala Leu Val Asn Ser Phe 145 150 155 160 Asn Gly Phe Thr Thr Ala Phe Thr Gly Phe Phe Asp Asn Arg Glu Asn 165 170 175 Met Phe Ser Glu Glu Ala Lys Ser Thr Ser Ile Ala Phe Arg Cys Ile 180 185 190 Asn Glu Asn Leu Thr Arg Tyr Ile Ser Asn Met Asp Ile Phe Glu Lys 195 200 205 Val Asp Ala Ile Phe Asp Lys His Glu Val Gln Glu Ile Lys Glu Lys 210 215 220 Ile Leu Asn Ser Asp Tyr Asp Val Glu Asp Phe Phe Glu Gly Glu Phe 225 230 235 240 Phe Asn Phe Val Leu Thr Gln Glu Gly Ile Asp Val Tyr Asn Ala Ile 245 250 255 Ile Gly Gly Phe Val Thr Glu Ser Gly Glu Lys Ile Lys Gly Leu Asn 260 265 270 Glu Tyr Ile Asn Leu Tyr Asn Gln Lys Thr Lys Gln Lys Leu Pro Lys 275 280 285 Phe Lys Pro Leu Tyr Lys Gln Val Leu Ser Asp Arg Glu Ser Leu Ser 290 295 300 Phe Tyr Gly Glu Gly Tyr Thr Ser Asp Glu Glu Val Leu Glu Val Phe 305 310 315 320 Arg Asn Thr Leu Asn Lys Asn Ser Glu Ile Phe Ser Ser Ile Lys Lys 325 330 335 Leu Glu Lys Leu Phe Lys Asn Phe Asp Glu Tyr Ser Ser Ala Gly Ile 340 345 350 Phe Val Lys Asn Gly Pro Ala Ile Ser Thr Ile Ser Lys Asp Ile Phe 355 360 365 Gly Glu Trp Asn Val Ile Arg Asp Lys Trp Asn Ala Glu Tyr Asp Asp 370 375 380 Ile His Leu Lys Lys Lys Ala Val Val Thr Glu Lys Tyr Glu Asp Asp 385 390 395 400 Arg Arg Lys Ser Phe Lys Lys Ile Gly Ser Phe Ser Leu Glu Gln Leu 405 410 415 Gln Glu Tyr Ala Asp Ala Asp Leu Ser Val Val Glu Lys Leu Lys Glu 420 425 430 Ile Ile Ile Gln Lys Val Asp Glu Ile Tyr Lys Val Tyr Gly Ser Ser 435 440 445 Glu Lys Leu Phe Asp Ala Asp Phe Val Leu Glu Lys Ser Leu Lys Lys 450 455 460 Asn Asp Ala Val Val Ala Ile Met Lys Asp Leu Leu Asp Ser Val Lys 465 470 475 480 Ser Phe Glu Asn Tyr Ile Lys Ala Phe Phe Gly Glu Gly Lys Glu Thr 485 490 495 Asn Arg Asp Glu Ser Phe Tyr Gly Asp Phe Val Leu Ala Tyr Asp Ile 500 505 510 Leu Leu Lys Val Asp His Ile Tyr Asp Ala Ile Arg Asn Tyr Val Thr 515 520 525 Gln Lys Pro Tyr Ser Lys Asp Lys Phe Lys Leu Tyr Phe Gln Asn Pro 530 535 540 Gln Phe Met Gly Gly Trp Asp Lys Asp Lys Glu Thr Asp Tyr Arg Ala 545 550 555 560 Thr Ile Leu Arg Tyr Gly Ser Lys Tyr Tyr Leu Ala Ile Met Asp Lys 565 570 575 Lys Tyr Ala Lys Cys Leu Gln Lys Ile Asp Lys Asp Asp Val Asn Gly 580 585 590 Asn Tyr Glu Lys Ile Asn Tyr Lys Leu Leu Pro Gly Pro Asn Lys Met 595 600 605 Leu Pro Lys Val Phe Phe Ser Lys Lys Trp Met Ala Tyr Tyr Asn Pro 610 615 620 Ser Glu Asp Ile Gln Lys Ile Tyr Lys Asn Gly Thr Phe Lys Lys Gly 625 630 635 640 Asp Met Phe Asn Leu Asn Asp Cys His Lys Leu Ile Asp Phe Phe Lys 645 650 655 Asp Ser Ile Ser Arg Tyr Pro Lys Trp Ser Asn Ala Tyr Asp Phe Asn 660 665 670 Phe Ser Glu Thr Glu Lys Tyr Lys Asp Ile Ala Gly Phe Tyr Arg Glu 675 680 685 Val Glu Glu Gln Gly Tyr Lys Val Ser Phe Glu Ser Ala Ser Lys Lys 690 695 700 Glu Val Asp Lys Leu Val Glu Glu Gly Lys Leu Tyr Met Phe Gln Ile 705 710 715 720 Tyr Asn Lys Asp Phe Ser Asp Lys Ser His Gly Thr Pro Asn Leu His 725 730 735 Thr Met Tyr Phe Lys Leu Leu Phe Asp Glu Asn Asn His Gly Gln Ile 740 745 750 Arg Leu Ser Gly Gly Ala Glu Leu Phe Met Arg Arg Ala Ser Leu Lys 755 760 765 Lys Glu Glu Leu Val Val His Pro Ala Asn Ser Pro Ile Ala Asn Lys 770 775 780 Asn Pro Asp Asn Pro Lys Lys Thr Thr Thr Leu Ser Tyr Asp Val Tyr 785 790 795 800 Lys Asp Lys Arg Phe Ser Glu Asp Gln Tyr Glu Leu His Ile Pro Ile 805 810 815 Ala Ile Asn Lys Cys Pro Lys Asn Ile Phe Lys Ile Asn Thr Glu Val 820 825 830 Arg Val Leu Leu Lys His Asp Asp Asn Pro Tyr Val Ile Gly Ile Asp 835 840 845 Arg Gly Glu Arg Asn Leu Leu Tyr Ile Val Val Val Asp Gly Lys Gly 850 855 860 Asn Ile Val Glu Gln Tyr Ser Leu Asn Glu Ile Ile Asn Asn Phe Asn 865 870 875 880 Gly Ile Arg Ile Lys Thr Asp Tyr His Ser Leu Leu Asp Lys Lys Glu 885 890 895 Lys Glu Arg Phe Glu Ala Arg Gln Asn Trp Thr Ser Ile Glu Asn Ile 900 905 910 Lys Glu Leu Lys Ala Gly Tyr Ile Ser Gln Val Val His Lys Ile Cys 915 920 925 Glu Leu Val Glu Lys Tyr Asp Ala Val Ile Ala Leu Glu Asp Leu Asn 930 935 940 Ser Gly Phe Lys Asn Ser Arg Val Lys Val Glu Lys Gln Val Tyr Gln 945 950 955 960 Lys Phe Glu Lys Met Leu Ile Asp Lys Leu Asn Tyr Met Val Asp Lys 965 970 975 Lys Ser Asn Pro Cys Ala Thr Gly Gly Ala Leu Lys Gly Tyr Gln Ile 980 985 990 Thr Asn Lys Phe Glu Ser Phe Lys Ser Met Ser Thr Gln Asn Gly Phe 995 1000 1005 Ile Phe Tyr Ile Pro Ala Trp Leu Thr Ser Lys Ile Asp Pro Ser 1010 1015 1020 Thr Gly Phe Val Asn Leu Leu Lys Thr Lys Tyr Thr Ser Ile Ala 1025 1030 1035 Asp Ser Lys Lys Phe Ile Ser Ser Phe Asp Arg Ile Met Tyr Val 1040 1045 1050 Pro Glu Glu Asp Leu Phe Glu Phe Ala Leu Asp Tyr Lys Asn Phe 1055 1060 1065 Ser Arg Thr Asp Ala Asp Tyr Ile Lys Lys Trp Lys Leu Tyr Ser 1070 1075 1080 Tyr Gly Asn Arg Ile Arg Ile Phe Arg Asn Pro Lys Lys Asn Asn 1085 1090 1095 Val Phe Asp Trp Glu Glu Val Cys Leu Thr Ser Ala Tyr Lys Glu 1100 1105 1110 Leu Phe Asn Lys Tyr Gly Ile Asn Tyr Gln Gln Gly Asp Ile Arg 1115 1120 1125 Ala Leu Leu Cys Glu Gln Ser Asp Lys Ala Phe Tyr Ser Ser Phe 1130 1135 1140 Met Ala Leu Met Ser Leu Met Leu Gln Met Arg Asn Ser Ile Thr 1145 1150 1155 Gly Arg Thr Asp Val Asp Phe Leu Ile Ser Pro Val Lys Asn Ser 1160 1165 1170 Asp Gly Ile Phe Tyr Asp Ser Arg Asn Tyr Glu Ala Gln Glu Asn 1175 1180 1185 Ala Ile Leu Pro Lys Asn Ala Asp Ala Asn Gly Ala Tyr Asn Ile 1190 1195 1200 Ala Arg Lys Val Leu Trp Ala Ile Gly Gln Phe Lys Lys Ala Glu 1205 1210 1215 Asp Glu Lys Leu Asp Lys Val Lys Ile Ala Ile Ser Asn Lys Glu 1220 1225 1230 Trp Leu Glu Tyr Ala Gln Thr Ser Val Lys His Lys Arg Pro Ala 1235 1240 1245 Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys 1250 1255 1260 <210> 34 <211> 3873 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 34 atgccgaaga agaagcgcaa ggtcgggggc gggggctcag gcgggggcgg gagcggcggc 60 gggggctctg ggggcggcgg cagcggcggg ggcggcagcg ggggcggcgg gtcgatgagc 120 aagctggaga agttcacgaa ctgctactcc ctcagcaaga ccctgaggtt caaggcgatc 180 ccggtcggca agacccagga gaacatcgac aacaagcggc tgctggtgga ggacgagaag 240 agggctgagg actacaaggg cgtgaagaag ctcctggacc gctactacct gtccttcatc 300 aacgacgtgc tccacagcat caagctcaag aacctgaaca actacatcag cctcttcagg 360 aagaagacgc gcaccgagaa ggagaacaag gagctcgaga acctggagat caacctgagg 420 aaggagatcg ccaaggcgtt caagggcaac gagggctaca agtccctctt caagaaggac 480 atcatcgaga cgatcctccc ggagttcctg gacgacaagg acgagatcgc cctggtcaac 540 tccttcaacg gcttcaccac ggcgttcacc ggcttcttcg acaaccgcga gaacatgttc 600 agcgaggagg ccaagtccac gagcatcgcg ttcaggtgca tcaacgagaa cctcacccgc 660 tacatctcca acatggacat cttcgagaag gtcgacgcga tcttcgacaa gcacgaggtg 720 caggagatca aggagaagat cctgaacagc gactacgacg tcgaggactt cttcgagggc 780 gagttcttca acttcgtcct cacgcaggag ggcatcgacg tgtacaacgc catcatcggt 840 ggcttcgtga ccgagtccgg cgagaagatc aagggcctga acgagtacat caacctctac 900 aaccagaaga ccaagcagaa gctgccgaag ttcaagcccc tgtacaagca ggtgctctcc 960 gacagggagt ccctcagctt ctacggcgag ggctacacga gcgacgagga ggtcctggag 1020 gtgttccgca acaccctcaa caagaacagc gagatcttct ccagcatcaa gaagctcgag 1080 aagctgttca agaacttcga cgagtactcc agcgccggca tcttcgtcaa gaacggcccg 1140 gcgatctcca cgatcagcaa ggacatcttc ggcgagtgga acgtgatccg cgacaagtgg 1200 aacgccgagt acgacgacat ccacctcaag aagaaggcgg tggtcaccga gaagtacgag 1260 gacgacaggc gcaagtcctt caagaagatc ggctccttca gcctcgagca gctgcaggag 1320 tacgccgacg cggacctgag cgtggtcgag aagctcaagg agatcatcat ccagaaggtc 1380 gacgagatct acaaggtgta cggctccagc gagaagctct tcgacgcgga cttcgtcctc 1440 gagaagtccc tgaagaagaa cgacgccgtg gtcgcgatca tgaaggacct cctggactcc 1500 gtgaagagct tcgagaatta catcaaggcc ttcttcggcg agggcaagga gacgaacagg 1560 gacgagtcct tctacggcga cttcgtcctg gcctacgaca tcctcctgaa ggtggaccac 1620 atctacgacg cgatccgcaa ctacgtgacc cagaagccgt acagcaagga caagttcaag 1680 ctctacttcc agaaccccca gttcatgggc ggctgggaca aggacaagga gacggactac 1740 agggcgacca tcctgcgcta cggcagcaag tactacctcg ccatcatgga caagaagtac 1800 gcgaagtgcc tgcagaagat cgacaaggac gacgtcaacg gcaactacga gaagatcaac 1860 tacaagctcc tgccgggccc caacaagatg ctcccgaagg tgttcttctc caagaagtgg 1920 atggcctact acaaccccag cgaggacatc cagaagatct acaagaacgg cacgttcaag 1980 aagggcgaca tgttcaacct gaacgactgc cacaagctca tcgacttctt caaggactcc 2040 atcagccgct acccgaagtg gtccaacgcc tacgacttca acttcagcga gaccgagaag 2100 tacaaggaca tcgcgggctt ctaccgcgag gtcgaggagc agggctacaa ggtgtccttc 2160 gagtccgcca gcaagaagga ggtcgacaag ctggtggagg agggcaagct ctacatgttc 2220 cagatctaca acaaggactt ctccgacaag agccacggca cgcccaacct gcacaccatg 2280 tacttcaagc tcctgttcga cgagaacaac cacggccaga tcaggctgtc cggcggcgcc 2340 gagctcttca tgaggagggc gagcctgaag aaggaggagc tggtggtcca ccccgctaac 2400 agcccaatcg cgaacaagaa cccggacaac cccaagaaga ccacgaccct gtcctacgac 2460 gtgtacaagg acaagaggtt cagcgaggac cagtacgagc tccacatccc gatcgcgatc 2520 aacaagtgcc ccaagaacat cttcaagatc aacaccgagg tccgcgtgct cctgaagcac 2580 gacgacaacc cctacgtgat cggcatcgac aggggcgaga ggaacctcct gtacatcgtg 2640 gtcgtggacg gcaagggcaa catcgtggag cagtactccc tcaacgagat catcaacaac 2700 ttcaacggca tcaggatcaa gacggactac cacagcctcc tggacaagaa ggagaaggag 2760 aggttcgagg cccgccagaa ctggacctcc atcgagaaca tcaaggagct gaaggcgggc 2820 tacatcagcc aggtcgtgca caagatctgc gagctcgtcg agaagtacga cgccgtgatc 2880 gccctcgagg acctgaactc cggcttcaag aacagccgcg tcaaggtgga gaagcaggtc 2940 taccagaagt tcgagaagat gctcatcgac aagctgaact acatggtgga caagaagtcc 3000 aacccctgcg ctacgggcgg cgcgctgaag ggctaccaga tcaccaacaa gttcgagagc 3060 ttcaagtcca tgagcactca gaacggcttc atcttctaca tcccggcgtg gctcacgtcc 3120 aagatcgacc ccagcaccgg cttcgtcaac ctcctgaaga cgaagtacac ctccatcgcc 3180 gacagcaaga agttcatctc cagcttcgac cgcatcatgt atgtgccgga ggaggacctg 3240 ttcgagttcg ccctcgacta caagaacttc tcccgcacgg acgcggacta catcaagaag 3300 tggaagctgt acagctacgg caaccgcatc cgcatcttca ggaaccccaa gaagaacaac 3360 gtcttcgact gggaggaggt gtgcctgacc tccgcgtaca aggagctctt caacaagtac 3420 ggcatcaact accagcaggg cgacatcagg gctctcctgt gcgagcagag cgacaaggcc 3480 ttctactcca gcttcatggc gctgatgtcc ctcatgctgc agatgaggaa ctcgatcacc 3540 ggcaggacgg acgtggactt cctcatctcc ccggtgaaga acagcgacgg catcttctac 3600 gactccagga actacgaggc ccaggagaac gcgatcctcc caaagaacgc ggacgccaac 3660 ggcgcctaca acatcgccag gaaggtcctc tgggctatcg gccagttcaa gaaggcggag 3720 gacgagaagc tggacaaggt gaagatcgcc atcagcaaca aggagtggct cgagtacgcc 3780 cagacctcgg tcaagcacgg cagcccgaag aagaagcgca aggtgtccgg cggcagctcc 3840 ggcggcagcc cgaagaagaa gcgcaaagtg tga 3873 <210> 35 <211> 1290 <212> PRT <213> Artificial Sequence <220> <223> Fusion protein <400> 35 Met Pro Lys Lys Lys Arg Lys Val Gly Gly Gly Gly Ser Gly Gly Gly 1 5 10 15 Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly 20 25 30 Ser Gly Gly Gly Gly Ser Met Ser Lys Leu Glu Lys Phe Thr Asn Cys 35 40 45 Tyr Ser Leu Ser Lys Thr Leu Arg Phe Lys Ala Ile Pro Val Gly Lys 50 55 60 Thr Gln Glu Asn Ile Asp Asn Lys Arg Leu Leu Val Glu Asp Glu Lys 65 70 75 80 Arg Ala Glu Asp Tyr Lys Gly Val Lys Lys Leu Leu Asp Arg Tyr Tyr 85 90 95 Leu Ser Phe Ile Asn Asp Val Leu His Ser Ile Lys Leu Lys Asn Leu 100 105 110 Asn Asn Tyr Ile Ser Leu Phe Arg Lys Lys Thr Arg Thr Glu Lys Glu 115 120 125 Asn Lys Glu Leu Glu Asn Leu Glu Ile Asn Leu Arg Lys Glu Ile Ala 130 135 140 Lys Ala Phe Lys Gly Asn Glu Gly Tyr Lys Ser Leu Phe Lys Lys Asp 145 150 155 160 Ile Ile Glu Thr Ile Leu Pro Glu Phe Leu Asp Asp Lys Asp Glu Ile 165 170 175 Ala Leu Val Asn Ser Phe Asn Gly Phe Thr Thr Ala Phe Thr Gly Phe 180 185 190 Phe Asp Asn Arg Glu Asn Met Phe Ser Glu Glu Ala Lys Ser Thr Ser 195 200 205 Ile Ala Phe Arg Cys Ile Asn Glu Asn Leu Thr Arg Tyr Ile Ser Asn 210 215 220 Met Asp Ile Phe Glu Lys Val Asp Ala Ile Phe Asp Lys His Glu Val 225 230 235 240 Gln Glu Ile Lys Glu Lys Ile Leu Asn Ser Asp Tyr Asp Val Glu Asp 245 250 255 Phe Phe Glu Gly Glu Phe Phe Asn Phe Val Leu Thr Gln Glu Gly Ile 260 265 270 Asp Val Tyr Asn Ala Ile Ile Gly Gly Phe Val Thr Glu Ser Gly Glu 275 280 285 Lys Ile Lys Gly Leu Asn Glu Tyr Ile Asn Leu Tyr Asn Gln Lys Thr 290 295 300 Lys Gln Lys Leu Pro Lys Phe Lys Pro Leu Tyr Lys Gln Val Leu Ser 305 310 315 320 Asp Arg Glu Ser Leu Ser Phe Tyr Gly Glu Gly Tyr Thr Ser Asp Glu 325 330 335 Glu Val Leu Glu Val Phe Arg Asn Thr Leu Asn Lys Asn Ser Glu Ile 340 345 350 Phe Ser Ser Ile Lys Lys Leu Glu Lys Leu Phe Lys Asn Phe Asp Glu 355 360 365 Tyr Ser Ser Ala Gly Ile Phe Val Lys Asn Gly Pro Ala Ile Ser Thr 370 375 380 Ile Ser Lys Asp Ile Phe Gly Glu Trp Asn Val Ile Arg Asp Lys Trp 385 390 395 400 Asn Ala Glu Tyr Asp Asp Ile His Leu Lys Lys Lys Ala Val Val Thr 405 410 415 Glu Lys Tyr Glu Asp Asp Arg Arg Lys Ser Phe Lys Lys Ile Gly Ser 420 425 430 Phe Ser Leu Glu Gln Leu Gln Glu Tyr Ala Asp Ala Asp Leu Ser Val 435 440 445 Val Glu Lys Leu Lys Glu Ile Ile Ile Gln Lys Val Asp Glu Ile Tyr 450 455 460 Lys Val Tyr Gly Ser Ser Glu Lys Leu Phe Asp Ala Asp Phe Val Leu 465 470 475 480 Glu Lys Ser Leu Lys Lys Asn Asp Ala Val Val Ala Ile Met Lys Asp 485 490 495 Leu Leu Asp Ser Val Lys Ser Phe Glu Asn Tyr Ile Lys Ala Phe Phe 500 505 510 Gly Glu Gly Lys Glu Thr Asn Arg Asp Glu Ser Phe Tyr Gly Asp Phe 515 520 525 Val Leu Ala Tyr Asp Ile Leu Leu Lys Val Asp His Ile Tyr Asp Ala 530 535 540 Ile Arg Asn Tyr Val Thr Gln Lys Pro Tyr Ser Lys Asp Lys Phe Lys 545 550 555 560 Leu Tyr Phe Gln Asn Pro Gln Phe Met Gly Gly Trp Asp Lys Asp Lys 565 570 575 Glu Thr Asp Tyr Arg Ala Thr Ile Leu Arg Tyr Gly Ser Lys Tyr Tyr 580 585 590 Leu Ala Ile Met Asp Lys Lys Tyr Ala Lys Cys Leu Gln Lys Ile Asp 595 600 605 Lys Asp Asp Val Asn Gly Asn Tyr Glu Lys Ile Asn Tyr Lys Leu Leu 610 615 620 Pro Gly Pro Asn Lys Met Leu Pro Lys Val Phe Phe Ser Lys Lys Trp 625 630 635 640 Met Ala Tyr Tyr Asn Pro Ser Glu Asp Ile Gln Lys Ile Tyr Lys Asn 645 650 655 Gly Thr Phe Lys Lys Gly Asp Met Phe Asn Leu Asn Asp Cys His Lys 660 665 670 Leu Ile Asp Phe Phe Lys Asp Ser Ile Ser Arg Tyr Pro Lys Trp Ser 675 680 685 Asn Ala Tyr Asp Phe Asn Phe Ser Glu Thr Glu Lys Tyr Lys Asp Ile 690 695 700 Ala Gly Phe Tyr Arg Glu Val Glu Glu Gln Gly Tyr Lys Val Ser Phe 705 710 715 720 Glu Ser Ala Ser Lys Lys Glu Val Asp Lys Leu Val Glu Glu Gly Lys 725 730 735 Leu Tyr Met Phe Gln Ile Tyr Asn Lys Asp Phe Ser Asp Lys Ser His 740 745 750 Gly Thr Pro Asn Leu His Thr Met Tyr Phe Lys Leu Leu Phe Asp Glu 755 760 765 Asn Asn His Gly Gln Ile Arg Leu Ser Gly Gly Ala Glu Leu Phe Met 770 775 780 Arg Arg Ala Ser Leu Lys Lys Glu Glu Leu Val Val His Pro Ala Asn 785 790 795 800 Ser Pro Ile Ala Asn Lys Asn Pro Asp Asn Pro Lys Lys Thr Thr Thr 805 810 815 Leu Ser Tyr Asp Val Tyr Lys Asp Lys Arg Phe Ser Glu Asp Gln Tyr 820 825 830 Glu Leu His Ile Pro Ile Ala Ile Asn Lys Cys Pro Lys Asn Ile Phe 835 840 845 Lys Ile Asn Thr Glu Val Arg Val Leu Leu Lys His Asp Asp Asn Pro 850 855 860 Tyr Val Ile Gly Ile Asp Arg Gly Glu Arg Asn Leu Leu Tyr Ile Val 865 870 875 880 Val Val Asp Gly Lys Gly Asn Ile Val Glu Gln Tyr Ser Leu Asn Glu 885 890 895 Ile Ile Asn Asn Phe Asn Gly Ile Arg Ile Lys Thr Asp Tyr His Ser 900 905 910 Leu Leu Asp Lys Lys Glu Lys Glu Arg Phe Glu Ala Arg Gln Asn Trp 915 920 925 Thr Ser Ile Glu Asn Ile Lys Glu Leu Lys Ala Gly Tyr Ile Ser Gln 930 935 940 Val Val His Lys Ile Cys Glu Leu Val Glu Lys Tyr Asp Ala Val Ile 945 950 955 960 Ala Leu Glu Asp Leu Asn Ser Gly Phe Lys Asn Ser Arg Val Lys Val 965 970 975 Glu Lys Gln Val Tyr Gln Lys Phe Glu Lys Met Leu Ile Asp Lys Leu 980 985 990 Asn Tyr Met Val Asp Lys Lys Ser Asn Pro Cys Ala Thr Gly Gly Ala 995 1000 1005 Leu Lys Gly Tyr Gln Ile Thr Asn Lys Phe Glu Ser Phe Lys Ser 1010 1015 1020 Met Ser Thr Gln Asn Gly Phe Ile Phe Tyr Ile Pro Ala Trp Leu 1025 1030 1035 Thr Ser Lys Ile Asp Pro Ser Thr Gly Phe Val Asn Leu Leu Lys 1040 1045 1050 Thr Lys Tyr Thr Ser Ile Ala Asp Ser Lys Lys Phe Ile Ser Ser 1055 1060 1065 Phe Asp Arg Ile Met Tyr Val Pro Glu Glu Asp Leu Phe Glu Phe 1070 1075 1080 Ala Leu Asp Tyr Lys Asn Phe Ser Arg Thr Asp Ala Asp Tyr Ile 1085 1090 1095 Lys Lys Trp Lys Leu Tyr Ser Tyr Gly Asn Arg Ile Arg Ile Phe 1100 1105 1110 Arg Asn Pro Lys Lys Asn Asn Val Phe Asp Trp Glu Glu Val Cys 1115 1120 1125 Leu Thr Ser Ala Tyr Lys Glu Leu Phe Asn Lys Tyr Gly Ile Asn 1130 1135 1140 Tyr Gln Gln Gly Asp Ile Arg Ala Leu Leu Cys Glu Gln Ser Asp 1145 1150 1155 Lys Ala Phe Tyr Ser Ser Phe Met Ala Leu Met Ser Leu Met Leu 1160 1165 1170 Gln Met Arg Asn Ser Ile Thr Gly Arg Thr Asp Val Asp Phe Leu 1175 1180 1185 Ile Ser Pro Val Lys Asn Ser Asp Gly Ile Phe Tyr Asp Ser Arg 1190 1195 1200 Asn Tyr Glu Ala Gln Glu Asn Ala Ile Leu Pro Lys Asn Ala Asp 1205 1210 1215 Ala Asn Gly Ala Tyr Asn Ile Ala Arg Lys Val Leu Trp Ala Ile 1220 1225 1230 Gly Gln Phe Lys Lys Ala Glu Asp Glu Lys Leu Asp Lys Val Lys 1235 1240 1245 Ile Ala Ile Ser Asn Lys Glu Trp Leu Glu Tyr Ala Gln Thr Ser 1250 1255 1260 Val Lys His Gly Ser Pro Lys Lys Lys Arg Lys Val Ser Gly Gly 1265 1270 1275 Ser Ser Gly Gly Ser Pro Lys Lys Lys Arg Lys Val 1280 1285 1290 <210> 36 <211> 3783 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 36 atggctccta agaagaagcg gaaggttggt attcacgggg tgcctgcggc ttcaaagctc 60 gagaaattca ccaactgtta ttcgttgagc aaaacactgc ggtttaaagc gattccagtc 120 ggcaagactc aagagaatat agacaataag cggctgttgg tggaagatga aaagcgcgcg 180 gaagactaca aaggggtgaa gaagttgttg gacagatact acctctcttt tatcaatgat 240 gtcttgcact caatcaaatt gaagaatctg aacaactaca tctccctctt cagaaagaaa 300 acaaggacag aaaaggagaa taaggaactt gaaaatttgg agatcaatct gaggaaagag 360 atcgcgaaag cctttaaagg caacgaagga tacaaaagtc tgttcaagaa ggatataatt 420 gagacaattt tgccagagtt cctcgatgac aaggacgaga ttgcgctggt caattcgttc 480 aacggattca caacagcatt cacaggcttc tttgataatc gggaaaatat gttctctgag 540 gaggcaaagt ccacttctat tgcgttcagg tgtatcaatg agaatctcac taggtacatt 600 tccaacatgg atatctttga gaaggttgac gcaatttttg acaagcacga agttcaggag 660 attaaggaga agatcctcaa ttccgattat gacgttgagg acttcttcga gggtgagttt 720 tttaatttcg tgctcactca agagggtatc gacgtgtata atgcgatcat cggtgggttc 780 gtgactgagt ccggtgaaaa gattaaggga ttgaacgagt atatcaacct ttacaaccaa 840 aagacgaaac agaagctgcc aaagttcaag cctctttaca aacaggttct ttcagaccgc 900 gagtcactct cgttctatgg ggagggctac acttcggatg aggaagtcct ggaggtgttc 960 aggaatactc tcaataagaa ttcggagatt ttctcttcta taaaaaaact ggaaaagttg 1020 tttaagaatt ttgacgaata ctctagcgcc ggcatatttg tgaaaaacgg cccggccata 1080 tcaacgataa gtaaagatat cttcggcgaa tggaacgtga tcagagacaa atggaacgcg 1140 gagtatgacg atattcacct gaagaagaag gctgtcgtaa cggagaagta cgaggatgat 1200 cgcaggaaaa gcttcaaaaa gatcggaagt ttcagcctgg aacagttgca ggagtatgct 1260 gacgccgatc ttagcgtcgt cgagaagttg aaggagataa tcatccaaaa ggtcgacgag 1320 atatataaag tctatggatc aagtgaaaaa ctgttcgacg ccgacttcgt tttggagaag 1380 tccctgaaga agaacgacgc tgttgttgcc attatgaagg atctgctcga cagcgtgaag 1440 agtttcgaga actatattaa ggcttttttc ggggagggga aggagactaa cagagatgag 1500 tccttctacg gagacttcgt cctcgcgtac gatatactcc ttaaggtaga ccacatctac 1560 gacgcaatca gaaattacgt gacacaaaag ccgtacagca aggacaagtt caaactctac 1620 ttccagaacc cccagttcat gggcggctgg gacaaggaca aggaaacgga ttacagggct 1680 acgatcctga ggtatggttc aaaatactac ttggcgatta tggacaagaa gtacgccaag 1740 tgtctccaga agattgacaa agacgatgtc aatggcaatt atgagaagat caactacaag 1800 ctgcttccgg gtccgaacaa gatgctccca aaggttttct tcagcaagaa atggatggcc 1860 tactataacc caagcgagga catccagaag atttataaga acggtacgtt caagaagggc 1920 gacatgttca atcttaacga ctgtcacaag ctgatcgact tcttcaaaga ctcaattagc 1980 cggtacccaa agtggtctaa cgcctatgac ttcaactttt cggaaaccga gaagtacaag 2040 gatatagccg gattttatag agaggtggaa gagcagggct acaaggtgtc attcgagtcc 2100 gccagcaaga aggaagtgga caagctcgtg gaagagggta agctctacat gttccagatt 2160 tataataaag actttagcga taagagccac gggacaccta atctccacac aatgtatttc 2220 aagctgctct tcgacgagaa taaccacggc caaatcaggt tgtcaggagg ggctgaactc 2280 ttcatgcggc gcgctagcct taagaaggag gagcttgtag tccaccctgc gaatagtcca 2340 attgcgaata agaacccgga caatcctaaa aagactacaa cattgagcta cgacgtgtac 2400 aaggataaga ggttttccga ggatcagtac gagctccaca tcccgattgc gatcaacaag 2460 tgcccaaaga atattttcaa gataaacaca gaggtgcgtg tactcctgaa gcatgacgac 2520 aatccttacg tcattgggat tgatcggggc gagaggaacc tcctctatat tgtggtggtg 2580 gacgggaagg ggaacatagt cgaacagtac tcccttaacg aaataattaa caatttcaac 2640 ggcatccgta tcaagaccga ctaccattcg ttgctggaca agaaggagaa ggagagattt 2700 gaggcgcggc aaaattggac aagtatcgag aacatcaagg aactcaaagc aggttatatc 2760 tctcaagttg tgcataagat atgcgagctg gttgagaagt atgacgcagt gatcgctctt 2820 gaggacctca actcgggctt taagaattct agagttaaag tggagaagca ggtctatcaa 2880 aagttcgaga agatgcttat agataagctc aactacatgg tcgataagaa atcgaaccca 2940 tgtgccaccg gcggcgcact caaaggttac caaataacaa acaaattcga gtccttcaaa 3000 tcgatgagta ctcagaatgg gttcatattt tatataccgg cgtggcttac gtctaagatc 3060 gacccgtcaa ctggttttgt caacctgttg aagacgaaat acacgtccat tgccgattca 3120 aaaaagttca tatctagttt tgatcgtatt atgtacgtcc cagaggaaga tcttttcgag 3180 tttgctctcg actacaaaaa cttttcgcgc accgatgcgg attacattaa aaaatggaaa 3240 ctctattcgt acggcaacag aatcaggatt tttcgcaacc ctaagaagaa taacgtcttt 3300 gattgggagg aagtttgctt gactagcgcg tacaaggagc tctttaataa gtatggcatt 3360 aactaccaac agggtgatat cagagcactg ctttgcgaac aatctgacaa ggctttctac 3420 tcatccttca tggctttgat gagcctgatg ctccagatga gaaattcaat tacaggcaga 3480 accgacgtgg atttcttgat ctccccggtt aaaaattctg atggcatctt ttacgatagc 3540 aggaactatg aagcgcaaga gaatgcgatt ctgccaaaaa atgcagacgc caacggtgcc 3600 tataacatcg ccaggaaagt cctgtgggcg atcggccagt tcaaaaaggc cgaagacgaa 3660 aaattggaca aggtcaaaat cgctatcagc aacaaagagt ggctggagta tgctcagaca 3720 tccgtaaagc ataagcgtcc tgctgccacc aaaaaggccg gacaggctaa gaaaaagaag 3780 tga 3783 <210> 37 <211> 1260 <212> PRT <213> Artificial Sequence <220> <223> Fusion protein <400> 37 Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala 1 5 10 15 Ala Ser Lys Leu Glu Lys Phe Thr Asn Cys Tyr Ser Leu Ser Lys Thr 20 25 30 Leu Arg Phe Lys Ala Ile Pro Val Gly Lys Thr Gln Glu Asn Ile Asp 35 40 45 Asn Lys Arg Leu Leu Val Glu Asp Glu Lys Arg Ala Glu Asp Tyr Lys 50 55 60 Gly Val Lys Lys Leu Leu Asp Arg Tyr Tyr Leu Ser Phe Ile Asn Asp 65 70 75 80 Val Leu His Ser Ile Lys Leu Lys Asn Leu Asn Asn Tyr Ile Ser Leu 85 90 95 Phe Arg Lys Lys Thr Arg Thr Glu Lys Glu Asn Lys Glu Leu Glu Asn 100 105 110 Leu Glu Ile Asn Leu Arg Lys Glu Ile Ala Lys Ala Phe Lys Gly Asn 115 120 125 Glu Gly Tyr Lys Ser Leu Phe Lys Lys Asp Ile Ile Glu Thr Ile Leu 130 135 140 Pro Glu Phe Leu Asp Asp Lys Asp Glu Ile Ala Leu Val Asn Ser Phe 145 150 155 160 Asn Gly Phe Thr Thr Ala Phe Thr Gly Phe Phe Asp Asn Arg Glu Asn 165 170 175 Met Phe Ser Glu Glu Ala Lys Ser Thr Ser Ile Ala Phe Arg Cys Ile 180 185 190 Asn Glu Asn Leu Thr Arg Tyr Ile Ser Asn Met Asp Ile Phe Glu Lys 195 200 205 Val Asp Ala Ile Phe Asp Lys His Glu Val Gln Glu Ile Lys Glu Lys 210 215 220 Ile Leu Asn Ser Asp Tyr Asp Val Glu Asp Phe Phe Glu Gly Glu Phe 225 230 235 240 Phe Asn Phe Val Leu Thr Gln Glu Gly Ile Asp Val Tyr Asn Ala Ile 245 250 255 Ile Gly Gly Phe Val Thr Glu Ser Gly Glu Lys Ile Lys Gly Leu Asn 260 265 270 Glu Tyr Ile Asn Leu Tyr Asn Gln Lys Thr Lys Gln Lys Leu Pro Lys 275 280 285 Phe Lys Pro Leu Tyr Lys Gln Val Leu Ser Asp Arg Glu Ser Leu Ser 290 295 300 Phe Tyr Gly Glu Gly Tyr Thr Ser Asp Glu Glu Val Leu Glu Val Phe 305 310 315 320 Arg Asn Thr Leu Asn Lys Asn Ser Glu Ile Phe Ser Ser Ile Lys Lys 325 330 335 Leu Glu Lys Leu Phe Lys Asn Phe Asp Glu Tyr Ser Ser Ala Gly Ile 340 345 350 Phe Val Lys Asn Gly Pro Ala Ile Ser Thr Ile Ser Lys Asp Ile Phe 355 360 365 Gly Glu Trp Asn Val Ile Arg Asp Lys Trp Asn Ala Glu Tyr Asp Asp 370 375 380 Ile His Leu Lys Lys Lys Ala Val Val Thr Glu Lys Tyr Glu Asp Asp 385 390 395 400 Arg Arg Lys Ser Phe Lys Lys Ile Gly Ser Phe Ser Leu Glu Gln Leu 405 410 415 Gln Glu Tyr Ala Asp Ala Asp Leu Ser Val Val Glu Lys Leu Lys Glu 420 425 430 Ile Ile Ile Gln Lys Val Asp Glu Ile Tyr Lys Val Tyr Gly Ser Ser 435 440 445 Glu Lys Leu Phe Asp Ala Asp Phe Val Leu Glu Lys Ser Leu Lys Lys 450 455 460 Asn Asp Ala Val Val Ala Ile Met Lys Asp Leu Leu Asp Ser Val Lys 465 470 475 480 Ser Phe Glu Asn Tyr Ile Lys Ala Phe Phe Gly Glu Gly Lys Glu Thr 485 490 495 Asn Arg Asp Glu Ser Phe Tyr Gly Asp Phe Val Leu Ala Tyr Asp Ile 500 505 510 Leu Leu Lys Val Asp His Ile Tyr Asp Ala Ile Arg Asn Tyr Val Thr 515 520 525 Gln Lys Pro Tyr Ser Lys Asp Lys Phe Lys Leu Tyr Phe Gln Asn Pro 530 535 540 Gln Phe Met Gly Gly Trp Asp Lys Asp Lys Glu Thr Asp Tyr Arg Ala 545 550 555 560 Thr Ile Leu Arg Tyr Gly Ser Lys Tyr Tyr Leu Ala Ile Met Asp Lys 565 570 575 Lys Tyr Ala Lys Cys Leu Gln Lys Ile Asp Lys Asp Asp Val Asn Gly 580 585 590 Asn Tyr Glu Lys Ile Asn Tyr Lys Leu Leu Pro Gly Pro Asn Lys Met 595 600 605 Leu Pro Lys Val Phe Phe Ser Lys Lys Trp Met Ala Tyr Tyr Asn Pro 610 615 620 Ser Glu Asp Ile Gln Lys Ile Tyr Lys Asn Gly Thr Phe Lys Lys Gly 625 630 635 640 Asp Met Phe Asn Leu Asn Asp Cys His Lys Leu Ile Asp Phe Phe Lys 645 650 655 Asp Ser Ile Ser Arg Tyr Pro Lys Trp Ser Asn Ala Tyr Asp Phe Asn 660 665 670 Phe Ser Glu Thr Glu Lys Tyr Lys Asp Ile Ala Gly Phe Tyr Arg Glu 675 680 685 Val Glu Glu Gln Gly Tyr Lys Val Ser Phe Glu Ser Ala Ser Lys Lys 690 695 700 Glu Val Asp Lys Leu Val Glu Glu Gly Lys Leu Tyr Met Phe Gln Ile 705 710 715 720 Tyr Asn Lys Asp Phe Ser Asp Lys Ser His Gly Thr Pro Asn Leu His 725 730 735 Thr Met Tyr Phe Lys Leu Leu Phe Asp Glu Asn Asn His Gly Gln Ile 740 745 750 Arg Leu Ser Gly Gly Ala Glu Leu Phe Met Arg Arg Ala Ser Leu Lys 755 760 765 Lys Glu Glu Leu Val Val His Pro Ala Asn Ser Pro Ile Ala Asn Lys 770 775 780 Asn Pro Asp Asn Pro Lys Lys Thr Thr Thr Leu Ser Tyr Asp Val Tyr 785 790 795 800 Lys Asp Lys Arg Phe Ser Glu Asp Gln Tyr Glu Leu His Ile Pro Ile 805 810 815 Ala Ile Asn Lys Cys Pro Lys Asn Ile Phe Lys Ile Asn Thr Glu Val 820 825 830 Arg Val Leu Leu Lys His Asp Asp Asn Pro Tyr Val Ile Gly Ile Asp 835 840 845 Arg Gly Glu Arg Asn Leu Leu Tyr Ile Val Val Val Asp Gly Lys Gly 850 855 860 Asn Ile Val Glu Gln Tyr Ser Leu Asn Glu Ile Ile Asn Asn Phe Asn 865 870 875 880 Gly Ile Arg Ile Lys Thr Asp Tyr His Ser Leu Leu Asp Lys Lys Glu 885 890 895 Lys Glu Arg Phe Glu Ala Arg Gln Asn Trp Thr Ser Ile Glu Asn Ile 900 905 910 Lys Glu Leu Lys Ala Gly Tyr Ile Ser Gln Val Val His Lys Ile Cys 915 920 925 Glu Leu Val Glu Lys Tyr Asp Ala Val Ile Ala Leu Glu Asp Leu Asn 930 935 940 Ser Gly Phe Lys Asn Ser Arg Val Lys Val Glu Lys Gln Val Tyr Gln 945 950 955 960 Lys Phe Glu Lys Met Leu Ile Asp Lys Leu Asn Tyr Met Val Asp Lys 965 970 975 Lys Ser Asn Pro Cys Ala Thr Gly Gly Ala Leu Lys Gly Tyr Gln Ile 980 985 990 Thr Asn Lys Phe Glu Ser Phe Lys Ser Met Ser Thr Gln Asn Gly Phe 995 1000 1005 Ile Phe Tyr Ile Pro Ala Trp Leu Thr Ser Lys Ile Asp Pro Ser 1010 1015 1020 Thr Gly Phe Val Asn Leu Leu Lys Thr Lys Tyr Thr Ser Ile Ala 1025 1030 1035 Asp Ser Lys Lys Phe Ile Ser Ser Phe Asp Arg Ile Met Tyr Val 1040 1045 1050 Pro Glu Glu Asp Leu Phe Glu Phe Ala Leu Asp Tyr Lys Asn Phe 1055 1060 1065 Ser Arg Thr Asp Ala Asp Tyr Ile Lys Lys Trp Lys Leu Tyr Ser 1070 1075 1080 Tyr Gly Asn Arg Ile Arg Ile Phe Arg Asn Pro Lys Lys Asn Asn 1085 1090 1095 Val Phe Asp Trp Glu Glu Val Cys Leu Thr Ser Ala Tyr Lys Glu 1100 1105 1110 Leu Phe Asn Lys Tyr Gly Ile Asn Tyr Gln Gln Gly Asp Ile Arg 1115 1120 1125 Ala Leu Leu Cys Glu Gln Ser Asp Lys Ala Phe Tyr Ser Ser Phe 1130 1135 1140 Met Ala Leu Met Ser Leu Met Leu Gln Met Arg Asn Ser Ile Thr 1145 1150 1155 Gly Arg Thr Asp Val Asp Phe Leu Ile Ser Pro Val Lys Asn Ser 1160 1165 1170 Asp Gly Ile Phe Tyr Asp Ser Arg Asn Tyr Glu Ala Gln Glu Asn 1175 1180 1185 Ala Ile Leu Pro Lys Asn Ala Asp Ala Asn Gly Ala Tyr Asn Ile 1190 1195 1200 Ala Arg Lys Val Leu Trp Ala Ile Gly Gln Phe Lys Lys Ala Glu 1205 1210 1215 Asp Glu Lys Leu Asp Lys Val Lys Ile Ala Ile Ser Asn Lys Glu 1220 1225 1230 Trp Leu Glu Tyr Ala Gln Thr Ser Val Lys His Lys Arg Pro Ala 1235 1240 1245 Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys 1250 1255 1260 <210> 38 <211> 3873 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 38 atgccgaaga agaagcgcaa ggtcgggggc gggggctcag gcgggggcgg gagcggcggc 60 gggggctctg ggggcggcgg cagcggcggg ggcggcagcg ggggcggcgg gtcgatgtca 120 aagctcgaga aattcaccaa ctgttattcg ttgagcaaaa cactgcggtt taaagcgatt 180 ccagtcggca agactcaaga gaatatagac aataagcggc tgttggtgga agatgaaaag 240 cgcgcggaag actacaaagg ggtgaagaag ttgttggaca gatactacct ctcttttatc 300 aatgatgtct tgcactcaat caaattgaag aatctgaaca actacatctc cctcttcaga 360 aagaaaacaa ggacagaaaa ggagaataag gaacttgaaa atttggagat caatctgagg 420 aaagagatcg cgaaagcctt taaaggcaac gaaggataca aaagtctgtt caagaaggat 480 ataattgaga caattttgcc agagttcctc gatgacaagg acgagattgc gctggtcaat 540 tcgttcaacg gattcacaac agcattcaca ggcttctttg ataatcggga aaatatgttc 600 tctgaggagg caaagtccac ttctattgcg ttcaggtgta tcaatgagaa tctcactagg 660 tacatttcca acatggatat ctttgagaag gttgacgcaa tttttgacaa gcacgaagtt 720 caggagatta aggagaagat cctcaattcc gattatgacg ttgaggactt cttcgagggt 780 gagtttttta atttcgtgct cactcaagag ggtatcgacg tgtataatgc gatcatcggt 840 gggttcgtga ctgagtccgg tgaaaagatt aagggattga acgagtatat caacctttac 900 aaccaaaaga cgaaacagaa gctgccaaag ttcaagcctc tttacaaaca ggttctttca 960 gaccgcgagt cactctcgtt ctatggggag ggctacactt cggatgagga agtcctggag 1020 gtgttcagga atactctcaa taagaattcg gagattttct cttctataaa aaaactggaa 1080 aagttgttta agaattttga cgaatactct agcgccggca tatttgtgaa aaacggcccg 1140 gccatatcaa cgataagtaa agatatcttc ggcgaatgga acgtgatcag agacaaatgg 1200 aacgcggagt atgacgatat tcacctgaag aagaaggctg tcgtaacgga gaagtacgag 1260 gatgatcgca ggaaaagctt caaaaagatc ggaagtttca gcctggaaca gttgcaggag 1320 tatgctgacg ccgatcttag cgtcgtcgag aagttgaagg agataatcat ccaaaaggtc 1380 gacgagatat ataaagtcta tggatcaagt gaaaaactgt tcgacgccga cttcgttttg 1440 gagaagtccc tgaagaagaa cgacgctgtt gttgccatta tgaaggatct gctcgacagc 1500 gtgaagagtt tcgagaacta tattaaggct tttttcgggg aggggaagga gactaacaga 1560 gatgagtcct tctacggaga cttcgtcctc gcgtacgata tactccttaa ggtagaccac 1620 atctacgacg caatcagaaa ttacgtgaca caaaagccgt acagcaagga caagttcaaa 1680 ctctacttcc agaaccccca gttcatgggc ggctgggaca aggacaagga aacggattac 1740 agggctacga tcctgaggta tggttcaaaa tactacttgg cgattatgga caagaagtac 1800 gccaagtgtc tccagaagat tgacaaagac gatgtcaatg gcaattatga gaagatcaac 1860 tacaagctgc ttccgggtcc gaacaagatg ctcccaaagg ttttcttcag caagaaatgg 1920 atggcctact ataacccaag cgaggacatc cagaagattt ataagaacgg tacgttcaag 1980 aagggcgaca tgttcaatct taacgactgt cacaagctga tcgacttctt caaagactca 2040 attagccggt acccaaagtg gtctaacgcc tatgacttca acttttcgga aaccgagaag 2100 tacaaggata tagccggatt ttatagagag gtggaagagc agggctacaa ggtgtcattc 2160 gagtccgcca gcaagaagga agtggacaag ctcgtggaag agggtaagct ctacatgttc 2220 cagatttata ataaagactt tagcgataag agccacggga cacctaatct ccacacaatg 2280 tatttcaagc tgctcttcga cgagaataac cacggccaaa tcaggttgtc aggaggggct 2340 gaactcttca tgcggcgcgc tagccttaag aaggaggagc ttgtagtcca ccctgcgaat 2400 agtccaattg cgaataagaa cccggacaat cctaaaaaga ctacaacatt gagctacgac 2460 gtgtacaagg ataagaggtt ttccgaggat cagtacgagc tccacatccc gattgcgatc 2520 aacaagtgcc caaagaatat tttcaagata aacacagagg tgcgtgtact cctgaagcat 2580 gacgacaatc cttacgtcat tgggattgat cggggcgaga ggaacctcct ctatattgtg 2640 gtggtggacg ggaaggggaa catagtcgaa cagtactccc ttaacgaaat aattaacaat 2700 ttcaacggca tccgtatcaa gaccgactac cattcgttgc tggacaagaa ggagaaggag 2760 agatttgagg cgcggcaaaa ttggacaagt atcgagaaca tcaaggaact caaagcaggt 2820 tatatctctc aagttgtgca taagatatgc gagctggttg agaagtatga cgcagtgatc 2880 gctcttgagg acctcaactc gggctttaag aattctagag ttaaagtgga gaagcaggtc 2940 tatcaaaagt tcgagaagat gcttatagat aagctcaact acatggtcga taagaaatcg 3000 aacccatgtg ccaccggcgg cgcactcaaa ggttaccaaa taacaaacaa attcgagtcc 3060 ttcaaatcga tgagtactca gaatgggttc atattttata taccggcgtg gcttacgtct 3120 aagatcgacc cgtcaactgg ttttgtcaac ctgttgaaga cgaaatacac gtccattgcc 3180 gattcaaaaa agttcatatc tagttttgat cgtattatgt acgtcccaga ggaagatctt 3240 ttcgagtttg ctctcgacta caaaaacttt tcgcgcaccg atgcggatta cattaaaaaa 3300 tggaaactct attcgtacgg caacagaatc aggatttttc gcaaccctaa gaagaataac 3360 gtctttgatt gggaggaagt ttgcttgact agcgcgtaca aggagctctt taataagtat 3420 ggcattaact accaacaggg tgatatcaga gcactgcttt gcgaacaatc tgacaaggct 3480 ttctactcat ccttcatggc tttgatgagc ctgatgctcc agatgagaaa ttcaattaca 3540 ggcagaaccg acgtggattt cttgatctcc ccggttaaaa attctgatgg catcttttac 3600 gatagcagga actatgaagc gcaagagaat gcgattctgc caaaaaatgc agacgccaac 3660 ggtgcctata acatcgccag gaaagtcctg tgggcgatcg gccagttcaa aaaggccgaa 3720 gacgaaaaat tggacaaggt caaaatcgct atcagcaaca aagagtggct ggagtatgct 3780 cagacatccg taaagcatgg cagcccgaag aagaagcgca aggtgtccgg cggcagctcc 3840 ggcggcagcc cgaagaagaa gcgcaaagtg tga 3873 <210> 39 <211> 1290 <212> PRT <213> Artificial Sequence <220> <223> Fusion protein <400> 39 Met Pro Lys Lys Lys Arg Lys Val Gly Gly Gly Gly Ser Gly Gly Gly 1 5 10 15 Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly 20 25 30 Ser Gly Gly Gly Gly Ser Met Ser Lys Leu Glu Lys Phe Thr Asn Cys 35 40 45 Tyr Ser Leu Ser Lys Thr Leu Arg Phe Lys Ala Ile Pro Val Gly Lys 50 55 60 Thr Gln Glu Asn Ile Asp Asn Lys Arg Leu Leu Val Glu Asp Glu Lys 65 70 75 80 Arg Ala Glu Asp Tyr Lys Gly Val Lys Lys Leu Leu Asp Arg Tyr Tyr 85 90 95 Leu Ser Phe Ile Asn Asp Val Leu His Ser Ile Lys Leu Lys Asn Leu 100 105 110 Asn Asn Tyr Ile Ser Leu Phe Arg Lys Lys Thr Arg Thr Glu Lys Glu 115 120 125 Asn Lys Glu Leu Glu Asn Leu Glu Ile Asn Leu Arg Lys Glu Ile Ala 130 135 140 Lys Ala Phe Lys Gly Asn Glu Gly Tyr Lys Ser Leu Phe Lys Lys Asp 145 150 155 160 Ile Ile Glu Thr Ile Leu Pro Glu Phe Leu Asp Asp Lys Asp Glu Ile 165 170 175 Ala Leu Val Asn Ser Phe Asn Gly Phe Thr Thr Ala Phe Thr Gly Phe 180 185 190 Phe Asp Asn Arg Glu Asn Met Phe Ser Glu Glu Ala Lys Ser Thr Ser 195 200 205 Ile Ala Phe Arg Cys Ile Asn Glu Asn Leu Thr Arg Tyr Ile Ser Asn 210 215 220 Met Asp Ile Phe Glu Lys Val Asp Ala Ile Phe Asp Lys His Glu Val 225 230 235 240 Gln Glu Ile Lys Glu Lys Ile Leu Asn Ser Asp Tyr Asp Val Glu Asp 245 250 255 Phe Phe Glu Gly Glu Phe Phe Asn Phe Val Leu Thr Gln Glu Gly Ile 260 265 270 Asp Val Tyr Asn Ala Ile Ile Gly Gly Phe Val Thr Glu Ser Gly Glu 275 280 285 Lys Ile Lys Gly Leu Asn Glu Tyr Ile Asn Leu Tyr Asn Gln Lys Thr 290 295 300 Lys Gln Lys Leu Pro Lys Phe Lys Pro Leu Tyr Lys Gln Val Leu Ser 305 310 315 320 Asp Arg Glu Ser Leu Ser Phe Tyr Gly Glu Gly Tyr Thr Ser Asp Glu 325 330 335 Glu Val Leu Glu Val Phe Arg Asn Thr Leu Asn Lys Asn Ser Glu Ile 340 345 350 Phe Ser Ser Ile Lys Lys Leu Glu Lys Leu Phe Lys Asn Phe Asp Glu 355 360 365 Tyr Ser Ser Ala Gly Ile Phe Val Lys Asn Gly Pro Ala Ile Ser Thr 370 375 380 Ile Ser Lys Asp Ile Phe Gly Glu Trp Asn Val Ile Arg Asp Lys Trp 385 390 395 400 Asn Ala Glu Tyr Asp Asp Ile His Leu Lys Lys Lys Ala Val Val Thr 405 410 415 Glu Lys Tyr Glu Asp Asp Arg Arg Lys Ser Phe Lys Lys Ile Gly Ser 420 425 430 Phe Ser Leu Glu Gln Leu Gln Glu Tyr Ala Asp Ala Asp Leu Ser Val 435 440 445 Val Glu Lys Leu Lys Glu Ile Ile Ile Gln Lys Val Asp Glu Ile Tyr 450 455 460 Lys Val Tyr Gly Ser Ser Glu Lys Leu Phe Asp Ala Asp Phe Val Leu 465 470 475 480 Glu Lys Ser Leu Lys Lys Asn Asp Ala Val Val Ala Ile Met Lys Asp 485 490 495 Leu Leu Asp Ser Val Lys Ser Phe Glu Asn Tyr Ile Lys Ala Phe Phe 500 505 510 Gly Glu Gly Lys Glu Thr Asn Arg Asp Glu Ser Phe Tyr Gly Asp Phe 515 520 525 Val Leu Ala Tyr Asp Ile Leu Leu Lys Val Asp His Ile Tyr Asp Ala 530 535 540 Ile Arg Asn Tyr Val Thr Gln Lys Pro Tyr Ser Lys Asp Lys Phe Lys 545 550 555 560 Leu Tyr Phe Gln Asn Pro Gln Phe Met Gly Gly Trp Asp Lys Asp Lys 565 570 575 Glu Thr Asp Tyr Arg Ala Thr Ile Leu Arg Tyr Gly Ser Lys Tyr Tyr 580 585 590 Leu Ala Ile Met Asp Lys Lys Tyr Ala Lys Cys Leu Gln Lys Ile Asp 595 600 605 Lys Asp Asp Val Asn Gly Asn Tyr Glu Lys Ile Asn Tyr Lys Leu Leu 610 615 620 Pro Gly Pro Asn Lys Met Leu Pro Lys Val Phe Phe Ser Lys Lys Trp 625 630 635 640 Met Ala Tyr Tyr Asn Pro Ser Glu Asp Ile Gln Lys Ile Tyr Lys Asn 645 650 655 Gly Thr Phe Lys Lys Gly Asp Met Phe Asn Leu Asn Asp Cys His Lys 660 665 670 Leu Ile Asp Phe Phe Lys Asp Ser Ile Ser Arg Tyr Pro Lys Trp Ser 675 680 685 Asn Ala Tyr Asp Phe Asn Phe Ser Glu Thr Glu Lys Tyr Lys Asp Ile 690 695 700 Ala Gly Phe Tyr Arg Glu Val Glu Glu Gln Gly Tyr Lys Val Ser Phe 705 710 715 720 Glu Ser Ala Ser Lys Lys Glu Val Asp Lys Leu Val Glu Glu Gly Lys 725 730 735 Leu Tyr Met Phe Gln Ile Tyr Asn Lys Asp Phe Ser Asp Lys Ser His 740 745 750 Gly Thr Pro Asn Leu His Thr Met Tyr Phe Lys Leu Leu Phe Asp Glu 755 760 765 Asn Asn His Gly Gln Ile Arg Leu Ser Gly Gly Ala Glu Leu Phe Met 770 775 780 Arg Arg Ala Ser Leu Lys Lys Glu Glu Leu Val Val His Pro Ala Asn 785 790 795 800 Ser Pro Ile Ala Asn Lys Asn Pro Asp Asn Pro Lys Lys Thr Thr Thr 805 810 815 Leu Ser Tyr Asp Val Tyr Lys Asp Lys Arg Phe Ser Glu Asp Gln Tyr 820 825 830 Glu Leu His Ile Pro Ile Ala Ile Asn Lys Cys Pro Lys Asn Ile Phe 835 840 845 Lys Ile Asn Thr Glu Val Arg Val Leu Leu Lys His Asp Asp Asn Pro 850 855 860 Tyr Val Ile Gly Ile Asp Arg Gly Glu Arg Asn Leu Leu Tyr Ile Val 865 870 875 880 Val Val Asp Gly Lys Gly Asn Ile Val Glu Gln Tyr Ser Leu Asn Glu 885 890 895 Ile Ile Asn Asn Phe Asn Gly Ile Arg Ile Lys Thr Asp Tyr His Ser 900 905 910 Leu Leu Asp Lys Lys Glu Lys Glu Arg Phe Glu Ala Arg Gln Asn Trp 915 920 925 Thr Ser Ile Glu Asn Ile Lys Glu Leu Lys Ala Gly Tyr Ile Ser Gln 930 935 940 Val Val His Lys Ile Cys Glu Leu Val Glu Lys Tyr Asp Ala Val Ile 945 950 955 960 Ala Leu Glu Asp Leu Asn Ser Gly Phe Lys Asn Ser Arg Val Lys Val 965 970 975 Glu Lys Gln Val Tyr Gln Lys Phe Glu Lys Met Leu Ile Asp Lys Leu 980 985 990 Asn Tyr Met Val Asp Lys Lys Ser Asn Pro Cys Ala Thr Gly Gly Ala 995 1000 1005 Leu Lys Gly Tyr Gln Ile Thr Asn Lys Phe Glu Ser Phe Lys Ser 1010 1015 1020 Met Ser Thr Gln Asn Gly Phe Ile Phe Tyr Ile Pro Ala Trp Leu 1025 1030 1035 Thr Ser Lys Ile Asp Pro Ser Thr Gly Phe Val Asn Leu Leu Lys 1040 1045 1050 Thr Lys Tyr Thr Ser Ile Ala Asp Ser Lys Lys Phe Ile Ser Ser 1055 1060 1065 Phe Asp Arg Ile Met Tyr Val Pro Glu Glu Asp Leu Phe Glu Phe 1070 1075 1080 Ala Leu Asp Tyr Lys Asn Phe Ser Arg Thr Asp Ala Asp Tyr Ile 1085 1090 1095 Lys Lys Trp Lys Leu Tyr Ser Tyr Gly Asn Arg Ile Arg Ile Phe 1100 1105 1110 Arg Asn Pro Lys Lys Asn Asn Val Phe Asp Trp Glu Glu Val Cys 1115 1120 1125 Leu Thr Ser Ala Tyr Lys Glu Leu Phe Asn Lys Tyr Gly Ile Asn 1130 1135 1140 Tyr Gln Gln Gly Asp Ile Arg Ala Leu Leu Cys Glu Gln Ser Asp 1145 1150 1155 Lys Ala Phe Tyr Ser Ser Phe Met Ala Leu Met Ser Leu Met Leu 1160 1165 1170 Gln Met Arg Asn Ser Ile Thr Gly Arg Thr Asp Val Asp Phe Leu 1175 1180 1185 Ile Ser Pro Val Lys Asn Ser Asp Gly Ile Phe Tyr Asp Ser Arg 1190 1195 1200 Asn Tyr Glu Ala Gln Glu Asn Ala Ile Leu Pro Lys Asn Ala Asp 1205 1210 1215 Ala Asn Gly Ala Tyr Asn Ile Ala Arg Lys Val Leu Trp Ala Ile 1220 1225 1230 Gly Gln Phe Lys Lys Ala Glu Asp Glu Lys Leu Asp Lys Val Lys 1235 1240 1245 Ile Ala Ile Ser Asn Lys Glu Trp Leu Glu Tyr Ala Gln Thr Ser 1250 1255 1260 Val Lys His Gly Ser Pro Lys Lys Lys Arg Lys Val Ser Gly Gly 1265 1270 1275 Ser Ser Gly Gly Ser Pro Lys Lys Lys Arg Lys Val 1280 1285 1290 <210> 40 <211> 3852 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 40 atggctccta agaagaagcg gaaggttggt attcacgggg tgcctgcggc tctgtttcaa 60 gattttacac atctgtaccc gctgagtaaa acagtgcggt tcgagctgaa acccatagga 120 aggaccctcg agcacatcca cgcgaagaat tttctgagcc aggatgaaac tatggctgat 180 atgtatcaaa aagttaaggt cattttggac gactatcatc gcgattttat tgccgacatg 240 atgggagagg tgaaactcac gaagcttgct gaattttacg acgtctatct gaagttcagg 300 aaaaatccta aggacgatgg gctgcaaaaa cagcttaaag accttcaagc tgtccttcgg 360 aaggaatcgg tgaagcctat agggtcaggt gggaagtaca aaacaggcta cgatagactc 420 tttggggcaa aactcttcaa agatggaaaa gagttgggtg acctcgcaaa attcgttata 480 gcccaagaag gtgagtcttc tccgaagctg gctcatcttg ctcattttga gaagttcagc 540 acgtatttta ctggatttca cgataatcgg aagaatatgt actcggatga agacaagcat 600 actgcaatag cgtacaggct catccatgag aatttgccga gattcatcga caatctgcaa 660 atcttgacaa caatcaaaca aaagcatagc gccctctatg atcagataat caacgagctc 720 acggcctccg ggctcgacgt ctccttggct tctcatcttg acgggtatca caagctcctt 780 acacaagagg ggatcacggc atacaacagg atcataggag aggtgaatgg atatacaaat 840 aagcataacc agatatgcca caagagcgag cgcatagcga aacttagacc cttgcacaag 900 caaatccttt ctgacggaat gggagtgtca ttccttccgt ctaagttcgc ggatgatagt 960 gagatgtgcc aagcggtcaa cgaattttat cgccattata ctgacgtgtt cgcaaaggtg 1020 caaagtctct ttgacggatt tgatgatcac cagaaagacg ggatctatgt tgaacacaaa 1080 aaccttaatg aactgagcaa acaggcgttc ggcgactttg ctttgctggg gagggtcctt 1140 gatggatact acgtggacgt tgtcaatccg gagttcaatg agcggttcgc aaaggccaag 1200 actgacaatg cgaaagccaa gcttacaaaa gaaaaggaca aattcattaa aggagtccac 1260 tcactggctt ccctcgaaca agcaatagaa caccatacag ctagacacga cgatgagagt 1320 gttcaagccg gaaaacttgg ccagtacttc aaacacggtt tggcgggggt tgacaacccg 1380 attcagaaaa ttcacaataa ccattcgacg attaaagggt ttctggaaag ggaaaggcct 1440 gctggggaac gggcgctccc gaagatcaag tcaggaaaaa acccagaaat gacacagctc 1500 aggcagctga aggaactttt ggacaacgca ttgaatgtgg cgcacttcgc taagctgctg 1560 acaactaaaa caaccttgga caaccaggat ggaaattttt acggggagtt tggggtgctt 1620 tacgacgagc tggctaaaat tccaactctc tacaataagg ttagagatta tctctctcaa 1680 aagccctttt ctaccgaaaa gtataagctc aacttcggca atccgaccct tctcaatggg 1740 tgggacctga acaaagagaa agataacttt ggggttatac ttcagaagga tggatgctat 1800 tacttggcgc ttcttgataa ggctcataaa aaagttttcg acaacgcccc taacactggt 1860 aagaacgtct accaaaagat ggtctacaaa ctgttgcccg gccccaacaa aatgcttcct 1920 aaagtgtttt tcgcaaaatc gaatctcgac tattataatc catctgccga gctccttgac 1980 aaatatgcta aggggaccca taaaaagggt gataatttca acctgaagga ctgccacgcg 2040 cttatcgact ttttcaaagc cgggataaat aagcatccgg agtggcaaca ttttggtttt 2100 aaattttcgc caacgtcgtc ctatcgcgac ctttccgatt tctataggga agttgaacct 2160 caggggtacc aggtcaaatt tgttgacatt aatgcggact acattgatga attggtggag 2220 caagggaagc tctacctctt tcaaatatat aacaaagatt tctcgccaaa agcgcatggt 2280 aaaccgaatc ttcatacctt gtactttaaa gcactttttt cagaagataa cttggcggac 2340 ccgatctaca agctgaatgg ggaagctcag atcttctaca ggaaagcttc gttggacatg 2400 aacgagacta ccatacatcg cgcgggagag gtgcttgaga acaaaaatcc cgacaacccg 2460 aaaaagcggc aattcgttta cgacatcatc aaagacaaac ggtacacgca ggacaaattt 2520 atgctccacg tccccattac catgaatttt ggagtccaag gcatgaccat taaggaattc 2580 aacaaaaagg tcaaccaaag tattcagcaa tacgatgaag tcaatgtcat aggcatagat 2640 cggggagaaa ggcatctgtt gtatcttacc gtgattaact ctaagggtga aatactggag 2700 caacggtcac ttaacgatat aaccacggcg tccgcgaacg gtacacaagt gaccactccc 2760 taccacaaaa tattggataa aagggagata gaacgcttga atgcccgcgt tggctggggt 2820 gagattgaga ccatcaaaga gcttaaatcg ggatatttgt ctcacgtcgt tcatcaaatt 2880 aaccaactca tgcttaagta caatgcaatc gttgtgctcg aggacctgaa ctttggtttc 2940 aaaagaggga ggttcaaggt ggaaaaacaa atttaccaga actttgaaaa cgcgcttatc 3000 aagaaattga atcaccttgt tttgaaagat aaggcagatg acgaaatcgg gtcgtataaa 3060 aatgcactcc agttgacaaa taatttcacg gatttgaagt cgatcggcaa gcaaacaggg 3120 ttcctctttt atgtgccagc gtggaataca tcaaaaattg atccggagac gggatttgtc 3180 gacttgctga agcctaggta tgagaacatt gcccaatctc aggccttttt cggcaaattc 3240 gataaaatat gctacaacac agacaaaggt tattttgaat ttcacattga ttacgccaaa 3300 tttacagata aggcgaaaaa cagcagacag aaatgggcta tctgttctca tggggacaaa 3360 cgctatgtct acgataagac ggctaatcaa aataaaggcg ccgcaaaagg tattaatgtg 3420 aatgatgagc tgaaaagctt gtttgcccgc taccatatca atgataaaca accaaacttg 3480 gtgatggaca tatgccagaa caatgacaaa gaattccaca agtcactcat gtgcctgctt 3540 aaaacccttt tggcgctgcg gtatagcaat gcatctagcg atgaagactt tattttgagt 3600 cccgtggcca acgacgaggg cgtgtttttt aattcagcct tggcggacga tacgcagccc 3660 cagaatgcgg acgcaaacgg cgcgtaccac attgcactga agggactgtg gcttctgaac 3720 gagctgaaaa atagcgacga cctgaataaa gtcaagttgg ccattgacaa tcaaacctgg 3780 ttgaatttcg ctcaaaatag aaagcgtcct gctgccacca aaaaggccgg acaggctaag 3840 aaaaagaagt ga 3852 <210> 41 <211> 1283 <212> PRT <213> Artificial Sequence <220> <223> Fusion protein <400> 41 Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala 1 5 10 15 Ala Leu Phe Gln Asp Phe Thr His Leu Tyr Pro Leu Ser Lys Thr Val 20 25 30 Arg Phe Glu Leu Lys Pro Ile Gly Arg Thr Leu Glu His Ile His Ala 35 40 45 Lys Asn Phe Leu Ser Gln Asp Glu Thr Met Ala Asp Met Tyr Gln Lys 50 55 60 Val Lys Val Ile Leu Asp Asp Tyr His Arg Asp Phe Ile Ala Asp Met 65 70 75 80 Met Gly Glu Val Lys Leu Thr Lys Leu Ala Glu Phe Tyr Asp Val Tyr 85 90 95 Leu Lys Phe Arg Lys Asn Pro Lys Asp Asp Gly Leu Gln Lys Gln Leu 100 105 110 Lys Asp Leu Gln Ala Val Leu Arg Lys Glu Ser Val Lys Pro Ile Gly 115 120 125 Ser Gly Gly Lys Tyr Lys Thr Gly Tyr Asp Arg Leu Phe Gly Ala Lys 130 135 140 Leu Phe Lys Asp Gly Lys Glu Leu Gly Asp Leu Ala Lys Phe Val Ile 145 150 155 160 Ala Gln Glu Gly Glu Ser Ser Pro Lys Leu Ala His Leu Ala His Phe 165 170 175 Glu Lys Phe Ser Thr Tyr Phe Thr Gly Phe His Asp Asn Arg Lys Asn 180 185 190 Met Tyr Ser Asp Glu Asp Lys His Thr Ala Ile Ala Tyr Arg Leu Ile 195 200 205 His Glu Asn Leu Pro Arg Phe Ile Asp Asn Leu Gln Ile Leu Thr Thr 210 215 220 Ile Lys Gln Lys His Ser Ala Leu Tyr Asp Gln Ile Ile Asn Glu Leu 225 230 235 240 Thr Ala Ser Gly Leu Asp Val Ser Leu Ala Ser His Leu Asp Gly Tyr 245 250 255 His Lys Leu Leu Thr Gln Glu Gly Ile Thr Ala Tyr Asn Arg Ile Ile 260 265 270 Gly Glu Val Asn Gly Tyr Thr Asn Lys His Asn Gln Ile Cys His Lys 275 280 285 Ser Glu Arg Ile Ala Lys Leu Arg Pro Leu His Lys Gln Ile Leu Ser 290 295 300 Asp Gly Met Gly Val Ser Phe Leu Pro Ser Lys Phe Ala Asp Asp Ser 305 310 315 320 Glu Met Cys Gln Ala Val Asn Glu Phe Tyr Arg His Tyr Thr Asp Val 325 330 335 Phe Ala Lys Val Gln Ser Leu Phe Asp Gly Phe Asp Asp His Gln Lys 340 345 350 Asp Gly Ile Tyr Val Glu His Lys Asn Leu Asn Glu Leu Ser Lys Gln 355 360 365 Ala Phe Gly Asp Phe Ala Leu Leu Gly Arg Val Leu Asp Gly Tyr Tyr 370 375 380 Val Asp Val Val Asn Pro Glu Phe Asn Glu Arg Phe Ala Lys Ala Lys 385 390 395 400 Thr Asp Asn Ala Lys Ala Lys Leu Thr Lys Glu Lys Asp Lys Phe Ile 405 410 415 Lys Gly Val His Ser Leu Ala Ser Leu Glu Gln Ala Ile Glu His His 420 425 430 Thr Ala Arg His Asp Asp Glu Ser Val Gln Ala Gly Lys Leu Gly Gln 435 440 445 Tyr Phe Lys His Gly Leu Ala Gly Val Asp Asn Pro Ile Gln Lys Ile 450 455 460 His Asn Asn His Ser Thr Ile Lys Gly Phe Leu Glu Arg Glu Arg Pro 465 470 475 480 Ala Gly Glu Arg Ala Leu Pro Lys Ile Lys Ser Gly Lys Asn Pro Glu 485 490 495 Met Thr Gln Leu Arg Gln Leu Lys Glu Leu Leu Asp Asn Ala Leu Asn 500 505 510 Val Ala His Phe Ala Lys Leu Leu Thr Thr Lys Thr Thr Leu Asp Asn 515 520 525 Gln Asp Gly Asn Phe Tyr Gly Glu Phe Gly Val Leu Tyr Asp Glu Leu 530 535 540 Ala Lys Ile Pro Thr Leu Tyr Asn Lys Val Arg Asp Tyr Leu Ser Gln 545 550 555 560 Lys Pro Phe Ser Thr Glu Lys Tyr Lys Leu Asn Phe Gly Asn Pro Thr 565 570 575 Leu Leu Asn Gly Trp Asp Leu Asn Lys Glu Lys Asp Asn Phe Gly Val 580 585 590 Ile Leu Gln Lys Asp Gly Cys Tyr Tyr Leu Ala Leu Leu Asp Lys Ala 595 600 605 His Lys Lys Val Phe Asp Asn Ala Pro Asn Thr Gly Lys Asn Val Tyr 610 615 620 Gln Lys Met Val Tyr Lys Leu Leu Pro Gly Pro Asn Lys Met Leu Pro 625 630 635 640 Lys Val Phe Phe Ala Lys Ser Asn Leu Asp Tyr Tyr Asn Pro Ser Ala 645 650 655 Glu Leu Leu Asp Lys Tyr Ala Lys Gly Thr His Lys Lys Gly Asp Asn 660 665 670 Phe Asn Leu Lys Asp Cys His Ala Leu Ile Asp Phe Phe Lys Ala Gly 675 680 685 Ile Asn Lys His Pro Glu Trp Gln His Phe Gly Phe Lys Phe Ser Pro 690 695 700 Thr Ser Ser Tyr Arg Asp Leu Ser Asp Phe Tyr Arg Glu Val Glu Pro 705 710 715 720 Gln Gly Tyr Gln Val Lys Phe Val Asp Ile Asn Ala Asp Tyr Ile Asp 725 730 735 Glu Leu Val Glu Gln Gly Lys Leu Tyr Leu Phe Gln Ile Tyr Asn Lys 740 745 750 Asp Phe Ser Pro Lys Ala His Gly Lys Pro Asn Leu His Thr Leu Tyr 755 760 765 Phe Lys Ala Leu Phe Ser Glu Asp Asn Leu Ala Asp Pro Ile Tyr Lys 770 775 780 Leu Asn Gly Glu Ala Gln Ile Phe Tyr Arg Lys Ala Ser Leu Asp Met 785 790 795 800 Asn Glu Thr Thr Ile His Arg Ala Gly Glu Val Leu Glu Asn Lys Asn 805 810 815 Pro Asp Asn Pro Lys Lys Arg Gln Phe Val Tyr Asp Ile Ile Lys Asp 820 825 830 Lys Arg Tyr Thr Gln Asp Lys Phe Met Leu His Val Pro Ile Thr Met 835 840 845 Asn Phe Gly Val Gln Gly Met Thr Ile Lys Glu Phe Asn Lys Lys Val 850 855 860 Asn Gln Ser Ile Gln Gln Tyr Asp Glu Val Asn Val Ile Gly Ile Asp 865 870 875 880 Arg Gly Glu Arg His Leu Leu Tyr Leu Thr Val Ile Asn Ser Lys Gly 885 890 895 Glu Ile Leu Glu Gln Arg Ser Leu Asn Asp Ile Thr Thr Ala Ser Ala 900 905 910 Asn Gly Thr Gln Val Thr Thr Pro Tyr His Lys Ile Leu Asp Lys Arg 915 920 925 Glu Ile Glu Arg Leu Asn Ala Arg Val Gly Trp Gly Glu Ile Glu Thr 930 935 940 Ile Lys Glu Leu Lys Ser Gly Tyr Leu Ser His Val Val His Gln Ile 945 950 955 960 Asn Gln Leu Met Leu Lys Tyr Asn Ala Ile Val Val Leu Glu Asp Leu 965 970 975 Asn Phe Gly Phe Lys Arg Gly Arg Phe Lys Val Glu Lys Gln Ile Tyr 980 985 990 Gln Asn Phe Glu Asn Ala Leu Ile Lys Lys Leu Asn His Leu Val Leu 995 1000 1005 Lys Asp Lys Ala Asp Asp Glu Ile Gly Ser Tyr Lys Asn Ala Leu 1010 1015 1020 Gln Leu Thr Asn Asn Phe Thr Asp Leu Lys Ser Ile Gly Lys Gln 1025 1030 1035 Thr Gly Phe Leu Phe Tyr Val Pro Ala Trp Asn Thr Ser Lys Ile 1040 1045 1050 Asp Pro Glu Thr Gly Phe Val Asp Leu Leu Lys Pro Arg Tyr Glu 1055 1060 1065 Asn Ile Ala Gln Ser Gln Ala Phe Phe Gly Lys Phe Asp Lys Ile 1070 1075 1080 Cys Tyr Asn Thr Asp Lys Gly Tyr Phe Glu Phe His Ile Asp Tyr 1085 1090 1095 Ala Lys Phe Thr Asp Lys Ala Lys Asn Ser Arg Gln Lys Trp Ala 1100 1105 1110 Ile Cys Ser His Gly Asp Lys Arg Tyr Val Tyr Asp Lys Thr Ala 1115 1120 1125 Asn Gln Asn Lys Gly Ala Ala Lys Gly Ile Asn Val Asn Asp Glu 1130 1135 1140 Leu Lys Ser Leu Phe Ala Arg Tyr His Ile Asn Asp Lys Gln Pro 1145 1150 1155 Asn Leu Val Met Asp Ile Cys Gln Asn Asn Asp Lys Glu Phe His 1160 1165 1170 Lys Ser Leu Met Cys Leu Leu Lys Thr Leu Leu Ala Leu Arg Tyr 1175 1180 1185 Ser Asn Ala Ser Ser Asp Glu Asp Phe Ile Leu Ser Pro Val Ala 1190 1195 1200 Asn Asp Glu Gly Val Phe Phe Asn Ser Ala Leu Ala Asp Asp Thr 1205 1210 1215 Gln Pro Gln Asn Ala Asp Ala Asn Gly Ala Tyr His Ile Ala Leu 1220 1225 1230 Lys Gly Leu Trp Leu Leu Asn Glu Leu Lys Asn Ser Asp Asp Leu 1235 1240 1245 Asn Lys Val Lys Leu Ala Ile Asp Asn Gln Thr Trp Leu Asn Phe 1250 1255 1260 Ala Gln Asn Arg Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln 1265 1270 1275 Ala Lys Lys Lys Lys 1280 <210> 42 <211> 3936 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 42 atgccgaaga agaagcgcaa ggtcgggggc gggggctcag gcgggggcgg gagcggcggc 60 gggggctctg ggggcggcgg cagcggcggg ggcggcagcg ggggcggcgg gtcgatgctg 120 ttccaggatt tcactcatct gtaccctctc tcaaagactg ttcggttcga gctcaagcct 180 attgggcgga ctctggagca catccacgcg aagaacttcc tcagccagga cgaaaccatg 240 gccgacatgt accagaaggt caaggtcatc ctcgacgact accacaggga cttcatcgcg 300 gacatgatgg gcgaggtgaa gctgacgaag ctcgccgagt tctacgacgt ctacctcaag 360 ttccgcaaga acccgaagga cgacggcctc cagaagcagc tcaaggacct gcaggccgtc 420 ctgaggaagg agtccgtcaa gcccatcggc agcggcggca agtacaagac cggctacgac 480 aggctgttcg gcgccaagct gttcaaggac ggcaaggagc tcggcgacct ggcgaagttc 540 gtgatcgcgc aggagggcga gagctccccc aagctggccc acctggccca cttcgagaag 600 ttcagcacgt acttcaccgg cttccacgac aacaggaaga acatgtacag cgacgaggac 660 aagcacacgg ccatcgccta ccgcctcatc cacgagaacc tgccccgctt catcgacaac 720 ctgcagatcc tgacgaccat caagcagaag cactccgccc tgtacgacca gatcatcaac 780 gagctcaccg cgagcggcct cgacgtgtcc ctcgccagcc acctcgacgg ctaccacaag 840 ctcctgaccc aggagggcat caccgcctac aaccgcatca tcggcgaggt gaacggctac 900 accaacaagc acaaccagat ctgccacaag tccgagagga tcgccaagct caggcccctg 960 cacaagcaga tcctcagcga cggcatgggc gtgagcttcc tcccgtccaa gttcgccgac 1020 gactccgaga tgtgccaggc cgtgaacgag ttctacaggc actacaccga cgtgttcgcc 1080 aaggtgcagt ccctgttcga cggcttcgac gaccaccaga aggacggcat ctacgtggag 1140 cacaagaacc tgaacgagct gtccaagcag gccttcggcg acttcgccct cctgggccgc 1200 gtgctggacg gctactacgt ggacgtcgtg aacccggagt tcaacgagcg cttcgcgaag 1260 gcgaagacgg acaacgcgaa ggccaagctc accaaggaga aggacaagtt catcaagggc 1320 gtccacagcc tcgcgtccct ggagcaggcg atcgagcacc acaccgcgcg ccacgacgac 1380 gagtccgtgc aggccggcaa gctcggccag tacttcaagc acggcctggc cggcgtcgac 1440 aacccgatcc agaagatcca caacaaccac tccaccatca agggcttcct ggagagggag 1500 cgcccggcgg gcgagcgcgc gctccccaag atcaagtccg gcaagaaccc cgagatgacg 1560 cagctcaggc agctgaagga gctgctcgac aacgcgctca acgtggcgca cttcgccaag 1620 ctgctcacga ccaagaccac gctggacaac caggacggca acttctacgg cgagttcggc 1680 gtcctgtacg acgagctggc gaagatcccg accctgtaca acaaggtccg cgactacctg 1740 agccagaagc ccttctccac cgagaagtac aagctcaact tcggcaaccc gaccctcctg 1800 aacggctggg acctcaacaa ggagaaggac aacttcggcg tgatcctcca gaaggacggc 1860 tgctactacc tcgccctgct ggacaaggcg cacaagaagg tcttcgacaa cgccccgaac 1920 accggcaaga acgtgtacca gaagatggtg tacaagctgc tccccggccc caacaagatg 1980 ctgccgaagg tgttcttcgc gaagtccaac ctcgactact acaaccccag cgccgagctc 2040 ctggacaagt acgccaaggg cacgcacaag aagggcgaca acttcaacct caaggactgc 2100 cacgcgctga tcgacttctt caaggcgggc atcaacaagc accccgagtg gcagcacttc 2160 ggcttcaagt tcagcccgac ctccagctac agggacctca gcgacttcta ccgcgaggtg 2220 gagccccagg gctaccaggt gaagttcgtc gacatcaacg ccgactacat cgacgagctc 2280 gtcgagcagg gcaagctcta cctgttccag atctacaaca aggacttctc cccgaaggcc 2340 cacggcaagc cgaacctcca cacgctctac ttcaaggccc tcttcagcga ggacaacctg 2400 gccgacccga tctacaagct caacggcgag gcgcagatct tctaccgcaa ggccagcctg 2460 gacatgaacg aaacgaccat ccacagggcc ggcgaggtcc tggagaacaa gaacccggac 2520 aacccgaaga agaggcagtt cgtctacgac atcatcaagg acaagaggta cacccaggac 2580 aagttcatgc tccacgtccc gatcaccatg aacttcggcg tccagggcat gaccatcaag 2640 gagttcaaca agaaggtcaa ccagagcatc cagcagtacg acgaggtgaa cgtcatcggc 2700 atcgaccgcg gcgagaggca cctgctctac ctgacggtca tcaactccaa gggcgagatc 2760 ctcgagcagc gcagcctgaa cgacatcacg accgcgagcg ccaacggcac gcaggtcacc 2820 acgccgtacc acaagatcct cgacaagcgc gagatcgaga ggctgaacgc gcgcgtcggc 2880 tggggcgaga tcgaaacgat caaggagctc aagtccggct acctcagcca cgtcgtgcac 2940 cagatcaacc agctcatgct gaagtacaac gcgatcgtgg tcctcgagga cctgaacttc 3000 ggcttcaaga ggggccgctt caaggtggag aagcagatct accagaactt cgagaacgcc 3060 ctgatcaaga agctcaacca cctggtcctc aaggacaagg cggacgacga gatcggcagc 3120 tacaagaacg cgctccagct gaccaacaac ttcacggacc tcaagtccat cggcaagcag 3180 acgggcttcc tgttctacgt gccggcgtgg aacacctcca agatcgaccc ggaaaccggc 3240 ttcgtcgacc tgctcaagcc gcgctacgag aacatcgcgc agtcccaggc gttcttcggc 3300 aagttcgaca agatctgcta caacaccgac aagggctact tcgagttcca catcgactac 3360 gcgaagttca ccgacaaggc caagaactcc aggcagaagt gggccatctg cagccacggc 3420 gacaagcgct acgtgtacga caagacggcg aaccagaaca agggcgcggc caagggcatc 3480 aacgtgaacg acgagctgaa gtccctcttc gcgcgctacc acatcaacga caagcagccg 3540 aacctcgtca tggacatctg ccagaacaac gacaaggagt tccacaagag cctgatgtgc 3600 ctgctcaaga ccctgctcgc cctccgctac tccaacgcga gctccgacga ggacttcatc 3660 ctcagccccg tcgcgaacga cgagggcgtg ttcttcaact ccgccctcgc ggacgacacg 3720 cagccgcaga acgccgacgc gaacggcgcc taccacatcg ccctcaaggg cctgtggctg 3780 ctcaacgagc tcaagaactc cgacgacctg aacaaggtga agctcgccat tgacaaccag 3840 acgtggctga atttcgctca gaataggccg aagaagaagc gcaaggtgtc cggcggcagc 3900 tccggcggca gcccgaagaa gaagcgcaaa gtgtga 3936 <210> 43 <211> 1311 <212> PRT <213> Artificial Sequence <220> <223> Fusion protein <400> 43 Met Pro Lys Lys Lys Arg Lys Val Gly Gly Gly Gly Ser Gly Gly Gly 1 5 10 15 Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly 20 25 30 Ser Gly Gly Gly Gly Ser Met Leu Phe Gln Asp Phe Thr His Leu Tyr 35 40 45 Pro Leu Ser Lys Thr Val Arg Phe Glu Leu Lys Pro Ile Gly Arg Thr 50 55 60 Leu Glu His Ile His Ala Lys Asn Phe Leu Ser Gln Asp Glu Thr Met 65 70 75 80 Ala Asp Met Tyr Gln Lys Val Lys Val Ile Leu Asp Asp Tyr His Arg 85 90 95 Asp Phe Ile Ala Asp Met Met Gly Glu Val Lys Leu Thr Lys Leu Ala 100 105 110 Glu Phe Tyr Asp Val Tyr Leu Lys Phe Arg Lys Asn Pro Lys Asp Asp 115 120 125 Gly Leu Gln Lys Gln Leu Lys Asp Leu Gln Ala Val Leu Arg Lys Glu 130 135 140 Ser Val Lys Pro Ile Gly Ser Gly Gly Lys Tyr Lys Thr Gly Tyr Asp 145 150 155 160 Arg Leu Phe Gly Ala Lys Leu Phe Lys Asp Gly Lys Glu Leu Gly Asp 165 170 175 Leu Ala Lys Phe Val Ile Ala Gln Glu Gly Glu Ser Ser Pro Lys Leu 180 185 190 Ala His Leu Ala His Phe Glu Lys Phe Ser Thr Tyr Phe Thr Gly Phe 195 200 205 His Asp Asn Arg Lys Asn Met Tyr Ser Asp Glu Asp Lys His Thr Ala 210 215 220 Ile Ala Tyr Arg Leu Ile His Glu Asn Leu Pro Arg Phe Ile Asp Asn 225 230 235 240 Leu Gln Ile Leu Thr Thr Ile Lys Gln Lys His Ser Ala Leu Tyr Asp 245 250 255 Gln Ile Ile Asn Glu Leu Thr Ala Ser Gly Leu Asp Val Ser Leu Ala 260 265 270 Ser His Leu Asp Gly Tyr His Lys Leu Leu Thr Gln Glu Gly Ile Thr 275 280 285 Ala Tyr Asn Arg Ile Ile Gly Glu Val Asn Gly Tyr Thr Asn Lys His 290 295 300 Asn Gln Ile Cys His Lys Ser Glu Arg Ile Ala Lys Leu Arg Pro Leu 305 310 315 320 His Lys Gln Ile Leu Ser Asp Gly Met Gly Val Ser Phe Leu Pro Ser 325 330 335 Lys Phe Ala Asp Asp Ser Glu Met Cys Gln Ala Val Asn Glu Phe Tyr 340 345 350 Arg His Tyr Thr Asp Val Phe Ala Lys Val Gln Ser Leu Phe Asp Gly 355 360 365 Phe Asp Asp His Gln Lys Asp Gly Ile Tyr Val Glu His Lys Asn Leu 370 375 380 Asn Glu Leu Ser Lys Gln Ala Phe Gly Asp Phe Ala Leu Leu Gly Arg 385 390 395 400 Val Leu Asp Gly Tyr Tyr Val Asp Val Val Asn Pro Glu Phe Asn Glu 405 410 415 Arg Phe Ala Lys Ala Lys Thr Asp Asn Ala Lys Ala Lys Leu Thr Lys 420 425 430 Glu Lys Asp Lys Phe Ile Lys Gly Val His Ser Leu Ala Ser Leu Glu 435 440 445 Gln Ala Ile Glu His His Thr Ala Arg His Asp Asp Glu Ser Val Gln 450 455 460 Ala Gly Lys Leu Gly Gln Tyr Phe Lys His Gly Leu Ala Gly Val Asp 465 470 475 480 Asn Pro Ile Gln Lys Ile His Asn Asn His Ser Thr Ile Lys Gly Phe 485 490 495 Leu Glu Arg Glu Arg Pro Ala Gly Glu Arg Ala Leu Pro Lys Ile Lys 500 505 510 Ser Gly Lys Asn Pro Glu Met Thr Gln Leu Arg Gln Leu Lys Glu Leu 515 520 525 Leu Asp Asn Ala Leu Asn Val Ala His Phe Ala Lys Leu Leu Thr Thr 530 535 540 Lys Thr Thr Leu Asp Asn Gln Asp Gly Asn Phe Tyr Gly Glu Phe Gly 545 550 555 560 Val Leu Tyr Asp Glu Leu Ala Lys Ile Pro Thr Leu Tyr Asn Lys Val 565 570 575 Arg Asp Tyr Leu Ser Gln Lys Pro Phe Ser Thr Glu Lys Tyr Lys Leu 580 585 590 Asn Phe Gly Asn Pro Thr Leu Leu Asn Gly Trp Asp Leu Asn Lys Glu 595 600 605 Lys Asp Asn Phe Gly Val Ile Leu Gln Lys Asp Gly Cys Tyr Tyr Leu 610 615 620 Ala Leu Leu Asp Lys Ala His Lys Lys Val Phe Asp Asn Ala Pro Asn 625 630 635 640 Thr Gly Lys Asn Val Tyr Gln Lys Met Val Tyr Lys Leu Leu Pro Gly 645 650 655 Pro Asn Lys Met Leu Pro Lys Val Phe Phe Ala Lys Ser Asn Leu Asp 660 665 670 Tyr Tyr Asn Pro Ser Ala Glu Leu Leu Asp Lys Tyr Ala Lys Gly Thr 675 680 685 His Lys Lys Gly Asp Asn Phe Asn Leu Lys Asp Cys His Ala Leu Ile 690 695 700 Asp Phe Phe Lys Ala Gly Ile Asn Lys His Pro Glu Trp Gln His Phe 705 710 715 720 Gly Phe Lys Phe Ser Pro Thr Ser Ser Tyr Arg Asp Leu Ser Asp Phe 725 730 735 Tyr Arg Glu Val Glu Pro Gln Gly Tyr Gln Val Lys Phe Val Asp Ile 740 745 750 Asn Ala Asp Tyr Ile Asp Glu Leu Val Glu Gln Gly Lys Leu Tyr Leu 755 760 765 Phe Gln Ile Tyr Asn Lys Asp Phe Ser Pro Lys Ala His Gly Lys Pro 770 775 780 Asn Leu His Thr Leu Tyr Phe Lys Ala Leu Phe Ser Glu Asp Asn Leu 785 790 795 800 Ala Asp Pro Ile Tyr Lys Leu Asn Gly Glu Ala Gln Ile Phe Tyr Arg 805 810 815 Lys Ala Ser Leu Asp Met Asn Glu Thr Thr Ile His Arg Ala Gly Glu 820 825 830 Val Leu Glu Asn Lys Asn Pro Asp Asn Pro Lys Lys Arg Gln Phe Val 835 840 845 Tyr Asp Ile Ile Lys Asp Lys Arg Tyr Thr Gln Asp Lys Phe Met Leu 850 855 860 His Val Pro Ile Thr Met Asn Phe Gly Val Gln Gly Met Thr Ile Lys 865 870 875 880 Glu Phe Asn Lys Lys Val Asn Gln Ser Ile Gln Gln Tyr Asp Glu Val 885 890 895 Asn Val Ile Gly Ile Asp Arg Gly Glu Arg His Leu Leu Tyr Leu Thr 900 905 910 Val Ile Asn Ser Lys Gly Glu Ile Leu Glu Gln Arg Ser Leu Asn Asp 915 920 925 Ile Thr Thr Ala Ser Ala Asn Gly Thr Gln Val Thr Thr Pro Tyr His 930 935 940 Lys Ile Leu Asp Lys Arg Glu Ile Glu Arg Leu Asn Ala Arg Val Gly 945 950 955 960 Trp Gly Glu Ile Glu Thr Ile Lys Glu Leu Lys Ser Gly Tyr Leu Ser 965 970 975 His Val Val His Gln Ile Asn Gln Leu Met Leu Lys Tyr Asn Ala Ile 980 985 990 Val Val Leu Glu Asp Leu Asn Phe Gly Phe Lys Arg Gly Arg Phe Lys 995 1000 1005 Val Glu Lys Gln Ile Tyr Gln Asn Phe Glu Asn Ala Leu Ile Lys 1010 1015 1020 Lys Leu Asn His Leu Val Leu Lys Asp Lys Ala Asp Asp Glu Ile 1025 1030 1035 Gly Ser Tyr Lys Asn Ala Leu Gln Leu Thr Asn Asn Phe Thr Asp 1040 1045 1050 Leu Lys Ser Ile Gly Lys Gln Thr Gly Phe Leu Phe Tyr Val Pro 1055 1060 1065 Ala Trp Asn Thr Ser Lys Ile Asp Pro Glu Thr Gly Phe Val Asp 1070 1075 1080 Leu Leu Lys Pro Arg Tyr Glu Asn Ile Ala Gln Ser Gln Ala Phe 1085 1090 1095 Phe Gly Lys Phe Asp Lys Ile Cys Tyr Asn Thr Asp Lys Gly Tyr 1100 1105 1110 Phe Glu Phe His Ile Asp Tyr Ala Lys Phe Thr Asp Lys Ala Lys 1115 1120 1125 Asn Ser Arg Gln Lys Trp Ala Ile Cys Ser His Gly Asp Lys Arg 1130 1135 1140 Tyr Val Tyr Asp Lys Thr Ala Asn Gln Asn Lys Gly Ala Ala Lys 1145 1150 1155 Gly Ile Asn Val Asn Asp Glu Leu Lys Ser Leu Phe Ala Arg Tyr 1160 1165 1170 His Ile Asn Asp Lys Gln Pro Asn Leu Val Met Asp Ile Cys Gln 1175 1180 1185 Asn Asn Asp Lys Glu Phe His Lys Ser Leu Met Cys Leu Leu Lys 1190 1195 1200 Thr Leu Leu Ala Leu Arg Tyr Ser Asn Ala Ser Ser Asp Glu Asp 1205 1210 1215 Phe Ile Leu Ser Pro Val Ala Asn Asp Glu Gly Val Phe Phe Asn 1220 1225 1230 Ser Ala Leu Ala Asp Asp Thr Gln Pro Gln Asn Ala Asp Ala Asn 1235 1240 1245 Gly Ala Tyr His Ile Ala Leu Lys Gly Leu Trp Leu Leu Asn Glu 1250 1255 1260 Leu Lys Asn Ser Asp Asp Leu Asn Lys Val Lys Leu Ala Ile Asp 1265 1270 1275 Asn Gln Thr Trp Leu Asn Phe Ala Gln Asn Arg Pro Lys Lys Lys 1280 1285 1290 Arg Lys Val Ser Gly Gly Ser Ser Gly Gly Ser Pro Lys Lys Lys 1295 1300 1305 Arg Lys Val 1310 <210> 44 <211> 36 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 44 Gly Gly Gly Gly Ser Gly Gly Gly Gly Gly Ser Gly Gly Gly Gly Gly 1 5 10 15 Ser Gly Gly Gly Gly Gly Ser Gly Gly Gly Gly Gly Ser Gly Gly Gly 20 25 30 Gly Gly Ser Gly 35 <210> 45 <211> 1260 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <220> <221> xNLS-03 <222> (1)..(9) <220> <221> xEpitope-03 <222> (10)..(17) <220> <221> xNLS-04 <222> (1245)..(1260) <400> 45 Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala 1 5 10 15 Ala Ser Lys Leu Glu Lys Phe Thr Asn Cys Tyr Ser Leu Ser Lys Thr 20 25 30 Leu Arg Phe Lys Ala Ile Pro Val Gly Lys Thr Gln Glu Asn Ile Asp 35 40 45 Asn Lys Arg Leu Leu Val Glu Asp Glu Lys Arg Ala Glu Asp Tyr Lys 50 55 60 Gly Val Lys Lys Leu Leu Asp Arg Tyr Tyr Leu Ser Phe Ile Asn Asp 65 70 75 80 Val Leu His Ser Ile Lys Leu Lys Asn Leu Asn Asn Tyr Ile Ser Leu 85 90 95 Phe Arg Lys Lys Thr Arg Thr Glu Lys Glu Asn Lys Glu Leu Glu Asn 100 105 110 Leu Glu Ile Asn Leu Arg Lys Glu Ile Ala Lys Ala Phe Lys Gly Asn 115 120 125 Glu Gly Tyr Lys Ser Leu Phe Lys Lys Asp Ile Ile Glu Thr Ile Leu 130 135 140 Pro Glu Phe Leu Asp Asp Lys Asp Glu Ile Ala Leu Val Asn Ser Phe 145 150 155 160 Asn Gly Phe Thr Thr Ala Phe Thr Gly Phe Phe Asp Asn Arg Glu Asn 165 170 175 Met Phe Ser Glu Glu Ala Lys Ser Thr Ser Ile Ala Phe Arg Cys Ile 180 185 190 Asn Glu Asn Leu Thr Arg Tyr Ile Ser Asn Met Asp Ile Phe Glu Lys 195 200 205 Val Asp Ala Ile Phe Asp Lys His Glu Val Gln Glu Ile Lys Glu Lys 210 215 220 Ile Leu Asn Ser Asp Tyr Asp Val Glu Asp Phe Phe Glu Gly Glu Phe 225 230 235 240 Phe Asn Phe Val Leu Thr Gln Glu Gly Ile Asp Val Tyr Asn Ala Ile 245 250 255 Ile Gly Gly Phe Val Thr Glu Ser Gly Glu Lys Ile Lys Gly Leu Asn 260 265 270 Glu Tyr Ile Asn Leu Tyr Asn Gln Lys Thr Lys Gln Lys Leu Pro Lys 275 280 285 Phe Lys Pro Leu Tyr Lys Gln Val Leu Ser Asp Arg Glu Ser Leu Ser 290 295 300 Phe Tyr Gly Glu Gly Tyr Thr Ser Asp Glu Glu Val Leu Glu Val Phe 305 310 315 320 Arg Asn Thr Leu Asn Lys Asn Ser Glu Ile Phe Ser Ser Ile Lys Lys 325 330 335 Leu Glu Lys Leu Phe Lys Asn Phe Asp Glu Tyr Ser Ser Ala Gly Ile 340 345 350 Phe Val Lys Asn Gly Pro Ala Ile Ser Thr Ile Ser Lys Asp Ile Phe 355 360 365 Gly Glu Trp Asn Val Ile Arg Asp Lys Trp Asn Ala Glu Tyr Asp Asp 370 375 380 Ile His Leu Lys Lys Lys Ala Val Val Thr Glu Lys Tyr Glu Asp Asp 385 390 395 400 Arg Arg Lys Ser Phe Lys Lys Ile Gly Ser Phe Ser Leu Glu Gln Leu 405 410 415 Gln Glu Tyr Ala Asp Ala Asp Leu Ser Val Val Glu Lys Leu Lys Glu 420 425 430 Ile Ile Ile Gln Lys Val Asp Glu Ile Tyr Lys Val Tyr Gly Ser Ser 435 440 445 Glu Lys Leu Phe Asp Ala Asp Phe Val Leu Glu Lys Ser Leu Lys Lys 450 455 460 Asn Asp Ala Val Val Ala Ile Met Lys Asp Leu Leu Asp Ser Val Lys 465 470 475 480 Ser Phe Glu Asn Tyr Ile Lys Ala Phe Phe Gly Glu Gly Lys Glu Thr 485 490 495 Asn Arg Asp Glu Ser Phe Tyr Gly Asp Phe Val Leu Ala Tyr Asp Ile 500 505 510 Leu Leu Lys Val Asp His Ile Tyr Asp Ala Ile Arg Asn Tyr Val Thr 515 520 525 Gln Lys Pro Tyr Ser Lys Asp Lys Phe Lys Leu Tyr Phe Gln Asn Pro 530 535 540 Gln Phe Met Gly Gly Trp Asp Lys Asp Lys Glu Thr Asp Tyr Arg Ala 545 550 555 560 Thr Ile Leu Arg Tyr Gly Ser Lys Tyr Tyr Leu Ala Ile Met Asp Lys 565 570 575 Lys Tyr Ala Lys Cys Leu Gln Lys Ile Asp Lys Asp Asp Val Asn Gly 580 585 590 Asn Tyr Glu Lys Ile Asn Tyr Lys Leu Leu Pro Gly Pro Asn Lys Met 595 600 605 Leu Pro Lys Val Phe Phe Ser Lys Lys Trp Met Ala Tyr Tyr Asn Pro 610 615 620 Ser Glu Asp Ile Gln Lys Ile Tyr Lys Asn Gly Thr Phe Lys Lys Gly 625 630 635 640 Asp Met Phe Asn Leu Asn Asp Cys His Lys Leu Ile Asp Phe Phe Lys 645 650 655 Asp Ser Ile Ser Arg Tyr Pro Lys Trp Ser Asn Ala Tyr Asp Phe Asn 660 665 670 Phe Ser Glu Thr Glu Lys Tyr Lys Asp Ile Ala Gly Phe Tyr Arg Glu 675 680 685 Val Glu Glu Gln Gly Tyr Lys Val Ser Phe Glu Ser Ala Ser Lys Lys 690 695 700 Glu Val Asp Lys Leu Val Glu Glu Gly Lys Leu Tyr Met Phe Gln Ile 705 710 715 720 Tyr Asn Lys Asp Phe Ser Asp Lys Ser His Gly Thr Pro Asn Leu His 725 730 735 Thr Met Tyr Phe Lys Leu Leu Phe Asp Glu Asn Asn His Gly Gln Ile 740 745 750 Arg Leu Ser Gly Gly Ala Glu Leu Phe Met Arg Arg Ala Ser Leu Lys 755 760 765 Lys Glu Glu Leu Val Val His Pro Ala Asn Ser Pro Ile Ala Asn Lys 770 775 780 Asn Pro Asp Asn Pro Lys Lys Thr Thr Thr Leu Ser Tyr Asp Val Tyr 785 790 795 800 Lys Asp Lys Arg Phe Ser Glu Asp Gln Tyr Glu Leu His Ile Pro Ile 805 810 815 Ala Ile Asn Lys Cys Pro Lys Asn Ile Phe Lys Ile Asn Thr Glu Val 820 825 830 Arg Val Leu Leu Lys His Asp Asp Asn Pro Tyr Val Ile Gly Ile Asp 835 840 845 Arg Gly Glu Arg Asn Leu Leu Tyr Ile Val Val Val Asp Gly Lys Gly 850 855 860 Asn Ile Val Glu Gln Tyr Ser Leu Asn Glu Ile Ile Asn Asn Phe Asn 865 870 875 880 Gly Ile Arg Ile Lys Thr Asp Tyr His Ser Leu Leu Asp Lys Lys Glu 885 890 895 Lys Glu Arg Phe Glu Ala Arg Gln Asn Trp Thr Ser Ile Glu Asn Ile 900 905 910 Lys Glu Leu Lys Ala Gly Tyr Ile Ser Gln Val Val His Lys Ile Cys 915 920 925 Glu Leu Val Glu Lys Tyr Asp Ala Val Ile Ala Leu Glu Asp Leu Asn 930 935 940 Ser Gly Phe Lys Asn Ser Arg Val Lys Val Glu Lys Gln Val Tyr Gln 945 950 955 960 Lys Phe Glu Lys Met Leu Ile Asp Lys Leu Asn Tyr Met Val Asp Lys 965 970 975 Lys Ser Asn Pro Cys Ala Thr Gly Gly Ala Leu Lys Gly Tyr Gln Ile 980 985 990 Thr Asn Lys Phe Glu Ser Phe Lys Ser Met Ser Thr Gln Asn Gly Phe 995 1000 1005 Ile Phe Tyr Ile Pro Ala Trp Leu Thr Ser Lys Ile Asp Pro Ser 1010 1015 1020 Thr Gly Phe Val Asn Leu Leu Lys Thr Lys Tyr Thr Ser Ile Ala 1025 1030 1035 Asp Ser Lys Lys Phe Ile Ser Ser Phe Asp Arg Ile Met Tyr Val 1040 1045 1050 Pro Glu Glu Asp Leu Phe Glu Phe Ala Leu Asp Tyr Lys Asn Phe 1055 1060 1065 Ser Arg Thr Asp Ala Asp Tyr Ile Lys Lys Trp Lys Leu Tyr Ser 1070 1075 1080 Tyr Gly Asn Arg Ile Arg Ile Phe Arg Asn Pro Lys Lys Asn Asn 1085 1090 1095 Val Phe Asp Trp Glu Glu Val Cys Leu Thr Ser Ala Tyr Lys Glu 1100 1105 1110 Leu Phe Asn Lys Tyr Gly Ile Asn Tyr Gln Gln Gly Asp Ile Arg 1115 1120 1125 Ala Leu Leu Cys Glu Gln Ser Asp Lys Ala Phe Tyr Ser Ser Phe 1130 1135 1140 Met Ala Leu Met Ser Leu Met Leu Gln Met Arg Asn Ser Ile Thr 1145 1150 1155 Gly Arg Thr Asp Val Asp Phe Leu Ile Ser Pro Val Lys Asn Ser 1160 1165 1170 Asp Gly Ile Phe Tyr Asp Ser Arg Asn Tyr Glu Ala Gln Glu Asn 1175 1180 1185 Ala Ile Leu Pro Lys Asn Ala Asp Ala Asn Gly Ala Tyr Asn Ile 1190 1195 1200 Ala Arg Lys Val Leu Trp Ala Ile Gly Gln Phe Lys Lys Ala Glu 1205 1210 1215 Asp Glu Lys Leu Asp Lys Val Lys Ile Ala Ile Ser Asn Lys Glu 1220 1225 1230 Trp Leu Glu Tyr Ala Gln Thr Ser Val Lys His Lys Arg Pro Ala 1235 1240 1245 Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys 1250 1255 1260 <210> 46 <211> 1283 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <220> <221> xNLS-03 <222> (1)..(9) <220> <221> xEpitope-03 <222> (10)..(17) <220> <221> xNLS-04 <222> (1268)..(1283) <400> 46 Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala 1 5 10 15 Ala Leu Phe Gln Asp Phe Thr His Leu Tyr Pro Leu Ser Lys Thr Val 20 25 30 Arg Phe Glu Leu Lys Pro Ile Gly Arg Thr Leu Glu His Ile His Ala 35 40 45 Lys Asn Phe Leu Ser Gln Asp Glu Thr Met Ala Asp Met Tyr Gln Lys 50 55 60 Val Lys Val Ile Leu Asp Asp Tyr His Arg Asp Phe Ile Ala Asp Met 65 70 75 80 Met Gly Glu Val Lys Leu Thr Lys Leu Ala Glu Phe Tyr Asp Val Tyr 85 90 95 Leu Lys Phe Arg Lys Asn Pro Lys Asp Asp Gly Leu Gln Lys Gln Leu 100 105 110 Lys Asp Leu Gln Ala Val Leu Arg Lys Glu Ser Val Lys Pro Ile Gly 115 120 125 Ser Gly Gly Lys Tyr Lys Thr Gly Tyr Asp Arg Leu Phe Gly Ala Lys 130 135 140 Leu Phe Lys Asp Gly Lys Glu Leu Gly Asp Leu Ala Lys Phe Val Ile 145 150 155 160 Ala Gln Glu Gly Glu Ser Ser Pro Lys Leu Ala His Leu Ala His Phe 165 170 175 Glu Lys Phe Ser Thr Tyr Phe Thr Gly Phe His Asp Asn Arg Lys Asn 180 185 190 Met Tyr Ser Asp Glu Asp Lys His Thr Ala Ile Ala Tyr Arg Leu Ile 195 200 205 His Glu Asn Leu Pro Arg Phe Ile Asp Asn Leu Gln Ile Leu Thr Thr 210 215 220 Ile Lys Gln Lys His Ser Ala Leu Tyr Asp Gln Ile Ile Asn Glu Leu 225 230 235 240 Thr Ala Ser Gly Leu Asp Val Ser Leu Ala Ser His Leu Asp Gly Tyr 245 250 255 His Lys Leu Leu Thr Gln Glu Gly Ile Thr Ala Tyr Asn Arg Ile Ile 260 265 270 Gly Glu Val Asn Gly Tyr Thr Asn Lys His Asn Gln Ile Cys His Lys 275 280 285 Ser Glu Arg Ile Ala Lys Leu Arg Pro Leu His Lys Gln Ile Leu Ser 290 295 300 Asp Gly Met Gly Val Ser Phe Leu Pro Ser Lys Phe Ala Asp Asp Ser 305 310 315 320 Glu Met Cys Gln Ala Val Asn Glu Phe Tyr Arg His Tyr Thr Asp Val 325 330 335 Phe Ala Lys Val Gln Ser Leu Phe Asp Gly Phe Asp Asp His Gln Lys 340 345 350 Asp Gly Ile Tyr Val Glu His Lys Asn Leu Asn Glu Leu Ser Lys Gln 355 360 365 Ala Phe Gly Asp Phe Ala Leu Leu Gly Arg Val Leu Asp Gly Tyr Tyr 370 375 380 Val Asp Val Val Asn Pro Glu Phe Asn Glu Arg Phe Ala Lys Ala Lys 385 390 395 400 Thr Asp Asn Ala Lys Ala Lys Leu Thr Lys Glu Lys Asp Lys Phe Ile 405 410 415 Lys Gly Val His Ser Leu Ala Ser Leu Glu Gln Ala Ile Glu His His 420 425 430 Thr Ala Arg His Asp Asp Glu Ser Val Gln Ala Gly Lys Leu Gly Gln 435 440 445 Tyr Phe Lys His Gly Leu Ala Gly Val Asp Asn Pro Ile Gln Lys Ile 450 455 460 His Asn Asn His Ser Thr Ile Lys Gly Phe Leu Glu Arg Glu Arg Pro 465 470 475 480 Ala Gly Glu Arg Ala Leu Pro Lys Ile Lys Ser Gly Lys Asn Pro Glu 485 490 495 Met Thr Gln Leu Arg Gln Leu Lys Glu Leu Leu Asp Asn Ala Leu Asn 500 505 510 Val Ala His Phe Ala Lys Leu Leu Thr Thr Lys Thr Thr Leu Asp Asn 515 520 525 Gln Asp Gly Asn Phe Tyr Gly Glu Phe Gly Val Leu Tyr Asp Glu Leu 530 535 540 Ala Lys Ile Pro Thr Leu Tyr Asn Lys Val Arg Asp Tyr Leu Ser Gln 545 550 555 560 Lys Pro Phe Ser Thr Glu Lys Tyr Lys Leu Asn Phe Gly Asn Pro Thr 565 570 575 Leu Leu Asn Gly Trp Asp Leu Asn Lys Glu Lys Asp Asn Phe Gly Val 580 585 590 Ile Leu Gln Lys Asp Gly Cys Tyr Tyr Leu Ala Leu Leu Asp Lys Ala 595 600 605 His Lys Lys Val Phe Asp Asn Ala Pro Asn Thr Gly Lys Asn Val Tyr 610 615 620 Gln Lys Met Val Tyr Lys Leu Leu Pro Gly Pro Asn Lys Met Leu Pro 625 630 635 640 Lys Val Phe Phe Ala Lys Ser Asn Leu Asp Tyr Tyr Asn Pro Ser Ala 645 650 655 Glu Leu Leu Asp Lys Tyr Ala Lys Gly Thr His Lys Lys Gly Asp Asn 660 665 670 Phe Asn Leu Lys Asp Cys His Ala Leu Ile Asp Phe Phe Lys Ala Gly 675 680 685 Ile Asn Lys His Pro Glu Trp Gln His Phe Gly Phe Lys Phe Ser Pro 690 695 700 Thr Ser Ser Tyr Arg Asp Leu Ser Asp Phe Tyr Arg Glu Val Glu Pro 705 710 715 720 Gln Gly Tyr Gln Val Lys Phe Val Asp Ile Asn Ala Asp Tyr Ile Asp 725 730 735 Glu Leu Val Glu Gln Gly Lys Leu Tyr Leu Phe Gln Ile Tyr Asn Lys 740 745 750 Asp Phe Ser Pro Lys Ala His Gly Lys Pro Asn Leu His Thr Leu Tyr 755 760 765 Phe Lys Ala Leu Phe Ser Glu Asp Asn Leu Ala Asp Pro Ile Tyr Lys 770 775 780 Leu Asn Gly Glu Ala Gln Ile Phe Tyr Arg Lys Ala Ser Leu Asp Met 785 790 795 800 Asn Glu Thr Thr Ile His Arg Ala Gly Glu Val Leu Glu Asn Lys Asn 805 810 815 Pro Asp Asn Pro Lys Lys Arg Gln Phe Val Tyr Asp Ile Ile Lys Asp 820 825 830 Lys Arg Tyr Thr Gln Asp Lys Phe Met Leu His Val Pro Ile Thr Met 835 840 845 Asn Phe Gly Val Gln Gly Met Thr Ile Lys Glu Phe Asn Lys Lys Val 850 855 860 Asn Gln Ser Ile Gln Gln Tyr Asp Glu Val Asn Val Ile Gly Ile Asp 865 870 875 880 Arg Gly Glu Arg His Leu Leu Tyr Leu Thr Val Ile Asn Ser Lys Gly 885 890 895 Glu Ile Leu Glu Gln Arg Ser Leu Asn Asp Ile Thr Thr Ala Ser Ala 900 905 910 Asn Gly Thr Gln Val Thr Thr Pro Tyr His Lys Ile Leu Asp Lys Arg 915 920 925 Glu Ile Glu Arg Leu Asn Ala Arg Val Gly Trp Gly Glu Ile Glu Thr 930 935 940 Ile Lys Glu Leu Lys Ser Gly Tyr Leu Ser His Val Val His Gln Ile 945 950 955 960 Asn Gln Leu Met Leu Lys Tyr Asn Ala Ile Val Val Leu Glu Asp Leu 965 970 975 Asn Phe Gly Phe Lys Arg Gly Arg Phe Lys Val Glu Lys Gln Ile Tyr 980 985 990 Gln Asn Phe Glu Asn Ala Leu Ile Lys Lys Leu Asn His Leu Val Leu 995 1000 1005 Lys Asp Lys Ala Asp Asp Glu Ile Gly Ser Tyr Lys Asn Ala Leu 1010 1015 1020 Gln Leu Thr Asn Asn Phe Thr Asp Leu Lys Ser Ile Gly Lys Gln 1025 1030 1035 Thr Gly Phe Leu Phe Tyr Val Pro Ala Trp Asn Thr Ser Lys Ile 1040 1045 1050 Asp Pro Glu Thr Gly Phe Val Asp Leu Leu Lys Pro Arg Tyr Glu 1055 1060 1065 Asn Ile Ala Gln Ser Gln Ala Phe Phe Gly Lys Phe Asp Lys Ile 1070 1075 1080 Cys Tyr Asn Thr Asp Lys Gly Tyr Phe Glu Phe His Ile Asp Tyr 1085 1090 1095 Ala Lys Phe Thr Asp Lys Ala Lys Asn Ser Arg Gln Lys Trp Ala 1100 1105 1110 Ile Cys Ser His Gly Asp Lys Arg Tyr Val Tyr Asp Lys Thr Ala 1115 1120 1125 Asn Gln Asn Lys Gly Ala Ala Lys Gly Ile Asn Val Asn Asp Glu 1130 1135 1140 Leu Lys Ser Leu Phe Ala Arg Tyr His Ile Asn Asp Lys Gln Pro 1145 1150 1155 Asn Leu Val Met Asp Ile Cys Gln Asn Asn Asp Lys Glu Phe His 1160 1165 1170 Lys Ser Leu Met Cys Leu Leu Lys Thr Leu Leu Ala Leu Arg Tyr 1175 1180 1185 Ser Asn Ala Ser Ser Asp Glu Asp Phe Ile Leu Ser Pro Val Ala 1190 1195 1200 Asn Asp Glu Gly Val Phe Phe Asn Ser Ala Leu Ala Asp Asp Thr 1205 1210 1215 Gln Pro Gln Asn Ala Asp Ala Asn Gly Ala Tyr His Ile Ala Leu 1220 1225 1230 Lys Gly Leu Trp Leu Leu Asn Glu Leu Lys Asn Ser Asp Asp Leu 1235 1240 1245 Asn Lys Val Lys Leu Ala Ile Asp Asn Gln Thr Trp Leu Asn Phe 1250 1255 1260 Ala Gln Asn Arg Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln 1265 1270 1275 Ala Lys Lys Lys Lys 1280 <210> 47 <211> 1352 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 47 Met Thr Gln Phe Glu Gly Phe Thr Asn Leu Tyr Gln Val Ser Lys Thr 1 5 10 15 Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Lys His Ile Gln 20 25 30 Glu Gln Gly Phe Ile Glu Glu Asp Lys Ala Arg Asn Asp His Tyr Lys 35 40 45 Glu Leu Lys Pro Ile Ile Asp Arg Ile Tyr Lys Thr Tyr Ala Asp Gln 50 55 60 Cys Leu Gln Leu Val Gln Leu Asp Trp Glu Asn Leu Ser Ala Ala Ile 65 70 75 80 Asp Ser Tyr Arg Lys Glu Lys Thr Glu Glu Thr Arg Asn Ala Leu Ile 85 90 95 Glu Glu Gln Ala Thr Tyr Arg Asn Ala Ile His Asp Tyr Phe Ile Gly 100 105 110 Arg Thr Asp Asn Leu Thr Asp Ala Ile Asn Lys Arg His Ala Glu Ile 115 120 125 Tyr Lys Gly Leu Phe Lys Ala Glu Leu Phe Asn Gly Lys Val Leu Lys 130 135 140 Gln Leu Gly Thr Val Thr Thr Thr Glu His Glu Asn Ala Leu Leu Arg 145 150 155 160 Ser Phe Asp Lys Phe Thr Thr Tyr Phe Ser Gly Phe Tyr Glu Asn Arg 165 170 175 Lys Asn Val Phe Ser Ala Glu Asp Ile Ser Thr Ala Ile Pro His Arg 180 185 190 Ile Val Gln Asp Asn Phe Pro Lys Phe Lys Glu Asn Cys His Ile Phe 195 200 205 Thr Arg Leu Ile Thr Ala Val Pro Ser Leu Arg Glu His Phe Glu Asn 210 215 220 Val Lys Lys Ala Ile Gly Ile Phe Val Ser Thr Ser Ile Glu Glu Val 225 230 235 240 Phe Ser Phe Pro Phe Tyr Asn Gln Leu Leu Thr Gln Thr Gln Ile Asp 245 250 255 Leu Tyr Asn Gln Leu Leu Gly Gly Ile Ser Arg Glu Ala Gly Thr Glu 260 265 270 Lys Ile Lys Gly Leu Asn Glu Val Leu Asn Leu Ala Ile Gln Lys Asn 275 280 285 Asp Glu Thr Ala His Ile Ile Ala Ser Leu Pro His Arg Phe Ile Pro 290 295 300 Leu Phe Lys Gln Ile Leu Ser Asp Arg Asn Thr Leu Ser Phe Ile Leu 305 310 315 320 Glu Glu Phe Lys Ser Asp Glu Glu Val Ile Gln Ser Phe Cys Lys Tyr 325 330 335 Lys Thr Leu Leu Arg Asn Glu Asn Val Leu Glu Thr Ala Glu Ala Leu 340 345 350 Phe Asn Glu Leu Asn Ser Ile Asp Leu Thr His Ile Phe Ile Ser His 355 360 365 Lys Lys Leu Glu Thr Ile Ser Ser Ala Leu Cys Asp His Trp Asp Thr 370 375 380 Leu Arg Asn Ala Leu Tyr Glu Arg Arg Ile Ser Glu Leu Thr Gly Lys 385 390 395 400 Ile Thr Lys Ser Ala Lys Glu Lys Val Gln Arg Ser Leu Lys His Glu 405 410 415 Asp Ile Asn Leu Gln Glu Ile Ile Ser Ala Ala Gly Lys Glu Leu Ser 420 425 430 Glu Ala Phe Lys Gln Lys Thr Ser Glu Ile Leu Ser His Ala His Ala 435 440 445 Ala Leu Asp Gln Pro Leu Pro Thr Thr Leu Lys Lys Gln Glu Glu Lys 450 455 460 Glu Ile Leu Lys Ser Gln Leu Asp Ser Leu Leu Gly Leu Tyr His Leu 465 470 475 480 Leu Asp Trp Phe Ala Val Asp Glu Ser Asn Glu Val Asp Pro Glu Phe 485 490 495 Ser Ala Arg Leu Thr Gly Ile Lys Leu Glu Met Glu Pro Ser Leu Ser 500 505 510 Phe Tyr Asn Lys Ala Arg Asn Tyr Ala Thr Lys Lys Pro Tyr Ser Val 515 520 525 Glu Lys Phe Lys Leu Asn Phe Gln Met Pro Thr Leu Ala Ser Gly Trp 530 535 540 Asp Val Asn Lys Glu Lys Asn Asn Gly Ala Ile Leu Phe Val Lys Asn 545 550 555 560 Gly Leu Tyr Tyr Leu Gly Ile Met Pro Lys Gln Lys Gly Arg Tyr Lys 565 570 575 Ala Leu Ser Phe Glu Pro Thr Glu Lys Thr Ser Glu Gly Phe Asp Lys 580 585 590 Met Tyr Tyr Asp Tyr Phe Pro Asp Ala Ala Lys Met Ile Pro Lys Cys 595 600 605 Ser Thr Gln Leu Lys Ala Val Thr Ala His Phe Gln Thr His Thr Thr 610 615 620 Pro Ile Leu Leu Ser Asn Asn Phe Ile Glu Pro Leu Glu Ile Thr Lys 625 630 635 640 Glu Ile Tyr Asp Leu Asn Asn Pro Glu Lys Glu Pro Lys Lys Phe Gln 645 650 655 Thr Ala Tyr Ala Lys Lys Thr Gly Asp Gln Lys Gly Tyr Arg Glu Ala 660 665 670 Leu Cys Lys Trp Ile Asp Phe Thr Arg Asp Phe Leu Ser Lys Tyr Thr 675 680 685 Lys Thr Thr Ser Ile Asp Leu Ser Ser Leu Arg Pro Ser Ser Gln Tyr 690 695 700 Lys Asp Leu Gly Glu Tyr Tyr Ala Glu Leu Asn Pro Leu Leu Tyr His 705 710 715 720 Ile Ser Phe Gln Arg Ile Ala Glu Lys Glu Ile Met Asp Ala Val Glu 725 730 735 Thr Gly Lys Leu Tyr Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ala Lys 740 745 750 Gly His His Gly Lys Pro Asn Leu His Thr Leu Tyr Trp Thr Gly Leu 755 760 765 Phe Ser Pro Glu Asn Leu Ala Lys Thr Ser Ile Lys Leu Asn Gly Gln 770 775 780 Ala Glu Leu Phe Tyr Arg Pro Lys Ser Arg Met Lys Arg Met Ala His 785 790 795 800 Arg Leu Gly Glu Lys Met Leu Asn Lys Lys Leu Lys Asp Gln Lys Thr 805 810 815 Pro Ile Pro Asp Thr Leu Tyr Gln Glu Leu Tyr Asp Tyr Val Asn His 820 825 830 Arg Leu Ser His Asp Leu Ser Asp Glu Ala Arg Ala Leu Leu Pro Asn 835 840 845 Val Ile Thr Lys Glu Val Ser His Glu Ile Ile Lys Asp Arg Arg Phe 850 855 860 Thr Ser Asp Lys Phe Phe Phe His Val Pro Ile Thr Leu Asn Tyr Gln 865 870 875 880 Ala Ala Asn Ser Pro Ser Lys Phe Asn Gln Arg Val Asn Ala Tyr Leu 885 890 895 Lys Glu His Pro Glu Thr Pro Ile Ile Gly Ile Asp Arg Gly Glu Arg 900 905 910 Asn Leu Ile Tyr Ile Thr Val Ile Asp Ser Thr Gly Lys Ile Leu Glu 915 920 925 Gln Arg Ser Leu Asn Thr Ile Gln Gln Phe Asp Tyr Gln Lys Lys Leu 930 935 940 Asp Asn Arg Glu Lys Glu Arg Val Ala Ala Arg Gln Ala Trp Ser Val 945 950 955 960 Val Gly Thr Ile Lys Asp Leu Lys Gln Gly Tyr Leu Ser Gln Val Ile 965 970 975 His Glu Ile Val Asp Leu Met Ile His Tyr Gln Ala Val Val Val Leu 980 985 990 Glu Asn Leu Asn Phe Gly Phe Lys Ser Lys Arg Thr Gly Ile Ala Glu 995 1000 1005 Lys Ala Val Tyr Gln Gln Phe Glu Lys Met Leu Ile Asp Lys Leu 1010 1015 1020 Asn Cys Leu Val Leu Lys Asp Tyr Pro Ala Glu Lys Val Gly Gly 1025 1030 1035 Val Leu Asn Pro Tyr Gln Leu Thr Asp Gln Phe Thr Ser Phe Ala 1040 1045 1050 Lys Met Gly Thr Gln Ser Gly Phe Leu Phe Tyr Val Pro Ala Pro 1055 1060 1065 Tyr Thr Ser Lys Ile Asp Pro Leu Thr Gly Phe Val Asp Pro Phe 1070 1075 1080 Val Trp Lys Thr Ile Lys Asn His Glu Ser Arg Lys His Phe Leu 1085 1090 1095 Glu Gly Phe Asp Phe Leu His Tyr Asp Val Lys Thr Gly Asp Phe 1100 1105 1110 Ile Leu His Phe Lys Met Asn Arg Asn Leu Ser Phe Gln Arg Gly 1115 1120 1125 Leu Pro Gly Phe Met Pro Ala Trp Asp Ile Val Phe Glu Lys Asn 1130 1135 1140 Glu Thr Gln Phe Asp Ala Lys Gly Thr Pro Phe Ile Ala Gly Lys 1145 1150 1155 Arg Ile Val Pro Val Ile Glu Asn His Arg Phe Thr Gly Arg Tyr 1160 1165 1170 Arg Asp Leu Tyr Pro Ala Asn Glu Leu Ile Ala Leu Leu Glu Glu 1175 1180 1185 Lys Gly Ile Val Phe Arg Asp Gly Ser Asn Ile Leu Pro Lys Leu 1190 1195 1200 Leu Glu Asn Asp Asp Ser His Ala Ile Asp Thr Met Val Ala Leu 1205 1210 1215 Ile Arg Ser Val Leu Gln Met Arg Asn Ser Asn Ala Ala Thr Gly 1220 1225 1230 Glu Asp Tyr Ile Asn Ser Pro Val Arg Asp Leu Asn Gly Val Cys 1235 1240 1245 Phe Asp Ser Arg Phe Gln Asn Pro Glu Trp Pro Met Asp Ala Asp 1250 1255 1260 Ala Asn Gly Ala Tyr His Ile Ala Leu Lys Gly Gln Leu Leu Leu 1265 1270 1275 Asn His Leu Lys Glu Ser Lys Asp Leu Lys Leu Gln Asn Gly Ile 1280 1285 1290 Ser Asn Gln Asp Trp Leu Ala Tyr Ile Gln Glu Leu Arg Asn Lys 1295 1300 1305 Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys 1310 1315 1320 Gly Ser Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Tyr Pro Tyr Asp 1325 1330 1335 Val Pro Asp Tyr Ala Tyr Pro Tyr Asp Val Pro Asp Tyr Ala 1340 1345 1350 <210> 48 <211> 1387 <212> PRT <213> Artificial Sequence <220> <223> Synethtic <220> <221> xSV40NLS-06 <222> (2)..(8) <220> <221> xLinker-06 <222> (9)..(39) <220> <221> xSV40NLS-04 <222> (1339)..(1345) <220> <221> xsGGSlinker-02 <222> (1346)..(1349) <220> <221> xsGGSlinker-02 <222> (1350)..(1353) <220> <221> xSV40NLS-07 <222> (1354)..(1360) <220> <221> tag3XHA <222> (1361)..(1387) <400> 48 Met Pro Lys Lys Lys Arg Lys Val Gly Gly Gly Gly Ser Gly Gly Gly 1 5 10 15 Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly 20 25 30 Ser Gly Gly Gly Gly Ser Met Ser Ile Tyr Gln Glu Phe Val Asn Lys 35 40 45 Tyr Ser Leu Ser Lys Thr Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys 50 55 60 Thr Leu Glu Asn Ile Lys Ala Arg Gly Leu Ile Leu Asp Asp Glu Lys 65 70 75 80 Arg Ala Lys Asp Tyr Lys Lys Ala Lys Gln Ile Ile Asp Lys Tyr His 85 90 95 Gln Phe Phe Ile Glu Glu Ile Leu Ser Ser Val Cys Ile Ser Glu Asp 100 105 110 Leu Leu Gln Asn Tyr Ser Asp Val Tyr Phe Lys Leu Lys Lys Ser Asp 115 120 125 Asp Asp Asn Leu Gln Lys Asp Phe Lys Ser Ala Lys Asp Thr Ile Lys 130 135 140 Lys Gln Ile Ser Glu Tyr Ile Lys Asp Ser Glu Lys Phe Lys Asn Leu 145 150 155 160 Phe Asn Gln Asn Leu Ile Asp Ala Lys Lys Gly Gln Glu Ser Asp Leu 165 170 175 Ile Leu Trp Leu Lys Gln Ser Lys Asp Asn Gly Ile Glu Leu Phe Lys 180 185 190 Ala Asn Ser Asp Ile Thr Asp Ile Asp Glu Ala Leu Glu Ile Ile Lys 195 200 205 Ser Phe Lys Gly Trp Thr Thr Tyr Phe Lys Gly Phe His Glu Asn Arg 210 215 220 Lys Asn Val Tyr Ser Ser Asn Asp Ile Pro Thr Ser Ile Ile Tyr Arg 225 230 235 240 Ile Val Asp Asp Asn Leu Pro Lys Phe Leu Glu Asn Lys Ala Lys Tyr 245 250 255 Glu Ser Leu Lys Asp Lys Ala Pro Glu Ala Ile Asn Tyr Glu Gln Ile 260 265 270 Lys Lys Asp Leu Ala Glu Glu Leu Thr Phe Asp Ile Asp Tyr Lys Thr 275 280 285 Ser Glu Val Asn Gln Arg Val Phe Ser Leu Asp Glu Val Phe Glu Ile 290 295 300 Ala Asn Phe Asn Asn Tyr Leu Asn Gln Ser Gly Ile Thr Lys Phe Asn 305 310 315 320 Thr Ile Ile Gly Gly Lys Phe Val Asn Gly Glu Asn Thr Lys Arg Lys 325 330 335 Gly Ile Asn Glu Tyr Ile Asn Leu Tyr Ser Gln Gln Ile Asn Asp Lys 340 345 350 Thr Leu Lys Lys Tyr Lys Met Ser Val Leu Phe Lys Gln Ile Leu Ser 355 360 365 Asp Thr Glu Ser Lys Ser Phe Val Ile Asp Lys Leu Glu Asp Asp Ser 370 375 380 Asp Val Val Thr Thr Met Gln Ser Phe Tyr Glu Gln Ile Ala Ala Phe 385 390 395 400 Lys Thr Val Glu Glu Lys Ser Ile Lys Glu Thr Leu Ser Leu Leu Phe 405 410 415 Asp Asp Leu Lys Ala Gln Lys Leu Asp Leu Ser Lys Ile Tyr Phe Lys 420 425 430 Asn Asp Lys Ser Leu Thr Asp Leu Ser Gln Gln Val Phe Asp Asp Tyr 435 440 445 Ser Val Ile Gly Thr Ala Val Leu Glu Tyr Ile Thr Gln Gln Ile Ala 450 455 460 Pro Lys Asn Leu Asp Asn Pro Ser Lys Lys Glu Gln Glu Leu Ile Ala 465 470 475 480 Lys Lys Thr Glu Lys Ala Lys Tyr Leu Ser Leu Glu Thr Ile Lys Leu 485 490 495 Ala Leu Glu Glu Phe Asn Lys His Arg Asp Ile Asp Lys Gln Cys Arg 500 505 510 Phe Glu Glu Ile Leu Ala Asn Phe Ala Ala Ile Pro Met Ile Phe Asp 515 520 525 Glu Ile Ala Gln Asn Lys Asp Asn Leu Ala Gln Ile Ser Ile Lys Tyr 530 535 540 Gln Asn Gln Gly Lys Lys Asp Leu Leu Gln Ala Ser Ala Glu Asp Asp 545 550 555 560 Val Lys Ala Ile Lys Asp Leu Leu Asp Gln Thr Asn Asn Leu Leu His 565 570 575 Lys Leu Lys Ile Phe His Ile Ser Gln Ser Glu Asp Lys Ala Asn Ile 580 585 590 Leu Asp Lys Asp Glu His Phe Tyr Leu Val Phe Glu Glu Cys Tyr Phe 595 600 605 Glu Leu Ala Asn Ile Val Pro Leu Tyr Asn Lys Ile Arg Asn Tyr Ile 610 615 620 Thr Gln Lys Pro Tyr Ser Asp Glu Lys Phe Lys Leu Asn Phe Glu Asn 625 630 635 640 Ser Thr Leu Ala Asn Gly Trp Asp Lys Asn Lys Glu Pro Asp Asn Thr 645 650 655 Ala Ile Leu Phe Ile Lys Asp Asp Lys Tyr Tyr Leu Gly Val Met Asn 660 665 670 Lys Lys Asn Asn Lys Ile Phe Asp Asp Lys Ala Ile Lys Glu Asn Lys 675 680 685 Gly Glu Gly Tyr Lys Lys Ile Val Tyr Lys Leu Leu Pro Gly Ala Asn 690 695 700 Lys Met Leu Pro Lys Val Phe Phe Ser Ala Lys Ser Ile Lys Phe Tyr 705 710 715 720 Asn Pro Ser Glu Asp Ile Leu Arg Ile Arg Asn His Ser Thr His Thr 725 730 735 Lys Asn Gly Ser Pro Gln Lys Gly Tyr Glu Lys Phe Glu Phe Asn Ile 740 745 750 Glu Asp Cys Arg Lys Phe Ile Asp Phe Tyr Lys Gln Ser Ile Ser Lys 755 760 765 His Pro Glu Trp Lys Asp Phe Gly Phe Arg Phe Ser Asp Thr Gln Arg 770 775 780 Tyr Asn Ser Ile Asp Glu Phe Tyr Arg Glu Val Glu Asn Gln Gly Tyr 785 790 795 800 Lys Leu Thr Phe Glu Asn Ile Ser Glu Ser Tyr Ile Asp Ser Val Val 805 810 815 Asn Gln Gly Lys Leu Tyr Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ser 820 825 830 Ala Tyr Ser Lys Gly Arg Pro Asn Leu His Thr Leu Tyr Trp Lys Ala 835 840 845 Leu Phe Asp Glu Arg Asn Leu Gln Asp Val Val Tyr Lys Leu Asn Gly 850 855 860 Glu Ala Glu Leu Phe Tyr Arg Lys Gln Ser Ile Pro Lys Lys Ile Thr 865 870 875 880 His Pro Ala Lys Glu Ala Ile Ala Asn Lys Asn Lys Asp Asn Pro Lys 885 890 895 Lys Glu Ser Val Phe Glu Tyr Asp Leu Ile Lys Asp Lys Arg Phe Thr 900 905 910 Glu Asp Lys Phe Phe Phe His Cys Pro Ile Thr Ile Asn Phe Lys Ser 915 920 925 Ser Gly Ala Asn Lys Phe Asn Asp Glu Ile Asn Leu Leu Leu Lys Glu 930 935 940 Lys Ala Asn Asp Val His Ile Leu Ser Ile Asp Arg Gly Glu Arg His 945 950 955 960 Leu Ala Tyr Tyr Thr Leu Val Asp Gly Lys Gly Asn Ile Ile Lys Gln 965 970 975 Asp Thr Phe Asn Ile Ile Gly Asn Asp Arg Met Lys Thr Asn Tyr His 980 985 990 Asp Lys Leu Ala Ala Ile Glu Lys Asp Arg Asp Ser Ala Arg Lys Asp 995 1000 1005 Trp Lys Lys Ile Asn Asn Ile Lys Glu Met Lys Glu Gly Tyr Leu 1010 1015 1020 Ser Gln Val Val His Glu Ile Ala Lys Leu Val Ile Glu Tyr Asn 1025 1030 1035 Ala Ile Val Val Phe Glu Asp Leu Asn Phe Gly Phe Lys Arg Gly 1040 1045 1050 Arg Phe Lys Val Glu Lys Gln Val Tyr Gln Lys Leu Glu Lys Met 1055 1060 1065 Leu Ile Glu Lys Leu Asn Tyr Leu Val Phe Lys Asp Asn Glu Phe 1070 1075 1080 Asp Lys Thr Gly Gly Val Leu Arg Ala Tyr Gln Leu Thr Ala Pro 1085 1090 1095 Phe Glu Thr Phe Lys Lys Met Gly Lys Gln Thr Gly Ile Ile Tyr 1100 1105 1110 Tyr Val Pro Ala Gly Phe Thr Ser Lys Ile Cys Pro Val Thr Gly 1115 1120 1125 Phe Val Asn Gln Leu Tyr Pro Lys Tyr Glu Ser Val Ser Lys Ser 1130 1135 1140 Gln Glu Phe Phe Ser Lys Phe Asp Lys Ile Cys Tyr Asn Leu Asp 1145 1150 1155 Lys Gly Tyr Phe Glu Phe Ser Phe Asp Tyr Lys Asn Phe Gly Asp 1160 1165 1170 Lys Ala Ala Lys Gly Lys Trp Thr Ile Ala Ser Phe Gly Ser Arg 1175 1180 1185 Leu Ile Asn Phe Arg Asn Ser Asp Lys Asn His Asn Trp Asp Thr 1190 1195 1200 Arg Glu Val Tyr Pro Thr Lys Glu Leu Glu Lys Leu Leu Lys Asp 1205 1210 1215 Tyr Ser Ile Glu Tyr Gly His Gly Glu Cys Ile Lys Ala Ala Ile 1220 1225 1230 Cys Gly Glu Ser Asp Lys Lys Phe Phe Ala Lys Leu Thr Ser Val 1235 1240 1245 Leu Asn Thr Ile Leu Gln Met Arg Asn Ser Lys Thr Gly Thr Glu 1250 1255 1260 Leu Asp Tyr Leu Ile Ser Pro Val Ala Asp Val Asn Gly Asn Phe 1265 1270 1275 Phe Asp Ser Arg Gln Ala Pro Lys Asn Met Pro Gln Asp Ala Asp 1280 1285 1290 Ala Asn Gly Ala Tyr His Ile Gly Leu Lys Gly Leu Met Leu Leu 1295 1300 1305 Gly Arg Ile Lys Asn Asn Gln Glu Gly Lys Lys Leu Asn Leu Val 1310 1315 1320 Ile Lys Asn Glu Glu Tyr Phe Glu Phe Val Gln Asn Arg Asn Asn 1325 1330 1335 Pro Lys Lys Lys Arg Lys Val Ser Gly Gly Ser Ser Gly Gly Ser 1340 1345 1350 Pro Lys Lys Lys Arg Lys Val Tyr Pro Tyr Asp Val Pro Asp Tyr 1355 1360 1365 Ala Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Tyr Pro Tyr Asp Val 1370 1375 1380 Pro Asp Tyr Ala 1385 <210> 49 <211> 4899 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 49 atgccgaaga agaagcgcaa ggtcatgtcc agcgagaccg gccccgtggc ggtggacccc 60 accctgcgca ggcgcatcga gccgcacgag ttcgaggtgt tcttcgaccc cagggagctc 120 cgcaaggaga cctgcctcct gtacgagatc aactggggcg gcaggcactc catctggagg 180 cacacgagcc agaacaccaa caagcacgtc gaggtgaact tcatcgagaa gttcaccacg 240 gagaggtact tctgcccgaa cacgcgctgc tccatcacgt ggttcctctc gtggagccca 300 tgcggcgagt gctccagggc gatcacggag ttcctcagcc gctacccgca cgtgaccctg 360 ttcatctaca tcgctaggct ctaccaccac gcggacccca ggaacaggca gggcctcagg 420 gacctgatct ccagcggcgt cacgatccag atcatgaccg agcaggagtc cggctactgc 480 tggaggaact tcgtgaacta ctccccgagc aacgaggccc actggccccg ctacccgcac 540 ctctgggtcc gcctctacgt gctcgagctg tactgcatca tcctcggcct gccgccctgc 600 ctcaacatcc tgaggcgcaa gcagccccag ctgacgttct tcaccatcgc cctgcagagc 660 tgccactacc agaggctccc gccccacatc ctgtgggcga ccgggctcaa ggggggcggg 720 ggctcaggcg ggggcgggag cggcggcggg ggctctgggg gcggcggcag cggcgggggc 780 ggcagcgggg gcggcgggtc gatgctcttc caggacttca cccacctcta cccgctgtcc 840 aagacggtga ggttcgagct gaagcccatc ggccgcaccc tcgagcacat ccacgccaag 900 aacttcctca gccaggacga gacgatggcg gacatgtacc agaaggtgaa ggtcatcctg 960 gacgactacc acagggactt catcgccgac atgatgggcg aggtgaagct caccaagctg 1020 gcggagttct acgacgtcta cctgaagttc cgcaagaacc cgaaggacga cggcctccag 1080 aagcagctca aggacctgca ggccgtgctg aggaaggagt cggtcaagcc aatcggcagc 1140 ggcggcaagt acaagaccgg ctacgacagg ctgttcggcg ccaagctctt caaggacggc 1200 aaggagctcg gcgacctggc caagttcgtg atcgcccagg agggcgagtc ctcgcccaag 1260 ctcgctcacc tggcccactt cgagaagttc tccacctact tcacgggctt ccacgacaac 1320 cgcaagaaca tgtacagcga cgaggacaag cacaccgcca tcgcgtacag gctgatccac 1380 gagaacctcc cccgcttcat cgacaacctc cagatcctga ccacgatcaa gcagaagcac 1440 tccgccctgt acgaccagat catcaacgag ctgacggctt cgggcctgga cgtgtccctg 1500 gccagccacc tcgacggcta ccacaagctc ctgacccagg agggcatcac ggcctacaac 1560 aggatcatcg gcgaggtcaa cggctacacg aacaagcaca accagatctg ccacaagtcg 1620 gagaggatcg ccaagctcag gcccctgcac aagcagatcc tgagcgacgg catgggcgtg 1680 tccttcctcc ccagcaagtt cgccgacgac tccgagatgt gccaggcggt caacgagttc 1740 taccgccact acaccgacgt gttcgccaag gtccagagcc tgttcgacgg cttcgacgac 1800 caccagaagg acggcatcta cgtggagcac aagaacctca acgagctgtc caagcaggcc 1860 ttcggcgact tcgccctcct gggcagggtg ctggacggct actacgtcga cgtggtcaac 1920 ccggagttca acgagcgctt cgccaaggcg aagaccgaca acgccaaggc gaagctgacg 1980 aaggagaagg acaagttcat caagggcgtc cactcgctgg ccagcctgga gcaggccatc 2040 gagcaccaca cggctaggca cgacgacgag tcggtgcagg ccggcaagct gggccagtac 2100 ttcaagcacg gcctggcggg cgtggacaac ccgatccaga agatccacaa caaccactcc 2160 accatcaagg gcttcctcga gagggagagg cccgcgggcg agagggcgct gcccaagatc 2220 aagagcggca agaaccccga gatgacgcag ctccgccagc tgaaggagct cctggacaac 2280 gccctcaacg tggcccactt cgcgaagctc ctgaccacga agaccacgct ggacaaccag 2340 gacggcaact tctacggcga gttcggcgtg ctgtacgacg agctcgcgaa gatcccgacc 2400 ctgtacaaca aggtccgcga ctacctctcc cagaagccgt tcagcaccga gaagtacaag 2460 ctcaacttcg gcaaccccac gctcctgaac ggctgggacc tgaacaagga gaaggacaac 2520 ttcggcgtga tcctgcagaa ggacggctgc tactacctcg ccctcctgga caaggcgcac 2580 aagaaggtct tcgacaacgc ccccaacacg ggcaagaacg tgtaccagaa gatggtctac 2640 aagctcctgc cgggccccaa caagatgctg ccgaaggtgt tcttcgcgaa gtccaacctc 2700 gactactaca accccagcgc cgagctcctg gacaagtacg cgaagggcac ccacaagaag 2760 ggcgacaact tcaacctgaa ggactgccac gccctcatcg acttcttcaa ggcgggcatc 2820 aacaagcacc cggagtggca gcacttcggc ttcaagttct cccccacgtc cagctacagg 2880 gacctcagcg acttctacag ggaggtggag ccccagggct accaggtgaa gttcgtcgac 2940 atcaacgccg actacatcga cgagctggtc gagcagggca agctctacct gttccagatc 3000 tacaacaagg acttctcgcc caaggcccac ggcaagccaa acctccacac cctgtacttc 3060 aaggccctgt tcagcgagga caacctcgcg gaccccatct acaagctcaa cggcgaggcc 3120 cagatcttct acaggaaggc gtccctggac atgaacgaga cgaccatcca cagggcgggc 3180 gaggtgctcg agaacaagaa cccggacaac cccaagaaga ggcagttcgt ctacgacatc 3240 atcaaggaca agcgctacac gcaggacaag ttcatgctgc acgtgccgat caccatgaac 3300 ttcggcgtcc agggcatgac gatcaaggag ttcaacaaga aggtgaacca gtccatccag 3360 cagtacgacg aggtgaacgt catcggcatc gctcgcggcg agaggcacct cctgtacctc 3420 accgtcatca acagcaaggg cgagatcctg gagcagaggt ccctcaacga catcacgacc 3480 gcttcggcca acggcacgca ggtgaccacg ccctaccaca agatcctgga caagcgcgag 3540 atcgagaggc tcaacgctag ggtgggctgg ggcgagatcg agaccatcaa ggagctgaag 3600 tccggctacc tcagccacgt ggtccaccag atcaaccagc tcatgctgaa gtacaacgcc 3660 atcgtggtcc tcgcggacct gaatttcggc ttcaagcgcg gcaggttcaa ggtggagaag 3720 cagatctacc agaacttcga gaacgccctg atcaagaagc tcaaccacct cgtcctgaag 3780 gacaaggccg acgacgagat cggctcctac aagaacgcgc tccagctgac caacaacttc 3840 acggacctga agagcatcgg caagcagacc ggcttcctct tctacgtgcc ggcgtggaac 3900 acctccaaga tcgaccccga gacgggcttc gtcgacctcc tgaagccgag gtacgagaac 3960 atcgcccaga gccaggcgtt cttcggcaag ttcgacaaga tctgctacaa caccgacaag 4020 ggctacttcg agttccacat cgactacgcc aagttcacgg acaaggcgaa gaactccagg 4080 cagaagtggg ccatctgcag ccacggcgac aagcgctacg tgtacgacaa gaccgcgaac 4140 cagaacaagg gcgccgcgaa gggcatcaac gtcaacgacg agctcaagtc cctgttcgcc 4200 cgctaccaca tcaacgacaa gcagccgaac ctcgtgatgg acatctgcca gaacaacgac 4260 aaggagttcc acaagagcct gatgtgcctc ctgaagaccc tcctggccct ccgctactcc 4320 aacgcctcca gcgacgaggc gttcatcctg agccccgtgg ccaacgacga gggcgtcttc 4380 ttcaactcgg ctctggccga cgacacccag ccacagaacg cggacgccaa cggcgcttac 4440 cacatcgcgc tcaagggcct gtggctcctg aacgagctca agaacagcga cgacctgaac 4500 aaggtcaagc tcgccatcga caaccagacc tggctgaact tcgcccagaa ccgcaagagg 4560 cccgcggcca cgaagaaggc gggccaggcc aagaagaaga agtccggcgg cagcacgaac 4620 ctgtccgaca tcatcgagaa ggagaccggc aagcagctcg tgatccagga gagcatcctc 4680 atgctgccgg aggaggtcga ggaggtcatc ggcaacaagc ccgagtccga catcctcgtc 4740 cacacggcct acgacgagtc caccgacgag aacgtgatgc tcctgacctc ggacgctccc 4800 gagtacaagc catgggccct ggtcatccag gacagcaacg gcgagaacaa gatcaagatg 4860 ctctccggcg gcagcccgaa gaagaagcgc aaagtgtga 4899 <210> 50 <211> 1632 <212> PRT <213> Artificial Sequence <220> <223> Fusion protein <400> 50 Met Pro Lys Lys Lys Arg Lys Val Met Ser Ser Glu Thr Gly Pro Val 1 5 10 15 Ala Val Asp Pro Thr Leu Arg Arg Arg Ile Glu Pro His Glu Phe Glu 20 25 30 Val Phe Phe Asp Pro Arg Glu Leu Arg Lys Glu Thr Cys Leu Leu Tyr 35 40 45 Glu Ile Asn Trp Gly Gly Arg His Ser Ile Trp Arg His Thr Ser Gln 50 55 60 Asn Thr Asn Lys His Val Glu Val Asn Phe Ile Glu Lys Phe Thr Thr 65 70 75 80 Glu Arg Tyr Phe Cys Pro Asn Thr Arg Cys Ser Ile Thr Trp Phe Leu 85 90 95 Ser Trp Ser Pro Cys Gly Glu Cys Ser Arg Ala Ile Thr Glu Phe Leu 100 105 110 Ser Arg Tyr Pro His Val Thr Leu Phe Ile Tyr Ile Ala Arg Leu Tyr 115 120 125 His His Ala Asp Pro Arg Asn Arg Gln Gly Leu Arg Asp Leu Ile Ser 130 135 140 Ser Gly Val Thr Ile Gln Ile Met Thr Glu Gln Glu Ser Gly Tyr Cys 145 150 155 160 Trp Arg Asn Phe Val Asn Tyr Ser Pro Ser Asn Glu Ala His Trp Pro 165 170 175 Arg Tyr Pro His Leu Trp Val Arg Leu Tyr Val Leu Glu Leu Tyr Cys 180 185 190 Ile Ile Leu Gly Leu Pro Pro Cys Leu Asn Ile Leu Arg Arg Lys Gln 195 200 205 Pro Gln Leu Thr Phe Phe Thr Ile Ala Leu Gln Ser Cys His Tyr Gln 210 215 220 Arg Leu Pro Pro His Ile Leu Trp Ala Thr Gly Leu Lys Gly Gly Gly 225 230 235 240 Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly 245 250 255 Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Met Leu Phe Gln Asp 260 265 270 Phe Thr His Leu Tyr Pro Leu Ser Lys Thr Val Arg Phe Glu Leu Lys 275 280 285 Pro Ile Gly Arg Thr Leu Glu His Ile His Ala Lys Asn Phe Leu Ser 290 295 300 Gln Asp Glu Thr Met Ala Asp Met Tyr Gln Lys Val Lys Val Ile Leu 305 310 315 320 Asp Asp Tyr His Arg Asp Phe Ile Ala Asp Met Met Gly Glu Val Lys 325 330 335 Leu Thr Lys Leu Ala Glu Phe Tyr Asp Val Tyr Leu Lys Phe Arg Lys 340 345 350 Asn Pro Lys Asp Asp Gly Leu Gln Lys Gln Leu Lys Asp Leu Gln Ala 355 360 365 Val Leu Arg Lys Glu Ser Val Lys Pro Ile Gly Ser Gly Gly Lys Tyr 370 375 380 Lys Thr Gly Tyr Asp Arg Leu Phe Gly Ala Lys Leu Phe Lys Asp Gly 385 390 395 400 Lys Glu Leu Gly Asp Leu Ala Lys Phe Val Ile Ala Gln Glu Gly Glu 405 410 415 Ser Ser Pro Lys Leu Ala His Leu Ala His Phe Glu Lys Phe Ser Thr 420 425 430 Tyr Phe Thr Gly Phe His Asp Asn Arg Lys Asn Met Tyr Ser Asp Glu 435 440 445 Asp Lys His Thr Ala Ile Ala Tyr Arg Leu Ile His Glu Asn Leu Pro 450 455 460 Arg Phe Ile Asp Asn Leu Gln Ile Leu Thr Thr Ile Lys Gln Lys His 465 470 475 480 Ser Ala Leu Tyr Asp Gln Ile Ile Asn Glu Leu Thr Ala Ser Gly Leu 485 490 495 Asp Val Ser Leu Ala Ser His Leu Asp Gly Tyr His Lys Leu Leu Thr 500 505 510 Gln Glu Gly Ile Thr Ala Tyr Asn Arg Ile Ile Gly Glu Val Asn Gly 515 520 525 Tyr Thr Asn Lys His Asn Gln Ile Cys His Lys Ser Glu Arg Ile Ala 530 535 540 Lys Leu Arg Pro Leu His Lys Gln Ile Leu Ser Asp Gly Met Gly Val 545 550 555 560 Ser Phe Leu Pro Ser Lys Phe Ala Asp Asp Ser Glu Met Cys Gln Ala 565 570 575 Val Asn Glu Phe Tyr Arg His Tyr Thr Asp Val Phe Ala Lys Val Gln 580 585 590 Ser Leu Phe Asp Gly Phe Asp Asp His Gln Lys Asp Gly Ile Tyr Val 595 600 605 Glu His Lys Asn Leu Asn Glu Leu Ser Lys Gln Ala Phe Gly Asp Phe 610 615 620 Ala Leu Leu Gly Arg Val Leu Asp Gly Tyr Tyr Val Asp Val Val Asn 625 630 635 640 Pro Glu Phe Asn Glu Arg Phe Ala Lys Ala Lys Thr Asp Asn Ala Lys 645 650 655 Ala Lys Leu Thr Lys Glu Lys Asp Lys Phe Ile Lys Gly Val His Ser 660 665 670 Leu Ala Ser Leu Glu Gln Ala Ile Glu His His Thr Ala Arg His Asp 675 680 685 Asp Glu Ser Val Gln Ala Gly Lys Leu Gly Gln Tyr Phe Lys His Gly 690 695 700 Leu Ala Gly Val Asp Asn Pro Ile Gln Lys Ile His Asn Asn His Ser 705 710 715 720 Thr Ile Lys Gly Phe Leu Glu Arg Glu Arg Pro Ala Gly Glu Arg Ala 725 730 735 Leu Pro Lys Ile Lys Ser Gly Lys Asn Pro Glu Met Thr Gln Leu Arg 740 745 750 Gln Leu Lys Glu Leu Leu Asp Asn Ala Leu Asn Val Ala His Phe Ala 755 760 765 Lys Leu Leu Thr Thr Lys Thr Thr Leu Asp Asn Gln Asp Gly Asn Phe 770 775 780 Tyr Gly Glu Phe Gly Val Leu Tyr Asp Glu Leu Ala Lys Ile Pro Thr 785 790 795 800 Leu Tyr Asn Lys Val Arg Asp Tyr Leu Ser Gln Lys Pro Phe Ser Thr 805 810 815 Glu Lys Tyr Lys Leu Asn Phe Gly Asn Pro Thr Leu Leu Asn Gly Trp 820 825 830 Asp Leu Asn Lys Glu Lys Asp Asn Phe Gly Val Ile Leu Gln Lys Asp 835 840 845 Gly Cys Tyr Tyr Leu Ala Leu Leu Asp Lys Ala His Lys Lys Val Phe 850 855 860 Asp Asn Ala Pro Asn Thr Gly Lys Asn Val Tyr Gln Lys Met Val Tyr 865 870 875 880 Lys Leu Leu Pro Gly Pro Asn Lys Met Leu Pro Lys Val Phe Phe Ala 885 890 895 Lys Ser Asn Leu Asp Tyr Tyr Asn Pro Ser Ala Glu Leu Leu Asp Lys 900 905 910 Tyr Ala Lys Gly Thr His Lys Lys Gly Asp Asn Phe Asn Leu Lys Asp 915 920 925 Cys His Ala Leu Ile Asp Phe Phe Lys Ala Gly Ile Asn Lys His Pro 930 935 940 Glu Trp Gln His Phe Gly Phe Lys Phe Ser Pro Thr Ser Ser Tyr Arg 945 950 955 960 Asp Leu Ser Asp Phe Tyr Arg Glu Val Glu Pro Gln Gly Tyr Gln Val 965 970 975 Lys Phe Val Asp Ile Asn Ala Asp Tyr Ile Asp Glu Leu Val Glu Gln 980 985 990 Gly Lys Leu Tyr Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ser Pro Lys 995 1000 1005 Ala His Gly Lys Pro Asn Leu His Thr Leu Tyr Phe Lys Ala Leu 1010 1015 1020 Phe Ser Glu Asp Asn Leu Ala Asp Pro Ile Tyr Lys Leu Asn Gly 1025 1030 1035 Glu Ala Gln Ile Phe Tyr Arg Lys Ala Ser Leu Asp Met Asn Glu 1040 1045 1050 Thr Thr Ile His Arg Ala Gly Glu Val Leu Glu Asn Lys Asn Pro 1055 1060 1065 Asp Asn Pro Lys Lys Arg Gln Phe Val Tyr Asp Ile Ile Lys Asp 1070 1075 1080 Lys Arg Tyr Thr Gln Asp Lys Phe Met Leu His Val Pro Ile Thr 1085 1090 1095 Met Asn Phe Gly Val Gln Gly Met Thr Ile Lys Glu Phe Asn Lys 1100 1105 1110 Lys Val Asn Gln Ser Ile Gln Gln Tyr Asp Glu Val Asn Val Ile 1115 1120 1125 Gly Ile Ala Arg Gly Glu Arg His Leu Leu Tyr Leu Thr Val Ile 1130 1135 1140 Asn Ser Lys Gly Glu Ile Leu Glu Gln Arg Ser Leu Asn Asp Ile 1145 1150 1155 Thr Thr Ala Ser Ala Asn Gly Thr Gln Val Thr Thr Pro Tyr His 1160 1165 1170 Lys Ile Leu Asp Lys Arg Glu Ile Glu Arg Leu Asn Ala Arg Val 1175 1180 1185 Gly Trp Gly Glu Ile Glu Thr Ile Lys Glu Leu Lys Ser Gly Tyr 1190 1195 1200 Leu Ser His Val Val His Gln Ile Asn Gln Leu Met Leu Lys Tyr 1205 1210 1215 Asn Ala Ile Val Val Leu Ala Asp Leu Asn Phe Gly Phe Lys Arg 1220 1225 1230 Gly Arg Phe Lys Val Glu Lys Gln Ile Tyr Gln Asn Phe Glu Asn 1235 1240 1245 Ala Leu Ile Lys Lys Leu Asn His Leu Val Leu Lys Asp Lys Ala 1250 1255 1260 Asp Asp Glu Ile Gly Ser Tyr Lys Asn Ala Leu Gln Leu Thr Asn 1265 1270 1275 Asn Phe Thr Asp Leu Lys Ser Ile Gly Lys Gln Thr Gly Phe Leu 1280 1285 1290 Phe Tyr Val Pro Ala Trp Asn Thr Ser Lys Ile Asp Pro Glu Thr 1295 1300 1305 Gly Phe Val Asp Leu Leu Lys Pro Arg Tyr Glu Asn Ile Ala Gln 1310 1315 1320 Ser Gln Ala Phe Phe Gly Lys Phe Asp Lys Ile Cys Tyr Asn Thr 1325 1330 1335 Asp Lys Gly Tyr Phe Glu Phe His Ile Asp Tyr Ala Lys Phe Thr 1340 1345 1350 Asp Lys Ala Lys Asn Ser Arg Gln Lys Trp Ala Ile Cys Ser His 1355 1360 1365 Gly Asp Lys Arg Tyr Val Tyr Asp Lys Thr Ala Asn Gln Asn Lys 1370 1375 1380 Gly Ala Ala Lys Gly Ile Asn Val Asn Asp Glu Leu Lys Ser Leu 1385 1390 1395 Phe Ala Arg Tyr His Ile Asn Asp Lys Gln Pro Asn Leu Val Met 1400 1405 1410 Asp Ile Cys Gln Asn Asn Asp Lys Glu Phe His Lys Ser Leu Met 1415 1420 1425 Cys Leu Leu Lys Thr Leu Leu Ala Leu Arg Tyr Ser Asn Ala Ser 1430 1435 1440 Ser Asp Glu Ala Phe Ile Leu Ser Pro Val Ala Asn Asp Glu Gly 1445 1450 1455 Val Phe Phe Asn Ser Ala Leu Ala Asp Asp Thr Gln Pro Gln Asn 1460 1465 1470 Ala Asp Ala Asn Gly Ala Tyr His Ile Ala Leu Lys Gly Leu Trp 1475 1480 1485 Leu Leu Asn Glu Leu Lys Asn Ser Asp Asp Leu Asn Lys Val Lys 1490 1495 1500 Leu Ala Ile Asp Asn Gln Thr Trp Leu Asn Phe Ala Gln Asn Arg 1505 1510 1515 Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys 1520 1525 1530 Lys Ser Gly Gly Ser Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu 1535 1540 1545 Thr Gly Lys Gln Leu Val Ile Gln Glu Ser Ile Leu Met Leu Pro 1550 1555 1560 Glu Glu Val Glu Glu Val Ile Gly Asn Lys Pro Glu Ser Asp Ile 1565 1570 1575 Leu Val His Thr Ala Tyr Asp Glu Ser Thr Asp Glu Asn Val Met 1580 1585 1590 Leu Leu Thr Ser Asp Ala Pro Glu Tyr Lys Pro Trp Ala Leu Val 1595 1600 1605 Ile Gln Asp Ser Asn Gly Glu Asn Lys Ile Lys Met Leu Ser Gly 1610 1615 1620 Gly Ser Pro Lys Lys Lys Arg Lys Val 1625 1630 <210> 51 <211> 4809 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 51 atgccgaaga agaagcgcaa ggtcatgtcc agcgagaccg gccccgtggc ggtggacccc 60 accctgcgca ggcgcatcga gccgcacgag ttcgaggtgt tcttcgaccc cagggagctc 120 cgcaaggaga cctgcctcct gtacgagatc aactggggcg gcaggcactc catctggagg 180 cacacgagcc agaacaccaa caagcacgtc gaggtgaact tcatcgagaa gttcaccacg 240 gagaggtact tctgcccgaa cacgcgctgc tccatcacgt ggttcctctc gtggagccca 300 tgcggcgagt gctccagggc gatcacggag ttcctcagcc gctacccgca cgtgaccctg 360 ttcatctaca tcgctaggct ctaccaccac gcggacccca ggaacaggca gggcctcagg 420 gacctgatct ccagcggcgt cacgatccag atcatgaccg agcaggagtc cggctactgc 480 tggaggaact tcgtgaacta ctccccgagc aacgaggccc actggccccg ctacccgcac 540 ctctgggtcc gcctctacgt gctcgagctg tactgcatca tcctcggcct gccgccctgc 600 ctcaacatcc tgaggcgcaa gcagccccag ctgacgttct tcaccatcgc cctgcagagc 660 tgccactacc agaggctccc gccccacatc ctgtgggcga ccgggctcaa ggggggcggg 720 ggctcaggcg ggggcgggag cggcggcggg ggctctgggg gcggcggcag cggcgggggc 780 ggcagcgggg gcggcgggtc gatgagcaag ctggagaagt tcacgaactg ctactccctc 840 agcaagaccc tgaggttcaa ggcgatcccg gtcggcaaga cccaggagaa catcgacaac 900 aagcggctgc tggtggagga cgagaagagg gctgaggact acaagggcgt gaagaagctc 960 ctggaccgct actacctgtc cttcatcaac gacgtgctcc acagcatcaa gctcaagaac 1020 ctgaacaact acatcagcct cttcaggaag aagacgcgca ccgagaagga gaacaaggag 1080 ctcgagaacc tggagatcaa cctgaggaag gagatcgcca aggcgttcaa gggcaacgag 1140 ggctacaagt ccctcttcaa gaaggacatc atcgagacga tcctcccgga gttcctggac 1200 gacaaggacg agatcgccct ggtcaactcc ttcaacggct tcaccacggc gttcaccggc 1260 ttcttcgaca accgcgagaa catgttcagc gaggaggcca agtccacgag catcgcgttc 1320 aggtgcatca acgagaacct cacccgctac atctccaaca tggacatctt cgagaaggtc 1380 gacgcgatct tcgacaagca cgaggtgcag gagatcaagg agaagatcct gaacagcgac 1440 tacgacgtcg aggacttctt cgagggcgag ttcttcaact tcgtcctcac gcaggagggc 1500 atcgacgtgt acaacgccat catcggtggc ttcgtgaccg agtccggcga gaagatcaag 1560 ggcctgaacg agtacatcaa cctctacaac cagaagacca agcagaagct gccgaagttc 1620 aagcccctgt acaagcaggt gctctccgac agggagtccc tcagcttcta cggcgagggc 1680 tacacgagcg acgaggaggt cctggaggtg ttccgcaaca ccctcaacaa gaacagcgag 1740 atcttctcca gcatcaagaa gctcgagaag ctgttcaaga acttcgacga gtactccagc 1800 gccggcatct tcgtcaagaa cggcccggcg atctccacga tcagcaagga catcttcggc 1860 gagtggaacg tgatccgcga caagtggaac gccgagtacg acgacatcca cctcaagaag 1920 aaggcggtgg tcaccgagaa gtacgaggac gacaggcgca agtccttcaa gaagatcggc 1980 tccttcagcc tcgagcagct gcaggagtac gccgacgcgg acctgagcgt ggtcgagaag 2040 ctcaaggaga tcatcatcca gaaggtcgac gagatctaca aggtgtacgg ctccagcgag 2100 aagctcttcg acgcggactt cgtcctcgag aagtccctga agaagaacga cgccgtggtc 2160 gcgatcatga aggacctcct ggactccgtg aagagcttcg agaattacat caaggccttc 2220 ttcggcgagg gcaaggagac gaacagggac gagtccttct acggcgactt cgtcctggcc 2280 tacgacatcc tcctgaaggt ggaccacatc tacgacgcga tccgcaacta cgtgacccag 2340 aagccgtaca gcaaggacaa gttcaagctc tacttccaga acccccagtt catgggcggc 2400 tgggacaagg acaaggagac ggactacagg gcgaccatcc tgcgctacgg cagcaagtac 2460 tacctcgcca tcatggacaa gaagtacgcg aagtgcctgc agaagatcga caaggacgac 2520 gtcaacggca actacgagaa gatcaactac aagctcctgc cgggccccaa caagatgctc 2580 ccgaaggtgt tcttctccaa gaagtggatg gcctactaca accccagcga ggacatccag 2640 aagatctaca agaacggcac gttcaagaag ggcgacatgt tcaacctgaa cgactgccac 2700 aagctcatcg acttcttcaa ggactccatc agccgctacc cgaagtggtc caacgcctac 2760 gacttcaact tcagcgagac cgagaagtac aaggacatcg cgggcttcta ccgcgaggtc 2820 gaggagcagg gctacaaggt gtccttcgag tccgccagca agaaggaggt cgacaagctg 2880 gtggaggagg gcaagctcta catgttccag atctacaaca aggacttctc cgacaagagc 2940 cacggcacgc ccaacctgca caccatgtac ttcaagctcc tgttcgacga gaacaaccac 3000 ggccagatca ggctgtccgg cggcgccgag ctcttcatga ggagggcgag cctgaagaag 3060 gaggagctgg tggtccaccc cgctaacagc ccaatcgcga acaagaaccc ggacaacccc 3120 aagaagacca cgaccctgtc ctacgacgtg tacaaggaca agaggttcag cgaggaccag 3180 tacgagctcc acatcccgat cgcgatcaac aagtgcccca agaacatctt caagatcaac 3240 accgaggtcc gcgtgctcct gaagcacgac gacaacccct acgtgatcgg catcgacagg 3300 ggcgagagga acctcctgta catcgtggtc gtggacggca agggcaacat cgtggagcag 3360 tactccctca acgagatcat caacaacttc aacggcatca ggatcaagac ggactaccac 3420 agcctcctgg acaagaagga gaaggagagg ttcgaggccc gccagaactg gacctccatc 3480 gagaacatca aggagctgaa ggcgggctac atcagccagg tcgtgcacaa gatctgcgag 3540 ctcgtcgaga agtacgacgc cgtgatcgcc ctcgaggacc tgaactccgg cttcaagaac 3600 agccgcgtca aggtggagaa gcaggtctac cagaagttcg agaagatgct catcgacaag 3660 ctgaactaca tggtggacaa gaagtccaac ccctgcgcta cgggcggcgc gctgaagggc 3720 taccagatca ccaacaagtt cgagagcttc aagtccatga gcactcagaa cggcttcatc 3780 ttctacatcc cggcgtggct cacgtccaag atcgacccca gcaccggctt cgtcaacctc 3840 ctgaagacga agtacacctc catcgccgac agcaagaagt tcatctccag cttcgaccgc 3900 atcatgtatg tgccggagga ggacctgttc gagttcgccc tcgactacaa gaacttctcc 3960 cgcacggacg cggactacat caagaagtgg aagctgtaca gctacggcaa ccgcatccgc 4020 atcttcagga accccaagaa gaacaacgtc ttcgactggg aggaggtgtg cctgacctcc 4080 gcgtacaagg agctcttcaa caagtacggc atcaactacc agcagggcga catcagggct 4140 ctcctgtgcg agcagagcga caaggccttc tactccagct tcatggcgct gatgtccctc 4200 atgctgcaga tgaggaactc gatcaccggc aggacggacg tggacttcct catctccccg 4260 gtgaagaaca gcgacggcat cttctacgac tccaggaact acgaggccca ggagaacgcg 4320 atcctcccaa agaacgcgga cgccaacggc gcctacaaca tcgccaggaa ggtcctctgg 4380 gctatcggcc agttcaagaa ggcggaggac gagaagctgg acaaggtgaa gatcgccatc 4440 agcaacaagg agtggctcga gtacgcccag acctcggtca agcacggcag cccgaagaag 4500 aagcgcaagg tgtccggcgg cagcacgaac ctgtccgaca tcatcgagaa ggagaccggc 4560 aagcagctcg tgatccagga gagcatcctc atgctgccgg aggaggtcga ggaggtcatc 4620 ggcaacaagc ccgagtccga catcctcgtc cacacggcct acgacgagtc caccgacgag 4680 aacgtgatgc tcctgacctc ggacgctccc gagtacaagc catgggccct ggtcatccag 4740 gacagcaacg gcgagaacaa gatcaagatg ctctccggcg gcagcccgaa gaagaagcgc 4800 aaagtgtga 4809 <210> 52 <211> 1602 <212> PRT <213> Artificial Sequence <220> <223> Fusion protein <400> 52 Met Pro Lys Lys Lys Arg Lys Val Met Ser Ser Glu Thr Gly Pro Val 1 5 10 15 Ala Val Asp Pro Thr Leu Arg Arg Arg Ile Glu Pro His Glu Phe Glu 20 25 30 Val Phe Phe Asp Pro Arg Glu Leu Arg Lys Glu Thr Cys Leu Leu Tyr 35 40 45 Glu Ile Asn Trp Gly Gly Arg His Ser Ile Trp Arg His Thr Ser Gln 50 55 60 Asn Thr Asn Lys His Val Glu Val Asn Phe Ile Glu Lys Phe Thr Thr 65 70 75 80 Glu Arg Tyr Phe Cys Pro Asn Thr Arg Cys Ser Ile Thr Trp Phe Leu 85 90 95 Ser Trp Ser Pro Cys Gly Glu Cys Ser Arg Ala Ile Thr Glu Phe Leu 100 105 110 Ser Arg Tyr Pro His Val Thr Leu Phe Ile Tyr Ile Ala Arg Leu Tyr 115 120 125 His His Ala Asp Pro Arg Asn Arg Gln Gly Leu Arg Asp Leu Ile Ser 130 135 140 Ser Gly Val Thr Ile Gln Ile Met Thr Glu Gln Glu Ser Gly Tyr Cys 145 150 155 160 Trp Arg Asn Phe Val Asn Tyr Ser Pro Ser Asn Glu Ala His Trp Pro 165 170 175 Arg Tyr Pro His Leu Trp Val Arg Leu Tyr Val Leu Glu Leu Tyr Cys 180 185 190 Ile Ile Leu Gly Leu Pro Pro Cys Leu Asn Ile Leu Arg Arg Lys Gln 195 200 205 Pro Gln Leu Thr Phe Phe Thr Ile Ala Leu Gln Ser Cys His Tyr Gln 210 215 220 Arg Leu Pro Pro His Ile Leu Trp Ala Thr Gly Leu Lys Gly Gly Gly 225 230 235 240 Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly 245 250 255 Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Met Ser Lys Leu Glu 260 265 270 Lys Phe Thr Asn Cys Tyr Ser Leu Ser Lys Thr Leu Arg Phe Lys Ala 275 280 285 Ile Pro Val Gly Lys Thr Gln Glu Asn Ile Asp Asn Lys Arg Leu Leu 290 295 300 Val Glu Asp Glu Lys Arg Ala Glu Asp Tyr Lys Gly Val Lys Lys Leu 305 310 315 320 Leu Asp Arg Tyr Tyr Leu Ser Phe Ile Asn Asp Val Leu His Ser Ile 325 330 335 Lys Leu Lys Asn Leu Asn Asn Tyr Ile Ser Leu Phe Arg Lys Lys Thr 340 345 350 Arg Thr Glu Lys Glu Asn Lys Glu Leu Glu Asn Leu Glu Ile Asn Leu 355 360 365 Arg Lys Glu Ile Ala Lys Ala Phe Lys Gly Asn Glu Gly Tyr Lys Ser 370 375 380 Leu Phe Lys Lys Asp Ile Ile Glu Thr Ile Leu Pro Glu Phe Leu Asp 385 390 395 400 Asp Lys Asp Glu Ile Ala Leu Val Asn Ser Phe Asn Gly Phe Thr Thr 405 410 415 Ala Phe Thr Gly Phe Phe Asp Asn Arg Glu Asn Met Phe Ser Glu Glu 420 425 430 Ala Lys Ser Thr Ser Ile Ala Phe Arg Cys Ile Asn Glu Asn Leu Thr 435 440 445 Arg Tyr Ile Ser Asn Met Asp Ile Phe Glu Lys Val Asp Ala Ile Phe 450 455 460 Asp Lys His Glu Val Gln Glu Ile Lys Glu Lys Ile Leu Asn Ser Asp 465 470 475 480 Tyr Asp Val Glu Asp Phe Phe Glu Gly Glu Phe Phe Asn Phe Val Leu 485 490 495 Thr Gln Glu Gly Ile Asp Val Tyr Asn Ala Ile Ile Gly Gly Phe Val 500 505 510 Thr Glu Ser Gly Glu Lys Ile Lys Gly Leu Asn Glu Tyr Ile Asn Leu 515 520 525 Tyr Asn Gln Lys Thr Lys Gln Lys Leu Pro Lys Phe Lys Pro Leu Tyr 530 535 540 Lys Gln Val Leu Ser Asp Arg Glu Ser Leu Ser Phe Tyr Gly Glu Gly 545 550 555 560 Tyr Thr Ser Asp Glu Glu Val Leu Glu Val Phe Arg Asn Thr Leu Asn 565 570 575 Lys Asn Ser Glu Ile Phe Ser Ser Ile Lys Lys Leu Glu Lys Leu Phe 580 585 590 Lys Asn Phe Asp Glu Tyr Ser Ser Ala Gly Ile Phe Val Lys Asn Gly 595 600 605 Pro Ala Ile Ser Thr Ile Ser Lys Asp Ile Phe Gly Glu Trp Asn Val 610 615 620 Ile Arg Asp Lys Trp Asn Ala Glu Tyr Asp Asp Ile His Leu Lys Lys 625 630 635 640 Lys Ala Val Val Thr Glu Lys Tyr Glu Asp Asp Arg Arg Lys Ser Phe 645 650 655 Lys Lys Ile Gly Ser Phe Ser Leu Glu Gln Leu Gln Glu Tyr Ala Asp 660 665 670 Ala Asp Leu Ser Val Val Glu Lys Leu Lys Glu Ile Ile Ile Gln Lys 675 680 685 Val Asp Glu Ile Tyr Lys Val Tyr Gly Ser Ser Glu Lys Leu Phe Asp 690 695 700 Ala Asp Phe Val Leu Glu Lys Ser Leu Lys Lys Asn Asp Ala Val Val 705 710 715 720 Ala Ile Met Lys Asp Leu Leu Asp Ser Val Lys Ser Phe Glu Asn Tyr 725 730 735 Ile Lys Ala Phe Phe Gly Glu Gly Lys Glu Thr Asn Arg Asp Glu Ser 740 745 750 Phe Tyr Gly Asp Phe Val Leu Ala Tyr Asp Ile Leu Leu Lys Val Asp 755 760 765 His Ile Tyr Asp Ala Ile Arg Asn Tyr Val Thr Gln Lys Pro Tyr Ser 770 775 780 Lys Asp Lys Phe Lys Leu Tyr Phe Gln Asn Pro Gln Phe Met Gly Gly 785 790 795 800 Trp Asp Lys Asp Lys Glu Thr Asp Tyr Arg Ala Thr Ile Leu Arg Tyr 805 810 815 Gly Ser Lys Tyr Tyr Leu Ala Ile Met Asp Lys Lys Tyr Ala Lys Cys 820 825 830 Leu Gln Lys Ile Asp Lys Asp Asp Val Asn Gly Asn Tyr Glu Lys Ile 835 840 845 Asn Tyr Lys Leu Leu Pro Gly Pro Asn Lys Met Leu Pro Lys Val Phe 850 855 860 Phe Ser Lys Lys Trp Met Ala Tyr Tyr Asn Pro Ser Glu Asp Ile Gln 865 870 875 880 Lys Ile Tyr Lys Asn Gly Thr Phe Lys Lys Gly Asp Met Phe Asn Leu 885 890 895 Asn Asp Cys His Lys Leu Ile Asp Phe Phe Lys Asp Ser Ile Ser Arg 900 905 910 Tyr Pro Lys Trp Ser Asn Ala Tyr Asp Phe Asn Phe Ser Glu Thr Glu 915 920 925 Lys Tyr Lys Asp Ile Ala Gly Phe Tyr Arg Glu Val Glu Glu Gln Gly 930 935 940 Tyr Lys Val Ser Phe Glu Ser Ala Ser Lys Lys Glu Val Asp Lys Leu 945 950 955 960 Val Glu Glu Gly Lys Leu Tyr Met Phe Gln Ile Tyr Asn Lys Asp Phe 965 970 975 Ser Asp Lys Ser His Gly Thr Pro Asn Leu His Thr Met Tyr Phe Lys 980 985 990 Leu Leu Phe Asp Glu Asn Asn His Gly Gln Ile Arg Leu Ser Gly Gly 995 1000 1005 Ala Glu Leu Phe Met Arg Arg Ala Ser Leu Lys Lys Glu Glu Leu 1010 1015 1020 Val Val His Pro Ala Asn Ser Pro Ile Ala Asn Lys Asn Pro Asp 1025 1030 1035 Asn Pro Lys Lys Thr Thr Thr Leu Ser Tyr Asp Val Tyr Lys Asp 1040 1045 1050 Lys Arg Phe Ser Glu Asp Gln Tyr Glu Leu His Ile Pro Ile Ala 1055 1060 1065 Ile Asn Lys Cys Pro Lys Asn Ile Phe Lys Ile Asn Thr Glu Val 1070 1075 1080 Arg Val Leu Leu Lys His Asp Asp Asn Pro Tyr Val Ile Gly Ile 1085 1090 1095 Asp Arg Gly Glu Arg Asn Leu Leu Tyr Ile Val Val Val Asp Gly 1100 1105 1110 Lys Gly Asn Ile Val Glu Gln Tyr Ser Leu Asn Glu Ile Ile Asn 1115 1120 1125 Asn Phe Asn Gly Ile Arg Ile Lys Thr Asp Tyr His Ser Leu Leu 1130 1135 1140 Asp Lys Lys Glu Lys Glu Arg Phe Glu Ala Arg Gln Asn Trp Thr 1145 1150 1155 Ser Ile Glu Asn Ile Lys Glu Leu Lys Ala Gly Tyr Ile Ser Gln 1160 1165 1170 Val Val His Lys Ile Cys Glu Leu Val Glu Lys Tyr Asp Ala Val 1175 1180 1185 Ile Ala Leu Glu Asp Leu Asn Ser Gly Phe Lys Asn Ser Arg Val 1190 1195 1200 Lys Val Glu Lys Gln Val Tyr Gln Lys Phe Glu Lys Met Leu Ile 1205 1210 1215 Asp Lys Leu Asn Tyr Met Val Asp Lys Lys Ser Asn Pro Cys Ala 1220 1225 1230 Thr Gly Gly Ala Leu Lys Gly Tyr Gln Ile Thr Asn Lys Phe Glu 1235 1240 1245 Ser Phe Lys Ser Met Ser Thr Gln Asn Gly Phe Ile Phe Tyr Ile 1250 1255 1260 Pro Ala Trp Leu Thr Ser Lys Ile Asp Pro Ser Thr Gly Phe Val 1265 1270 1275 Asn Leu Leu Lys Thr Lys Tyr Thr Ser Ile Ala Asp Ser Lys Lys 1280 1285 1290 Phe Ile Ser Ser Phe Asp Arg Ile Met Tyr Val Pro Glu Glu Asp 1295 1300 1305 Leu Phe Glu Phe Ala Leu Asp Tyr Lys Asn Phe Ser Arg Thr Asp 1310 1315 1320 Ala Asp Tyr Ile Lys Lys Trp Lys Leu Tyr Ser Tyr Gly Asn Arg 1325 1330 1335 Ile Arg Ile Phe Arg Asn Pro Lys Lys Asn Asn Val Phe Asp Trp 1340 1345 1350 Glu Glu Val Cys Leu Thr Ser Ala Tyr Lys Glu Leu Phe Asn Lys 1355 1360 1365 Tyr Gly Ile Asn Tyr Gln Gln Gly Asp Ile Arg Ala Leu Leu Cys 1370 1375 1380 Glu Gln Ser Asp Lys Ala Phe Tyr Ser Ser Phe Met Ala Leu Met 1385 1390 1395 Ser Leu Met Leu Gln Met Arg Asn Ser Ile Thr Gly Arg Thr Asp 1400 1405 1410 Val Asp Phe Leu Ile Ser Pro Val Lys Asn Ser Asp Gly Ile Phe 1415 1420 1425 Tyr Asp Ser Arg Asn Tyr Glu Ala Gln Glu Asn Ala Ile Leu Pro 1430 1435 1440 Lys Asn Ala Asp Ala Asn Gly Ala Tyr Asn Ile Ala Arg Lys Val 1445 1450 1455 Leu Trp Ala Ile Gly Gln Phe Lys Lys Ala Glu Asp Glu Lys Leu 1460 1465 1470 Asp Lys Val Lys Ile Ala Ile Ser Asn Lys Glu Trp Leu Glu Tyr 1475 1480 1485 Ala Gln Thr Ser Val Lys His Gly Ser Pro Lys Lys Lys Arg Lys 1490 1495 1500 Val Ser Gly Gly Ser Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu 1505 1510 1515 Thr Gly Lys Gln Leu Val Ile Gln Glu Ser Ile Leu Met Leu Pro 1520 1525 1530 Glu Glu Val Glu Glu Val Ile Gly Asn Lys Pro Glu Ser Asp Ile 1535 1540 1545 Leu Val His Thr Ala Tyr Asp Glu Ser Thr Asp Glu Asn Val Met 1550 1555 1560 Leu Leu Thr Ser Asp Ala Pro Glu Tyr Lys Pro Trp Ala Leu Val 1565 1570 1575 Ile Gln Asp Ser Asn Gly Glu Asn Lys Ile Lys Met Leu Ser Gly 1580 1585 1590 Gly Ser Pro Lys Lys Lys Arg Lys Val 1595 1600 <210> 53 <211> 3873 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 53 atgccgaaga agaagcgcaa ggtcgggggc gggggctcag gcgggggcgg gagcggcggc 60 gggggctctg ggggcggcgg cagcggcggg ggcggcagcg ggggcggcgg gtcgatgagc 120 aagctggaga agttcacgaa ctgctactcc ctcagcaaga ccctgaggtt caaggcgatc 180 ccggtcggca agacccagga gaacatcgac aacaagcggc tgctggtgga ggacgagaag 240 agggctgagg actacaaggg cgtgaagaag ctcctggacc gctactacct gtccttcatc 300 aacgacgtgc tccacagcat caagctcaag aacctgaaca actacatcag cctcttcagg 360 aagaagacgc gcaccgagaa ggagaacaag gagctcgaga acctggagat caacctgagg 420 aaggagatcg ccaaggcgtt caagggcaac gagggctaca agtccctctt caagaaggac 480 atcatcgaga cgatcctccc ggagttcctg gacgacaagg acgagatcgc cctggtcaac 540 tccttcaacg gcttcaccac ggcgttcacc ggcttcttcg acaaccgcga gaacatgttc 600 agcgaggagg ccaagtccac gagcatcgcg ttcaggtgca tcaacgagaa cctcacccgc 660 tacatctcca acatggacat cttcgagaag gtcgacgcga tcttcgacaa gcacgaggtg 720 caggagatca aggagaagat cctgaacagc gactacgacg tcgaggactt cttcgagggc 780 gagttcttca acttcgtcct cacgcaggag ggcatcgacg tgtacaacgc catcatcggt 840 ggcttcgtga ccgagtccgg cgagaagatc aagggcctga acgagtacat caacctctac 900 aaccagaaga ccaagcagaa gctgccgaag ttcaagcccc tgtacaagca ggtgctctcc 960 gacagggagt ccctcagctt ctacggcgag ggctacacga gcgacgagga ggtcctggag 1020 gtgttccgca acaccctcaa caagaacagc gagatcttct ccagcatcaa gaagctcgag 1080 aagctgttca agaacttcga cgagtactcc agcgccggca tcttcgtcaa gaacggcccg 1140 gcgatctcca cgatcagcaa ggacatcttc ggcgagtgga acgtgatccg cgacaagtgg 1200 aacgccgagt acgacgacat ccacctcaag aagaaggcgg tggtcaccga gaagtacgag 1260 gacgacaggc gcaagtcctt caagaagatc ggctccttca gcctcgagca gctgcaggag 1320 tacgccgacg cggacctgag cgtggtcgag aagctcaagg agatcatcat ccagaaggtc 1380 gacgagatct acaaggtgta cggctccagc gagaagctct tcgacgcgga cttcgtcctc 1440 gagaagtccc tgaagaagaa cgacgccgtg gtcgcgatca tgaaggacct cctggactcc 1500 gtgaagagct tcgagaatta catcaaggcc ttcttcggcg agggcaagga gacgaacagg 1560 gacgagtcct tctacggcga cttcgtcctg gcctacgaca tcctcctgaa ggtggaccac 1620 atctacgacg cgatccgcaa ctacgtgacc cagaagccgt acagcaagga caagttcaag 1680 ctctacttcc agaaccccca gttcatgggc ggctgggaca aggacaagga gacggactac 1740 agggcgacca tcctgcgcta cggcagcaag tactacctcg ccatcatgga caagaagtac 1800 gcgaagtgcc tgcagaagat cgacaaggac gacgtcaacg gcaactacga gaagatcaac 1860 tacaagctcc tgccgggccc caacaagatg ctcccgaagg tgttcttctc caagaagtgg 1920 atggcctact acaaccccag cgaggacatc cagaagatct acaagaacgg cacgttcaag 1980 aagggcgaca tgttcaacct gaacgactgc cacaagctca tcgacttctt caaggactcc 2040 atcagccgct acccgaagtg gtccaacgcc tacgacttca acttcagcga gaccgagaag 2100 tacaaggaca tcgcgggctt ctaccgcgag gtcgaggagc agggctacaa ggtgtccttc 2160 gagtccgcca gcaagaagga ggtcgacaag ctggtggagg agggcaagct ctacatgttc 2220 cagatctaca acaaggactt ctccgacaag agccacggca cgcccaacct gcacaccatg 2280 tacttcaagc tcctgttcga cgagaacaac cacggccaga tcaggctgtc cggcggcgcc 2340 gagctcttca tgaggagggc gagcctgaag aaggaggagc tggtggtcca ccccgctaac 2400 agcccaatcg cgaacaagaa cccggacaac cccaagaaga ccacgaccct gtcctacgac 2460 gtgtacaagg acaagaggtt cagcgaggac cagtacgagc tccacatccc gatcgcgatc 2520 aacaagtgcc ccaagaacat cttcaagatc aacaccgagg tccgcgtgct cctgaagcac 2580 gacgacaacc cctacgtgat cggcatcgac aggggcgaga ggaacctcct gtacatcgtg 2640 gtcgtggacg gcaagggcaa catcgtggag cagtactccc tcaacgagat catcaacaac 2700 ttcaacggca tcaggatcaa gacggactac cacagcctcc tggacaagaa ggagaaggag 2760 aggttcgagg cccgccagaa ctggacctcc atcgagaaca tcaaggagct gaaggcgggc 2820 tacatcagcc aggtcgtgca caagatctgc gagctcgtcg agaagtacga cgccgtgatc 2880 gccctcgagg acctgaactc cggcttcaag aacagccgcg tcaaggtgga gaagcaggtc 2940 taccagaagt tcgagaagat gctcatcgac aagctgaact acatggtgga caagaagtcc 3000 aacccctgcg ctacgggcgg cgcgctgaag ggctaccaga tcaccaacaa gttcgagagc 3060 ttcaagtcca tgagcactca gaacggcttc atcttctaca tcccggcgtg gctcacgtcc 3120 aagatcgacc ccagcaccgg cttcgtcaac ctcctgaaga cgaagtacac ctccatcgcc 3180 gacagcaaga agttcatctc cagcttcgac cgcatcatgt atgtgccgga ggaggacctg 3240 ttcgagttcg ccctcgacta caagaacttc tcccgcacgg acgcggacta catcaagaag 3300 tggaagctgt acagctacgg caaccgcatc cgcatcttca ggaaccccaa gaagaacaac 3360 gtcttcgact gggaggaggt gtgcctgacc tccgcgtaca aggagctctt caacaagtac 3420 ggcatcaact accagcaggg cgacatcagg gctctcctgt gcgagcagag cgacaaggcc 3480 ttctactcca gcttcatggc gctgatgtcc ctcatgctgc agatgaggaa ctcgatcacc 3540 ggcaggacgg acgtggactt cctcatctcc ccggtgaaga acagcgacgg catcttctac 3600 gactccagga actacgaggc ccaggagaac gcgatcctcc caaagaacgc ggacgccaac 3660 ggcgcctaca acatcgccag gaaggtcctc tgggctatcg gccagttcaa gaaggcggag 3720 gacgagaagc tggacaaggt gaagatcgcc atcagcaaca aggagtggct cgagtacgcc 3780 cagacctcgg tcaagcacgg cagcccgaag aagaagcgca aggtgtccgg cggcagctcc 3840 ggcggcagcc cgaagaagaa gcgcaaagtg tga 3873 <210> 54 <211> 1290 <212> PRT <213> Artificial Sequence <220> <223> Fusion protein <400> 54 Met Pro Lys Lys Lys Arg Lys Val Gly Gly Gly Gly Ser Gly Gly Gly 1 5 10 15 Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly 20 25 30 Ser Gly Gly Gly Gly Ser Met Ser Lys Leu Glu Lys Phe Thr Asn Cys 35 40 45 Tyr Ser Leu Ser Lys Thr Leu Arg Phe Lys Ala Ile Pro Val Gly Lys 50 55 60 Thr Gln Glu Asn Ile Asp Asn Lys Arg Leu Leu Val Glu Asp Glu Lys 65 70 75 80 Arg Ala Glu Asp Tyr Lys Gly Val Lys Lys Leu Leu Asp Arg Tyr Tyr 85 90 95 Leu Ser Phe Ile Asn Asp Val Leu His Ser Ile Lys Leu Lys Asn Leu 100 105 110 Asn Asn Tyr Ile Ser Leu Phe Arg Lys Lys Thr Arg Thr Glu Lys Glu 115 120 125 Asn Lys Glu Leu Glu Asn Leu Glu Ile Asn Leu Arg Lys Glu Ile Ala 130 135 140 Lys Ala Phe Lys Gly Asn Glu Gly Tyr Lys Ser Leu Phe Lys Lys Asp 145 150 155 160 Ile Ile Glu Thr Ile Leu Pro Glu Phe Leu Asp Asp Lys Asp Glu Ile 165 170 175 Ala Leu Val Asn Ser Phe Asn Gly Phe Thr Thr Ala Phe Thr Gly Phe 180 185 190 Phe Asp Asn Arg Glu Asn Met Phe Ser Glu Glu Ala Lys Ser Thr Ser 195 200 205 Ile Ala Phe Arg Cys Ile Asn Glu Asn Leu Thr Arg Tyr Ile Ser Asn 210 215 220 Met Asp Ile Phe Glu Lys Val Asp Ala Ile Phe Asp Lys His Glu Val 225 230 235 240 Gln Glu Ile Lys Glu Lys Ile Leu Asn Ser Asp Tyr Asp Val Glu Asp 245 250 255 Phe Phe Glu Gly Glu Phe Phe Asn Phe Val Leu Thr Gln Glu Gly Ile 260 265 270 Asp Val Tyr Asn Ala Ile Ile Gly Gly Phe Val Thr Glu Ser Gly Glu 275 280 285 Lys Ile Lys Gly Leu Asn Glu Tyr Ile Asn Leu Tyr Asn Gln Lys Thr 290 295 300 Lys Gln Lys Leu Pro Lys Phe Lys Pro Leu Tyr Lys Gln Val Leu Ser 305 310 315 320 Asp Arg Glu Ser Leu Ser Phe Tyr Gly Glu Gly Tyr Thr Ser Asp Glu 325 330 335 Glu Val Leu Glu Val Phe Arg Asn Thr Leu Asn Lys Asn Ser Glu Ile 340 345 350 Phe Ser Ser Ile Lys Lys Leu Glu Lys Leu Phe Lys Asn Phe Asp Glu 355 360 365 Tyr Ser Ser Ala Gly Ile Phe Val Lys Asn Gly Pro Ala Ile Ser Thr 370 375 380 Ile Ser Lys Asp Ile Phe Gly Glu Trp Asn Val Ile Arg Asp Lys Trp 385 390 395 400 Asn Ala Glu Tyr Asp Asp Ile His Leu Lys Lys Lys Ala Val Val Thr 405 410 415 Glu Lys Tyr Glu Asp Asp Arg Arg Lys Ser Phe Lys Lys Ile Gly Ser 420 425 430 Phe Ser Leu Glu Gln Leu Gln Glu Tyr Ala Asp Ala Asp Leu Ser Val 435 440 445 Val Glu Lys Leu Lys Glu Ile Ile Ile Gln Lys Val Asp Glu Ile Tyr 450 455 460 Lys Val Tyr Gly Ser Ser Glu Lys Leu Phe Asp Ala Asp Phe Val Leu 465 470 475 480 Glu Lys Ser Leu Lys Lys Asn Asp Ala Val Val Ala Ile Met Lys Asp 485 490 495 Leu Leu Asp Ser Val Lys Ser Phe Glu Asn Tyr Ile Lys Ala Phe Phe 500 505 510 Gly Glu Gly Lys Glu Thr Asn Arg Asp Glu Ser Phe Tyr Gly Asp Phe 515 520 525 Val Leu Ala Tyr Asp Ile Leu Leu Lys Val Asp His Ile Tyr Asp Ala 530 535 540 Ile Arg Asn Tyr Val Thr Gln Lys Pro Tyr Ser Lys Asp Lys Phe Lys 545 550 555 560 Leu Tyr Phe Gln Asn Pro Gln Phe Met Gly Gly Trp Asp Lys Asp Lys 565 570 575 Glu Thr Asp Tyr Arg Ala Thr Ile Leu Arg Tyr Gly Ser Lys Tyr Tyr 580 585 590 Leu Ala Ile Met Asp Lys Lys Tyr Ala Lys Cys Leu Gln Lys Ile Asp 595 600 605 Lys Asp Asp Val Asn Gly Asn Tyr Glu Lys Ile Asn Tyr Lys Leu Leu 610 615 620 Pro Gly Pro Asn Lys Met Leu Pro Lys Val Phe Phe Ser Lys Lys Trp 625 630 635 640 Met Ala Tyr Tyr Asn Pro Ser Glu Asp Ile Gln Lys Ile Tyr Lys Asn 645 650 655 Gly Thr Phe Lys Lys Gly Asp Met Phe Asn Leu Asn Asp Cys His Lys 660 665 670 Leu Ile Asp Phe Phe Lys Asp Ser Ile Ser Arg Tyr Pro Lys Trp Ser 675 680 685 Asn Ala Tyr Asp Phe Asn Phe Ser Glu Thr Glu Lys Tyr Lys Asp Ile 690 695 700 Ala Gly Phe Tyr Arg Glu Val Glu Glu Gln Gly Tyr Lys Val Ser Phe 705 710 715 720 Glu Ser Ala Ser Lys Lys Glu Val Asp Lys Leu Val Glu Glu Gly Lys 725 730 735 Leu Tyr Met Phe Gln Ile Tyr Asn Lys Asp Phe Ser Asp Lys Ser His 740 745 750 Gly Thr Pro Asn Leu His Thr Met Tyr Phe Lys Leu Leu Phe Asp Glu 755 760 765 Asn Asn His Gly Gln Ile Arg Leu Ser Gly Gly Ala Glu Leu Phe Met 770 775 780 Arg Arg Ala Ser Leu Lys Lys Glu Glu Leu Val Val His Pro Ala Asn 785 790 795 800 Ser Pro Ile Ala Asn Lys Asn Pro Asp Asn Pro Lys Lys Thr Thr Thr 805 810 815 Leu Ser Tyr Asp Val Tyr Lys Asp Lys Arg Phe Ser Glu Asp Gln Tyr 820 825 830 Glu Leu His Ile Pro Ile Ala Ile Asn Lys Cys Pro Lys Asn Ile Phe 835 840 845 Lys Ile Asn Thr Glu Val Arg Val Leu Leu Lys His Asp Asp Asn Pro 850 855 860 Tyr Val Ile Gly Ile Asp Arg Gly Glu Arg Asn Leu Leu Tyr Ile Val 865 870 875 880 Val Val Asp Gly Lys Gly Asn Ile Val Glu Gln Tyr Ser Leu Asn Glu 885 890 895 Ile Ile Asn Asn Phe Asn Gly Ile Arg Ile Lys Thr Asp Tyr His Ser 900 905 910 Leu Leu Asp Lys Lys Glu Lys Glu Arg Phe Glu Ala Arg Gln Asn Trp 915 920 925 Thr Ser Ile Glu Asn Ile Lys Glu Leu Lys Ala Gly Tyr Ile Ser Gln 930 935 940 Val Val His Lys Ile Cys Glu Leu Val Glu Lys Tyr Asp Ala Val Ile 945 950 955 960 Ala Leu Glu Asp Leu Asn Ser Gly Phe Lys Asn Ser Arg Val Lys Val 965 970 975 Glu Lys Gln Val Tyr Gln Lys Phe Glu Lys Met Leu Ile Asp Lys Leu 980 985 990 Asn Tyr Met Val Asp Lys Lys Ser Asn Pro Cys Ala Thr Gly Gly Ala 995 1000 1005 Leu Lys Gly Tyr Gln Ile Thr Asn Lys Phe Glu Ser Phe Lys Ser 1010 1015 1020 Met Ser Thr Gln Asn Gly Phe Ile Phe Tyr Ile Pro Ala Trp Leu 1025 1030 1035 Thr Ser Lys Ile Asp Pro Ser Thr Gly Phe Val Asn Leu Leu Lys 1040 1045 1050 Thr Lys Tyr Thr Ser Ile Ala Asp Ser Lys Lys Phe Ile Ser Ser 1055 1060 1065 Phe Asp Arg Ile Met Tyr Val Pro Glu Glu Asp Leu Phe Glu Phe 1070 1075 1080 Ala Leu Asp Tyr Lys Asn Phe Ser Arg Thr Asp Ala Asp Tyr Ile 1085 1090 1095 Lys Lys Trp Lys Leu Tyr Ser Tyr Gly Asn Arg Ile Arg Ile Phe 1100 1105 1110 Arg Asn Pro Lys Lys Asn Asn Val Phe Asp Trp Glu Glu Val Cys 1115 1120 1125 Leu Thr Ser Ala Tyr Lys Glu Leu Phe Asn Lys Tyr Gly Ile Asn 1130 1135 1140 Tyr Gln Gln Gly Asp Ile Arg Ala Leu Leu Cys Glu Gln Ser Asp 1145 1150 1155 Lys Ala Phe Tyr Ser Ser Phe Met Ala Leu Met Ser Leu Met Leu 1160 1165 1170 Gln Met Arg Asn Ser Ile Thr Gly Arg Thr Asp Val Asp Phe Leu 1175 1180 1185 Ile Ser Pro Val Lys Asn Ser Asp Gly Ile Phe Tyr Asp Ser Arg 1190 1195 1200 Asn Tyr Glu Ala Gln Glu Asn Ala Ile Leu Pro Lys Asn Ala Asp 1205 1210 1215 Ala Asn Gly Ala Tyr Asn Ile Ala Arg Lys Val Leu Trp Ala Ile 1220 1225 1230 Gly Gln Phe Lys Lys Ala Glu Asp Glu Lys Leu Asp Lys Val Lys 1235 1240 1245 Ile Ala Ile Ser Asn Lys Glu Trp Leu Glu Tyr Ala Gln Thr Ser 1250 1255 1260 Val Lys His Gly Ser Pro Lys Lys Lys Arg Lys Val Ser Gly Gly 1265 1270 1275 Ser Ser Gly Gly Ser Pro Lys Lys Lys Arg Lys Val 1280 1285 1290 <210> 55 <211> 3873 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 55 atgccgaaga agaagcgcaa ggtcgggggc gggggctcag gcgggggcgg gagcggcggc 60 gggggctctg ggggcggcgg cagcggcggg ggcggcagcg ggggcggcgg gtcgatgagc 120 aagctggaga agttcacgaa ctgctactcc ctcagcaaga ccctgaggtt caaggcgatc 180 ccggtcggca agacccagga gaacatcgac aacaagcggc tgctggtgga ggacgagaag 240 agggctgagg actacaaggg cgtgaagaag ctcctggacc gctactacct gtccttcatc 300 aacgacgtgc tccacagcat caagctcaag aacctgaaca actacatcag cctcttcagg 360 aagaagacgc gcaccgagaa ggagaacaag gagctcgaga acctggagat caacctgagg 420 aaggagatcg ccaaggcgtt caagggcaac gagggctaca agtccctctt caagaaggac 480 atcatcgaga cgatcctccc ggagttcctg gacgacaagg acgagatcgc cctggtcaac 540 tccttcaacg gcttcaccac ggcgttcacc ggcttcttcg acaaccgcga gaacatgttc 600 agcgaggagg ccaagtccac gagcatcgcg ttcaggtgca tcaacgagaa cctcacccgc 660 tacatctcca acatggacat cttcgagaag gtcgacgcga tcttcgacaa gcacgaggtg 720 caggagatca aggagaagat cctgaacagc gactacgacg tcgaggactt cttcgagggc 780 gagttcttca acttcgtcct cacgcaggag ggcatcgacg tgtacaacgc catcatcggt 840 ggcttcgtga ccgagtccgg cgagaagatc aagggcctga acgagtacat caacctctac 900 aaccagaaga ccaagcagaa gctgccgaag ttcaagcccc tgtacaagca ggtgctctcc 960 gacagggagt ccctcagctt ctacggcgag ggctacacga gcgacgagga ggtcctggag 1020 gtgttccgca acaccctcaa caagaacagc gagatcttct ccagcatcaa gaagctcgag 1080 aagctgttca agaacttcga cgagtactcc agcgccggca tcttcgtcaa gaacggcccg 1140 gcgatctcca cgatcagcaa ggacatcttc ggcgagtgga acgtgatccg cgacaagtgg 1200 aacgccgagt acgacgacat ccacctcaag aagaaggcgg tggtcaccga gaagtacgag 1260 gacgacaggc gcaagtcctt caagaagatc ggctccttca gcctcgagca gctgcaggag 1320 tacgccgacg cggacctgag cgtggtcgag aagctcaagg agatcatcat ccagaaggtc 1380 gacgagatct acaaggtgta cggctccagc gagaagctct tcgacgcgga cttcgtcctc 1440 gagaagtccc tgaagaagaa cgacgccgtg gtcgcgatca tgaaggacct cctggactcc 1500 gtgaagagct tcgagaatta catcaaggcc ttcttcggcg agggcaagga gacgaacagg 1560 gacgagtcct tctacggcga cttcgtcctg gcctacgaca tcctcctgaa ggtggaccac 1620 atctacgacg cgatccgcaa ctacgtgacc cagaagccgt acagcaagga caagttcaag 1680 ctctacttcc agaaccccca gttcatgggc ggctgggaca aggacaagga gacggactac 1740 agggcgacca tcctgcgcta cggcagcaag tactacctcg ccatcatgga caagaagtac 1800 gcgaagtgcc tgcagaagat cgacaaggac gacgtcaacg gcaactacga gaagatcaac 1860 tacaagctcc tgccgggccc caacaagatg ctcccgaagg tgttcttctc caagaagtgg 1920 atggcctact acaaccccag cgaggacatc cagaagatct acaagaacgg cacgttcaag 1980 aagggcgaca tgttcaacct gaacgactgc cacaagctca tcgacttctt caaggactcc 2040 atcagccgct acccgaagtg gtccaacgcc tacgacttca acttcagcga gaccgagaag 2100 tacaaggaca tcgcgggctt ctaccgcgag gtcgaggagc agggctacaa ggtgtccttc 2160 gagtccgcca gcaagaagga ggtcgacaag ctggtggagg agggcaagct ctacatgttc 2220 cagatctaca acaaggactt ctccgacaag agccacggca cgcccaacct gcacaccatg 2280 tacttcaagc tcctgttcga cgagaacaac cacggccaga tcaggctgtc cggcggcgcc 2340 gagctcttca tgaggagggc gagcctgaag aaggaggagc tggtggtcca ccccgctaac 2400 agcccaatcg cgaacaagaa cccggacaac cccaagaaga ccacgaccct gtcctacgac 2460 gtgtacaagg acaagaggtt cagcgaggac cagtacgagc tccacatccc gatcgcgatc 2520 aacaagtgcc ccaagaacat cttcaagatc aacaccgagg tccgcgtgct cctgaagcac 2580 gacgacaacc cctacgtgat cggcatcgac aggggcgaga ggaacctcct gtacatcgtg 2640 gtcgtggacg gcaagggcaa catcgtggag cagtactccc tcaacgagat catcaacaac 2700 ttcaacggca tcaggatcaa gacggactac cacagcctcc tggacaagaa ggagaaggag 2760 aggttcgagg cccgccagaa ctggacctcc atcgagaaca tcaaggagct gaaggcgggc 2820 tacatcagcc aggtcgtgca caagatctgc gagctcgtcg agaagtacga cgccgtgatc 2880 gccctcgagg acctgaactc cggcttcaag aacagccgcg tcaaggtgga gaagcaggtc 2940 taccagaagt tcgagaagat gctcatcgac aagctgaact acatggtgga caagaagtcc 3000 aacccctgcg ctacgggcgg cgcgctgaag ggctaccaga tcaccaacaa gttcgagagc 3060 ttcaagtcca tgagcactca gaacggcttc atcttctaca tcccggcgtg gctcacgtcc 3120 aagatcgacc ccagcaccgg cttcgtcaac ctcctgaaga cgaagtacac ctccatcgcc 3180 gacagcaaga agttcatctc cagcttcgac cgcatcatgt atgtgccgga ggaggacctg 3240 ttcgagttcg ccctcgacta caagaacttc tcccgcacgg acgcggacta catcaagaag 3300 tggaagctgt acagctacgg caaccgcatc cgcatcttca ggaaccccaa gaagaacaac 3360 gtcttcgact gggaggaggt gtgcctgacc tccgcgtaca aggagctctt caacaagtac 3420 ggcatcaact accagcaggg cgacatcagg gctctcctgt gcgagcagag cgacaaggcc 3480 ttctactcca gcttcatggc gctgatgtcc ctcatgctgc agatgaggaa ctcgatcacc 3540 ggcaggacgg acgtggactt cctcatctcc ccggtgaaga acagcgacgg catcttctac 3600 gactccagga actacgaggc ccaggagaac gcgatcctcc caaagaacgc ggacgccaac 3660 ggcgcctaca acatcgccag gaaggtcctc tgggctatcg gccagttcaa gaaggcggag 3720 gacgagaagc tggacaaggt gaagatcgcc atcagcaaca aggagtggct cgagtacgcc 3780 cagacctcgg tcaagcacgg cagcccgaag aagaagcgca aggtgtccgg cggcagctcc 3840 ggcggcagcc cgaagaagaa gcgcaaagtg tga 3873 <210> 56 <211> 1290 <212> PRT <213> Artificial Sequence <220> <223> Fusion protein <400> 56 Met Pro Lys Lys Lys Arg Lys Val Gly Gly Gly Gly Ser Gly Gly Gly 1 5 10 15 Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly 20 25 30 Ser Gly Gly Gly Gly Ser Met Ser Lys Leu Glu Lys Phe Thr Asn Cys 35 40 45 Tyr Ser Leu Ser Lys Thr Leu Arg Phe Lys Ala Ile Pro Val Gly Lys 50 55 60 Thr Gln Glu Asn Ile Asp Asn Lys Arg Leu Leu Val Glu Asp Glu Lys 65 70 75 80 Arg Ala Glu Asp Tyr Lys Gly Val Lys Lys Leu Leu Asp Arg Tyr Tyr 85 90 95 Leu Ser Phe Ile Asn Asp Val Leu His Ser Ile Lys Leu Lys Asn Leu 100 105 110 Asn Asn Tyr Ile Ser Leu Phe Arg Lys Lys Thr Arg Thr Glu Lys Glu 115 120 125 Asn Lys Glu Leu Glu Asn Leu Glu Ile Asn Leu Arg Lys Glu Ile Ala 130 135 140 Lys Ala Phe Lys Gly Asn Glu Gly Tyr Lys Ser Leu Phe Lys Lys Asp 145 150 155 160 Ile Ile Glu Thr Ile Leu Pro Glu Phe Leu Asp Asp Lys Asp Glu Ile 165 170 175 Ala Leu Val Asn Ser Phe Asn Gly Phe Thr Thr Ala Phe Thr Gly Phe 180 185 190 Phe Asp Asn Arg Glu Asn Met Phe Ser Glu Glu Ala Lys Ser Thr Ser 195 200 205 Ile Ala Phe Arg Cys Ile Asn Glu Asn Leu Thr Arg Tyr Ile Ser Asn 210 215 220 Met Asp Ile Phe Glu Lys Val Asp Ala Ile Phe Asp Lys His Glu Val 225 230 235 240 Gln Glu Ile Lys Glu Lys Ile Leu Asn Ser Asp Tyr Asp Val Glu Asp 245 250 255 Phe Phe Glu Gly Glu Phe Phe Asn Phe Val Leu Thr Gln Glu Gly Ile 260 265 270 Asp Val Tyr Asn Ala Ile Ile Gly Gly Phe Val Thr Glu Ser Gly Glu 275 280 285 Lys Ile Lys Gly Leu Asn Glu Tyr Ile Asn Leu Tyr Asn Gln Lys Thr 290 295 300 Lys Gln Lys Leu Pro Lys Phe Lys Pro Leu Tyr Lys Gln Val Leu Ser 305 310 315 320 Asp Arg Glu Ser Leu Ser Phe Tyr Gly Glu Gly Tyr Thr Ser Asp Glu 325 330 335 Glu Val Leu Glu Val Phe Arg Asn Thr Leu Asn Lys Asn Ser Glu Ile 340 345 350 Phe Ser Ser Ile Lys Lys Leu Glu Lys Leu Phe Lys Asn Phe Asp Glu 355 360 365 Tyr Ser Ser Ala Gly Ile Phe Val Lys Asn Gly Pro Ala Ile Ser Thr 370 375 380 Ile Ser Lys Asp Ile Phe Gly Glu Trp Asn Val Ile Arg Asp Lys Trp 385 390 395 400 Asn Ala Glu Tyr Asp Asp Ile His Leu Lys Lys Lys Ala Val Val Thr 405 410 415 Glu Lys Tyr Glu Asp Asp Arg Arg Lys Ser Phe Lys Lys Ile Gly Ser 420 425 430 Phe Ser Leu Glu Gln Leu Gln Glu Tyr Ala Asp Ala Asp Leu Ser Val 435 440 445 Val Glu Lys Leu Lys Glu Ile Ile Ile Gln Lys Val Asp Glu Ile Tyr 450 455 460 Lys Val Tyr Gly Ser Ser Glu Lys Leu Phe Asp Ala Asp Phe Val Leu 465 470 475 480 Glu Lys Ser Leu Lys Lys Asn Asp Ala Val Val Ala Ile Met Lys Asp 485 490 495 Leu Leu Asp Ser Val Lys Ser Phe Glu Asn Tyr Ile Lys Ala Phe Phe 500 505 510 Gly Glu Gly Lys Glu Thr Asn Arg Asp Glu Ser Phe Tyr Gly Asp Phe 515 520 525 Val Leu Ala Tyr Asp Ile Leu Leu Lys Val Asp His Ile Tyr Asp Ala 530 535 540 Ile Arg Asn Tyr Val Thr Gln Lys Pro Tyr Ser Lys Asp Lys Phe Lys 545 550 555 560 Leu Tyr Phe Gln Asn Pro Gln Phe Met Gly Gly Trp Asp Lys Asp Lys 565 570 575 Glu Thr Asp Tyr Arg Ala Thr Ile Leu Arg Tyr Gly Ser Lys Tyr Tyr 580 585 590 Leu Ala Ile Met Asp Lys Lys Tyr Ala Lys Cys Leu Gln Lys Ile Asp 595 600 605 Lys Asp Asp Val Asn Gly Asn Tyr Glu Lys Ile Asn Tyr Lys Leu Leu 610 615 620 Pro Gly Pro Asn Lys Met Leu Pro Lys Val Phe Phe Ser Lys Lys Trp 625 630 635 640 Met Ala Tyr Tyr Asn Pro Ser Glu Asp Ile Gln Lys Ile Tyr Lys Asn 645 650 655 Gly Thr Phe Lys Lys Gly Asp Met Phe Asn Leu Asn Asp Cys His Lys 660 665 670 Leu Ile Asp Phe Phe Lys Asp Ser Ile Ser Arg Tyr Pro Lys Trp Ser 675 680 685 Asn Ala Tyr Asp Phe Asn Phe Ser Glu Thr Glu Lys Tyr Lys Asp Ile 690 695 700 Ala Gly Phe Tyr Arg Glu Val Glu Glu Gln Gly Tyr Lys Val Ser Phe 705 710 715 720 Glu Ser Ala Ser Lys Lys Glu Val Asp Lys Leu Val Glu Glu Gly Lys 725 730 735 Leu Tyr Met Phe Gln Ile Tyr Asn Lys Asp Phe Ser Asp Lys Ser His 740 745 750 Gly Thr Pro Asn Leu His Thr Met Tyr Phe Lys Leu Leu Phe Asp Glu 755 760 765 Asn Asn His Gly Gln Ile Arg Leu Ser Gly Gly Ala Glu Leu Phe Met 770 775 780 Arg Arg Ala Ser Leu Lys Lys Glu Glu Leu Val Val His Pro Ala Asn 785 790 795 800 Ser Pro Ile Ala Asn Lys Asn Pro Asp Asn Pro Lys Lys Thr Thr Thr 805 810 815 Leu Ser Tyr Asp Val Tyr Lys Asp Lys Arg Phe Ser Glu Asp Gln Tyr 820 825 830 Glu Leu His Ile Pro Ile Ala Ile Asn Lys Cys Pro Lys Asn Ile Phe 835 840 845 Lys Ile Asn Thr Glu Val Arg Val Leu Leu Lys His Asp Asp Asn Pro 850 855 860 Tyr Val Ile Gly Ile Asp Arg Gly Glu Arg Asn Leu Leu Tyr Ile Val 865 870 875 880 Val Val Asp Gly Lys Gly Asn Ile Val Glu Gln Tyr Ser Leu Asn Glu 885 890 895 Ile Ile Asn Asn Phe Asn Gly Ile Arg Ile Lys Thr Asp Tyr His Ser 900 905 910 Leu Leu Asp Lys Lys Glu Lys Glu Arg Phe Glu Ala Arg Gln Asn Trp 915 920 925 Thr Ser Ile Glu Asn Ile Lys Glu Leu Lys Ala Gly Tyr Ile Ser Gln 930 935 940 Val Val His Lys Ile Cys Glu Leu Val Glu Lys Tyr Asp Ala Val Ile 945 950 955 960 Ala Leu Glu Asp Leu Asn Ser Gly Phe Lys Asn Ser Arg Val Lys Val 965 970 975 Glu Lys Gln Val Tyr Gln Lys Phe Glu Lys Met Leu Ile Asp Lys Leu 980 985 990 Asn Tyr Met Val Asp Lys Lys Ser Asn Pro Cys Ala Thr Gly Gly Ala 995 1000 1005 Leu Lys Gly Tyr Gln Ile Thr Asn Lys Phe Glu Ser Phe Lys Ser 1010 1015 1020 Met Ser Thr Gln Asn Gly Phe Ile Phe Tyr Ile Pro Ala Trp Leu 1025 1030 1035 Thr Ser Lys Ile Asp Pro Ser Thr Gly Phe Val Asn Leu Leu Lys 1040 1045 1050 Thr Lys Tyr Thr Ser Ile Ala Asp Ser Lys Lys Phe Ile Ser Ser 1055 1060 1065 Phe Asp Arg Ile Met Tyr Val Pro Glu Glu Asp Leu Phe Glu Phe 1070 1075 1080 Ala Leu Asp Tyr Lys Asn Phe Ser Arg Thr Asp Ala Asp Tyr Ile 1085 1090 1095 Lys Lys Trp Lys Leu Tyr Ser Tyr Gly Asn Arg Ile Arg Ile Phe 1100 1105 1110 Arg Asn Pro Lys Lys Asn Asn Val Phe Asp Trp Glu Glu Val Cys 1115 1120 1125 Leu Thr Ser Ala Tyr Lys Glu Leu Phe Asn Lys Tyr Gly Ile Asn 1130 1135 1140 Tyr Gln Gln Gly Asp Ile Arg Ala Leu Leu Cys Glu Gln Ser Asp 1145 1150 1155 Lys Ala Phe Tyr Ser Ser Phe Met Ala Leu Met Ser Leu Met Leu 1160 1165 1170 Gln Met Arg Asn Ser Ile Thr Gly Arg Thr Asp Val Asp Phe Leu 1175 1180 1185 Ile Ser Pro Val Lys Asn Ser Asp Gly Ile Phe Tyr Asp Ser Arg 1190 1195 1200 Asn Tyr Glu Ala Gln Glu Asn Ala Ile Leu Pro Lys Asn Ala Asp 1205 1210 1215 Ala Asn Gly Ala Tyr Asn Ile Ala Arg Lys Val Leu Trp Ala Ile 1220 1225 1230 Gly Gln Phe Lys Lys Ala Glu Asp Glu Lys Leu Asp Lys Val Lys 1235 1240 1245 Ile Ala Ile Ser Asn Lys Glu Trp Leu Glu Tyr Ala Gln Thr Ser 1250 1255 1260 Val Lys His Gly Ser Pro Lys Lys Lys Arg Lys Val Ser Gly Gly 1265 1270 1275 Ser Ser Gly Gly Ser Pro Lys Lys Lys Arg Lys Val 1280 1285 1290 <210> 57 <211> 1491 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 57 Gly Gly Gly Gly Ser Gly Gly Gly Gly Gly Ser Gly Gly Gly Gly Gly 1 5 10 15 Ser Gly Gly Gly Gly Gly Ser Gly Gly Gly Gly Gly Ser Gly Gly Gly 20 25 30 Gly Gly Ser Gly Met Ser Ser Glu Thr Gly Pro Val Ala Val Asp Pro 35 40 45 Thr Leu Arg Arg Arg Ile Glu Pro His Glu Phe Glu Val Phe Phe Asp 50 55 60 Pro Arg Glu Leu Arg Lys Glu Thr Cys Leu Leu Tyr Glu Ile Asn Trp 65 70 75 80 Gly Gly Arg His Ser Ile Trp Arg His Thr Ser Gln Asn Thr Asn Lys 85 90 95 His Val Glu Val Asn Phe Ile Glu Lys Phe Thr Thr Glu Arg Tyr Phe 100 105 110 Cys Pro Asn Thr Arg Cys Ser Ile Thr Trp Phe Leu Ser Trp Ser Pro 115 120 125 Cys Gly Glu Cys Ser Arg Ala Ile Thr Glu Phe Leu Ser Arg Tyr Pro 130 135 140 His Val Thr Leu Phe Ile Tyr Ile Ala Arg Leu Tyr His His Ala Asp 145 150 155 160 Pro Arg Asn Arg Gln Gly Leu Arg Asp Leu Ile Ser Ser Gly Val Thr 165 170 175 Ile Gln Ile Met Thr Glu Gln Glu Ser Gly Tyr Cys Trp Arg Asn Phe 180 185 190 Val Asn Tyr Ser Pro Ser Asn Glu Ala His Trp Pro Arg Tyr Pro His 195 200 205 Leu Trp Val Arg Leu Tyr Val Leu Glu Leu Tyr Cys Ile Ile Leu Gly 210 215 220 Leu Pro Pro Cys Leu Asn Ile Leu Arg Arg Lys Gln Pro Gln Leu Thr 225 230 235 240 Phe Phe Thr Ile Ala Leu Gln Ser Cys His Tyr Gln Arg Leu Pro Pro 245 250 255 His Ile Leu Trp Ala Thr Gly Leu Lys Gly Gly Gly Gly Ser Gly Gly 260 265 270 Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly 275 280 285 Gly Ser Gly Gly Gly Gly Ser Met Ser Lys Leu Glu Lys Phe Thr Asn 290 295 300 Cys Tyr Ser Leu Ser Lys Thr Leu Arg Phe Lys Ala Ile Pro Val Gly 305 310 315 320 Lys Thr Gln Glu Asn Ile Asp Asn Lys Arg Leu Leu Val Glu Asp Glu 325 330 335 Lys Arg Ala Glu Asp Tyr Lys Gly Val Lys Lys Leu Leu Asp Arg Tyr 340 345 350 Tyr Leu Ser Phe Ile Asn Asp Val Leu His Ser Ile Lys Leu Lys Asn 355 360 365 Leu Asn Asn Tyr Ile Ser Leu Phe Arg Lys Lys Thr Arg Thr Glu Lys 370 375 380 Glu Asn Lys Glu Leu Glu Asn Leu Glu Ile Asn Leu Arg Lys Glu Ile 385 390 395 400 Ala Lys Ala Phe Lys Gly Asn Glu Gly Tyr Lys Ser Leu Phe Lys Lys 405 410 415 Asp Ile Ile Glu Thr Ile Leu Pro Glu Phe Leu Asp Asp Lys Asp Glu 420 425 430 Ile Ala Leu Val Asn Ser Phe Asn Gly Phe Thr Thr Ala Phe Thr Gly 435 440 445 Phe Phe Asp Asn Arg Glu Asn Met Phe Ser Glu Glu Ala Lys Ser Thr 450 455 460 Ser Ile Ala Phe Arg Cys Ile Asn Glu Asn Leu Thr Arg Tyr Ile Ser 465 470 475 480 Asn Met Asp Ile Phe Glu Lys Val Asp Ala Ile Phe Asp Lys His Glu 485 490 495 Val Gln Glu Ile Lys Glu Lys Ile Leu Asn Ser Asp Tyr Asp Val Glu 500 505 510 Asp Phe Phe Glu Gly Glu Phe Phe Asn Phe Val Leu Thr Gln Glu Gly 515 520 525 Ile Asp Val Tyr Asn Ala Ile Ile Gly Gly Phe Val Thr Glu Ser Gly 530 535 540 Glu Lys Ile Lys Gly Leu Asn Glu Tyr Ile Asn Leu Tyr Asn Gln Lys 545 550 555 560 Thr Lys Gln Lys Leu Pro Lys Phe Lys Pro Leu Tyr Lys Gln Val Leu 565 570 575 Ser Asp Arg Glu Ser Leu Ser Phe Tyr Gly Glu Gly Tyr Thr Ser Asp 580 585 590 Glu Glu Val Leu Glu Val Phe Arg Asn Thr Leu Asn Lys Asn Ser Glu 595 600 605 Ile Phe Ser Ser Ile Lys Lys Leu Glu Lys Leu Phe Lys Asn Phe Asp 610 615 620 Glu Tyr Ser Ser Ala Gly Ile Phe Val Lys Asn Gly Pro Ala Ile Ser 625 630 635 640 Thr Ile Ser Lys Asp Ile Phe Gly Glu Trp Asn Val Ile Arg Asp Lys 645 650 655 Trp Asn Ala Glu Tyr Asp Asp Ile His Leu Lys Lys Lys Ala Val Val 660 665 670 Thr Glu Lys Tyr Glu Asp Asp Arg Arg Lys Ser Phe Lys Lys Ile Gly 675 680 685 Ser Phe Ser Leu Glu Gln Leu Gln Glu Tyr Ala Asp Ala Asp Leu Ser 690 695 700 Val Val Glu Lys Leu Lys Glu Ile Ile Ile Gln Lys Val Asp Glu Ile 705 710 715 720 Tyr Lys Val Tyr Gly Ser Ser Glu Lys Leu Phe Asp Ala Asp Phe Val 725 730 735 Leu Glu Lys Ser Leu Lys Lys Asn Asp Ala Val Val Ala Ile Met Lys 740 745 750 Asp Leu Leu Asp Ser Val Lys Ser Phe Glu Asn Tyr Ile Lys Ala Phe 755 760 765 Phe Gly Glu Gly Lys Glu Thr Asn Arg Asp Glu Ser Phe Tyr Gly Asp 770 775 780 Phe Val Leu Ala Tyr Asp Ile Leu Leu Lys Val Asp His Ile Tyr Asp 785 790 795 800 Ala Ile Arg Asn Tyr Val Thr Gln Lys Pro Tyr Ser Lys Asp Lys Phe 805 810 815 Lys Leu Tyr Phe Gln Asn Pro Gln Phe Met Gly Gly Trp Asp Lys Asp 820 825 830 Lys Glu Thr Asp Tyr Arg Ala Thr Ile Leu Arg Tyr Gly Ser Lys Tyr 835 840 845 Tyr Leu Ala Ile Met Asp Lys Lys Tyr Ala Lys Cys Leu Gln Lys Ile 850 855 860 Asp Lys Asp Asp Val Asn Gly Asn Tyr Glu Lys Ile Asn Tyr Lys Leu 865 870 875 880 Leu Pro Gly Pro Asn Lys Met Leu Pro Lys Val Phe Phe Ser Lys Lys 885 890 895 Trp Met Ala Tyr Tyr Asn Pro Ser Glu Asp Ile Gln Lys Ile Tyr Lys 900 905 910 Asn Gly Thr Phe Lys Lys Gly Asp Met Phe Asn Leu Asn Asp Cys His 915 920 925 Lys Leu Ile Asp Phe Phe Lys Asp Ser Ile Ser Arg Tyr Pro Lys Trp 930 935 940 Ser Asn Ala Tyr Asp Phe Asn Phe Ser Glu Thr Glu Lys Tyr Lys Asp 945 950 955 960 Ile Ala Gly Phe Tyr Arg Glu Val Glu Glu Gln Gly Tyr Lys Val Ser 965 970 975 Phe Glu Ser Ala Ser Lys Lys Glu Val Asp Lys Leu Val Glu Glu Gly 980 985 990 Lys Leu Tyr Met Phe Gln Ile Tyr Asn Lys Asp Phe Ser Asp Lys Ser 995 1000 1005 His Gly Thr Pro Asn Leu His Thr Met Tyr Phe Lys Leu Leu Phe 1010 1015 1020 Asp Glu Asn Asn His Gly Gln Ile Arg Leu Ser Gly Gly Ala Glu 1025 1030 1035 Leu Phe Met Arg Arg Ala Ser Leu Lys Lys Glu Glu Leu Val Val 1040 1045 1050 His Pro Ala Asn Ser Pro Ile Ala Asn Lys Asn Pro Asp Asn Pro 1055 1060 1065 Lys Lys Thr Thr Thr Leu Ser Tyr Asp Val Tyr Lys Asp Lys Arg 1070 1075 1080 Phe Ser Glu Asp Gln Tyr Glu Leu His Ile Pro Ile Ala Ile Asn 1085 1090 1095 Lys Cys Pro Lys Asn Ile Phe Lys Ile Asn Thr Glu Val Arg Val 1100 1105 1110 Leu Leu Lys His Asp Asp Asn Pro Tyr Val Ile Gly Ile Ala Arg 1115 1120 1125 Gly Glu Arg Asn Leu Leu Tyr Ile Val Val Val Asp Gly Lys Gly 1130 1135 1140 Asn Ile Val Glu Gln Tyr Ser Leu Asn Glu Ile Ile Asn Asn Phe 1145 1150 1155 Asn Gly Ile Arg Ile Lys Thr Asp Tyr His Ser Leu Leu Asp Lys 1160 1165 1170 Lys Glu Lys Glu Arg Phe Glu Ala Arg Gln Asn Trp Thr Ser Ile 1175 1180 1185 Glu Asn Ile Lys Glu Leu Lys Ala Gly Tyr Ile Ser Gln Val Val 1190 1195 1200 His Lys Ile Cys Glu Leu Val Glu Lys Tyr Asp Ala Val Ile Ala 1205 1210 1215 Leu Ala Asp Leu Asn Ser Gly Phe Lys Asn Ser Arg Val Lys Val 1220 1225 1230 Glu Lys Gln Val Tyr Gln Lys Phe Glu Lys Met Leu Ile Asp Lys 1235 1240 1245 Leu Asn Tyr Met Val Asp Lys Lys Ser Asn Pro Cys Ala Thr Gly 1250 1255 1260 Gly Ala Leu Lys Gly Tyr Gln Ile Thr Asn Lys Phe Glu Ser Phe 1265 1270 1275 Lys Ser Met Ser Thr Gln Asn Gly Phe Ile Phe Tyr Ile Pro Ala 1280 1285 1290 Trp Leu Thr Ser Lys Ile Asp Pro Ser Thr Gly Phe Val Asn Leu 1295 1300 1305 Leu Lys Thr Lys Tyr Thr Ser Ile Ala Asp Ser Lys Lys Phe Ile 1310 1315 1320 Ser Ser Phe Asp Arg Ile Met Tyr Val Pro Glu Glu Asp Leu Phe 1325 1330 1335 Glu Phe Ala Leu Asp Tyr Lys Asn Phe Ser Arg Thr Asp Ala Asp 1340 1345 1350 Tyr Ile Lys Lys Trp Lys Leu Tyr Ser Tyr Gly Asn Arg Ile Arg 1355 1360 1365 Ile Phe Arg Asn Pro Lys Lys Asn Asn Val Phe Asp Trp Glu Glu 1370 1375 1380 Val Cys Leu Thr Ser Ala Tyr Lys Glu Leu Phe Asn Lys Tyr Gly 1385 1390 1395 Ile Asn Tyr Gln Gln Gly Asp Ile Arg Ala Leu Leu Cys Glu Gln 1400 1405 1410 Ser Asp Lys Ala Phe Tyr Ser Ser Phe Met Ala Leu Met Ser Leu 1415 1420 1425 Met Leu Gln Met Arg Asn Ser Ile Thr Gly Arg Thr Asp Val Ala 1430 1435 1440 Phe Leu Ile Ser Pro Val Lys Asn Ser Asp Gly Ile Phe Tyr Asp 1445 1450 1455 Ser Arg Asn Tyr Glu Ala Gln Glu Asn Ala Ile Leu Pro Lys Asn 1460 1465 1470 Ala Asp Ala Asn Gly Ala Tyr Asn Ile Ala Arg Lys Val Leu Trp 1475 1480 1485 Ala Ile Gly 1490 <210> 58 <211> 1662 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 58 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly 1 5 10 15 Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Met Pro 20 25 30 Lys Lys Lys Arg Lys Val Met Ser Ser Glu Thr Gly Pro Val Ala Val 35 40 45 Asp Pro Thr Leu Arg Arg Arg Ile Glu Pro His Glu Phe Glu Val Phe 50 55 60 Phe Asp Pro Arg Glu Leu Arg Lys Glu Thr Cys Leu Leu Tyr Glu Ile 65 70 75 80 Asn Trp Gly Gly Arg His Ser Ile Trp Arg His Thr Ser Gln Asn Thr 85 90 95 Asn Lys His Val Glu Val Asn Phe Ile Glu Lys Phe Thr Thr Glu Arg 100 105 110 Tyr Phe Cys Pro Asn Thr Arg Cys Ser Ile Thr Trp Phe Leu Ser Trp 115 120 125 Ser Pro Cys Gly Glu Cys Ser Arg Ala Ile Thr Glu Phe Leu Ser Arg 130 135 140 Tyr Pro His Val Thr Leu Phe Ile Tyr Ile Ala Arg Leu Tyr His His 145 150 155 160 Ala Asp Pro Arg Asn Arg Gln Gly Leu Arg Asp Leu Ile Ser Ser Gly 165 170 175 Val Thr Ile Gln Ile Met Thr Glu Gln Glu Ser Gly Tyr Cys Trp Arg 180 185 190 Asn Phe Val Asn Tyr Ser Pro Ser Asn Glu Ala His Trp Pro Arg Tyr 195 200 205 Pro His Leu Trp Val Arg Leu Tyr Val Leu Glu Leu Tyr Cys Ile Ile 210 215 220 Leu Gly Leu Pro Pro Cys Leu Asn Ile Leu Arg Arg Lys Gln Pro Gln 225 230 235 240 Leu Thr Phe Phe Thr Ile Ala Leu Gln Ser Cys His Tyr Gln Arg Leu 245 250 255 Pro Pro His Ile Leu Trp Ala Thr Gly Leu Lys Gly Gly Gly Gly Ser 260 265 270 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly 275 280 285 Gly Gly Gly Ser Gly Gly Gly Gly Ser Met Leu Phe Gln Asp Phe Thr 290 295 300 His Leu Tyr Pro Leu Ser Lys Thr Val Arg Phe Glu Leu Lys Pro Ile 305 310 315 320 Gly Arg Thr Leu Glu His Ile His Ala Lys Asn Phe Leu Ser Gln Asp 325 330 335 Glu Thr Met Ala Asp Met Tyr Gln Lys Val Lys Val Ile Leu Asp Asp 340 345 350 Tyr His Arg Asp Phe Ile Ala Asp Met Met Gly Glu Val Lys Leu Thr 355 360 365 Lys Leu Ala Glu Phe Tyr Asp Val Tyr Leu Lys Phe Arg Lys Asn Pro 370 375 380 Lys Asp Asp Gly Leu Gln Lys Gln Leu Lys Asp Leu Gln Ala Val Leu 385 390 395 400 Arg Lys Glu Ser Val Lys Pro Ile Gly Ser Gly Gly Lys Tyr Lys Thr 405 410 415 Gly Tyr Asp Arg Leu Phe Gly Ala Lys Leu Phe Lys Asp Gly Lys Glu 420 425 430 Leu Gly Asp Leu Ala Lys Phe Val Ile Ala Gln Glu Gly Glu Ser Ser 435 440 445 Pro Lys Leu Ala His Leu Ala His Phe Glu Lys Phe Ser Thr Tyr Phe 450 455 460 Thr Gly Phe His Asp Asn Arg Lys Asn Met Tyr Ser Asp Glu Asp Lys 465 470 475 480 His Thr Ala Ile Ala Tyr Arg Leu Ile His Glu Asn Leu Pro Arg Phe 485 490 495 Ile Asp Asn Leu Gln Ile Leu Thr Thr Ile Lys Gln Lys His Ser Ala 500 505 510 Leu Tyr Asp Gln Ile Ile Asn Glu Leu Thr Ala Ser Gly Leu Asp Val 515 520 525 Ser Leu Ala Ser His Leu Asp Gly Tyr His Lys Leu Leu Thr Gln Glu 530 535 540 Gly Ile Thr Ala Tyr Asn Arg Ile Ile Gly Glu Val Asn Gly Tyr Thr 545 550 555 560 Asn Lys His Asn Gln Ile Cys His Lys Ser Glu Arg Ile Ala Lys Leu 565 570 575 Arg Pro Leu His Lys Gln Ile Leu Ser Asp Gly Met Gly Val Ser Phe 580 585 590 Leu Pro Ser Lys Phe Ala Asp Asp Ser Glu Met Cys Gln Ala Val Asn 595 600 605 Glu Phe Tyr Arg His Tyr Thr Asp Val Phe Ala Lys Val Gln Ser Leu 610 615 620 Phe Asp Gly Phe Asp Asp His Gln Lys Asp Gly Ile Tyr Val Glu His 625 630 635 640 Lys Asn Leu Asn Glu Leu Ser Lys Gln Ala Phe Gly Asp Phe Ala Leu 645 650 655 Leu Gly Arg Val Leu Asp Gly Tyr Tyr Val Asp Val Val Asn Pro Glu 660 665 670 Phe Asn Glu Arg Phe Ala Lys Ala Lys Thr Asp Asn Ala Lys Ala Lys 675 680 685 Leu Thr Lys Glu Lys Asp Lys Phe Ile Lys Gly Val His Ser Leu Ala 690 695 700 Ser Leu Glu Gln Ala Ile Glu His His Thr Ala Arg His Asp Asp Glu 705 710 715 720 Ser Val Gln Ala Gly Lys Leu Gly Gln Tyr Phe Lys His Gly Leu Ala 725 730 735 Gly Val Asp Asn Pro Ile Gln Lys Ile His Asn Asn His Ser Thr Ile 740 745 750 Lys Gly Phe Leu Glu Arg Glu Arg Pro Ala Gly Glu Arg Ala Leu Pro 755 760 765 Lys Ile Lys Ser Gly Lys Asn Pro Glu Met Thr Gln Leu Arg Gln Leu 770 775 780 Lys Glu Leu Leu Asp Asn Ala Leu Asn Val Ala His Phe Ala Lys Leu 785 790 795 800 Leu Thr Thr Lys Thr Thr Leu Asp Asn Gln Asp Gly Asn Phe Tyr Gly 805 810 815 Glu Phe Gly Val Leu Tyr Asp Glu Leu Ala Lys Ile Pro Thr Leu Tyr 820 825 830 Asn Lys Val Arg Asp Tyr Leu Ser Gln Lys Pro Phe Ser Thr Glu Lys 835 840 845 Tyr Lys Leu Asn Phe Gly Asn Pro Thr Leu Leu Asn Gly Trp Asp Leu 850 855 860 Asn Lys Glu Lys Asp Asn Phe Gly Val Ile Leu Gln Lys Asp Gly Cys 865 870 875 880 Tyr Tyr Leu Ala Leu Leu Asp Lys Ala His Lys Lys Val Phe Asp Asn 885 890 895 Ala Pro Asn Thr Gly Lys Asn Val Tyr Gln Lys Met Val Tyr Lys Leu 900 905 910 Leu Pro Gly Pro Asn Lys Met Leu Pro Lys Val Phe Phe Ala Lys Ser 915 920 925 Asn Leu Asp Tyr Tyr Asn Pro Ser Ala Glu Leu Leu Asp Lys Tyr Ala 930 935 940 Lys Gly Thr His Lys Lys Gly Asp Asn Phe Asn Leu Lys Asp Cys His 945 950 955 960 Ala Leu Ile Asp Phe Phe Lys Ala Gly Ile Asn Lys His Pro Glu Trp 965 970 975 Gln His Phe Gly Phe Lys Phe Ser Pro Thr Ser Ser Tyr Arg Asp Leu 980 985 990 Ser Asp Phe Tyr Arg Glu Val Glu Pro Gln Gly Tyr Gln Val Lys Phe 995 1000 1005 Val Asp Ile Asn Ala Asp Tyr Ile Asp Glu Leu Val Glu Gln Gly 1010 1015 1020 Lys Leu Tyr Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ser Pro Lys 1025 1030 1035 Ala His Gly Lys Pro Asn Leu His Thr Leu Tyr Phe Lys Ala Leu 1040 1045 1050 Phe Ser Glu Asp Asn Leu Ala Asp Pro Ile Tyr Lys Leu Asn Gly 1055 1060 1065 Glu Ala Gln Ile Phe Tyr Arg Lys Ala Ser Leu Asp Met Asn Glu 1070 1075 1080 Thr Thr Ile His Arg Ala Gly Glu Val Leu Glu Asn Lys Asn Pro 1085 1090 1095 Asp Asn Pro Lys Lys Arg Gln Phe Val Tyr Asp Ile Ile Lys Asp 1100 1105 1110 Lys Arg Tyr Thr Gln Asp Lys Phe Met Leu His Val Pro Ile Thr 1115 1120 1125 Met Asn Phe Gly Val Gln Gly Met Thr Ile Lys Glu Phe Asn Lys 1130 1135 1140 Lys Val Asn Gln Ser Ile Gln Gln Tyr Asp Glu Val Asn Val Ile 1145 1150 1155 Gly Ile Ala Arg Gly Glu Arg His Leu Leu Tyr Leu Thr Val Ile 1160 1165 1170 Asn Ser Lys Gly Glu Ile Leu Glu Gln Arg Ser Leu Asn Asp Ile 1175 1180 1185 Thr Thr Ala Ser Ala Asn Gly Thr Gln Val Thr Thr Pro Tyr His 1190 1195 1200 Lys Ile Leu Asp Lys Arg Glu Ile Glu Arg Leu Asn Ala Arg Val 1205 1210 1215 Gly Trp Gly Glu Ile Glu Thr Ile Lys Glu Leu Lys Ser Gly Tyr 1220 1225 1230 Leu Ser His Val Val His Gln Ile Asn Gln Leu Met Leu Lys Tyr 1235 1240 1245 Asn Ala Ile Val Val Leu Ala Asp Leu Asn Phe Gly Phe Lys Arg 1250 1255 1260 Gly Arg Phe Lys Val Glu Lys Gln Ile Tyr Gln Asn Phe Glu Asn 1265 1270 1275 Ala Leu Ile Lys Lys Leu Asn His Leu Val Leu Lys Asp Lys Ala 1280 1285 1290 Asp Asp Glu Ile Gly Ser Tyr Lys Asn Ala Leu Gln Leu Thr Asn 1295 1300 1305 Asn Phe Thr Asp Leu Lys Ser Ile Gly Lys Gln Thr Gly Phe Leu 1310 1315 1320 Phe Tyr Val Pro Ala Trp Asn Thr Ser Lys Ile Asp Pro Glu Thr 1325 1330 1335 Gly Phe Val Asp Leu Leu Lys Pro Arg Tyr Glu Asn Ile Ala Gln 1340 1345 1350 Ser Gln Ala Phe Phe Gly Lys Phe Asp Lys Ile Cys Tyr Asn Thr 1355 1360 1365 Asp Lys Gly Tyr Phe Glu Phe His Ile Asp Tyr Ala Lys Phe Thr 1370 1375 1380 Asp Lys Ala Lys Asn Ser Arg Gln Lys Trp Ala Ile Cys Ser His 1385 1390 1395 Gly Asp Lys Arg Tyr Val Tyr Asp Lys Thr Ala Asn Gln Asn Lys 1400 1405 1410 Gly Ala Ala Lys Gly Ile Asn Val Asn Asp Glu Leu Lys Ser Leu 1415 1420 1425 Phe Ala Arg Tyr His Ile Asn Asp Lys Gln Pro Asn Leu Val Met 1430 1435 1440 Asp Ile Cys Gln Asn Asn Asp Lys Glu Phe His Lys Ser Leu Met 1445 1450 1455 Cys Leu Leu Lys Thr Leu Leu Ala Leu Arg Tyr Ser Asn Ala Ser 1460 1465 1470 Ser Asp Glu Ala Phe Ile Leu Ser Pro Val Ala Asn Asp Glu Gly 1475 1480 1485 Val Phe Phe Asn Ser Ala Leu Ala Asp Asp Thr Gln Pro Gln Asn 1490 1495 1500 Ala Asp Ala Asn Gly Ala Tyr His Ile Ala Leu Lys Gly Leu Trp 1505 1510 1515 Leu Leu Asn Glu Leu Lys Asn Ser Asp Asp Leu Asn Lys Val Lys 1520 1525 1530 Leu Ala Ile Asp Asn Gln Thr Trp Leu Asn Phe Ala Gln Asn Arg 1535 1540 1545 Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys 1550 1555 1560 Lys Ser Gly Gly Ser Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu 1565 1570 1575 Thr Gly Lys Gln Leu Val Ile Gln Glu Ser Ile Leu Met Leu Pro 1580 1585 1590 Glu Glu Val Glu Glu Val Ile Gly Asn Lys Pro Glu Ser Asp Ile 1595 1600 1605 Leu Val His Thr Ala Tyr Asp Glu Ser Thr Asp Glu Asn Val Met 1610 1615 1620 Leu Leu Thr Ser Asp Ala Pro Glu Tyr Lys Pro Trp Ala Leu Val 1625 1630 1635 Ile Gln Asp Ser Asn Gly Glu Asn Lys Ile Lys Met Leu Ser Gly 1640 1645 1650 Gly Ser Pro Lys Lys Lys Arg Lys Val 1655 1660 <210> 59 <211> 1267 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 59 Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser 1 5 10 15 Met Leu Phe Gln Asp Phe Thr His Leu Tyr Pro Leu Ser Lys Thr Val 20 25 30 Arg Phe Glu Leu Lys Pro Ile Gly Arg Thr Leu Glu His Ile His Ala 35 40 45 Lys Asn Phe Leu Ser Gln Asp Glu Thr Met Ala Asp Met Tyr Gln Lys 50 55 60 Val Lys Val Ile Leu Asp Asp Tyr His Arg Asp Phe Ile Ala Asp Met 65 70 75 80 Met Gly Glu Val Lys Leu Thr Lys Leu Ala Glu Phe Tyr Asp Val Tyr 85 90 95 Leu Lys Phe Arg Lys Asn Pro Lys Asp Asp Gly Leu Gln Lys Gln Leu 100 105 110 Lys Asp Leu Gln Ala Val Leu Arg Lys Glu Ser Val Lys Pro Ile Gly 115 120 125 Ser Gly Gly Lys Tyr Lys Thr Gly Tyr Asp Arg Leu Phe Gly Ala Lys 130 135 140 Leu Phe Lys Asp Gly Lys Glu Leu Gly Asp Leu Ala Lys Phe Val Ile 145 150 155 160 Ala Gln Glu Gly Glu Ser Ser Pro Lys Leu Ala His Leu Ala His Phe 165 170 175 Glu Lys Phe Ser Thr Tyr Phe Thr Gly Phe His Asp Asn Arg Lys Asn 180 185 190 Met Tyr Ser Asp Glu Asp Lys His Thr Ala Ile Ala Tyr Arg Leu Ile 195 200 205 His Glu Asn Leu Pro Arg Phe Ile Asp Asn Leu Gln Ile Leu Thr Thr 210 215 220 Ile Lys Gln Lys His Ser Ala Leu Tyr Asp Gln Ile Ile Asn Glu Leu 225 230 235 240 Thr Ala Ser Gly Leu Asp Val Ser Leu Ala Ser His Leu Asp Gly Tyr 245 250 255 His Lys Leu Leu Thr Gln Glu Gly Ile Thr Ala Tyr Asn Arg Ile Ile 260 265 270 Gly Glu Val Asn Gly Tyr Thr Asn Lys His Asn Gln Ile Cys His Lys 275 280 285 Ser Glu Arg Ile Ala Lys Leu Arg Pro Leu His Lys Gln Ile Leu Ser 290 295 300 Asp Gly Met Gly Val Ser Phe Leu Pro Ser Lys Phe Ala Asp Asp Ser 305 310 315 320 Glu Met Cys Gln Ala Val Asn Glu Phe Tyr Arg His Tyr Thr Asp Val 325 330 335 Phe Ala Lys Val Gln Ser Leu Phe Asp Gly Phe Asp Asp His Gln Lys 340 345 350 Asp Gly Ile Tyr Val Glu His Lys Asn Leu Asn Glu Leu Ser Lys Gln 355 360 365 Ala Phe Gly Asp Phe Ala Leu Leu Gly Arg Val Leu Asp Gly Tyr Tyr 370 375 380 Val Asp Val Val Asn Pro Glu Phe Asn Glu Arg Phe Ala Lys Ala Lys 385 390 395 400 Thr Asp Asn Ala Lys Ala Lys Leu Thr Lys Glu Lys Asp Lys Phe Ile 405 410 415 Lys Gly Val His Ser Leu Ala Ser Leu Glu Gln Ala Ile Glu His His 420 425 430 Thr Ala Arg His Asp Asp Glu Ser Val Gln Ala Gly Lys Leu Gly Gln 435 440 445 Tyr Phe Lys His Gly Leu Ala Gly Val Asp Asn Pro Ile Gln Lys Ile 450 455 460 His Asn Asn His Ser Thr Ile Lys Gly Phe Leu Glu Arg Glu Arg Pro 465 470 475 480 Ala Gly Glu Arg Ala Leu Pro Lys Ile Lys Ser Gly Lys Asn Pro Glu 485 490 495 Met Thr Gln Leu Arg Gln Leu Lys Glu Leu Leu Asp Asn Ala Leu Asn 500 505 510 Val Ala His Phe Ala Lys Leu Leu Thr Thr Lys Thr Thr Leu Asp Asn 515 520 525 Gln Asp Gly Asn Phe Tyr Gly Glu Phe Gly Val Leu Tyr Asp Glu Leu 530 535 540 Ala Lys Ile Pro Thr Leu Tyr Asn Lys Val Arg Asp Tyr Leu Ser Gln 545 550 555 560 Lys Pro Phe Ser Thr Glu Lys Tyr Lys Leu Asn Phe Gly Asn Pro Thr 565 570 575 Leu Leu Asn Gly Trp Asp Leu Asn Lys Glu Lys Asp Asn Phe Gly Val 580 585 590 Ile Leu Gln Lys Asp Gly Cys Tyr Tyr Leu Ala Leu Leu Asp Lys Ala 595 600 605 His Lys Lys Val Phe Asp Asn Ala Pro Asn Thr Gly Lys Asn Val Tyr 610 615 620 Gln Lys Met Val Tyr Lys Leu Leu Pro Gly Pro Asn Lys Met Leu Pro 625 630 635 640 Lys Val Phe Phe Ala Lys Ser Asn Leu Asp Tyr Tyr Asn Pro Ser Ala 645 650 655 Glu Leu Leu Asp Lys Tyr Ala Lys Gly Thr His Lys Lys Gly Asp Asn 660 665 670 Phe Asn Leu Lys Asp Cys His Ala Leu Ile Asp Phe Phe Lys Ala Gly 675 680 685 Ile Asn Lys His Pro Glu Trp Gln His Phe Gly Phe Lys Phe Ser Pro 690 695 700 Thr Ser Ser Tyr Arg Asp Leu Ser Asp Phe Tyr Arg Glu Val Glu Pro 705 710 715 720 Gln Gly Tyr Gln Val Lys Phe Val Asp Ile Asn Ala Asp Tyr Ile Asp 725 730 735 Glu Leu Val Glu Gln Gly Lys Leu Tyr Leu Phe Gln Ile Tyr Asn Lys 740 745 750 Asp Phe Ser Pro Lys Ala His Gly Lys Pro Asn Leu His Thr Leu Tyr 755 760 765 Phe Lys Ala Leu Phe Ser Glu Asp Asn Leu Ala Asp Pro Ile Tyr Lys 770 775 780 Leu Asn Gly Glu Ala Gln Ile Phe Tyr Arg Lys Ala Ser Leu Asp Met 785 790 795 800 Asn Glu Thr Thr Ile His Arg Ala Gly Glu Val Leu Glu Asn Lys Asn 805 810 815 Pro Asp Asn Pro Lys Lys Arg Gln Phe Val Tyr Asp Ile Ile Lys Asp 820 825 830 Lys Arg Tyr Thr Gln Asp Lys Phe Met Leu His Val Pro Ile Thr Met 835 840 845 Asn Phe Gly Val Gln Gly Met Thr Ile Lys Glu Phe Asn Lys Lys Val 850 855 860 Asn Gln Ser Ile Gln Gln Tyr Asp Glu Val Asn Val Ile Gly Ile Asp 865 870 875 880 Arg Gly Glu Arg His Leu Leu Tyr Leu Thr Val Ile Asn Ser Lys Gly 885 890 895 Glu Ile Leu Glu Gln Arg Ser Leu Asn Asp Ile Thr Thr Ala Ser Ala 900 905 910 Asn Gly Thr Gln Val Thr Thr Pro Tyr His Lys Ile Leu Asp Lys Arg 915 920 925 Glu Ile Glu Arg Leu Asn Ala Arg Val Gly Trp Gly Glu Ile Glu Thr 930 935 940 Ile Lys Glu Leu Lys Ser Gly Tyr Leu Ser His Val Val His Gln Ile 945 950 955 960 Asn Gln Leu Met Leu Lys Tyr Asn Ala Ile Val Val Leu Glu Asp Leu 965 970 975 Asn Phe Gly Phe Lys Arg Gly Arg Phe Lys Val Glu Lys Gln Ile Tyr 980 985 990 Gln Asn Phe Glu Asn Ala Leu Ile Lys Lys Leu Asn His Leu Val Leu 995 1000 1005 Lys Asp Lys Ala Asp Asp Glu Ile Gly Ser Tyr Lys Asn Ala Leu 1010 1015 1020 Gln Leu Thr Asn Asn Phe Thr Asp Leu Lys Ser Ile Gly Lys Gln 1025 1030 1035 Thr Gly Phe Leu Phe Tyr Val Pro Ala Trp Asn Thr Ser Lys Ile 1040 1045 1050 Asp Pro Glu Thr Gly Phe Val Asp Leu Leu Lys Pro Arg Tyr Glu 1055 1060 1065 Asn Ile Ala Gln Ser Gln Ala Phe Phe Gly Lys Phe Asp Lys Ile 1070 1075 1080 Cys Tyr Asn Thr Asp Lys Gly Tyr Phe Glu Phe His Ile Asp Tyr 1085 1090 1095 Ala Lys Phe Thr Asp Lys Ala Lys Asn Ser Arg Gln Lys Trp Ala 1100 1105 1110 Ile Cys Ser His Gly Asp Lys Arg Tyr Val Tyr Asp Lys Thr Ala 1115 1120 1125 Asn Gln Asn Lys Gly Ala Ala Lys Gly Ile Asn Val Asn Asp Glu 1130 1135 1140 Leu Lys Ser Leu Phe Ala Arg Tyr His Ile Asn Asp Lys Gln Pro 1145 1150 1155 Asn Leu Val Met Asp Ile Cys Gln Asn Asn Asp Lys Glu Phe His 1160 1165 1170 Lys Ser Leu Met Cys Leu Leu Lys Thr Leu Leu Ala Leu Arg Tyr 1175 1180 1185 Ser Asn Ala Ser Ser Asp Glu Asp Phe Ile Leu Ser Pro Val Ala 1190 1195 1200 Asn Asp Glu Gly Val Phe Phe Asn Ser Ala Leu Ala Asp Asp Thr 1205 1210 1215 Gln Pro Gln Asn Ala Asp Ala Asn Gly Ala Tyr His Ile Ala Leu 1220 1225 1230 Lys Gly Leu Trp Leu Leu Asn Glu Leu Lys Asn Ser Asp Asp Leu 1235 1240 1245 Asn Lys Val Lys Leu Ala Ile Asp Asn Gln Thr Trp Leu Asn Phe 1250 1255 1260 Ala Gln Asn Arg 1265 <210> 60 <211> 1368 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 60 Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser 1 5 10 15 Met Thr Gln Phe Glu Gly Phe Thr Asn Leu Tyr Gln Val Ser Lys Thr 20 25 30 Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Lys His Ile Gln 35 40 45 Glu Gln Gly Phe Ile Glu Glu Asp Lys Ala Arg Asn Asp His Tyr Lys 50 55 60 Glu Leu Lys Pro Ile Ile Asp Arg Ile Tyr Lys Thr Tyr Ala Asp Gln 65 70 75 80 Cys Leu Gln Leu Val Gln Leu Asp Trp Glu Asn Leu Ser Ala Ala Ile 85 90 95 Asp Ser Tyr Arg Lys Glu Lys Thr Glu Glu Thr Arg Asn Ala Leu Ile 100 105 110 Glu Glu Gln Ala Thr Tyr Arg Asn Ala Ile His Asp Tyr Phe Ile Gly 115 120 125 Arg Thr Asp Asn Leu Thr Asp Ala Ile Asn Lys Arg His Ala Glu Ile 130 135 140 Tyr Lys Gly Leu Phe Lys Ala Glu Leu Phe Asn Gly Lys Val Leu Lys 145 150 155 160 Gln Leu Gly Thr Val Thr Thr Thr Glu His Glu Asn Ala Leu Leu Arg 165 170 175 Ser Phe Asp Lys Phe Thr Thr Tyr Phe Ser Gly Phe Tyr Glu Asn Arg 180 185 190 Lys Asn Val Phe Ser Ala Glu Asp Ile Ser Thr Ala Ile Pro His Arg 195 200 205 Ile Val Gln Asp Asn Phe Pro Lys Phe Lys Glu Asn Cys His Ile Phe 210 215 220 Thr Arg Leu Ile Thr Ala Val Pro Ser Leu Arg Glu His Phe Glu Asn 225 230 235 240 Val Lys Lys Ala Ile Gly Ile Phe Val Ser Thr Ser Ile Glu Glu Val 245 250 255 Phe Ser Phe Pro Phe Tyr Asn Gln Leu Leu Thr Gln Thr Gln Ile Asp 260 265 270 Leu Tyr Asn Gln Leu Leu Gly Gly Ile Ser Arg Glu Ala Gly Thr Glu 275 280 285 Lys Ile Lys Gly Leu Asn Glu Val Leu Asn Leu Ala Ile Gln Lys Asn 290 295 300 Asp Glu Thr Ala His Ile Ile Ala Ser Leu Pro His Arg Phe Ile Pro 305 310 315 320 Leu Phe Lys Gln Ile Leu Ser Asp Arg Asn Thr Leu Ser Phe Ile Leu 325 330 335 Glu Glu Phe Lys Ser Asp Glu Glu Val Ile Gln Ser Phe Cys Lys Tyr 340 345 350 Lys Thr Leu Leu Arg Asn Glu Asn Val Leu Glu Thr Ala Glu Ala Leu 355 360 365 Phe Asn Glu Leu Asn Ser Ile Asp Leu Thr His Ile Phe Ile Ser His 370 375 380 Lys Lys Leu Glu Thr Ile Ser Ser Ala Leu Cys Asp His Trp Asp Thr 385 390 395 400 Leu Arg Asn Ala Leu Tyr Glu Arg Arg Ile Ser Glu Leu Thr Gly Lys 405 410 415 Ile Thr Lys Ser Ala Lys Glu Lys Val Gln Arg Ser Leu Lys His Glu 420 425 430 Asp Ile Asn Leu Gln Glu Ile Ile Ser Ala Ala Gly Lys Glu Leu Ser 435 440 445 Glu Ala Phe Lys Gln Lys Thr Ser Glu Ile Leu Ser His Ala His Ala 450 455 460 Ala Leu Asp Gln Pro Leu Pro Thr Thr Leu Lys Lys Gln Glu Glu Lys 465 470 475 480 Glu Ile Leu Lys Ser Gln Leu Asp Ser Leu Leu Gly Leu Tyr His Leu 485 490 495 Leu Asp Trp Phe Ala Val Asp Glu Ser Asn Glu Val Asp Pro Glu Phe 500 505 510 Ser Ala Arg Leu Thr Gly Ile Lys Leu Glu Met Glu Pro Ser Leu Ser 515 520 525 Phe Tyr Asn Lys Ala Arg Asn Tyr Ala Thr Lys Lys Pro Tyr Ser Val 530 535 540 Glu Lys Phe Lys Leu Asn Phe Gln Met Pro Thr Leu Ala Ser Gly Trp 545 550 555 560 Asp Val Asn Lys Glu Lys Asn Asn Gly Ala Ile Leu Phe Val Lys Asn 565 570 575 Gly Leu Tyr Tyr Leu Gly Ile Met Pro Lys Gln Lys Gly Arg Tyr Lys 580 585 590 Ala Leu Ser Phe Glu Pro Thr Glu Lys Thr Ser Glu Gly Phe Asp Lys 595 600 605 Met Tyr Tyr Asp Tyr Phe Pro Asp Ala Ala Lys Met Ile Pro Lys Cys 610 615 620 Ser Thr Gln Leu Lys Ala Val Thr Ala His Phe Gln Thr His Thr Thr 625 630 635 640 Pro Ile Leu Leu Ser Asn Asn Phe Ile Glu Pro Leu Glu Ile Thr Lys 645 650 655 Glu Ile Tyr Asp Leu Asn Asn Pro Glu Lys Glu Pro Lys Lys Phe Gln 660 665 670 Thr Ala Tyr Ala Lys Lys Thr Gly Asp Gln Lys Gly Tyr Arg Glu Ala 675 680 685 Leu Cys Lys Trp Ile Asp Phe Thr Arg Asp Phe Leu Ser Lys Tyr Thr 690 695 700 Lys Thr Thr Ser Ile Asp Leu Ser Ser Leu Arg Pro Ser Ser Gln Tyr 705 710 715 720 Lys Asp Leu Gly Glu Tyr Tyr Ala Glu Leu Asn Pro Leu Leu Tyr His 725 730 735 Ile Ser Phe Gln Arg Ile Ala Glu Lys Glu Ile Met Asp Ala Val Glu 740 745 750 Thr Gly Lys Leu Tyr Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ala Lys 755 760 765 Gly His His Gly Lys Pro Asn Leu His Thr Leu Tyr Trp Thr Gly Leu 770 775 780 Phe Ser Pro Glu Asn Leu Ala Lys Thr Ser Ile Lys Leu Asn Gly Gln 785 790 795 800 Ala Glu Leu Phe Tyr Arg Pro Lys Ser Arg Met Lys Arg Met Ala His 805 810 815 Arg Leu Gly Glu Lys Met Leu Asn Lys Lys Leu Lys Asp Gln Lys Thr 820 825 830 Pro Ile Pro Asp Thr Leu Tyr Gln Glu Leu Tyr Asp Tyr Val Asn His 835 840 845 Arg Leu Ser His Asp Leu Ser Asp Glu Ala Arg Ala Leu Leu Pro Asn 850 855 860 Val Ile Thr Lys Glu Val Ser His Glu Ile Ile Lys Asp Arg Arg Phe 865 870 875 880 Thr Ser Asp Lys Phe Phe Phe His Val Pro Ile Thr Leu Asn Tyr Gln 885 890 895 Ala Ala Asn Ser Pro Ser Lys Phe Asn Gln Arg Val Asn Ala Tyr Leu 900 905 910 Lys Glu His Pro Glu Thr Pro Ile Ile Gly Ile Asp Arg Gly Glu Arg 915 920 925 Asn Leu Ile Tyr Ile Thr Val Ile Asp Ser Thr Gly Lys Ile Leu Glu 930 935 940 Gln Arg Ser Leu Asn Thr Ile Gln Gln Phe Asp Tyr Gln Lys Lys Leu 945 950 955 960 Asp Asn Arg Glu Lys Glu Arg Val Ala Ala Arg Gln Ala Trp Ser Val 965 970 975 Val Gly Thr Ile Lys Asp Leu Lys Gln Gly Tyr Leu Ser Gln Val Ile 980 985 990 His Glu Ile Val Asp Leu Met Ile His Tyr Gln Ala Val Val Val Leu 995 1000 1005 Glu Asn Leu Asn Phe Gly Phe Lys Ser Lys Arg Thr Gly Ile Ala 1010 1015 1020 Glu Lys Ala Val Tyr Gln Gln Phe Glu Lys Met Leu Ile Asp Lys 1025 1030 1035 Leu Asn Cys Leu Val Leu Lys Asp Tyr Pro Ala Glu Lys Val Gly 1040 1045 1050 Gly Val Leu Asn Pro Tyr Gln Leu Thr Asp Gln Phe Thr Ser Phe 1055 1060 1065 Ala Lys Met Gly Thr Gln Ser Gly Phe Leu Phe Tyr Val Pro Ala 1070 1075 1080 Pro Tyr Thr Ser Lys Ile Asp Pro Leu Thr Gly Phe Val Asp Pro 1085 1090 1095 Phe Val Trp Lys Thr Ile Lys Asn His Glu Ser Arg Lys His Phe 1100 1105 1110 Leu Glu Gly Phe Asp Phe Leu His Tyr Asp Val Lys Thr Gly Asp 1115 1120 1125 Phe Ile Leu His Phe Lys Met Asn Arg Asn Leu Ser Phe Gln Arg 1130 1135 1140 Gly Leu Pro Gly Phe Met Pro Ala Trp Asp Ile Val Phe Glu Lys 1145 1150 1155 Asn Glu Thr Gln Phe Asp Ala Lys Gly Thr Pro Phe Ile Ala Gly 1160 1165 1170 Lys Arg Ile Val Pro Val Ile Glu Asn His Arg Phe Thr Gly Arg 1175 1180 1185 Tyr Arg Asp Leu Tyr Pro Ala Asn Glu Leu Ile Ala Leu Leu Glu 1190 1195 1200 Glu Lys Gly Ile Val Phe Arg Asp Gly Ser Asn Ile Leu Pro Lys 1205 1210 1215 Leu Leu Glu Asn Asp Asp Ser His Ala Ile Asp Thr Met Val Ala 1220 1225 1230 Leu Ile Arg Ser Val Leu Gln Met Arg Asn Ser Asn Ala Ala Thr 1235 1240 1245 Gly Glu Asp Tyr Ile Asn Ser Pro Val Arg Asp Leu Asn Gly Val 1250 1255 1260 Cys Phe Asp Ser Arg Phe Gln Asn Pro Glu Trp Pro Met Asp Ala 1265 1270 1275 Asp Ala Asn Gly Ala Tyr His Ile Ala Leu Lys Gly Gln Leu Leu 1280 1285 1290 Leu Asn His Leu Lys Glu Ser Lys Asp Leu Lys Leu Gln Asn Gly 1295 1300 1305 Ile Ser Asn Gln Asp Trp Leu Ala Tyr Ile Gln Glu Leu Arg Asn 1310 1315 1320 Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys 1325 1330 1335 Lys Gly Ser Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Tyr Pro Tyr 1340 1345 1350 Asp Val Pro Asp Tyr Ala Tyr Pro Tyr Asp Val Pro Asp Tyr Ala 1355 1360 1365 <210> 61 <211> 1332 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 61 Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser 1 5 10 15 Met Thr Gln Phe Glu Gly Phe Thr Asn Leu Tyr Gln Val Ser Lys Thr 20 25 30 Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Lys His Ile Gln 35 40 45 Glu Gln Gly Phe Ile Glu Glu Asp Lys Ala Arg Asn Asp His Tyr Lys 50 55 60 Glu Leu Lys Pro Ile Ile Asp Arg Ile Tyr Lys Thr Tyr Ala Asp Gln 65 70 75 80 Cys Leu Gln Leu Val Gln Leu Asp Trp Glu Asn Leu Ser Ala Ala Ile 85 90 95 Asp Ser Tyr Arg Lys Glu Lys Thr Glu Glu Thr Arg Asn Ala Leu Ile 100 105 110 Glu Glu Gln Ala Thr Tyr Arg Asn Ala Ile His Asp Tyr Phe Ile Gly 115 120 125 Arg Thr Asp Asn Leu Thr Asp Ala Ile Asn Lys Arg His Ala Glu Ile 130 135 140 Tyr Lys Gly Leu Phe Lys Ala Glu Leu Phe Asn Gly Lys Val Leu Lys 145 150 155 160 Gln Leu Gly Thr Val Thr Thr Thr Glu His Glu Asn Ala Leu Leu Arg 165 170 175 Ser Phe Asp Lys Phe Thr Thr Tyr Phe Ser Gly Phe Tyr Glu Asn Arg 180 185 190 Lys Asn Val Phe Ser Ala Glu Asp Ile Ser Thr Ala Ile Pro His Arg 195 200 205 Ile Val Gln Asp Asn Phe Pro Lys Phe Lys Glu Asn Cys His Ile Phe 210 215 220 Thr Arg Leu Ile Thr Ala Val Pro Ser Leu Arg Glu His Phe Glu Asn 225 230 235 240 Val Lys Lys Ala Ile Gly Ile Phe Val Ser Thr Ser Ile Glu Glu Val 245 250 255 Phe Ser Phe Pro Phe Tyr Asn Gln Leu Leu Thr Gln Thr Gln Ile Asp 260 265 270 Leu Tyr Asn Gln Leu Leu Gly Gly Ile Ser Arg Glu Ala Gly Thr Glu 275 280 285 Lys Ile Lys Gly Leu Asn Glu Val Leu Asn Leu Ala Ile Gln Lys Asn 290 295 300 Asp Glu Thr Ala His Ile Ile Ala Ser Leu Pro His Arg Phe Ile Pro 305 310 315 320 Leu Phe Lys Gln Ile Leu Ser Asp Arg Asn Thr Leu Ser Phe Ile Leu 325 330 335 Glu Glu Phe Lys Ser Asp Glu Glu Val Ile Gln Ser Phe Cys Lys Tyr 340 345 350 Lys Thr Leu Leu Arg Asn Glu Asn Val Leu Glu Thr Ala Glu Ala Leu 355 360 365 Phe Asn Glu Leu Asn Ser Ile Asp Leu Thr His Ile Phe Ile Ser His 370 375 380 Lys Lys Leu Glu Thr Ile Ser Ser Ala Leu Cys Asp His Trp Asp Thr 385 390 395 400 Leu Arg Asn Ala Leu Tyr Glu Arg Arg Ile Ser Glu Leu Thr Gly Lys 405 410 415 Ile Thr Lys Ser Ala Lys Glu Lys Val Gln Arg Ser Leu Lys His Glu 420 425 430 Asp Ile Asn Leu Gln Glu Ile Ile Ser Ala Ala Gly Lys Glu Leu Ser 435 440 445 Glu Ala Phe Lys Gln Lys Thr Ser Glu Ile Leu Ser His Ala His Ala 450 455 460 Ala Leu Asp Gln Pro Leu Pro Thr Thr Leu Lys Lys Gln Glu Glu Lys 465 470 475 480 Glu Ile Leu Lys Ser Gln Leu Asp Ser Leu Leu Gly Leu Tyr His Leu 485 490 495 Leu Asp Trp Phe Ala Val Asp Glu Ser Asn Glu Val Asp Pro Glu Phe 500 505 510 Ser Ala Arg Leu Thr Gly Ile Lys Leu Glu Met Glu Pro Ser Leu Ser 515 520 525 Phe Tyr Asn Lys Ala Arg Asn Tyr Ala Thr Lys Lys Pro Tyr Ser Val 530 535 540 Glu Lys Phe Lys Leu Asn Phe Gln Met Pro Thr Leu Ala Ser Gly Trp 545 550 555 560 Asp Val Asn Lys Glu Lys Asn Asn Gly Ala Ile Leu Phe Val Lys Asn 565 570 575 Gly Leu Tyr Tyr Leu Gly Ile Met Pro Lys Gln Lys Gly Arg Tyr Lys 580 585 590 Ala Leu Ser Phe Glu Pro Thr Glu Lys Thr Ser Glu Gly Phe Asp Lys 595 600 605 Met Tyr Tyr Asp Tyr Phe Pro Asp Ala Ala Lys Met Ile Pro Lys Cys 610 615 620 Ser Thr Gln Leu Lys Ala Val Thr Ala His Phe Gln Thr His Thr Thr 625 630 635 640 Pro Ile Leu Leu Ser Asn Asn Phe Ile Glu Pro Leu Glu Ile Thr Lys 645 650 655 Glu Ile Tyr Asp Leu Asn Asn Pro Glu Lys Glu Pro Lys Lys Phe Gln 660 665 670 Thr Ala Tyr Ala Lys Lys Thr Gly Asp Gln Lys Gly Tyr Arg Glu Ala 675 680 685 Leu Cys Lys Trp Ile Asp Phe Thr Arg Asp Phe Leu Ser Lys Tyr Thr 690 695 700 Lys Thr Thr Ser Ile Asp Leu Ser Ser Leu Arg Pro Ser Ser Gln Tyr 705 710 715 720 Lys Asp Leu Gly Glu Tyr Tyr Ala Glu Leu Asn Pro Leu Leu Tyr His 725 730 735 Ile Ser Phe Gln Arg Ile Ala Glu Lys Glu Ile Met Asp Ala Val Glu 740 745 750 Thr Gly Lys Leu Tyr Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ala Lys 755 760 765 Gly His His Gly Lys Pro Asn Leu His Thr Leu Tyr Trp Thr Gly Leu 770 775 780 Phe Ser Pro Glu Asn Leu Ala Lys Thr Ser Ile Lys Leu Asn Gly Gln 785 790 795 800 Ala Glu Leu Phe Tyr Arg Pro Lys Ser Arg Met Lys Arg Met Ala His 805 810 815 Arg Leu Gly Glu Lys Met Leu Asn Lys Lys Leu Lys Asp Gln Lys Thr 820 825 830 Pro Ile Pro Asp Thr Leu Tyr Gln Glu Leu Tyr Asp Tyr Val Asn His 835 840 845 Arg Leu Ser His Asp Leu Ser Asp Glu Ala Arg Ala Leu Leu Pro Asn 850 855 860 Val Ile Thr Lys Glu Val Ser His Glu Ile Ile Lys Asp Arg Arg Phe 865 870 875 880 Thr Ser Asp Lys Phe Phe Phe His Val Pro Ile Thr Leu Asn Tyr Gln 885 890 895 Ala Ala Asn Ser Pro Ser Lys Phe Asn Gln Arg Val Asn Ala Tyr Leu 900 905 910 Lys Glu His Pro Glu Thr Pro Ile Ile Gly Ile Ala Arg Gly Glu Arg 915 920 925 Asn Leu Ile Tyr Ile Thr Val Ile Asp Ser Thr Gly Lys Ile Leu Glu 930 935 940 Gln Arg Ser Leu Asn Thr Ile Gln Gln Phe Asp Tyr Gln Lys Lys Leu 945 950 955 960 Asp Asn Arg Glu Lys Glu Arg Val Ala Ala Arg Gln Ala Trp Ser Val 965 970 975 Val Gly Thr Ile Lys Asp Leu Lys Gln Gly Tyr Leu Ser Gln Val Ile 980 985 990 His Glu Ile Val Asp Leu Met Ile His Tyr Gln Ala Val Val Val Leu 995 1000 1005 Ala Asn Leu Asn Phe Gly Phe Lys Ser Lys Arg Thr Gly Ile Ala 1010 1015 1020 Glu Lys Ala Val Tyr Gln Gln Phe Glu Lys Met Leu Ile Asp Lys 1025 1030 1035 Leu Asn Cys Leu Val Leu Lys Asp Tyr Pro Ala Glu Lys Val Gly 1040 1045 1050 Gly Val Leu Asn Pro Tyr Gln Leu Thr Asp Gln Phe Thr Ser Phe 1055 1060 1065 Ala Lys Met Gly Thr Gln Ser Gly Phe Leu Phe Tyr Val Pro Ala 1070 1075 1080 Pro Tyr Thr Ser Lys Ile Asp Pro Leu Thr Gly Phe Val Asp Pro 1085 1090 1095 Phe Val Trp Lys Thr Ile Lys Asn His Glu Ser Arg Lys His Phe 1100 1105 1110 Leu Glu Gly Phe Asp Phe Leu His Tyr Asp Val Lys Thr Gly Asp 1115 1120 1125 Phe Ile Leu His Phe Lys Met Asn Arg Asn Leu Ser Phe Gln Arg 1130 1135 1140 Gly Leu Pro Gly Phe Met Pro Ala Trp Asp Ile Val Phe Glu Lys 1145 1150 1155 Asn Glu Thr Gln Phe Asp Ala Lys Gly Thr Pro Phe Ile Ala Gly 1160 1165 1170 Lys Arg Ile Val Pro Val Ile Glu Asn His Arg Phe Thr Gly Arg 1175 1180 1185 Tyr Arg Asp Leu Tyr Pro Ala Asn Glu Leu Ile Ala Leu Leu Glu 1190 1195 1200 Glu Lys Gly Ile Val Phe Arg Asp Gly Ser Asn Ile Leu Pro Lys 1205 1210 1215 Leu Leu Glu Asn Asp Asp Ser His Ala Ile Asp Thr Met Val Ala 1220 1225 1230 Leu Ile Arg Ser Val Leu Gln Met Arg Asn Ser Asn Ala Ala Thr 1235 1240 1245 Gly Glu Ala Tyr Ile Asn Ser Pro Val Arg Asp Leu Asn Gly Val 1250 1255 1260 Cys Phe Asp Ser Arg Phe Gln Asn Pro Glu Trp Pro Met Asp Ala 1265 1270 1275 Asp Ala Asn Gly Ala Tyr His Ile Ala Leu Lys Gly Gln Leu Leu 1280 1285 1290 Leu Asn His Leu Lys Glu Ser Lys Asp Leu Lys Leu Gln Asn Gly 1295 1300 1305 Ile Ser Asn Gln Asp Trp Leu Ala Tyr Ile Gln Glu Leu Arg Asn 1310 1315 1320 Gly Ser Pro Lys Lys Lys Arg Lys Val 1325 1330 <210> 62 <211> 1403 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 62 Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser 1 5 10 15 Met Pro Lys Lys Lys Arg Lys Val Gly Gly Gly Gly Ser Gly Gly Gly 20 25 30 Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly 35 40 45 Ser Gly Gly Gly Gly Ser Met Ser Ile Tyr Gln Glu Phe Val Asn Lys 50 55 60 Tyr Ser Leu Ser Lys Thr Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys 65 70 75 80 Thr Leu Glu Asn Ile Lys Ala Arg Gly Leu Ile Leu Asp Asp Glu Lys 85 90 95 Arg Ala Lys Asp Tyr Lys Lys Ala Lys Gln Ile Ile Asp Lys Tyr His 100 105 110 Gln Phe Phe Ile Glu Glu Ile Leu Ser Ser Val Cys Ile Ser Glu Asp 115 120 125 Leu Leu Gln Asn Tyr Ser Asp Val Tyr Phe Lys Leu Lys Lys Ser Asp 130 135 140 Asp Asp Asn Leu Gln Lys Asp Phe Lys Ser Ala Lys Asp Thr Ile Lys 145 150 155 160 Lys Gln Ile Ser Glu Tyr Ile Lys Asp Ser Glu Lys Phe Lys Asn Leu 165 170 175 Phe Asn Gln Asn Leu Ile Asp Ala Lys Lys Gly Gln Glu Ser Asp Leu 180 185 190 Ile Leu Trp Leu Lys Gln Ser Lys Asp Asn Gly Ile Glu Leu Phe Lys 195 200 205 Ala Asn Ser Asp Ile Thr Asp Ile Asp Glu Ala Leu Glu Ile Ile Lys 210 215 220 Ser Phe Lys Gly Trp Thr Thr Tyr Phe Lys Gly Phe His Glu Asn Arg 225 230 235 240 Lys Asn Val Tyr Ser Ser Asn Asp Ile Pro Thr Ser Ile Ile Tyr Arg 245 250 255 Ile Val Asp Asp Asn Leu Pro Lys Phe Leu Glu Asn Lys Ala Lys Tyr 260 265 270 Glu Ser Leu Lys Asp Lys Ala Pro Glu Ala Ile Asn Tyr Glu Gln Ile 275 280 285 Lys Lys Asp Leu Ala Glu Glu Leu Thr Phe Asp Ile Asp Tyr Lys Thr 290 295 300 Ser Glu Val Asn Gln Arg Val Phe Ser Leu Asp Glu Val Phe Glu Ile 305 310 315 320 Ala Asn Phe Asn Asn Tyr Leu Asn Gln Ser Gly Ile Thr Lys Phe Asn 325 330 335 Thr Ile Ile Gly Gly Lys Phe Val Asn Gly Glu Asn Thr Lys Arg Lys 340 345 350 Gly Ile Asn Glu Tyr Ile Asn Leu Tyr Ser Gln Gln Ile Asn Asp Lys 355 360 365 Thr Leu Lys Lys Tyr Lys Met Ser Val Leu Phe Lys Gln Ile Leu Ser 370 375 380 Asp Thr Glu Ser Lys Ser Phe Val Ile Asp Lys Leu Glu Asp Asp Ser 385 390 395 400 Asp Val Val Thr Thr Met Gln Ser Phe Tyr Glu Gln Ile Ala Ala Phe 405 410 415 Lys Thr Val Glu Glu Lys Ser Ile Lys Glu Thr Leu Ser Leu Leu Phe 420 425 430 Asp Asp Leu Lys Ala Gln Lys Leu Asp Leu Ser Lys Ile Tyr Phe Lys 435 440 445 Asn Asp Lys Ser Leu Thr Asp Leu Ser Gln Gln Val Phe Asp Asp Tyr 450 455 460 Ser Val Ile Gly Thr Ala Val Leu Glu Tyr Ile Thr Gln Gln Ile Ala 465 470 475 480 Pro Lys Asn Leu Asp Asn Pro Ser Lys Lys Glu Gln Glu Leu Ile Ala 485 490 495 Lys Lys Thr Glu Lys Ala Lys Tyr Leu Ser Leu Glu Thr Ile Lys Leu 500 505 510 Ala Leu Glu Glu Phe Asn Lys His Arg Asp Ile Asp Lys Gln Cys Arg 515 520 525 Phe Glu Glu Ile Leu Ala Asn Phe Ala Ala Ile Pro Met Ile Phe Asp 530 535 540 Glu Ile Ala Gln Asn Lys Asp Asn Leu Ala Gln Ile Ser Ile Lys Tyr 545 550 555 560 Gln Asn Gln Gly Lys Lys Asp Leu Leu Gln Ala Ser Ala Glu Asp Asp 565 570 575 Val Lys Ala Ile Lys Asp Leu Leu Asp Gln Thr Asn Asn Leu Leu His 580 585 590 Lys Leu Lys Ile Phe His Ile Ser Gln Ser Glu Asp Lys Ala Asn Ile 595 600 605 Leu Asp Lys Asp Glu His Phe Tyr Leu Val Phe Glu Glu Cys Tyr Phe 610 615 620 Glu Leu Ala Asn Ile Val Pro Leu Tyr Asn Lys Ile Arg Asn Tyr Ile 625 630 635 640 Thr Gln Lys Pro Tyr Ser Asp Glu Lys Phe Lys Leu Asn Phe Glu Asn 645 650 655 Ser Thr Leu Ala Asn Gly Trp Asp Lys Asn Lys Glu Pro Asp Asn Thr 660 665 670 Ala Ile Leu Phe Ile Lys Asp Asp Lys Tyr Tyr Leu Gly Val Met Asn 675 680 685 Lys Lys Asn Asn Lys Ile Phe Asp Asp Lys Ala Ile Lys Glu Asn Lys 690 695 700 Gly Glu Gly Tyr Lys Lys Ile Val Tyr Lys Leu Leu Pro Gly Ala Asn 705 710 715 720 Lys Met Leu Pro Lys Val Phe Phe Ser Ala Lys Ser Ile Lys Phe Tyr 725 730 735 Asn Pro Ser Glu Asp Ile Leu Arg Ile Arg Asn His Ser Thr His Thr 740 745 750 Lys Asn Gly Ser Pro Gln Lys Gly Tyr Glu Lys Phe Glu Phe Asn Ile 755 760 765 Glu Asp Cys Arg Lys Phe Ile Asp Phe Tyr Lys Gln Ser Ile Ser Lys 770 775 780 His Pro Glu Trp Lys Asp Phe Gly Phe Arg Phe Ser Asp Thr Gln Arg 785 790 795 800 Tyr Asn Ser Ile Asp Glu Phe Tyr Arg Glu Val Glu Asn Gln Gly Tyr 805 810 815 Lys Leu Thr Phe Glu Asn Ile Ser Glu Ser Tyr Ile Asp Ser Val Val 820 825 830 Asn Gln Gly Lys Leu Tyr Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ser 835 840 845 Ala Tyr Ser Lys Gly Arg Pro Asn Leu His Thr Leu Tyr Trp Lys Ala 850 855 860 Leu Phe Asp Glu Arg Asn Leu Gln Asp Val Val Tyr Lys Leu Asn Gly 865 870 875 880 Glu Ala Glu Leu Phe Tyr Arg Lys Gln Ser Ile Pro Lys Lys Ile Thr 885 890 895 His Pro Ala Lys Glu Ala Ile Ala Asn Lys Asn Lys Asp Asn Pro Lys 900 905 910 Lys Glu Ser Val Phe Glu Tyr Asp Leu Ile Lys Asp Lys Arg Phe Thr 915 920 925 Glu Asp Lys Phe Phe Phe His Cys Pro Ile Thr Ile Asn Phe Lys Ser 930 935 940 Ser Gly Ala Asn Lys Phe Asn Asp Glu Ile Asn Leu Leu Leu Lys Glu 945 950 955 960 Lys Ala Asn Asp Val His Ile Leu Ser Ile Asp Arg Gly Glu Arg His 965 970 975 Leu Ala Tyr Tyr Thr Leu Val Asp Gly Lys Gly Asn Ile Ile Lys Gln 980 985 990 Asp Thr Phe Asn Ile Ile Gly Asn Asp Arg Met Lys Thr Asn Tyr His 995 1000 1005 Asp Lys Leu Ala Ala Ile Glu Lys Asp Arg Asp Ser Ala Arg Lys 1010 1015 1020 Asp Trp Lys Lys Ile Asn Asn Ile Lys Glu Met Lys Glu Gly Tyr 1025 1030 1035 Leu Ser Gln Val Val His Glu Ile Ala Lys Leu Val Ile Glu Tyr 1040 1045 1050 Asn Ala Ile Val Val Phe Glu Asp Leu Asn Phe Gly Phe Lys Arg 1055 1060 1065 Gly Arg Phe Lys Val Glu Lys Gln Val Tyr Gln Lys Leu Glu Lys 1070 1075 1080 Met Leu Ile Glu Lys Leu Asn Tyr Leu Val Phe Lys Asp Asn Glu 1085 1090 1095 Phe Asp Lys Thr Gly Gly Val Leu Arg Ala Tyr Gln Leu Thr Ala 1100 1105 1110 Pro Phe Glu Thr Phe Lys Lys Met Gly Lys Gln Thr Gly Ile Ile 1115 1120 1125 Tyr Tyr Val Pro Ala Gly Phe Thr Ser Lys Ile Cys Pro Val Thr 1130 1135 1140 Gly Phe Val Asn Gln Leu Tyr Pro Lys Tyr Glu Ser Val Ser Lys 1145 1150 1155 Ser Gln Glu Phe Phe Ser Lys Phe Asp Lys Ile Cys Tyr Asn Leu 1160 1165 1170 Asp Lys Gly Tyr Phe Glu Phe Ser Phe Asp Tyr Lys Asn Phe Gly 1175 1180 1185 Asp Lys Ala Ala Lys Gly Lys Trp Thr Ile Ala Ser Phe Gly Ser 1190 1195 1200 Arg Leu Ile Asn Phe Arg Asn Ser Asp Lys Asn His Asn Trp Asp 1205 1210 1215 Thr Arg Glu Val Tyr Pro Thr Lys Glu Leu Glu Lys Leu Leu Lys 1220 1225 1230 Asp Tyr Ser Ile Glu Tyr Gly His Gly Glu Cys Ile Lys Ala Ala 1235 1240 1245 Ile Cys Gly Glu Ser Asp Lys Lys Phe Phe Ala Lys Leu Thr Ser 1250 1255 1260 Val Leu Asn Thr Ile Leu Gln Met Arg Asn Ser Lys Thr Gly Thr 1265 1270 1275 Glu Leu Asp Tyr Leu Ile Ser Pro Val Ala Asp Val Asn Gly Asn 1280 1285 1290 Phe Phe Asp Ser Arg Gln Ala Pro Lys Asn Met Pro Gln Asp Ala 1295 1300 1305 Asp Ala Asn Gly Ala Tyr His Ile Gly Leu Lys Gly Leu Met Leu 1310 1315 1320 Leu Gly Arg Ile Lys Asn Asn Gln Glu Gly Lys Lys Leu Asn Leu 1325 1330 1335 Val Ile Lys Asn Glu Glu Tyr Phe Glu Phe Val Gln Asn Arg Asn 1340 1345 1350 Asn Pro Lys Lys Lys Arg Lys Val Ser Gly Gly Ser Ser Gly Gly 1355 1360 1365 Ser Pro Lys Lys Lys Arg Lys Val Tyr Pro Tyr Asp Val Pro Asp 1370 1375 1380 Tyr Ala Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Tyr Pro Tyr Asp 1385 1390 1395 Val Pro Asp Tyr Ala 1400 <210> 63 <211> 1382 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 63 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly 1 5 10 15 Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Met Thr 20 25 30 Gln Phe Glu Gly Phe Thr Asn Leu Tyr Gln Val Ser Lys Thr Leu Arg 35 40 45 Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Lys His Ile Gln Glu Gln 50 55 60 Gly Phe Ile Glu Glu Asp Lys Ala Arg Asn Asp His Tyr Lys Glu Leu 65 70 75 80 Lys Pro Ile Ile Asp Arg Ile Tyr Lys Thr Tyr Ala Asp Gln Cys Leu 85 90 95 Gln Leu Val Gln Leu Asp Trp Glu Asn Leu Ser Ala Ala Ile Asp Ser 100 105 110 Tyr Arg Lys Glu Lys Thr Glu Glu Thr Arg Asn Ala Leu Ile Glu Glu 115 120 125 Gln Ala Thr Tyr Arg Asn Ala Ile His Asp Tyr Phe Ile Gly Arg Thr 130 135 140 Asp Asn Leu Thr Asp Ala Ile Asn Lys Arg His Ala Glu Ile Tyr Lys 145 150 155 160 Gly Leu Phe Lys Ala Glu Leu Phe Asn Gly Lys Val Leu Lys Gln Leu 165 170 175 Gly Thr Val Thr Thr Thr Glu His Glu Asn Ala Leu Leu Arg Ser Phe 180 185 190 Asp Lys Phe Thr Thr Tyr Phe Ser Gly Phe Tyr Glu Asn Arg Lys Asn 195 200 205 Val Phe Ser Ala Glu Asp Ile Ser Thr Ala Ile Pro His Arg Ile Val 210 215 220 Gln Asp Asn Phe Pro Lys Phe Lys Glu Asn Cys His Ile Phe Thr Arg 225 230 235 240 Leu Ile Thr Ala Val Pro Ser Leu Arg Glu His Phe Glu Asn Val Lys 245 250 255 Lys Ala Ile Gly Ile Phe Val Ser Thr Ser Ile Glu Glu Val Phe Ser 260 265 270 Phe Pro Phe Tyr Asn Gln Leu Leu Thr Gln Thr Gln Ile Asp Leu Tyr 275 280 285 Asn Gln Leu Leu Gly Gly Ile Ser Arg Glu Ala Gly Thr Glu Lys Ile 290 295 300 Lys Gly Leu Asn Glu Val Leu Asn Leu Ala Ile Gln Lys Asn Asp Glu 305 310 315 320 Thr Ala His Ile Ile Ala Ser Leu Pro His Arg Phe Ile Pro Leu Phe 325 330 335 Lys Gln Ile Leu Ser Asp Arg Asn Thr Leu Ser Phe Ile Leu Glu Glu 340 345 350 Phe Lys Ser Asp Glu Glu Val Ile Gln Ser Phe Cys Lys Tyr Lys Thr 355 360 365 Leu Leu Arg Asn Glu Asn Val Leu Glu Thr Ala Glu Ala Leu Phe Asn 370 375 380 Glu Leu Asn Ser Ile Asp Leu Thr His Ile Phe Ile Ser His Lys Lys 385 390 395 400 Leu Glu Thr Ile Ser Ser Ala Leu Cys Asp His Trp Asp Thr Leu Arg 405 410 415 Asn Ala Leu Tyr Glu Arg Arg Ile Ser Glu Leu Thr Gly Lys Ile Thr 420 425 430 Lys Ser Ala Lys Glu Lys Val Gln Arg Ser Leu Lys His Glu Asp Ile 435 440 445 Asn Leu Gln Glu Ile Ile Ser Ala Ala Gly Lys Glu Leu Ser Glu Ala 450 455 460 Phe Lys Gln Lys Thr Ser Glu Ile Leu Ser His Ala His Ala Ala Leu 465 470 475 480 Asp Gln Pro Leu Pro Thr Thr Leu Lys Lys Gln Glu Glu Lys Glu Ile 485 490 495 Leu Lys Ser Gln Leu Asp Ser Leu Leu Gly Leu Tyr His Leu Leu Asp 500 505 510 Trp Phe Ala Val Asp Glu Ser Asn Glu Val Asp Pro Glu Phe Ser Ala 515 520 525 Arg Leu Thr Gly Ile Lys Leu Glu Met Glu Pro Ser Leu Ser Phe Tyr 530 535 540 Asn Lys Ala Arg Asn Tyr Ala Thr Lys Lys Pro Tyr Ser Val Glu Lys 545 550 555 560 Phe Lys Leu Asn Phe Gln Met Pro Thr Leu Ala Ser Gly Trp Asp Val 565 570 575 Asn Lys Glu Lys Asn Asn Gly Ala Ile Leu Phe Val Lys Asn Gly Leu 580 585 590 Tyr Tyr Leu Gly Ile Met Pro Lys Gln Lys Gly Arg Tyr Lys Ala Leu 595 600 605 Ser Phe Glu Pro Thr Glu Lys Thr Ser Glu Gly Phe Asp Lys Met Tyr 610 615 620 Tyr Asp Tyr Phe Pro Asp Ala Ala Lys Met Ile Pro Lys Cys Ser Thr 625 630 635 640 Gln Leu Lys Ala Val Thr Ala His Phe Gln Thr His Thr Thr Pro Ile 645 650 655 Leu Leu Ser Asn Asn Phe Ile Glu Pro Leu Glu Ile Thr Lys Glu Ile 660 665 670 Tyr Asp Leu Asn Asn Pro Glu Lys Glu Pro Lys Lys Phe Gln Thr Ala 675 680 685 Tyr Ala Lys Lys Thr Gly Asp Gln Lys Gly Tyr Arg Glu Ala Leu Cys 690 695 700 Lys Trp Ile Asp Phe Thr Arg Asp Phe Leu Ser Lys Tyr Thr Lys Thr 705 710 715 720 Thr Ser Ile Asp Leu Ser Ser Leu Arg Pro Ser Ser Gln Tyr Lys Asp 725 730 735 Leu Gly Glu Tyr Tyr Ala Glu Leu Asn Pro Leu Leu Tyr His Ile Ser 740 745 750 Phe Gln Arg Ile Ala Glu Lys Glu Ile Met Asp Ala Val Glu Thr Gly 755 760 765 Lys Leu Tyr Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ala Lys Gly His 770 775 780 His Gly Lys Pro Asn Leu His Thr Leu Tyr Trp Thr Gly Leu Phe Ser 785 790 795 800 Pro Glu Asn Leu Ala Lys Thr Ser Ile Lys Leu Asn Gly Gln Ala Glu 805 810 815 Leu Phe Tyr Arg Pro Lys Ser Arg Met Lys Arg Met Ala His Arg Leu 820 825 830 Gly Glu Lys Met Leu Asn Lys Lys Leu Lys Asp Gln Lys Thr Pro Ile 835 840 845 Pro Asp Thr Leu Tyr Gln Glu Leu Tyr Asp Tyr Val Asn His Arg Leu 850 855 860 Ser His Asp Leu Ser Asp Glu Ala Arg Ala Leu Leu Pro Asn Val Ile 865 870 875 880 Thr Lys Glu Val Ser His Glu Ile Ile Lys Asp Arg Arg Phe Thr Ser 885 890 895 Asp Lys Phe Phe Phe His Val Pro Ile Thr Leu Asn Tyr Gln Ala Ala 900 905 910 Asn Ser Pro Ser Lys Phe Asn Gln Arg Val Asn Ala Tyr Leu Lys Glu 915 920 925 His Pro Glu Thr Pro Ile Ile Gly Ile Asp Arg Gly Glu Arg Asn Leu 930 935 940 Ile Tyr Ile Thr Val Ile Asp Ser Thr Gly Lys Ile Leu Glu Gln Arg 945 950 955 960 Ser Leu Asn Thr Ile Gln Gln Phe Asp Tyr Gln Lys Lys Leu Asp Asn 965 970 975 Arg Glu Lys Glu Arg Val Ala Ala Arg Gln Ala Trp Ser Val Val Gly 980 985 990 Thr Ile Lys Asp Leu Lys Gln Gly Tyr Leu Ser Gln Val Ile His Glu 995 1000 1005 Ile Val Asp Leu Met Ile His Tyr Gln Ala Val Val Val Leu Glu 1010 1015 1020 Asn Leu Asn Phe Gly Phe Lys Ser Lys Arg Thr Gly Ile Ala Glu 1025 1030 1035 Lys Ala Val Tyr Gln Gln Phe Glu Lys Met Leu Ile Asp Lys Leu 1040 1045 1050 Asn Cys Leu Val Leu Lys Asp Tyr Pro Ala Glu Lys Val Gly Gly 1055 1060 1065 Val Leu Asn Pro Tyr Gln Leu Thr Asp Gln Phe Thr Ser Phe Ala 1070 1075 1080 Lys Met Gly Thr Gln Ser Gly Phe Leu Phe Tyr Val Pro Ala Pro 1085 1090 1095 Tyr Thr Ser Lys Ile Asp Pro Leu Thr Gly Phe Val Asp Pro Phe 1100 1105 1110 Val Trp Lys Thr Ile Lys Asn His Glu Ser Arg Lys His Phe Leu 1115 1120 1125 Glu Gly Phe Asp Phe Leu His Tyr Asp Val Lys Thr Gly Asp Phe 1130 1135 1140 Ile Leu His Phe Lys Met Asn Arg Asn Leu Ser Phe Gln Arg Gly 1145 1150 1155 Leu Pro Gly Phe Met Pro Ala Trp Asp Ile Val Phe Glu Lys Asn 1160 1165 1170 Glu Thr Gln Phe Asp Ala Lys Gly Thr Pro Phe Ile Ala Gly Lys 1175 1180 1185 Arg Ile Val Pro Val Ile Glu Asn His Arg Phe Thr Gly Arg Tyr 1190 1195 1200 Arg Asp Leu Tyr Pro Ala Asn Glu Leu Ile Ala Leu Leu Glu Glu 1205 1210 1215 Lys Gly Ile Val Phe Arg Asp Gly Ser Asn Ile Leu Pro Lys Leu 1220 1225 1230 Leu Glu Asn Asp Asp Ser His Ala Ile Asp Thr Met Val Ala Leu 1235 1240 1245 Ile Arg Ser Val Leu Gln Met Arg Asn Ser Asn Ala Ala Thr Gly 1250 1255 1260 Glu Asp Tyr Ile Asn Ser Pro Val Arg Asp Leu Asn Gly Val Cys 1265 1270 1275 Phe Asp Ser Arg Phe Gln Asn Pro Glu Trp Pro Met Asp Ala Asp 1280 1285 1290 Ala Asn Gly Ala Tyr His Ile Ala Leu Lys Gly Gln Leu Leu Leu 1295 1300 1305 Asn His Leu Lys Glu Ser Lys Asp Leu Lys Leu Gln Asn Gly Ile 1310 1315 1320 Ser Asn Gln Asp Trp Leu Ala Tyr Ile Gln Glu Leu Arg Asn Lys 1325 1330 1335 Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys 1340 1345 1350 Gly Ser Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Tyr Pro Tyr Asp 1355 1360 1365 Val Pro Asp Tyr Ala Tyr Pro Tyr Asp Val Pro Asp Tyr Ala 1370 1375 1380 <210> 64 <211> 1346 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 64 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly 1 5 10 15 Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Met Thr 20 25 30 Gln Phe Glu Gly Phe Thr Asn Leu Tyr Gln Val Ser Lys Thr Leu Arg 35 40 45 Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Lys His Ile Gln Glu Gln 50 55 60 Gly Phe Ile Glu Glu Asp Lys Ala Arg Asn Asp His Tyr Lys Glu Leu 65 70 75 80 Lys Pro Ile Ile Asp Arg Ile Tyr Lys Thr Tyr Ala Asp Gln Cys Leu 85 90 95 Gln Leu Val Gln Leu Asp Trp Glu Asn Leu Ser Ala Ala Ile Asp Ser 100 105 110 Tyr Arg Lys Glu Lys Thr Glu Glu Thr Arg Asn Ala Leu Ile Glu Glu 115 120 125 Gln Ala Thr Tyr Arg Asn Ala Ile His Asp Tyr Phe Ile Gly Arg Thr 130 135 140 Asp Asn Leu Thr Asp Ala Ile Asn Lys Arg His Ala Glu Ile Tyr Lys 145 150 155 160 Gly Leu Phe Lys Ala Glu Leu Phe Asn Gly Lys Val Leu Lys Gln Leu 165 170 175 Gly Thr Val Thr Thr Thr Glu His Glu Asn Ala Leu Leu Arg Ser Phe 180 185 190 Asp Lys Phe Thr Thr Tyr Phe Ser Gly Phe Tyr Glu Asn Arg Lys Asn 195 200 205 Val Phe Ser Ala Glu Asp Ile Ser Thr Ala Ile Pro His Arg Ile Val 210 215 220 Gln Asp Asn Phe Pro Lys Phe Lys Glu Asn Cys His Ile Phe Thr Arg 225 230 235 240 Leu Ile Thr Ala Val Pro Ser Leu Arg Glu His Phe Glu Asn Val Lys 245 250 255 Lys Ala Ile Gly Ile Phe Val Ser Thr Ser Ile Glu Glu Val Phe Ser 260 265 270 Phe Pro Phe Tyr Asn Gln Leu Leu Thr Gln Thr Gln Ile Asp Leu Tyr 275 280 285 Asn Gln Leu Leu Gly Gly Ile Ser Arg Glu Ala Gly Thr Glu Lys Ile 290 295 300 Lys Gly Leu Asn Glu Val Leu Asn Leu Ala Ile Gln Lys Asn Asp Glu 305 310 315 320 Thr Ala His Ile Ile Ala Ser Leu Pro His Arg Phe Ile Pro Leu Phe 325 330 335 Lys Gln Ile Leu Ser Asp Arg Asn Thr Leu Ser Phe Ile Leu Glu Glu 340 345 350 Phe Lys Ser Asp Glu Glu Val Ile Gln Ser Phe Cys Lys Tyr Lys Thr 355 360 365 Leu Leu Arg Asn Glu Asn Val Leu Glu Thr Ala Glu Ala Leu Phe Asn 370 375 380 Glu Leu Asn Ser Ile Asp Leu Thr His Ile Phe Ile Ser His Lys Lys 385 390 395 400 Leu Glu Thr Ile Ser Ser Ala Leu Cys Asp His Trp Asp Thr Leu Arg 405 410 415 Asn Ala Leu Tyr Glu Arg Arg Ile Ser Glu Leu Thr Gly Lys Ile Thr 420 425 430 Lys Ser Ala Lys Glu Lys Val Gln Arg Ser Leu Lys His Glu Asp Ile 435 440 445 Asn Leu Gln Glu Ile Ile Ser Ala Ala Gly Lys Glu Leu Ser Glu Ala 450 455 460 Phe Lys Gln Lys Thr Ser Glu Ile Leu Ser His Ala His Ala Ala Leu 465 470 475 480 Asp Gln Pro Leu Pro Thr Thr Leu Lys Lys Gln Glu Glu Lys Glu Ile 485 490 495 Leu Lys Ser Gln Leu Asp Ser Leu Leu Gly Leu Tyr His Leu Leu Asp 500 505 510 Trp Phe Ala Val Asp Glu Ser Asn Glu Val Asp Pro Glu Phe Ser Ala 515 520 525 Arg Leu Thr Gly Ile Lys Leu Glu Met Glu Pro Ser Leu Ser Phe Tyr 530 535 540 Asn Lys Ala Arg Asn Tyr Ala Thr Lys Lys Pro Tyr Ser Val Glu Lys 545 550 555 560 Phe Lys Leu Asn Phe Gln Met Pro Thr Leu Ala Ser Gly Trp Asp Val 565 570 575 Asn Lys Glu Lys Asn Asn Gly Ala Ile Leu Phe Val Lys Asn Gly Leu 580 585 590 Tyr Tyr Leu Gly Ile Met Pro Lys Gln Lys Gly Arg Tyr Lys Ala Leu 595 600 605 Ser Phe Glu Pro Thr Glu Lys Thr Ser Glu Gly Phe Asp Lys Met Tyr 610 615 620 Tyr Asp Tyr Phe Pro Asp Ala Ala Lys Met Ile Pro Lys Cys Ser Thr 625 630 635 640 Gln Leu Lys Ala Val Thr Ala His Phe Gln Thr His Thr Thr Pro Ile 645 650 655 Leu Leu Ser Asn Asn Phe Ile Glu Pro Leu Glu Ile Thr Lys Glu Ile 660 665 670 Tyr Asp Leu Asn Asn Pro Glu Lys Glu Pro Lys Lys Phe Gln Thr Ala 675 680 685 Tyr Ala Lys Lys Thr Gly Asp Gln Lys Gly Tyr Arg Glu Ala Leu Cys 690 695 700 Lys Trp Ile Asp Phe Thr Arg Asp Phe Leu Ser Lys Tyr Thr Lys Thr 705 710 715 720 Thr Ser Ile Asp Leu Ser Ser Leu Arg Pro Ser Ser Gln Tyr Lys Asp 725 730 735 Leu Gly Glu Tyr Tyr Ala Glu Leu Asn Pro Leu Leu Tyr His Ile Ser 740 745 750 Phe Gln Arg Ile Ala Glu Lys Glu Ile Met Asp Ala Val Glu Thr Gly 755 760 765 Lys Leu Tyr Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ala Lys Gly His 770 775 780 His Gly Lys Pro Asn Leu His Thr Leu Tyr Trp Thr Gly Leu Phe Ser 785 790 795 800 Pro Glu Asn Leu Ala Lys Thr Ser Ile Lys Leu Asn Gly Gln Ala Glu 805 810 815 Leu Phe Tyr Arg Pro Lys Ser Arg Met Lys Arg Met Ala His Arg Leu 820 825 830 Gly Glu Lys Met Leu Asn Lys Lys Leu Lys Asp Gln Lys Thr Pro Ile 835 840 845 Pro Asp Thr Leu Tyr Gln Glu Leu Tyr Asp Tyr Val Asn His Arg Leu 850 855 860 Ser His Asp Leu Ser Asp Glu Ala Arg Ala Leu Leu Pro Asn Val Ile 865 870 875 880 Thr Lys Glu Val Ser His Glu Ile Ile Lys Asp Arg Arg Phe Thr Ser 885 890 895 Asp Lys Phe Phe Phe His Val Pro Ile Thr Leu Asn Tyr Gln Ala Ala 900 905 910 Asn Ser Pro Ser Lys Phe Asn Gln Arg Val Asn Ala Tyr Leu Lys Glu 915 920 925 His Pro Glu Thr Pro Ile Ile Gly Ile Ala Arg Gly Glu Arg Asn Leu 930 935 940 Ile Tyr Ile Thr Val Ile Asp Ser Thr Gly Lys Ile Leu Glu Gln Arg 945 950 955 960 Ser Leu Asn Thr Ile Gln Gln Phe Asp Tyr Gln Lys Lys Leu Asp Asn 965 970 975 Arg Glu Lys Glu Arg Val Ala Ala Arg Gln Ala Trp Ser Val Val Gly 980 985 990 Thr Ile Lys Asp Leu Lys Gln Gly Tyr Leu Ser Gln Val Ile His Glu 995 1000 1005 Ile Val Asp Leu Met Ile His Tyr Gln Ala Val Val Val Leu Ala 1010 1015 1020 Asn Leu Asn Phe Gly Phe Lys Ser Lys Arg Thr Gly Ile Ala Glu 1025 1030 1035 Lys Ala Val Tyr Gln Gln Phe Glu Lys Met Leu Ile Asp Lys Leu 1040 1045 1050 Asn Cys Leu Val Leu Lys Asp Tyr Pro Ala Glu Lys Val Gly Gly 1055 1060 1065 Val Leu Asn Pro Tyr Gln Leu Thr Asp Gln Phe Thr Ser Phe Ala 1070 1075 1080 Lys Met Gly Thr Gln Ser Gly Phe Leu Phe Tyr Val Pro Ala Pro 1085 1090 1095 Tyr Thr Ser Lys Ile Asp Pro Leu Thr Gly Phe Val Asp Pro Phe 1100 1105 1110 Val Trp Lys Thr Ile Lys Asn His Glu Ser Arg Lys His Phe Leu 1115 1120 1125 Glu Gly Phe Asp Phe Leu His Tyr Asp Val Lys Thr Gly Asp Phe 1130 1135 1140 Ile Leu His Phe Lys Met Asn Arg Asn Leu Ser Phe Gln Arg Gly 1145 1150 1155 Leu Pro Gly Phe Met Pro Ala Trp Asp Ile Val Phe Glu Lys Asn 1160 1165 1170 Glu Thr Gln Phe Asp Ala Lys Gly Thr Pro Phe Ile Ala Gly Lys 1175 1180 1185 Arg Ile Val Pro Val Ile Glu Asn His Arg Phe Thr Gly Arg Tyr 1190 1195 1200 Arg Asp Leu Tyr Pro Ala Asn Glu Leu Ile Ala Leu Leu Glu Glu 1205 1210 1215 Lys Gly Ile Val Phe Arg Asp Gly Ser Asn Ile Leu Pro Lys Leu 1220 1225 1230 Leu Glu Asn Asp Asp Ser His Ala Ile Asp Thr Met Val Ala Leu 1235 1240 1245 Ile Arg Ser Val Leu Gln Met Arg Asn Ser Asn Ala Ala Thr Gly 1250 1255 1260 Glu Ala Tyr Ile Asn Ser Pro Val Arg Asp Leu Asn Gly Val Cys 1265 1270 1275 Phe Asp Ser Arg Phe Gln Asn Pro Glu Trp Pro Met Asp Ala Asp 1280 1285 1290 Ala Asn Gly Ala Tyr His Ile Ala Leu Lys Gly Gln Leu Leu Leu 1295 1300 1305 Asn His Leu Lys Glu Ser Lys Asp Leu Lys Leu Gln Asn Gly Ile 1310 1315 1320 Ser Asn Gln Asp Trp Leu Ala Tyr Ile Gln Glu Leu Arg Asn Gly 1325 1330 1335 Ser Pro Lys Lys Lys Arg Lys Val 1340 1345 <210> 65 <211> 1417 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 65 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly 1 5 10 15 Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Met Pro 20 25 30 Lys Lys Lys Arg Lys Val Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser 35 40 45 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly 50 55 60 Gly Gly Gly Ser Met Ser Ile Tyr Gln Glu Phe Val Asn Lys Tyr Ser 65 70 75 80 Leu Ser Lys Thr Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu 85 90 95 Glu Asn Ile Lys Ala Arg Gly Leu Ile Leu Asp Asp Glu Lys Arg Ala 100 105 110 Lys Asp Tyr Lys Lys Ala Lys Gln Ile Ile Asp Lys Tyr His Gln Phe 115 120 125 Phe Ile Glu Glu Ile Leu Ser Ser Val Cys Ile Ser Glu Asp Leu Leu 130 135 140 Gln Asn Tyr Ser Asp Val Tyr Phe Lys Leu Lys Lys Ser Asp Asp Asp 145 150 155 160 Asn Leu Gln Lys Asp Phe Lys Ser Ala Lys Asp Thr Ile Lys Lys Gln 165 170 175 Ile Ser Glu Tyr Ile Lys Asp Ser Glu Lys Phe Lys Asn Leu Phe Asn 180 185 190 Gln Asn Leu Ile Asp Ala Lys Lys Gly Gln Glu Ser Asp Leu Ile Leu 195 200 205 Trp Leu Lys Gln Ser Lys Asp Asn Gly Ile Glu Leu Phe Lys Ala Asn 210 215 220 Ser Asp Ile Thr Asp Ile Asp Glu Ala Leu Glu Ile Ile Lys Ser Phe 225 230 235 240 Lys Gly Trp Thr Thr Tyr Phe Lys Gly Phe His Glu Asn Arg Lys Asn 245 250 255 Val Tyr Ser Ser Asn Asp Ile Pro Thr Ser Ile Ile Tyr Arg Ile Val 260 265 270 Asp Asp Asn Leu Pro Lys Phe Leu Glu Asn Lys Ala Lys Tyr Glu Ser 275 280 285 Leu Lys Asp Lys Ala Pro Glu Ala Ile Asn Tyr Glu Gln Ile Lys Lys 290 295 300 Asp Leu Ala Glu Glu Leu Thr Phe Asp Ile Asp Tyr Lys Thr Ser Glu 305 310 315 320 Val Asn Gln Arg Val Phe Ser Leu Asp Glu Val Phe Glu Ile Ala Asn 325 330 335 Phe Asn Asn Tyr Leu Asn Gln Ser Gly Ile Thr Lys Phe Asn Thr Ile 340 345 350 Ile Gly Gly Lys Phe Val Asn Gly Glu Asn Thr Lys Arg Lys Gly Ile 355 360 365 Asn Glu Tyr Ile Asn Leu Tyr Ser Gln Gln Ile Asn Asp Lys Thr Leu 370 375 380 Lys Lys Tyr Lys Met Ser Val Leu Phe Lys Gln Ile Leu Ser Asp Thr 385 390 395 400 Glu Ser Lys Ser Phe Val Ile Asp Lys Leu Glu Asp Asp Ser Asp Val 405 410 415 Val Thr Thr Met Gln Ser Phe Tyr Glu Gln Ile Ala Ala Phe Lys Thr 420 425 430 Val Glu Glu Lys Ser Ile Lys Glu Thr Leu Ser Leu Leu Phe Asp Asp 435 440 445 Leu Lys Ala Gln Lys Leu Asp Leu Ser Lys Ile Tyr Phe Lys Asn Asp 450 455 460 Lys Ser Leu Thr Asp Leu Ser Gln Gln Val Phe Asp Asp Tyr Ser Val 465 470 475 480 Ile Gly Thr Ala Val Leu Glu Tyr Ile Thr Gln Gln Ile Ala Pro Lys 485 490 495 Asn Leu Asp Asn Pro Ser Lys Lys Glu Gln Glu Leu Ile Ala Lys Lys 500 505 510 Thr Glu Lys Ala Lys Tyr Leu Ser Leu Glu Thr Ile Lys Leu Ala Leu 515 520 525 Glu Glu Phe Asn Lys His Arg Asp Ile Asp Lys Gln Cys Arg Phe Glu 530 535 540 Glu Ile Leu Ala Asn Phe Ala Ala Ile Pro Met Ile Phe Asp Glu Ile 545 550 555 560 Ala Gln Asn Lys Asp Asn Leu Ala Gln Ile Ser Ile Lys Tyr Gln Asn 565 570 575 Gln Gly Lys Lys Asp Leu Leu Gln Ala Ser Ala Glu Asp Asp Val Lys 580 585 590 Ala Ile Lys Asp Leu Leu Asp Gln Thr Asn Asn Leu Leu His Lys Leu 595 600 605 Lys Ile Phe His Ile Ser Gln Ser Glu Asp Lys Ala Asn Ile Leu Asp 610 615 620 Lys Asp Glu His Phe Tyr Leu Val Phe Glu Glu Cys Tyr Phe Glu Leu 625 630 635 640 Ala Asn Ile Val Pro Leu Tyr Asn Lys Ile Arg Asn Tyr Ile Thr Gln 645 650 655 Lys Pro Tyr Ser Asp Glu Lys Phe Lys Leu Asn Phe Glu Asn Ser Thr 660 665 670 Leu Ala Asn Gly Trp Asp Lys Asn Lys Glu Pro Asp Asn Thr Ala Ile 675 680 685 Leu Phe Ile Lys Asp Asp Lys Tyr Tyr Leu Gly Val Met Asn Lys Lys 690 695 700 Asn Asn Lys Ile Phe Asp Asp Lys Ala Ile Lys Glu Asn Lys Gly Glu 705 710 715 720 Gly Tyr Lys Lys Ile Val Tyr Lys Leu Leu Pro Gly Ala Asn Lys Met 725 730 735 Leu Pro Lys Val Phe Phe Ser Ala Lys Ser Ile Lys Phe Tyr Asn Pro 740 745 750 Ser Glu Asp Ile Leu Arg Ile Arg Asn His Ser Thr His Thr Lys Asn 755 760 765 Gly Ser Pro Gln Lys Gly Tyr Glu Lys Phe Glu Phe Asn Ile Glu Asp 770 775 780 Cys Arg Lys Phe Ile Asp Phe Tyr Lys Gln Ser Ile Ser Lys His Pro 785 790 795 800 Glu Trp Lys Asp Phe Gly Phe Arg Phe Ser Asp Thr Gln Arg Tyr Asn 805 810 815 Ser Ile Asp Glu Phe Tyr Arg Glu Val Glu Asn Gln Gly Tyr Lys Leu 820 825 830 Thr Phe Glu Asn Ile Ser Glu Ser Tyr Ile Asp Ser Val Val Asn Gln 835 840 845 Gly Lys Leu Tyr Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ser Ala Tyr 850 855 860 Ser Lys Gly Arg Pro Asn Leu His Thr Leu Tyr Trp Lys Ala Leu Phe 865 870 875 880 Asp Glu Arg Asn Leu Gln Asp Val Val Tyr Lys Leu Asn Gly Glu Ala 885 890 895 Glu Leu Phe Tyr Arg Lys Gln Ser Ile Pro Lys Lys Ile Thr His Pro 900 905 910 Ala Lys Glu Ala Ile Ala Asn Lys Asn Lys Asp Asn Pro Lys Lys Glu 915 920 925 Ser Val Phe Glu Tyr Asp Leu Ile Lys Asp Lys Arg Phe Thr Glu Asp 930 935 940 Lys Phe Phe Phe His Cys Pro Ile Thr Ile Asn Phe Lys Ser Ser Gly 945 950 955 960 Ala Asn Lys Phe Asn Asp Glu Ile Asn Leu Leu Leu Lys Glu Lys Ala 965 970 975 Asn Asp Val His Ile Leu Ser Ile Asp Arg Gly Glu Arg His Leu Ala 980 985 990 Tyr Tyr Thr Leu Val Asp Gly Lys Gly Asn Ile Ile Lys Gln Asp Thr 995 1000 1005 Phe Asn Ile Ile Gly Asn Asp Arg Met Lys Thr Asn Tyr His Asp 1010 1015 1020 Lys Leu Ala Ala Ile Glu Lys Asp Arg Asp Ser Ala Arg Lys Asp 1025 1030 1035 Trp Lys Lys Ile Asn Asn Ile Lys Glu Met Lys Glu Gly Tyr Leu 1040 1045 1050 Ser Gln Val Val His Glu Ile Ala Lys Leu Val Ile Glu Tyr Asn 1055 1060 1065 Ala Ile Val Val Phe Glu Asp Leu Asn Phe Gly Phe Lys Arg Gly 1070 1075 1080 Arg Phe Lys Val Glu Lys Gln Val Tyr Gln Lys Leu Glu Lys Met 1085 1090 1095 Leu Ile Glu Lys Leu Asn Tyr Leu Val Phe Lys Asp Asn Glu Phe 1100 1105 1110 Asp Lys Thr Gly Gly Val Leu Arg Ala Tyr Gln Leu Thr Ala Pro 1115 1120 1125 Phe Glu Thr Phe Lys Lys Met Gly Lys Gln Thr Gly Ile Ile Tyr 1130 1135 1140 Tyr Val Pro Ala Gly Phe Thr Ser Lys Ile Cys Pro Val Thr Gly 1145 1150 1155 Phe Val Asn Gln Leu Tyr Pro Lys Tyr Glu Ser Val Ser Lys Ser 1160 1165 1170 Gln Glu Phe Phe Ser Lys Phe Asp Lys Ile Cys Tyr Asn Leu Asp 1175 1180 1185 Lys Gly Tyr Phe Glu Phe Ser Phe Asp Tyr Lys Asn Phe Gly Asp 1190 1195 1200 Lys Ala Ala Lys Gly Lys Trp Thr Ile Ala Ser Phe Gly Ser Arg 1205 1210 1215 Leu Ile Asn Phe Arg Asn Ser Asp Lys Asn His Asn Trp Asp Thr 1220 1225 1230 Arg Glu Val Tyr Pro Thr Lys Glu Leu Glu Lys Leu Leu Lys Asp 1235 1240 1245 Tyr Ser Ile Glu Tyr Gly His Gly Glu Cys Ile Lys Ala Ala Ile 1250 1255 1260 Cys Gly Glu Ser Asp Lys Lys Phe Phe Ala Lys Leu Thr Ser Val 1265 1270 1275 Leu Asn Thr Ile Leu Gln Met Arg Asn Ser Lys Thr Gly Thr Glu 1280 1285 1290 Leu Asp Tyr Leu Ile Ser Pro Val Ala Asp Val Asn Gly Asn Phe 1295 1300 1305 Phe Asp Ser Arg Gln Ala Pro Lys Asn Met Pro Gln Asp Ala Asp 1310 1315 1320 Ala Asn Gly Ala Tyr His Ile Gly Leu Lys Gly Leu Met Leu Leu 1325 1330 1335 Gly Arg Ile Lys Asn Asn Gln Glu Gly Lys Lys Leu Asn Leu Val 1340 1345 1350 Ile Lys Asn Glu Glu Tyr Phe Glu Phe Val Gln Asn Arg Asn Asn 1355 1360 1365 Pro Lys Lys Lys Arg Lys Val Ser Gly Gly Ser Ser Gly Gly Ser 1370 1375 1380 Pro Lys Lys Lys Arg Lys Val Tyr Pro Tyr Asp Val Pro Asp Tyr 1385 1390 1395 Ala Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Tyr Pro Tyr Asp Val 1400 1405 1410 Pro Asp Tyr Ala 1415 <210> 66 <211> 1287 <212> PRT <213> Artificial Sequence <220> <223> Syntheti <400> 66 Gly Gly Gly Gly Ser Gly Gly Gly Gly Gly Ser Gly Gly Gly Gly Gly 1 5 10 15 Ser Gly Gly Gly Gly Gly Ser Gly Gly Gly Gly Gly Ser Gly Gly Gly 20 25 30 Gly Gly Ser Gly Met Leu Phe Gln Asp Phe Thr His Leu Tyr Pro Leu 35 40 45 Ser Lys Thr Val Arg Phe Glu Leu Lys Pro Ile Gly Arg Thr Leu Glu 50 55 60 His Ile His Ala Lys Asn Phe Leu Ser Gln Asp Glu Thr Met Ala Asp 65 70 75 80 Met Tyr Gln Lys Val Lys Val Ile Leu Asp Asp Tyr His Arg Asp Phe 85 90 95 Ile Ala Asp Met Met Gly Glu Val Lys Leu Thr Lys Leu Ala Glu Phe 100 105 110 Tyr Asp Val Tyr Leu Lys Phe Arg Lys Asn Pro Lys Asp Asp Gly Leu 115 120 125 Gln Lys Gln Leu Lys Asp Leu Gln Ala Val Leu Arg Lys Glu Ser Val 130 135 140 Lys Pro Ile Gly Ser Gly Gly Lys Tyr Lys Thr Gly Tyr Asp Arg Leu 145 150 155 160 Phe Gly Ala Lys Leu Phe Lys Asp Gly Lys Glu Leu Gly Asp Leu Ala 165 170 175 Lys Phe Val Ile Ala Gln Glu Gly Glu Ser Ser Pro Lys Leu Ala His 180 185 190 Leu Ala His Phe Glu Lys Phe Ser Thr Tyr Phe Thr Gly Phe His Asp 195 200 205 Asn Arg Lys Asn Met Tyr Ser Asp Glu Asp Lys His Thr Ala Ile Ala 210 215 220 Tyr Arg Leu Ile His Glu Asn Leu Pro Arg Phe Ile Asp Asn Leu Gln 225 230 235 240 Ile Leu Thr Thr Ile Lys Gln Lys His Ser Ala Leu Tyr Asp Gln Ile 245 250 255 Ile Asn Glu Leu Thr Ala Ser Gly Leu Asp Val Ser Leu Ala Ser His 260 265 270 Leu Asp Gly Tyr His Lys Leu Leu Thr Gln Glu Gly Ile Thr Ala Tyr 275 280 285 Asn Arg Ile Ile Gly Glu Val Asn Gly Tyr Thr Asn Lys His Asn Gln 290 295 300 Ile Cys His Lys Ser Glu Arg Ile Ala Lys Leu Arg Pro Leu His Lys 305 310 315 320 Gln Ile Leu Ser Asp Gly Met Gly Val Ser Phe Leu Pro Ser Lys Phe 325 330 335 Ala Asp Asp Ser Glu Met Cys Gln Ala Val Asn Glu Phe Tyr Arg His 340 345 350 Tyr Thr Asp Val Phe Ala Lys Val Gln Ser Leu Phe Asp Gly Phe Asp 355 360 365 Asp His Gln Lys Asp Gly Ile Tyr Val Glu His Lys Asn Leu Asn Glu 370 375 380 Leu Ser Lys Gln Ala Phe Gly Asp Phe Ala Leu Leu Gly Arg Val Leu 385 390 395 400 Asp Gly Tyr Tyr Val Asp Val Val Asn Pro Glu Phe Asn Glu Arg Phe 405 410 415 Ala Lys Ala Lys Thr Asp Asn Ala Lys Ala Lys Leu Thr Lys Glu Lys 420 425 430 Asp Lys Phe Ile Lys Gly Val His Ser Leu Ala Ser Leu Glu Gln Ala 435 440 445 Ile Glu His His Thr Ala Arg His Asp Asp Glu Ser Val Gln Ala Gly 450 455 460 Lys Leu Gly Gln Tyr Phe Lys His Gly Leu Ala Gly Val Asp Asn Pro 465 470 475 480 Ile Gln Lys Ile His Asn Asn His Ser Thr Ile Lys Gly Phe Leu Glu 485 490 495 Arg Glu Arg Pro Ala Gly Glu Arg Ala Leu Pro Lys Ile Lys Ser Gly 500 505 510 Lys Asn Pro Glu Met Thr Gln Leu Arg Gln Leu Lys Glu Leu Leu Asp 515 520 525 Asn Ala Leu Asn Val Ala His Phe Ala Lys Leu Leu Thr Thr Lys Thr 530 535 540 Thr Leu Asp Asn Gln Asp Gly Asn Phe Tyr Gly Glu Phe Gly Val Leu 545 550 555 560 Tyr Asp Glu Leu Ala Lys Ile Pro Thr Leu Tyr Asn Lys Val Arg Asp 565 570 575 Tyr Leu Ser Gln Lys Pro Phe Ser Thr Glu Lys Tyr Lys Leu Asn Phe 580 585 590 Gly Asn Pro Thr Leu Leu Asn Gly Trp Asp Leu Asn Lys Glu Lys Asp 595 600 605 Asn Phe Gly Val Ile Leu Gln Lys Asp Gly Cys Tyr Tyr Leu Ala Leu 610 615 620 Leu Asp Lys Ala His Lys Lys Val Phe Asp Asn Ala Pro Asn Thr Gly 625 630 635 640 Lys Asn Val Tyr Gln Lys Met Val Tyr Lys Leu Leu Pro Gly Pro Asn 645 650 655 Lys Met Leu Pro Lys Val Phe Phe Ala Lys Ser Asn Leu Asp Tyr Tyr 660 665 670 Asn Pro Ser Ala Glu Leu Leu Asp Lys Tyr Ala Lys Gly Thr His Lys 675 680 685 Lys Gly Asp Asn Phe Asn Leu Lys Asp Cys His Ala Leu Ile Asp Phe 690 695 700 Phe Lys Ala Gly Ile Asn Lys His Pro Glu Trp Gln His Phe Gly Phe 705 710 715 720 Lys Phe Ser Pro Thr Ser Ser Tyr Arg Asp Leu Ser Asp Phe Tyr Arg 725 730 735 Glu Val Glu Pro Gln Gly Tyr Gln Val Lys Phe Val Asp Ile Asn Ala 740 745 750 Asp Tyr Ile Asp Glu Leu Val Glu Gln Gly Lys Leu Tyr Leu Phe Gln 755 760 765 Ile Tyr Asn Lys Asp Phe Ser Pro Lys Ala His Gly Lys Pro Asn Leu 770 775 780 His Thr Leu Tyr Phe Lys Ala Leu Phe Ser Glu Asp Asn Leu Ala Asp 785 790 795 800 Pro Ile Tyr Lys Leu Asn Gly Glu Ala Gln Ile Phe Tyr Arg Lys Ala 805 810 815 Ser Leu Asp Met Asn Glu Thr Thr Ile His Arg Ala Gly Glu Val Leu 820 825 830 Glu Asn Lys Asn Pro Asp Asn Pro Lys Lys Arg Gln Phe Val Tyr Asp 835 840 845 Ile Ile Lys Asp Lys Arg Tyr Thr Gln Asp Lys Phe Met Leu His Val 850 855 860 Pro Ile Thr Met Asn Phe Gly Val Gln Gly Met Thr Ile Lys Glu Phe 865 870 875 880 Asn Lys Lys Val Asn Gln Ser Ile Gln Gln Tyr Asp Glu Val Asn Val 885 890 895 Ile Gly Ile Asp Arg Gly Glu Arg His Leu Leu Tyr Leu Thr Val Ile 900 905 910 Asn Ser Lys Gly Glu Ile Leu Glu Gln Arg Ser Leu Asn Asp Ile Thr 915 920 925 Thr Ala Ser Ala Asn Gly Thr Gln Val Thr Thr Pro Tyr His Lys Ile 930 935 940 Leu Asp Lys Arg Glu Ile Glu Arg Leu Asn Ala Arg Val Gly Trp Gly 945 950 955 960 Glu Ile Glu Thr Ile Lys Glu Leu Lys Ser Gly Tyr Leu Ser His Val 965 970 975 Val His Gln Ile Asn Gln Leu Met Leu Lys Tyr Asn Ala Ile Val Val 980 985 990 Leu Glu Asp Leu Asn Phe Gly Phe Lys Arg Gly Arg Phe Lys Val Glu 995 1000 1005 Lys Gln Ile Tyr Gln Asn Phe Glu Asn Ala Leu Ile Lys Lys Leu 1010 1015 1020 Asn His Leu Val Leu Lys Asp Lys Ala Asp Asp Glu Ile Gly Ser 1025 1030 1035 Tyr Lys Asn Ala Leu Gln Leu Thr Asn Asn Phe Thr Asp Leu Lys 1040 1045 1050 Ser Ile Gly Lys Gln Thr Gly Phe Leu Phe Tyr Val Pro Ala Trp 1055 1060 1065 Asn Thr Ser Lys Ile Asp Pro Glu Thr Gly Phe Val Asp Leu Leu 1070 1075 1080 Lys Pro Arg Tyr Glu Asn Ile Ala Gln Ser Gln Ala Phe Phe Gly 1085 1090 1095 Lys Phe Asp Lys Ile Cys Tyr Asn Thr Asp Lys Gly Tyr Phe Glu 1100 1105 1110 Phe His Ile Asp Tyr Ala Lys Phe Thr Asp Lys Ala Lys Asn Ser 1115 1120 1125 Arg Gln Lys Trp Ala Ile Cys Ser His Gly Asp Lys Arg Tyr Val 1130 1135 1140 Tyr Asp Lys Thr Ala Asn Gln Asn Lys Gly Ala Ala Lys Gly Ile 1145 1150 1155 Asn Val Asn Asp Glu Leu Lys Ser Leu Phe Ala Arg Tyr His Ile 1160 1165 1170 Asn Asp Lys Gln Pro Asn Leu Val Met Asp Ile Cys Gln Asn Asn 1175 1180 1185 Asp Lys Glu Phe His Lys Ser Leu Met Cys Leu Leu Lys Thr Leu 1190 1195 1200 Leu Ala Leu Arg Tyr Ser Asn Ala Ser Ser Asp Glu Asp Phe Ile 1205 1210 1215 Leu Ser Pro Val Ala Asn Asp Glu Gly Val Phe Phe Asn Ser Ala 1220 1225 1230 Leu Ala Asp Asp Thr Gln Pro Gln Asn Ala Asp Ala Asn Gly Ala 1235 1240 1245 Tyr His Ile Ala Leu Lys Gly Leu Trp Leu Leu Asn Glu Leu Lys 1250 1255 1260 Asn Ser Asp Asp Leu Asn Lys Val Lys Leu Ala Ile Asp Asn Gln 1265 1270 1275 Thr Trp Leu Asn Phe Ala Gln Asn Arg 1280 1285 <210> 67 <211> 1388 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 67 Gly Gly Gly Gly Ser Gly Gly Gly Gly Gly Ser Gly Gly Gly Gly Gly 1 5 10 15 Ser Gly Gly Gly Gly Gly Ser Gly Gly Gly Gly Gly Ser Gly Gly Gly 20 25 30 Gly Gly Ser Gly Met Thr Gln Phe Glu Gly Phe Thr Asn Leu Tyr Gln 35 40 45 Val Ser Lys Thr Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu 50 55 60 Lys His Ile Gln Glu Gln Gly Phe Ile Glu Glu Asp Lys Ala Arg Asn 65 70 75 80 Asp His Tyr Lys Glu Leu Lys Pro Ile Ile Asp Arg Ile Tyr Lys Thr 85 90 95 Tyr Ala Asp Gln Cys Leu Gln Leu Val Gln Leu Asp Trp Glu Asn Leu 100 105 110 Ser Ala Ala Ile Asp Ser Tyr Arg Lys Glu Lys Thr Glu Glu Thr Arg 115 120 125 Asn Ala Leu Ile Glu Glu Gln Ala Thr Tyr Arg Asn Ala Ile His Asp 130 135 140 Tyr Phe Ile Gly Arg Thr Asp Asn Leu Thr Asp Ala Ile Asn Lys Arg 145 150 155 160 His Ala Glu Ile Tyr Lys Gly Leu Phe Lys Ala Glu Leu Phe Asn Gly 165 170 175 Lys Val Leu Lys Gln Leu Gly Thr Val Thr Thr Thr Glu His Glu Asn 180 185 190 Ala Leu Leu Arg Ser Phe Asp Lys Phe Thr Thr Tyr Phe Ser Gly Phe 195 200 205 Tyr Glu Asn Arg Lys Asn Val Phe Ser Ala Glu Asp Ile Ser Thr Ala 210 215 220 Ile Pro His Arg Ile Val Gln Asp Asn Phe Pro Lys Phe Lys Glu Asn 225 230 235 240 Cys His Ile Phe Thr Arg Leu Ile Thr Ala Val Pro Ser Leu Arg Glu 245 250 255 His Phe Glu Asn Val Lys Lys Ala Ile Gly Ile Phe Val Ser Thr Ser 260 265 270 Ile Glu Glu Val Phe Ser Phe Pro Phe Tyr Asn Gln Leu Leu Thr Gln 275 280 285 Thr Gln Ile Asp Leu Tyr Asn Gln Leu Leu Gly Gly Ile Ser Arg Glu 290 295 300 Ala Gly Thr Glu Lys Ile Lys Gly Leu Asn Glu Val Leu Asn Leu Ala 305 310 315 320 Ile Gln Lys Asn Asp Glu Thr Ala His Ile Ile Ala Ser Leu Pro His 325 330 335 Arg Phe Ile Pro Leu Phe Lys Gln Ile Leu Ser Asp Arg Asn Thr Leu 340 345 350 Ser Phe Ile Leu Glu Glu Phe Lys Ser Asp Glu Glu Val Ile Gln Ser 355 360 365 Phe Cys Lys Tyr Lys Thr Leu Leu Arg Asn Glu Asn Val Leu Glu Thr 370 375 380 Ala Glu Ala Leu Phe Asn Glu Leu Asn Ser Ile Asp Leu Thr His Ile 385 390 395 400 Phe Ile Ser His Lys Lys Leu Glu Thr Ile Ser Ser Ala Leu Cys Asp 405 410 415 His Trp Asp Thr Leu Arg Asn Ala Leu Tyr Glu Arg Arg Ile Ser Glu 420 425 430 Leu Thr Gly Lys Ile Thr Lys Ser Ala Lys Glu Lys Val Gln Arg Ser 435 440 445 Leu Lys His Glu Asp Ile Asn Leu Gln Glu Ile Ile Ser Ala Ala Gly 450 455 460 Lys Glu Leu Ser Glu Ala Phe Lys Gln Lys Thr Ser Glu Ile Leu Ser 465 470 475 480 His Ala His Ala Ala Leu Asp Gln Pro Leu Pro Thr Thr Leu Lys Lys 485 490 495 Gln Glu Glu Lys Glu Ile Leu Lys Ser Gln Leu Asp Ser Leu Leu Gly 500 505 510 Leu Tyr His Leu Leu Asp Trp Phe Ala Val Asp Glu Ser Asn Glu Val 515 520 525 Asp Pro Glu Phe Ser Ala Arg Leu Thr Gly Ile Lys Leu Glu Met Glu 530 535 540 Pro Ser Leu Ser Phe Tyr Asn Lys Ala Arg Asn Tyr Ala Thr Lys Lys 545 550 555 560 Pro Tyr Ser Val Glu Lys Phe Lys Leu Asn Phe Gln Met Pro Thr Leu 565 570 575 Ala Ser Gly Trp Asp Val Asn Lys Glu Lys Asn Asn Gly Ala Ile Leu 580 585 590 Phe Val Lys Asn Gly Leu Tyr Tyr Leu Gly Ile Met Pro Lys Gln Lys 595 600 605 Gly Arg Tyr Lys Ala Leu Ser Phe Glu Pro Thr Glu Lys Thr Ser Glu 610 615 620 Gly Phe Asp Lys Met Tyr Tyr Asp Tyr Phe Pro Asp Ala Ala Lys Met 625 630 635 640 Ile Pro Lys Cys Ser Thr Gln Leu Lys Ala Val Thr Ala His Phe Gln 645 650 655 Thr His Thr Thr Pro Ile Leu Leu Ser Asn Asn Phe Ile Glu Pro Leu 660 665 670 Glu Ile Thr Lys Glu Ile Tyr Asp Leu Asn Asn Pro Glu Lys Glu Pro 675 680 685 Lys Lys Phe Gln Thr Ala Tyr Ala Lys Lys Thr Gly Asp Gln Lys Gly 690 695 700 Tyr Arg Glu Ala Leu Cys Lys Trp Ile Asp Phe Thr Arg Asp Phe Leu 705 710 715 720 Ser Lys Tyr Thr Lys Thr Thr Ser Ile Asp Leu Ser Ser Leu Arg Pro 725 730 735 Ser Ser Gln Tyr Lys Asp Leu Gly Glu Tyr Tyr Ala Glu Leu Asn Pro 740 745 750 Leu Leu Tyr His Ile Ser Phe Gln Arg Ile Ala Glu Lys Glu Ile Met 755 760 765 Asp Ala Val Glu Thr Gly Lys Leu Tyr Leu Phe Gln Ile Tyr Asn Lys 770 775 780 Asp Phe Ala Lys Gly His His Gly Lys Pro Asn Leu His Thr Leu Tyr 785 790 795 800 Trp Thr Gly Leu Phe Ser Pro Glu Asn Leu Ala Lys Thr Ser Ile Lys 805 810 815 Leu Asn Gly Gln Ala Glu Leu Phe Tyr Arg Pro Lys Ser Arg Met Lys 820 825 830 Arg Met Ala His Arg Leu Gly Glu Lys Met Leu Asn Lys Lys Leu Lys 835 840 845 Asp Gln Lys Thr Pro Ile Pro Asp Thr Leu Tyr Gln Glu Leu Tyr Asp 850 855 860 Tyr Val Asn His Arg Leu Ser His Asp Leu Ser Asp Glu Ala Arg Ala 865 870 875 880 Leu Leu Pro Asn Val Ile Thr Lys Glu Val Ser His Glu Ile Ile Lys 885 890 895 Asp Arg Arg Phe Thr Ser Asp Lys Phe Phe Phe His Val Pro Ile Thr 900 905 910 Leu Asn Tyr Gln Ala Ala Asn Ser Pro Ser Lys Phe Asn Gln Arg Val 915 920 925 Asn Ala Tyr Leu Lys Glu His Pro Glu Thr Pro Ile Ile Gly Ile Asp 930 935 940 Arg Gly Glu Arg Asn Leu Ile Tyr Ile Thr Val Ile Asp Ser Thr Gly 945 950 955 960 Lys Ile Leu Glu Gln Arg Ser Leu Asn Thr Ile Gln Gln Phe Asp Tyr 965 970 975 Gln Lys Lys Leu Asp Asn Arg Glu Lys Glu Arg Val Ala Ala Arg Gln 980 985 990 Ala Trp Ser Val Val Gly Thr Ile Lys Asp Leu Lys Gln Gly Tyr Leu 995 1000 1005 Ser Gln Val Ile His Glu Ile Val Asp Leu Met Ile His Tyr Gln 1010 1015 1020 Ala Val Val Val Leu Glu Asn Leu Asn Phe Gly Phe Lys Ser Lys 1025 1030 1035 Arg Thr Gly Ile Ala Glu Lys Ala Val Tyr Gln Gln Phe Glu Lys 1040 1045 1050 Met Leu Ile Asp Lys Leu Asn Cys Leu Val Leu Lys Asp Tyr Pro 1055 1060 1065 Ala Glu Lys Val Gly Gly Val Leu Asn Pro Tyr Gln Leu Thr Asp 1070 1075 1080 Gln Phe Thr Ser Phe Ala Lys Met Gly Thr Gln Ser Gly Phe Leu 1085 1090 1095 Phe Tyr Val Pro Ala Pro Tyr Thr Ser Lys Ile Asp Pro Leu Thr 1100 1105 1110 Gly Phe Val Asp Pro Phe Val Trp Lys Thr Ile Lys Asn His Glu 1115 1120 1125 Ser Arg Lys His Phe Leu Glu Gly Phe Asp Phe Leu His Tyr Asp 1130 1135 1140 Val Lys Thr Gly Asp Phe Ile Leu His Phe Lys Met Asn Arg Asn 1145 1150 1155 Leu Ser Phe Gln Arg Gly Leu Pro Gly Phe Met Pro Ala Trp Asp 1160 1165 1170 Ile Val Phe Glu Lys Asn Glu Thr Gln Phe Asp Ala Lys Gly Thr 1175 1180 1185 Pro Phe Ile Ala Gly Lys Arg Ile Val Pro Val Ile Glu Asn His 1190 1195 1200 Arg Phe Thr Gly Arg Tyr Arg Asp Leu Tyr Pro Ala Asn Glu Leu 1205 1210 1215 Ile Ala Leu Leu Glu Glu Lys Gly Ile Val Phe Arg Asp Gly Ser 1220 1225 1230 Asn Ile Leu Pro Lys Leu Leu Glu Asn Asp Asp Ser His Ala Ile 1235 1240 1245 Asp Thr Met Val Ala Leu Ile Arg Ser Val Leu Gln Met Arg Asn 1250 1255 1260 Ser Asn Ala Ala Thr Gly Glu Asp Tyr Ile Asn Ser Pro Val Arg 1265 1270 1275 Asp Leu Asn Gly Val Cys Phe Asp Ser Arg Phe Gln Asn Pro Glu 1280 1285 1290 Trp Pro Met Asp Ala Asp Ala Asn Gly Ala Tyr His Ile Ala Leu 1295 1300 1305 Lys Gly Gln Leu Leu Leu Asn His Leu Lys Glu Ser Lys Asp Leu 1310 1315 1320 Lys Leu Gln Asn Gly Ile Ser Asn Gln Asp Trp Leu Ala Tyr Ile 1325 1330 1335 Gln Glu Leu Arg Asn Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly 1340 1345 1350 Gln Ala Lys Lys Lys Lys Gly Ser Tyr Pro Tyr Asp Val Pro Asp 1355 1360 1365 Tyr Ala Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Tyr Pro Tyr Asp 1370 1375 1380 Val Pro Asp Tyr Ala 1385 <210> 68 <211> 1352 <212> PRT <213> Artificial Sequence <220> <223> Syntheti <400> 68 Gly Gly Gly Gly Ser Gly Gly Gly Gly Gly Ser Gly Gly Gly Gly Gly 1 5 10 15 Ser Gly Gly Gly Gly Gly Ser Gly Gly Gly Gly Gly Ser Gly Gly Gly 20 25 30 Gly Gly Ser Gly Met Thr Gln Phe Glu Gly Phe Thr Asn Leu Tyr Gln 35 40 45 Val Ser Lys Thr Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu 50 55 60 Lys His Ile Gln Glu Gln Gly Phe Ile Glu Glu Asp Lys Ala Arg Asn 65 70 75 80 Asp His Tyr Lys Glu Leu Lys Pro Ile Ile Asp Arg Ile Tyr Lys Thr 85 90 95 Tyr Ala Asp Gln Cys Leu Gln Leu Val Gln Leu Asp Trp Glu Asn Leu 100 105 110 Ser Ala Ala Ile Asp Ser Tyr Arg Lys Glu Lys Thr Glu Glu Thr Arg 115 120 125 Asn Ala Leu Ile Glu Glu Gln Ala Thr Tyr Arg Asn Ala Ile His Asp 130 135 140 Tyr Phe Ile Gly Arg Thr Asp Asn Leu Thr Asp Ala Ile Asn Lys Arg 145 150 155 160 His Ala Glu Ile Tyr Lys Gly Leu Phe Lys Ala Glu Leu Phe Asn Gly 165 170 175 Lys Val Leu Lys Gln Leu Gly Thr Val Thr Thr Thr Glu His Glu Asn 180 185 190 Ala Leu Leu Arg Ser Phe Asp Lys Phe Thr Thr Tyr Phe Ser Gly Phe 195 200 205 Tyr Glu Asn Arg Lys Asn Val Phe Ser Ala Glu Asp Ile Ser Thr Ala 210 215 220 Ile Pro His Arg Ile Val Gln Asp Asn Phe Pro Lys Phe Lys Glu Asn 225 230 235 240 Cys His Ile Phe Thr Arg Leu Ile Thr Ala Val Pro Ser Leu Arg Glu 245 250 255 His Phe Glu Asn Val Lys Lys Ala Ile Gly Ile Phe Val Ser Thr Ser 260 265 270 Ile Glu Glu Val Phe Ser Phe Pro Phe Tyr Asn Gln Leu Leu Thr Gln 275 280 285 Thr Gln Ile Asp Leu Tyr Asn Gln Leu Leu Gly Gly Ile Ser Arg Glu 290 295 300 Ala Gly Thr Glu Lys Ile Lys Gly Leu Asn Glu Val Leu Asn Leu Ala 305 310 315 320 Ile Gln Lys Asn Asp Glu Thr Ala His Ile Ile Ala Ser Leu Pro His 325 330 335 Arg Phe Ile Pro Leu Phe Lys Gln Ile Leu Ser Asp Arg Asn Thr Leu 340 345 350 Ser Phe Ile Leu Glu Glu Phe Lys Ser Asp Glu Glu Val Ile Gln Ser 355 360 365 Phe Cys Lys Tyr Lys Thr Leu Leu Arg Asn Glu Asn Val Leu Glu Thr 370 375 380 Ala Glu Ala Leu Phe Asn Glu Leu Asn Ser Ile Asp Leu Thr His Ile 385 390 395 400 Phe Ile Ser His Lys Lys Leu Glu Thr Ile Ser Ser Ala Leu Cys Asp 405 410 415 His Trp Asp Thr Leu Arg Asn Ala Leu Tyr Glu Arg Arg Ile Ser Glu 420 425 430 Leu Thr Gly Lys Ile Thr Lys Ser Ala Lys Glu Lys Val Gln Arg Ser 435 440 445 Leu Lys His Glu Asp Ile Asn Leu Gln Glu Ile Ile Ser Ala Ala Gly 450 455 460 Lys Glu Leu Ser Glu Ala Phe Lys Gln Lys Thr Ser Glu Ile Leu Ser 465 470 475 480 His Ala His Ala Ala Leu Asp Gln Pro Leu Pro Thr Thr Leu Lys Lys 485 490 495 Gln Glu Glu Lys Glu Ile Leu Lys Ser Gln Leu Asp Ser Leu Leu Gly 500 505 510 Leu Tyr His Leu Leu Asp Trp Phe Ala Val Asp Glu Ser Asn Glu Val 515 520 525 Asp Pro Glu Phe Ser Ala Arg Leu Thr Gly Ile Lys Leu Glu Met Glu 530 535 540 Pro Ser Leu Ser Phe Tyr Asn Lys Ala Arg Asn Tyr Ala Thr Lys Lys 545 550 555 560 Pro Tyr Ser Val Glu Lys Phe Lys Leu Asn Phe Gln Met Pro Thr Leu 565 570 575 Ala Ser Gly Trp Asp Val Asn Lys Glu Lys Asn Asn Gly Ala Ile Leu 580 585 590 Phe Val Lys Asn Gly Leu Tyr Tyr Leu Gly Ile Met Pro Lys Gln Lys 595 600 605 Gly Arg Tyr Lys Ala Leu Ser Phe Glu Pro Thr Glu Lys Thr Ser Glu 610 615 620 Gly Phe Asp Lys Met Tyr Tyr Asp Tyr Phe Pro Asp Ala Ala Lys Met 625 630 635 640 Ile Pro Lys Cys Ser Thr Gln Leu Lys Ala Val Thr Ala His Phe Gln 645 650 655 Thr His Thr Thr Pro Ile Leu Leu Ser Asn Asn Phe Ile Glu Pro Leu 660 665 670 Glu Ile Thr Lys Glu Ile Tyr Asp Leu Asn Asn Pro Glu Lys Glu Pro 675 680 685 Lys Lys Phe Gln Thr Ala Tyr Ala Lys Lys Thr Gly Asp Gln Lys Gly 690 695 700 Tyr Arg Glu Ala Leu Cys Lys Trp Ile Asp Phe Thr Arg Asp Phe Leu 705 710 715 720 Ser Lys Tyr Thr Lys Thr Thr Ser Ile Asp Leu Ser Ser Leu Arg Pro 725 730 735 Ser Ser Gln Tyr Lys Asp Leu Gly Glu Tyr Tyr Ala Glu Leu Asn Pro 740 745 750 Leu Leu Tyr His Ile Ser Phe Gln Arg Ile Ala Glu Lys Glu Ile Met 755 760 765 Asp Ala Val Glu Thr Gly Lys Leu Tyr Leu Phe Gln Ile Tyr Asn Lys 770 775 780 Asp Phe Ala Lys Gly His His Gly Lys Pro Asn Leu His Thr Leu Tyr 785 790 795 800 Trp Thr Gly Leu Phe Ser Pro Glu Asn Leu Ala Lys Thr Ser Ile Lys 805 810 815 Leu Asn Gly Gln Ala Glu Leu Phe Tyr Arg Pro Lys Ser Arg Met Lys 820 825 830 Arg Met Ala His Arg Leu Gly Glu Lys Met Leu Asn Lys Lys Leu Lys 835 840 845 Asp Gln Lys Thr Pro Ile Pro Asp Thr Leu Tyr Gln Glu Leu Tyr Asp 850 855 860 Tyr Val Asn His Arg Leu Ser His Asp Leu Ser Asp Glu Ala Arg Ala 865 870 875 880 Leu Leu Pro Asn Val Ile Thr Lys Glu Val Ser His Glu Ile Ile Lys 885 890 895 Asp Arg Arg Phe Thr Ser Asp Lys Phe Phe Phe His Val Pro Ile Thr 900 905 910 Leu Asn Tyr Gln Ala Ala Asn Ser Pro Ser Lys Phe Asn Gln Arg Val 915 920 925 Asn Ala Tyr Leu Lys Glu His Pro Glu Thr Pro Ile Ile Gly Ile Ala 930 935 940 Arg Gly Glu Arg Asn Leu Ile Tyr Ile Thr Val Ile Asp Ser Thr Gly 945 950 955 960 Lys Ile Leu Glu Gln Arg Ser Leu Asn Thr Ile Gln Gln Phe Asp Tyr 965 970 975 Gln Lys Lys Leu Asp Asn Arg Glu Lys Glu Arg Val Ala Ala Arg Gln 980 985 990 Ala Trp Ser Val Val Gly Thr Ile Lys Asp Leu Lys Gln Gly Tyr Leu 995 1000 1005 Ser Gln Val Ile His Glu Ile Val Asp Leu Met Ile His Tyr Gln 1010 1015 1020 Ala Val Val Val Leu Ala Asn Leu Asn Phe Gly Phe Lys Ser Lys 1025 1030 1035 Arg Thr Gly Ile Ala Glu Lys Ala Val Tyr Gln Gln Phe Glu Lys 1040 1045 1050 Met Leu Ile Asp Lys Leu Asn Cys Leu Val Leu Lys Asp Tyr Pro 1055 1060 1065 Ala Glu Lys Val Gly Gly Val Leu Asn Pro Tyr Gln Leu Thr Asp 1070 1075 1080 Gln Phe Thr Ser Phe Ala Lys Met Gly Thr Gln Ser Gly Phe Leu 1085 1090 1095 Phe Tyr Val Pro Ala Pro Tyr Thr Ser Lys Ile Asp Pro Leu Thr 1100 1105 1110 Gly Phe Val Asp Pro Phe Val Trp Lys Thr Ile Lys Asn His Glu 1115 1120 1125 Ser Arg Lys His Phe Leu Glu Gly Phe Asp Phe Leu His Tyr Asp 1130 1135 1140 Val Lys Thr Gly Asp Phe Ile Leu His Phe Lys Met Asn Arg Asn 1145 1150 1155 Leu Ser Phe Gln Arg Gly Leu Pro Gly Phe Met Pro Ala Trp Asp 1160 1165 1170 Ile Val Phe Glu Lys Asn Glu Thr Gln Phe Asp Ala Lys Gly Thr 1175 1180 1185 Pro Phe Ile Ala Gly Lys Arg Ile Val Pro Val Ile Glu Asn His 1190 1195 1200 Arg Phe Thr Gly Arg Tyr Arg Asp Leu Tyr Pro Ala Asn Glu Leu 1205 1210 1215 Ile Ala Leu Leu Glu Glu Lys Gly Ile Val Phe Arg Asp Gly Ser 1220 1225 1230 Asn Ile Leu Pro Lys Leu Leu Glu Asn Asp Asp Ser His Ala Ile 1235 1240 1245 Asp Thr Met Val Ala Leu Ile Arg Ser Val Leu Gln Met Arg Asn 1250 1255 1260 Ser Asn Ala Ala Thr Gly Glu Ala Tyr Ile Asn Ser Pro Val Arg 1265 1270 1275 Asp Leu Asn Gly Val Cys Phe Asp Ser Arg Phe Gln Asn Pro Glu 1280 1285 1290 Trp Pro Met Asp Ala Asp Ala Asn Gly Ala Tyr His Ile Ala Leu 1295 1300 1305 Lys Gly Gln Leu Leu Leu Asn His Leu Lys Glu Ser Lys Asp Leu 1310 1315 1320 Lys Leu Gln Asn Gly Ile Ser Asn Gln Asp Trp Leu Ala Tyr Ile 1325 1330 1335 Gln Glu Leu Arg Asn Gly Ser Pro Lys Lys Lys Arg Lys Val 1340 1345 1350 <210> 69 <211> 1423 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 69 Gly Gly Gly Gly Ser Gly Gly Gly Gly Gly Ser Gly Gly Gly Gly Gly 1 5 10 15 Ser Gly Gly Gly Gly Gly Ser Gly Gly Gly Gly Gly Ser Gly Gly Gly 20 25 30 Gly Gly Ser Gly Met Pro Lys Lys Lys Arg Lys Val Gly Gly Gly Gly 35 40 45 Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser 50 55 60 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Met Ser Ile Tyr Gln Glu 65 70 75 80 Phe Val Asn Lys Tyr Ser Leu Ser Lys Thr Leu Arg Phe Glu Leu Ile 85 90 95 Pro Gln Gly Lys Thr Leu Glu Asn Ile Lys Ala Arg Gly Leu Ile Leu 100 105 110 Asp Asp Glu Lys Arg Ala Lys Asp Tyr Lys Lys Ala Lys Gln Ile Ile 115 120 125 Asp Lys Tyr His Gln Phe Phe Ile Glu Glu Ile Leu Ser Ser Val Cys 130 135 140 Ile Ser Glu Asp Leu Leu Gln Asn Tyr Ser Asp Val Tyr Phe Lys Leu 145 150 155 160 Lys Lys Ser Asp Asp Asp Asn Leu Gln Lys Asp Phe Lys Ser Ala Lys 165 170 175 Asp Thr Ile Lys Lys Gln Ile Ser Glu Tyr Ile Lys Asp Ser Glu Lys 180 185 190 Phe Lys Asn Leu Phe Asn Gln Asn Leu Ile Asp Ala Lys Lys Gly Gln 195 200 205 Glu Ser Asp Leu Ile Leu Trp Leu Lys Gln Ser Lys Asp Asn Gly Ile 210 215 220 Glu Leu Phe Lys Ala Asn Ser Asp Ile Thr Asp Ile Asp Glu Ala Leu 225 230 235 240 Glu Ile Ile Lys Ser Phe Lys Gly Trp Thr Thr Tyr Phe Lys Gly Phe 245 250 255 His Glu Asn Arg Lys Asn Val Tyr Ser Ser Asn Asp Ile Pro Thr Ser 260 265 270 Ile Ile Tyr Arg Ile Val Asp Asp Asn Leu Pro Lys Phe Leu Glu Asn 275 280 285 Lys Ala Lys Tyr Glu Ser Leu Lys Asp Lys Ala Pro Glu Ala Ile Asn 290 295 300 Tyr Glu Gln Ile Lys Lys Asp Leu Ala Glu Glu Leu Thr Phe Asp Ile 305 310 315 320 Asp Tyr Lys Thr Ser Glu Val Asn Gln Arg Val Phe Ser Leu Asp Glu 325 330 335 Val Phe Glu Ile Ala Asn Phe Asn Asn Tyr Leu Asn Gln Ser Gly Ile 340 345 350 Thr Lys Phe Asn Thr Ile Ile Gly Gly Lys Phe Val Asn Gly Glu Asn 355 360 365 Thr Lys Arg Lys Gly Ile Asn Glu Tyr Ile Asn Leu Tyr Ser Gln Gln 370 375 380 Ile Asn Asp Lys Thr Leu Lys Lys Tyr Lys Met Ser Val Leu Phe Lys 385 390 395 400 Gln Ile Leu Ser Asp Thr Glu Ser Lys Ser Phe Val Ile Asp Lys Leu 405 410 415 Glu Asp Asp Ser Asp Val Val Thr Thr Met Gln Ser Phe Tyr Glu Gln 420 425 430 Ile Ala Ala Phe Lys Thr Val Glu Glu Lys Ser Ile Lys Glu Thr Leu 435 440 445 Ser Leu Leu Phe Asp Asp Leu Lys Ala Gln Lys Leu Asp Leu Ser Lys 450 455 460 Ile Tyr Phe Lys Asn Asp Lys Ser Leu Thr Asp Leu Ser Gln Gln Val 465 470 475 480 Phe Asp Asp Tyr Ser Val Ile Gly Thr Ala Val Leu Glu Tyr Ile Thr 485 490 495 Gln Gln Ile Ala Pro Lys Asn Leu Asp Asn Pro Ser Lys Lys Glu Gln 500 505 510 Glu Leu Ile Ala Lys Lys Thr Glu Lys Ala Lys Tyr Leu Ser Leu Glu 515 520 525 Thr Ile Lys Leu Ala Leu Glu Glu Phe Asn Lys His Arg Asp Ile Asp 530 535 540 Lys Gln Cys Arg Phe Glu Glu Ile Leu Ala Asn Phe Ala Ala Ile Pro 545 550 555 560 Met Ile Phe Asp Glu Ile Ala Gln Asn Lys Asp Asn Leu Ala Gln Ile 565 570 575 Ser Ile Lys Tyr Gln Asn Gln Gly Lys Lys Asp Leu Leu Gln Ala Ser 580 585 590 Ala Glu Asp Asp Val Lys Ala Ile Lys Asp Leu Leu Asp Gln Thr Asn 595 600 605 Asn Leu Leu His Lys Leu Lys Ile Phe His Ile Ser Gln Ser Glu Asp 610 615 620 Lys Ala Asn Ile Leu Asp Lys Asp Glu His Phe Tyr Leu Val Phe Glu 625 630 635 640 Glu Cys Tyr Phe Glu Leu Ala Asn Ile Val Pro Leu Tyr Asn Lys Ile 645 650 655 Arg Asn Tyr Ile Thr Gln Lys Pro Tyr Ser Asp Glu Lys Phe Lys Leu 660 665 670 Asn Phe Glu Asn Ser Thr Leu Ala Asn Gly Trp Asp Lys Asn Lys Glu 675 680 685 Pro Asp Asn Thr Ala Ile Leu Phe Ile Lys Asp Asp Lys Tyr Tyr Leu 690 695 700 Gly Val Met Asn Lys Lys Asn Asn Lys Ile Phe Asp Asp Lys Ala Ile 705 710 715 720 Lys Glu Asn Lys Gly Glu Gly Tyr Lys Lys Ile Val Tyr Lys Leu Leu 725 730 735 Pro Gly Ala Asn Lys Met Leu Pro Lys Val Phe Phe Ser Ala Lys Ser 740 745 750 Ile Lys Phe Tyr Asn Pro Ser Glu Asp Ile Leu Arg Ile Arg Asn His 755 760 765 Ser Thr His Thr Lys Asn Gly Ser Pro Gln Lys Gly Tyr Glu Lys Phe 770 775 780 Glu Phe Asn Ile Glu Asp Cys Arg Lys Phe Ile Asp Phe Tyr Lys Gln 785 790 795 800 Ser Ile Ser Lys His Pro Glu Trp Lys Asp Phe Gly Phe Arg Phe Ser 805 810 815 Asp Thr Gln Arg Tyr Asn Ser Ile Asp Glu Phe Tyr Arg Glu Val Glu 820 825 830 Asn Gln Gly Tyr Lys Leu Thr Phe Glu Asn Ile Ser Glu Ser Tyr Ile 835 840 845 Asp Ser Val Val Asn Gln Gly Lys Leu Tyr Leu Phe Gln Ile Tyr Asn 850 855 860 Lys Asp Phe Ser Ala Tyr Ser Lys Gly Arg Pro Asn Leu His Thr Leu 865 870 875 880 Tyr Trp Lys Ala Leu Phe Asp Glu Arg Asn Leu Gln Asp Val Val Tyr 885 890 895 Lys Leu Asn Gly Glu Ala Glu Leu Phe Tyr Arg Lys Gln Ser Ile Pro 900 905 910 Lys Lys Ile Thr His Pro Ala Lys Glu Ala Ile Ala Asn Lys Asn Lys 915 920 925 Asp Asn Pro Lys Lys Glu Ser Val Phe Glu Tyr Asp Leu Ile Lys Asp 930 935 940 Lys Arg Phe Thr Glu Asp Lys Phe Phe Phe His Cys Pro Ile Thr Ile 945 950 955 960 Asn Phe Lys Ser Ser Gly Ala Asn Lys Phe Asn Asp Glu Ile Asn Leu 965 970 975 Leu Leu Lys Glu Lys Ala Asn Asp Val His Ile Leu Ser Ile Asp Arg 980 985 990 Gly Glu Arg His Leu Ala Tyr Tyr Thr Leu Val Asp Gly Lys Gly Asn 995 1000 1005 Ile Ile Lys Gln Asp Thr Phe Asn Ile Ile Gly Asn Asp Arg Met 1010 1015 1020 Lys Thr Asn Tyr His Asp Lys Leu Ala Ala Ile Glu Lys Asp Arg 1025 1030 1035 Asp Ser Ala Arg Lys Asp Trp Lys Lys Ile Asn Asn Ile Lys Glu 1040 1045 1050 Met Lys Glu Gly Tyr Leu Ser Gln Val Val His Glu Ile Ala Lys 1055 1060 1065 Leu Val Ile Glu Tyr Asn Ala Ile Val Val Phe Glu Asp Leu Asn 1070 1075 1080 Phe Gly Phe Lys Arg Gly Arg Phe Lys Val Glu Lys Gln Val Tyr 1085 1090 1095 Gln Lys Leu Glu Lys Met Leu Ile Glu Lys Leu Asn Tyr Leu Val 1100 1105 1110 Phe Lys Asp Asn Glu Phe Asp Lys Thr Gly Gly Val Leu Arg Ala 1115 1120 1125 Tyr Gln Leu Thr Ala Pro Phe Glu Thr Phe Lys Lys Met Gly Lys 1130 1135 1140 Gln Thr Gly Ile Ile Tyr Tyr Val Pro Ala Gly Phe Thr Ser Lys 1145 1150 1155 Ile Cys Pro Val Thr Gly Phe Val Asn Gln Leu Tyr Pro Lys Tyr 1160 1165 1170 Glu Ser Val Ser Lys Ser Gln Glu Phe Phe Ser Lys Phe Asp Lys 1175 1180 1185 Ile Cys Tyr Asn Leu Asp Lys Gly Tyr Phe Glu Phe Ser Phe Asp 1190 1195 1200 Tyr Lys Asn Phe Gly Asp Lys Ala Ala Lys Gly Lys Trp Thr Ile 1205 1210 1215 Ala Ser Phe Gly Ser Arg Leu Ile Asn Phe Arg Asn Ser Asp Lys 1220 1225 1230 Asn His Asn Trp Asp Thr Arg Glu Val Tyr Pro Thr Lys Glu Leu 1235 1240 1245 Glu Lys Leu Leu Lys Asp Tyr Ser Ile Glu Tyr Gly His Gly Glu 1250 1255 1260 Cys Ile Lys Ala Ala Ile Cys Gly Glu Ser Asp Lys Lys Phe Phe 1265 1270 1275 Ala Lys Leu Thr Ser Val Leu Asn Thr Ile Leu Gln Met Arg Asn 1280 1285 1290 Ser Lys Thr Gly Thr Glu Leu Asp Tyr Leu Ile Ser Pro Val Ala 1295 1300 1305 Asp Val Asn Gly Asn Phe Phe Asp Ser Arg Gln Ala Pro Lys Asn 1310 1315 1320 Met Pro Gln Asp Ala Asp Ala Asn Gly Ala Tyr His Ile Gly Leu 1325 1330 1335 Lys Gly Leu Met Leu Leu Gly Arg Ile Lys Asn Asn Gln Glu Gly 1340 1345 1350 Lys Lys Leu Asn Leu Val Ile Lys Asn Glu Glu Tyr Phe Glu Phe 1355 1360 1365 Val Gln Asn Arg Asn Asn Pro Lys Lys Lys Arg Lys Val Ser Gly 1370 1375 1380 Gly Ser Ser Gly Gly Ser Pro Lys Lys Lys Arg Lys Val Tyr Pro 1385 1390 1395 Tyr Asp Val Pro Asp Tyr Ala Tyr Pro Tyr Asp Val Pro Asp Tyr 1400 1405 1410 Ala Tyr Pro Tyr Asp Val Pro Asp Tyr Ala 1415 1420 <210> 70 <211> 16 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 70 Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser 1 5 10 15 <210> 71 <211> 23 <212> DNA <213> Zea mays <400> 71 attgatagag cacatgagct tgg 23 <210> 72 <211> 23 <212> DNA <213> Zea mays <400> 72 gtcacagatc acaaacttca aat 23 <210> 73 <211> 23 <212> DNA <213> Glycine max <400> 73 gaacccttga gagaggcttc ttc 23 <210> 74 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> crRNA <400> 74 taatttctac taagtgtaga t 21 <210> 75 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> crRNA <400> 75 taatttctac tgttgtagat 20 <210> 76 <211> 5358 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 76 atgtccgagg tggagttcag ccacgagtac tggatgaggc acgctctcac cctggctaag 60 agggcgtggg acgagaggga ggtgccggtg ggcgccgtgc tcgtccacaa caaccgcgtg 120 atcggcgagg gctggaacag gcccatcggc aggcacgacc caaccgctca cgccgagatc 180 atggctctca ggcagggcgg cctggtcatg cagaactaca ggctgatcga cgcgaccctc 240 tacgtgaccc tcgagccctg cgtcatgtgc gcgggcgcca tgatccactc caggatcggc 300 agggtggtct tcggcgctag ggacgccaag acgggcgctg cgggcagcct catggacgtg 360 ctgcaccacc ccggcatgaa ccaccgcgtc gagatcaccg agggcatcct cgcggacgag 420 tgcgctgcgc tcctgtccga cttcttcagg atgcgcaggc aggagatcaa ggcccagaag 480 aaggcgcagt ccagcaccga ctccggcggc tccagcggcg gctccagcgg cagcgagacc 540 ccgggcacgt ccgagagcgc gacgcccgag agcagcggcg gctccagcgg cggctcctcg 600 gaggtcgagt tcagccatga gtactggatg aggcatgccc tgactctcgc taagagggcg 660 cgggatgagc gcgaggtgcc ggtgggggcc gtgctcgtcc tgaacaaccg cgtgatcggg 720 gagggctgga accgggctat cggcctccac gacccaacgg cccatgccga gatcatggcc 780 ctgaggcagg gcggcctggt catgcaaaac tacaggctca tcgacgccac cctctacgtg 840 accttcgagc catgcgtgat gtgcgcgggg gccatgatcc actcgaggat tgggagggtg 900 gtcttcggcg tgcgcaacgc taagacgggg gccgccggca gcctcatgga cgtcctgcac 960 tacccgggca tgaaccacag ggtggagatt accgagggca tcctggccga tgagtgcgcc 1020 gcgctcctgt gctacttctt ccgcatgccc aggcaggtct tcaacgcgca gaagaaggcc 1080 cagagctcca ctgattccgg cggctccagc ggcggctcca gtggcagcga gactcctggc 1140 acgtccgaga gcgccacgcc cgagtctagc ggcggctcca gcggcggctc cgacaagaag 1200 tacagcatcg gcctggcaat cggcaccaac agcgtgggct gggccgtgat caccgacgag 1260 tacaaggtgc cgagcaagaa gttcaaggtg ctgggcaaca ccgacaggca cagcatcaag 1320 aagaacctga tcggcgccct gctgttcgac agcggcgaga ccgccgaggc caccaggctg 1380 aagaggaccg ccaggaggag gtacaccagg aggaagaaca ggatctgcta cctgcaggag 1440 atcttcagca acgagatggc caaggtggac gacagcttct tccacaggct ggaggagagc 1500 ttcctggtgg aggaggacaa gaagcacgag aggcacccga tcttcggcaa catcgtggac 1560 gaggtggcct accacgagaa gtacccgacc atctaccacc tgaggaagaa gctggtggac 1620 agcaccgaca aggccgacct gaggctgatc tacctggccc tggcccacat gatcaagttc 1680 aggggccact tcctgatcga gggcgacctg aacccggaca acagcgacgt ggacaagctg 1740 ttcatccagc tggtgcagac ctacaaccag ctgttcgagg agaacccgat caacgccagc 1800 ggcgtggacg ccaaggccat cctgagcgcc aggctgagca agagcaggag gctggagaac 1860 ctgatcgccc agctgccggg cgagaagaag aacggcctgt tcggcaacct gatcgccctg 1920 agcctgggcc tgaccccgaa cttcaagagc aacttcgacc tggccgagga cgccaagctg 1980 cagctgagca aggacaccta cgacgacgac ctggacaacc tgctggccca gatcggcgac 2040 cagtacgccg acctgttcct ggccgccaag aacctgagcg acgccatcct gctgagcgac 2100 atcctgaggg tgaacaccga gatcaccaag gccccgctga gcgccagcat gatcaagagg 2160 tacgacgagc accaccagga cctgaccctg ctgaaggccc tggtgaggca gcagctgccg 2220 gagaagtaca aggagatctt cttcgaccag agcaagaacg gctacgccgg ctacatcgac 2280 ggcggcgcca gccaggagga gttctacaag ttcatcaagc cgatcctgga gaagatggac 2340 ggcaccgagg agctgctggt gaagctgaac agggaggacc tgctgaggaa gcagaggacc 2400 ttcgacaacg gcagcatccc gcaccagatc cacctgggcg agctgcacgc catcctgagg 2460 aggcaggagg acttctaccc gttcctgaag gacaacaggg agaagatcga gaagatcctg 2520 accttccgca tcccgtacta cgtgggcccg ctggccaggg gcaacagcag gttcgcctgg 2580 atgaccagga agagcgagga gaccatcacc ccgtggaact tcgaggaggt ggtggacaag 2640 ggcgccagcg cccagagctt catcgagagg atgaccaact tcgacaagaa cctgccgaac 2700 gagaaggtgc tgccgaagca cagcctgctg tacgagtact tcaccgtgta caacgagctg 2760 accaaggtga agtacgtgac cgagggcatg aggaagccgg ccttcctgag cggcgagcag 2820 aagaaggcca tcgtggacct gctgttcaag accaacagga aggtgaccgt gaagcagctg 2880 aaggaggact acttcaagaa gatcgagtgc ttcgacagcg tggagatcag cggcgtggag 2940 gacaggttca acgccagcct gggcacctac cacgacctgc tgaagatcat caaggacaag 3000 gacttcctgg acaacgagga gaacgaggac atcctggagg acatcgtgct gaccctgacc 3060 ctgttcgagg acagggagat gatcgaggag aggctgaaga cctacgccca cctgttcgac 3120 gacaaggtga tgaagcagct gaagaggagg aggtacaccg gctggggcag gctgagcagg 3180 aagctgatca acggcatcag ggacaagcag agcggcaaga ccatcctgga cttcctgaag 3240 agcgacggct tcgccaacag gaacttcatg cagctgatcc acgacgacag cctgaccttc 3300 aaggaggaca tccagaaggc ccaggtgagc ggccagggcg acagcctgca cgagcacatc 3360 gccaacctgg ccggcagccc ggccatcaag aagggcatcc tgcagaccgt gaaggtggtg 3420 gacgagctgg tgaaggtgat gggcaggcac aagccggaga acatcgtgat cgagatggcc 3480 agggagaacc agaccaccca gaagggccag aagaacagca gggagaggat gaagaggatc 3540 gaggagggca tcaaggagct gggcagccag atcctgaagg agcacccggt ggagaacacc 3600 cagctgcaga acgagaagct gtacctgtac tacctgcaga acggcaggga catgtacgtg 3660 gaccaggagc tggacatcaa caggctgagc gactacgacg tggaccacat cgtgccgcag 3720 agcttcctga aggacgacag catcgacaac aaggtgctga ccaggagcga caagaacagg 3780 ggcaagagcg acaacgtgcc gagcgaggag gtggtgaaga agatgaaaaa ctactggagg 3840 cagctgctga acgccaagct gatcacccag aggaagttcg acaacctgac caaggccgag 3900 aggggcggcc tgagcgagct ggacaaggcc ggcttcatta aaaggcagct ggtggagacc 3960 aggcagatca ccaagcacgt ggcccagatc ctggacagca ggatgaacac caagtacgac 4020 gagaacgaca agctgatcag ggaggtgaag gtgatcaccc tgaagagcaa gctggtgagc 4080 gacttcagga aggacttcca gttctacaag gtgagggaga tcaataatta ccaccacgcc 4140 cacgacgcct acctgaacgc cgtggtgggc accgccctga ttaaaaagta cccgaagctg 4200 gagagcgagt tcgtgtacgg cgactacaag gtgtacgacg tgaggaagat gatcgccaag 4260 agcgagcagg agatcggcaa ggccaccgcc aagtacttct tctacagcaa catcatgaac 4320 ttcttcaaga ccgagatcac cctggccaac ggcgagatca ggaagaggcc gctgatcgag 4380 accaacggcg agaccggcga gatcgtgtgg gacaagggca gggacttcgc caccgtgagg 4440 aaggtgctgt ccatgccgca ggtgaacatc gtgaagaaga ccgaggtgca gaccggcggc 4500 ttcagcaagg agagcatcct gccgaagagg aacagcgaca agctgatcgc caggaagaag 4560 gactgggatc cgaagaagta cggcggcttc gacagcccga ccgtggccta cagcgtgctg 4620 gtggtggcca aggtggagaa gggcaagagc aagaagctga agagcgtgaa ggagctggtg 4680 ggcatcacca tcatggagag gagcagcttc gagaagaacc cagtggactt cctggaggcc 4740 aagggctaca aggaggtgaa gaaggacctg atcattaaac tgccgaagta cagcctgttc 4800 gagctggaga acggcaggaa gaggatgctg gccagcgccg gcgagctgca gaagggcaac 4860 gagctggccc tgccgagcaa gtacgtgaac ttcctgtacc tggccagcca ctacgagaag 4920 ctgaagggca gcccggagga caacgagcag aagcagctgt tcgtggagca gcacaagcac 4980 tacctggacg agatcatcga gcagatcagc gagttcagca agagggtgat cctggccgac 5040 gccaacctgg acaaggtgct gagcgcctac aacaagcaca gggacaagcc gatcagggag 5100 caggccgaga acatcatcca cctgttcacc ctgaccaacc tgggcgcccc ggccgccttc 5160 aagtacttcg acaccaccat cgacaggaag aggtacacca gcaccaagga ggtgctggac 5220 gccaccctga tccaccagag catcaccggc ctgtacgaga ccaggatcga cctgagccag 5280 ctgggcggcg acagcagccc gccgaagaag aagaggaagg tgagctggaa ggacgccagc 5340 ggctggagca ggatgtga 5358 <210> 77 <211> 1785 <212> PRT <213> Artificial Sequence <220> <223> Fusion protein <400> 77 Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu 1 5 10 15 Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala 20 25 30 Val Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro 35 40 45 Ile Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg 50 55 60 Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu 65 70 75 80 Tyr Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His 85 90 95 Ser Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly 100 105 110 Ala Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His 115 120 125 Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu 130 135 140 Leu Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys 145 150 155 160 Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly Ser Ser Gly Gly Ser Ser 165 170 175 Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser 180 185 190 Gly Gly Ser Ser Gly Gly Ser Ser Glu Val Glu Phe Ser His Glu Tyr 195 200 205 Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala Arg Asp Glu Arg 210 215 220 Glu Val Pro Val Gly Ala Val Leu Val Leu Asn Asn Arg Val Ile Gly 225 230 235 240 Glu Gly Trp Asn Arg Ala Ile Gly Leu His Asp Pro Thr Ala His Ala 245 250 255 Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met Gln Asn Tyr Arg 260 265 270 Leu Ile Asp Ala Thr Leu Tyr Val Thr Phe Glu Pro Cys Val Met Cys 275 280 285 Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val Phe Gly Val 290 295 300 Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp Val Leu His 305 310 315 320 Tyr Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly Ile Leu Ala 325 330 335 Asp Glu Cys Ala Ala Leu Leu Cys Tyr Phe Phe Arg Met Pro Arg Gln 340 345 350 Val Phe Asn Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly 355 360 365 Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser 370 375 380 Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser Asp Lys Lys 385 390 395 400 Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val 405 410 415 Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly 420 425 430 Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu 435 440 445 Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala 450 455 460 Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu 465 470 475 480 Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe Phe His Arg 485 490 495 Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His Glu Arg His 500 505 510 Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr 515 520 525 Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys 530 535 540 Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe 545 550 555 560 Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp 565 570 575 Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe 580 585 590 Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu 595 600 605 Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln 610 615 620 Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu 625 630 635 640 Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu 645 650 655 Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp 660 665 670 Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala 675 680 685 Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val 690 695 700 Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg 705 710 715 720 Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg 725 730 735 Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys 740 745 750 Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe 755 760 765 Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu 770 775 780 Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr 785 790 795 800 Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly Glu Leu His 805 810 815 Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn 820 825 830 Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val 835 840 845 Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys 850 855 860 Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys 865 870 875 880 Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys 885 890 895 Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu 900 905 910 Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu 915 920 925 Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile 930 935 940 Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu 945 950 955 960 Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile 965 970 975 Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp 980 985 990 Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn 995 1000 1005 Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu Phe Glu 1010 1015 1020 Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His Leu 1025 1030 1035 Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr 1040 1045 1050 Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 1055 1060 1065 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly 1070 1075 1080 Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu 1085 1090 1095 Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly 1100 1105 1110 Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala 1115 1120 1125 Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu 1130 1135 1140 Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu 1145 1150 1155 Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser 1160 1165 1170 Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly 1175 1180 1185 Ser Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln 1190 1195 1200 Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met 1205 1210 1215 Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp 1220 1225 1230 Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile 1235 1240 1245 Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser 1250 1255 1260 Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr 1265 1270 1275 Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe 1280 1285 1290 Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 1295 1300 1305 Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile 1310 1315 1320 Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys 1325 1330 1335 Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr 1340 1345 1350 Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe 1355 1360 1365 Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala 1370 1375 1380 Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro 1385 1390 1395 Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp 1400 1405 1410 Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala 1415 1420 1425 Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys 1430 1435 1440 Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu 1445 1450 1455 Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly 1460 1465 1470 Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val 1475 1480 1485 Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys 1490 1495 1500 Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg 1505 1510 1515 Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro 1520 1525 1530 Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly 1535 1540 1545 Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Val Gly Ile Thr 1550 1555 1560 Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Val Asp Phe Leu 1565 1570 1575 Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys 1580 1585 1590 Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg 1595 1600 1605 Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala 1610 1615 1620 Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr 1625 1630 1635 Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu 1640 1645 1650 Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln 1655 1660 1665 Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu 1670 1675 1680 Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile 1685 1690 1695 Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn 1700 1705 1710 Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp 1715 1720 1725 Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu 1730 1735 1740 Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu 1745 1750 1755 Ser Gln Leu Gly Gly Asp Ser Ser Pro Pro Lys Lys Lys Arg Lys 1760 1765 1770 Val Ser Trp Lys Asp Ala Ser Gly Trp Ser Arg Met 1775 1780 1785 <210> 78 <211> 5094 <212> DNA <213> Artificial Sequence <220> <223> Syntheic <400> 78 atgtccgagg tggagttcag ccacgagtac tggatgaggc acgctctcac cctggctaag 60 agggcgtggg acgagaggga ggtgccggtg ggcgccgtgc tcgtccacaa caaccgcgtg 120 atcggcgagg gctggaacag gcccatcggc aggcacgacc caaccgctca cgccgagatc 180 atggctctca ggcagggcgg cctggtcatg cagaactaca ggctgatcga cgcgaccctc 240 tacgtgaccc tcgagccctg cgtcatggta agtttctgct tctacctttg atatatatat 300 aataattatc attaattagt agtaatataa tatttcaaat atttttttca aaataaaaga 360 atgtagtata tagcaattgc ttttctgtag tttataagtg tgtatatttt aatttataac 420 ttttctaata tatgaccaaa atttgttgat gtgcagtgcg cgggcgccat gatccactcc 480 aggatcggca gggtggtctt cggcgctagg gacgccaaga cgggcgctgc gggcagcctc 540 atggacgtgc tgcaccaccc cggcatgaac caccgcgtcg agatcaccga gggcatcctc 600 gcggacgagt gcgctgcgct cctgtccgac ttcttcagga tgcgcaggca ggagatcaag 660 gcccagaaga aggcgcagtc cagcaccgac tccggcggct ccagcggcgg ctccagcggc 720 agcgagaccc cgggcacgtc cgagagcgcg acgcccgaga gcagcggcgg ctccagcggc 780 ggctcctcgg aggtcgagtt cagccatgag tactggatga ggcatgccct gactctcgct 840 aagagggcgc gggatgagcg cgaggtgccg gtgggggccg tgctcgtcct gaacaaccgc 900 gtgatcgggg agggctggaa ccgggctatc ggcctccacg acccaacggc ccatgccgag 960 atcatggccc tgaggcaggg cggcctggtc atgcaaaact acaggctcat cgacgccacc 1020 ctctacgtga ccttcgagcc atgcgtgatg tgcgcggggg ccatgatcca ctcgaggatt 1080 gggagggtgg tcttcggcgt gcgcaacgct aagacggggg ccgccggcag cctcatggac 1140 gtcctgcact acccgggcat gaaccacagg gtggagatta ccgagggcat cctggccgat 1200 gagtgcgccg cgctcctgtg ctacttcttc cgcatgccca ggcaggtctt caacgcgcag 1260 aagaaggccc agagctccac tgattccggc ggctccagcg gcggctccag tggcagcgag 1320 actcctggca cgtccgagag cgccacgccc gagtctagcg gcggctccag cggcggctcc 1380 atgagcaagc tggagaagtt cacgaactgc tactccctca gcaagaccct gaggttcaag 1440 gcgatcccgg tcggcaagac ccaggagaac atcgacaaca agcggctgct ggtggaggac 1500 gagaagaggg ctgaggacta caagggcgtg aagaagctcc tggaccgcta ctacctgtcc 1560 ttcatcaacg acgtgctcca cagcatcaag ctcaagaacc tgaacaacta catcagcctc 1620 ttcaggaaga agacgcgcac cgagaaggag aacaaggagc tcgagaacct ggagatcaac 1680 ctgaggaagg agatcgccaa ggcgttcaag ggcaacgagg gctacaagtc cctcttcaag 1740 aaggacatca tcgagacgat cctcccggag ttcctggacg acaaggacga gatcgccctg 1800 gtcaactcct tcaacggctt caccacggcg ttcaccggct tcttcgacaa ccgcgagaac 1860 atgttcagcg aggaggccaa gtccacgagc atcgcgttca ggtgcatcaa cgagaacctc 1920 acccgctaca tctccaacat ggacatcttc gagaaggtcg acgcgatctt cgacaagcac 1980 gaggtgcagg agatcaagga gaagatcctg aacagcgact acgacgtcga ggacttcttc 2040 gagggcgagt tcttcaactt cgtcctcacg caggagggca tcgacgtgta caacgccatc 2100 atcggtggct tcgtgaccga gtccggcgag aagatcaagg gcctgaacga gtacatcaac 2160 ctctacaacc agaagaccaa gcagaagctg ccgaagttca agcccctgta caagcaggtg 2220 ctctccgaca gggagtccct cagcttctac ggcgagggct acacgagcga cgaggaggtc 2280 ctggaggtgt tccgcaacac cctcaacaag aacagcgaga tcttctccag catcaagaag 2340 ctcgagaagc tgttcaagaa cttcgacgag tactccagcg ccggcatctt cgtcaagaac 2400 ggcccggcga tctccacgat cagcaaggac atcttcggcg agtggaacgt gatccgcgac 2460 aagtggaacg ccgagtacga cgacatccac ctcaagaaga aggcggtggt caccgagaag 2520 tacgaggacg acaggcgcaa gtccttcaag aagatcggct ccttcagcct cgagcagctg 2580 caggagtacg ccgacgcgga cctgagcgtg gtcgagaagc tcaaggagat catcatccag 2640 aaggtcgacg agatctacaa ggtgtacggc tccagcgaga agctcttcga cgcggacttc 2700 gtcctcgaga agtccctgaa gaagaacgac gccgtggtcg cgatcatgaa ggacctcctg 2760 gactccgtga agagcttcga gaattacatc aaggccttct tcggcgaggg caaggagacg 2820 aacagggacg agtccttcta cggcgacttc gtcctggcct acgacatcct cctgaaggtg 2880 gaccacatct acgacgcgat ccgcaactac gtgacccaga agccgtacag caaggacaag 2940 ttcaagctct acttccagaa cccccagttc atgggcggct gggacaagga caaggagacg 3000 gactacaggg cgaccatcct gcgctacggc agcaagtact acctcgccat catggacaag 3060 aagtacgcga agtgcctgca gaagatcgac aaggacgacg tcaacggcaa ctacgagaag 3120 atcaactaca agctcctgcc gggccccaac aagatgctcc cgaaggtgtt cttctccaag 3180 aagtggatgg cctactacaa ccccagcgag gacatccaga agatctacaa gaacggcacg 3240 ttcaagaagg gcgacatgtt caacctgaac gactgccaca agctcatcga cttcttcaag 3300 gactccatca gccgctaccc gaagtggtcc aacgcctacg acttcaactt cagcgagacc 3360 gagaagtaca aggacatcgc gggcttctac cgcgaggtcg aggagcaggg ctacaaggtg 3420 tccttcgagt ccgccagcaa gaaggaggtc gacaagctgg tggaggaggg caagctctac 3480 atgttccaga tctacaacaa ggacttctcc gacaagagcc acggcacgcc caacctgcac 3540 accatgtact tcaagctcct gttcgacgag aacaaccacg gccagatcag gctgtccggc 3600 ggcgccgagc tcttcatgag gagggcgagc ctgaagaagg aggagctggt ggtccacccc 3660 gctaacagcc caatcgcgaa caagaacccg gacaacccca agaagaccac gaccctgtcc 3720 tacgacgtgt acaaggacaa gaggttcagc gaggaccagt acgagctcca catcccgatc 3780 gcgatcaaca agtgccccaa gaacatcttc aagatcaaca ccgaggtccg cgtgctcctg 3840 aagcacgacg acaaccccta cgtgatcggc atcgctaggg gcgagaggaa cctcctgtac 3900 atcgtggtcg tggacggcaa gggcaacatc gtggagcagt actccctcaa cgagatcatc 3960 aacaacttca acggcatcag gatcaagacg gactaccaca gcctcctgga caagaaggag 4020 aaggagaggt tcgaggcccg ccagaactgg acctccatcg agaacatcaa ggagctgaag 4080 gcgggctaca tcagccaggt cgtgcacaag atctgcgagc tcgtcgagaa gtacgacgcc 4140 gtgatcgccc tcgcggacct gaactccggc ttcaagaaca gccgcgtcaa ggtggagaag 4200 caggtctacc agaagttcga gaagatgctc atcgacaagc tgaactacat ggtggacaag 4260 aagtccaacc cctgcgctac gggcggcgcg ctgaagggct accagatcac caacaagttc 4320 gagagcttca agtccatgag cactcagaac ggcttcatct tctacatccc ggcgtggctc 4380 acgtccaaga tcgaccccag caccggcttc gtcaacctcc tgaagacgaa gtacacctcc 4440 atcgccgaca gcaagaagtt catctccagc ttcgaccgca tcatgtatgt gccggaggag 4500 gacctgttcg agttcgccct cgactacaag aacttctccc gcacggacgc ggactacatc 4560 aagaagtgga agctgtacag ctacggcaac cgcatccgca tcttcaggaa ccccaagaag 4620 aacaacgtct tcgactggga ggaggtgtgc ctgacctccg cgtacaagga gctcttcaac 4680 aagtacggca tcaactacca gcagggcgac atcagggctc tcctgtgcga gcagagcgac 4740 aaggccttct actccagctt catggcgctg atgtccctca tgctgcagat gaggaactcg 4800 atcaccggca ggacggacgt ggccttcctc atctccccgg tgaagaacag cgacggcatc 4860 ttctacgact ccaggaacta cgaggcccag gagaacgcga tcctcccaaa gaacgcggac 4920 gccaacggcg cctacaacat cgccaggaag gtcctctggg ctatcggcca gttcaagaag 4980 gcggaggacg agaagctgga caaggtgaag atcgccatca gcaacaagga gtggctcgag 5040 tacgcccaga cctcggtcaa gcacggcagc ccgaagaaga agcgcaaggt gtga 5094 <210> 79 <211> 1691 <212> PRT <213> Artificial Sequence <220> <223> Fusion protein <400> 79 Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu 1 5 10 15 Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala 20 25 30 Val Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro 35 40 45 Ile Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg 50 55 60 Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu 65 70 75 80 Tyr Val Thr Leu Glu Pro Cys Val Met Val Ser Phe Cys Phe Tyr Leu 85 90 95 Tyr Ile Tyr Asn Asn Tyr His Leu Val Val Ile Tyr Phe Lys Tyr Phe 100 105 110 Phe Gln Asn Lys Arg Met Tyr Ile Ala Ile Ala Phe Leu Phe Ile Ser 115 120 125 Val Tyr Ile Leu Ile Tyr Asn Phe Ser Asn Ile Pro Lys Phe Val Asp 130 135 140 Val Gln Cys Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val 145 150 155 160 Phe Gly Ala Arg Asp Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp 165 170 175 Val Leu His His Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly 180 185 190 Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu Ser Asp Phe Phe Arg Met 195 200 205 Arg Arg Gln Glu Ile Lys Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp 210 215 220 Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr 225 230 235 240 Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser 245 250 255 Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr 260 265 270 Leu Ala Lys Arg Ala Arg Asp Glu Arg Glu Val Pro Val Gly Ala Val 275 280 285 Leu Val Leu Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Ala Ile 290 295 300 Gly Leu His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 305 310 315 320 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 325 330 335 Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 340 345 350 Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly Ala 355 360 365 Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His Arg 370 375 380 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu 385 390 395 400 Cys Tyr Phe Phe Arg Met Pro Arg Gln Val Phe Asn Ala Gln Lys Lys 405 410 415 Ala Gln Ser Ser Thr Asp Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly 420 425 430 Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly 435 440 445 Gly Ser Ser Gly Gly Ser Met Ser Lys Leu Glu Lys Phe Thr Asn Cys 450 455 460 Tyr Ser Leu Ser Lys Thr Leu Arg Phe Lys Ala Ile Pro Val Gly Lys 465 470 475 480 Thr Gln Glu Asn Ile Asp Asn Lys Arg Leu Leu Val Glu Asp Glu Lys 485 490 495 Arg Ala Glu Asp Tyr Lys Gly Val Lys Lys Leu Leu Asp Arg Tyr Tyr 500 505 510 Leu Ser Phe Ile Asn Asp Val Leu His Ser Ile Lys Leu Lys Asn Leu 515 520 525 Asn Asn Tyr Ile Ser Leu Phe Arg Lys Lys Thr Arg Thr Glu Lys Glu 530 535 540 Asn Lys Glu Leu Glu Asn Leu Glu Ile Asn Leu Arg Lys Glu Ile Ala 545 550 555 560 Lys Ala Phe Lys Gly Asn Glu Gly Tyr Lys Ser Leu Phe Lys Lys Asp 565 570 575 Ile Ile Glu Thr Ile Leu Pro Glu Phe Leu Asp Asp Lys Asp Glu Ile 580 585 590 Ala Leu Val Asn Ser Phe Asn Gly Phe Thr Thr Ala Phe Thr Gly Phe 595 600 605 Phe Asp Asn Arg Glu Asn Met Phe Ser Glu Glu Ala Lys Ser Thr Ser 610 615 620 Ile Ala Phe Arg Cys Ile Asn Glu Asn Leu Thr Arg Tyr Ile Ser Asn 625 630 635 640 Met Asp Ile Phe Glu Lys Val Asp Ala Ile Phe Asp Lys His Glu Val 645 650 655 Gln Glu Ile Lys Glu Lys Ile Leu Asn Ser Asp Tyr Asp Val Glu Asp 660 665 670 Phe Phe Glu Gly Glu Phe Phe Asn Phe Val Leu Thr Gln Glu Gly Ile 675 680 685 Asp Val Tyr Asn Ala Ile Ile Gly Gly Phe Val Thr Glu Ser Gly Glu 690 695 700 Lys Ile Lys Gly Leu Asn Glu Tyr Ile Asn Leu Tyr Asn Gln Lys Thr 705 710 715 720 Lys Gln Lys Leu Pro Lys Phe Lys Pro Leu Tyr Lys Gln Val Leu Ser 725 730 735 Asp Arg Glu Ser Leu Ser Phe Tyr Gly Glu Gly Tyr Thr Ser Asp Glu 740 745 750 Glu Val Leu Glu Val Phe Arg Asn Thr Leu Asn Lys Asn Ser Glu Ile 755 760 765 Phe Ser Ser Ile Lys Lys Leu Glu Lys Leu Phe Lys Asn Phe Asp Glu 770 775 780 Tyr Ser Ser Ala Gly Ile Phe Val Lys Asn Gly Pro Ala Ile Ser Thr 785 790 795 800 Ile Ser Lys Asp Ile Phe Gly Glu Trp Asn Val Ile Arg Asp Lys Trp 805 810 815 Asn Ala Glu Tyr Asp Asp Ile His Leu Lys Lys Lys Ala Val Val Thr 820 825 830 Glu Lys Tyr Glu Asp Asp Arg Arg Lys Ser Phe Lys Lys Ile Gly Ser 835 840 845 Phe Ser Leu Glu Gln Leu Gln Glu Tyr Ala Asp Ala Asp Leu Ser Val 850 855 860 Val Glu Lys Leu Lys Glu Ile Ile Ile Gln Lys Val Asp Glu Ile Tyr 865 870 875 880 Lys Val Tyr Gly Ser Ser Glu Lys Leu Phe Asp Ala Asp Phe Val Leu 885 890 895 Glu Lys Ser Leu Lys Lys Asn Asp Ala Val Val Ala Ile Met Lys Asp 900 905 910 Leu Leu Asp Ser Val Lys Ser Phe Glu Asn Tyr Ile Lys Ala Phe Phe 915 920 925 Gly Glu Gly Lys Glu Thr Asn Arg Asp Glu Ser Phe Tyr Gly Asp Phe 930 935 940 Val Leu Ala Tyr Asp Ile Leu Leu Lys Val Asp His Ile Tyr Asp Ala 945 950 955 960 Ile Arg Asn Tyr Val Thr Gln Lys Pro Tyr Ser Lys Asp Lys Phe Lys 965 970 975 Leu Tyr Phe Gln Asn Pro Gln Phe Met Gly Gly Trp Asp Lys Asp Lys 980 985 990 Glu Thr Asp Tyr Arg Ala Thr Ile Leu Arg Tyr Gly Ser Lys Tyr Tyr 995 1000 1005 Leu Ala Ile Met Asp Lys Lys Tyr Ala Lys Cys Leu Gln Lys Ile 1010 1015 1020 Asp Lys Asp Asp Val Asn Gly Asn Tyr Glu Lys Ile Asn Tyr Lys 1025 1030 1035 Leu Leu Pro Gly Pro Asn Lys Met Leu Pro Lys Val Phe Phe Ser 1040 1045 1050 Lys Lys Trp Met Ala Tyr Tyr Asn Pro Ser Glu Asp Ile Gln Lys 1055 1060 1065 Ile Tyr Lys Asn Gly Thr Phe Lys Lys Gly Asp Met Phe Asn Leu 1070 1075 1080 Asn Asp Cys His Lys Leu Ile Asp Phe Phe Lys Asp Ser Ile Ser 1085 1090 1095 Arg Tyr Pro Lys Trp Ser Asn Ala Tyr Asp Phe Asn Phe Ser Glu 1100 1105 1110 Thr Glu Lys Tyr Lys Asp Ile Ala Gly Phe Tyr Arg Glu Val Glu 1115 1120 1125 Glu Gln Gly Tyr Lys Val Ser Phe Glu Ser Ala Ser Lys Lys Glu 1130 1135 1140 Val Asp Lys Leu Val Glu Glu Gly Lys Leu Tyr Met Phe Gln Ile 1145 1150 1155 Tyr Asn Lys Asp Phe Ser Asp Lys Ser His Gly Thr Pro Asn Leu 1160 1165 1170 His Thr Met Tyr Phe Lys Leu Leu Phe Asp Glu Asn Asn His Gly 1175 1180 1185 Gln Ile Arg Leu Ser Gly Gly Ala Glu Leu Phe Met Arg Arg Ala 1190 1195 1200 Ser Leu Lys Lys Glu Glu Leu Val Val His Pro Ala Asn Ser Pro 1205 1210 1215 Ile Ala Asn Lys Asn Pro Asp Asn Pro Lys Lys Thr Thr Thr Leu 1220 1225 1230 Ser Tyr Asp Val Tyr Lys Asp Lys Arg Phe Ser Glu Asp Gln Tyr 1235 1240 1245 Glu Leu His Ile Pro Ile Ala Ile Asn Lys Cys Pro Lys Asn Ile 1250 1255 1260 Phe Lys Ile Asn Thr Glu Val Arg Val Leu Leu Lys His Asp Asp 1265 1270 1275 Asn Pro Tyr Val Ile Gly Ile Ala Arg Gly Glu Arg Asn Leu Leu 1280 1285 1290 Tyr Ile Val Val Val Asp Gly Lys Gly Asn Ile Val Glu Gln Tyr 1295 1300 1305 Ser Leu Asn Glu Ile Ile Asn Asn Phe Asn Gly Ile Arg Ile Lys 1310 1315 1320 Thr Asp Tyr His Ser Leu Leu Asp Lys Lys Glu Lys Glu Arg Phe 1325 1330 1335 Glu Ala Arg Gln Asn Trp Thr Ser Ile Glu Asn Ile Lys Glu Leu 1340 1345 1350 Lys Ala Gly Tyr Ile Ser Gln Val Val His Lys Ile Cys Glu Leu 1355 1360 1365 Val Glu Lys Tyr Asp Ala Val Ile Ala Leu Ala Asp Leu Asn Ser 1370 1375 1380 Gly Phe Lys Asn Ser Arg Val Lys Val Glu Lys Gln Val Tyr Gln 1385 1390 1395 Lys Phe Glu Lys Met Leu Ile Asp Lys Leu Asn Tyr Met Val Asp 1400 1405 1410 Lys Lys Ser Asn Pro Cys Ala Thr Gly Gly Ala Leu Lys Gly Tyr 1415 1420 1425 Gln Ile Thr Asn Lys Phe Glu Ser Phe Lys Ser Met Ser Thr Gln 1430 1435 1440 Asn Gly Phe Ile Phe Tyr Ile Pro Ala Trp Leu Thr Ser Lys Ile 1445 1450 1455 Asp Pro Ser Thr Gly Phe Val Asn Leu Leu Lys Thr Lys Tyr Thr 1460 1465 1470 Ser Ile Ala Asp Ser Lys Lys Phe Ile Ser Ser Phe Asp Arg Ile 1475 1480 1485 Met Tyr Val Pro Glu Glu Asp Leu Phe Glu Phe Ala Leu Asp Tyr 1490 1495 1500 Lys Asn Phe Ser Arg Thr Asp Ala Asp Tyr Ile Lys Lys Trp Lys 1505 1510 1515 Leu Tyr Ser Tyr Gly Asn Arg Ile Arg Ile Phe Arg Asn Pro Lys 1520 1525 1530 Lys Asn Asn Val Phe Asp Trp Glu Glu Val Cys Leu Thr Ser Ala 1535 1540 1545 Tyr Lys Glu Leu Phe Asn Lys Tyr Gly Ile Asn Tyr Gln Gln Gly 1550 1555 1560 Asp Ile Arg Ala Leu Leu Cys Glu Gln Ser Asp Lys Ala Phe Tyr 1565 1570 1575 Ser Ser Phe Met Ala Leu Met Ser Leu Met Leu Gln Met Arg Asn 1580 1585 1590 Ser Ile Thr Gly Arg Thr Asp Val Ala Phe Leu Ile Ser Pro Val 1595 1600 1605 Lys Asn Ser Asp Gly Ile Phe Tyr Asp Ser Arg Asn Tyr Glu Ala 1610 1615 1620 Gln Glu Asn Ala Ile Leu Pro Lys Asn Ala Asp Ala Asn Gly Ala 1625 1630 1635 Tyr Asn Ile Ala Arg Lys Val Leu Trp Ala Ile Gly Gln Phe Lys 1640 1645 1650 Lys Ala Glu Asp Glu Lys Leu Asp Lys Val Lys Ile Ala Ile Ser 1655 1660 1665 Asn Lys Glu Trp Leu Glu Tyr Ala Gln Thr Ser Val Lys His Gly 1670 1675 1680 Ser Pro Lys Lys Lys Arg Lys Val 1685 1690 <210> 80 <211> 5088 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 80 atgtccgagg tggagttcag ccacgagtac tggatgaggc acgctctcac cctggctaag 60 agggcgtggg acgagaggga ggtgccggtg ggcgccgtgc tcgtccacaa caaccgcgtg 120 atcggcgagg gctggaacag gcccatcggc aggcacgacc caaccgctca cgccgagatc 180 atggctctca ggcagggcgg cctggtcatg cagaactaca ggctgatcga cgcgaccctc 240 tacgtgaccc tcgagccctg cgtcatggta agtttctgct tctacctttg atatatatat 300 aataattatc attaattagt agtaatataa tatttcaaat atttttttca aaataaaaga 360 atgtagtata tagcaattgc ttttctgtag tttataagtg tgtatatttt aatttataac 420 ttttctaata tatgaccaaa atttgttgat gtgcagtgcg cgggcgccat gatccactcc 480 aggatcggca gggtggtctt cggcgctagg gacgccaaga cgggcgctgc gggcagcctc 540 atggacgtgc tgcaccaccc cggcatgaac caccgcgtcg agatcaccga gggcatcctc 600 gcggacgagt gcgctgcgct cctgtccgac ttcttcagga tgcgcaggca ggagatcaag 660 gcccagaaga aggcgcagtc cagcaccgac tccggcggct ccagcggcgg ctccagcggc 720 agcgagaccc cgggcacgtc cgagagcgcg acgcccgaga gcagcggcgg ctccagcggc 780 ggctcctcgg aggtcgagtt cagccatgag tactggatga ggcatgccct gactctcgct 840 aagagggcgc gggatgagcg cgaggtgccg gtgggggccg tgctcgtcct gaacaaccgc 900 gtgatcgggg agggctggaa ccgggctatc ggcctccacg acccaacggc ccatgccgag 960 atcatggccc tgaggcaggg cggcctggtc atgcaaaact acaggctcat cgacgccacc 1020 ctctacgtga ccttcgagcc atgcgtgatg tgcgcggggg ccatgatcca ctcgaggatt 1080 gggagggtgg tcttcggcgt gcgcaacgct aagacggggg ccgccggcag cctcatggac 1140 gtcctgcact acccgggcat gaaccacagg gtggagatta ccgagggcat cctggccgat 1200 gagtgcgccg cgctcctgtg ctacttcttc cgcatgccca ggcaggtctt caacgcgcag 1260 aagaaggccc agagctccac tgatgggggc gggggctcag gcgggggcgg gagcggcggc 1320 gggggctctg ggggcggcgg cagcggcggg ggcggcagcg ggggcggcgg gtcgatgagc 1380 aagctggaga agttcacgaa ctgctactcc ctcagcaaga ccctgaggtt caaggcgatc 1440 ccggtcggca agacccagga gaacatcgac aacaagcggc tgctggtgga ggacgagaag 1500 agggctgagg actacaaggg cgtgaagaag ctcctggacc gctactacct gtccttcatc 1560 aacgacgtgc tccacagcat caagctcaag aacctgaaca actacatcag cctcttcagg 1620 aagaagacgc gcaccgagaa ggagaacaag gagctcgaga acctggagat caacctgagg 1680 aaggagatcg ccaaggcgtt caagggcaac gagggctaca agtccctctt caagaaggac 1740 atcatcgaga cgatcctccc ggagttcctg gacgacaagg acgagatcgc cctggtcaac 1800 tccttcaacg gcttcaccac ggcgttcacc ggcttcttcg acaaccgcga gaacatgttc 1860 agcgaggagg ccaagtccac gagcatcgcg ttcaggtgca tcaacgagaa cctcacccgc 1920 tacatctcca acatggacat cttcgagaag gtcgacgcga tcttcgacaa gcacgaggtg 1980 caggagatca aggagaagat cctgaacagc gactacgacg tcgaggactt cttcgagggc 2040 gagttcttca acttcgtcct cacgcaggag ggcatcgacg tgtacaacgc catcatcggt 2100 ggcttcgtga ccgagtccgg cgagaagatc aagggcctga acgagtacat caacctctac 2160 aaccagaaga ccaagcagaa gctgccgaag ttcaagcccc tgtacaagca ggtgctctcc 2220 gacagggagt ccctcagctt ctacggcgag ggctacacga gcgacgagga ggtcctggag 2280 gtgttccgca acaccctcaa caagaacagc gagatcttct ccagcatcaa gaagctcgag 2340 aagctgttca agaacttcga cgagtactcc agcgccggca tcttcgtcaa gaacggcccg 2400 gcgatctcca cgatcagcaa ggacatcttc ggcgagtgga acgtgatccg cgacaagtgg 2460 aacgccgagt acgacgacat ccacctcaag aagaaggcgg tggtcaccga gaagtacgag 2520 gacgacaggc gcaagtcctt caagaagatc ggctccttca gcctcgagca gctgcaggag 2580 tacgccgacg cggacctgag cgtggtcgag aagctcaagg agatcatcat ccagaaggtc 2640 gacgagatct acaaggtgta cggctccagc gagaagctct tcgacgcgga cttcgtcctc 2700 gagaagtccc tgaagaagaa cgacgccgtg gtcgcgatca tgaaggacct cctggactcc 2760 gtgaagagct tcgagaatta catcaaggcc ttcttcggcg agggcaagga gacgaacagg 2820 gacgagtcct tctacggcga cttcgtcctg gcctacgaca tcctcctgaa ggtggaccac 2880 atctacgacg cgatccgcaa ctacgtgacc cagaagccgt acagcaagga caagttcaag 2940 ctctacttcc agaaccccca gttcatgggc ggctgggaca aggacaagga gacggactac 3000 agggcgacca tcctgcgcta cggcagcaag tactacctcg ccatcatgga caagaagtac 3060 gcgaagtgcc tgcagaagat cgacaaggac gacgtcaacg gcaactacga gaagatcaac 3120 tacaagctcc tgccgggccc caacaagatg ctcccgaagg tgttcttctc caagaagtgg 3180 atggcctact acaaccccag cgaggacatc cagaagatct acaagaacgg cacgttcaag 3240 aagggcgaca tgttcaacct gaacgactgc cacaagctca tcgacttctt caaggactcc 3300 atcagccgct acccgaagtg gtccaacgcc tacgacttca acttcagcga gaccgagaag 3360 tacaaggaca tcgcgggctt ctaccgcgag gtcgaggagc agggctacaa ggtgtccttc 3420 gagtccgcca gcaagaagga ggtcgacaag ctggtggagg agggcaagct ctacatgttc 3480 cagatctaca acaaggactt ctccgacaag agccacggca cgcccaacct gcacaccatg 3540 tacttcaagc tcctgttcga cgagaacaac cacggccaga tcaggctgtc cggcggcgcc 3600 gagctcttca tgaggagggc gagcctgaag aaggaggagc tggtggtcca ccccgctaac 3660 agcccaatcg cgaacaagaa cccggacaac cccaagaaga ccacgaccct gtcctacgac 3720 gtgtacaagg acaagaggtt cagcgaggac cagtacgagc tccacatccc gatcgcgatc 3780 aacaagtgcc ccaagaacat cttcaagatc aacaccgagg tccgcgtgct cctgaagcac 3840 gacgacaacc cctacgtgat cggcatcgct aggggcgaga ggaacctcct gtacatcgtg 3900 gtcgtggacg gcaagggcaa catcgtggag cagtactccc tcaacgagat catcaacaac 3960 ttcaacggca tcaggatcaa gacggactac cacagcctcc tggacaagaa ggagaaggag 4020 aggttcgagg cccgccagaa ctggacctcc atcgagaaca tcaaggagct gaaggcgggc 4080 tacatcagcc aggtcgtgca caagatctgc gagctcgtcg agaagtacga cgccgtgatc 4140 gccctcgcgg acctgaactc cggcttcaag aacagccgcg tcaaggtgga gaagcaggtc 4200 taccagaagt tcgagaagat gctcatcgac aagctgaact acatggtgga caagaagtcc 4260 aacccctgcg ctacgggcgg cgcgctgaag ggctaccaga tcaccaacaa gttcgagagc 4320 ttcaagtcca tgagcactca gaacggcttc atcttctaca tcccggcgtg gctcacgtcc 4380 aagatcgacc ccagcaccgg cttcgtcaac ctcctgaaga cgaagtacac ctccatcgcc 4440 gacagcaaga agttcatctc cagcttcgac cgcatcatgt atgtgccgga ggaggacctg 4500 ttcgagttcg ccctcgacta caagaacttc tcccgcacgg acgcggacta catcaagaag 4560 tggaagctgt acagctacgg caaccgcatc cgcatcttca ggaaccccaa gaagaacaac 4620 gtcttcgact gggaggaggt gtgcctgacc tccgcgtaca aggagctctt caacaagtac 4680 ggcatcaact accagcaggg cgacatcagg gctctcctgt gcgagcagag cgacaaggcc 4740 ttctactcca gcttcatggc gctgatgtcc ctcatgctgc agatgaggaa ctcgatcacc 4800 ggcaggacgg acgtggcctt cctcatctcc ccggtgaaga acagcgacgg catcttctac 4860 gactccagga actacgaggc ccaggagaac gcgatcctcc caaagaacgc ggacgccaac 4920 ggcgcctaca acatcgccag gaaggtcctc tgggctatcg gccagttcaa gaaggcggag 4980 gacgagaagc tggacaaggt gaagatcgcc atcagcaaca aggagtggct cgagtacgcc 5040 cagacctcgg tcaagcacgg cagcccgaag aagaagcgca aggtgtga 5088 <210> 81 <211> 1689 <212> PRT <213> Artificial Sequence <220> <223> Fusion protein <400> 81 Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu 1 5 10 15 Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala 20 25 30 Val Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro 35 40 45 Ile Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg 50 55 60 Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu 65 70 75 80 Tyr Val Thr Leu Glu Pro Cys Val Met Val Ser Phe Cys Phe Tyr Leu 85 90 95 Tyr Ile Tyr Asn Asn Tyr His Leu Val Val Ile Tyr Phe Lys Tyr Phe 100 105 110 Phe Gln Asn Lys Arg Met Tyr Ile Ala Ile Ala Phe Leu Phe Ile Ser 115 120 125 Val Tyr Ile Leu Ile Tyr Asn Phe Ser Asn Ile Pro Lys Phe Val Asp 130 135 140 Val Gln Cys Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val 145 150 155 160 Phe Gly Ala Arg Asp Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp 165 170 175 Val Leu His His Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly 180 185 190 Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu Ser Asp Phe Phe Arg Met 195 200 205 Arg Arg Gln Glu Ile Lys Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp 210 215 220 Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr 225 230 235 240 Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser 245 250 255 Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr 260 265 270 Leu Ala Lys Arg Ala Arg Asp Glu Arg Glu Val Pro Val Gly Ala Val 275 280 285 Leu Val Leu Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Ala Ile 290 295 300 Gly Leu His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 305 310 315 320 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 325 330 335 Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 340 345 350 Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly Ala 355 360 365 Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His Arg 370 375 380 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu 385 390 395 400 Cys Tyr Phe Phe Arg Met Pro Arg Gln Val Phe Asn Ala Gln Lys Lys 405 410 415 Ala Gln Ser Ser Thr Asp Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser 420 425 430 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly 435 440 445 Gly Gly Gly Ser Met Ser Lys Leu Glu Lys Phe Thr Asn Cys Tyr Ser 450 455 460 Leu Ser Lys Thr Leu Arg Phe Lys Ala Ile Pro Val Gly Lys Thr Gln 465 470 475 480 Glu Asn Ile Asp Asn Lys Arg Leu Leu Val Glu Asp Glu Lys Arg Ala 485 490 495 Glu Asp Tyr Lys Gly Val Lys Lys Leu Leu Asp Arg Tyr Tyr Leu Ser 500 505 510 Phe Ile Asn Asp Val Leu His Ser Ile Lys Leu Lys Asn Leu Asn Asn 515 520 525 Tyr Ile Ser Leu Phe Arg Lys Lys Thr Arg Thr Glu Lys Glu Asn Lys 530 535 540 Glu Leu Glu Asn Leu Glu Ile Asn Leu Arg Lys Glu Ile Ala Lys Ala 545 550 555 560 Phe Lys Gly Asn Glu Gly Tyr Lys Ser Leu Phe Lys Lys Asp Ile Ile 565 570 575 Glu Thr Ile Leu Pro Glu Phe Leu Asp Asp Lys Asp Glu Ile Ala Leu 580 585 590 Val Asn Ser Phe Asn Gly Phe Thr Thr Ala Phe Thr Gly Phe Phe Asp 595 600 605 Asn Arg Glu Asn Met Phe Ser Glu Glu Ala Lys Ser Thr Ser Ile Ala 610 615 620 Phe Arg Cys Ile Asn Glu Asn Leu Thr Arg Tyr Ile Ser Asn Met Asp 625 630 635 640 Ile Phe Glu Lys Val Asp Ala Ile Phe Asp Lys His Glu Val Gln Glu 645 650 655 Ile Lys Glu Lys Ile Leu Asn Ser Asp Tyr Asp Val Glu Asp Phe Phe 660 665 670 Glu Gly Glu Phe Phe Asn Phe Val Leu Thr Gln Glu Gly Ile Asp Val 675 680 685 Tyr Asn Ala Ile Ile Gly Gly Phe Val Thr Glu Ser Gly Glu Lys Ile 690 695 700 Lys Gly Leu Asn Glu Tyr Ile Asn Leu Tyr Asn Gln Lys Thr Lys Gln 705 710 715 720 Lys Leu Pro Lys Phe Lys Pro Leu Tyr Lys Gln Val Leu Ser Asp Arg 725 730 735 Glu Ser Leu Ser Phe Tyr Gly Glu Gly Tyr Thr Ser Asp Glu Glu Val 740 745 750 Leu Glu Val Phe Arg Asn Thr Leu Asn Lys Asn Ser Glu Ile Phe Ser 755 760 765 Ser Ile Lys Lys Leu Glu Lys Leu Phe Lys Asn Phe Asp Glu Tyr Ser 770 775 780 Ser Ala Gly Ile Phe Val Lys Asn Gly Pro Ala Ile Ser Thr Ile Ser 785 790 795 800 Lys Asp Ile Phe Gly Glu Trp Asn Val Ile Arg Asp Lys Trp Asn Ala 805 810 815 Glu Tyr Asp Asp Ile His Leu Lys Lys Lys Ala Val Val Thr Glu Lys 820 825 830 Tyr Glu Asp Asp Arg Arg Lys Ser Phe Lys Lys Ile Gly Ser Phe Ser 835 840 845 Leu Glu Gln Leu Gln Glu Tyr Ala Asp Ala Asp Leu Ser Val Val Glu 850 855 860 Lys Leu Lys Glu Ile Ile Ile Gln Lys Val Asp Glu Ile Tyr Lys Val 865 870 875 880 Tyr Gly Ser Ser Glu Lys Leu Phe Asp Ala Asp Phe Val Leu Glu Lys 885 890 895 Ser Leu Lys Lys Asn Asp Ala Val Val Ala Ile Met Lys Asp Leu Leu 900 905 910 Asp Ser Val Lys Ser Phe Glu Asn Tyr Ile Lys Ala Phe Phe Gly Glu 915 920 925 Gly Lys Glu Thr Asn Arg Asp Glu Ser Phe Tyr Gly Asp Phe Val Leu 930 935 940 Ala Tyr Asp Ile Leu Leu Lys Val Asp His Ile Tyr Asp Ala Ile Arg 945 950 955 960 Asn Tyr Val Thr Gln Lys Pro Tyr Ser Lys Asp Lys Phe Lys Leu Tyr 965 970 975 Phe Gln Asn Pro Gln Phe Met Gly Gly Trp Asp Lys Asp Lys Glu Thr 980 985 990 Asp Tyr Arg Ala Thr Ile Leu Arg Tyr Gly Ser Lys Tyr Tyr Leu Ala 995 1000 1005 Ile Met Asp Lys Lys Tyr Ala Lys Cys Leu Gln Lys Ile Asp Lys 1010 1015 1020 Asp Asp Val Asn Gly Asn Tyr Glu Lys Ile Asn Tyr Lys Leu Leu 1025 1030 1035 Pro Gly Pro Asn Lys Met Leu Pro Lys Val Phe Phe Ser Lys Lys 1040 1045 1050 Trp Met Ala Tyr Tyr Asn Pro Ser Glu Asp Ile Gln Lys Ile Tyr 1055 1060 1065 Lys Asn Gly Thr Phe Lys Lys Gly Asp Met Phe Asn Leu Asn Asp 1070 1075 1080 Cys His Lys Leu Ile Asp Phe Phe Lys Asp Ser Ile Ser Arg Tyr 1085 1090 1095 Pro Lys Trp Ser Asn Ala Tyr Asp Phe Asn Phe Ser Glu Thr Glu 1100 1105 1110 Lys Tyr Lys Asp Ile Ala Gly Phe Tyr Arg Glu Val Glu Glu Gln 1115 1120 1125 Gly Tyr Lys Val Ser Phe Glu Ser Ala Ser Lys Lys Glu Val Asp 1130 1135 1140 Lys Leu Val Glu Glu Gly Lys Leu Tyr Met Phe Gln Ile Tyr Asn 1145 1150 1155 Lys Asp Phe Ser Asp Lys Ser His Gly Thr Pro Asn Leu His Thr 1160 1165 1170 Met Tyr Phe Lys Leu Leu Phe Asp Glu Asn Asn His Gly Gln Ile 1175 1180 1185 Arg Leu Ser Gly Gly Ala Glu Leu Phe Met Arg Arg Ala Ser Leu 1190 1195 1200 Lys Lys Glu Glu Leu Val Val His Pro Ala Asn Ser Pro Ile Ala 1205 1210 1215 Asn Lys Asn Pro Asp Asn Pro Lys Lys Thr Thr Thr Leu Ser Tyr 1220 1225 1230 Asp Val Tyr Lys Asp Lys Arg Phe Ser Glu Asp Gln Tyr Glu Leu 1235 1240 1245 His Ile Pro Ile Ala Ile Asn Lys Cys Pro Lys Asn Ile Phe Lys 1250 1255 1260 Ile Asn Thr Glu Val Arg Val Leu Leu Lys His Asp Asp Asn Pro 1265 1270 1275 Tyr Val Ile Gly Ile Ala Arg Gly Glu Arg Asn Leu Leu Tyr Ile 1280 1285 1290 Val Val Val Asp Gly Lys Gly Asn Ile Val Glu Gln Tyr Ser Leu 1295 1300 1305 Asn Glu Ile Ile Asn Asn Phe Asn Gly Ile Arg Ile Lys Thr Asp 1310 1315 1320 Tyr His Ser Leu Leu Asp Lys Lys Glu Lys Glu Arg Phe Glu Ala 1325 1330 1335 Arg Gln Asn Trp Thr Ser Ile Glu Asn Ile Lys Glu Leu Lys Ala 1340 1345 1350 Gly Tyr Ile Ser Gln Val Val His Lys Ile Cys Glu Leu Val Glu 1355 1360 1365 Lys Tyr Asp Ala Val Ile Ala Leu Ala Asp Leu Asn Ser Gly Phe 1370 1375 1380 Lys Asn Ser Arg Val Lys Val Glu Lys Gln Val Tyr Gln Lys Phe 1385 1390 1395 Glu Lys Met Leu Ile Asp Lys Leu Asn Tyr Met Val Asp Lys Lys 1400 1405 1410 Ser Asn Pro Cys Ala Thr Gly Gly Ala Leu Lys Gly Tyr Gln Ile 1415 1420 1425 Thr Asn Lys Phe Glu Ser Phe Lys Ser Met Ser Thr Gln Asn Gly 1430 1435 1440 Phe Ile Phe Tyr Ile Pro Ala Trp Leu Thr Ser Lys Ile Asp Pro 1445 1450 1455 Ser Thr Gly Phe Val Asn Leu Leu Lys Thr Lys Tyr Thr Ser Ile 1460 1465 1470 Ala Asp Ser Lys Lys Phe Ile Ser Ser Phe Asp Arg Ile Met Tyr 1475 1480 1485 Val Pro Glu Glu Asp Leu Phe Glu Phe Ala Leu Asp Tyr Lys Asn 1490 1495 1500 Phe Ser Arg Thr Asp Ala Asp Tyr Ile Lys Lys Trp Lys Leu Tyr 1505 1510 1515 Ser Tyr Gly Asn Arg Ile Arg Ile Phe Arg Asn Pro Lys Lys Asn 1520 1525 1530 Asn Val Phe Asp Trp Glu Glu Val Cys Leu Thr Ser Ala Tyr Lys 1535 1540 1545 Glu Leu Phe Asn Lys Tyr Gly Ile Asn Tyr Gln Gln Gly Asp Ile 1550 1555 1560 Arg Ala Leu Leu Cys Glu Gln Ser Asp Lys Ala Phe Tyr Ser Ser 1565 1570 1575 Phe Met Ala Leu Met Ser Leu Met Leu Gln Met Arg Asn Ser Ile 1580 1585 1590 Thr Gly Arg Thr Asp Val Ala Phe Leu Ile Ser Pro Val Lys Asn 1595 1600 1605 Ser Asp Gly Ile Phe Tyr Asp Ser Arg Asn Tyr Glu Ala Gln Glu 1610 1615 1620 Asn Ala Ile Leu Pro Lys Asn Ala Asp Ala Asn Gly Ala Tyr Asn 1625 1630 1635 Ile Ala Arg Lys Val Leu Trp Ala Ile Gly Gln Phe Lys Lys Ala 1640 1645 1650 Glu Asp Glu Lys Leu Asp Lys Val Lys Ile Ala Ile Ser Asn Lys 1655 1660 1665 Glu Trp Leu Glu Tyr Ala Gln Thr Ser Val Lys His Gly Ser Pro 1670 1675 1680 Lys Lys Lys Arg Lys Val 1685 <210> 82 <211> 4936 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 82 atgccgaaga agaagcgcaa ggtcatgacc gacgcggagt atgtgcgcat ccacgagaag 60 ctcgacatct acaccttcaa gaagcagttc ttcaacaaca agaagagcgt ctcccacagg 120 tgctacgtgc tcttcgagct gaagaggcgc ggcgagcgca gggcctgctt ctggggctac 180 gccgtgaaca agccgcagag cggcaccgag cgcggcatcc acgccgagat cttcagcatc 240 cgcaaggtgg aggagtacct cagggacaac ccgggccagt tcaccatcaa ctggtacagc 300 tcctggagcc cggtaagttt ctgcttctac ctttgatata tatataataa ttatcattaa 360 ttagtagtaa tataatattt caaatatttt tttcaaaata aaagaatgta gtatatagca 420 attgcttttc tgtagtttat aagtgtgtat attttaattt ataacttttc taatatatga 480 ccaaaatttg ttgatgtgca gtgcgcggac tgcgccgaga agatcctgga gtggtacaac 540 caggagctga ggggcaacgg ccacaccctg aagatctggg cctgcaagct ctactacgag 600 aagaacgcga ggaaccagat cggcctgtgg aacctccgcg acaacggcgt cggcctcaac 660 gtgatggtct ccgagcacta ccagtgctgc cgcaagatct tcatccagtc cagccacaac 720 cagctcaacg agaacaggtg gctggagaag accctgaaga gggccgagaa gcgcaggtcc 780 gagctcagca tcatgatcca ggtgaagatc ctccacacca cgaagtcccc cgccgtgggg 840 gggcgggggc tcaggcgggg gcgggagcgg cggcgggggc tctgggggcg gcggcagcgg 900 cgggggcggc agcgggggcg gcgggtcgat gagcaagctg gagaagttca cgaactgcta 960 ctccctcagc aagaccctga ggttcaaggc gatcccggtc ggcaagaccc aggagaacat 1020 cgacaacaag cggctgctgg tggaggacga gaagagggct gaggactaca agggcgtgaa 1080 gaagctcctg gaccgctact acctgtcctt catcaacgac gtgctccaca gcatcaagct 1140 caagaacctg aacaactaca tcagcctctt caggaagaag acgcgcaccg agaaggagaa 1200 caaggagctc gagaacctgg agatcaacct gaggaaggag atcgccaagg cgttcaaggg 1260 caacgagggc tacaagtccc tcttcaagaa ggacatcatc gagacgatcc tcccggagtt 1320 cctggacgac aaggacgaga tcgccctggt caactccttc aacggcttca ccacggcgtt 1380 caccggcttc ttcgacaacc gcgagaacat gttcagcgag gaggccaagt ccacgagcat 1440 cgcgttcagg tgcatcaacg agaacctcac ccgctacatc tccaacatgg acatcttcga 1500 gaaggtcgac gcgatcttcg acaagcacga ggtgcaggag atcaaggaga agatcctgaa 1560 cagcgactac gacgtcgagg acttcttcga gggcgagttc ttcaacttcg tcctcacgca 1620 ggagggcatc gacgtgtaca acgccatcat cggtggcttc gtgaccgagt ccggcgagaa 1680 gatcaagggc ctgaacgagt acatcaacct ctacaaccag aagaccaagc agaagctgcc 1740 gaagttcaag cccctgtaca agcaggtgct ctccgacagg gagtccctca gcttctacgg 1800 cgagggctac acgagcgacg aggaggtcct ggaggtgttc cgcaacaccc tcaacaagaa 1860 cagcgagatc ttctccagca tcaagaagct cgagaagctg ttcaagaact tcgacgagta 1920 ctccagcgcc ggcatcttcg tcaagaacgg cccggcgatc tccacgatca gcaaggacat 1980 cttcggcgag tggaacgtga tccgcgacaa gtggaacgcc gagtacgacg acatccacct 2040 caagaagaag gcggtggtca ccgagaagta cgaggacgac aggcgcaagt ccttcaagaa 2100 gatcggctcc ttcagcctcg agcagctgca ggagtacgcc gacgcggacc tgagcgtggt 2160 cgagaagctc aaggagatca tcatccagaa ggtcgacgag atctacaagg tgtacggctc 2220 cagcgagaag ctcttcgacg cggacttcgt cctcgagaag tccctgaaga agaacgacgc 2280 cgtggtcgcg atcatgaagg acctcctgga ctccgtgaag agcttcgaga attacatcaa 2340 ggccttcttc ggcgagggca aggagacgaa cagggacgag tccttctacg gcgacttcgt 2400 cctggcctac gacatcctcc tgaaggtgga ccacatctac gacgcgatcc gcaactacgt 2460 gacccagaag ccgtacagca aggacaagtt caagctctac ttccagaacc cccagttcat 2520 gggcggctgg gacaaggaca aggagacgga ctacagggcg accatcctgc gctacggcag 2580 caagtactac ctcgccatca tggacaagaa gtacgcgaag tgcctgcaga agatcgacaa 2640 ggacgacgtc aacggcaact acgagaagat caactacaag ctcctgccgg gccccaacaa 2700 gatgctcccg aaggtgttct tctccaagaa gtggatggcc tactacaacc ccagcgagga 2760 catccagaag atctacaaga acggcacgtt caagaagggc gacatgttca acctgaacga 2820 ctgccacaag ctcatcgact tcttcaagga ctccatcagc cgctacccga agtggtccaa 2880 cgcctacgac ttcaacttca gcgagaccga gaagtacaag gacatcgcgg gcttctaccg 2940 cgaggtcgag gagcagggct acaaggtgtc cttcgagtcc gccagcaaga aggaggtcga 3000 caagctggtg gaggagggca agctctacat gttccagatc tacaacaagg acttctccga 3060 caagagccac ggcacgccca acctgcacac catgtacttc aagctcctgt tcgacgagaa 3120 caaccacggc cagatcaggc tgtccggcgg cgccgagctc ttcatgagga gggcgagcct 3180 gaagaaggag gagctggtgg tccaccccgc taacagccca atcgcgaaca agaacccgga 3240 caaccccaag aagaccacga ccctgtccta cgacgtgtac aaggacaaga ggttcagcga 3300 ggaccagtac gagctccaca tcccgatcgc gatcaacaag tgccccaaga acatcttcaa 3360 gatcaacacc gaggtccgcg tgctcctgaa gcacgacgac aacccctacg tgatcggcat 3420 cgctaggggc gagaggaacc tcctgtacat cgtggtcgtg gacggcaagg gcaacatcgt 3480 ggagcagtac tccctcaacg agatcatcaa caacttcaac ggcatcagga tcaagacgga 3540 ctaccacagc ctcctggaca agaaggagaa ggagaggttc gaggcccgcc agaactggac 3600 ctccatcgag aacatcaagg agctgaaggc gggctacatc agccaggtcg tgcacaagat 3660 ctgcgagctc gtcgagaagt acgacgccgt gatcgccctc gcggacctga actccggctt 3720 caagaacagc cgcgtcaagg tggagaagca ggtctaccag aagttcgaga agatgctcat 3780 cgacaagctg aactacatgg tggacaagaa gtccaacccc tgcgctacgg gcggcgcgct 3840 gaagggctac cagatcacca acaagttcga gagcttcaag tccatgagca ctcagaacgg 3900 cttcatcttc tacatcccgg cgtggctcac gtccaagatc gaccccagca ccggcttcgt 3960 caacctcctg aagacgaagt acacctccat cgccgacagc aagaagttca tctccagctt 4020 cgaccgcatc atgtatgtgc cggaggagga cctgttcgag ttcgccctcg actacaagaa 4080 cttctcccgc acggacgcgg actacatcaa gaagtggaag ctgtacagct acggcaaccg 4140 catccgcatc ttcaggaacc ccaagaagaa caacgtcttc gactgggagg aggtgtgcct 4200 gacctccgcg tacaaggagc tcttcaacaa gtacggcatc aactaccagc agggcgacat 4260 cagggctctc ctgtgcgagc agagcgacaa ggccttctac tccagcttca tggcgctgat 4320 gtccctcatg ctgcagatga ggaactcgat caccggcagg acggacgtgg ccttcctcat 4380 ctccccggtg aagaacagcg acggcatctt ctacgactcc aggaactacg aggcccagga 4440 gaacgcgatc ctcccaaaga acgcggacgc caacggcgcc tacaacatcg ccaggaaggt 4500 cctctgggct atcggccagt tcaagaaggc ggaggacgag aagctggaca aggtgaagat 4560 cgccatcagc aacaaggagt ggctcgagta cgcccagacc tcggtcaagc acggcagccc 4620 gaagaagaag cgcaaggtgt ccggcggcag cacgaacctg tccgacatca tcgagaagga 4680 gaccggcaag cagctcgtga tccaggagag catcctcatg ctgccggagg aggtcgagga 4740 ggtcatcggc aacaagcccg agtccgacat cctcgtccac acggcctacg acgagtccac 4800 cgacgagaac gtgatgctcc tgacctcgga cgctcccgag tacaagccat gggccctggt 4860 catccaggac agcaacggcg agaacaagat caagatgctc tccggcggca gcccgaagaa 4920 gaagcgcaaa gtgtga 4936 <210> 83 <211> 1636 <212> PRT <213> Artificial Sequence <220> <223> Fusion protein <400> 83 Met Pro Lys Lys Lys Arg Lys Val Met Thr Asp Ala Glu Tyr Val Arg 1 5 10 15 Ile His Glu Lys Leu Asp Ile Tyr Thr Phe Lys Lys Gln Phe Phe Asn 20 25 30 Asn Lys Lys Ser Val Ser His Arg Cys Tyr Val Leu Phe Glu Leu Lys 35 40 45 Arg Arg Gly Glu Arg Arg Ala Cys Phe Trp Gly Tyr Ala Val Asn Lys 50 55 60 Pro Gln Ser Gly Thr Glu Arg Gly Ile His Ala Glu Ile Phe Ser Ile 65 70 75 80 Arg Lys Val Glu Glu Tyr Leu Arg Asp Asn Pro Gly Gln Phe Thr Ile 85 90 95 Asn Trp Tyr Ser Ser Trp Ser Pro Val Ser Phe Cys Phe Tyr Leu Tyr 100 105 110 Ile Tyr Asn Asn Tyr His Leu Val Val Ile Tyr Phe Lys Tyr Phe Phe 115 120 125 Gln Asn Lys Arg Met Tyr Ile Ala Ile Ala Phe Leu Phe Ile Ser Val 130 135 140 Tyr Ile Leu Ile Tyr Asn Phe Ser Asn Ile Pro Lys Phe Val Asp Val 145 150 155 160 Gln Cys Ala Asp Cys Ala Glu Lys Ile Leu Glu Trp Tyr Asn Gln Glu 165 170 175 Leu Arg Gly Asn Gly His Thr Leu Lys Ile Trp Ala Cys Lys Leu Tyr 180 185 190 Tyr Glu Lys Asn Ala Arg Asn Gln Ile Gly Leu Trp Asn Leu Arg Asp 195 200 205 Asn Gly Val Gly Leu Asn Val Met Val Ser Glu His Tyr Gln Cys Cys 210 215 220 Arg Lys Ile Phe Ile Gln Ser Ser His Asn Gln Leu Asn Glu Asn Arg 225 230 235 240 Trp Leu Glu Lys Thr Leu Lys Arg Ala Glu Lys Arg Arg Ser Glu Leu 245 250 255 Ser Ile Met Ile Gln Val Lys Ile Leu His Thr Thr Lys Ser Pro Ala 260 265 270 Val Gly Gly Arg Gly Leu Arg Arg Gly Arg Glu Arg Arg Arg Gly Leu 275 280 285 Trp Gly Arg Arg Gln Arg Arg Gly Arg Gln Arg Gly Arg Arg Val Asp 290 295 300 Glu Gln Ala Gly Glu Val His Glu Leu Leu Leu Pro Gln Gln Asp Pro 305 310 315 320 Glu Val Gln Gly Asp Pro Gly Arg Gln Asp Pro Gly Glu His Arg Gln 325 330 335 Gln Ala Ala Ala Gly Gly Gly Arg Glu Glu Gly Gly Leu Gln Gly Arg 340 345 350 Glu Glu Ala Pro Gly Pro Leu Leu Pro Val Leu His Gln Arg Arg Ala 355 360 365 Pro Gln His Gln Ala Gln Glu Pro Glu Gln Leu His Gln Pro Leu Gln 370 375 380 Glu Glu Asp Ala His Arg Glu Gly Glu Gln Gly Ala Arg Glu Pro Gly 385 390 395 400 Asp Gln Pro Glu Glu Gly Asp Arg Gln Gly Val Gln Gly Gln Arg Gly 405 410 415 Leu Gln Val Pro Leu Gln Glu Gly His His Arg Asp Asp Pro Pro Gly 420 425 430 Val Pro Gly Arg Gln Gly Arg Asp Arg Pro Gly Gln Leu Leu Gln Arg 435 440 445 Leu His His Gly Val His Arg Leu Leu Arg Gln Pro Arg Glu His Val 450 455 460 Gln Arg Gly Gly Gln Val His Glu His Arg Val Gln Val His Gln Arg 465 470 475 480 Glu Pro His Pro Leu His Leu Gln His Gly His Leu Arg Glu Gly Arg 485 490 495 Arg Asp Leu Arg Gln Ala Arg Gly Ala Gly Asp Gln Gly Glu Asp Pro 500 505 510 Glu Gln Arg Leu Arg Arg Arg Gly Leu Leu Arg Gly Arg Val Leu Gln 515 520 525 Leu Arg Pro His Ala Gly Gly His Arg Arg Val Gln Arg His His Arg 530 535 540 Trp Leu Arg Asp Arg Val Arg Arg Glu Asp Gln Gly Pro Glu Arg Val 545 550 555 560 His Gln Pro Leu Gln Pro Glu Asp Gln Ala Glu Ala Ala Glu Val Gln 565 570 575 Ala Pro Val Gln Ala Gly Ala Leu Arg Gln Gly Val Pro Gln Leu Leu 580 585 590 Arg Arg Gly Leu His Glu Arg Arg Gly Gly Pro Gly Gly Val Pro Gln 595 600 605 His Pro Gln Gln Glu Gln Arg Asp Leu Leu Gln His Gln Glu Ala Arg 610 615 620 Glu Ala Val Gln Glu Leu Arg Arg Val Leu Gln Arg Arg His Leu Arg 625 630 635 640 Gln Glu Arg Pro Gly Asp Leu His Asp Gln Gln Gly His Leu Arg Arg 645 650 655 Val Glu Arg Asp Pro Arg Gln Val Glu Arg Arg Val Arg Arg His Pro 660 665 670 Pro Gln Glu Glu Gly Gly Gly His Arg Glu Val Arg Gly Arg Gln Ala 675 680 685 Gln Val Leu Gln Glu Asp Arg Leu Leu Gln Pro Arg Ala Ala Ala Gly 690 695 700 Val Arg Arg Arg Gly Pro Glu Arg Gly Arg Glu Ala Gln Gly Asp His 705 710 715 720 His Pro Glu Gly Arg Arg Asp Leu Gln Gly Val Arg Leu Gln Arg Glu 725 730 735 Ala Leu Arg Arg Gly Leu Arg Pro Arg Glu Val Pro Glu Glu Glu Arg 740 745 750 Arg Arg Gly Arg Asp His Glu Gly Pro Pro Gly Leu Arg Glu Glu Leu 755 760 765 Arg Glu Leu His Gln Gly Leu Leu Arg Arg Gly Gln Gly Asp Glu Gln 770 775 780 Gly Arg Val Leu Leu Arg Arg Leu Arg Pro Gly Leu Arg His Pro Pro 785 790 795 800 Glu Gly Gly Pro His Leu Arg Arg Asp Pro Gln Leu Arg Asp Pro Glu 805 810 815 Ala Val Gln Gln Gly Gln Val Gln Ala Leu Leu Pro Glu Pro Pro Val 820 825 830 His Gly Arg Leu Gly Gln Gly Gln Gly Asp Gly Leu Gln Gly Asp His 835 840 845 Pro Ala Leu Arg Gln Gln Val Leu Pro Arg His His Gly Gln Glu Val 850 855 860 Arg Glu Val Pro Ala Glu Asp Arg Gln Gly Arg Arg Gln Arg Gln Leu 865 870 875 880 Arg Glu Asp Gln Leu Gln Ala Pro Ala Gly Pro Gln Gln Asp Ala Pro 885 890 895 Glu Gly Val Leu Leu Gln Glu Val Asp Gly Leu Leu Gln Pro Gln Arg 900 905 910 Gly His Pro Glu Asp Leu Gln Glu Arg His Val Gln Glu Gly Arg His 915 920 925 Val Gln Pro Glu Arg Leu Pro Gln Ala His Arg Leu Leu Gln Gly Leu 930 935 940 His Gln Pro Leu Pro Glu Val Val Gln Arg Leu Arg Leu Gln Leu Gln 945 950 955 960 Arg Asp Arg Glu Val Gln Gly His Arg Gly Leu Leu Pro Arg Gly Arg 965 970 975 Gly Ala Gly Leu Gln Gly Val Leu Arg Val Arg Gln Gln Glu Gly Gly 980 985 990 Arg Gln Ala Gly Gly Gly Gly Gln Ala Leu His Val Pro Asp Leu Gln 995 1000 1005 Gln Gly Leu Leu Arg Gln Glu Pro Arg His Ala Gln Pro Ala His 1010 1015 1020 His Val Leu Gln Ala Pro Val Arg Arg Glu Gln Pro Arg Pro Asp 1025 1030 1035 Gln Ala Val Arg Arg Arg Arg Ala Leu His Glu Glu Gly Glu Pro 1040 1045 1050 Glu Glu Gly Gly Ala Gly Gly Pro Pro Arg Gln Pro Asn Arg Glu 1055 1060 1065 Gln Glu Pro Gly Gln Pro Gln Glu Asp His Asp Pro Val Leu Arg 1070 1075 1080 Arg Val Gln Gly Gln Glu Val Gln Arg Gly Pro Val Arg Ala Pro 1085 1090 1095 His Pro Asp Arg Asp Gln Gln Val Pro Gln Glu His Leu Gln Asp 1100 1105 1110 Gln His Arg Gly Pro Arg Ala Pro Glu Ala Arg Arg Gln Pro Leu 1115 1120 1125 Arg Asp Arg His Arg Gly Arg Glu Glu Pro Pro Val His Arg Gly 1130 1135 1140 Arg Gly Arg Gln Gly Gln His Arg Gly Ala Val Leu Pro Gln Arg 1145 1150 1155 Asp His Gln Gln Leu Gln Arg His Gln Asp Gln Asp Gly Leu Pro 1160 1165 1170 Gln Pro Pro Gly Gln Glu Gly Glu Gly Glu Val Arg Gly Pro Pro 1175 1180 1185 Glu Leu Asp Leu His Arg Glu His Gln Gly Ala Glu Gly Gly Leu 1190 1195 1200 His Gln Pro Gly Arg Ala Gln Asp Leu Arg Ala Arg Arg Glu Val 1205 1210 1215 Arg Arg Arg Asp Arg Pro Arg Gly Pro Glu Leu Arg Leu Gln Glu 1220 1225 1230 Gln Pro Arg Gln Gly Gly Glu Ala Gly Leu Pro Glu Val Arg Glu 1235 1240 1245 Asp Ala His Arg Gln Ala Glu Leu His Gly Gly Gln Glu Val Gln 1250 1255 1260 Pro Leu Arg Tyr Gly Arg Arg Ala Glu Gly Leu Pro Asp His Gln 1265 1270 1275 Gln Val Arg Glu Leu Gln Val His Glu His Ser Glu Arg Leu His 1280 1285 1290 Leu Leu His Pro Gly Val Ala His Val Gln Asp Arg Pro Gln His 1295 1300 1305 Arg Leu Arg Gln Pro Pro Glu Asp Glu Val His Leu His Arg Arg 1310 1315 1320 Gln Gln Glu Val His Leu Gln Leu Arg Pro His His Val Cys Ala 1325 1330 1335 Gly Gly Gly Pro Val Arg Val Arg Pro Arg Leu Gln Glu Leu Leu 1340 1345 1350 Pro His Gly Arg Gly Leu His Gln Glu Val Glu Ala Val Gln Leu 1355 1360 1365 Arg Gln Pro His Pro His Leu Gln Glu Pro Gln Glu Glu Gln Arg 1370 1375 1380 Leu Arg Leu Gly Gly Gly Val Pro Asp Leu Arg Val Gln Gly Ala 1385 1390 1395 Leu Gln Gln Val Arg His Gln Leu Pro Ala Gly Arg His Gln Gly 1400 1405 1410 Ser Pro Val Arg Ala Glu Arg Gln Gly Leu Leu Leu Gln Leu His 1415 1420 1425 Gly Ala Asp Val Pro His Ala Ala Asp Glu Glu Leu Asp His Arg 1430 1435 1440 Gln Asp Gly Arg Gly Leu Pro His Leu Pro Gly Glu Glu Gln Arg 1445 1450 1455 Arg His Leu Leu Arg Leu Gln Glu Leu Arg Gly Pro Gly Glu Arg 1460 1465 1470 Asp Pro Pro Lys Glu Arg Gly Arg Gln Arg Arg Leu Gln His Arg 1475 1480 1485 Gln Glu Gly Pro Leu Gly Tyr Arg Pro Val Gln Glu Gly Gly Gly 1490 1495 1500 Arg Glu Ala Gly Gln Gly Glu Asp Arg His Gln Gln Gln Gly Val 1505 1510 1515 Ala Arg Val Arg Pro Asp Leu Gly Gln Ala Arg Gln Pro Glu Glu 1520 1525 1530 Glu Ala Gln Gly Val Arg Arg Gln His Glu Pro Val Arg His His 1535 1540 1545 Arg Glu Gly Asp Arg Gln Ala Ala Arg Asp Pro Gly Glu His Pro 1550 1555 1560 His Ala Ala Gly Gly Gly Arg Gly Gly His Arg Gln Gln Ala Arg 1565 1570 1575 Val Arg His Pro Arg Pro His Gly Leu Arg Arg Val His Arg Arg 1580 1585 1590 Glu Arg Asp Ala Pro Asp Leu Gly Arg Ser Arg Val Gln Ala Met 1595 1600 1605 Gly Pro Gly His Pro Gly Gln Gln Arg Arg Glu Gln Asp Gln Asp 1610 1615 1620 Ala Leu Arg Arg Gln Pro Glu Glu Glu Ala Gln Ser Val 1625 1630 1635 <210> 84 <211> 6210 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 84 atgtccgagg tggagttcag ccacgagtac tggatgaggc acgctctcac cctggctaag 60 agggcgtggg acgagaggga ggtgccggtg ggcgccgtgc tcgtccacaa caaccgcgtg 120 atcggcgagg gctggaacag gcccatcggc aggcacgacc caaccgctca cgccgagatc 180 atggctctca ggcagggcgg cctggtcatg cagaactaca ggctgatcga cgcgaccctc 240 tacgtgaccc tcgagccctg cgtcatggta agtttctgct tctacctttg atatatatat 300 aataattatc attaattagt agtaatataa tatttcaaat atttttttca aaataaaaga 360 atgtagtata tagcaattgc ttttctgtag tttataagtg tgtatatttt aatttataac 420 ttttctaata tatgaccaaa atttgttgat gtgcagtgcg cgggcgccat gatccactcc 480 aggatcggca gggtggtctt cggcgctagg gacgccaaga cgggcgctgc gggcagcctc 540 atggacgtgc tgcaccaccc cggcatgaac caccgcgtcg agatcaccga gggcatcctc 600 gcggacgagt gcgctgcgct cctgtccgac ttcttcagga tgcgcaggca ggagatcaag 660 gcccagaaga aggcgcagtc cagcaccgac tccggcggct ccagcggcgg ctccagcggc 720 agcgagaccc cgggcacgtc cgagagcgcg acgcccgaga gcagcggcgg ctccagcggc 780 ggctcctcgg aggtcgagtt cagccatgag tactggatga ggcatgccct gactctcgct 840 aagagggcgc gggatgagcg cgaggtgccg gtgggggccg tgctcgtcct gaacaaccgc 900 gtgatcgggg agggctggaa ccgggctatc ggcctccacg acccaacggc ccatgccgag 960 atcatggccc tgaggcaggg cggcctggtc atgcaaaact acaggctcat cgacgccacc 1020 ctctacgtga ccttcgagcc atgcgtgatg tgcgcggggg ccatgatcca ctcgaggatt 1080 gggagggtgg tcttcggcgt gcgcaacgct aagacggggg ccgccggcag cctcatggac 1140 gtcctgcact acccgggcat gaaccacagg gtggagatta ccgagggcat cctggccgat 1200 gagtgcgccg cgctcctgtg ctacttcttc cgcatgccca ggcaggtctt caacgcgcag 1260 aagaaggccc agagctccac tgatgggggc gggggctcag gcgggggcgg gagcggcggc 1320 gggggctctg ggggcggcgg cagcggcggg ggcggcagcg ggggcggcgg gtcgatgagc 1380 aagctggaga agttcacgaa ctgctactcc ctcagcaaga ccctgaggtt caaggcgatc 1440 ccggtcggca agacccagga gaacatcgac aacaagcggc tgctggtgga ggacgagaag 1500 agggctgagg actacaaggg cgtgaagaag ctcctggacc gctactacct gtccttcatc 1560 aacgacgtgc tccacagcat caagctcaag aacctgaaca actacatcag cctcttcagg 1620 aagaagacgc gcaccgagaa ggagaacaag gagctcgaga acctggagat caacctgagg 1680 aaggagatcg ccaaggcgtt caagggcaac gagggctaca agtccctctt caagaaggac 1740 atcatcgaga cgatcctccc ggagttcctg gacgacaagg acgagatcgc cctggtcaac 1800 tccttcaacg gcttcaccac ggcgttcacc ggcttcttcg acaaccgcga gaacatgttc 1860 agcgaggagg ccaagtccac gagcatcgcg ttcaggtgca tcaacgagaa cctcacccgc 1920 tacatctcca acatggacat cttcgagaag gtcgacgcga tcttcgacaa gcacgaggtg 1980 caggagatca aggagaagat cctgaacagc gactacgacg tcgaggactt cttcgagggc 2040 gagttcttca acttcgtcct cacgcaggag ggcatcgacg tgtacaacgc catcatcggt 2100 ggcttcgtga ccgagtccgg cgagaagatc aagggcctga acgagtacat caacctctac 2160 aaccagaaga ccaagcagaa gctgccgaag ttcaagcccc tgtacaagca ggtgctctcc 2220 gacagggagt ccctcagctt ctacggcgag ggctacacga gcgacgagga ggtcctggag 2280 gtgttccgca acaccctcaa caagaacagc gagatcttct ccagcatcaa gaagctcgag 2340 aagctgttca agaacttcga cgagtactcc agcgccggca tcttcgtcaa gaacggcccg 2400 gcgatctcca cgatcagcaa ggacatcttc ggcgagtgga acgtgatccg cgacaagtgg 2460 aacgccgagt acgacgacat ccacctcaag aagaaggcgg tggtcaccga gaagtacgag 2520 gacgacaggc gcaagtcctt caagaagatc ggctccttca gcctcgagca gctgcaggag 2580 tacgccgacg cggacctgag cgtggtcgag aagctcaagg agatcatcat ccagaaggtc 2640 gacgagatct acaaggtgta cggctccagc gagaagctct tcgacgcgga cttcgtcctc 2700 gagaagtccc tgaagaagaa cgacgccgtg gtcgcgatca tgaaggacct cctggactcc 2760 gtgaagagct tcgagaatta catcaaggcc ttcttcggcg agggcaagga gacgaacagg 2820 gacgagtcct tctacggcga cttcgtcctg gcctacgaca tcctcctgaa ggtggaccac 2880 atctacgacg cgatccgcaa ctacgtgacc cagaagccgt acagcaagga caagttcaag 2940 ctctacttcc agaaccccca gttcatgggc ggctgggaca aggacaagga gacggactac 3000 agggcgacca tcctgcgcta cggcagcaag tactacctcg ccatcatgga caagaagtac 3060 gcgaagtgcc tgcagaagat cgacaaggac gacgtcaacg gcaactacga gaagatcaac 3120 tacaagctcc tgccgggccc caacaagatg ctcccgaagg tgttcttctc caagaagtgg 3180 atggcctact acaaccccag cgaggacatc cagaagatct acaagaacgg cacgttcaag 3240 aagggcgaca tgttcaacct gaacgactgc cacaagctca tcgacttctt caaggactcc 3300 atcagccgct acccgaagtg gtccaacgcc tacgacttca acttcagcga gaccgagaag 3360 tacaaggaca tcgcgggctt ctaccgcgag gtcgaggagc agggctacaa ggtgtccttc 3420 gagtccgcca gcaagaagga ggtcgacaag ctggtggagg agggcaagct ctacatgttc 3480 cagatctaca acaaggactt ctccgacaag agccacggca cgcccaacct gcacaccatg 3540 tacttcaagc tcctgttcga cgagaacaac cacggccaga tcaggctgtc cggcggcgcc 3600 gagctcttca tgaggagggc gagcctgaag aaggaggagc tggtggtcca ccccgctaac 3660 agcccaatcg cgaacaagaa cccggacaac cccaagaaga ccacgaccct gtcctacgac 3720 gtgtacaagg acaagaggtt cagcgaggac cagtacgagc tccacatccc gatcgcgatc 3780 aacaagtgcc ccaagaacat cttcaagatc aacaccgagg tccgcgtgct cctgaagcac 3840 gacgacaacc cctacgtgat cggcatcgct aggggcgaga ggaacctcct gtacatcgtg 3900 gtcgtggacg gcaagggcaa catcgtggag cagtactccc tcaacgagat catcaacaac 3960 ttcaacggca tcaggatcaa gacggactac cacagcctcc tggacaagaa ggagaaggag 4020 aggttcgagg cccgccagaa ctggacctcc atcgagaaca tcaaggagct gaaggcgggc 4080 tacatcagcc aggtcgtgca caagatctgc gagctcgtcg agaagtacga cgccgtgatc 4140 gccctcgcgg acctgaactc cggcttcaag aacagccgcg tcaaggtgga gaagcaggtc 4200 taccagaagt tcgagaagat gctcatcgac aagctgaact acatggtgga caagaagtcc 4260 aacccctgcg ctacgggcgg cgcgctgaag ggctaccaga tcaccaacaa gttcgagagc 4320 ttcaagtcca tgagcactca gaacggcttc atcttctaca tcccggcgtg gctcacgtcc 4380 aagatcgacc ccagcaccgg cttcgtcaac ctcctgaaga cgaagtacac ctccatcgcc 4440 gacagcaaga agttcatctc cagcttcgac cgcatcatgt atgtgccgga ggaggacctg 4500 ttcgagttcg ccctcgacta caagaacttc tcccgcacgg acgcggacta catcaagaag 4560 tggaagctgt acagctacgg caaccgcatc cgcatcttca ggaaccccaa gaagaacaac 4620 gtcttcgact gggaggaggt gtgcctgacc tccgcgtaca aggagctctt caacaagtac 4680 ggcatcaact accagcaggg cgacatcagg gctctcctgt gcgagcagag cgacaaggcc 4740 ttctactcca gcttcatggc gctgatgtcc ctcatgctgc agatgaggaa ctcgatcacc 4800 ggcaggacgg acgtggcctt cctcatctcc ccggtgaaga acagcgacgg catcttctac 4860 gactccagga actacgaggc ccaggagaac gcgatcctcc caaagaacgc ggacgccaac 4920 ggcgcctaca acatcgccag gaaggtcctc tgggctatcg gccagttcaa gaaggcggag 4980 gacgagaagc tggacaaggt gaagatcgcc atcagcaaca aggagtggct cgagtacgcc 5040 cagacctcgg tcaagcacgg cagcccgaag aagaagcgca aggtgggcag cgcggagtac 5100 gttcgggctc tgttcgactt caacggcaac gacgaggagg acctcccgtt caagaagggc 5160 gacatcctgc gcatcaggga caagccggag gagcagtggt ggaacgccga ggactccgag 5220 ggcaagaggg gcatgatccc ggtcccctac gtggagaagt acatgaccga cgcggagtat 5280 gtgcgcatcc acgagaagct cgacatctac accttcaaga agcagttctt caacaacaag 5340 aagagcgtct cccacaggtg ctacgtgctc ttcgagctga agaggcgcgg cgagcgcagg 5400 gcctgcttct ggggctacgc cgtgaacaag ccgcagagcg gcaccgagcg cggcatccac 5460 gccgagatct tcagcatccg caaggtggag gagtacctca gggacaaccc gggccagttc 5520 accatcaact ggtacagctc ctggagcccg tgcgcggact gcgccgagaa gatcctggag 5580 tggtacaacc aggagctgag gggcaacggc cacaccctga agatctgggc ctgcaagctc 5640 tactacgaga agaacgcgag gaaccagatc ggcctgtgga acctccgcga caacggcgtc 5700 ggcctcaacg tgatggtctc cgagcactac cagtgctgcc gcaagatctt catccagtcc 5760 agccacaacc agctcaacga gaacaggtgg ctggagaaga ccctgaagag ggccgagaag 5820 cgcaggtccg agctcagcat catgatccag gtgaagatcc tccacaccac gaagtccccc 5880 gccgtgggca gcccgaagaa gaagcgcaag gtgtccggcg gcagcacgaa cctgtccgac 5940 atcatcgaga aggagaccgg caagcagctc gtgatccagg agagcatcct catgctgccg 6000 gaggaggtcg aggaggtcat cggcaacaag cccgagtccg acatcctcgt ccacacggcc 6060 tacgacgagt ccaccgacga gaacgtgatg ctcctgacct cggacgctcc cgagtacaag 6120 ccatgggccc tggtcatcca ggacagcaac ggcgagaaca agatcaagat gctctccggc 6180 ggcagcccga agaagaagcg caaagtgtga 6210 <210> 85 <211> 2063 <212> PRT <213> Artificial Sequence <220> <223> Fusion protein <400> 85 Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu 1 5 10 15 Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala 20 25 30 Val Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro 35 40 45 Ile Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg 50 55 60 Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu 65 70 75 80 Tyr Val Thr Leu Glu Pro Cys Val Met Val Ser Phe Cys Phe Tyr Leu 85 90 95 Tyr Ile Tyr Asn Asn Tyr His Leu Val Val Ile Tyr Phe Lys Tyr Phe 100 105 110 Phe Gln Asn Lys Arg Met Tyr Ile Ala Ile Ala Phe Leu Phe Ile Ser 115 120 125 Val Tyr Ile Leu Ile Tyr Asn Phe Ser Asn Ile Pro Lys Phe Val Asp 130 135 140 Val Gln Cys Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val 145 150 155 160 Phe Gly Ala Arg Asp Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp 165 170 175 Val Leu His His Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly 180 185 190 Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu Ser Asp Phe Phe Arg Met 195 200 205 Arg Arg Gln Glu Ile Lys Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp 210 215 220 Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr 225 230 235 240 Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser 245 250 255 Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr 260 265 270 Leu Ala Lys Arg Ala Arg Asp Glu Arg Glu Val Pro Val Gly Ala Val 275 280 285 Leu Val Leu Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Ala Ile 290 295 300 Gly Leu His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 305 310 315 320 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 325 330 335 Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 340 345 350 Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly Ala 355 360 365 Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His Arg 370 375 380 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu 385 390 395 400 Cys Tyr Phe Phe Arg Met Pro Arg Gln Val Phe Asn Ala Gln Lys Lys 405 410 415 Ala Gln Ser Ser Thr Asp Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser 420 425 430 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly 435 440 445 Gly Gly Gly Ser Met Ser Lys Leu Glu Lys Phe Thr Asn Cys Tyr Ser 450 455 460 Leu Ser Lys Thr Leu Arg Phe Lys Ala Ile Pro Val Gly Lys Thr Gln 465 470 475 480 Glu Asn Ile Asp Asn Lys Arg Leu Leu Val Glu Asp Glu Lys Arg Ala 485 490 495 Glu Asp Tyr Lys Gly Val Lys Lys Leu Leu Asp Arg Tyr Tyr Leu Ser 500 505 510 Phe Ile Asn Asp Val Leu His Ser Ile Lys Leu Lys Asn Leu Asn Asn 515 520 525 Tyr Ile Ser Leu Phe Arg Lys Lys Thr Arg Thr Glu Lys Glu Asn Lys 530 535 540 Glu Leu Glu Asn Leu Glu Ile Asn Leu Arg Lys Glu Ile Ala Lys Ala 545 550 555 560 Phe Lys Gly Asn Glu Gly Tyr Lys Ser Leu Phe Lys Lys Asp Ile Ile 565 570 575 Glu Thr Ile Leu Pro Glu Phe Leu Asp Asp Lys Asp Glu Ile Ala Leu 580 585 590 Val Asn Ser Phe Asn Gly Phe Thr Thr Ala Phe Thr Gly Phe Phe Asp 595 600 605 Asn Arg Glu Asn Met Phe Ser Glu Glu Ala Lys Ser Thr Ser Ile Ala 610 615 620 Phe Arg Cys Ile Asn Glu Asn Leu Thr Arg Tyr Ile Ser Asn Met Asp 625 630 635 640 Ile Phe Glu Lys Val Asp Ala Ile Phe Asp Lys His Glu Val Gln Glu 645 650 655 Ile Lys Glu Lys Ile Leu Asn Ser Asp Tyr Asp Val Glu Asp Phe Phe 660 665 670 Glu Gly Glu Phe Phe Asn Phe Val Leu Thr Gln Glu Gly Ile Asp Val 675 680 685 Tyr Asn Ala Ile Ile Gly Gly Phe Val Thr Glu Ser Gly Glu Lys Ile 690 695 700 Lys Gly Leu Asn Glu Tyr Ile Asn Leu Tyr Asn Gln Lys Thr Lys Gln 705 710 715 720 Lys Leu Pro Lys Phe Lys Pro Leu Tyr Lys Gln Val Leu Ser Asp Arg 725 730 735 Glu Ser Leu Ser Phe Tyr Gly Glu Gly Tyr Thr Ser Asp Glu Glu Val 740 745 750 Leu Glu Val Phe Arg Asn Thr Leu Asn Lys Asn Ser Glu Ile Phe Ser 755 760 765 Ser Ile Lys Lys Leu Glu Lys Leu Phe Lys Asn Phe Asp Glu Tyr Ser 770 775 780 Ser Ala Gly Ile Phe Val Lys Asn Gly Pro Ala Ile Ser Thr Ile Ser 785 790 795 800 Lys Asp Ile Phe Gly Glu Trp Asn Val Ile Arg Asp Lys Trp Asn Ala 805 810 815 Glu Tyr Asp Asp Ile His Leu Lys Lys Lys Ala Val Val Thr Glu Lys 820 825 830 Tyr Glu Asp Asp Arg Arg Lys Ser Phe Lys Lys Ile Gly Ser Phe Ser 835 840 845 Leu Glu Gln Leu Gln Glu Tyr Ala Asp Ala Asp Leu Ser Val Val Glu 850 855 860 Lys Leu Lys Glu Ile Ile Ile Gln Lys Val Asp Glu Ile Tyr Lys Val 865 870 875 880 Tyr Gly Ser Ser Glu Lys Leu Phe Asp Ala Asp Phe Val Leu Glu Lys 885 890 895 Ser Leu Lys Lys Asn Asp Ala Val Val Ala Ile Met Lys Asp Leu Leu 900 905 910 Asp Ser Val Lys Ser Phe Glu Asn Tyr Ile Lys Ala Phe Phe Gly Glu 915 920 925 Gly Lys Glu Thr Asn Arg Asp Glu Ser Phe Tyr Gly Asp Phe Val Leu 930 935 940 Ala Tyr Asp Ile Leu Leu Lys Val Asp His Ile Tyr Asp Ala Ile Arg 945 950 955 960 Asn Tyr Val Thr Gln Lys Pro Tyr Ser Lys Asp Lys Phe Lys Leu Tyr 965 970 975 Phe Gln Asn Pro Gln Phe Met Gly Gly Trp Asp Lys Asp Lys Glu Thr 980 985 990 Asp Tyr Arg Ala Thr Ile Leu Arg Tyr Gly Ser Lys Tyr Tyr Leu Ala 995 1000 1005 Ile Met Asp Lys Lys Tyr Ala Lys Cys Leu Gln Lys Ile Asp Lys 1010 1015 1020 Asp Asp Val Asn Gly Asn Tyr Glu Lys Ile Asn Tyr Lys Leu Leu 1025 1030 1035 Pro Gly Pro Asn Lys Met Leu Pro Lys Val Phe Phe Ser Lys Lys 1040 1045 1050 Trp Met Ala Tyr Tyr Asn Pro Ser Glu Asp Ile Gln Lys Ile Tyr 1055 1060 1065 Lys Asn Gly Thr Phe Lys Lys Gly Asp Met Phe Asn Leu Asn Asp 1070 1075 1080 Cys His Lys Leu Ile Asp Phe Phe Lys Asp Ser Ile Ser Arg Tyr 1085 1090 1095 Pro Lys Trp Ser Asn Ala Tyr Asp Phe Asn Phe Ser Glu Thr Glu 1100 1105 1110 Lys Tyr Lys Asp Ile Ala Gly Phe Tyr Arg Glu Val Glu Glu Gln 1115 1120 1125 Gly Tyr Lys Val Ser Phe Glu Ser Ala Ser Lys Lys Glu Val Asp 1130 1135 1140 Lys Leu Val Glu Glu Gly Lys Leu Tyr Met Phe Gln Ile Tyr Asn 1145 1150 1155 Lys Asp Phe Ser Asp Lys Ser His Gly Thr Pro Asn Leu His Thr 1160 1165 1170 Met Tyr Phe Lys Leu Leu Phe Asp Glu Asn Asn His Gly Gln Ile 1175 1180 1185 Arg Leu Ser Gly Gly Ala Glu Leu Phe Met Arg Arg Ala Ser Leu 1190 1195 1200 Lys Lys Glu Glu Leu Val Val His Pro Ala Asn Ser Pro Ile Ala 1205 1210 1215 Asn Lys Asn Pro Asp Asn Pro Lys Lys Thr Thr Thr Leu Ser Tyr 1220 1225 1230 Asp Val Tyr Lys Asp Lys Arg Phe Ser Glu Asp Gln Tyr Glu Leu 1235 1240 1245 His Ile Pro Ile Ala Ile Asn Lys Cys Pro Lys Asn Ile Phe Lys 1250 1255 1260 Ile Asn Thr Glu Val Arg Val Leu Leu Lys His Asp Asp Asn Pro 1265 1270 1275 Tyr Val Ile Gly Ile Ala Arg Gly Glu Arg Asn Leu Leu Tyr Ile 1280 1285 1290 Val Val Val Asp Gly Lys Gly Asn Ile Val Glu Gln Tyr Ser Leu 1295 1300 1305 Asn Glu Ile Ile Asn Asn Phe Asn Gly Ile Arg Ile Lys Thr Asp 1310 1315 1320 Tyr His Ser Leu Leu Asp Lys Lys Glu Lys Glu Arg Phe Glu Ala 1325 1330 1335 Arg Gln Asn Trp Thr Ser Ile Glu Asn Ile Lys Glu Leu Lys Ala 1340 1345 1350 Gly Tyr Ile Ser Gln Val Val His Lys Ile Cys Glu Leu Val Glu 1355 1360 1365 Lys Tyr Asp Ala Val Ile Ala Leu Ala Asp Leu Asn Ser Gly Phe 1370 1375 1380 Lys Asn Ser Arg Val Lys Val Glu Lys Gln Val Tyr Gln Lys Phe 1385 1390 1395 Glu Lys Met Leu Ile Asp Lys Leu Asn Tyr Met Val Asp Lys Lys 1400 1405 1410 Ser Asn Pro Cys Ala Thr Gly Gly Ala Leu Lys Gly Tyr Gln Ile 1415 1420 1425 Thr Asn Lys Phe Glu Ser Phe Lys Ser Met Ser Thr Gln Asn Gly 1430 1435 1440 Phe Ile Phe Tyr Ile Pro Ala Trp Leu Thr Ser Lys Ile Asp Pro 1445 1450 1455 Ser Thr Gly Phe Val Asn Leu Leu Lys Thr Lys Tyr Thr Ser Ile 1460 1465 1470 Ala Asp Ser Lys Lys Phe Ile Ser Ser Phe Asp Arg Ile Met Tyr 1475 1480 1485 Val Pro Glu Glu Asp Leu Phe Glu Phe Ala Leu Asp Tyr Lys Asn 1490 1495 1500 Phe Ser Arg Thr Asp Ala Asp Tyr Ile Lys Lys Trp Lys Leu Tyr 1505 1510 1515 Ser Tyr Gly Asn Arg Ile Arg Ile Phe Arg Asn Pro Lys Lys Asn 1520 1525 1530 Asn Val Phe Asp Trp Glu Glu Val Cys Leu Thr Ser Ala Tyr Lys 1535 1540 1545 Glu Leu Phe Asn Lys Tyr Gly Ile Asn Tyr Gln Gln Gly Asp Ile 1550 1555 1560 Arg Ala Leu Leu Cys Glu Gln Ser Asp Lys Ala Phe Tyr Ser Ser 1565 1570 1575 Phe Met Ala Leu Met Ser Leu Met Leu Gln Met Arg Asn Ser Ile 1580 1585 1590 Thr Gly Arg Thr Asp Val Ala Phe Leu Ile Ser Pro Val Lys Asn 1595 1600 1605 Ser Asp Gly Ile Phe Tyr Asp Ser Arg Asn Tyr Glu Ala Gln Glu 1610 1615 1620 Asn Ala Ile Leu Pro Lys Asn Ala Asp Ala Asn Gly Ala Tyr Asn 1625 1630 1635 Ile Ala Arg Lys Val Leu Trp Ala Ile Gly Gln Phe Lys Lys Ala 1640 1645 1650 Glu Asp Glu Lys Leu Asp Lys Val Lys Ile Ala Ile Ser Asn Lys 1655 1660 1665 Glu Trp Leu Glu Tyr Ala Gln Thr Ser Val Lys His Gly Ser Pro 1670 1675 1680 Lys Lys Lys Arg Lys Val Gly Ser Ala Glu Tyr Val Arg Ala Leu 1685 1690 1695 Phe Asp Phe Asn Gly Asn Asp Glu Glu Asp Leu Pro Phe Lys Lys 1700 1705 1710 Gly Asp Ile Leu Arg Ile Arg Asp Lys Pro Glu Glu Gln Trp Trp 1715 1720 1725 Asn Ala Glu Asp Ser Glu Gly Lys Arg Gly Met Ile Pro Val Pro 1730 1735 1740 Tyr Val Glu Lys Tyr Met Thr Asp Ala Glu Tyr Val Arg Ile His 1745 1750 1755 Glu Lys Leu Asp Ile Tyr Thr Phe Lys Lys Gln Phe Phe Asn Asn 1760 1765 1770 Lys Lys Ser Val Ser His Arg Cys Tyr Val Leu Phe Glu Leu Lys 1775 1780 1785 Arg Arg Gly Glu Arg Arg Ala Cys Phe Trp Gly Tyr Ala Val Asn 1790 1795 1800 Lys Pro Gln Ser Gly Thr Glu Arg Gly Ile His Ala Glu Ile Phe 1805 1810 1815 Ser Ile Arg Lys Val Glu Glu Tyr Leu Arg Asp Asn Pro Gly Gln 1820 1825 1830 Phe Thr Ile Asn Trp Tyr Ser Ser Trp Ser Pro Cys Ala Asp Cys 1835 1840 1845 Ala Glu Lys Ile Leu Glu Trp Tyr Asn Gln Glu Leu Arg Gly Asn 1850 1855 1860 Gly His Thr Leu Lys Ile Trp Ala Cys Lys Leu Tyr Tyr Glu Lys 1865 1870 1875 Asn Ala Arg Asn Gln Ile Gly Leu Trp Asn Leu Arg Asp Asn Gly 1880 1885 1890 Val Gly Leu Asn Val Met Val Ser Glu His Tyr Gln Cys Cys Arg 1895 1900 1905 Lys Ile Phe Ile Gln Ser Ser His Asn Gln Leu Asn Glu Asn Arg 1910 1915 1920 Trp Leu Glu Lys Thr Leu Lys Arg Ala Glu Lys Arg Arg Ser Glu 1925 1930 1935 Leu Ser Ile Met Ile Gln Val Lys Ile Leu His Thr Thr Lys Ser 1940 1945 1950 Pro Ala Val Gly Ser Pro Lys Lys Lys Arg Lys Val Ser Gly Gly 1955 1960 1965 Ser Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly Lys Gln 1970 1975 1980 Leu Val Ile Gln Glu Ser Ile Leu Met Leu Pro Glu Glu Val Glu 1985 1990 1995 Glu Val Ile Gly Asn Lys Pro Glu Ser Asp Ile Leu Val His Thr 2000 2005 2010 Ala Tyr Asp Glu Ser Thr Asp Glu Asn Val Met Leu Leu Thr Ser 2015 2020 2025 Asp Ala Pro Glu Tyr Lys Pro Trp Ala Leu Val Ile Gln Asp Ser 2030 2035 2040 Asn Gly Glu Asn Lys Ile Lys Met Leu Ser Gly Gly Ser Pro Lys 2045 2050 2055 Lys Lys Arg Lys Val 2060 <210> 86 <211> 6201 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 86 atgccgaaga agaagcgcaa ggtcatgacc gacgcggagt atgtgcgcat ccacgagaag 60 ctcgacatct acaccttcaa gaagcagttc ttcaacaaca agaagagcgt ctcccacagg 120 tgctacgtgc tcttcgagct gaagaggcgc ggcgagcgca gggcctgctt ctggggctac 180 gccgtgaaca agccgcagag cggcaccgag cgcggcatcc acgccgagat cttcagcatc 240 cgcaaggtgg aggagtacct cagggacaac ccgggccagt tcaccatcaa ctggtacagc 300 tcctggagcc cggtaagttt ctgcttctac ctttgatata tatataataa ttatcattaa 360 ttagtagtaa tataatattt caaatatttt tttcaaaata aaagaatgta gtatatagca 420 attgcttttc tgtagtttat aagtgtgtat attttaattt ataacttttc taatatatga 480 ccaaaatttg ttgatgtgca gtgcgcggac tgcgccgaga agatcctgga gtggtacaac 540 caggagctga ggggcaacgg ccacaccctg aagatctggg cctgcaagct ctactacgag 600 aagaacgcga ggaaccagat cggcctgtgg aacctccgcg acaacggcgt cggcctcaac 660 gtgatggtct ccgagcacta ccagtgctgc cgcaagatct tcatccagtc cagccacaac 720 cagctcaacg agaacaggtg gctggagaag accctgaaga gggccgagaa gcgcaggtcc 780 gagctcagca tcatgatcca ggtgaagatc ctccacacca cgaagtcccc cgccgtggcg 840 gagtacgttc gggctctgtt cgacttcaac ggcaacgacg aggaggacct cccgttcaag 900 aagggcgaca tcctgcgcat cagggacaag ccggaggagc agtggtggaa cgccgaggac 960 tccgagggca agaggggcat gatcccggtc ccctacgtgg agaagtacat gtccgaggtg 1020 gagttcagcc acgagtactg gatgaggcac gctctcaccc tggctaagag ggcgtgggac 1080 gagagggagg tgccggtggg cgccgtgctc gtccacaaca accgcgtgat cggcgagggc 1140 tggaacaggc ccatcggcag gcacgaccca accgctcacg ccgagatcat ggctctcagg 1200 cagggcggcc tggtcatgca gaactacagg ctgatcgacg cgaccctcta cgtgaccctc 1260 gagccctgcg tcatgtgcgc gggcgccatg atccactcca ggatcggcag ggtggtcttc 1320 ggcgctaggg acgccaagac gggcgctgcg ggcagcctca tggacgtgct gcaccacccc 1380 ggcatgaacc accgcgtcga gatcaccgag ggcatcctcg cggacgagtg cgctgcgctc 1440 ctgtccgact tcttcaggat gcgcaggcag gagatcaagg cccagaagaa ggcgcagtcc 1500 agcaccgact ccggcggctc cagcggcggc tccagcggca gcgagacccc gggcacgtcc 1560 gagagcgcga cgcccgagag cagcggcggc tccagcggcg gctcctcgga ggtcgagttc 1620 agccatgagt actggatgag gcatgccctg actctcgcta agagggcgcg ggatgagcgc 1680 gaggtgccgg tgggggccgt gctcgtcctg aacaaccgcg tgatcgggga gggctggaac 1740 cgggctatcg gcctccacga cccaacggcc catgccgaga tcatggccct gaggcagggc 1800 ggcctggtca tgcaaaacta caggctcatc gacgccaccc tctacgtgac cttcgagcca 1860 tgcgtgatgt gcgcgggggc catgatccac tcgaggattg ggagggtggt cttcggcgtg 1920 cgcaacgcta agacgggggc cgccggcagc ctcatggacg tcctgcacta cccgggcatg 1980 aaccacaggg tggagattac cgagggcatc ctggccgatg agtgcgccgc gctcctgtgc 2040 tacttcttcc gcatgcccag gcaggtcttc aacgcgcaga agaaggccca gagctccact 2100 gatgggggcg ggggctcagg cgggggcggg agcggcggcg ggggctctgg gggcggcggc 2160 agcggcgggg gcggcagcgg gggcggcggg tcgatgagca agctggagaa gttcacgaac 2220 tgctactccc tcagcaagac cctgaggttc aaggcgatcc cggtcggcaa gacccaggag 2280 aacatcgaca acaagcggct gctggtggag gacgagaaga gggctgagga ctacaagggc 2340 gtgaagaagc tcctggaccg ctactacctg tccttcatca acgacgtgct ccacagcatc 2400 aagctcaaga acctgaacaa ctacatcagc ctcttcagga agaagacgcg caccgagaag 2460 gagaacaagg agctcgagaa cctggagatc aacctgagga aggagatcgc caaggcgttc 2520 aagggcaacg agggctacaa gtccctcttc aagaaggaca tcatcgagac gatcctcccg 2580 gagttcctgg acgacaagga cgagatcgcc ctggtcaact ccttcaacgg cttcaccacg 2640 gcgttcaccg gcttcttcga caaccgcgag aacatgttca gcgaggaggc caagtccacg 2700 agcatcgcgt tcaggtgcat caacgagaac ctcacccgct acatctccaa catggacatc 2760 ttcgagaagg tcgacgcgat cttcgacaag cacgaggtgc aggagatcaa ggagaagatc 2820 ctgaacagcg actacgacgt cgaggacttc ttcgagggcg agttcttcaa cttcgtcctc 2880 acgcaggagg gcatcgacgt gtacaacgcc atcatcggtg gcttcgtgac cgagtccggc 2940 gagaagatca agggcctgaa cgagtacatc aacctctaca accagaagac caagcagaag 3000 ctgccgaagt tcaagcccct gtacaagcag gtgctctccg acagggagtc cctcagcttc 3060 tacggcgagg gctacacgag cgacgaggag gtcctggagg tgttccgcaa caccctcaac 3120 aagaacagcg agatcttctc cagcatcaag aagctcgaga agctgttcaa gaacttcgac 3180 gagtactcca gcgccggcat cttcgtcaag aacggcccgg cgatctccac gatcagcaag 3240 gacatcttcg gcgagtggaa cgtgatccgc gacaagtgga acgccgagta cgacgacatc 3300 cacctcaaga agaaggcggt ggtcaccgag aagtacgagg acgacaggcg caagtccttc 3360 aagaagatcg gctccttcag cctcgagcag ctgcaggagt acgccgacgc ggacctgagc 3420 gtggtcgaga agctcaagga gatcatcatc cagaaggtcg acgagatcta caaggtgtac 3480 ggctccagcg agaagctctt cgacgcggac ttcgtcctcg agaagtccct gaagaagaac 3540 gacgccgtgg tcgcgatcat gaaggacctc ctggactccg tgaagagctt cgagaattac 3600 atcaaggcct tcttcggcga gggcaaggag acgaacaggg acgagtcctt ctacggcgac 3660 ttcgtcctgg cctacgacat cctcctgaag gtggaccaca tctacgacgc gatccgcaac 3720 tacgtgaccc agaagccgta cagcaaggac aagttcaagc tctacttcca gaacccccag 3780 ttcatgggcg gctgggacaa ggacaaggag acggactaca gggcgaccat cctgcgctac 3840 ggcagcaagt actacctcgc catcatggac aagaagtacg cgaagtgcct gcagaagatc 3900 gacaaggacg acgtcaacgg caactacgag aagatcaact acaagctcct gccgggcccc 3960 aacaagatgc tcccgaaggt gttcttctcc aagaagtgga tggcctacta caaccccagc 4020 gaggacatcc agaagatcta caagaacggc acgttcaaga agggcgacat gttcaacctg 4080 aacgactgcc acaagctcat cgacttcttc aaggactcca tcagccgcta cccgaagtgg 4140 tccaacgcct acgacttcaa cttcagcgag accgagaagt acaaggacat cgcgggcttc 4200 taccgcgagg tcgaggagca gggctacaag gtgtccttcg agtccgccag caagaaggag 4260 gtcgacaagc tggtggagga gggcaagctc tacatgttcc agatctacaa caaggacttc 4320 tccgacaaga gccacggcac gcccaacctg cacaccatgt acttcaagct cctgttcgac 4380 gagaacaacc acggccagat caggctgtcc ggcggcgccg agctcttcat gaggagggcg 4440 agcctgaaga aggaggagct ggtggtccac cccgctaaca gcccaatcgc gaacaagaac 4500 ccggacaacc ccaagaagac cacgaccctg tcctacgacg tgtacaagga caagaggttc 4560 agcgaggacc agtacgagct ccacatcccg atcgcgatca acaagtgccc caagaacatc 4620 ttcaagatca acaccgaggt ccgcgtgctc ctgaagcacg acgacaaccc ctacgtgatc 4680 ggcatcgcta ggggcgagag gaacctcctg tacatcgtgg tcgtggacgg caagggcaac 4740 atcgtggagc agtactccct caacgagatc atcaacaact tcaacggcat caggatcaag 4800 acggactacc acagcctcct ggacaagaag gagaaggaga ggttcgaggc ccgccagaac 4860 tggacctcca tcgagaacat caaggagctg aaggcgggct acatcagcca ggtcgtgcac 4920 aagatctgcg agctcgtcga gaagtacgac gccgtgatcg ccctcgcgga cctgaactcc 4980 ggcttcaaga acagccgcgt caaggtggag aagcaggtct accagaagtt cgagaagatg 5040 ctcatcgaca agctgaacta catggtggac aagaagtcca acccctgcgc tacgggcggc 5100 gcgctgaagg gctaccagat caccaacaag ttcgagagct tcaagtccat gagcactcag 5160 aacggcttca tcttctacat cccggcgtgg ctcacgtcca agatcgaccc cagcaccggc 5220 ttcgtcaacc tcctgaagac gaagtacacc tccatcgccg acagcaagaa gttcatctcc 5280 agcttcgacc gcatcatgta tgtgccggag gaggacctgt tcgagttcgc cctcgactac 5340 aagaacttct cccgcacgga cgcggactac atcaagaagt ggaagctgta cagctacggc 5400 aaccgcatcc gcatcttcag gaaccccaag aagaacaacg tcttcgactg ggaggaggtg 5460 tgcctgacct ccgcgtacaa ggagctcttc aacaagtacg gcatcaacta ccagcagggc 5520 gacatcaggg ctctcctgtg cgagcagagc gacaaggcct tctactccag cttcatggcg 5580 ctgatgtccc tcatgctgca gatgaggaac tcgatcaccg gcaggacgga cgtggccttc 5640 ctcatctccc cggtgaagaa cagcgacggc atcttctacg actccaggaa ctacgaggcc 5700 caggagaacg cgatcctccc aaagaacgcg gacgccaacg gcgcctacaa catcgccagg 5760 aaggtcctct gggctatcgg ccagttcaag aaggcggagg acgagaagct ggacaaggtg 5820 aagatcgcca tcagcaacaa ggagtggctc gagtacgccc agacctcggt caagcacggc 5880 agcccgaaga agaagcgcaa ggtgtccggc ggcagcacga acctgtccga catcatcgag 5940 aaggagaccg gcaagcagct cgtgatccag gagagcatcc tcatgctgcc ggaggaggtc 6000 gaggaggtca tcggcaacaa gcccgagtcc gacatcctcg tccacacggc ctacgacgag 6060 tccaccgacg agaacgtgat gctcctgacc tcggacgctc ccgagtacaa gccatgggcc 6120 ctggtcatcc aggacagcaa cggcgagaac aagatcaaga tgctctccgg cggcagcccg 6180 aagaagaagc gcaaagtgtg a 6201 <210> 87 <211> 2060 <212> PRT <213> Artificial Sequence <220> <223> Fusion protein <400> 87 Met Pro Lys Lys Lys Arg Lys Val Met Thr Asp Ala Glu Tyr Val Arg 1 5 10 15 Ile His Glu Lys Leu Asp Ile Tyr Thr Phe Lys Lys Gln Phe Phe Asn 20 25 30 Asn Lys Lys Ser Val Ser His Arg Cys Tyr Val Leu Phe Glu Leu Lys 35 40 45 Arg Arg Gly Glu Arg Arg Ala Cys Phe Trp Gly Tyr Ala Val Asn Lys 50 55 60 Pro Gln Ser Gly Thr Glu Arg Gly Ile His Ala Glu Ile Phe Ser Ile 65 70 75 80 Arg Lys Val Glu Glu Tyr Leu Arg Asp Asn Pro Gly Gln Phe Thr Ile 85 90 95 Asn Trp Tyr Ser Ser Trp Ser Pro Val Ser Phe Cys Phe Tyr Leu Tyr 100 105 110 Ile Tyr Asn Asn Tyr His Leu Val Val Ile Tyr Phe Lys Tyr Phe Phe 115 120 125 Gln Asn Lys Arg Met Tyr Ile Ala Ile Ala Phe Leu Phe Ile Ser Val 130 135 140 Tyr Ile Leu Ile Tyr Asn Phe Ser Asn Ile Pro Lys Phe Val Asp Val 145 150 155 160 Gln Cys Ala Asp Cys Ala Glu Lys Ile Leu Glu Trp Tyr Asn Gln Glu 165 170 175 Leu Arg Gly Asn Gly His Thr Leu Lys Ile Trp Ala Cys Lys Leu Tyr 180 185 190 Tyr Glu Lys Asn Ala Arg Asn Gln Ile Gly Leu Trp Asn Leu Arg Asp 195 200 205 Asn Gly Val Gly Leu Asn Val Met Val Ser Glu His Tyr Gln Cys Cys 210 215 220 Arg Lys Ile Phe Ile Gln Ser Ser His Asn Gln Leu Asn Glu Asn Arg 225 230 235 240 Trp Leu Glu Lys Thr Leu Lys Arg Ala Glu Lys Arg Arg Ser Glu Leu 245 250 255 Ser Ile Met Ile Gln Val Lys Ile Leu His Thr Thr Lys Ser Pro Ala 260 265 270 Val Ala Glu Tyr Val Arg Ala Leu Phe Asp Phe Asn Gly Asn Asp Glu 275 280 285 Glu Asp Leu Pro Phe Lys Lys Gly Asp Ile Leu Arg Ile Arg Asp Lys 290 295 300 Pro Glu Glu Gln Trp Trp Asn Ala Glu Asp Ser Glu Gly Lys Arg Gly 305 310 315 320 Met Ile Pro Val Pro Tyr Val Glu Lys Tyr Met Ser Glu Val Glu Phe 325 330 335 Ser His Glu Tyr Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala 340 345 350 Trp Asp Glu Arg Glu Val Pro Val Gly Ala Val Leu Val His Asn Asn 355 360 365 Arg Val Ile Gly Glu Gly Trp Asn Arg Pro Ile Gly Arg His Asp Pro 370 375 380 Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met 385 390 395 400 Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr Val Thr Leu Glu Pro 405 410 415 Cys Val Met Cys Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val 420 425 430 Val Phe Gly Ala Arg Asp Ala Lys Thr Gly Ala Ala Gly Ser Leu Met 435 440 445 Asp Val Leu His His Pro Gly Met Asn His Arg Val Glu Ile Thr Glu 450 455 460 Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu Ser Asp Phe Phe Arg 465 470 475 480 Met Arg Arg Gln Glu Ile Lys Ala Gln Lys Lys Ala Gln Ser Ser Thr 485 490 495 Asp Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly 500 505 510 Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly 515 520 525 Ser Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu 530 535 540 Thr Leu Ala Lys Arg Ala Arg Asp Glu Arg Glu Val Pro Val Gly Ala 545 550 555 560 Val Leu Val Leu Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Ala 565 570 575 Ile Gly Leu His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg 580 585 590 Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu 595 600 605 Tyr Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His 610 615 620 Ser Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly 625 630 635 640 Ala Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His 645 650 655 Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu 660 665 670 Leu Cys Tyr Phe Phe Arg Met Pro Arg Gln Val Phe Asn Ala Gln Lys 675 680 685 Lys Ala Gln Ser Ser Thr Asp Gly Gly Gly Gly Ser Gly Gly Gly Gly 690 695 700 Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser 705 710 715 720 Gly Gly Gly Gly Ser Met Ser Lys Leu Glu Lys Phe Thr Asn Cys Tyr 725 730 735 Ser Leu Ser Lys Thr Leu Arg Phe Lys Ala Ile Pro Val Gly Lys Thr 740 745 750 Gln Glu Asn Ile Asp Asn Lys Arg Leu Leu Val Glu Asp Glu Lys Arg 755 760 765 Ala Glu Asp Tyr Lys Gly Val Lys Lys Leu Leu Asp Arg Tyr Tyr Leu 770 775 780 Ser Phe Ile Asn Asp Val Leu His Ser Ile Lys Leu Lys Asn Leu Asn 785 790 795 800 Asn Tyr Ile Ser Leu Phe Arg Lys Lys Thr Arg Thr Glu Lys Glu Asn 805 810 815 Lys Glu Leu Glu Asn Leu Glu Ile Asn Leu Arg Lys Glu Ile Ala Lys 820 825 830 Ala Phe Lys Gly Asn Glu Gly Tyr Lys Ser Leu Phe Lys Lys Asp Ile 835 840 845 Ile Glu Thr Ile Leu Pro Glu Phe Leu Asp Asp Lys Asp Glu Ile Ala 850 855 860 Leu Val Asn Ser Phe Asn Gly Phe Thr Thr Ala Phe Thr Gly Phe Phe 865 870 875 880 Asp Asn Arg Glu Asn Met Phe Ser Glu Glu Ala Lys Ser Thr Ser Ile 885 890 895 Ala Phe Arg Cys Ile Asn Glu Asn Leu Thr Arg Tyr Ile Ser Asn Met 900 905 910 Asp Ile Phe Glu Lys Val Asp Ala Ile Phe Asp Lys His Glu Val Gln 915 920 925 Glu Ile Lys Glu Lys Ile Leu Asn Ser Asp Tyr Asp Val Glu Asp Phe 930 935 940 Phe Glu Gly Glu Phe Phe Asn Phe Val Leu Thr Gln Glu Gly Ile Asp 945 950 955 960 Val Tyr Asn Ala Ile Ile Gly Gly Phe Val Thr Glu Ser Gly Glu Lys 965 970 975 Ile Lys Gly Leu Asn Glu Tyr Ile Asn Leu Tyr Asn Gln Lys Thr Lys 980 985 990 Gln Lys Leu Pro Lys Phe Lys Pro Leu Tyr Lys Gln Val Leu Ser Asp 995 1000 1005 Arg Glu Ser Leu Ser Phe Tyr Gly Glu Gly Tyr Thr Ser Asp Glu 1010 1015 1020 Glu Val Leu Glu Val Phe Arg Asn Thr Leu Asn Lys Asn Ser Glu 1025 1030 1035 Ile Phe Ser Ser Ile Lys Lys Leu Glu Lys Leu Phe Lys Asn Phe 1040 1045 1050 Asp Glu Tyr Ser Ser Ala Gly Ile Phe Val Lys Asn Gly Pro Ala 1055 1060 1065 Ile Ser Thr Ile Ser Lys Asp Ile Phe Gly Glu Trp Asn Val Ile 1070 1075 1080 Arg Asp Lys Trp Asn Ala Glu Tyr Asp Asp Ile His Leu Lys Lys 1085 1090 1095 Lys Ala Val Val Thr Glu Lys Tyr Glu Asp Asp Arg Arg Lys Ser 1100 1105 1110 Phe Lys Lys Ile Gly Ser Phe Ser Leu Glu Gln Leu Gln Glu Tyr 1115 1120 1125 Ala Asp Ala Asp Leu Ser Val Val Glu Lys Leu Lys Glu Ile Ile 1130 1135 1140 Ile Gln Lys Val Asp Glu Ile Tyr Lys Val Tyr Gly Ser Ser Glu 1145 1150 1155 Lys Leu Phe Asp Ala Asp Phe Val Leu Glu Lys Ser Leu Lys Lys 1160 1165 1170 Asn Asp Ala Val Val Ala Ile Met Lys Asp Leu Leu Asp Ser Val 1175 1180 1185 Lys Ser Phe Glu Asn Tyr Ile Lys Ala Phe Phe Gly Glu Gly Lys 1190 1195 1200 Glu Thr Asn Arg Asp Glu Ser Phe Tyr Gly Asp Phe Val Leu Ala 1205 1210 1215 Tyr Asp Ile Leu Leu Lys Val Asp His Ile Tyr Asp Ala Ile Arg 1220 1225 1230 Asn Tyr Val Thr Gln Lys Pro Tyr Ser Lys Asp Lys Phe Lys Leu 1235 1240 1245 Tyr Phe Gln Asn Pro Gln Phe Met Gly Gly Trp Asp Lys Asp Lys 1250 1255 1260 Glu Thr Asp Tyr Arg Ala Thr Ile Leu Arg Tyr Gly Ser Lys Tyr 1265 1270 1275 Tyr Leu Ala Ile Met Asp Lys Lys Tyr Ala Lys Cys Leu Gln Lys 1280 1285 1290 Ile Asp Lys Asp Asp Val Asn Gly Asn Tyr Glu Lys Ile Asn Tyr 1295 1300 1305 Lys Leu Leu Pro Gly Pro Asn Lys Met Leu Pro Lys Val Phe Phe 1310 1315 1320 Ser Lys Lys Trp Met Ala Tyr Tyr Asn Pro Ser Glu Asp Ile Gln 1325 1330 1335 Lys Ile Tyr Lys Asn Gly Thr Phe Lys Lys Gly Asp Met Phe Asn 1340 1345 1350 Leu Asn Asp Cys His Lys Leu Ile Asp Phe Phe Lys Asp Ser Ile 1355 1360 1365 Ser Arg Tyr Pro Lys Trp Ser Asn Ala Tyr Asp Phe Asn Phe Ser 1370 1375 1380 Glu Thr Glu Lys Tyr Lys Asp Ile Ala Gly Phe Tyr Arg Glu Val 1385 1390 1395 Glu Glu Gln Gly Tyr Lys Val Ser Phe Glu Ser Ala Ser Lys Lys 1400 1405 1410 Glu Val Asp Lys Leu Val Glu Glu Gly Lys Leu Tyr Met Phe Gln 1415 1420 1425 Ile Tyr Asn Lys Asp Phe Ser Asp Lys Ser His Gly Thr Pro Asn 1430 1435 1440 Leu His Thr Met Tyr Phe Lys Leu Leu Phe Asp Glu Asn Asn His 1445 1450 1455 Gly Gln Ile Arg Leu Ser Gly Gly Ala Glu Leu Phe Met Arg Arg 1460 1465 1470 Ala Ser Leu Lys Lys Glu Glu Leu Val Val His Pro Ala Asn Ser 1475 1480 1485 Pro Ile Ala Asn Lys Asn Pro Asp Asn Pro Lys Lys Thr Thr Thr 1490 1495 1500 Leu Ser Tyr Asp Val Tyr Lys Asp Lys Arg Phe Ser Glu Asp Gln 1505 1510 1515 Tyr Glu Leu His Ile Pro Ile Ala Ile Asn Lys Cys Pro Lys Asn 1520 1525 1530 Ile Phe Lys Ile Asn Thr Glu Val Arg Val Leu Leu Lys His Asp 1535 1540 1545 Asp Asn Pro Tyr Val Ile Gly Ile Ala Arg Gly Glu Arg Asn Leu 1550 1555 1560 Leu Tyr Ile Val Val Val Asp Gly Lys Gly Asn Ile Val Glu Gln 1565 1570 1575 Tyr Ser Leu Asn Glu Ile Ile Asn Asn Phe Asn Gly Ile Arg Ile 1580 1585 1590 Lys Thr Asp Tyr His Ser Leu Leu Asp Lys Lys Glu Lys Glu Arg 1595 1600 1605 Phe Glu Ala Arg Gln Asn Trp Thr Ser Ile Glu Asn Ile Lys Glu 1610 1615 1620 Leu Lys Ala Gly Tyr Ile Ser Gln Val Val His Lys Ile Cys Glu 1625 1630 1635 Leu Val Glu Lys Tyr Asp Ala Val Ile Ala Leu Ala Asp Leu Asn 1640 1645 1650 Ser Gly Phe Lys Asn Ser Arg Val Lys Val Glu Lys Gln Val Tyr 1655 1660 1665 Gln Lys Phe Glu Lys Met Leu Ile Asp Lys Leu Asn Tyr Met Val 1670 1675 1680 Asp Lys Lys Ser Asn Pro Cys Ala Thr Gly Gly Ala Leu Lys Gly 1685 1690 1695 Tyr Gln Ile Thr Asn Lys Phe Glu Ser Phe Lys Ser Met Ser Thr 1700 1705 1710 Gln Asn Gly Phe Ile Phe Tyr Ile Pro Ala Trp Leu Thr Ser Lys 1715 1720 1725 Ile Asp Pro Ser Thr Gly Phe Val Asn Leu Leu Lys Thr Lys Tyr 1730 1735 1740 Thr Ser Ile Ala Asp Ser Lys Lys Phe Ile Ser Ser Phe Asp Arg 1745 1750 1755 Ile Met Tyr Val Pro Glu Glu Asp Leu Phe Glu Phe Ala Leu Asp 1760 1765 1770 Tyr Lys Asn Phe Ser Arg Thr Asp Ala Asp Tyr Ile Lys Lys Trp 1775 1780 1785 Lys Leu Tyr Ser Tyr Gly Asn Arg Ile Arg Ile Phe Arg Asn Pro 1790 1795 1800 Lys Lys Asn Asn Val Phe Asp Trp Glu Glu Val Cys Leu Thr Ser 1805 1810 1815 Ala Tyr Lys Glu Leu Phe Asn Lys Tyr Gly Ile Asn Tyr Gln Gln 1820 1825 1830 Gly Asp Ile Arg Ala Leu Leu Cys Glu Gln Ser Asp Lys Ala Phe 1835 1840 1845 Tyr Ser Ser Phe Met Ala Leu Met Ser Leu Met Leu Gln Met Arg 1850 1855 1860 Asn Ser Ile Thr Gly Arg Thr Asp Val Ala Phe Leu Ile Ser Pro 1865 1870 1875 Val Lys Asn Ser Asp Gly Ile Phe Tyr Asp Ser Arg Asn Tyr Glu 1880 1885 1890 Ala Gln Glu Asn Ala Ile Leu Pro Lys Asn Ala Asp Ala Asn Gly 1895 1900 1905 Ala Tyr Asn Ile Ala Arg Lys Val Leu Trp Ala Ile Gly Gln Phe 1910 1915 1920 Lys Lys Ala Glu Asp Glu Lys Leu Asp Lys Val Lys Ile Ala Ile 1925 1930 1935 Ser Asn Lys Glu Trp Leu Glu Tyr Ala Gln Thr Ser Val Lys His 1940 1945 1950 Gly Ser Pro Lys Lys Lys Arg Lys Val Ser Gly Gly Ser Thr Asn 1955 1960 1965 Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly Lys Gln Leu Val Ile 1970 1975 1980 Gln Glu Ser Ile Leu Met Leu Pro Glu Glu Val Glu Glu Val Ile 1985 1990 1995 Gly Asn Lys Pro Glu Ser Asp Ile Leu Val His Thr Ala Tyr Asp 2000 2005 2010 Glu Ser Thr Asp Glu Asn Val Met Leu Leu Thr Ser Asp Ala Pro 2015 2020 2025 Glu Tyr Lys Pro Trp Ala Leu Val Ile Gln Asp Ser Asn Gly Glu 2030 2035 2040 Asn Lys Ile Lys Met Leu Ser Gly Gly Ser Pro Lys Lys Lys Arg 2045 2050 2055 Lys Val 2060 <210> 88 <211> 6183 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 88 atgtccgagg tggagttcag ccacgagtac tggatgaggc acgctctcac cctggctaag 60 agggcgtggg acgagaggga ggtgccggtg ggcgccgtgc tcgtccacaa caaccgcgtg 120 atcggcgagg gctggaacag gcccatcggc aggcacgacc caaccgctca cgccgagatc 180 atggctctca ggcagggcgg cctggtcatg cagaactaca ggctgatcga cgcgaccctc 240 tacgtgaccc tcgagccctg cgtcatggta agtttctgct tctacctttg atatatatat 300 aataattatc attaattagt agtaatataa tatttcaaat atttttttca aaataaaaga 360 atgtagtata tagcaattgc ttttctgtag tttataagtg tgtatatttt aatttataac 420 ttttctaata tatgaccaaa atttgttgat gtgcagtgcg cgggcgccat gatccactcc 480 aggatcggca gggtggtctt cggcgctagg gacgccaaga cgggcgctgc gggcagcctc 540 atggacgtgc tgcaccaccc cggcatgaac caccgcgtcg agatcaccga gggcatcctc 600 gcggacgagt gcgctgcgct cctgtccgac ttcttcagga tgcgcaggca ggagatcaag 660 gcccagaaga aggcgcagtc cagcaccgac tccggcggct ccagcggcgg ctccagcggc 720 agcgagaccc cgggcacgtc cgagagcgcg acgcccgaga gcagcggcgg ctccagcggc 780 ggctcctcgg aggtcgagtt cagccatgag tactggatga ggcatgccct gactctcgct 840 aagagggcgc gggatgagcg cgaggtgccg gtgggggccg tgctcgtcct gaacaaccgc 900 gtgatcgggg agggctggaa ccgggctatc ggcctccacg acccaacggc ccatgccgag 960 atcatggccc tgaggcaggg cggcctggtc atgcaaaact acaggctcat cgacgccacc 1020 ctctacgtga ccttcgagcc atgcgtgatg tgcgcggggg ccatgatcca ctcgaggatt 1080 gggagggtgg tcttcggcgt gcgcaacgct aagacggggg ccgccggcag cctcatggac 1140 gtcctgcact acccgggcat gaaccacagg gtggagatta ccgagggcat cctggccgat 1200 gagtgcgccg cgctcctgtg ctacttcttc cgcatgccca ggcaggtctt caacgcgcag 1260 aagaaggccc agagctccac tgatggcagc gcggagtacg ttcgggctct gttcgacttc 1320 aacggcaacg acgaggagga cctcccgttc aagaagggcg acatcctgcg catcagggac 1380 aagccggagg agcagtggtg gaacgccgag gactccgagg gcaagagggg catgatcccg 1440 gtcccctacg tggagaagta catgaccgac gcggagtatg tgcgcatcca cgagaagctc 1500 gacatctaca ccttcaagaa gcagttcttc aacaacaaga agagcgtctc ccacaggtgc 1560 tacgtgctct tcgagctgaa gaggcgcggc gagcgcaggg cctgcttctg gggctacgcc 1620 gtgaacaagc cgcagagcgg caccgagcgc ggcatccacg ccgagatctt cagcatccgc 1680 aaggtggagg agtacctcag ggacaacccg ggccagttca ccatcaactg gtacagctcc 1740 tggagcccgt gcgcggactg cgccgagaag atcctggagt ggtacaacca ggagctgagg 1800 ggcaacggcc acaccctgaa gatctgggcc tgcaagctct actacgagaa gaacgcgagg 1860 aaccagatcg gcctgtggaa cctccgcgac aacggcgtcg gcctcaacgt gatggtctcc 1920 gagcactacc agtgctgccg caagatcttc atccagtcca gccacaacca gctcaacgag 1980 aacaggtggc tggagaagac cctgaagagg gccgagaagc gcaggtccga gctcagcatc 2040 atgatccagg tgaagatcct ccacaccacg aagtcccccg ccgtgggggg cgggggctca 2100 ggcgggggcg ggagcggcgg cgggggctct gggggcggcg gcagcggcgg gggcggcagc 2160 gggggcggcg ggtcgatgag caagctggag aagttcacga actgctactc cctcagcaag 2220 accctgaggt tcaaggcgat cccggtcggc aagacccagg agaacatcga caacaagcgg 2280 ctgctggtgg aggacgagaa gagggctgag gactacaagg gcgtgaagaa gctcctggac 2340 cgctactacc tgtccttcat caacgacgtg ctccacagca tcaagctcaa gaacctgaac 2400 aactacatca gcctcttcag gaagaagacg cgcaccgaga aggagaacaa ggagctcgag 2460 aacctggaga tcaacctgag gaaggagatc gccaaggcgt tcaagggcaa cgagggctac 2520 aagtccctct tcaagaagga catcatcgag acgatcctcc cggagttcct ggacgacaag 2580 gacgagatcg ccctggtcaa ctccttcaac ggcttcacca cggcgttcac cggcttcttc 2640 gacaaccgcg agaacatgtt cagcgaggag gccaagtcca cgagcatcgc gttcaggtgc 2700 atcaacgaga acctcacccg ctacatctcc aacatggaca tcttcgagaa ggtcgacgcg 2760 atcttcgaca agcacgaggt gcaggagatc aaggagaaga tcctgaacag cgactacgac 2820 gtcgaggact tcttcgaggg cgagttcttc aacttcgtcc tcacgcagga gggcatcgac 2880 gtgtacaacg ccatcatcgg tggcttcgtg accgagtccg gcgagaagat caagggcctg 2940 aacgagtaca tcaacctcta caaccagaag accaagcaga agctgccgaa gttcaagccc 3000 ctgtacaagc aggtgctctc cgacagggag tccctcagct tctacggcga gggctacacg 3060 agcgacgagg aggtcctgga ggtgttccgc aacaccctca acaagaacag cgagatcttc 3120 tccagcatca agaagctcga gaagctgttc aagaacttcg acgagtactc cagcgccggc 3180 atcttcgtca agaacggccc ggcgatctcc acgatcagca aggacatctt cggcgagtgg 3240 aacgtgatcc gcgacaagtg gaacgccgag tacgacgaca tccacctcaa gaagaaggcg 3300 gtggtcaccg agaagtacga ggacgacagg cgcaagtcct tcaagaagat cggctccttc 3360 agcctcgagc agctgcagga gtacgccgac gcggacctga gcgtggtcga gaagctcaag 3420 gagatcatca tccagaaggt cgacgagatc tacaaggtgt acggctccag cgagaagctc 3480 ttcgacgcgg acttcgtcct cgagaagtcc ctgaagaaga acgacgccgt ggtcgcgatc 3540 atgaaggacc tcctggactc cgtgaagagc ttcgagaatt acatcaaggc cttcttcggc 3600 gagggcaagg agacgaacag ggacgagtcc ttctacggcg acttcgtcct ggcctacgac 3660 atcctcctga aggtggacca catctacgac gcgatccgca actacgtgac ccagaagccg 3720 tacagcaagg acaagttcaa gctctacttc cagaaccccc agttcatggg cggctgggac 3780 aaggacaagg agacggacta cagggcgacc atcctgcgct acggcagcaa gtactacctc 3840 gccatcatgg acaagaagta cgcgaagtgc ctgcagaaga tcgacaagga cgacgtcaac 3900 ggcaactacg agaagatcaa ctacaagctc ctgccgggcc ccaacaagat gctcccgaag 3960 gtgttcttct ccaagaagtg gatggcctac tacaacccca gcgaggacat ccagaagatc 4020 tacaagaacg gcacgttcaa gaagggcgac atgttcaacc tgaacgactg ccacaagctc 4080 atcgacttct tcaaggactc catcagccgc tacccgaagt ggtccaacgc ctacgacttc 4140 aacttcagcg agaccgagaa gtacaaggac atcgcgggct tctaccgcga ggtcgaggag 4200 cagggctaca aggtgtcctt cgagtccgcc agcaagaagg aggtcgacaa gctggtggag 4260 gagggcaagc tctacatgtt ccagatctac aacaaggact tctccgacaa gagccacggc 4320 acgcccaacc tgcacaccat gtacttcaag ctcctgttcg acgagaacaa ccacggccag 4380 atcaggctgt ccggcggcgc cgagctcttc atgaggaggg cgagcctgaa gaaggaggag 4440 ctggtggtcc accccgctaa cagcccaatc gcgaacaaga acccggacaa ccccaagaag 4500 accacgaccc tgtcctacga cgtgtacaag gacaagaggt tcagcgagga ccagtacgag 4560 ctccacatcc cgatcgcgat caacaagtgc cccaagaaca tcttcaagat caacaccgag 4620 gtccgcgtgc tcctgaagca cgacgacaac ccctacgtga tcggcatcgc taggggcgag 4680 aggaacctcc tgtacatcgt ggtcgtggac ggcaagggca acatcgtgga gcagtactcc 4740 ctcaacgaga tcatcaacaa cttcaacggc atcaggatca agacggacta ccacagcctc 4800 ctggacaaga aggagaagga gaggttcgag gcccgccaga actggacctc catcgagaac 4860 atcaaggagc tgaaggcggg ctacatcagc caggtcgtgc acaagatctg cgagctcgtc 4920 gagaagtacg acgccgtgat cgccctcgcg gacctgaact ccggcttcaa gaacagccgc 4980 gtcaaggtgg agaagcaggt ctaccagaag ttcgagaaga tgctcatcga caagctgaac 5040 tacatggtgg acaagaagtc caacccctgc gctacgggcg gcgcgctgaa gggctaccag 5100 atcaccaaca agttcgagag cttcaagtcc atgagcactc agaacggctt catcttctac 5160 atcccggcgt ggctcacgtc caagatcgac cccagcaccg gcttcgtcaa cctcctgaag 5220 acgaagtaca cctccatcgc cgacagcaag aagttcatct ccagcttcga ccgcatcatg 5280 tatgtgccgg aggaggacct gttcgagttc gccctcgact acaagaactt ctcccgcacg 5340 gacgcggact acatcaagaa gtggaagctg tacagctacg gcaaccgcat ccgcatcttc 5400 aggaacccca agaagaacaa cgtcttcgac tgggaggagg tgtgcctgac ctccgcgtac 5460 aaggagctct tcaacaagta cggcatcaac taccagcagg gcgacatcag ggctctcctg 5520 tgcgagcaga gcgacaaggc cttctactcc agcttcatgg cgctgatgtc cctcatgctg 5580 cagatgagga actcgatcac cggcaggacg gacgtggcct tcctcatctc cccggtgaag 5640 aacagcgacg gcatcttcta cgactccagg aactacgagg cccaggagaa cgcgatcctc 5700 ccaaagaacg cggacgccaa cggcgcctac aacatcgcca ggaaggtcct ctgggctatc 5760 ggccagttca agaaggcgga ggacgagaag ctggacaagg tgaagatcgc catcagcaac 5820 aaggagtggc tcgagtacgc ccagacctcg gtcaagcacg gcagcccgaa gaagaagcgc 5880 aaggtgtccg gcggcagcac gaacctgtcc gacatcatcg agaaggagac cggcaagcag 5940 ctcgtgatcc aggagagcat cctcatgctg ccggaggagg tcgaggaggt catcggcaac 6000 aagcccgagt ccgacatcct cgtccacacg gcctacgacg agtccaccga cgagaacgtg 6060 atgctcctga cctcggacgc tcccgagtac aagccatggg ccctggtcat ccaggacagc 6120 aacggcgaga acaagatcaa gatgctctcc ggcggcagcc cgaagaagaa gcgcaaagtg 6180 tga 6183 <210> 89 <211> 2054 <212> PRT <213> Artificial Sequence <220> <223> Fusion protein <400> 89 Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu 1 5 10 15 Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala 20 25 30 Val Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro 35 40 45 Ile Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg 50 55 60 Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu 65 70 75 80 Tyr Val Thr Leu Glu Pro Cys Val Met Val Ser Phe Cys Phe Tyr Leu 85 90 95 Tyr Ile Tyr Asn Asn Tyr His Leu Val Val Ile Tyr Phe Lys Tyr Phe 100 105 110 Phe Gln Asn Lys Arg Met Tyr Ile Ala Ile Ala Phe Leu Phe Ile Ser 115 120 125 Val Tyr Ile Leu Ile Tyr Asn Phe Ser Asn Ile Pro Lys Phe Val Asp 130 135 140 Val Gln Cys Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val 145 150 155 160 Phe Gly Ala Arg Asp Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp 165 170 175 Val Leu His His Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly 180 185 190 Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu Ser Asp Phe Phe Arg Met 195 200 205 Arg Arg Gln Glu Ile Lys Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp 210 215 220 Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr 225 230 235 240 Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser 245 250 255 Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr 260 265 270 Leu Ala Lys Arg Ala Arg Asp Glu Arg Glu Val Pro Val Gly Ala Val 275 280 285 Leu Val Leu Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Ala Ile 290 295 300 Gly Leu His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 305 310 315 320 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 325 330 335 Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 340 345 350 Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly Ala 355 360 365 Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His Arg 370 375 380 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu 385 390 395 400 Cys Tyr Phe Phe Arg Met Pro Arg Gln Val Phe Asn Ala Gln Lys Lys 405 410 415 Ala Gln Ser Ser Thr Asp Gly Ser Ala Glu Tyr Val Arg Ala Leu Phe 420 425 430 Asp Phe Asn Gly Asn Asp Glu Glu Asp Leu Pro Phe Lys Lys Gly Asp 435 440 445 Ile Leu Arg Ile Arg Asp Lys Pro Glu Glu Gln Trp Trp Asn Ala Glu 450 455 460 Asp Ser Glu Gly Lys Arg Gly Met Ile Pro Val Pro Tyr Val Glu Lys 465 470 475 480 Tyr Met Thr Asp Ala Glu Tyr Val Arg Ile His Glu Lys Leu Asp Ile 485 490 495 Tyr Thr Phe Lys Lys Gln Phe Phe Asn Asn Lys Lys Ser Val Ser His 500 505 510 Arg Cys Tyr Val Leu Phe Glu Leu Lys Arg Arg Gly Glu Arg Arg Ala 515 520 525 Cys Phe Trp Gly Tyr Ala Val Asn Lys Pro Gln Ser Gly Thr Glu Arg 530 535 540 Gly Ile His Ala Glu Ile Phe Ser Ile Arg Lys Val Glu Glu Tyr Leu 545 550 555 560 Arg Asp Asn Pro Gly Gln Phe Thr Ile Asn Trp Tyr Ser Ser Trp Ser 565 570 575 Pro Cys Ala Asp Cys Ala Glu Lys Ile Leu Glu Trp Tyr Asn Gln Glu 580 585 590 Leu Arg Gly Asn Gly His Thr Leu Lys Ile Trp Ala Cys Lys Leu Tyr 595 600 605 Tyr Glu Lys Asn Ala Arg Asn Gln Ile Gly Leu Trp Asn Leu Arg Asp 610 615 620 Asn Gly Val Gly Leu Asn Val Met Val Ser Glu His Tyr Gln Cys Cys 625 630 635 640 Arg Lys Ile Phe Ile Gln Ser Ser His Asn Gln Leu Asn Glu Asn Arg 645 650 655 Trp Leu Glu Lys Thr Leu Lys Arg Ala Glu Lys Arg Arg Ser Glu Leu 660 665 670 Ser Ile Met Ile Gln Val Lys Ile Leu His Thr Thr Lys Ser Pro Ala 675 680 685 Val Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser 690 695 700 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Met 705 710 715 720 Ser Lys Leu Glu Lys Phe Thr Asn Cys Tyr Ser Leu Ser Lys Thr Leu 725 730 735 Arg Phe Lys Ala Ile Pro Val Gly Lys Thr Gln Glu Asn Ile Asp Asn 740 745 750 Lys Arg Leu Leu Val Glu Asp Glu Lys Arg Ala Glu Asp Tyr Lys Gly 755 760 765 Val Lys Lys Leu Leu Asp Arg Tyr Tyr Leu Ser Phe Ile Asn Asp Val 770 775 780 Leu His Ser Ile Lys Leu Lys Asn Leu Asn Asn Tyr Ile Ser Leu Phe 785 790 795 800 Arg Lys Lys Thr Arg Thr Glu Lys Glu Asn Lys Glu Leu Glu Asn Leu 805 810 815 Glu Ile Asn Leu Arg Lys Glu Ile Ala Lys Ala Phe Lys Gly Asn Glu 820 825 830 Gly Tyr Lys Ser Leu Phe Lys Lys Asp Ile Ile Glu Thr Ile Leu Pro 835 840 845 Glu Phe Leu Asp Asp Lys Asp Glu Ile Ala Leu Val Asn Ser Phe Asn 850 855 860 Gly Phe Thr Thr Ala Phe Thr Gly Phe Phe Asp Asn Arg Glu Asn Met 865 870 875 880 Phe Ser Glu Glu Ala Lys Ser Thr Ser Ile Ala Phe Arg Cys Ile Asn 885 890 895 Glu Asn Leu Thr Arg Tyr Ile Ser Asn Met Asp Ile Phe Glu Lys Val 900 905 910 Asp Ala Ile Phe Asp Lys His Glu Val Gln Glu Ile Lys Glu Lys Ile 915 920 925 Leu Asn Ser Asp Tyr Asp Val Glu Asp Phe Phe Glu Gly Glu Phe Phe 930 935 940 Asn Phe Val Leu Thr Gln Glu Gly Ile Asp Val Tyr Asn Ala Ile Ile 945 950 955 960 Gly Gly Phe Val Thr Glu Ser Gly Glu Lys Ile Lys Gly Leu Asn Glu 965 970 975 Tyr Ile Asn Leu Tyr Asn Gln Lys Thr Lys Gln Lys Leu Pro Lys Phe 980 985 990 Lys Pro Leu Tyr Lys Gln Val Leu Ser Asp Arg Glu Ser Leu Ser Phe 995 1000 1005 Tyr Gly Glu Gly Tyr Thr Ser Asp Glu Glu Val Leu Glu Val Phe 1010 1015 1020 Arg Asn Thr Leu Asn Lys Asn Ser Glu Ile Phe Ser Ser Ile Lys 1025 1030 1035 Lys Leu Glu Lys Leu Phe Lys Asn Phe Asp Glu Tyr Ser Ser Ala 1040 1045 1050 Gly Ile Phe Val Lys Asn Gly Pro Ala Ile Ser Thr Ile Ser Lys 1055 1060 1065 Asp Ile Phe Gly Glu Trp Asn Val Ile Arg Asp Lys Trp Asn Ala 1070 1075 1080 Glu Tyr Asp Asp Ile His Leu Lys Lys Lys Ala Val Val Thr Glu 1085 1090 1095 Lys Tyr Glu Asp Asp Arg Arg Lys Ser Phe Lys Lys Ile Gly Ser 1100 1105 1110 Phe Ser Leu Glu Gln Leu Gln Glu Tyr Ala Asp Ala Asp Leu Ser 1115 1120 1125 Val Val Glu Lys Leu Lys Glu Ile Ile Ile Gln Lys Val Asp Glu 1130 1135 1140 Ile Tyr Lys Val Tyr Gly Ser Ser Glu Lys Leu Phe Asp Ala Asp 1145 1150 1155 Phe Val Leu Glu Lys Ser Leu Lys Lys Asn Asp Ala Val Val Ala 1160 1165 1170 Ile Met Lys Asp Leu Leu Asp Ser Val Lys Ser Phe Glu Asn Tyr 1175 1180 1185 Ile Lys Ala Phe Phe Gly Glu Gly Lys Glu Thr Asn Arg Asp Glu 1190 1195 1200 Ser Phe Tyr Gly Asp Phe Val Leu Ala Tyr Asp Ile Leu Leu Lys 1205 1210 1215 Val Asp His Ile Tyr Asp Ala Ile Arg Asn Tyr Val Thr Gln Lys 1220 1225 1230 Pro Tyr Ser Lys Asp Lys Phe Lys Leu Tyr Phe Gln Asn Pro Gln 1235 1240 1245 Phe Met Gly Gly Trp Asp Lys Asp Lys Glu Thr Asp Tyr Arg Ala 1250 1255 1260 Thr Ile Leu Arg Tyr Gly Ser Lys Tyr Tyr Leu Ala Ile Met Asp 1265 1270 1275 Lys Lys Tyr Ala Lys Cys Leu Gln Lys Ile Asp Lys Asp Asp Val 1280 1285 1290 Asn Gly Asn Tyr Glu Lys Ile Asn Tyr Lys Leu Leu Pro Gly Pro 1295 1300 1305 Asn Lys Met Leu Pro Lys Val Phe Phe Ser Lys Lys Trp Met Ala 1310 1315 1320 Tyr Tyr Asn Pro Ser Glu Asp Ile Gln Lys Ile Tyr Lys Asn Gly 1325 1330 1335 Thr Phe Lys Lys Gly Asp Met Phe Asn Leu Asn Asp Cys His Lys 1340 1345 1350 Leu Ile Asp Phe Phe Lys Asp Ser Ile Ser Arg Tyr Pro Lys Trp 1355 1360 1365 Ser Asn Ala Tyr Asp Phe Asn Phe Ser Glu Thr Glu Lys Tyr Lys 1370 1375 1380 Asp Ile Ala Gly Phe Tyr Arg Glu Val Glu Glu Gln Gly Tyr Lys 1385 1390 1395 Val Ser Phe Glu Ser Ala Ser Lys Lys Glu Val Asp Lys Leu Val 1400 1405 1410 Glu Glu Gly Lys Leu Tyr Met Phe Gln Ile Tyr Asn Lys Asp Phe 1415 1420 1425 Ser Asp Lys Ser His Gly Thr Pro Asn Leu His Thr Met Tyr Phe 1430 1435 1440 Lys Leu Leu Phe Asp Glu Asn Asn His Gly Gln Ile Arg Leu Ser 1445 1450 1455 Gly Gly Ala Glu Leu Phe Met Arg Arg Ala Ser Leu Lys Lys Glu 1460 1465 1470 Glu Leu Val Val His Pro Ala Asn Ser Pro Ile Ala Asn Lys Asn 1475 1480 1485 Pro Asp Asn Pro Lys Lys Thr Thr Thr Leu Ser Tyr Asp Val Tyr 1490 1495 1500 Lys Asp Lys Arg Phe Ser Glu Asp Gln Tyr Glu Leu His Ile Pro 1505 1510 1515 Ile Ala Ile Asn Lys Cys Pro Lys Asn Ile Phe Lys Ile Asn Thr 1520 1525 1530 Glu Val Arg Val Leu Leu Lys His Asp Asp Asn Pro Tyr Val Ile 1535 1540 1545 Gly Ile Ala Arg Gly Glu Arg Asn Leu Leu Tyr Ile Val Val Val 1550 1555 1560 Asp Gly Lys Gly Asn Ile Val Glu Gln Tyr Ser Leu Asn Glu Ile 1565 1570 1575 Ile Asn Asn Phe Asn Gly Ile Arg Ile Lys Thr Asp Tyr His Ser 1580 1585 1590 Leu Leu Asp Lys Lys Glu Lys Glu Arg Phe Glu Ala Arg Gln Asn 1595 1600 1605 Trp Thr Ser Ile Glu Asn Ile Lys Glu Leu Lys Ala Gly Tyr Ile 1610 1615 1620 Ser Gln Val Val His Lys Ile Cys Glu Leu Val Glu Lys Tyr Asp 1625 1630 1635 Ala Val Ile Ala Leu Ala Asp Leu Asn Ser Gly Phe Lys Asn Ser 1640 1645 1650 Arg Val Lys Val Glu Lys Gln Val Tyr Gln Lys Phe Glu Lys Met 1655 1660 1665 Leu Ile Asp Lys Leu Asn Tyr Met Val Asp Lys Lys Ser Asn Pro 1670 1675 1680 Cys Ala Thr Gly Gly Ala Leu Lys Gly Tyr Gln Ile Thr Asn Lys 1685 1690 1695 Phe Glu Ser Phe Lys Ser Met Ser Thr Gln Asn Gly Phe Ile Phe 1700 1705 1710 Tyr Ile Pro Ala Trp Leu Thr Ser Lys Ile Asp Pro Ser Thr Gly 1715 1720 1725 Phe Val Asn Leu Leu Lys Thr Lys Tyr Thr Ser Ile Ala Asp Ser 1730 1735 1740 Lys Lys Phe Ile Ser Ser Phe Asp Arg Ile Met Tyr Val Pro Glu 1745 1750 1755 Glu Asp Leu Phe Glu Phe Ala Leu Asp Tyr Lys Asn Phe Ser Arg 1760 1765 1770 Thr Asp Ala Asp Tyr Ile Lys Lys Trp Lys Leu Tyr Ser Tyr Gly 1775 1780 1785 Asn Arg Ile Arg Ile Phe Arg Asn Pro Lys Lys Asn Asn Val Phe 1790 1795 1800 Asp Trp Glu Glu Val Cys Leu Thr Ser Ala Tyr Lys Glu Leu Phe 1805 1810 1815 Asn Lys Tyr Gly Ile Asn Tyr Gln Gln Gly Asp Ile Arg Ala Leu 1820 1825 1830 Leu Cys Glu Gln Ser Asp Lys Ala Phe Tyr Ser Ser Phe Met Ala 1835 1840 1845 Leu Met Ser Leu Met Leu Gln Met Arg Asn Ser Ile Thr Gly Arg 1850 1855 1860 Thr Asp Val Ala Phe Leu Ile Ser Pro Val Lys Asn Ser Asp Gly 1865 1870 1875 Ile Phe Tyr Asp Ser Arg Asn Tyr Glu Ala Gln Glu Asn Ala Ile 1880 1885 1890 Leu Pro Lys Asn Ala Asp Ala Asn Gly Ala Tyr Asn Ile Ala Arg 1895 1900 1905 Lys Val Leu Trp Ala Ile Gly Gln Phe Lys Lys Ala Glu Asp Glu 1910 1915 1920 Lys Leu Asp Lys Val Lys Ile Ala Ile Ser Asn Lys Glu Trp Leu 1925 1930 1935 Glu Tyr Ala Gln Thr Ser Val Lys His Gly Ser Pro Lys Lys Lys 1940 1945 1950 Arg Lys Val Ser Gly Gly Ser Thr Asn Leu Ser Asp Ile Ile Glu 1955 1960 1965 Lys Glu Thr Gly Lys Gln Leu Val Ile Gln Glu Ser Ile Leu Met 1970 1975 1980 Leu Pro Glu Glu Val Glu Glu Val Ile Gly Asn Lys Pro Glu Ser 1985 1990 1995 Asp Ile Leu Val His Thr Ala Tyr Asp Glu Ser Thr Asp Glu Asn 2000 2005 2010 Val Met Leu Leu Thr Ser Asp Ala Pro Glu Tyr Lys Pro Trp Ala 2015 2020 2025 Leu Val Ile Gln Asp Ser Asn Gly Glu Asn Lys Ile Lys Met Leu 2030 2035 2040 Ser Gly Gly Ser Pro Lys Lys Lys Arg Lys Val 2045 2050 <210> 90 <211> 23 <212> DNA <213> Zea mays <400> 90 aatcaatggg aagcctatct acc 23 <210> 91 <211> 1284 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 91 atgtccgagg tggagttcag ccacgagtac tggatgaggc acgctctcac cctggctaag 60 agggcgtggg acgagaggga ggtgccggtg ggcgccgtgc tcgtccacaa caaccgcgtg 120 atcggcgagg gctggaacag gcccatcggc aggcacgacc caaccgctca cgccgagatc 180 atggctctca ggcagggcgg cctggtcatg cagaactaca ggctgatcga cgcgaccctc 240 tacgtgaccc tcgagccctg cgtcatggta agtttctgct tctacctttg atatatatat 300 aataattatc attaattagt agtaatataa tatttcaaat atttttttca aaataaaaga 360 atgtagtata tagcaattgc ttttctgtag tttataagtg tgtatatttt aatttataac 420 ttttctaata tatgaccaaa atttgttgat gtgcagtgcg cgggcgccat gatccactcc 480 aggatcggca gggtggtctt cggcgctagg gacgccaaga cgggcgctgc gggcagcctc 540 atggacgtgc tgcaccaccc cggcatgaac caccgcgtcg agatcaccga gggcatcctc 600 gcggacgagt gcgctgcgct cctgtccgac ttcttcagga tgcgcaggca ggagatcaag 660 gcccagaaga aggcgcagtc cagcaccgac tccggcggct ccagcggcgg ctccagcggc 720 agcgagaccc cgggcacgtc cgagagcgcg acgcccgaga gcagcggcgg ctccagcggc 780 ggctcctcgg aggtcgagtt cagccatgag tactggatga ggcatgccct gactctcgct 840 aagagggcgc gggatgagcg cgaggtgccg gtgggggccg tgctcgtcct gaacaaccgc 900 gtgatcgggg agggctggaa ccgggctatc ggcctccacg acccaacggc ccatgccgag 960 atcatggccc tgaggcaggg cggcctggtc atgcaaaact acaggctcat cgacgccacc 1020 ctctacgtga ccttcgagcc atgcgtgatg tgcgcggggg ccatgatcca ctcgaggatt 1080 gggagggtgg tcttcggcgt gcgcaacgct aagacggggg ccgccggcag cctcatggac 1140 gtcctgcact acccgggcat gaaccacagg gtggagatta ccgagggcat cctggccgat 1200 gagtgcgccg cgctcctgtg ctacttcttc cgcatgccca ggcaggtctt caacgcgcag 1260 aagaaggccc agagctccac tgat 1284 <210> 92 <211> 422 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 92 Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu 1 5 10 15 Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala 20 25 30 Val Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro 35 40 45 Ile Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg 50 55 60 Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu 65 70 75 80 Tyr Val Thr Leu Glu Pro Cys Val Met Val Ser Phe Cys Phe Tyr Leu 85 90 95 Tyr Ile Tyr Asn Asn Tyr His Leu Val Val Ile Tyr Phe Lys Tyr Phe 100 105 110 Phe Gln Asn Lys Arg Met Tyr Ile Ala Ile Ala Phe Leu Phe Ile Ser 115 120 125 Val Tyr Ile Leu Ile Tyr Asn Phe Ser Asn Ile Pro Lys Phe Val Asp 130 135 140 Val Gln Cys Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val 145 150 155 160 Phe Gly Ala Arg Asp Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp 165 170 175 Val Leu His His Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly 180 185 190 Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu Ser Asp Phe Phe Arg Met 195 200 205 Arg Arg Gln Glu Ile Lys Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp 210 215 220 Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr 225 230 235 240 Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser 245 250 255 Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr 260 265 270 Leu Ala Lys Arg Ala Arg Asp Glu Arg Glu Val Pro Val Gly Ala Val 275 280 285 Leu Val Leu Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Ala Ile 290 295 300 Gly Leu His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 305 310 315 320 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 325 330 335 Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 340 345 350 Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly Ala 355 360 365 Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His Arg 370 375 380 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu 385 390 395 400 Cys Tyr Phe Phe Arg Met Pro Arg Gln Val Phe Asn Ala Gln Lys Lys 405 410 415 Ala Gln Ser Ser Thr Asp 420

Claims (27)

  1. N-말단에서 C-말단 방향으로, 이종성 도메인, 제1 링커 서열, 및 V형 CRISPR-Cas 효소를 포함하는 융합 단백질로서, 제1 링커 서열은 반복된 GGGGS 서열을 포함하는, 융합 단백질.
  2. 제1항에 있어서, 이종성 도메인은 데아미나제, 폴리머라제, 뉴클레아제, 릴랙사제, 알킬트랜스퍼라제, 메틸트랜스퍼라제, 아데노신 데아미나제, 시티딘 데아미나제, 옥시다제, 티민 알킬트랜스퍼라제, 아데닌 옥시다제, 아데노신 메틸트랜스퍼라제, 글리코실라제 또는 핵 국재화 신호인, 융합 단백질.
  3. 제2항에 있어서, 이종성 도메인은 데아미나제 도메인인, 융합 단백질.
  4. 제3항에 있어서, 데아미나제 도메인은 시티딘 데아미나제인, 융합 단백질.
  5. 제4항에 있어서, 시티딘 데아미나제 도메인은 활성화-유도 시티딘 데아미나제("AID")인, 융합 단백질.
  6. 제4항에 있어서, 시티딘 데아미나제 도메인은 아포리포단백질 B mRNA-편집 복합체("APOBEC") 도메인인, 융합 단백질.
  7. 제6항에 있어서, APOBEC 도메인은 APOBEC1 패밀리 데아미나제인, 융합 단백질.
  8. 제7항에 있어서, APOBEC 도메인은 SEQ ID NO: 1과 적어도 70% 동일한 서열을 포함하는, 융합 단백질.
  9. 제3항에 있어서, 데아미나제 도메인은 아데닌 데아미나제인, 융합 단백질.
  10. 제9항에 있어서, 아데닌 데아미나제는 TadA 도메인인, 융합 단백질.
  11. 제10항에 있어서, TadA 도메인은 SEQ ID NO: 92와 적어도 70% 동일한 서열을 포함하는, 융합 단백질.
  12. 제1항에 있어서, V형 CRISPR-Cas 효소는 V-A형(Cas12a) 효소인, 융합 단백질.
  13. 제12항에 있어서, Cas12a 도메인은 SEQ ID NO: 3, SEQ ID NO: 6, SEQ ID NO: 22, SEQ ID NO: 45, SEQ ID NO: 46, SEQ ID NO: 47, 및 SEQ ID NO: 48로 구성된 군으로부터 선택되는, 융합 단백질.
  14. 제13항에 있어서, Cas12a 도메인은 촉매적 비활성이고, SEQ ID NO: 3, SEQ ID NO: 6, 및 SEQ ID NO: 22로 구성된 군으로부터 선택되는, 융합 단백질.
  15. 제1항에 있어서, 제1 링커 서열은 적어도 3 회 반복된 GGGGS를 포함하는, 융합 단백질.
  16. 제15항에 있어서, 제1 링커 서열은 적어도 6 회 반복된 GGGGS를 포함하는, 융합 단백질.
  17. 제1항 내지 제16항 중 어느 한 항에 있어서, 융합 단백질은 SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 13, 및 SEQ ID NO: 44로 이루어진 군으로부터 선택된 서열을 포함하는, 융합 단백질.
  18. 제1항 내지 제17항 중 어느 한 항에 있어서, 우라실 DNA 글리코실라제 억제제("UGI") 도메인을 추가로 포함하는, 융합 단백질.
  19. 제18항에 있어서, UGI 도메인은 SEQ ID NO: 8을 포함하는, 융합 단백질.
  20. 제19항에 있어서, UGI 도메인은 서열 SGGS를 포함하는 제2 링커에 의해 Cas12a 효소에 연결되는, 융합 단백질.
  21. 제1항에 있어서, SEQ ID NO: 17, SEQ ID NO: 24, SEQ ID NO: 35, SEQ ID NO: 39, SEQ ID NO: 43, SEQ ID NO: 50, SEQ ID NO: 52, SEQ ID NO: 54, SEQ ID NO: 56, SEQ ID NO: 81, SEQ ID NO: 83, SEQ ID NO: 85, SEQ ID NO:87, 및 SEQ ID NO:89로 이루어진 군으로부터 선택된 서열을 포함하는, 융합 단백질.
  22. 제1항에 있어서, DNA와 접촉될 때, 반복된 GGGGS 서열 이외의 제1 링커 서열을 갖는 융합 단백질에 비해 증가된 빈도로 표적내 편집을 생성하고 감소된 빈도로 표적외 편집을 생성하는, 융합 단백질.
  23. 식물 게놈 DNA를 편집하는 방법으로서, 상기 방법은 식물 게놈 DNA를
    (a) 선택적으로 UGI 도메인을 포함하여, 제1항 내지 제17항 중 어느 한 항의 융합 단백질; 및
    (b) 단계 (a)의 융합 단백질을 식물 게놈 DNA의 표적 DNA 서열에 표적화하는 가이드 RNA("gRNA")와 접촉시키는 단계를 포함하고,
    편집된 식물 게놈 DNA는 반복된 GGGGS 서열 이외의 제1 링커를 갖는 융합 단백질에 의해 편집된 식물 게놈 DNA에 비해 감소된 표적외 편집을 포함하는, 방법.
  24. 감소된 표적외 편집으로 식물 게놈 DNA를 편집하는 방법으로서, 상기 방법은 식물 게놈 DNA를
    (a) 선택적으로 UGI 도메인을 포함하여, 제1항 내지 제17항 중 어느 한 항의 융합 단백질; 및
    (b) 단계 (a)의 융합 단백질을 식물 게놈 DNA의 표적 DNA 서열에 표적화하는 가이드 RNA("gRNA")와 접촉시키는 단계를 포함하고,
    편집된 식물 게놈 DNA는 반복된 GGGGS 서열 이외의 제1 링커를 갖는 융합 단백질에 의해 편집된 식물 게놈 DNA에 비해 감소된 표적외 편집을 포함하는, 방법.
  25. 제24항에 있어서, 융합 단백질은 SEQ ID NO: 24를 포함하는, 방법.
  26. 감소된 표적외 편집으로 편집된 식물의 집단을 수득하는 방법으로서, 상기 방법은
    (a) 편집될 게놈 DNA를 포함하는 식물 세포의 집단을 수득하는 단계;
    (b) 제1항 내지 제16항 중 어느 한 항 및 선택적으로 UGI 도메인의 융합 단백질을 인코딩하는 뉴클레오티드 서열을 수득하는 단계;
    (c) 식물 세포의 집단을 단계 (b)의 뉴클레오티드 서열로 형질 전환함으로써, 식물 세포의 집단 내 핵산 서열에 의해 인코딩되는 융합 단백질을 발현하는 단계;
    (d) 형질 전환된 식물 세포 집단을 식물로 성장시키는 단계로서, 식물 중 적어도 하나가 편집되는 단계; 및
    (e) 단계 (d)의 산물로부터 적어도 하나의 편집된 식물을 선택함으로써, 편집된 식물의 집단을 수득하는 단계를 포함하고,
    편집된 식물의 집단은 반복된 GGGGS 서열 이외의 제1 링커를 갖는 융합 단백질에 의해 편집된 식물에 비해 감소된 표적외 편집을 포함하는, 방법.
  27. 제26항에 있어서, 뉴클레오티드 서열은 SEQ ID NO: 17, SEQ ID NO: 24, SEQ ID NO: 35, SEQ ID NO: 39, SEQ ID NO: 43, SEQ ID NO: 50, SEQ ID NO: 52, SEQ ID NO: 54, SEQ ID NO: 56, SEQ ID NO: 81, SEQ ID NO: 83, SEQ ID NO: 85, SEQ ID NO:87, 및 SEQ ID NO:89로 이루어진 군으로부터 선택된 융합 단백질에 대해 인코딩하는, 방법.
KR1020227012388A 2019-09-26 2020-09-18 Dna 염기 편집을 위한 방법 및 조성물 KR20220066111A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CNPCT/CN2019/108026 2019-09-26
PCT/CN2019/108026 WO2021056302A1 (en) 2019-09-26 2019-09-26 Methods and compositions for dna base editing
PCT/US2020/051383 WO2021061507A1 (en) 2019-09-26 2020-09-18 Methods and compositions for dna base editing

Publications (1)

Publication Number Publication Date
KR20220066111A true KR20220066111A (ko) 2022-05-23

Family

ID=75166246

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020227012388A KR20220066111A (ko) 2019-09-26 2020-09-18 Dna 염기 편집을 위한 방법 및 조성물

Country Status (11)

Country Link
US (1) US20220403396A1 (ko)
EP (1) EP4034648A4 (ko)
JP (1) JP2022549430A (ko)
KR (1) KR20220066111A (ko)
CN (1) CN114761547A (ko)
AU (1) AU2020354372A1 (ko)
CA (1) CA3149273A1 (ko)
CL (2) CL2022000745A1 (ko)
IL (1) IL290572A (ko)
MX (1) MX2022003577A (ko)
WO (2) WO2021056302A1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
MX2022012683A (es) * 2020-04-09 2023-01-11 Verve Therapeutics Inc Edicion de bases de pcsk9 y metodos de uso de la misma para el tratamiento de enfermedades.

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2439472A1 (en) * 2001-02-27 2002-09-06 University Of Rochester Methods and compositions for modifying apolipoprotein b mrna editing
WO2017070632A2 (en) * 2015-10-23 2017-04-27 President And Fellows Of Harvard College Nucleobase editors and uses thereof
CA3032699A1 (en) * 2016-08-03 2018-02-08 President And Fellows Of Harvard College Adenosine nucleobase editors and uses thereof
JP2020510439A (ja) * 2017-03-10 2020-04-09 プレジデント アンド フェローズ オブ ハーバード カレッジ シトシンからグアニンへの塩基編集因子
KR102687373B1 (ko) * 2017-03-23 2024-07-23 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 핵산 프로그램가능한 dna 결합 단백질을 포함하는 핵염기 편집제
JP7364472B2 (ja) * 2017-05-18 2023-10-18 ザ・ブロード・インスティテュート・インコーポレイテッド 標的化された核酸編集のための系、方法、及び組成物
WO2018213726A1 (en) * 2017-05-18 2018-11-22 The Broad Institute, Inc. Systems, methods, and compositions for targeted nucleic acid editing
EP3658573A1 (en) * 2017-07-28 2020-06-03 President and Fellows of Harvard College Methods and compositions for evolving base editors using phage-assisted continuous evolution (pace)
WO2019041296A1 (zh) * 2017-09-01 2019-03-07 上海科技大学 一种碱基编辑系统及方法
CN111757937A (zh) * 2017-10-16 2020-10-09 布罗德研究所股份有限公司 腺苷碱基编辑器的用途
CN110157727A (zh) * 2017-12-21 2019-08-23 中国科学院遗传与发育生物学研究所 植物碱基编辑方法
CN109957569B (zh) * 2017-12-22 2022-10-25 苏州齐禾生科生物科技有限公司 基于cpf1蛋白的碱基编辑系统和方法
US20210079366A1 (en) * 2017-12-22 2021-03-18 The Broad Institute, Inc. Cas12a systems, methods, and compositions for targeted rna base editing
BR112020012696A2 (pt) * 2017-12-22 2020-11-24 The Broad Institute Inc. diagnóstico multiplex com base em sistema efetor crispr
WO2019161783A1 (en) * 2018-02-23 2019-08-29 Shanghaitech University Fusion proteins for base editing
CN113913454B (zh) * 2018-11-07 2023-07-21 中国农业科学院植物保护研究所 一套用于水稻的人工基因编辑系统

Also Published As

Publication number Publication date
CN114761547A (zh) 2022-07-15
MX2022003577A (es) 2022-04-25
CL2022000745A1 (es) 2022-10-28
EP4034648A1 (en) 2022-08-03
WO2021061507A1 (en) 2021-04-01
US20220403396A1 (en) 2022-12-22
CL2023003425A1 (es) 2024-06-07
EP4034648A4 (en) 2023-11-01
IL290572A (en) 2022-04-01
JP2022549430A (ja) 2022-11-25
CA3149273A1 (en) 2021-04-01
WO2021056302A1 (en) 2021-04-01
AU2020354372A1 (en) 2022-03-31

Similar Documents

Publication Publication Date Title
CN107109427B (zh) 用于鉴定和富集包含位点特异性基因组修饰的细胞的方法和组合物
KR102339365B1 (ko) 키메라 게놈 조작 분자 및 방법
CN111770992B (zh) CRISPR-Cas12j酶和系统
CN108795972B (zh) 不使用转基因标记序列分离细胞的方法
JP2023145691A (ja) 遺伝子操作のためのヌクレアーゼシステム
CN106715694B (zh) 核酸酶介导的dna组装
AU2016380351A1 (en) Novel CRISPR-associated transposases and uses thereof
KR102253223B1 (ko) 식물 내 담배 특이 니트로사민 감소
CN112105728B (zh) CRISPR/Cas效应蛋白及系统
AU2016334225A1 (en) Novel RNA-guided nucleases and uses thereof
CN101784667A (zh) 来自玉米的次生壁形成基因及其用途
CN114641568A (zh) Rna指导的核酸酶及其活性片段及变体以及使用方法
KR20210099608A (ko) 게놈 편집을 통한 유전자 침묵화
US20210087557A1 (en) Methods and compositions for targeted genomic insertion
KR20220137166A (ko) 전이유전자성 마커 서열을 이용하지 않는 세포 단리 방법
KR20220066111A (ko) Dna 염기 편집을 위한 방법 및 조성물
JP2022522823A (ja) 天然miRNAのゲノム編集による標的遺伝子発現の抑制
US11459577B2 (en) Targeted insertion sites in the maize genome
WO2024080067A1 (ja) ゲノム編集方法およびゲノム編集用組成物
US20230114951A1 (en) Targeted insertion sites in the maize genome
CN114502733A (zh) 花期基因及其使用方法
CN117255859A (zh) 具有同源指导rna识别位点的可去除植物转基因基因座