KR20220066111A - Dna 염기 편집을 위한 방법 및 조성물 - Google Patents
Dna 염기 편집을 위한 방법 및 조성물 Download PDFInfo
- Publication number
- KR20220066111A KR20220066111A KR1020227012388A KR20227012388A KR20220066111A KR 20220066111 A KR20220066111 A KR 20220066111A KR 1020227012388 A KR1020227012388 A KR 1020227012388A KR 20227012388 A KR20227012388 A KR 20227012388A KR 20220066111 A KR20220066111 A KR 20220066111A
- Authority
- KR
- South Korea
- Prior art keywords
- lys
- leu
- glu
- ile
- ser
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/62—DNA sequences coding for fusion proteins
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/01—Preparation of mutants without inserting foreign genetic material therein; Screening processes therefor
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/102—Mutagenizing nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8201—Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
- C12N15/8213—Targeted insertion of genes into the plant genome by homologous recombination
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8241—Phenotypically and genetically modified plants via recombinant DNA technology
- C12N15/8242—Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
- C12N15/8243—Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine
- C12N15/8245—Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine involving modified carbohydrate or sugar alcohol metabolism, e.g. starch biosynthesis
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/78—Hydrolases (3) acting on carbon to nitrogen bonds other than peptide bonds (3.5)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y305/00—Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
- C12Y305/04—Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in cyclic amidines (3.5.4)
- C12Y305/04005—Cytidine deaminase (3.5.4.5)
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/01—Fusion polypeptide containing a localisation/targetting motif
- C07K2319/09—Fusion polypeptide containing a localisation/targetting motif containing a nuclear localisation signal
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/80—Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Zoology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Wood Science & Technology (AREA)
- Biomedical Technology (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Microbiology (AREA)
- Plant Pathology (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Cell Biology (AREA)
- Medicinal Chemistry (AREA)
- Nutrition Science (AREA)
- Crystallography & Structural Chemistry (AREA)
- Peptides Or Proteins (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
- Enzymes And Modification Thereof (AREA)
Abstract
본 발명은 세포의 게놈에서 표적 부위를 변형시키기 위한 방법 및 조성물에 관한 것이다. 개선된 링커 서열에 의해 연결된, 하나 이상의 DNA 결합 도메인 및 하나 이상의 이종성 도메인, 예컨대, DNA 변형 도메인을 포함하는 융합 단백질이 제공된다. 개선된 링커 서열에 의해 연결된 하나 이상의 DNA 결합 도메인 및 하나 이상의 이종성 도메인을 포함하는 융합 단백질을 인코딩하는 코돈 최적화된 폴리뉴클레오티드가 제공된다.
Description
발명의 분야
본 발명은 세포의 게놈에서 표적화된 뉴클레오티드 염기 편집을 위한 방법 및 조성물에 관한 것이다.
서열 목록의 전자 제출에 관한 진술
37 C.F.R. § 1.821하에서 제출된, 약 702 킬로바이트인 2020년 9월 18일에 생성된 "81945_ST25"라는 명칭의 ASCII 텍스트 형식의 서열 목록은 명세서와 함께 첨부되고 파일링되었으며, 본원에 참고로 포함된다.
농업에서는 유리한 대립 유전자를 생성하기 위해 식물의 게놈을 편집할 수 있는 능력을 갖는 것이 매우 필요하다. 수확량을 늘리거나 질병을 예방하는 것이 가능할 수 있다. 게놈 편집은 식물의 발전이 뒤처지고 있는 새로운 분야이다. 또한, 의도된 변경 이외의 게놈에 대한 변경은 요망되는 변경의 적용을 제한하는 문제가 된다. CRISPR-CAS9는 DNA에 이중 가닥 절단을 가함으로써 작용한다. 이러한 파손은 비-상동성 말단 접합 또는 상동성 의존적 복구에 의해 복구되기 때문에, DNA 염기 삽입 또는 결실이 발생할 수 있다. 염기 편집이라 불리는 전략은 절단 및 삽입 및 결실의 생성 없이 DNA를 변경한다. 한 버전에서, 시티딘 데아미나제라 불리는 효소는 DNA를 절단할 수 없도록 변경된 CAS9(Shimatani et al, 2017. Nat. Biotechnol. 35, 441-443) 또는 CAS12a(Li et al, 2018. Nat. Biotechnol. 36, 324-327) 효소에 의해 특정 염기에 표적화된다. 시티딘 데아미나제 및 뉴클레아제 결핍 CAS9 또는 CAS12a는 아미노산 링커를 통해 연결에 의해 함께 융합된다. 링커 연결의 개선은, 예컨대, 표적외 염기 변경을 감소시킴으로써 절단의 정밀도를 개선함으로써 융합 단백질의 기능을 개선할 수 있다.
개선을 위해 이러한 요구를 충족시키기 위해, 최적화되고 개선된 Cas12a 효소 및 작제물이 제공된다. 구체적으로, 이종성 도메인, 제1 링커 서열, 및 V형 CRISPR-Cas 효소를 포함하는 융합 단백질이 제공된다. 제1 링커 서열은 반복된 GGGGS 서열을 포함한다. 이종성 도메인은 데아미나제, 폴리머라제, 뉴클레아제, 릴랙사제, 알킬트랜스퍼라제, 메틸트랜스퍼라제, 아데노신 데아미나제, 시티딘 데아미나제, 옥시다제, 티민 알킬트랜스퍼라제, 아데닌 옥시다제, 아데노신 메틸트랜스퍼라제, 글리코실라제 또는 핵 국재화 신호일 수 있다. 염기 편집을 위해, 이종성 도메인은 데아미나제 도메인, 예컨대, 시티딘 데아미나제 또는 아데닌 데아미나제이다. 시티딘 데아미나제 도메인은, 예컨대, 데아미나제의 APOBEC1 패밀리로부터의 활성화-유도 시티딘 데아미나제("AID"), 또는 아포리포단백질 B mRNA-편집 복합체("APOBEC") 도메인일 수 있다. 일부 맥락에서, APOBEC 도메인은 SEQ ID NO: 1과 적어도 70% 동일한 서열을 포함한다. 아데닌 데아미나제가 필요한 경우, 아데닌 데아미나제는 SEQ ID NO: 92와 적어도 70% 동일한 아미노산 서열을 포함하는 TadA 도메인일 수 있다.
V형 CRISPR-Cas 효소가 V-A형("Cas12a") 효소인 경우, Cas12a는 SEQ ID NO: 3, SEQ ID NO: 6, SEQ ID NO: 22, SEQ ID NO: 45, SEQ ID NO: 46, SEQ ID NO: 47, 및 SEQ ID NO: 48로 구성된 군으로부터 선택된다. Cas12a 도메인은 촉매적 비활성일 수 있지만, 여전히 표적 DNA에 결합하고, 이종성 도메인이 작동되게 한다. Cas12a가 비활성인 경우, 이의 서열은 SEQ ID NO: 3, SEQ ID NO: 6, 또는 SEQ ID NO: 22이다.
이종성 도메인과 Cas12a 효소 사이의 제1 링커 서열은 적어도 3 회 반복된 GGGGS를 포함할 수 있다. 다른 사용에서, 제1 링커 서열은 적어도 6 회 반복된 GGGGS를 포함할 수 있다.
융합 단백질은 SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 13, 또는 SEQ ID NO: 44를 포함할 수 있고, 이는 또한 우라실 DNA 글리코실라제 억제제("UGI") 도메인(SEQ ID NO: 8로 표현된 바와 같음)을 포함할 수 있다. UGI 도메인은 서열 SGGS를 포함하는 제2 링커에 의해 Cas12a 효소에 연결될 수 있다. 융합 단백질은 SEQ ID NO: 17, SEQ ID NO: 24, SEQ ID NO: 35, SEQ ID NO: 39, SEQ ID NO: 43, SEQ ID NO: 50, SEQ ID NO: 52, SEQ ID NO: 54, SEQ ID NO: 56, SEQ ID NO: 81, SEQ ID NO: 83, SEQ ID NO: 85, SEQ ID NO:87, 또는 SEQ ID NO:89를 포함할 수 있다. 이들 융합 단백질은, DNA와 접촉될 때, 반복된 GGGGS 서열의 제1 링커 서열이 결여된 종래 기술의 융합 단백질에 비해, 증가된 빈도로 표적내 편집을 생성하고 감소된 빈도로 표적외 편집을 생성한다.
또한, 식물 게놈 DNA를 (a) 선택적으로 UGI 도메인을 포함하여 상기 양태들 중 하나에 의해 기재된 바와 같은 융합 단백질; 및 (b) 단계 (a)의 융합 단백질을 식물 게놈 DNA의 표적 DNA 서열에 표적화하는 가이드 RNA("gRNA")와 접촉시킴으로써 식물 게놈 DNA를 편집하는 방법으로서, 편집된 식물 게놈 DNA는 반복된 GGGGS 서열 이외의 제1 링커를 갖는 융합 단백질에 의해 편집된 식물 게놈 DNA에 비해 감소된 표적외 편집을 포함하는, 방법이 제공된다.
또한, 식물 게놈 DNA를 (a) 선택적으로 UGI 도메인을 포함하여 상기 양태들 중 하나에 의해 기재된 바와 같은 융합 단백질; 및 (b) 단계 (a)의 융합 단백질을 식물 게놈 DNA의 표적 DNA 서열에 표적화하는 가이드 RNA("gRNA")와 접촉시킴으로써 감소된 표적외 편집으로 식물 게놈 DNA를 편집하는 방법으로서, 편집된 식물 게놈 DNA는 반복된 GGGGS 서열 이외의 제1 링커를 갖는 융합 단백질에 의해 편집된 식물 게놈 DNA에 비해 감소된 표적외 편집을 포함하는, 방법이 제공된다. 일 양태에서, 융합 단백질은 SEQ ID NO: 24를 포함한다.
또한, (a) 편집될 게놈 DNA를 포함하는 식물 세포 집단을 수득하는 단계; (b) 상기 양태들 중 하나 및 선택적으로 UGI 도메인에 의해 기술된 바와 같은 융합 단백질을 인코딩하는 뉴클레오티드 서열을 수득하는 단계; (c) 식물 세포의 집단을 단계 (b)의 뉴클레오티드 서열로 형질 전환함으로써, 식물 세포의 집단 내에서 핵산 서열에 의해 인코딩되는 융합 단백질을 발현하는 단계; (d) 형질 전환된 식물 세포 집단을 식물로 성장시키는 단계로서, 식물의 적어도 하나가 편집되는 단계; 및 (e) 단계 (d)의 생성물로부터 적어도 하나의 편집된 식물을 선택함으로써, 편집된 식물의 집단을 수득하는 단계로서, 편집된 식물의 집단은 반복된 GGGGS 서열 이외의 제1 링커를 갖는 융합 단백질에 의해 편집된 식물에 비해 감소된 표적외 편집을 포함하는 단계에 의해, 감소된 표적외 편집으로 편집된 식물의 집단을 수득하는 방법이 제공된다. 일 양태에서, 융합 단백질을 인코딩하는 뉴클레오티드 서열은 SEQ ID NO: 17, SEQ ID NO: 24, SEQ ID NO: 35, SEQ ID NO: 39, SEQ ID NO: 43, SEQ ID NO: 50, SEQ ID NO: 52, SEQ ID NO: 54, SEQ ID NO: 56, SEQ ID NO: 81, SEQ ID NO: 83, SEQ ID NO: 85, SEQ ID NO:87, 또는 SEQ ID NO:89를 포함한다.
도 1은 Cas12aBE에 대한 세 가지 버전의 DNA 작제물의 개략도를 보여주는 것이다. (1)은 프로모터를 나타내고; (2)는 핵 국재화 신호를 나타내고; (3)은 데아미나제, 예를 들어, APOBEC 데아미나제이고; (4)는 XTEN 링커이고; (5)는 LbCas12a이고; (6)은 SGGS 링커이고; (7)은 우라실 글리코실라제 억제제이고; (8)은 긴 링커, 예를 들어, (G4S)6 링커이고; (9)는 Mb2Cas12a이고; (10)은 가이드 RNA-인코딩 요소이다. 도 1a는 5'에서 3' 방향의 LbCas12aBE + 가이드 RNA 작제물을 보여주는 것이고, 여기서 데아미나제(3)는 XTEN 링커(4)에 의해 LbCas12a(5)에 작동 가능하게 연결된다. 도 1b는 5'에서 3' 방향의 LbCas12aBE + 가이드 RNA 작제물을 보여주는 것이고, 여기서 데아미나제(3)는 (G4S)6 링커(8)에 의해 LbCas12a(5)에 작동 가능하게 연결된다. 도 1c는 5'에서 3' 방향으로 Mb2Cas12aBE + 가이드 RNA 작제물을 보여주는 것이고, 여기서 데아미나제(3)는 (G4S)6 링커(8)에 의해 Mb2Cas12a(9)에 작동 가능하게 연결된다.
도 2는 Cas12aBE 및 다중화된 가이드 RNA를 포함하는 5'에서 3' 방향의 DNA 작제물의 개략도를 보여주는 것이다. (1)은 프로모터를 나타내고; (2)는 핵 국재화 신호이고; (3)은 데아미나제, 예를 들어, APOBEC 데아미나제이고; (6)은 SGGS 링커이고; (7)은 우라실 글리코실라제 억제제이고; (8)은 긴 링커, 예를 들어, (G4S)6 링커이고; (9)는 Cas12a이고; (10)은 제1 가이드 RNA-인코딩 요소이고; (11)은 제2 가이드 RNA-인코딩 요소이고; (12)는 제3 가이드 RNA-인코딩 요소이다. 각각의 가이드 RNA-인코딩 요소는 게놈 표적 DNA 서열에 혼성화될 수 있는 crRNA 세그먼트 및 표적 서열 세그먼트를 포함한다.
서열 목록의 서열에 대한 간략한 설명
SEQ ID NO: 1은 Apobec1의 아미노산 서열이다.
SEQ ID NO: 2는 Apobec1의 뉴클레오티드 서열이다.
SEQ ID NO: 3은 촉매적 비활성 Mb2Cas12a의 아미노산 서열이다.
SEQ ID NO: 4는 촉매적 비활성 Mb2Cas12a의 뉴클레오티드 서열이다.
SEQ ID NO: 5는 촉매적 비활성 cLbCas12aBE의 뉴클레오티드 서열이다.
SEQ ID NO: 6은 촉매적 비활성 cLbCas12aBE의 아미노산 서열이다.
SEQ ID NO: 7은 우라실 DNA 글리코실라제 억제제(UGI)의 뉴클레오티드 서열이다.
SEQ ID NO: 8은 우라실 DNA 글리코실라제 억제제(UGI)의 아미노산 서열이다.
SEQ ID NO: 9는 발현 카세트 prSoUbi4:SV40NLS:cLbCas12aBE:GS6링커:SV40NLS:SGGS링커:UGI:SGGS링커:SV40NLS:tNOS를 포함하는 뉴클레오티드 서열이다.
SEQ ID NO: 10은 뉴클레오티드 서열 최적화된 (G4S)x6 링커이다.
SEQ ID NO: 11은 최적화된 (G4S)x6 링커에 대한 아미노산 서열이다.
SEQ ID NO: 12는 18 aa 링커-SX에 대한 아미노산 서열이다.
SEQ ID NO: 13은 15 aa 링커-(G4S)X3에 대한 아미노산 서열이다.
SEQ ID NO: 14는 작제물 25057로부터의 융합 단백질 cLBCas12aBE-07을 포함하는 뉴클레오티드 서열이다.
SEQ ID NO: 15는 작제물 25057로부터의 융합 단백질 cLBCas12aBE-07을 포함하는 아미노산 서열이다.
SEQ ID NO: 16은 작제물 25058로부터의 융합 단백질 cLBCas12aBE-08을 포함하는 뉴클레오티드 서열이다.
SEQ ID NO: 17은 작제물 25058로부터의 융합 단백질 cLBCas12aBE-08을 포함하는 아미노산 서열이다.
SEQ ID NO: 18은 작제물 24524로부터의 융합 단백질 cLBCas12aBE-01을 포함하는 뉴클레오티드 서열이다.
SEQ ID NO: 19는 작제물 24524로부터의 융합 단백질 cLBCas12aBE-01을 포함하는 아미노산 서열이다.
SEQ ID NO: 20은 cCas9BE-02에 대한 뉴클레오티드 서열이다.
SEQ ID NO: 21은 cCas9BE-02에 대한 아미노산 서열이다.
SEQ ID NO: 22는 촉매적 비활성 AsCas12a에 대한 아미노산 서열이다.
SEQ ID NO: 23은 작제물 24904로부터의 융합 단백질 cLBCas12aBE-06을 포함하는 뉴클레오티드 서열이다.
SEQ ID NO: 24는 작제물 24904로부터의 융합 단백질 cLBCas12aBE-06을 포함하는 아미노산 서열이다.
SEQ ID NO: 25는 프로모터 prSoUbi4-02를 포함하는 뉴클레오티드 서열이다.
SEQ ID NO: 26은 Cas12a gRNA waxy1 표적 서열을 포함하는 뉴클레오티드 서열이다.
SEQ ID NO: 27은 Cas9 gRNA waxy1 표적 서열을 포함하는 뉴클레오티드 서열이다.
SEQ ID NO: 28은 ZmWaxy1 유전자 엑손 4를 포함하는 뉴클레오티드 서열이다.
SEQ ID NO: 29는 ZmWaxy1에 대한 포워드 프라이머이다.
SEQ ID NO: 30은 ZmWaxy1에 대한 리버스 프라이머이다.
SEQ ID NO: 31은 ZmWaxy1에 대한 시퀀싱 프라이머이다.
SEQ ID NO: 32는 작제물 24523로부터의 융합 단백질 cLbCpf1-02를 포함하는 뉴클레오티드 서열이다.
SEQ ID NO: 33은 작제물 24523로부터의 융합 단백질 cLbCpf1-02를 포함하는 아미노산 서열이다.
SEQ ID NO: 34는 작제물 25181로부터의 융합 단백질 cLbCas12a-05를 포함하는 뉴클레오티드 서열이다.
SEQ ID NO: 35는 작제물 25181로부터의 융합 단백질 cLbCas12a-05를 포함하는 아미노산 서열이다.
SEQ ID NO: 36은 작제물 25205로부터의 융합 단백질 cLbCas12a-02를 포함하는 뉴클레오티드 서열이다.
SEQ ID NO: 37은 작제물 25205로부터의 융합 단백질 cLbCas12a-02를 포함하는 아미노산 서열이다.
SEQ ID NO: 38은 작제물 25513으로부터의 융합 단백질 cLbCas12a-25를 포함하는 뉴클레오티드 서열이다.
SEQ ID NO: 39는 작제물 25513으로부터의 융합 단백질 cLbCas12a-25를 포함하는 아미노산 서열이다.
SEQ ID NO: 40은 작제물 25220으로부터의 융합 단백질 cMb2Cas12a-01을 포함하는 뉴클레오티드 서열이다.
SEQ ID NO: 41은 작제물 25220으로부터의 융합 단백질 cMb2Cas12a-01을 포함하는 아미노산 서열이다.
SEQ ID NO: 42는 작제물 25382으로부터의 융합 단백질 cMb2Cas12a-02를 포함하는 뉴클레오티드 서열이다.
SEQ ID NO: 43은 작제물 25382로부터의 융합 단백질 cMb2Cas12a-02를 포함하는 아미노산 서열이다.
SEQ ID NO: 44는 최적화된 (G4SG)x6 링커에 대한 아미노산 서열이다.
SEQ ID NO: 45는 활성 LbCas12a에 대한 아미노산 서열이다.
SEQ ID NO: 46은 활성 Mb2Cas12a에 대한 아미노산 서열이다.
SEQ ID NO: 47은 활성 AsCas12a에 대한 아미노산 서열이다.
SEQ ID NO: 48은 활성 FnCas12a에 대한 아미노산 서열이다.
SEQ ID NO: 49는 작제물 25457로부터의 융합 단백질 cMb2Cas12a-BE-01을 포함하는 뉴클레오티드 서열이다.
SEQ ID NO: 50은 작제물 25457로부터의 융합 단백질 cMb2Cas12a-BE-01을 포함하는 아미노산 서열이다.
SEQ ID NO: 51은 작제물 25268로부터의 융합 단백질 cLbCas12a-BE-08을 포함하는 뉴클레오티드 서열이다.
SEQ ID NO: 52는 작제물 25268로부터의 융합 단백질 cLbCas12a-BE-08을 포함하는 아미노산 서열이다.
SEQ ID NO: 53은 작제물 25173으로부터의 융합 단백질 cLbCas12a-05를 포함하는 뉴클레오티드 서열이다.
SEQ ID NO: 54는 작제물 25173으로부터의 융합 단백질 cLbCas12a-05를 포함하는 아미노산 서열이다.
SEQ ID NO: 55는 작제물 25175으로부터의 융합 단백질 cLbCas12a-05를 포함하는 뉴클레오티드 서열이다.
SEQ ID NO: 56은 작제물 25175로부터의 융합 단백질 cLbCas12a-05를 포함하는 아미노산 서열이다.
SEQ ID NO: 57은 최적화된 (G4SG)6 링커를 갖는 촉매적 비활성 LbCas12a의 아미노산 서열이다.
SEQ ID NO: 58은 최적화된 (G4S)6 링커를 갖는 활성 Mb2Cas12a의 아미노산 서열이다.
SEQ ID NO: 59는 XTEN 링커를 갖는 촉매적 비활성 Mb2Cas12a의 아미노산 서열이다.
SEQ ID NO: 60은 XTEN 링커를 갖는 활성 AsCas12a의 아미노산 서열이다.
SEQ ID NO: 61은 XTEN 링커를 갖는 촉매적 비활성 AsCas12a의 아미노산 서열이다.
SEQ ID NO: 62는 XTEN 링커를 갖는 활성 FnCas12a의 아미노산 서열이다.
SEQ ID NO: 63은 최적화된 (G4S)6 링커를 갖는 활성 AsCas12a의 아미노산 서열이다.
SEQ ID NO: 64는 최적화된 (G4S)6 링커를 갖는 촉매적 비활성 AsCas12a의 아미노산 서열이다.
SEQ ID NO: 65는 최적화된 (G4S)6 링커를 갖는 활성 FnCas12a의 아미노산 서열이다.
SEQ ID NO: 66은 최적화된 (G4SG)6 링커를 갖는 촉매적 비활성 Mb2Cas12a의 아미노산 서열이다.
SEQ ID NO: 67은 최적화된 (G4SG)6 링커를 갖는 활성 AsCas12a의 아미노산 서열이다.
SEQ ID NO: 68은 최적화된 (G4SG)6 링커를 갖는 촉매적 비활성 AsCas12a의 아미노산 서열이다.
SEQ ID NO: 69는 최적화된 (G4SG)6 링커를 갖는 활성 FnCas12a의 아미노산 서열이다.
SEQ ID NO: 70은 XTEN 링커의 아미노산 서열이다.
SEQ ID NO: 71은 Cas12a gRNA SBEII 표적 서열을 포함하는 뉴클레오티드 서열이다.
SEQ ID NO: 72는 Cas12a gRNA GL2 표적 서열을 포함하는 뉴클레오티드 서열이다.
SEQ ID NO: 73은 Cas12a gRNA Fad2 표적 서열을 포함하는 뉴클레오티드 서열이다.
SEQ ID NO: 74는 waxy1, SBEII, 및 Fad2 표적 서열과 사용된 Cas12a crRNA 서열을 포함하는 뉴클레오티드 서열이다.
SEQ ID NO: 75는 GL2 표적 서열과 함께 사용된 Cas12a crRNA 서열을 포함하는 뉴클레오티드 서열이다.
SEQ ID NO: 76은 작제물 24785로부터의 융합 단백질 cCas9ABE-01을 포함하는 뉴클레오티드 서열이다.
SEQ ID NO: 77은 작제물 24785로부터의 융합 단백질 cCas9ABE-01을 포함하는 아미노산 서열이다.
SEQ ID NO: 78은 작제물 25459로부터의 융합 단백질 cLbCas1aABE-01을 포함하는 뉴클레오티드 서열이다.
SEQ ID NO: 79는 작제물 25459로부터의 융합 단백질 cLbCas1aABE-01을 포함하는 아미노산 서열이다.
SEQ ID NO: 80은 작제물 25504로부터의 융합 단백질 cLbCas12aABE-02를 포함하는 뉴클레오티드 서열이다.
SEQ ID NO: 81은 작제물 25504로부터의 융합 단백질 cLbCas12aABE-02를 포함하는 아미노산 서열이다.
SEQ ID NO: 82는 작제물 25289로부터의 융합 단백질 cLbCas12aBE-09를 포함하는 뉴클레오티드 서열이다.
SEQ ID NO: 83은 작제물 25289로부터의 융합 단백질 cLbCas12aBE-09를 포함하는 아미노산 서열이다.
SEQ ID NO: 84는 작제물 25658로부터의 융합 단백질 cdLbCas12a-ABE-CBE-01을 포함하는 뉴클레오티드 서열이다.
SEQ ID NO: 85는 작제물 25658로부터의 융합 단백질 cdLbCas12a-ABE-CBE-01을 포함하는 아미노산 서열이다.
SEQ ID NO: 86은 작제물 25701로부터의 융합 단백질 cdLbCas12a-ABE-CBE-02를 포함하는 뉴클레오티드 서열이다.
SEQ ID NO: 87은 작제물 25701로부터의 융합 단백질 cdLbCas12a-ABE-CBE-02를 포함하는 아미노산 서열이다.
SEQ ID NO: 88은 작제물 25702로부터의 융합 단백질 cdLbCas12a-ABE-CBE-03을 포함하는 뉴클레오티드 서열이다.
SEQ ID NO: 89는 작제물 25702로부터의 융합 단백질 cdLbCas12a-ABE-CBE-03을 포함하는 아미노산 서열이다.
SEQ ID NO: 90은 Cas12a gRNA ADH1 표적 서열을 포함하는 뉴클레오티드 서열이다.
SEQ ID NO: 91은 TadA 이량체를 포함하는 뉴클레오티드 서열이다.
SEQ ID NO: 92는 TadA 이량체를 포함하는 아미노산 서열이다.
도 2는 Cas12aBE 및 다중화된 가이드 RNA를 포함하는 5'에서 3' 방향의 DNA 작제물의 개략도를 보여주는 것이다. (1)은 프로모터를 나타내고; (2)는 핵 국재화 신호이고; (3)은 데아미나제, 예를 들어, APOBEC 데아미나제이고; (6)은 SGGS 링커이고; (7)은 우라실 글리코실라제 억제제이고; (8)은 긴 링커, 예를 들어, (G4S)6 링커이고; (9)는 Cas12a이고; (10)은 제1 가이드 RNA-인코딩 요소이고; (11)은 제2 가이드 RNA-인코딩 요소이고; (12)는 제3 가이드 RNA-인코딩 요소이다. 각각의 가이드 RNA-인코딩 요소는 게놈 표적 DNA 서열에 혼성화될 수 있는 crRNA 세그먼트 및 표적 서열 세그먼트를 포함한다.
서열 목록의 서열에 대한 간략한 설명
SEQ ID NO: 1은 Apobec1의 아미노산 서열이다.
SEQ ID NO: 2는 Apobec1의 뉴클레오티드 서열이다.
SEQ ID NO: 3은 촉매적 비활성 Mb2Cas12a의 아미노산 서열이다.
SEQ ID NO: 4는 촉매적 비활성 Mb2Cas12a의 뉴클레오티드 서열이다.
SEQ ID NO: 5는 촉매적 비활성 cLbCas12aBE의 뉴클레오티드 서열이다.
SEQ ID NO: 6은 촉매적 비활성 cLbCas12aBE의 아미노산 서열이다.
SEQ ID NO: 7은 우라실 DNA 글리코실라제 억제제(UGI)의 뉴클레오티드 서열이다.
SEQ ID NO: 8은 우라실 DNA 글리코실라제 억제제(UGI)의 아미노산 서열이다.
SEQ ID NO: 9는 발현 카세트 prSoUbi4:SV40NLS:cLbCas12aBE:GS6링커:SV40NLS:SGGS링커:UGI:SGGS링커:SV40NLS:tNOS를 포함하는 뉴클레오티드 서열이다.
SEQ ID NO: 10은 뉴클레오티드 서열 최적화된 (G4S)x6 링커이다.
SEQ ID NO: 11은 최적화된 (G4S)x6 링커에 대한 아미노산 서열이다.
SEQ ID NO: 12는 18 aa 링커-SX에 대한 아미노산 서열이다.
SEQ ID NO: 13은 15 aa 링커-(G4S)X3에 대한 아미노산 서열이다.
SEQ ID NO: 14는 작제물 25057로부터의 융합 단백질 cLBCas12aBE-07을 포함하는 뉴클레오티드 서열이다.
SEQ ID NO: 15는 작제물 25057로부터의 융합 단백질 cLBCas12aBE-07을 포함하는 아미노산 서열이다.
SEQ ID NO: 16은 작제물 25058로부터의 융합 단백질 cLBCas12aBE-08을 포함하는 뉴클레오티드 서열이다.
SEQ ID NO: 17은 작제물 25058로부터의 융합 단백질 cLBCas12aBE-08을 포함하는 아미노산 서열이다.
SEQ ID NO: 18은 작제물 24524로부터의 융합 단백질 cLBCas12aBE-01을 포함하는 뉴클레오티드 서열이다.
SEQ ID NO: 19는 작제물 24524로부터의 융합 단백질 cLBCas12aBE-01을 포함하는 아미노산 서열이다.
SEQ ID NO: 20은 cCas9BE-02에 대한 뉴클레오티드 서열이다.
SEQ ID NO: 21은 cCas9BE-02에 대한 아미노산 서열이다.
SEQ ID NO: 22는 촉매적 비활성 AsCas12a에 대한 아미노산 서열이다.
SEQ ID NO: 23은 작제물 24904로부터의 융합 단백질 cLBCas12aBE-06을 포함하는 뉴클레오티드 서열이다.
SEQ ID NO: 24는 작제물 24904로부터의 융합 단백질 cLBCas12aBE-06을 포함하는 아미노산 서열이다.
SEQ ID NO: 25는 프로모터 prSoUbi4-02를 포함하는 뉴클레오티드 서열이다.
SEQ ID NO: 26은 Cas12a gRNA waxy1 표적 서열을 포함하는 뉴클레오티드 서열이다.
SEQ ID NO: 27은 Cas9 gRNA waxy1 표적 서열을 포함하는 뉴클레오티드 서열이다.
SEQ ID NO: 28은 ZmWaxy1 유전자 엑손 4를 포함하는 뉴클레오티드 서열이다.
SEQ ID NO: 29는 ZmWaxy1에 대한 포워드 프라이머이다.
SEQ ID NO: 30은 ZmWaxy1에 대한 리버스 프라이머이다.
SEQ ID NO: 31은 ZmWaxy1에 대한 시퀀싱 프라이머이다.
SEQ ID NO: 32는 작제물 24523로부터의 융합 단백질 cLbCpf1-02를 포함하는 뉴클레오티드 서열이다.
SEQ ID NO: 33은 작제물 24523로부터의 융합 단백질 cLbCpf1-02를 포함하는 아미노산 서열이다.
SEQ ID NO: 34는 작제물 25181로부터의 융합 단백질 cLbCas12a-05를 포함하는 뉴클레오티드 서열이다.
SEQ ID NO: 35는 작제물 25181로부터의 융합 단백질 cLbCas12a-05를 포함하는 아미노산 서열이다.
SEQ ID NO: 36은 작제물 25205로부터의 융합 단백질 cLbCas12a-02를 포함하는 뉴클레오티드 서열이다.
SEQ ID NO: 37은 작제물 25205로부터의 융합 단백질 cLbCas12a-02를 포함하는 아미노산 서열이다.
SEQ ID NO: 38은 작제물 25513으로부터의 융합 단백질 cLbCas12a-25를 포함하는 뉴클레오티드 서열이다.
SEQ ID NO: 39는 작제물 25513으로부터의 융합 단백질 cLbCas12a-25를 포함하는 아미노산 서열이다.
SEQ ID NO: 40은 작제물 25220으로부터의 융합 단백질 cMb2Cas12a-01을 포함하는 뉴클레오티드 서열이다.
SEQ ID NO: 41은 작제물 25220으로부터의 융합 단백질 cMb2Cas12a-01을 포함하는 아미노산 서열이다.
SEQ ID NO: 42는 작제물 25382으로부터의 융합 단백질 cMb2Cas12a-02를 포함하는 뉴클레오티드 서열이다.
SEQ ID NO: 43은 작제물 25382로부터의 융합 단백질 cMb2Cas12a-02를 포함하는 아미노산 서열이다.
SEQ ID NO: 44는 최적화된 (G4SG)x6 링커에 대한 아미노산 서열이다.
SEQ ID NO: 45는 활성 LbCas12a에 대한 아미노산 서열이다.
SEQ ID NO: 46은 활성 Mb2Cas12a에 대한 아미노산 서열이다.
SEQ ID NO: 47은 활성 AsCas12a에 대한 아미노산 서열이다.
SEQ ID NO: 48은 활성 FnCas12a에 대한 아미노산 서열이다.
SEQ ID NO: 49는 작제물 25457로부터의 융합 단백질 cMb2Cas12a-BE-01을 포함하는 뉴클레오티드 서열이다.
SEQ ID NO: 50은 작제물 25457로부터의 융합 단백질 cMb2Cas12a-BE-01을 포함하는 아미노산 서열이다.
SEQ ID NO: 51은 작제물 25268로부터의 융합 단백질 cLbCas12a-BE-08을 포함하는 뉴클레오티드 서열이다.
SEQ ID NO: 52는 작제물 25268로부터의 융합 단백질 cLbCas12a-BE-08을 포함하는 아미노산 서열이다.
SEQ ID NO: 53은 작제물 25173으로부터의 융합 단백질 cLbCas12a-05를 포함하는 뉴클레오티드 서열이다.
SEQ ID NO: 54는 작제물 25173으로부터의 융합 단백질 cLbCas12a-05를 포함하는 아미노산 서열이다.
SEQ ID NO: 55는 작제물 25175으로부터의 융합 단백질 cLbCas12a-05를 포함하는 뉴클레오티드 서열이다.
SEQ ID NO: 56은 작제물 25175로부터의 융합 단백질 cLbCas12a-05를 포함하는 아미노산 서열이다.
SEQ ID NO: 57은 최적화된 (G4SG)6 링커를 갖는 촉매적 비활성 LbCas12a의 아미노산 서열이다.
SEQ ID NO: 58은 최적화된 (G4S)6 링커를 갖는 활성 Mb2Cas12a의 아미노산 서열이다.
SEQ ID NO: 59는 XTEN 링커를 갖는 촉매적 비활성 Mb2Cas12a의 아미노산 서열이다.
SEQ ID NO: 60은 XTEN 링커를 갖는 활성 AsCas12a의 아미노산 서열이다.
SEQ ID NO: 61은 XTEN 링커를 갖는 촉매적 비활성 AsCas12a의 아미노산 서열이다.
SEQ ID NO: 62는 XTEN 링커를 갖는 활성 FnCas12a의 아미노산 서열이다.
SEQ ID NO: 63은 최적화된 (G4S)6 링커를 갖는 활성 AsCas12a의 아미노산 서열이다.
SEQ ID NO: 64는 최적화된 (G4S)6 링커를 갖는 촉매적 비활성 AsCas12a의 아미노산 서열이다.
SEQ ID NO: 65는 최적화된 (G4S)6 링커를 갖는 활성 FnCas12a의 아미노산 서열이다.
SEQ ID NO: 66은 최적화된 (G4SG)6 링커를 갖는 촉매적 비활성 Mb2Cas12a의 아미노산 서열이다.
SEQ ID NO: 67은 최적화된 (G4SG)6 링커를 갖는 활성 AsCas12a의 아미노산 서열이다.
SEQ ID NO: 68은 최적화된 (G4SG)6 링커를 갖는 촉매적 비활성 AsCas12a의 아미노산 서열이다.
SEQ ID NO: 69는 최적화된 (G4SG)6 링커를 갖는 활성 FnCas12a의 아미노산 서열이다.
SEQ ID NO: 70은 XTEN 링커의 아미노산 서열이다.
SEQ ID NO: 71은 Cas12a gRNA SBEII 표적 서열을 포함하는 뉴클레오티드 서열이다.
SEQ ID NO: 72는 Cas12a gRNA GL2 표적 서열을 포함하는 뉴클레오티드 서열이다.
SEQ ID NO: 73은 Cas12a gRNA Fad2 표적 서열을 포함하는 뉴클레오티드 서열이다.
SEQ ID NO: 74는 waxy1, SBEII, 및 Fad2 표적 서열과 사용된 Cas12a crRNA 서열을 포함하는 뉴클레오티드 서열이다.
SEQ ID NO: 75는 GL2 표적 서열과 함께 사용된 Cas12a crRNA 서열을 포함하는 뉴클레오티드 서열이다.
SEQ ID NO: 76은 작제물 24785로부터의 융합 단백질 cCas9ABE-01을 포함하는 뉴클레오티드 서열이다.
SEQ ID NO: 77은 작제물 24785로부터의 융합 단백질 cCas9ABE-01을 포함하는 아미노산 서열이다.
SEQ ID NO: 78은 작제물 25459로부터의 융합 단백질 cLbCas1aABE-01을 포함하는 뉴클레오티드 서열이다.
SEQ ID NO: 79는 작제물 25459로부터의 융합 단백질 cLbCas1aABE-01을 포함하는 아미노산 서열이다.
SEQ ID NO: 80은 작제물 25504로부터의 융합 단백질 cLbCas12aABE-02를 포함하는 뉴클레오티드 서열이다.
SEQ ID NO: 81은 작제물 25504로부터의 융합 단백질 cLbCas12aABE-02를 포함하는 아미노산 서열이다.
SEQ ID NO: 82는 작제물 25289로부터의 융합 단백질 cLbCas12aBE-09를 포함하는 뉴클레오티드 서열이다.
SEQ ID NO: 83은 작제물 25289로부터의 융합 단백질 cLbCas12aBE-09를 포함하는 아미노산 서열이다.
SEQ ID NO: 84는 작제물 25658로부터의 융합 단백질 cdLbCas12a-ABE-CBE-01을 포함하는 뉴클레오티드 서열이다.
SEQ ID NO: 85는 작제물 25658로부터의 융합 단백질 cdLbCas12a-ABE-CBE-01을 포함하는 아미노산 서열이다.
SEQ ID NO: 86은 작제물 25701로부터의 융합 단백질 cdLbCas12a-ABE-CBE-02를 포함하는 뉴클레오티드 서열이다.
SEQ ID NO: 87은 작제물 25701로부터의 융합 단백질 cdLbCas12a-ABE-CBE-02를 포함하는 아미노산 서열이다.
SEQ ID NO: 88은 작제물 25702로부터의 융합 단백질 cdLbCas12a-ABE-CBE-03을 포함하는 뉴클레오티드 서열이다.
SEQ ID NO: 89는 작제물 25702로부터의 융합 단백질 cdLbCas12a-ABE-CBE-03을 포함하는 아미노산 서열이다.
SEQ ID NO: 90은 Cas12a gRNA ADH1 표적 서열을 포함하는 뉴클레오티드 서열이다.
SEQ ID NO: 91은 TadA 이량체를 포함하는 뉴클레오티드 서열이다.
SEQ ID NO: 92는 TadA 이량체를 포함하는 아미노산 서열이다.
이 설명은 본 발명이 구현될 수 있는 모든 다양한 방식 또는 본 발명에 추가될 수 있는 모든 특징의 상세한 카탈로그임을 뜻하는 것은 아니다. 예를 들어, 일 구현예에 대해 예시된 특징은 다른 구현예에 통합될 수 있고, 특정 구현예에 대해 예시된 특징은 그 구현예로부터 삭제될 수 있다. 또한, 본원에 제시된 다양한 구현예로의 많은 변화 및 추가가 본 개시를 고려하여 당업자에게 명백할 것이며, 이는 본 발명을 벗어나지 않는다. 따라서, 하기 설명은 본 발명의 일부 특정 구현예를 예시하고자 하는 것이며, 그의 모든 순열, 조합 및 변화를 망라적으로 명시하고자 하는 것이 아니다.
정의
달리 정의되지 않는 한, 본원에 사용되는 모든 기술적 및 학술적 용어는 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 갖는다. 본원의 발명의 설명에 사용된 용어는 특정 구현예를 설명하기 위한 것이며 본 발명을 제한하려는 것이 아니다. 본원에 언급된 모든 간행물, 특허 출원, 특허, 및 기타 참고 문헌은 그 전체가 참고로 포함된다.
하기 정의 및 방법은 본 발명을 더 잘 규정하고 본 발명의 실시에 있어서 당업자를 안내하기 위해 제공된다. 달리 언급되지 않는 한, 본 명세서에 사용된 용어는 관련 기술 분야의 통상의 지식을 가진 자에 의해 통상적인 용법에 따라 이해되어야 한다. 분자 생물학의 일반 용어의 정의는 문헌[Rieger et al., Glossary of Genetics: Classical and Molecular, 5th edition, Springer-Verlag, New York, 1994]에서도 찾을 수 있다.
본원에 사용되는 바와 같이, 용어 "긴 링커"는 관심있는 단백질에 이종성 도메인을 연결하는 데 사용된 적어도 10개 아미노산의 폴리펩티드 사슬을 지칭한다. 비제한적인 예로서, 긴 링커는 달리 (G4S)6 또는 (G4S)x6 또는 (G4S)*6으로 표현되는 서열 GGGGSGGGGSGGGGSGGGGSGGGGSGGGGS(SEQ ID NO: 11)을 포함할 수 있다. 긴 링커는 달리 (G4SG)6 또는 (G4SG)x6 또는 (G4SG)*6으로 표현되는 GGGGSGGGGGSGGGGGSGGGGGSGGGGGSGGGGGSG(SEQ ID NO: 44)를 포함할 수 있다. 단백질에 긴 링커에 의해 연결된 이종성 도메인은 시티딘 데아미나제, 구아닌 데아미나제, 우라실 글리코실라제 억제제("UGI"), 뉴클레아제, 및 관심있는 단백질에 이종성 방식으로 작동 가능하게 연결될 수 있는 임의의 다른 단백성 도메인을 포함한다. 관심있는 이러한 단백질은 부위-지정 뉴클레아제(예를 들어, Cas9, Cas12a, Cas12b, Cas12i, Cas12j, 또는 다른 CRISPR 뉴클레아제), 징크-핑거, 메가뉴클레아제, 전사 활성자-유사 이펙터 뉴클레아제("TALEN") 등을 포함하지만 이로 한정되지 않는다.
본 발명의 구현예의 설명 및 첨부된 청구 범위에 사용된 바와 같이, 단수 형태는 문맥이 달리 명확하게 지시하지 않는 한 복수 형태도 포함하도록 하고자 한다.
본원에 사용되는 바와 같이, "및/또는"은 하나 이상의 열거된 관련 항목들의 임의의 및 모든 가능한 조합을 지칭하고 이를 포함한다.
화합물의 양, 용량, 시간, 온도 등과 같은 측정 가능한 값을 지칭할 때 본원에 사용되는 바와 같은 용어 "약"은 명시된 양의 20%, 10%, 5%, 1%, 0.5%, 또는 심지어 0.1%의 변화를 포함하는 것을 의미한다.
본 명세서에서 사용될 때 "포함하다(comprise)", "포함하다(comprises)" 및/또는 "포함하는(comprising)"이라는 용어는 언급된 특징, 정수, 단계, 동작, 요소, 및/또는 구성 요소의 존재를 명시하지만, 하나 이상의 다른 특징, 정수, 단계, 동작, 요소, 구성 요소, 및/또는 그들의 그룹의 존재 또는 추가를 배제하지 않는다.
본원에 사용되는 바와 같이, "본질적으로 구성되는(consisting essentially of)"이라는 이행 문구는 청구항의 범주가 청구항에 언급된 특정 재료 또는 단계 및 청구된 발명의 기본 및 신규 특성(들)에 실질적으로 영향을 미치지 않는 재료 또는 단계를 포함하도록 해석되어야 함을 의미한다. 따라서, 본 발명의 청구항에 사용될 때 "본질적으로 구성되는"이라는 용어는 "포함하는"과 동등한 것으로 해석되는 것을 뜻하지 않는다.
본원에 사용되는 바와 같이, 용어 "증폭된"은 핵산 분자 중 적어도 하나를 주형으로 사용하여 핵산 분자의 다수의 카피 또는 핵산 분자에 상보적인 다수의 카피가 작제됨을 의미한다. 예를 들어, 문헌[Diagnostic Molecular Microbiology: Principles and Applications, D. H. Persing et al., Ed., American Society for Microbiology, Washington, D.C. (1993)]을 참조한다. 증폭의 산물은 앰플리콘으로 명명된다.
"코딩 서열"은 mRNA, rRNA, tRNA, snRNA, 센스 RNA 또는 안티센스 RNA와 같은 RNA로 전사되는 핵산 서열이다. 일부 구현예에서, RNA는 이어서 유기체에서 번역되어 단백질을 생성한다.
본원에 사용되는 바와 같은 트랜스제닉 "사건"이라는 용어는 이종 DNA를 갖는 단일 식물 세포의 형질 전환 및 재생, 예를 들어, 관심있는 하나 이상의 유전자(예를 들어, 트랜스진)를 포함하는 발현 카세트에 의해 생산된 재조합 식물을 지칭한다. 용어 "사건"은 본래의 형질 전환체 및/또는 이종 DNA를 포함하는 형질 전환체의 자손을 지칭한다. 용어 "사건"은 또한 형질 전환체와 또 다른 계통 사이의 성적 교배에 의해 생산된 자손을 지칭한다. 반복친에 대한 반복적인 역교배 후에도, 형질 전환된 모체로부터 삽입된 DNA 및 측접한 DNA는 동일한 염색체 위치에서 교배의 자손에 존재한다. 정상적으로, 식물 조직의 형질 전환은, 각각 식물 세포 게놈에서 상이한 위치에 DNA 작제물을 삽입하는 것을 나타내는 여러 사건을 생성한다. 트랜스진의 발현 또는 기타 바람직한 특성에 기초하여, 특정 사건이 선택된다. 따라서, 본원에 사용되는 바와 같은 "사건 MIR604," "MIR604" 또는 "MIR604 사건"은 본래의 MIR604 형질 전환체 및/또는 MIR604 형질 전환체의 자손을 의미한다(본원에 참고로 포함된 미국 특허 제7,361,813호, 제7,897,748호, 제8,354,519호, 및 제8,884,102호).
본원에 사용되는 바와 같은 "발현 카세트"는, 종결 신호에 작동 가능하게 연결된 관심있는 뉴클레오티드 서열, 전형적으로 코딩 영역에 작동 가능하게 연결된 프로모터를 포함하는, 적절한 숙주 세포에서 특정 뉴클레오티드 서열의 발현을 지시할 수 있는 핵산 분자를 의미한다. 이는 또한 전형적으로 뉴클레오티드 서열의 적절한 번역에 필요한 서열을 포함한다. 코딩 영역은 일반적으로 관심있는 단백질을 코딩하지만, 관심있는 기능적 RNA, 예를 들어 안티센스 RNA 또는 비번역 RNA도 코딩할 수 있다. 발현 카세트는 또한 관심있는 뉴클레오티드 서열의 직접적인 발현에 필요하지 않지만 발현 벡터로부터의 카세트의 제거를 위한 편리한 제한 부위로 인해 존재하는 서열을 포함할 수 있다. 관심있는 뉴클레오티드 서열을 포함하는 발현 카세트는 키메라일 수 있으며, 이는 그의 구성 요소들 중 적어도 하나가 그의 다른 구성 요소들 중 적어도 하나에 대해 이종성임을 의미한다. 발현 카세트는 또한, 자연 발생적이지만 이종성 발현에 유용한 재조합 형태로 수득된 것일 수 있다. 그러나, 전형적으로, 발현 카세트는 숙주에 대해 이종성이며, 즉, 발현 카세트의 특정 핵산 서열은 숙주 세포에서 자연적으로 발생하지 않은 것이며 당업계에 알려진 형질 전환 과정에 의해 숙주 세포 또는 숙주 세포의 조상에 도입되었던 것이어야 한다. 발현 카세트에서 뉴클레오티드 서열의 발현은 항시성 프로모터의 제어, 또는 숙주 세포가 어떤 특정 외부 자극에 노출된 경우에만 전사를 개시하는 유도성 프로모터의 제어하에 있을 수 있다. 식물과 같은 다세포 유기체의 경우, 프로모터는 또한 특정 조직, 또는 기관, 또는 발달기에 특이적일 수 있다. 발현 카세트 또는 그의 단편은 또한 식물 내로 형질 전환될 때 "삽입된 서열" 또는 "삽입 서열"로 지칭될 수 있다.
"유전자"는, 게놈 내에 위치하며, 앞서 언급된 코딩 핵산 서열 외에, 코딩 부분의 발현, 즉, 전사 및 번역의 제어를 담당하는 주로 조절 핵산 서열인 다른 핵산 서열을 포함하는 규정된 영역이다. 유전자는 코딩 및 비-코딩 영역(예를 들어, 인트론, 조절 요소, 프로모터, 인핸서, 종결 서열 및 5' 및 3' 비번역 영역) 둘 모두를 포함할 수 있다. 유전자는 전형적으로 mRNA, 기능성 RNA, 또는 조절 서열을 포함하는 특정 단백질을 발현한다. 유전자는 기능성 단백질을 생성하는 데 사용 가능하거나 사용 가능하지 않을 수 있다. 일부 구현예에서, 유전자는 코딩 영역만을 지칭한다. 용어 "천연 유전자"는 자연계에서 발견되는 유전자를 지칭한다. 용어 "키메라 유전자"는 1) 자연계에서 함께 발견되지 않는 조절 및 코딩 서열을 포함하는 DNA 서열, 또는 2) 자연적으로 결합되지 않은 단백질의 일부를 인코딩하는 서열, 또는 3) 자연적으로 결합되지 않은 프로모터의 일부를 함유하는 임의의 유전자를 지칭한다. 따라서, 키메라 유전자는 상이한 공급원으로부터 유래된 조절 서열 및 코딩 서열을 포함할 수 있거나, 동일한 공급원으로부터 유래되지만 자연계에서 발견되는 것과 상이한 방식으로 배열된 조절 서열 및 코딩 서열을 포함할 수 있다. 유전자는 "분리"될 수 있으며, 이는 정상적으로 자연 상태에서 핵산 분자와 결부된 상태로 발견되는 구성 요소가 실질적으로 또는 본질적으로 없는 핵산 분자를 의미한다. 그러한 구성 요소는 다른 세포 물질, 재조합 생산으로부터의 배양 배지, 및/또는 핵산 분자를 화학적으로 합성하는 데 사용되는 다양한 화학 물질을 포함한다.
폴리뉴클레오티드 코딩 서열을 "발현하는" 또는 그의 "발현"이라는 용어는 서열이 전사되고 선택적으로 번역됨을 의미한다.
"관심있는 유전자" 또는 "관심있는 뉴클레오티드 서열"은 식물로 전달될 때 식물에 항생제 저항성, 바이러스 저항성, 곤충 저항성, 질병 저항성, 또는 다른 해충에 대한 저항성, 제초제 내성, 영양가 개선, 산업적 공정에서의 성능 개선 또는 생식 능력 변경과 같은 원하는 특성을 부여하는 임의의 유전자를 지칭한다. "관심있는 유전자"는 또한 식물에서 상업적으로 가치있는 효소 또는 대사 산물의 생산을 위해 식물로 전달되는 것일 수 있다.
본원에 사용되는 바와 같이, "이종성"은, 자연 발생적 핵산 서열의 다수의 비-자연 발생적 카피를 포함하는, 또 다른 종으로부터 유래하거나 동일한 종 또는 유기체로부터 비롯되지만 원래 형태 또는 세포에서 주로 발현되는 형태로부터 변형된, 도입되는 숙주 세포와 자연적으로 결부되어 있지 않은 핵산 분자 또는 뉴클레오티드 서열을 지칭한다. 따라서, 뉴클레오티드 서열이 도입된 세포와 상이한 유기체 또는 종으로부터 유래된 뉴클레오티드 서열은 그 세포 및 세포의 후손에 대해 이종성이다. 또한, 이종성 뉴클레오티드 서열은, 동일한 천연의 원래 세포 유형으로부터 유래되어 그로 삽입되지만 비천연 상태로 존재하는, 예를 들어, 핵산 분자의 천연 상태에서 발견되는 것과 상이한 카피 수로 존재하고/하거나 상이한 조절 서열의 제어하에 있는 뉴클레오티드 서열을 포함한다. 핵산 서열은 또한, 예를 들어 발현 벡터와 같은 핵산 작제물에서 이것이 결부될 수 있는 다른 핵산 서열에 이종성일 수 있다. 하나의 비-제한적 예로서, 프로모터는, 그 특정 프로모터와 결부된 상태로 자연적으로 발생하지 않는, 즉, 프로모터에 대해 이종성인 하나 이상의 조절 요소 및/또는 코딩 서열과 조합되어 핵산 작제물에 존재할 수 있다.
"상동성" 핵산 서열은 이것이 도입되는 숙주 세포와 자연적으로 결부된 핵산 서열이다. 상동성 핵산 서열은 또한, 예를 들어, 핵산 작제물에 존재할 수 있는 다른 핵산 서열과 자연적으로 결부된 핵산 서열일 수 있다. 하나의 비-제한적 예로서, 프로모터는, 그 특정 프로모터와 결부된 상태로 자연적으로 발생하는, 즉, 프로모터에 대해 상동성인 하나 이상의 조절 요소 및/또는 코딩 서열과 조합되어 핵산 작제물에 존재할 수 있다.
"작동 가능하게 연결된"은 단일 핵산 서열 상에서 핵산 서열들이 결부됨으로써 하나의 핵산 서열의 기능이 다른 하나의 핵산 서열의 기능에 영향을 미침을 지칭한다. 예를 들어, 프로모터는 이것이 코딩 서열 또는 기능적 RNA의 발현에 영향을 미칠 수 있는(즉, 코딩 서열 또는 기능적 RNA가 프로모터의 전사 제어하에 있는) 경우 그 코딩 서열 또는 기능적 RNA와 작동 가능하게 연결된 것이다. 센스 또는 안티센스 배향의 코딩 서열은 조절 서열에 작동 가능하게 연결될 수 있다. 따라서, 뉴클레오티드 서열과 작동적으로 결부된 조절 또는 제어 서열(예를 들어, 프로모터)은 뉴클레오티드 서열의 발현을 수행할 수 있다. 예를 들어, GFP를 인코딩하는 뉴클레오티드 서열에 작동 가능하게 연결된 프로모터는 그 GFP 뉴클레오티드 서열의 발현을 수행할 수 있을 것이다.
제어 서열은 관심있는 뉴클레오티드 서열의 발현을 지시하는 기능을 하는 한 그 뉴클레오티드 서열과 인접할 필요는 없다. 따라서, 예를 들어, 번역되지 않았지만 전사된 개재 서열이 프로모터와 코딩 서열 사이에 존재할 수 있고, 프로모터 서열은 여전히 코딩 서열에 "작동 가능하게 연결된"것으로 간주될 수 있다.
본원에 사용되는 바와 같은 "프라이머"는, 핵산 하이브리드화에 의해 상보적 표적 DNA 가닥에 어닐링되어 프라이머와 표적 DNA 가닥 사이에 하이브리드를 형성하고, 이어서 DNA 중합 효소와 같은 중합 효소에 의해 표적 DNA 가닥을 따라 신장되는 분리된 핵산이다. 프라이머 쌍 또는 세트는, 예를 들어, 중합 효소 연쇄 반응(PCR) 또는 다른 핵산 증폭 방법에 의한 핵산 분자의 증폭에 사용될 수 있다.
"프로브"는 표적 핵산 분자의 일부에 상보적인 분리된 핵산 분자이며, 전형적으로 표적 핵산 분자를 검출하고/하거나 정량화하는 데 사용된다. 따라서, 일부 구현예에서, 프로브는 방사성 동위 원소, 리간드, 화학 발광제, 형광제 또는 효소와 같은 검출 가능한 모이어티 또는 리포터 분자가 부착된 분리된 핵산 분자일 수 있다. 본 발명에 따른 프로브는 데옥시리보핵산 또는 리보핵산뿐만 아니라 폴리아미드, 및 표적 핵산 서열에 특이적으로 결합하는 다른 프로브 물질을 포함할 수 있으며, 그 표적 핵산의 존재를 검출하고/하거나 그 표적 핵산의 양을 정량화하는 데 사용될 수 있다.
TaqMan 프로브는 특이적 프라이머 세트에 의해 증폭된 DNA 영역 내에서 어닐링되도록 설계된다. Taq 중합 효소가 프라이머를 신장시키고 상보적 가닥의 3'에서 5'로 단일-가닥 주형으로부터 초기 가닥을 합성함에 따라, 중합 효소의 5'→3' 엑소뉴클레아제는 프로브를 통해 초기 가닥을 신장시키고 결과적으로 주형에 어닐링된 프로브를 분해한다. 프로브의 분해는 그로부터 형광단을 방출하고 켄처에 대한 밀접 근접성을 깨뜨림으로써 켄칭 효과를 완화하고 형광단의 형광을 허용한다. 따라서, 정량적 PCR 써멀 사이클러(thermal cycler)에서 검출된 형광은 방출된 형광단, 및 PCR에 존재하는 DNA 주형의 양에 정비례한다.
프라이머 및 프로브는 일반적으로 길이가 5개 내지 100개 이상의 뉴클레오티드 길이이다. 일부 구현예에서, 프라이머 및 프로브는 적어도 20개 이상의 뉴클레오티드 길이, 또는 적어도 25개 이상의 뉴클레오티드 길이, 또는 적어도 30개 이상의 뉴클레오티드 길이일 수 있다. 그러한 프라이머 및 프로브는 당업계에 알려진 바와 같은 최적의 하이브리드화 조건하에서 표적 서열에 특이적으로 하이브리드화된다. 본 발명에 따른 프라이머 및 프로브는 표적 서열과의 완전한 서열 상보성을 가질 수 있지만, 표적 서열과 다르며 표적 서열에 하이브리드화되는 능력을 보유하는 프로브가 본 발명에 따른 통상적인 방법에 의해 설계될 수 있다.
프로브 및 프라이머를 제조하고 사용하는 방법은, 예를 들어, 문헌[Molecular Cloning: A Laboratory Manual, 2nd ed., vol. 1-3, ed. Sambrook et al., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y., 1989]에 기술되어 있다. PCR-프라이머 쌍은, 예를 들어, 그 목적을 위해 의도된 컴퓨터 프로그램을 사용함으로써 알려진 서열로부터 유도될 수 있다.
중합 효소 연쇄 반응(PCR)은 특정 DNA 조각을 "증폭"시키는 기법이다. PCR을 수행하기 위해서는, 복제하려는 DNA 분자의 뉴클레오티드 서열의 적어도 일부가 알려져 있어야 한다. 일반적으로, 증폭하려는 DNA의 각 가닥의 3' 말단에 있는 뉴클레오티드 서열(알려진 서열)에 상보적인(예를 들어, 실질적으로 상보적이거나 완전히 상보적인) 프라이머 또는 짧은 올리고뉴클레오티드가 사용된다. DNA 샘플을 가열하여 그의 가닥들을 분리하고, 이를 프라이머와 혼합한다. 프라이머들은 DNA 샘플에서 그들의 상보적 서열에 하이브리드화된다. 합성은 원래 DNA 가닥을 주형으로 사용하여 (5'에서 3' 방향으로) 시작된다. 반응 혼합물은 4개의 데옥시뉴클레오티드 트리포스페이트(dATP, dCTP, dGTP 및 dTTP) 및 DNA 중합 효소를 모두 함유해야 한다. 중합은 새로 합성된 각 가닥이 다른 프라이머에 의해 인식되는 서열을 포함할 정도로 충분히 진행될 때까지 계속된다. 일단 이것이 발생하면, 원래 분자와 동일한 2개의 DNA 분자가 생성된다. 이러한 2개의 분자를 가열하여 그들의 가닥을 분리하고, 과정을 반복한다. 각 사이클은 DNA 분자의 수를 배증시킨다. 자동화된 장비를 사용하면, 각 복제 사이클이 5분 미만 내에 완료될 수 있다. 30회 사이클 후, DNA의 단일 분자로 시작된 것이 10억 개(230 = 1.02 x 109) 초과의 카피로 증폭되었다.
올리고뉴클레오티드 프라이머 쌍의 올리고뉴클레오티드는, 반대 DNA 가닥에 위치하고 증폭될 영역에 측접한 DNA 서열에 상보적이다. 어닐링된 프라이머는 새로 합성된 DNA 가닥에 하이브리드화된다. 제1 증폭 사이클은 5' 말단이 올리고뉴클레오티드 프라이머의 위치에 의해 고정되지만 3' 말단이 가변적인('고르지 않은' 3' 말단) 두 개의 새로운 DNA 가닥을 생성할 것이다. 두 개의 새로운 가닥은 결국 요망되는 길이의 상보적 가닥의 합성을 위한 주형으로서 작용할 수 있다(5' 말단은 프라이머에 의해 한정되고, 3' 말단은 고정되는데, 그 이유는 합성이 반대 프라이머의 말단을 지나 진행될 수 없기 때문이다). 몇 사이클 후에, 요망되는 고정된 길이의 산물이 우세하기 시작한다.
실시간 중합 효소 연쇄 반응으로도 지칭되는 정량적 중합 효소 연쇄 반응(qPCR)은 실시간으로 PCR 반응으로부터의 DNA 산물의 축적을 모니터링한다. qPCR은 중합 효소 연쇄 반응(PCR)에 기반한 분자 생물학의 실험실용 기법으로서, 표적화된 DNA 분자를 증폭하고 동시에 정량화하는 데 사용된다. 특정 서열의 1개 카피라도 PCR에서 증폭되어 검출될 수 있다. PCR 반응은 DNA 주형의 카피를 기하급수적으로 생성한다. 이는 출발 표적 서열의 양과 임의의 특정 사이클에서 축적된 PCR 산물의 양 사이의 정량적 관계를 초래한다. 주형과 함께 발견되는 중합 효소 반응의 억제제, 시약 제한 또는 피로포스페이트 분자의 축적으로 인해, PCR 반응은 결국 기하급수적 속도로 주형 생성을 멈추며(즉, 안정기), 이는 PCR 산물의 종점 정량화를 신뢰할 수 없게 한다. 따라서, 중복(duplicate) 반응은 가변적인 양의 PCR 산물을 생성할 수 있다. PCR 반응의 대수기 동안에만 주형 서열의 출발 수량을 결정하기 위해 역외삽에 의해 추정하는 것이 가능하다. PCR 산물이 축적됨에 따른 그의 측정(즉, 실시간 정량적 PCR)은 반응의 대수기에서의 정량화를 가능하게 하며, 그에 따라 통상적인 PCR과 관련된 가변성을 제거한다. 실시간 PCR 검정에서, 양성 반응은 형광 신호의 축적에 의해 검출된다. DNA 샘플 내의 하나 이상의 특정 서열에 대해, 정량적 PCR은 검출 및 정량화 둘 모두를 가능하게 한다. 수량은 절대 카피 수, 또는 DNA 입력 또는 추가 정규화 유전자에 대해 정규화될 때의 상대적인 양일 수 있다. 실시간 PCR이 최초로 기록된 이래로, 이는 mRNA 발현 연구, 게놈 또는 바이러스 DNA에서 DNA 카피 수 측정, 대립 형질 식별 검정, 유전자의 특정 스플라이스 변이체의 발현 분석 및 파라핀-포매 조직 및 레이저 포획된 미세-절제 세포에서의 유전자 발현을 포함하는 점점 더 많은 다양한 응용 분야에 사용되어 왔다.
본원에 사용되는 바와 같이, "Ct 값"이라는 문구는 "증폭된 표적의 양이 고정된 임계값에 이르는 부분 사이클 수"로서 규정되는 "임계 사이클"을 지칭한다. 일부 구현예에서, 이는 증폭 곡선과 임계선 사이의 교차점을 나타낸다. 증폭 곡선은 전형적으로 주어진 사이클(X-축)에서 각 반응의 상대 형광 변화(Y-축)를 지시하는 "S" 모양이며, 이는 일부 구현예에서 PCR 동안 실시간 PCR 기기에 의해 기록된다. 임계선은 일부 구현예에서 반응이 배경보다 높은 형광 강도에 이르는 검출 수준이다. 문헌[Livak & Schmittgen (2001) 25 Methods 402-408]을 참조한다. 이는 PCR에서 표적의 농도의 상대 척도이다. 일반적으로, qPCR과 같은 정량적 검정에 대한 우수한 Ct 값은 일부 구현예에서, 주어진 참조 유전자의 경우 10 내지 40의 범위이다. Ct 수준은 샘플 중 표적 핵산의 양에 반비례한다(즉, Ct 수준이 낮을수록 샘플에서 검출 가능한 표적 핵산의 양이 많아진다). 추가적으로, qPCR과 같은 정량적 검정에 대한 우수한 Ct 값은 표적 gDNA의 비례 희석으로 선형 반응 범위를 나타낸다.
일부 구현예에서, qPCR은 Ct 값이 정량적 분석에 대하여 실시간으로 수집될 수 있는 조건 하에 수행된다. 예를 들어, 전형적인 qPCR 실험에서, DNA 증폭은 확장기 동안 PCR의 각 사이클에 모니터링된다. 형광의 양은 일반적으로 DNA가 증폭의 로그 선형 단계에 있을 때 배경보다 높게 증가한다. 일부 구현예에서, 이 시점에 Ct 값이 수집된다.
본원에 사용되는 바와 같이, 용어 "세포"는 임의의 살아있는 세포를 지칭한다. 세포는 원핵 또는 진핵 세포일 수 있다. 세포는 분리된 것일 수 있다. 세포는 유기체로 재생될 수 있거나 재생되지 않을 수 있다. 세포는 조직, 캘러스, 배양물, 기관, 또는 부분과 관련하여 존재할 수 있다. 일부 구현예에서, 세포는 식물 세포일 수 있다. 본 발명의 식물 세포는 분리된 단일 세포의 형태로 존재할 수 있거나, 배양된 세포일 수 있거나, 예를 들어 식물 조직 또는 식물 기관과 같은 상위-체계 단위의 일부일 수 있다. 식물 세포는 속씨식물 또는 겉씨식물로부터 유래되거나 그 일부일 수 있다. 추가 구현예에서, 식물 세포는 외떡잎 식물 세포, 쌍떡잎 식물 세포일 수 있다. 외떡잎 식물 세포는, 예를 들어, 메이즈(maize), 벼, 수수, 사탕 수수, 보리, 밀, 귀리, 떼잔디(turf grass), 또는 장식용 잔디 세포일 수 있다. 쌍떡잎 식물 세포는, 예를 들어, 담배, 후추, 가지, 해바라기, 십자화과 식물, 아마, 감자, 면화, 대두, 슈가 비(sugar bee), 또는 유채 세포일 수 있다.
본원에 사용된 바와 같은 용어 "식물 부분"은 배아, 꽃가루, 밑씨, 종자, 잎, 줄기, 싹, 꽃, 가지, 열매, 속씨, 이삭, 속대, 겉껍질, 대(stalk), 뿌리, 뿌리 끝, 꽃밥, 식물 및/또는 식물의 일부에서 온전한 식물 세포를 비롯한 식물 세포, 식물 원형질체, 식물 조직, 식물 세포 조직 배양, 식물 캘리, 식물 클럼프 등을 포함하지만, 이로 한정되지 않는다. 본원에 사용되는 바와 같이, "싹"은 잎과 줄기를 포함하는 지상 부분을 지칭한다. 또한, 본원에 사용되는 바와 같이, "식물 세포"는 세포벽을 포함하는 식물의 구조적 및 생리학적 단위를 지칭하며, 원형질체를 또한 지칭할 수 있다.
세포, 원핵 세포, 박테리아 세포, 진핵 세포, 식물 세포, 식물 및/또는 식물 부분과 관련하여 용어 "도입하는(introducing)" 또는 "도입하다(introduce)"는, 핵산 분자가 세포, 진핵 세포, 식물 세포 및/또는 식물 및/또는 식물 부분의 세포의 내부에 접근하게 하는 방식으로, 핵산 분자를 세포, 진핵 세포, 식물, 식물 부분, 및/또는 식물 세포와 접촉시키는 것을 의미한다. 하나 초과의 핵산 분자가 도입되어야 하는 경우, 이들 핵산 분자는 단일 폴리뉴클레오티드 또는 핵산 작제물의 일부로서 조립되거나 별개의 폴리뉴클레오티드 또는 핵산 작제물로서 조립될 수 있으며, 동일하거나 상이한 핵산 작제물 상에 위치할 수 있다. 따라서, 이들 폴리뉴클레오티드는 단일 형질 전환 사건으로, 별개의 형질 전환 사건으로, 또는 예를 들어, 육종 프로토콜의 일부로서 식물 세포에 도입될 수 있다.
본원에 사용되는 바와 같이, 용어 "형질 전환된" 및 "트랜스제닉"은, 적어도 하나의 재조합(예를 들어, 이종성) 폴리뉴클레오티드의 전부 또는 일부를 함유하는 임의의 세포, 원핵 세포, 진핵 세포, 식물, 식물 세포, 캘러스, 식물 조직, 또는 식물 부분을 지칭한다. 일부 구현예에서, 재조합 폴리뉴클레오티드의 전부 또는 일부는 염색체 또는 안정한 염색체 외 요소에 안정적으로 통합되며, 그에 따라 후속 세대로 전달된다. 본 발명의 목적을 위해, 용어 "재조합 폴리뉴클레오티드"는 유전자 조작에 의해 변경되거나, 재배열되거나, 변형된 폴리뉴클레오티드를 지칭한다. 예에는 이종성 서열에 연결되거나 결합된 임의의 클로닝된 폴리뉴클레오티드 또는 폴리뉴클레오티드들이 포함된다. 용어 "재조합"은 자연 발생적 사건, 예컨대 자발적 돌연변이에 기인하거나, 비-자발적 돌연변이 유발에 이은 선택적 육종에 기인한 폴리뉴클레오티드의 변경을 지칭하지 않는다.
본원에 사용되는 바와 같은 용어 "형질 전환"은 세포로의 이종성 핵산의 도입을 지칭한다. 세포의 형질 전환은 안정적이거나 일시적일 수 있다. 따라서, 본 발명의 트랜스제닉 세포, 식물 세포, 식물 및/또는 식물 부분은 안정적으로 형질 전환되거나 일시적으로 형질 전환될 수 있다. 형질 전환은, 유전자적으로 안정한 유전을 초래하는, 숙주 세포의 게놈 내로의 핵산 분자의 전달을 지칭할 수 있다. 일부 구현예에서, 식물, 식물 부분 및/또는 식물 세포로의 도입은 박테리아-매개 형질 전환, 입자 충격 형질 전환, 칼슘-포스페이트-매개 형질 전환, 사이클로덱스트린-매개 형질 전환, 전기 천공, 리포솜-매개 형질 전환, 나노 입자-매개 형질 전환, 중합체-매개 형질 전환, 바이러스-매개 핵산 전달, 위스커(whisker)-매개 핵산 전달, 미세 주입, 초음파 처리, 침투, 폴리에틸렌 글리콜-매개 형질 전환, 원형질체 형질 전환, 또는 식물, 식물 부분 및/또는 그의 세포로의 핵산의 도입을 초래하는 임의의 다른 전기적, 화학적, 물리적 및/또는 생물학적 메커니즘, 또는 그들의 임의의 조합을 통해 이루어진다.
식물을 형질 전환하는 절차는 당업계에 잘 알려져 있고 일상적이며, 문헌 전반에 걸쳐 기술되어 있다. 식물의 형질 전환을 위한 방법의 비-제한적 예에는 (예를 들어, 아그로박테리움 속 박테리아를 통한) 박테리아-매개 핵산 전달, 바이러스-매개 핵산 전달, 탄화 규소 또는 핵산 위스커-매개 핵산 전달, 리포솜 매개된 핵산 전달, 미세 주입, 미세 입자 충격, 칼슘 포스페이트-매개 형질 전환, 사이클로덱스트린-매개 형질 전환, 전기 천공, 나노 입자-매개 형질 전환, 초음파 처리, 침투, PEG-매개 핵산 흡수뿐만 아니라 식물 세포로의 핵산의 도입을 초래하는 임의의 다른 전기적, 화학적, 물리적(기계적) 및/또는 생물학적 메커니즘(그들의 임의의 조합을 포함함)을 통한 형질 전환이 포함된다. 당업계에 알려진 다양한 식물 형질 전환 방법에 대한 일반적인 가이드에는 문헌[Miki et al. ("Procedures for Introducing Foreign DNA into Plants" in Methods in Plant Molecular Biology and Biotechnology, Glick, B. R. and Thompson, J. E., Eds. (CRC Press, Inc., Boca Raton, 1993), pages 67-88)] 및 문헌[Rakowoczy-Trojanowska (Cell Mol Biol Lett 7:849-858 (2002))]이 포함된다.
아그로박테리움-매개 형질 전환은 그의 높은 형질 전환 효율, 및 많은 다양한 종과 관련된 그의 광범위한 유용성으로 인해 식물을 형질 전환하는 데 일반적으로 사용되는 방법이다. 아그로박테리움-매개 형질 전환은 전형적으로, 함께 존재하는(co-resident) Ti 플라스미드 상에 또는 염색체에 숙주 아그로박테리움 균주에 의해 운반되는 vir 유전자의 상보체에 의존할 수 있는 적절한 아그로박테리움 균주로의 관심있는 외래 DNA를 지닌 이원 벡터의 전달을 포함한다(문헌[Uknes et al. 1993, Plant Cell 5:159-169]). 아그로박테리움으로의 재조합 이원 벡터의 전달은, 표적 아그로박테리움 균주로 재조합 이원 벡터를 동원할 수 있는 플라스미드를 지닌 헬퍼(helper) 이. 콜라이(E. coli) 균주인 재조합 이원 벡터를 지닌 에스케리키아 콜라이(Escherichia coli)를 사용하는 트리-페어런탈 메이팅(tri-parental mating) 절차에 의해 달성될 수 있다. 대안적으로, 재조합 이원 벡터는 핵산 형질 전환에 의해 아그로박테리움으로 전달될 수 있다(문헌[ and Willmitzer 1988, Nucleic Acids Res 16:9877]).
재조합 아그로박테리움에 의한 식물의 형질 전환은 일반적으로 식물로부터의 외식편과 아그로박테리움의 공동-배양을 포함하며 당업계에 잘 알려진 방법을 따른다. 형질 전환된 조직은 전형적으로 이원 플라스미드 T-DNA 경계 사이에 항생제 또는 제초제 저항성 마커를 지닌 선택 배지 상에서 재생된다.
식물, 식물 부분 및 식물 세포를 형질 전환하는 또 다른 방법은 식물 조직 및 세포에서 비활성 또는 생물학적 활성 입자를 추진시키는 단계를 포함한다. 예를 들어, 미국 특허 제4,945,050호; 제5,036,006호 및 제5,100,792호를 참조한다. 일반적으로, 이 방법은 세포의 외부 표면을 관통하여 그의 내부로의 혼입을 제공하기에 효과적인 조건하에서 식물 세포에서 비활성 또는 생물학적 활성 입자를 추진시키는 단계를 포함한다. 비활성 입자가 이용될 때, 벡터는 관심있는 핵산을 함유하는 벡터로 입자를 코팅함으로써 세포에 도입될 수 있다. 대안적으로, 입자의 후류에 의해 벡터가 세포 내로 운반되도록 세포 또는 세포들이 벡터에 의해 둘러싸일 수 있다. 생물학적 활성 입자(예를 들어, 도입하고자 하는 하나 이상의 핵산을 각각 함유하는, 건조된 효모 세포, 건조된 박테리아 또는 박테리오파지)가 또한 식물 조직 내로 추진될 수 있다.
폴리뉴클레오티드와 관련하여 "일시적 형질 전환"은 폴리뉴클레오티드가 세포에는 도입되고 세포의 게놈에는 통합되지 않음을 의미한다.
본원에 사용되는 바와 같이, 세포에 도입되는 폴리뉴클레오티드와 관련하여 "안정적으로 도입하는", "안정적으로 도입된", "안정적인 형질 전환" 또는 "안정적으로 형질 전환된"은 도입된 폴리뉴클레오티드가 세포의 게놈에 안정적으로 통합되며, 그에 따라 세포가 폴리뉴클레오티드로 안정적으로 형질 전환됨을 의미한다. 그와 같이, 통합된 폴리뉴클레오티드는 그의 자손에 의해, 보다 구체적으로, 다수의 후속 세대의 자손에 의해 유전될 수 있다. 본원에 사용되는 바와 같은 "게놈"은 핵 및/또는 색소체 게놈을 포함하며, 그에 따라, 예를 들어, 엽록체 게놈으로의 폴리뉴클레오티드의 통합을 포함한다. 본원에 사용되는 바와 같은 안정적인 형질 전환은 또한 염색체 외에서, 예를 들어, 미니 염색체(minichromosome)로서 유지되는 폴리뉴클레오티드를 지칭할 수 있다.
일시적 형질 전환은, 예를 들어, 효소-연결 면역 흡착 검정(ELISA) 또는 웨스턴 블롯에 의해 검출될 수 있으며, 이는 유기체에 도입된 하나 이상의 핵산 분자에 의해 인코딩되는 펩티드 또는 폴리펩티드의 존재를 검출할 수 있다. 세포의 안정적인 형질 전환은, 예를 들어, 유기체(예를 들어, 식물)에 도입된 핵산 분자의 뉴클레오티드 서열과 특이적으로 하이브리드화되는 핵산 서열을 사용한 세포의 게놈 DNA의 서던 블롯 하이브리드화 검정에 의해 검출될 수 있다. 세포의 안정적인 형질 전환은, 예를 들어, 식물 또는 다른 유기체에 도입된 핵산 분자의 뉴클레오티드 서열과 특이적으로 하이브리드화되는 핵산 서열을 사용한 세포의 RNA의 노던 블롯 하이브리드화 검정에 의해 검출될 수 있다. 세포의 안정적인 형질 전환은 또한, 예를 들어, 핵산 분자의 표적 서열(들)과 하이브리드화되어 표준 방법에 따라 검출될 수 있는 표적 서열(들)의 증폭을 초래하는 특이적 프라이머 서열을 사용하는, 중합 효소 연쇄 반응(PCR) 또는 당업계에 잘 알려진 바와 같은 다른 증폭 반응에 의해 검출될 수 있다. 형질 전환은 또한 당업계에 잘 알려진 직접 시퀀싱 및/또는 하이브리드화 프로토콜에 의해 검출될 수 있다.
따라서, 본 발명의 특정 구현예에서 식물 세포는, 당업계에 알려져 있으며 본원에 기술된 바와 같은 임의의 방법에 의해 형질 전환될 수 있고, 다양한 알려진 기법 중 임의의 것을 사용하여 이러한 형질 전환된 세포로부터 온전한 식물이 재생될 수 있다. 식물 세포, 식물 조직 배양물 및/또는 배양된 원형질체로부터의 식물 재생은, 예를 들어, 문헌[Evans et al. (Handbook of Plant Cell Cultures, Vol. 1, MacMilan Publishing Co. New York (1983))]; 및 문헌[Vasil I. R. (ed.) (Cell Culture and Somatic Cell Genetics of Plants, Acad. Press, Orlando, Vol. I (1984), and Vol. II (1986))]에 기술되어 있다. 형질 전환된 트랜스제닉 식물, 식물 세포 및/또는 식물 조직 배양물을 선택하는 방법은 당업계에서는 일상적인 것이며, 본원에 제공되는 본 발명의 방법에서 사용될 수 있다.
"형질 전환 및 재생 과정"은 트랜스진을 식물 세포에 안정적으로 도입하고 트랜스제닉 식물 세포로부터 식물을 재생시키는 과정을 지칭한다. 본원에 사용되는 바와 같이, 형질 전환 및 재생은 선택 과정을 포함하며, 이에 의해 트랜스진은 선택 가능 마커를 포함하고 형질 전환된 세포는 트랜스진을 통합하여 이를 발현함으로써, 형질 전환된 세포가 선택제의 존재하에 생존하고 발육상 번성할 것이다. "재생"은 식물 세포, 일단의 식물 세포, 또는 식물 조각으로부터, 예컨대 원형질체, 캘러스, 또는 조직 부분으로부터 전체 식물을 성장시키는 것을 지칭한다.
용어 "뉴클레오티드 서열" "핵산", "핵산 서열", "핵산 분자", "올리고뉴클레오티드" 및 "폴리뉴클레오티드"는, 뉴클레오티드의 이종 중합체를 지칭하고 cDNA, 게놈 DNA, mRNA, 합성(예를 들어, 화학적으로 합성된) DNA 또는 RNA 및 RNA와 DNA의 키메라를 비롯한 RNA 및 DNA 둘 모두를 포함하도록 본원에서 상호 교환적으로 사용된다. 핵산 분자라는 용어는 사슬의 길이와 관계없이 뉴클레오티드 사슬을 지칭한다. 뉴클레오티드는 당, 포스페이트, 및 퓨린 또는 피리미딘인 염기를 함유한다. 핵산 분자는 이중-가닥 또는 단일-가닥일 수 있다. 단일-가닥인 경우, 핵산 분자는 센스 가닥 또는 안티센스 가닥일 수 있다. 핵산 분자는 올리고뉴클레오티드 유사체 또는 유도체(예를 들어, 이노신 또는 포스포로티오에이트 뉴클레오티드)를 사용하여 합성될 수 있다. 그러한 올리고뉴클레오티드는, 예를 들어, 염기쌍 형성 능력이 변경되거나 뉴클레아제에 대한 저항성이 증가된 핵산 분자를 제조하기 위해 사용될 수 있다. 본원에 제공된 핵산 서열은 왼쪽에서 오른쪽으로 5'*?*방향으로 본원에 제시되며, 미국 서열 규칙 37 CFR §§1.821 내지 1.825 및 세계지적재산기구(World Intellectual Property Organization, WIPO) 표준 ST.25에 명시된 바와 같은 뉴클레오티드 문자를 나타내는 표준 코드를 사용하여 표시된다.
"핵산 단편"은 주어진 핵산 분자의 일부이다. "RNA 단편"은 주어진 RNA 분자의 분획이다. "DNA 단편"은 주어진 DNA 분자의 분획이다. "핵산 세그먼트"는 주어진 핵산 분자의 분획이며, 분자로부터 분리되지 않는다. "RNA 세그먼트"는 주어진 RNA 분자의 분획이며, 분자로부터 분리되지 않는다. "DNA 세그먼트"은 주어진 DNA 분자의 분획이며, 분자로부터 분리되지 않는다. 폴리뉴클레오티드의 세그먼트는 임의의 길이, 예를 들어, 적어도 5개, 10개, 15개, 20개, 25개, 30개, 40개, 50개, 7 5개, 100개, 150개, 200개, 300개 또는 500개 이상의 뉴클레오티드 길이일 수 있다. 가이드 서열의 세그먼트 또는 일부는 가이드 서열의 약 50%, 40%, 30%, 20%, 10%, 예를 들어, 가이드 서열의 1/3 이하, 예를 들어 7개, 6개, 5개, 4개, 3개, 또는 2개 뉴클레오티드 길이일 수 있다.
분자와 관련하여 용어 "~로부터 유래된"은 모(parent) 분자 또는 그 모 분자로부터의 정보를 사용하여 분리되거나 만들어진 분자를 지칭한다. 예를 들어, Cas9 단일 돌연변이 닉카제 및 Cas9 이중 돌연변이 null-뉴클레아제는 야생형 Cas9 단백질로부터 유래된다.
고등 식물에서, 데옥시리보핵산(DNA)은 유전 물질인 한편, 리보핵산(RNA)은 DNA 내에 포함된 정보의 단백질로의 전달에 관여한다. "게놈"은 유기체의 각 세포에 포함된 유전 물질의 완전체(entire body)이다. 달리 지시되지 않는 한, 본 발명의 특정 핵산 서열은, 명시적으로 지시된 서열뿐만 아니라, 또한 그의 보존적으로 변형된 변이체(예를 들어, 축퇴성 코돈 치환체) 및 상보적 서열을 암시적으로 포함한다. 구체적으로, 축퇴성 코돈 치환체는 하나 이상의 선택된(또는 모든) 코돈의 세 번째 위치가 혼합-염기 및/또는 데옥시이노신 잔기로 치환된 서열을 생성함으로써 달성될 수 있다(문헌[Batzer et al., Nucleic Acid Res. 19:5081 (1991)]; 문헌[Ohtsuka et al., J. Biol. Chem. 260:2605-2608 (1985)]; 및 문헌[Rossolini et al., Mol. Cell. Probes 8:91-98 (1994)]). 핵산 분자라는 용어는 유전자, cDNA, 및 유전자에 의해 인코딩된 mRNA와 상호 교환적으로 사용된다.
본원에 사용되는 바와 같이, "서열 동일성"은 2개의 최적으로 정렬된 폴리뉴클레오티드 또는 펩티드 서열이 구성 요소, 예를 들어, 뉴클레오티드 또는 아미노산의 정렬 윈도우 전체에 걸쳐 불변하는 정도를 지칭한다. "동일성"은 하기 문헌에 기술된 방법을 포함하지만 이로 한정되지 않는 알려진 방법에 의해 용이하게 계산될 수 있다: 문헌[Computational Molecular Biology (Lesk, A. M., ed.) Oxford University Press, New York (1988)]; 문헌[Biocomputing: Informatics and Genome Projects (Smith, D. W., ed.) Academic Press, New York (1993)]; 문헌[Computer Analysis of Sequence Data, Part I (Griffin, A. M., and Griffin, H. G., eds.) Humana Press, New Jersey (1994)]; 문헌[Sequence Analysis in Molecular Biology (von Heinje, G., ed.) Academic Press (1987)]; 및 문헌[Sequence Analysis Primer (Gribskov, M. and Devereux, J., eds.) Stockton Press, New York (1991)].
본원에 사용되는 바와 같이, 용어 "서열 동일성 퍼센트" 또는 "동일성 퍼센트"는 시험("대상") 폴리뉴클레오티드 분자(또는 그의 상보적 가닥)와 비교한 기준("질의(query)") 폴리뉴클레오티드 분자(또는 그의 상보적 가닥)의 선형 폴리뉴클레오티드 서열에서의 동일한 뉴클레오티드의 백분율(두 서열이 최적으로 정렬된 경우)을 지칭한다. 일부 구현예에서, "동일성 퍼센트"는 아미노산 서열에서 동일한 아미노산의 백분율을 지칭할 수 있다.
본원에 사용되는 바와 같이, 2개의 핵산 분자, 뉴클레오티드 서열 또는 단백질 서열과 관련하여 "실질적으로 동일한"이라는 문구는, 하기 서열 비교 알고리즘들 중 하나를 사용하거나 육안 검사에 의해 측정되는 바와 같이, 최대 일치를 위해 비교되고 정렬되는 경우 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99%의 뉴클레오티드 또는 아미노산 잔기 동일성을 갖는 2개 이상의 서열 또는 하위서열(subsequence)을 지칭한다. 본 발명의 일부 구현예에서, 실질적 동일성은 적어도 약 50개 잔기 내지 약 150개 잔기 길이인 서열 영역에 걸쳐 존재한다. 따라서, 본 발명의 일부 구현예에서, 실질적 동일성은 적어도 약 50개, 약 60개, 약 70개, 약 80개, 약 90개, 약 100개, 약 110개, 약 120개, 약 130개, 약 140개, 약 150개, 또는 그 초과의 잔기 길이인 서열 영역에 걸쳐 존재한다. 일부 특정 구현예에서, 서열은 적어도 약 150개의 잔기에 걸쳐 실질적으로 동일하다. 추가 구현예에서, 서열은 코딩 영역의 전체 길이에 걸쳐 실질적으로 동일하다. 또한, 대표적인 구현예에서, 실질적으로 동일한 뉴클레오티드 또는 단백질 서열은 실질적으로 동일한 기능(예를 들어, 특정 게놈 표적으로의 안내, 특정 게놈 표적 부위의 엔도뉴클레아제 절단)을 수행한다.
서열 비교를 위해, 전형적으로 하나의 서열이 시험 서열과 비교되는 기준 서열로 작용한다. 서열 비교 알고리즘을 사용하는 경우, 시험 및 기준 서열을 컴퓨터에 입력하고, 필요에 따라 하위서열 좌표를 지정하고, 서열 알고리즘 프로그램 파라미터를 지정한다. 이어서 서열 비교 알고리즘은 지정된 프로그램 파라미터에 기초하여 기준 서열에 비한 시험 서열(들)에 대한 서열 동일성 퍼센트를 계산한다.
비교 윈도우를 정렬하기 위한 서열들의 최적 정렬은 당업자에게 잘 알려져 있으며, Smith 및 Waterman의 국소 상동성 알고리즘, Needleman 및 Wunsch의 상동성 정렬 알고리즘, Pearson 및 Lipman의 유사성 검색 방법과 같은 도구에 의해, 및 선택적으로 GCG® Wisconsin Package®(미국 캘리포니아주 샌디에고 소재의 Accelrys Inc.)의 일부로 이용 가능한 GAP, BESTFIT, FASTA, 및 TFASTA와 같은 이러한 알고리즘의 컴퓨터화된 구현에 의해 수행될 수 있다. 시험 서열과 기준 서열의 정렬된 세그먼트에 대한 "동일성 분율"은 두 정렬된 서열에 의해 공유되는 동일한 구성 요소 수를 기준 서열 세그먼트 내의 총 구성 요소 수, 즉, 전체 기준 서열 또는 기준 서열의 더 작은 규정된 부분으로 나눈 것이다. 서열 동일성 퍼센트는 동일성 분율에 100을 곱한 것으로 표시된다. 하나 이상의 폴리뉴클레오티드 서열의 비교는 전장 폴리뉴클레오티드 서열 또는 그의 일부에 대한 것이거나, 더 긴 폴리뉴클레오티드 서열에 대한 것일 수 있다. 본 발명의 목적을 위해 "동일성 퍼센트"는 또한 번역된 뉴클레오티드 서열의 경우 BLASTX 버전 2.0을 사용하고 폴리뉴클레오티드 서열의 경우 BLASTN 버전 2.0을 사용하여 결정될 수 있다.
BLAST 분석을 수행하기 위한 소프트웨어는 미국 국립생물공학정보센터(National Center for Biotechnology Information)를 통해 공개적으로 이용 가능하다. 이 알고리즘은 먼저 질의 서열에서 길이 W의 짧은 단어들을 확인함으로써 고득점 서열 쌍(high scoring sequence pair, HSP)을 확인하는 것을 포함하며, 이는 데이터베이스 서열 내의 동일한 길이의 단어와 정렬된 경우 어떤 양의(positive) 임계값 점수 T와 일치하거나 이를 충족한다. T는 이웃 단어 점수 임계값으로 지칭된다(문헌[Altschul et al., 1990]). 이러한 초기 이웃 단어 히트(hit)는 이를 포함하는 더 긴 HSP를 찾기 위해 검색을 개시하기 위한 시드(seed) 역할을 한다. 이어서, 단어 히트는 누적 정렬 점수가 증가될 수 있는 한 각 서열을 따라 양방향 모두로 확장된다. 뉴클레오티드 서열의 경우, 파라미터 M(일치하는 잔기 쌍에 대한 보상 점수; 항상 0보다 큼) 및 N(불일치 잔기에 대한 페널티 점수; 항상 0보다 작음)을 사용하여 누적 점수가 계산된다. 아미노산 서열의 경우, 누적 점수를 계산하기 위해 스코어링 행렬(scoring matrix)이 사용된다. 누적 정렬 점수가 그의 최대 달성 값으로부터 수량 X만큼 하락하거나, 하나 이상의 음의 점수를 내는 잔기 정렬의 축적으로 인해 누적 점수가 0 이하로 되거나, 어느 한쪽의 서열의 단부에 도달한 경우, 각 방향에서의 단어 히트의 확장이 중단된다. BLAST 알고리즘 파라미터 W, T 및 X는 정렬의 감도 및 속도를 결정한다. BLASTN 프로그램(뉴클레오티드 서열용)은 디폴트로서 11의 단어길이(W), 10의 기대값(E), 100의 컷오프, M = 5, N = -4, 및 두 가닥 모두의 비교를 사용한다. 아미노산 서열의 경우, BLASTP 프로그램은 디폴트로서 3의 단어길이(W), 10의 기대값(E), 및 BLOSUM62 스코어링 행렬을 사용한다(문헌[Henikoff & Henikoff, Proc. Natl. Acad. Sci. USA 89: 10915 (1989)] 참조).
서열 동일성 퍼센트를 계산하는 것 외에, BLAST 알고리즘은 또한 두 서열 사이의 유사성에 관한 통계적 분석을 수행한다(예를 들어, 문헌[Karlin & Altschul, Proc. Nat'l. Acad. Sci. USA 90: 5873-5787 (1993)] 참조). BLAST 알고리즘에 의해 제공되는 유사성의 한 가지 척도는 최소 합 확률(P(N))이며, 이는 두 뉴클레오티드 또는 아미노산 서열 사이의 일치가 우연히 발생할 확률의 지표를 제공한다. 예를 들어, 시험 뉴클레오티드 서열과 기준 뉴클레오티드 서열의 비교에서 최소 합 확률이 약 0.1 미만 내지 약 0.001 미만인 경우 시험 핵산 서열은 기준 서열과 유사한 것으로 간주된다. 따라서, 본 발명의 일부 구현예에서, 시험 뉴클레오티드 서열과 기준 뉴클레오티드 서열의 비교에서 최소 합 확률은 약 0.001 미만이다.
두 뉴클레오티드 서열은, 두 서열이 엄격한 조건하에서 서로 하이브리드화될 때 실질적으로 동일한 것으로 또한 간주될 수 있다. 일부 대표적인 구현예에서, 실질적으로 동일한 것으로 간주되는 두 뉴클레오티드 서열은 매우 엄격한 조건하에서 서로 하이브리드화된다.
서던 및 노던 하이브리드화와 같은 핵산 하이브리드화 실험과 관련하여 "엄격한 하이브리드화 조건" 및 "엄격한 하이브리드화 세척 조건"은 서열 의존적이며, 다양한 환경 파라미터하에서 다양하다. 핵산의 하이브리드화에 대한 포괄적인 가이드는 문헌[Tijssen Laboratory Techniques in Biochemistry and Molecular Biology-Hybridization with Nucleic Acid Probes part I chapter 2 "Overview of principles of hybridization and the strategy of nucleic acid probe assays" Elsevier, New York (1993)]에서 발견된다. 일반적으로, 매우 엄격한 하이브리드화 및 세척 조건은 규정된 이온 강도 및 pH에서의 특정 서열에 대한 열 융점(Tm)보다 약 5℃ 낮도록 선택된다.
Tm은 완벽하게 일치하는 프로브에 표적 서열의 50%가 하이브리드화되는 (규정된 이온 강도 및 pH하의) 온도이다. 매우 엄격한 조건은 특정 프로브에 대한 Tm과 동일하도록 선택된다. 서던 또는 노던 블롯에서 필터 상에 100개를 초과하는 상보적 잔기를 갖는 상보적 뉴클레오티드 서열의 하이브리드화를 위한 엄격한 하이브리드화 조건의 예는 42℃에서 1 mg의 헤파린을 갖는 50% 포름아미드이며, 하이브리드화는 밤새 수행된다. 매우 엄격한 세척 조건의 예는 약 15분 동안 72℃에서 0.1 5 M NaCl이다. 엄격한 세척 조건의 예는 15분 동안 65℃에서 0.2x SSC 세척이다(SSC 완충액에 대한 설명에 대해서는 하기 문헌[Sambrook] 참조). 종종, 백그라운드 프로브 신호를 제거하기 위해 높은 엄격도 세척에 앞서 낮은 엄격도 세척이 수행된다. 예를 들어, 100개 초과의 뉴클레오티드의 이중체에 대한 중간 엄격도 세척의 예는 15분 동안 45℃에서 1x SSC이다. 예를 들어, 100개 초과의 뉴클레오티드의 이중체에 대한 낮은 엄격도 세척의 예는 15분 동안 40℃에서 4 내지 6x SSC이다. 짧은 프로브(예를 들어, 약 10개 내지 50개 뉴클레오티드)의 경우, 엄격한 조건은 전형적으로 pH 7.0 내지 8.3에서 약 1.0 M 미만의 Na 이온의 염 농도, 전형적으로 약 0.01 내지 1.0 M Na 이온 농도(또는 다른 염)를 포함하고, 온도는 전형적으로 적어도 약 30℃이다. 엄격한 조건은 또한 포름아미드와 같은 불안정화제를 첨가하여 달성될 수 있다. 일반적으로, 특정 하이브리드화 검정에서 관련없는 프로브에 대해 관찰된 것보다 2x(또는 그 초과)의 신호 대 잡음비는 특이적 하이브리드화의 검출을 나타낸다. 엄격한 조건하에서 서로 하이브리드화되지 않은 뉴클레오티드 서열들은, 이들이 인코딩하는 단백질이 실질적으로 동일한 경우 여전히 실질적으로 동일하다. 이는, 예를 들어, 뉴클레오티드 서열의 카피가 유전자 코드에 의해 허용되는 최대 코돈 축퇴성을 사용하여 생성되는 경우 일어난다.
다음은 본 발명의 기준 뉴클레오티드 서열과 실질적으로 동일한 상동성 뉴클레오티드 서열을 클로닝하기 위해 사용될 수 있는 하이브리드화/세척 조건 세트의 예이다. 일 구현예에서, 기준 뉴클레오티드 서열은 50℃에서 7% 소듐 도데실 설페이트(SDS), 0.5 M NaPO4, 1 mM EDTA 중에서 "시험" 뉴클레오티드 서열에 하이브리드화되며 50℃에서 2X SSC, 0.1% SDS 중에서 세척된다. 또 다른 구현예에서, 기준 뉴클레오티드 서열은 50℃에서 7% 소듐 도데실 설페이트(SDS), 0.5 M NaPO4, 1 mM EDTA 중에서 "시험" 뉴클레오티드 서열에 하이브리드화되며 50℃에서 1X SSC, 0.1% SDS 중에서 세척되거나, 50℃에서 7% 소듐 도데실 설페이트(SDS), 0.5 M NaPO4, 1 mM EDTA 중에서 "시험" 뉴클레오티드 서열에 하이브리드화되며 50℃에서 0.5X SSC, 0.1% SDS 중에서 세척된다. 추가 구현예에서, 기준 뉴클레오티드 서열은 50℃에서 7% 소듐 도데실 설페이트(SDS), 0.5 M NaPO4, 1 mM EDTA 중에서 "시험" 뉴클레오티드 서열에 하이브리드화되며 50℃에서 0.1X SSC, 0.1% SDS 중에서 세척되거나, 50℃에서 7% 소듐 도데실 설페이트(SDS), 0.5 M NaPO4, 1 mM EDTA 중에서 "시험" 뉴클레오티드 서열에 하이브리드화되며 65℃에서 0.1X SSC, 0.1% SDS 중에서 세척된다.
"분리된" 핵산 분자 또는 뉴클레오티드 서열 또는 "분리된" 폴리펩티드는, 인위적으로 그의 천연 환경과는 별도로 존재하게 되고/되거나 그의 천연 환경에서의 기능과 비교하여 상이하고/하거나, 변형되고/되거나, 변조되고/되거나, 변경된 기능을 갖게 된 핵산 분자, 뉴클레오티드 서열 또는 폴리펩티드이며, 그에 따라 자연적인 산물이 아니다. 분리된 핵산 분자 또는 분리된 폴리펩티드는 정제된 형태로 존재할 수 있거나, 예를 들어 재조합 숙주 세포와 같은 비-천연 환경에 존재할 수 있다. 따라서, 예를 들어, 폴리뉴클레오티드와 관련하여, 분리된이라는 용어는 그것이 자연적으로 발생하는 염색체 및/또는 세포로부터 분리된 것임을 의미한다. 폴리뉴클레오티드는 또한 그것이 자연적으로 발생하는 염색체 및/또는 세포로부터 분리되고, 이어서 그것이 자연적으로 발생하지 않는 유전자 컨텍스트(genetic context), 염색체, 염색체 위치, 및/또는 세포에 삽입되는 경우 분리된 것이다. 본 발명의 재조합 핵산 분자 및 뉴클레오티드 서열은 상기 정의된 바와 같이 "분리된" 것으로 간주될 수 있다.
따라서, "분리된 핵산 분자" 또는 "분리된 뉴클레오티드 서열"은, 유기체의 자연 발생 게놈(유기체로부터 유래됨)에서 바로 인접한(5' 말단에 하나 및 3' 말단에 하나) 뉴클레오티드 서열과 바로 인접하지 않은 핵산 분자 또는 뉴클레오티드 서열이다. 이에 따라, 일 구현예에서, 분리된 핵산은 코딩 서열에 바로 인접한 5' 비-코딩(예를 들어, 프로모터) 서열의 일부 또는 전부를 포함한다. 따라서, 이 용어는, 예를 들어, 벡터로, 자율 복제 플라스미드 또는 바이러스로, 또는 원핵생물 또는 진핵생물의 게놈 DNA로 혼입되거나, 다른 서열과는 관계없이 별개의 분자로 존재하는 재조합 핵산(예를 들어, PCR 또는 제한 엔도뉴클레아제 처리에 의해 생산된 cDNA 또는 게놈 DNA 단편)을 포함한다. 이는 또한 추가의 폴리펩티드 또는 펩티드 서열을 인코딩하는 하이브리드 핵산 분자의 일부인 재조합 핵산을 포함한다. "분리된 핵산 분자" 또는 "분리된 뉴클레오티드 서열"은, 동일한 천연의 원래 세포 유형으로부터 유래되어 그로 삽입되지만 비천연 상태로 존재하는, 예를 들어, 핵산 분자의 천연 상태에서 발견되는 것과 상이한 카피 수로 존재하고/하거나 상이한 조절 서열의 제어하에 있는 뉴클레오티드 서열도 포함할 수 있다.
용어 "분리된"은 세포 물질, 바이러스 물질, 및/또는 배양 배지(예를 들어, 재조합 DNA 기법에 의해 생산되는 경우), 또는 화학적 전구체 또는 다른 화학물질(예를 들어, 화학적으로 합성되는 경우)을 실질적으로 함유하지 않는 핵산 분자, 뉴클레오티드 서열, 폴리펩티드, 펩티드 또는 단편을 추가로 지칭할 수 있다. 더욱이, "분리된 단편"은 단편으로서 자연 발생하지 않고 이에 따라 천연 상태에서 발견되지 않을 핵산 분자, 뉴클레오티드 서열 또는 폴리펩티드의 단편이다. "분리된"은 제제가 반드시 기술적으로 순수하다는 것(동형이라는 것)을 의미하는 것은 아니며, 의도된 목적으로 사용될 수 있는 형태로 폴리펩티드 또는 핵산을 제공하기에 충분히 순수하다는 것을 의미한다.
본 발명의 대표적인 구현예에서, "분리된" 핵산 분자, 뉴클레오티드 서열, 및/또는 폴리펩티드는 적어도 약 5%, 10%, 15%, 20%, 25%, 30%, 40%, 50%, 60%, 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99%(w/w) 이상 순수하다. 다른 구현예에서, "분리된" 핵산, 뉴클레오티드 서열, 및/또는 폴리펩티드는 출발 물질과 비교하여 적어도 약 5-배, 10-배, 25-배, 100-배, 1000-배, 10,000-배, 100,000-배 이상의 핵산 농축도(w/w)가 달성된다는 것을 나타낸다.
"야생형" 뉴클레오티드 서열 또는 아미노산 서열은 자연 발생적("천연") 또는 내인성 뉴클레오티드 서열 또는 아미노산 서열을 지칭한다. 따라서, 예를 들어, "야생형 mRNA"는 유기체에서 자연적으로 발생하거나 유기체에 내인성인 mRNA이다. "상동성" 뉴클레오티드 서열은 그것이 도입되는 숙주 세포와 자연적으로 결부된 뉴클레오티드 서열이다.
용어 "오픈 리딩 프레임" 및 "ORF"는 코딩 서열의 번역 개시 코돈과 종결 코돈 사이에서 인코딩되는 아미노산 서열을 지칭한다. 용어 "개시 코돈" 및 "종결 코돈"은 각각 단백질 합성(mRNA 번역)의 개시 및 사슬 종결을 특정하는 코딩 서열 내의 3개의 인접 뉴클레오티드 단위('코돈')를 지칭한다.
"프로모터"는 일반적으로 그의 코딩 서열의 업스트림(5')에 있는 뉴클레오티드 서열을 지칭하며, 이는 RNA 중합 효소 및 적절한 전사에 필요한 다른 인자에 대한 인식을 제공함으로써 코딩 서열의 발현을 제어한다. "프로모터 조절 서열"은 근위 업스트림 요소 및 보다 원위의 업스트림 요소로 구성된다. 프로모터 조절 서열은 결부된 코딩 서열의 전사, RNA 가공 또는 안정성, 또는 번역에 영향을 미친다. 조절 서열은 인핸서, 프로모터, 비번역 선도 서열, 인트론, 및 폴리아데닐화 신호 서열을 포함한다. 이는 천연 및 합성 서열뿐만 아니라 합성 서열과 천연 서열의 조합일 수 있는 서열을 포함한다. "인핸서"는 프로모터 활성을 자극할 수 있는 DNA 서열이며, 프로모터의 고유 요소이거나 프로모터의 수준 또는 조직 특이성을 향상시키기 위해 삽입된 이종성 요소일 수 있다. 이는 두 배향 모두(정상 배향 또는 뒤집힌(flipped) 배향)로 작동할 수 있으며, 프로모터의 업스트림 또는 다운스트림으로 이동하더라도 기능할 수 있다. 용어 "프로모터"의 의미는 "프로모터 조절 서열"을 포함한다.
"1차 형질 전환체" 및 "T0 세대"는 초기에 형질 전환된 조직과 동일한 유전적 세대인(즉, 형질 전환 이래로 감수 분열 및 수정을 거치지 않은) 트랜스제닉 식물을 지칭한다. "2차 형질 전환체" 및 "T1, T2, T3 등의 세대"는 1회 이상의 감수 분열 및 수정 주기를 통해 1차 형질 전환체로부터 유래된 트랜스제닉 식물을 지칭한다. 이는 1차 또는 2차 형질 전환체의 자가 수정에 의해 또는 1차 또는 2차 형질 전환체와, 형질 전환되거나 형질 전환되지 않은 다른 식물과의 교배에 의해 유래될 수 있다.
"트랜스진"은 형질 전환에 의해 게놈에 도입되어 안정적으로 유지되는 핵산 분자를 지칭한다. 트랜스진은 적어도 하나의 발현 카세트를 포함할 수 있으며, 전형적으로 적어도 2개의 발현 카세트를 포함하고, 10개 이상의 발현 카세트를 포함할 수 있다. 트랜스진은, 예를 들어, 형질 전환될 특정 식물의 유전자에 대해 이종성 또는 상동성인 유전자를 포함할 수 있다. 추가로, 트랜스진은 비-천연 유기체에 삽입된 천연 유전자 또는 키메라 유전자를 포함할 수 있다. 용어 "내인성 유전자"는 유기체의 게놈에서 그의 천연 위치에 있는 천연 유전자를 지칭한다. "외래" 유전자는 숙주 유기체에서 정상적으로는 발견되지 않지만 유전자 전달에 의해 유기체로 도입된 유전자를 지칭한다.
"인트론"은 거의 배타적으로 진핵 유전자 내에서 발생하지만 유전자 산물에서 아미노산 서열로 번역되지 않는 DNA의 개재 섹션을 지칭한다. 인트론은, 엑손은 그대로 두는 스플라이싱(splicing)으로 일컬어지는 과정을 통해 성숙전(pre-mature) mRNA로부터 제거되어 mRNA를 형성한다. 본 발명의 목적을 위해, 용어 "인트론"의 정의는 표적 유전자로부터 유래된 인트론의 뉴클레오티드 서열에 대한 변형을 포함하며, 단, 변형된 인트론은 그의 결부된 5' 조절 서열의 활성을 유의하게 감소시키지 않는다.
"엑손"은 단백질 또는 그의 일부에 대한 코딩 서열을 지닌 DNA의 섹션을 지칭한다. 엑손은 개재하는 비-코딩 서열(인트론)에 의해 분리되어 있다. 본 발명의 목적을 위해, 용어 "엑손"의 정의는 표적 유전자로부터 유래된 엑손의 뉴클레오티드 서열에 대한 변형을 포함하며, 단, 변형된 엑손은 그의 결부된 5' 조절 서열의 활성을 유의하게 감소시키지 않는다.
용어 "절단" 또는 "절단하는"은 폴리뉴클레오티드의 리보실포스포디에스테르 백본에서 공유 포스포디에스테르 결합의 파손을 지칭한다. 용어 "절단" 또는 "절단하는"은 단일-가닥 파손 및 이중-가닥 파손 둘 모두를 포함한다. 이중-가닥 절단은 2개의 구별되는 단일-가닥 절단 사건의 결과로 발생할 수 있다. 절단은 블런트형(blunt) 단부 또는 스태거형(staggered) 단부의 생성을 초래할 수 있다. "뉴클레아제 절단 부위" 또는 "게놈 뉴클레아제 절단 부위"는, 하나 또는 둘 모두의 가닥에서 게놈 DNA의 뉴클레오티드 서열을 절단하는 역할을 하는 특정 뉴클레아제에 의해 인식되는 뉴클레아제 절단 서열을 포함하는 뉴클레오티드의 영역이다. 뉴클레아제 효소에 의한 그러한 절단은 세포 내에서 DNA 복구 메커니즘을 개시하며, 이는 상동성 재조합이 발생하게 하는 환경을 조성한다.
본 발명은 데아미나제 도메인과 부위-지정 DNA-결합 도메인 사이에 개선된 링커를 갖는 융합 단백질을 제공하고, 이는 편집 효율의 증가 및 돌연변이 빈도의 감소를 제공한다. 본 발명의 일부 구현예에서, 데아미나제 도메인은 시티딘 데아미나제이다. 본 발명의 다른 구현예에서, 데아미나제 도메인은 아데닌 데아미나제이다. 일부 구현예에서, 시티딘 데아미나제 도메인은 활성화-유도 시티딘 데아미나제("AID")이다. 본 발명의 일부 구현예에서, 시티딘 데아미나제 도메인은 아포리포단백질 B mRNA-편집 복합체("APOBEC") 도메인이다. 일부 구현예에서, APOBEC 도메인은 APOBEC1 패밀리 데아미나제이다.
"시티딘 데아미나제"는 각각 시티딘 및 데옥시시티딘에서 우리딘 및 데옥시우리딘으로의 비가역적 가수분해 탈아민화를 촉매작용하는 효소를 지칭한다. 시티딘 데아미나제는 세포 피리미딘 풀을 유지한다. 시티딘 데아미나제의 패밀리는 APOBEC("아포리포단백질 B mRNA 편집 효소, 촉매적 폴리펩티드-유사")이다. 이러한 패밀리의 구성원은 C의 U로의 편집 효소이다. APOBEC 유사 단백질의 N-말단 도메인은 촉매 도메인인 반면, C-말단 도메인은 유사촉매 도메인이다. 보다 구체적으로, 촉매 도메인은 아연 의존적 시티딘 데아미나제 도메인이고, 시티딘 탈아민화에 있어서 중요하다. APOBEC1에 의한 RNA 편집은 동종이량체화를 필요로 하고, 이러한 복합체는 RNA 결합 단백질과 상호작용하여 에디토좀을 형성한다. APOBEC 단백질의 비-제한적인 예는 APOBEC1, APOBEC2, APOBEC3A, APOBEC3B, APOBEC3C, APOBEC3D, APOBEC3F, APOBEC3G, APOBEC3H, APOBEC4, 및 활성화-유도 (시티딘) 데아미나제를 포함한다. 염기 편집기에 대해 상이한 편집 특징을 야기하는 APOBEC 단백질의 다양한 돌연변이체가 또한 알려져 있다. 예를 들어, 인간 APOBEC3A의 경우, 특정 돌연변이체(예를 들어, Y130F, Y132D, W104A 및 D131Y)는 심지어 편집 효율 측면에서 야생형 인간 APOBEC3A를 능가한다. 따라서, 용어 APOBEC 및 이의 각각의 패밀리 구성원은 또한 상응하는 야생형 APOBEC 단백질에 대해 특정 수준(예를 들어, 70%, 75%, 80%, 85%, 90%, 95%, 98%, 99%)의 서열 동일성을 갖고 시티딘 탈아민화 활성을 보유하는 변이체 및 돌연변이체를 포괄한다. 변이체 및 돌연변이체는 아미노산 추가, 결실 및/또는 치환으로 유도될 수 있다. 이러한 치환은, 일부 구현예에서, 보존적 치환이다.
"시토신 염기 편집기"("CBE")는 C·G 염기쌍을 T·A 염기쌍으로 전환시킨다.
"아데닌 데아미나제"는 아데노신에서 이노신으로의 가수분해 탈아민화를 촉매작용하는 효소를 지칭한다. 이노신은 C와 쌍을 형성하므로, G로 읽거나 복제된다. 예시적인 효소로는 동종이량체로 작용하는 이. 콜라이로부터의 TadA이다.
"아데닌 염기 편집기"("ABE")는 A·T 염기쌍을 G·C 염기쌍으로 전환시킨다.
라크노스피라세아이 박테리움(Lachnospiraceae bacterium) Cpf1(LbCpf1)은 큰 그룹의 다수 Cpf1 단백질 중 하나이다. 용어 "Cpf1" 및 "Cas12a"는 전반에 걸쳐 상호교환 가능하게 사용된다. Cpf1은 Cas 단백질이다. 용어 "Cas 단백질" 또는 "클러스터링된 규칙적으로 간격을 둔 짧은 회문 반복(CRISPR)-관련(Cas) 단백질"은, 예를 들어, 스트렙토코쿠스 피오게네스(Streptococcus pyogenes), 뿐만 아니라 기타 세균에서 발견되는 적응 면역계인 CRISPR(클러스터링된 규칙적으로 간격을 둔 짧은 회문 반복)과 관련된 RNA 가이드 DNA 엔도뉴클레아제 효소를 지칭한다. Cas 단백질은 Cas9, Cas12a, Cas12b, Cas12i, Cas12j 등을 포함한다. 본 발명의 일부 구현예에서, 부위 지정 DNA 결합 도메인은 라크노스피라세아이 박테리움으로부터의 촉매적 비활성 Cas12a("dLbCas12a")이다. 다른 구현예에서, 부위 지정 DNA 결합 도메인은 라크노스피라세아이 박테리움("LbCas12a") 또는 모락셀라 보보쿨리(Moraxella bovoculi) AAX08_00205("Mb2Cas12a")로부터 촉매적 활성이다. 본 발명의 일부 구현예에서, 라크노스피라세아이 박테리움, 아키다미노코쿠스(Acidaminococcus) 종, 모락셀라 보보쿨리, 티오미크로스피라(Thiomicrospira) 종, 모락셀라 라쿠나타(Moraxella lacunata), 메타노메틸로필루스 알부스(Methanomethylophilus alvus), 브타이리비브리오(Btyrivibrio) 종, 또는 박테로이데테소랄(Bacteroidetesoral) 종으로부터의 Cas12a 단백질은 융합 단백질의 부위 지정 DNA-결합 도메인으로서 제공된다.
융합 단백질은 우라실 DNA 글리코실라제 억제제(UGI) 및 핵 국재화 서열(NLS)과 같은 다른 단편을 포함할 수 있다.
바실러스 서브틸리스 박테리오파지 PBS1로부터 제조될 수 있는 "우라실 글리코실라제 억제제"(UGI)는 이. 콜라이 우라실-DNA 글리코실라제(UDG)뿐만 아니라 다른 종으로부터의 UDG를 억제하는 작은 단백질(9.5 kDa)이다. UDG의 억제는 1:1의 UGD: UGI 화학량론으로 결합하는 가역적 단백질에 의해 발생한다. UGI는 UDG-DNA 복합체를 해리할 수 있다. UGI의 비-제한적 예는 바실러스 파지 AR9(YP_009283008.1)에서 발견된다. 일부 구현예에서, UGI는 SEQ ID NO: 8의 아미노산 서열을 포함하거나 SEQ ID NO: 8에 대해 적어도 적어도 70%, 75%, 80%, 85%, 90% 또는 95% 서열 동일성을 갖고, 우라실 글리코실라제 억제 활성을 보유한다.
일부 구현예에서, UGI는 시티딘 데아미나제-Cpf1 부분의 C-말단 측에 위치한다. 일부 구현예에서, 융합 단백질은 적어도 2개의 UGI를 포함한다.
일부 구현예에서, 적어도 하나의 핵 국재화 신호("NLS")는 제1 및 제2 단편(시티딘 데아미나제-Cpf1 부분)에 대해, 예를 들어, 제2 단편(Cpf1 포함)과 UGI 사이에서 C-말단에 위치한다. 일부 구현예에서, 적어도 2개의 NLS는 제2 단편과 UGI 사이에 위치한다. 일부 구현예에서, 적어도 3개의 NLS는 제2 단편과 UGI 사이에 위치한다. 일부 구현예에서, 적어도 하나의 NLS는 제1 단편 및 제2 단편(시티딘 데아미나제-Cpf1 부분)에 대해 N-말단에 위치한다.
융합 단백질에서 구성요소의 비-제한적인 예시적 배열은, N-말단에서 C-말단으로, (a) NLS, 시티딘 데아미나제, Cas12a, NLS, UGI, NLS, 2A, 및 UGI; (b) NLS, 시티딘 데아미나제, Cas12a, NLS, NLS, UGI, NLS, 2A, 및 UGI; (c) NLS, 시티딘 데아미나제, Cas12a, NLS, UGI, NLS, 2A, UGI, 2A, 및 UGI; (d) NLS, 시티딘 데아미나제, Cas12a, NLS, UGI, NLS, 2A, UGI, 2A, UGI, 2A 및 UGI를 포함한다.
일부 구현예에서, 펩티드 링커는 선택적으로 융합 단백질에서 각각의 단편들 사이에 제공된다. 일부 구현예에서, 펩티드 링커는 1개 내지 100개(또는, 제한 없이, 3개 내지 20개, 4개 내지 15개) 아미노산 잔기를 갖는다. 일부 구현예에서, 펩티드 링커의 아미노산 잔기의 적어도 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80% 또는 90%는 알라닌, 글리신, 시스테인, 및 세린으로 이루어진 군으로부터 선택된 아미노산 잔기이다.
본 발명은 또한 본 발명의 가이드 RNA를 인코딩하는 핵산 서열을 포함하는 핵산 분자를 제공한다. 핵산 분자는 DNA 또는 RNA 분자일 수 있다. 일부 구현예에서, 핵산 분자는 원형화된다. 다른 구현예에서, 핵산 분자는 선형이다. 일부 구현예에서, 핵산 분자는 단일 가닥이거나, 부분적으로 이중-가닥이거나, 이중-가닥이다. 일부 구현예에서, 핵산 분자는 적어도 하나의 폴리펩티드와 복합체화된다. 폴리펩티드는 핵산 인식 또는 핵산 결합 도메인을 가질 수 있다. 일부 구현예에서, 폴리펩티드는, 예를 들어, 본 발명의 키메라 RNA, 및 선택적으로 뉴클레아제의 전달을 매개하기 위한 셔틀이다. 일부 구현예에서, 폴리펩티드는 Feldan Shuttle(본원에 참고로 포함된 미국 특허 공개 제20160298078호)이다.
"표적내 편집"은 gRNA에 의해 표적화된 PAM 부위 이후 영역의 시토신에서 티민으로의 치환이다. 주요 편집 범위는 PAM 부위 이후 8개 내지 13개 염기이다. "표적외 편집"은 gRNA 표적화된 영역 내부의 C에서 T로의 변경 이외의 인델 또는 염기 변경 또는 gRNA 표적화된 영역 외부의 염기 변경 또는 인델이다.
"부위-지정 변형 폴리펩티드"는 표적 DNA(예를 들어, 표적 DNA의 절단 또는 메틸화) 및/또는 표적 DNA와 결부된 폴리펩티드(예를 들어, 히스톤 꼬리의 메틸화 또는 아세틸화)를 변형시킨다. 부위-지정 변형 폴리펩티드는 또한 본원에서 "부위-지정 폴리펩티드" 또는 "RNA 결합 부위-지정 변형 폴리펩티드"로 지칭된다. 부위-지정 변형 폴리펩티드는 단일 RNA 분자 또는 적어도 두 개의 RNA 분자의 RNA 이중체인 가이드 RNA와 상호 작용하고, 가이드 RNA와의 이의 회합에 의해 DNA 서열(예를 들어, 염색체 서열 또는 염색체 외 서열, 예를 들어, 에피솜 서열, 미니서클 서열, 미토콘드리아 서열, 엽록체 서열 등)에 가이딩된다.
일부 경우에, 부위-지정 변형 폴리펩티드는 자연 발생적 변형 폴리펩티드이다. 다른 경우에, 부위-지정 변형 폴리펩티드는 자연 발생적 폴리펩티드가 아니다(예를 들어, 변형, 예를 들어, 돌연변이, 결실, 삽입된 키메라 폴리펩티드 또는 자연 발생적 폴리펩티드). 예시적인 자연 발생적 부위-지정 변형 폴리펩티드는 당업계에 알려져 있다(예를 들어, 둘 모두 본원에 참고로 포함된 문헌[Makarova et al., 2017, Cell 168: 328-328.e1] 및 문헌[Shmakov et al., 2017, Nat Rev Microbiol 15(3): 169-182]을 참조함). 이러한 자연 발생적 폴리펩티드는 DNA-표적화 RNA에 결합하고, 그에 따라 표적 DNA 내의 특정 서열로 지향되고, 표적 DNA를 절단하여 이중 가닥 파손을 생성한다.
부위-지정 변형 폴리펩티드는 RNA-결합 부분과 활성 부분의 두 부분을 포함한다. 일부 구현예에서, 부위-지정 변형 폴리펩티드는 다음을 포함한다: (i) DNA-표적화 RNA와 상호 작용하는 RNA-결합 부분으로서, DNA-표적화 RNA는 표적 DNA 내의 서열에 상보적인 뉴클레오티드 서열을 포함하는, RNA-결합 부분; 및 (ii) 부위-지정 효소 활성(예를 들어, DNA 메틸화를 위한 활성, DNA 절단을 위한 활성, 히스톤 아세틸화를 위한 활성, 히스톤 메틸화를 위한 활성 등)을 나타내는 활성 부분으로서, 효소 활성 부위는 DNA-표적화 RNA에 의해 결정되는, 활성 부분. 다른 구현예에서, 부위-지정 변형 폴리펩티드는 다음을 포함한다: (i) DNA-표적화 RNA와 상호 작용하는 RNA-결합 부분으로서, DNA-표적화 RNA는 표적 DNA 내의 서열에 상보적인 뉴클레오티드 서열을 포함하는, RNA-결합 부분; 및 (ii) 표적 DNA 내에서 전사를 조절하는(예를 들어, 전사를 증가시키거나 감소시키는) 활성 부분으로서, 표적 DNA 내의 조절되는 전사 부위는 DNA-표적화 RNA에 의해 결정되는, 활성 부분.
일부 경우에, 부위-지정 변형 폴리펩티드는 작동 가능하게-연결된 이종성 도메인을 갖는다. 이종성 도메인은 효소 또는 신호 펩티드일 수 있다. 이종성 도메인이 효소 도메인인 양태에서, 도메인은 표적 핵산을 변형시키는 효소 활성(예를 들어, 뉴클레아제 활성, 메틸트랜스퍼라제 활성, 데메틸라제 활성, DNA 복구 활성, DNA 손상 활성, 탈아미노화 활성, 역전사효소 활성, 디스뮤타제 활성, 알킬화 활성, 메틸화 활성, 탈퓨린화 활성, 산화 활성, 피리미딘 이량체 형성 활성, 인테그라제 활성, 트랜스포사제 활성, 재조합 효소 활성, 중합 효소 활성, 리가제 활성, 헬리카제 활성, 광분해 효소 활성 또는 글리코실라제 활성)을 지닌다. 다른 경우에, 부위-지정 변형 폴리펩티드는 효소 활성이 표적 DNA와 결부된 폴리펩티드(예를 들어, 히스톤)를 변형시키는 작동 가능하게 연결된 효소 도메인(예를 들어, 메틸트랜스퍼라제 활성, 데메틸라제 활성, 아세틸트랜스퍼라제 활성, 데아세틸라제 활성, 키나제 활성, 포스파타제 활성, 유비퀴틴 리가제 활성, 탈유비퀴틴화 활성, 아데닐화 활성, 탈아데닐화 활성, 수모일화(SUMOylating) 활성, 탈수모일화(deSUMOylating) 활성, 리보실화 활성, 탈리보실화 활성, 미리스토일화 활성 또는 탈미리스토일화 활성)을 갖는다. 예시적인 효소 도메인은, 단독으로 또는 다른 효소 도메인과 조합되는지의 여부에 상관없이 아데노신 데아미나제, 옥시다제, 티민 알킬트랜스퍼라제, 아데닌 옥시다제, 아데노신 메틸트랜스퍼라제, 아데노신 데아미나제, 글리코실라제를 포함한다. 이종성 도메인이 신호 펩티드인 양태에서, 신호 펩티드는 핵 국재화 신호("NLS"), 예컨대, SV40 NLS일 수 있다.
일부 경우에, 다양한 부위-지정 변형 폴리펩티드, 예를 들어, 다양한 Cas9 단백질(즉, 다양한 종으로부터의 Cas9 단백질)이 다양한 Cas9 단백질의 다양한 효소 특성을 이용하기 위해(예를 들어, 다양한 PAM 서열 선호를 위해; 효소 활성의 증가 또는 감소를 위해; 세포 독성 수준의 증가 또는 감소를 위해; NHEJ, 상동성-지정 복구, 단일 가닥 파손, 이중 가닥 파손 사이의 균형을 변화시키기 위해 등) 본 발명의 다양한 제공된 방법에서 사용하기에 유리할 수 있다. 다양한 종으로부터의 Cas9 단백질(예를 들어, 문헌[Shmakov et al., 2017]에 개시된 것들, 또는 그로부터 유래된 폴리펩티드들)은 표적 DNA 내의 다양한 PAM 서열을 필요로 할 수 있다. 따라서, 선택된 특정 Cas9 효소의 경우, PAM 서열 요건은 Cas9 활성을 위해 필요한 것으로 알려진 5'-N GG-3' 서열(여기서, N은 A, T, C 또는 G임)과 상이할 수 있다. 매우 다양한 종으로부터의 많은 Cas9 오르토로그가 본원에서 확인되었고, 단백질들은 몇 개의 동일한 아미노산을 공유한다. 모든 확인된 Cas9 오르토로그는 중심 HNH 엔도뉴클레아제 도메인 및 스플릿(split) RuvC/RNaseH 도메인을 갖는 동일한 도메인 아키텍처(architecture)를 갖는다. Cas9 단백질은 보존된 아키텍처를 갖는 4개의 핵심 모티프를 공유하는데, 모티프 1, 2 및 4는 RuvC 유사 모티프인 한편, 모티프 3은 HNH-모티프이다. 대조적으로, 다양한 종으로부터의 Cas12a 단백질은 TTTV의 LbCas12a 정규 PAM과 비교하여 상이한 PAM 서열 요건을 가질 수 있다.
부위-지정 변형 폴리펩티드는 또한 키메라 및 변형된 CRISPR/Cas 뉴클레아제일 수 있다. 예를 들어, 이는 변형된 Cas9 "염기 편집기"일 수 있다. 염기 편집은 DNA 절단 또는 공여자 DNA 분자를 필요로 하지 않고 프로그래밍 가능한 방식으로 하나의 표적 DNA 염기의 또 다른 염기로의 직접적이고 비가역적인 전환을 가능하게 한다. 예를 들어, 문헌[Komor et al (2016, Nature, 533: 420-424)]에는 Cas9-시티딘 데아미나제 융합이 교시되어 있으며, 여기서 Cas9는 또한 비활성화되어 이중-가닥 DNA 파손을 유도하지 않도록 조작되었다. 추가로, 문헌[Gaudelli et al (2017, Nature, doi:10.1038/nature24644)]에는 tRNA 아데노신 데아미나제에 융합된 촉매 활성이 손상된(catalytically impaired) Cas9가 교시되어 있으며, 이는 표적 DNA 서열에서 A/T의 G/C로의 전환을 매개할 수 있다. 본 발명의 방법 및 조성물에서 부위-지정 변형 폴리펩티드로 작용할 수 있는 또 다른 부류의 조작된 Cas9 뉴클레아제는, NG, GAA, 및 GAT를 비롯한 광범위한 PAM 서열을 인식할 수 있는 변이체이다(문헌[Hu et al., 2018, Nature, doi:10.1038/nature26155]).
구현예
일 구현예에서, N-말단에서 C-말단 방향으로, 이종성 도메인, 제1 링커 서열, 및 V형 CRISPR-Cas 효소를 포함하는 융합 단백질이 제공되고, 여기서 제1 링커 서열은 반복된 GGGGS 서열을 포함한다. 일 양태에서, 이종성 도메인은 데아미나제, 폴리머라제, 뉴클레아제, 릴랙사제, 알킬트랜스퍼라제, 메틸트랜스퍼라제, 아데노신 데아미나제, 시티딘 데아미나제, 옥시다제, 티민 알킬트랜스퍼라제, 아데닌 옥시다제, 아데노신 메틸트랜스퍼라제, 글리코실라제 또는 핵 국재화 신호이다. 또 다른 양태에서, 이종성 도메인은 데아미나제 도메인이다. 추가의 또 다른 양태에서, 데아미나제 도메인은 시티딘 데아미나제이다. 또 다른 양태에서, 시티딘 데아미나제 도메인은 활성화-유도 시티딘 데아미나제("AID")이다. 추가의 또 다른 양태에서, 시티딘 데아미나제 도메인은 아포리포단백질 B mRNA-편집 복합체("APOBEC") 도메인이다. 또 다른 양태에서, APOBEC 도메인은 APOBEC1 패밀리 데아미나제이다. 추가의 또 다른 양태에서, APOBEC 도메인은 SEQ ID NO: 1과 적어도 70% 동일한 서열을 포함한다. 또 다른 양태에서, 데아미나제 도메인은 아데닌 데아미나제이다. 추가의 또 다른 양태에서, 아데닌 데아미나제는 SEQ ID NO: 92와 적어도 70% 동일한 서열을 포함하는 TadA 도메인이다.
일 양태에서, V형 CRISPR-Cas 효소는 V-A형("Cas12a") 효소이다. 또 다른 양태에서, Cas12a 도메인은 SEQ ID NO: 3, SEQ ID NO: 6, SEQ ID NO: 22, SEQ ID NO: 45, SEQ ID NO: 46, SEQ ID NO: 47, 및 SEQ ID NO: 48로 구성된 군으로부터 선택된다. 추가의 또 다른 양태에서, Cas12a 도메인은 촉매적 비활성이고, SEQ ID NO: 3, SEQ ID NO: 6, 및 SEQ ID NO: 22로 구성된 군으로부터 선택된다.
일 양태에서, 제1 링커 서열은 적어도 3 회 반복된 GGGGS를 포함한다. 일 양태에서, 제1 링커 서열은 적어도 6 회 반복된 GGGGS를 포함한다.
일 양태에서, 융합 단백질은 SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 13, 및 SEQ ID NO: 44로 이루어진 군으로부터 선택된 서열을 포함한다. 또 다른 양태에서, 융합 단백질은 우라실 DNA 글리코실라제 억제제("UGI") 도메인을 추가로 포함한다. 추가의 또 다른 양태에서, UGI 도메인은 SEQ ID NO: 8을 포함한다. 또 다른 양태에서, UGI 도메인은 서열 SGGS를 포함하는 제2 링커에 의해 Cas12a 효소에 연결된다. 추가의 또 다른 양태에서, 융합 단백질은 SEQ ID NO: 17, SEQ ID NO: 24, SEQ ID NO: 35, SEQ ID NO: 39, SEQ ID NO: 43, SEQ ID NO: 50, SEQ ID NO: 52, SEQ ID NO: 54, SEQ ID NO: 56, SEQ ID NO: 81, SEQ ID NO: 83, SEQ ID NO: 85, SEQ ID NO:87, 및 SEQ ID NO:89로 이루어진 군으로부터 선택된 서열을 포함한다. 또 다른 양태에서, 융합 단백질은 DNA와 접촉될 때, 반복된 GGGGS 서열 이외의 제1 링커 서열을 갖는 융합 단백질에 비해 증가된 빈도로 표적내 편집을 생성하고 감소된 빈도로 표적외 편집을 생성한다.
또 다른 구현예에서, 식물 게놈 DNA를 편집하는 방법으로서, 상기 방법은 식물 게놈 DNA를 (a) 선택적으로 UGI 도메인을 포함하여 상기 양태들의 융합 단백질; 및 (b) 단계 (a)의 융합 단백질을 식물 게놈 DNA의 표적 DNA 서열에 표적화하는 가이드 RNA("gRNA")와 접촉시키는 단계를 포함하고, 여기서 편집된 식물 게놈 DNA는 반복된 GGGGS 서열 이외의 제1 링커를 갖는 융합 단백질에 의해 편집된 식물 게놈 DNA에 비해 감소된 표적외 편집을 포함하는, 방법이 제공된다.
또 다른 구현예에서, 감소된 표적외 편집으로 식물 게놈 DNA를 편집하는 방법으로서, 상기 방법은 식물 게놈 DNA를 (a) 선택적으로 UGI 도메인을 포함하여 상기 양태들 중 하나의 융합 단백질; 및 (b) 단계 (a)의 융합 단백질을 식물 게놈 DNA의 표적 DNA 서열에 표적화하는 가이드 RNA("gRNA")와 접촉시키는 단계를 포함하고, 여기서 편집된 식물 게놈 DNA는 반복된 GGGGS 서열 이외의 제1 링커를 갖는 융합 단백질에 의해 편집된 식물 게놈 DNA에 비해 감소된 표적외 편집을 포함하는, 방법이 제공된다. 양태에서, 융합 단백질은 SEQ ID NO: 24를 포함한다.
또 다른 구현예에서, 감소된 표적외 편집으로 편집된 식물의 집단을 수득하는 방법으로서, 상기 방법은 (a) 편집될 게놈 DNA를 포함하는 식물 세포 집단을 수득하는 단계; (b) 상기 양태들 및 선택적으로 UGI 도메인의 융합 단백질을 인코딩하는 뉴클레오티드 서열을 수득하는 단계; (c) 식물 세포의 집단을 단계 (b)의 뉴클레오티드 서열로 형질 전환함으로써, 식물 세포의 집단 내에서 핵산 서열에 의해 인코딩되는 융합 단백질을 발현하는 단계; (d) 형질 전환된 식물 세포 집단을 식물로 성장시키는 단계로서, 식물의 적어도 하나가 편집되는 단계; 및 (e) 단계 (d)의 생성물로부터 적어도 하나의 편집된 식물을 선택함으로써, 편집된 식물의 집단을 수득하는 단계로서, 편집된 식물의 집단은 반복된 GGGGS 서열 이외의 제1 링커를 갖는 융합된 단백질에 의해 편집된 식물에 비해 감소된 표적외 편집을 포함하는 단계를 포함하는, 방법이 제공된다. 일 양태에서, 융합 단백질을 인코딩하는 뉴클레오티드 서열은 SEQ ID NO: 17, SEQ ID NO: 24, SEQ ID NO: 35, SEQ ID NO: 39, SEQ ID NO: 43, SEQ ID NO: 50, SEQ ID NO: 52, SEQ ID NO: 54, SEQ ID NO: 56, SEQ ID NO: 81, SEQ ID NO: 83, SEQ ID NO: 85, SEQ ID NO:87, 및 SEQ ID NO:89를 포함한다. 일부 구현예에서, 개선된 링커 서열에 의해 연결된 하나 이상의 DNA 결합 도메인 및 하나 이상의 DNA 변형 도메인을 포함하는 융합 단백질을 인코딩하는 코돈 최적화된 폴리뉴클레오티드가 제공된다.
실시예
하기 실시예는 예시적인 구현예를 제공한다. 본 개시 및 당 분야의 일반적인 수준의 기술에 비추어, 당업자는 하기 실시예가 단지 예시적인 것으로 의도되고, 본원에 개시된 요지의 범위로부터 벗어남 없이 다수의 수정, 변형 및 변경이 이용될 수 있음을 이해할 것이다.
실시예 1. dLbCas12a-BE를 위한 벡터의 구축 및 가이드 RNA 발현
식물에서 염기 편집에 유익한 성질을 이용하는 한 단백질로서 아미노산 링커에 의해 연결된, D832A/E925A/D1148A 돌연변이, 랫트 시티딘 데아미나제(APOBEC1) 및 우라실 DNA 글리코실라제 억제제(UGI)를 함유한 촉매적 비활성 라크노스피라세아이 박테리움 Cas12a(이하에서 "dLbCas12a," 이전에 dLbCpf1로 공지됨)을 융합하였다. 융합 작제물을 제아 메이즈(Zea mays) 코돈에 대해 최적화하고, 상업적으로 합성하고(GenScript, 난징, 중국), 사탕수수 유비퀴틴-4(SoUbi4) 유전자 프로모터 하에 클로닝하여 dLbCas12a-BE를 구성적으로 생성하였다.
작제물 24524의 dLbCas12a-BE에서, 핵 국재화 신호(SV40-NLS)는 XTEN 단백질 링커에 의해 dLbCas12a에 연결된 APOBEC1, 및 이어서 SGGS 링커에 의해 UGI에 연결된 SV40-NLS로 진행되었다. SV40-NLS를 또한 SGGS 링커에 의해 UGI의 C-말단에 도입하여 융합 단백질의 핵 내 표적화를 개선하였다. 메이즈 최적화된 코돈으로 제조된 dLbCas12a-BE에 대한 합성 서열은 SEQ ID NO: 18에 기재되어 있다.
작제물 24904의 dLbCas12a-BE에서, SV40-NLS는 (G4S)x6로도 지칭되는 6개 GGGGS 아미노산 반복부를 갖는 30개 아미노산 링커 GGGGS GGGGS GGGGS GGGGS GGGGS GGGGS(SEQ ID NO: 11)에 의해 dLbCas12a에 연결된 APOBEC1, 및 이어서 SGGS 링커에 의해 UGI에 연결된 SV40NLS로 진행되었다. SV40-NLS를 또한 SGGS 링커에 의해 UGI의 C-말단에 도입하여 융합 단백질의 핵 내 표적화를 개선하였다. 메이즈 최적화된 코돈으로 제조된 dLbCas12a-BE에 대한 합성 서열은 SEQ ID NO: 23에 기재되어 있다.
작제물 25057의 dLbCas12a-BE에서, SV40-NLS는 XTEN 단백질 링커에 의해 dLbCas12a에 연결된 APOBEC1, 및 이어서 SX로 지칭되는 18개 아미노산 링커 GGSTG GGSGG GSGGG SSG(SEQ ID NO: 12)에 의해 UGI에 연결된 SV40-NLS로 진행되었다. SV40-NLS를 또한 (G4S)x3로 지칭되는 15개 아미노산 링커 GGGGS GGGGS에 의해 UGI의 C-말단에 도입하여 dLbCas12a-BE의 핵 내 표적화를 개선하였다. 메이즈 최적화된 코돈으로 제조된 dLbCas12a-BE에 대한 합성 서열은 SEQ ID NO: 14에 기재되어 있다.
작제물 25058의 dLbCas12a-BE에서, SV40-NLS는 30개 아미노산 링커 (G4S)x6에 의해 dLbCas12a에 연결된 APOBEC1, 및 이어서 SX 링커에 의해 UGI에 연결된 SV40-NLS로 진행되었다. SV40-NLS를 또한 (G4S)x3에 의해 UGI의 C-말단에 도입하여 dLbCas12a-BE의 핵 내 표적화를 개선하였다. 메이즈 최적화된 코돈으로 제조된 dLbCas12a-BE에 대한 합성 서열은 SEQ ID NO: 16에 기재되어 있다.
dLbCas12a-BE 작제물에서, CRISPR/Cas12a 가이드 RNA 전사체는 엑손4에서 PAM 서열 후에 T로 C9, C10 또는 C22를 변경하도록 옥수수 Waxy1 제4 엑손 영역을 표적화하는 SoUbi4 프로모터의 제어 하에 발현되었다. 이는 또한 스캐폴드로서 LbCrRNA의 직접적인 반복부를 포함하였다. 가이드 RNA에 대한 합성 서열은 SEQ ID NO: 26에 기재되어 있다.
작제물 24784에서, 핵 국재화 신호(xSV40NLS-06)는 xXTEN-02에 의해 메이즈-최적화된 Cas9 유전자(cCas9BE-02)에 연결된 시티딘 데아미나제(xAPOBEC1-01), 및 이어서 xSGGS링커-02에 의해 핵 국재화 신호 xSV40NLS-07에 연결된 우라실 DNA 글리코실라제 억제제 xUGI-02에 xSGGS링커-02에 의해 연결된 핵 국재화 신호(xSV40NLS-04)로 진행되었다. 융합 단백질은 사탕수수 유비퀴틴-4 프로모터(prSoUbi4-02) 및 이어서 NOS 종결자(tNOS-05-01)의 제어 하에 구동되었다. Cas9 단백질은 랫트 APOBEC1 및 우라실 DNA 글리코실라제 억제제(UGI)에 융합된 D10A를 갖는 니카제 Cas9 돌연변이이다. 핵 국재화 신호를 또한 Cas9의 C-말단에 도입하여 핵으로의 이의 표적화를 개선하였다. cCas9BE-02에 대한 합성 서열은 SEQ ID NO: 20에 기재되어 있다.
실시예 2. 옥수수 배아의 아그로박테리움-매개된 형질 전환
메이즈 Wx1에서 편집된 잠재적인 사건을 생성하기 위해, 엘리트 메이즈 형질 전환 변종 NP2222를 기재된 바와 같이(WO16106121, 본원에 참고로 포함됨) 모든 실험에 대해 선택하였다.
옥수수 변종 NP2222를 옥수수 형질 전환에 사용하였다. 미성숙 배아가 약 1.2 mm일 때 GH로부터 옥수수 이삭을 수확한 다음, 20분 동안 20% Clorox 용액으로 이삭을 멸균하고, 멸균수로 3 회 헹구었다.
전기천공에 의해 벡터를 보유하는 아그로박테리움 투메파시엔스(Agrobacterium tumefaciens) 균주 LBA4404 17740 RecA-를 Gent(25 μg/ml) 및 Spec(100 μg/ml) 항생제를 함유하는 YP 배지에서 스트리킹하고, 28℃에서 2일 동안 성장시켰다. 형질 전환 전에, 단일 콜로니를 선택하고, 신선한 YP 플레이트 상에 스트리킹하고 28℃에서 1일 동안 성장시켰다. 아그로박테리움을 접종 배지를 사용하여 재현탁시켰다. OD660을 0.25로 조정하였다.
배유를 제거한 후, 미성숙 배아를 멸균된 메스로 분리하고 함께 수집하여 아그로박테리움 현탁액에 2분 내지 3분 동안 주입하였다. 감염된 미성숙 배아를 22℃ 에서 2일 내지 4일 동안 공동-배양 배지로 옮겼다.
공동-배양 단계 후, 배아를 28℃ 암흑 조건 하에 4주 동안 선택제와 함께 배지로 옮겼다. 저항성 배아 캘리를 재생 배지로 옮기고, 16/8 광 주기 조건으로 28℃에서 배양하였다. 약 3주 후, 재생된 묘목을 동일한 배양 온도 및 광 조건 하에서 발근 배지가 있는 성장 용기로 옮겼다.
실시예 3. 표적화된 영역에서 편집된 염기의 분석
Phire Plant Direct PCR Master Mix(Thermo Fisher, F160L)를 사용하여 옥수수 잎 샘플로부터 직접적으로 표적화된 영역을 함유하는 DNA 단편을 약 410 bp 증폭시켰다. PCR 전에 DNA 정제가 필요하지 않았다. 증폭된 DNA 단편을 Sanger DNA 시퀀싱에 의해 수행하여 표적 부위의 돌연변이를 분석하였다.
DNA 추출 및 PCR 증폭을 제조업체의 권고에 따라 수행하였다. 어린 잎 조각(예를 들어, 직경이 약 2 mm인 펀치)을 30 μL의 희석 완충액에 넣었다. 잎 샘플을 튜브 벽에 대고 잠시 누르고 20 μL의 희석 완충액을 첨가함으로써 100 μL 피펫 팁으로 파쇄하였다. 잎을 파쇄한 후, 용액은 녹색을 띠었다. 식물 물질을 원심분리기에서 회전시키고, 1 μL의 상청액을 20 μL PCR 반응을 위한 주형으로 사용하였다.
PCR 시스템은 하기로 이루어졌다:
ZmWaxy1에 대한 PCR 프라이머:
포워드 프라이머: 5'-AGATGGGAGACGGGTACGAGACGG-3' (SEQ ID NO: 29)
리버스 프라이머: 5'-GTATGGGTTGTTGTTGAGGCTCAGG-3' (SEQ ID NO: 30)
DNA 시퀀싱 프라이머: 5'-GACCACCCACTGTTCCTGGAGAGGG-3' (SEQ ID NO: 31)
PCR 조건:
5분 동안 98℃;
5초 동안 98℃, 및 이어서 5초 동안 60℃의 35 회 사이클;
20초 동안 72℃;
1분 동안 72℃; 및
분석 준비까지 4℃에서 유지.
시퀀싱:
PCR 산물을 아가로스 겔 전기영동에 의해 분리하고, 특정 프라이머에 의한 Sanger DNA 시퀀싱 전에 정제하였다. 이종접합 돌연변이의 경우, 동종접합 돌연변이로 여겨지는 대조군과 상이한 독특한 단일 피크와 함께 표적 뉴클레오티드 위치에서 이중 피크가 관찰되었다. 작제물 24524, 24904 및 24784에 대한 트랜스제닉 사건을 이용하여 시퀀싱을 위한 ZmWxy1 엑손 4 영역을 증폭시킴으로써 염기 편집을 평가하였다.
[표 1] 시티딘 데아미나제와 니카제 Cas9("nCas9-CBE") 사이에 XTEN 링커를 포함하는 CRISPR/Cas 시티딘 염기 편집기("CBE") APOBEC
편집된 뉴클레오티드는 회색 음영으로 나타나 있다. 상기 나타낸 바와 같이, APOBEC 도메인과 부위-지정 뉴클레아제 사이에 XTEN 링커를 포함하는 이러한 버전의 Cas12a 염기 편집기는 위치 5 및 위치 6에서 시스테인을 티아민으로 가장 효율적으로 편집하였다. 그러나, 위치 -2, 7, 및 49에 구아닌에서 아데닌으로 편집하는 경우가 있었다. 위치를 PAM 부위의 시작점에서 떨어져 있는 뉴클레오티드의 수에 의해 결정하였다.
[표 2] APOBEC 데아미나제와 dLbCas12a 사이에 XTEN 링커를 포함하는 CRISPR/Cas 시티딘 염기 편집기
편집된 뉴클레오티드는 회색 음영으로 나타나 있다. 이러한 버전에서, APOBEC 도메인과 탈활성화된 부위-지정 뉴클레아제 사이에 XTEN 링커를 포함하는, Cas12a 염기 편집기는 위치 9, 10, 및 22에서 시스테인을 티아민으로 편집하고, 위치 39, 44, 52, 및 특히 53에서 구아닌을 아데닌으로 편집하였다. 구아닌이 아데닌으로 편집되는 곳은 상보체 가닥 상에서 편집이 발생했다는 것을 지시한다.
[표 3] 데아미나제와 dLbCas12a 사이에 긴 링커를 포함하는 CRISPR/Cas 시티딘 염기 편집기
편집된 뉴클레오티드는 회색 음영으로 나타나 있다. 이러한 버전에서, APOBEC 도메인과 탈활성화된 부위-지정 뉴클레아제 사이에 (G4S)6을 포함하는 긴 링커를 포함하는, Cas12a 염기 편집기는 위치 9 및 10에서 시스테인을 티아민으로 편집하고, 위치 19, 및 53에서 구아닌을 아데닌으로 편집하였다. 구아닌이 아데닌으로 편집되는 곳은 상보체 가닥 상에서 편집이 발생했다는 것을 지시한다.
실시예 4. 편집 효율 측정.
[표 4] 옥수수 Wxy1 by dLbCas12a-CBE 시스템의 염기 편집 효율.
표 4는 긴 링커를 사용한 Cas12a의 염기 편집 효율이 Cas9의 염기 편집 효율과 비슷하다는 것을 보여준다. 최적화 없이, Cas12aBE는 Cas9(87%)보다 훨씬 낮게 대략 5%의 불량한 편집 효율을 가졌다. 그러나, 데아미나제를 촉매적 비활성 Cas12a에 작동 가능하게 연결하도록 긴 링커를 추가함으로써, 편집 효율은 12배까지 향상되었다.
[표 5] 긴 링커를 사용한 LbCas12a에 의한 SBEIIb의 편집 효율.
표 5는 XTEN 링커 또는 긴 링커에 작동 가능하게 연결될 때 LbCas12a 염기 편집기의 편집 효율 간의 직접적인 비교를 보여준다. 어려운 표적의 편집 효율은 데아미나제를 긴 링커, 예컨대, (G4S)6에 의해 부위-지정 뉴클레아제에 작동 가능하게 연결하는 경우 거의 5배 향상되었다.
[표 6] 긴 링커를 사용한 LbCas12a에 의한 Waxy1의 편집 효율.
[표 7] 긴 링커를 사용한 LbCas12a에 의한 SBEIIb, Waxy1, 및 Glossy2의 다중화된 편집.
동일한 작제물 내 여러 가이드 RNA 분자를 사용("다중화" 또는 "다중화된 편집")할 뿐만 아니라 아니라 핵 국재화 신호와 활성 Cas12a 사이에 긴 링커를 갖는 다중의 동시적인 편집은 높은 편집 효율을 달성하였다. SBEIIb와 같은 난제의 표적조차도 다중화된 편집 실험 설계의 일부일 때 허용 가능한 편집 효율을 달성하였다.
실시예 5. 대두에서의 편집 향상.
긴 링커와 Cas12a 조합을 사용한 대두 편집이 또한 크게 향상되었다. 표준 Cas12a 및 긴 링커-Cas12a에 의한 GmFAD2 편집은 거의 7배까지 향상되었다.
[표 8] GmFAD2 편집
실시예 6. 옥수수에서 Mb2Cas12a 편집을 향상시킨 긴 링커.
긴 링커는 또한 Mb2Cas12a와 같은 추가 Cas12 효소의 편집 효율을 향상시켰다.
[표 9] 긴 링커를 사용한 Mb2Cas12a에 의한 편집.
긴 링커 없이, Mb2Cas12a는 표적 서열을 편집하지 않았다. 그러나, 긴 링커를 사용하여, 편집 효율은 유의하게 향상되었다.
실시예 7. 긴 링커에 의해 연결되는 Cas12a에 작동 가능하게 연결된 기타 이종성 도메인.
긴 링커를 통해 Cas12a에 이종성 도메인(APOBEC 데아미나제만을 넘어서)을 테더링하는 것은 본 발명의 범위 내에 있다. 이러한 이종성 도메인은 데아미나제, 폴리머라제, 뉴클레아제, 릴랙사제, 알킬트랜스퍼라제, 메틸트랜스퍼라제, 아데노신 데아미나제, 시티딘 데아미나제, 옥시다제, 티민 알킬트랜스퍼라제, 아데닌 옥시다제, 아데노신 메틸트랜스퍼라제, 글리코실라제 또는 핵 국재화 신호를 포함하지만, 이로 한정되지 않는다.
아데닌 데아미나제를 Cas12a에 작동 가능하게 연결하여 Cas12a 아데닌 염기 편집기("Cas12a-ABE")를 생성하였다. 촉매적 비활성 LbCas12a(D832A, E925A, 및 D1148A 돌연변이 함유)를 아미노산 링커에 의해 작동 가능하게 연결된 이. 콜라이 야생형 아데닌 데아미나제(W23R, H36L, P48A, R51L, L84F, A106V, D108N, H123Y, S146C, D147Y, R152P, E155V, I156F, 및 K157N 아미노산 치환을 함유하도록 조작된 "TadA")에 융합하였다. 융합 작제물을 제아 메이즈(Zea mays) 코돈에 대해 최적화하고, 상업적으로 합성하고(GenScript, 난징, 중국), 사탕수수 유비퀴틴-4(SoUbi4) 유전자 프로모터 하에 함유하고 클로닝하여 dLbCa12a-ABE를 구성적으로 생성하였다.
작제물 25459의 dLbCas12a-ABE에서, 189 bp 감자 인트론을 XTEN 단백질 링커에 의해 연결된 TadA 변이체에 의해 진행된 TadA 코딩 서열에 삽입하여 TadA 이량체를 형성하였다. 이를 dLbCas12a에 융합하고, SV40-NLS를 또한 GS 링커에 의해 dLbCas12a의 C-말단에 도입하여 융합 단백질의 핵 내 표적화를 개선하였다. 메이즈 최적화된 코돈으로 제조된 dLbCas12a-ABE에 대한 합성 서열은 SEQ ID NO: 79에 기재되어 있다.
작제물 25504의 dLbCas12a-ABE에서, 189 bp 감자 인트론을 TadA 변이체에 의해 진행된 TadA 코딩 서열에 삽입하여 TadA 이량체를 형성하였다. 이를 dLbCas12a에 또한 30개 아미노산 링커 (G4S)x6 단백질 링커에 의해 연결하고, SV40-NLS를 또한 GS 링커에 의해 dLbCas12a의 C-말단에 도입하여 융합 단백질의 핵 내 표적화를 개선하였다. 메이즈 최적화된 코돈으로 제조된 dLbCas12a-ABE에 대한 합성 서열은 SEQ ID NO: 81에 기재되어 있다.
dLbCas12a-ABE 작제물에서, CRISPR/Cas12a 가이드 RNA 전사체는 옥수수 Waxy1 유전자를 표적화하는 SoUbi4 프로모터의 제어 하에 발현되었다. 이는 또한 스캐폴드로서 LbCrRNA의 직접적인 반복부를 포함하였다. 가이드 RNA에 대한 합성 서열은 SEQ ID NO: 74에 기재되어 있다.
작제물 25459(아데닌 데아미나제는 XTEN 링커에 의해 dLbCas12a에 연결되었음)로의 실험에서, 메이즈 식물에 사용될 때 검출 가능한 편집이 얻어지지 않았다. (G4S)*6 긴 링커에 의해 아데닌 데아미나제가 dLbCas12a에 연결된 작제물 25504로의 실험에서, Cas9ABE 대조군(작제물 24785)의 대략 절반으로 7% 편집 효율이 얻어졌다. 표 10을 참조한다.
[표 10] dLbCas12aABE
이는 처음으로 Cas12aABE가 식물에서 작용한 것이 밝혀졌음을 나타내는 것으로 생각된다. 아데닌 데아미나제를 Cas12a에 작동 가능하게 연결하기 위해 긴 링커를 사용하는 것이 이러한 기술적 성공의 원인이라고 생각된다.
실시예 8. 메이즈에서의 이중 염기 편집기
이중 염기 편집기(Cas 효소에 융합된 시티딘 데아미나제 도메인 및 아데닌 데아미나제 도메인). 이러한 개념에서, 작물 유전자의 표적화된 포화 돌연변이유발은 동일한 표적 영역에서 향상된 농경학적 성능, 예를 들어, C:G > T:A 및 A:T > G:C 치환을 갖는 유전적 변이체를 생성하기 위해 적용될 수 있다. 4개의 가이드 RNA를 다중화하였다: 하나는 ZmWaxy1 유전자를 표적화하고, 3개의 별개의 가이드 RNA는 ZmADH 유전자를 표적화하였다.
[표 11] 메이즈에서 이중 CBE-ABE Cas12a에 의한 편집 빈도.
[표 12] 메이즈에서 이중 CBE-ABE Cas12a에 의한 편집.
전체적으로, dLbCas12a를 기반으로 한 CBE-ABE는 1% C에서 T로, 및 A에서 G로의 돌연변이이다. 인트론을 추가하면 벡터 안정성이 증가하지만, 비효율적인 스플라이싱으로 인해 효소 활성이 감소될 수 있다. 이는 Cas12a를 사용한 식물에서 이중 CBE-ABE 편집의 첫 번째 경우인 것으로 생각된다.
요약 표
상기 표에서, 대부분의 Cas12aBE 작제물은 이종성 효소 도메인-링커-Cas 효소의 패턴을 따랐다. 이러한 패턴에 대한 예외는 다음과 같다: 25702[TadA 이량체-링커-PmCDA-링커-Cas 효소], 25701[PmCDA-링커-TadA 이량체-링커-Cas 효소], 및 25658[TadA 이량체-링커-Cas 효소-PmCDA]. 추가의 핵 국재화 서열, 우라실 글리코실라제 억제제, 및 다른 구성 요소가 존재할 수 있지만, 상기 표에는 나타나 있지 않을 수 있다. 이러한 세부 사항은 첨부된 서열 목록에 제공된 서열에서 제시된다.
본원에 제공된 실시예 및 구현예는 청구항의 비-제한적 예시이고, 유일한 작업예로 해석되어서는 안된다. 추가 변형이 당업자에 의해 실시될 수 있다.
SEQUENCE LISTING
<110> Syngenta
Li, Jiang
Xu, Jianping
<120> METHODS AND COMPOSITIONS FOR DNA BASE EDITING
<130> Attorney Docket Number 81945
<160> 92
<170> PatentIn version 3.5
<210> 1
<211> 229
<212> PRT
<213> Rattus norvegicus
<400> 1
Met Ser Ser Glu Thr Gly Pro Val Ala Val Asp Pro Thr Leu Arg Arg
1 5 10 15
Arg Ile Glu Pro His Glu Phe Glu Val Phe Phe Asp Pro Arg Glu Leu
20 25 30
Arg Lys Glu Thr Cys Leu Leu Tyr Glu Ile Asn Trp Gly Gly Arg His
35 40 45
Ser Ile Trp Arg His Thr Ser Gln Asn Thr Asn Lys His Val Glu Val
50 55 60
Asn Phe Ile Glu Lys Phe Thr Thr Glu Arg Tyr Phe Cys Pro Asn Thr
65 70 75 80
Arg Cys Ser Ile Thr Trp Phe Leu Ser Trp Ser Pro Cys Gly Glu Cys
85 90 95
Ser Arg Ala Ile Thr Glu Phe Leu Ser Arg Tyr Pro His Val Thr Leu
100 105 110
Phe Ile Tyr Ile Ala Arg Leu Tyr His His Ala Asp Pro Arg Asn Arg
115 120 125
Gln Gly Leu Arg Asp Leu Ile Ser Ser Gly Val Thr Ile Gln Ile Met
130 135 140
Thr Glu Gln Glu Ser Gly Tyr Cys Trp Arg Asn Phe Val Asn Tyr Ser
145 150 155 160
Pro Ser Asn Glu Ala His Trp Pro Arg Tyr Pro His Leu Trp Val Arg
165 170 175
Leu Tyr Val Leu Glu Leu Tyr Cys Ile Ile Leu Gly Leu Pro Pro Cys
180 185 190
Leu Asn Ile Leu Arg Arg Lys Gln Pro Gln Leu Thr Phe Phe Thr Ile
195 200 205
Ala Leu Gln Ser Cys His Tyr Gln Arg Leu Pro Pro His Ile Leu Trp
210 215 220
Ala Thr Gly Leu Lys
225
<210> 2
<211> 687
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 2
atgtccagcg agaccggccc cgtggcggtg gaccccaccc tgcgcaggcg catcgagccg 60
cacgagttcg aggtgttctt cgaccccagg gagctccgca aggagacctg cctcctgtac 120
gagatcaact ggggcggcag gcactccatc tggaggcaca cgagccagaa caccaacaag 180
cacgtcgagg tgaacttcat cgagaagttc accacggaga ggtacttctg cccgaacacg 240
cgctgctcca tcacgtggtt cctctcgtgg agcccatgcg gcgagtgctc cagggcgatc 300
acggagttcc tcagccgcta cccgcacgtg accctgttca tctacatcgc taggctctac 360
caccacgcgg accccaggaa caggcagggc ctcagggacc tgatctccag cggcgtcacg 420
atccagatca tgaccgagca ggagtccggc tactgctgga ggaacttcgt gaactactcc 480
ccgagcaacg aggcccactg gccccgctac ccgcacctct gggtccgcct ctacgtgctc 540
gagctgtact gcatcatcct cggcctgccg ccctgcctca acatcctgag gcgcaagcag 600
ccccagctga cgttcttcac catcgccctg cagagctgcc actaccagag gctcccgccc 660
cacatcctgt gggcgaccgg gctcaag 687
<210> 3
<211> 1251
<212> PRT
<213> Moraxella bovis
<400> 3
Met Leu Phe Gln Asp Phe Thr His Leu Tyr Pro Leu Ser Lys Thr Val
1 5 10 15
Arg Phe Glu Leu Lys Pro Ile Gly Arg Thr Leu Glu His Ile His Ala
20 25 30
Lys Asn Phe Leu Ser Gln Asp Glu Thr Met Ala Asp Met Tyr Gln Lys
35 40 45
Val Lys Val Ile Leu Asp Asp Tyr His Arg Asp Phe Ile Ala Asp Met
50 55 60
Met Gly Glu Val Lys Leu Thr Lys Leu Ala Glu Phe Tyr Asp Val Tyr
65 70 75 80
Leu Lys Phe Arg Lys Asn Pro Lys Asp Asp Gly Leu Gln Lys Gln Leu
85 90 95
Lys Asp Leu Gln Ala Val Leu Arg Lys Glu Ser Val Lys Pro Ile Gly
100 105 110
Ser Gly Gly Lys Tyr Lys Thr Gly Tyr Asp Arg Leu Phe Gly Ala Lys
115 120 125
Leu Phe Lys Asp Gly Lys Glu Leu Gly Asp Leu Ala Lys Phe Val Ile
130 135 140
Ala Gln Glu Gly Glu Ser Ser Pro Lys Leu Ala His Leu Ala His Phe
145 150 155 160
Glu Lys Phe Ser Thr Tyr Phe Thr Gly Phe His Asp Asn Arg Lys Asn
165 170 175
Met Tyr Ser Asp Glu Asp Lys His Thr Ala Ile Ala Tyr Arg Leu Ile
180 185 190
His Glu Asn Leu Pro Arg Phe Ile Asp Asn Leu Gln Ile Leu Thr Thr
195 200 205
Ile Lys Gln Lys His Ser Ala Leu Tyr Asp Gln Ile Ile Asn Glu Leu
210 215 220
Thr Ala Ser Gly Leu Asp Val Ser Leu Ala Ser His Leu Asp Gly Tyr
225 230 235 240
His Lys Leu Leu Thr Gln Glu Gly Ile Thr Ala Tyr Asn Arg Ile Ile
245 250 255
Gly Glu Val Asn Gly Tyr Thr Asn Lys His Asn Gln Ile Cys His Lys
260 265 270
Ser Glu Arg Ile Ala Lys Leu Arg Pro Leu His Lys Gln Ile Leu Ser
275 280 285
Asp Gly Met Gly Val Ser Phe Leu Pro Ser Lys Phe Ala Asp Asp Ser
290 295 300
Glu Met Cys Gln Ala Val Asn Glu Phe Tyr Arg His Tyr Thr Asp Val
305 310 315 320
Phe Ala Lys Val Gln Ser Leu Phe Asp Gly Phe Asp Asp His Gln Lys
325 330 335
Asp Gly Ile Tyr Val Glu His Lys Asn Leu Asn Glu Leu Ser Lys Gln
340 345 350
Ala Phe Gly Asp Phe Ala Leu Leu Gly Arg Val Leu Asp Gly Tyr Tyr
355 360 365
Val Asp Val Val Asn Pro Glu Phe Asn Glu Arg Phe Ala Lys Ala Lys
370 375 380
Thr Asp Asn Ala Lys Ala Lys Leu Thr Lys Glu Lys Asp Lys Phe Ile
385 390 395 400
Lys Gly Val His Ser Leu Ala Ser Leu Glu Gln Ala Ile Glu His His
405 410 415
Thr Ala Arg His Asp Asp Glu Ser Val Gln Ala Gly Lys Leu Gly Gln
420 425 430
Tyr Phe Lys His Gly Leu Ala Gly Val Asp Asn Pro Ile Gln Lys Ile
435 440 445
His Asn Asn His Ser Thr Ile Lys Gly Phe Leu Glu Arg Glu Arg Pro
450 455 460
Ala Gly Glu Arg Ala Leu Pro Lys Ile Lys Ser Gly Lys Asn Pro Glu
465 470 475 480
Met Thr Gln Leu Arg Gln Leu Lys Glu Leu Leu Asp Asn Ala Leu Asn
485 490 495
Val Ala His Phe Ala Lys Leu Leu Thr Thr Lys Thr Thr Leu Asp Asn
500 505 510
Gln Asp Gly Asn Phe Tyr Gly Glu Phe Gly Val Leu Tyr Asp Glu Leu
515 520 525
Ala Lys Ile Pro Thr Leu Tyr Asn Lys Val Arg Asp Tyr Leu Ser Gln
530 535 540
Lys Pro Phe Ser Thr Glu Lys Tyr Lys Leu Asn Phe Gly Asn Pro Thr
545 550 555 560
Leu Leu Asn Gly Trp Asp Leu Asn Lys Glu Lys Asp Asn Phe Gly Val
565 570 575
Ile Leu Gln Lys Asp Gly Cys Tyr Tyr Leu Ala Leu Leu Asp Lys Ala
580 585 590
His Lys Lys Val Phe Asp Asn Ala Pro Asn Thr Gly Lys Asn Val Tyr
595 600 605
Gln Lys Met Val Tyr Lys Leu Leu Pro Gly Pro Asn Lys Met Leu Pro
610 615 620
Lys Val Phe Phe Ala Lys Ser Asn Leu Asp Tyr Tyr Asn Pro Ser Ala
625 630 635 640
Glu Leu Leu Asp Lys Tyr Ala Lys Gly Thr His Lys Lys Gly Asp Asn
645 650 655
Phe Asn Leu Lys Asp Cys His Ala Leu Ile Asp Phe Phe Lys Ala Gly
660 665 670
Ile Asn Lys His Pro Glu Trp Gln His Phe Gly Phe Lys Phe Ser Pro
675 680 685
Thr Ser Ser Tyr Arg Asp Leu Ser Asp Phe Tyr Arg Glu Val Glu Pro
690 695 700
Gln Gly Tyr Gln Val Lys Phe Val Asp Ile Asn Ala Asp Tyr Ile Asp
705 710 715 720
Glu Leu Val Glu Gln Gly Lys Leu Tyr Leu Phe Gln Ile Tyr Asn Lys
725 730 735
Asp Phe Ser Pro Lys Ala His Gly Lys Pro Asn Leu His Thr Leu Tyr
740 745 750
Phe Lys Ala Leu Phe Ser Glu Asp Asn Leu Ala Asp Pro Ile Tyr Lys
755 760 765
Leu Asn Gly Glu Ala Gln Ile Phe Tyr Arg Lys Ala Ser Leu Asp Met
770 775 780
Asn Glu Thr Thr Ile His Arg Ala Gly Glu Val Leu Glu Asn Lys Asn
785 790 795 800
Pro Asp Asn Pro Lys Lys Arg Gln Phe Val Tyr Asp Ile Ile Lys Asp
805 810 815
Lys Arg Tyr Thr Gln Asp Lys Phe Met Leu His Val Pro Ile Thr Met
820 825 830
Asn Phe Gly Val Gln Gly Met Thr Ile Lys Glu Phe Asn Lys Lys Val
835 840 845
Asn Gln Ser Ile Gln Gln Tyr Asp Glu Val Asn Val Ile Gly Ile Asp
850 855 860
Arg Gly Glu Arg His Leu Leu Tyr Leu Thr Val Ile Asn Ser Lys Gly
865 870 875 880
Glu Ile Leu Glu Gln Arg Ser Leu Asn Asp Ile Thr Thr Ala Ser Ala
885 890 895
Asn Gly Thr Gln Val Thr Thr Pro Tyr His Lys Ile Leu Asp Lys Arg
900 905 910
Glu Ile Glu Arg Leu Asn Ala Arg Val Gly Trp Gly Glu Ile Glu Thr
915 920 925
Ile Lys Glu Leu Lys Ser Gly Tyr Leu Ser His Val Val His Gln Ile
930 935 940
Asn Gln Leu Met Leu Lys Tyr Asn Ala Ile Val Val Leu Glu Asp Leu
945 950 955 960
Asn Phe Gly Phe Lys Arg Gly Arg Phe Lys Val Glu Lys Gln Ile Tyr
965 970 975
Gln Asn Phe Glu Asn Ala Leu Ile Lys Lys Leu Asn His Leu Val Leu
980 985 990
Lys Asp Lys Ala Asp Asp Glu Ile Gly Ser Tyr Lys Asn Ala Leu Gln
995 1000 1005
Leu Thr Asn Asn Phe Thr Asp Leu Lys Ser Ile Gly Lys Gln Thr
1010 1015 1020
Gly Phe Leu Phe Tyr Val Pro Ala Trp Asn Thr Ser Lys Ile Asp
1025 1030 1035
Pro Glu Thr Gly Phe Val Asp Leu Leu Lys Pro Arg Tyr Glu Asn
1040 1045 1050
Ile Ala Gln Ser Gln Ala Phe Phe Gly Lys Phe Asp Lys Ile Cys
1055 1060 1065
Tyr Asn Thr Asp Lys Gly Tyr Phe Glu Phe His Ile Asp Tyr Ala
1070 1075 1080
Lys Phe Thr Asp Lys Ala Lys Asn Ser Arg Gln Lys Trp Ala Ile
1085 1090 1095
Cys Ser His Gly Asp Lys Arg Tyr Val Tyr Asp Lys Thr Ala Asn
1100 1105 1110
Gln Asn Lys Gly Ala Ala Lys Gly Ile Asn Val Asn Asp Glu Leu
1115 1120 1125
Lys Ser Leu Phe Ala Arg Tyr His Ile Asn Asp Lys Gln Pro Asn
1130 1135 1140
Leu Val Met Asp Ile Cys Gln Asn Asn Asp Lys Glu Phe His Lys
1145 1150 1155
Ser Leu Met Cys Leu Leu Lys Thr Leu Leu Ala Leu Arg Tyr Ser
1160 1165 1170
Asn Ala Ser Ser Asp Glu Asp Phe Ile Leu Ser Pro Val Ala Asn
1175 1180 1185
Asp Glu Gly Val Phe Phe Asn Ser Ala Leu Ala Asp Asp Thr Gln
1190 1195 1200
Pro Gln Asn Ala Asp Ala Asn Gly Ala Tyr His Ile Ala Leu Lys
1205 1210 1215
Gly Leu Trp Leu Leu Asn Glu Leu Lys Asn Ser Asp Asp Leu Asn
1220 1225 1230
Lys Val Lys Leu Ala Ile Asp Asn Gln Thr Trp Leu Asn Phe Ala
1235 1240 1245
Gln Asn Arg
1250
<210> 4
<211> 3753
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimized
<400> 4
gctctgtttc aagattttac acatctgtac ccgctgagta aaacagtgcg gttcgagctg 60
aaacccatag gaaggaccct cgagcacatc cacgcgaaga attttctgag ccaggatgaa 120
actatggctg atatgtatca aaaagttaag gtcattttgg acgactatca tcgcgatttt 180
attgccgaca tgatgggaga ggtgaaactc acgaagcttg ctgaatttta cgacgtctat 240
ctgaagttca ggaaaaatcc taaggacgat gggctgcaaa aacagcttaa agaccttcaa 300
gctgtccttc ggaaggaatc ggtgaagcct atagggtcag gtgggaagta caaaacaggc 360
tacgatagac tctttggggc aaaactcttc aaagatggaa aagagttggg tgacctcgca 420
aaattcgtta tagcccaaga aggtgagtct tctccgaagc tggctcatct tgctcatttt 480
gagaagttca gcacgtattt tactggattt cacgataatc ggaagaatat gtactcggat 540
gaagacaagc atactgcaat agcgtacagg ctcatccatg agaatttgcc gagattcatc 600
gacaatctgc aaatcttgac aacaatcaaa caaaagcata gcgccctcta tgatcagata 660
atcaacgagc tcacggcctc cgggctcgac gtctccttgg cttctcatct tgacgggtat 720
cacaagctcc ttacacaaga ggggatcacg gcatacaaca ggatcatagg agaggtgaat 780
ggatatacaa ataagcataa ccagatatgc cacaagagcg agcgcatagc gaaacttaga 840
cccttgcaca agcaaatcct ttctgacgga atgggagtgt cattccttcc gtctaagttc 900
gcggatgata gtgagatgtg ccaagcggtc aacgaatttt atcgccatta tactgacgtg 960
ttcgcaaagg tgcaaagtct ctttgacgga tttgatgatc accagaaaga cgggatctat 1020
gttgaacaca aaaaccttaa tgaactgagc aaacaggcgt tcggcgactt tgctttgctg 1080
gggagggtcc ttgatggata ctacgtggac gttgtcaatc cggagttcaa tgagcggttc 1140
gcaaaggcca agactgacaa tgcgaaagcc aagcttacaa aagaaaagga caaattcatt 1200
aaaggagtcc actcactggc ttccctcgaa caagcaatag aacaccatac agctagacac 1260
gacgatgaga gtgttcaagc cggaaaactt ggccagtact tcaaacacgg tttggcgggg 1320
gttgacaacc cgattcagaa aattcacaat aaccattcga cgattaaagg gtttctggaa 1380
agggaaaggc ctgctgggga acgggcgctc ccgaagatca agtcaggaaa aaacccagaa 1440
atgacacagc tcaggcagct gaaggaactt ttggacaacg cattgaatgt ggcgcacttc 1500
gctaagctgc tgacaactaa aacaaccttg gacaaccagg atggaaattt ttacggggag 1560
tttggggtgc tttacgacga gctggctaaa attccaactc tctacaataa ggttagagat 1620
tatctctctc aaaagccctt ttctaccgaa aagtataagc tcaacttcgg caatccgacc 1680
cttctcaatg ggtgggacct gaacaaagag aaagataact ttggggttat acttcagaag 1740
gatggatgct attacttggc gcttcttgat aaggctcata aaaaagtttt cgacaacgcc 1800
cctaacactg gtaagaacgt ctaccaaaag atggtctaca aactgttgcc cggccccaac 1860
aaaatgcttc ctaaagtgtt tttcgcaaaa tcgaatctcg actattataa tccatctgcc 1920
gagctccttg acaaatatgc taaggggacc cataaaaagg gtgataattt caacctgaag 1980
gactgccacg cgcttatcga ctttttcaaa gccgggataa ataagcatcc ggagtggcaa 2040
cattttggtt ttaaattttc gccaacgtcg tcctatcgcg acctttccga tttctatagg 2100
gaagttgaac ctcaggggta ccaggtcaaa tttgttgaca ttaatgcgga ctacattgat 2160
gaattggtgg agcaagggaa gctctacctc tttcaaatat ataacaaaga tttctcgcca 2220
aaagcgcatg gtaaaccgaa tcttcatacc ttgtacttta aagcactttt ttcagaagat 2280
aacttggcgg acccgatcta caagctgaat ggggaagctc agatcttcta caggaaagct 2340
tcgttggaca tgaacgagac taccatacat cgcgcgggag aggtgcttga gaacaaaaat 2400
cccgacaacc cgaaaaagcg gcaattcgtt tacgacatca tcaaagacaa acggtacacg 2460
caggacaaat ttatgctcca cgtccccatt accatgaatt ttggagtcca aggcatgacc 2520
attaaggaat tcaacaaaaa ggtcaaccaa agtattcagc aatacgatga agtcaatgtc 2580
ataggcatag atcggggaga aaggcatctg ttgtatctta ccgtgattaa ctctaagggt 2640
gaaatactgg agcaacggtc acttaacgat ataaccacgg cgtccgcgaa cggtacacaa 2700
gtgaccactc cctaccacaa aatattggat aaaagggaga tagaacgctt gaatgcccgc 2760
gttggctggg gtgagattga gaccatcaaa gagcttaaat cgggatattt gtctcacgtc 2820
gttcatcaaa ttaaccaact catgcttaag tacaatgcaa tcgttgtgct cgaggacctg 2880
aactttggtt tcaaaagagg gaggttcaag gtggaaaaac aaatttacca gaactttgaa 2940
aacgcgctta tcaagaaatt gaatcacctt gttttgaaag ataaggcaga tgacgaaatc 3000
gggtcgtata aaaatgcact ccagttgaca aataatttca cggatttgaa gtcgatcggc 3060
aagcaaacag ggttcctctt ttatgtgcca gcgtggaata catcaaaaat tgatccggag 3120
acgggatttg tcgacttgct gaagcctagg tatgagaaca ttgcccaatc tcaggccttt 3180
ttcggcaaat tcgataaaat atgctacaac acagacaaag gttattttga atttcacatt 3240
gattacgcca aatttacaga taaggcgaaa aacagcagac agaaatgggc tatctgttct 3300
catggggaca aacgctatgt ctacgataag acggctaatc aaaataaagg cgccgcaaaa 3360
ggtattaatg tgaatgatga gctgaaaagc ttgtttgccc gctaccatat caatgataaa 3420
caaccaaact tggtgatgga catatgccag aacaatgaca aagaattcca caagtcactc 3480
atgtgcctgc ttaaaaccct tttggcgctg cggtatagca atgcatctag cgatgaagac 3540
tttattttga gtcccgtggc caacgacgag ggcgtgtttt ttaattcagc cttggcggac 3600
gatacgcagc cccagaatgc ggacgcaaac ggcgcgtacc acattgcact gaagggactg 3660
tggcttctga acgagctgaa aaatagcgac gacctgaata aagtcaagtt ggccattgac 3720
aatcaaacct ggttgaattt cgctcaaaat aga 3753
<210> 5
<211> 4367
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimized fusion protein
<400> 5
atgtccagcg agaccggccc cgtggcggtg gaccccaccc tgcgcaggcg catcgagccg 60
cacgagttcg aggtgttctt cgaccccagg gagctccgca aggagacctg cctcctgtac 120
gagatcaact ggggcggcag gcactccatc tggaggcaca cgagccagaa caccaacaag 180
cacgtcgagg tgaacttcat cgagaagttc accacggaga ggtacttctg cccgaacacg 240
cgctgctcca tcacgtggtt cctctcgtgg agcccatgcg gcgagtgctc cagggcgatc 300
acggagttcc tcagccgcta cccgcacgtg accctgttca tctacatcgc taggctctac 360
caccacgcgg accccaggaa caggcagggc ctcagggacc tgatctccag cggcgtcacg 420
atccagatca tgaccgagca ggagtccggc tactgctgga ggaacttcgt gaactactcc 480
ccgagcaacg aggcccactg gccccgctac ccgcacctct gggtccgcct ctacgtgctc 540
gagctgtact gcatcatcct cggcctgccg ccctgcctca acatcctgag gcgcaagcag 600
ccccagctga cgttcttcac catcgccctg cagagctgcc actaccagag gctcccgccc 660
cacatcctgt gggcgaccgg gctcaagggg ggcgggggct caggcggggg cgggagcggc 720
ggcgggggct ctgggggcgg cggcagcggc gggggcggca gcgggggcgg cgggtcgatg 780
agcaagctgg agaagttcac gaactgctac tccctcagca agaccctgag gttcaaggcg 840
atcccggtcg gcaagaccca ggagaacatc gacaacaagc ggctgctggt ggaggacgag 900
aagagggctg aggactacaa gggcgtgaag aagctcctgg accgctacta cctgtccttc 960
atcaacgacg tgctccacag catcaagctc aagaacctga acaactacat cagcctcttc 1020
aggaagaaga cgcgcaccga gaaggagaac aaggagctcg agaacctgga gatcaacctg 1080
aggaaggaga tcgccaaggc gttcaagggc aacgagggct acaagtccct cttcaagaag 1140
gacatcatcg agacgatcct cccggagttc ctggacgaca aggacgagat cgccctggtc 1200
aactccttca acggcttcac cacggcgttc accggcttct tcgacaaccg cgagaacatg 1260
ttcagcgagg aggccaagtc cacgagcatc gcgttcaggt gcatcaacga gaacctcacc 1320
cgctacatct ccaacatgga catcttcgag aaggtcgacg cgatcttcga caagcacgag 1380
gtgcaggaga tcaaggagaa gatcctgaac agcgactacg acgtcgagga cttcttcgag 1440
ggcgagttct tcaacttcgt cctcacgcag gagggcatcg acgtgtacaa cgccatcatc 1500
ggtggcttcg tgaccgagtc cggcgagaag atcaagggcc tgaacgagta catcaacctc 1560
tacaaccaga agaccaagca gaagctgccg aagttcaagc ccctgtacaa gcaggtgctc 1620
tccgacaggg agtccctcag cttctacggc gagggctaca cgagcgacga ggaggtcctg 1680
gaggtgttcc gcaacaccct caacaagaac agcgagatct tctccagcat caagaagctc 1740
gagaagctgt tcaagaactt cgacgagtac tccagcgccg gcatcttcgt caagaacggc 1800
ccggcgatct ccacgatcag caaggacatc ttcggcgagt ggaacgtgat ccgcgacaag 1860
tggaacgccg agtacgacga catccacctc aagaagaagg cggtggtcac cgagaagtac 1920
gaggacgaca ggcgcaagtc cttcaagaag atcggctcct tcagcctcga gcagctgcag 1980
gagtacgccg acgcggacct gagcgtggtc gagaagctca aggagatcat catccagaag 2040
gtcgacgaga tctacaaggt gtacggctcc agcgagaagc tcttcgacgc ggacttcgtc 2100
ctcgagaagt ccctgaagaa gaacgacgcc gtggtcgcga tcatgaagga cctcctggac 2160
tccgtgaaga gcttcgagaa ttacatcaag gccttcttcg gcgagggcaa ggagacgaac 2220
agggacgagt ccttctacgg cgacttcgtc ctggcctacg acatcctcct gaaggtggac 2280
cacatctacg acgcgatccg caactacgtg acccagaagc cgtacagcaa ggacaagttc 2340
aagctctact tccagaaccc ccagttcatg ggcggctggg acaaggacaa ggagacggac 2400
tacagggcga ccatcctgcg ctacggcagc aagtactacc tcgccatcat ggacaagaag 2460
tacgcgaagt gcctgcagaa gatcgacaag gacgacgtca acggcaacta cgagaagatc 2520
aactacaagc tcctgccggg ccccaacaag atgctcccga aggtgttctt ctccaagaag 2580
tggatggcct actacaaccc cagcgaggac atccagaaga tctacaagaa cggcacgttc 2640
aagaagggcg acatgttcaa cctgaacgac tgccacaagc tcatcgactt cttcaaggac 2700
tccatcagcc gctacccgaa gtggtccaac gcctacgact tcaacttcag cgagaccgag 2760
aagtacaagg acatcgcggg cttctaccgc gaggtcgagg agcagggcta caaggtgtcc 2820
ttcgagtccg ccagcaagaa ggaggtcgac aagctggtgg aggagggcaa gctctacatg 2880
ttccagatct acaacaagga cttctccgac aagagccacg gcacgcccaa cctgcacacc 2940
atgtacttca agctcctgtt cgacgagaac aaccacggcc agatcaggct gtccggcggc 3000
gccgagctct tcatgaggag ggcgagcctg aagaaggagg agctggtggt ccaccccgct 3060
aacagcccaa tcgcgaacaa gaacccggac aaccccaaga agaccacgac cctgtcctac 3120
gacgtgtaca aggacaagag gttcagcgag gaccagtacg agctccacat cccgatcgcg 3180
atcaacaagt gccccaagaa catcttcaag atcaacaccg aggtccgcgt gctcctgaag 3240
cacgacgaca acccctacgt gatcggcatc gctaggggcg agaggaacct cctgtacatc 3300
gtggtcgtgg acggcaaggg caacatcgtg gagcagtact ccctcaacga gatcatcaac 3360
aacttcaacg gcatcaggat caagacggac taccacagcc tcctggacaa gaaggagaag 3420
gagaggttcg aggcccgcca gaactggacc tccatcgaga acatcaagga gctgaaggcg 3480
ggctacatca gccaggtcgt gcacaagatc tgcgagctcg tcgagaagta cgacgccgtg 3540
atcgccctcg cggacctgaa ctccggcttc aagaacagcc gcgtcaaggt ggagaagcag 3600
gtctaccaga agttcgagaa gatgctcatc gacaagctga actacatggt ggacaagaag 3660
tccaacccct gcgctacggg cggcgcgctg aagggctacc agatcaccaa caagttcgag 3720
agcttcaagt ccatgagcac tcagaacggc ttcatcttct acatcccggc gtggctcacg 3780
tccaagatcg accccagcac cggcttcgtc aacctcctga agacgaagta cacctccatc 3840
gccgacagca agaagttcat ctccagcttc gaccgcatca tgtatgtgcc ggaggaggac 3900
ctgttcgagt tcgccctcga ctacaagaac ttctcccgca cggacgcgga ctacatcaag 3960
aagtggaagc tgtacagcta cggcaaccgc atccgcatct tcaggaaccc caagaagaac 4020
aacgtcttcg actgggagga ggtgtgcctg acctccgcgt acaaggagct cttcaacaag 4080
tacggcatca actaccagca gggcgacatc agggctctcc tgtgcgagca gagcgacaag 4140
gccttctact ccagcttcat ggcgctgatg tccctcatgc tgcagatgag gaactcgatc 4200
accggcagga cggacgtggc cttcctcatc tccccggtga agaacagcga cggcatcttc 4260
tacgactcca ggaactacga ggcccaggag aacgcgatcc tcccaaagaa cgcggacgcc 4320
aacggcgcct acaacatcgc caggaaggtc ctctgggcta tcggcca 4367
<210> 6
<211> 1455
<212> PRT
<213> Artificial Sequence
<220>
<223> Fusion protein
<400> 6
Met Ser Ser Glu Thr Gly Pro Val Ala Val Asp Pro Thr Leu Arg Arg
1 5 10 15
Arg Ile Glu Pro His Glu Phe Glu Val Phe Phe Asp Pro Arg Glu Leu
20 25 30
Arg Lys Glu Thr Cys Leu Leu Tyr Glu Ile Asn Trp Gly Gly Arg His
35 40 45
Ser Ile Trp Arg His Thr Ser Gln Asn Thr Asn Lys His Val Glu Val
50 55 60
Asn Phe Ile Glu Lys Phe Thr Thr Glu Arg Tyr Phe Cys Pro Asn Thr
65 70 75 80
Arg Cys Ser Ile Thr Trp Phe Leu Ser Trp Ser Pro Cys Gly Glu Cys
85 90 95
Ser Arg Ala Ile Thr Glu Phe Leu Ser Arg Tyr Pro His Val Thr Leu
100 105 110
Phe Ile Tyr Ile Ala Arg Leu Tyr His His Ala Asp Pro Arg Asn Arg
115 120 125
Gln Gly Leu Arg Asp Leu Ile Ser Ser Gly Val Thr Ile Gln Ile Met
130 135 140
Thr Glu Gln Glu Ser Gly Tyr Cys Trp Arg Asn Phe Val Asn Tyr Ser
145 150 155 160
Pro Ser Asn Glu Ala His Trp Pro Arg Tyr Pro His Leu Trp Val Arg
165 170 175
Leu Tyr Val Leu Glu Leu Tyr Cys Ile Ile Leu Gly Leu Pro Pro Cys
180 185 190
Leu Asn Ile Leu Arg Arg Lys Gln Pro Gln Leu Thr Phe Phe Thr Ile
195 200 205
Ala Leu Gln Ser Cys His Tyr Gln Arg Leu Pro Pro His Ile Leu Trp
210 215 220
Ala Thr Gly Leu Lys Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
225 230 235 240
Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly
245 250 255
Gly Gly Ser Met Ser Lys Leu Glu Lys Phe Thr Asn Cys Tyr Ser Leu
260 265 270
Ser Lys Thr Leu Arg Phe Lys Ala Ile Pro Val Gly Lys Thr Gln Glu
275 280 285
Asn Ile Asp Asn Lys Arg Leu Leu Val Glu Asp Glu Lys Arg Ala Glu
290 295 300
Asp Tyr Lys Gly Val Lys Lys Leu Leu Asp Arg Tyr Tyr Leu Ser Phe
305 310 315 320
Ile Asn Asp Val Leu His Ser Ile Lys Leu Lys Asn Leu Asn Asn Tyr
325 330 335
Ile Ser Leu Phe Arg Lys Lys Thr Arg Thr Glu Lys Glu Asn Lys Glu
340 345 350
Leu Glu Asn Leu Glu Ile Asn Leu Arg Lys Glu Ile Ala Lys Ala Phe
355 360 365
Lys Gly Asn Glu Gly Tyr Lys Ser Leu Phe Lys Lys Asp Ile Ile Glu
370 375 380
Thr Ile Leu Pro Glu Phe Leu Asp Asp Lys Asp Glu Ile Ala Leu Val
385 390 395 400
Asn Ser Phe Asn Gly Phe Thr Thr Ala Phe Thr Gly Phe Phe Asp Asn
405 410 415
Arg Glu Asn Met Phe Ser Glu Glu Ala Lys Ser Thr Ser Ile Ala Phe
420 425 430
Arg Cys Ile Asn Glu Asn Leu Thr Arg Tyr Ile Ser Asn Met Asp Ile
435 440 445
Phe Glu Lys Val Asp Ala Ile Phe Asp Lys His Glu Val Gln Glu Ile
450 455 460
Lys Glu Lys Ile Leu Asn Ser Asp Tyr Asp Val Glu Asp Phe Phe Glu
465 470 475 480
Gly Glu Phe Phe Asn Phe Val Leu Thr Gln Glu Gly Ile Asp Val Tyr
485 490 495
Asn Ala Ile Ile Gly Gly Phe Val Thr Glu Ser Gly Glu Lys Ile Lys
500 505 510
Gly Leu Asn Glu Tyr Ile Asn Leu Tyr Asn Gln Lys Thr Lys Gln Lys
515 520 525
Leu Pro Lys Phe Lys Pro Leu Tyr Lys Gln Val Leu Ser Asp Arg Glu
530 535 540
Ser Leu Ser Phe Tyr Gly Glu Gly Tyr Thr Ser Asp Glu Glu Val Leu
545 550 555 560
Glu Val Phe Arg Asn Thr Leu Asn Lys Asn Ser Glu Ile Phe Ser Ser
565 570 575
Ile Lys Lys Leu Glu Lys Leu Phe Lys Asn Phe Asp Glu Tyr Ser Ser
580 585 590
Ala Gly Ile Phe Val Lys Asn Gly Pro Ala Ile Ser Thr Ile Ser Lys
595 600 605
Asp Ile Phe Gly Glu Trp Asn Val Ile Arg Asp Lys Trp Asn Ala Glu
610 615 620
Tyr Asp Asp Ile His Leu Lys Lys Lys Ala Val Val Thr Glu Lys Tyr
625 630 635 640
Glu Asp Asp Arg Arg Lys Ser Phe Lys Lys Ile Gly Ser Phe Ser Leu
645 650 655
Glu Gln Leu Gln Glu Tyr Ala Asp Ala Asp Leu Ser Val Val Glu Lys
660 665 670
Leu Lys Glu Ile Ile Ile Gln Lys Val Asp Glu Ile Tyr Lys Val Tyr
675 680 685
Gly Ser Ser Glu Lys Leu Phe Asp Ala Asp Phe Val Leu Glu Lys Ser
690 695 700
Leu Lys Lys Asn Asp Ala Val Val Ala Ile Met Lys Asp Leu Leu Asp
705 710 715 720
Ser Val Lys Ser Phe Glu Asn Tyr Ile Lys Ala Phe Phe Gly Glu Gly
725 730 735
Lys Glu Thr Asn Arg Asp Glu Ser Phe Tyr Gly Asp Phe Val Leu Ala
740 745 750
Tyr Asp Ile Leu Leu Lys Val Asp His Ile Tyr Asp Ala Ile Arg Asn
755 760 765
Tyr Val Thr Gln Lys Pro Tyr Ser Lys Asp Lys Phe Lys Leu Tyr Phe
770 775 780
Gln Asn Pro Gln Phe Met Gly Gly Trp Asp Lys Asp Lys Glu Thr Asp
785 790 795 800
Tyr Arg Ala Thr Ile Leu Arg Tyr Gly Ser Lys Tyr Tyr Leu Ala Ile
805 810 815
Met Asp Lys Lys Tyr Ala Lys Cys Leu Gln Lys Ile Asp Lys Asp Asp
820 825 830
Val Asn Gly Asn Tyr Glu Lys Ile Asn Tyr Lys Leu Leu Pro Gly Pro
835 840 845
Asn Lys Met Leu Pro Lys Val Phe Phe Ser Lys Lys Trp Met Ala Tyr
850 855 860
Tyr Asn Pro Ser Glu Asp Ile Gln Lys Ile Tyr Lys Asn Gly Thr Phe
865 870 875 880
Lys Lys Gly Asp Met Phe Asn Leu Asn Asp Cys His Lys Leu Ile Asp
885 890 895
Phe Phe Lys Asp Ser Ile Ser Arg Tyr Pro Lys Trp Ser Asn Ala Tyr
900 905 910
Asp Phe Asn Phe Ser Glu Thr Glu Lys Tyr Lys Asp Ile Ala Gly Phe
915 920 925
Tyr Arg Glu Val Glu Glu Gln Gly Tyr Lys Val Ser Phe Glu Ser Ala
930 935 940
Ser Lys Lys Glu Val Asp Lys Leu Val Glu Glu Gly Lys Leu Tyr Met
945 950 955 960
Phe Gln Ile Tyr Asn Lys Asp Phe Ser Asp Lys Ser His Gly Thr Pro
965 970 975
Asn Leu His Thr Met Tyr Phe Lys Leu Leu Phe Asp Glu Asn Asn His
980 985 990
Gly Gln Ile Arg Leu Ser Gly Gly Ala Glu Leu Phe Met Arg Arg Ala
995 1000 1005
Ser Leu Lys Lys Glu Glu Leu Val Val His Pro Ala Asn Ser Pro
1010 1015 1020
Ile Ala Asn Lys Asn Pro Asp Asn Pro Lys Lys Thr Thr Thr Leu
1025 1030 1035
Ser Tyr Asp Val Tyr Lys Asp Lys Arg Phe Ser Glu Asp Gln Tyr
1040 1045 1050
Glu Leu His Ile Pro Ile Ala Ile Asn Lys Cys Pro Lys Asn Ile
1055 1060 1065
Phe Lys Ile Asn Thr Glu Val Arg Val Leu Leu Lys His Asp Asp
1070 1075 1080
Asn Pro Tyr Val Ile Gly Ile Ala Arg Gly Glu Arg Asn Leu Leu
1085 1090 1095
Tyr Ile Val Val Val Asp Gly Lys Gly Asn Ile Val Glu Gln Tyr
1100 1105 1110
Ser Leu Asn Glu Ile Ile Asn Asn Phe Asn Gly Ile Arg Ile Lys
1115 1120 1125
Thr Asp Tyr His Ser Leu Leu Asp Lys Lys Glu Lys Glu Arg Phe
1130 1135 1140
Glu Ala Arg Gln Asn Trp Thr Ser Ile Glu Asn Ile Lys Glu Leu
1145 1150 1155
Lys Ala Gly Tyr Ile Ser Gln Val Val His Lys Ile Cys Glu Leu
1160 1165 1170
Val Glu Lys Tyr Asp Ala Val Ile Ala Leu Ala Asp Leu Asn Ser
1175 1180 1185
Gly Phe Lys Asn Ser Arg Val Lys Val Glu Lys Gln Val Tyr Gln
1190 1195 1200
Lys Phe Glu Lys Met Leu Ile Asp Lys Leu Asn Tyr Met Val Asp
1205 1210 1215
Lys Lys Ser Asn Pro Cys Ala Thr Gly Gly Ala Leu Lys Gly Tyr
1220 1225 1230
Gln Ile Thr Asn Lys Phe Glu Ser Phe Lys Ser Met Ser Thr Gln
1235 1240 1245
Asn Gly Phe Ile Phe Tyr Ile Pro Ala Trp Leu Thr Ser Lys Ile
1250 1255 1260
Asp Pro Ser Thr Gly Phe Val Asn Leu Leu Lys Thr Lys Tyr Thr
1265 1270 1275
Ser Ile Ala Asp Ser Lys Lys Phe Ile Ser Ser Phe Asp Arg Ile
1280 1285 1290
Met Tyr Val Pro Glu Glu Asp Leu Phe Glu Phe Ala Leu Asp Tyr
1295 1300 1305
Lys Asn Phe Ser Arg Thr Asp Ala Asp Tyr Ile Lys Lys Trp Lys
1310 1315 1320
Leu Tyr Ser Tyr Gly Asn Arg Ile Arg Ile Phe Arg Asn Pro Lys
1325 1330 1335
Lys Asn Asn Val Phe Asp Trp Glu Glu Val Cys Leu Thr Ser Ala
1340 1345 1350
Tyr Lys Glu Leu Phe Asn Lys Tyr Gly Ile Asn Tyr Gln Gln Gly
1355 1360 1365
Asp Ile Arg Ala Leu Leu Cys Glu Gln Ser Asp Lys Ala Phe Tyr
1370 1375 1380
Ser Ser Phe Met Ala Leu Met Ser Leu Met Leu Gln Met Arg Asn
1385 1390 1395
Ser Ile Thr Gly Arg Thr Asp Val Ala Phe Leu Ile Ser Pro Val
1400 1405 1410
Lys Asn Ser Asp Gly Ile Phe Tyr Asp Ser Arg Asn Tyr Glu Ala
1415 1420 1425
Gln Glu Asn Ala Ile Leu Pro Lys Asn Ala Asp Ala Asn Gly Ala
1430 1435 1440
Tyr Asn Ile Ala Arg Lys Val Leu Trp Ala Ile Gly
1445 1450 1455
<210> 7
<211> 249
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon Optimized
<400> 7
acgaacctgt ccgacatcat cgagaaggag accggcaagc agctcgtgat ccaggagagc 60
atcctcatgc tgccggagga ggtcgaggag gtcatcggca acaagcccga gtccgacatc 120
ctcgtccaca cggcctacga cgagtccacc gacgagaacg tgatgctcct gacctcggac 180
gctcccgagt acaagccatg ggccctggtc atccaggaca gcaacggcga gaacaagatc 240
aagatgctc 249
<210> 8
<211> 83
<212> PRT
<213> Bacillus subtilis phage PBSX
<400> 8
Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly Lys Gln Leu Val
1 5 10 15
Ile Gln Glu Ser Ile Leu Met Leu Pro Glu Glu Val Glu Glu Val Ile
20 25 30
Gly Asn Lys Pro Glu Ser Asp Ile Leu Val His Thr Ala Tyr Asp Glu
35 40 45
Ser Thr Asp Glu Asn Val Met Leu Leu Thr Ser Asp Ala Pro Glu Tyr
50 55 60
Lys Pro Trp Ala Leu Val Ile Gln Asp Ser Asn Gly Glu Asn Lys Ile
65 70 75 80
Lys Met Leu
<210> 9
<211> 6882
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimized fusion
<400> 9
gaattcatta tgtggtctag gtaggttcta tatataagaa aacttgaaat gttctaaaaa 60
aaaattcaag cccatgcatg attgaagcaa acggtatagc aacggtgtta acctgatcta 120
gtgatctctt gcaatcctta acggccacct accgcaggta gcaaacggcg tccccctcct 180
cgatatctcc gcggcgacct ctggcttttt ccgcggaatt gcgcggtggg gacggattcc 240
acgagaccgc gacgcaaccg cctctcgccg ctgggcccca caccgctcgg tgccgtagcc 300
tcacgggact ctttctccct cctcccccgt tataaattgg cttcatcccc tccttgcctc 360
atccatccaa atcccagtcc ccaatcccat cccttcgtag gagaaattca tcgaagctaa 420
gcgaatcctc gcgatcctct caaggtactg cgagttttcg atccccctct cgacccctcg 480
tatgtttgtg tttgtcgtag cgtttgatta ggtatgcttt ccctgtttgt gttcgtcgta 540
gcgtttgatt aggtatgctt tccctgttcg tgttcatcgt agtgtttgat taggtcgtgt 600
gaggcgatgg cctgctcgcg tccttcgatc tgtagtcgat ttgcgggtcg tggtgtagat 660
ctgcgggctg tgatgaagtt atttggtgtg atctgctcgc ctgattctgc gggttggctc 720
gagtagatat gatggttgga ccggttggtt cgtttaccgc gctagggttg ggctgggatg 780
atgttgcatg cgccgttgcg cgtgatcccg cagcaggact tgcgtttgat tgccagatct 840
cgttacgatt atgtgatttg gtttggactt tttagatctg tagcttctgc ttatgtgcca 900
gatgcgccta ctgctcatat gcctgatgat aatcataaat ggctgtggaa ctaactagtt 960
gattgcggag tcatgtatca gctacaggtg tagggactag ctacaggtgt agggacttgc 1020
gtctaattgt ttggtccttt actcatgttg caattatgca atttagttta gattgtttgt 1080
tccactcatc taggctgtaa aagggacact gcttagattg ctgtttaatc tttttagtag 1140
attatattat attggtaact tattacccct attacatgcc atacgtgact tctgctcatg 1200
cctgatgata atcatagatc actgtggaat taattagttg attgttgaat catgtttcat 1260
gtacatacca cggcacaatt gcttagttcc ttaacaaatg caaattttac tgatccatgt 1320
atgatttgcg tggttctcta atgtgaaata ctatagctac ttgttagtaa gaatcaggtt 1380
cgtatgctta atgctgtatg tgccttctgc tcatgcctga tgataatcat atatcactgg 1440
aattaattag ttgatcgttt aatcatatat caagtacata ccatgccaca atttttagtc 1500
acttaaccca tgcagattga actggtccct gcatgttttg ctaaattgtt ctattctgat 1560
tagaccatat atcatgtatt tttttttggt aatggttctc ttattttaaa tgctatatag 1620
ttctggtact tgttagaaag atctgcttca tagtttagtt gcctatccct cgaattagga 1680
tgctgagcag ctgatcctat agctttgttt catgtatcaa ttcttttgtg ttcaacagtc 1740
agtttttgtt agattcattg taacttatgg tcgcttactc ttctggtcct caatgcttgc 1800
agggatcccc taaatagacc atgccgaaga agaagcgcaa ggtcatgtcc agcgagaccg 1860
gccccgtggc ggtggacccc accctgcgca ggcgcatcga gccgcacgag ttcgaggtgt 1920
tcttcgaccc cagggagctc cgcaaggaga cctgcctcct gtacgagatc aactggggcg 1980
gcaggcactc catctggagg cacacgagcc agaacaccaa caagcacgtc gaggtgaact 2040
tcatcgagaa gttcaccacg gagaggtact tctgcccgaa cacgcgctgc tccatcacgt 2100
ggttcctctc gtggagccca tgcggcgagt gctccagggc gatcacggag ttcctcagcc 2160
gctacccgca cgtgaccctg ttcatctaca tcgctaggct ctaccaccac gcggacccca 2220
ggaacaggca gggcctcagg gacctgatct ccagcggcgt cacgatccag atcatgaccg 2280
agcaggagtc cggctactgc tggaggaact tcgtgaacta ctccccgagc aacgaggccc 2340
actggccccg ctacccgcac ctctgggtcc gcctctacgt gctcgagctg tactgcatca 2400
tcctcggcct gccgccctgc ctcaacatcc tgaggcgcaa gcagccccag ctgacgttct 2460
tcaccatcgc cctgcagagc tgccactacc agaggctccc gccccacatc ctgtgggcga 2520
ccgggctcaa ggggggcggg ggctcaggcg ggggcgggag cggcggcggg ggctctgggg 2580
gcggcggcag cggcgggggc ggcagcgggg gcggcgggtc gatgagcaag ctggagaagt 2640
tcacgaactg ctactccctc agcaagaccc tgaggttcaa ggcgatcccg gtcggcaaga 2700
cccaggagaa catcgacaac aagcggctgc tggtggagga cgagaagagg gctgaggact 2760
acaagggcgt gaagaagctc ctggaccgct actacctgtc cttcatcaac gacgtgctcc 2820
acagcatcaa gctcaagaac ctgaacaact acatcagcct cttcaggaag aagacgcgca 2880
ccgagaagga gaacaaggag ctcgagaacc tggagatcaa cctgaggaag gagatcgcca 2940
aggcgttcaa gggcaacgag ggctacaagt ccctcttcaa gaaggacatc atcgagacga 3000
tcctcccgga gttcctggac gacaaggacg agatcgccct ggtcaactcc ttcaacggct 3060
tcaccacggc gttcaccggc ttcttcgaca accgcgagaa catgttcagc gaggaggcca 3120
agtccacgag catcgcgttc aggtgcatca acgagaacct cacccgctac atctccaaca 3180
tggacatctt cgagaaggtc gacgcgatct tcgacaagca cgaggtgcag gagatcaagg 3240
agaagatcct gaacagcgac tacgacgtcg aggacttctt cgagggcgag ttcttcaact 3300
tcgtcctcac gcaggagggc atcgacgtgt acaacgccat catcggtggc ttcgtgaccg 3360
agtccggcga gaagatcaag ggcctgaacg agtacatcaa cctctacaac cagaagacca 3420
agcagaagct gccgaagttc aagcccctgt acaagcaggt gctctccgac agggagtccc 3480
tcagcttcta cggcgagggc tacacgagcg acgaggaggt cctggaggtg ttccgcaaca 3540
ccctcaacaa gaacagcgag atcttctcca gcatcaagaa gctcgagaag ctgttcaaga 3600
acttcgacga gtactccagc gccggcatct tcgtcaagaa cggcccggcg atctccacga 3660
tcagcaagga catcttcggc gagtggaacg tgatccgcga caagtggaac gccgagtacg 3720
acgacatcca cctcaagaag aaggcggtgg tcaccgagaa gtacgaggac gacaggcgca 3780
agtccttcaa gaagatcggc tccttcagcc tcgagcagct gcaggagtac gccgacgcgg 3840
acctgagcgt ggtcgagaag ctcaaggaga tcatcatcca gaaggtcgac gagatctaca 3900
aggtgtacgg ctccagcgag aagctcttcg acgcggactt cgtcctcgag aagtccctga 3960
agaagaacga cgccgtggtc gcgatcatga aggacctcct ggactccgtg aagagcttcg 4020
agaattacat caaggccttc ttcggcgagg gcaaggagac gaacagggac gagtccttct 4080
acggcgactt cgtcctggcc tacgacatcc tcctgaaggt ggaccacatc tacgacgcga 4140
tccgcaacta cgtgacccag aagccgtaca gcaaggacaa gttcaagctc tacttccaga 4200
acccccagtt catgggcggc tgggacaagg acaaggagac ggactacagg gcgaccatcc 4260
tgcgctacgg cagcaagtac tacctcgcca tcatggacaa gaagtacgcg aagtgcctgc 4320
agaagatcga caaggacgac gtcaacggca actacgagaa gatcaactac aagctcctgc 4380
cgggccccaa caagatgctc ccgaaggtgt tcttctccaa gaagtggatg gcctactaca 4440
accccagcga ggacatccag aagatctaca agaacggcac gttcaagaag ggcgacatgt 4500
tcaacctgaa cgactgccac aagctcatcg acttcttcaa ggactccatc agccgctacc 4560
cgaagtggtc caacgcctac gacttcaact tcagcgagac cgagaagtac aaggacatcg 4620
cgggcttcta ccgcgaggtc gaggagcagg gctacaaggt gtccttcgag tccgccagca 4680
agaaggaggt cgacaagctg gtggaggagg gcaagctcta catgttccag atctacaaca 4740
aggacttctc cgacaagagc cacggcacgc ccaacctgca caccatgtac ttcaagctcc 4800
tgttcgacga gaacaaccac ggccagatca ggctgtccgg cggcgccgag ctcttcatga 4860
ggagggcgag cctgaagaag gaggagctgg tggtccaccc cgctaacagc ccaatcgcga 4920
acaagaaccc ggacaacccc aagaagacca cgaccctgtc ctacgacgtg tacaaggaca 4980
agaggttcag cgaggaccag tacgagctcc acatcccgat cgcgatcaac aagtgcccca 5040
agaacatctt caagatcaac accgaggtcc gcgtgctcct gaagcacgac gacaacccct 5100
acgtgatcgg catcgctagg ggcgagagga acctcctgta catcgtggtc gtggacggca 5160
agggcaacat cgtggagcag tactccctca acgagatcat caacaacttc aacggcatca 5220
ggatcaagac ggactaccac agcctcctgg acaagaagga gaaggagagg ttcgaggccc 5280
gccagaactg gacctccatc gagaacatca aggagctgaa ggcgggctac atcagccagg 5340
tcgtgcacaa gatctgcgag ctcgtcgaga agtacgacgc cgtgatcgcc ctcgcggacc 5400
tgaactccgg cttcaagaac agccgcgtca aggtggagaa gcaggtctac cagaagttcg 5460
agaagatgct catcgacaag ctgaactaca tggtggacaa gaagtccaac ccctgcgcta 5520
cgggcggcgc gctgaagggc taccagatca ccaacaagtt cgagagcttc aagtccatga 5580
gcactcagaa cggcttcatc ttctacatcc cggcgtggct cacgtccaag atcgacccca 5640
gcaccggctt cgtcaacctc ctgaagacga agtacacctc catcgccgac agcaagaagt 5700
tcatctccag cttcgaccgc atcatgtatg tgccggagga ggacctgttc gagttcgccc 5760
tcgactacaa gaacttctcc cgcacggacg cggactacat caagaagtgg aagctgtaca 5820
gctacggcaa ccgcatccgc atcttcagga accccaagaa gaacaacgtc ttcgactggg 5880
aggaggtgtg cctgacctcc gcgtacaagg agctcttcaa caagtacggc atcaactacc 5940
agcagggcga catcagggct ctcctgtgcg agcagagcga caaggccttc tactccagct 6000
tcatggcgct gatgtccctc atgctgcaga tgaggaactc gatcaccggc aggacggacg 6060
tggccttcct catctccccg gtgaagaaca gcgacggcat cttctacgac tccaggaact 6120
acgaggccca ggagaacgcg atcctcccaa agaacgcgga cgccaacggc gcctacaaca 6180
tcgccaggaa ggtcctctgg gctatcggcc agttcaagaa ggcggaggac gagaagctgg 6240
acaaggtgaa gatcgccatc agcaacaagg agtggctcga gtacgcccag acctcggtca 6300
agcacggcag cccgaagaag aagcgcaagg tgtccggcgg cagcacgaac ctgtccgaca 6360
tcatcgagaa ggagaccggc aagcagctcg tgatccagga gagcatcctc atgctgccgg 6420
aggaggtcga ggaggtcatc ggcaacaagc ccgagtccga catcctcgtc cacacggcct 6480
acgacgagtc caccgacgag aacgtgatgc tcctgacctc ggacgctccc gagtacaagc 6540
catgggccct ggtcatccag gacagcaacg gcgagaacaa gatcaagatg ctctccggcg 6600
gcagcccgaa gaagaagcgc aaagtgtgag atcgttcaaa catttggcaa taaagtttct 6660
taagattgaa tcctgttgcc ggtcttgcga tgattatcat ataatttctg ttgaattacg 6720
ttaagcatgt aataattaac atgtaatgca tgacgttatt tatgagatgg gtttttatga 6780
ttagagtccc gcaattatac atttaatacg cgatagaaaa caaaatatag cgcgcaaact 6840
aggataaatt atcgcgcgcg gtgtcatcta tgttactaga tc 6882
<210> 10
<211> 90
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 10
gggggcgggg gctcaggcgg gggcgggagc ggcggcgggg gctctggggg cggcggcagc 60
ggcgggggcg gcagcggggg cggcgggtcg 90
<210> 11
<211> 30
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 11
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
1 5 10 15
Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
20 25 30
<210> 12
<211> 18
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 12
Gly Gly Ser Thr Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser
1 5 10 15
Ser Gly
<210> 13
<211> 15
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 13
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
1 5 10 15
<210> 14
<211> 4842
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimized fusion
<400> 14
atgccgaaga agaagcgcaa ggtcatgtcc agcgagaccg gccccgtggc ggtggacccc 60
accctgcgca ggcgcatcga gccgcacgag ttcgaggtgt tcttcgaccc cagggagctc 120
cgcaaggaga cctgcctcct gtacgagatc aactggggcg gcaggcactc catctggagg 180
cacacgagcc agaacaccaa caagcacgtc gaggtgaact tcatcgagaa gttcaccacg 240
gagaggtact tctgcccgaa cacgcgctgc tccatcacgt ggttcctctc gtggagccca 300
tgcggcgagt gctccagggc gatcacggag ttcctcagcc gctacccgca cgtgaccctg 360
ttcatctaca tcgctaggct ctaccaccac gcggacccca ggaacaggca gggcctcagg 420
gacctgatct ccagcggcgt cacgatccag atcatgaccg agcaggagtc cggctactgc 480
tggaggaact tcgtgaacta ctccccgagc aacgaggccc actggccccg ctacccgcac 540
ctctgggtcc gcctctacgt gctcgagctg tactgcatca tcctcggcct gccgccctgc 600
ctcaacatcc tgaggcgcaa gcagccccag ctgacgttct tcaccatcgc cctgcagagc 660
tgccactacc agaggctccc gccccacatc ctgtgggcga ccgggctcaa gtcgggcagc 720
gagacccccg gcacctccga gtcggctacc ccagagtcca tgagcaagct ggagaagttc 780
acgaactgct actccctcag caagaccctg aggttcaagg cgatcccggt cggcaagacc 840
caggagaaca tcgacaacaa gcggctgctg gtggaggacg agaagagggc tgaggactac 900
aagggcgtga agaagctcct ggaccgctac tacctgtcct tcatcaacga cgtgctccac 960
agcatcaagc tcaagaacct gaacaactac atcagcctct tcaggaagaa gacgcgcacc 1020
gagaaggaga acaaggagct cgagaacctg gagatcaacc tgaggaagga gatcgccaag 1080
gcgttcaagg gcaacgaggg ctacaagtcc ctcttcaaga aggacatcat cgagacgatc 1140
ctcccggagt tcctggacga caaggacgag atcgccctgg tcaactcctt caacggcttc 1200
accacggcgt tcaccggctt cttcgacaac cgcgagaaca tgttcagcga ggaggccaag 1260
tccacgagca tcgcgttcag gtgcatcaac gagaacctca cccgctacat ctccaacatg 1320
gacatcttcg agaaggtcga cgcgatcttc gacaagcacg aggtgcagga gatcaaggag 1380
aagatcctga acagcgacta cgacgtcgag gacttcttcg agggcgagtt cttcaacttc 1440
gtcctcacgc aggagggcat cgacgtgtac aacgccatca tcggtggctt cgtgaccgag 1500
tccggcgaga agatcaaggg cctgaacgag tacatcaacc tctacaacca gaagaccaag 1560
cagaagctgc cgaagttcaa gcccctgtac aagcaggtgc tctccgacag ggagtccctc 1620
agcttctacg gcgagggcta cacgagcgac gaggaggtcc tggaggtgtt ccgcaacacc 1680
ctcaacaaga acagcgagat cttctccagc atcaagaagc tcgagaagct gttcaagaac 1740
ttcgacgagt actccagcgc cggcatcttc gtcaagaacg gcccggcgat ctccacgatc 1800
agcaaggaca tcttcggcga gtggaacgtg atccgcgaca agtggaacgc cgagtacgac 1860
gacatccacc tcaagaagaa ggcggtggtc accgagaagt acgaggacga caggcgcaag 1920
tccttcaaga agatcggctc cttcagcctc gagcagctgc aggagtacgc cgacgcggac 1980
ctgagcgtgg tcgagaagct caaggagatc atcatccaga aggtcgacga gatctacaag 2040
gtgtacggct ccagcgagaa gctcttcgac gcggacttcg tcctcgagaa gtccctgaag 2100
aagaacgacg ccgtggtcgc gatcatgaag gacctcctgg actccgtgaa gagcttcgag 2160
aattacatca aggccttctt cggcgagggc aaggagacga acagggacga gtccttctac 2220
ggcgacttcg tcctggccta cgacatcctc ctgaaggtgg accacatcta cgacgcgatc 2280
cgcaactacg tgacccagaa gccgtacagc aaggacaagt tcaagctcta cttccagaac 2340
ccccagttca tgggcggctg ggacaaggac aaggagacgg actacagggc gaccatcctg 2400
cgctacggca gcaagtacta cctcgccatc atggacaaga agtacgcgaa gtgcctgcag 2460
aagatcgaca aggacgacgt caacggcaac tacgagaaga tcaactacaa gctcctgccg 2520
ggccccaaca agatgctccc gaaggtgttc ttctccaaga agtggatggc ctactacaac 2580
cccagcgagg acatccagaa gatctacaag aacggcacgt tcaagaaggg cgacatgttc 2640
aacctgaacg actgccacaa gctcatcgac ttcttcaagg actccatcag ccgctacccg 2700
aagtggtcca acgcctacga cttcaacttc agcgagaccg agaagtacaa ggacatcgcg 2760
ggcttctacc gcgaggtcga ggagcagggc tacaaggtgt ccttcgagtc cgccagcaag 2820
aaggaggtcg acaagctggt ggaggagggc aagctctaca tgttccagat ctacaacaag 2880
gacttctccg acaagagcca cggcacgccc aacctgcaca ccatgtactt caagctcctg 2940
ttcgacgaga acaaccacgg ccagatcagg ctgtccggcg gcgccgagct cttcatgagg 3000
agggcgagcc tgaagaagga ggagctggtg gtccaccccg ctaacagccc aatcgcgaac 3060
aagaacccgg acaaccccaa gaagaccacg accctgtcct acgacgtgta caaggacaag 3120
aggttcagcg aggaccagta cgagctccac atcccgatcg cgatcaacaa gtgccccaag 3180
aacatcttca agatcaacac cgaggtccgc gtgctcctga agcacgacga caacccctac 3240
gtgatcggca tcgctagggg cgagaggaac ctcctgtaca tcgtggtcgt ggacggcaag 3300
ggcaacatcg tggagcagta ctccctcaac gagatcatca acaacttcaa cggcatcagg 3360
atcaagacgg actaccacag cctcctggac aagaaggaga aggagaggtt cgaggcccgc 3420
cagaactgga cctccatcga gaacatcaag gagctgaagg cgggctacat cagccaggtc 3480
gtgcacaaga tctgcgagct cgtcgagaag tacgacgccg tgatcgccct cgcggacctg 3540
aactccggct tcaagaacag ccgcgtcaag gtggagaagc aggtctacca gaagttcgag 3600
aagatgctca tcgacaagct gaactacatg gtggacaaga agtccaaccc ctgcgctacg 3660
ggcggcgcgc tgaagggcta ccagatcacc aacaagttcg agagcttcaa gtccatgagc 3720
actcagaacg gcttcatctt ctacatcccg gcgtggctca cgtccaagat cgaccccagc 3780
accggcttcg tcaacctcct gaagacgaag tacacctcca tcgccgacag caagaagttc 3840
atctccagct tcgaccgcat catgtatgtg ccggaggagg acctgttcga gttcgccctc 3900
gactacaaga acttctcccg cacggacgcg gactacatca agaagtggaa gctgtacagc 3960
tacggcaacc gcatccgcat cttcaggaac cccaagaaga acaacgtctt cgactgggag 4020
gaggtgtgcc tgacctccgc gtacaaggag ctcttcaaca agtacggcat caactaccag 4080
cagggcgaca tcagggctct cctgtgcgag cagagcgaca aggccttcta ctccagcttc 4140
atggcgctga tgtccctcat gctgcagatg aggaactcga tcaccggcag gacggacgtg 4200
gccttcctca tctccccggt gaagaacagc gacggcatct tctacgactc caggaactac 4260
gaggcccagg agaacgcgat cctcccaaag aacgcggacg ccaacggcgc ctacaacatc 4320
gccaggaagg tcctctgggc tatcggccag ttcaagaagg cggaggacga gaagctggac 4380
aaggtgaaga tcgccatcag caacaaggag tggctcgagt acgcccagac ctcggtcaag 4440
cacggcagcc cgaagaagaa gcgcaaggtg ggagggtcga caggaggcgg ttctggcgga 4500
ggttcaggtg gaggctcgag tggtacgaac ctgtccgaca tcatcgagaa ggagaccggc 4560
aagcagctcg tgatccagga gagcatcctc atgctgccgg aggaggtcga ggaggtcatc 4620
ggcaacaagc ccgagtccga catcctcgtc cacacggcct acgacgagtc caccgacgag 4680
aacgtgatgc tcctgacctc ggacgctccc gagtacaagc catgggccct ggtcatccag 4740
gacagcaacg gcgagaacaa gatcaagatg ctcggtggag gcggttcagg cggaggtggc 4800
tctggcggtg gcggatcgcc gaagaagaag cgcaaagtgt ga 4842
<210> 15
<211> 1613
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 15
Met Pro Lys Lys Lys Arg Lys Val Met Ser Ser Glu Thr Gly Pro Val
1 5 10 15
Ala Val Asp Pro Thr Leu Arg Arg Arg Ile Glu Pro His Glu Phe Glu
20 25 30
Val Phe Phe Asp Pro Arg Glu Leu Arg Lys Glu Thr Cys Leu Leu Tyr
35 40 45
Glu Ile Asn Trp Gly Gly Arg His Ser Ile Trp Arg His Thr Ser Gln
50 55 60
Asn Thr Asn Lys His Val Glu Val Asn Phe Ile Glu Lys Phe Thr Thr
65 70 75 80
Glu Arg Tyr Phe Cys Pro Asn Thr Arg Cys Ser Ile Thr Trp Phe Leu
85 90 95
Ser Trp Ser Pro Cys Gly Glu Cys Ser Arg Ala Ile Thr Glu Phe Leu
100 105 110
Ser Arg Tyr Pro His Val Thr Leu Phe Ile Tyr Ile Ala Arg Leu Tyr
115 120 125
His His Ala Asp Pro Arg Asn Arg Gln Gly Leu Arg Asp Leu Ile Ser
130 135 140
Ser Gly Val Thr Ile Gln Ile Met Thr Glu Gln Glu Ser Gly Tyr Cys
145 150 155 160
Trp Arg Asn Phe Val Asn Tyr Ser Pro Ser Asn Glu Ala His Trp Pro
165 170 175
Arg Tyr Pro His Leu Trp Val Arg Leu Tyr Val Leu Glu Leu Tyr Cys
180 185 190
Ile Ile Leu Gly Leu Pro Pro Cys Leu Asn Ile Leu Arg Arg Lys Gln
195 200 205
Pro Gln Leu Thr Phe Phe Thr Ile Ala Leu Gln Ser Cys His Tyr Gln
210 215 220
Arg Leu Pro Pro His Ile Leu Trp Ala Thr Gly Leu Lys Ser Gly Ser
225 230 235 240
Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Met Ser Lys
245 250 255
Leu Glu Lys Phe Thr Asn Cys Tyr Ser Leu Ser Lys Thr Leu Arg Phe
260 265 270
Lys Ala Ile Pro Val Gly Lys Thr Gln Glu Asn Ile Asp Asn Lys Arg
275 280 285
Leu Leu Val Glu Asp Glu Lys Arg Ala Glu Asp Tyr Lys Gly Val Lys
290 295 300
Lys Leu Leu Asp Arg Tyr Tyr Leu Ser Phe Ile Asn Asp Val Leu His
305 310 315 320
Ser Ile Lys Leu Lys Asn Leu Asn Asn Tyr Ile Ser Leu Phe Arg Lys
325 330 335
Lys Thr Arg Thr Glu Lys Glu Asn Lys Glu Leu Glu Asn Leu Glu Ile
340 345 350
Asn Leu Arg Lys Glu Ile Ala Lys Ala Phe Lys Gly Asn Glu Gly Tyr
355 360 365
Lys Ser Leu Phe Lys Lys Asp Ile Ile Glu Thr Ile Leu Pro Glu Phe
370 375 380
Leu Asp Asp Lys Asp Glu Ile Ala Leu Val Asn Ser Phe Asn Gly Phe
385 390 395 400
Thr Thr Ala Phe Thr Gly Phe Phe Asp Asn Arg Glu Asn Met Phe Ser
405 410 415
Glu Glu Ala Lys Ser Thr Ser Ile Ala Phe Arg Cys Ile Asn Glu Asn
420 425 430
Leu Thr Arg Tyr Ile Ser Asn Met Asp Ile Phe Glu Lys Val Asp Ala
435 440 445
Ile Phe Asp Lys His Glu Val Gln Glu Ile Lys Glu Lys Ile Leu Asn
450 455 460
Ser Asp Tyr Asp Val Glu Asp Phe Phe Glu Gly Glu Phe Phe Asn Phe
465 470 475 480
Val Leu Thr Gln Glu Gly Ile Asp Val Tyr Asn Ala Ile Ile Gly Gly
485 490 495
Phe Val Thr Glu Ser Gly Glu Lys Ile Lys Gly Leu Asn Glu Tyr Ile
500 505 510
Asn Leu Tyr Asn Gln Lys Thr Lys Gln Lys Leu Pro Lys Phe Lys Pro
515 520 525
Leu Tyr Lys Gln Val Leu Ser Asp Arg Glu Ser Leu Ser Phe Tyr Gly
530 535 540
Glu Gly Tyr Thr Ser Asp Glu Glu Val Leu Glu Val Phe Arg Asn Thr
545 550 555 560
Leu Asn Lys Asn Ser Glu Ile Phe Ser Ser Ile Lys Lys Leu Glu Lys
565 570 575
Leu Phe Lys Asn Phe Asp Glu Tyr Ser Ser Ala Gly Ile Phe Val Lys
580 585 590
Asn Gly Pro Ala Ile Ser Thr Ile Ser Lys Asp Ile Phe Gly Glu Trp
595 600 605
Asn Val Ile Arg Asp Lys Trp Asn Ala Glu Tyr Asp Asp Ile His Leu
610 615 620
Lys Lys Lys Ala Val Val Thr Glu Lys Tyr Glu Asp Asp Arg Arg Lys
625 630 635 640
Ser Phe Lys Lys Ile Gly Ser Phe Ser Leu Glu Gln Leu Gln Glu Tyr
645 650 655
Ala Asp Ala Asp Leu Ser Val Val Glu Lys Leu Lys Glu Ile Ile Ile
660 665 670
Gln Lys Val Asp Glu Ile Tyr Lys Val Tyr Gly Ser Ser Glu Lys Leu
675 680 685
Phe Asp Ala Asp Phe Val Leu Glu Lys Ser Leu Lys Lys Asn Asp Ala
690 695 700
Val Val Ala Ile Met Lys Asp Leu Leu Asp Ser Val Lys Ser Phe Glu
705 710 715 720
Asn Tyr Ile Lys Ala Phe Phe Gly Glu Gly Lys Glu Thr Asn Arg Asp
725 730 735
Glu Ser Phe Tyr Gly Asp Phe Val Leu Ala Tyr Asp Ile Leu Leu Lys
740 745 750
Val Asp His Ile Tyr Asp Ala Ile Arg Asn Tyr Val Thr Gln Lys Pro
755 760 765
Tyr Ser Lys Asp Lys Phe Lys Leu Tyr Phe Gln Asn Pro Gln Phe Met
770 775 780
Gly Gly Trp Asp Lys Asp Lys Glu Thr Asp Tyr Arg Ala Thr Ile Leu
785 790 795 800
Arg Tyr Gly Ser Lys Tyr Tyr Leu Ala Ile Met Asp Lys Lys Tyr Ala
805 810 815
Lys Cys Leu Gln Lys Ile Asp Lys Asp Asp Val Asn Gly Asn Tyr Glu
820 825 830
Lys Ile Asn Tyr Lys Leu Leu Pro Gly Pro Asn Lys Met Leu Pro Lys
835 840 845
Val Phe Phe Ser Lys Lys Trp Met Ala Tyr Tyr Asn Pro Ser Glu Asp
850 855 860
Ile Gln Lys Ile Tyr Lys Asn Gly Thr Phe Lys Lys Gly Asp Met Phe
865 870 875 880
Asn Leu Asn Asp Cys His Lys Leu Ile Asp Phe Phe Lys Asp Ser Ile
885 890 895
Ser Arg Tyr Pro Lys Trp Ser Asn Ala Tyr Asp Phe Asn Phe Ser Glu
900 905 910
Thr Glu Lys Tyr Lys Asp Ile Ala Gly Phe Tyr Arg Glu Val Glu Glu
915 920 925
Gln Gly Tyr Lys Val Ser Phe Glu Ser Ala Ser Lys Lys Glu Val Asp
930 935 940
Lys Leu Val Glu Glu Gly Lys Leu Tyr Met Phe Gln Ile Tyr Asn Lys
945 950 955 960
Asp Phe Ser Asp Lys Ser His Gly Thr Pro Asn Leu His Thr Met Tyr
965 970 975
Phe Lys Leu Leu Phe Asp Glu Asn Asn His Gly Gln Ile Arg Leu Ser
980 985 990
Gly Gly Ala Glu Leu Phe Met Arg Arg Ala Ser Leu Lys Lys Glu Glu
995 1000 1005
Leu Val Val His Pro Ala Asn Ser Pro Ile Ala Asn Lys Asn Pro
1010 1015 1020
Asp Asn Pro Lys Lys Thr Thr Thr Leu Ser Tyr Asp Val Tyr Lys
1025 1030 1035
Asp Lys Arg Phe Ser Glu Asp Gln Tyr Glu Leu His Ile Pro Ile
1040 1045 1050
Ala Ile Asn Lys Cys Pro Lys Asn Ile Phe Lys Ile Asn Thr Glu
1055 1060 1065
Val Arg Val Leu Leu Lys His Asp Asp Asn Pro Tyr Val Ile Gly
1070 1075 1080
Ile Ala Arg Gly Glu Arg Asn Leu Leu Tyr Ile Val Val Val Asp
1085 1090 1095
Gly Lys Gly Asn Ile Val Glu Gln Tyr Ser Leu Asn Glu Ile Ile
1100 1105 1110
Asn Asn Phe Asn Gly Ile Arg Ile Lys Thr Asp Tyr His Ser Leu
1115 1120 1125
Leu Asp Lys Lys Glu Lys Glu Arg Phe Glu Ala Arg Gln Asn Trp
1130 1135 1140
Thr Ser Ile Glu Asn Ile Lys Glu Leu Lys Ala Gly Tyr Ile Ser
1145 1150 1155
Gln Val Val His Lys Ile Cys Glu Leu Val Glu Lys Tyr Asp Ala
1160 1165 1170
Val Ile Ala Leu Ala Asp Leu Asn Ser Gly Phe Lys Asn Ser Arg
1175 1180 1185
Val Lys Val Glu Lys Gln Val Tyr Gln Lys Phe Glu Lys Met Leu
1190 1195 1200
Ile Asp Lys Leu Asn Tyr Met Val Asp Lys Lys Ser Asn Pro Cys
1205 1210 1215
Ala Thr Gly Gly Ala Leu Lys Gly Tyr Gln Ile Thr Asn Lys Phe
1220 1225 1230
Glu Ser Phe Lys Ser Met Ser Thr Gln Asn Gly Phe Ile Phe Tyr
1235 1240 1245
Ile Pro Ala Trp Leu Thr Ser Lys Ile Asp Pro Ser Thr Gly Phe
1250 1255 1260
Val Asn Leu Leu Lys Thr Lys Tyr Thr Ser Ile Ala Asp Ser Lys
1265 1270 1275
Lys Phe Ile Ser Ser Phe Asp Arg Ile Met Tyr Val Pro Glu Glu
1280 1285 1290
Asp Leu Phe Glu Phe Ala Leu Asp Tyr Lys Asn Phe Ser Arg Thr
1295 1300 1305
Asp Ala Asp Tyr Ile Lys Lys Trp Lys Leu Tyr Ser Tyr Gly Asn
1310 1315 1320
Arg Ile Arg Ile Phe Arg Asn Pro Lys Lys Asn Asn Val Phe Asp
1325 1330 1335
Trp Glu Glu Val Cys Leu Thr Ser Ala Tyr Lys Glu Leu Phe Asn
1340 1345 1350
Lys Tyr Gly Ile Asn Tyr Gln Gln Gly Asp Ile Arg Ala Leu Leu
1355 1360 1365
Cys Glu Gln Ser Asp Lys Ala Phe Tyr Ser Ser Phe Met Ala Leu
1370 1375 1380
Met Ser Leu Met Leu Gln Met Arg Asn Ser Ile Thr Gly Arg Thr
1385 1390 1395
Asp Val Ala Phe Leu Ile Ser Pro Val Lys Asn Ser Asp Gly Ile
1400 1405 1410
Phe Tyr Asp Ser Arg Asn Tyr Glu Ala Gln Glu Asn Ala Ile Leu
1415 1420 1425
Pro Lys Asn Ala Asp Ala Asn Gly Ala Tyr Asn Ile Ala Arg Lys
1430 1435 1440
Val Leu Trp Ala Ile Gly Gln Phe Lys Lys Ala Glu Asp Glu Lys
1445 1450 1455
Leu Asp Lys Val Lys Ile Ala Ile Ser Asn Lys Glu Trp Leu Glu
1460 1465 1470
Tyr Ala Gln Thr Ser Val Lys His Gly Ser Pro Lys Lys Lys Arg
1475 1480 1485
Lys Val Gly Gly Ser Thr Gly Gly Gly Ser Gly Gly Gly Ser Gly
1490 1495 1500
Gly Gly Ser Ser Gly Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu
1505 1510 1515
Thr Gly Lys Gln Leu Val Ile Gln Glu Ser Ile Leu Met Leu Pro
1520 1525 1530
Glu Glu Val Glu Glu Val Ile Gly Asn Lys Pro Glu Ser Asp Ile
1535 1540 1545
Leu Val His Thr Ala Tyr Asp Glu Ser Thr Asp Glu Asn Val Met
1550 1555 1560
Leu Leu Thr Ser Asp Ala Pro Glu Tyr Lys Pro Trp Ala Leu Val
1565 1570 1575
Ile Gln Asp Ser Asn Gly Glu Asn Lys Ile Lys Met Leu Gly Gly
1580 1585 1590
Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Pro Lys
1595 1600 1605
Lys Lys Arg Lys Val
1610
<210> 16
<211> 5145
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 16
atgccgaaga agaagcgcaa ggtcatgtcc agcgagaccg gccccgtggc ggtggacccc 60
accctgcgca ggcgcatcga gccgcacgag ttcgaggtgt tcttcgaccc cagggagctc 120
cgcaaggaga cctgcctcct gtacgagatc aactggggcg gcaggcactc catctggagg 180
cacacgagcc agaacaccaa caagcacgtc gaggtgaact tcatcgagaa gttcaccacg 240
gagaggtact tctgcccgaa cacgcgctgc tccatcacgt ggttcctctc gtggagccca 300
tgcggcgagt gctccagggc gatcacggag ttcctcagcc gctacccgca cgtgaccctg 360
ttcatctaca tcgctaggct ctaccaccac gcggacccca ggaacaggca gggcctcagg 420
gacctgatct ccagcggcgt cacgatccag atcatgaccg agcaggagtc cggctactgc 480
tggaggaact tcgtgaacta ctccccgagc aacgaggccc actggccccg ctacccgcac 540
ctctgggtcc gcctctacgt gctcgagctg tactgcatca tcctcggcct gccgccctgc 600
ctcaacatcc tgaggcgcaa gcagccccag ctgacgttct tcaccatcgc cctgcagagc 660
tgccactacc agaggctccc gccccacatc ctgtgggcga ccgggctcaa ggggggcggg 720
ggctcaggcg ggggcgggag cggcggcggg ggctctgggg gcggcggcag cggcgggggc 780
ggcagcgggg gcggcgggtc gatgagcaag ctggagaagt tcacgaactg ctactccctc 840
agcaagaccc tgaggttcaa ggcgatcccg gtcggcaaga cccaggagaa catcgacaac 900
aagcggctgc tggtggagga cgagaagagg gctgaggact acaagggcgt gaagaagctc 960
ctggaccgct actacctgtc cttcatcaac gacgtgctcc acagcatcaa gctcaagaac 1020
ctgaacaact acatcagcct cttcaggaag aagacgcgca ccgagaagga gaacaaggag 1080
ctcgagaacc tggagatcaa cctgaggaag gagatcgcca aggcgttcaa gggcaacgag 1140
ggctacaagt ccctcttcaa gaaggacatc atcgagacga tcctcccgga gttcctggac 1200
gacaaggacg agatcgccct ggtcaactcc ttcaacggct tcaccacggc gttcaccggc 1260
ttcttcgaca accgcgagaa catgttcagc gaggaggcca agtccacgag catcgcgttc 1320
aggtgcatca acgagaacct cacccgctac atctccaaca tggacatctt cgagaaggtc 1380
gacgcgatct tcgacaagca cgaggtgcag gagatcaagg agaagatcct gaacagcgac 1440
tacgacgtcg aggacttctt cgagggcgag ttcttcaact tcgtcctcac gcaggagggc 1500
atcgacgtgt acaacgccat catcggtggc ttcgtgaccg agtccggcga gaagatcaag 1560
ggcctgaacg agtacatcaa cctctacaac cagaagacca agcagaagct gccgaagttc 1620
aagcccctgt acaagcaggt gctctccgac agggagtccc tcagcttcta cggcgagggc 1680
tacacgagcg acgaggaggt cctggaggtg ttccgcaaca ccctcaacaa gaacagcgag 1740
atcttctcca gcatcaagaa gctcgagaag ctgttcaaga acttcgacga gtactccagc 1800
gccggcatct tcgtcaagaa cggcccggcg atctccacga tcagcaagga catcttcggc 1860
gagtggaacg tgatccgcga caagtggaac gccgagtacg acgacatcca cctcaagaag 1920
aaggcggtgg tcaccgagaa gtacgaggac gacaggcgca agtccttcaa gaagatcggc 1980
tccttcagcc tcgagcagct gcaggagtac gccgacgcgg acctgagcgt ggtcgagaag 2040
ctcaaggaga tcatcatcca gaaggtcgac gagatctaca aggtgtacgg ctccagcgag 2100
aagctcttcg acgcggactt cgtcctcgag aagtccctga agaagaacga cgccgtggtc 2160
gcgatcatga aggacctcct ggactccgtg aagagcttcg agaattacat caaggccttc 2220
ttcggcgagg gcaaggagac gaacagggac gagtccttct acggcgactt cgtcctggcc 2280
tacgacatcc tcctgaaggt ggaccacatc tacgacgcga tccgcaacta cgtgacccag 2340
aagccgtaca gcaaggacaa gttcaagctc tacttccaga acccccagtt catgggcggc 2400
tgggacaagg acaaggagac ggactacagg gcgaccatcc tgcgctacgg cagcaagtac 2460
tacctcgcca tcatggacaa gaagtacgcg aagtgcctgc agaagatcga caaggacgac 2520
gtcaacggca actacgagaa gatcaactac aagctcctgc cgggccccaa caagatgctc 2580
ccgaaggtgt tcttctccaa gaagtggatg gcctactaca accccagcga ggacatccag 2640
aagatctaca agaacggcac gttcaagaag ggcgacatgt tcaacctgaa cgactgccac 2700
aagctcatcg acttcttcaa ggactccatc agccgctacc cgaagtggtc caacgcctac 2760
gacttcaact tcagcgagac cgagaagtac aaggacatcg cgggcttcta ccgcgaggtc 2820
gaggagcagg gctacaaggt gtccttcgag tccgccagca agaaggaggt cgacaagctg 2880
gtggaggagg gcaagctcta catgttccag atctacaaca aggacttctc cgacaagagc 2940
cacggcacgc ccaacctgca caccatgtac ttcaagctcc tgttcgacga gaacaaccac 3000
ggccagatca ggctgtccgg cggcgccgag ctcttcatga ggagggcgag cctgaagaag 3060
gaggagctgg tggtccaccc cgctaacagc ccaatcgcga acaagaaccc ggacaacccc 3120
aagaagacca cgaccctgtc ctacgacgtg tacaaggaca agaggttcag cgaggaccag 3180
tacgagctcc acatcccgat cgcgatcaac aagtgcccca agaacatctt caagatcaac 3240
accgaggtcc gcgtgctcct gaagcacgac gacaacccct acgtgatcgg catcgctagg 3300
ggcgagagga acctcctgta catcgtggtc gtggacggca agggcaacat cgtggagcag 3360
tactccctca acgagatcat caacaacttc aacggcatca ggatcaagac ggactaccac 3420
agcctcctgg acaagaagga gaaggagagg ttcgaggccc gccagaactg gacctccatc 3480
gagaacatca aggagctgaa ggcgggctac atcagccagg tcgtgcacaa gatctgcgag 3540
ctcgtcgaga agtacgacgc cgtgatcgcc ctcgcggacc tgaactccgg cttcaagaac 3600
agccgcgtca aggtggagaa gcaggtctac cagaagttcg agaagatgct catcgacaag 3660
ctgaactaca tggtggacaa gaagtccaac ccctgcgcta cgggcggcgc gctgaagggc 3720
taccagatca ccaacaagtt cgagagcttc aagtccatga gcactcagaa cggcttcatc 3780
ttctacatcc cggcgtggct cacgtccaag atcgacccca gcaccggctt cgtcaacctc 3840
ctgaagacga agtacacctc catcgccgac agcaagaagt tcatctccag cttcgaccgc 3900
atcatgtatg tgccggagga ggacctgttc gagttcgccc tcgactacaa gaacttctcc 3960
cgcacggacg cggactacat caagaagtgg aagctgtaca gctacggcaa ccgcatccgc 4020
atcttcagga accccaagaa gaacaacgtc ttcgactggg aggaggtgtg cctgacctcc 4080
gcgtacaagg agctcttcaa caagtacggc atcaactacc agcagggcga catcagggct 4140
ctcctgtgcg agcagagcga caaggccttc tactccagct tcatggcgct gatgtccctc 4200
atgctgcaga tgaggaactc gatcaccggc aggacggacg tggccttcct catctccccg 4260
gtgaagaaca gcgacggcat cttctacgac tccaggaact acgaggccca ggagaacgcg 4320
atcctcccaa agaacgcgga cgccaacggc gcctacaaca tcgccaggaa ggtcctctgg 4380
gctatcggcc agttcaagaa ggcggaggac gagaagctgg acaaggtgaa gatcgccatc 4440
agcaacaagg agtggctcga gtacgcccag acctcggtca agcacggcag cccgaagaag 4500
aagcgcaagg tgggagggtc gacaggaggc ggttctggcg gaggttcagg tggaggctcg 4560
agtggtacga acctgtccga catcatcgag aaggagaccg gcaagcagct cgtgatccag 4620
gagagcatcc tcatgctgcc ggaggaggtc gaggaggtca tcggcaacaa gcccgagtcc 4680
gacatcctcg tccacacggc ctacgacgag tccaccgacg agaacgtgat gctcctgacc 4740
tcggacgctc ccgagtacaa gccatgggcc ctggtcatcc aggacagcaa cggcgagaac 4800
aagatcaaga tgctcggtgg aggcggttca ggcggaggtg gctctggcgg tggcggatcg 4860
acgaacctgt ccgacatcat cgagaaggag accggcaagc agctcgtgat ccaggagagc 4920
atcctcatgc tgccggagga ggtcgaggag gtcatcggca acaagcccga gtccgacatc 4980
ctcgtccaca cggcctacga cgagtccacc gacgagaacg tgatgctcct gacctcggac 5040
gctcccgagt acaagccatg ggccctggtc atccaggaca gcaacggcga gaacaagatc 5100
aagatgctct ccggcggcag cccgaagaag aagcgcaaag tgtga 5145
<210> 17
<211> 1714
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 17
Met Pro Lys Lys Lys Arg Lys Val Met Ser Ser Glu Thr Gly Pro Val
1 5 10 15
Ala Val Asp Pro Thr Leu Arg Arg Arg Ile Glu Pro His Glu Phe Glu
20 25 30
Val Phe Phe Asp Pro Arg Glu Leu Arg Lys Glu Thr Cys Leu Leu Tyr
35 40 45
Glu Ile Asn Trp Gly Gly Arg His Ser Ile Trp Arg His Thr Ser Gln
50 55 60
Asn Thr Asn Lys His Val Glu Val Asn Phe Ile Glu Lys Phe Thr Thr
65 70 75 80
Glu Arg Tyr Phe Cys Pro Asn Thr Arg Cys Ser Ile Thr Trp Phe Leu
85 90 95
Ser Trp Ser Pro Cys Gly Glu Cys Ser Arg Ala Ile Thr Glu Phe Leu
100 105 110
Ser Arg Tyr Pro His Val Thr Leu Phe Ile Tyr Ile Ala Arg Leu Tyr
115 120 125
His His Ala Asp Pro Arg Asn Arg Gln Gly Leu Arg Asp Leu Ile Ser
130 135 140
Ser Gly Val Thr Ile Gln Ile Met Thr Glu Gln Glu Ser Gly Tyr Cys
145 150 155 160
Trp Arg Asn Phe Val Asn Tyr Ser Pro Ser Asn Glu Ala His Trp Pro
165 170 175
Arg Tyr Pro His Leu Trp Val Arg Leu Tyr Val Leu Glu Leu Tyr Cys
180 185 190
Ile Ile Leu Gly Leu Pro Pro Cys Leu Asn Ile Leu Arg Arg Lys Gln
195 200 205
Pro Gln Leu Thr Phe Phe Thr Ile Ala Leu Gln Ser Cys His Tyr Gln
210 215 220
Arg Leu Pro Pro His Ile Leu Trp Ala Thr Gly Leu Lys Gly Gly Gly
225 230 235 240
Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly
245 250 255
Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Met Ser Lys Leu Glu
260 265 270
Lys Phe Thr Asn Cys Tyr Ser Leu Ser Lys Thr Leu Arg Phe Lys Ala
275 280 285
Ile Pro Val Gly Lys Thr Gln Glu Asn Ile Asp Asn Lys Arg Leu Leu
290 295 300
Val Glu Asp Glu Lys Arg Ala Glu Asp Tyr Lys Gly Val Lys Lys Leu
305 310 315 320
Leu Asp Arg Tyr Tyr Leu Ser Phe Ile Asn Asp Val Leu His Ser Ile
325 330 335
Lys Leu Lys Asn Leu Asn Asn Tyr Ile Ser Leu Phe Arg Lys Lys Thr
340 345 350
Arg Thr Glu Lys Glu Asn Lys Glu Leu Glu Asn Leu Glu Ile Asn Leu
355 360 365
Arg Lys Glu Ile Ala Lys Ala Phe Lys Gly Asn Glu Gly Tyr Lys Ser
370 375 380
Leu Phe Lys Lys Asp Ile Ile Glu Thr Ile Leu Pro Glu Phe Leu Asp
385 390 395 400
Asp Lys Asp Glu Ile Ala Leu Val Asn Ser Phe Asn Gly Phe Thr Thr
405 410 415
Ala Phe Thr Gly Phe Phe Asp Asn Arg Glu Asn Met Phe Ser Glu Glu
420 425 430
Ala Lys Ser Thr Ser Ile Ala Phe Arg Cys Ile Asn Glu Asn Leu Thr
435 440 445
Arg Tyr Ile Ser Asn Met Asp Ile Phe Glu Lys Val Asp Ala Ile Phe
450 455 460
Asp Lys His Glu Val Gln Glu Ile Lys Glu Lys Ile Leu Asn Ser Asp
465 470 475 480
Tyr Asp Val Glu Asp Phe Phe Glu Gly Glu Phe Phe Asn Phe Val Leu
485 490 495
Thr Gln Glu Gly Ile Asp Val Tyr Asn Ala Ile Ile Gly Gly Phe Val
500 505 510
Thr Glu Ser Gly Glu Lys Ile Lys Gly Leu Asn Glu Tyr Ile Asn Leu
515 520 525
Tyr Asn Gln Lys Thr Lys Gln Lys Leu Pro Lys Phe Lys Pro Leu Tyr
530 535 540
Lys Gln Val Leu Ser Asp Arg Glu Ser Leu Ser Phe Tyr Gly Glu Gly
545 550 555 560
Tyr Thr Ser Asp Glu Glu Val Leu Glu Val Phe Arg Asn Thr Leu Asn
565 570 575
Lys Asn Ser Glu Ile Phe Ser Ser Ile Lys Lys Leu Glu Lys Leu Phe
580 585 590
Lys Asn Phe Asp Glu Tyr Ser Ser Ala Gly Ile Phe Val Lys Asn Gly
595 600 605
Pro Ala Ile Ser Thr Ile Ser Lys Asp Ile Phe Gly Glu Trp Asn Val
610 615 620
Ile Arg Asp Lys Trp Asn Ala Glu Tyr Asp Asp Ile His Leu Lys Lys
625 630 635 640
Lys Ala Val Val Thr Glu Lys Tyr Glu Asp Asp Arg Arg Lys Ser Phe
645 650 655
Lys Lys Ile Gly Ser Phe Ser Leu Glu Gln Leu Gln Glu Tyr Ala Asp
660 665 670
Ala Asp Leu Ser Val Val Glu Lys Leu Lys Glu Ile Ile Ile Gln Lys
675 680 685
Val Asp Glu Ile Tyr Lys Val Tyr Gly Ser Ser Glu Lys Leu Phe Asp
690 695 700
Ala Asp Phe Val Leu Glu Lys Ser Leu Lys Lys Asn Asp Ala Val Val
705 710 715 720
Ala Ile Met Lys Asp Leu Leu Asp Ser Val Lys Ser Phe Glu Asn Tyr
725 730 735
Ile Lys Ala Phe Phe Gly Glu Gly Lys Glu Thr Asn Arg Asp Glu Ser
740 745 750
Phe Tyr Gly Asp Phe Val Leu Ala Tyr Asp Ile Leu Leu Lys Val Asp
755 760 765
His Ile Tyr Asp Ala Ile Arg Asn Tyr Val Thr Gln Lys Pro Tyr Ser
770 775 780
Lys Asp Lys Phe Lys Leu Tyr Phe Gln Asn Pro Gln Phe Met Gly Gly
785 790 795 800
Trp Asp Lys Asp Lys Glu Thr Asp Tyr Arg Ala Thr Ile Leu Arg Tyr
805 810 815
Gly Ser Lys Tyr Tyr Leu Ala Ile Met Asp Lys Lys Tyr Ala Lys Cys
820 825 830
Leu Gln Lys Ile Asp Lys Asp Asp Val Asn Gly Asn Tyr Glu Lys Ile
835 840 845
Asn Tyr Lys Leu Leu Pro Gly Pro Asn Lys Met Leu Pro Lys Val Phe
850 855 860
Phe Ser Lys Lys Trp Met Ala Tyr Tyr Asn Pro Ser Glu Asp Ile Gln
865 870 875 880
Lys Ile Tyr Lys Asn Gly Thr Phe Lys Lys Gly Asp Met Phe Asn Leu
885 890 895
Asn Asp Cys His Lys Leu Ile Asp Phe Phe Lys Asp Ser Ile Ser Arg
900 905 910
Tyr Pro Lys Trp Ser Asn Ala Tyr Asp Phe Asn Phe Ser Glu Thr Glu
915 920 925
Lys Tyr Lys Asp Ile Ala Gly Phe Tyr Arg Glu Val Glu Glu Gln Gly
930 935 940
Tyr Lys Val Ser Phe Glu Ser Ala Ser Lys Lys Glu Val Asp Lys Leu
945 950 955 960
Val Glu Glu Gly Lys Leu Tyr Met Phe Gln Ile Tyr Asn Lys Asp Phe
965 970 975
Ser Asp Lys Ser His Gly Thr Pro Asn Leu His Thr Met Tyr Phe Lys
980 985 990
Leu Leu Phe Asp Glu Asn Asn His Gly Gln Ile Arg Leu Ser Gly Gly
995 1000 1005
Ala Glu Leu Phe Met Arg Arg Ala Ser Leu Lys Lys Glu Glu Leu
1010 1015 1020
Val Val His Pro Ala Asn Ser Pro Ile Ala Asn Lys Asn Pro Asp
1025 1030 1035
Asn Pro Lys Lys Thr Thr Thr Leu Ser Tyr Asp Val Tyr Lys Asp
1040 1045 1050
Lys Arg Phe Ser Glu Asp Gln Tyr Glu Leu His Ile Pro Ile Ala
1055 1060 1065
Ile Asn Lys Cys Pro Lys Asn Ile Phe Lys Ile Asn Thr Glu Val
1070 1075 1080
Arg Val Leu Leu Lys His Asp Asp Asn Pro Tyr Val Ile Gly Ile
1085 1090 1095
Ala Arg Gly Glu Arg Asn Leu Leu Tyr Ile Val Val Val Asp Gly
1100 1105 1110
Lys Gly Asn Ile Val Glu Gln Tyr Ser Leu Asn Glu Ile Ile Asn
1115 1120 1125
Asn Phe Asn Gly Ile Arg Ile Lys Thr Asp Tyr His Ser Leu Leu
1130 1135 1140
Asp Lys Lys Glu Lys Glu Arg Phe Glu Ala Arg Gln Asn Trp Thr
1145 1150 1155
Ser Ile Glu Asn Ile Lys Glu Leu Lys Ala Gly Tyr Ile Ser Gln
1160 1165 1170
Val Val His Lys Ile Cys Glu Leu Val Glu Lys Tyr Asp Ala Val
1175 1180 1185
Ile Ala Leu Ala Asp Leu Asn Ser Gly Phe Lys Asn Ser Arg Val
1190 1195 1200
Lys Val Glu Lys Gln Val Tyr Gln Lys Phe Glu Lys Met Leu Ile
1205 1210 1215
Asp Lys Leu Asn Tyr Met Val Asp Lys Lys Ser Asn Pro Cys Ala
1220 1225 1230
Thr Gly Gly Ala Leu Lys Gly Tyr Gln Ile Thr Asn Lys Phe Glu
1235 1240 1245
Ser Phe Lys Ser Met Ser Thr Gln Asn Gly Phe Ile Phe Tyr Ile
1250 1255 1260
Pro Ala Trp Leu Thr Ser Lys Ile Asp Pro Ser Thr Gly Phe Val
1265 1270 1275
Asn Leu Leu Lys Thr Lys Tyr Thr Ser Ile Ala Asp Ser Lys Lys
1280 1285 1290
Phe Ile Ser Ser Phe Asp Arg Ile Met Tyr Val Pro Glu Glu Asp
1295 1300 1305
Leu Phe Glu Phe Ala Leu Asp Tyr Lys Asn Phe Ser Arg Thr Asp
1310 1315 1320
Ala Asp Tyr Ile Lys Lys Trp Lys Leu Tyr Ser Tyr Gly Asn Arg
1325 1330 1335
Ile Arg Ile Phe Arg Asn Pro Lys Lys Asn Asn Val Phe Asp Trp
1340 1345 1350
Glu Glu Val Cys Leu Thr Ser Ala Tyr Lys Glu Leu Phe Asn Lys
1355 1360 1365
Tyr Gly Ile Asn Tyr Gln Gln Gly Asp Ile Arg Ala Leu Leu Cys
1370 1375 1380
Glu Gln Ser Asp Lys Ala Phe Tyr Ser Ser Phe Met Ala Leu Met
1385 1390 1395
Ser Leu Met Leu Gln Met Arg Asn Ser Ile Thr Gly Arg Thr Asp
1400 1405 1410
Val Ala Phe Leu Ile Ser Pro Val Lys Asn Ser Asp Gly Ile Phe
1415 1420 1425
Tyr Asp Ser Arg Asn Tyr Glu Ala Gln Glu Asn Ala Ile Leu Pro
1430 1435 1440
Lys Asn Ala Asp Ala Asn Gly Ala Tyr Asn Ile Ala Arg Lys Val
1445 1450 1455
Leu Trp Ala Ile Gly Gln Phe Lys Lys Ala Glu Asp Glu Lys Leu
1460 1465 1470
Asp Lys Val Lys Ile Ala Ile Ser Asn Lys Glu Trp Leu Glu Tyr
1475 1480 1485
Ala Gln Thr Ser Val Lys His Gly Ser Pro Lys Lys Lys Arg Lys
1490 1495 1500
Val Gly Gly Ser Thr Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly
1505 1510 1515
Gly Ser Ser Gly Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu Thr
1520 1525 1530
Gly Lys Gln Leu Val Ile Gln Glu Ser Ile Leu Met Leu Pro Glu
1535 1540 1545
Glu Val Glu Glu Val Ile Gly Asn Lys Pro Glu Ser Asp Ile Leu
1550 1555 1560
Val His Thr Ala Tyr Asp Glu Ser Thr Asp Glu Asn Val Met Leu
1565 1570 1575
Leu Thr Ser Asp Ala Pro Glu Tyr Lys Pro Trp Ala Leu Val Ile
1580 1585 1590
Gln Asp Ser Asn Gly Glu Asn Lys Ile Lys Met Leu Gly Gly Gly
1595 1600 1605
Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Thr Asn Leu
1610 1615 1620
Ser Asp Ile Ile Glu Lys Glu Thr Gly Lys Gln Leu Val Ile Gln
1625 1630 1635
Glu Ser Ile Leu Met Leu Pro Glu Glu Val Glu Glu Val Ile Gly
1640 1645 1650
Asn Lys Pro Glu Ser Asp Ile Leu Val His Thr Ala Tyr Asp Glu
1655 1660 1665
Ser Thr Asp Glu Asn Val Met Leu Leu Thr Ser Asp Ala Pro Glu
1670 1675 1680
Tyr Lys Pro Trp Ala Leu Val Ile Gln Asp Ser Asn Gly Glu Asn
1685 1690 1695
Lys Ile Lys Met Leu Ser Gly Gly Ser Pro Lys Lys Lys Arg Lys
1700 1705 1710
Val
<210> 18
<211> 4767
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 18
atgccgaaga agaagcgcaa ggtcatgtcc agcgagaccg gccccgtggc ggtggacccc 60
accctgcgca ggcgcatcga gccgcacgag ttcgaggtgt tcttcgaccc cagggagctc 120
cgcaaggaga cctgcctcct gtacgagatc aactggggcg gcaggcactc catctggagg 180
cacacgagcc agaacaccaa caagcacgtc gaggtgaact tcatcgagaa gttcaccacg 240
gagaggtact tctgcccgaa cacgcgctgc tccatcacgt ggttcctctc gtggagccca 300
tgcggcgagt gctccagggc gatcacggag ttcctcagcc gctacccgca cgtgaccctg 360
ttcatctaca tcgctaggct ctaccaccac gcggacccca ggaacaggca gggcctcagg 420
gacctgatct ccagcggcgt cacgatccag atcatgaccg agcaggagtc cggctactgc 480
tggaggaact tcgtgaacta ctccccgagc aacgaggccc actggccccg ctacccgcac 540
ctctgggtcc gcctctacgt gctcgagctg tactgcatca tcctcggcct gccgccctgc 600
ctcaacatcc tgaggcgcaa gcagccccag ctgacgttct tcaccatcgc cctgcagagc 660
tgccactacc agaggctccc gccccacatc ctgtgggcga ccgggctcaa gtcgggcagc 720
gagacccccg gcacctccga gtcggctacc ccagagtcca tgagcaagct ggagaagttc 780
acgaactgct actccctcag caagaccctg aggttcaagg cgatcccggt cggcaagacc 840
caggagaaca tcgacaacaa gcggctgctg gtggaggacg agaagagggc tgaggactac 900
aagggcgtga agaagctcct ggaccgctac tacctgtcct tcatcaacga cgtgctccac 960
agcatcaagc tcaagaacct gaacaactac atcagcctct tcaggaagaa gacgcgcacc 1020
gagaaggaga acaaggagct cgagaacctg gagatcaacc tgaggaagga gatcgccaag 1080
gcgttcaagg gcaacgaggg ctacaagtcc ctcttcaaga aggacatcat cgagacgatc 1140
ctcccggagt tcctggacga caaggacgag atcgccctgg tcaactcctt caacggcttc 1200
accacggcgt tcaccggctt cttcgacaac cgcgagaaca tgttcagcga ggaggccaag 1260
tccacgagca tcgcgttcag gtgcatcaac gagaacctca cccgctacat ctccaacatg 1320
gacatcttcg agaaggtcga cgcgatcttc gacaagcacg aggtgcagga gatcaaggag 1380
aagatcctga acagcgacta cgacgtcgag gacttcttcg agggcgagtt cttcaacttc 1440
gtcctcacgc aggagggcat cgacgtgtac aacgccatca tcggtggctt cgtgaccgag 1500
tccggcgaga agatcaaggg cctgaacgag tacatcaacc tctacaacca gaagaccaag 1560
cagaagctgc cgaagttcaa gcccctgtac aagcaggtgc tctccgacag ggagtccctc 1620
agcttctacg gcgagggcta cacgagcgac gaggaggtcc tggaggtgtt ccgcaacacc 1680
ctcaacaaga acagcgagat cttctccagc atcaagaagc tcgagaagct gttcaagaac 1740
ttcgacgagt actccagcgc cggcatcttc gtcaagaacg gcccggcgat ctccacgatc 1800
agcaaggaca tcttcggcga gtggaacgtg atccgcgaca agtggaacgc cgagtacgac 1860
gacatccacc tcaagaagaa ggcggtggtc accgagaagt acgaggacga caggcgcaag 1920
tccttcaaga agatcggctc cttcagcctc gagcagctgc aggagtacgc cgacgcggac 1980
ctgagcgtgg tcgagaagct caaggagatc atcatccaga aggtcgacga gatctacaag 2040
gtgtacggct ccagcgagaa gctcttcgac gcggacttcg tcctcgagaa gtccctgaag 2100
aagaacgacg ccgtggtcgc gatcatgaag gacctcctgg actccgtgaa gagcttcgag 2160
aattacatca aggccttctt cggcgagggc aaggagacga acagggacga gtccttctac 2220
ggcgacttcg tcctggccta cgacatcctc ctgaaggtgg accacatcta cgacgcgatc 2280
cgcaactacg tgacccagaa gccgtacagc aaggacaagt tcaagctcta cttccagaac 2340
ccccagttca tgggcggctg ggacaaggac aaggagacgg actacagggc gaccatcctg 2400
cgctacggca gcaagtacta cctcgccatc atggacaaga agtacgcgaa gtgcctgcag 2460
aagatcgaca aggacgacgt caacggcaac tacgagaaga tcaactacaa gctcctgccg 2520
ggccccaaca agatgctccc gaaggtgttc ttctccaaga agtggatggc ctactacaac 2580
cccagcgagg acatccagaa gatctacaag aacggcacgt tcaagaaggg cgacatgttc 2640
aacctgaacg actgccacaa gctcatcgac ttcttcaagg actccatcag ccgctacccg 2700
aagtggtcca acgcctacga cttcaacttc agcgagaccg agaagtacaa ggacatcgcg 2760
ggcttctacc gcgaggtcga ggagcagggc tacaaggtgt ccttcgagtc cgccagcaag 2820
aaggaggtcg acaagctggt ggaggagggc aagctctaca tgttccagat ctacaacaag 2880
gacttctccg acaagagcca cggcacgccc aacctgcaca ccatgtactt caagctcctg 2940
ttcgacgaga acaaccacgg ccagatcagg ctgtccggcg gcgccgagct cttcatgagg 3000
agggcgagcc tgaagaagga ggagctggtg gtccaccccg ctaacagccc aatcgcgaac 3060
aagaacccgg acaaccccaa gaagaccacg accctgtcct acgacgtgta caaggacaag 3120
aggttcagcg aggaccagta cgagctccac atcccgatcg cgatcaacaa gtgccccaag 3180
aacatcttca agatcaacac cgaggtccgc gtgctcctga agcacgacga caacccctac 3240
gtgatcggca tcgctagggg cgagaggaac ctcctgtaca tcgtggtcgt ggacggcaag 3300
ggcaacatcg tggagcagta ctccctcaac gagatcatca acaacttcaa cggcatcagg 3360
atcaagacgg actaccacag cctcctggac aagaaggaga aggagaggtt cgaggcccgc 3420
cagaactgga cctccatcga gaacatcaag gagctgaagg cgggctacat cagccaggtc 3480
gtgcacaaga tctgcgagct cgtcgagaag tacgacgccg tgatcgccct cgcggacctg 3540
aactccggct tcaagaacag ccgcgtcaag gtggagaagc aggtctacca gaagttcgag 3600
aagatgctca tcgacaagct gaactacatg gtggacaaga agtccaaccc ctgcgctacg 3660
ggcggcgcgc tgaagggcta ccagatcacc aacaagttcg agagcttcaa gtccatgagc 3720
actcagaacg gcttcatctt ctacatcccg gcgtggctca cgtccaagat cgaccccagc 3780
accggcttcg tcaacctcct gaagacgaag tacacctcca tcgccgacag caagaagttc 3840
atctccagct tcgaccgcat catgtatgtg ccggaggagg acctgttcga gttcgccctc 3900
gactacaaga acttctcccg cacggacgcg gactacatca agaagtggaa gctgtacagc 3960
tacggcaacc gcatccgcat cttcaggaac cccaagaaga acaacgtctt cgactgggag 4020
gaggtgtgcc tgacctccgc gtacaaggag ctcttcaaca agtacggcat caactaccag 4080
cagggcgaca tcagggctct cctgtgcgag cagagcgaca aggccttcta ctccagcttc 4140
atggcgctga tgtccctcat gctgcagatg aggaactcga tcaccggcag gacggacgtg 4200
gccttcctca tctccccggt gaagaacagc gacggcatct tctacgactc caggaactac 4260
gaggcccagg agaacgcgat cctcccaaag aacgcggacg ccaacggcgc ctacaacatc 4320
gccaggaagg tcctctgggc tatcggccag ttcaagaagg cggaggacga gaagctggac 4380
aaggtgaaga tcgccatcag caacaaggag tggctcgagt acgcccagac ctcggtcaag 4440
cacggcagcc cgaagaagaa gcgcaaggtg tccggcggca gcacgaacct gtccgacatc 4500
atcgagaagg agaccggcaa gcagctcgtg atccaggaga gcatcctcat gctgccggag 4560
gaggtcgagg aggtcatcgg caacaagccc gagtccgaca tcctcgtcca cacggcctac 4620
gacgagtcca ccgacgagaa cgtgatgctc ctgacctcgg acgctcccga gtacaagcca 4680
tgggccctgg tcatccagga cagcaacggc gagaacaaga tcaagatgct ctccggcggc 4740
agcccgaaga agaagcgcaa agtgtga 4767
<210> 19
<211> 1588
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 19
Met Pro Lys Lys Lys Arg Lys Val Met Ser Ser Glu Thr Gly Pro Val
1 5 10 15
Ala Val Asp Pro Thr Leu Arg Arg Arg Ile Glu Pro His Glu Phe Glu
20 25 30
Val Phe Phe Asp Pro Arg Glu Leu Arg Lys Glu Thr Cys Leu Leu Tyr
35 40 45
Glu Ile Asn Trp Gly Gly Arg His Ser Ile Trp Arg His Thr Ser Gln
50 55 60
Asn Thr Asn Lys His Val Glu Val Asn Phe Ile Glu Lys Phe Thr Thr
65 70 75 80
Glu Arg Tyr Phe Cys Pro Asn Thr Arg Cys Ser Ile Thr Trp Phe Leu
85 90 95
Ser Trp Ser Pro Cys Gly Glu Cys Ser Arg Ala Ile Thr Glu Phe Leu
100 105 110
Ser Arg Tyr Pro His Val Thr Leu Phe Ile Tyr Ile Ala Arg Leu Tyr
115 120 125
His His Ala Asp Pro Arg Asn Arg Gln Gly Leu Arg Asp Leu Ile Ser
130 135 140
Ser Gly Val Thr Ile Gln Ile Met Thr Glu Gln Glu Ser Gly Tyr Cys
145 150 155 160
Trp Arg Asn Phe Val Asn Tyr Ser Pro Ser Asn Glu Ala His Trp Pro
165 170 175
Arg Tyr Pro His Leu Trp Val Arg Leu Tyr Val Leu Glu Leu Tyr Cys
180 185 190
Ile Ile Leu Gly Leu Pro Pro Cys Leu Asn Ile Leu Arg Arg Lys Gln
195 200 205
Pro Gln Leu Thr Phe Phe Thr Ile Ala Leu Gln Ser Cys His Tyr Gln
210 215 220
Arg Leu Pro Pro His Ile Leu Trp Ala Thr Gly Leu Lys Ser Gly Ser
225 230 235 240
Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Met Ser Lys
245 250 255
Leu Glu Lys Phe Thr Asn Cys Tyr Ser Leu Ser Lys Thr Leu Arg Phe
260 265 270
Lys Ala Ile Pro Val Gly Lys Thr Gln Glu Asn Ile Asp Asn Lys Arg
275 280 285
Leu Leu Val Glu Asp Glu Lys Arg Ala Glu Asp Tyr Lys Gly Val Lys
290 295 300
Lys Leu Leu Asp Arg Tyr Tyr Leu Ser Phe Ile Asn Asp Val Leu His
305 310 315 320
Ser Ile Lys Leu Lys Asn Leu Asn Asn Tyr Ile Ser Leu Phe Arg Lys
325 330 335
Lys Thr Arg Thr Glu Lys Glu Asn Lys Glu Leu Glu Asn Leu Glu Ile
340 345 350
Asn Leu Arg Lys Glu Ile Ala Lys Ala Phe Lys Gly Asn Glu Gly Tyr
355 360 365
Lys Ser Leu Phe Lys Lys Asp Ile Ile Glu Thr Ile Leu Pro Glu Phe
370 375 380
Leu Asp Asp Lys Asp Glu Ile Ala Leu Val Asn Ser Phe Asn Gly Phe
385 390 395 400
Thr Thr Ala Phe Thr Gly Phe Phe Asp Asn Arg Glu Asn Met Phe Ser
405 410 415
Glu Glu Ala Lys Ser Thr Ser Ile Ala Phe Arg Cys Ile Asn Glu Asn
420 425 430
Leu Thr Arg Tyr Ile Ser Asn Met Asp Ile Phe Glu Lys Val Asp Ala
435 440 445
Ile Phe Asp Lys His Glu Val Gln Glu Ile Lys Glu Lys Ile Leu Asn
450 455 460
Ser Asp Tyr Asp Val Glu Asp Phe Phe Glu Gly Glu Phe Phe Asn Phe
465 470 475 480
Val Leu Thr Gln Glu Gly Ile Asp Val Tyr Asn Ala Ile Ile Gly Gly
485 490 495
Phe Val Thr Glu Ser Gly Glu Lys Ile Lys Gly Leu Asn Glu Tyr Ile
500 505 510
Asn Leu Tyr Asn Gln Lys Thr Lys Gln Lys Leu Pro Lys Phe Lys Pro
515 520 525
Leu Tyr Lys Gln Val Leu Ser Asp Arg Glu Ser Leu Ser Phe Tyr Gly
530 535 540
Glu Gly Tyr Thr Ser Asp Glu Glu Val Leu Glu Val Phe Arg Asn Thr
545 550 555 560
Leu Asn Lys Asn Ser Glu Ile Phe Ser Ser Ile Lys Lys Leu Glu Lys
565 570 575
Leu Phe Lys Asn Phe Asp Glu Tyr Ser Ser Ala Gly Ile Phe Val Lys
580 585 590
Asn Gly Pro Ala Ile Ser Thr Ile Ser Lys Asp Ile Phe Gly Glu Trp
595 600 605
Asn Val Ile Arg Asp Lys Trp Asn Ala Glu Tyr Asp Asp Ile His Leu
610 615 620
Lys Lys Lys Ala Val Val Thr Glu Lys Tyr Glu Asp Asp Arg Arg Lys
625 630 635 640
Ser Phe Lys Lys Ile Gly Ser Phe Ser Leu Glu Gln Leu Gln Glu Tyr
645 650 655
Ala Asp Ala Asp Leu Ser Val Val Glu Lys Leu Lys Glu Ile Ile Ile
660 665 670
Gln Lys Val Asp Glu Ile Tyr Lys Val Tyr Gly Ser Ser Glu Lys Leu
675 680 685
Phe Asp Ala Asp Phe Val Leu Glu Lys Ser Leu Lys Lys Asn Asp Ala
690 695 700
Val Val Ala Ile Met Lys Asp Leu Leu Asp Ser Val Lys Ser Phe Glu
705 710 715 720
Asn Tyr Ile Lys Ala Phe Phe Gly Glu Gly Lys Glu Thr Asn Arg Asp
725 730 735
Glu Ser Phe Tyr Gly Asp Phe Val Leu Ala Tyr Asp Ile Leu Leu Lys
740 745 750
Val Asp His Ile Tyr Asp Ala Ile Arg Asn Tyr Val Thr Gln Lys Pro
755 760 765
Tyr Ser Lys Asp Lys Phe Lys Leu Tyr Phe Gln Asn Pro Gln Phe Met
770 775 780
Gly Gly Trp Asp Lys Asp Lys Glu Thr Asp Tyr Arg Ala Thr Ile Leu
785 790 795 800
Arg Tyr Gly Ser Lys Tyr Tyr Leu Ala Ile Met Asp Lys Lys Tyr Ala
805 810 815
Lys Cys Leu Gln Lys Ile Asp Lys Asp Asp Val Asn Gly Asn Tyr Glu
820 825 830
Lys Ile Asn Tyr Lys Leu Leu Pro Gly Pro Asn Lys Met Leu Pro Lys
835 840 845
Val Phe Phe Ser Lys Lys Trp Met Ala Tyr Tyr Asn Pro Ser Glu Asp
850 855 860
Ile Gln Lys Ile Tyr Lys Asn Gly Thr Phe Lys Lys Gly Asp Met Phe
865 870 875 880
Asn Leu Asn Asp Cys His Lys Leu Ile Asp Phe Phe Lys Asp Ser Ile
885 890 895
Ser Arg Tyr Pro Lys Trp Ser Asn Ala Tyr Asp Phe Asn Phe Ser Glu
900 905 910
Thr Glu Lys Tyr Lys Asp Ile Ala Gly Phe Tyr Arg Glu Val Glu Glu
915 920 925
Gln Gly Tyr Lys Val Ser Phe Glu Ser Ala Ser Lys Lys Glu Val Asp
930 935 940
Lys Leu Val Glu Glu Gly Lys Leu Tyr Met Phe Gln Ile Tyr Asn Lys
945 950 955 960
Asp Phe Ser Asp Lys Ser His Gly Thr Pro Asn Leu His Thr Met Tyr
965 970 975
Phe Lys Leu Leu Phe Asp Glu Asn Asn His Gly Gln Ile Arg Leu Ser
980 985 990
Gly Gly Ala Glu Leu Phe Met Arg Arg Ala Ser Leu Lys Lys Glu Glu
995 1000 1005
Leu Val Val His Pro Ala Asn Ser Pro Ile Ala Asn Lys Asn Pro
1010 1015 1020
Asp Asn Pro Lys Lys Thr Thr Thr Leu Ser Tyr Asp Val Tyr Lys
1025 1030 1035
Asp Lys Arg Phe Ser Glu Asp Gln Tyr Glu Leu His Ile Pro Ile
1040 1045 1050
Ala Ile Asn Lys Cys Pro Lys Asn Ile Phe Lys Ile Asn Thr Glu
1055 1060 1065
Val Arg Val Leu Leu Lys His Asp Asp Asn Pro Tyr Val Ile Gly
1070 1075 1080
Ile Ala Arg Gly Glu Arg Asn Leu Leu Tyr Ile Val Val Val Asp
1085 1090 1095
Gly Lys Gly Asn Ile Val Glu Gln Tyr Ser Leu Asn Glu Ile Ile
1100 1105 1110
Asn Asn Phe Asn Gly Ile Arg Ile Lys Thr Asp Tyr His Ser Leu
1115 1120 1125
Leu Asp Lys Lys Glu Lys Glu Arg Phe Glu Ala Arg Gln Asn Trp
1130 1135 1140
Thr Ser Ile Glu Asn Ile Lys Glu Leu Lys Ala Gly Tyr Ile Ser
1145 1150 1155
Gln Val Val His Lys Ile Cys Glu Leu Val Glu Lys Tyr Asp Ala
1160 1165 1170
Val Ile Ala Leu Ala Asp Leu Asn Ser Gly Phe Lys Asn Ser Arg
1175 1180 1185
Val Lys Val Glu Lys Gln Val Tyr Gln Lys Phe Glu Lys Met Leu
1190 1195 1200
Ile Asp Lys Leu Asn Tyr Met Val Asp Lys Lys Ser Asn Pro Cys
1205 1210 1215
Ala Thr Gly Gly Ala Leu Lys Gly Tyr Gln Ile Thr Asn Lys Phe
1220 1225 1230
Glu Ser Phe Lys Ser Met Ser Thr Gln Asn Gly Phe Ile Phe Tyr
1235 1240 1245
Ile Pro Ala Trp Leu Thr Ser Lys Ile Asp Pro Ser Thr Gly Phe
1250 1255 1260
Val Asn Leu Leu Lys Thr Lys Tyr Thr Ser Ile Ala Asp Ser Lys
1265 1270 1275
Lys Phe Ile Ser Ser Phe Asp Arg Ile Met Tyr Val Pro Glu Glu
1280 1285 1290
Asp Leu Phe Glu Phe Ala Leu Asp Tyr Lys Asn Phe Ser Arg Thr
1295 1300 1305
Asp Ala Asp Tyr Ile Lys Lys Trp Lys Leu Tyr Ser Tyr Gly Asn
1310 1315 1320
Arg Ile Arg Ile Phe Arg Asn Pro Lys Lys Asn Asn Val Phe Asp
1325 1330 1335
Trp Glu Glu Val Cys Leu Thr Ser Ala Tyr Lys Glu Leu Phe Asn
1340 1345 1350
Lys Tyr Gly Ile Asn Tyr Gln Gln Gly Asp Ile Arg Ala Leu Leu
1355 1360 1365
Cys Glu Gln Ser Asp Lys Ala Phe Tyr Ser Ser Phe Met Ala Leu
1370 1375 1380
Met Ser Leu Met Leu Gln Met Arg Asn Ser Ile Thr Gly Arg Thr
1385 1390 1395
Asp Val Ala Phe Leu Ile Ser Pro Val Lys Asn Ser Asp Gly Ile
1400 1405 1410
Phe Tyr Asp Ser Arg Asn Tyr Glu Ala Gln Glu Asn Ala Ile Leu
1415 1420 1425
Pro Lys Asn Ala Asp Ala Asn Gly Ala Tyr Asn Ile Ala Arg Lys
1430 1435 1440
Val Leu Trp Ala Ile Gly Gln Phe Lys Lys Ala Glu Asp Glu Lys
1445 1450 1455
Leu Asp Lys Val Lys Ile Ala Ile Ser Asn Lys Glu Trp Leu Glu
1460 1465 1470
Tyr Ala Gln Thr Ser Val Lys His Gly Ser Pro Lys Lys Lys Arg
1475 1480 1485
Lys Val Ser Gly Gly Ser Thr Asn Leu Ser Asp Ile Ile Glu Lys
1490 1495 1500
Glu Thr Gly Lys Gln Leu Val Ile Gln Glu Ser Ile Leu Met Leu
1505 1510 1515
Pro Glu Glu Val Glu Glu Val Ile Gly Asn Lys Pro Glu Ser Asp
1520 1525 1530
Ile Leu Val His Thr Ala Tyr Asp Glu Ser Thr Asp Glu Asn Val
1535 1540 1545
Met Leu Leu Thr Ser Asp Ala Pro Glu Tyr Lys Pro Trp Ala Leu
1550 1555 1560
Val Ile Gln Asp Ser Asn Gly Glu Asn Lys Ile Lys Met Leu Ser
1565 1570 1575
Gly Gly Ser Pro Lys Lys Lys Arg Lys Val
1580 1585
<210> 20
<211> 5229
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 20
atgccgaaga agaagcgcaa ggtgtccagc gagaccggcc ccgtggcggt cgaccccacc 60
ctgcgcaggc gcatcgagcc gcacgagttc gaggtcttct tcgaccccag ggagctccgc 120
aaggagacct gcctcctgta cgagatcaac tggggcggca ggcactccat ctggaggcac 180
accagccaga acacgaacaa gcacgtggag gtcaacttca tcgagaagtt caccacggag 240
aggtacttct gcccgaacac ccgctgctcc atcacctggt tcctctcgtg gagcccatgc 300
ggcgagtgct ccagggcgat cacggagttc ctcagccgct acccgcacgt gaccctcttc 360
atctacatcg ctaggctgta ccaccacgcg gaccccagga acaggcaggg gctcagggac 420
ctgatctcca gcggcgtgac catccagatc atgacggagc aggagtccgg ctactgctgg 480
cgcaacttcg tcaactactc cccgagcaac gaggcccact ggccccgcta cccgcacctg 540
tgggtgcgcc tctacgtcct cgagctgtac tgcatcatcc tcggcctgcc gccctgcctc 600
aacatcctga ggcgcaagca gccccagctc accttcttca cgatcgccct gcagagctgc 660
cactaccagc ggctgccgcc ccacatcctc tgggccaccg gcctgaagtc gggcagcgag 720
acgcccggca cgtccgagtc ggctacccca gagctcaagg acaagaagta cagcatcggc 780
ctggcaatcg gcaccaacag cgtgggctgg gccgtgatca ccgacgagta caaggtgccg 840
agcaagaagt tcaaggtgct gggcaacacc gacaggcaca gcatcaagaa gaacctgatc 900
ggcgccctgc tgttcgacag cggcgagacc gccgaggcca ccaggctgaa gaggaccgcc 960
aggaggaggt acaccaggag gaagaacagg atctgctacc tgcaggagat cttcagcaac 1020
gagatggcca aggtggacga cagcttcttc cacaggctgg aggagagctt cctggtggag 1080
gaggacaaga agcacgagag gcacccgatc ttcggcaaca tcgtggacga ggtggcctac 1140
cacgagaagt acccgaccat ctaccacctg aggaagaagc tggtggacag caccgacaag 1200
gccgacctga ggctgatcta cctggccctg gcccacatga tcaagttcag gggccacttc 1260
ctgatcgagg gcgacctgaa cccggacaac agcgacgtgg acaagctgtt catccagctg 1320
gtgcagacct acaaccagct gttcgaggag aacccgatca acgccagcgg cgtggacgcc 1380
aaggccatcc tgagcgccag gctgagcaag agcaggaggc tggagaacct gatcgcccag 1440
ctgccgggcg agaagaagaa cggcctgttc ggcaacctga tcgccctgag cctgggcctg 1500
accccgaact tcaagagcaa cttcgacctg gccgaggacg ccaagctgca gctgagcaag 1560
gacacctacg acgacgacct ggacaacctg ctggcccaga tcggcgacca gtacgccgac 1620
ctgttcctgg ccgccaagaa cctgagcgac gccatcctgc tgagcgacat cctgagggtg 1680
aacaccgaga tcaccaaggc cccgctgagc gccagcatga tcaagaggta cgacgagcac 1740
caccaggacc tgaccctgct gaaggccctg gtgaggcagc agctgccgga gaagtacaag 1800
gagatcttct tcgaccagag caagaacggc tacgccggct acatcgacgg cggcgccagc 1860
caggaggagt tctacaagtt catcaagccg atcctggaga agatggacgg caccgaggag 1920
ctgctggtga agctgaacag ggaggacctg ctgaggaagc agaggacctt cgacaacggc 1980
agcatcccgc accagatcca cctgggcgag ctgcacgcca tcctgaggag gcaggaggac 2040
ttctacccgt tcctgaagga caacagggag aagatcgaga agatcctgac cttccgcatc 2100
ccgtactacg tgggcccgct ggccaggggc aacagcaggt tcgcctggat gaccaggaag 2160
agcgaggaga ccatcacccc gtggaacttc gaggaggtgg tggacaaggg cgccagcgcc 2220
cagagcttca tcgagaggat gaccaacttc gacaagaacc tgccgaacga gaaggtgctg 2280
ccgaagcaca gcctgctgta cgagtacttc accgtgtaca acgagctgac caaggtgaag 2340
tacgtgaccg agggcatgag gaagccggcc ttcctgagcg gcgagcagaa gaaggccatc 2400
gtggacctgc tgttcaagac caacaggaag gtgaccgtga agcagctgaa ggaggactac 2460
ttcaagaaga tcgagtgctt cgacagcgtg gagatcagcg gcgtggagga caggttcaac 2520
gccagcctgg gcacctacca cgacctgctg aagatcatca aggacaagga cttcctggac 2580
aacgaggaga acgaggacat cctggaggac atcgtgctga ccctgaccct gttcgaggac 2640
agggagatga tcgaggagag gctgaagacc tacgcccacc tgttcgacga caaggtgatg 2700
aagcagctga agaggaggag gtacaccggc tggggcaggc tgagcaggaa gctgatcaac 2760
ggcatcaggg acaagcagag cggcaagacc atcctggact tcctgaagag cgacggcttc 2820
gccaacagga acttcatgca gctgatccac gacgacagcc tgaccttcaa ggaggacatc 2880
cagaaggccc aggtgagcgg ccagggcgac agcctgcacg agcacatcgc caacctggcc 2940
ggcagcccgg ccatcaagaa gggcatcctg cagaccgtga aggtggtgga cgagctggtg 3000
aaggtgatgg gcaggcacaa gccggagaac atcgtgatcg agatggccag ggagaaccag 3060
accacccaga agggccagaa gaacagcagg gagaggatga agaggatcga ggagggcatc 3120
aaggagctgg gcagccagat cctgaaggag cacccggtgg agaacaccca gctgcagaac 3180
gagaagctgt acctgtacta cctgcagaac ggcagggaca tgtacgtgga ccaggagctg 3240
gacatcaaca ggctgagcga ctacgacgtg gaccacatcg tgccgcagag cttcctgaag 3300
gacgacagca tcgacaacaa ggtgctgacc aggagcgaca agaacagggg caagagcgac 3360
aacgtgccga gcgaggaggt ggtgaagaag atgaaaaact actggaggca gctgctgaac 3420
gccaagctga tcacccagag gaagttcgac aacctgacca aggccgagag gggcggcctg 3480
agcgagctgg acaaggccgg cttcattaaa aggcagctgg tggagaccag gcagatcacc 3540
aagcacgtgg cccagatcct ggacagcagg atgaacacca agtacgacga gaacgacaag 3600
ctgatcaggg aggtgaaggt gatcaccctg aagagcaagc tggtgagcga cttcaggaag 3660
gacttccagt tctacaaggt gagggagatc aataattacc accacgccca cgacgcctac 3720
ctgaacgccg tggtgggcac cgccctgatt aaaaagtacc cgaagctgga gagcgagttc 3780
gtgtacggcg actacaaggt gtacgacgtg aggaagatga tcgccaagag cgagcaggag 3840
atcggcaagg ccaccgccaa gtacttcttc tacagcaaca tcatgaactt cttcaagacc 3900
gagatcaccc tggccaacgg cgagatcagg aagaggccgc tgatcgagac caacggcgag 3960
accggcgaga tcgtgtggga caagggcagg gacttcgcca ccgtgaggaa ggtgctgtcc 4020
atgccgcagg tgaacatcgt gaagaagacc gaggtgcaga ccggcggctt cagcaaggag 4080
agcatcctgc cgaagaggaa cagcgacaag ctgatcgcca ggaagaagga ctgggatccg 4140
aagaagtacg gcggcttcga cagcccgacc gtggcctaca gcgtgctggt ggtggccaag 4200
gtggagaagg gcaagagcaa gaagctgaag agcgtgaagg agctggtggg catcaccatc 4260
atggagagga gcagcttcga gaagaaccca gtggacttcc tggaggccaa gggctacaag 4320
gaggtgaaga aggacctgat cattaaactg ccgaagtaca gcctgttcga gctggagaac 4380
ggcaggaaga ggatgctggc cagcgccggc gagctgcaga agggcaacga gctggccctg 4440
ccgagcaagt acgtgaactt cctgtacctg gccagccact acgagaagct gaagggcagc 4500
ccggaggaca acgagcagaa gcagctgttc gtggagcagc acaagcacta cctggacgag 4560
atcatcgagc agatcagcga gttcagcaag agggtgatcc tggccgacgc caacctggac 4620
aaggtgctga gcgcctacaa caagcacagg gacaagccga tcagggagca ggccgagaac 4680
atcatccacc tgttcaccct gaccaacctg ggcgccccgg ccgccttcaa gtacttcgac 4740
accaccatcg acaggaagag gtacaccagc accaaggagg tgctggacgc caccctgatc 4800
caccagagca tcaccggcct gtacgagacc aggatcgacc tgagccagct gggcggcgac 4860
agcagcccgc cgaagaagaa gaggaaggtg agctggaagg acgccagcgg ctggagcagg 4920
atgaccaggg actccggcgg cagcaccaac ctctccgaca tcatcgagaa ggagacgggc 4980
aagcagctcg tgatccagga gagcatcctc atgctgccgg aggaggtgga ggaggtcatc 5040
ggcaacaagc ccgagtccga catcctcgtg cacacggcct acgacgagtc caccgacgag 5100
aacgtcatgc tcctgacctc ggacgctccc gagtacaagc catgggccct cgtgatccag 5160
gacagcaacg gcgagaacaa gatcaagatg ctctccggcg gcagcccgaa gaagaagcgc 5220
aaagtctga 5229
<210> 21
<211> 1742
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 21
Met Pro Lys Lys Lys Arg Lys Val Ser Ser Glu Thr Gly Pro Val Ala
1 5 10 15
Val Asp Pro Thr Leu Arg Arg Arg Ile Glu Pro His Glu Phe Glu Val
20 25 30
Phe Phe Asp Pro Arg Glu Leu Arg Lys Glu Thr Cys Leu Leu Tyr Glu
35 40 45
Ile Asn Trp Gly Gly Arg His Ser Ile Trp Arg His Thr Ser Gln Asn
50 55 60
Thr Asn Lys His Val Glu Val Asn Phe Ile Glu Lys Phe Thr Thr Glu
65 70 75 80
Arg Tyr Phe Cys Pro Asn Thr Arg Cys Ser Ile Thr Trp Phe Leu Ser
85 90 95
Trp Ser Pro Cys Gly Glu Cys Ser Arg Ala Ile Thr Glu Phe Leu Ser
100 105 110
Arg Tyr Pro His Val Thr Leu Phe Ile Tyr Ile Ala Arg Leu Tyr His
115 120 125
His Ala Asp Pro Arg Asn Arg Gln Gly Leu Arg Asp Leu Ile Ser Ser
130 135 140
Gly Val Thr Ile Gln Ile Met Thr Glu Gln Glu Ser Gly Tyr Cys Trp
145 150 155 160
Arg Asn Phe Val Asn Tyr Ser Pro Ser Asn Glu Ala His Trp Pro Arg
165 170 175
Tyr Pro His Leu Trp Val Arg Leu Tyr Val Leu Glu Leu Tyr Cys Ile
180 185 190
Ile Leu Gly Leu Pro Pro Cys Leu Asn Ile Leu Arg Arg Lys Gln Pro
195 200 205
Gln Leu Thr Phe Phe Thr Ile Ala Leu Gln Ser Cys His Tyr Gln Arg
210 215 220
Leu Pro Pro His Ile Leu Trp Ala Thr Gly Leu Lys Ser Gly Ser Glu
225 230 235 240
Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Leu Lys Asp Lys Lys
245 250 255
Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val
260 265 270
Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly
275 280 285
Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu
290 295 300
Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala
305 310 315 320
Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu
325 330 335
Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe Phe His Arg
340 345 350
Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His Glu Arg His
355 360 365
Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr
370 375 380
Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys
385 390 395 400
Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe
405 410 415
Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp
420 425 430
Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe
435 440 445
Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu
450 455 460
Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln
465 470 475 480
Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu
485 490 495
Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu
500 505 510
Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp
515 520 525
Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala
530 535 540
Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val
545 550 555 560
Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg
565 570 575
Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg
580 585 590
Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys
595 600 605
Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe
610 615 620
Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu
625 630 635 640
Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr
645 650 655
Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly Glu Leu His
660 665 670
Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn
675 680 685
Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val
690 695 700
Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys
705 710 715 720
Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys
725 730 735
Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys
740 745 750
Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu
755 760 765
Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu
770 775 780
Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile
785 790 795 800
Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu
805 810 815
Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile
820 825 830
Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp
835 840 845
Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn
850 855 860
Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu Phe Glu Asp
865 870 875 880
Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His Leu Phe Asp
885 890 895
Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly
900 905 910
Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly
915 920 925
Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn
930 935 940
Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile
945 950 955 960
Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His Glu His Ile
965 970 975
Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr
980 985 990
Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg His Lys Pro
995 1000 1005
Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr Thr Gln
1010 1015 1020
Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu Glu
1025 1030 1035
Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val
1040 1045 1050
Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
1055 1060 1065
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn
1070 1075 1080
Arg Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe
1085 1090 1095
Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp
1100 1105 1110
Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val
1115 1120 1125
Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu
1130 1135 1140
Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly
1145 1150 1155
Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu
1160 1165 1170
Val Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp
1175 1180 1185
Ser Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg
1190 1195 1200
Glu Val Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp Phe
1205 1210 1215
Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn Tyr
1220 1225 1230
His His Ala His Asp Ala Tyr Leu Asn Ala Val Val Gly Thr Ala
1235 1240 1245
Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val Tyr Gly
1250 1255 1260
Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys Ser Glu
1265 1270 1275
Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn
1280 1285 1290
Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu
1295 1300 1305
Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu
1310 1315 1320
Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val
1325 1330 1335
Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln
1340 1345 1350
Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser
1355 1360 1365
Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr
1370 1375 1380
Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu Val Val
1385 1390 1395
Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser Val Lys
1400 1405 1410
Glu Leu Val Gly Ile Thr Ile Met Glu Arg Ser Ser Phe Glu Lys
1415 1420 1425
Asn Pro Val Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val Lys
1430 1435 1440
Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu
1445 1450 1455
Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu Leu Gln
1460 1465 1470
Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe Leu
1475 1480 1485
Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro Glu Asp
1490 1495 1500
Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His Tyr Leu
1505 1510 1515
Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val Ile
1520 1525 1530
Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys
1535 1540 1545
His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His
1550 1555 1560
Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr
1565 1570 1575
Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu
1580 1585 1590
Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr
1595 1600 1605
Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp Ser Ser Pro
1610 1615 1620
Pro Lys Lys Lys Arg Lys Val Ser Trp Lys Asp Ala Ser Gly Trp
1625 1630 1635
Ser Arg Met Thr Arg Asp Ser Gly Gly Ser Thr Asn Leu Ser Asp
1640 1645 1650
Ile Ile Glu Lys Glu Thr Gly Lys Gln Leu Val Ile Gln Glu Ser
1655 1660 1665
Ile Leu Met Leu Pro Glu Glu Val Glu Glu Val Ile Gly Asn Lys
1670 1675 1680
Pro Glu Ser Asp Ile Leu Val His Thr Ala Tyr Asp Glu Ser Thr
1685 1690 1695
Asp Glu Asn Val Met Leu Leu Thr Ser Asp Ala Pro Glu Tyr Lys
1700 1705 1710
Pro Trp Ala Leu Val Ile Gln Asp Ser Asn Gly Glu Asn Lys Ile
1715 1720 1725
Lys Met Leu Ser Gly Gly Ser Pro Lys Lys Lys Arg Lys Val
1730 1735 1740
<210> 22
<211> 1316
<212> PRT
<213> Acidaminococcus fermentans
<400> 22
Met Thr Gln Phe Glu Gly Phe Thr Asn Leu Tyr Gln Val Ser Lys Thr
1 5 10 15
Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Lys His Ile Gln
20 25 30
Glu Gln Gly Phe Ile Glu Glu Asp Lys Ala Arg Asn Asp His Tyr Lys
35 40 45
Glu Leu Lys Pro Ile Ile Asp Arg Ile Tyr Lys Thr Tyr Ala Asp Gln
50 55 60
Cys Leu Gln Leu Val Gln Leu Asp Trp Glu Asn Leu Ser Ala Ala Ile
65 70 75 80
Asp Ser Tyr Arg Lys Glu Lys Thr Glu Glu Thr Arg Asn Ala Leu Ile
85 90 95
Glu Glu Gln Ala Thr Tyr Arg Asn Ala Ile His Asp Tyr Phe Ile Gly
100 105 110
Arg Thr Asp Asn Leu Thr Asp Ala Ile Asn Lys Arg His Ala Glu Ile
115 120 125
Tyr Lys Gly Leu Phe Lys Ala Glu Leu Phe Asn Gly Lys Val Leu Lys
130 135 140
Gln Leu Gly Thr Val Thr Thr Thr Glu His Glu Asn Ala Leu Leu Arg
145 150 155 160
Ser Phe Asp Lys Phe Thr Thr Tyr Phe Ser Gly Phe Tyr Glu Asn Arg
165 170 175
Lys Asn Val Phe Ser Ala Glu Asp Ile Ser Thr Ala Ile Pro His Arg
180 185 190
Ile Val Gln Asp Asn Phe Pro Lys Phe Lys Glu Asn Cys His Ile Phe
195 200 205
Thr Arg Leu Ile Thr Ala Val Pro Ser Leu Arg Glu His Phe Glu Asn
210 215 220
Val Lys Lys Ala Ile Gly Ile Phe Val Ser Thr Ser Ile Glu Glu Val
225 230 235 240
Phe Ser Phe Pro Phe Tyr Asn Gln Leu Leu Thr Gln Thr Gln Ile Asp
245 250 255
Leu Tyr Asn Gln Leu Leu Gly Gly Ile Ser Arg Glu Ala Gly Thr Glu
260 265 270
Lys Ile Lys Gly Leu Asn Glu Val Leu Asn Leu Ala Ile Gln Lys Asn
275 280 285
Asp Glu Thr Ala His Ile Ile Ala Ser Leu Pro His Arg Phe Ile Pro
290 295 300
Leu Phe Lys Gln Ile Leu Ser Asp Arg Asn Thr Leu Ser Phe Ile Leu
305 310 315 320
Glu Glu Phe Lys Ser Asp Glu Glu Val Ile Gln Ser Phe Cys Lys Tyr
325 330 335
Lys Thr Leu Leu Arg Asn Glu Asn Val Leu Glu Thr Ala Glu Ala Leu
340 345 350
Phe Asn Glu Leu Asn Ser Ile Asp Leu Thr His Ile Phe Ile Ser His
355 360 365
Lys Lys Leu Glu Thr Ile Ser Ser Ala Leu Cys Asp His Trp Asp Thr
370 375 380
Leu Arg Asn Ala Leu Tyr Glu Arg Arg Ile Ser Glu Leu Thr Gly Lys
385 390 395 400
Ile Thr Lys Ser Ala Lys Glu Lys Val Gln Arg Ser Leu Lys His Glu
405 410 415
Asp Ile Asn Leu Gln Glu Ile Ile Ser Ala Ala Gly Lys Glu Leu Ser
420 425 430
Glu Ala Phe Lys Gln Lys Thr Ser Glu Ile Leu Ser His Ala His Ala
435 440 445
Ala Leu Asp Gln Pro Leu Pro Thr Thr Leu Lys Lys Gln Glu Glu Lys
450 455 460
Glu Ile Leu Lys Ser Gln Leu Asp Ser Leu Leu Gly Leu Tyr His Leu
465 470 475 480
Leu Asp Trp Phe Ala Val Asp Glu Ser Asn Glu Val Asp Pro Glu Phe
485 490 495
Ser Ala Arg Leu Thr Gly Ile Lys Leu Glu Met Glu Pro Ser Leu Ser
500 505 510
Phe Tyr Asn Lys Ala Arg Asn Tyr Ala Thr Lys Lys Pro Tyr Ser Val
515 520 525
Glu Lys Phe Lys Leu Asn Phe Gln Met Pro Thr Leu Ala Ser Gly Trp
530 535 540
Asp Val Asn Lys Glu Lys Asn Asn Gly Ala Ile Leu Phe Val Lys Asn
545 550 555 560
Gly Leu Tyr Tyr Leu Gly Ile Met Pro Lys Gln Lys Gly Arg Tyr Lys
565 570 575
Ala Leu Ser Phe Glu Pro Thr Glu Lys Thr Ser Glu Gly Phe Asp Lys
580 585 590
Met Tyr Tyr Asp Tyr Phe Pro Asp Ala Ala Lys Met Ile Pro Lys Cys
595 600 605
Ser Thr Gln Leu Lys Ala Val Thr Ala His Phe Gln Thr His Thr Thr
610 615 620
Pro Ile Leu Leu Ser Asn Asn Phe Ile Glu Pro Leu Glu Ile Thr Lys
625 630 635 640
Glu Ile Tyr Asp Leu Asn Asn Pro Glu Lys Glu Pro Lys Lys Phe Gln
645 650 655
Thr Ala Tyr Ala Lys Lys Thr Gly Asp Gln Lys Gly Tyr Arg Glu Ala
660 665 670
Leu Cys Lys Trp Ile Asp Phe Thr Arg Asp Phe Leu Ser Lys Tyr Thr
675 680 685
Lys Thr Thr Ser Ile Asp Leu Ser Ser Leu Arg Pro Ser Ser Gln Tyr
690 695 700
Lys Asp Leu Gly Glu Tyr Tyr Ala Glu Leu Asn Pro Leu Leu Tyr His
705 710 715 720
Ile Ser Phe Gln Arg Ile Ala Glu Lys Glu Ile Met Asp Ala Val Glu
725 730 735
Thr Gly Lys Leu Tyr Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ala Lys
740 745 750
Gly His His Gly Lys Pro Asn Leu His Thr Leu Tyr Trp Thr Gly Leu
755 760 765
Phe Ser Pro Glu Asn Leu Ala Lys Thr Ser Ile Lys Leu Asn Gly Gln
770 775 780
Ala Glu Leu Phe Tyr Arg Pro Lys Ser Arg Met Lys Arg Met Ala His
785 790 795 800
Arg Leu Gly Glu Lys Met Leu Asn Lys Lys Leu Lys Asp Gln Lys Thr
805 810 815
Pro Ile Pro Asp Thr Leu Tyr Gln Glu Leu Tyr Asp Tyr Val Asn His
820 825 830
Arg Leu Ser His Asp Leu Ser Asp Glu Ala Arg Ala Leu Leu Pro Asn
835 840 845
Val Ile Thr Lys Glu Val Ser His Glu Ile Ile Lys Asp Arg Arg Phe
850 855 860
Thr Ser Asp Lys Phe Phe Phe His Val Pro Ile Thr Leu Asn Tyr Gln
865 870 875 880
Ala Ala Asn Ser Pro Ser Lys Phe Asn Gln Arg Val Asn Ala Tyr Leu
885 890 895
Lys Glu His Pro Glu Thr Pro Ile Ile Gly Ile Ala Arg Gly Glu Arg
900 905 910
Asn Leu Ile Tyr Ile Thr Val Ile Asp Ser Thr Gly Lys Ile Leu Glu
915 920 925
Gln Arg Ser Leu Asn Thr Ile Gln Gln Phe Asp Tyr Gln Lys Lys Leu
930 935 940
Asp Asn Arg Glu Lys Glu Arg Val Ala Ala Arg Gln Ala Trp Ser Val
945 950 955 960
Val Gly Thr Ile Lys Asp Leu Lys Gln Gly Tyr Leu Ser Gln Val Ile
965 970 975
His Glu Ile Val Asp Leu Met Ile His Tyr Gln Ala Val Val Val Leu
980 985 990
Ala Asn Leu Asn Phe Gly Phe Lys Ser Lys Arg Thr Gly Ile Ala Glu
995 1000 1005
Lys Ala Val Tyr Gln Gln Phe Glu Lys Met Leu Ile Asp Lys Leu
1010 1015 1020
Asn Cys Leu Val Leu Lys Asp Tyr Pro Ala Glu Lys Val Gly Gly
1025 1030 1035
Val Leu Asn Pro Tyr Gln Leu Thr Asp Gln Phe Thr Ser Phe Ala
1040 1045 1050
Lys Met Gly Thr Gln Ser Gly Phe Leu Phe Tyr Val Pro Ala Pro
1055 1060 1065
Tyr Thr Ser Lys Ile Asp Pro Leu Thr Gly Phe Val Asp Pro Phe
1070 1075 1080
Val Trp Lys Thr Ile Lys Asn His Glu Ser Arg Lys His Phe Leu
1085 1090 1095
Glu Gly Phe Asp Phe Leu His Tyr Asp Val Lys Thr Gly Asp Phe
1100 1105 1110
Ile Leu His Phe Lys Met Asn Arg Asn Leu Ser Phe Gln Arg Gly
1115 1120 1125
Leu Pro Gly Phe Met Pro Ala Trp Asp Ile Val Phe Glu Lys Asn
1130 1135 1140
Glu Thr Gln Phe Asp Ala Lys Gly Thr Pro Phe Ile Ala Gly Lys
1145 1150 1155
Arg Ile Val Pro Val Ile Glu Asn His Arg Phe Thr Gly Arg Tyr
1160 1165 1170
Arg Asp Leu Tyr Pro Ala Asn Glu Leu Ile Ala Leu Leu Glu Glu
1175 1180 1185
Lys Gly Ile Val Phe Arg Asp Gly Ser Asn Ile Leu Pro Lys Leu
1190 1195 1200
Leu Glu Asn Asp Asp Ser His Ala Ile Asp Thr Met Val Ala Leu
1205 1210 1215
Ile Arg Ser Val Leu Gln Met Arg Asn Ser Asn Ala Ala Thr Gly
1220 1225 1230
Glu Ala Tyr Ile Asn Ser Pro Val Arg Asp Leu Asn Gly Val Cys
1235 1240 1245
Phe Asp Ser Arg Phe Gln Asn Pro Glu Trp Pro Met Asp Ala Asp
1250 1255 1260
Ala Asn Gly Ala Tyr His Ile Ala Leu Lys Gly Gln Leu Leu Leu
1265 1270 1275
Asn His Leu Lys Glu Ser Lys Asp Leu Lys Leu Gln Asn Gly Ile
1280 1285 1290
Ser Asn Gln Asp Trp Leu Ala Tyr Ile Gln Glu Leu Arg Asn Gly
1295 1300 1305
Ser Pro Lys Lys Lys Arg Lys Val
1310 1315
<210> 23
<211> 4809
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon Optimized
<400> 23
atgccgaaga agaagcgcaa ggtcatgtcc agcgagaccg gccccgtggc ggtggacccc 60
accctgcgca ggcgcatcga gccgcacgag ttcgaggtgt tcttcgaccc cagggagctc 120
cgcaaggaga cctgcctcct gtacgagatc aactggggcg gcaggcactc catctggagg 180
cacacgagcc agaacaccaa caagcacgtc gaggtgaact tcatcgagaa gttcaccacg 240
gagaggtact tctgcccgaa cacgcgctgc tccatcacgt ggttcctctc gtggagccca 300
tgcggcgagt gctccagggc gatcacggag ttcctcagcc gctacccgca cgtgaccctg 360
ttcatctaca tcgctaggct ctaccaccac gcggacccca ggaacaggca gggcctcagg 420
gacctgatct ccagcggcgt cacgatccag atcatgaccg agcaggagtc cggctactgc 480
tggaggaact tcgtgaacta ctccccgagc aacgaggccc actggccccg ctacccgcac 540
ctctgggtcc gcctctacgt gctcgagctg tactgcatca tcctcggcct gccgccctgc 600
ctcaacatcc tgaggcgcaa gcagccccag ctgacgttct tcaccatcgc cctgcagagc 660
tgccactacc agaggctccc gccccacatc ctgtgggcga ccgggctcaa ggggggcggg 720
ggctcaggcg ggggcgggag cggcggcggg ggctctgggg gcggcggcag cggcgggggc 780
ggcagcgggg gcggcgggtc gatgagcaag ctggagaagt tcacgaactg ctactccctc 840
agcaagaccc tgaggttcaa ggcgatcccg gtcggcaaga cccaggagaa catcgacaac 900
aagcggctgc tggtggagga cgagaagagg gctgaggact acaagggcgt gaagaagctc 960
ctggaccgct actacctgtc cttcatcaac gacgtgctcc acagcatcaa gctcaagaac 1020
ctgaacaact acatcagcct cttcaggaag aagacgcgca ccgagaagga gaacaaggag 1080
ctcgagaacc tggagatcaa cctgaggaag gagatcgcca aggcgttcaa gggcaacgag 1140
ggctacaagt ccctcttcaa gaaggacatc atcgagacga tcctcccgga gttcctggac 1200
gacaaggacg agatcgccct ggtcaactcc ttcaacggct tcaccacggc gttcaccggc 1260
ttcttcgaca accgcgagaa catgttcagc gaggaggcca agtccacgag catcgcgttc 1320
aggtgcatca acgagaacct cacccgctac atctccaaca tggacatctt cgagaaggtc 1380
gacgcgatct tcgacaagca cgaggtgcag gagatcaagg agaagatcct gaacagcgac 1440
tacgacgtcg aggacttctt cgagggcgag ttcttcaact tcgtcctcac gcaggagggc 1500
atcgacgtgt acaacgccat catcggtggc ttcgtgaccg agtccggcga gaagatcaag 1560
ggcctgaacg agtacatcaa cctctacaac cagaagacca agcagaagct gccgaagttc 1620
aagcccctgt acaagcaggt gctctccgac agggagtccc tcagcttcta cggcgagggc 1680
tacacgagcg acgaggaggt cctggaggtg ttccgcaaca ccctcaacaa gaacagcgag 1740
atcttctcca gcatcaagaa gctcgagaag ctgttcaaga acttcgacga gtactccagc 1800
gccggcatct tcgtcaagaa cggcccggcg atctccacga tcagcaagga catcttcggc 1860
gagtggaacg tgatccgcga caagtggaac gccgagtacg acgacatcca cctcaagaag 1920
aaggcggtgg tcaccgagaa gtacgaggac gacaggcgca agtccttcaa gaagatcggc 1980
tccttcagcc tcgagcagct gcaggagtac gccgacgcgg acctgagcgt ggtcgagaag 2040
ctcaaggaga tcatcatcca gaaggtcgac gagatctaca aggtgtacgg ctccagcgag 2100
aagctcttcg acgcggactt cgtcctcgag aagtccctga agaagaacga cgccgtggtc 2160
gcgatcatga aggacctcct ggactccgtg aagagcttcg agaattacat caaggccttc 2220
ttcggcgagg gcaaggagac gaacagggac gagtccttct acggcgactt cgtcctggcc 2280
tacgacatcc tcctgaaggt ggaccacatc tacgacgcga tccgcaacta cgtgacccag 2340
aagccgtaca gcaaggacaa gttcaagctc tacttccaga acccccagtt catgggcggc 2400
tgggacaagg acaaggagac ggactacagg gcgaccatcc tgcgctacgg cagcaagtac 2460
tacctcgcca tcatggacaa gaagtacgcg aagtgcctgc agaagatcga caaggacgac 2520
gtcaacggca actacgagaa gatcaactac aagctcctgc cgggccccaa caagatgctc 2580
ccgaaggtgt tcttctccaa gaagtggatg gcctactaca accccagcga ggacatccag 2640
aagatctaca agaacggcac gttcaagaag ggcgacatgt tcaacctgaa cgactgccac 2700
aagctcatcg acttcttcaa ggactccatc agccgctacc cgaagtggtc caacgcctac 2760
gacttcaact tcagcgagac cgagaagtac aaggacatcg cgggcttcta ccgcgaggtc 2820
gaggagcagg gctacaaggt gtccttcgag tccgccagca agaaggaggt cgacaagctg 2880
gtggaggagg gcaagctcta catgttccag atctacaaca aggacttctc cgacaagagc 2940
cacggcacgc ccaacctgca caccatgtac ttcaagctcc tgttcgacga gaacaaccac 3000
ggccagatca ggctgtccgg cggcgccgag ctcttcatga ggagggcgag cctgaagaag 3060
gaggagctgg tggtccaccc cgctaacagc ccaatcgcga acaagaaccc ggacaacccc 3120
aagaagacca cgaccctgtc ctacgacgtg tacaaggaca agaggttcag cgaggaccag 3180
tacgagctcc acatcccgat cgcgatcaac aagtgcccca agaacatctt caagatcaac 3240
accgaggtcc gcgtgctcct gaagcacgac gacaacccct acgtgatcgg catcgctagg 3300
ggcgagagga acctcctgta catcgtggtc gtggacggca agggcaacat cgtggagcag 3360
tactccctca acgagatcat caacaacttc aacggcatca ggatcaagac ggactaccac 3420
agcctcctgg acaagaagga gaaggagagg ttcgaggccc gccagaactg gacctccatc 3480
gagaacatca aggagctgaa ggcgggctac atcagccagg tcgtgcacaa gatctgcgag 3540
ctcgtcgaga agtacgacgc cgtgatcgcc ctcgcggacc tgaactccgg cttcaagaac 3600
agccgcgtca aggtggagaa gcaggtctac cagaagttcg agaagatgct catcgacaag 3660
ctgaactaca tggtggacaa gaagtccaac ccctgcgcta cgggcggcgc gctgaagggc 3720
taccagatca ccaacaagtt cgagagcttc aagtccatga gcactcagaa cggcttcatc 3780
ttctacatcc cggcgtggct cacgtccaag atcgacccca gcaccggctt cgtcaacctc 3840
ctgaagacga agtacacctc catcgccgac agcaagaagt tcatctccag cttcgaccgc 3900
atcatgtatg tgccggagga ggacctgttc gagttcgccc tcgactacaa gaacttctcc 3960
cgcacggacg cggactacat caagaagtgg aagctgtaca gctacggcaa ccgcatccgc 4020
atcttcagga accccaagaa gaacaacgtc ttcgactggg aggaggtgtg cctgacctcc 4080
gcgtacaagg agctcttcaa caagtacggc atcaactacc agcagggcga catcagggct 4140
ctcctgtgcg agcagagcga caaggccttc tactccagct tcatggcgct gatgtccctc 4200
atgctgcaga tgaggaactc gatcaccggc aggacggacg tggccttcct catctccccg 4260
gtgaagaaca gcgacggcat cttctacgac tccaggaact acgaggccca ggagaacgcg 4320
atcctcccaa agaacgcgga cgccaacggc gcctacaaca tcgccaggaa ggtcctctgg 4380
gctatcggcc agttcaagaa ggcggaggac gagaagctgg acaaggtgaa gatcgccatc 4440
agcaacaagg agtggctcga gtacgcccag acctcggtca agcacggcag cccgaagaag 4500
aagcgcaagg tgtccggcgg cagcacgaac ctgtccgaca tcatcgagaa ggagaccggc 4560
aagcagctcg tgatccagga gagcatcctc atgctgccgg aggaggtcga ggaggtcatc 4620
ggcaacaagc ccgagtccga catcctcgtc cacacggcct acgacgagtc caccgacgag 4680
aacgtgatgc tcctgacctc ggacgctccc gagtacaagc catgggccct ggtcatccag 4740
gacagcaacg gcgagaacaa gatcaagatg ctctccggcg gcagcccgaa gaagaagcgc 4800
aaagtgtga 4809
<210> 24
<211> 1602
<212> PRT
<213> Artificial Sequence
<220>
<223> Fusion Protein
<400> 24
Met Pro Lys Lys Lys Arg Lys Val Met Ser Ser Glu Thr Gly Pro Val
1 5 10 15
Ala Val Asp Pro Thr Leu Arg Arg Arg Ile Glu Pro His Glu Phe Glu
20 25 30
Val Phe Phe Asp Pro Arg Glu Leu Arg Lys Glu Thr Cys Leu Leu Tyr
35 40 45
Glu Ile Asn Trp Gly Gly Arg His Ser Ile Trp Arg His Thr Ser Gln
50 55 60
Asn Thr Asn Lys His Val Glu Val Asn Phe Ile Glu Lys Phe Thr Thr
65 70 75 80
Glu Arg Tyr Phe Cys Pro Asn Thr Arg Cys Ser Ile Thr Trp Phe Leu
85 90 95
Ser Trp Ser Pro Cys Gly Glu Cys Ser Arg Ala Ile Thr Glu Phe Leu
100 105 110
Ser Arg Tyr Pro His Val Thr Leu Phe Ile Tyr Ile Ala Arg Leu Tyr
115 120 125
His His Ala Asp Pro Arg Asn Arg Gln Gly Leu Arg Asp Leu Ile Ser
130 135 140
Ser Gly Val Thr Ile Gln Ile Met Thr Glu Gln Glu Ser Gly Tyr Cys
145 150 155 160
Trp Arg Asn Phe Val Asn Tyr Ser Pro Ser Asn Glu Ala His Trp Pro
165 170 175
Arg Tyr Pro His Leu Trp Val Arg Leu Tyr Val Leu Glu Leu Tyr Cys
180 185 190
Ile Ile Leu Gly Leu Pro Pro Cys Leu Asn Ile Leu Arg Arg Lys Gln
195 200 205
Pro Gln Leu Thr Phe Phe Thr Ile Ala Leu Gln Ser Cys His Tyr Gln
210 215 220
Arg Leu Pro Pro His Ile Leu Trp Ala Thr Gly Leu Lys Gly Gly Gly
225 230 235 240
Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly
245 250 255
Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Met Ser Lys Leu Glu
260 265 270
Lys Phe Thr Asn Cys Tyr Ser Leu Ser Lys Thr Leu Arg Phe Lys Ala
275 280 285
Ile Pro Val Gly Lys Thr Gln Glu Asn Ile Asp Asn Lys Arg Leu Leu
290 295 300
Val Glu Asp Glu Lys Arg Ala Glu Asp Tyr Lys Gly Val Lys Lys Leu
305 310 315 320
Leu Asp Arg Tyr Tyr Leu Ser Phe Ile Asn Asp Val Leu His Ser Ile
325 330 335
Lys Leu Lys Asn Leu Asn Asn Tyr Ile Ser Leu Phe Arg Lys Lys Thr
340 345 350
Arg Thr Glu Lys Glu Asn Lys Glu Leu Glu Asn Leu Glu Ile Asn Leu
355 360 365
Arg Lys Glu Ile Ala Lys Ala Phe Lys Gly Asn Glu Gly Tyr Lys Ser
370 375 380
Leu Phe Lys Lys Asp Ile Ile Glu Thr Ile Leu Pro Glu Phe Leu Asp
385 390 395 400
Asp Lys Asp Glu Ile Ala Leu Val Asn Ser Phe Asn Gly Phe Thr Thr
405 410 415
Ala Phe Thr Gly Phe Phe Asp Asn Arg Glu Asn Met Phe Ser Glu Glu
420 425 430
Ala Lys Ser Thr Ser Ile Ala Phe Arg Cys Ile Asn Glu Asn Leu Thr
435 440 445
Arg Tyr Ile Ser Asn Met Asp Ile Phe Glu Lys Val Asp Ala Ile Phe
450 455 460
Asp Lys His Glu Val Gln Glu Ile Lys Glu Lys Ile Leu Asn Ser Asp
465 470 475 480
Tyr Asp Val Glu Asp Phe Phe Glu Gly Glu Phe Phe Asn Phe Val Leu
485 490 495
Thr Gln Glu Gly Ile Asp Val Tyr Asn Ala Ile Ile Gly Gly Phe Val
500 505 510
Thr Glu Ser Gly Glu Lys Ile Lys Gly Leu Asn Glu Tyr Ile Asn Leu
515 520 525
Tyr Asn Gln Lys Thr Lys Gln Lys Leu Pro Lys Phe Lys Pro Leu Tyr
530 535 540
Lys Gln Val Leu Ser Asp Arg Glu Ser Leu Ser Phe Tyr Gly Glu Gly
545 550 555 560
Tyr Thr Ser Asp Glu Glu Val Leu Glu Val Phe Arg Asn Thr Leu Asn
565 570 575
Lys Asn Ser Glu Ile Phe Ser Ser Ile Lys Lys Leu Glu Lys Leu Phe
580 585 590
Lys Asn Phe Asp Glu Tyr Ser Ser Ala Gly Ile Phe Val Lys Asn Gly
595 600 605
Pro Ala Ile Ser Thr Ile Ser Lys Asp Ile Phe Gly Glu Trp Asn Val
610 615 620
Ile Arg Asp Lys Trp Asn Ala Glu Tyr Asp Asp Ile His Leu Lys Lys
625 630 635 640
Lys Ala Val Val Thr Glu Lys Tyr Glu Asp Asp Arg Arg Lys Ser Phe
645 650 655
Lys Lys Ile Gly Ser Phe Ser Leu Glu Gln Leu Gln Glu Tyr Ala Asp
660 665 670
Ala Asp Leu Ser Val Val Glu Lys Leu Lys Glu Ile Ile Ile Gln Lys
675 680 685
Val Asp Glu Ile Tyr Lys Val Tyr Gly Ser Ser Glu Lys Leu Phe Asp
690 695 700
Ala Asp Phe Val Leu Glu Lys Ser Leu Lys Lys Asn Asp Ala Val Val
705 710 715 720
Ala Ile Met Lys Asp Leu Leu Asp Ser Val Lys Ser Phe Glu Asn Tyr
725 730 735
Ile Lys Ala Phe Phe Gly Glu Gly Lys Glu Thr Asn Arg Asp Glu Ser
740 745 750
Phe Tyr Gly Asp Phe Val Leu Ala Tyr Asp Ile Leu Leu Lys Val Asp
755 760 765
His Ile Tyr Asp Ala Ile Arg Asn Tyr Val Thr Gln Lys Pro Tyr Ser
770 775 780
Lys Asp Lys Phe Lys Leu Tyr Phe Gln Asn Pro Gln Phe Met Gly Gly
785 790 795 800
Trp Asp Lys Asp Lys Glu Thr Asp Tyr Arg Ala Thr Ile Leu Arg Tyr
805 810 815
Gly Ser Lys Tyr Tyr Leu Ala Ile Met Asp Lys Lys Tyr Ala Lys Cys
820 825 830
Leu Gln Lys Ile Asp Lys Asp Asp Val Asn Gly Asn Tyr Glu Lys Ile
835 840 845
Asn Tyr Lys Leu Leu Pro Gly Pro Asn Lys Met Leu Pro Lys Val Phe
850 855 860
Phe Ser Lys Lys Trp Met Ala Tyr Tyr Asn Pro Ser Glu Asp Ile Gln
865 870 875 880
Lys Ile Tyr Lys Asn Gly Thr Phe Lys Lys Gly Asp Met Phe Asn Leu
885 890 895
Asn Asp Cys His Lys Leu Ile Asp Phe Phe Lys Asp Ser Ile Ser Arg
900 905 910
Tyr Pro Lys Trp Ser Asn Ala Tyr Asp Phe Asn Phe Ser Glu Thr Glu
915 920 925
Lys Tyr Lys Asp Ile Ala Gly Phe Tyr Arg Glu Val Glu Glu Gln Gly
930 935 940
Tyr Lys Val Ser Phe Glu Ser Ala Ser Lys Lys Glu Val Asp Lys Leu
945 950 955 960
Val Glu Glu Gly Lys Leu Tyr Met Phe Gln Ile Tyr Asn Lys Asp Phe
965 970 975
Ser Asp Lys Ser His Gly Thr Pro Asn Leu His Thr Met Tyr Phe Lys
980 985 990
Leu Leu Phe Asp Glu Asn Asn His Gly Gln Ile Arg Leu Ser Gly Gly
995 1000 1005
Ala Glu Leu Phe Met Arg Arg Ala Ser Leu Lys Lys Glu Glu Leu
1010 1015 1020
Val Val His Pro Ala Asn Ser Pro Ile Ala Asn Lys Asn Pro Asp
1025 1030 1035
Asn Pro Lys Lys Thr Thr Thr Leu Ser Tyr Asp Val Tyr Lys Asp
1040 1045 1050
Lys Arg Phe Ser Glu Asp Gln Tyr Glu Leu His Ile Pro Ile Ala
1055 1060 1065
Ile Asn Lys Cys Pro Lys Asn Ile Phe Lys Ile Asn Thr Glu Val
1070 1075 1080
Arg Val Leu Leu Lys His Asp Asp Asn Pro Tyr Val Ile Gly Ile
1085 1090 1095
Ala Arg Gly Glu Arg Asn Leu Leu Tyr Ile Val Val Val Asp Gly
1100 1105 1110
Lys Gly Asn Ile Val Glu Gln Tyr Ser Leu Asn Glu Ile Ile Asn
1115 1120 1125
Asn Phe Asn Gly Ile Arg Ile Lys Thr Asp Tyr His Ser Leu Leu
1130 1135 1140
Asp Lys Lys Glu Lys Glu Arg Phe Glu Ala Arg Gln Asn Trp Thr
1145 1150 1155
Ser Ile Glu Asn Ile Lys Glu Leu Lys Ala Gly Tyr Ile Ser Gln
1160 1165 1170
Val Val His Lys Ile Cys Glu Leu Val Glu Lys Tyr Asp Ala Val
1175 1180 1185
Ile Ala Leu Ala Asp Leu Asn Ser Gly Phe Lys Asn Ser Arg Val
1190 1195 1200
Lys Val Glu Lys Gln Val Tyr Gln Lys Phe Glu Lys Met Leu Ile
1205 1210 1215
Asp Lys Leu Asn Tyr Met Val Asp Lys Lys Ser Asn Pro Cys Ala
1220 1225 1230
Thr Gly Gly Ala Leu Lys Gly Tyr Gln Ile Thr Asn Lys Phe Glu
1235 1240 1245
Ser Phe Lys Ser Met Ser Thr Gln Asn Gly Phe Ile Phe Tyr Ile
1250 1255 1260
Pro Ala Trp Leu Thr Ser Lys Ile Asp Pro Ser Thr Gly Phe Val
1265 1270 1275
Asn Leu Leu Lys Thr Lys Tyr Thr Ser Ile Ala Asp Ser Lys Lys
1280 1285 1290
Phe Ile Ser Ser Phe Asp Arg Ile Met Tyr Val Pro Glu Glu Asp
1295 1300 1305
Leu Phe Glu Phe Ala Leu Asp Tyr Lys Asn Phe Ser Arg Thr Asp
1310 1315 1320
Ala Asp Tyr Ile Lys Lys Trp Lys Leu Tyr Ser Tyr Gly Asn Arg
1325 1330 1335
Ile Arg Ile Phe Arg Asn Pro Lys Lys Asn Asn Val Phe Asp Trp
1340 1345 1350
Glu Glu Val Cys Leu Thr Ser Ala Tyr Lys Glu Leu Phe Asn Lys
1355 1360 1365
Tyr Gly Ile Asn Tyr Gln Gln Gly Asp Ile Arg Ala Leu Leu Cys
1370 1375 1380
Glu Gln Ser Asp Lys Ala Phe Tyr Ser Ser Phe Met Ala Leu Met
1385 1390 1395
Ser Leu Met Leu Gln Met Arg Asn Ser Ile Thr Gly Arg Thr Asp
1400 1405 1410
Val Ala Phe Leu Ile Ser Pro Val Lys Asn Ser Asp Gly Ile Phe
1415 1420 1425
Tyr Asp Ser Arg Asn Tyr Glu Ala Gln Glu Asn Ala Ile Leu Pro
1430 1435 1440
Lys Asn Ala Asp Ala Asn Gly Ala Tyr Asn Ile Ala Arg Lys Val
1445 1450 1455
Leu Trp Ala Ile Gly Gln Phe Lys Lys Ala Glu Asp Glu Lys Leu
1460 1465 1470
Asp Lys Val Lys Ile Ala Ile Ser Asn Lys Glu Trp Leu Glu Tyr
1475 1480 1485
Ala Gln Thr Ser Val Lys His Gly Ser Pro Lys Lys Lys Arg Lys
1490 1495 1500
Val Ser Gly Gly Ser Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu
1505 1510 1515
Thr Gly Lys Gln Leu Val Ile Gln Glu Ser Ile Leu Met Leu Pro
1520 1525 1530
Glu Glu Val Glu Glu Val Ile Gly Asn Lys Pro Glu Ser Asp Ile
1535 1540 1545
Leu Val His Thr Ala Tyr Asp Glu Ser Thr Asp Glu Asn Val Met
1550 1555 1560
Leu Leu Thr Ser Asp Ala Pro Glu Tyr Lys Pro Trp Ala Leu Val
1565 1570 1575
Ile Gln Asp Ser Asn Gly Glu Asn Lys Ile Lys Met Leu Ser Gly
1580 1585 1590
Gly Ser Pro Lys Lys Lys Arg Lys Val
1595 1600
<210> 25
<211> 1802
<212> DNA
<213> Saccharum officinarum
<400> 25
gaattcatta tgtggtctag gtaggttcta tatataagaa aacttgaaat gttctaaaaa 60
aaaattcaag cccatgcatg attgaagcaa acggtatagc aacggtgtta acctgatcta 120
gtgatctctt gcaatcctta acggccacct accgcaggta gcaaacggcg tccccctcct 180
cgatatctcc gcggcgacct ctggcttttt ccgcggaatt gcgcggtggg gacggattcc 240
acgagaccgc gacgcaaccg cctctcgccg ctgggcccca caccgctcgg tgccgtagcc 300
tcacgggact ctttctccct cctcccccgt tataaattgg cttcatcccc tccttgcctc 360
atccatccaa atcccagtcc ccaatcccat cccttcgtag gagaaattca tcgaagctaa 420
gcgaatcctc gcgatcctct caaggtactg cgagttttcg atccccctct cgacccctcg 480
tatgtttgtg tttgtcgtag cgtttgatta ggtatgcttt ccctgtttgt gttcgtcgta 540
gcgtttgatt aggtatgctt tccctgttcg tgttcatcgt agtgtttgat taggtcgtgt 600
gaggcgatgg cctgctcgcg tccttcgatc tgtagtcgat ttgcgggtcg tggtgtagat 660
ctgcgggctg tgatgaagtt atttggtgtg atctgctcgc ctgattctgc gggttggctc 720
gagtagatat gatggttgga ccggttggtt cgtttaccgc gctagggttg ggctgggatg 780
atgttgcatg cgccgttgcg cgtgatcccg cagcaggact tgcgtttgat tgccagatct 840
cgttacgatt atgtgatttg gtttggactt tttagatctg tagcttctgc ttatgtgcca 900
gatgcgccta ctgctcatat gcctgatgat aatcataaat ggctgtggaa ctaactagtt 960
gattgcggag tcatgtatca gctacaggtg tagggactag ctacaggtgt agggacttgc 1020
gtctaattgt ttggtccttt actcatgttg caattatgca atttagttta gattgtttgt 1080
tccactcatc taggctgtaa aagggacact gcttagattg ctgtttaatc tttttagtag 1140
attatattat attggtaact tattacccct attacatgcc atacgtgact tctgctcatg 1200
cctgatgata atcatagatc actgtggaat taattagttg attgttgaat catgtttcat 1260
gtacatacca cggcacaatt gcttagttcc ttaacaaatg caaattttac tgatccatgt 1320
atgatttgcg tggttctcta atgtgaaata ctatagctac ttgttagtaa gaatcaggtt 1380
cgtatgctta atgctgtatg tgccttctgc tcatgcctga tgataatcat atatcactgg 1440
aattaattag ttgatcgttt aatcatatat caagtacata ccatgccaca atttttagtc 1500
acttaaccca tgcagattga actggtccct gcatgttttg ctaaattgtt ctattctgat 1560
tagaccatat atcatgtatt tttttttggt aatggttctc ttattttaaa tgctatatag 1620
ttctggtact tgttagaaag atctgcttca tagtttagtt gcctatccct cgaattagga 1680
tgctgagcag ctgatcctat agctttgttt catgtatcaa ttcttttgtg ttcaacagtc 1740
agtttttgtt agattcattg taacttatgg tcgcttactc ttctggtcct caatgcttgc 1800
ag 1802
<210> 26
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic
<400> 26
gggaaagacc gaggagaaga tct 23
<210> 27
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 27
aagaccgagg agaagatcta 20
<210> 28
<211> 90
<212> DNA
<213> Zea mays
<400> 28
gtttggggaa agaccgagga gaagatctac gggcctgtcg ctggaacgga ctacagggac 60
aaccagctgc ggttcagcct gctatgccag 90
<210> 29
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 29
agatgggaga cgggtacgag acgg 24
<210> 30
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 30
gtatgggttg ttgttgaggc tcagg 25
<210> 31
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 31
gaccacccac tgttcctgga gaggg 25
<210> 32
<211> 3783
<212> DNA
<213> Artificial Sequence
<220>
<223> Synethic
<400> 32
atggctccta agaagaagcg gaaggttggt attcacgggg tgcctgcggc ttcaaagctc 60
gagaaattca ccaactgtta ttcgttgagc aaaacactgc ggtttaaagc gattccagtc 120
ggcaagactc aagagaatat agacaataag cggctgttgg tggaagatga aaagcgcgcg 180
gaagactaca aaggggtgaa gaagttgttg gacagatact acctctcttt tatcaatgat 240
gtcttgcact caatcaaatt gaagaatctg aacaactaca tctccctctt cagaaagaaa 300
acaaggacag aaaaggagaa taaggaactt gaaaatttgg agatcaatct gaggaaagag 360
atcgcgaaag cctttaaagg caacgaagga tacaaaagtc tgttcaagaa ggatataatt 420
gagacaattt tgccagagtt cctcgatgac aaggacgaga ttgcgctggt caattcgttc 480
aacggattca caacagcatt cacaggcttc tttgataatc gggaaaatat gttctctgag 540
gaggcaaagt ccacttctat tgcgttcagg tgtatcaatg agaatctcac taggtacatt 600
tccaacatgg atatctttga gaaggttgac gcaatttttg acaagcacga agttcaggag 660
attaaggaga agatcctcaa ttccgattat gacgttgagg acttcttcga gggtgagttt 720
tttaatttcg tgctcactca agagggtatc gacgtgtata atgcgatcat cggtgggttc 780
gtgactgagt ccggtgaaaa gattaaggga ttgaacgagt atatcaacct ttacaaccaa 840
aagacgaaac agaagctgcc aaagttcaag cctctttaca aacaggttct ttcagaccgc 900
gagtcactct cgttctatgg ggagggctac acttcggatg aggaagtcct ggaggtgttc 960
aggaatactc tcaataagaa ttcggagatt ttctcttcta taaaaaaact ggaaaagttg 1020
tttaagaatt ttgacgaata ctctagcgcc ggcatatttg tgaaaaacgg cccggccata 1080
tcaacgataa gtaaagatat cttcggcgaa tggaacgtga tcagagacaa atggaacgcg 1140
gagtatgacg atattcacct gaagaagaag gctgtcgtaa cggagaagta cgaggatgat 1200
cgcaggaaaa gcttcaaaaa gatcggaagt ttcagcctgg aacagttgca ggagtatgct 1260
gacgccgatc ttagcgtcgt cgagaagttg aaggagataa tcatccaaaa ggtcgacgag 1320
atatataaag tctatggatc aagtgaaaaa ctgttcgacg ccgacttcgt tttggagaag 1380
tccctgaaga agaacgacgc tgttgttgcc attatgaagg atctgctcga cagcgtgaag 1440
agtttcgaga actatattaa ggcttttttc ggggagggga aggagactaa cagagatgag 1500
tccttctacg gagacttcgt cctcgcgtac gatatactcc ttaaggtaga ccacatctac 1560
gacgcaatca gaaattacgt gacacaaaag ccgtacagca aggacaagtt caaactctac 1620
ttccagaacc cccagttcat gggcggctgg gacaaggaca aggaaacgga ttacagggct 1680
acgatcctga ggtatggttc aaaatactac ttggcgatta tggacaagaa gtacgccaag 1740
tgtctccaga agattgacaa agacgatgtc aatggcaatt atgagaagat caactacaag 1800
ctgcttccgg gtccgaacaa gatgctccca aaggttttct tcagcaagaa atggatggcc 1860
tactataacc caagcgagga catccagaag atttataaga acggtacgtt caagaagggc 1920
gacatgttca atcttaacga ctgtcacaag ctgatcgact tcttcaaaga ctcaattagc 1980
cggtacccaa agtggtctaa cgcctatgac ttcaactttt cggaaaccga gaagtacaag 2040
gatatagccg gattttatag agaggtggaa gagcagggct acaaggtgtc attcgagtcc 2100
gccagcaaga aggaagtgga caagctcgtg gaagagggta agctctacat gttccagatt 2160
tataataaag actttagcga taagagccac gggacaccta atctccacac aatgtatttc 2220
aagctgctct tcgacgagaa taaccacggc caaatcaggt tgtcaggagg ggctgaactc 2280
ttcatgcggc gcgctagcct taagaaggag gagcttgtag tccaccctgc gaatagtcca 2340
attgcgaata agaacccgga caatcctaaa aagactacaa cattgagcta cgacgtgtac 2400
aaggataaga ggttttccga ggatcagtac gagctccaca tcccgattgc gatcaacaag 2460
tgcccaaaga atattttcaa gataaacaca gaggtgcgtg tactcctgaa gcatgacgac 2520
aatccttacg tcattgggat tgatcggggc gagaggaacc tcctctatat tgtggtggtg 2580
gacgggaagg ggaacatagt cgaacagtac tcccttaacg aaataattaa caatttcaac 2640
ggcatccgta tcaagaccga ctaccattcg ttgctggaca agaaggagaa ggagagattt 2700
gaggcgcggc aaaattggac aagtatcgag aacatcaagg aactcaaagc aggttatatc 2760
tctcaagttg tgcataagat atgcgagctg gttgagaagt atgacgcagt gatcgctctt 2820
gaggacctca actcgggctt taagaattct agagttaaag tggagaagca ggtctatcaa 2880
aagttcgaga agatgcttat agataagctc aactacatgg tcgataagaa atcgaaccca 2940
tgtgccaccg gcggcgcact caaaggttac caaataacaa acaaattcga gtccttcaaa 3000
tcgatgagta ctcagaatgg gttcatattt tatataccgg cgtggcttac gtctaagatc 3060
gacccgtcaa ctggttttgt caacctgttg aagacgaaat acacgtccat tgccgattca 3120
aaaaagttca tatctagttt tgatcgtatt atgtacgtcc cagaggaaga tcttttcgag 3180
tttgctctcg actacaaaaa cttttcgcgc accgatgcgg attacattaa aaaatggaaa 3240
ctctattcgt acggcaacag aatcaggatt tttcgcaacc ctaagaagaa taacgtcttt 3300
gattgggagg aagtttgctt gactagcgcg tacaaggagc tctttaataa gtatggcatt 3360
aactaccaac agggtgatat cagagcactg ctttgcgaac aatctgacaa ggctttctac 3420
tcatccttca tggctttgat gagcctgatg ctccagatga gaaattcaat tacaggcaga 3480
accgacgtgg atttcttgat ctccccggtt aaaaattctg atggcatctt ttacgatagc 3540
aggaactatg aagcgcaaga gaatgcgatt ctgccaaaaa atgcagacgc caacggtgcc 3600
tataacatcg ccaggaaagt cctgtgggcg atcggccagt tcaaaaaggc cgaagacgaa 3660
aaattggaca aggtcaaaat cgctatcagc aacaaagagt ggctggagta tgctcagaca 3720
tccgtaaagc ataagcgtcc tgctgccacc aaaaaggccg gacaggctaa gaaaaagaag 3780
tga 3783
<210> 33
<211> 1260
<212> PRT
<213> Artificial Sequence
<220>
<223> Fusion protein
<400> 33
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Ser Lys Leu Glu Lys Phe Thr Asn Cys Tyr Ser Leu Ser Lys Thr
20 25 30
Leu Arg Phe Lys Ala Ile Pro Val Gly Lys Thr Gln Glu Asn Ile Asp
35 40 45
Asn Lys Arg Leu Leu Val Glu Asp Glu Lys Arg Ala Glu Asp Tyr Lys
50 55 60
Gly Val Lys Lys Leu Leu Asp Arg Tyr Tyr Leu Ser Phe Ile Asn Asp
65 70 75 80
Val Leu His Ser Ile Lys Leu Lys Asn Leu Asn Asn Tyr Ile Ser Leu
85 90 95
Phe Arg Lys Lys Thr Arg Thr Glu Lys Glu Asn Lys Glu Leu Glu Asn
100 105 110
Leu Glu Ile Asn Leu Arg Lys Glu Ile Ala Lys Ala Phe Lys Gly Asn
115 120 125
Glu Gly Tyr Lys Ser Leu Phe Lys Lys Asp Ile Ile Glu Thr Ile Leu
130 135 140
Pro Glu Phe Leu Asp Asp Lys Asp Glu Ile Ala Leu Val Asn Ser Phe
145 150 155 160
Asn Gly Phe Thr Thr Ala Phe Thr Gly Phe Phe Asp Asn Arg Glu Asn
165 170 175
Met Phe Ser Glu Glu Ala Lys Ser Thr Ser Ile Ala Phe Arg Cys Ile
180 185 190
Asn Glu Asn Leu Thr Arg Tyr Ile Ser Asn Met Asp Ile Phe Glu Lys
195 200 205
Val Asp Ala Ile Phe Asp Lys His Glu Val Gln Glu Ile Lys Glu Lys
210 215 220
Ile Leu Asn Ser Asp Tyr Asp Val Glu Asp Phe Phe Glu Gly Glu Phe
225 230 235 240
Phe Asn Phe Val Leu Thr Gln Glu Gly Ile Asp Val Tyr Asn Ala Ile
245 250 255
Ile Gly Gly Phe Val Thr Glu Ser Gly Glu Lys Ile Lys Gly Leu Asn
260 265 270
Glu Tyr Ile Asn Leu Tyr Asn Gln Lys Thr Lys Gln Lys Leu Pro Lys
275 280 285
Phe Lys Pro Leu Tyr Lys Gln Val Leu Ser Asp Arg Glu Ser Leu Ser
290 295 300
Phe Tyr Gly Glu Gly Tyr Thr Ser Asp Glu Glu Val Leu Glu Val Phe
305 310 315 320
Arg Asn Thr Leu Asn Lys Asn Ser Glu Ile Phe Ser Ser Ile Lys Lys
325 330 335
Leu Glu Lys Leu Phe Lys Asn Phe Asp Glu Tyr Ser Ser Ala Gly Ile
340 345 350
Phe Val Lys Asn Gly Pro Ala Ile Ser Thr Ile Ser Lys Asp Ile Phe
355 360 365
Gly Glu Trp Asn Val Ile Arg Asp Lys Trp Asn Ala Glu Tyr Asp Asp
370 375 380
Ile His Leu Lys Lys Lys Ala Val Val Thr Glu Lys Tyr Glu Asp Asp
385 390 395 400
Arg Arg Lys Ser Phe Lys Lys Ile Gly Ser Phe Ser Leu Glu Gln Leu
405 410 415
Gln Glu Tyr Ala Asp Ala Asp Leu Ser Val Val Glu Lys Leu Lys Glu
420 425 430
Ile Ile Ile Gln Lys Val Asp Glu Ile Tyr Lys Val Tyr Gly Ser Ser
435 440 445
Glu Lys Leu Phe Asp Ala Asp Phe Val Leu Glu Lys Ser Leu Lys Lys
450 455 460
Asn Asp Ala Val Val Ala Ile Met Lys Asp Leu Leu Asp Ser Val Lys
465 470 475 480
Ser Phe Glu Asn Tyr Ile Lys Ala Phe Phe Gly Glu Gly Lys Glu Thr
485 490 495
Asn Arg Asp Glu Ser Phe Tyr Gly Asp Phe Val Leu Ala Tyr Asp Ile
500 505 510
Leu Leu Lys Val Asp His Ile Tyr Asp Ala Ile Arg Asn Tyr Val Thr
515 520 525
Gln Lys Pro Tyr Ser Lys Asp Lys Phe Lys Leu Tyr Phe Gln Asn Pro
530 535 540
Gln Phe Met Gly Gly Trp Asp Lys Asp Lys Glu Thr Asp Tyr Arg Ala
545 550 555 560
Thr Ile Leu Arg Tyr Gly Ser Lys Tyr Tyr Leu Ala Ile Met Asp Lys
565 570 575
Lys Tyr Ala Lys Cys Leu Gln Lys Ile Asp Lys Asp Asp Val Asn Gly
580 585 590
Asn Tyr Glu Lys Ile Asn Tyr Lys Leu Leu Pro Gly Pro Asn Lys Met
595 600 605
Leu Pro Lys Val Phe Phe Ser Lys Lys Trp Met Ala Tyr Tyr Asn Pro
610 615 620
Ser Glu Asp Ile Gln Lys Ile Tyr Lys Asn Gly Thr Phe Lys Lys Gly
625 630 635 640
Asp Met Phe Asn Leu Asn Asp Cys His Lys Leu Ile Asp Phe Phe Lys
645 650 655
Asp Ser Ile Ser Arg Tyr Pro Lys Trp Ser Asn Ala Tyr Asp Phe Asn
660 665 670
Phe Ser Glu Thr Glu Lys Tyr Lys Asp Ile Ala Gly Phe Tyr Arg Glu
675 680 685
Val Glu Glu Gln Gly Tyr Lys Val Ser Phe Glu Ser Ala Ser Lys Lys
690 695 700
Glu Val Asp Lys Leu Val Glu Glu Gly Lys Leu Tyr Met Phe Gln Ile
705 710 715 720
Tyr Asn Lys Asp Phe Ser Asp Lys Ser His Gly Thr Pro Asn Leu His
725 730 735
Thr Met Tyr Phe Lys Leu Leu Phe Asp Glu Asn Asn His Gly Gln Ile
740 745 750
Arg Leu Ser Gly Gly Ala Glu Leu Phe Met Arg Arg Ala Ser Leu Lys
755 760 765
Lys Glu Glu Leu Val Val His Pro Ala Asn Ser Pro Ile Ala Asn Lys
770 775 780
Asn Pro Asp Asn Pro Lys Lys Thr Thr Thr Leu Ser Tyr Asp Val Tyr
785 790 795 800
Lys Asp Lys Arg Phe Ser Glu Asp Gln Tyr Glu Leu His Ile Pro Ile
805 810 815
Ala Ile Asn Lys Cys Pro Lys Asn Ile Phe Lys Ile Asn Thr Glu Val
820 825 830
Arg Val Leu Leu Lys His Asp Asp Asn Pro Tyr Val Ile Gly Ile Asp
835 840 845
Arg Gly Glu Arg Asn Leu Leu Tyr Ile Val Val Val Asp Gly Lys Gly
850 855 860
Asn Ile Val Glu Gln Tyr Ser Leu Asn Glu Ile Ile Asn Asn Phe Asn
865 870 875 880
Gly Ile Arg Ile Lys Thr Asp Tyr His Ser Leu Leu Asp Lys Lys Glu
885 890 895
Lys Glu Arg Phe Glu Ala Arg Gln Asn Trp Thr Ser Ile Glu Asn Ile
900 905 910
Lys Glu Leu Lys Ala Gly Tyr Ile Ser Gln Val Val His Lys Ile Cys
915 920 925
Glu Leu Val Glu Lys Tyr Asp Ala Val Ile Ala Leu Glu Asp Leu Asn
930 935 940
Ser Gly Phe Lys Asn Ser Arg Val Lys Val Glu Lys Gln Val Tyr Gln
945 950 955 960
Lys Phe Glu Lys Met Leu Ile Asp Lys Leu Asn Tyr Met Val Asp Lys
965 970 975
Lys Ser Asn Pro Cys Ala Thr Gly Gly Ala Leu Lys Gly Tyr Gln Ile
980 985 990
Thr Asn Lys Phe Glu Ser Phe Lys Ser Met Ser Thr Gln Asn Gly Phe
995 1000 1005
Ile Phe Tyr Ile Pro Ala Trp Leu Thr Ser Lys Ile Asp Pro Ser
1010 1015 1020
Thr Gly Phe Val Asn Leu Leu Lys Thr Lys Tyr Thr Ser Ile Ala
1025 1030 1035
Asp Ser Lys Lys Phe Ile Ser Ser Phe Asp Arg Ile Met Tyr Val
1040 1045 1050
Pro Glu Glu Asp Leu Phe Glu Phe Ala Leu Asp Tyr Lys Asn Phe
1055 1060 1065
Ser Arg Thr Asp Ala Asp Tyr Ile Lys Lys Trp Lys Leu Tyr Ser
1070 1075 1080
Tyr Gly Asn Arg Ile Arg Ile Phe Arg Asn Pro Lys Lys Asn Asn
1085 1090 1095
Val Phe Asp Trp Glu Glu Val Cys Leu Thr Ser Ala Tyr Lys Glu
1100 1105 1110
Leu Phe Asn Lys Tyr Gly Ile Asn Tyr Gln Gln Gly Asp Ile Arg
1115 1120 1125
Ala Leu Leu Cys Glu Gln Ser Asp Lys Ala Phe Tyr Ser Ser Phe
1130 1135 1140
Met Ala Leu Met Ser Leu Met Leu Gln Met Arg Asn Ser Ile Thr
1145 1150 1155
Gly Arg Thr Asp Val Asp Phe Leu Ile Ser Pro Val Lys Asn Ser
1160 1165 1170
Asp Gly Ile Phe Tyr Asp Ser Arg Asn Tyr Glu Ala Gln Glu Asn
1175 1180 1185
Ala Ile Leu Pro Lys Asn Ala Asp Ala Asn Gly Ala Tyr Asn Ile
1190 1195 1200
Ala Arg Lys Val Leu Trp Ala Ile Gly Gln Phe Lys Lys Ala Glu
1205 1210 1215
Asp Glu Lys Leu Asp Lys Val Lys Ile Ala Ile Ser Asn Lys Glu
1220 1225 1230
Trp Leu Glu Tyr Ala Gln Thr Ser Val Lys His Lys Arg Pro Ala
1235 1240 1245
Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys
1250 1255 1260
<210> 34
<211> 3873
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 34
atgccgaaga agaagcgcaa ggtcgggggc gggggctcag gcgggggcgg gagcggcggc 60
gggggctctg ggggcggcgg cagcggcggg ggcggcagcg ggggcggcgg gtcgatgagc 120
aagctggaga agttcacgaa ctgctactcc ctcagcaaga ccctgaggtt caaggcgatc 180
ccggtcggca agacccagga gaacatcgac aacaagcggc tgctggtgga ggacgagaag 240
agggctgagg actacaaggg cgtgaagaag ctcctggacc gctactacct gtccttcatc 300
aacgacgtgc tccacagcat caagctcaag aacctgaaca actacatcag cctcttcagg 360
aagaagacgc gcaccgagaa ggagaacaag gagctcgaga acctggagat caacctgagg 420
aaggagatcg ccaaggcgtt caagggcaac gagggctaca agtccctctt caagaaggac 480
atcatcgaga cgatcctccc ggagttcctg gacgacaagg acgagatcgc cctggtcaac 540
tccttcaacg gcttcaccac ggcgttcacc ggcttcttcg acaaccgcga gaacatgttc 600
agcgaggagg ccaagtccac gagcatcgcg ttcaggtgca tcaacgagaa cctcacccgc 660
tacatctcca acatggacat cttcgagaag gtcgacgcga tcttcgacaa gcacgaggtg 720
caggagatca aggagaagat cctgaacagc gactacgacg tcgaggactt cttcgagggc 780
gagttcttca acttcgtcct cacgcaggag ggcatcgacg tgtacaacgc catcatcggt 840
ggcttcgtga ccgagtccgg cgagaagatc aagggcctga acgagtacat caacctctac 900
aaccagaaga ccaagcagaa gctgccgaag ttcaagcccc tgtacaagca ggtgctctcc 960
gacagggagt ccctcagctt ctacggcgag ggctacacga gcgacgagga ggtcctggag 1020
gtgttccgca acaccctcaa caagaacagc gagatcttct ccagcatcaa gaagctcgag 1080
aagctgttca agaacttcga cgagtactcc agcgccggca tcttcgtcaa gaacggcccg 1140
gcgatctcca cgatcagcaa ggacatcttc ggcgagtgga acgtgatccg cgacaagtgg 1200
aacgccgagt acgacgacat ccacctcaag aagaaggcgg tggtcaccga gaagtacgag 1260
gacgacaggc gcaagtcctt caagaagatc ggctccttca gcctcgagca gctgcaggag 1320
tacgccgacg cggacctgag cgtggtcgag aagctcaagg agatcatcat ccagaaggtc 1380
gacgagatct acaaggtgta cggctccagc gagaagctct tcgacgcgga cttcgtcctc 1440
gagaagtccc tgaagaagaa cgacgccgtg gtcgcgatca tgaaggacct cctggactcc 1500
gtgaagagct tcgagaatta catcaaggcc ttcttcggcg agggcaagga gacgaacagg 1560
gacgagtcct tctacggcga cttcgtcctg gcctacgaca tcctcctgaa ggtggaccac 1620
atctacgacg cgatccgcaa ctacgtgacc cagaagccgt acagcaagga caagttcaag 1680
ctctacttcc agaaccccca gttcatgggc ggctgggaca aggacaagga gacggactac 1740
agggcgacca tcctgcgcta cggcagcaag tactacctcg ccatcatgga caagaagtac 1800
gcgaagtgcc tgcagaagat cgacaaggac gacgtcaacg gcaactacga gaagatcaac 1860
tacaagctcc tgccgggccc caacaagatg ctcccgaagg tgttcttctc caagaagtgg 1920
atggcctact acaaccccag cgaggacatc cagaagatct acaagaacgg cacgttcaag 1980
aagggcgaca tgttcaacct gaacgactgc cacaagctca tcgacttctt caaggactcc 2040
atcagccgct acccgaagtg gtccaacgcc tacgacttca acttcagcga gaccgagaag 2100
tacaaggaca tcgcgggctt ctaccgcgag gtcgaggagc agggctacaa ggtgtccttc 2160
gagtccgcca gcaagaagga ggtcgacaag ctggtggagg agggcaagct ctacatgttc 2220
cagatctaca acaaggactt ctccgacaag agccacggca cgcccaacct gcacaccatg 2280
tacttcaagc tcctgttcga cgagaacaac cacggccaga tcaggctgtc cggcggcgcc 2340
gagctcttca tgaggagggc gagcctgaag aaggaggagc tggtggtcca ccccgctaac 2400
agcccaatcg cgaacaagaa cccggacaac cccaagaaga ccacgaccct gtcctacgac 2460
gtgtacaagg acaagaggtt cagcgaggac cagtacgagc tccacatccc gatcgcgatc 2520
aacaagtgcc ccaagaacat cttcaagatc aacaccgagg tccgcgtgct cctgaagcac 2580
gacgacaacc cctacgtgat cggcatcgac aggggcgaga ggaacctcct gtacatcgtg 2640
gtcgtggacg gcaagggcaa catcgtggag cagtactccc tcaacgagat catcaacaac 2700
ttcaacggca tcaggatcaa gacggactac cacagcctcc tggacaagaa ggagaaggag 2760
aggttcgagg cccgccagaa ctggacctcc atcgagaaca tcaaggagct gaaggcgggc 2820
tacatcagcc aggtcgtgca caagatctgc gagctcgtcg agaagtacga cgccgtgatc 2880
gccctcgagg acctgaactc cggcttcaag aacagccgcg tcaaggtgga gaagcaggtc 2940
taccagaagt tcgagaagat gctcatcgac aagctgaact acatggtgga caagaagtcc 3000
aacccctgcg ctacgggcgg cgcgctgaag ggctaccaga tcaccaacaa gttcgagagc 3060
ttcaagtcca tgagcactca gaacggcttc atcttctaca tcccggcgtg gctcacgtcc 3120
aagatcgacc ccagcaccgg cttcgtcaac ctcctgaaga cgaagtacac ctccatcgcc 3180
gacagcaaga agttcatctc cagcttcgac cgcatcatgt atgtgccgga ggaggacctg 3240
ttcgagttcg ccctcgacta caagaacttc tcccgcacgg acgcggacta catcaagaag 3300
tggaagctgt acagctacgg caaccgcatc cgcatcttca ggaaccccaa gaagaacaac 3360
gtcttcgact gggaggaggt gtgcctgacc tccgcgtaca aggagctctt caacaagtac 3420
ggcatcaact accagcaggg cgacatcagg gctctcctgt gcgagcagag cgacaaggcc 3480
ttctactcca gcttcatggc gctgatgtcc ctcatgctgc agatgaggaa ctcgatcacc 3540
ggcaggacgg acgtggactt cctcatctcc ccggtgaaga acagcgacgg catcttctac 3600
gactccagga actacgaggc ccaggagaac gcgatcctcc caaagaacgc ggacgccaac 3660
ggcgcctaca acatcgccag gaaggtcctc tgggctatcg gccagttcaa gaaggcggag 3720
gacgagaagc tggacaaggt gaagatcgcc atcagcaaca aggagtggct cgagtacgcc 3780
cagacctcgg tcaagcacgg cagcccgaag aagaagcgca aggtgtccgg cggcagctcc 3840
ggcggcagcc cgaagaagaa gcgcaaagtg tga 3873
<210> 35
<211> 1290
<212> PRT
<213> Artificial Sequence
<220>
<223> Fusion protein
<400> 35
Met Pro Lys Lys Lys Arg Lys Val Gly Gly Gly Gly Ser Gly Gly Gly
1 5 10 15
Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly
20 25 30
Ser Gly Gly Gly Gly Ser Met Ser Lys Leu Glu Lys Phe Thr Asn Cys
35 40 45
Tyr Ser Leu Ser Lys Thr Leu Arg Phe Lys Ala Ile Pro Val Gly Lys
50 55 60
Thr Gln Glu Asn Ile Asp Asn Lys Arg Leu Leu Val Glu Asp Glu Lys
65 70 75 80
Arg Ala Glu Asp Tyr Lys Gly Val Lys Lys Leu Leu Asp Arg Tyr Tyr
85 90 95
Leu Ser Phe Ile Asn Asp Val Leu His Ser Ile Lys Leu Lys Asn Leu
100 105 110
Asn Asn Tyr Ile Ser Leu Phe Arg Lys Lys Thr Arg Thr Glu Lys Glu
115 120 125
Asn Lys Glu Leu Glu Asn Leu Glu Ile Asn Leu Arg Lys Glu Ile Ala
130 135 140
Lys Ala Phe Lys Gly Asn Glu Gly Tyr Lys Ser Leu Phe Lys Lys Asp
145 150 155 160
Ile Ile Glu Thr Ile Leu Pro Glu Phe Leu Asp Asp Lys Asp Glu Ile
165 170 175
Ala Leu Val Asn Ser Phe Asn Gly Phe Thr Thr Ala Phe Thr Gly Phe
180 185 190
Phe Asp Asn Arg Glu Asn Met Phe Ser Glu Glu Ala Lys Ser Thr Ser
195 200 205
Ile Ala Phe Arg Cys Ile Asn Glu Asn Leu Thr Arg Tyr Ile Ser Asn
210 215 220
Met Asp Ile Phe Glu Lys Val Asp Ala Ile Phe Asp Lys His Glu Val
225 230 235 240
Gln Glu Ile Lys Glu Lys Ile Leu Asn Ser Asp Tyr Asp Val Glu Asp
245 250 255
Phe Phe Glu Gly Glu Phe Phe Asn Phe Val Leu Thr Gln Glu Gly Ile
260 265 270
Asp Val Tyr Asn Ala Ile Ile Gly Gly Phe Val Thr Glu Ser Gly Glu
275 280 285
Lys Ile Lys Gly Leu Asn Glu Tyr Ile Asn Leu Tyr Asn Gln Lys Thr
290 295 300
Lys Gln Lys Leu Pro Lys Phe Lys Pro Leu Tyr Lys Gln Val Leu Ser
305 310 315 320
Asp Arg Glu Ser Leu Ser Phe Tyr Gly Glu Gly Tyr Thr Ser Asp Glu
325 330 335
Glu Val Leu Glu Val Phe Arg Asn Thr Leu Asn Lys Asn Ser Glu Ile
340 345 350
Phe Ser Ser Ile Lys Lys Leu Glu Lys Leu Phe Lys Asn Phe Asp Glu
355 360 365
Tyr Ser Ser Ala Gly Ile Phe Val Lys Asn Gly Pro Ala Ile Ser Thr
370 375 380
Ile Ser Lys Asp Ile Phe Gly Glu Trp Asn Val Ile Arg Asp Lys Trp
385 390 395 400
Asn Ala Glu Tyr Asp Asp Ile His Leu Lys Lys Lys Ala Val Val Thr
405 410 415
Glu Lys Tyr Glu Asp Asp Arg Arg Lys Ser Phe Lys Lys Ile Gly Ser
420 425 430
Phe Ser Leu Glu Gln Leu Gln Glu Tyr Ala Asp Ala Asp Leu Ser Val
435 440 445
Val Glu Lys Leu Lys Glu Ile Ile Ile Gln Lys Val Asp Glu Ile Tyr
450 455 460
Lys Val Tyr Gly Ser Ser Glu Lys Leu Phe Asp Ala Asp Phe Val Leu
465 470 475 480
Glu Lys Ser Leu Lys Lys Asn Asp Ala Val Val Ala Ile Met Lys Asp
485 490 495
Leu Leu Asp Ser Val Lys Ser Phe Glu Asn Tyr Ile Lys Ala Phe Phe
500 505 510
Gly Glu Gly Lys Glu Thr Asn Arg Asp Glu Ser Phe Tyr Gly Asp Phe
515 520 525
Val Leu Ala Tyr Asp Ile Leu Leu Lys Val Asp His Ile Tyr Asp Ala
530 535 540
Ile Arg Asn Tyr Val Thr Gln Lys Pro Tyr Ser Lys Asp Lys Phe Lys
545 550 555 560
Leu Tyr Phe Gln Asn Pro Gln Phe Met Gly Gly Trp Asp Lys Asp Lys
565 570 575
Glu Thr Asp Tyr Arg Ala Thr Ile Leu Arg Tyr Gly Ser Lys Tyr Tyr
580 585 590
Leu Ala Ile Met Asp Lys Lys Tyr Ala Lys Cys Leu Gln Lys Ile Asp
595 600 605
Lys Asp Asp Val Asn Gly Asn Tyr Glu Lys Ile Asn Tyr Lys Leu Leu
610 615 620
Pro Gly Pro Asn Lys Met Leu Pro Lys Val Phe Phe Ser Lys Lys Trp
625 630 635 640
Met Ala Tyr Tyr Asn Pro Ser Glu Asp Ile Gln Lys Ile Tyr Lys Asn
645 650 655
Gly Thr Phe Lys Lys Gly Asp Met Phe Asn Leu Asn Asp Cys His Lys
660 665 670
Leu Ile Asp Phe Phe Lys Asp Ser Ile Ser Arg Tyr Pro Lys Trp Ser
675 680 685
Asn Ala Tyr Asp Phe Asn Phe Ser Glu Thr Glu Lys Tyr Lys Asp Ile
690 695 700
Ala Gly Phe Tyr Arg Glu Val Glu Glu Gln Gly Tyr Lys Val Ser Phe
705 710 715 720
Glu Ser Ala Ser Lys Lys Glu Val Asp Lys Leu Val Glu Glu Gly Lys
725 730 735
Leu Tyr Met Phe Gln Ile Tyr Asn Lys Asp Phe Ser Asp Lys Ser His
740 745 750
Gly Thr Pro Asn Leu His Thr Met Tyr Phe Lys Leu Leu Phe Asp Glu
755 760 765
Asn Asn His Gly Gln Ile Arg Leu Ser Gly Gly Ala Glu Leu Phe Met
770 775 780
Arg Arg Ala Ser Leu Lys Lys Glu Glu Leu Val Val His Pro Ala Asn
785 790 795 800
Ser Pro Ile Ala Asn Lys Asn Pro Asp Asn Pro Lys Lys Thr Thr Thr
805 810 815
Leu Ser Tyr Asp Val Tyr Lys Asp Lys Arg Phe Ser Glu Asp Gln Tyr
820 825 830
Glu Leu His Ile Pro Ile Ala Ile Asn Lys Cys Pro Lys Asn Ile Phe
835 840 845
Lys Ile Asn Thr Glu Val Arg Val Leu Leu Lys His Asp Asp Asn Pro
850 855 860
Tyr Val Ile Gly Ile Asp Arg Gly Glu Arg Asn Leu Leu Tyr Ile Val
865 870 875 880
Val Val Asp Gly Lys Gly Asn Ile Val Glu Gln Tyr Ser Leu Asn Glu
885 890 895
Ile Ile Asn Asn Phe Asn Gly Ile Arg Ile Lys Thr Asp Tyr His Ser
900 905 910
Leu Leu Asp Lys Lys Glu Lys Glu Arg Phe Glu Ala Arg Gln Asn Trp
915 920 925
Thr Ser Ile Glu Asn Ile Lys Glu Leu Lys Ala Gly Tyr Ile Ser Gln
930 935 940
Val Val His Lys Ile Cys Glu Leu Val Glu Lys Tyr Asp Ala Val Ile
945 950 955 960
Ala Leu Glu Asp Leu Asn Ser Gly Phe Lys Asn Ser Arg Val Lys Val
965 970 975
Glu Lys Gln Val Tyr Gln Lys Phe Glu Lys Met Leu Ile Asp Lys Leu
980 985 990
Asn Tyr Met Val Asp Lys Lys Ser Asn Pro Cys Ala Thr Gly Gly Ala
995 1000 1005
Leu Lys Gly Tyr Gln Ile Thr Asn Lys Phe Glu Ser Phe Lys Ser
1010 1015 1020
Met Ser Thr Gln Asn Gly Phe Ile Phe Tyr Ile Pro Ala Trp Leu
1025 1030 1035
Thr Ser Lys Ile Asp Pro Ser Thr Gly Phe Val Asn Leu Leu Lys
1040 1045 1050
Thr Lys Tyr Thr Ser Ile Ala Asp Ser Lys Lys Phe Ile Ser Ser
1055 1060 1065
Phe Asp Arg Ile Met Tyr Val Pro Glu Glu Asp Leu Phe Glu Phe
1070 1075 1080
Ala Leu Asp Tyr Lys Asn Phe Ser Arg Thr Asp Ala Asp Tyr Ile
1085 1090 1095
Lys Lys Trp Lys Leu Tyr Ser Tyr Gly Asn Arg Ile Arg Ile Phe
1100 1105 1110
Arg Asn Pro Lys Lys Asn Asn Val Phe Asp Trp Glu Glu Val Cys
1115 1120 1125
Leu Thr Ser Ala Tyr Lys Glu Leu Phe Asn Lys Tyr Gly Ile Asn
1130 1135 1140
Tyr Gln Gln Gly Asp Ile Arg Ala Leu Leu Cys Glu Gln Ser Asp
1145 1150 1155
Lys Ala Phe Tyr Ser Ser Phe Met Ala Leu Met Ser Leu Met Leu
1160 1165 1170
Gln Met Arg Asn Ser Ile Thr Gly Arg Thr Asp Val Asp Phe Leu
1175 1180 1185
Ile Ser Pro Val Lys Asn Ser Asp Gly Ile Phe Tyr Asp Ser Arg
1190 1195 1200
Asn Tyr Glu Ala Gln Glu Asn Ala Ile Leu Pro Lys Asn Ala Asp
1205 1210 1215
Ala Asn Gly Ala Tyr Asn Ile Ala Arg Lys Val Leu Trp Ala Ile
1220 1225 1230
Gly Gln Phe Lys Lys Ala Glu Asp Glu Lys Leu Asp Lys Val Lys
1235 1240 1245
Ile Ala Ile Ser Asn Lys Glu Trp Leu Glu Tyr Ala Gln Thr Ser
1250 1255 1260
Val Lys His Gly Ser Pro Lys Lys Lys Arg Lys Val Ser Gly Gly
1265 1270 1275
Ser Ser Gly Gly Ser Pro Lys Lys Lys Arg Lys Val
1280 1285 1290
<210> 36
<211> 3783
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 36
atggctccta agaagaagcg gaaggttggt attcacgggg tgcctgcggc ttcaaagctc 60
gagaaattca ccaactgtta ttcgttgagc aaaacactgc ggtttaaagc gattccagtc 120
ggcaagactc aagagaatat agacaataag cggctgttgg tggaagatga aaagcgcgcg 180
gaagactaca aaggggtgaa gaagttgttg gacagatact acctctcttt tatcaatgat 240
gtcttgcact caatcaaatt gaagaatctg aacaactaca tctccctctt cagaaagaaa 300
acaaggacag aaaaggagaa taaggaactt gaaaatttgg agatcaatct gaggaaagag 360
atcgcgaaag cctttaaagg caacgaagga tacaaaagtc tgttcaagaa ggatataatt 420
gagacaattt tgccagagtt cctcgatgac aaggacgaga ttgcgctggt caattcgttc 480
aacggattca caacagcatt cacaggcttc tttgataatc gggaaaatat gttctctgag 540
gaggcaaagt ccacttctat tgcgttcagg tgtatcaatg agaatctcac taggtacatt 600
tccaacatgg atatctttga gaaggttgac gcaatttttg acaagcacga agttcaggag 660
attaaggaga agatcctcaa ttccgattat gacgttgagg acttcttcga gggtgagttt 720
tttaatttcg tgctcactca agagggtatc gacgtgtata atgcgatcat cggtgggttc 780
gtgactgagt ccggtgaaaa gattaaggga ttgaacgagt atatcaacct ttacaaccaa 840
aagacgaaac agaagctgcc aaagttcaag cctctttaca aacaggttct ttcagaccgc 900
gagtcactct cgttctatgg ggagggctac acttcggatg aggaagtcct ggaggtgttc 960
aggaatactc tcaataagaa ttcggagatt ttctcttcta taaaaaaact ggaaaagttg 1020
tttaagaatt ttgacgaata ctctagcgcc ggcatatttg tgaaaaacgg cccggccata 1080
tcaacgataa gtaaagatat cttcggcgaa tggaacgtga tcagagacaa atggaacgcg 1140
gagtatgacg atattcacct gaagaagaag gctgtcgtaa cggagaagta cgaggatgat 1200
cgcaggaaaa gcttcaaaaa gatcggaagt ttcagcctgg aacagttgca ggagtatgct 1260
gacgccgatc ttagcgtcgt cgagaagttg aaggagataa tcatccaaaa ggtcgacgag 1320
atatataaag tctatggatc aagtgaaaaa ctgttcgacg ccgacttcgt tttggagaag 1380
tccctgaaga agaacgacgc tgttgttgcc attatgaagg atctgctcga cagcgtgaag 1440
agtttcgaga actatattaa ggcttttttc ggggagggga aggagactaa cagagatgag 1500
tccttctacg gagacttcgt cctcgcgtac gatatactcc ttaaggtaga ccacatctac 1560
gacgcaatca gaaattacgt gacacaaaag ccgtacagca aggacaagtt caaactctac 1620
ttccagaacc cccagttcat gggcggctgg gacaaggaca aggaaacgga ttacagggct 1680
acgatcctga ggtatggttc aaaatactac ttggcgatta tggacaagaa gtacgccaag 1740
tgtctccaga agattgacaa agacgatgtc aatggcaatt atgagaagat caactacaag 1800
ctgcttccgg gtccgaacaa gatgctccca aaggttttct tcagcaagaa atggatggcc 1860
tactataacc caagcgagga catccagaag atttataaga acggtacgtt caagaagggc 1920
gacatgttca atcttaacga ctgtcacaag ctgatcgact tcttcaaaga ctcaattagc 1980
cggtacccaa agtggtctaa cgcctatgac ttcaactttt cggaaaccga gaagtacaag 2040
gatatagccg gattttatag agaggtggaa gagcagggct acaaggtgtc attcgagtcc 2100
gccagcaaga aggaagtgga caagctcgtg gaagagggta agctctacat gttccagatt 2160
tataataaag actttagcga taagagccac gggacaccta atctccacac aatgtatttc 2220
aagctgctct tcgacgagaa taaccacggc caaatcaggt tgtcaggagg ggctgaactc 2280
ttcatgcggc gcgctagcct taagaaggag gagcttgtag tccaccctgc gaatagtcca 2340
attgcgaata agaacccgga caatcctaaa aagactacaa cattgagcta cgacgtgtac 2400
aaggataaga ggttttccga ggatcagtac gagctccaca tcccgattgc gatcaacaag 2460
tgcccaaaga atattttcaa gataaacaca gaggtgcgtg tactcctgaa gcatgacgac 2520
aatccttacg tcattgggat tgatcggggc gagaggaacc tcctctatat tgtggtggtg 2580
gacgggaagg ggaacatagt cgaacagtac tcccttaacg aaataattaa caatttcaac 2640
ggcatccgta tcaagaccga ctaccattcg ttgctggaca agaaggagaa ggagagattt 2700
gaggcgcggc aaaattggac aagtatcgag aacatcaagg aactcaaagc aggttatatc 2760
tctcaagttg tgcataagat atgcgagctg gttgagaagt atgacgcagt gatcgctctt 2820
gaggacctca actcgggctt taagaattct agagttaaag tggagaagca ggtctatcaa 2880
aagttcgaga agatgcttat agataagctc aactacatgg tcgataagaa atcgaaccca 2940
tgtgccaccg gcggcgcact caaaggttac caaataacaa acaaattcga gtccttcaaa 3000
tcgatgagta ctcagaatgg gttcatattt tatataccgg cgtggcttac gtctaagatc 3060
gacccgtcaa ctggttttgt caacctgttg aagacgaaat acacgtccat tgccgattca 3120
aaaaagttca tatctagttt tgatcgtatt atgtacgtcc cagaggaaga tcttttcgag 3180
tttgctctcg actacaaaaa cttttcgcgc accgatgcgg attacattaa aaaatggaaa 3240
ctctattcgt acggcaacag aatcaggatt tttcgcaacc ctaagaagaa taacgtcttt 3300
gattgggagg aagtttgctt gactagcgcg tacaaggagc tctttaataa gtatggcatt 3360
aactaccaac agggtgatat cagagcactg ctttgcgaac aatctgacaa ggctttctac 3420
tcatccttca tggctttgat gagcctgatg ctccagatga gaaattcaat tacaggcaga 3480
accgacgtgg atttcttgat ctccccggtt aaaaattctg atggcatctt ttacgatagc 3540
aggaactatg aagcgcaaga gaatgcgatt ctgccaaaaa atgcagacgc caacggtgcc 3600
tataacatcg ccaggaaagt cctgtgggcg atcggccagt tcaaaaaggc cgaagacgaa 3660
aaattggaca aggtcaaaat cgctatcagc aacaaagagt ggctggagta tgctcagaca 3720
tccgtaaagc ataagcgtcc tgctgccacc aaaaaggccg gacaggctaa gaaaaagaag 3780
tga 3783
<210> 37
<211> 1260
<212> PRT
<213> Artificial Sequence
<220>
<223> Fusion protein
<400> 37
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Ser Lys Leu Glu Lys Phe Thr Asn Cys Tyr Ser Leu Ser Lys Thr
20 25 30
Leu Arg Phe Lys Ala Ile Pro Val Gly Lys Thr Gln Glu Asn Ile Asp
35 40 45
Asn Lys Arg Leu Leu Val Glu Asp Glu Lys Arg Ala Glu Asp Tyr Lys
50 55 60
Gly Val Lys Lys Leu Leu Asp Arg Tyr Tyr Leu Ser Phe Ile Asn Asp
65 70 75 80
Val Leu His Ser Ile Lys Leu Lys Asn Leu Asn Asn Tyr Ile Ser Leu
85 90 95
Phe Arg Lys Lys Thr Arg Thr Glu Lys Glu Asn Lys Glu Leu Glu Asn
100 105 110
Leu Glu Ile Asn Leu Arg Lys Glu Ile Ala Lys Ala Phe Lys Gly Asn
115 120 125
Glu Gly Tyr Lys Ser Leu Phe Lys Lys Asp Ile Ile Glu Thr Ile Leu
130 135 140
Pro Glu Phe Leu Asp Asp Lys Asp Glu Ile Ala Leu Val Asn Ser Phe
145 150 155 160
Asn Gly Phe Thr Thr Ala Phe Thr Gly Phe Phe Asp Asn Arg Glu Asn
165 170 175
Met Phe Ser Glu Glu Ala Lys Ser Thr Ser Ile Ala Phe Arg Cys Ile
180 185 190
Asn Glu Asn Leu Thr Arg Tyr Ile Ser Asn Met Asp Ile Phe Glu Lys
195 200 205
Val Asp Ala Ile Phe Asp Lys His Glu Val Gln Glu Ile Lys Glu Lys
210 215 220
Ile Leu Asn Ser Asp Tyr Asp Val Glu Asp Phe Phe Glu Gly Glu Phe
225 230 235 240
Phe Asn Phe Val Leu Thr Gln Glu Gly Ile Asp Val Tyr Asn Ala Ile
245 250 255
Ile Gly Gly Phe Val Thr Glu Ser Gly Glu Lys Ile Lys Gly Leu Asn
260 265 270
Glu Tyr Ile Asn Leu Tyr Asn Gln Lys Thr Lys Gln Lys Leu Pro Lys
275 280 285
Phe Lys Pro Leu Tyr Lys Gln Val Leu Ser Asp Arg Glu Ser Leu Ser
290 295 300
Phe Tyr Gly Glu Gly Tyr Thr Ser Asp Glu Glu Val Leu Glu Val Phe
305 310 315 320
Arg Asn Thr Leu Asn Lys Asn Ser Glu Ile Phe Ser Ser Ile Lys Lys
325 330 335
Leu Glu Lys Leu Phe Lys Asn Phe Asp Glu Tyr Ser Ser Ala Gly Ile
340 345 350
Phe Val Lys Asn Gly Pro Ala Ile Ser Thr Ile Ser Lys Asp Ile Phe
355 360 365
Gly Glu Trp Asn Val Ile Arg Asp Lys Trp Asn Ala Glu Tyr Asp Asp
370 375 380
Ile His Leu Lys Lys Lys Ala Val Val Thr Glu Lys Tyr Glu Asp Asp
385 390 395 400
Arg Arg Lys Ser Phe Lys Lys Ile Gly Ser Phe Ser Leu Glu Gln Leu
405 410 415
Gln Glu Tyr Ala Asp Ala Asp Leu Ser Val Val Glu Lys Leu Lys Glu
420 425 430
Ile Ile Ile Gln Lys Val Asp Glu Ile Tyr Lys Val Tyr Gly Ser Ser
435 440 445
Glu Lys Leu Phe Asp Ala Asp Phe Val Leu Glu Lys Ser Leu Lys Lys
450 455 460
Asn Asp Ala Val Val Ala Ile Met Lys Asp Leu Leu Asp Ser Val Lys
465 470 475 480
Ser Phe Glu Asn Tyr Ile Lys Ala Phe Phe Gly Glu Gly Lys Glu Thr
485 490 495
Asn Arg Asp Glu Ser Phe Tyr Gly Asp Phe Val Leu Ala Tyr Asp Ile
500 505 510
Leu Leu Lys Val Asp His Ile Tyr Asp Ala Ile Arg Asn Tyr Val Thr
515 520 525
Gln Lys Pro Tyr Ser Lys Asp Lys Phe Lys Leu Tyr Phe Gln Asn Pro
530 535 540
Gln Phe Met Gly Gly Trp Asp Lys Asp Lys Glu Thr Asp Tyr Arg Ala
545 550 555 560
Thr Ile Leu Arg Tyr Gly Ser Lys Tyr Tyr Leu Ala Ile Met Asp Lys
565 570 575
Lys Tyr Ala Lys Cys Leu Gln Lys Ile Asp Lys Asp Asp Val Asn Gly
580 585 590
Asn Tyr Glu Lys Ile Asn Tyr Lys Leu Leu Pro Gly Pro Asn Lys Met
595 600 605
Leu Pro Lys Val Phe Phe Ser Lys Lys Trp Met Ala Tyr Tyr Asn Pro
610 615 620
Ser Glu Asp Ile Gln Lys Ile Tyr Lys Asn Gly Thr Phe Lys Lys Gly
625 630 635 640
Asp Met Phe Asn Leu Asn Asp Cys His Lys Leu Ile Asp Phe Phe Lys
645 650 655
Asp Ser Ile Ser Arg Tyr Pro Lys Trp Ser Asn Ala Tyr Asp Phe Asn
660 665 670
Phe Ser Glu Thr Glu Lys Tyr Lys Asp Ile Ala Gly Phe Tyr Arg Glu
675 680 685
Val Glu Glu Gln Gly Tyr Lys Val Ser Phe Glu Ser Ala Ser Lys Lys
690 695 700
Glu Val Asp Lys Leu Val Glu Glu Gly Lys Leu Tyr Met Phe Gln Ile
705 710 715 720
Tyr Asn Lys Asp Phe Ser Asp Lys Ser His Gly Thr Pro Asn Leu His
725 730 735
Thr Met Tyr Phe Lys Leu Leu Phe Asp Glu Asn Asn His Gly Gln Ile
740 745 750
Arg Leu Ser Gly Gly Ala Glu Leu Phe Met Arg Arg Ala Ser Leu Lys
755 760 765
Lys Glu Glu Leu Val Val His Pro Ala Asn Ser Pro Ile Ala Asn Lys
770 775 780
Asn Pro Asp Asn Pro Lys Lys Thr Thr Thr Leu Ser Tyr Asp Val Tyr
785 790 795 800
Lys Asp Lys Arg Phe Ser Glu Asp Gln Tyr Glu Leu His Ile Pro Ile
805 810 815
Ala Ile Asn Lys Cys Pro Lys Asn Ile Phe Lys Ile Asn Thr Glu Val
820 825 830
Arg Val Leu Leu Lys His Asp Asp Asn Pro Tyr Val Ile Gly Ile Asp
835 840 845
Arg Gly Glu Arg Asn Leu Leu Tyr Ile Val Val Val Asp Gly Lys Gly
850 855 860
Asn Ile Val Glu Gln Tyr Ser Leu Asn Glu Ile Ile Asn Asn Phe Asn
865 870 875 880
Gly Ile Arg Ile Lys Thr Asp Tyr His Ser Leu Leu Asp Lys Lys Glu
885 890 895
Lys Glu Arg Phe Glu Ala Arg Gln Asn Trp Thr Ser Ile Glu Asn Ile
900 905 910
Lys Glu Leu Lys Ala Gly Tyr Ile Ser Gln Val Val His Lys Ile Cys
915 920 925
Glu Leu Val Glu Lys Tyr Asp Ala Val Ile Ala Leu Glu Asp Leu Asn
930 935 940
Ser Gly Phe Lys Asn Ser Arg Val Lys Val Glu Lys Gln Val Tyr Gln
945 950 955 960
Lys Phe Glu Lys Met Leu Ile Asp Lys Leu Asn Tyr Met Val Asp Lys
965 970 975
Lys Ser Asn Pro Cys Ala Thr Gly Gly Ala Leu Lys Gly Tyr Gln Ile
980 985 990
Thr Asn Lys Phe Glu Ser Phe Lys Ser Met Ser Thr Gln Asn Gly Phe
995 1000 1005
Ile Phe Tyr Ile Pro Ala Trp Leu Thr Ser Lys Ile Asp Pro Ser
1010 1015 1020
Thr Gly Phe Val Asn Leu Leu Lys Thr Lys Tyr Thr Ser Ile Ala
1025 1030 1035
Asp Ser Lys Lys Phe Ile Ser Ser Phe Asp Arg Ile Met Tyr Val
1040 1045 1050
Pro Glu Glu Asp Leu Phe Glu Phe Ala Leu Asp Tyr Lys Asn Phe
1055 1060 1065
Ser Arg Thr Asp Ala Asp Tyr Ile Lys Lys Trp Lys Leu Tyr Ser
1070 1075 1080
Tyr Gly Asn Arg Ile Arg Ile Phe Arg Asn Pro Lys Lys Asn Asn
1085 1090 1095
Val Phe Asp Trp Glu Glu Val Cys Leu Thr Ser Ala Tyr Lys Glu
1100 1105 1110
Leu Phe Asn Lys Tyr Gly Ile Asn Tyr Gln Gln Gly Asp Ile Arg
1115 1120 1125
Ala Leu Leu Cys Glu Gln Ser Asp Lys Ala Phe Tyr Ser Ser Phe
1130 1135 1140
Met Ala Leu Met Ser Leu Met Leu Gln Met Arg Asn Ser Ile Thr
1145 1150 1155
Gly Arg Thr Asp Val Asp Phe Leu Ile Ser Pro Val Lys Asn Ser
1160 1165 1170
Asp Gly Ile Phe Tyr Asp Ser Arg Asn Tyr Glu Ala Gln Glu Asn
1175 1180 1185
Ala Ile Leu Pro Lys Asn Ala Asp Ala Asn Gly Ala Tyr Asn Ile
1190 1195 1200
Ala Arg Lys Val Leu Trp Ala Ile Gly Gln Phe Lys Lys Ala Glu
1205 1210 1215
Asp Glu Lys Leu Asp Lys Val Lys Ile Ala Ile Ser Asn Lys Glu
1220 1225 1230
Trp Leu Glu Tyr Ala Gln Thr Ser Val Lys His Lys Arg Pro Ala
1235 1240 1245
Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys
1250 1255 1260
<210> 38
<211> 3873
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 38
atgccgaaga agaagcgcaa ggtcgggggc gggggctcag gcgggggcgg gagcggcggc 60
gggggctctg ggggcggcgg cagcggcggg ggcggcagcg ggggcggcgg gtcgatgtca 120
aagctcgaga aattcaccaa ctgttattcg ttgagcaaaa cactgcggtt taaagcgatt 180
ccagtcggca agactcaaga gaatatagac aataagcggc tgttggtgga agatgaaaag 240
cgcgcggaag actacaaagg ggtgaagaag ttgttggaca gatactacct ctcttttatc 300
aatgatgtct tgcactcaat caaattgaag aatctgaaca actacatctc cctcttcaga 360
aagaaaacaa ggacagaaaa ggagaataag gaacttgaaa atttggagat caatctgagg 420
aaagagatcg cgaaagcctt taaaggcaac gaaggataca aaagtctgtt caagaaggat 480
ataattgaga caattttgcc agagttcctc gatgacaagg acgagattgc gctggtcaat 540
tcgttcaacg gattcacaac agcattcaca ggcttctttg ataatcggga aaatatgttc 600
tctgaggagg caaagtccac ttctattgcg ttcaggtgta tcaatgagaa tctcactagg 660
tacatttcca acatggatat ctttgagaag gttgacgcaa tttttgacaa gcacgaagtt 720
caggagatta aggagaagat cctcaattcc gattatgacg ttgaggactt cttcgagggt 780
gagtttttta atttcgtgct cactcaagag ggtatcgacg tgtataatgc gatcatcggt 840
gggttcgtga ctgagtccgg tgaaaagatt aagggattga acgagtatat caacctttac 900
aaccaaaaga cgaaacagaa gctgccaaag ttcaagcctc tttacaaaca ggttctttca 960
gaccgcgagt cactctcgtt ctatggggag ggctacactt cggatgagga agtcctggag 1020
gtgttcagga atactctcaa taagaattcg gagattttct cttctataaa aaaactggaa 1080
aagttgttta agaattttga cgaatactct agcgccggca tatttgtgaa aaacggcccg 1140
gccatatcaa cgataagtaa agatatcttc ggcgaatgga acgtgatcag agacaaatgg 1200
aacgcggagt atgacgatat tcacctgaag aagaaggctg tcgtaacgga gaagtacgag 1260
gatgatcgca ggaaaagctt caaaaagatc ggaagtttca gcctggaaca gttgcaggag 1320
tatgctgacg ccgatcttag cgtcgtcgag aagttgaagg agataatcat ccaaaaggtc 1380
gacgagatat ataaagtcta tggatcaagt gaaaaactgt tcgacgccga cttcgttttg 1440
gagaagtccc tgaagaagaa cgacgctgtt gttgccatta tgaaggatct gctcgacagc 1500
gtgaagagtt tcgagaacta tattaaggct tttttcgggg aggggaagga gactaacaga 1560
gatgagtcct tctacggaga cttcgtcctc gcgtacgata tactccttaa ggtagaccac 1620
atctacgacg caatcagaaa ttacgtgaca caaaagccgt acagcaagga caagttcaaa 1680
ctctacttcc agaaccccca gttcatgggc ggctgggaca aggacaagga aacggattac 1740
agggctacga tcctgaggta tggttcaaaa tactacttgg cgattatgga caagaagtac 1800
gccaagtgtc tccagaagat tgacaaagac gatgtcaatg gcaattatga gaagatcaac 1860
tacaagctgc ttccgggtcc gaacaagatg ctcccaaagg ttttcttcag caagaaatgg 1920
atggcctact ataacccaag cgaggacatc cagaagattt ataagaacgg tacgttcaag 1980
aagggcgaca tgttcaatct taacgactgt cacaagctga tcgacttctt caaagactca 2040
attagccggt acccaaagtg gtctaacgcc tatgacttca acttttcgga aaccgagaag 2100
tacaaggata tagccggatt ttatagagag gtggaagagc agggctacaa ggtgtcattc 2160
gagtccgcca gcaagaagga agtggacaag ctcgtggaag agggtaagct ctacatgttc 2220
cagatttata ataaagactt tagcgataag agccacggga cacctaatct ccacacaatg 2280
tatttcaagc tgctcttcga cgagaataac cacggccaaa tcaggttgtc aggaggggct 2340
gaactcttca tgcggcgcgc tagccttaag aaggaggagc ttgtagtcca ccctgcgaat 2400
agtccaattg cgaataagaa cccggacaat cctaaaaaga ctacaacatt gagctacgac 2460
gtgtacaagg ataagaggtt ttccgaggat cagtacgagc tccacatccc gattgcgatc 2520
aacaagtgcc caaagaatat tttcaagata aacacagagg tgcgtgtact cctgaagcat 2580
gacgacaatc cttacgtcat tgggattgat cggggcgaga ggaacctcct ctatattgtg 2640
gtggtggacg ggaaggggaa catagtcgaa cagtactccc ttaacgaaat aattaacaat 2700
ttcaacggca tccgtatcaa gaccgactac cattcgttgc tggacaagaa ggagaaggag 2760
agatttgagg cgcggcaaaa ttggacaagt atcgagaaca tcaaggaact caaagcaggt 2820
tatatctctc aagttgtgca taagatatgc gagctggttg agaagtatga cgcagtgatc 2880
gctcttgagg acctcaactc gggctttaag aattctagag ttaaagtgga gaagcaggtc 2940
tatcaaaagt tcgagaagat gcttatagat aagctcaact acatggtcga taagaaatcg 3000
aacccatgtg ccaccggcgg cgcactcaaa ggttaccaaa taacaaacaa attcgagtcc 3060
ttcaaatcga tgagtactca gaatgggttc atattttata taccggcgtg gcttacgtct 3120
aagatcgacc cgtcaactgg ttttgtcaac ctgttgaaga cgaaatacac gtccattgcc 3180
gattcaaaaa agttcatatc tagttttgat cgtattatgt acgtcccaga ggaagatctt 3240
ttcgagtttg ctctcgacta caaaaacttt tcgcgcaccg atgcggatta cattaaaaaa 3300
tggaaactct attcgtacgg caacagaatc aggatttttc gcaaccctaa gaagaataac 3360
gtctttgatt gggaggaagt ttgcttgact agcgcgtaca aggagctctt taataagtat 3420
ggcattaact accaacaggg tgatatcaga gcactgcttt gcgaacaatc tgacaaggct 3480
ttctactcat ccttcatggc tttgatgagc ctgatgctcc agatgagaaa ttcaattaca 3540
ggcagaaccg acgtggattt cttgatctcc ccggttaaaa attctgatgg catcttttac 3600
gatagcagga actatgaagc gcaagagaat gcgattctgc caaaaaatgc agacgccaac 3660
ggtgcctata acatcgccag gaaagtcctg tgggcgatcg gccagttcaa aaaggccgaa 3720
gacgaaaaat tggacaaggt caaaatcgct atcagcaaca aagagtggct ggagtatgct 3780
cagacatccg taaagcatgg cagcccgaag aagaagcgca aggtgtccgg cggcagctcc 3840
ggcggcagcc cgaagaagaa gcgcaaagtg tga 3873
<210> 39
<211> 1290
<212> PRT
<213> Artificial Sequence
<220>
<223> Fusion protein
<400> 39
Met Pro Lys Lys Lys Arg Lys Val Gly Gly Gly Gly Ser Gly Gly Gly
1 5 10 15
Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly
20 25 30
Ser Gly Gly Gly Gly Ser Met Ser Lys Leu Glu Lys Phe Thr Asn Cys
35 40 45
Tyr Ser Leu Ser Lys Thr Leu Arg Phe Lys Ala Ile Pro Val Gly Lys
50 55 60
Thr Gln Glu Asn Ile Asp Asn Lys Arg Leu Leu Val Glu Asp Glu Lys
65 70 75 80
Arg Ala Glu Asp Tyr Lys Gly Val Lys Lys Leu Leu Asp Arg Tyr Tyr
85 90 95
Leu Ser Phe Ile Asn Asp Val Leu His Ser Ile Lys Leu Lys Asn Leu
100 105 110
Asn Asn Tyr Ile Ser Leu Phe Arg Lys Lys Thr Arg Thr Glu Lys Glu
115 120 125
Asn Lys Glu Leu Glu Asn Leu Glu Ile Asn Leu Arg Lys Glu Ile Ala
130 135 140
Lys Ala Phe Lys Gly Asn Glu Gly Tyr Lys Ser Leu Phe Lys Lys Asp
145 150 155 160
Ile Ile Glu Thr Ile Leu Pro Glu Phe Leu Asp Asp Lys Asp Glu Ile
165 170 175
Ala Leu Val Asn Ser Phe Asn Gly Phe Thr Thr Ala Phe Thr Gly Phe
180 185 190
Phe Asp Asn Arg Glu Asn Met Phe Ser Glu Glu Ala Lys Ser Thr Ser
195 200 205
Ile Ala Phe Arg Cys Ile Asn Glu Asn Leu Thr Arg Tyr Ile Ser Asn
210 215 220
Met Asp Ile Phe Glu Lys Val Asp Ala Ile Phe Asp Lys His Glu Val
225 230 235 240
Gln Glu Ile Lys Glu Lys Ile Leu Asn Ser Asp Tyr Asp Val Glu Asp
245 250 255
Phe Phe Glu Gly Glu Phe Phe Asn Phe Val Leu Thr Gln Glu Gly Ile
260 265 270
Asp Val Tyr Asn Ala Ile Ile Gly Gly Phe Val Thr Glu Ser Gly Glu
275 280 285
Lys Ile Lys Gly Leu Asn Glu Tyr Ile Asn Leu Tyr Asn Gln Lys Thr
290 295 300
Lys Gln Lys Leu Pro Lys Phe Lys Pro Leu Tyr Lys Gln Val Leu Ser
305 310 315 320
Asp Arg Glu Ser Leu Ser Phe Tyr Gly Glu Gly Tyr Thr Ser Asp Glu
325 330 335
Glu Val Leu Glu Val Phe Arg Asn Thr Leu Asn Lys Asn Ser Glu Ile
340 345 350
Phe Ser Ser Ile Lys Lys Leu Glu Lys Leu Phe Lys Asn Phe Asp Glu
355 360 365
Tyr Ser Ser Ala Gly Ile Phe Val Lys Asn Gly Pro Ala Ile Ser Thr
370 375 380
Ile Ser Lys Asp Ile Phe Gly Glu Trp Asn Val Ile Arg Asp Lys Trp
385 390 395 400
Asn Ala Glu Tyr Asp Asp Ile His Leu Lys Lys Lys Ala Val Val Thr
405 410 415
Glu Lys Tyr Glu Asp Asp Arg Arg Lys Ser Phe Lys Lys Ile Gly Ser
420 425 430
Phe Ser Leu Glu Gln Leu Gln Glu Tyr Ala Asp Ala Asp Leu Ser Val
435 440 445
Val Glu Lys Leu Lys Glu Ile Ile Ile Gln Lys Val Asp Glu Ile Tyr
450 455 460
Lys Val Tyr Gly Ser Ser Glu Lys Leu Phe Asp Ala Asp Phe Val Leu
465 470 475 480
Glu Lys Ser Leu Lys Lys Asn Asp Ala Val Val Ala Ile Met Lys Asp
485 490 495
Leu Leu Asp Ser Val Lys Ser Phe Glu Asn Tyr Ile Lys Ala Phe Phe
500 505 510
Gly Glu Gly Lys Glu Thr Asn Arg Asp Glu Ser Phe Tyr Gly Asp Phe
515 520 525
Val Leu Ala Tyr Asp Ile Leu Leu Lys Val Asp His Ile Tyr Asp Ala
530 535 540
Ile Arg Asn Tyr Val Thr Gln Lys Pro Tyr Ser Lys Asp Lys Phe Lys
545 550 555 560
Leu Tyr Phe Gln Asn Pro Gln Phe Met Gly Gly Trp Asp Lys Asp Lys
565 570 575
Glu Thr Asp Tyr Arg Ala Thr Ile Leu Arg Tyr Gly Ser Lys Tyr Tyr
580 585 590
Leu Ala Ile Met Asp Lys Lys Tyr Ala Lys Cys Leu Gln Lys Ile Asp
595 600 605
Lys Asp Asp Val Asn Gly Asn Tyr Glu Lys Ile Asn Tyr Lys Leu Leu
610 615 620
Pro Gly Pro Asn Lys Met Leu Pro Lys Val Phe Phe Ser Lys Lys Trp
625 630 635 640
Met Ala Tyr Tyr Asn Pro Ser Glu Asp Ile Gln Lys Ile Tyr Lys Asn
645 650 655
Gly Thr Phe Lys Lys Gly Asp Met Phe Asn Leu Asn Asp Cys His Lys
660 665 670
Leu Ile Asp Phe Phe Lys Asp Ser Ile Ser Arg Tyr Pro Lys Trp Ser
675 680 685
Asn Ala Tyr Asp Phe Asn Phe Ser Glu Thr Glu Lys Tyr Lys Asp Ile
690 695 700
Ala Gly Phe Tyr Arg Glu Val Glu Glu Gln Gly Tyr Lys Val Ser Phe
705 710 715 720
Glu Ser Ala Ser Lys Lys Glu Val Asp Lys Leu Val Glu Glu Gly Lys
725 730 735
Leu Tyr Met Phe Gln Ile Tyr Asn Lys Asp Phe Ser Asp Lys Ser His
740 745 750
Gly Thr Pro Asn Leu His Thr Met Tyr Phe Lys Leu Leu Phe Asp Glu
755 760 765
Asn Asn His Gly Gln Ile Arg Leu Ser Gly Gly Ala Glu Leu Phe Met
770 775 780
Arg Arg Ala Ser Leu Lys Lys Glu Glu Leu Val Val His Pro Ala Asn
785 790 795 800
Ser Pro Ile Ala Asn Lys Asn Pro Asp Asn Pro Lys Lys Thr Thr Thr
805 810 815
Leu Ser Tyr Asp Val Tyr Lys Asp Lys Arg Phe Ser Glu Asp Gln Tyr
820 825 830
Glu Leu His Ile Pro Ile Ala Ile Asn Lys Cys Pro Lys Asn Ile Phe
835 840 845
Lys Ile Asn Thr Glu Val Arg Val Leu Leu Lys His Asp Asp Asn Pro
850 855 860
Tyr Val Ile Gly Ile Asp Arg Gly Glu Arg Asn Leu Leu Tyr Ile Val
865 870 875 880
Val Val Asp Gly Lys Gly Asn Ile Val Glu Gln Tyr Ser Leu Asn Glu
885 890 895
Ile Ile Asn Asn Phe Asn Gly Ile Arg Ile Lys Thr Asp Tyr His Ser
900 905 910
Leu Leu Asp Lys Lys Glu Lys Glu Arg Phe Glu Ala Arg Gln Asn Trp
915 920 925
Thr Ser Ile Glu Asn Ile Lys Glu Leu Lys Ala Gly Tyr Ile Ser Gln
930 935 940
Val Val His Lys Ile Cys Glu Leu Val Glu Lys Tyr Asp Ala Val Ile
945 950 955 960
Ala Leu Glu Asp Leu Asn Ser Gly Phe Lys Asn Ser Arg Val Lys Val
965 970 975
Glu Lys Gln Val Tyr Gln Lys Phe Glu Lys Met Leu Ile Asp Lys Leu
980 985 990
Asn Tyr Met Val Asp Lys Lys Ser Asn Pro Cys Ala Thr Gly Gly Ala
995 1000 1005
Leu Lys Gly Tyr Gln Ile Thr Asn Lys Phe Glu Ser Phe Lys Ser
1010 1015 1020
Met Ser Thr Gln Asn Gly Phe Ile Phe Tyr Ile Pro Ala Trp Leu
1025 1030 1035
Thr Ser Lys Ile Asp Pro Ser Thr Gly Phe Val Asn Leu Leu Lys
1040 1045 1050
Thr Lys Tyr Thr Ser Ile Ala Asp Ser Lys Lys Phe Ile Ser Ser
1055 1060 1065
Phe Asp Arg Ile Met Tyr Val Pro Glu Glu Asp Leu Phe Glu Phe
1070 1075 1080
Ala Leu Asp Tyr Lys Asn Phe Ser Arg Thr Asp Ala Asp Tyr Ile
1085 1090 1095
Lys Lys Trp Lys Leu Tyr Ser Tyr Gly Asn Arg Ile Arg Ile Phe
1100 1105 1110
Arg Asn Pro Lys Lys Asn Asn Val Phe Asp Trp Glu Glu Val Cys
1115 1120 1125
Leu Thr Ser Ala Tyr Lys Glu Leu Phe Asn Lys Tyr Gly Ile Asn
1130 1135 1140
Tyr Gln Gln Gly Asp Ile Arg Ala Leu Leu Cys Glu Gln Ser Asp
1145 1150 1155
Lys Ala Phe Tyr Ser Ser Phe Met Ala Leu Met Ser Leu Met Leu
1160 1165 1170
Gln Met Arg Asn Ser Ile Thr Gly Arg Thr Asp Val Asp Phe Leu
1175 1180 1185
Ile Ser Pro Val Lys Asn Ser Asp Gly Ile Phe Tyr Asp Ser Arg
1190 1195 1200
Asn Tyr Glu Ala Gln Glu Asn Ala Ile Leu Pro Lys Asn Ala Asp
1205 1210 1215
Ala Asn Gly Ala Tyr Asn Ile Ala Arg Lys Val Leu Trp Ala Ile
1220 1225 1230
Gly Gln Phe Lys Lys Ala Glu Asp Glu Lys Leu Asp Lys Val Lys
1235 1240 1245
Ile Ala Ile Ser Asn Lys Glu Trp Leu Glu Tyr Ala Gln Thr Ser
1250 1255 1260
Val Lys His Gly Ser Pro Lys Lys Lys Arg Lys Val Ser Gly Gly
1265 1270 1275
Ser Ser Gly Gly Ser Pro Lys Lys Lys Arg Lys Val
1280 1285 1290
<210> 40
<211> 3852
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 40
atggctccta agaagaagcg gaaggttggt attcacgggg tgcctgcggc tctgtttcaa 60
gattttacac atctgtaccc gctgagtaaa acagtgcggt tcgagctgaa acccatagga 120
aggaccctcg agcacatcca cgcgaagaat tttctgagcc aggatgaaac tatggctgat 180
atgtatcaaa aagttaaggt cattttggac gactatcatc gcgattttat tgccgacatg 240
atgggagagg tgaaactcac gaagcttgct gaattttacg acgtctatct gaagttcagg 300
aaaaatccta aggacgatgg gctgcaaaaa cagcttaaag accttcaagc tgtccttcgg 360
aaggaatcgg tgaagcctat agggtcaggt gggaagtaca aaacaggcta cgatagactc 420
tttggggcaa aactcttcaa agatggaaaa gagttgggtg acctcgcaaa attcgttata 480
gcccaagaag gtgagtcttc tccgaagctg gctcatcttg ctcattttga gaagttcagc 540
acgtatttta ctggatttca cgataatcgg aagaatatgt actcggatga agacaagcat 600
actgcaatag cgtacaggct catccatgag aatttgccga gattcatcga caatctgcaa 660
atcttgacaa caatcaaaca aaagcatagc gccctctatg atcagataat caacgagctc 720
acggcctccg ggctcgacgt ctccttggct tctcatcttg acgggtatca caagctcctt 780
acacaagagg ggatcacggc atacaacagg atcataggag aggtgaatgg atatacaaat 840
aagcataacc agatatgcca caagagcgag cgcatagcga aacttagacc cttgcacaag 900
caaatccttt ctgacggaat gggagtgtca ttccttccgt ctaagttcgc ggatgatagt 960
gagatgtgcc aagcggtcaa cgaattttat cgccattata ctgacgtgtt cgcaaaggtg 1020
caaagtctct ttgacggatt tgatgatcac cagaaagacg ggatctatgt tgaacacaaa 1080
aaccttaatg aactgagcaa acaggcgttc ggcgactttg ctttgctggg gagggtcctt 1140
gatggatact acgtggacgt tgtcaatccg gagttcaatg agcggttcgc aaaggccaag 1200
actgacaatg cgaaagccaa gcttacaaaa gaaaaggaca aattcattaa aggagtccac 1260
tcactggctt ccctcgaaca agcaatagaa caccatacag ctagacacga cgatgagagt 1320
gttcaagccg gaaaacttgg ccagtacttc aaacacggtt tggcgggggt tgacaacccg 1380
attcagaaaa ttcacaataa ccattcgacg attaaagggt ttctggaaag ggaaaggcct 1440
gctggggaac gggcgctccc gaagatcaag tcaggaaaaa acccagaaat gacacagctc 1500
aggcagctga aggaactttt ggacaacgca ttgaatgtgg cgcacttcgc taagctgctg 1560
acaactaaaa caaccttgga caaccaggat ggaaattttt acggggagtt tggggtgctt 1620
tacgacgagc tggctaaaat tccaactctc tacaataagg ttagagatta tctctctcaa 1680
aagccctttt ctaccgaaaa gtataagctc aacttcggca atccgaccct tctcaatggg 1740
tgggacctga acaaagagaa agataacttt ggggttatac ttcagaagga tggatgctat 1800
tacttggcgc ttcttgataa ggctcataaa aaagttttcg acaacgcccc taacactggt 1860
aagaacgtct accaaaagat ggtctacaaa ctgttgcccg gccccaacaa aatgcttcct 1920
aaagtgtttt tcgcaaaatc gaatctcgac tattataatc catctgccga gctccttgac 1980
aaatatgcta aggggaccca taaaaagggt gataatttca acctgaagga ctgccacgcg 2040
cttatcgact ttttcaaagc cgggataaat aagcatccgg agtggcaaca ttttggtttt 2100
aaattttcgc caacgtcgtc ctatcgcgac ctttccgatt tctataggga agttgaacct 2160
caggggtacc aggtcaaatt tgttgacatt aatgcggact acattgatga attggtggag 2220
caagggaagc tctacctctt tcaaatatat aacaaagatt tctcgccaaa agcgcatggt 2280
aaaccgaatc ttcatacctt gtactttaaa gcactttttt cagaagataa cttggcggac 2340
ccgatctaca agctgaatgg ggaagctcag atcttctaca ggaaagcttc gttggacatg 2400
aacgagacta ccatacatcg cgcgggagag gtgcttgaga acaaaaatcc cgacaacccg 2460
aaaaagcggc aattcgttta cgacatcatc aaagacaaac ggtacacgca ggacaaattt 2520
atgctccacg tccccattac catgaatttt ggagtccaag gcatgaccat taaggaattc 2580
aacaaaaagg tcaaccaaag tattcagcaa tacgatgaag tcaatgtcat aggcatagat 2640
cggggagaaa ggcatctgtt gtatcttacc gtgattaact ctaagggtga aatactggag 2700
caacggtcac ttaacgatat aaccacggcg tccgcgaacg gtacacaagt gaccactccc 2760
taccacaaaa tattggataa aagggagata gaacgcttga atgcccgcgt tggctggggt 2820
gagattgaga ccatcaaaga gcttaaatcg ggatatttgt ctcacgtcgt tcatcaaatt 2880
aaccaactca tgcttaagta caatgcaatc gttgtgctcg aggacctgaa ctttggtttc 2940
aaaagaggga ggttcaaggt ggaaaaacaa atttaccaga actttgaaaa cgcgcttatc 3000
aagaaattga atcaccttgt tttgaaagat aaggcagatg acgaaatcgg gtcgtataaa 3060
aatgcactcc agttgacaaa taatttcacg gatttgaagt cgatcggcaa gcaaacaggg 3120
ttcctctttt atgtgccagc gtggaataca tcaaaaattg atccggagac gggatttgtc 3180
gacttgctga agcctaggta tgagaacatt gcccaatctc aggccttttt cggcaaattc 3240
gataaaatat gctacaacac agacaaaggt tattttgaat ttcacattga ttacgccaaa 3300
tttacagata aggcgaaaaa cagcagacag aaatgggcta tctgttctca tggggacaaa 3360
cgctatgtct acgataagac ggctaatcaa aataaaggcg ccgcaaaagg tattaatgtg 3420
aatgatgagc tgaaaagctt gtttgcccgc taccatatca atgataaaca accaaacttg 3480
gtgatggaca tatgccagaa caatgacaaa gaattccaca agtcactcat gtgcctgctt 3540
aaaacccttt tggcgctgcg gtatagcaat gcatctagcg atgaagactt tattttgagt 3600
cccgtggcca acgacgaggg cgtgtttttt aattcagcct tggcggacga tacgcagccc 3660
cagaatgcgg acgcaaacgg cgcgtaccac attgcactga agggactgtg gcttctgaac 3720
gagctgaaaa atagcgacga cctgaataaa gtcaagttgg ccattgacaa tcaaacctgg 3780
ttgaatttcg ctcaaaatag aaagcgtcct gctgccacca aaaaggccgg acaggctaag 3840
aaaaagaagt ga 3852
<210> 41
<211> 1283
<212> PRT
<213> Artificial Sequence
<220>
<223> Fusion protein
<400> 41
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Leu Phe Gln Asp Phe Thr His Leu Tyr Pro Leu Ser Lys Thr Val
20 25 30
Arg Phe Glu Leu Lys Pro Ile Gly Arg Thr Leu Glu His Ile His Ala
35 40 45
Lys Asn Phe Leu Ser Gln Asp Glu Thr Met Ala Asp Met Tyr Gln Lys
50 55 60
Val Lys Val Ile Leu Asp Asp Tyr His Arg Asp Phe Ile Ala Asp Met
65 70 75 80
Met Gly Glu Val Lys Leu Thr Lys Leu Ala Glu Phe Tyr Asp Val Tyr
85 90 95
Leu Lys Phe Arg Lys Asn Pro Lys Asp Asp Gly Leu Gln Lys Gln Leu
100 105 110
Lys Asp Leu Gln Ala Val Leu Arg Lys Glu Ser Val Lys Pro Ile Gly
115 120 125
Ser Gly Gly Lys Tyr Lys Thr Gly Tyr Asp Arg Leu Phe Gly Ala Lys
130 135 140
Leu Phe Lys Asp Gly Lys Glu Leu Gly Asp Leu Ala Lys Phe Val Ile
145 150 155 160
Ala Gln Glu Gly Glu Ser Ser Pro Lys Leu Ala His Leu Ala His Phe
165 170 175
Glu Lys Phe Ser Thr Tyr Phe Thr Gly Phe His Asp Asn Arg Lys Asn
180 185 190
Met Tyr Ser Asp Glu Asp Lys His Thr Ala Ile Ala Tyr Arg Leu Ile
195 200 205
His Glu Asn Leu Pro Arg Phe Ile Asp Asn Leu Gln Ile Leu Thr Thr
210 215 220
Ile Lys Gln Lys His Ser Ala Leu Tyr Asp Gln Ile Ile Asn Glu Leu
225 230 235 240
Thr Ala Ser Gly Leu Asp Val Ser Leu Ala Ser His Leu Asp Gly Tyr
245 250 255
His Lys Leu Leu Thr Gln Glu Gly Ile Thr Ala Tyr Asn Arg Ile Ile
260 265 270
Gly Glu Val Asn Gly Tyr Thr Asn Lys His Asn Gln Ile Cys His Lys
275 280 285
Ser Glu Arg Ile Ala Lys Leu Arg Pro Leu His Lys Gln Ile Leu Ser
290 295 300
Asp Gly Met Gly Val Ser Phe Leu Pro Ser Lys Phe Ala Asp Asp Ser
305 310 315 320
Glu Met Cys Gln Ala Val Asn Glu Phe Tyr Arg His Tyr Thr Asp Val
325 330 335
Phe Ala Lys Val Gln Ser Leu Phe Asp Gly Phe Asp Asp His Gln Lys
340 345 350
Asp Gly Ile Tyr Val Glu His Lys Asn Leu Asn Glu Leu Ser Lys Gln
355 360 365
Ala Phe Gly Asp Phe Ala Leu Leu Gly Arg Val Leu Asp Gly Tyr Tyr
370 375 380
Val Asp Val Val Asn Pro Glu Phe Asn Glu Arg Phe Ala Lys Ala Lys
385 390 395 400
Thr Asp Asn Ala Lys Ala Lys Leu Thr Lys Glu Lys Asp Lys Phe Ile
405 410 415
Lys Gly Val His Ser Leu Ala Ser Leu Glu Gln Ala Ile Glu His His
420 425 430
Thr Ala Arg His Asp Asp Glu Ser Val Gln Ala Gly Lys Leu Gly Gln
435 440 445
Tyr Phe Lys His Gly Leu Ala Gly Val Asp Asn Pro Ile Gln Lys Ile
450 455 460
His Asn Asn His Ser Thr Ile Lys Gly Phe Leu Glu Arg Glu Arg Pro
465 470 475 480
Ala Gly Glu Arg Ala Leu Pro Lys Ile Lys Ser Gly Lys Asn Pro Glu
485 490 495
Met Thr Gln Leu Arg Gln Leu Lys Glu Leu Leu Asp Asn Ala Leu Asn
500 505 510
Val Ala His Phe Ala Lys Leu Leu Thr Thr Lys Thr Thr Leu Asp Asn
515 520 525
Gln Asp Gly Asn Phe Tyr Gly Glu Phe Gly Val Leu Tyr Asp Glu Leu
530 535 540
Ala Lys Ile Pro Thr Leu Tyr Asn Lys Val Arg Asp Tyr Leu Ser Gln
545 550 555 560
Lys Pro Phe Ser Thr Glu Lys Tyr Lys Leu Asn Phe Gly Asn Pro Thr
565 570 575
Leu Leu Asn Gly Trp Asp Leu Asn Lys Glu Lys Asp Asn Phe Gly Val
580 585 590
Ile Leu Gln Lys Asp Gly Cys Tyr Tyr Leu Ala Leu Leu Asp Lys Ala
595 600 605
His Lys Lys Val Phe Asp Asn Ala Pro Asn Thr Gly Lys Asn Val Tyr
610 615 620
Gln Lys Met Val Tyr Lys Leu Leu Pro Gly Pro Asn Lys Met Leu Pro
625 630 635 640
Lys Val Phe Phe Ala Lys Ser Asn Leu Asp Tyr Tyr Asn Pro Ser Ala
645 650 655
Glu Leu Leu Asp Lys Tyr Ala Lys Gly Thr His Lys Lys Gly Asp Asn
660 665 670
Phe Asn Leu Lys Asp Cys His Ala Leu Ile Asp Phe Phe Lys Ala Gly
675 680 685
Ile Asn Lys His Pro Glu Trp Gln His Phe Gly Phe Lys Phe Ser Pro
690 695 700
Thr Ser Ser Tyr Arg Asp Leu Ser Asp Phe Tyr Arg Glu Val Glu Pro
705 710 715 720
Gln Gly Tyr Gln Val Lys Phe Val Asp Ile Asn Ala Asp Tyr Ile Asp
725 730 735
Glu Leu Val Glu Gln Gly Lys Leu Tyr Leu Phe Gln Ile Tyr Asn Lys
740 745 750
Asp Phe Ser Pro Lys Ala His Gly Lys Pro Asn Leu His Thr Leu Tyr
755 760 765
Phe Lys Ala Leu Phe Ser Glu Asp Asn Leu Ala Asp Pro Ile Tyr Lys
770 775 780
Leu Asn Gly Glu Ala Gln Ile Phe Tyr Arg Lys Ala Ser Leu Asp Met
785 790 795 800
Asn Glu Thr Thr Ile His Arg Ala Gly Glu Val Leu Glu Asn Lys Asn
805 810 815
Pro Asp Asn Pro Lys Lys Arg Gln Phe Val Tyr Asp Ile Ile Lys Asp
820 825 830
Lys Arg Tyr Thr Gln Asp Lys Phe Met Leu His Val Pro Ile Thr Met
835 840 845
Asn Phe Gly Val Gln Gly Met Thr Ile Lys Glu Phe Asn Lys Lys Val
850 855 860
Asn Gln Ser Ile Gln Gln Tyr Asp Glu Val Asn Val Ile Gly Ile Asp
865 870 875 880
Arg Gly Glu Arg His Leu Leu Tyr Leu Thr Val Ile Asn Ser Lys Gly
885 890 895
Glu Ile Leu Glu Gln Arg Ser Leu Asn Asp Ile Thr Thr Ala Ser Ala
900 905 910
Asn Gly Thr Gln Val Thr Thr Pro Tyr His Lys Ile Leu Asp Lys Arg
915 920 925
Glu Ile Glu Arg Leu Asn Ala Arg Val Gly Trp Gly Glu Ile Glu Thr
930 935 940
Ile Lys Glu Leu Lys Ser Gly Tyr Leu Ser His Val Val His Gln Ile
945 950 955 960
Asn Gln Leu Met Leu Lys Tyr Asn Ala Ile Val Val Leu Glu Asp Leu
965 970 975
Asn Phe Gly Phe Lys Arg Gly Arg Phe Lys Val Glu Lys Gln Ile Tyr
980 985 990
Gln Asn Phe Glu Asn Ala Leu Ile Lys Lys Leu Asn His Leu Val Leu
995 1000 1005
Lys Asp Lys Ala Asp Asp Glu Ile Gly Ser Tyr Lys Asn Ala Leu
1010 1015 1020
Gln Leu Thr Asn Asn Phe Thr Asp Leu Lys Ser Ile Gly Lys Gln
1025 1030 1035
Thr Gly Phe Leu Phe Tyr Val Pro Ala Trp Asn Thr Ser Lys Ile
1040 1045 1050
Asp Pro Glu Thr Gly Phe Val Asp Leu Leu Lys Pro Arg Tyr Glu
1055 1060 1065
Asn Ile Ala Gln Ser Gln Ala Phe Phe Gly Lys Phe Asp Lys Ile
1070 1075 1080
Cys Tyr Asn Thr Asp Lys Gly Tyr Phe Glu Phe His Ile Asp Tyr
1085 1090 1095
Ala Lys Phe Thr Asp Lys Ala Lys Asn Ser Arg Gln Lys Trp Ala
1100 1105 1110
Ile Cys Ser His Gly Asp Lys Arg Tyr Val Tyr Asp Lys Thr Ala
1115 1120 1125
Asn Gln Asn Lys Gly Ala Ala Lys Gly Ile Asn Val Asn Asp Glu
1130 1135 1140
Leu Lys Ser Leu Phe Ala Arg Tyr His Ile Asn Asp Lys Gln Pro
1145 1150 1155
Asn Leu Val Met Asp Ile Cys Gln Asn Asn Asp Lys Glu Phe His
1160 1165 1170
Lys Ser Leu Met Cys Leu Leu Lys Thr Leu Leu Ala Leu Arg Tyr
1175 1180 1185
Ser Asn Ala Ser Ser Asp Glu Asp Phe Ile Leu Ser Pro Val Ala
1190 1195 1200
Asn Asp Glu Gly Val Phe Phe Asn Ser Ala Leu Ala Asp Asp Thr
1205 1210 1215
Gln Pro Gln Asn Ala Asp Ala Asn Gly Ala Tyr His Ile Ala Leu
1220 1225 1230
Lys Gly Leu Trp Leu Leu Asn Glu Leu Lys Asn Ser Asp Asp Leu
1235 1240 1245
Asn Lys Val Lys Leu Ala Ile Asp Asn Gln Thr Trp Leu Asn Phe
1250 1255 1260
Ala Gln Asn Arg Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln
1265 1270 1275
Ala Lys Lys Lys Lys
1280
<210> 42
<211> 3936
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 42
atgccgaaga agaagcgcaa ggtcgggggc gggggctcag gcgggggcgg gagcggcggc 60
gggggctctg ggggcggcgg cagcggcggg ggcggcagcg ggggcggcgg gtcgatgctg 120
ttccaggatt tcactcatct gtaccctctc tcaaagactg ttcggttcga gctcaagcct 180
attgggcgga ctctggagca catccacgcg aagaacttcc tcagccagga cgaaaccatg 240
gccgacatgt accagaaggt caaggtcatc ctcgacgact accacaggga cttcatcgcg 300
gacatgatgg gcgaggtgaa gctgacgaag ctcgccgagt tctacgacgt ctacctcaag 360
ttccgcaaga acccgaagga cgacggcctc cagaagcagc tcaaggacct gcaggccgtc 420
ctgaggaagg agtccgtcaa gcccatcggc agcggcggca agtacaagac cggctacgac 480
aggctgttcg gcgccaagct gttcaaggac ggcaaggagc tcggcgacct ggcgaagttc 540
gtgatcgcgc aggagggcga gagctccccc aagctggccc acctggccca cttcgagaag 600
ttcagcacgt acttcaccgg cttccacgac aacaggaaga acatgtacag cgacgaggac 660
aagcacacgg ccatcgccta ccgcctcatc cacgagaacc tgccccgctt catcgacaac 720
ctgcagatcc tgacgaccat caagcagaag cactccgccc tgtacgacca gatcatcaac 780
gagctcaccg cgagcggcct cgacgtgtcc ctcgccagcc acctcgacgg ctaccacaag 840
ctcctgaccc aggagggcat caccgcctac aaccgcatca tcggcgaggt gaacggctac 900
accaacaagc acaaccagat ctgccacaag tccgagagga tcgccaagct caggcccctg 960
cacaagcaga tcctcagcga cggcatgggc gtgagcttcc tcccgtccaa gttcgccgac 1020
gactccgaga tgtgccaggc cgtgaacgag ttctacaggc actacaccga cgtgttcgcc 1080
aaggtgcagt ccctgttcga cggcttcgac gaccaccaga aggacggcat ctacgtggag 1140
cacaagaacc tgaacgagct gtccaagcag gccttcggcg acttcgccct cctgggccgc 1200
gtgctggacg gctactacgt ggacgtcgtg aacccggagt tcaacgagcg cttcgcgaag 1260
gcgaagacgg acaacgcgaa ggccaagctc accaaggaga aggacaagtt catcaagggc 1320
gtccacagcc tcgcgtccct ggagcaggcg atcgagcacc acaccgcgcg ccacgacgac 1380
gagtccgtgc aggccggcaa gctcggccag tacttcaagc acggcctggc cggcgtcgac 1440
aacccgatcc agaagatcca caacaaccac tccaccatca agggcttcct ggagagggag 1500
cgcccggcgg gcgagcgcgc gctccccaag atcaagtccg gcaagaaccc cgagatgacg 1560
cagctcaggc agctgaagga gctgctcgac aacgcgctca acgtggcgca cttcgccaag 1620
ctgctcacga ccaagaccac gctggacaac caggacggca acttctacgg cgagttcggc 1680
gtcctgtacg acgagctggc gaagatcccg accctgtaca acaaggtccg cgactacctg 1740
agccagaagc ccttctccac cgagaagtac aagctcaact tcggcaaccc gaccctcctg 1800
aacggctggg acctcaacaa ggagaaggac aacttcggcg tgatcctcca gaaggacggc 1860
tgctactacc tcgccctgct ggacaaggcg cacaagaagg tcttcgacaa cgccccgaac 1920
accggcaaga acgtgtacca gaagatggtg tacaagctgc tccccggccc caacaagatg 1980
ctgccgaagg tgttcttcgc gaagtccaac ctcgactact acaaccccag cgccgagctc 2040
ctggacaagt acgccaaggg cacgcacaag aagggcgaca acttcaacct caaggactgc 2100
cacgcgctga tcgacttctt caaggcgggc atcaacaagc accccgagtg gcagcacttc 2160
ggcttcaagt tcagcccgac ctccagctac agggacctca gcgacttcta ccgcgaggtg 2220
gagccccagg gctaccaggt gaagttcgtc gacatcaacg ccgactacat cgacgagctc 2280
gtcgagcagg gcaagctcta cctgttccag atctacaaca aggacttctc cccgaaggcc 2340
cacggcaagc cgaacctcca cacgctctac ttcaaggccc tcttcagcga ggacaacctg 2400
gccgacccga tctacaagct caacggcgag gcgcagatct tctaccgcaa ggccagcctg 2460
gacatgaacg aaacgaccat ccacagggcc ggcgaggtcc tggagaacaa gaacccggac 2520
aacccgaaga agaggcagtt cgtctacgac atcatcaagg acaagaggta cacccaggac 2580
aagttcatgc tccacgtccc gatcaccatg aacttcggcg tccagggcat gaccatcaag 2640
gagttcaaca agaaggtcaa ccagagcatc cagcagtacg acgaggtgaa cgtcatcggc 2700
atcgaccgcg gcgagaggca cctgctctac ctgacggtca tcaactccaa gggcgagatc 2760
ctcgagcagc gcagcctgaa cgacatcacg accgcgagcg ccaacggcac gcaggtcacc 2820
acgccgtacc acaagatcct cgacaagcgc gagatcgaga ggctgaacgc gcgcgtcggc 2880
tggggcgaga tcgaaacgat caaggagctc aagtccggct acctcagcca cgtcgtgcac 2940
cagatcaacc agctcatgct gaagtacaac gcgatcgtgg tcctcgagga cctgaacttc 3000
ggcttcaaga ggggccgctt caaggtggag aagcagatct accagaactt cgagaacgcc 3060
ctgatcaaga agctcaacca cctggtcctc aaggacaagg cggacgacga gatcggcagc 3120
tacaagaacg cgctccagct gaccaacaac ttcacggacc tcaagtccat cggcaagcag 3180
acgggcttcc tgttctacgt gccggcgtgg aacacctcca agatcgaccc ggaaaccggc 3240
ttcgtcgacc tgctcaagcc gcgctacgag aacatcgcgc agtcccaggc gttcttcggc 3300
aagttcgaca agatctgcta caacaccgac aagggctact tcgagttcca catcgactac 3360
gcgaagttca ccgacaaggc caagaactcc aggcagaagt gggccatctg cagccacggc 3420
gacaagcgct acgtgtacga caagacggcg aaccagaaca agggcgcggc caagggcatc 3480
aacgtgaacg acgagctgaa gtccctcttc gcgcgctacc acatcaacga caagcagccg 3540
aacctcgtca tggacatctg ccagaacaac gacaaggagt tccacaagag cctgatgtgc 3600
ctgctcaaga ccctgctcgc cctccgctac tccaacgcga gctccgacga ggacttcatc 3660
ctcagccccg tcgcgaacga cgagggcgtg ttcttcaact ccgccctcgc ggacgacacg 3720
cagccgcaga acgccgacgc gaacggcgcc taccacatcg ccctcaaggg cctgtggctg 3780
ctcaacgagc tcaagaactc cgacgacctg aacaaggtga agctcgccat tgacaaccag 3840
acgtggctga atttcgctca gaataggccg aagaagaagc gcaaggtgtc cggcggcagc 3900
tccggcggca gcccgaagaa gaagcgcaaa gtgtga 3936
<210> 43
<211> 1311
<212> PRT
<213> Artificial Sequence
<220>
<223> Fusion protein
<400> 43
Met Pro Lys Lys Lys Arg Lys Val Gly Gly Gly Gly Ser Gly Gly Gly
1 5 10 15
Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly
20 25 30
Ser Gly Gly Gly Gly Ser Met Leu Phe Gln Asp Phe Thr His Leu Tyr
35 40 45
Pro Leu Ser Lys Thr Val Arg Phe Glu Leu Lys Pro Ile Gly Arg Thr
50 55 60
Leu Glu His Ile His Ala Lys Asn Phe Leu Ser Gln Asp Glu Thr Met
65 70 75 80
Ala Asp Met Tyr Gln Lys Val Lys Val Ile Leu Asp Asp Tyr His Arg
85 90 95
Asp Phe Ile Ala Asp Met Met Gly Glu Val Lys Leu Thr Lys Leu Ala
100 105 110
Glu Phe Tyr Asp Val Tyr Leu Lys Phe Arg Lys Asn Pro Lys Asp Asp
115 120 125
Gly Leu Gln Lys Gln Leu Lys Asp Leu Gln Ala Val Leu Arg Lys Glu
130 135 140
Ser Val Lys Pro Ile Gly Ser Gly Gly Lys Tyr Lys Thr Gly Tyr Asp
145 150 155 160
Arg Leu Phe Gly Ala Lys Leu Phe Lys Asp Gly Lys Glu Leu Gly Asp
165 170 175
Leu Ala Lys Phe Val Ile Ala Gln Glu Gly Glu Ser Ser Pro Lys Leu
180 185 190
Ala His Leu Ala His Phe Glu Lys Phe Ser Thr Tyr Phe Thr Gly Phe
195 200 205
His Asp Asn Arg Lys Asn Met Tyr Ser Asp Glu Asp Lys His Thr Ala
210 215 220
Ile Ala Tyr Arg Leu Ile His Glu Asn Leu Pro Arg Phe Ile Asp Asn
225 230 235 240
Leu Gln Ile Leu Thr Thr Ile Lys Gln Lys His Ser Ala Leu Tyr Asp
245 250 255
Gln Ile Ile Asn Glu Leu Thr Ala Ser Gly Leu Asp Val Ser Leu Ala
260 265 270
Ser His Leu Asp Gly Tyr His Lys Leu Leu Thr Gln Glu Gly Ile Thr
275 280 285
Ala Tyr Asn Arg Ile Ile Gly Glu Val Asn Gly Tyr Thr Asn Lys His
290 295 300
Asn Gln Ile Cys His Lys Ser Glu Arg Ile Ala Lys Leu Arg Pro Leu
305 310 315 320
His Lys Gln Ile Leu Ser Asp Gly Met Gly Val Ser Phe Leu Pro Ser
325 330 335
Lys Phe Ala Asp Asp Ser Glu Met Cys Gln Ala Val Asn Glu Phe Tyr
340 345 350
Arg His Tyr Thr Asp Val Phe Ala Lys Val Gln Ser Leu Phe Asp Gly
355 360 365
Phe Asp Asp His Gln Lys Asp Gly Ile Tyr Val Glu His Lys Asn Leu
370 375 380
Asn Glu Leu Ser Lys Gln Ala Phe Gly Asp Phe Ala Leu Leu Gly Arg
385 390 395 400
Val Leu Asp Gly Tyr Tyr Val Asp Val Val Asn Pro Glu Phe Asn Glu
405 410 415
Arg Phe Ala Lys Ala Lys Thr Asp Asn Ala Lys Ala Lys Leu Thr Lys
420 425 430
Glu Lys Asp Lys Phe Ile Lys Gly Val His Ser Leu Ala Ser Leu Glu
435 440 445
Gln Ala Ile Glu His His Thr Ala Arg His Asp Asp Glu Ser Val Gln
450 455 460
Ala Gly Lys Leu Gly Gln Tyr Phe Lys His Gly Leu Ala Gly Val Asp
465 470 475 480
Asn Pro Ile Gln Lys Ile His Asn Asn His Ser Thr Ile Lys Gly Phe
485 490 495
Leu Glu Arg Glu Arg Pro Ala Gly Glu Arg Ala Leu Pro Lys Ile Lys
500 505 510
Ser Gly Lys Asn Pro Glu Met Thr Gln Leu Arg Gln Leu Lys Glu Leu
515 520 525
Leu Asp Asn Ala Leu Asn Val Ala His Phe Ala Lys Leu Leu Thr Thr
530 535 540
Lys Thr Thr Leu Asp Asn Gln Asp Gly Asn Phe Tyr Gly Glu Phe Gly
545 550 555 560
Val Leu Tyr Asp Glu Leu Ala Lys Ile Pro Thr Leu Tyr Asn Lys Val
565 570 575
Arg Asp Tyr Leu Ser Gln Lys Pro Phe Ser Thr Glu Lys Tyr Lys Leu
580 585 590
Asn Phe Gly Asn Pro Thr Leu Leu Asn Gly Trp Asp Leu Asn Lys Glu
595 600 605
Lys Asp Asn Phe Gly Val Ile Leu Gln Lys Asp Gly Cys Tyr Tyr Leu
610 615 620
Ala Leu Leu Asp Lys Ala His Lys Lys Val Phe Asp Asn Ala Pro Asn
625 630 635 640
Thr Gly Lys Asn Val Tyr Gln Lys Met Val Tyr Lys Leu Leu Pro Gly
645 650 655
Pro Asn Lys Met Leu Pro Lys Val Phe Phe Ala Lys Ser Asn Leu Asp
660 665 670
Tyr Tyr Asn Pro Ser Ala Glu Leu Leu Asp Lys Tyr Ala Lys Gly Thr
675 680 685
His Lys Lys Gly Asp Asn Phe Asn Leu Lys Asp Cys His Ala Leu Ile
690 695 700
Asp Phe Phe Lys Ala Gly Ile Asn Lys His Pro Glu Trp Gln His Phe
705 710 715 720
Gly Phe Lys Phe Ser Pro Thr Ser Ser Tyr Arg Asp Leu Ser Asp Phe
725 730 735
Tyr Arg Glu Val Glu Pro Gln Gly Tyr Gln Val Lys Phe Val Asp Ile
740 745 750
Asn Ala Asp Tyr Ile Asp Glu Leu Val Glu Gln Gly Lys Leu Tyr Leu
755 760 765
Phe Gln Ile Tyr Asn Lys Asp Phe Ser Pro Lys Ala His Gly Lys Pro
770 775 780
Asn Leu His Thr Leu Tyr Phe Lys Ala Leu Phe Ser Glu Asp Asn Leu
785 790 795 800
Ala Asp Pro Ile Tyr Lys Leu Asn Gly Glu Ala Gln Ile Phe Tyr Arg
805 810 815
Lys Ala Ser Leu Asp Met Asn Glu Thr Thr Ile His Arg Ala Gly Glu
820 825 830
Val Leu Glu Asn Lys Asn Pro Asp Asn Pro Lys Lys Arg Gln Phe Val
835 840 845
Tyr Asp Ile Ile Lys Asp Lys Arg Tyr Thr Gln Asp Lys Phe Met Leu
850 855 860
His Val Pro Ile Thr Met Asn Phe Gly Val Gln Gly Met Thr Ile Lys
865 870 875 880
Glu Phe Asn Lys Lys Val Asn Gln Ser Ile Gln Gln Tyr Asp Glu Val
885 890 895
Asn Val Ile Gly Ile Asp Arg Gly Glu Arg His Leu Leu Tyr Leu Thr
900 905 910
Val Ile Asn Ser Lys Gly Glu Ile Leu Glu Gln Arg Ser Leu Asn Asp
915 920 925
Ile Thr Thr Ala Ser Ala Asn Gly Thr Gln Val Thr Thr Pro Tyr His
930 935 940
Lys Ile Leu Asp Lys Arg Glu Ile Glu Arg Leu Asn Ala Arg Val Gly
945 950 955 960
Trp Gly Glu Ile Glu Thr Ile Lys Glu Leu Lys Ser Gly Tyr Leu Ser
965 970 975
His Val Val His Gln Ile Asn Gln Leu Met Leu Lys Tyr Asn Ala Ile
980 985 990
Val Val Leu Glu Asp Leu Asn Phe Gly Phe Lys Arg Gly Arg Phe Lys
995 1000 1005
Val Glu Lys Gln Ile Tyr Gln Asn Phe Glu Asn Ala Leu Ile Lys
1010 1015 1020
Lys Leu Asn His Leu Val Leu Lys Asp Lys Ala Asp Asp Glu Ile
1025 1030 1035
Gly Ser Tyr Lys Asn Ala Leu Gln Leu Thr Asn Asn Phe Thr Asp
1040 1045 1050
Leu Lys Ser Ile Gly Lys Gln Thr Gly Phe Leu Phe Tyr Val Pro
1055 1060 1065
Ala Trp Asn Thr Ser Lys Ile Asp Pro Glu Thr Gly Phe Val Asp
1070 1075 1080
Leu Leu Lys Pro Arg Tyr Glu Asn Ile Ala Gln Ser Gln Ala Phe
1085 1090 1095
Phe Gly Lys Phe Asp Lys Ile Cys Tyr Asn Thr Asp Lys Gly Tyr
1100 1105 1110
Phe Glu Phe His Ile Asp Tyr Ala Lys Phe Thr Asp Lys Ala Lys
1115 1120 1125
Asn Ser Arg Gln Lys Trp Ala Ile Cys Ser His Gly Asp Lys Arg
1130 1135 1140
Tyr Val Tyr Asp Lys Thr Ala Asn Gln Asn Lys Gly Ala Ala Lys
1145 1150 1155
Gly Ile Asn Val Asn Asp Glu Leu Lys Ser Leu Phe Ala Arg Tyr
1160 1165 1170
His Ile Asn Asp Lys Gln Pro Asn Leu Val Met Asp Ile Cys Gln
1175 1180 1185
Asn Asn Asp Lys Glu Phe His Lys Ser Leu Met Cys Leu Leu Lys
1190 1195 1200
Thr Leu Leu Ala Leu Arg Tyr Ser Asn Ala Ser Ser Asp Glu Asp
1205 1210 1215
Phe Ile Leu Ser Pro Val Ala Asn Asp Glu Gly Val Phe Phe Asn
1220 1225 1230
Ser Ala Leu Ala Asp Asp Thr Gln Pro Gln Asn Ala Asp Ala Asn
1235 1240 1245
Gly Ala Tyr His Ile Ala Leu Lys Gly Leu Trp Leu Leu Asn Glu
1250 1255 1260
Leu Lys Asn Ser Asp Asp Leu Asn Lys Val Lys Leu Ala Ile Asp
1265 1270 1275
Asn Gln Thr Trp Leu Asn Phe Ala Gln Asn Arg Pro Lys Lys Lys
1280 1285 1290
Arg Lys Val Ser Gly Gly Ser Ser Gly Gly Ser Pro Lys Lys Lys
1295 1300 1305
Arg Lys Val
1310
<210> 44
<211> 36
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 44
Gly Gly Gly Gly Ser Gly Gly Gly Gly Gly Ser Gly Gly Gly Gly Gly
1 5 10 15
Ser Gly Gly Gly Gly Gly Ser Gly Gly Gly Gly Gly Ser Gly Gly Gly
20 25 30
Gly Gly Ser Gly
35
<210> 45
<211> 1260
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<220>
<221> xNLS-03
<222> (1)..(9)
<220>
<221> xEpitope-03
<222> (10)..(17)
<220>
<221> xNLS-04
<222> (1245)..(1260)
<400> 45
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Ser Lys Leu Glu Lys Phe Thr Asn Cys Tyr Ser Leu Ser Lys Thr
20 25 30
Leu Arg Phe Lys Ala Ile Pro Val Gly Lys Thr Gln Glu Asn Ile Asp
35 40 45
Asn Lys Arg Leu Leu Val Glu Asp Glu Lys Arg Ala Glu Asp Tyr Lys
50 55 60
Gly Val Lys Lys Leu Leu Asp Arg Tyr Tyr Leu Ser Phe Ile Asn Asp
65 70 75 80
Val Leu His Ser Ile Lys Leu Lys Asn Leu Asn Asn Tyr Ile Ser Leu
85 90 95
Phe Arg Lys Lys Thr Arg Thr Glu Lys Glu Asn Lys Glu Leu Glu Asn
100 105 110
Leu Glu Ile Asn Leu Arg Lys Glu Ile Ala Lys Ala Phe Lys Gly Asn
115 120 125
Glu Gly Tyr Lys Ser Leu Phe Lys Lys Asp Ile Ile Glu Thr Ile Leu
130 135 140
Pro Glu Phe Leu Asp Asp Lys Asp Glu Ile Ala Leu Val Asn Ser Phe
145 150 155 160
Asn Gly Phe Thr Thr Ala Phe Thr Gly Phe Phe Asp Asn Arg Glu Asn
165 170 175
Met Phe Ser Glu Glu Ala Lys Ser Thr Ser Ile Ala Phe Arg Cys Ile
180 185 190
Asn Glu Asn Leu Thr Arg Tyr Ile Ser Asn Met Asp Ile Phe Glu Lys
195 200 205
Val Asp Ala Ile Phe Asp Lys His Glu Val Gln Glu Ile Lys Glu Lys
210 215 220
Ile Leu Asn Ser Asp Tyr Asp Val Glu Asp Phe Phe Glu Gly Glu Phe
225 230 235 240
Phe Asn Phe Val Leu Thr Gln Glu Gly Ile Asp Val Tyr Asn Ala Ile
245 250 255
Ile Gly Gly Phe Val Thr Glu Ser Gly Glu Lys Ile Lys Gly Leu Asn
260 265 270
Glu Tyr Ile Asn Leu Tyr Asn Gln Lys Thr Lys Gln Lys Leu Pro Lys
275 280 285
Phe Lys Pro Leu Tyr Lys Gln Val Leu Ser Asp Arg Glu Ser Leu Ser
290 295 300
Phe Tyr Gly Glu Gly Tyr Thr Ser Asp Glu Glu Val Leu Glu Val Phe
305 310 315 320
Arg Asn Thr Leu Asn Lys Asn Ser Glu Ile Phe Ser Ser Ile Lys Lys
325 330 335
Leu Glu Lys Leu Phe Lys Asn Phe Asp Glu Tyr Ser Ser Ala Gly Ile
340 345 350
Phe Val Lys Asn Gly Pro Ala Ile Ser Thr Ile Ser Lys Asp Ile Phe
355 360 365
Gly Glu Trp Asn Val Ile Arg Asp Lys Trp Asn Ala Glu Tyr Asp Asp
370 375 380
Ile His Leu Lys Lys Lys Ala Val Val Thr Glu Lys Tyr Glu Asp Asp
385 390 395 400
Arg Arg Lys Ser Phe Lys Lys Ile Gly Ser Phe Ser Leu Glu Gln Leu
405 410 415
Gln Glu Tyr Ala Asp Ala Asp Leu Ser Val Val Glu Lys Leu Lys Glu
420 425 430
Ile Ile Ile Gln Lys Val Asp Glu Ile Tyr Lys Val Tyr Gly Ser Ser
435 440 445
Glu Lys Leu Phe Asp Ala Asp Phe Val Leu Glu Lys Ser Leu Lys Lys
450 455 460
Asn Asp Ala Val Val Ala Ile Met Lys Asp Leu Leu Asp Ser Val Lys
465 470 475 480
Ser Phe Glu Asn Tyr Ile Lys Ala Phe Phe Gly Glu Gly Lys Glu Thr
485 490 495
Asn Arg Asp Glu Ser Phe Tyr Gly Asp Phe Val Leu Ala Tyr Asp Ile
500 505 510
Leu Leu Lys Val Asp His Ile Tyr Asp Ala Ile Arg Asn Tyr Val Thr
515 520 525
Gln Lys Pro Tyr Ser Lys Asp Lys Phe Lys Leu Tyr Phe Gln Asn Pro
530 535 540
Gln Phe Met Gly Gly Trp Asp Lys Asp Lys Glu Thr Asp Tyr Arg Ala
545 550 555 560
Thr Ile Leu Arg Tyr Gly Ser Lys Tyr Tyr Leu Ala Ile Met Asp Lys
565 570 575
Lys Tyr Ala Lys Cys Leu Gln Lys Ile Asp Lys Asp Asp Val Asn Gly
580 585 590
Asn Tyr Glu Lys Ile Asn Tyr Lys Leu Leu Pro Gly Pro Asn Lys Met
595 600 605
Leu Pro Lys Val Phe Phe Ser Lys Lys Trp Met Ala Tyr Tyr Asn Pro
610 615 620
Ser Glu Asp Ile Gln Lys Ile Tyr Lys Asn Gly Thr Phe Lys Lys Gly
625 630 635 640
Asp Met Phe Asn Leu Asn Asp Cys His Lys Leu Ile Asp Phe Phe Lys
645 650 655
Asp Ser Ile Ser Arg Tyr Pro Lys Trp Ser Asn Ala Tyr Asp Phe Asn
660 665 670
Phe Ser Glu Thr Glu Lys Tyr Lys Asp Ile Ala Gly Phe Tyr Arg Glu
675 680 685
Val Glu Glu Gln Gly Tyr Lys Val Ser Phe Glu Ser Ala Ser Lys Lys
690 695 700
Glu Val Asp Lys Leu Val Glu Glu Gly Lys Leu Tyr Met Phe Gln Ile
705 710 715 720
Tyr Asn Lys Asp Phe Ser Asp Lys Ser His Gly Thr Pro Asn Leu His
725 730 735
Thr Met Tyr Phe Lys Leu Leu Phe Asp Glu Asn Asn His Gly Gln Ile
740 745 750
Arg Leu Ser Gly Gly Ala Glu Leu Phe Met Arg Arg Ala Ser Leu Lys
755 760 765
Lys Glu Glu Leu Val Val His Pro Ala Asn Ser Pro Ile Ala Asn Lys
770 775 780
Asn Pro Asp Asn Pro Lys Lys Thr Thr Thr Leu Ser Tyr Asp Val Tyr
785 790 795 800
Lys Asp Lys Arg Phe Ser Glu Asp Gln Tyr Glu Leu His Ile Pro Ile
805 810 815
Ala Ile Asn Lys Cys Pro Lys Asn Ile Phe Lys Ile Asn Thr Glu Val
820 825 830
Arg Val Leu Leu Lys His Asp Asp Asn Pro Tyr Val Ile Gly Ile Asp
835 840 845
Arg Gly Glu Arg Asn Leu Leu Tyr Ile Val Val Val Asp Gly Lys Gly
850 855 860
Asn Ile Val Glu Gln Tyr Ser Leu Asn Glu Ile Ile Asn Asn Phe Asn
865 870 875 880
Gly Ile Arg Ile Lys Thr Asp Tyr His Ser Leu Leu Asp Lys Lys Glu
885 890 895
Lys Glu Arg Phe Glu Ala Arg Gln Asn Trp Thr Ser Ile Glu Asn Ile
900 905 910
Lys Glu Leu Lys Ala Gly Tyr Ile Ser Gln Val Val His Lys Ile Cys
915 920 925
Glu Leu Val Glu Lys Tyr Asp Ala Val Ile Ala Leu Glu Asp Leu Asn
930 935 940
Ser Gly Phe Lys Asn Ser Arg Val Lys Val Glu Lys Gln Val Tyr Gln
945 950 955 960
Lys Phe Glu Lys Met Leu Ile Asp Lys Leu Asn Tyr Met Val Asp Lys
965 970 975
Lys Ser Asn Pro Cys Ala Thr Gly Gly Ala Leu Lys Gly Tyr Gln Ile
980 985 990
Thr Asn Lys Phe Glu Ser Phe Lys Ser Met Ser Thr Gln Asn Gly Phe
995 1000 1005
Ile Phe Tyr Ile Pro Ala Trp Leu Thr Ser Lys Ile Asp Pro Ser
1010 1015 1020
Thr Gly Phe Val Asn Leu Leu Lys Thr Lys Tyr Thr Ser Ile Ala
1025 1030 1035
Asp Ser Lys Lys Phe Ile Ser Ser Phe Asp Arg Ile Met Tyr Val
1040 1045 1050
Pro Glu Glu Asp Leu Phe Glu Phe Ala Leu Asp Tyr Lys Asn Phe
1055 1060 1065
Ser Arg Thr Asp Ala Asp Tyr Ile Lys Lys Trp Lys Leu Tyr Ser
1070 1075 1080
Tyr Gly Asn Arg Ile Arg Ile Phe Arg Asn Pro Lys Lys Asn Asn
1085 1090 1095
Val Phe Asp Trp Glu Glu Val Cys Leu Thr Ser Ala Tyr Lys Glu
1100 1105 1110
Leu Phe Asn Lys Tyr Gly Ile Asn Tyr Gln Gln Gly Asp Ile Arg
1115 1120 1125
Ala Leu Leu Cys Glu Gln Ser Asp Lys Ala Phe Tyr Ser Ser Phe
1130 1135 1140
Met Ala Leu Met Ser Leu Met Leu Gln Met Arg Asn Ser Ile Thr
1145 1150 1155
Gly Arg Thr Asp Val Asp Phe Leu Ile Ser Pro Val Lys Asn Ser
1160 1165 1170
Asp Gly Ile Phe Tyr Asp Ser Arg Asn Tyr Glu Ala Gln Glu Asn
1175 1180 1185
Ala Ile Leu Pro Lys Asn Ala Asp Ala Asn Gly Ala Tyr Asn Ile
1190 1195 1200
Ala Arg Lys Val Leu Trp Ala Ile Gly Gln Phe Lys Lys Ala Glu
1205 1210 1215
Asp Glu Lys Leu Asp Lys Val Lys Ile Ala Ile Ser Asn Lys Glu
1220 1225 1230
Trp Leu Glu Tyr Ala Gln Thr Ser Val Lys His Lys Arg Pro Ala
1235 1240 1245
Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys
1250 1255 1260
<210> 46
<211> 1283
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<220>
<221> xNLS-03
<222> (1)..(9)
<220>
<221> xEpitope-03
<222> (10)..(17)
<220>
<221> xNLS-04
<222> (1268)..(1283)
<400> 46
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Leu Phe Gln Asp Phe Thr His Leu Tyr Pro Leu Ser Lys Thr Val
20 25 30
Arg Phe Glu Leu Lys Pro Ile Gly Arg Thr Leu Glu His Ile His Ala
35 40 45
Lys Asn Phe Leu Ser Gln Asp Glu Thr Met Ala Asp Met Tyr Gln Lys
50 55 60
Val Lys Val Ile Leu Asp Asp Tyr His Arg Asp Phe Ile Ala Asp Met
65 70 75 80
Met Gly Glu Val Lys Leu Thr Lys Leu Ala Glu Phe Tyr Asp Val Tyr
85 90 95
Leu Lys Phe Arg Lys Asn Pro Lys Asp Asp Gly Leu Gln Lys Gln Leu
100 105 110
Lys Asp Leu Gln Ala Val Leu Arg Lys Glu Ser Val Lys Pro Ile Gly
115 120 125
Ser Gly Gly Lys Tyr Lys Thr Gly Tyr Asp Arg Leu Phe Gly Ala Lys
130 135 140
Leu Phe Lys Asp Gly Lys Glu Leu Gly Asp Leu Ala Lys Phe Val Ile
145 150 155 160
Ala Gln Glu Gly Glu Ser Ser Pro Lys Leu Ala His Leu Ala His Phe
165 170 175
Glu Lys Phe Ser Thr Tyr Phe Thr Gly Phe His Asp Asn Arg Lys Asn
180 185 190
Met Tyr Ser Asp Glu Asp Lys His Thr Ala Ile Ala Tyr Arg Leu Ile
195 200 205
His Glu Asn Leu Pro Arg Phe Ile Asp Asn Leu Gln Ile Leu Thr Thr
210 215 220
Ile Lys Gln Lys His Ser Ala Leu Tyr Asp Gln Ile Ile Asn Glu Leu
225 230 235 240
Thr Ala Ser Gly Leu Asp Val Ser Leu Ala Ser His Leu Asp Gly Tyr
245 250 255
His Lys Leu Leu Thr Gln Glu Gly Ile Thr Ala Tyr Asn Arg Ile Ile
260 265 270
Gly Glu Val Asn Gly Tyr Thr Asn Lys His Asn Gln Ile Cys His Lys
275 280 285
Ser Glu Arg Ile Ala Lys Leu Arg Pro Leu His Lys Gln Ile Leu Ser
290 295 300
Asp Gly Met Gly Val Ser Phe Leu Pro Ser Lys Phe Ala Asp Asp Ser
305 310 315 320
Glu Met Cys Gln Ala Val Asn Glu Phe Tyr Arg His Tyr Thr Asp Val
325 330 335
Phe Ala Lys Val Gln Ser Leu Phe Asp Gly Phe Asp Asp His Gln Lys
340 345 350
Asp Gly Ile Tyr Val Glu His Lys Asn Leu Asn Glu Leu Ser Lys Gln
355 360 365
Ala Phe Gly Asp Phe Ala Leu Leu Gly Arg Val Leu Asp Gly Tyr Tyr
370 375 380
Val Asp Val Val Asn Pro Glu Phe Asn Glu Arg Phe Ala Lys Ala Lys
385 390 395 400
Thr Asp Asn Ala Lys Ala Lys Leu Thr Lys Glu Lys Asp Lys Phe Ile
405 410 415
Lys Gly Val His Ser Leu Ala Ser Leu Glu Gln Ala Ile Glu His His
420 425 430
Thr Ala Arg His Asp Asp Glu Ser Val Gln Ala Gly Lys Leu Gly Gln
435 440 445
Tyr Phe Lys His Gly Leu Ala Gly Val Asp Asn Pro Ile Gln Lys Ile
450 455 460
His Asn Asn His Ser Thr Ile Lys Gly Phe Leu Glu Arg Glu Arg Pro
465 470 475 480
Ala Gly Glu Arg Ala Leu Pro Lys Ile Lys Ser Gly Lys Asn Pro Glu
485 490 495
Met Thr Gln Leu Arg Gln Leu Lys Glu Leu Leu Asp Asn Ala Leu Asn
500 505 510
Val Ala His Phe Ala Lys Leu Leu Thr Thr Lys Thr Thr Leu Asp Asn
515 520 525
Gln Asp Gly Asn Phe Tyr Gly Glu Phe Gly Val Leu Tyr Asp Glu Leu
530 535 540
Ala Lys Ile Pro Thr Leu Tyr Asn Lys Val Arg Asp Tyr Leu Ser Gln
545 550 555 560
Lys Pro Phe Ser Thr Glu Lys Tyr Lys Leu Asn Phe Gly Asn Pro Thr
565 570 575
Leu Leu Asn Gly Trp Asp Leu Asn Lys Glu Lys Asp Asn Phe Gly Val
580 585 590
Ile Leu Gln Lys Asp Gly Cys Tyr Tyr Leu Ala Leu Leu Asp Lys Ala
595 600 605
His Lys Lys Val Phe Asp Asn Ala Pro Asn Thr Gly Lys Asn Val Tyr
610 615 620
Gln Lys Met Val Tyr Lys Leu Leu Pro Gly Pro Asn Lys Met Leu Pro
625 630 635 640
Lys Val Phe Phe Ala Lys Ser Asn Leu Asp Tyr Tyr Asn Pro Ser Ala
645 650 655
Glu Leu Leu Asp Lys Tyr Ala Lys Gly Thr His Lys Lys Gly Asp Asn
660 665 670
Phe Asn Leu Lys Asp Cys His Ala Leu Ile Asp Phe Phe Lys Ala Gly
675 680 685
Ile Asn Lys His Pro Glu Trp Gln His Phe Gly Phe Lys Phe Ser Pro
690 695 700
Thr Ser Ser Tyr Arg Asp Leu Ser Asp Phe Tyr Arg Glu Val Glu Pro
705 710 715 720
Gln Gly Tyr Gln Val Lys Phe Val Asp Ile Asn Ala Asp Tyr Ile Asp
725 730 735
Glu Leu Val Glu Gln Gly Lys Leu Tyr Leu Phe Gln Ile Tyr Asn Lys
740 745 750
Asp Phe Ser Pro Lys Ala His Gly Lys Pro Asn Leu His Thr Leu Tyr
755 760 765
Phe Lys Ala Leu Phe Ser Glu Asp Asn Leu Ala Asp Pro Ile Tyr Lys
770 775 780
Leu Asn Gly Glu Ala Gln Ile Phe Tyr Arg Lys Ala Ser Leu Asp Met
785 790 795 800
Asn Glu Thr Thr Ile His Arg Ala Gly Glu Val Leu Glu Asn Lys Asn
805 810 815
Pro Asp Asn Pro Lys Lys Arg Gln Phe Val Tyr Asp Ile Ile Lys Asp
820 825 830
Lys Arg Tyr Thr Gln Asp Lys Phe Met Leu His Val Pro Ile Thr Met
835 840 845
Asn Phe Gly Val Gln Gly Met Thr Ile Lys Glu Phe Asn Lys Lys Val
850 855 860
Asn Gln Ser Ile Gln Gln Tyr Asp Glu Val Asn Val Ile Gly Ile Asp
865 870 875 880
Arg Gly Glu Arg His Leu Leu Tyr Leu Thr Val Ile Asn Ser Lys Gly
885 890 895
Glu Ile Leu Glu Gln Arg Ser Leu Asn Asp Ile Thr Thr Ala Ser Ala
900 905 910
Asn Gly Thr Gln Val Thr Thr Pro Tyr His Lys Ile Leu Asp Lys Arg
915 920 925
Glu Ile Glu Arg Leu Asn Ala Arg Val Gly Trp Gly Glu Ile Glu Thr
930 935 940
Ile Lys Glu Leu Lys Ser Gly Tyr Leu Ser His Val Val His Gln Ile
945 950 955 960
Asn Gln Leu Met Leu Lys Tyr Asn Ala Ile Val Val Leu Glu Asp Leu
965 970 975
Asn Phe Gly Phe Lys Arg Gly Arg Phe Lys Val Glu Lys Gln Ile Tyr
980 985 990
Gln Asn Phe Glu Asn Ala Leu Ile Lys Lys Leu Asn His Leu Val Leu
995 1000 1005
Lys Asp Lys Ala Asp Asp Glu Ile Gly Ser Tyr Lys Asn Ala Leu
1010 1015 1020
Gln Leu Thr Asn Asn Phe Thr Asp Leu Lys Ser Ile Gly Lys Gln
1025 1030 1035
Thr Gly Phe Leu Phe Tyr Val Pro Ala Trp Asn Thr Ser Lys Ile
1040 1045 1050
Asp Pro Glu Thr Gly Phe Val Asp Leu Leu Lys Pro Arg Tyr Glu
1055 1060 1065
Asn Ile Ala Gln Ser Gln Ala Phe Phe Gly Lys Phe Asp Lys Ile
1070 1075 1080
Cys Tyr Asn Thr Asp Lys Gly Tyr Phe Glu Phe His Ile Asp Tyr
1085 1090 1095
Ala Lys Phe Thr Asp Lys Ala Lys Asn Ser Arg Gln Lys Trp Ala
1100 1105 1110
Ile Cys Ser His Gly Asp Lys Arg Tyr Val Tyr Asp Lys Thr Ala
1115 1120 1125
Asn Gln Asn Lys Gly Ala Ala Lys Gly Ile Asn Val Asn Asp Glu
1130 1135 1140
Leu Lys Ser Leu Phe Ala Arg Tyr His Ile Asn Asp Lys Gln Pro
1145 1150 1155
Asn Leu Val Met Asp Ile Cys Gln Asn Asn Asp Lys Glu Phe His
1160 1165 1170
Lys Ser Leu Met Cys Leu Leu Lys Thr Leu Leu Ala Leu Arg Tyr
1175 1180 1185
Ser Asn Ala Ser Ser Asp Glu Asp Phe Ile Leu Ser Pro Val Ala
1190 1195 1200
Asn Asp Glu Gly Val Phe Phe Asn Ser Ala Leu Ala Asp Asp Thr
1205 1210 1215
Gln Pro Gln Asn Ala Asp Ala Asn Gly Ala Tyr His Ile Ala Leu
1220 1225 1230
Lys Gly Leu Trp Leu Leu Asn Glu Leu Lys Asn Ser Asp Asp Leu
1235 1240 1245
Asn Lys Val Lys Leu Ala Ile Asp Asn Gln Thr Trp Leu Asn Phe
1250 1255 1260
Ala Gln Asn Arg Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln
1265 1270 1275
Ala Lys Lys Lys Lys
1280
<210> 47
<211> 1352
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 47
Met Thr Gln Phe Glu Gly Phe Thr Asn Leu Tyr Gln Val Ser Lys Thr
1 5 10 15
Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Lys His Ile Gln
20 25 30
Glu Gln Gly Phe Ile Glu Glu Asp Lys Ala Arg Asn Asp His Tyr Lys
35 40 45
Glu Leu Lys Pro Ile Ile Asp Arg Ile Tyr Lys Thr Tyr Ala Asp Gln
50 55 60
Cys Leu Gln Leu Val Gln Leu Asp Trp Glu Asn Leu Ser Ala Ala Ile
65 70 75 80
Asp Ser Tyr Arg Lys Glu Lys Thr Glu Glu Thr Arg Asn Ala Leu Ile
85 90 95
Glu Glu Gln Ala Thr Tyr Arg Asn Ala Ile His Asp Tyr Phe Ile Gly
100 105 110
Arg Thr Asp Asn Leu Thr Asp Ala Ile Asn Lys Arg His Ala Glu Ile
115 120 125
Tyr Lys Gly Leu Phe Lys Ala Glu Leu Phe Asn Gly Lys Val Leu Lys
130 135 140
Gln Leu Gly Thr Val Thr Thr Thr Glu His Glu Asn Ala Leu Leu Arg
145 150 155 160
Ser Phe Asp Lys Phe Thr Thr Tyr Phe Ser Gly Phe Tyr Glu Asn Arg
165 170 175
Lys Asn Val Phe Ser Ala Glu Asp Ile Ser Thr Ala Ile Pro His Arg
180 185 190
Ile Val Gln Asp Asn Phe Pro Lys Phe Lys Glu Asn Cys His Ile Phe
195 200 205
Thr Arg Leu Ile Thr Ala Val Pro Ser Leu Arg Glu His Phe Glu Asn
210 215 220
Val Lys Lys Ala Ile Gly Ile Phe Val Ser Thr Ser Ile Glu Glu Val
225 230 235 240
Phe Ser Phe Pro Phe Tyr Asn Gln Leu Leu Thr Gln Thr Gln Ile Asp
245 250 255
Leu Tyr Asn Gln Leu Leu Gly Gly Ile Ser Arg Glu Ala Gly Thr Glu
260 265 270
Lys Ile Lys Gly Leu Asn Glu Val Leu Asn Leu Ala Ile Gln Lys Asn
275 280 285
Asp Glu Thr Ala His Ile Ile Ala Ser Leu Pro His Arg Phe Ile Pro
290 295 300
Leu Phe Lys Gln Ile Leu Ser Asp Arg Asn Thr Leu Ser Phe Ile Leu
305 310 315 320
Glu Glu Phe Lys Ser Asp Glu Glu Val Ile Gln Ser Phe Cys Lys Tyr
325 330 335
Lys Thr Leu Leu Arg Asn Glu Asn Val Leu Glu Thr Ala Glu Ala Leu
340 345 350
Phe Asn Glu Leu Asn Ser Ile Asp Leu Thr His Ile Phe Ile Ser His
355 360 365
Lys Lys Leu Glu Thr Ile Ser Ser Ala Leu Cys Asp His Trp Asp Thr
370 375 380
Leu Arg Asn Ala Leu Tyr Glu Arg Arg Ile Ser Glu Leu Thr Gly Lys
385 390 395 400
Ile Thr Lys Ser Ala Lys Glu Lys Val Gln Arg Ser Leu Lys His Glu
405 410 415
Asp Ile Asn Leu Gln Glu Ile Ile Ser Ala Ala Gly Lys Glu Leu Ser
420 425 430
Glu Ala Phe Lys Gln Lys Thr Ser Glu Ile Leu Ser His Ala His Ala
435 440 445
Ala Leu Asp Gln Pro Leu Pro Thr Thr Leu Lys Lys Gln Glu Glu Lys
450 455 460
Glu Ile Leu Lys Ser Gln Leu Asp Ser Leu Leu Gly Leu Tyr His Leu
465 470 475 480
Leu Asp Trp Phe Ala Val Asp Glu Ser Asn Glu Val Asp Pro Glu Phe
485 490 495
Ser Ala Arg Leu Thr Gly Ile Lys Leu Glu Met Glu Pro Ser Leu Ser
500 505 510
Phe Tyr Asn Lys Ala Arg Asn Tyr Ala Thr Lys Lys Pro Tyr Ser Val
515 520 525
Glu Lys Phe Lys Leu Asn Phe Gln Met Pro Thr Leu Ala Ser Gly Trp
530 535 540
Asp Val Asn Lys Glu Lys Asn Asn Gly Ala Ile Leu Phe Val Lys Asn
545 550 555 560
Gly Leu Tyr Tyr Leu Gly Ile Met Pro Lys Gln Lys Gly Arg Tyr Lys
565 570 575
Ala Leu Ser Phe Glu Pro Thr Glu Lys Thr Ser Glu Gly Phe Asp Lys
580 585 590
Met Tyr Tyr Asp Tyr Phe Pro Asp Ala Ala Lys Met Ile Pro Lys Cys
595 600 605
Ser Thr Gln Leu Lys Ala Val Thr Ala His Phe Gln Thr His Thr Thr
610 615 620
Pro Ile Leu Leu Ser Asn Asn Phe Ile Glu Pro Leu Glu Ile Thr Lys
625 630 635 640
Glu Ile Tyr Asp Leu Asn Asn Pro Glu Lys Glu Pro Lys Lys Phe Gln
645 650 655
Thr Ala Tyr Ala Lys Lys Thr Gly Asp Gln Lys Gly Tyr Arg Glu Ala
660 665 670
Leu Cys Lys Trp Ile Asp Phe Thr Arg Asp Phe Leu Ser Lys Tyr Thr
675 680 685
Lys Thr Thr Ser Ile Asp Leu Ser Ser Leu Arg Pro Ser Ser Gln Tyr
690 695 700
Lys Asp Leu Gly Glu Tyr Tyr Ala Glu Leu Asn Pro Leu Leu Tyr His
705 710 715 720
Ile Ser Phe Gln Arg Ile Ala Glu Lys Glu Ile Met Asp Ala Val Glu
725 730 735
Thr Gly Lys Leu Tyr Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ala Lys
740 745 750
Gly His His Gly Lys Pro Asn Leu His Thr Leu Tyr Trp Thr Gly Leu
755 760 765
Phe Ser Pro Glu Asn Leu Ala Lys Thr Ser Ile Lys Leu Asn Gly Gln
770 775 780
Ala Glu Leu Phe Tyr Arg Pro Lys Ser Arg Met Lys Arg Met Ala His
785 790 795 800
Arg Leu Gly Glu Lys Met Leu Asn Lys Lys Leu Lys Asp Gln Lys Thr
805 810 815
Pro Ile Pro Asp Thr Leu Tyr Gln Glu Leu Tyr Asp Tyr Val Asn His
820 825 830
Arg Leu Ser His Asp Leu Ser Asp Glu Ala Arg Ala Leu Leu Pro Asn
835 840 845
Val Ile Thr Lys Glu Val Ser His Glu Ile Ile Lys Asp Arg Arg Phe
850 855 860
Thr Ser Asp Lys Phe Phe Phe His Val Pro Ile Thr Leu Asn Tyr Gln
865 870 875 880
Ala Ala Asn Ser Pro Ser Lys Phe Asn Gln Arg Val Asn Ala Tyr Leu
885 890 895
Lys Glu His Pro Glu Thr Pro Ile Ile Gly Ile Asp Arg Gly Glu Arg
900 905 910
Asn Leu Ile Tyr Ile Thr Val Ile Asp Ser Thr Gly Lys Ile Leu Glu
915 920 925
Gln Arg Ser Leu Asn Thr Ile Gln Gln Phe Asp Tyr Gln Lys Lys Leu
930 935 940
Asp Asn Arg Glu Lys Glu Arg Val Ala Ala Arg Gln Ala Trp Ser Val
945 950 955 960
Val Gly Thr Ile Lys Asp Leu Lys Gln Gly Tyr Leu Ser Gln Val Ile
965 970 975
His Glu Ile Val Asp Leu Met Ile His Tyr Gln Ala Val Val Val Leu
980 985 990
Glu Asn Leu Asn Phe Gly Phe Lys Ser Lys Arg Thr Gly Ile Ala Glu
995 1000 1005
Lys Ala Val Tyr Gln Gln Phe Glu Lys Met Leu Ile Asp Lys Leu
1010 1015 1020
Asn Cys Leu Val Leu Lys Asp Tyr Pro Ala Glu Lys Val Gly Gly
1025 1030 1035
Val Leu Asn Pro Tyr Gln Leu Thr Asp Gln Phe Thr Ser Phe Ala
1040 1045 1050
Lys Met Gly Thr Gln Ser Gly Phe Leu Phe Tyr Val Pro Ala Pro
1055 1060 1065
Tyr Thr Ser Lys Ile Asp Pro Leu Thr Gly Phe Val Asp Pro Phe
1070 1075 1080
Val Trp Lys Thr Ile Lys Asn His Glu Ser Arg Lys His Phe Leu
1085 1090 1095
Glu Gly Phe Asp Phe Leu His Tyr Asp Val Lys Thr Gly Asp Phe
1100 1105 1110
Ile Leu His Phe Lys Met Asn Arg Asn Leu Ser Phe Gln Arg Gly
1115 1120 1125
Leu Pro Gly Phe Met Pro Ala Trp Asp Ile Val Phe Glu Lys Asn
1130 1135 1140
Glu Thr Gln Phe Asp Ala Lys Gly Thr Pro Phe Ile Ala Gly Lys
1145 1150 1155
Arg Ile Val Pro Val Ile Glu Asn His Arg Phe Thr Gly Arg Tyr
1160 1165 1170
Arg Asp Leu Tyr Pro Ala Asn Glu Leu Ile Ala Leu Leu Glu Glu
1175 1180 1185
Lys Gly Ile Val Phe Arg Asp Gly Ser Asn Ile Leu Pro Lys Leu
1190 1195 1200
Leu Glu Asn Asp Asp Ser His Ala Ile Asp Thr Met Val Ala Leu
1205 1210 1215
Ile Arg Ser Val Leu Gln Met Arg Asn Ser Asn Ala Ala Thr Gly
1220 1225 1230
Glu Asp Tyr Ile Asn Ser Pro Val Arg Asp Leu Asn Gly Val Cys
1235 1240 1245
Phe Asp Ser Arg Phe Gln Asn Pro Glu Trp Pro Met Asp Ala Asp
1250 1255 1260
Ala Asn Gly Ala Tyr His Ile Ala Leu Lys Gly Gln Leu Leu Leu
1265 1270 1275
Asn His Leu Lys Glu Ser Lys Asp Leu Lys Leu Gln Asn Gly Ile
1280 1285 1290
Ser Asn Gln Asp Trp Leu Ala Tyr Ile Gln Glu Leu Arg Asn Lys
1295 1300 1305
Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys
1310 1315 1320
Gly Ser Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Tyr Pro Tyr Asp
1325 1330 1335
Val Pro Asp Tyr Ala Tyr Pro Tyr Asp Val Pro Asp Tyr Ala
1340 1345 1350
<210> 48
<211> 1387
<212> PRT
<213> Artificial Sequence
<220>
<223> Synethtic
<220>
<221> xSV40NLS-06
<222> (2)..(8)
<220>
<221> xLinker-06
<222> (9)..(39)
<220>
<221> xSV40NLS-04
<222> (1339)..(1345)
<220>
<221> xsGGSlinker-02
<222> (1346)..(1349)
<220>
<221> xsGGSlinker-02
<222> (1350)..(1353)
<220>
<221> xSV40NLS-07
<222> (1354)..(1360)
<220>
<221> tag3XHA
<222> (1361)..(1387)
<400> 48
Met Pro Lys Lys Lys Arg Lys Val Gly Gly Gly Gly Ser Gly Gly Gly
1 5 10 15
Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly
20 25 30
Ser Gly Gly Gly Gly Ser Met Ser Ile Tyr Gln Glu Phe Val Asn Lys
35 40 45
Tyr Ser Leu Ser Lys Thr Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys
50 55 60
Thr Leu Glu Asn Ile Lys Ala Arg Gly Leu Ile Leu Asp Asp Glu Lys
65 70 75 80
Arg Ala Lys Asp Tyr Lys Lys Ala Lys Gln Ile Ile Asp Lys Tyr His
85 90 95
Gln Phe Phe Ile Glu Glu Ile Leu Ser Ser Val Cys Ile Ser Glu Asp
100 105 110
Leu Leu Gln Asn Tyr Ser Asp Val Tyr Phe Lys Leu Lys Lys Ser Asp
115 120 125
Asp Asp Asn Leu Gln Lys Asp Phe Lys Ser Ala Lys Asp Thr Ile Lys
130 135 140
Lys Gln Ile Ser Glu Tyr Ile Lys Asp Ser Glu Lys Phe Lys Asn Leu
145 150 155 160
Phe Asn Gln Asn Leu Ile Asp Ala Lys Lys Gly Gln Glu Ser Asp Leu
165 170 175
Ile Leu Trp Leu Lys Gln Ser Lys Asp Asn Gly Ile Glu Leu Phe Lys
180 185 190
Ala Asn Ser Asp Ile Thr Asp Ile Asp Glu Ala Leu Glu Ile Ile Lys
195 200 205
Ser Phe Lys Gly Trp Thr Thr Tyr Phe Lys Gly Phe His Glu Asn Arg
210 215 220
Lys Asn Val Tyr Ser Ser Asn Asp Ile Pro Thr Ser Ile Ile Tyr Arg
225 230 235 240
Ile Val Asp Asp Asn Leu Pro Lys Phe Leu Glu Asn Lys Ala Lys Tyr
245 250 255
Glu Ser Leu Lys Asp Lys Ala Pro Glu Ala Ile Asn Tyr Glu Gln Ile
260 265 270
Lys Lys Asp Leu Ala Glu Glu Leu Thr Phe Asp Ile Asp Tyr Lys Thr
275 280 285
Ser Glu Val Asn Gln Arg Val Phe Ser Leu Asp Glu Val Phe Glu Ile
290 295 300
Ala Asn Phe Asn Asn Tyr Leu Asn Gln Ser Gly Ile Thr Lys Phe Asn
305 310 315 320
Thr Ile Ile Gly Gly Lys Phe Val Asn Gly Glu Asn Thr Lys Arg Lys
325 330 335
Gly Ile Asn Glu Tyr Ile Asn Leu Tyr Ser Gln Gln Ile Asn Asp Lys
340 345 350
Thr Leu Lys Lys Tyr Lys Met Ser Val Leu Phe Lys Gln Ile Leu Ser
355 360 365
Asp Thr Glu Ser Lys Ser Phe Val Ile Asp Lys Leu Glu Asp Asp Ser
370 375 380
Asp Val Val Thr Thr Met Gln Ser Phe Tyr Glu Gln Ile Ala Ala Phe
385 390 395 400
Lys Thr Val Glu Glu Lys Ser Ile Lys Glu Thr Leu Ser Leu Leu Phe
405 410 415
Asp Asp Leu Lys Ala Gln Lys Leu Asp Leu Ser Lys Ile Tyr Phe Lys
420 425 430
Asn Asp Lys Ser Leu Thr Asp Leu Ser Gln Gln Val Phe Asp Asp Tyr
435 440 445
Ser Val Ile Gly Thr Ala Val Leu Glu Tyr Ile Thr Gln Gln Ile Ala
450 455 460
Pro Lys Asn Leu Asp Asn Pro Ser Lys Lys Glu Gln Glu Leu Ile Ala
465 470 475 480
Lys Lys Thr Glu Lys Ala Lys Tyr Leu Ser Leu Glu Thr Ile Lys Leu
485 490 495
Ala Leu Glu Glu Phe Asn Lys His Arg Asp Ile Asp Lys Gln Cys Arg
500 505 510
Phe Glu Glu Ile Leu Ala Asn Phe Ala Ala Ile Pro Met Ile Phe Asp
515 520 525
Glu Ile Ala Gln Asn Lys Asp Asn Leu Ala Gln Ile Ser Ile Lys Tyr
530 535 540
Gln Asn Gln Gly Lys Lys Asp Leu Leu Gln Ala Ser Ala Glu Asp Asp
545 550 555 560
Val Lys Ala Ile Lys Asp Leu Leu Asp Gln Thr Asn Asn Leu Leu His
565 570 575
Lys Leu Lys Ile Phe His Ile Ser Gln Ser Glu Asp Lys Ala Asn Ile
580 585 590
Leu Asp Lys Asp Glu His Phe Tyr Leu Val Phe Glu Glu Cys Tyr Phe
595 600 605
Glu Leu Ala Asn Ile Val Pro Leu Tyr Asn Lys Ile Arg Asn Tyr Ile
610 615 620
Thr Gln Lys Pro Tyr Ser Asp Glu Lys Phe Lys Leu Asn Phe Glu Asn
625 630 635 640
Ser Thr Leu Ala Asn Gly Trp Asp Lys Asn Lys Glu Pro Asp Asn Thr
645 650 655
Ala Ile Leu Phe Ile Lys Asp Asp Lys Tyr Tyr Leu Gly Val Met Asn
660 665 670
Lys Lys Asn Asn Lys Ile Phe Asp Asp Lys Ala Ile Lys Glu Asn Lys
675 680 685
Gly Glu Gly Tyr Lys Lys Ile Val Tyr Lys Leu Leu Pro Gly Ala Asn
690 695 700
Lys Met Leu Pro Lys Val Phe Phe Ser Ala Lys Ser Ile Lys Phe Tyr
705 710 715 720
Asn Pro Ser Glu Asp Ile Leu Arg Ile Arg Asn His Ser Thr His Thr
725 730 735
Lys Asn Gly Ser Pro Gln Lys Gly Tyr Glu Lys Phe Glu Phe Asn Ile
740 745 750
Glu Asp Cys Arg Lys Phe Ile Asp Phe Tyr Lys Gln Ser Ile Ser Lys
755 760 765
His Pro Glu Trp Lys Asp Phe Gly Phe Arg Phe Ser Asp Thr Gln Arg
770 775 780
Tyr Asn Ser Ile Asp Glu Phe Tyr Arg Glu Val Glu Asn Gln Gly Tyr
785 790 795 800
Lys Leu Thr Phe Glu Asn Ile Ser Glu Ser Tyr Ile Asp Ser Val Val
805 810 815
Asn Gln Gly Lys Leu Tyr Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ser
820 825 830
Ala Tyr Ser Lys Gly Arg Pro Asn Leu His Thr Leu Tyr Trp Lys Ala
835 840 845
Leu Phe Asp Glu Arg Asn Leu Gln Asp Val Val Tyr Lys Leu Asn Gly
850 855 860
Glu Ala Glu Leu Phe Tyr Arg Lys Gln Ser Ile Pro Lys Lys Ile Thr
865 870 875 880
His Pro Ala Lys Glu Ala Ile Ala Asn Lys Asn Lys Asp Asn Pro Lys
885 890 895
Lys Glu Ser Val Phe Glu Tyr Asp Leu Ile Lys Asp Lys Arg Phe Thr
900 905 910
Glu Asp Lys Phe Phe Phe His Cys Pro Ile Thr Ile Asn Phe Lys Ser
915 920 925
Ser Gly Ala Asn Lys Phe Asn Asp Glu Ile Asn Leu Leu Leu Lys Glu
930 935 940
Lys Ala Asn Asp Val His Ile Leu Ser Ile Asp Arg Gly Glu Arg His
945 950 955 960
Leu Ala Tyr Tyr Thr Leu Val Asp Gly Lys Gly Asn Ile Ile Lys Gln
965 970 975
Asp Thr Phe Asn Ile Ile Gly Asn Asp Arg Met Lys Thr Asn Tyr His
980 985 990
Asp Lys Leu Ala Ala Ile Glu Lys Asp Arg Asp Ser Ala Arg Lys Asp
995 1000 1005
Trp Lys Lys Ile Asn Asn Ile Lys Glu Met Lys Glu Gly Tyr Leu
1010 1015 1020
Ser Gln Val Val His Glu Ile Ala Lys Leu Val Ile Glu Tyr Asn
1025 1030 1035
Ala Ile Val Val Phe Glu Asp Leu Asn Phe Gly Phe Lys Arg Gly
1040 1045 1050
Arg Phe Lys Val Glu Lys Gln Val Tyr Gln Lys Leu Glu Lys Met
1055 1060 1065
Leu Ile Glu Lys Leu Asn Tyr Leu Val Phe Lys Asp Asn Glu Phe
1070 1075 1080
Asp Lys Thr Gly Gly Val Leu Arg Ala Tyr Gln Leu Thr Ala Pro
1085 1090 1095
Phe Glu Thr Phe Lys Lys Met Gly Lys Gln Thr Gly Ile Ile Tyr
1100 1105 1110
Tyr Val Pro Ala Gly Phe Thr Ser Lys Ile Cys Pro Val Thr Gly
1115 1120 1125
Phe Val Asn Gln Leu Tyr Pro Lys Tyr Glu Ser Val Ser Lys Ser
1130 1135 1140
Gln Glu Phe Phe Ser Lys Phe Asp Lys Ile Cys Tyr Asn Leu Asp
1145 1150 1155
Lys Gly Tyr Phe Glu Phe Ser Phe Asp Tyr Lys Asn Phe Gly Asp
1160 1165 1170
Lys Ala Ala Lys Gly Lys Trp Thr Ile Ala Ser Phe Gly Ser Arg
1175 1180 1185
Leu Ile Asn Phe Arg Asn Ser Asp Lys Asn His Asn Trp Asp Thr
1190 1195 1200
Arg Glu Val Tyr Pro Thr Lys Glu Leu Glu Lys Leu Leu Lys Asp
1205 1210 1215
Tyr Ser Ile Glu Tyr Gly His Gly Glu Cys Ile Lys Ala Ala Ile
1220 1225 1230
Cys Gly Glu Ser Asp Lys Lys Phe Phe Ala Lys Leu Thr Ser Val
1235 1240 1245
Leu Asn Thr Ile Leu Gln Met Arg Asn Ser Lys Thr Gly Thr Glu
1250 1255 1260
Leu Asp Tyr Leu Ile Ser Pro Val Ala Asp Val Asn Gly Asn Phe
1265 1270 1275
Phe Asp Ser Arg Gln Ala Pro Lys Asn Met Pro Gln Asp Ala Asp
1280 1285 1290
Ala Asn Gly Ala Tyr His Ile Gly Leu Lys Gly Leu Met Leu Leu
1295 1300 1305
Gly Arg Ile Lys Asn Asn Gln Glu Gly Lys Lys Leu Asn Leu Val
1310 1315 1320
Ile Lys Asn Glu Glu Tyr Phe Glu Phe Val Gln Asn Arg Asn Asn
1325 1330 1335
Pro Lys Lys Lys Arg Lys Val Ser Gly Gly Ser Ser Gly Gly Ser
1340 1345 1350
Pro Lys Lys Lys Arg Lys Val Tyr Pro Tyr Asp Val Pro Asp Tyr
1355 1360 1365
Ala Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Tyr Pro Tyr Asp Val
1370 1375 1380
Pro Asp Tyr Ala
1385
<210> 49
<211> 4899
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 49
atgccgaaga agaagcgcaa ggtcatgtcc agcgagaccg gccccgtggc ggtggacccc 60
accctgcgca ggcgcatcga gccgcacgag ttcgaggtgt tcttcgaccc cagggagctc 120
cgcaaggaga cctgcctcct gtacgagatc aactggggcg gcaggcactc catctggagg 180
cacacgagcc agaacaccaa caagcacgtc gaggtgaact tcatcgagaa gttcaccacg 240
gagaggtact tctgcccgaa cacgcgctgc tccatcacgt ggttcctctc gtggagccca 300
tgcggcgagt gctccagggc gatcacggag ttcctcagcc gctacccgca cgtgaccctg 360
ttcatctaca tcgctaggct ctaccaccac gcggacccca ggaacaggca gggcctcagg 420
gacctgatct ccagcggcgt cacgatccag atcatgaccg agcaggagtc cggctactgc 480
tggaggaact tcgtgaacta ctccccgagc aacgaggccc actggccccg ctacccgcac 540
ctctgggtcc gcctctacgt gctcgagctg tactgcatca tcctcggcct gccgccctgc 600
ctcaacatcc tgaggcgcaa gcagccccag ctgacgttct tcaccatcgc cctgcagagc 660
tgccactacc agaggctccc gccccacatc ctgtgggcga ccgggctcaa ggggggcggg 720
ggctcaggcg ggggcgggag cggcggcggg ggctctgggg gcggcggcag cggcgggggc 780
ggcagcgggg gcggcgggtc gatgctcttc caggacttca cccacctcta cccgctgtcc 840
aagacggtga ggttcgagct gaagcccatc ggccgcaccc tcgagcacat ccacgccaag 900
aacttcctca gccaggacga gacgatggcg gacatgtacc agaaggtgaa ggtcatcctg 960
gacgactacc acagggactt catcgccgac atgatgggcg aggtgaagct caccaagctg 1020
gcggagttct acgacgtcta cctgaagttc cgcaagaacc cgaaggacga cggcctccag 1080
aagcagctca aggacctgca ggccgtgctg aggaaggagt cggtcaagcc aatcggcagc 1140
ggcggcaagt acaagaccgg ctacgacagg ctgttcggcg ccaagctctt caaggacggc 1200
aaggagctcg gcgacctggc caagttcgtg atcgcccagg agggcgagtc ctcgcccaag 1260
ctcgctcacc tggcccactt cgagaagttc tccacctact tcacgggctt ccacgacaac 1320
cgcaagaaca tgtacagcga cgaggacaag cacaccgcca tcgcgtacag gctgatccac 1380
gagaacctcc cccgcttcat cgacaacctc cagatcctga ccacgatcaa gcagaagcac 1440
tccgccctgt acgaccagat catcaacgag ctgacggctt cgggcctgga cgtgtccctg 1500
gccagccacc tcgacggcta ccacaagctc ctgacccagg agggcatcac ggcctacaac 1560
aggatcatcg gcgaggtcaa cggctacacg aacaagcaca accagatctg ccacaagtcg 1620
gagaggatcg ccaagctcag gcccctgcac aagcagatcc tgagcgacgg catgggcgtg 1680
tccttcctcc ccagcaagtt cgccgacgac tccgagatgt gccaggcggt caacgagttc 1740
taccgccact acaccgacgt gttcgccaag gtccagagcc tgttcgacgg cttcgacgac 1800
caccagaagg acggcatcta cgtggagcac aagaacctca acgagctgtc caagcaggcc 1860
ttcggcgact tcgccctcct gggcagggtg ctggacggct actacgtcga cgtggtcaac 1920
ccggagttca acgagcgctt cgccaaggcg aagaccgaca acgccaaggc gaagctgacg 1980
aaggagaagg acaagttcat caagggcgtc cactcgctgg ccagcctgga gcaggccatc 2040
gagcaccaca cggctaggca cgacgacgag tcggtgcagg ccggcaagct gggccagtac 2100
ttcaagcacg gcctggcggg cgtggacaac ccgatccaga agatccacaa caaccactcc 2160
accatcaagg gcttcctcga gagggagagg cccgcgggcg agagggcgct gcccaagatc 2220
aagagcggca agaaccccga gatgacgcag ctccgccagc tgaaggagct cctggacaac 2280
gccctcaacg tggcccactt cgcgaagctc ctgaccacga agaccacgct ggacaaccag 2340
gacggcaact tctacggcga gttcggcgtg ctgtacgacg agctcgcgaa gatcccgacc 2400
ctgtacaaca aggtccgcga ctacctctcc cagaagccgt tcagcaccga gaagtacaag 2460
ctcaacttcg gcaaccccac gctcctgaac ggctgggacc tgaacaagga gaaggacaac 2520
ttcggcgtga tcctgcagaa ggacggctgc tactacctcg ccctcctgga caaggcgcac 2580
aagaaggtct tcgacaacgc ccccaacacg ggcaagaacg tgtaccagaa gatggtctac 2640
aagctcctgc cgggccccaa caagatgctg ccgaaggtgt tcttcgcgaa gtccaacctc 2700
gactactaca accccagcgc cgagctcctg gacaagtacg cgaagggcac ccacaagaag 2760
ggcgacaact tcaacctgaa ggactgccac gccctcatcg acttcttcaa ggcgggcatc 2820
aacaagcacc cggagtggca gcacttcggc ttcaagttct cccccacgtc cagctacagg 2880
gacctcagcg acttctacag ggaggtggag ccccagggct accaggtgaa gttcgtcgac 2940
atcaacgccg actacatcga cgagctggtc gagcagggca agctctacct gttccagatc 3000
tacaacaagg acttctcgcc caaggcccac ggcaagccaa acctccacac cctgtacttc 3060
aaggccctgt tcagcgagga caacctcgcg gaccccatct acaagctcaa cggcgaggcc 3120
cagatcttct acaggaaggc gtccctggac atgaacgaga cgaccatcca cagggcgggc 3180
gaggtgctcg agaacaagaa cccggacaac cccaagaaga ggcagttcgt ctacgacatc 3240
atcaaggaca agcgctacac gcaggacaag ttcatgctgc acgtgccgat caccatgaac 3300
ttcggcgtcc agggcatgac gatcaaggag ttcaacaaga aggtgaacca gtccatccag 3360
cagtacgacg aggtgaacgt catcggcatc gctcgcggcg agaggcacct cctgtacctc 3420
accgtcatca acagcaaggg cgagatcctg gagcagaggt ccctcaacga catcacgacc 3480
gcttcggcca acggcacgca ggtgaccacg ccctaccaca agatcctgga caagcgcgag 3540
atcgagaggc tcaacgctag ggtgggctgg ggcgagatcg agaccatcaa ggagctgaag 3600
tccggctacc tcagccacgt ggtccaccag atcaaccagc tcatgctgaa gtacaacgcc 3660
atcgtggtcc tcgcggacct gaatttcggc ttcaagcgcg gcaggttcaa ggtggagaag 3720
cagatctacc agaacttcga gaacgccctg atcaagaagc tcaaccacct cgtcctgaag 3780
gacaaggccg acgacgagat cggctcctac aagaacgcgc tccagctgac caacaacttc 3840
acggacctga agagcatcgg caagcagacc ggcttcctct tctacgtgcc ggcgtggaac 3900
acctccaaga tcgaccccga gacgggcttc gtcgacctcc tgaagccgag gtacgagaac 3960
atcgcccaga gccaggcgtt cttcggcaag ttcgacaaga tctgctacaa caccgacaag 4020
ggctacttcg agttccacat cgactacgcc aagttcacgg acaaggcgaa gaactccagg 4080
cagaagtggg ccatctgcag ccacggcgac aagcgctacg tgtacgacaa gaccgcgaac 4140
cagaacaagg gcgccgcgaa gggcatcaac gtcaacgacg agctcaagtc cctgttcgcc 4200
cgctaccaca tcaacgacaa gcagccgaac ctcgtgatgg acatctgcca gaacaacgac 4260
aaggagttcc acaagagcct gatgtgcctc ctgaagaccc tcctggccct ccgctactcc 4320
aacgcctcca gcgacgaggc gttcatcctg agccccgtgg ccaacgacga gggcgtcttc 4380
ttcaactcgg ctctggccga cgacacccag ccacagaacg cggacgccaa cggcgcttac 4440
cacatcgcgc tcaagggcct gtggctcctg aacgagctca agaacagcga cgacctgaac 4500
aaggtcaagc tcgccatcga caaccagacc tggctgaact tcgcccagaa ccgcaagagg 4560
cccgcggcca cgaagaaggc gggccaggcc aagaagaaga agtccggcgg cagcacgaac 4620
ctgtccgaca tcatcgagaa ggagaccggc aagcagctcg tgatccagga gagcatcctc 4680
atgctgccgg aggaggtcga ggaggtcatc ggcaacaagc ccgagtccga catcctcgtc 4740
cacacggcct acgacgagtc caccgacgag aacgtgatgc tcctgacctc ggacgctccc 4800
gagtacaagc catgggccct ggtcatccag gacagcaacg gcgagaacaa gatcaagatg 4860
ctctccggcg gcagcccgaa gaagaagcgc aaagtgtga 4899
<210> 50
<211> 1632
<212> PRT
<213> Artificial Sequence
<220>
<223> Fusion protein
<400> 50
Met Pro Lys Lys Lys Arg Lys Val Met Ser Ser Glu Thr Gly Pro Val
1 5 10 15
Ala Val Asp Pro Thr Leu Arg Arg Arg Ile Glu Pro His Glu Phe Glu
20 25 30
Val Phe Phe Asp Pro Arg Glu Leu Arg Lys Glu Thr Cys Leu Leu Tyr
35 40 45
Glu Ile Asn Trp Gly Gly Arg His Ser Ile Trp Arg His Thr Ser Gln
50 55 60
Asn Thr Asn Lys His Val Glu Val Asn Phe Ile Glu Lys Phe Thr Thr
65 70 75 80
Glu Arg Tyr Phe Cys Pro Asn Thr Arg Cys Ser Ile Thr Trp Phe Leu
85 90 95
Ser Trp Ser Pro Cys Gly Glu Cys Ser Arg Ala Ile Thr Glu Phe Leu
100 105 110
Ser Arg Tyr Pro His Val Thr Leu Phe Ile Tyr Ile Ala Arg Leu Tyr
115 120 125
His His Ala Asp Pro Arg Asn Arg Gln Gly Leu Arg Asp Leu Ile Ser
130 135 140
Ser Gly Val Thr Ile Gln Ile Met Thr Glu Gln Glu Ser Gly Tyr Cys
145 150 155 160
Trp Arg Asn Phe Val Asn Tyr Ser Pro Ser Asn Glu Ala His Trp Pro
165 170 175
Arg Tyr Pro His Leu Trp Val Arg Leu Tyr Val Leu Glu Leu Tyr Cys
180 185 190
Ile Ile Leu Gly Leu Pro Pro Cys Leu Asn Ile Leu Arg Arg Lys Gln
195 200 205
Pro Gln Leu Thr Phe Phe Thr Ile Ala Leu Gln Ser Cys His Tyr Gln
210 215 220
Arg Leu Pro Pro His Ile Leu Trp Ala Thr Gly Leu Lys Gly Gly Gly
225 230 235 240
Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly
245 250 255
Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Met Leu Phe Gln Asp
260 265 270
Phe Thr His Leu Tyr Pro Leu Ser Lys Thr Val Arg Phe Glu Leu Lys
275 280 285
Pro Ile Gly Arg Thr Leu Glu His Ile His Ala Lys Asn Phe Leu Ser
290 295 300
Gln Asp Glu Thr Met Ala Asp Met Tyr Gln Lys Val Lys Val Ile Leu
305 310 315 320
Asp Asp Tyr His Arg Asp Phe Ile Ala Asp Met Met Gly Glu Val Lys
325 330 335
Leu Thr Lys Leu Ala Glu Phe Tyr Asp Val Tyr Leu Lys Phe Arg Lys
340 345 350
Asn Pro Lys Asp Asp Gly Leu Gln Lys Gln Leu Lys Asp Leu Gln Ala
355 360 365
Val Leu Arg Lys Glu Ser Val Lys Pro Ile Gly Ser Gly Gly Lys Tyr
370 375 380
Lys Thr Gly Tyr Asp Arg Leu Phe Gly Ala Lys Leu Phe Lys Asp Gly
385 390 395 400
Lys Glu Leu Gly Asp Leu Ala Lys Phe Val Ile Ala Gln Glu Gly Glu
405 410 415
Ser Ser Pro Lys Leu Ala His Leu Ala His Phe Glu Lys Phe Ser Thr
420 425 430
Tyr Phe Thr Gly Phe His Asp Asn Arg Lys Asn Met Tyr Ser Asp Glu
435 440 445
Asp Lys His Thr Ala Ile Ala Tyr Arg Leu Ile His Glu Asn Leu Pro
450 455 460
Arg Phe Ile Asp Asn Leu Gln Ile Leu Thr Thr Ile Lys Gln Lys His
465 470 475 480
Ser Ala Leu Tyr Asp Gln Ile Ile Asn Glu Leu Thr Ala Ser Gly Leu
485 490 495
Asp Val Ser Leu Ala Ser His Leu Asp Gly Tyr His Lys Leu Leu Thr
500 505 510
Gln Glu Gly Ile Thr Ala Tyr Asn Arg Ile Ile Gly Glu Val Asn Gly
515 520 525
Tyr Thr Asn Lys His Asn Gln Ile Cys His Lys Ser Glu Arg Ile Ala
530 535 540
Lys Leu Arg Pro Leu His Lys Gln Ile Leu Ser Asp Gly Met Gly Val
545 550 555 560
Ser Phe Leu Pro Ser Lys Phe Ala Asp Asp Ser Glu Met Cys Gln Ala
565 570 575
Val Asn Glu Phe Tyr Arg His Tyr Thr Asp Val Phe Ala Lys Val Gln
580 585 590
Ser Leu Phe Asp Gly Phe Asp Asp His Gln Lys Asp Gly Ile Tyr Val
595 600 605
Glu His Lys Asn Leu Asn Glu Leu Ser Lys Gln Ala Phe Gly Asp Phe
610 615 620
Ala Leu Leu Gly Arg Val Leu Asp Gly Tyr Tyr Val Asp Val Val Asn
625 630 635 640
Pro Glu Phe Asn Glu Arg Phe Ala Lys Ala Lys Thr Asp Asn Ala Lys
645 650 655
Ala Lys Leu Thr Lys Glu Lys Asp Lys Phe Ile Lys Gly Val His Ser
660 665 670
Leu Ala Ser Leu Glu Gln Ala Ile Glu His His Thr Ala Arg His Asp
675 680 685
Asp Glu Ser Val Gln Ala Gly Lys Leu Gly Gln Tyr Phe Lys His Gly
690 695 700
Leu Ala Gly Val Asp Asn Pro Ile Gln Lys Ile His Asn Asn His Ser
705 710 715 720
Thr Ile Lys Gly Phe Leu Glu Arg Glu Arg Pro Ala Gly Glu Arg Ala
725 730 735
Leu Pro Lys Ile Lys Ser Gly Lys Asn Pro Glu Met Thr Gln Leu Arg
740 745 750
Gln Leu Lys Glu Leu Leu Asp Asn Ala Leu Asn Val Ala His Phe Ala
755 760 765
Lys Leu Leu Thr Thr Lys Thr Thr Leu Asp Asn Gln Asp Gly Asn Phe
770 775 780
Tyr Gly Glu Phe Gly Val Leu Tyr Asp Glu Leu Ala Lys Ile Pro Thr
785 790 795 800
Leu Tyr Asn Lys Val Arg Asp Tyr Leu Ser Gln Lys Pro Phe Ser Thr
805 810 815
Glu Lys Tyr Lys Leu Asn Phe Gly Asn Pro Thr Leu Leu Asn Gly Trp
820 825 830
Asp Leu Asn Lys Glu Lys Asp Asn Phe Gly Val Ile Leu Gln Lys Asp
835 840 845
Gly Cys Tyr Tyr Leu Ala Leu Leu Asp Lys Ala His Lys Lys Val Phe
850 855 860
Asp Asn Ala Pro Asn Thr Gly Lys Asn Val Tyr Gln Lys Met Val Tyr
865 870 875 880
Lys Leu Leu Pro Gly Pro Asn Lys Met Leu Pro Lys Val Phe Phe Ala
885 890 895
Lys Ser Asn Leu Asp Tyr Tyr Asn Pro Ser Ala Glu Leu Leu Asp Lys
900 905 910
Tyr Ala Lys Gly Thr His Lys Lys Gly Asp Asn Phe Asn Leu Lys Asp
915 920 925
Cys His Ala Leu Ile Asp Phe Phe Lys Ala Gly Ile Asn Lys His Pro
930 935 940
Glu Trp Gln His Phe Gly Phe Lys Phe Ser Pro Thr Ser Ser Tyr Arg
945 950 955 960
Asp Leu Ser Asp Phe Tyr Arg Glu Val Glu Pro Gln Gly Tyr Gln Val
965 970 975
Lys Phe Val Asp Ile Asn Ala Asp Tyr Ile Asp Glu Leu Val Glu Gln
980 985 990
Gly Lys Leu Tyr Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ser Pro Lys
995 1000 1005
Ala His Gly Lys Pro Asn Leu His Thr Leu Tyr Phe Lys Ala Leu
1010 1015 1020
Phe Ser Glu Asp Asn Leu Ala Asp Pro Ile Tyr Lys Leu Asn Gly
1025 1030 1035
Glu Ala Gln Ile Phe Tyr Arg Lys Ala Ser Leu Asp Met Asn Glu
1040 1045 1050
Thr Thr Ile His Arg Ala Gly Glu Val Leu Glu Asn Lys Asn Pro
1055 1060 1065
Asp Asn Pro Lys Lys Arg Gln Phe Val Tyr Asp Ile Ile Lys Asp
1070 1075 1080
Lys Arg Tyr Thr Gln Asp Lys Phe Met Leu His Val Pro Ile Thr
1085 1090 1095
Met Asn Phe Gly Val Gln Gly Met Thr Ile Lys Glu Phe Asn Lys
1100 1105 1110
Lys Val Asn Gln Ser Ile Gln Gln Tyr Asp Glu Val Asn Val Ile
1115 1120 1125
Gly Ile Ala Arg Gly Glu Arg His Leu Leu Tyr Leu Thr Val Ile
1130 1135 1140
Asn Ser Lys Gly Glu Ile Leu Glu Gln Arg Ser Leu Asn Asp Ile
1145 1150 1155
Thr Thr Ala Ser Ala Asn Gly Thr Gln Val Thr Thr Pro Tyr His
1160 1165 1170
Lys Ile Leu Asp Lys Arg Glu Ile Glu Arg Leu Asn Ala Arg Val
1175 1180 1185
Gly Trp Gly Glu Ile Glu Thr Ile Lys Glu Leu Lys Ser Gly Tyr
1190 1195 1200
Leu Ser His Val Val His Gln Ile Asn Gln Leu Met Leu Lys Tyr
1205 1210 1215
Asn Ala Ile Val Val Leu Ala Asp Leu Asn Phe Gly Phe Lys Arg
1220 1225 1230
Gly Arg Phe Lys Val Glu Lys Gln Ile Tyr Gln Asn Phe Glu Asn
1235 1240 1245
Ala Leu Ile Lys Lys Leu Asn His Leu Val Leu Lys Asp Lys Ala
1250 1255 1260
Asp Asp Glu Ile Gly Ser Tyr Lys Asn Ala Leu Gln Leu Thr Asn
1265 1270 1275
Asn Phe Thr Asp Leu Lys Ser Ile Gly Lys Gln Thr Gly Phe Leu
1280 1285 1290
Phe Tyr Val Pro Ala Trp Asn Thr Ser Lys Ile Asp Pro Glu Thr
1295 1300 1305
Gly Phe Val Asp Leu Leu Lys Pro Arg Tyr Glu Asn Ile Ala Gln
1310 1315 1320
Ser Gln Ala Phe Phe Gly Lys Phe Asp Lys Ile Cys Tyr Asn Thr
1325 1330 1335
Asp Lys Gly Tyr Phe Glu Phe His Ile Asp Tyr Ala Lys Phe Thr
1340 1345 1350
Asp Lys Ala Lys Asn Ser Arg Gln Lys Trp Ala Ile Cys Ser His
1355 1360 1365
Gly Asp Lys Arg Tyr Val Tyr Asp Lys Thr Ala Asn Gln Asn Lys
1370 1375 1380
Gly Ala Ala Lys Gly Ile Asn Val Asn Asp Glu Leu Lys Ser Leu
1385 1390 1395
Phe Ala Arg Tyr His Ile Asn Asp Lys Gln Pro Asn Leu Val Met
1400 1405 1410
Asp Ile Cys Gln Asn Asn Asp Lys Glu Phe His Lys Ser Leu Met
1415 1420 1425
Cys Leu Leu Lys Thr Leu Leu Ala Leu Arg Tyr Ser Asn Ala Ser
1430 1435 1440
Ser Asp Glu Ala Phe Ile Leu Ser Pro Val Ala Asn Asp Glu Gly
1445 1450 1455
Val Phe Phe Asn Ser Ala Leu Ala Asp Asp Thr Gln Pro Gln Asn
1460 1465 1470
Ala Asp Ala Asn Gly Ala Tyr His Ile Ala Leu Lys Gly Leu Trp
1475 1480 1485
Leu Leu Asn Glu Leu Lys Asn Ser Asp Asp Leu Asn Lys Val Lys
1490 1495 1500
Leu Ala Ile Asp Asn Gln Thr Trp Leu Asn Phe Ala Gln Asn Arg
1505 1510 1515
Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys
1520 1525 1530
Lys Ser Gly Gly Ser Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu
1535 1540 1545
Thr Gly Lys Gln Leu Val Ile Gln Glu Ser Ile Leu Met Leu Pro
1550 1555 1560
Glu Glu Val Glu Glu Val Ile Gly Asn Lys Pro Glu Ser Asp Ile
1565 1570 1575
Leu Val His Thr Ala Tyr Asp Glu Ser Thr Asp Glu Asn Val Met
1580 1585 1590
Leu Leu Thr Ser Asp Ala Pro Glu Tyr Lys Pro Trp Ala Leu Val
1595 1600 1605
Ile Gln Asp Ser Asn Gly Glu Asn Lys Ile Lys Met Leu Ser Gly
1610 1615 1620
Gly Ser Pro Lys Lys Lys Arg Lys Val
1625 1630
<210> 51
<211> 4809
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 51
atgccgaaga agaagcgcaa ggtcatgtcc agcgagaccg gccccgtggc ggtggacccc 60
accctgcgca ggcgcatcga gccgcacgag ttcgaggtgt tcttcgaccc cagggagctc 120
cgcaaggaga cctgcctcct gtacgagatc aactggggcg gcaggcactc catctggagg 180
cacacgagcc agaacaccaa caagcacgtc gaggtgaact tcatcgagaa gttcaccacg 240
gagaggtact tctgcccgaa cacgcgctgc tccatcacgt ggttcctctc gtggagccca 300
tgcggcgagt gctccagggc gatcacggag ttcctcagcc gctacccgca cgtgaccctg 360
ttcatctaca tcgctaggct ctaccaccac gcggacccca ggaacaggca gggcctcagg 420
gacctgatct ccagcggcgt cacgatccag atcatgaccg agcaggagtc cggctactgc 480
tggaggaact tcgtgaacta ctccccgagc aacgaggccc actggccccg ctacccgcac 540
ctctgggtcc gcctctacgt gctcgagctg tactgcatca tcctcggcct gccgccctgc 600
ctcaacatcc tgaggcgcaa gcagccccag ctgacgttct tcaccatcgc cctgcagagc 660
tgccactacc agaggctccc gccccacatc ctgtgggcga ccgggctcaa ggggggcggg 720
ggctcaggcg ggggcgggag cggcggcggg ggctctgggg gcggcggcag cggcgggggc 780
ggcagcgggg gcggcgggtc gatgagcaag ctggagaagt tcacgaactg ctactccctc 840
agcaagaccc tgaggttcaa ggcgatcccg gtcggcaaga cccaggagaa catcgacaac 900
aagcggctgc tggtggagga cgagaagagg gctgaggact acaagggcgt gaagaagctc 960
ctggaccgct actacctgtc cttcatcaac gacgtgctcc acagcatcaa gctcaagaac 1020
ctgaacaact acatcagcct cttcaggaag aagacgcgca ccgagaagga gaacaaggag 1080
ctcgagaacc tggagatcaa cctgaggaag gagatcgcca aggcgttcaa gggcaacgag 1140
ggctacaagt ccctcttcaa gaaggacatc atcgagacga tcctcccgga gttcctggac 1200
gacaaggacg agatcgccct ggtcaactcc ttcaacggct tcaccacggc gttcaccggc 1260
ttcttcgaca accgcgagaa catgttcagc gaggaggcca agtccacgag catcgcgttc 1320
aggtgcatca acgagaacct cacccgctac atctccaaca tggacatctt cgagaaggtc 1380
gacgcgatct tcgacaagca cgaggtgcag gagatcaagg agaagatcct gaacagcgac 1440
tacgacgtcg aggacttctt cgagggcgag ttcttcaact tcgtcctcac gcaggagggc 1500
atcgacgtgt acaacgccat catcggtggc ttcgtgaccg agtccggcga gaagatcaag 1560
ggcctgaacg agtacatcaa cctctacaac cagaagacca agcagaagct gccgaagttc 1620
aagcccctgt acaagcaggt gctctccgac agggagtccc tcagcttcta cggcgagggc 1680
tacacgagcg acgaggaggt cctggaggtg ttccgcaaca ccctcaacaa gaacagcgag 1740
atcttctcca gcatcaagaa gctcgagaag ctgttcaaga acttcgacga gtactccagc 1800
gccggcatct tcgtcaagaa cggcccggcg atctccacga tcagcaagga catcttcggc 1860
gagtggaacg tgatccgcga caagtggaac gccgagtacg acgacatcca cctcaagaag 1920
aaggcggtgg tcaccgagaa gtacgaggac gacaggcgca agtccttcaa gaagatcggc 1980
tccttcagcc tcgagcagct gcaggagtac gccgacgcgg acctgagcgt ggtcgagaag 2040
ctcaaggaga tcatcatcca gaaggtcgac gagatctaca aggtgtacgg ctccagcgag 2100
aagctcttcg acgcggactt cgtcctcgag aagtccctga agaagaacga cgccgtggtc 2160
gcgatcatga aggacctcct ggactccgtg aagagcttcg agaattacat caaggccttc 2220
ttcggcgagg gcaaggagac gaacagggac gagtccttct acggcgactt cgtcctggcc 2280
tacgacatcc tcctgaaggt ggaccacatc tacgacgcga tccgcaacta cgtgacccag 2340
aagccgtaca gcaaggacaa gttcaagctc tacttccaga acccccagtt catgggcggc 2400
tgggacaagg acaaggagac ggactacagg gcgaccatcc tgcgctacgg cagcaagtac 2460
tacctcgcca tcatggacaa gaagtacgcg aagtgcctgc agaagatcga caaggacgac 2520
gtcaacggca actacgagaa gatcaactac aagctcctgc cgggccccaa caagatgctc 2580
ccgaaggtgt tcttctccaa gaagtggatg gcctactaca accccagcga ggacatccag 2640
aagatctaca agaacggcac gttcaagaag ggcgacatgt tcaacctgaa cgactgccac 2700
aagctcatcg acttcttcaa ggactccatc agccgctacc cgaagtggtc caacgcctac 2760
gacttcaact tcagcgagac cgagaagtac aaggacatcg cgggcttcta ccgcgaggtc 2820
gaggagcagg gctacaaggt gtccttcgag tccgccagca agaaggaggt cgacaagctg 2880
gtggaggagg gcaagctcta catgttccag atctacaaca aggacttctc cgacaagagc 2940
cacggcacgc ccaacctgca caccatgtac ttcaagctcc tgttcgacga gaacaaccac 3000
ggccagatca ggctgtccgg cggcgccgag ctcttcatga ggagggcgag cctgaagaag 3060
gaggagctgg tggtccaccc cgctaacagc ccaatcgcga acaagaaccc ggacaacccc 3120
aagaagacca cgaccctgtc ctacgacgtg tacaaggaca agaggttcag cgaggaccag 3180
tacgagctcc acatcccgat cgcgatcaac aagtgcccca agaacatctt caagatcaac 3240
accgaggtcc gcgtgctcct gaagcacgac gacaacccct acgtgatcgg catcgacagg 3300
ggcgagagga acctcctgta catcgtggtc gtggacggca agggcaacat cgtggagcag 3360
tactccctca acgagatcat caacaacttc aacggcatca ggatcaagac ggactaccac 3420
agcctcctgg acaagaagga gaaggagagg ttcgaggccc gccagaactg gacctccatc 3480
gagaacatca aggagctgaa ggcgggctac atcagccagg tcgtgcacaa gatctgcgag 3540
ctcgtcgaga agtacgacgc cgtgatcgcc ctcgaggacc tgaactccgg cttcaagaac 3600
agccgcgtca aggtggagaa gcaggtctac cagaagttcg agaagatgct catcgacaag 3660
ctgaactaca tggtggacaa gaagtccaac ccctgcgcta cgggcggcgc gctgaagggc 3720
taccagatca ccaacaagtt cgagagcttc aagtccatga gcactcagaa cggcttcatc 3780
ttctacatcc cggcgtggct cacgtccaag atcgacccca gcaccggctt cgtcaacctc 3840
ctgaagacga agtacacctc catcgccgac agcaagaagt tcatctccag cttcgaccgc 3900
atcatgtatg tgccggagga ggacctgttc gagttcgccc tcgactacaa gaacttctcc 3960
cgcacggacg cggactacat caagaagtgg aagctgtaca gctacggcaa ccgcatccgc 4020
atcttcagga accccaagaa gaacaacgtc ttcgactggg aggaggtgtg cctgacctcc 4080
gcgtacaagg agctcttcaa caagtacggc atcaactacc agcagggcga catcagggct 4140
ctcctgtgcg agcagagcga caaggccttc tactccagct tcatggcgct gatgtccctc 4200
atgctgcaga tgaggaactc gatcaccggc aggacggacg tggacttcct catctccccg 4260
gtgaagaaca gcgacggcat cttctacgac tccaggaact acgaggccca ggagaacgcg 4320
atcctcccaa agaacgcgga cgccaacggc gcctacaaca tcgccaggaa ggtcctctgg 4380
gctatcggcc agttcaagaa ggcggaggac gagaagctgg acaaggtgaa gatcgccatc 4440
agcaacaagg agtggctcga gtacgcccag acctcggtca agcacggcag cccgaagaag 4500
aagcgcaagg tgtccggcgg cagcacgaac ctgtccgaca tcatcgagaa ggagaccggc 4560
aagcagctcg tgatccagga gagcatcctc atgctgccgg aggaggtcga ggaggtcatc 4620
ggcaacaagc ccgagtccga catcctcgtc cacacggcct acgacgagtc caccgacgag 4680
aacgtgatgc tcctgacctc ggacgctccc gagtacaagc catgggccct ggtcatccag 4740
gacagcaacg gcgagaacaa gatcaagatg ctctccggcg gcagcccgaa gaagaagcgc 4800
aaagtgtga 4809
<210> 52
<211> 1602
<212> PRT
<213> Artificial Sequence
<220>
<223> Fusion protein
<400> 52
Met Pro Lys Lys Lys Arg Lys Val Met Ser Ser Glu Thr Gly Pro Val
1 5 10 15
Ala Val Asp Pro Thr Leu Arg Arg Arg Ile Glu Pro His Glu Phe Glu
20 25 30
Val Phe Phe Asp Pro Arg Glu Leu Arg Lys Glu Thr Cys Leu Leu Tyr
35 40 45
Glu Ile Asn Trp Gly Gly Arg His Ser Ile Trp Arg His Thr Ser Gln
50 55 60
Asn Thr Asn Lys His Val Glu Val Asn Phe Ile Glu Lys Phe Thr Thr
65 70 75 80
Glu Arg Tyr Phe Cys Pro Asn Thr Arg Cys Ser Ile Thr Trp Phe Leu
85 90 95
Ser Trp Ser Pro Cys Gly Glu Cys Ser Arg Ala Ile Thr Glu Phe Leu
100 105 110
Ser Arg Tyr Pro His Val Thr Leu Phe Ile Tyr Ile Ala Arg Leu Tyr
115 120 125
His His Ala Asp Pro Arg Asn Arg Gln Gly Leu Arg Asp Leu Ile Ser
130 135 140
Ser Gly Val Thr Ile Gln Ile Met Thr Glu Gln Glu Ser Gly Tyr Cys
145 150 155 160
Trp Arg Asn Phe Val Asn Tyr Ser Pro Ser Asn Glu Ala His Trp Pro
165 170 175
Arg Tyr Pro His Leu Trp Val Arg Leu Tyr Val Leu Glu Leu Tyr Cys
180 185 190
Ile Ile Leu Gly Leu Pro Pro Cys Leu Asn Ile Leu Arg Arg Lys Gln
195 200 205
Pro Gln Leu Thr Phe Phe Thr Ile Ala Leu Gln Ser Cys His Tyr Gln
210 215 220
Arg Leu Pro Pro His Ile Leu Trp Ala Thr Gly Leu Lys Gly Gly Gly
225 230 235 240
Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly
245 250 255
Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Met Ser Lys Leu Glu
260 265 270
Lys Phe Thr Asn Cys Tyr Ser Leu Ser Lys Thr Leu Arg Phe Lys Ala
275 280 285
Ile Pro Val Gly Lys Thr Gln Glu Asn Ile Asp Asn Lys Arg Leu Leu
290 295 300
Val Glu Asp Glu Lys Arg Ala Glu Asp Tyr Lys Gly Val Lys Lys Leu
305 310 315 320
Leu Asp Arg Tyr Tyr Leu Ser Phe Ile Asn Asp Val Leu His Ser Ile
325 330 335
Lys Leu Lys Asn Leu Asn Asn Tyr Ile Ser Leu Phe Arg Lys Lys Thr
340 345 350
Arg Thr Glu Lys Glu Asn Lys Glu Leu Glu Asn Leu Glu Ile Asn Leu
355 360 365
Arg Lys Glu Ile Ala Lys Ala Phe Lys Gly Asn Glu Gly Tyr Lys Ser
370 375 380
Leu Phe Lys Lys Asp Ile Ile Glu Thr Ile Leu Pro Glu Phe Leu Asp
385 390 395 400
Asp Lys Asp Glu Ile Ala Leu Val Asn Ser Phe Asn Gly Phe Thr Thr
405 410 415
Ala Phe Thr Gly Phe Phe Asp Asn Arg Glu Asn Met Phe Ser Glu Glu
420 425 430
Ala Lys Ser Thr Ser Ile Ala Phe Arg Cys Ile Asn Glu Asn Leu Thr
435 440 445
Arg Tyr Ile Ser Asn Met Asp Ile Phe Glu Lys Val Asp Ala Ile Phe
450 455 460
Asp Lys His Glu Val Gln Glu Ile Lys Glu Lys Ile Leu Asn Ser Asp
465 470 475 480
Tyr Asp Val Glu Asp Phe Phe Glu Gly Glu Phe Phe Asn Phe Val Leu
485 490 495
Thr Gln Glu Gly Ile Asp Val Tyr Asn Ala Ile Ile Gly Gly Phe Val
500 505 510
Thr Glu Ser Gly Glu Lys Ile Lys Gly Leu Asn Glu Tyr Ile Asn Leu
515 520 525
Tyr Asn Gln Lys Thr Lys Gln Lys Leu Pro Lys Phe Lys Pro Leu Tyr
530 535 540
Lys Gln Val Leu Ser Asp Arg Glu Ser Leu Ser Phe Tyr Gly Glu Gly
545 550 555 560
Tyr Thr Ser Asp Glu Glu Val Leu Glu Val Phe Arg Asn Thr Leu Asn
565 570 575
Lys Asn Ser Glu Ile Phe Ser Ser Ile Lys Lys Leu Glu Lys Leu Phe
580 585 590
Lys Asn Phe Asp Glu Tyr Ser Ser Ala Gly Ile Phe Val Lys Asn Gly
595 600 605
Pro Ala Ile Ser Thr Ile Ser Lys Asp Ile Phe Gly Glu Trp Asn Val
610 615 620
Ile Arg Asp Lys Trp Asn Ala Glu Tyr Asp Asp Ile His Leu Lys Lys
625 630 635 640
Lys Ala Val Val Thr Glu Lys Tyr Glu Asp Asp Arg Arg Lys Ser Phe
645 650 655
Lys Lys Ile Gly Ser Phe Ser Leu Glu Gln Leu Gln Glu Tyr Ala Asp
660 665 670
Ala Asp Leu Ser Val Val Glu Lys Leu Lys Glu Ile Ile Ile Gln Lys
675 680 685
Val Asp Glu Ile Tyr Lys Val Tyr Gly Ser Ser Glu Lys Leu Phe Asp
690 695 700
Ala Asp Phe Val Leu Glu Lys Ser Leu Lys Lys Asn Asp Ala Val Val
705 710 715 720
Ala Ile Met Lys Asp Leu Leu Asp Ser Val Lys Ser Phe Glu Asn Tyr
725 730 735
Ile Lys Ala Phe Phe Gly Glu Gly Lys Glu Thr Asn Arg Asp Glu Ser
740 745 750
Phe Tyr Gly Asp Phe Val Leu Ala Tyr Asp Ile Leu Leu Lys Val Asp
755 760 765
His Ile Tyr Asp Ala Ile Arg Asn Tyr Val Thr Gln Lys Pro Tyr Ser
770 775 780
Lys Asp Lys Phe Lys Leu Tyr Phe Gln Asn Pro Gln Phe Met Gly Gly
785 790 795 800
Trp Asp Lys Asp Lys Glu Thr Asp Tyr Arg Ala Thr Ile Leu Arg Tyr
805 810 815
Gly Ser Lys Tyr Tyr Leu Ala Ile Met Asp Lys Lys Tyr Ala Lys Cys
820 825 830
Leu Gln Lys Ile Asp Lys Asp Asp Val Asn Gly Asn Tyr Glu Lys Ile
835 840 845
Asn Tyr Lys Leu Leu Pro Gly Pro Asn Lys Met Leu Pro Lys Val Phe
850 855 860
Phe Ser Lys Lys Trp Met Ala Tyr Tyr Asn Pro Ser Glu Asp Ile Gln
865 870 875 880
Lys Ile Tyr Lys Asn Gly Thr Phe Lys Lys Gly Asp Met Phe Asn Leu
885 890 895
Asn Asp Cys His Lys Leu Ile Asp Phe Phe Lys Asp Ser Ile Ser Arg
900 905 910
Tyr Pro Lys Trp Ser Asn Ala Tyr Asp Phe Asn Phe Ser Glu Thr Glu
915 920 925
Lys Tyr Lys Asp Ile Ala Gly Phe Tyr Arg Glu Val Glu Glu Gln Gly
930 935 940
Tyr Lys Val Ser Phe Glu Ser Ala Ser Lys Lys Glu Val Asp Lys Leu
945 950 955 960
Val Glu Glu Gly Lys Leu Tyr Met Phe Gln Ile Tyr Asn Lys Asp Phe
965 970 975
Ser Asp Lys Ser His Gly Thr Pro Asn Leu His Thr Met Tyr Phe Lys
980 985 990
Leu Leu Phe Asp Glu Asn Asn His Gly Gln Ile Arg Leu Ser Gly Gly
995 1000 1005
Ala Glu Leu Phe Met Arg Arg Ala Ser Leu Lys Lys Glu Glu Leu
1010 1015 1020
Val Val His Pro Ala Asn Ser Pro Ile Ala Asn Lys Asn Pro Asp
1025 1030 1035
Asn Pro Lys Lys Thr Thr Thr Leu Ser Tyr Asp Val Tyr Lys Asp
1040 1045 1050
Lys Arg Phe Ser Glu Asp Gln Tyr Glu Leu His Ile Pro Ile Ala
1055 1060 1065
Ile Asn Lys Cys Pro Lys Asn Ile Phe Lys Ile Asn Thr Glu Val
1070 1075 1080
Arg Val Leu Leu Lys His Asp Asp Asn Pro Tyr Val Ile Gly Ile
1085 1090 1095
Asp Arg Gly Glu Arg Asn Leu Leu Tyr Ile Val Val Val Asp Gly
1100 1105 1110
Lys Gly Asn Ile Val Glu Gln Tyr Ser Leu Asn Glu Ile Ile Asn
1115 1120 1125
Asn Phe Asn Gly Ile Arg Ile Lys Thr Asp Tyr His Ser Leu Leu
1130 1135 1140
Asp Lys Lys Glu Lys Glu Arg Phe Glu Ala Arg Gln Asn Trp Thr
1145 1150 1155
Ser Ile Glu Asn Ile Lys Glu Leu Lys Ala Gly Tyr Ile Ser Gln
1160 1165 1170
Val Val His Lys Ile Cys Glu Leu Val Glu Lys Tyr Asp Ala Val
1175 1180 1185
Ile Ala Leu Glu Asp Leu Asn Ser Gly Phe Lys Asn Ser Arg Val
1190 1195 1200
Lys Val Glu Lys Gln Val Tyr Gln Lys Phe Glu Lys Met Leu Ile
1205 1210 1215
Asp Lys Leu Asn Tyr Met Val Asp Lys Lys Ser Asn Pro Cys Ala
1220 1225 1230
Thr Gly Gly Ala Leu Lys Gly Tyr Gln Ile Thr Asn Lys Phe Glu
1235 1240 1245
Ser Phe Lys Ser Met Ser Thr Gln Asn Gly Phe Ile Phe Tyr Ile
1250 1255 1260
Pro Ala Trp Leu Thr Ser Lys Ile Asp Pro Ser Thr Gly Phe Val
1265 1270 1275
Asn Leu Leu Lys Thr Lys Tyr Thr Ser Ile Ala Asp Ser Lys Lys
1280 1285 1290
Phe Ile Ser Ser Phe Asp Arg Ile Met Tyr Val Pro Glu Glu Asp
1295 1300 1305
Leu Phe Glu Phe Ala Leu Asp Tyr Lys Asn Phe Ser Arg Thr Asp
1310 1315 1320
Ala Asp Tyr Ile Lys Lys Trp Lys Leu Tyr Ser Tyr Gly Asn Arg
1325 1330 1335
Ile Arg Ile Phe Arg Asn Pro Lys Lys Asn Asn Val Phe Asp Trp
1340 1345 1350
Glu Glu Val Cys Leu Thr Ser Ala Tyr Lys Glu Leu Phe Asn Lys
1355 1360 1365
Tyr Gly Ile Asn Tyr Gln Gln Gly Asp Ile Arg Ala Leu Leu Cys
1370 1375 1380
Glu Gln Ser Asp Lys Ala Phe Tyr Ser Ser Phe Met Ala Leu Met
1385 1390 1395
Ser Leu Met Leu Gln Met Arg Asn Ser Ile Thr Gly Arg Thr Asp
1400 1405 1410
Val Asp Phe Leu Ile Ser Pro Val Lys Asn Ser Asp Gly Ile Phe
1415 1420 1425
Tyr Asp Ser Arg Asn Tyr Glu Ala Gln Glu Asn Ala Ile Leu Pro
1430 1435 1440
Lys Asn Ala Asp Ala Asn Gly Ala Tyr Asn Ile Ala Arg Lys Val
1445 1450 1455
Leu Trp Ala Ile Gly Gln Phe Lys Lys Ala Glu Asp Glu Lys Leu
1460 1465 1470
Asp Lys Val Lys Ile Ala Ile Ser Asn Lys Glu Trp Leu Glu Tyr
1475 1480 1485
Ala Gln Thr Ser Val Lys His Gly Ser Pro Lys Lys Lys Arg Lys
1490 1495 1500
Val Ser Gly Gly Ser Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu
1505 1510 1515
Thr Gly Lys Gln Leu Val Ile Gln Glu Ser Ile Leu Met Leu Pro
1520 1525 1530
Glu Glu Val Glu Glu Val Ile Gly Asn Lys Pro Glu Ser Asp Ile
1535 1540 1545
Leu Val His Thr Ala Tyr Asp Glu Ser Thr Asp Glu Asn Val Met
1550 1555 1560
Leu Leu Thr Ser Asp Ala Pro Glu Tyr Lys Pro Trp Ala Leu Val
1565 1570 1575
Ile Gln Asp Ser Asn Gly Glu Asn Lys Ile Lys Met Leu Ser Gly
1580 1585 1590
Gly Ser Pro Lys Lys Lys Arg Lys Val
1595 1600
<210> 53
<211> 3873
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 53
atgccgaaga agaagcgcaa ggtcgggggc gggggctcag gcgggggcgg gagcggcggc 60
gggggctctg ggggcggcgg cagcggcggg ggcggcagcg ggggcggcgg gtcgatgagc 120
aagctggaga agttcacgaa ctgctactcc ctcagcaaga ccctgaggtt caaggcgatc 180
ccggtcggca agacccagga gaacatcgac aacaagcggc tgctggtgga ggacgagaag 240
agggctgagg actacaaggg cgtgaagaag ctcctggacc gctactacct gtccttcatc 300
aacgacgtgc tccacagcat caagctcaag aacctgaaca actacatcag cctcttcagg 360
aagaagacgc gcaccgagaa ggagaacaag gagctcgaga acctggagat caacctgagg 420
aaggagatcg ccaaggcgtt caagggcaac gagggctaca agtccctctt caagaaggac 480
atcatcgaga cgatcctccc ggagttcctg gacgacaagg acgagatcgc cctggtcaac 540
tccttcaacg gcttcaccac ggcgttcacc ggcttcttcg acaaccgcga gaacatgttc 600
agcgaggagg ccaagtccac gagcatcgcg ttcaggtgca tcaacgagaa cctcacccgc 660
tacatctcca acatggacat cttcgagaag gtcgacgcga tcttcgacaa gcacgaggtg 720
caggagatca aggagaagat cctgaacagc gactacgacg tcgaggactt cttcgagggc 780
gagttcttca acttcgtcct cacgcaggag ggcatcgacg tgtacaacgc catcatcggt 840
ggcttcgtga ccgagtccgg cgagaagatc aagggcctga acgagtacat caacctctac 900
aaccagaaga ccaagcagaa gctgccgaag ttcaagcccc tgtacaagca ggtgctctcc 960
gacagggagt ccctcagctt ctacggcgag ggctacacga gcgacgagga ggtcctggag 1020
gtgttccgca acaccctcaa caagaacagc gagatcttct ccagcatcaa gaagctcgag 1080
aagctgttca agaacttcga cgagtactcc agcgccggca tcttcgtcaa gaacggcccg 1140
gcgatctcca cgatcagcaa ggacatcttc ggcgagtgga acgtgatccg cgacaagtgg 1200
aacgccgagt acgacgacat ccacctcaag aagaaggcgg tggtcaccga gaagtacgag 1260
gacgacaggc gcaagtcctt caagaagatc ggctccttca gcctcgagca gctgcaggag 1320
tacgccgacg cggacctgag cgtggtcgag aagctcaagg agatcatcat ccagaaggtc 1380
gacgagatct acaaggtgta cggctccagc gagaagctct tcgacgcgga cttcgtcctc 1440
gagaagtccc tgaagaagaa cgacgccgtg gtcgcgatca tgaaggacct cctggactcc 1500
gtgaagagct tcgagaatta catcaaggcc ttcttcggcg agggcaagga gacgaacagg 1560
gacgagtcct tctacggcga cttcgtcctg gcctacgaca tcctcctgaa ggtggaccac 1620
atctacgacg cgatccgcaa ctacgtgacc cagaagccgt acagcaagga caagttcaag 1680
ctctacttcc agaaccccca gttcatgggc ggctgggaca aggacaagga gacggactac 1740
agggcgacca tcctgcgcta cggcagcaag tactacctcg ccatcatgga caagaagtac 1800
gcgaagtgcc tgcagaagat cgacaaggac gacgtcaacg gcaactacga gaagatcaac 1860
tacaagctcc tgccgggccc caacaagatg ctcccgaagg tgttcttctc caagaagtgg 1920
atggcctact acaaccccag cgaggacatc cagaagatct acaagaacgg cacgttcaag 1980
aagggcgaca tgttcaacct gaacgactgc cacaagctca tcgacttctt caaggactcc 2040
atcagccgct acccgaagtg gtccaacgcc tacgacttca acttcagcga gaccgagaag 2100
tacaaggaca tcgcgggctt ctaccgcgag gtcgaggagc agggctacaa ggtgtccttc 2160
gagtccgcca gcaagaagga ggtcgacaag ctggtggagg agggcaagct ctacatgttc 2220
cagatctaca acaaggactt ctccgacaag agccacggca cgcccaacct gcacaccatg 2280
tacttcaagc tcctgttcga cgagaacaac cacggccaga tcaggctgtc cggcggcgcc 2340
gagctcttca tgaggagggc gagcctgaag aaggaggagc tggtggtcca ccccgctaac 2400
agcccaatcg cgaacaagaa cccggacaac cccaagaaga ccacgaccct gtcctacgac 2460
gtgtacaagg acaagaggtt cagcgaggac cagtacgagc tccacatccc gatcgcgatc 2520
aacaagtgcc ccaagaacat cttcaagatc aacaccgagg tccgcgtgct cctgaagcac 2580
gacgacaacc cctacgtgat cggcatcgac aggggcgaga ggaacctcct gtacatcgtg 2640
gtcgtggacg gcaagggcaa catcgtggag cagtactccc tcaacgagat catcaacaac 2700
ttcaacggca tcaggatcaa gacggactac cacagcctcc tggacaagaa ggagaaggag 2760
aggttcgagg cccgccagaa ctggacctcc atcgagaaca tcaaggagct gaaggcgggc 2820
tacatcagcc aggtcgtgca caagatctgc gagctcgtcg agaagtacga cgccgtgatc 2880
gccctcgagg acctgaactc cggcttcaag aacagccgcg tcaaggtgga gaagcaggtc 2940
taccagaagt tcgagaagat gctcatcgac aagctgaact acatggtgga caagaagtcc 3000
aacccctgcg ctacgggcgg cgcgctgaag ggctaccaga tcaccaacaa gttcgagagc 3060
ttcaagtcca tgagcactca gaacggcttc atcttctaca tcccggcgtg gctcacgtcc 3120
aagatcgacc ccagcaccgg cttcgtcaac ctcctgaaga cgaagtacac ctccatcgcc 3180
gacagcaaga agttcatctc cagcttcgac cgcatcatgt atgtgccgga ggaggacctg 3240
ttcgagttcg ccctcgacta caagaacttc tcccgcacgg acgcggacta catcaagaag 3300
tggaagctgt acagctacgg caaccgcatc cgcatcttca ggaaccccaa gaagaacaac 3360
gtcttcgact gggaggaggt gtgcctgacc tccgcgtaca aggagctctt caacaagtac 3420
ggcatcaact accagcaggg cgacatcagg gctctcctgt gcgagcagag cgacaaggcc 3480
ttctactcca gcttcatggc gctgatgtcc ctcatgctgc agatgaggaa ctcgatcacc 3540
ggcaggacgg acgtggactt cctcatctcc ccggtgaaga acagcgacgg catcttctac 3600
gactccagga actacgaggc ccaggagaac gcgatcctcc caaagaacgc ggacgccaac 3660
ggcgcctaca acatcgccag gaaggtcctc tgggctatcg gccagttcaa gaaggcggag 3720
gacgagaagc tggacaaggt gaagatcgcc atcagcaaca aggagtggct cgagtacgcc 3780
cagacctcgg tcaagcacgg cagcccgaag aagaagcgca aggtgtccgg cggcagctcc 3840
ggcggcagcc cgaagaagaa gcgcaaagtg tga 3873
<210> 54
<211> 1290
<212> PRT
<213> Artificial Sequence
<220>
<223> Fusion protein
<400> 54
Met Pro Lys Lys Lys Arg Lys Val Gly Gly Gly Gly Ser Gly Gly Gly
1 5 10 15
Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly
20 25 30
Ser Gly Gly Gly Gly Ser Met Ser Lys Leu Glu Lys Phe Thr Asn Cys
35 40 45
Tyr Ser Leu Ser Lys Thr Leu Arg Phe Lys Ala Ile Pro Val Gly Lys
50 55 60
Thr Gln Glu Asn Ile Asp Asn Lys Arg Leu Leu Val Glu Asp Glu Lys
65 70 75 80
Arg Ala Glu Asp Tyr Lys Gly Val Lys Lys Leu Leu Asp Arg Tyr Tyr
85 90 95
Leu Ser Phe Ile Asn Asp Val Leu His Ser Ile Lys Leu Lys Asn Leu
100 105 110
Asn Asn Tyr Ile Ser Leu Phe Arg Lys Lys Thr Arg Thr Glu Lys Glu
115 120 125
Asn Lys Glu Leu Glu Asn Leu Glu Ile Asn Leu Arg Lys Glu Ile Ala
130 135 140
Lys Ala Phe Lys Gly Asn Glu Gly Tyr Lys Ser Leu Phe Lys Lys Asp
145 150 155 160
Ile Ile Glu Thr Ile Leu Pro Glu Phe Leu Asp Asp Lys Asp Glu Ile
165 170 175
Ala Leu Val Asn Ser Phe Asn Gly Phe Thr Thr Ala Phe Thr Gly Phe
180 185 190
Phe Asp Asn Arg Glu Asn Met Phe Ser Glu Glu Ala Lys Ser Thr Ser
195 200 205
Ile Ala Phe Arg Cys Ile Asn Glu Asn Leu Thr Arg Tyr Ile Ser Asn
210 215 220
Met Asp Ile Phe Glu Lys Val Asp Ala Ile Phe Asp Lys His Glu Val
225 230 235 240
Gln Glu Ile Lys Glu Lys Ile Leu Asn Ser Asp Tyr Asp Val Glu Asp
245 250 255
Phe Phe Glu Gly Glu Phe Phe Asn Phe Val Leu Thr Gln Glu Gly Ile
260 265 270
Asp Val Tyr Asn Ala Ile Ile Gly Gly Phe Val Thr Glu Ser Gly Glu
275 280 285
Lys Ile Lys Gly Leu Asn Glu Tyr Ile Asn Leu Tyr Asn Gln Lys Thr
290 295 300
Lys Gln Lys Leu Pro Lys Phe Lys Pro Leu Tyr Lys Gln Val Leu Ser
305 310 315 320
Asp Arg Glu Ser Leu Ser Phe Tyr Gly Glu Gly Tyr Thr Ser Asp Glu
325 330 335
Glu Val Leu Glu Val Phe Arg Asn Thr Leu Asn Lys Asn Ser Glu Ile
340 345 350
Phe Ser Ser Ile Lys Lys Leu Glu Lys Leu Phe Lys Asn Phe Asp Glu
355 360 365
Tyr Ser Ser Ala Gly Ile Phe Val Lys Asn Gly Pro Ala Ile Ser Thr
370 375 380
Ile Ser Lys Asp Ile Phe Gly Glu Trp Asn Val Ile Arg Asp Lys Trp
385 390 395 400
Asn Ala Glu Tyr Asp Asp Ile His Leu Lys Lys Lys Ala Val Val Thr
405 410 415
Glu Lys Tyr Glu Asp Asp Arg Arg Lys Ser Phe Lys Lys Ile Gly Ser
420 425 430
Phe Ser Leu Glu Gln Leu Gln Glu Tyr Ala Asp Ala Asp Leu Ser Val
435 440 445
Val Glu Lys Leu Lys Glu Ile Ile Ile Gln Lys Val Asp Glu Ile Tyr
450 455 460
Lys Val Tyr Gly Ser Ser Glu Lys Leu Phe Asp Ala Asp Phe Val Leu
465 470 475 480
Glu Lys Ser Leu Lys Lys Asn Asp Ala Val Val Ala Ile Met Lys Asp
485 490 495
Leu Leu Asp Ser Val Lys Ser Phe Glu Asn Tyr Ile Lys Ala Phe Phe
500 505 510
Gly Glu Gly Lys Glu Thr Asn Arg Asp Glu Ser Phe Tyr Gly Asp Phe
515 520 525
Val Leu Ala Tyr Asp Ile Leu Leu Lys Val Asp His Ile Tyr Asp Ala
530 535 540
Ile Arg Asn Tyr Val Thr Gln Lys Pro Tyr Ser Lys Asp Lys Phe Lys
545 550 555 560
Leu Tyr Phe Gln Asn Pro Gln Phe Met Gly Gly Trp Asp Lys Asp Lys
565 570 575
Glu Thr Asp Tyr Arg Ala Thr Ile Leu Arg Tyr Gly Ser Lys Tyr Tyr
580 585 590
Leu Ala Ile Met Asp Lys Lys Tyr Ala Lys Cys Leu Gln Lys Ile Asp
595 600 605
Lys Asp Asp Val Asn Gly Asn Tyr Glu Lys Ile Asn Tyr Lys Leu Leu
610 615 620
Pro Gly Pro Asn Lys Met Leu Pro Lys Val Phe Phe Ser Lys Lys Trp
625 630 635 640
Met Ala Tyr Tyr Asn Pro Ser Glu Asp Ile Gln Lys Ile Tyr Lys Asn
645 650 655
Gly Thr Phe Lys Lys Gly Asp Met Phe Asn Leu Asn Asp Cys His Lys
660 665 670
Leu Ile Asp Phe Phe Lys Asp Ser Ile Ser Arg Tyr Pro Lys Trp Ser
675 680 685
Asn Ala Tyr Asp Phe Asn Phe Ser Glu Thr Glu Lys Tyr Lys Asp Ile
690 695 700
Ala Gly Phe Tyr Arg Glu Val Glu Glu Gln Gly Tyr Lys Val Ser Phe
705 710 715 720
Glu Ser Ala Ser Lys Lys Glu Val Asp Lys Leu Val Glu Glu Gly Lys
725 730 735
Leu Tyr Met Phe Gln Ile Tyr Asn Lys Asp Phe Ser Asp Lys Ser His
740 745 750
Gly Thr Pro Asn Leu His Thr Met Tyr Phe Lys Leu Leu Phe Asp Glu
755 760 765
Asn Asn His Gly Gln Ile Arg Leu Ser Gly Gly Ala Glu Leu Phe Met
770 775 780
Arg Arg Ala Ser Leu Lys Lys Glu Glu Leu Val Val His Pro Ala Asn
785 790 795 800
Ser Pro Ile Ala Asn Lys Asn Pro Asp Asn Pro Lys Lys Thr Thr Thr
805 810 815
Leu Ser Tyr Asp Val Tyr Lys Asp Lys Arg Phe Ser Glu Asp Gln Tyr
820 825 830
Glu Leu His Ile Pro Ile Ala Ile Asn Lys Cys Pro Lys Asn Ile Phe
835 840 845
Lys Ile Asn Thr Glu Val Arg Val Leu Leu Lys His Asp Asp Asn Pro
850 855 860
Tyr Val Ile Gly Ile Asp Arg Gly Glu Arg Asn Leu Leu Tyr Ile Val
865 870 875 880
Val Val Asp Gly Lys Gly Asn Ile Val Glu Gln Tyr Ser Leu Asn Glu
885 890 895
Ile Ile Asn Asn Phe Asn Gly Ile Arg Ile Lys Thr Asp Tyr His Ser
900 905 910
Leu Leu Asp Lys Lys Glu Lys Glu Arg Phe Glu Ala Arg Gln Asn Trp
915 920 925
Thr Ser Ile Glu Asn Ile Lys Glu Leu Lys Ala Gly Tyr Ile Ser Gln
930 935 940
Val Val His Lys Ile Cys Glu Leu Val Glu Lys Tyr Asp Ala Val Ile
945 950 955 960
Ala Leu Glu Asp Leu Asn Ser Gly Phe Lys Asn Ser Arg Val Lys Val
965 970 975
Glu Lys Gln Val Tyr Gln Lys Phe Glu Lys Met Leu Ile Asp Lys Leu
980 985 990
Asn Tyr Met Val Asp Lys Lys Ser Asn Pro Cys Ala Thr Gly Gly Ala
995 1000 1005
Leu Lys Gly Tyr Gln Ile Thr Asn Lys Phe Glu Ser Phe Lys Ser
1010 1015 1020
Met Ser Thr Gln Asn Gly Phe Ile Phe Tyr Ile Pro Ala Trp Leu
1025 1030 1035
Thr Ser Lys Ile Asp Pro Ser Thr Gly Phe Val Asn Leu Leu Lys
1040 1045 1050
Thr Lys Tyr Thr Ser Ile Ala Asp Ser Lys Lys Phe Ile Ser Ser
1055 1060 1065
Phe Asp Arg Ile Met Tyr Val Pro Glu Glu Asp Leu Phe Glu Phe
1070 1075 1080
Ala Leu Asp Tyr Lys Asn Phe Ser Arg Thr Asp Ala Asp Tyr Ile
1085 1090 1095
Lys Lys Trp Lys Leu Tyr Ser Tyr Gly Asn Arg Ile Arg Ile Phe
1100 1105 1110
Arg Asn Pro Lys Lys Asn Asn Val Phe Asp Trp Glu Glu Val Cys
1115 1120 1125
Leu Thr Ser Ala Tyr Lys Glu Leu Phe Asn Lys Tyr Gly Ile Asn
1130 1135 1140
Tyr Gln Gln Gly Asp Ile Arg Ala Leu Leu Cys Glu Gln Ser Asp
1145 1150 1155
Lys Ala Phe Tyr Ser Ser Phe Met Ala Leu Met Ser Leu Met Leu
1160 1165 1170
Gln Met Arg Asn Ser Ile Thr Gly Arg Thr Asp Val Asp Phe Leu
1175 1180 1185
Ile Ser Pro Val Lys Asn Ser Asp Gly Ile Phe Tyr Asp Ser Arg
1190 1195 1200
Asn Tyr Glu Ala Gln Glu Asn Ala Ile Leu Pro Lys Asn Ala Asp
1205 1210 1215
Ala Asn Gly Ala Tyr Asn Ile Ala Arg Lys Val Leu Trp Ala Ile
1220 1225 1230
Gly Gln Phe Lys Lys Ala Glu Asp Glu Lys Leu Asp Lys Val Lys
1235 1240 1245
Ile Ala Ile Ser Asn Lys Glu Trp Leu Glu Tyr Ala Gln Thr Ser
1250 1255 1260
Val Lys His Gly Ser Pro Lys Lys Lys Arg Lys Val Ser Gly Gly
1265 1270 1275
Ser Ser Gly Gly Ser Pro Lys Lys Lys Arg Lys Val
1280 1285 1290
<210> 55
<211> 3873
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 55
atgccgaaga agaagcgcaa ggtcgggggc gggggctcag gcgggggcgg gagcggcggc 60
gggggctctg ggggcggcgg cagcggcggg ggcggcagcg ggggcggcgg gtcgatgagc 120
aagctggaga agttcacgaa ctgctactcc ctcagcaaga ccctgaggtt caaggcgatc 180
ccggtcggca agacccagga gaacatcgac aacaagcggc tgctggtgga ggacgagaag 240
agggctgagg actacaaggg cgtgaagaag ctcctggacc gctactacct gtccttcatc 300
aacgacgtgc tccacagcat caagctcaag aacctgaaca actacatcag cctcttcagg 360
aagaagacgc gcaccgagaa ggagaacaag gagctcgaga acctggagat caacctgagg 420
aaggagatcg ccaaggcgtt caagggcaac gagggctaca agtccctctt caagaaggac 480
atcatcgaga cgatcctccc ggagttcctg gacgacaagg acgagatcgc cctggtcaac 540
tccttcaacg gcttcaccac ggcgttcacc ggcttcttcg acaaccgcga gaacatgttc 600
agcgaggagg ccaagtccac gagcatcgcg ttcaggtgca tcaacgagaa cctcacccgc 660
tacatctcca acatggacat cttcgagaag gtcgacgcga tcttcgacaa gcacgaggtg 720
caggagatca aggagaagat cctgaacagc gactacgacg tcgaggactt cttcgagggc 780
gagttcttca acttcgtcct cacgcaggag ggcatcgacg tgtacaacgc catcatcggt 840
ggcttcgtga ccgagtccgg cgagaagatc aagggcctga acgagtacat caacctctac 900
aaccagaaga ccaagcagaa gctgccgaag ttcaagcccc tgtacaagca ggtgctctcc 960
gacagggagt ccctcagctt ctacggcgag ggctacacga gcgacgagga ggtcctggag 1020
gtgttccgca acaccctcaa caagaacagc gagatcttct ccagcatcaa gaagctcgag 1080
aagctgttca agaacttcga cgagtactcc agcgccggca tcttcgtcaa gaacggcccg 1140
gcgatctcca cgatcagcaa ggacatcttc ggcgagtgga acgtgatccg cgacaagtgg 1200
aacgccgagt acgacgacat ccacctcaag aagaaggcgg tggtcaccga gaagtacgag 1260
gacgacaggc gcaagtcctt caagaagatc ggctccttca gcctcgagca gctgcaggag 1320
tacgccgacg cggacctgag cgtggtcgag aagctcaagg agatcatcat ccagaaggtc 1380
gacgagatct acaaggtgta cggctccagc gagaagctct tcgacgcgga cttcgtcctc 1440
gagaagtccc tgaagaagaa cgacgccgtg gtcgcgatca tgaaggacct cctggactcc 1500
gtgaagagct tcgagaatta catcaaggcc ttcttcggcg agggcaagga gacgaacagg 1560
gacgagtcct tctacggcga cttcgtcctg gcctacgaca tcctcctgaa ggtggaccac 1620
atctacgacg cgatccgcaa ctacgtgacc cagaagccgt acagcaagga caagttcaag 1680
ctctacttcc agaaccccca gttcatgggc ggctgggaca aggacaagga gacggactac 1740
agggcgacca tcctgcgcta cggcagcaag tactacctcg ccatcatgga caagaagtac 1800
gcgaagtgcc tgcagaagat cgacaaggac gacgtcaacg gcaactacga gaagatcaac 1860
tacaagctcc tgccgggccc caacaagatg ctcccgaagg tgttcttctc caagaagtgg 1920
atggcctact acaaccccag cgaggacatc cagaagatct acaagaacgg cacgttcaag 1980
aagggcgaca tgttcaacct gaacgactgc cacaagctca tcgacttctt caaggactcc 2040
atcagccgct acccgaagtg gtccaacgcc tacgacttca acttcagcga gaccgagaag 2100
tacaaggaca tcgcgggctt ctaccgcgag gtcgaggagc agggctacaa ggtgtccttc 2160
gagtccgcca gcaagaagga ggtcgacaag ctggtggagg agggcaagct ctacatgttc 2220
cagatctaca acaaggactt ctccgacaag agccacggca cgcccaacct gcacaccatg 2280
tacttcaagc tcctgttcga cgagaacaac cacggccaga tcaggctgtc cggcggcgcc 2340
gagctcttca tgaggagggc gagcctgaag aaggaggagc tggtggtcca ccccgctaac 2400
agcccaatcg cgaacaagaa cccggacaac cccaagaaga ccacgaccct gtcctacgac 2460
gtgtacaagg acaagaggtt cagcgaggac cagtacgagc tccacatccc gatcgcgatc 2520
aacaagtgcc ccaagaacat cttcaagatc aacaccgagg tccgcgtgct cctgaagcac 2580
gacgacaacc cctacgtgat cggcatcgac aggggcgaga ggaacctcct gtacatcgtg 2640
gtcgtggacg gcaagggcaa catcgtggag cagtactccc tcaacgagat catcaacaac 2700
ttcaacggca tcaggatcaa gacggactac cacagcctcc tggacaagaa ggagaaggag 2760
aggttcgagg cccgccagaa ctggacctcc atcgagaaca tcaaggagct gaaggcgggc 2820
tacatcagcc aggtcgtgca caagatctgc gagctcgtcg agaagtacga cgccgtgatc 2880
gccctcgagg acctgaactc cggcttcaag aacagccgcg tcaaggtgga gaagcaggtc 2940
taccagaagt tcgagaagat gctcatcgac aagctgaact acatggtgga caagaagtcc 3000
aacccctgcg ctacgggcgg cgcgctgaag ggctaccaga tcaccaacaa gttcgagagc 3060
ttcaagtcca tgagcactca gaacggcttc atcttctaca tcccggcgtg gctcacgtcc 3120
aagatcgacc ccagcaccgg cttcgtcaac ctcctgaaga cgaagtacac ctccatcgcc 3180
gacagcaaga agttcatctc cagcttcgac cgcatcatgt atgtgccgga ggaggacctg 3240
ttcgagttcg ccctcgacta caagaacttc tcccgcacgg acgcggacta catcaagaag 3300
tggaagctgt acagctacgg caaccgcatc cgcatcttca ggaaccccaa gaagaacaac 3360
gtcttcgact gggaggaggt gtgcctgacc tccgcgtaca aggagctctt caacaagtac 3420
ggcatcaact accagcaggg cgacatcagg gctctcctgt gcgagcagag cgacaaggcc 3480
ttctactcca gcttcatggc gctgatgtcc ctcatgctgc agatgaggaa ctcgatcacc 3540
ggcaggacgg acgtggactt cctcatctcc ccggtgaaga acagcgacgg catcttctac 3600
gactccagga actacgaggc ccaggagaac gcgatcctcc caaagaacgc ggacgccaac 3660
ggcgcctaca acatcgccag gaaggtcctc tgggctatcg gccagttcaa gaaggcggag 3720
gacgagaagc tggacaaggt gaagatcgcc atcagcaaca aggagtggct cgagtacgcc 3780
cagacctcgg tcaagcacgg cagcccgaag aagaagcgca aggtgtccgg cggcagctcc 3840
ggcggcagcc cgaagaagaa gcgcaaagtg tga 3873
<210> 56
<211> 1290
<212> PRT
<213> Artificial Sequence
<220>
<223> Fusion protein
<400> 56
Met Pro Lys Lys Lys Arg Lys Val Gly Gly Gly Gly Ser Gly Gly Gly
1 5 10 15
Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly
20 25 30
Ser Gly Gly Gly Gly Ser Met Ser Lys Leu Glu Lys Phe Thr Asn Cys
35 40 45
Tyr Ser Leu Ser Lys Thr Leu Arg Phe Lys Ala Ile Pro Val Gly Lys
50 55 60
Thr Gln Glu Asn Ile Asp Asn Lys Arg Leu Leu Val Glu Asp Glu Lys
65 70 75 80
Arg Ala Glu Asp Tyr Lys Gly Val Lys Lys Leu Leu Asp Arg Tyr Tyr
85 90 95
Leu Ser Phe Ile Asn Asp Val Leu His Ser Ile Lys Leu Lys Asn Leu
100 105 110
Asn Asn Tyr Ile Ser Leu Phe Arg Lys Lys Thr Arg Thr Glu Lys Glu
115 120 125
Asn Lys Glu Leu Glu Asn Leu Glu Ile Asn Leu Arg Lys Glu Ile Ala
130 135 140
Lys Ala Phe Lys Gly Asn Glu Gly Tyr Lys Ser Leu Phe Lys Lys Asp
145 150 155 160
Ile Ile Glu Thr Ile Leu Pro Glu Phe Leu Asp Asp Lys Asp Glu Ile
165 170 175
Ala Leu Val Asn Ser Phe Asn Gly Phe Thr Thr Ala Phe Thr Gly Phe
180 185 190
Phe Asp Asn Arg Glu Asn Met Phe Ser Glu Glu Ala Lys Ser Thr Ser
195 200 205
Ile Ala Phe Arg Cys Ile Asn Glu Asn Leu Thr Arg Tyr Ile Ser Asn
210 215 220
Met Asp Ile Phe Glu Lys Val Asp Ala Ile Phe Asp Lys His Glu Val
225 230 235 240
Gln Glu Ile Lys Glu Lys Ile Leu Asn Ser Asp Tyr Asp Val Glu Asp
245 250 255
Phe Phe Glu Gly Glu Phe Phe Asn Phe Val Leu Thr Gln Glu Gly Ile
260 265 270
Asp Val Tyr Asn Ala Ile Ile Gly Gly Phe Val Thr Glu Ser Gly Glu
275 280 285
Lys Ile Lys Gly Leu Asn Glu Tyr Ile Asn Leu Tyr Asn Gln Lys Thr
290 295 300
Lys Gln Lys Leu Pro Lys Phe Lys Pro Leu Tyr Lys Gln Val Leu Ser
305 310 315 320
Asp Arg Glu Ser Leu Ser Phe Tyr Gly Glu Gly Tyr Thr Ser Asp Glu
325 330 335
Glu Val Leu Glu Val Phe Arg Asn Thr Leu Asn Lys Asn Ser Glu Ile
340 345 350
Phe Ser Ser Ile Lys Lys Leu Glu Lys Leu Phe Lys Asn Phe Asp Glu
355 360 365
Tyr Ser Ser Ala Gly Ile Phe Val Lys Asn Gly Pro Ala Ile Ser Thr
370 375 380
Ile Ser Lys Asp Ile Phe Gly Glu Trp Asn Val Ile Arg Asp Lys Trp
385 390 395 400
Asn Ala Glu Tyr Asp Asp Ile His Leu Lys Lys Lys Ala Val Val Thr
405 410 415
Glu Lys Tyr Glu Asp Asp Arg Arg Lys Ser Phe Lys Lys Ile Gly Ser
420 425 430
Phe Ser Leu Glu Gln Leu Gln Glu Tyr Ala Asp Ala Asp Leu Ser Val
435 440 445
Val Glu Lys Leu Lys Glu Ile Ile Ile Gln Lys Val Asp Glu Ile Tyr
450 455 460
Lys Val Tyr Gly Ser Ser Glu Lys Leu Phe Asp Ala Asp Phe Val Leu
465 470 475 480
Glu Lys Ser Leu Lys Lys Asn Asp Ala Val Val Ala Ile Met Lys Asp
485 490 495
Leu Leu Asp Ser Val Lys Ser Phe Glu Asn Tyr Ile Lys Ala Phe Phe
500 505 510
Gly Glu Gly Lys Glu Thr Asn Arg Asp Glu Ser Phe Tyr Gly Asp Phe
515 520 525
Val Leu Ala Tyr Asp Ile Leu Leu Lys Val Asp His Ile Tyr Asp Ala
530 535 540
Ile Arg Asn Tyr Val Thr Gln Lys Pro Tyr Ser Lys Asp Lys Phe Lys
545 550 555 560
Leu Tyr Phe Gln Asn Pro Gln Phe Met Gly Gly Trp Asp Lys Asp Lys
565 570 575
Glu Thr Asp Tyr Arg Ala Thr Ile Leu Arg Tyr Gly Ser Lys Tyr Tyr
580 585 590
Leu Ala Ile Met Asp Lys Lys Tyr Ala Lys Cys Leu Gln Lys Ile Asp
595 600 605
Lys Asp Asp Val Asn Gly Asn Tyr Glu Lys Ile Asn Tyr Lys Leu Leu
610 615 620
Pro Gly Pro Asn Lys Met Leu Pro Lys Val Phe Phe Ser Lys Lys Trp
625 630 635 640
Met Ala Tyr Tyr Asn Pro Ser Glu Asp Ile Gln Lys Ile Tyr Lys Asn
645 650 655
Gly Thr Phe Lys Lys Gly Asp Met Phe Asn Leu Asn Asp Cys His Lys
660 665 670
Leu Ile Asp Phe Phe Lys Asp Ser Ile Ser Arg Tyr Pro Lys Trp Ser
675 680 685
Asn Ala Tyr Asp Phe Asn Phe Ser Glu Thr Glu Lys Tyr Lys Asp Ile
690 695 700
Ala Gly Phe Tyr Arg Glu Val Glu Glu Gln Gly Tyr Lys Val Ser Phe
705 710 715 720
Glu Ser Ala Ser Lys Lys Glu Val Asp Lys Leu Val Glu Glu Gly Lys
725 730 735
Leu Tyr Met Phe Gln Ile Tyr Asn Lys Asp Phe Ser Asp Lys Ser His
740 745 750
Gly Thr Pro Asn Leu His Thr Met Tyr Phe Lys Leu Leu Phe Asp Glu
755 760 765
Asn Asn His Gly Gln Ile Arg Leu Ser Gly Gly Ala Glu Leu Phe Met
770 775 780
Arg Arg Ala Ser Leu Lys Lys Glu Glu Leu Val Val His Pro Ala Asn
785 790 795 800
Ser Pro Ile Ala Asn Lys Asn Pro Asp Asn Pro Lys Lys Thr Thr Thr
805 810 815
Leu Ser Tyr Asp Val Tyr Lys Asp Lys Arg Phe Ser Glu Asp Gln Tyr
820 825 830
Glu Leu His Ile Pro Ile Ala Ile Asn Lys Cys Pro Lys Asn Ile Phe
835 840 845
Lys Ile Asn Thr Glu Val Arg Val Leu Leu Lys His Asp Asp Asn Pro
850 855 860
Tyr Val Ile Gly Ile Asp Arg Gly Glu Arg Asn Leu Leu Tyr Ile Val
865 870 875 880
Val Val Asp Gly Lys Gly Asn Ile Val Glu Gln Tyr Ser Leu Asn Glu
885 890 895
Ile Ile Asn Asn Phe Asn Gly Ile Arg Ile Lys Thr Asp Tyr His Ser
900 905 910
Leu Leu Asp Lys Lys Glu Lys Glu Arg Phe Glu Ala Arg Gln Asn Trp
915 920 925
Thr Ser Ile Glu Asn Ile Lys Glu Leu Lys Ala Gly Tyr Ile Ser Gln
930 935 940
Val Val His Lys Ile Cys Glu Leu Val Glu Lys Tyr Asp Ala Val Ile
945 950 955 960
Ala Leu Glu Asp Leu Asn Ser Gly Phe Lys Asn Ser Arg Val Lys Val
965 970 975
Glu Lys Gln Val Tyr Gln Lys Phe Glu Lys Met Leu Ile Asp Lys Leu
980 985 990
Asn Tyr Met Val Asp Lys Lys Ser Asn Pro Cys Ala Thr Gly Gly Ala
995 1000 1005
Leu Lys Gly Tyr Gln Ile Thr Asn Lys Phe Glu Ser Phe Lys Ser
1010 1015 1020
Met Ser Thr Gln Asn Gly Phe Ile Phe Tyr Ile Pro Ala Trp Leu
1025 1030 1035
Thr Ser Lys Ile Asp Pro Ser Thr Gly Phe Val Asn Leu Leu Lys
1040 1045 1050
Thr Lys Tyr Thr Ser Ile Ala Asp Ser Lys Lys Phe Ile Ser Ser
1055 1060 1065
Phe Asp Arg Ile Met Tyr Val Pro Glu Glu Asp Leu Phe Glu Phe
1070 1075 1080
Ala Leu Asp Tyr Lys Asn Phe Ser Arg Thr Asp Ala Asp Tyr Ile
1085 1090 1095
Lys Lys Trp Lys Leu Tyr Ser Tyr Gly Asn Arg Ile Arg Ile Phe
1100 1105 1110
Arg Asn Pro Lys Lys Asn Asn Val Phe Asp Trp Glu Glu Val Cys
1115 1120 1125
Leu Thr Ser Ala Tyr Lys Glu Leu Phe Asn Lys Tyr Gly Ile Asn
1130 1135 1140
Tyr Gln Gln Gly Asp Ile Arg Ala Leu Leu Cys Glu Gln Ser Asp
1145 1150 1155
Lys Ala Phe Tyr Ser Ser Phe Met Ala Leu Met Ser Leu Met Leu
1160 1165 1170
Gln Met Arg Asn Ser Ile Thr Gly Arg Thr Asp Val Asp Phe Leu
1175 1180 1185
Ile Ser Pro Val Lys Asn Ser Asp Gly Ile Phe Tyr Asp Ser Arg
1190 1195 1200
Asn Tyr Glu Ala Gln Glu Asn Ala Ile Leu Pro Lys Asn Ala Asp
1205 1210 1215
Ala Asn Gly Ala Tyr Asn Ile Ala Arg Lys Val Leu Trp Ala Ile
1220 1225 1230
Gly Gln Phe Lys Lys Ala Glu Asp Glu Lys Leu Asp Lys Val Lys
1235 1240 1245
Ile Ala Ile Ser Asn Lys Glu Trp Leu Glu Tyr Ala Gln Thr Ser
1250 1255 1260
Val Lys His Gly Ser Pro Lys Lys Lys Arg Lys Val Ser Gly Gly
1265 1270 1275
Ser Ser Gly Gly Ser Pro Lys Lys Lys Arg Lys Val
1280 1285 1290
<210> 57
<211> 1491
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 57
Gly Gly Gly Gly Ser Gly Gly Gly Gly Gly Ser Gly Gly Gly Gly Gly
1 5 10 15
Ser Gly Gly Gly Gly Gly Ser Gly Gly Gly Gly Gly Ser Gly Gly Gly
20 25 30
Gly Gly Ser Gly Met Ser Ser Glu Thr Gly Pro Val Ala Val Asp Pro
35 40 45
Thr Leu Arg Arg Arg Ile Glu Pro His Glu Phe Glu Val Phe Phe Asp
50 55 60
Pro Arg Glu Leu Arg Lys Glu Thr Cys Leu Leu Tyr Glu Ile Asn Trp
65 70 75 80
Gly Gly Arg His Ser Ile Trp Arg His Thr Ser Gln Asn Thr Asn Lys
85 90 95
His Val Glu Val Asn Phe Ile Glu Lys Phe Thr Thr Glu Arg Tyr Phe
100 105 110
Cys Pro Asn Thr Arg Cys Ser Ile Thr Trp Phe Leu Ser Trp Ser Pro
115 120 125
Cys Gly Glu Cys Ser Arg Ala Ile Thr Glu Phe Leu Ser Arg Tyr Pro
130 135 140
His Val Thr Leu Phe Ile Tyr Ile Ala Arg Leu Tyr His His Ala Asp
145 150 155 160
Pro Arg Asn Arg Gln Gly Leu Arg Asp Leu Ile Ser Ser Gly Val Thr
165 170 175
Ile Gln Ile Met Thr Glu Gln Glu Ser Gly Tyr Cys Trp Arg Asn Phe
180 185 190
Val Asn Tyr Ser Pro Ser Asn Glu Ala His Trp Pro Arg Tyr Pro His
195 200 205
Leu Trp Val Arg Leu Tyr Val Leu Glu Leu Tyr Cys Ile Ile Leu Gly
210 215 220
Leu Pro Pro Cys Leu Asn Ile Leu Arg Arg Lys Gln Pro Gln Leu Thr
225 230 235 240
Phe Phe Thr Ile Ala Leu Gln Ser Cys His Tyr Gln Arg Leu Pro Pro
245 250 255
His Ile Leu Trp Ala Thr Gly Leu Lys Gly Gly Gly Gly Ser Gly Gly
260 265 270
Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly
275 280 285
Gly Ser Gly Gly Gly Gly Ser Met Ser Lys Leu Glu Lys Phe Thr Asn
290 295 300
Cys Tyr Ser Leu Ser Lys Thr Leu Arg Phe Lys Ala Ile Pro Val Gly
305 310 315 320
Lys Thr Gln Glu Asn Ile Asp Asn Lys Arg Leu Leu Val Glu Asp Glu
325 330 335
Lys Arg Ala Glu Asp Tyr Lys Gly Val Lys Lys Leu Leu Asp Arg Tyr
340 345 350
Tyr Leu Ser Phe Ile Asn Asp Val Leu His Ser Ile Lys Leu Lys Asn
355 360 365
Leu Asn Asn Tyr Ile Ser Leu Phe Arg Lys Lys Thr Arg Thr Glu Lys
370 375 380
Glu Asn Lys Glu Leu Glu Asn Leu Glu Ile Asn Leu Arg Lys Glu Ile
385 390 395 400
Ala Lys Ala Phe Lys Gly Asn Glu Gly Tyr Lys Ser Leu Phe Lys Lys
405 410 415
Asp Ile Ile Glu Thr Ile Leu Pro Glu Phe Leu Asp Asp Lys Asp Glu
420 425 430
Ile Ala Leu Val Asn Ser Phe Asn Gly Phe Thr Thr Ala Phe Thr Gly
435 440 445
Phe Phe Asp Asn Arg Glu Asn Met Phe Ser Glu Glu Ala Lys Ser Thr
450 455 460
Ser Ile Ala Phe Arg Cys Ile Asn Glu Asn Leu Thr Arg Tyr Ile Ser
465 470 475 480
Asn Met Asp Ile Phe Glu Lys Val Asp Ala Ile Phe Asp Lys His Glu
485 490 495
Val Gln Glu Ile Lys Glu Lys Ile Leu Asn Ser Asp Tyr Asp Val Glu
500 505 510
Asp Phe Phe Glu Gly Glu Phe Phe Asn Phe Val Leu Thr Gln Glu Gly
515 520 525
Ile Asp Val Tyr Asn Ala Ile Ile Gly Gly Phe Val Thr Glu Ser Gly
530 535 540
Glu Lys Ile Lys Gly Leu Asn Glu Tyr Ile Asn Leu Tyr Asn Gln Lys
545 550 555 560
Thr Lys Gln Lys Leu Pro Lys Phe Lys Pro Leu Tyr Lys Gln Val Leu
565 570 575
Ser Asp Arg Glu Ser Leu Ser Phe Tyr Gly Glu Gly Tyr Thr Ser Asp
580 585 590
Glu Glu Val Leu Glu Val Phe Arg Asn Thr Leu Asn Lys Asn Ser Glu
595 600 605
Ile Phe Ser Ser Ile Lys Lys Leu Glu Lys Leu Phe Lys Asn Phe Asp
610 615 620
Glu Tyr Ser Ser Ala Gly Ile Phe Val Lys Asn Gly Pro Ala Ile Ser
625 630 635 640
Thr Ile Ser Lys Asp Ile Phe Gly Glu Trp Asn Val Ile Arg Asp Lys
645 650 655
Trp Asn Ala Glu Tyr Asp Asp Ile His Leu Lys Lys Lys Ala Val Val
660 665 670
Thr Glu Lys Tyr Glu Asp Asp Arg Arg Lys Ser Phe Lys Lys Ile Gly
675 680 685
Ser Phe Ser Leu Glu Gln Leu Gln Glu Tyr Ala Asp Ala Asp Leu Ser
690 695 700
Val Val Glu Lys Leu Lys Glu Ile Ile Ile Gln Lys Val Asp Glu Ile
705 710 715 720
Tyr Lys Val Tyr Gly Ser Ser Glu Lys Leu Phe Asp Ala Asp Phe Val
725 730 735
Leu Glu Lys Ser Leu Lys Lys Asn Asp Ala Val Val Ala Ile Met Lys
740 745 750
Asp Leu Leu Asp Ser Val Lys Ser Phe Glu Asn Tyr Ile Lys Ala Phe
755 760 765
Phe Gly Glu Gly Lys Glu Thr Asn Arg Asp Glu Ser Phe Tyr Gly Asp
770 775 780
Phe Val Leu Ala Tyr Asp Ile Leu Leu Lys Val Asp His Ile Tyr Asp
785 790 795 800
Ala Ile Arg Asn Tyr Val Thr Gln Lys Pro Tyr Ser Lys Asp Lys Phe
805 810 815
Lys Leu Tyr Phe Gln Asn Pro Gln Phe Met Gly Gly Trp Asp Lys Asp
820 825 830
Lys Glu Thr Asp Tyr Arg Ala Thr Ile Leu Arg Tyr Gly Ser Lys Tyr
835 840 845
Tyr Leu Ala Ile Met Asp Lys Lys Tyr Ala Lys Cys Leu Gln Lys Ile
850 855 860
Asp Lys Asp Asp Val Asn Gly Asn Tyr Glu Lys Ile Asn Tyr Lys Leu
865 870 875 880
Leu Pro Gly Pro Asn Lys Met Leu Pro Lys Val Phe Phe Ser Lys Lys
885 890 895
Trp Met Ala Tyr Tyr Asn Pro Ser Glu Asp Ile Gln Lys Ile Tyr Lys
900 905 910
Asn Gly Thr Phe Lys Lys Gly Asp Met Phe Asn Leu Asn Asp Cys His
915 920 925
Lys Leu Ile Asp Phe Phe Lys Asp Ser Ile Ser Arg Tyr Pro Lys Trp
930 935 940
Ser Asn Ala Tyr Asp Phe Asn Phe Ser Glu Thr Glu Lys Tyr Lys Asp
945 950 955 960
Ile Ala Gly Phe Tyr Arg Glu Val Glu Glu Gln Gly Tyr Lys Val Ser
965 970 975
Phe Glu Ser Ala Ser Lys Lys Glu Val Asp Lys Leu Val Glu Glu Gly
980 985 990
Lys Leu Tyr Met Phe Gln Ile Tyr Asn Lys Asp Phe Ser Asp Lys Ser
995 1000 1005
His Gly Thr Pro Asn Leu His Thr Met Tyr Phe Lys Leu Leu Phe
1010 1015 1020
Asp Glu Asn Asn His Gly Gln Ile Arg Leu Ser Gly Gly Ala Glu
1025 1030 1035
Leu Phe Met Arg Arg Ala Ser Leu Lys Lys Glu Glu Leu Val Val
1040 1045 1050
His Pro Ala Asn Ser Pro Ile Ala Asn Lys Asn Pro Asp Asn Pro
1055 1060 1065
Lys Lys Thr Thr Thr Leu Ser Tyr Asp Val Tyr Lys Asp Lys Arg
1070 1075 1080
Phe Ser Glu Asp Gln Tyr Glu Leu His Ile Pro Ile Ala Ile Asn
1085 1090 1095
Lys Cys Pro Lys Asn Ile Phe Lys Ile Asn Thr Glu Val Arg Val
1100 1105 1110
Leu Leu Lys His Asp Asp Asn Pro Tyr Val Ile Gly Ile Ala Arg
1115 1120 1125
Gly Glu Arg Asn Leu Leu Tyr Ile Val Val Val Asp Gly Lys Gly
1130 1135 1140
Asn Ile Val Glu Gln Tyr Ser Leu Asn Glu Ile Ile Asn Asn Phe
1145 1150 1155
Asn Gly Ile Arg Ile Lys Thr Asp Tyr His Ser Leu Leu Asp Lys
1160 1165 1170
Lys Glu Lys Glu Arg Phe Glu Ala Arg Gln Asn Trp Thr Ser Ile
1175 1180 1185
Glu Asn Ile Lys Glu Leu Lys Ala Gly Tyr Ile Ser Gln Val Val
1190 1195 1200
His Lys Ile Cys Glu Leu Val Glu Lys Tyr Asp Ala Val Ile Ala
1205 1210 1215
Leu Ala Asp Leu Asn Ser Gly Phe Lys Asn Ser Arg Val Lys Val
1220 1225 1230
Glu Lys Gln Val Tyr Gln Lys Phe Glu Lys Met Leu Ile Asp Lys
1235 1240 1245
Leu Asn Tyr Met Val Asp Lys Lys Ser Asn Pro Cys Ala Thr Gly
1250 1255 1260
Gly Ala Leu Lys Gly Tyr Gln Ile Thr Asn Lys Phe Glu Ser Phe
1265 1270 1275
Lys Ser Met Ser Thr Gln Asn Gly Phe Ile Phe Tyr Ile Pro Ala
1280 1285 1290
Trp Leu Thr Ser Lys Ile Asp Pro Ser Thr Gly Phe Val Asn Leu
1295 1300 1305
Leu Lys Thr Lys Tyr Thr Ser Ile Ala Asp Ser Lys Lys Phe Ile
1310 1315 1320
Ser Ser Phe Asp Arg Ile Met Tyr Val Pro Glu Glu Asp Leu Phe
1325 1330 1335
Glu Phe Ala Leu Asp Tyr Lys Asn Phe Ser Arg Thr Asp Ala Asp
1340 1345 1350
Tyr Ile Lys Lys Trp Lys Leu Tyr Ser Tyr Gly Asn Arg Ile Arg
1355 1360 1365
Ile Phe Arg Asn Pro Lys Lys Asn Asn Val Phe Asp Trp Glu Glu
1370 1375 1380
Val Cys Leu Thr Ser Ala Tyr Lys Glu Leu Phe Asn Lys Tyr Gly
1385 1390 1395
Ile Asn Tyr Gln Gln Gly Asp Ile Arg Ala Leu Leu Cys Glu Gln
1400 1405 1410
Ser Asp Lys Ala Phe Tyr Ser Ser Phe Met Ala Leu Met Ser Leu
1415 1420 1425
Met Leu Gln Met Arg Asn Ser Ile Thr Gly Arg Thr Asp Val Ala
1430 1435 1440
Phe Leu Ile Ser Pro Val Lys Asn Ser Asp Gly Ile Phe Tyr Asp
1445 1450 1455
Ser Arg Asn Tyr Glu Ala Gln Glu Asn Ala Ile Leu Pro Lys Asn
1460 1465 1470
Ala Asp Ala Asn Gly Ala Tyr Asn Ile Ala Arg Lys Val Leu Trp
1475 1480 1485
Ala Ile Gly
1490
<210> 58
<211> 1662
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 58
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
1 5 10 15
Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Met Pro
20 25 30
Lys Lys Lys Arg Lys Val Met Ser Ser Glu Thr Gly Pro Val Ala Val
35 40 45
Asp Pro Thr Leu Arg Arg Arg Ile Glu Pro His Glu Phe Glu Val Phe
50 55 60
Phe Asp Pro Arg Glu Leu Arg Lys Glu Thr Cys Leu Leu Tyr Glu Ile
65 70 75 80
Asn Trp Gly Gly Arg His Ser Ile Trp Arg His Thr Ser Gln Asn Thr
85 90 95
Asn Lys His Val Glu Val Asn Phe Ile Glu Lys Phe Thr Thr Glu Arg
100 105 110
Tyr Phe Cys Pro Asn Thr Arg Cys Ser Ile Thr Trp Phe Leu Ser Trp
115 120 125
Ser Pro Cys Gly Glu Cys Ser Arg Ala Ile Thr Glu Phe Leu Ser Arg
130 135 140
Tyr Pro His Val Thr Leu Phe Ile Tyr Ile Ala Arg Leu Tyr His His
145 150 155 160
Ala Asp Pro Arg Asn Arg Gln Gly Leu Arg Asp Leu Ile Ser Ser Gly
165 170 175
Val Thr Ile Gln Ile Met Thr Glu Gln Glu Ser Gly Tyr Cys Trp Arg
180 185 190
Asn Phe Val Asn Tyr Ser Pro Ser Asn Glu Ala His Trp Pro Arg Tyr
195 200 205
Pro His Leu Trp Val Arg Leu Tyr Val Leu Glu Leu Tyr Cys Ile Ile
210 215 220
Leu Gly Leu Pro Pro Cys Leu Asn Ile Leu Arg Arg Lys Gln Pro Gln
225 230 235 240
Leu Thr Phe Phe Thr Ile Ala Leu Gln Ser Cys His Tyr Gln Arg Leu
245 250 255
Pro Pro His Ile Leu Trp Ala Thr Gly Leu Lys Gly Gly Gly Gly Ser
260 265 270
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
275 280 285
Gly Gly Gly Ser Gly Gly Gly Gly Ser Met Leu Phe Gln Asp Phe Thr
290 295 300
His Leu Tyr Pro Leu Ser Lys Thr Val Arg Phe Glu Leu Lys Pro Ile
305 310 315 320
Gly Arg Thr Leu Glu His Ile His Ala Lys Asn Phe Leu Ser Gln Asp
325 330 335
Glu Thr Met Ala Asp Met Tyr Gln Lys Val Lys Val Ile Leu Asp Asp
340 345 350
Tyr His Arg Asp Phe Ile Ala Asp Met Met Gly Glu Val Lys Leu Thr
355 360 365
Lys Leu Ala Glu Phe Tyr Asp Val Tyr Leu Lys Phe Arg Lys Asn Pro
370 375 380
Lys Asp Asp Gly Leu Gln Lys Gln Leu Lys Asp Leu Gln Ala Val Leu
385 390 395 400
Arg Lys Glu Ser Val Lys Pro Ile Gly Ser Gly Gly Lys Tyr Lys Thr
405 410 415
Gly Tyr Asp Arg Leu Phe Gly Ala Lys Leu Phe Lys Asp Gly Lys Glu
420 425 430
Leu Gly Asp Leu Ala Lys Phe Val Ile Ala Gln Glu Gly Glu Ser Ser
435 440 445
Pro Lys Leu Ala His Leu Ala His Phe Glu Lys Phe Ser Thr Tyr Phe
450 455 460
Thr Gly Phe His Asp Asn Arg Lys Asn Met Tyr Ser Asp Glu Asp Lys
465 470 475 480
His Thr Ala Ile Ala Tyr Arg Leu Ile His Glu Asn Leu Pro Arg Phe
485 490 495
Ile Asp Asn Leu Gln Ile Leu Thr Thr Ile Lys Gln Lys His Ser Ala
500 505 510
Leu Tyr Asp Gln Ile Ile Asn Glu Leu Thr Ala Ser Gly Leu Asp Val
515 520 525
Ser Leu Ala Ser His Leu Asp Gly Tyr His Lys Leu Leu Thr Gln Glu
530 535 540
Gly Ile Thr Ala Tyr Asn Arg Ile Ile Gly Glu Val Asn Gly Tyr Thr
545 550 555 560
Asn Lys His Asn Gln Ile Cys His Lys Ser Glu Arg Ile Ala Lys Leu
565 570 575
Arg Pro Leu His Lys Gln Ile Leu Ser Asp Gly Met Gly Val Ser Phe
580 585 590
Leu Pro Ser Lys Phe Ala Asp Asp Ser Glu Met Cys Gln Ala Val Asn
595 600 605
Glu Phe Tyr Arg His Tyr Thr Asp Val Phe Ala Lys Val Gln Ser Leu
610 615 620
Phe Asp Gly Phe Asp Asp His Gln Lys Asp Gly Ile Tyr Val Glu His
625 630 635 640
Lys Asn Leu Asn Glu Leu Ser Lys Gln Ala Phe Gly Asp Phe Ala Leu
645 650 655
Leu Gly Arg Val Leu Asp Gly Tyr Tyr Val Asp Val Val Asn Pro Glu
660 665 670
Phe Asn Glu Arg Phe Ala Lys Ala Lys Thr Asp Asn Ala Lys Ala Lys
675 680 685
Leu Thr Lys Glu Lys Asp Lys Phe Ile Lys Gly Val His Ser Leu Ala
690 695 700
Ser Leu Glu Gln Ala Ile Glu His His Thr Ala Arg His Asp Asp Glu
705 710 715 720
Ser Val Gln Ala Gly Lys Leu Gly Gln Tyr Phe Lys His Gly Leu Ala
725 730 735
Gly Val Asp Asn Pro Ile Gln Lys Ile His Asn Asn His Ser Thr Ile
740 745 750
Lys Gly Phe Leu Glu Arg Glu Arg Pro Ala Gly Glu Arg Ala Leu Pro
755 760 765
Lys Ile Lys Ser Gly Lys Asn Pro Glu Met Thr Gln Leu Arg Gln Leu
770 775 780
Lys Glu Leu Leu Asp Asn Ala Leu Asn Val Ala His Phe Ala Lys Leu
785 790 795 800
Leu Thr Thr Lys Thr Thr Leu Asp Asn Gln Asp Gly Asn Phe Tyr Gly
805 810 815
Glu Phe Gly Val Leu Tyr Asp Glu Leu Ala Lys Ile Pro Thr Leu Tyr
820 825 830
Asn Lys Val Arg Asp Tyr Leu Ser Gln Lys Pro Phe Ser Thr Glu Lys
835 840 845
Tyr Lys Leu Asn Phe Gly Asn Pro Thr Leu Leu Asn Gly Trp Asp Leu
850 855 860
Asn Lys Glu Lys Asp Asn Phe Gly Val Ile Leu Gln Lys Asp Gly Cys
865 870 875 880
Tyr Tyr Leu Ala Leu Leu Asp Lys Ala His Lys Lys Val Phe Asp Asn
885 890 895
Ala Pro Asn Thr Gly Lys Asn Val Tyr Gln Lys Met Val Tyr Lys Leu
900 905 910
Leu Pro Gly Pro Asn Lys Met Leu Pro Lys Val Phe Phe Ala Lys Ser
915 920 925
Asn Leu Asp Tyr Tyr Asn Pro Ser Ala Glu Leu Leu Asp Lys Tyr Ala
930 935 940
Lys Gly Thr His Lys Lys Gly Asp Asn Phe Asn Leu Lys Asp Cys His
945 950 955 960
Ala Leu Ile Asp Phe Phe Lys Ala Gly Ile Asn Lys His Pro Glu Trp
965 970 975
Gln His Phe Gly Phe Lys Phe Ser Pro Thr Ser Ser Tyr Arg Asp Leu
980 985 990
Ser Asp Phe Tyr Arg Glu Val Glu Pro Gln Gly Tyr Gln Val Lys Phe
995 1000 1005
Val Asp Ile Asn Ala Asp Tyr Ile Asp Glu Leu Val Glu Gln Gly
1010 1015 1020
Lys Leu Tyr Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ser Pro Lys
1025 1030 1035
Ala His Gly Lys Pro Asn Leu His Thr Leu Tyr Phe Lys Ala Leu
1040 1045 1050
Phe Ser Glu Asp Asn Leu Ala Asp Pro Ile Tyr Lys Leu Asn Gly
1055 1060 1065
Glu Ala Gln Ile Phe Tyr Arg Lys Ala Ser Leu Asp Met Asn Glu
1070 1075 1080
Thr Thr Ile His Arg Ala Gly Glu Val Leu Glu Asn Lys Asn Pro
1085 1090 1095
Asp Asn Pro Lys Lys Arg Gln Phe Val Tyr Asp Ile Ile Lys Asp
1100 1105 1110
Lys Arg Tyr Thr Gln Asp Lys Phe Met Leu His Val Pro Ile Thr
1115 1120 1125
Met Asn Phe Gly Val Gln Gly Met Thr Ile Lys Glu Phe Asn Lys
1130 1135 1140
Lys Val Asn Gln Ser Ile Gln Gln Tyr Asp Glu Val Asn Val Ile
1145 1150 1155
Gly Ile Ala Arg Gly Glu Arg His Leu Leu Tyr Leu Thr Val Ile
1160 1165 1170
Asn Ser Lys Gly Glu Ile Leu Glu Gln Arg Ser Leu Asn Asp Ile
1175 1180 1185
Thr Thr Ala Ser Ala Asn Gly Thr Gln Val Thr Thr Pro Tyr His
1190 1195 1200
Lys Ile Leu Asp Lys Arg Glu Ile Glu Arg Leu Asn Ala Arg Val
1205 1210 1215
Gly Trp Gly Glu Ile Glu Thr Ile Lys Glu Leu Lys Ser Gly Tyr
1220 1225 1230
Leu Ser His Val Val His Gln Ile Asn Gln Leu Met Leu Lys Tyr
1235 1240 1245
Asn Ala Ile Val Val Leu Ala Asp Leu Asn Phe Gly Phe Lys Arg
1250 1255 1260
Gly Arg Phe Lys Val Glu Lys Gln Ile Tyr Gln Asn Phe Glu Asn
1265 1270 1275
Ala Leu Ile Lys Lys Leu Asn His Leu Val Leu Lys Asp Lys Ala
1280 1285 1290
Asp Asp Glu Ile Gly Ser Tyr Lys Asn Ala Leu Gln Leu Thr Asn
1295 1300 1305
Asn Phe Thr Asp Leu Lys Ser Ile Gly Lys Gln Thr Gly Phe Leu
1310 1315 1320
Phe Tyr Val Pro Ala Trp Asn Thr Ser Lys Ile Asp Pro Glu Thr
1325 1330 1335
Gly Phe Val Asp Leu Leu Lys Pro Arg Tyr Glu Asn Ile Ala Gln
1340 1345 1350
Ser Gln Ala Phe Phe Gly Lys Phe Asp Lys Ile Cys Tyr Asn Thr
1355 1360 1365
Asp Lys Gly Tyr Phe Glu Phe His Ile Asp Tyr Ala Lys Phe Thr
1370 1375 1380
Asp Lys Ala Lys Asn Ser Arg Gln Lys Trp Ala Ile Cys Ser His
1385 1390 1395
Gly Asp Lys Arg Tyr Val Tyr Asp Lys Thr Ala Asn Gln Asn Lys
1400 1405 1410
Gly Ala Ala Lys Gly Ile Asn Val Asn Asp Glu Leu Lys Ser Leu
1415 1420 1425
Phe Ala Arg Tyr His Ile Asn Asp Lys Gln Pro Asn Leu Val Met
1430 1435 1440
Asp Ile Cys Gln Asn Asn Asp Lys Glu Phe His Lys Ser Leu Met
1445 1450 1455
Cys Leu Leu Lys Thr Leu Leu Ala Leu Arg Tyr Ser Asn Ala Ser
1460 1465 1470
Ser Asp Glu Ala Phe Ile Leu Ser Pro Val Ala Asn Asp Glu Gly
1475 1480 1485
Val Phe Phe Asn Ser Ala Leu Ala Asp Asp Thr Gln Pro Gln Asn
1490 1495 1500
Ala Asp Ala Asn Gly Ala Tyr His Ile Ala Leu Lys Gly Leu Trp
1505 1510 1515
Leu Leu Asn Glu Leu Lys Asn Ser Asp Asp Leu Asn Lys Val Lys
1520 1525 1530
Leu Ala Ile Asp Asn Gln Thr Trp Leu Asn Phe Ala Gln Asn Arg
1535 1540 1545
Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys
1550 1555 1560
Lys Ser Gly Gly Ser Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu
1565 1570 1575
Thr Gly Lys Gln Leu Val Ile Gln Glu Ser Ile Leu Met Leu Pro
1580 1585 1590
Glu Glu Val Glu Glu Val Ile Gly Asn Lys Pro Glu Ser Asp Ile
1595 1600 1605
Leu Val His Thr Ala Tyr Asp Glu Ser Thr Asp Glu Asn Val Met
1610 1615 1620
Leu Leu Thr Ser Asp Ala Pro Glu Tyr Lys Pro Trp Ala Leu Val
1625 1630 1635
Ile Gln Asp Ser Asn Gly Glu Asn Lys Ile Lys Met Leu Ser Gly
1640 1645 1650
Gly Ser Pro Lys Lys Lys Arg Lys Val
1655 1660
<210> 59
<211> 1267
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 59
Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser
1 5 10 15
Met Leu Phe Gln Asp Phe Thr His Leu Tyr Pro Leu Ser Lys Thr Val
20 25 30
Arg Phe Glu Leu Lys Pro Ile Gly Arg Thr Leu Glu His Ile His Ala
35 40 45
Lys Asn Phe Leu Ser Gln Asp Glu Thr Met Ala Asp Met Tyr Gln Lys
50 55 60
Val Lys Val Ile Leu Asp Asp Tyr His Arg Asp Phe Ile Ala Asp Met
65 70 75 80
Met Gly Glu Val Lys Leu Thr Lys Leu Ala Glu Phe Tyr Asp Val Tyr
85 90 95
Leu Lys Phe Arg Lys Asn Pro Lys Asp Asp Gly Leu Gln Lys Gln Leu
100 105 110
Lys Asp Leu Gln Ala Val Leu Arg Lys Glu Ser Val Lys Pro Ile Gly
115 120 125
Ser Gly Gly Lys Tyr Lys Thr Gly Tyr Asp Arg Leu Phe Gly Ala Lys
130 135 140
Leu Phe Lys Asp Gly Lys Glu Leu Gly Asp Leu Ala Lys Phe Val Ile
145 150 155 160
Ala Gln Glu Gly Glu Ser Ser Pro Lys Leu Ala His Leu Ala His Phe
165 170 175
Glu Lys Phe Ser Thr Tyr Phe Thr Gly Phe His Asp Asn Arg Lys Asn
180 185 190
Met Tyr Ser Asp Glu Asp Lys His Thr Ala Ile Ala Tyr Arg Leu Ile
195 200 205
His Glu Asn Leu Pro Arg Phe Ile Asp Asn Leu Gln Ile Leu Thr Thr
210 215 220
Ile Lys Gln Lys His Ser Ala Leu Tyr Asp Gln Ile Ile Asn Glu Leu
225 230 235 240
Thr Ala Ser Gly Leu Asp Val Ser Leu Ala Ser His Leu Asp Gly Tyr
245 250 255
His Lys Leu Leu Thr Gln Glu Gly Ile Thr Ala Tyr Asn Arg Ile Ile
260 265 270
Gly Glu Val Asn Gly Tyr Thr Asn Lys His Asn Gln Ile Cys His Lys
275 280 285
Ser Glu Arg Ile Ala Lys Leu Arg Pro Leu His Lys Gln Ile Leu Ser
290 295 300
Asp Gly Met Gly Val Ser Phe Leu Pro Ser Lys Phe Ala Asp Asp Ser
305 310 315 320
Glu Met Cys Gln Ala Val Asn Glu Phe Tyr Arg His Tyr Thr Asp Val
325 330 335
Phe Ala Lys Val Gln Ser Leu Phe Asp Gly Phe Asp Asp His Gln Lys
340 345 350
Asp Gly Ile Tyr Val Glu His Lys Asn Leu Asn Glu Leu Ser Lys Gln
355 360 365
Ala Phe Gly Asp Phe Ala Leu Leu Gly Arg Val Leu Asp Gly Tyr Tyr
370 375 380
Val Asp Val Val Asn Pro Glu Phe Asn Glu Arg Phe Ala Lys Ala Lys
385 390 395 400
Thr Asp Asn Ala Lys Ala Lys Leu Thr Lys Glu Lys Asp Lys Phe Ile
405 410 415
Lys Gly Val His Ser Leu Ala Ser Leu Glu Gln Ala Ile Glu His His
420 425 430
Thr Ala Arg His Asp Asp Glu Ser Val Gln Ala Gly Lys Leu Gly Gln
435 440 445
Tyr Phe Lys His Gly Leu Ala Gly Val Asp Asn Pro Ile Gln Lys Ile
450 455 460
His Asn Asn His Ser Thr Ile Lys Gly Phe Leu Glu Arg Glu Arg Pro
465 470 475 480
Ala Gly Glu Arg Ala Leu Pro Lys Ile Lys Ser Gly Lys Asn Pro Glu
485 490 495
Met Thr Gln Leu Arg Gln Leu Lys Glu Leu Leu Asp Asn Ala Leu Asn
500 505 510
Val Ala His Phe Ala Lys Leu Leu Thr Thr Lys Thr Thr Leu Asp Asn
515 520 525
Gln Asp Gly Asn Phe Tyr Gly Glu Phe Gly Val Leu Tyr Asp Glu Leu
530 535 540
Ala Lys Ile Pro Thr Leu Tyr Asn Lys Val Arg Asp Tyr Leu Ser Gln
545 550 555 560
Lys Pro Phe Ser Thr Glu Lys Tyr Lys Leu Asn Phe Gly Asn Pro Thr
565 570 575
Leu Leu Asn Gly Trp Asp Leu Asn Lys Glu Lys Asp Asn Phe Gly Val
580 585 590
Ile Leu Gln Lys Asp Gly Cys Tyr Tyr Leu Ala Leu Leu Asp Lys Ala
595 600 605
His Lys Lys Val Phe Asp Asn Ala Pro Asn Thr Gly Lys Asn Val Tyr
610 615 620
Gln Lys Met Val Tyr Lys Leu Leu Pro Gly Pro Asn Lys Met Leu Pro
625 630 635 640
Lys Val Phe Phe Ala Lys Ser Asn Leu Asp Tyr Tyr Asn Pro Ser Ala
645 650 655
Glu Leu Leu Asp Lys Tyr Ala Lys Gly Thr His Lys Lys Gly Asp Asn
660 665 670
Phe Asn Leu Lys Asp Cys His Ala Leu Ile Asp Phe Phe Lys Ala Gly
675 680 685
Ile Asn Lys His Pro Glu Trp Gln His Phe Gly Phe Lys Phe Ser Pro
690 695 700
Thr Ser Ser Tyr Arg Asp Leu Ser Asp Phe Tyr Arg Glu Val Glu Pro
705 710 715 720
Gln Gly Tyr Gln Val Lys Phe Val Asp Ile Asn Ala Asp Tyr Ile Asp
725 730 735
Glu Leu Val Glu Gln Gly Lys Leu Tyr Leu Phe Gln Ile Tyr Asn Lys
740 745 750
Asp Phe Ser Pro Lys Ala His Gly Lys Pro Asn Leu His Thr Leu Tyr
755 760 765
Phe Lys Ala Leu Phe Ser Glu Asp Asn Leu Ala Asp Pro Ile Tyr Lys
770 775 780
Leu Asn Gly Glu Ala Gln Ile Phe Tyr Arg Lys Ala Ser Leu Asp Met
785 790 795 800
Asn Glu Thr Thr Ile His Arg Ala Gly Glu Val Leu Glu Asn Lys Asn
805 810 815
Pro Asp Asn Pro Lys Lys Arg Gln Phe Val Tyr Asp Ile Ile Lys Asp
820 825 830
Lys Arg Tyr Thr Gln Asp Lys Phe Met Leu His Val Pro Ile Thr Met
835 840 845
Asn Phe Gly Val Gln Gly Met Thr Ile Lys Glu Phe Asn Lys Lys Val
850 855 860
Asn Gln Ser Ile Gln Gln Tyr Asp Glu Val Asn Val Ile Gly Ile Asp
865 870 875 880
Arg Gly Glu Arg His Leu Leu Tyr Leu Thr Val Ile Asn Ser Lys Gly
885 890 895
Glu Ile Leu Glu Gln Arg Ser Leu Asn Asp Ile Thr Thr Ala Ser Ala
900 905 910
Asn Gly Thr Gln Val Thr Thr Pro Tyr His Lys Ile Leu Asp Lys Arg
915 920 925
Glu Ile Glu Arg Leu Asn Ala Arg Val Gly Trp Gly Glu Ile Glu Thr
930 935 940
Ile Lys Glu Leu Lys Ser Gly Tyr Leu Ser His Val Val His Gln Ile
945 950 955 960
Asn Gln Leu Met Leu Lys Tyr Asn Ala Ile Val Val Leu Glu Asp Leu
965 970 975
Asn Phe Gly Phe Lys Arg Gly Arg Phe Lys Val Glu Lys Gln Ile Tyr
980 985 990
Gln Asn Phe Glu Asn Ala Leu Ile Lys Lys Leu Asn His Leu Val Leu
995 1000 1005
Lys Asp Lys Ala Asp Asp Glu Ile Gly Ser Tyr Lys Asn Ala Leu
1010 1015 1020
Gln Leu Thr Asn Asn Phe Thr Asp Leu Lys Ser Ile Gly Lys Gln
1025 1030 1035
Thr Gly Phe Leu Phe Tyr Val Pro Ala Trp Asn Thr Ser Lys Ile
1040 1045 1050
Asp Pro Glu Thr Gly Phe Val Asp Leu Leu Lys Pro Arg Tyr Glu
1055 1060 1065
Asn Ile Ala Gln Ser Gln Ala Phe Phe Gly Lys Phe Asp Lys Ile
1070 1075 1080
Cys Tyr Asn Thr Asp Lys Gly Tyr Phe Glu Phe His Ile Asp Tyr
1085 1090 1095
Ala Lys Phe Thr Asp Lys Ala Lys Asn Ser Arg Gln Lys Trp Ala
1100 1105 1110
Ile Cys Ser His Gly Asp Lys Arg Tyr Val Tyr Asp Lys Thr Ala
1115 1120 1125
Asn Gln Asn Lys Gly Ala Ala Lys Gly Ile Asn Val Asn Asp Glu
1130 1135 1140
Leu Lys Ser Leu Phe Ala Arg Tyr His Ile Asn Asp Lys Gln Pro
1145 1150 1155
Asn Leu Val Met Asp Ile Cys Gln Asn Asn Asp Lys Glu Phe His
1160 1165 1170
Lys Ser Leu Met Cys Leu Leu Lys Thr Leu Leu Ala Leu Arg Tyr
1175 1180 1185
Ser Asn Ala Ser Ser Asp Glu Asp Phe Ile Leu Ser Pro Val Ala
1190 1195 1200
Asn Asp Glu Gly Val Phe Phe Asn Ser Ala Leu Ala Asp Asp Thr
1205 1210 1215
Gln Pro Gln Asn Ala Asp Ala Asn Gly Ala Tyr His Ile Ala Leu
1220 1225 1230
Lys Gly Leu Trp Leu Leu Asn Glu Leu Lys Asn Ser Asp Asp Leu
1235 1240 1245
Asn Lys Val Lys Leu Ala Ile Asp Asn Gln Thr Trp Leu Asn Phe
1250 1255 1260
Ala Gln Asn Arg
1265
<210> 60
<211> 1368
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 60
Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser
1 5 10 15
Met Thr Gln Phe Glu Gly Phe Thr Asn Leu Tyr Gln Val Ser Lys Thr
20 25 30
Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Lys His Ile Gln
35 40 45
Glu Gln Gly Phe Ile Glu Glu Asp Lys Ala Arg Asn Asp His Tyr Lys
50 55 60
Glu Leu Lys Pro Ile Ile Asp Arg Ile Tyr Lys Thr Tyr Ala Asp Gln
65 70 75 80
Cys Leu Gln Leu Val Gln Leu Asp Trp Glu Asn Leu Ser Ala Ala Ile
85 90 95
Asp Ser Tyr Arg Lys Glu Lys Thr Glu Glu Thr Arg Asn Ala Leu Ile
100 105 110
Glu Glu Gln Ala Thr Tyr Arg Asn Ala Ile His Asp Tyr Phe Ile Gly
115 120 125
Arg Thr Asp Asn Leu Thr Asp Ala Ile Asn Lys Arg His Ala Glu Ile
130 135 140
Tyr Lys Gly Leu Phe Lys Ala Glu Leu Phe Asn Gly Lys Val Leu Lys
145 150 155 160
Gln Leu Gly Thr Val Thr Thr Thr Glu His Glu Asn Ala Leu Leu Arg
165 170 175
Ser Phe Asp Lys Phe Thr Thr Tyr Phe Ser Gly Phe Tyr Glu Asn Arg
180 185 190
Lys Asn Val Phe Ser Ala Glu Asp Ile Ser Thr Ala Ile Pro His Arg
195 200 205
Ile Val Gln Asp Asn Phe Pro Lys Phe Lys Glu Asn Cys His Ile Phe
210 215 220
Thr Arg Leu Ile Thr Ala Val Pro Ser Leu Arg Glu His Phe Glu Asn
225 230 235 240
Val Lys Lys Ala Ile Gly Ile Phe Val Ser Thr Ser Ile Glu Glu Val
245 250 255
Phe Ser Phe Pro Phe Tyr Asn Gln Leu Leu Thr Gln Thr Gln Ile Asp
260 265 270
Leu Tyr Asn Gln Leu Leu Gly Gly Ile Ser Arg Glu Ala Gly Thr Glu
275 280 285
Lys Ile Lys Gly Leu Asn Glu Val Leu Asn Leu Ala Ile Gln Lys Asn
290 295 300
Asp Glu Thr Ala His Ile Ile Ala Ser Leu Pro His Arg Phe Ile Pro
305 310 315 320
Leu Phe Lys Gln Ile Leu Ser Asp Arg Asn Thr Leu Ser Phe Ile Leu
325 330 335
Glu Glu Phe Lys Ser Asp Glu Glu Val Ile Gln Ser Phe Cys Lys Tyr
340 345 350
Lys Thr Leu Leu Arg Asn Glu Asn Val Leu Glu Thr Ala Glu Ala Leu
355 360 365
Phe Asn Glu Leu Asn Ser Ile Asp Leu Thr His Ile Phe Ile Ser His
370 375 380
Lys Lys Leu Glu Thr Ile Ser Ser Ala Leu Cys Asp His Trp Asp Thr
385 390 395 400
Leu Arg Asn Ala Leu Tyr Glu Arg Arg Ile Ser Glu Leu Thr Gly Lys
405 410 415
Ile Thr Lys Ser Ala Lys Glu Lys Val Gln Arg Ser Leu Lys His Glu
420 425 430
Asp Ile Asn Leu Gln Glu Ile Ile Ser Ala Ala Gly Lys Glu Leu Ser
435 440 445
Glu Ala Phe Lys Gln Lys Thr Ser Glu Ile Leu Ser His Ala His Ala
450 455 460
Ala Leu Asp Gln Pro Leu Pro Thr Thr Leu Lys Lys Gln Glu Glu Lys
465 470 475 480
Glu Ile Leu Lys Ser Gln Leu Asp Ser Leu Leu Gly Leu Tyr His Leu
485 490 495
Leu Asp Trp Phe Ala Val Asp Glu Ser Asn Glu Val Asp Pro Glu Phe
500 505 510
Ser Ala Arg Leu Thr Gly Ile Lys Leu Glu Met Glu Pro Ser Leu Ser
515 520 525
Phe Tyr Asn Lys Ala Arg Asn Tyr Ala Thr Lys Lys Pro Tyr Ser Val
530 535 540
Glu Lys Phe Lys Leu Asn Phe Gln Met Pro Thr Leu Ala Ser Gly Trp
545 550 555 560
Asp Val Asn Lys Glu Lys Asn Asn Gly Ala Ile Leu Phe Val Lys Asn
565 570 575
Gly Leu Tyr Tyr Leu Gly Ile Met Pro Lys Gln Lys Gly Arg Tyr Lys
580 585 590
Ala Leu Ser Phe Glu Pro Thr Glu Lys Thr Ser Glu Gly Phe Asp Lys
595 600 605
Met Tyr Tyr Asp Tyr Phe Pro Asp Ala Ala Lys Met Ile Pro Lys Cys
610 615 620
Ser Thr Gln Leu Lys Ala Val Thr Ala His Phe Gln Thr His Thr Thr
625 630 635 640
Pro Ile Leu Leu Ser Asn Asn Phe Ile Glu Pro Leu Glu Ile Thr Lys
645 650 655
Glu Ile Tyr Asp Leu Asn Asn Pro Glu Lys Glu Pro Lys Lys Phe Gln
660 665 670
Thr Ala Tyr Ala Lys Lys Thr Gly Asp Gln Lys Gly Tyr Arg Glu Ala
675 680 685
Leu Cys Lys Trp Ile Asp Phe Thr Arg Asp Phe Leu Ser Lys Tyr Thr
690 695 700
Lys Thr Thr Ser Ile Asp Leu Ser Ser Leu Arg Pro Ser Ser Gln Tyr
705 710 715 720
Lys Asp Leu Gly Glu Tyr Tyr Ala Glu Leu Asn Pro Leu Leu Tyr His
725 730 735
Ile Ser Phe Gln Arg Ile Ala Glu Lys Glu Ile Met Asp Ala Val Glu
740 745 750
Thr Gly Lys Leu Tyr Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ala Lys
755 760 765
Gly His His Gly Lys Pro Asn Leu His Thr Leu Tyr Trp Thr Gly Leu
770 775 780
Phe Ser Pro Glu Asn Leu Ala Lys Thr Ser Ile Lys Leu Asn Gly Gln
785 790 795 800
Ala Glu Leu Phe Tyr Arg Pro Lys Ser Arg Met Lys Arg Met Ala His
805 810 815
Arg Leu Gly Glu Lys Met Leu Asn Lys Lys Leu Lys Asp Gln Lys Thr
820 825 830
Pro Ile Pro Asp Thr Leu Tyr Gln Glu Leu Tyr Asp Tyr Val Asn His
835 840 845
Arg Leu Ser His Asp Leu Ser Asp Glu Ala Arg Ala Leu Leu Pro Asn
850 855 860
Val Ile Thr Lys Glu Val Ser His Glu Ile Ile Lys Asp Arg Arg Phe
865 870 875 880
Thr Ser Asp Lys Phe Phe Phe His Val Pro Ile Thr Leu Asn Tyr Gln
885 890 895
Ala Ala Asn Ser Pro Ser Lys Phe Asn Gln Arg Val Asn Ala Tyr Leu
900 905 910
Lys Glu His Pro Glu Thr Pro Ile Ile Gly Ile Asp Arg Gly Glu Arg
915 920 925
Asn Leu Ile Tyr Ile Thr Val Ile Asp Ser Thr Gly Lys Ile Leu Glu
930 935 940
Gln Arg Ser Leu Asn Thr Ile Gln Gln Phe Asp Tyr Gln Lys Lys Leu
945 950 955 960
Asp Asn Arg Glu Lys Glu Arg Val Ala Ala Arg Gln Ala Trp Ser Val
965 970 975
Val Gly Thr Ile Lys Asp Leu Lys Gln Gly Tyr Leu Ser Gln Val Ile
980 985 990
His Glu Ile Val Asp Leu Met Ile His Tyr Gln Ala Val Val Val Leu
995 1000 1005
Glu Asn Leu Asn Phe Gly Phe Lys Ser Lys Arg Thr Gly Ile Ala
1010 1015 1020
Glu Lys Ala Val Tyr Gln Gln Phe Glu Lys Met Leu Ile Asp Lys
1025 1030 1035
Leu Asn Cys Leu Val Leu Lys Asp Tyr Pro Ala Glu Lys Val Gly
1040 1045 1050
Gly Val Leu Asn Pro Tyr Gln Leu Thr Asp Gln Phe Thr Ser Phe
1055 1060 1065
Ala Lys Met Gly Thr Gln Ser Gly Phe Leu Phe Tyr Val Pro Ala
1070 1075 1080
Pro Tyr Thr Ser Lys Ile Asp Pro Leu Thr Gly Phe Val Asp Pro
1085 1090 1095
Phe Val Trp Lys Thr Ile Lys Asn His Glu Ser Arg Lys His Phe
1100 1105 1110
Leu Glu Gly Phe Asp Phe Leu His Tyr Asp Val Lys Thr Gly Asp
1115 1120 1125
Phe Ile Leu His Phe Lys Met Asn Arg Asn Leu Ser Phe Gln Arg
1130 1135 1140
Gly Leu Pro Gly Phe Met Pro Ala Trp Asp Ile Val Phe Glu Lys
1145 1150 1155
Asn Glu Thr Gln Phe Asp Ala Lys Gly Thr Pro Phe Ile Ala Gly
1160 1165 1170
Lys Arg Ile Val Pro Val Ile Glu Asn His Arg Phe Thr Gly Arg
1175 1180 1185
Tyr Arg Asp Leu Tyr Pro Ala Asn Glu Leu Ile Ala Leu Leu Glu
1190 1195 1200
Glu Lys Gly Ile Val Phe Arg Asp Gly Ser Asn Ile Leu Pro Lys
1205 1210 1215
Leu Leu Glu Asn Asp Asp Ser His Ala Ile Asp Thr Met Val Ala
1220 1225 1230
Leu Ile Arg Ser Val Leu Gln Met Arg Asn Ser Asn Ala Ala Thr
1235 1240 1245
Gly Glu Asp Tyr Ile Asn Ser Pro Val Arg Asp Leu Asn Gly Val
1250 1255 1260
Cys Phe Asp Ser Arg Phe Gln Asn Pro Glu Trp Pro Met Asp Ala
1265 1270 1275
Asp Ala Asn Gly Ala Tyr His Ile Ala Leu Lys Gly Gln Leu Leu
1280 1285 1290
Leu Asn His Leu Lys Glu Ser Lys Asp Leu Lys Leu Gln Asn Gly
1295 1300 1305
Ile Ser Asn Gln Asp Trp Leu Ala Tyr Ile Gln Glu Leu Arg Asn
1310 1315 1320
Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys
1325 1330 1335
Lys Gly Ser Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Tyr Pro Tyr
1340 1345 1350
Asp Val Pro Asp Tyr Ala Tyr Pro Tyr Asp Val Pro Asp Tyr Ala
1355 1360 1365
<210> 61
<211> 1332
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 61
Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser
1 5 10 15
Met Thr Gln Phe Glu Gly Phe Thr Asn Leu Tyr Gln Val Ser Lys Thr
20 25 30
Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Lys His Ile Gln
35 40 45
Glu Gln Gly Phe Ile Glu Glu Asp Lys Ala Arg Asn Asp His Tyr Lys
50 55 60
Glu Leu Lys Pro Ile Ile Asp Arg Ile Tyr Lys Thr Tyr Ala Asp Gln
65 70 75 80
Cys Leu Gln Leu Val Gln Leu Asp Trp Glu Asn Leu Ser Ala Ala Ile
85 90 95
Asp Ser Tyr Arg Lys Glu Lys Thr Glu Glu Thr Arg Asn Ala Leu Ile
100 105 110
Glu Glu Gln Ala Thr Tyr Arg Asn Ala Ile His Asp Tyr Phe Ile Gly
115 120 125
Arg Thr Asp Asn Leu Thr Asp Ala Ile Asn Lys Arg His Ala Glu Ile
130 135 140
Tyr Lys Gly Leu Phe Lys Ala Glu Leu Phe Asn Gly Lys Val Leu Lys
145 150 155 160
Gln Leu Gly Thr Val Thr Thr Thr Glu His Glu Asn Ala Leu Leu Arg
165 170 175
Ser Phe Asp Lys Phe Thr Thr Tyr Phe Ser Gly Phe Tyr Glu Asn Arg
180 185 190
Lys Asn Val Phe Ser Ala Glu Asp Ile Ser Thr Ala Ile Pro His Arg
195 200 205
Ile Val Gln Asp Asn Phe Pro Lys Phe Lys Glu Asn Cys His Ile Phe
210 215 220
Thr Arg Leu Ile Thr Ala Val Pro Ser Leu Arg Glu His Phe Glu Asn
225 230 235 240
Val Lys Lys Ala Ile Gly Ile Phe Val Ser Thr Ser Ile Glu Glu Val
245 250 255
Phe Ser Phe Pro Phe Tyr Asn Gln Leu Leu Thr Gln Thr Gln Ile Asp
260 265 270
Leu Tyr Asn Gln Leu Leu Gly Gly Ile Ser Arg Glu Ala Gly Thr Glu
275 280 285
Lys Ile Lys Gly Leu Asn Glu Val Leu Asn Leu Ala Ile Gln Lys Asn
290 295 300
Asp Glu Thr Ala His Ile Ile Ala Ser Leu Pro His Arg Phe Ile Pro
305 310 315 320
Leu Phe Lys Gln Ile Leu Ser Asp Arg Asn Thr Leu Ser Phe Ile Leu
325 330 335
Glu Glu Phe Lys Ser Asp Glu Glu Val Ile Gln Ser Phe Cys Lys Tyr
340 345 350
Lys Thr Leu Leu Arg Asn Glu Asn Val Leu Glu Thr Ala Glu Ala Leu
355 360 365
Phe Asn Glu Leu Asn Ser Ile Asp Leu Thr His Ile Phe Ile Ser His
370 375 380
Lys Lys Leu Glu Thr Ile Ser Ser Ala Leu Cys Asp His Trp Asp Thr
385 390 395 400
Leu Arg Asn Ala Leu Tyr Glu Arg Arg Ile Ser Glu Leu Thr Gly Lys
405 410 415
Ile Thr Lys Ser Ala Lys Glu Lys Val Gln Arg Ser Leu Lys His Glu
420 425 430
Asp Ile Asn Leu Gln Glu Ile Ile Ser Ala Ala Gly Lys Glu Leu Ser
435 440 445
Glu Ala Phe Lys Gln Lys Thr Ser Glu Ile Leu Ser His Ala His Ala
450 455 460
Ala Leu Asp Gln Pro Leu Pro Thr Thr Leu Lys Lys Gln Glu Glu Lys
465 470 475 480
Glu Ile Leu Lys Ser Gln Leu Asp Ser Leu Leu Gly Leu Tyr His Leu
485 490 495
Leu Asp Trp Phe Ala Val Asp Glu Ser Asn Glu Val Asp Pro Glu Phe
500 505 510
Ser Ala Arg Leu Thr Gly Ile Lys Leu Glu Met Glu Pro Ser Leu Ser
515 520 525
Phe Tyr Asn Lys Ala Arg Asn Tyr Ala Thr Lys Lys Pro Tyr Ser Val
530 535 540
Glu Lys Phe Lys Leu Asn Phe Gln Met Pro Thr Leu Ala Ser Gly Trp
545 550 555 560
Asp Val Asn Lys Glu Lys Asn Asn Gly Ala Ile Leu Phe Val Lys Asn
565 570 575
Gly Leu Tyr Tyr Leu Gly Ile Met Pro Lys Gln Lys Gly Arg Tyr Lys
580 585 590
Ala Leu Ser Phe Glu Pro Thr Glu Lys Thr Ser Glu Gly Phe Asp Lys
595 600 605
Met Tyr Tyr Asp Tyr Phe Pro Asp Ala Ala Lys Met Ile Pro Lys Cys
610 615 620
Ser Thr Gln Leu Lys Ala Val Thr Ala His Phe Gln Thr His Thr Thr
625 630 635 640
Pro Ile Leu Leu Ser Asn Asn Phe Ile Glu Pro Leu Glu Ile Thr Lys
645 650 655
Glu Ile Tyr Asp Leu Asn Asn Pro Glu Lys Glu Pro Lys Lys Phe Gln
660 665 670
Thr Ala Tyr Ala Lys Lys Thr Gly Asp Gln Lys Gly Tyr Arg Glu Ala
675 680 685
Leu Cys Lys Trp Ile Asp Phe Thr Arg Asp Phe Leu Ser Lys Tyr Thr
690 695 700
Lys Thr Thr Ser Ile Asp Leu Ser Ser Leu Arg Pro Ser Ser Gln Tyr
705 710 715 720
Lys Asp Leu Gly Glu Tyr Tyr Ala Glu Leu Asn Pro Leu Leu Tyr His
725 730 735
Ile Ser Phe Gln Arg Ile Ala Glu Lys Glu Ile Met Asp Ala Val Glu
740 745 750
Thr Gly Lys Leu Tyr Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ala Lys
755 760 765
Gly His His Gly Lys Pro Asn Leu His Thr Leu Tyr Trp Thr Gly Leu
770 775 780
Phe Ser Pro Glu Asn Leu Ala Lys Thr Ser Ile Lys Leu Asn Gly Gln
785 790 795 800
Ala Glu Leu Phe Tyr Arg Pro Lys Ser Arg Met Lys Arg Met Ala His
805 810 815
Arg Leu Gly Glu Lys Met Leu Asn Lys Lys Leu Lys Asp Gln Lys Thr
820 825 830
Pro Ile Pro Asp Thr Leu Tyr Gln Glu Leu Tyr Asp Tyr Val Asn His
835 840 845
Arg Leu Ser His Asp Leu Ser Asp Glu Ala Arg Ala Leu Leu Pro Asn
850 855 860
Val Ile Thr Lys Glu Val Ser His Glu Ile Ile Lys Asp Arg Arg Phe
865 870 875 880
Thr Ser Asp Lys Phe Phe Phe His Val Pro Ile Thr Leu Asn Tyr Gln
885 890 895
Ala Ala Asn Ser Pro Ser Lys Phe Asn Gln Arg Val Asn Ala Tyr Leu
900 905 910
Lys Glu His Pro Glu Thr Pro Ile Ile Gly Ile Ala Arg Gly Glu Arg
915 920 925
Asn Leu Ile Tyr Ile Thr Val Ile Asp Ser Thr Gly Lys Ile Leu Glu
930 935 940
Gln Arg Ser Leu Asn Thr Ile Gln Gln Phe Asp Tyr Gln Lys Lys Leu
945 950 955 960
Asp Asn Arg Glu Lys Glu Arg Val Ala Ala Arg Gln Ala Trp Ser Val
965 970 975
Val Gly Thr Ile Lys Asp Leu Lys Gln Gly Tyr Leu Ser Gln Val Ile
980 985 990
His Glu Ile Val Asp Leu Met Ile His Tyr Gln Ala Val Val Val Leu
995 1000 1005
Ala Asn Leu Asn Phe Gly Phe Lys Ser Lys Arg Thr Gly Ile Ala
1010 1015 1020
Glu Lys Ala Val Tyr Gln Gln Phe Glu Lys Met Leu Ile Asp Lys
1025 1030 1035
Leu Asn Cys Leu Val Leu Lys Asp Tyr Pro Ala Glu Lys Val Gly
1040 1045 1050
Gly Val Leu Asn Pro Tyr Gln Leu Thr Asp Gln Phe Thr Ser Phe
1055 1060 1065
Ala Lys Met Gly Thr Gln Ser Gly Phe Leu Phe Tyr Val Pro Ala
1070 1075 1080
Pro Tyr Thr Ser Lys Ile Asp Pro Leu Thr Gly Phe Val Asp Pro
1085 1090 1095
Phe Val Trp Lys Thr Ile Lys Asn His Glu Ser Arg Lys His Phe
1100 1105 1110
Leu Glu Gly Phe Asp Phe Leu His Tyr Asp Val Lys Thr Gly Asp
1115 1120 1125
Phe Ile Leu His Phe Lys Met Asn Arg Asn Leu Ser Phe Gln Arg
1130 1135 1140
Gly Leu Pro Gly Phe Met Pro Ala Trp Asp Ile Val Phe Glu Lys
1145 1150 1155
Asn Glu Thr Gln Phe Asp Ala Lys Gly Thr Pro Phe Ile Ala Gly
1160 1165 1170
Lys Arg Ile Val Pro Val Ile Glu Asn His Arg Phe Thr Gly Arg
1175 1180 1185
Tyr Arg Asp Leu Tyr Pro Ala Asn Glu Leu Ile Ala Leu Leu Glu
1190 1195 1200
Glu Lys Gly Ile Val Phe Arg Asp Gly Ser Asn Ile Leu Pro Lys
1205 1210 1215
Leu Leu Glu Asn Asp Asp Ser His Ala Ile Asp Thr Met Val Ala
1220 1225 1230
Leu Ile Arg Ser Val Leu Gln Met Arg Asn Ser Asn Ala Ala Thr
1235 1240 1245
Gly Glu Ala Tyr Ile Asn Ser Pro Val Arg Asp Leu Asn Gly Val
1250 1255 1260
Cys Phe Asp Ser Arg Phe Gln Asn Pro Glu Trp Pro Met Asp Ala
1265 1270 1275
Asp Ala Asn Gly Ala Tyr His Ile Ala Leu Lys Gly Gln Leu Leu
1280 1285 1290
Leu Asn His Leu Lys Glu Ser Lys Asp Leu Lys Leu Gln Asn Gly
1295 1300 1305
Ile Ser Asn Gln Asp Trp Leu Ala Tyr Ile Gln Glu Leu Arg Asn
1310 1315 1320
Gly Ser Pro Lys Lys Lys Arg Lys Val
1325 1330
<210> 62
<211> 1403
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 62
Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser
1 5 10 15
Met Pro Lys Lys Lys Arg Lys Val Gly Gly Gly Gly Ser Gly Gly Gly
20 25 30
Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly
35 40 45
Ser Gly Gly Gly Gly Ser Met Ser Ile Tyr Gln Glu Phe Val Asn Lys
50 55 60
Tyr Ser Leu Ser Lys Thr Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys
65 70 75 80
Thr Leu Glu Asn Ile Lys Ala Arg Gly Leu Ile Leu Asp Asp Glu Lys
85 90 95
Arg Ala Lys Asp Tyr Lys Lys Ala Lys Gln Ile Ile Asp Lys Tyr His
100 105 110
Gln Phe Phe Ile Glu Glu Ile Leu Ser Ser Val Cys Ile Ser Glu Asp
115 120 125
Leu Leu Gln Asn Tyr Ser Asp Val Tyr Phe Lys Leu Lys Lys Ser Asp
130 135 140
Asp Asp Asn Leu Gln Lys Asp Phe Lys Ser Ala Lys Asp Thr Ile Lys
145 150 155 160
Lys Gln Ile Ser Glu Tyr Ile Lys Asp Ser Glu Lys Phe Lys Asn Leu
165 170 175
Phe Asn Gln Asn Leu Ile Asp Ala Lys Lys Gly Gln Glu Ser Asp Leu
180 185 190
Ile Leu Trp Leu Lys Gln Ser Lys Asp Asn Gly Ile Glu Leu Phe Lys
195 200 205
Ala Asn Ser Asp Ile Thr Asp Ile Asp Glu Ala Leu Glu Ile Ile Lys
210 215 220
Ser Phe Lys Gly Trp Thr Thr Tyr Phe Lys Gly Phe His Glu Asn Arg
225 230 235 240
Lys Asn Val Tyr Ser Ser Asn Asp Ile Pro Thr Ser Ile Ile Tyr Arg
245 250 255
Ile Val Asp Asp Asn Leu Pro Lys Phe Leu Glu Asn Lys Ala Lys Tyr
260 265 270
Glu Ser Leu Lys Asp Lys Ala Pro Glu Ala Ile Asn Tyr Glu Gln Ile
275 280 285
Lys Lys Asp Leu Ala Glu Glu Leu Thr Phe Asp Ile Asp Tyr Lys Thr
290 295 300
Ser Glu Val Asn Gln Arg Val Phe Ser Leu Asp Glu Val Phe Glu Ile
305 310 315 320
Ala Asn Phe Asn Asn Tyr Leu Asn Gln Ser Gly Ile Thr Lys Phe Asn
325 330 335
Thr Ile Ile Gly Gly Lys Phe Val Asn Gly Glu Asn Thr Lys Arg Lys
340 345 350
Gly Ile Asn Glu Tyr Ile Asn Leu Tyr Ser Gln Gln Ile Asn Asp Lys
355 360 365
Thr Leu Lys Lys Tyr Lys Met Ser Val Leu Phe Lys Gln Ile Leu Ser
370 375 380
Asp Thr Glu Ser Lys Ser Phe Val Ile Asp Lys Leu Glu Asp Asp Ser
385 390 395 400
Asp Val Val Thr Thr Met Gln Ser Phe Tyr Glu Gln Ile Ala Ala Phe
405 410 415
Lys Thr Val Glu Glu Lys Ser Ile Lys Glu Thr Leu Ser Leu Leu Phe
420 425 430
Asp Asp Leu Lys Ala Gln Lys Leu Asp Leu Ser Lys Ile Tyr Phe Lys
435 440 445
Asn Asp Lys Ser Leu Thr Asp Leu Ser Gln Gln Val Phe Asp Asp Tyr
450 455 460
Ser Val Ile Gly Thr Ala Val Leu Glu Tyr Ile Thr Gln Gln Ile Ala
465 470 475 480
Pro Lys Asn Leu Asp Asn Pro Ser Lys Lys Glu Gln Glu Leu Ile Ala
485 490 495
Lys Lys Thr Glu Lys Ala Lys Tyr Leu Ser Leu Glu Thr Ile Lys Leu
500 505 510
Ala Leu Glu Glu Phe Asn Lys His Arg Asp Ile Asp Lys Gln Cys Arg
515 520 525
Phe Glu Glu Ile Leu Ala Asn Phe Ala Ala Ile Pro Met Ile Phe Asp
530 535 540
Glu Ile Ala Gln Asn Lys Asp Asn Leu Ala Gln Ile Ser Ile Lys Tyr
545 550 555 560
Gln Asn Gln Gly Lys Lys Asp Leu Leu Gln Ala Ser Ala Glu Asp Asp
565 570 575
Val Lys Ala Ile Lys Asp Leu Leu Asp Gln Thr Asn Asn Leu Leu His
580 585 590
Lys Leu Lys Ile Phe His Ile Ser Gln Ser Glu Asp Lys Ala Asn Ile
595 600 605
Leu Asp Lys Asp Glu His Phe Tyr Leu Val Phe Glu Glu Cys Tyr Phe
610 615 620
Glu Leu Ala Asn Ile Val Pro Leu Tyr Asn Lys Ile Arg Asn Tyr Ile
625 630 635 640
Thr Gln Lys Pro Tyr Ser Asp Glu Lys Phe Lys Leu Asn Phe Glu Asn
645 650 655
Ser Thr Leu Ala Asn Gly Trp Asp Lys Asn Lys Glu Pro Asp Asn Thr
660 665 670
Ala Ile Leu Phe Ile Lys Asp Asp Lys Tyr Tyr Leu Gly Val Met Asn
675 680 685
Lys Lys Asn Asn Lys Ile Phe Asp Asp Lys Ala Ile Lys Glu Asn Lys
690 695 700
Gly Glu Gly Tyr Lys Lys Ile Val Tyr Lys Leu Leu Pro Gly Ala Asn
705 710 715 720
Lys Met Leu Pro Lys Val Phe Phe Ser Ala Lys Ser Ile Lys Phe Tyr
725 730 735
Asn Pro Ser Glu Asp Ile Leu Arg Ile Arg Asn His Ser Thr His Thr
740 745 750
Lys Asn Gly Ser Pro Gln Lys Gly Tyr Glu Lys Phe Glu Phe Asn Ile
755 760 765
Glu Asp Cys Arg Lys Phe Ile Asp Phe Tyr Lys Gln Ser Ile Ser Lys
770 775 780
His Pro Glu Trp Lys Asp Phe Gly Phe Arg Phe Ser Asp Thr Gln Arg
785 790 795 800
Tyr Asn Ser Ile Asp Glu Phe Tyr Arg Glu Val Glu Asn Gln Gly Tyr
805 810 815
Lys Leu Thr Phe Glu Asn Ile Ser Glu Ser Tyr Ile Asp Ser Val Val
820 825 830
Asn Gln Gly Lys Leu Tyr Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ser
835 840 845
Ala Tyr Ser Lys Gly Arg Pro Asn Leu His Thr Leu Tyr Trp Lys Ala
850 855 860
Leu Phe Asp Glu Arg Asn Leu Gln Asp Val Val Tyr Lys Leu Asn Gly
865 870 875 880
Glu Ala Glu Leu Phe Tyr Arg Lys Gln Ser Ile Pro Lys Lys Ile Thr
885 890 895
His Pro Ala Lys Glu Ala Ile Ala Asn Lys Asn Lys Asp Asn Pro Lys
900 905 910
Lys Glu Ser Val Phe Glu Tyr Asp Leu Ile Lys Asp Lys Arg Phe Thr
915 920 925
Glu Asp Lys Phe Phe Phe His Cys Pro Ile Thr Ile Asn Phe Lys Ser
930 935 940
Ser Gly Ala Asn Lys Phe Asn Asp Glu Ile Asn Leu Leu Leu Lys Glu
945 950 955 960
Lys Ala Asn Asp Val His Ile Leu Ser Ile Asp Arg Gly Glu Arg His
965 970 975
Leu Ala Tyr Tyr Thr Leu Val Asp Gly Lys Gly Asn Ile Ile Lys Gln
980 985 990
Asp Thr Phe Asn Ile Ile Gly Asn Asp Arg Met Lys Thr Asn Tyr His
995 1000 1005
Asp Lys Leu Ala Ala Ile Glu Lys Asp Arg Asp Ser Ala Arg Lys
1010 1015 1020
Asp Trp Lys Lys Ile Asn Asn Ile Lys Glu Met Lys Glu Gly Tyr
1025 1030 1035
Leu Ser Gln Val Val His Glu Ile Ala Lys Leu Val Ile Glu Tyr
1040 1045 1050
Asn Ala Ile Val Val Phe Glu Asp Leu Asn Phe Gly Phe Lys Arg
1055 1060 1065
Gly Arg Phe Lys Val Glu Lys Gln Val Tyr Gln Lys Leu Glu Lys
1070 1075 1080
Met Leu Ile Glu Lys Leu Asn Tyr Leu Val Phe Lys Asp Asn Glu
1085 1090 1095
Phe Asp Lys Thr Gly Gly Val Leu Arg Ala Tyr Gln Leu Thr Ala
1100 1105 1110
Pro Phe Glu Thr Phe Lys Lys Met Gly Lys Gln Thr Gly Ile Ile
1115 1120 1125
Tyr Tyr Val Pro Ala Gly Phe Thr Ser Lys Ile Cys Pro Val Thr
1130 1135 1140
Gly Phe Val Asn Gln Leu Tyr Pro Lys Tyr Glu Ser Val Ser Lys
1145 1150 1155
Ser Gln Glu Phe Phe Ser Lys Phe Asp Lys Ile Cys Tyr Asn Leu
1160 1165 1170
Asp Lys Gly Tyr Phe Glu Phe Ser Phe Asp Tyr Lys Asn Phe Gly
1175 1180 1185
Asp Lys Ala Ala Lys Gly Lys Trp Thr Ile Ala Ser Phe Gly Ser
1190 1195 1200
Arg Leu Ile Asn Phe Arg Asn Ser Asp Lys Asn His Asn Trp Asp
1205 1210 1215
Thr Arg Glu Val Tyr Pro Thr Lys Glu Leu Glu Lys Leu Leu Lys
1220 1225 1230
Asp Tyr Ser Ile Glu Tyr Gly His Gly Glu Cys Ile Lys Ala Ala
1235 1240 1245
Ile Cys Gly Glu Ser Asp Lys Lys Phe Phe Ala Lys Leu Thr Ser
1250 1255 1260
Val Leu Asn Thr Ile Leu Gln Met Arg Asn Ser Lys Thr Gly Thr
1265 1270 1275
Glu Leu Asp Tyr Leu Ile Ser Pro Val Ala Asp Val Asn Gly Asn
1280 1285 1290
Phe Phe Asp Ser Arg Gln Ala Pro Lys Asn Met Pro Gln Asp Ala
1295 1300 1305
Asp Ala Asn Gly Ala Tyr His Ile Gly Leu Lys Gly Leu Met Leu
1310 1315 1320
Leu Gly Arg Ile Lys Asn Asn Gln Glu Gly Lys Lys Leu Asn Leu
1325 1330 1335
Val Ile Lys Asn Glu Glu Tyr Phe Glu Phe Val Gln Asn Arg Asn
1340 1345 1350
Asn Pro Lys Lys Lys Arg Lys Val Ser Gly Gly Ser Ser Gly Gly
1355 1360 1365
Ser Pro Lys Lys Lys Arg Lys Val Tyr Pro Tyr Asp Val Pro Asp
1370 1375 1380
Tyr Ala Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Tyr Pro Tyr Asp
1385 1390 1395
Val Pro Asp Tyr Ala
1400
<210> 63
<211> 1382
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 63
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
1 5 10 15
Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Met Thr
20 25 30
Gln Phe Glu Gly Phe Thr Asn Leu Tyr Gln Val Ser Lys Thr Leu Arg
35 40 45
Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Lys His Ile Gln Glu Gln
50 55 60
Gly Phe Ile Glu Glu Asp Lys Ala Arg Asn Asp His Tyr Lys Glu Leu
65 70 75 80
Lys Pro Ile Ile Asp Arg Ile Tyr Lys Thr Tyr Ala Asp Gln Cys Leu
85 90 95
Gln Leu Val Gln Leu Asp Trp Glu Asn Leu Ser Ala Ala Ile Asp Ser
100 105 110
Tyr Arg Lys Glu Lys Thr Glu Glu Thr Arg Asn Ala Leu Ile Glu Glu
115 120 125
Gln Ala Thr Tyr Arg Asn Ala Ile His Asp Tyr Phe Ile Gly Arg Thr
130 135 140
Asp Asn Leu Thr Asp Ala Ile Asn Lys Arg His Ala Glu Ile Tyr Lys
145 150 155 160
Gly Leu Phe Lys Ala Glu Leu Phe Asn Gly Lys Val Leu Lys Gln Leu
165 170 175
Gly Thr Val Thr Thr Thr Glu His Glu Asn Ala Leu Leu Arg Ser Phe
180 185 190
Asp Lys Phe Thr Thr Tyr Phe Ser Gly Phe Tyr Glu Asn Arg Lys Asn
195 200 205
Val Phe Ser Ala Glu Asp Ile Ser Thr Ala Ile Pro His Arg Ile Val
210 215 220
Gln Asp Asn Phe Pro Lys Phe Lys Glu Asn Cys His Ile Phe Thr Arg
225 230 235 240
Leu Ile Thr Ala Val Pro Ser Leu Arg Glu His Phe Glu Asn Val Lys
245 250 255
Lys Ala Ile Gly Ile Phe Val Ser Thr Ser Ile Glu Glu Val Phe Ser
260 265 270
Phe Pro Phe Tyr Asn Gln Leu Leu Thr Gln Thr Gln Ile Asp Leu Tyr
275 280 285
Asn Gln Leu Leu Gly Gly Ile Ser Arg Glu Ala Gly Thr Glu Lys Ile
290 295 300
Lys Gly Leu Asn Glu Val Leu Asn Leu Ala Ile Gln Lys Asn Asp Glu
305 310 315 320
Thr Ala His Ile Ile Ala Ser Leu Pro His Arg Phe Ile Pro Leu Phe
325 330 335
Lys Gln Ile Leu Ser Asp Arg Asn Thr Leu Ser Phe Ile Leu Glu Glu
340 345 350
Phe Lys Ser Asp Glu Glu Val Ile Gln Ser Phe Cys Lys Tyr Lys Thr
355 360 365
Leu Leu Arg Asn Glu Asn Val Leu Glu Thr Ala Glu Ala Leu Phe Asn
370 375 380
Glu Leu Asn Ser Ile Asp Leu Thr His Ile Phe Ile Ser His Lys Lys
385 390 395 400
Leu Glu Thr Ile Ser Ser Ala Leu Cys Asp His Trp Asp Thr Leu Arg
405 410 415
Asn Ala Leu Tyr Glu Arg Arg Ile Ser Glu Leu Thr Gly Lys Ile Thr
420 425 430
Lys Ser Ala Lys Glu Lys Val Gln Arg Ser Leu Lys His Glu Asp Ile
435 440 445
Asn Leu Gln Glu Ile Ile Ser Ala Ala Gly Lys Glu Leu Ser Glu Ala
450 455 460
Phe Lys Gln Lys Thr Ser Glu Ile Leu Ser His Ala His Ala Ala Leu
465 470 475 480
Asp Gln Pro Leu Pro Thr Thr Leu Lys Lys Gln Glu Glu Lys Glu Ile
485 490 495
Leu Lys Ser Gln Leu Asp Ser Leu Leu Gly Leu Tyr His Leu Leu Asp
500 505 510
Trp Phe Ala Val Asp Glu Ser Asn Glu Val Asp Pro Glu Phe Ser Ala
515 520 525
Arg Leu Thr Gly Ile Lys Leu Glu Met Glu Pro Ser Leu Ser Phe Tyr
530 535 540
Asn Lys Ala Arg Asn Tyr Ala Thr Lys Lys Pro Tyr Ser Val Glu Lys
545 550 555 560
Phe Lys Leu Asn Phe Gln Met Pro Thr Leu Ala Ser Gly Trp Asp Val
565 570 575
Asn Lys Glu Lys Asn Asn Gly Ala Ile Leu Phe Val Lys Asn Gly Leu
580 585 590
Tyr Tyr Leu Gly Ile Met Pro Lys Gln Lys Gly Arg Tyr Lys Ala Leu
595 600 605
Ser Phe Glu Pro Thr Glu Lys Thr Ser Glu Gly Phe Asp Lys Met Tyr
610 615 620
Tyr Asp Tyr Phe Pro Asp Ala Ala Lys Met Ile Pro Lys Cys Ser Thr
625 630 635 640
Gln Leu Lys Ala Val Thr Ala His Phe Gln Thr His Thr Thr Pro Ile
645 650 655
Leu Leu Ser Asn Asn Phe Ile Glu Pro Leu Glu Ile Thr Lys Glu Ile
660 665 670
Tyr Asp Leu Asn Asn Pro Glu Lys Glu Pro Lys Lys Phe Gln Thr Ala
675 680 685
Tyr Ala Lys Lys Thr Gly Asp Gln Lys Gly Tyr Arg Glu Ala Leu Cys
690 695 700
Lys Trp Ile Asp Phe Thr Arg Asp Phe Leu Ser Lys Tyr Thr Lys Thr
705 710 715 720
Thr Ser Ile Asp Leu Ser Ser Leu Arg Pro Ser Ser Gln Tyr Lys Asp
725 730 735
Leu Gly Glu Tyr Tyr Ala Glu Leu Asn Pro Leu Leu Tyr His Ile Ser
740 745 750
Phe Gln Arg Ile Ala Glu Lys Glu Ile Met Asp Ala Val Glu Thr Gly
755 760 765
Lys Leu Tyr Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ala Lys Gly His
770 775 780
His Gly Lys Pro Asn Leu His Thr Leu Tyr Trp Thr Gly Leu Phe Ser
785 790 795 800
Pro Glu Asn Leu Ala Lys Thr Ser Ile Lys Leu Asn Gly Gln Ala Glu
805 810 815
Leu Phe Tyr Arg Pro Lys Ser Arg Met Lys Arg Met Ala His Arg Leu
820 825 830
Gly Glu Lys Met Leu Asn Lys Lys Leu Lys Asp Gln Lys Thr Pro Ile
835 840 845
Pro Asp Thr Leu Tyr Gln Glu Leu Tyr Asp Tyr Val Asn His Arg Leu
850 855 860
Ser His Asp Leu Ser Asp Glu Ala Arg Ala Leu Leu Pro Asn Val Ile
865 870 875 880
Thr Lys Glu Val Ser His Glu Ile Ile Lys Asp Arg Arg Phe Thr Ser
885 890 895
Asp Lys Phe Phe Phe His Val Pro Ile Thr Leu Asn Tyr Gln Ala Ala
900 905 910
Asn Ser Pro Ser Lys Phe Asn Gln Arg Val Asn Ala Tyr Leu Lys Glu
915 920 925
His Pro Glu Thr Pro Ile Ile Gly Ile Asp Arg Gly Glu Arg Asn Leu
930 935 940
Ile Tyr Ile Thr Val Ile Asp Ser Thr Gly Lys Ile Leu Glu Gln Arg
945 950 955 960
Ser Leu Asn Thr Ile Gln Gln Phe Asp Tyr Gln Lys Lys Leu Asp Asn
965 970 975
Arg Glu Lys Glu Arg Val Ala Ala Arg Gln Ala Trp Ser Val Val Gly
980 985 990
Thr Ile Lys Asp Leu Lys Gln Gly Tyr Leu Ser Gln Val Ile His Glu
995 1000 1005
Ile Val Asp Leu Met Ile His Tyr Gln Ala Val Val Val Leu Glu
1010 1015 1020
Asn Leu Asn Phe Gly Phe Lys Ser Lys Arg Thr Gly Ile Ala Glu
1025 1030 1035
Lys Ala Val Tyr Gln Gln Phe Glu Lys Met Leu Ile Asp Lys Leu
1040 1045 1050
Asn Cys Leu Val Leu Lys Asp Tyr Pro Ala Glu Lys Val Gly Gly
1055 1060 1065
Val Leu Asn Pro Tyr Gln Leu Thr Asp Gln Phe Thr Ser Phe Ala
1070 1075 1080
Lys Met Gly Thr Gln Ser Gly Phe Leu Phe Tyr Val Pro Ala Pro
1085 1090 1095
Tyr Thr Ser Lys Ile Asp Pro Leu Thr Gly Phe Val Asp Pro Phe
1100 1105 1110
Val Trp Lys Thr Ile Lys Asn His Glu Ser Arg Lys His Phe Leu
1115 1120 1125
Glu Gly Phe Asp Phe Leu His Tyr Asp Val Lys Thr Gly Asp Phe
1130 1135 1140
Ile Leu His Phe Lys Met Asn Arg Asn Leu Ser Phe Gln Arg Gly
1145 1150 1155
Leu Pro Gly Phe Met Pro Ala Trp Asp Ile Val Phe Glu Lys Asn
1160 1165 1170
Glu Thr Gln Phe Asp Ala Lys Gly Thr Pro Phe Ile Ala Gly Lys
1175 1180 1185
Arg Ile Val Pro Val Ile Glu Asn His Arg Phe Thr Gly Arg Tyr
1190 1195 1200
Arg Asp Leu Tyr Pro Ala Asn Glu Leu Ile Ala Leu Leu Glu Glu
1205 1210 1215
Lys Gly Ile Val Phe Arg Asp Gly Ser Asn Ile Leu Pro Lys Leu
1220 1225 1230
Leu Glu Asn Asp Asp Ser His Ala Ile Asp Thr Met Val Ala Leu
1235 1240 1245
Ile Arg Ser Val Leu Gln Met Arg Asn Ser Asn Ala Ala Thr Gly
1250 1255 1260
Glu Asp Tyr Ile Asn Ser Pro Val Arg Asp Leu Asn Gly Val Cys
1265 1270 1275
Phe Asp Ser Arg Phe Gln Asn Pro Glu Trp Pro Met Asp Ala Asp
1280 1285 1290
Ala Asn Gly Ala Tyr His Ile Ala Leu Lys Gly Gln Leu Leu Leu
1295 1300 1305
Asn His Leu Lys Glu Ser Lys Asp Leu Lys Leu Gln Asn Gly Ile
1310 1315 1320
Ser Asn Gln Asp Trp Leu Ala Tyr Ile Gln Glu Leu Arg Asn Lys
1325 1330 1335
Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys
1340 1345 1350
Gly Ser Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Tyr Pro Tyr Asp
1355 1360 1365
Val Pro Asp Tyr Ala Tyr Pro Tyr Asp Val Pro Asp Tyr Ala
1370 1375 1380
<210> 64
<211> 1346
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 64
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
1 5 10 15
Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Met Thr
20 25 30
Gln Phe Glu Gly Phe Thr Asn Leu Tyr Gln Val Ser Lys Thr Leu Arg
35 40 45
Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Lys His Ile Gln Glu Gln
50 55 60
Gly Phe Ile Glu Glu Asp Lys Ala Arg Asn Asp His Tyr Lys Glu Leu
65 70 75 80
Lys Pro Ile Ile Asp Arg Ile Tyr Lys Thr Tyr Ala Asp Gln Cys Leu
85 90 95
Gln Leu Val Gln Leu Asp Trp Glu Asn Leu Ser Ala Ala Ile Asp Ser
100 105 110
Tyr Arg Lys Glu Lys Thr Glu Glu Thr Arg Asn Ala Leu Ile Glu Glu
115 120 125
Gln Ala Thr Tyr Arg Asn Ala Ile His Asp Tyr Phe Ile Gly Arg Thr
130 135 140
Asp Asn Leu Thr Asp Ala Ile Asn Lys Arg His Ala Glu Ile Tyr Lys
145 150 155 160
Gly Leu Phe Lys Ala Glu Leu Phe Asn Gly Lys Val Leu Lys Gln Leu
165 170 175
Gly Thr Val Thr Thr Thr Glu His Glu Asn Ala Leu Leu Arg Ser Phe
180 185 190
Asp Lys Phe Thr Thr Tyr Phe Ser Gly Phe Tyr Glu Asn Arg Lys Asn
195 200 205
Val Phe Ser Ala Glu Asp Ile Ser Thr Ala Ile Pro His Arg Ile Val
210 215 220
Gln Asp Asn Phe Pro Lys Phe Lys Glu Asn Cys His Ile Phe Thr Arg
225 230 235 240
Leu Ile Thr Ala Val Pro Ser Leu Arg Glu His Phe Glu Asn Val Lys
245 250 255
Lys Ala Ile Gly Ile Phe Val Ser Thr Ser Ile Glu Glu Val Phe Ser
260 265 270
Phe Pro Phe Tyr Asn Gln Leu Leu Thr Gln Thr Gln Ile Asp Leu Tyr
275 280 285
Asn Gln Leu Leu Gly Gly Ile Ser Arg Glu Ala Gly Thr Glu Lys Ile
290 295 300
Lys Gly Leu Asn Glu Val Leu Asn Leu Ala Ile Gln Lys Asn Asp Glu
305 310 315 320
Thr Ala His Ile Ile Ala Ser Leu Pro His Arg Phe Ile Pro Leu Phe
325 330 335
Lys Gln Ile Leu Ser Asp Arg Asn Thr Leu Ser Phe Ile Leu Glu Glu
340 345 350
Phe Lys Ser Asp Glu Glu Val Ile Gln Ser Phe Cys Lys Tyr Lys Thr
355 360 365
Leu Leu Arg Asn Glu Asn Val Leu Glu Thr Ala Glu Ala Leu Phe Asn
370 375 380
Glu Leu Asn Ser Ile Asp Leu Thr His Ile Phe Ile Ser His Lys Lys
385 390 395 400
Leu Glu Thr Ile Ser Ser Ala Leu Cys Asp His Trp Asp Thr Leu Arg
405 410 415
Asn Ala Leu Tyr Glu Arg Arg Ile Ser Glu Leu Thr Gly Lys Ile Thr
420 425 430
Lys Ser Ala Lys Glu Lys Val Gln Arg Ser Leu Lys His Glu Asp Ile
435 440 445
Asn Leu Gln Glu Ile Ile Ser Ala Ala Gly Lys Glu Leu Ser Glu Ala
450 455 460
Phe Lys Gln Lys Thr Ser Glu Ile Leu Ser His Ala His Ala Ala Leu
465 470 475 480
Asp Gln Pro Leu Pro Thr Thr Leu Lys Lys Gln Glu Glu Lys Glu Ile
485 490 495
Leu Lys Ser Gln Leu Asp Ser Leu Leu Gly Leu Tyr His Leu Leu Asp
500 505 510
Trp Phe Ala Val Asp Glu Ser Asn Glu Val Asp Pro Glu Phe Ser Ala
515 520 525
Arg Leu Thr Gly Ile Lys Leu Glu Met Glu Pro Ser Leu Ser Phe Tyr
530 535 540
Asn Lys Ala Arg Asn Tyr Ala Thr Lys Lys Pro Tyr Ser Val Glu Lys
545 550 555 560
Phe Lys Leu Asn Phe Gln Met Pro Thr Leu Ala Ser Gly Trp Asp Val
565 570 575
Asn Lys Glu Lys Asn Asn Gly Ala Ile Leu Phe Val Lys Asn Gly Leu
580 585 590
Tyr Tyr Leu Gly Ile Met Pro Lys Gln Lys Gly Arg Tyr Lys Ala Leu
595 600 605
Ser Phe Glu Pro Thr Glu Lys Thr Ser Glu Gly Phe Asp Lys Met Tyr
610 615 620
Tyr Asp Tyr Phe Pro Asp Ala Ala Lys Met Ile Pro Lys Cys Ser Thr
625 630 635 640
Gln Leu Lys Ala Val Thr Ala His Phe Gln Thr His Thr Thr Pro Ile
645 650 655
Leu Leu Ser Asn Asn Phe Ile Glu Pro Leu Glu Ile Thr Lys Glu Ile
660 665 670
Tyr Asp Leu Asn Asn Pro Glu Lys Glu Pro Lys Lys Phe Gln Thr Ala
675 680 685
Tyr Ala Lys Lys Thr Gly Asp Gln Lys Gly Tyr Arg Glu Ala Leu Cys
690 695 700
Lys Trp Ile Asp Phe Thr Arg Asp Phe Leu Ser Lys Tyr Thr Lys Thr
705 710 715 720
Thr Ser Ile Asp Leu Ser Ser Leu Arg Pro Ser Ser Gln Tyr Lys Asp
725 730 735
Leu Gly Glu Tyr Tyr Ala Glu Leu Asn Pro Leu Leu Tyr His Ile Ser
740 745 750
Phe Gln Arg Ile Ala Glu Lys Glu Ile Met Asp Ala Val Glu Thr Gly
755 760 765
Lys Leu Tyr Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ala Lys Gly His
770 775 780
His Gly Lys Pro Asn Leu His Thr Leu Tyr Trp Thr Gly Leu Phe Ser
785 790 795 800
Pro Glu Asn Leu Ala Lys Thr Ser Ile Lys Leu Asn Gly Gln Ala Glu
805 810 815
Leu Phe Tyr Arg Pro Lys Ser Arg Met Lys Arg Met Ala His Arg Leu
820 825 830
Gly Glu Lys Met Leu Asn Lys Lys Leu Lys Asp Gln Lys Thr Pro Ile
835 840 845
Pro Asp Thr Leu Tyr Gln Glu Leu Tyr Asp Tyr Val Asn His Arg Leu
850 855 860
Ser His Asp Leu Ser Asp Glu Ala Arg Ala Leu Leu Pro Asn Val Ile
865 870 875 880
Thr Lys Glu Val Ser His Glu Ile Ile Lys Asp Arg Arg Phe Thr Ser
885 890 895
Asp Lys Phe Phe Phe His Val Pro Ile Thr Leu Asn Tyr Gln Ala Ala
900 905 910
Asn Ser Pro Ser Lys Phe Asn Gln Arg Val Asn Ala Tyr Leu Lys Glu
915 920 925
His Pro Glu Thr Pro Ile Ile Gly Ile Ala Arg Gly Glu Arg Asn Leu
930 935 940
Ile Tyr Ile Thr Val Ile Asp Ser Thr Gly Lys Ile Leu Glu Gln Arg
945 950 955 960
Ser Leu Asn Thr Ile Gln Gln Phe Asp Tyr Gln Lys Lys Leu Asp Asn
965 970 975
Arg Glu Lys Glu Arg Val Ala Ala Arg Gln Ala Trp Ser Val Val Gly
980 985 990
Thr Ile Lys Asp Leu Lys Gln Gly Tyr Leu Ser Gln Val Ile His Glu
995 1000 1005
Ile Val Asp Leu Met Ile His Tyr Gln Ala Val Val Val Leu Ala
1010 1015 1020
Asn Leu Asn Phe Gly Phe Lys Ser Lys Arg Thr Gly Ile Ala Glu
1025 1030 1035
Lys Ala Val Tyr Gln Gln Phe Glu Lys Met Leu Ile Asp Lys Leu
1040 1045 1050
Asn Cys Leu Val Leu Lys Asp Tyr Pro Ala Glu Lys Val Gly Gly
1055 1060 1065
Val Leu Asn Pro Tyr Gln Leu Thr Asp Gln Phe Thr Ser Phe Ala
1070 1075 1080
Lys Met Gly Thr Gln Ser Gly Phe Leu Phe Tyr Val Pro Ala Pro
1085 1090 1095
Tyr Thr Ser Lys Ile Asp Pro Leu Thr Gly Phe Val Asp Pro Phe
1100 1105 1110
Val Trp Lys Thr Ile Lys Asn His Glu Ser Arg Lys His Phe Leu
1115 1120 1125
Glu Gly Phe Asp Phe Leu His Tyr Asp Val Lys Thr Gly Asp Phe
1130 1135 1140
Ile Leu His Phe Lys Met Asn Arg Asn Leu Ser Phe Gln Arg Gly
1145 1150 1155
Leu Pro Gly Phe Met Pro Ala Trp Asp Ile Val Phe Glu Lys Asn
1160 1165 1170
Glu Thr Gln Phe Asp Ala Lys Gly Thr Pro Phe Ile Ala Gly Lys
1175 1180 1185
Arg Ile Val Pro Val Ile Glu Asn His Arg Phe Thr Gly Arg Tyr
1190 1195 1200
Arg Asp Leu Tyr Pro Ala Asn Glu Leu Ile Ala Leu Leu Glu Glu
1205 1210 1215
Lys Gly Ile Val Phe Arg Asp Gly Ser Asn Ile Leu Pro Lys Leu
1220 1225 1230
Leu Glu Asn Asp Asp Ser His Ala Ile Asp Thr Met Val Ala Leu
1235 1240 1245
Ile Arg Ser Val Leu Gln Met Arg Asn Ser Asn Ala Ala Thr Gly
1250 1255 1260
Glu Ala Tyr Ile Asn Ser Pro Val Arg Asp Leu Asn Gly Val Cys
1265 1270 1275
Phe Asp Ser Arg Phe Gln Asn Pro Glu Trp Pro Met Asp Ala Asp
1280 1285 1290
Ala Asn Gly Ala Tyr His Ile Ala Leu Lys Gly Gln Leu Leu Leu
1295 1300 1305
Asn His Leu Lys Glu Ser Lys Asp Leu Lys Leu Gln Asn Gly Ile
1310 1315 1320
Ser Asn Gln Asp Trp Leu Ala Tyr Ile Gln Glu Leu Arg Asn Gly
1325 1330 1335
Ser Pro Lys Lys Lys Arg Lys Val
1340 1345
<210> 65
<211> 1417
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 65
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
1 5 10 15
Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Met Pro
20 25 30
Lys Lys Lys Arg Lys Val Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
35 40 45
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
50 55 60
Gly Gly Gly Ser Met Ser Ile Tyr Gln Glu Phe Val Asn Lys Tyr Ser
65 70 75 80
Leu Ser Lys Thr Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu
85 90 95
Glu Asn Ile Lys Ala Arg Gly Leu Ile Leu Asp Asp Glu Lys Arg Ala
100 105 110
Lys Asp Tyr Lys Lys Ala Lys Gln Ile Ile Asp Lys Tyr His Gln Phe
115 120 125
Phe Ile Glu Glu Ile Leu Ser Ser Val Cys Ile Ser Glu Asp Leu Leu
130 135 140
Gln Asn Tyr Ser Asp Val Tyr Phe Lys Leu Lys Lys Ser Asp Asp Asp
145 150 155 160
Asn Leu Gln Lys Asp Phe Lys Ser Ala Lys Asp Thr Ile Lys Lys Gln
165 170 175
Ile Ser Glu Tyr Ile Lys Asp Ser Glu Lys Phe Lys Asn Leu Phe Asn
180 185 190
Gln Asn Leu Ile Asp Ala Lys Lys Gly Gln Glu Ser Asp Leu Ile Leu
195 200 205
Trp Leu Lys Gln Ser Lys Asp Asn Gly Ile Glu Leu Phe Lys Ala Asn
210 215 220
Ser Asp Ile Thr Asp Ile Asp Glu Ala Leu Glu Ile Ile Lys Ser Phe
225 230 235 240
Lys Gly Trp Thr Thr Tyr Phe Lys Gly Phe His Glu Asn Arg Lys Asn
245 250 255
Val Tyr Ser Ser Asn Asp Ile Pro Thr Ser Ile Ile Tyr Arg Ile Val
260 265 270
Asp Asp Asn Leu Pro Lys Phe Leu Glu Asn Lys Ala Lys Tyr Glu Ser
275 280 285
Leu Lys Asp Lys Ala Pro Glu Ala Ile Asn Tyr Glu Gln Ile Lys Lys
290 295 300
Asp Leu Ala Glu Glu Leu Thr Phe Asp Ile Asp Tyr Lys Thr Ser Glu
305 310 315 320
Val Asn Gln Arg Val Phe Ser Leu Asp Glu Val Phe Glu Ile Ala Asn
325 330 335
Phe Asn Asn Tyr Leu Asn Gln Ser Gly Ile Thr Lys Phe Asn Thr Ile
340 345 350
Ile Gly Gly Lys Phe Val Asn Gly Glu Asn Thr Lys Arg Lys Gly Ile
355 360 365
Asn Glu Tyr Ile Asn Leu Tyr Ser Gln Gln Ile Asn Asp Lys Thr Leu
370 375 380
Lys Lys Tyr Lys Met Ser Val Leu Phe Lys Gln Ile Leu Ser Asp Thr
385 390 395 400
Glu Ser Lys Ser Phe Val Ile Asp Lys Leu Glu Asp Asp Ser Asp Val
405 410 415
Val Thr Thr Met Gln Ser Phe Tyr Glu Gln Ile Ala Ala Phe Lys Thr
420 425 430
Val Glu Glu Lys Ser Ile Lys Glu Thr Leu Ser Leu Leu Phe Asp Asp
435 440 445
Leu Lys Ala Gln Lys Leu Asp Leu Ser Lys Ile Tyr Phe Lys Asn Asp
450 455 460
Lys Ser Leu Thr Asp Leu Ser Gln Gln Val Phe Asp Asp Tyr Ser Val
465 470 475 480
Ile Gly Thr Ala Val Leu Glu Tyr Ile Thr Gln Gln Ile Ala Pro Lys
485 490 495
Asn Leu Asp Asn Pro Ser Lys Lys Glu Gln Glu Leu Ile Ala Lys Lys
500 505 510
Thr Glu Lys Ala Lys Tyr Leu Ser Leu Glu Thr Ile Lys Leu Ala Leu
515 520 525
Glu Glu Phe Asn Lys His Arg Asp Ile Asp Lys Gln Cys Arg Phe Glu
530 535 540
Glu Ile Leu Ala Asn Phe Ala Ala Ile Pro Met Ile Phe Asp Glu Ile
545 550 555 560
Ala Gln Asn Lys Asp Asn Leu Ala Gln Ile Ser Ile Lys Tyr Gln Asn
565 570 575
Gln Gly Lys Lys Asp Leu Leu Gln Ala Ser Ala Glu Asp Asp Val Lys
580 585 590
Ala Ile Lys Asp Leu Leu Asp Gln Thr Asn Asn Leu Leu His Lys Leu
595 600 605
Lys Ile Phe His Ile Ser Gln Ser Glu Asp Lys Ala Asn Ile Leu Asp
610 615 620
Lys Asp Glu His Phe Tyr Leu Val Phe Glu Glu Cys Tyr Phe Glu Leu
625 630 635 640
Ala Asn Ile Val Pro Leu Tyr Asn Lys Ile Arg Asn Tyr Ile Thr Gln
645 650 655
Lys Pro Tyr Ser Asp Glu Lys Phe Lys Leu Asn Phe Glu Asn Ser Thr
660 665 670
Leu Ala Asn Gly Trp Asp Lys Asn Lys Glu Pro Asp Asn Thr Ala Ile
675 680 685
Leu Phe Ile Lys Asp Asp Lys Tyr Tyr Leu Gly Val Met Asn Lys Lys
690 695 700
Asn Asn Lys Ile Phe Asp Asp Lys Ala Ile Lys Glu Asn Lys Gly Glu
705 710 715 720
Gly Tyr Lys Lys Ile Val Tyr Lys Leu Leu Pro Gly Ala Asn Lys Met
725 730 735
Leu Pro Lys Val Phe Phe Ser Ala Lys Ser Ile Lys Phe Tyr Asn Pro
740 745 750
Ser Glu Asp Ile Leu Arg Ile Arg Asn His Ser Thr His Thr Lys Asn
755 760 765
Gly Ser Pro Gln Lys Gly Tyr Glu Lys Phe Glu Phe Asn Ile Glu Asp
770 775 780
Cys Arg Lys Phe Ile Asp Phe Tyr Lys Gln Ser Ile Ser Lys His Pro
785 790 795 800
Glu Trp Lys Asp Phe Gly Phe Arg Phe Ser Asp Thr Gln Arg Tyr Asn
805 810 815
Ser Ile Asp Glu Phe Tyr Arg Glu Val Glu Asn Gln Gly Tyr Lys Leu
820 825 830
Thr Phe Glu Asn Ile Ser Glu Ser Tyr Ile Asp Ser Val Val Asn Gln
835 840 845
Gly Lys Leu Tyr Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ser Ala Tyr
850 855 860
Ser Lys Gly Arg Pro Asn Leu His Thr Leu Tyr Trp Lys Ala Leu Phe
865 870 875 880
Asp Glu Arg Asn Leu Gln Asp Val Val Tyr Lys Leu Asn Gly Glu Ala
885 890 895
Glu Leu Phe Tyr Arg Lys Gln Ser Ile Pro Lys Lys Ile Thr His Pro
900 905 910
Ala Lys Glu Ala Ile Ala Asn Lys Asn Lys Asp Asn Pro Lys Lys Glu
915 920 925
Ser Val Phe Glu Tyr Asp Leu Ile Lys Asp Lys Arg Phe Thr Glu Asp
930 935 940
Lys Phe Phe Phe His Cys Pro Ile Thr Ile Asn Phe Lys Ser Ser Gly
945 950 955 960
Ala Asn Lys Phe Asn Asp Glu Ile Asn Leu Leu Leu Lys Glu Lys Ala
965 970 975
Asn Asp Val His Ile Leu Ser Ile Asp Arg Gly Glu Arg His Leu Ala
980 985 990
Tyr Tyr Thr Leu Val Asp Gly Lys Gly Asn Ile Ile Lys Gln Asp Thr
995 1000 1005
Phe Asn Ile Ile Gly Asn Asp Arg Met Lys Thr Asn Tyr His Asp
1010 1015 1020
Lys Leu Ala Ala Ile Glu Lys Asp Arg Asp Ser Ala Arg Lys Asp
1025 1030 1035
Trp Lys Lys Ile Asn Asn Ile Lys Glu Met Lys Glu Gly Tyr Leu
1040 1045 1050
Ser Gln Val Val His Glu Ile Ala Lys Leu Val Ile Glu Tyr Asn
1055 1060 1065
Ala Ile Val Val Phe Glu Asp Leu Asn Phe Gly Phe Lys Arg Gly
1070 1075 1080
Arg Phe Lys Val Glu Lys Gln Val Tyr Gln Lys Leu Glu Lys Met
1085 1090 1095
Leu Ile Glu Lys Leu Asn Tyr Leu Val Phe Lys Asp Asn Glu Phe
1100 1105 1110
Asp Lys Thr Gly Gly Val Leu Arg Ala Tyr Gln Leu Thr Ala Pro
1115 1120 1125
Phe Glu Thr Phe Lys Lys Met Gly Lys Gln Thr Gly Ile Ile Tyr
1130 1135 1140
Tyr Val Pro Ala Gly Phe Thr Ser Lys Ile Cys Pro Val Thr Gly
1145 1150 1155
Phe Val Asn Gln Leu Tyr Pro Lys Tyr Glu Ser Val Ser Lys Ser
1160 1165 1170
Gln Glu Phe Phe Ser Lys Phe Asp Lys Ile Cys Tyr Asn Leu Asp
1175 1180 1185
Lys Gly Tyr Phe Glu Phe Ser Phe Asp Tyr Lys Asn Phe Gly Asp
1190 1195 1200
Lys Ala Ala Lys Gly Lys Trp Thr Ile Ala Ser Phe Gly Ser Arg
1205 1210 1215
Leu Ile Asn Phe Arg Asn Ser Asp Lys Asn His Asn Trp Asp Thr
1220 1225 1230
Arg Glu Val Tyr Pro Thr Lys Glu Leu Glu Lys Leu Leu Lys Asp
1235 1240 1245
Tyr Ser Ile Glu Tyr Gly His Gly Glu Cys Ile Lys Ala Ala Ile
1250 1255 1260
Cys Gly Glu Ser Asp Lys Lys Phe Phe Ala Lys Leu Thr Ser Val
1265 1270 1275
Leu Asn Thr Ile Leu Gln Met Arg Asn Ser Lys Thr Gly Thr Glu
1280 1285 1290
Leu Asp Tyr Leu Ile Ser Pro Val Ala Asp Val Asn Gly Asn Phe
1295 1300 1305
Phe Asp Ser Arg Gln Ala Pro Lys Asn Met Pro Gln Asp Ala Asp
1310 1315 1320
Ala Asn Gly Ala Tyr His Ile Gly Leu Lys Gly Leu Met Leu Leu
1325 1330 1335
Gly Arg Ile Lys Asn Asn Gln Glu Gly Lys Lys Leu Asn Leu Val
1340 1345 1350
Ile Lys Asn Glu Glu Tyr Phe Glu Phe Val Gln Asn Arg Asn Asn
1355 1360 1365
Pro Lys Lys Lys Arg Lys Val Ser Gly Gly Ser Ser Gly Gly Ser
1370 1375 1380
Pro Lys Lys Lys Arg Lys Val Tyr Pro Tyr Asp Val Pro Asp Tyr
1385 1390 1395
Ala Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Tyr Pro Tyr Asp Val
1400 1405 1410
Pro Asp Tyr Ala
1415
<210> 66
<211> 1287
<212> PRT
<213> Artificial Sequence
<220>
<223> Syntheti
<400> 66
Gly Gly Gly Gly Ser Gly Gly Gly Gly Gly Ser Gly Gly Gly Gly Gly
1 5 10 15
Ser Gly Gly Gly Gly Gly Ser Gly Gly Gly Gly Gly Ser Gly Gly Gly
20 25 30
Gly Gly Ser Gly Met Leu Phe Gln Asp Phe Thr His Leu Tyr Pro Leu
35 40 45
Ser Lys Thr Val Arg Phe Glu Leu Lys Pro Ile Gly Arg Thr Leu Glu
50 55 60
His Ile His Ala Lys Asn Phe Leu Ser Gln Asp Glu Thr Met Ala Asp
65 70 75 80
Met Tyr Gln Lys Val Lys Val Ile Leu Asp Asp Tyr His Arg Asp Phe
85 90 95
Ile Ala Asp Met Met Gly Glu Val Lys Leu Thr Lys Leu Ala Glu Phe
100 105 110
Tyr Asp Val Tyr Leu Lys Phe Arg Lys Asn Pro Lys Asp Asp Gly Leu
115 120 125
Gln Lys Gln Leu Lys Asp Leu Gln Ala Val Leu Arg Lys Glu Ser Val
130 135 140
Lys Pro Ile Gly Ser Gly Gly Lys Tyr Lys Thr Gly Tyr Asp Arg Leu
145 150 155 160
Phe Gly Ala Lys Leu Phe Lys Asp Gly Lys Glu Leu Gly Asp Leu Ala
165 170 175
Lys Phe Val Ile Ala Gln Glu Gly Glu Ser Ser Pro Lys Leu Ala His
180 185 190
Leu Ala His Phe Glu Lys Phe Ser Thr Tyr Phe Thr Gly Phe His Asp
195 200 205
Asn Arg Lys Asn Met Tyr Ser Asp Glu Asp Lys His Thr Ala Ile Ala
210 215 220
Tyr Arg Leu Ile His Glu Asn Leu Pro Arg Phe Ile Asp Asn Leu Gln
225 230 235 240
Ile Leu Thr Thr Ile Lys Gln Lys His Ser Ala Leu Tyr Asp Gln Ile
245 250 255
Ile Asn Glu Leu Thr Ala Ser Gly Leu Asp Val Ser Leu Ala Ser His
260 265 270
Leu Asp Gly Tyr His Lys Leu Leu Thr Gln Glu Gly Ile Thr Ala Tyr
275 280 285
Asn Arg Ile Ile Gly Glu Val Asn Gly Tyr Thr Asn Lys His Asn Gln
290 295 300
Ile Cys His Lys Ser Glu Arg Ile Ala Lys Leu Arg Pro Leu His Lys
305 310 315 320
Gln Ile Leu Ser Asp Gly Met Gly Val Ser Phe Leu Pro Ser Lys Phe
325 330 335
Ala Asp Asp Ser Glu Met Cys Gln Ala Val Asn Glu Phe Tyr Arg His
340 345 350
Tyr Thr Asp Val Phe Ala Lys Val Gln Ser Leu Phe Asp Gly Phe Asp
355 360 365
Asp His Gln Lys Asp Gly Ile Tyr Val Glu His Lys Asn Leu Asn Glu
370 375 380
Leu Ser Lys Gln Ala Phe Gly Asp Phe Ala Leu Leu Gly Arg Val Leu
385 390 395 400
Asp Gly Tyr Tyr Val Asp Val Val Asn Pro Glu Phe Asn Glu Arg Phe
405 410 415
Ala Lys Ala Lys Thr Asp Asn Ala Lys Ala Lys Leu Thr Lys Glu Lys
420 425 430
Asp Lys Phe Ile Lys Gly Val His Ser Leu Ala Ser Leu Glu Gln Ala
435 440 445
Ile Glu His His Thr Ala Arg His Asp Asp Glu Ser Val Gln Ala Gly
450 455 460
Lys Leu Gly Gln Tyr Phe Lys His Gly Leu Ala Gly Val Asp Asn Pro
465 470 475 480
Ile Gln Lys Ile His Asn Asn His Ser Thr Ile Lys Gly Phe Leu Glu
485 490 495
Arg Glu Arg Pro Ala Gly Glu Arg Ala Leu Pro Lys Ile Lys Ser Gly
500 505 510
Lys Asn Pro Glu Met Thr Gln Leu Arg Gln Leu Lys Glu Leu Leu Asp
515 520 525
Asn Ala Leu Asn Val Ala His Phe Ala Lys Leu Leu Thr Thr Lys Thr
530 535 540
Thr Leu Asp Asn Gln Asp Gly Asn Phe Tyr Gly Glu Phe Gly Val Leu
545 550 555 560
Tyr Asp Glu Leu Ala Lys Ile Pro Thr Leu Tyr Asn Lys Val Arg Asp
565 570 575
Tyr Leu Ser Gln Lys Pro Phe Ser Thr Glu Lys Tyr Lys Leu Asn Phe
580 585 590
Gly Asn Pro Thr Leu Leu Asn Gly Trp Asp Leu Asn Lys Glu Lys Asp
595 600 605
Asn Phe Gly Val Ile Leu Gln Lys Asp Gly Cys Tyr Tyr Leu Ala Leu
610 615 620
Leu Asp Lys Ala His Lys Lys Val Phe Asp Asn Ala Pro Asn Thr Gly
625 630 635 640
Lys Asn Val Tyr Gln Lys Met Val Tyr Lys Leu Leu Pro Gly Pro Asn
645 650 655
Lys Met Leu Pro Lys Val Phe Phe Ala Lys Ser Asn Leu Asp Tyr Tyr
660 665 670
Asn Pro Ser Ala Glu Leu Leu Asp Lys Tyr Ala Lys Gly Thr His Lys
675 680 685
Lys Gly Asp Asn Phe Asn Leu Lys Asp Cys His Ala Leu Ile Asp Phe
690 695 700
Phe Lys Ala Gly Ile Asn Lys His Pro Glu Trp Gln His Phe Gly Phe
705 710 715 720
Lys Phe Ser Pro Thr Ser Ser Tyr Arg Asp Leu Ser Asp Phe Tyr Arg
725 730 735
Glu Val Glu Pro Gln Gly Tyr Gln Val Lys Phe Val Asp Ile Asn Ala
740 745 750
Asp Tyr Ile Asp Glu Leu Val Glu Gln Gly Lys Leu Tyr Leu Phe Gln
755 760 765
Ile Tyr Asn Lys Asp Phe Ser Pro Lys Ala His Gly Lys Pro Asn Leu
770 775 780
His Thr Leu Tyr Phe Lys Ala Leu Phe Ser Glu Asp Asn Leu Ala Asp
785 790 795 800
Pro Ile Tyr Lys Leu Asn Gly Glu Ala Gln Ile Phe Tyr Arg Lys Ala
805 810 815
Ser Leu Asp Met Asn Glu Thr Thr Ile His Arg Ala Gly Glu Val Leu
820 825 830
Glu Asn Lys Asn Pro Asp Asn Pro Lys Lys Arg Gln Phe Val Tyr Asp
835 840 845
Ile Ile Lys Asp Lys Arg Tyr Thr Gln Asp Lys Phe Met Leu His Val
850 855 860
Pro Ile Thr Met Asn Phe Gly Val Gln Gly Met Thr Ile Lys Glu Phe
865 870 875 880
Asn Lys Lys Val Asn Gln Ser Ile Gln Gln Tyr Asp Glu Val Asn Val
885 890 895
Ile Gly Ile Asp Arg Gly Glu Arg His Leu Leu Tyr Leu Thr Val Ile
900 905 910
Asn Ser Lys Gly Glu Ile Leu Glu Gln Arg Ser Leu Asn Asp Ile Thr
915 920 925
Thr Ala Ser Ala Asn Gly Thr Gln Val Thr Thr Pro Tyr His Lys Ile
930 935 940
Leu Asp Lys Arg Glu Ile Glu Arg Leu Asn Ala Arg Val Gly Trp Gly
945 950 955 960
Glu Ile Glu Thr Ile Lys Glu Leu Lys Ser Gly Tyr Leu Ser His Val
965 970 975
Val His Gln Ile Asn Gln Leu Met Leu Lys Tyr Asn Ala Ile Val Val
980 985 990
Leu Glu Asp Leu Asn Phe Gly Phe Lys Arg Gly Arg Phe Lys Val Glu
995 1000 1005
Lys Gln Ile Tyr Gln Asn Phe Glu Asn Ala Leu Ile Lys Lys Leu
1010 1015 1020
Asn His Leu Val Leu Lys Asp Lys Ala Asp Asp Glu Ile Gly Ser
1025 1030 1035
Tyr Lys Asn Ala Leu Gln Leu Thr Asn Asn Phe Thr Asp Leu Lys
1040 1045 1050
Ser Ile Gly Lys Gln Thr Gly Phe Leu Phe Tyr Val Pro Ala Trp
1055 1060 1065
Asn Thr Ser Lys Ile Asp Pro Glu Thr Gly Phe Val Asp Leu Leu
1070 1075 1080
Lys Pro Arg Tyr Glu Asn Ile Ala Gln Ser Gln Ala Phe Phe Gly
1085 1090 1095
Lys Phe Asp Lys Ile Cys Tyr Asn Thr Asp Lys Gly Tyr Phe Glu
1100 1105 1110
Phe His Ile Asp Tyr Ala Lys Phe Thr Asp Lys Ala Lys Asn Ser
1115 1120 1125
Arg Gln Lys Trp Ala Ile Cys Ser His Gly Asp Lys Arg Tyr Val
1130 1135 1140
Tyr Asp Lys Thr Ala Asn Gln Asn Lys Gly Ala Ala Lys Gly Ile
1145 1150 1155
Asn Val Asn Asp Glu Leu Lys Ser Leu Phe Ala Arg Tyr His Ile
1160 1165 1170
Asn Asp Lys Gln Pro Asn Leu Val Met Asp Ile Cys Gln Asn Asn
1175 1180 1185
Asp Lys Glu Phe His Lys Ser Leu Met Cys Leu Leu Lys Thr Leu
1190 1195 1200
Leu Ala Leu Arg Tyr Ser Asn Ala Ser Ser Asp Glu Asp Phe Ile
1205 1210 1215
Leu Ser Pro Val Ala Asn Asp Glu Gly Val Phe Phe Asn Ser Ala
1220 1225 1230
Leu Ala Asp Asp Thr Gln Pro Gln Asn Ala Asp Ala Asn Gly Ala
1235 1240 1245
Tyr His Ile Ala Leu Lys Gly Leu Trp Leu Leu Asn Glu Leu Lys
1250 1255 1260
Asn Ser Asp Asp Leu Asn Lys Val Lys Leu Ala Ile Asp Asn Gln
1265 1270 1275
Thr Trp Leu Asn Phe Ala Gln Asn Arg
1280 1285
<210> 67
<211> 1388
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 67
Gly Gly Gly Gly Ser Gly Gly Gly Gly Gly Ser Gly Gly Gly Gly Gly
1 5 10 15
Ser Gly Gly Gly Gly Gly Ser Gly Gly Gly Gly Gly Ser Gly Gly Gly
20 25 30
Gly Gly Ser Gly Met Thr Gln Phe Glu Gly Phe Thr Asn Leu Tyr Gln
35 40 45
Val Ser Lys Thr Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu
50 55 60
Lys His Ile Gln Glu Gln Gly Phe Ile Glu Glu Asp Lys Ala Arg Asn
65 70 75 80
Asp His Tyr Lys Glu Leu Lys Pro Ile Ile Asp Arg Ile Tyr Lys Thr
85 90 95
Tyr Ala Asp Gln Cys Leu Gln Leu Val Gln Leu Asp Trp Glu Asn Leu
100 105 110
Ser Ala Ala Ile Asp Ser Tyr Arg Lys Glu Lys Thr Glu Glu Thr Arg
115 120 125
Asn Ala Leu Ile Glu Glu Gln Ala Thr Tyr Arg Asn Ala Ile His Asp
130 135 140
Tyr Phe Ile Gly Arg Thr Asp Asn Leu Thr Asp Ala Ile Asn Lys Arg
145 150 155 160
His Ala Glu Ile Tyr Lys Gly Leu Phe Lys Ala Glu Leu Phe Asn Gly
165 170 175
Lys Val Leu Lys Gln Leu Gly Thr Val Thr Thr Thr Glu His Glu Asn
180 185 190
Ala Leu Leu Arg Ser Phe Asp Lys Phe Thr Thr Tyr Phe Ser Gly Phe
195 200 205
Tyr Glu Asn Arg Lys Asn Val Phe Ser Ala Glu Asp Ile Ser Thr Ala
210 215 220
Ile Pro His Arg Ile Val Gln Asp Asn Phe Pro Lys Phe Lys Glu Asn
225 230 235 240
Cys His Ile Phe Thr Arg Leu Ile Thr Ala Val Pro Ser Leu Arg Glu
245 250 255
His Phe Glu Asn Val Lys Lys Ala Ile Gly Ile Phe Val Ser Thr Ser
260 265 270
Ile Glu Glu Val Phe Ser Phe Pro Phe Tyr Asn Gln Leu Leu Thr Gln
275 280 285
Thr Gln Ile Asp Leu Tyr Asn Gln Leu Leu Gly Gly Ile Ser Arg Glu
290 295 300
Ala Gly Thr Glu Lys Ile Lys Gly Leu Asn Glu Val Leu Asn Leu Ala
305 310 315 320
Ile Gln Lys Asn Asp Glu Thr Ala His Ile Ile Ala Ser Leu Pro His
325 330 335
Arg Phe Ile Pro Leu Phe Lys Gln Ile Leu Ser Asp Arg Asn Thr Leu
340 345 350
Ser Phe Ile Leu Glu Glu Phe Lys Ser Asp Glu Glu Val Ile Gln Ser
355 360 365
Phe Cys Lys Tyr Lys Thr Leu Leu Arg Asn Glu Asn Val Leu Glu Thr
370 375 380
Ala Glu Ala Leu Phe Asn Glu Leu Asn Ser Ile Asp Leu Thr His Ile
385 390 395 400
Phe Ile Ser His Lys Lys Leu Glu Thr Ile Ser Ser Ala Leu Cys Asp
405 410 415
His Trp Asp Thr Leu Arg Asn Ala Leu Tyr Glu Arg Arg Ile Ser Glu
420 425 430
Leu Thr Gly Lys Ile Thr Lys Ser Ala Lys Glu Lys Val Gln Arg Ser
435 440 445
Leu Lys His Glu Asp Ile Asn Leu Gln Glu Ile Ile Ser Ala Ala Gly
450 455 460
Lys Glu Leu Ser Glu Ala Phe Lys Gln Lys Thr Ser Glu Ile Leu Ser
465 470 475 480
His Ala His Ala Ala Leu Asp Gln Pro Leu Pro Thr Thr Leu Lys Lys
485 490 495
Gln Glu Glu Lys Glu Ile Leu Lys Ser Gln Leu Asp Ser Leu Leu Gly
500 505 510
Leu Tyr His Leu Leu Asp Trp Phe Ala Val Asp Glu Ser Asn Glu Val
515 520 525
Asp Pro Glu Phe Ser Ala Arg Leu Thr Gly Ile Lys Leu Glu Met Glu
530 535 540
Pro Ser Leu Ser Phe Tyr Asn Lys Ala Arg Asn Tyr Ala Thr Lys Lys
545 550 555 560
Pro Tyr Ser Val Glu Lys Phe Lys Leu Asn Phe Gln Met Pro Thr Leu
565 570 575
Ala Ser Gly Trp Asp Val Asn Lys Glu Lys Asn Asn Gly Ala Ile Leu
580 585 590
Phe Val Lys Asn Gly Leu Tyr Tyr Leu Gly Ile Met Pro Lys Gln Lys
595 600 605
Gly Arg Tyr Lys Ala Leu Ser Phe Glu Pro Thr Glu Lys Thr Ser Glu
610 615 620
Gly Phe Asp Lys Met Tyr Tyr Asp Tyr Phe Pro Asp Ala Ala Lys Met
625 630 635 640
Ile Pro Lys Cys Ser Thr Gln Leu Lys Ala Val Thr Ala His Phe Gln
645 650 655
Thr His Thr Thr Pro Ile Leu Leu Ser Asn Asn Phe Ile Glu Pro Leu
660 665 670
Glu Ile Thr Lys Glu Ile Tyr Asp Leu Asn Asn Pro Glu Lys Glu Pro
675 680 685
Lys Lys Phe Gln Thr Ala Tyr Ala Lys Lys Thr Gly Asp Gln Lys Gly
690 695 700
Tyr Arg Glu Ala Leu Cys Lys Trp Ile Asp Phe Thr Arg Asp Phe Leu
705 710 715 720
Ser Lys Tyr Thr Lys Thr Thr Ser Ile Asp Leu Ser Ser Leu Arg Pro
725 730 735
Ser Ser Gln Tyr Lys Asp Leu Gly Glu Tyr Tyr Ala Glu Leu Asn Pro
740 745 750
Leu Leu Tyr His Ile Ser Phe Gln Arg Ile Ala Glu Lys Glu Ile Met
755 760 765
Asp Ala Val Glu Thr Gly Lys Leu Tyr Leu Phe Gln Ile Tyr Asn Lys
770 775 780
Asp Phe Ala Lys Gly His His Gly Lys Pro Asn Leu His Thr Leu Tyr
785 790 795 800
Trp Thr Gly Leu Phe Ser Pro Glu Asn Leu Ala Lys Thr Ser Ile Lys
805 810 815
Leu Asn Gly Gln Ala Glu Leu Phe Tyr Arg Pro Lys Ser Arg Met Lys
820 825 830
Arg Met Ala His Arg Leu Gly Glu Lys Met Leu Asn Lys Lys Leu Lys
835 840 845
Asp Gln Lys Thr Pro Ile Pro Asp Thr Leu Tyr Gln Glu Leu Tyr Asp
850 855 860
Tyr Val Asn His Arg Leu Ser His Asp Leu Ser Asp Glu Ala Arg Ala
865 870 875 880
Leu Leu Pro Asn Val Ile Thr Lys Glu Val Ser His Glu Ile Ile Lys
885 890 895
Asp Arg Arg Phe Thr Ser Asp Lys Phe Phe Phe His Val Pro Ile Thr
900 905 910
Leu Asn Tyr Gln Ala Ala Asn Ser Pro Ser Lys Phe Asn Gln Arg Val
915 920 925
Asn Ala Tyr Leu Lys Glu His Pro Glu Thr Pro Ile Ile Gly Ile Asp
930 935 940
Arg Gly Glu Arg Asn Leu Ile Tyr Ile Thr Val Ile Asp Ser Thr Gly
945 950 955 960
Lys Ile Leu Glu Gln Arg Ser Leu Asn Thr Ile Gln Gln Phe Asp Tyr
965 970 975
Gln Lys Lys Leu Asp Asn Arg Glu Lys Glu Arg Val Ala Ala Arg Gln
980 985 990
Ala Trp Ser Val Val Gly Thr Ile Lys Asp Leu Lys Gln Gly Tyr Leu
995 1000 1005
Ser Gln Val Ile His Glu Ile Val Asp Leu Met Ile His Tyr Gln
1010 1015 1020
Ala Val Val Val Leu Glu Asn Leu Asn Phe Gly Phe Lys Ser Lys
1025 1030 1035
Arg Thr Gly Ile Ala Glu Lys Ala Val Tyr Gln Gln Phe Glu Lys
1040 1045 1050
Met Leu Ile Asp Lys Leu Asn Cys Leu Val Leu Lys Asp Tyr Pro
1055 1060 1065
Ala Glu Lys Val Gly Gly Val Leu Asn Pro Tyr Gln Leu Thr Asp
1070 1075 1080
Gln Phe Thr Ser Phe Ala Lys Met Gly Thr Gln Ser Gly Phe Leu
1085 1090 1095
Phe Tyr Val Pro Ala Pro Tyr Thr Ser Lys Ile Asp Pro Leu Thr
1100 1105 1110
Gly Phe Val Asp Pro Phe Val Trp Lys Thr Ile Lys Asn His Glu
1115 1120 1125
Ser Arg Lys His Phe Leu Glu Gly Phe Asp Phe Leu His Tyr Asp
1130 1135 1140
Val Lys Thr Gly Asp Phe Ile Leu His Phe Lys Met Asn Arg Asn
1145 1150 1155
Leu Ser Phe Gln Arg Gly Leu Pro Gly Phe Met Pro Ala Trp Asp
1160 1165 1170
Ile Val Phe Glu Lys Asn Glu Thr Gln Phe Asp Ala Lys Gly Thr
1175 1180 1185
Pro Phe Ile Ala Gly Lys Arg Ile Val Pro Val Ile Glu Asn His
1190 1195 1200
Arg Phe Thr Gly Arg Tyr Arg Asp Leu Tyr Pro Ala Asn Glu Leu
1205 1210 1215
Ile Ala Leu Leu Glu Glu Lys Gly Ile Val Phe Arg Asp Gly Ser
1220 1225 1230
Asn Ile Leu Pro Lys Leu Leu Glu Asn Asp Asp Ser His Ala Ile
1235 1240 1245
Asp Thr Met Val Ala Leu Ile Arg Ser Val Leu Gln Met Arg Asn
1250 1255 1260
Ser Asn Ala Ala Thr Gly Glu Asp Tyr Ile Asn Ser Pro Val Arg
1265 1270 1275
Asp Leu Asn Gly Val Cys Phe Asp Ser Arg Phe Gln Asn Pro Glu
1280 1285 1290
Trp Pro Met Asp Ala Asp Ala Asn Gly Ala Tyr His Ile Ala Leu
1295 1300 1305
Lys Gly Gln Leu Leu Leu Asn His Leu Lys Glu Ser Lys Asp Leu
1310 1315 1320
Lys Leu Gln Asn Gly Ile Ser Asn Gln Asp Trp Leu Ala Tyr Ile
1325 1330 1335
Gln Glu Leu Arg Asn Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly
1340 1345 1350
Gln Ala Lys Lys Lys Lys Gly Ser Tyr Pro Tyr Asp Val Pro Asp
1355 1360 1365
Tyr Ala Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Tyr Pro Tyr Asp
1370 1375 1380
Val Pro Asp Tyr Ala
1385
<210> 68
<211> 1352
<212> PRT
<213> Artificial Sequence
<220>
<223> Syntheti
<400> 68
Gly Gly Gly Gly Ser Gly Gly Gly Gly Gly Ser Gly Gly Gly Gly Gly
1 5 10 15
Ser Gly Gly Gly Gly Gly Ser Gly Gly Gly Gly Gly Ser Gly Gly Gly
20 25 30
Gly Gly Ser Gly Met Thr Gln Phe Glu Gly Phe Thr Asn Leu Tyr Gln
35 40 45
Val Ser Lys Thr Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu
50 55 60
Lys His Ile Gln Glu Gln Gly Phe Ile Glu Glu Asp Lys Ala Arg Asn
65 70 75 80
Asp His Tyr Lys Glu Leu Lys Pro Ile Ile Asp Arg Ile Tyr Lys Thr
85 90 95
Tyr Ala Asp Gln Cys Leu Gln Leu Val Gln Leu Asp Trp Glu Asn Leu
100 105 110
Ser Ala Ala Ile Asp Ser Tyr Arg Lys Glu Lys Thr Glu Glu Thr Arg
115 120 125
Asn Ala Leu Ile Glu Glu Gln Ala Thr Tyr Arg Asn Ala Ile His Asp
130 135 140
Tyr Phe Ile Gly Arg Thr Asp Asn Leu Thr Asp Ala Ile Asn Lys Arg
145 150 155 160
His Ala Glu Ile Tyr Lys Gly Leu Phe Lys Ala Glu Leu Phe Asn Gly
165 170 175
Lys Val Leu Lys Gln Leu Gly Thr Val Thr Thr Thr Glu His Glu Asn
180 185 190
Ala Leu Leu Arg Ser Phe Asp Lys Phe Thr Thr Tyr Phe Ser Gly Phe
195 200 205
Tyr Glu Asn Arg Lys Asn Val Phe Ser Ala Glu Asp Ile Ser Thr Ala
210 215 220
Ile Pro His Arg Ile Val Gln Asp Asn Phe Pro Lys Phe Lys Glu Asn
225 230 235 240
Cys His Ile Phe Thr Arg Leu Ile Thr Ala Val Pro Ser Leu Arg Glu
245 250 255
His Phe Glu Asn Val Lys Lys Ala Ile Gly Ile Phe Val Ser Thr Ser
260 265 270
Ile Glu Glu Val Phe Ser Phe Pro Phe Tyr Asn Gln Leu Leu Thr Gln
275 280 285
Thr Gln Ile Asp Leu Tyr Asn Gln Leu Leu Gly Gly Ile Ser Arg Glu
290 295 300
Ala Gly Thr Glu Lys Ile Lys Gly Leu Asn Glu Val Leu Asn Leu Ala
305 310 315 320
Ile Gln Lys Asn Asp Glu Thr Ala His Ile Ile Ala Ser Leu Pro His
325 330 335
Arg Phe Ile Pro Leu Phe Lys Gln Ile Leu Ser Asp Arg Asn Thr Leu
340 345 350
Ser Phe Ile Leu Glu Glu Phe Lys Ser Asp Glu Glu Val Ile Gln Ser
355 360 365
Phe Cys Lys Tyr Lys Thr Leu Leu Arg Asn Glu Asn Val Leu Glu Thr
370 375 380
Ala Glu Ala Leu Phe Asn Glu Leu Asn Ser Ile Asp Leu Thr His Ile
385 390 395 400
Phe Ile Ser His Lys Lys Leu Glu Thr Ile Ser Ser Ala Leu Cys Asp
405 410 415
His Trp Asp Thr Leu Arg Asn Ala Leu Tyr Glu Arg Arg Ile Ser Glu
420 425 430
Leu Thr Gly Lys Ile Thr Lys Ser Ala Lys Glu Lys Val Gln Arg Ser
435 440 445
Leu Lys His Glu Asp Ile Asn Leu Gln Glu Ile Ile Ser Ala Ala Gly
450 455 460
Lys Glu Leu Ser Glu Ala Phe Lys Gln Lys Thr Ser Glu Ile Leu Ser
465 470 475 480
His Ala His Ala Ala Leu Asp Gln Pro Leu Pro Thr Thr Leu Lys Lys
485 490 495
Gln Glu Glu Lys Glu Ile Leu Lys Ser Gln Leu Asp Ser Leu Leu Gly
500 505 510
Leu Tyr His Leu Leu Asp Trp Phe Ala Val Asp Glu Ser Asn Glu Val
515 520 525
Asp Pro Glu Phe Ser Ala Arg Leu Thr Gly Ile Lys Leu Glu Met Glu
530 535 540
Pro Ser Leu Ser Phe Tyr Asn Lys Ala Arg Asn Tyr Ala Thr Lys Lys
545 550 555 560
Pro Tyr Ser Val Glu Lys Phe Lys Leu Asn Phe Gln Met Pro Thr Leu
565 570 575
Ala Ser Gly Trp Asp Val Asn Lys Glu Lys Asn Asn Gly Ala Ile Leu
580 585 590
Phe Val Lys Asn Gly Leu Tyr Tyr Leu Gly Ile Met Pro Lys Gln Lys
595 600 605
Gly Arg Tyr Lys Ala Leu Ser Phe Glu Pro Thr Glu Lys Thr Ser Glu
610 615 620
Gly Phe Asp Lys Met Tyr Tyr Asp Tyr Phe Pro Asp Ala Ala Lys Met
625 630 635 640
Ile Pro Lys Cys Ser Thr Gln Leu Lys Ala Val Thr Ala His Phe Gln
645 650 655
Thr His Thr Thr Pro Ile Leu Leu Ser Asn Asn Phe Ile Glu Pro Leu
660 665 670
Glu Ile Thr Lys Glu Ile Tyr Asp Leu Asn Asn Pro Glu Lys Glu Pro
675 680 685
Lys Lys Phe Gln Thr Ala Tyr Ala Lys Lys Thr Gly Asp Gln Lys Gly
690 695 700
Tyr Arg Glu Ala Leu Cys Lys Trp Ile Asp Phe Thr Arg Asp Phe Leu
705 710 715 720
Ser Lys Tyr Thr Lys Thr Thr Ser Ile Asp Leu Ser Ser Leu Arg Pro
725 730 735
Ser Ser Gln Tyr Lys Asp Leu Gly Glu Tyr Tyr Ala Glu Leu Asn Pro
740 745 750
Leu Leu Tyr His Ile Ser Phe Gln Arg Ile Ala Glu Lys Glu Ile Met
755 760 765
Asp Ala Val Glu Thr Gly Lys Leu Tyr Leu Phe Gln Ile Tyr Asn Lys
770 775 780
Asp Phe Ala Lys Gly His His Gly Lys Pro Asn Leu His Thr Leu Tyr
785 790 795 800
Trp Thr Gly Leu Phe Ser Pro Glu Asn Leu Ala Lys Thr Ser Ile Lys
805 810 815
Leu Asn Gly Gln Ala Glu Leu Phe Tyr Arg Pro Lys Ser Arg Met Lys
820 825 830
Arg Met Ala His Arg Leu Gly Glu Lys Met Leu Asn Lys Lys Leu Lys
835 840 845
Asp Gln Lys Thr Pro Ile Pro Asp Thr Leu Tyr Gln Glu Leu Tyr Asp
850 855 860
Tyr Val Asn His Arg Leu Ser His Asp Leu Ser Asp Glu Ala Arg Ala
865 870 875 880
Leu Leu Pro Asn Val Ile Thr Lys Glu Val Ser His Glu Ile Ile Lys
885 890 895
Asp Arg Arg Phe Thr Ser Asp Lys Phe Phe Phe His Val Pro Ile Thr
900 905 910
Leu Asn Tyr Gln Ala Ala Asn Ser Pro Ser Lys Phe Asn Gln Arg Val
915 920 925
Asn Ala Tyr Leu Lys Glu His Pro Glu Thr Pro Ile Ile Gly Ile Ala
930 935 940
Arg Gly Glu Arg Asn Leu Ile Tyr Ile Thr Val Ile Asp Ser Thr Gly
945 950 955 960
Lys Ile Leu Glu Gln Arg Ser Leu Asn Thr Ile Gln Gln Phe Asp Tyr
965 970 975
Gln Lys Lys Leu Asp Asn Arg Glu Lys Glu Arg Val Ala Ala Arg Gln
980 985 990
Ala Trp Ser Val Val Gly Thr Ile Lys Asp Leu Lys Gln Gly Tyr Leu
995 1000 1005
Ser Gln Val Ile His Glu Ile Val Asp Leu Met Ile His Tyr Gln
1010 1015 1020
Ala Val Val Val Leu Ala Asn Leu Asn Phe Gly Phe Lys Ser Lys
1025 1030 1035
Arg Thr Gly Ile Ala Glu Lys Ala Val Tyr Gln Gln Phe Glu Lys
1040 1045 1050
Met Leu Ile Asp Lys Leu Asn Cys Leu Val Leu Lys Asp Tyr Pro
1055 1060 1065
Ala Glu Lys Val Gly Gly Val Leu Asn Pro Tyr Gln Leu Thr Asp
1070 1075 1080
Gln Phe Thr Ser Phe Ala Lys Met Gly Thr Gln Ser Gly Phe Leu
1085 1090 1095
Phe Tyr Val Pro Ala Pro Tyr Thr Ser Lys Ile Asp Pro Leu Thr
1100 1105 1110
Gly Phe Val Asp Pro Phe Val Trp Lys Thr Ile Lys Asn His Glu
1115 1120 1125
Ser Arg Lys His Phe Leu Glu Gly Phe Asp Phe Leu His Tyr Asp
1130 1135 1140
Val Lys Thr Gly Asp Phe Ile Leu His Phe Lys Met Asn Arg Asn
1145 1150 1155
Leu Ser Phe Gln Arg Gly Leu Pro Gly Phe Met Pro Ala Trp Asp
1160 1165 1170
Ile Val Phe Glu Lys Asn Glu Thr Gln Phe Asp Ala Lys Gly Thr
1175 1180 1185
Pro Phe Ile Ala Gly Lys Arg Ile Val Pro Val Ile Glu Asn His
1190 1195 1200
Arg Phe Thr Gly Arg Tyr Arg Asp Leu Tyr Pro Ala Asn Glu Leu
1205 1210 1215
Ile Ala Leu Leu Glu Glu Lys Gly Ile Val Phe Arg Asp Gly Ser
1220 1225 1230
Asn Ile Leu Pro Lys Leu Leu Glu Asn Asp Asp Ser His Ala Ile
1235 1240 1245
Asp Thr Met Val Ala Leu Ile Arg Ser Val Leu Gln Met Arg Asn
1250 1255 1260
Ser Asn Ala Ala Thr Gly Glu Ala Tyr Ile Asn Ser Pro Val Arg
1265 1270 1275
Asp Leu Asn Gly Val Cys Phe Asp Ser Arg Phe Gln Asn Pro Glu
1280 1285 1290
Trp Pro Met Asp Ala Asp Ala Asn Gly Ala Tyr His Ile Ala Leu
1295 1300 1305
Lys Gly Gln Leu Leu Leu Asn His Leu Lys Glu Ser Lys Asp Leu
1310 1315 1320
Lys Leu Gln Asn Gly Ile Ser Asn Gln Asp Trp Leu Ala Tyr Ile
1325 1330 1335
Gln Glu Leu Arg Asn Gly Ser Pro Lys Lys Lys Arg Lys Val
1340 1345 1350
<210> 69
<211> 1423
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 69
Gly Gly Gly Gly Ser Gly Gly Gly Gly Gly Ser Gly Gly Gly Gly Gly
1 5 10 15
Ser Gly Gly Gly Gly Gly Ser Gly Gly Gly Gly Gly Ser Gly Gly Gly
20 25 30
Gly Gly Ser Gly Met Pro Lys Lys Lys Arg Lys Val Gly Gly Gly Gly
35 40 45
Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
50 55 60
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Met Ser Ile Tyr Gln Glu
65 70 75 80
Phe Val Asn Lys Tyr Ser Leu Ser Lys Thr Leu Arg Phe Glu Leu Ile
85 90 95
Pro Gln Gly Lys Thr Leu Glu Asn Ile Lys Ala Arg Gly Leu Ile Leu
100 105 110
Asp Asp Glu Lys Arg Ala Lys Asp Tyr Lys Lys Ala Lys Gln Ile Ile
115 120 125
Asp Lys Tyr His Gln Phe Phe Ile Glu Glu Ile Leu Ser Ser Val Cys
130 135 140
Ile Ser Glu Asp Leu Leu Gln Asn Tyr Ser Asp Val Tyr Phe Lys Leu
145 150 155 160
Lys Lys Ser Asp Asp Asp Asn Leu Gln Lys Asp Phe Lys Ser Ala Lys
165 170 175
Asp Thr Ile Lys Lys Gln Ile Ser Glu Tyr Ile Lys Asp Ser Glu Lys
180 185 190
Phe Lys Asn Leu Phe Asn Gln Asn Leu Ile Asp Ala Lys Lys Gly Gln
195 200 205
Glu Ser Asp Leu Ile Leu Trp Leu Lys Gln Ser Lys Asp Asn Gly Ile
210 215 220
Glu Leu Phe Lys Ala Asn Ser Asp Ile Thr Asp Ile Asp Glu Ala Leu
225 230 235 240
Glu Ile Ile Lys Ser Phe Lys Gly Trp Thr Thr Tyr Phe Lys Gly Phe
245 250 255
His Glu Asn Arg Lys Asn Val Tyr Ser Ser Asn Asp Ile Pro Thr Ser
260 265 270
Ile Ile Tyr Arg Ile Val Asp Asp Asn Leu Pro Lys Phe Leu Glu Asn
275 280 285
Lys Ala Lys Tyr Glu Ser Leu Lys Asp Lys Ala Pro Glu Ala Ile Asn
290 295 300
Tyr Glu Gln Ile Lys Lys Asp Leu Ala Glu Glu Leu Thr Phe Asp Ile
305 310 315 320
Asp Tyr Lys Thr Ser Glu Val Asn Gln Arg Val Phe Ser Leu Asp Glu
325 330 335
Val Phe Glu Ile Ala Asn Phe Asn Asn Tyr Leu Asn Gln Ser Gly Ile
340 345 350
Thr Lys Phe Asn Thr Ile Ile Gly Gly Lys Phe Val Asn Gly Glu Asn
355 360 365
Thr Lys Arg Lys Gly Ile Asn Glu Tyr Ile Asn Leu Tyr Ser Gln Gln
370 375 380
Ile Asn Asp Lys Thr Leu Lys Lys Tyr Lys Met Ser Val Leu Phe Lys
385 390 395 400
Gln Ile Leu Ser Asp Thr Glu Ser Lys Ser Phe Val Ile Asp Lys Leu
405 410 415
Glu Asp Asp Ser Asp Val Val Thr Thr Met Gln Ser Phe Tyr Glu Gln
420 425 430
Ile Ala Ala Phe Lys Thr Val Glu Glu Lys Ser Ile Lys Glu Thr Leu
435 440 445
Ser Leu Leu Phe Asp Asp Leu Lys Ala Gln Lys Leu Asp Leu Ser Lys
450 455 460
Ile Tyr Phe Lys Asn Asp Lys Ser Leu Thr Asp Leu Ser Gln Gln Val
465 470 475 480
Phe Asp Asp Tyr Ser Val Ile Gly Thr Ala Val Leu Glu Tyr Ile Thr
485 490 495
Gln Gln Ile Ala Pro Lys Asn Leu Asp Asn Pro Ser Lys Lys Glu Gln
500 505 510
Glu Leu Ile Ala Lys Lys Thr Glu Lys Ala Lys Tyr Leu Ser Leu Glu
515 520 525
Thr Ile Lys Leu Ala Leu Glu Glu Phe Asn Lys His Arg Asp Ile Asp
530 535 540
Lys Gln Cys Arg Phe Glu Glu Ile Leu Ala Asn Phe Ala Ala Ile Pro
545 550 555 560
Met Ile Phe Asp Glu Ile Ala Gln Asn Lys Asp Asn Leu Ala Gln Ile
565 570 575
Ser Ile Lys Tyr Gln Asn Gln Gly Lys Lys Asp Leu Leu Gln Ala Ser
580 585 590
Ala Glu Asp Asp Val Lys Ala Ile Lys Asp Leu Leu Asp Gln Thr Asn
595 600 605
Asn Leu Leu His Lys Leu Lys Ile Phe His Ile Ser Gln Ser Glu Asp
610 615 620
Lys Ala Asn Ile Leu Asp Lys Asp Glu His Phe Tyr Leu Val Phe Glu
625 630 635 640
Glu Cys Tyr Phe Glu Leu Ala Asn Ile Val Pro Leu Tyr Asn Lys Ile
645 650 655
Arg Asn Tyr Ile Thr Gln Lys Pro Tyr Ser Asp Glu Lys Phe Lys Leu
660 665 670
Asn Phe Glu Asn Ser Thr Leu Ala Asn Gly Trp Asp Lys Asn Lys Glu
675 680 685
Pro Asp Asn Thr Ala Ile Leu Phe Ile Lys Asp Asp Lys Tyr Tyr Leu
690 695 700
Gly Val Met Asn Lys Lys Asn Asn Lys Ile Phe Asp Asp Lys Ala Ile
705 710 715 720
Lys Glu Asn Lys Gly Glu Gly Tyr Lys Lys Ile Val Tyr Lys Leu Leu
725 730 735
Pro Gly Ala Asn Lys Met Leu Pro Lys Val Phe Phe Ser Ala Lys Ser
740 745 750
Ile Lys Phe Tyr Asn Pro Ser Glu Asp Ile Leu Arg Ile Arg Asn His
755 760 765
Ser Thr His Thr Lys Asn Gly Ser Pro Gln Lys Gly Tyr Glu Lys Phe
770 775 780
Glu Phe Asn Ile Glu Asp Cys Arg Lys Phe Ile Asp Phe Tyr Lys Gln
785 790 795 800
Ser Ile Ser Lys His Pro Glu Trp Lys Asp Phe Gly Phe Arg Phe Ser
805 810 815
Asp Thr Gln Arg Tyr Asn Ser Ile Asp Glu Phe Tyr Arg Glu Val Glu
820 825 830
Asn Gln Gly Tyr Lys Leu Thr Phe Glu Asn Ile Ser Glu Ser Tyr Ile
835 840 845
Asp Ser Val Val Asn Gln Gly Lys Leu Tyr Leu Phe Gln Ile Tyr Asn
850 855 860
Lys Asp Phe Ser Ala Tyr Ser Lys Gly Arg Pro Asn Leu His Thr Leu
865 870 875 880
Tyr Trp Lys Ala Leu Phe Asp Glu Arg Asn Leu Gln Asp Val Val Tyr
885 890 895
Lys Leu Asn Gly Glu Ala Glu Leu Phe Tyr Arg Lys Gln Ser Ile Pro
900 905 910
Lys Lys Ile Thr His Pro Ala Lys Glu Ala Ile Ala Asn Lys Asn Lys
915 920 925
Asp Asn Pro Lys Lys Glu Ser Val Phe Glu Tyr Asp Leu Ile Lys Asp
930 935 940
Lys Arg Phe Thr Glu Asp Lys Phe Phe Phe His Cys Pro Ile Thr Ile
945 950 955 960
Asn Phe Lys Ser Ser Gly Ala Asn Lys Phe Asn Asp Glu Ile Asn Leu
965 970 975
Leu Leu Lys Glu Lys Ala Asn Asp Val His Ile Leu Ser Ile Asp Arg
980 985 990
Gly Glu Arg His Leu Ala Tyr Tyr Thr Leu Val Asp Gly Lys Gly Asn
995 1000 1005
Ile Ile Lys Gln Asp Thr Phe Asn Ile Ile Gly Asn Asp Arg Met
1010 1015 1020
Lys Thr Asn Tyr His Asp Lys Leu Ala Ala Ile Glu Lys Asp Arg
1025 1030 1035
Asp Ser Ala Arg Lys Asp Trp Lys Lys Ile Asn Asn Ile Lys Glu
1040 1045 1050
Met Lys Glu Gly Tyr Leu Ser Gln Val Val His Glu Ile Ala Lys
1055 1060 1065
Leu Val Ile Glu Tyr Asn Ala Ile Val Val Phe Glu Asp Leu Asn
1070 1075 1080
Phe Gly Phe Lys Arg Gly Arg Phe Lys Val Glu Lys Gln Val Tyr
1085 1090 1095
Gln Lys Leu Glu Lys Met Leu Ile Glu Lys Leu Asn Tyr Leu Val
1100 1105 1110
Phe Lys Asp Asn Glu Phe Asp Lys Thr Gly Gly Val Leu Arg Ala
1115 1120 1125
Tyr Gln Leu Thr Ala Pro Phe Glu Thr Phe Lys Lys Met Gly Lys
1130 1135 1140
Gln Thr Gly Ile Ile Tyr Tyr Val Pro Ala Gly Phe Thr Ser Lys
1145 1150 1155
Ile Cys Pro Val Thr Gly Phe Val Asn Gln Leu Tyr Pro Lys Tyr
1160 1165 1170
Glu Ser Val Ser Lys Ser Gln Glu Phe Phe Ser Lys Phe Asp Lys
1175 1180 1185
Ile Cys Tyr Asn Leu Asp Lys Gly Tyr Phe Glu Phe Ser Phe Asp
1190 1195 1200
Tyr Lys Asn Phe Gly Asp Lys Ala Ala Lys Gly Lys Trp Thr Ile
1205 1210 1215
Ala Ser Phe Gly Ser Arg Leu Ile Asn Phe Arg Asn Ser Asp Lys
1220 1225 1230
Asn His Asn Trp Asp Thr Arg Glu Val Tyr Pro Thr Lys Glu Leu
1235 1240 1245
Glu Lys Leu Leu Lys Asp Tyr Ser Ile Glu Tyr Gly His Gly Glu
1250 1255 1260
Cys Ile Lys Ala Ala Ile Cys Gly Glu Ser Asp Lys Lys Phe Phe
1265 1270 1275
Ala Lys Leu Thr Ser Val Leu Asn Thr Ile Leu Gln Met Arg Asn
1280 1285 1290
Ser Lys Thr Gly Thr Glu Leu Asp Tyr Leu Ile Ser Pro Val Ala
1295 1300 1305
Asp Val Asn Gly Asn Phe Phe Asp Ser Arg Gln Ala Pro Lys Asn
1310 1315 1320
Met Pro Gln Asp Ala Asp Ala Asn Gly Ala Tyr His Ile Gly Leu
1325 1330 1335
Lys Gly Leu Met Leu Leu Gly Arg Ile Lys Asn Asn Gln Glu Gly
1340 1345 1350
Lys Lys Leu Asn Leu Val Ile Lys Asn Glu Glu Tyr Phe Glu Phe
1355 1360 1365
Val Gln Asn Arg Asn Asn Pro Lys Lys Lys Arg Lys Val Ser Gly
1370 1375 1380
Gly Ser Ser Gly Gly Ser Pro Lys Lys Lys Arg Lys Val Tyr Pro
1385 1390 1395
Tyr Asp Val Pro Asp Tyr Ala Tyr Pro Tyr Asp Val Pro Asp Tyr
1400 1405 1410
Ala Tyr Pro Tyr Asp Val Pro Asp Tyr Ala
1415 1420
<210> 70
<211> 16
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 70
Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser
1 5 10 15
<210> 71
<211> 23
<212> DNA
<213> Zea mays
<400> 71
attgatagag cacatgagct tgg 23
<210> 72
<211> 23
<212> DNA
<213> Zea mays
<400> 72
gtcacagatc acaaacttca aat 23
<210> 73
<211> 23
<212> DNA
<213> Glycine max
<400> 73
gaacccttga gagaggcttc ttc 23
<210> 74
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> crRNA
<400> 74
taatttctac taagtgtaga t 21
<210> 75
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> crRNA
<400> 75
taatttctac tgttgtagat 20
<210> 76
<211> 5358
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 76
atgtccgagg tggagttcag ccacgagtac tggatgaggc acgctctcac cctggctaag 60
agggcgtggg acgagaggga ggtgccggtg ggcgccgtgc tcgtccacaa caaccgcgtg 120
atcggcgagg gctggaacag gcccatcggc aggcacgacc caaccgctca cgccgagatc 180
atggctctca ggcagggcgg cctggtcatg cagaactaca ggctgatcga cgcgaccctc 240
tacgtgaccc tcgagccctg cgtcatgtgc gcgggcgcca tgatccactc caggatcggc 300
agggtggtct tcggcgctag ggacgccaag acgggcgctg cgggcagcct catggacgtg 360
ctgcaccacc ccggcatgaa ccaccgcgtc gagatcaccg agggcatcct cgcggacgag 420
tgcgctgcgc tcctgtccga cttcttcagg atgcgcaggc aggagatcaa ggcccagaag 480
aaggcgcagt ccagcaccga ctccggcggc tccagcggcg gctccagcgg cagcgagacc 540
ccgggcacgt ccgagagcgc gacgcccgag agcagcggcg gctccagcgg cggctcctcg 600
gaggtcgagt tcagccatga gtactggatg aggcatgccc tgactctcgc taagagggcg 660
cgggatgagc gcgaggtgcc ggtgggggcc gtgctcgtcc tgaacaaccg cgtgatcggg 720
gagggctgga accgggctat cggcctccac gacccaacgg cccatgccga gatcatggcc 780
ctgaggcagg gcggcctggt catgcaaaac tacaggctca tcgacgccac cctctacgtg 840
accttcgagc catgcgtgat gtgcgcgggg gccatgatcc actcgaggat tgggagggtg 900
gtcttcggcg tgcgcaacgc taagacgggg gccgccggca gcctcatgga cgtcctgcac 960
tacccgggca tgaaccacag ggtggagatt accgagggca tcctggccga tgagtgcgcc 1020
gcgctcctgt gctacttctt ccgcatgccc aggcaggtct tcaacgcgca gaagaaggcc 1080
cagagctcca ctgattccgg cggctccagc ggcggctcca gtggcagcga gactcctggc 1140
acgtccgaga gcgccacgcc cgagtctagc ggcggctcca gcggcggctc cgacaagaag 1200
tacagcatcg gcctggcaat cggcaccaac agcgtgggct gggccgtgat caccgacgag 1260
tacaaggtgc cgagcaagaa gttcaaggtg ctgggcaaca ccgacaggca cagcatcaag 1320
aagaacctga tcggcgccct gctgttcgac agcggcgaga ccgccgaggc caccaggctg 1380
aagaggaccg ccaggaggag gtacaccagg aggaagaaca ggatctgcta cctgcaggag 1440
atcttcagca acgagatggc caaggtggac gacagcttct tccacaggct ggaggagagc 1500
ttcctggtgg aggaggacaa gaagcacgag aggcacccga tcttcggcaa catcgtggac 1560
gaggtggcct accacgagaa gtacccgacc atctaccacc tgaggaagaa gctggtggac 1620
agcaccgaca aggccgacct gaggctgatc tacctggccc tggcccacat gatcaagttc 1680
aggggccact tcctgatcga gggcgacctg aacccggaca acagcgacgt ggacaagctg 1740
ttcatccagc tggtgcagac ctacaaccag ctgttcgagg agaacccgat caacgccagc 1800
ggcgtggacg ccaaggccat cctgagcgcc aggctgagca agagcaggag gctggagaac 1860
ctgatcgccc agctgccggg cgagaagaag aacggcctgt tcggcaacct gatcgccctg 1920
agcctgggcc tgaccccgaa cttcaagagc aacttcgacc tggccgagga cgccaagctg 1980
cagctgagca aggacaccta cgacgacgac ctggacaacc tgctggccca gatcggcgac 2040
cagtacgccg acctgttcct ggccgccaag aacctgagcg acgccatcct gctgagcgac 2100
atcctgaggg tgaacaccga gatcaccaag gccccgctga gcgccagcat gatcaagagg 2160
tacgacgagc accaccagga cctgaccctg ctgaaggccc tggtgaggca gcagctgccg 2220
gagaagtaca aggagatctt cttcgaccag agcaagaacg gctacgccgg ctacatcgac 2280
ggcggcgcca gccaggagga gttctacaag ttcatcaagc cgatcctgga gaagatggac 2340
ggcaccgagg agctgctggt gaagctgaac agggaggacc tgctgaggaa gcagaggacc 2400
ttcgacaacg gcagcatccc gcaccagatc cacctgggcg agctgcacgc catcctgagg 2460
aggcaggagg acttctaccc gttcctgaag gacaacaggg agaagatcga gaagatcctg 2520
accttccgca tcccgtacta cgtgggcccg ctggccaggg gcaacagcag gttcgcctgg 2580
atgaccagga agagcgagga gaccatcacc ccgtggaact tcgaggaggt ggtggacaag 2640
ggcgccagcg cccagagctt catcgagagg atgaccaact tcgacaagaa cctgccgaac 2700
gagaaggtgc tgccgaagca cagcctgctg tacgagtact tcaccgtgta caacgagctg 2760
accaaggtga agtacgtgac cgagggcatg aggaagccgg ccttcctgag cggcgagcag 2820
aagaaggcca tcgtggacct gctgttcaag accaacagga aggtgaccgt gaagcagctg 2880
aaggaggact acttcaagaa gatcgagtgc ttcgacagcg tggagatcag cggcgtggag 2940
gacaggttca acgccagcct gggcacctac cacgacctgc tgaagatcat caaggacaag 3000
gacttcctgg acaacgagga gaacgaggac atcctggagg acatcgtgct gaccctgacc 3060
ctgttcgagg acagggagat gatcgaggag aggctgaaga cctacgccca cctgttcgac 3120
gacaaggtga tgaagcagct gaagaggagg aggtacaccg gctggggcag gctgagcagg 3180
aagctgatca acggcatcag ggacaagcag agcggcaaga ccatcctgga cttcctgaag 3240
agcgacggct tcgccaacag gaacttcatg cagctgatcc acgacgacag cctgaccttc 3300
aaggaggaca tccagaaggc ccaggtgagc ggccagggcg acagcctgca cgagcacatc 3360
gccaacctgg ccggcagccc ggccatcaag aagggcatcc tgcagaccgt gaaggtggtg 3420
gacgagctgg tgaaggtgat gggcaggcac aagccggaga acatcgtgat cgagatggcc 3480
agggagaacc agaccaccca gaagggccag aagaacagca gggagaggat gaagaggatc 3540
gaggagggca tcaaggagct gggcagccag atcctgaagg agcacccggt ggagaacacc 3600
cagctgcaga acgagaagct gtacctgtac tacctgcaga acggcaggga catgtacgtg 3660
gaccaggagc tggacatcaa caggctgagc gactacgacg tggaccacat cgtgccgcag 3720
agcttcctga aggacgacag catcgacaac aaggtgctga ccaggagcga caagaacagg 3780
ggcaagagcg acaacgtgcc gagcgaggag gtggtgaaga agatgaaaaa ctactggagg 3840
cagctgctga acgccaagct gatcacccag aggaagttcg acaacctgac caaggccgag 3900
aggggcggcc tgagcgagct ggacaaggcc ggcttcatta aaaggcagct ggtggagacc 3960
aggcagatca ccaagcacgt ggcccagatc ctggacagca ggatgaacac caagtacgac 4020
gagaacgaca agctgatcag ggaggtgaag gtgatcaccc tgaagagcaa gctggtgagc 4080
gacttcagga aggacttcca gttctacaag gtgagggaga tcaataatta ccaccacgcc 4140
cacgacgcct acctgaacgc cgtggtgggc accgccctga ttaaaaagta cccgaagctg 4200
gagagcgagt tcgtgtacgg cgactacaag gtgtacgacg tgaggaagat gatcgccaag 4260
agcgagcagg agatcggcaa ggccaccgcc aagtacttct tctacagcaa catcatgaac 4320
ttcttcaaga ccgagatcac cctggccaac ggcgagatca ggaagaggcc gctgatcgag 4380
accaacggcg agaccggcga gatcgtgtgg gacaagggca gggacttcgc caccgtgagg 4440
aaggtgctgt ccatgccgca ggtgaacatc gtgaagaaga ccgaggtgca gaccggcggc 4500
ttcagcaagg agagcatcct gccgaagagg aacagcgaca agctgatcgc caggaagaag 4560
gactgggatc cgaagaagta cggcggcttc gacagcccga ccgtggccta cagcgtgctg 4620
gtggtggcca aggtggagaa gggcaagagc aagaagctga agagcgtgaa ggagctggtg 4680
ggcatcacca tcatggagag gagcagcttc gagaagaacc cagtggactt cctggaggcc 4740
aagggctaca aggaggtgaa gaaggacctg atcattaaac tgccgaagta cagcctgttc 4800
gagctggaga acggcaggaa gaggatgctg gccagcgccg gcgagctgca gaagggcaac 4860
gagctggccc tgccgagcaa gtacgtgaac ttcctgtacc tggccagcca ctacgagaag 4920
ctgaagggca gcccggagga caacgagcag aagcagctgt tcgtggagca gcacaagcac 4980
tacctggacg agatcatcga gcagatcagc gagttcagca agagggtgat cctggccgac 5040
gccaacctgg acaaggtgct gagcgcctac aacaagcaca gggacaagcc gatcagggag 5100
caggccgaga acatcatcca cctgttcacc ctgaccaacc tgggcgcccc ggccgccttc 5160
aagtacttcg acaccaccat cgacaggaag aggtacacca gcaccaagga ggtgctggac 5220
gccaccctga tccaccagag catcaccggc ctgtacgaga ccaggatcga cctgagccag 5280
ctgggcggcg acagcagccc gccgaagaag aagaggaagg tgagctggaa ggacgccagc 5340
ggctggagca ggatgtga 5358
<210> 77
<211> 1785
<212> PRT
<213> Artificial Sequence
<220>
<223> Fusion protein
<400> 77
Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu
1 5 10 15
Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala
20 25 30
Val Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro
35 40 45
Ile Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg
50 55 60
Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu
65 70 75 80
Tyr Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His
85 90 95
Ser Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly
100 105 110
Ala Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His
115 120 125
Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu
130 135 140
Leu Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys
145 150 155 160
Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly Ser Ser Gly Gly Ser Ser
165 170 175
Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser
180 185 190
Gly Gly Ser Ser Gly Gly Ser Ser Glu Val Glu Phe Ser His Glu Tyr
195 200 205
Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala Arg Asp Glu Arg
210 215 220
Glu Val Pro Val Gly Ala Val Leu Val Leu Asn Asn Arg Val Ile Gly
225 230 235 240
Glu Gly Trp Asn Arg Ala Ile Gly Leu His Asp Pro Thr Ala His Ala
245 250 255
Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met Gln Asn Tyr Arg
260 265 270
Leu Ile Asp Ala Thr Leu Tyr Val Thr Phe Glu Pro Cys Val Met Cys
275 280 285
Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val Phe Gly Val
290 295 300
Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp Val Leu His
305 310 315 320
Tyr Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly Ile Leu Ala
325 330 335
Asp Glu Cys Ala Ala Leu Leu Cys Tyr Phe Phe Arg Met Pro Arg Gln
340 345 350
Val Phe Asn Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly
355 360 365
Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser
370 375 380
Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser Asp Lys Lys
385 390 395 400
Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val
405 410 415
Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly
420 425 430
Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu
435 440 445
Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala
450 455 460
Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu
465 470 475 480
Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe Phe His Arg
485 490 495
Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His Glu Arg His
500 505 510
Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr
515 520 525
Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys
530 535 540
Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe
545 550 555 560
Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp
565 570 575
Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe
580 585 590
Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu
595 600 605
Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln
610 615 620
Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu
625 630 635 640
Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu
645 650 655
Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp
660 665 670
Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala
675 680 685
Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val
690 695 700
Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg
705 710 715 720
Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg
725 730 735
Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys
740 745 750
Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe
755 760 765
Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu
770 775 780
Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr
785 790 795 800
Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly Glu Leu His
805 810 815
Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn
820 825 830
Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val
835 840 845
Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys
850 855 860
Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys
865 870 875 880
Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys
885 890 895
Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu
900 905 910
Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu
915 920 925
Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile
930 935 940
Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu
945 950 955 960
Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile
965 970 975
Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp
980 985 990
Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn
995 1000 1005
Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu Phe Glu
1010 1015 1020
Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His Leu
1025 1030 1035
Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr
1040 1045 1050
Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
1055 1060 1065
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly
1070 1075 1080
Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu
1085 1090 1095
Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly
1100 1105 1110
Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala
1115 1120 1125
Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu
1130 1135 1140
Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu
1145 1150 1155
Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser
1160 1165 1170
Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly
1175 1180 1185
Ser Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln
1190 1195 1200
Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met
1205 1210 1215
Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp
1220 1225 1230
Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile
1235 1240 1245
Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser
1250 1255 1260
Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr
1265 1270 1275
Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe
1280 1285 1290
Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
1295 1300 1305
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile
1310 1315 1320
Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys
1325 1330 1335
Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr
1340 1345 1350
Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe
1355 1360 1365
Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala
1370 1375 1380
Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro
1385 1390 1395
Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp
1400 1405 1410
Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala
1415 1420 1425
Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys
1430 1435 1440
Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu
1445 1450 1455
Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly
1460 1465 1470
Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val
1475 1480 1485
Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys
1490 1495 1500
Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg
1505 1510 1515
Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro
1520 1525 1530
Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly
1535 1540 1545
Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Val Gly Ile Thr
1550 1555 1560
Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Val Asp Phe Leu
1565 1570 1575
Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys
1580 1585 1590
Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg
1595 1600 1605
Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala
1610 1615 1620
Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr
1625 1630 1635
Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu
1640 1645 1650
Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln
1655 1660 1665
Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu
1670 1675 1680
Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile
1685 1690 1695
Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn
1700 1705 1710
Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp
1715 1720 1725
Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu
1730 1735 1740
Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu
1745 1750 1755
Ser Gln Leu Gly Gly Asp Ser Ser Pro Pro Lys Lys Lys Arg Lys
1760 1765 1770
Val Ser Trp Lys Asp Ala Ser Gly Trp Ser Arg Met
1775 1780 1785
<210> 78
<211> 5094
<212> DNA
<213> Artificial Sequence
<220>
<223> Syntheic
<400> 78
atgtccgagg tggagttcag ccacgagtac tggatgaggc acgctctcac cctggctaag 60
agggcgtggg acgagaggga ggtgccggtg ggcgccgtgc tcgtccacaa caaccgcgtg 120
atcggcgagg gctggaacag gcccatcggc aggcacgacc caaccgctca cgccgagatc 180
atggctctca ggcagggcgg cctggtcatg cagaactaca ggctgatcga cgcgaccctc 240
tacgtgaccc tcgagccctg cgtcatggta agtttctgct tctacctttg atatatatat 300
aataattatc attaattagt agtaatataa tatttcaaat atttttttca aaataaaaga 360
atgtagtata tagcaattgc ttttctgtag tttataagtg tgtatatttt aatttataac 420
ttttctaata tatgaccaaa atttgttgat gtgcagtgcg cgggcgccat gatccactcc 480
aggatcggca gggtggtctt cggcgctagg gacgccaaga cgggcgctgc gggcagcctc 540
atggacgtgc tgcaccaccc cggcatgaac caccgcgtcg agatcaccga gggcatcctc 600
gcggacgagt gcgctgcgct cctgtccgac ttcttcagga tgcgcaggca ggagatcaag 660
gcccagaaga aggcgcagtc cagcaccgac tccggcggct ccagcggcgg ctccagcggc 720
agcgagaccc cgggcacgtc cgagagcgcg acgcccgaga gcagcggcgg ctccagcggc 780
ggctcctcgg aggtcgagtt cagccatgag tactggatga ggcatgccct gactctcgct 840
aagagggcgc gggatgagcg cgaggtgccg gtgggggccg tgctcgtcct gaacaaccgc 900
gtgatcgggg agggctggaa ccgggctatc ggcctccacg acccaacggc ccatgccgag 960
atcatggccc tgaggcaggg cggcctggtc atgcaaaact acaggctcat cgacgccacc 1020
ctctacgtga ccttcgagcc atgcgtgatg tgcgcggggg ccatgatcca ctcgaggatt 1080
gggagggtgg tcttcggcgt gcgcaacgct aagacggggg ccgccggcag cctcatggac 1140
gtcctgcact acccgggcat gaaccacagg gtggagatta ccgagggcat cctggccgat 1200
gagtgcgccg cgctcctgtg ctacttcttc cgcatgccca ggcaggtctt caacgcgcag 1260
aagaaggccc agagctccac tgattccggc ggctccagcg gcggctccag tggcagcgag 1320
actcctggca cgtccgagag cgccacgccc gagtctagcg gcggctccag cggcggctcc 1380
atgagcaagc tggagaagtt cacgaactgc tactccctca gcaagaccct gaggttcaag 1440
gcgatcccgg tcggcaagac ccaggagaac atcgacaaca agcggctgct ggtggaggac 1500
gagaagaggg ctgaggacta caagggcgtg aagaagctcc tggaccgcta ctacctgtcc 1560
ttcatcaacg acgtgctcca cagcatcaag ctcaagaacc tgaacaacta catcagcctc 1620
ttcaggaaga agacgcgcac cgagaaggag aacaaggagc tcgagaacct ggagatcaac 1680
ctgaggaagg agatcgccaa ggcgttcaag ggcaacgagg gctacaagtc cctcttcaag 1740
aaggacatca tcgagacgat cctcccggag ttcctggacg acaaggacga gatcgccctg 1800
gtcaactcct tcaacggctt caccacggcg ttcaccggct tcttcgacaa ccgcgagaac 1860
atgttcagcg aggaggccaa gtccacgagc atcgcgttca ggtgcatcaa cgagaacctc 1920
acccgctaca tctccaacat ggacatcttc gagaaggtcg acgcgatctt cgacaagcac 1980
gaggtgcagg agatcaagga gaagatcctg aacagcgact acgacgtcga ggacttcttc 2040
gagggcgagt tcttcaactt cgtcctcacg caggagggca tcgacgtgta caacgccatc 2100
atcggtggct tcgtgaccga gtccggcgag aagatcaagg gcctgaacga gtacatcaac 2160
ctctacaacc agaagaccaa gcagaagctg ccgaagttca agcccctgta caagcaggtg 2220
ctctccgaca gggagtccct cagcttctac ggcgagggct acacgagcga cgaggaggtc 2280
ctggaggtgt tccgcaacac cctcaacaag aacagcgaga tcttctccag catcaagaag 2340
ctcgagaagc tgttcaagaa cttcgacgag tactccagcg ccggcatctt cgtcaagaac 2400
ggcccggcga tctccacgat cagcaaggac atcttcggcg agtggaacgt gatccgcgac 2460
aagtggaacg ccgagtacga cgacatccac ctcaagaaga aggcggtggt caccgagaag 2520
tacgaggacg acaggcgcaa gtccttcaag aagatcggct ccttcagcct cgagcagctg 2580
caggagtacg ccgacgcgga cctgagcgtg gtcgagaagc tcaaggagat catcatccag 2640
aaggtcgacg agatctacaa ggtgtacggc tccagcgaga agctcttcga cgcggacttc 2700
gtcctcgaga agtccctgaa gaagaacgac gccgtggtcg cgatcatgaa ggacctcctg 2760
gactccgtga agagcttcga gaattacatc aaggccttct tcggcgaggg caaggagacg 2820
aacagggacg agtccttcta cggcgacttc gtcctggcct acgacatcct cctgaaggtg 2880
gaccacatct acgacgcgat ccgcaactac gtgacccaga agccgtacag caaggacaag 2940
ttcaagctct acttccagaa cccccagttc atgggcggct gggacaagga caaggagacg 3000
gactacaggg cgaccatcct gcgctacggc agcaagtact acctcgccat catggacaag 3060
aagtacgcga agtgcctgca gaagatcgac aaggacgacg tcaacggcaa ctacgagaag 3120
atcaactaca agctcctgcc gggccccaac aagatgctcc cgaaggtgtt cttctccaag 3180
aagtggatgg cctactacaa ccccagcgag gacatccaga agatctacaa gaacggcacg 3240
ttcaagaagg gcgacatgtt caacctgaac gactgccaca agctcatcga cttcttcaag 3300
gactccatca gccgctaccc gaagtggtcc aacgcctacg acttcaactt cagcgagacc 3360
gagaagtaca aggacatcgc gggcttctac cgcgaggtcg aggagcaggg ctacaaggtg 3420
tccttcgagt ccgccagcaa gaaggaggtc gacaagctgg tggaggaggg caagctctac 3480
atgttccaga tctacaacaa ggacttctcc gacaagagcc acggcacgcc caacctgcac 3540
accatgtact tcaagctcct gttcgacgag aacaaccacg gccagatcag gctgtccggc 3600
ggcgccgagc tcttcatgag gagggcgagc ctgaagaagg aggagctggt ggtccacccc 3660
gctaacagcc caatcgcgaa caagaacccg gacaacccca agaagaccac gaccctgtcc 3720
tacgacgtgt acaaggacaa gaggttcagc gaggaccagt acgagctcca catcccgatc 3780
gcgatcaaca agtgccccaa gaacatcttc aagatcaaca ccgaggtccg cgtgctcctg 3840
aagcacgacg acaaccccta cgtgatcggc atcgctaggg gcgagaggaa cctcctgtac 3900
atcgtggtcg tggacggcaa gggcaacatc gtggagcagt actccctcaa cgagatcatc 3960
aacaacttca acggcatcag gatcaagacg gactaccaca gcctcctgga caagaaggag 4020
aaggagaggt tcgaggcccg ccagaactgg acctccatcg agaacatcaa ggagctgaag 4080
gcgggctaca tcagccaggt cgtgcacaag atctgcgagc tcgtcgagaa gtacgacgcc 4140
gtgatcgccc tcgcggacct gaactccggc ttcaagaaca gccgcgtcaa ggtggagaag 4200
caggtctacc agaagttcga gaagatgctc atcgacaagc tgaactacat ggtggacaag 4260
aagtccaacc cctgcgctac gggcggcgcg ctgaagggct accagatcac caacaagttc 4320
gagagcttca agtccatgag cactcagaac ggcttcatct tctacatccc ggcgtggctc 4380
acgtccaaga tcgaccccag caccggcttc gtcaacctcc tgaagacgaa gtacacctcc 4440
atcgccgaca gcaagaagtt catctccagc ttcgaccgca tcatgtatgt gccggaggag 4500
gacctgttcg agttcgccct cgactacaag aacttctccc gcacggacgc ggactacatc 4560
aagaagtgga agctgtacag ctacggcaac cgcatccgca tcttcaggaa ccccaagaag 4620
aacaacgtct tcgactggga ggaggtgtgc ctgacctccg cgtacaagga gctcttcaac 4680
aagtacggca tcaactacca gcagggcgac atcagggctc tcctgtgcga gcagagcgac 4740
aaggccttct actccagctt catggcgctg atgtccctca tgctgcagat gaggaactcg 4800
atcaccggca ggacggacgt ggccttcctc atctccccgg tgaagaacag cgacggcatc 4860
ttctacgact ccaggaacta cgaggcccag gagaacgcga tcctcccaaa gaacgcggac 4920
gccaacggcg cctacaacat cgccaggaag gtcctctggg ctatcggcca gttcaagaag 4980
gcggaggacg agaagctgga caaggtgaag atcgccatca gcaacaagga gtggctcgag 5040
tacgcccaga cctcggtcaa gcacggcagc ccgaagaaga agcgcaaggt gtga 5094
<210> 79
<211> 1691
<212> PRT
<213> Artificial Sequence
<220>
<223> Fusion protein
<400> 79
Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu
1 5 10 15
Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala
20 25 30
Val Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro
35 40 45
Ile Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg
50 55 60
Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu
65 70 75 80
Tyr Val Thr Leu Glu Pro Cys Val Met Val Ser Phe Cys Phe Tyr Leu
85 90 95
Tyr Ile Tyr Asn Asn Tyr His Leu Val Val Ile Tyr Phe Lys Tyr Phe
100 105 110
Phe Gln Asn Lys Arg Met Tyr Ile Ala Ile Ala Phe Leu Phe Ile Ser
115 120 125
Val Tyr Ile Leu Ile Tyr Asn Phe Ser Asn Ile Pro Lys Phe Val Asp
130 135 140
Val Gln Cys Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val
145 150 155 160
Phe Gly Ala Arg Asp Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp
165 170 175
Val Leu His His Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly
180 185 190
Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu Ser Asp Phe Phe Arg Met
195 200 205
Arg Arg Gln Glu Ile Lys Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp
210 215 220
Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr
225 230 235 240
Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser
245 250 255
Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr
260 265 270
Leu Ala Lys Arg Ala Arg Asp Glu Arg Glu Val Pro Val Gly Ala Val
275 280 285
Leu Val Leu Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Ala Ile
290 295 300
Gly Leu His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln
305 310 315 320
Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr
325 330 335
Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser
340 345 350
Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly Ala
355 360 365
Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His Arg
370 375 380
Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu
385 390 395 400
Cys Tyr Phe Phe Arg Met Pro Arg Gln Val Phe Asn Ala Gln Lys Lys
405 410 415
Ala Gln Ser Ser Thr Asp Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly
420 425 430
Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly
435 440 445
Gly Ser Ser Gly Gly Ser Met Ser Lys Leu Glu Lys Phe Thr Asn Cys
450 455 460
Tyr Ser Leu Ser Lys Thr Leu Arg Phe Lys Ala Ile Pro Val Gly Lys
465 470 475 480
Thr Gln Glu Asn Ile Asp Asn Lys Arg Leu Leu Val Glu Asp Glu Lys
485 490 495
Arg Ala Glu Asp Tyr Lys Gly Val Lys Lys Leu Leu Asp Arg Tyr Tyr
500 505 510
Leu Ser Phe Ile Asn Asp Val Leu His Ser Ile Lys Leu Lys Asn Leu
515 520 525
Asn Asn Tyr Ile Ser Leu Phe Arg Lys Lys Thr Arg Thr Glu Lys Glu
530 535 540
Asn Lys Glu Leu Glu Asn Leu Glu Ile Asn Leu Arg Lys Glu Ile Ala
545 550 555 560
Lys Ala Phe Lys Gly Asn Glu Gly Tyr Lys Ser Leu Phe Lys Lys Asp
565 570 575
Ile Ile Glu Thr Ile Leu Pro Glu Phe Leu Asp Asp Lys Asp Glu Ile
580 585 590
Ala Leu Val Asn Ser Phe Asn Gly Phe Thr Thr Ala Phe Thr Gly Phe
595 600 605
Phe Asp Asn Arg Glu Asn Met Phe Ser Glu Glu Ala Lys Ser Thr Ser
610 615 620
Ile Ala Phe Arg Cys Ile Asn Glu Asn Leu Thr Arg Tyr Ile Ser Asn
625 630 635 640
Met Asp Ile Phe Glu Lys Val Asp Ala Ile Phe Asp Lys His Glu Val
645 650 655
Gln Glu Ile Lys Glu Lys Ile Leu Asn Ser Asp Tyr Asp Val Glu Asp
660 665 670
Phe Phe Glu Gly Glu Phe Phe Asn Phe Val Leu Thr Gln Glu Gly Ile
675 680 685
Asp Val Tyr Asn Ala Ile Ile Gly Gly Phe Val Thr Glu Ser Gly Glu
690 695 700
Lys Ile Lys Gly Leu Asn Glu Tyr Ile Asn Leu Tyr Asn Gln Lys Thr
705 710 715 720
Lys Gln Lys Leu Pro Lys Phe Lys Pro Leu Tyr Lys Gln Val Leu Ser
725 730 735
Asp Arg Glu Ser Leu Ser Phe Tyr Gly Glu Gly Tyr Thr Ser Asp Glu
740 745 750
Glu Val Leu Glu Val Phe Arg Asn Thr Leu Asn Lys Asn Ser Glu Ile
755 760 765
Phe Ser Ser Ile Lys Lys Leu Glu Lys Leu Phe Lys Asn Phe Asp Glu
770 775 780
Tyr Ser Ser Ala Gly Ile Phe Val Lys Asn Gly Pro Ala Ile Ser Thr
785 790 795 800
Ile Ser Lys Asp Ile Phe Gly Glu Trp Asn Val Ile Arg Asp Lys Trp
805 810 815
Asn Ala Glu Tyr Asp Asp Ile His Leu Lys Lys Lys Ala Val Val Thr
820 825 830
Glu Lys Tyr Glu Asp Asp Arg Arg Lys Ser Phe Lys Lys Ile Gly Ser
835 840 845
Phe Ser Leu Glu Gln Leu Gln Glu Tyr Ala Asp Ala Asp Leu Ser Val
850 855 860
Val Glu Lys Leu Lys Glu Ile Ile Ile Gln Lys Val Asp Glu Ile Tyr
865 870 875 880
Lys Val Tyr Gly Ser Ser Glu Lys Leu Phe Asp Ala Asp Phe Val Leu
885 890 895
Glu Lys Ser Leu Lys Lys Asn Asp Ala Val Val Ala Ile Met Lys Asp
900 905 910
Leu Leu Asp Ser Val Lys Ser Phe Glu Asn Tyr Ile Lys Ala Phe Phe
915 920 925
Gly Glu Gly Lys Glu Thr Asn Arg Asp Glu Ser Phe Tyr Gly Asp Phe
930 935 940
Val Leu Ala Tyr Asp Ile Leu Leu Lys Val Asp His Ile Tyr Asp Ala
945 950 955 960
Ile Arg Asn Tyr Val Thr Gln Lys Pro Tyr Ser Lys Asp Lys Phe Lys
965 970 975
Leu Tyr Phe Gln Asn Pro Gln Phe Met Gly Gly Trp Asp Lys Asp Lys
980 985 990
Glu Thr Asp Tyr Arg Ala Thr Ile Leu Arg Tyr Gly Ser Lys Tyr Tyr
995 1000 1005
Leu Ala Ile Met Asp Lys Lys Tyr Ala Lys Cys Leu Gln Lys Ile
1010 1015 1020
Asp Lys Asp Asp Val Asn Gly Asn Tyr Glu Lys Ile Asn Tyr Lys
1025 1030 1035
Leu Leu Pro Gly Pro Asn Lys Met Leu Pro Lys Val Phe Phe Ser
1040 1045 1050
Lys Lys Trp Met Ala Tyr Tyr Asn Pro Ser Glu Asp Ile Gln Lys
1055 1060 1065
Ile Tyr Lys Asn Gly Thr Phe Lys Lys Gly Asp Met Phe Asn Leu
1070 1075 1080
Asn Asp Cys His Lys Leu Ile Asp Phe Phe Lys Asp Ser Ile Ser
1085 1090 1095
Arg Tyr Pro Lys Trp Ser Asn Ala Tyr Asp Phe Asn Phe Ser Glu
1100 1105 1110
Thr Glu Lys Tyr Lys Asp Ile Ala Gly Phe Tyr Arg Glu Val Glu
1115 1120 1125
Glu Gln Gly Tyr Lys Val Ser Phe Glu Ser Ala Ser Lys Lys Glu
1130 1135 1140
Val Asp Lys Leu Val Glu Glu Gly Lys Leu Tyr Met Phe Gln Ile
1145 1150 1155
Tyr Asn Lys Asp Phe Ser Asp Lys Ser His Gly Thr Pro Asn Leu
1160 1165 1170
His Thr Met Tyr Phe Lys Leu Leu Phe Asp Glu Asn Asn His Gly
1175 1180 1185
Gln Ile Arg Leu Ser Gly Gly Ala Glu Leu Phe Met Arg Arg Ala
1190 1195 1200
Ser Leu Lys Lys Glu Glu Leu Val Val His Pro Ala Asn Ser Pro
1205 1210 1215
Ile Ala Asn Lys Asn Pro Asp Asn Pro Lys Lys Thr Thr Thr Leu
1220 1225 1230
Ser Tyr Asp Val Tyr Lys Asp Lys Arg Phe Ser Glu Asp Gln Tyr
1235 1240 1245
Glu Leu His Ile Pro Ile Ala Ile Asn Lys Cys Pro Lys Asn Ile
1250 1255 1260
Phe Lys Ile Asn Thr Glu Val Arg Val Leu Leu Lys His Asp Asp
1265 1270 1275
Asn Pro Tyr Val Ile Gly Ile Ala Arg Gly Glu Arg Asn Leu Leu
1280 1285 1290
Tyr Ile Val Val Val Asp Gly Lys Gly Asn Ile Val Glu Gln Tyr
1295 1300 1305
Ser Leu Asn Glu Ile Ile Asn Asn Phe Asn Gly Ile Arg Ile Lys
1310 1315 1320
Thr Asp Tyr His Ser Leu Leu Asp Lys Lys Glu Lys Glu Arg Phe
1325 1330 1335
Glu Ala Arg Gln Asn Trp Thr Ser Ile Glu Asn Ile Lys Glu Leu
1340 1345 1350
Lys Ala Gly Tyr Ile Ser Gln Val Val His Lys Ile Cys Glu Leu
1355 1360 1365
Val Glu Lys Tyr Asp Ala Val Ile Ala Leu Ala Asp Leu Asn Ser
1370 1375 1380
Gly Phe Lys Asn Ser Arg Val Lys Val Glu Lys Gln Val Tyr Gln
1385 1390 1395
Lys Phe Glu Lys Met Leu Ile Asp Lys Leu Asn Tyr Met Val Asp
1400 1405 1410
Lys Lys Ser Asn Pro Cys Ala Thr Gly Gly Ala Leu Lys Gly Tyr
1415 1420 1425
Gln Ile Thr Asn Lys Phe Glu Ser Phe Lys Ser Met Ser Thr Gln
1430 1435 1440
Asn Gly Phe Ile Phe Tyr Ile Pro Ala Trp Leu Thr Ser Lys Ile
1445 1450 1455
Asp Pro Ser Thr Gly Phe Val Asn Leu Leu Lys Thr Lys Tyr Thr
1460 1465 1470
Ser Ile Ala Asp Ser Lys Lys Phe Ile Ser Ser Phe Asp Arg Ile
1475 1480 1485
Met Tyr Val Pro Glu Glu Asp Leu Phe Glu Phe Ala Leu Asp Tyr
1490 1495 1500
Lys Asn Phe Ser Arg Thr Asp Ala Asp Tyr Ile Lys Lys Trp Lys
1505 1510 1515
Leu Tyr Ser Tyr Gly Asn Arg Ile Arg Ile Phe Arg Asn Pro Lys
1520 1525 1530
Lys Asn Asn Val Phe Asp Trp Glu Glu Val Cys Leu Thr Ser Ala
1535 1540 1545
Tyr Lys Glu Leu Phe Asn Lys Tyr Gly Ile Asn Tyr Gln Gln Gly
1550 1555 1560
Asp Ile Arg Ala Leu Leu Cys Glu Gln Ser Asp Lys Ala Phe Tyr
1565 1570 1575
Ser Ser Phe Met Ala Leu Met Ser Leu Met Leu Gln Met Arg Asn
1580 1585 1590
Ser Ile Thr Gly Arg Thr Asp Val Ala Phe Leu Ile Ser Pro Val
1595 1600 1605
Lys Asn Ser Asp Gly Ile Phe Tyr Asp Ser Arg Asn Tyr Glu Ala
1610 1615 1620
Gln Glu Asn Ala Ile Leu Pro Lys Asn Ala Asp Ala Asn Gly Ala
1625 1630 1635
Tyr Asn Ile Ala Arg Lys Val Leu Trp Ala Ile Gly Gln Phe Lys
1640 1645 1650
Lys Ala Glu Asp Glu Lys Leu Asp Lys Val Lys Ile Ala Ile Ser
1655 1660 1665
Asn Lys Glu Trp Leu Glu Tyr Ala Gln Thr Ser Val Lys His Gly
1670 1675 1680
Ser Pro Lys Lys Lys Arg Lys Val
1685 1690
<210> 80
<211> 5088
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 80
atgtccgagg tggagttcag ccacgagtac tggatgaggc acgctctcac cctggctaag 60
agggcgtggg acgagaggga ggtgccggtg ggcgccgtgc tcgtccacaa caaccgcgtg 120
atcggcgagg gctggaacag gcccatcggc aggcacgacc caaccgctca cgccgagatc 180
atggctctca ggcagggcgg cctggtcatg cagaactaca ggctgatcga cgcgaccctc 240
tacgtgaccc tcgagccctg cgtcatggta agtttctgct tctacctttg atatatatat 300
aataattatc attaattagt agtaatataa tatttcaaat atttttttca aaataaaaga 360
atgtagtata tagcaattgc ttttctgtag tttataagtg tgtatatttt aatttataac 420
ttttctaata tatgaccaaa atttgttgat gtgcagtgcg cgggcgccat gatccactcc 480
aggatcggca gggtggtctt cggcgctagg gacgccaaga cgggcgctgc gggcagcctc 540
atggacgtgc tgcaccaccc cggcatgaac caccgcgtcg agatcaccga gggcatcctc 600
gcggacgagt gcgctgcgct cctgtccgac ttcttcagga tgcgcaggca ggagatcaag 660
gcccagaaga aggcgcagtc cagcaccgac tccggcggct ccagcggcgg ctccagcggc 720
agcgagaccc cgggcacgtc cgagagcgcg acgcccgaga gcagcggcgg ctccagcggc 780
ggctcctcgg aggtcgagtt cagccatgag tactggatga ggcatgccct gactctcgct 840
aagagggcgc gggatgagcg cgaggtgccg gtgggggccg tgctcgtcct gaacaaccgc 900
gtgatcgggg agggctggaa ccgggctatc ggcctccacg acccaacggc ccatgccgag 960
atcatggccc tgaggcaggg cggcctggtc atgcaaaact acaggctcat cgacgccacc 1020
ctctacgtga ccttcgagcc atgcgtgatg tgcgcggggg ccatgatcca ctcgaggatt 1080
gggagggtgg tcttcggcgt gcgcaacgct aagacggggg ccgccggcag cctcatggac 1140
gtcctgcact acccgggcat gaaccacagg gtggagatta ccgagggcat cctggccgat 1200
gagtgcgccg cgctcctgtg ctacttcttc cgcatgccca ggcaggtctt caacgcgcag 1260
aagaaggccc agagctccac tgatgggggc gggggctcag gcgggggcgg gagcggcggc 1320
gggggctctg ggggcggcgg cagcggcggg ggcggcagcg ggggcggcgg gtcgatgagc 1380
aagctggaga agttcacgaa ctgctactcc ctcagcaaga ccctgaggtt caaggcgatc 1440
ccggtcggca agacccagga gaacatcgac aacaagcggc tgctggtgga ggacgagaag 1500
agggctgagg actacaaggg cgtgaagaag ctcctggacc gctactacct gtccttcatc 1560
aacgacgtgc tccacagcat caagctcaag aacctgaaca actacatcag cctcttcagg 1620
aagaagacgc gcaccgagaa ggagaacaag gagctcgaga acctggagat caacctgagg 1680
aaggagatcg ccaaggcgtt caagggcaac gagggctaca agtccctctt caagaaggac 1740
atcatcgaga cgatcctccc ggagttcctg gacgacaagg acgagatcgc cctggtcaac 1800
tccttcaacg gcttcaccac ggcgttcacc ggcttcttcg acaaccgcga gaacatgttc 1860
agcgaggagg ccaagtccac gagcatcgcg ttcaggtgca tcaacgagaa cctcacccgc 1920
tacatctcca acatggacat cttcgagaag gtcgacgcga tcttcgacaa gcacgaggtg 1980
caggagatca aggagaagat cctgaacagc gactacgacg tcgaggactt cttcgagggc 2040
gagttcttca acttcgtcct cacgcaggag ggcatcgacg tgtacaacgc catcatcggt 2100
ggcttcgtga ccgagtccgg cgagaagatc aagggcctga acgagtacat caacctctac 2160
aaccagaaga ccaagcagaa gctgccgaag ttcaagcccc tgtacaagca ggtgctctcc 2220
gacagggagt ccctcagctt ctacggcgag ggctacacga gcgacgagga ggtcctggag 2280
gtgttccgca acaccctcaa caagaacagc gagatcttct ccagcatcaa gaagctcgag 2340
aagctgttca agaacttcga cgagtactcc agcgccggca tcttcgtcaa gaacggcccg 2400
gcgatctcca cgatcagcaa ggacatcttc ggcgagtgga acgtgatccg cgacaagtgg 2460
aacgccgagt acgacgacat ccacctcaag aagaaggcgg tggtcaccga gaagtacgag 2520
gacgacaggc gcaagtcctt caagaagatc ggctccttca gcctcgagca gctgcaggag 2580
tacgccgacg cggacctgag cgtggtcgag aagctcaagg agatcatcat ccagaaggtc 2640
gacgagatct acaaggtgta cggctccagc gagaagctct tcgacgcgga cttcgtcctc 2700
gagaagtccc tgaagaagaa cgacgccgtg gtcgcgatca tgaaggacct cctggactcc 2760
gtgaagagct tcgagaatta catcaaggcc ttcttcggcg agggcaagga gacgaacagg 2820
gacgagtcct tctacggcga cttcgtcctg gcctacgaca tcctcctgaa ggtggaccac 2880
atctacgacg cgatccgcaa ctacgtgacc cagaagccgt acagcaagga caagttcaag 2940
ctctacttcc agaaccccca gttcatgggc ggctgggaca aggacaagga gacggactac 3000
agggcgacca tcctgcgcta cggcagcaag tactacctcg ccatcatgga caagaagtac 3060
gcgaagtgcc tgcagaagat cgacaaggac gacgtcaacg gcaactacga gaagatcaac 3120
tacaagctcc tgccgggccc caacaagatg ctcccgaagg tgttcttctc caagaagtgg 3180
atggcctact acaaccccag cgaggacatc cagaagatct acaagaacgg cacgttcaag 3240
aagggcgaca tgttcaacct gaacgactgc cacaagctca tcgacttctt caaggactcc 3300
atcagccgct acccgaagtg gtccaacgcc tacgacttca acttcagcga gaccgagaag 3360
tacaaggaca tcgcgggctt ctaccgcgag gtcgaggagc agggctacaa ggtgtccttc 3420
gagtccgcca gcaagaagga ggtcgacaag ctggtggagg agggcaagct ctacatgttc 3480
cagatctaca acaaggactt ctccgacaag agccacggca cgcccaacct gcacaccatg 3540
tacttcaagc tcctgttcga cgagaacaac cacggccaga tcaggctgtc cggcggcgcc 3600
gagctcttca tgaggagggc gagcctgaag aaggaggagc tggtggtcca ccccgctaac 3660
agcccaatcg cgaacaagaa cccggacaac cccaagaaga ccacgaccct gtcctacgac 3720
gtgtacaagg acaagaggtt cagcgaggac cagtacgagc tccacatccc gatcgcgatc 3780
aacaagtgcc ccaagaacat cttcaagatc aacaccgagg tccgcgtgct cctgaagcac 3840
gacgacaacc cctacgtgat cggcatcgct aggggcgaga ggaacctcct gtacatcgtg 3900
gtcgtggacg gcaagggcaa catcgtggag cagtactccc tcaacgagat catcaacaac 3960
ttcaacggca tcaggatcaa gacggactac cacagcctcc tggacaagaa ggagaaggag 4020
aggttcgagg cccgccagaa ctggacctcc atcgagaaca tcaaggagct gaaggcgggc 4080
tacatcagcc aggtcgtgca caagatctgc gagctcgtcg agaagtacga cgccgtgatc 4140
gccctcgcgg acctgaactc cggcttcaag aacagccgcg tcaaggtgga gaagcaggtc 4200
taccagaagt tcgagaagat gctcatcgac aagctgaact acatggtgga caagaagtcc 4260
aacccctgcg ctacgggcgg cgcgctgaag ggctaccaga tcaccaacaa gttcgagagc 4320
ttcaagtcca tgagcactca gaacggcttc atcttctaca tcccggcgtg gctcacgtcc 4380
aagatcgacc ccagcaccgg cttcgtcaac ctcctgaaga cgaagtacac ctccatcgcc 4440
gacagcaaga agttcatctc cagcttcgac cgcatcatgt atgtgccgga ggaggacctg 4500
ttcgagttcg ccctcgacta caagaacttc tcccgcacgg acgcggacta catcaagaag 4560
tggaagctgt acagctacgg caaccgcatc cgcatcttca ggaaccccaa gaagaacaac 4620
gtcttcgact gggaggaggt gtgcctgacc tccgcgtaca aggagctctt caacaagtac 4680
ggcatcaact accagcaggg cgacatcagg gctctcctgt gcgagcagag cgacaaggcc 4740
ttctactcca gcttcatggc gctgatgtcc ctcatgctgc agatgaggaa ctcgatcacc 4800
ggcaggacgg acgtggcctt cctcatctcc ccggtgaaga acagcgacgg catcttctac 4860
gactccagga actacgaggc ccaggagaac gcgatcctcc caaagaacgc ggacgccaac 4920
ggcgcctaca acatcgccag gaaggtcctc tgggctatcg gccagttcaa gaaggcggag 4980
gacgagaagc tggacaaggt gaagatcgcc atcagcaaca aggagtggct cgagtacgcc 5040
cagacctcgg tcaagcacgg cagcccgaag aagaagcgca aggtgtga 5088
<210> 81
<211> 1689
<212> PRT
<213> Artificial Sequence
<220>
<223> Fusion protein
<400> 81
Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu
1 5 10 15
Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala
20 25 30
Val Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro
35 40 45
Ile Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg
50 55 60
Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu
65 70 75 80
Tyr Val Thr Leu Glu Pro Cys Val Met Val Ser Phe Cys Phe Tyr Leu
85 90 95
Tyr Ile Tyr Asn Asn Tyr His Leu Val Val Ile Tyr Phe Lys Tyr Phe
100 105 110
Phe Gln Asn Lys Arg Met Tyr Ile Ala Ile Ala Phe Leu Phe Ile Ser
115 120 125
Val Tyr Ile Leu Ile Tyr Asn Phe Ser Asn Ile Pro Lys Phe Val Asp
130 135 140
Val Gln Cys Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val
145 150 155 160
Phe Gly Ala Arg Asp Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp
165 170 175
Val Leu His His Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly
180 185 190
Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu Ser Asp Phe Phe Arg Met
195 200 205
Arg Arg Gln Glu Ile Lys Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp
210 215 220
Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr
225 230 235 240
Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser
245 250 255
Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr
260 265 270
Leu Ala Lys Arg Ala Arg Asp Glu Arg Glu Val Pro Val Gly Ala Val
275 280 285
Leu Val Leu Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Ala Ile
290 295 300
Gly Leu His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln
305 310 315 320
Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr
325 330 335
Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser
340 345 350
Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly Ala
355 360 365
Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His Arg
370 375 380
Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu
385 390 395 400
Cys Tyr Phe Phe Arg Met Pro Arg Gln Val Phe Asn Ala Gln Lys Lys
405 410 415
Ala Gln Ser Ser Thr Asp Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
420 425 430
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
435 440 445
Gly Gly Gly Ser Met Ser Lys Leu Glu Lys Phe Thr Asn Cys Tyr Ser
450 455 460
Leu Ser Lys Thr Leu Arg Phe Lys Ala Ile Pro Val Gly Lys Thr Gln
465 470 475 480
Glu Asn Ile Asp Asn Lys Arg Leu Leu Val Glu Asp Glu Lys Arg Ala
485 490 495
Glu Asp Tyr Lys Gly Val Lys Lys Leu Leu Asp Arg Tyr Tyr Leu Ser
500 505 510
Phe Ile Asn Asp Val Leu His Ser Ile Lys Leu Lys Asn Leu Asn Asn
515 520 525
Tyr Ile Ser Leu Phe Arg Lys Lys Thr Arg Thr Glu Lys Glu Asn Lys
530 535 540
Glu Leu Glu Asn Leu Glu Ile Asn Leu Arg Lys Glu Ile Ala Lys Ala
545 550 555 560
Phe Lys Gly Asn Glu Gly Tyr Lys Ser Leu Phe Lys Lys Asp Ile Ile
565 570 575
Glu Thr Ile Leu Pro Glu Phe Leu Asp Asp Lys Asp Glu Ile Ala Leu
580 585 590
Val Asn Ser Phe Asn Gly Phe Thr Thr Ala Phe Thr Gly Phe Phe Asp
595 600 605
Asn Arg Glu Asn Met Phe Ser Glu Glu Ala Lys Ser Thr Ser Ile Ala
610 615 620
Phe Arg Cys Ile Asn Glu Asn Leu Thr Arg Tyr Ile Ser Asn Met Asp
625 630 635 640
Ile Phe Glu Lys Val Asp Ala Ile Phe Asp Lys His Glu Val Gln Glu
645 650 655
Ile Lys Glu Lys Ile Leu Asn Ser Asp Tyr Asp Val Glu Asp Phe Phe
660 665 670
Glu Gly Glu Phe Phe Asn Phe Val Leu Thr Gln Glu Gly Ile Asp Val
675 680 685
Tyr Asn Ala Ile Ile Gly Gly Phe Val Thr Glu Ser Gly Glu Lys Ile
690 695 700
Lys Gly Leu Asn Glu Tyr Ile Asn Leu Tyr Asn Gln Lys Thr Lys Gln
705 710 715 720
Lys Leu Pro Lys Phe Lys Pro Leu Tyr Lys Gln Val Leu Ser Asp Arg
725 730 735
Glu Ser Leu Ser Phe Tyr Gly Glu Gly Tyr Thr Ser Asp Glu Glu Val
740 745 750
Leu Glu Val Phe Arg Asn Thr Leu Asn Lys Asn Ser Glu Ile Phe Ser
755 760 765
Ser Ile Lys Lys Leu Glu Lys Leu Phe Lys Asn Phe Asp Glu Tyr Ser
770 775 780
Ser Ala Gly Ile Phe Val Lys Asn Gly Pro Ala Ile Ser Thr Ile Ser
785 790 795 800
Lys Asp Ile Phe Gly Glu Trp Asn Val Ile Arg Asp Lys Trp Asn Ala
805 810 815
Glu Tyr Asp Asp Ile His Leu Lys Lys Lys Ala Val Val Thr Glu Lys
820 825 830
Tyr Glu Asp Asp Arg Arg Lys Ser Phe Lys Lys Ile Gly Ser Phe Ser
835 840 845
Leu Glu Gln Leu Gln Glu Tyr Ala Asp Ala Asp Leu Ser Val Val Glu
850 855 860
Lys Leu Lys Glu Ile Ile Ile Gln Lys Val Asp Glu Ile Tyr Lys Val
865 870 875 880
Tyr Gly Ser Ser Glu Lys Leu Phe Asp Ala Asp Phe Val Leu Glu Lys
885 890 895
Ser Leu Lys Lys Asn Asp Ala Val Val Ala Ile Met Lys Asp Leu Leu
900 905 910
Asp Ser Val Lys Ser Phe Glu Asn Tyr Ile Lys Ala Phe Phe Gly Glu
915 920 925
Gly Lys Glu Thr Asn Arg Asp Glu Ser Phe Tyr Gly Asp Phe Val Leu
930 935 940
Ala Tyr Asp Ile Leu Leu Lys Val Asp His Ile Tyr Asp Ala Ile Arg
945 950 955 960
Asn Tyr Val Thr Gln Lys Pro Tyr Ser Lys Asp Lys Phe Lys Leu Tyr
965 970 975
Phe Gln Asn Pro Gln Phe Met Gly Gly Trp Asp Lys Asp Lys Glu Thr
980 985 990
Asp Tyr Arg Ala Thr Ile Leu Arg Tyr Gly Ser Lys Tyr Tyr Leu Ala
995 1000 1005
Ile Met Asp Lys Lys Tyr Ala Lys Cys Leu Gln Lys Ile Asp Lys
1010 1015 1020
Asp Asp Val Asn Gly Asn Tyr Glu Lys Ile Asn Tyr Lys Leu Leu
1025 1030 1035
Pro Gly Pro Asn Lys Met Leu Pro Lys Val Phe Phe Ser Lys Lys
1040 1045 1050
Trp Met Ala Tyr Tyr Asn Pro Ser Glu Asp Ile Gln Lys Ile Tyr
1055 1060 1065
Lys Asn Gly Thr Phe Lys Lys Gly Asp Met Phe Asn Leu Asn Asp
1070 1075 1080
Cys His Lys Leu Ile Asp Phe Phe Lys Asp Ser Ile Ser Arg Tyr
1085 1090 1095
Pro Lys Trp Ser Asn Ala Tyr Asp Phe Asn Phe Ser Glu Thr Glu
1100 1105 1110
Lys Tyr Lys Asp Ile Ala Gly Phe Tyr Arg Glu Val Glu Glu Gln
1115 1120 1125
Gly Tyr Lys Val Ser Phe Glu Ser Ala Ser Lys Lys Glu Val Asp
1130 1135 1140
Lys Leu Val Glu Glu Gly Lys Leu Tyr Met Phe Gln Ile Tyr Asn
1145 1150 1155
Lys Asp Phe Ser Asp Lys Ser His Gly Thr Pro Asn Leu His Thr
1160 1165 1170
Met Tyr Phe Lys Leu Leu Phe Asp Glu Asn Asn His Gly Gln Ile
1175 1180 1185
Arg Leu Ser Gly Gly Ala Glu Leu Phe Met Arg Arg Ala Ser Leu
1190 1195 1200
Lys Lys Glu Glu Leu Val Val His Pro Ala Asn Ser Pro Ile Ala
1205 1210 1215
Asn Lys Asn Pro Asp Asn Pro Lys Lys Thr Thr Thr Leu Ser Tyr
1220 1225 1230
Asp Val Tyr Lys Asp Lys Arg Phe Ser Glu Asp Gln Tyr Glu Leu
1235 1240 1245
His Ile Pro Ile Ala Ile Asn Lys Cys Pro Lys Asn Ile Phe Lys
1250 1255 1260
Ile Asn Thr Glu Val Arg Val Leu Leu Lys His Asp Asp Asn Pro
1265 1270 1275
Tyr Val Ile Gly Ile Ala Arg Gly Glu Arg Asn Leu Leu Tyr Ile
1280 1285 1290
Val Val Val Asp Gly Lys Gly Asn Ile Val Glu Gln Tyr Ser Leu
1295 1300 1305
Asn Glu Ile Ile Asn Asn Phe Asn Gly Ile Arg Ile Lys Thr Asp
1310 1315 1320
Tyr His Ser Leu Leu Asp Lys Lys Glu Lys Glu Arg Phe Glu Ala
1325 1330 1335
Arg Gln Asn Trp Thr Ser Ile Glu Asn Ile Lys Glu Leu Lys Ala
1340 1345 1350
Gly Tyr Ile Ser Gln Val Val His Lys Ile Cys Glu Leu Val Glu
1355 1360 1365
Lys Tyr Asp Ala Val Ile Ala Leu Ala Asp Leu Asn Ser Gly Phe
1370 1375 1380
Lys Asn Ser Arg Val Lys Val Glu Lys Gln Val Tyr Gln Lys Phe
1385 1390 1395
Glu Lys Met Leu Ile Asp Lys Leu Asn Tyr Met Val Asp Lys Lys
1400 1405 1410
Ser Asn Pro Cys Ala Thr Gly Gly Ala Leu Lys Gly Tyr Gln Ile
1415 1420 1425
Thr Asn Lys Phe Glu Ser Phe Lys Ser Met Ser Thr Gln Asn Gly
1430 1435 1440
Phe Ile Phe Tyr Ile Pro Ala Trp Leu Thr Ser Lys Ile Asp Pro
1445 1450 1455
Ser Thr Gly Phe Val Asn Leu Leu Lys Thr Lys Tyr Thr Ser Ile
1460 1465 1470
Ala Asp Ser Lys Lys Phe Ile Ser Ser Phe Asp Arg Ile Met Tyr
1475 1480 1485
Val Pro Glu Glu Asp Leu Phe Glu Phe Ala Leu Asp Tyr Lys Asn
1490 1495 1500
Phe Ser Arg Thr Asp Ala Asp Tyr Ile Lys Lys Trp Lys Leu Tyr
1505 1510 1515
Ser Tyr Gly Asn Arg Ile Arg Ile Phe Arg Asn Pro Lys Lys Asn
1520 1525 1530
Asn Val Phe Asp Trp Glu Glu Val Cys Leu Thr Ser Ala Tyr Lys
1535 1540 1545
Glu Leu Phe Asn Lys Tyr Gly Ile Asn Tyr Gln Gln Gly Asp Ile
1550 1555 1560
Arg Ala Leu Leu Cys Glu Gln Ser Asp Lys Ala Phe Tyr Ser Ser
1565 1570 1575
Phe Met Ala Leu Met Ser Leu Met Leu Gln Met Arg Asn Ser Ile
1580 1585 1590
Thr Gly Arg Thr Asp Val Ala Phe Leu Ile Ser Pro Val Lys Asn
1595 1600 1605
Ser Asp Gly Ile Phe Tyr Asp Ser Arg Asn Tyr Glu Ala Gln Glu
1610 1615 1620
Asn Ala Ile Leu Pro Lys Asn Ala Asp Ala Asn Gly Ala Tyr Asn
1625 1630 1635
Ile Ala Arg Lys Val Leu Trp Ala Ile Gly Gln Phe Lys Lys Ala
1640 1645 1650
Glu Asp Glu Lys Leu Asp Lys Val Lys Ile Ala Ile Ser Asn Lys
1655 1660 1665
Glu Trp Leu Glu Tyr Ala Gln Thr Ser Val Lys His Gly Ser Pro
1670 1675 1680
Lys Lys Lys Arg Lys Val
1685
<210> 82
<211> 4936
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 82
atgccgaaga agaagcgcaa ggtcatgacc gacgcggagt atgtgcgcat ccacgagaag 60
ctcgacatct acaccttcaa gaagcagttc ttcaacaaca agaagagcgt ctcccacagg 120
tgctacgtgc tcttcgagct gaagaggcgc ggcgagcgca gggcctgctt ctggggctac 180
gccgtgaaca agccgcagag cggcaccgag cgcggcatcc acgccgagat cttcagcatc 240
cgcaaggtgg aggagtacct cagggacaac ccgggccagt tcaccatcaa ctggtacagc 300
tcctggagcc cggtaagttt ctgcttctac ctttgatata tatataataa ttatcattaa 360
ttagtagtaa tataatattt caaatatttt tttcaaaata aaagaatgta gtatatagca 420
attgcttttc tgtagtttat aagtgtgtat attttaattt ataacttttc taatatatga 480
ccaaaatttg ttgatgtgca gtgcgcggac tgcgccgaga agatcctgga gtggtacaac 540
caggagctga ggggcaacgg ccacaccctg aagatctggg cctgcaagct ctactacgag 600
aagaacgcga ggaaccagat cggcctgtgg aacctccgcg acaacggcgt cggcctcaac 660
gtgatggtct ccgagcacta ccagtgctgc cgcaagatct tcatccagtc cagccacaac 720
cagctcaacg agaacaggtg gctggagaag accctgaaga gggccgagaa gcgcaggtcc 780
gagctcagca tcatgatcca ggtgaagatc ctccacacca cgaagtcccc cgccgtgggg 840
gggcgggggc tcaggcgggg gcgggagcgg cggcgggggc tctgggggcg gcggcagcgg 900
cgggggcggc agcgggggcg gcgggtcgat gagcaagctg gagaagttca cgaactgcta 960
ctccctcagc aagaccctga ggttcaaggc gatcccggtc ggcaagaccc aggagaacat 1020
cgacaacaag cggctgctgg tggaggacga gaagagggct gaggactaca agggcgtgaa 1080
gaagctcctg gaccgctact acctgtcctt catcaacgac gtgctccaca gcatcaagct 1140
caagaacctg aacaactaca tcagcctctt caggaagaag acgcgcaccg agaaggagaa 1200
caaggagctc gagaacctgg agatcaacct gaggaaggag atcgccaagg cgttcaaggg 1260
caacgagggc tacaagtccc tcttcaagaa ggacatcatc gagacgatcc tcccggagtt 1320
cctggacgac aaggacgaga tcgccctggt caactccttc aacggcttca ccacggcgtt 1380
caccggcttc ttcgacaacc gcgagaacat gttcagcgag gaggccaagt ccacgagcat 1440
cgcgttcagg tgcatcaacg agaacctcac ccgctacatc tccaacatgg acatcttcga 1500
gaaggtcgac gcgatcttcg acaagcacga ggtgcaggag atcaaggaga agatcctgaa 1560
cagcgactac gacgtcgagg acttcttcga gggcgagttc ttcaacttcg tcctcacgca 1620
ggagggcatc gacgtgtaca acgccatcat cggtggcttc gtgaccgagt ccggcgagaa 1680
gatcaagggc ctgaacgagt acatcaacct ctacaaccag aagaccaagc agaagctgcc 1740
gaagttcaag cccctgtaca agcaggtgct ctccgacagg gagtccctca gcttctacgg 1800
cgagggctac acgagcgacg aggaggtcct ggaggtgttc cgcaacaccc tcaacaagaa 1860
cagcgagatc ttctccagca tcaagaagct cgagaagctg ttcaagaact tcgacgagta 1920
ctccagcgcc ggcatcttcg tcaagaacgg cccggcgatc tccacgatca gcaaggacat 1980
cttcggcgag tggaacgtga tccgcgacaa gtggaacgcc gagtacgacg acatccacct 2040
caagaagaag gcggtggtca ccgagaagta cgaggacgac aggcgcaagt ccttcaagaa 2100
gatcggctcc ttcagcctcg agcagctgca ggagtacgcc gacgcggacc tgagcgtggt 2160
cgagaagctc aaggagatca tcatccagaa ggtcgacgag atctacaagg tgtacggctc 2220
cagcgagaag ctcttcgacg cggacttcgt cctcgagaag tccctgaaga agaacgacgc 2280
cgtggtcgcg atcatgaagg acctcctgga ctccgtgaag agcttcgaga attacatcaa 2340
ggccttcttc ggcgagggca aggagacgaa cagggacgag tccttctacg gcgacttcgt 2400
cctggcctac gacatcctcc tgaaggtgga ccacatctac gacgcgatcc gcaactacgt 2460
gacccagaag ccgtacagca aggacaagtt caagctctac ttccagaacc cccagttcat 2520
gggcggctgg gacaaggaca aggagacgga ctacagggcg accatcctgc gctacggcag 2580
caagtactac ctcgccatca tggacaagaa gtacgcgaag tgcctgcaga agatcgacaa 2640
ggacgacgtc aacggcaact acgagaagat caactacaag ctcctgccgg gccccaacaa 2700
gatgctcccg aaggtgttct tctccaagaa gtggatggcc tactacaacc ccagcgagga 2760
catccagaag atctacaaga acggcacgtt caagaagggc gacatgttca acctgaacga 2820
ctgccacaag ctcatcgact tcttcaagga ctccatcagc cgctacccga agtggtccaa 2880
cgcctacgac ttcaacttca gcgagaccga gaagtacaag gacatcgcgg gcttctaccg 2940
cgaggtcgag gagcagggct acaaggtgtc cttcgagtcc gccagcaaga aggaggtcga 3000
caagctggtg gaggagggca agctctacat gttccagatc tacaacaagg acttctccga 3060
caagagccac ggcacgccca acctgcacac catgtacttc aagctcctgt tcgacgagaa 3120
caaccacggc cagatcaggc tgtccggcgg cgccgagctc ttcatgagga gggcgagcct 3180
gaagaaggag gagctggtgg tccaccccgc taacagccca atcgcgaaca agaacccgga 3240
caaccccaag aagaccacga ccctgtccta cgacgtgtac aaggacaaga ggttcagcga 3300
ggaccagtac gagctccaca tcccgatcgc gatcaacaag tgccccaaga acatcttcaa 3360
gatcaacacc gaggtccgcg tgctcctgaa gcacgacgac aacccctacg tgatcggcat 3420
cgctaggggc gagaggaacc tcctgtacat cgtggtcgtg gacggcaagg gcaacatcgt 3480
ggagcagtac tccctcaacg agatcatcaa caacttcaac ggcatcagga tcaagacgga 3540
ctaccacagc ctcctggaca agaaggagaa ggagaggttc gaggcccgcc agaactggac 3600
ctccatcgag aacatcaagg agctgaaggc gggctacatc agccaggtcg tgcacaagat 3660
ctgcgagctc gtcgagaagt acgacgccgt gatcgccctc gcggacctga actccggctt 3720
caagaacagc cgcgtcaagg tggagaagca ggtctaccag aagttcgaga agatgctcat 3780
cgacaagctg aactacatgg tggacaagaa gtccaacccc tgcgctacgg gcggcgcgct 3840
gaagggctac cagatcacca acaagttcga gagcttcaag tccatgagca ctcagaacgg 3900
cttcatcttc tacatcccgg cgtggctcac gtccaagatc gaccccagca ccggcttcgt 3960
caacctcctg aagacgaagt acacctccat cgccgacagc aagaagttca tctccagctt 4020
cgaccgcatc atgtatgtgc cggaggagga cctgttcgag ttcgccctcg actacaagaa 4080
cttctcccgc acggacgcgg actacatcaa gaagtggaag ctgtacagct acggcaaccg 4140
catccgcatc ttcaggaacc ccaagaagaa caacgtcttc gactgggagg aggtgtgcct 4200
gacctccgcg tacaaggagc tcttcaacaa gtacggcatc aactaccagc agggcgacat 4260
cagggctctc ctgtgcgagc agagcgacaa ggccttctac tccagcttca tggcgctgat 4320
gtccctcatg ctgcagatga ggaactcgat caccggcagg acggacgtgg ccttcctcat 4380
ctccccggtg aagaacagcg acggcatctt ctacgactcc aggaactacg aggcccagga 4440
gaacgcgatc ctcccaaaga acgcggacgc caacggcgcc tacaacatcg ccaggaaggt 4500
cctctgggct atcggccagt tcaagaaggc ggaggacgag aagctggaca aggtgaagat 4560
cgccatcagc aacaaggagt ggctcgagta cgcccagacc tcggtcaagc acggcagccc 4620
gaagaagaag cgcaaggtgt ccggcggcag cacgaacctg tccgacatca tcgagaagga 4680
gaccggcaag cagctcgtga tccaggagag catcctcatg ctgccggagg aggtcgagga 4740
ggtcatcggc aacaagcccg agtccgacat cctcgtccac acggcctacg acgagtccac 4800
cgacgagaac gtgatgctcc tgacctcgga cgctcccgag tacaagccat gggccctggt 4860
catccaggac agcaacggcg agaacaagat caagatgctc tccggcggca gcccgaagaa 4920
gaagcgcaaa gtgtga 4936
<210> 83
<211> 1636
<212> PRT
<213> Artificial Sequence
<220>
<223> Fusion protein
<400> 83
Met Pro Lys Lys Lys Arg Lys Val Met Thr Asp Ala Glu Tyr Val Arg
1 5 10 15
Ile His Glu Lys Leu Asp Ile Tyr Thr Phe Lys Lys Gln Phe Phe Asn
20 25 30
Asn Lys Lys Ser Val Ser His Arg Cys Tyr Val Leu Phe Glu Leu Lys
35 40 45
Arg Arg Gly Glu Arg Arg Ala Cys Phe Trp Gly Tyr Ala Val Asn Lys
50 55 60
Pro Gln Ser Gly Thr Glu Arg Gly Ile His Ala Glu Ile Phe Ser Ile
65 70 75 80
Arg Lys Val Glu Glu Tyr Leu Arg Asp Asn Pro Gly Gln Phe Thr Ile
85 90 95
Asn Trp Tyr Ser Ser Trp Ser Pro Val Ser Phe Cys Phe Tyr Leu Tyr
100 105 110
Ile Tyr Asn Asn Tyr His Leu Val Val Ile Tyr Phe Lys Tyr Phe Phe
115 120 125
Gln Asn Lys Arg Met Tyr Ile Ala Ile Ala Phe Leu Phe Ile Ser Val
130 135 140
Tyr Ile Leu Ile Tyr Asn Phe Ser Asn Ile Pro Lys Phe Val Asp Val
145 150 155 160
Gln Cys Ala Asp Cys Ala Glu Lys Ile Leu Glu Trp Tyr Asn Gln Glu
165 170 175
Leu Arg Gly Asn Gly His Thr Leu Lys Ile Trp Ala Cys Lys Leu Tyr
180 185 190
Tyr Glu Lys Asn Ala Arg Asn Gln Ile Gly Leu Trp Asn Leu Arg Asp
195 200 205
Asn Gly Val Gly Leu Asn Val Met Val Ser Glu His Tyr Gln Cys Cys
210 215 220
Arg Lys Ile Phe Ile Gln Ser Ser His Asn Gln Leu Asn Glu Asn Arg
225 230 235 240
Trp Leu Glu Lys Thr Leu Lys Arg Ala Glu Lys Arg Arg Ser Glu Leu
245 250 255
Ser Ile Met Ile Gln Val Lys Ile Leu His Thr Thr Lys Ser Pro Ala
260 265 270
Val Gly Gly Arg Gly Leu Arg Arg Gly Arg Glu Arg Arg Arg Gly Leu
275 280 285
Trp Gly Arg Arg Gln Arg Arg Gly Arg Gln Arg Gly Arg Arg Val Asp
290 295 300
Glu Gln Ala Gly Glu Val His Glu Leu Leu Leu Pro Gln Gln Asp Pro
305 310 315 320
Glu Val Gln Gly Asp Pro Gly Arg Gln Asp Pro Gly Glu His Arg Gln
325 330 335
Gln Ala Ala Ala Gly Gly Gly Arg Glu Glu Gly Gly Leu Gln Gly Arg
340 345 350
Glu Glu Ala Pro Gly Pro Leu Leu Pro Val Leu His Gln Arg Arg Ala
355 360 365
Pro Gln His Gln Ala Gln Glu Pro Glu Gln Leu His Gln Pro Leu Gln
370 375 380
Glu Glu Asp Ala His Arg Glu Gly Glu Gln Gly Ala Arg Glu Pro Gly
385 390 395 400
Asp Gln Pro Glu Glu Gly Asp Arg Gln Gly Val Gln Gly Gln Arg Gly
405 410 415
Leu Gln Val Pro Leu Gln Glu Gly His His Arg Asp Asp Pro Pro Gly
420 425 430
Val Pro Gly Arg Gln Gly Arg Asp Arg Pro Gly Gln Leu Leu Gln Arg
435 440 445
Leu His His Gly Val His Arg Leu Leu Arg Gln Pro Arg Glu His Val
450 455 460
Gln Arg Gly Gly Gln Val His Glu His Arg Val Gln Val His Gln Arg
465 470 475 480
Glu Pro His Pro Leu His Leu Gln His Gly His Leu Arg Glu Gly Arg
485 490 495
Arg Asp Leu Arg Gln Ala Arg Gly Ala Gly Asp Gln Gly Glu Asp Pro
500 505 510
Glu Gln Arg Leu Arg Arg Arg Gly Leu Leu Arg Gly Arg Val Leu Gln
515 520 525
Leu Arg Pro His Ala Gly Gly His Arg Arg Val Gln Arg His His Arg
530 535 540
Trp Leu Arg Asp Arg Val Arg Arg Glu Asp Gln Gly Pro Glu Arg Val
545 550 555 560
His Gln Pro Leu Gln Pro Glu Asp Gln Ala Glu Ala Ala Glu Val Gln
565 570 575
Ala Pro Val Gln Ala Gly Ala Leu Arg Gln Gly Val Pro Gln Leu Leu
580 585 590
Arg Arg Gly Leu His Glu Arg Arg Gly Gly Pro Gly Gly Val Pro Gln
595 600 605
His Pro Gln Gln Glu Gln Arg Asp Leu Leu Gln His Gln Glu Ala Arg
610 615 620
Glu Ala Val Gln Glu Leu Arg Arg Val Leu Gln Arg Arg His Leu Arg
625 630 635 640
Gln Glu Arg Pro Gly Asp Leu His Asp Gln Gln Gly His Leu Arg Arg
645 650 655
Val Glu Arg Asp Pro Arg Gln Val Glu Arg Arg Val Arg Arg His Pro
660 665 670
Pro Gln Glu Glu Gly Gly Gly His Arg Glu Val Arg Gly Arg Gln Ala
675 680 685
Gln Val Leu Gln Glu Asp Arg Leu Leu Gln Pro Arg Ala Ala Ala Gly
690 695 700
Val Arg Arg Arg Gly Pro Glu Arg Gly Arg Glu Ala Gln Gly Asp His
705 710 715 720
His Pro Glu Gly Arg Arg Asp Leu Gln Gly Val Arg Leu Gln Arg Glu
725 730 735
Ala Leu Arg Arg Gly Leu Arg Pro Arg Glu Val Pro Glu Glu Glu Arg
740 745 750
Arg Arg Gly Arg Asp His Glu Gly Pro Pro Gly Leu Arg Glu Glu Leu
755 760 765
Arg Glu Leu His Gln Gly Leu Leu Arg Arg Gly Gln Gly Asp Glu Gln
770 775 780
Gly Arg Val Leu Leu Arg Arg Leu Arg Pro Gly Leu Arg His Pro Pro
785 790 795 800
Glu Gly Gly Pro His Leu Arg Arg Asp Pro Gln Leu Arg Asp Pro Glu
805 810 815
Ala Val Gln Gln Gly Gln Val Gln Ala Leu Leu Pro Glu Pro Pro Val
820 825 830
His Gly Arg Leu Gly Gln Gly Gln Gly Asp Gly Leu Gln Gly Asp His
835 840 845
Pro Ala Leu Arg Gln Gln Val Leu Pro Arg His His Gly Gln Glu Val
850 855 860
Arg Glu Val Pro Ala Glu Asp Arg Gln Gly Arg Arg Gln Arg Gln Leu
865 870 875 880
Arg Glu Asp Gln Leu Gln Ala Pro Ala Gly Pro Gln Gln Asp Ala Pro
885 890 895
Glu Gly Val Leu Leu Gln Glu Val Asp Gly Leu Leu Gln Pro Gln Arg
900 905 910
Gly His Pro Glu Asp Leu Gln Glu Arg His Val Gln Glu Gly Arg His
915 920 925
Val Gln Pro Glu Arg Leu Pro Gln Ala His Arg Leu Leu Gln Gly Leu
930 935 940
His Gln Pro Leu Pro Glu Val Val Gln Arg Leu Arg Leu Gln Leu Gln
945 950 955 960
Arg Asp Arg Glu Val Gln Gly His Arg Gly Leu Leu Pro Arg Gly Arg
965 970 975
Gly Ala Gly Leu Gln Gly Val Leu Arg Val Arg Gln Gln Glu Gly Gly
980 985 990
Arg Gln Ala Gly Gly Gly Gly Gln Ala Leu His Val Pro Asp Leu Gln
995 1000 1005
Gln Gly Leu Leu Arg Gln Glu Pro Arg His Ala Gln Pro Ala His
1010 1015 1020
His Val Leu Gln Ala Pro Val Arg Arg Glu Gln Pro Arg Pro Asp
1025 1030 1035
Gln Ala Val Arg Arg Arg Arg Ala Leu His Glu Glu Gly Glu Pro
1040 1045 1050
Glu Glu Gly Gly Ala Gly Gly Pro Pro Arg Gln Pro Asn Arg Glu
1055 1060 1065
Gln Glu Pro Gly Gln Pro Gln Glu Asp His Asp Pro Val Leu Arg
1070 1075 1080
Arg Val Gln Gly Gln Glu Val Gln Arg Gly Pro Val Arg Ala Pro
1085 1090 1095
His Pro Asp Arg Asp Gln Gln Val Pro Gln Glu His Leu Gln Asp
1100 1105 1110
Gln His Arg Gly Pro Arg Ala Pro Glu Ala Arg Arg Gln Pro Leu
1115 1120 1125
Arg Asp Arg His Arg Gly Arg Glu Glu Pro Pro Val His Arg Gly
1130 1135 1140
Arg Gly Arg Gln Gly Gln His Arg Gly Ala Val Leu Pro Gln Arg
1145 1150 1155
Asp His Gln Gln Leu Gln Arg His Gln Asp Gln Asp Gly Leu Pro
1160 1165 1170
Gln Pro Pro Gly Gln Glu Gly Glu Gly Glu Val Arg Gly Pro Pro
1175 1180 1185
Glu Leu Asp Leu His Arg Glu His Gln Gly Ala Glu Gly Gly Leu
1190 1195 1200
His Gln Pro Gly Arg Ala Gln Asp Leu Arg Ala Arg Arg Glu Val
1205 1210 1215
Arg Arg Arg Asp Arg Pro Arg Gly Pro Glu Leu Arg Leu Gln Glu
1220 1225 1230
Gln Pro Arg Gln Gly Gly Glu Ala Gly Leu Pro Glu Val Arg Glu
1235 1240 1245
Asp Ala His Arg Gln Ala Glu Leu His Gly Gly Gln Glu Val Gln
1250 1255 1260
Pro Leu Arg Tyr Gly Arg Arg Ala Glu Gly Leu Pro Asp His Gln
1265 1270 1275
Gln Val Arg Glu Leu Gln Val His Glu His Ser Glu Arg Leu His
1280 1285 1290
Leu Leu His Pro Gly Val Ala His Val Gln Asp Arg Pro Gln His
1295 1300 1305
Arg Leu Arg Gln Pro Pro Glu Asp Glu Val His Leu His Arg Arg
1310 1315 1320
Gln Gln Glu Val His Leu Gln Leu Arg Pro His His Val Cys Ala
1325 1330 1335
Gly Gly Gly Pro Val Arg Val Arg Pro Arg Leu Gln Glu Leu Leu
1340 1345 1350
Pro His Gly Arg Gly Leu His Gln Glu Val Glu Ala Val Gln Leu
1355 1360 1365
Arg Gln Pro His Pro His Leu Gln Glu Pro Gln Glu Glu Gln Arg
1370 1375 1380
Leu Arg Leu Gly Gly Gly Val Pro Asp Leu Arg Val Gln Gly Ala
1385 1390 1395
Leu Gln Gln Val Arg His Gln Leu Pro Ala Gly Arg His Gln Gly
1400 1405 1410
Ser Pro Val Arg Ala Glu Arg Gln Gly Leu Leu Leu Gln Leu His
1415 1420 1425
Gly Ala Asp Val Pro His Ala Ala Asp Glu Glu Leu Asp His Arg
1430 1435 1440
Gln Asp Gly Arg Gly Leu Pro His Leu Pro Gly Glu Glu Gln Arg
1445 1450 1455
Arg His Leu Leu Arg Leu Gln Glu Leu Arg Gly Pro Gly Glu Arg
1460 1465 1470
Asp Pro Pro Lys Glu Arg Gly Arg Gln Arg Arg Leu Gln His Arg
1475 1480 1485
Gln Glu Gly Pro Leu Gly Tyr Arg Pro Val Gln Glu Gly Gly Gly
1490 1495 1500
Arg Glu Ala Gly Gln Gly Glu Asp Arg His Gln Gln Gln Gly Val
1505 1510 1515
Ala Arg Val Arg Pro Asp Leu Gly Gln Ala Arg Gln Pro Glu Glu
1520 1525 1530
Glu Ala Gln Gly Val Arg Arg Gln His Glu Pro Val Arg His His
1535 1540 1545
Arg Glu Gly Asp Arg Gln Ala Ala Arg Asp Pro Gly Glu His Pro
1550 1555 1560
His Ala Ala Gly Gly Gly Arg Gly Gly His Arg Gln Gln Ala Arg
1565 1570 1575
Val Arg His Pro Arg Pro His Gly Leu Arg Arg Val His Arg Arg
1580 1585 1590
Glu Arg Asp Ala Pro Asp Leu Gly Arg Ser Arg Val Gln Ala Met
1595 1600 1605
Gly Pro Gly His Pro Gly Gln Gln Arg Arg Glu Gln Asp Gln Asp
1610 1615 1620
Ala Leu Arg Arg Gln Pro Glu Glu Glu Ala Gln Ser Val
1625 1630 1635
<210> 84
<211> 6210
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 84
atgtccgagg tggagttcag ccacgagtac tggatgaggc acgctctcac cctggctaag 60
agggcgtggg acgagaggga ggtgccggtg ggcgccgtgc tcgtccacaa caaccgcgtg 120
atcggcgagg gctggaacag gcccatcggc aggcacgacc caaccgctca cgccgagatc 180
atggctctca ggcagggcgg cctggtcatg cagaactaca ggctgatcga cgcgaccctc 240
tacgtgaccc tcgagccctg cgtcatggta agtttctgct tctacctttg atatatatat 300
aataattatc attaattagt agtaatataa tatttcaaat atttttttca aaataaaaga 360
atgtagtata tagcaattgc ttttctgtag tttataagtg tgtatatttt aatttataac 420
ttttctaata tatgaccaaa atttgttgat gtgcagtgcg cgggcgccat gatccactcc 480
aggatcggca gggtggtctt cggcgctagg gacgccaaga cgggcgctgc gggcagcctc 540
atggacgtgc tgcaccaccc cggcatgaac caccgcgtcg agatcaccga gggcatcctc 600
gcggacgagt gcgctgcgct cctgtccgac ttcttcagga tgcgcaggca ggagatcaag 660
gcccagaaga aggcgcagtc cagcaccgac tccggcggct ccagcggcgg ctccagcggc 720
agcgagaccc cgggcacgtc cgagagcgcg acgcccgaga gcagcggcgg ctccagcggc 780
ggctcctcgg aggtcgagtt cagccatgag tactggatga ggcatgccct gactctcgct 840
aagagggcgc gggatgagcg cgaggtgccg gtgggggccg tgctcgtcct gaacaaccgc 900
gtgatcgggg agggctggaa ccgggctatc ggcctccacg acccaacggc ccatgccgag 960
atcatggccc tgaggcaggg cggcctggtc atgcaaaact acaggctcat cgacgccacc 1020
ctctacgtga ccttcgagcc atgcgtgatg tgcgcggggg ccatgatcca ctcgaggatt 1080
gggagggtgg tcttcggcgt gcgcaacgct aagacggggg ccgccggcag cctcatggac 1140
gtcctgcact acccgggcat gaaccacagg gtggagatta ccgagggcat cctggccgat 1200
gagtgcgccg cgctcctgtg ctacttcttc cgcatgccca ggcaggtctt caacgcgcag 1260
aagaaggccc agagctccac tgatgggggc gggggctcag gcgggggcgg gagcggcggc 1320
gggggctctg ggggcggcgg cagcggcggg ggcggcagcg ggggcggcgg gtcgatgagc 1380
aagctggaga agttcacgaa ctgctactcc ctcagcaaga ccctgaggtt caaggcgatc 1440
ccggtcggca agacccagga gaacatcgac aacaagcggc tgctggtgga ggacgagaag 1500
agggctgagg actacaaggg cgtgaagaag ctcctggacc gctactacct gtccttcatc 1560
aacgacgtgc tccacagcat caagctcaag aacctgaaca actacatcag cctcttcagg 1620
aagaagacgc gcaccgagaa ggagaacaag gagctcgaga acctggagat caacctgagg 1680
aaggagatcg ccaaggcgtt caagggcaac gagggctaca agtccctctt caagaaggac 1740
atcatcgaga cgatcctccc ggagttcctg gacgacaagg acgagatcgc cctggtcaac 1800
tccttcaacg gcttcaccac ggcgttcacc ggcttcttcg acaaccgcga gaacatgttc 1860
agcgaggagg ccaagtccac gagcatcgcg ttcaggtgca tcaacgagaa cctcacccgc 1920
tacatctcca acatggacat cttcgagaag gtcgacgcga tcttcgacaa gcacgaggtg 1980
caggagatca aggagaagat cctgaacagc gactacgacg tcgaggactt cttcgagggc 2040
gagttcttca acttcgtcct cacgcaggag ggcatcgacg tgtacaacgc catcatcggt 2100
ggcttcgtga ccgagtccgg cgagaagatc aagggcctga acgagtacat caacctctac 2160
aaccagaaga ccaagcagaa gctgccgaag ttcaagcccc tgtacaagca ggtgctctcc 2220
gacagggagt ccctcagctt ctacggcgag ggctacacga gcgacgagga ggtcctggag 2280
gtgttccgca acaccctcaa caagaacagc gagatcttct ccagcatcaa gaagctcgag 2340
aagctgttca agaacttcga cgagtactcc agcgccggca tcttcgtcaa gaacggcccg 2400
gcgatctcca cgatcagcaa ggacatcttc ggcgagtgga acgtgatccg cgacaagtgg 2460
aacgccgagt acgacgacat ccacctcaag aagaaggcgg tggtcaccga gaagtacgag 2520
gacgacaggc gcaagtcctt caagaagatc ggctccttca gcctcgagca gctgcaggag 2580
tacgccgacg cggacctgag cgtggtcgag aagctcaagg agatcatcat ccagaaggtc 2640
gacgagatct acaaggtgta cggctccagc gagaagctct tcgacgcgga cttcgtcctc 2700
gagaagtccc tgaagaagaa cgacgccgtg gtcgcgatca tgaaggacct cctggactcc 2760
gtgaagagct tcgagaatta catcaaggcc ttcttcggcg agggcaagga gacgaacagg 2820
gacgagtcct tctacggcga cttcgtcctg gcctacgaca tcctcctgaa ggtggaccac 2880
atctacgacg cgatccgcaa ctacgtgacc cagaagccgt acagcaagga caagttcaag 2940
ctctacttcc agaaccccca gttcatgggc ggctgggaca aggacaagga gacggactac 3000
agggcgacca tcctgcgcta cggcagcaag tactacctcg ccatcatgga caagaagtac 3060
gcgaagtgcc tgcagaagat cgacaaggac gacgtcaacg gcaactacga gaagatcaac 3120
tacaagctcc tgccgggccc caacaagatg ctcccgaagg tgttcttctc caagaagtgg 3180
atggcctact acaaccccag cgaggacatc cagaagatct acaagaacgg cacgttcaag 3240
aagggcgaca tgttcaacct gaacgactgc cacaagctca tcgacttctt caaggactcc 3300
atcagccgct acccgaagtg gtccaacgcc tacgacttca acttcagcga gaccgagaag 3360
tacaaggaca tcgcgggctt ctaccgcgag gtcgaggagc agggctacaa ggtgtccttc 3420
gagtccgcca gcaagaagga ggtcgacaag ctggtggagg agggcaagct ctacatgttc 3480
cagatctaca acaaggactt ctccgacaag agccacggca cgcccaacct gcacaccatg 3540
tacttcaagc tcctgttcga cgagaacaac cacggccaga tcaggctgtc cggcggcgcc 3600
gagctcttca tgaggagggc gagcctgaag aaggaggagc tggtggtcca ccccgctaac 3660
agcccaatcg cgaacaagaa cccggacaac cccaagaaga ccacgaccct gtcctacgac 3720
gtgtacaagg acaagaggtt cagcgaggac cagtacgagc tccacatccc gatcgcgatc 3780
aacaagtgcc ccaagaacat cttcaagatc aacaccgagg tccgcgtgct cctgaagcac 3840
gacgacaacc cctacgtgat cggcatcgct aggggcgaga ggaacctcct gtacatcgtg 3900
gtcgtggacg gcaagggcaa catcgtggag cagtactccc tcaacgagat catcaacaac 3960
ttcaacggca tcaggatcaa gacggactac cacagcctcc tggacaagaa ggagaaggag 4020
aggttcgagg cccgccagaa ctggacctcc atcgagaaca tcaaggagct gaaggcgggc 4080
tacatcagcc aggtcgtgca caagatctgc gagctcgtcg agaagtacga cgccgtgatc 4140
gccctcgcgg acctgaactc cggcttcaag aacagccgcg tcaaggtgga gaagcaggtc 4200
taccagaagt tcgagaagat gctcatcgac aagctgaact acatggtgga caagaagtcc 4260
aacccctgcg ctacgggcgg cgcgctgaag ggctaccaga tcaccaacaa gttcgagagc 4320
ttcaagtcca tgagcactca gaacggcttc atcttctaca tcccggcgtg gctcacgtcc 4380
aagatcgacc ccagcaccgg cttcgtcaac ctcctgaaga cgaagtacac ctccatcgcc 4440
gacagcaaga agttcatctc cagcttcgac cgcatcatgt atgtgccgga ggaggacctg 4500
ttcgagttcg ccctcgacta caagaacttc tcccgcacgg acgcggacta catcaagaag 4560
tggaagctgt acagctacgg caaccgcatc cgcatcttca ggaaccccaa gaagaacaac 4620
gtcttcgact gggaggaggt gtgcctgacc tccgcgtaca aggagctctt caacaagtac 4680
ggcatcaact accagcaggg cgacatcagg gctctcctgt gcgagcagag cgacaaggcc 4740
ttctactcca gcttcatggc gctgatgtcc ctcatgctgc agatgaggaa ctcgatcacc 4800
ggcaggacgg acgtggcctt cctcatctcc ccggtgaaga acagcgacgg catcttctac 4860
gactccagga actacgaggc ccaggagaac gcgatcctcc caaagaacgc ggacgccaac 4920
ggcgcctaca acatcgccag gaaggtcctc tgggctatcg gccagttcaa gaaggcggag 4980
gacgagaagc tggacaaggt gaagatcgcc atcagcaaca aggagtggct cgagtacgcc 5040
cagacctcgg tcaagcacgg cagcccgaag aagaagcgca aggtgggcag cgcggagtac 5100
gttcgggctc tgttcgactt caacggcaac gacgaggagg acctcccgtt caagaagggc 5160
gacatcctgc gcatcaggga caagccggag gagcagtggt ggaacgccga ggactccgag 5220
ggcaagaggg gcatgatccc ggtcccctac gtggagaagt acatgaccga cgcggagtat 5280
gtgcgcatcc acgagaagct cgacatctac accttcaaga agcagttctt caacaacaag 5340
aagagcgtct cccacaggtg ctacgtgctc ttcgagctga agaggcgcgg cgagcgcagg 5400
gcctgcttct ggggctacgc cgtgaacaag ccgcagagcg gcaccgagcg cggcatccac 5460
gccgagatct tcagcatccg caaggtggag gagtacctca gggacaaccc gggccagttc 5520
accatcaact ggtacagctc ctggagcccg tgcgcggact gcgccgagaa gatcctggag 5580
tggtacaacc aggagctgag gggcaacggc cacaccctga agatctgggc ctgcaagctc 5640
tactacgaga agaacgcgag gaaccagatc ggcctgtgga acctccgcga caacggcgtc 5700
ggcctcaacg tgatggtctc cgagcactac cagtgctgcc gcaagatctt catccagtcc 5760
agccacaacc agctcaacga gaacaggtgg ctggagaaga ccctgaagag ggccgagaag 5820
cgcaggtccg agctcagcat catgatccag gtgaagatcc tccacaccac gaagtccccc 5880
gccgtgggca gcccgaagaa gaagcgcaag gtgtccggcg gcagcacgaa cctgtccgac 5940
atcatcgaga aggagaccgg caagcagctc gtgatccagg agagcatcct catgctgccg 6000
gaggaggtcg aggaggtcat cggcaacaag cccgagtccg acatcctcgt ccacacggcc 6060
tacgacgagt ccaccgacga gaacgtgatg ctcctgacct cggacgctcc cgagtacaag 6120
ccatgggccc tggtcatcca ggacagcaac ggcgagaaca agatcaagat gctctccggc 6180
ggcagcccga agaagaagcg caaagtgtga 6210
<210> 85
<211> 2063
<212> PRT
<213> Artificial Sequence
<220>
<223> Fusion protein
<400> 85
Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu
1 5 10 15
Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala
20 25 30
Val Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro
35 40 45
Ile Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg
50 55 60
Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu
65 70 75 80
Tyr Val Thr Leu Glu Pro Cys Val Met Val Ser Phe Cys Phe Tyr Leu
85 90 95
Tyr Ile Tyr Asn Asn Tyr His Leu Val Val Ile Tyr Phe Lys Tyr Phe
100 105 110
Phe Gln Asn Lys Arg Met Tyr Ile Ala Ile Ala Phe Leu Phe Ile Ser
115 120 125
Val Tyr Ile Leu Ile Tyr Asn Phe Ser Asn Ile Pro Lys Phe Val Asp
130 135 140
Val Gln Cys Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val
145 150 155 160
Phe Gly Ala Arg Asp Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp
165 170 175
Val Leu His His Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly
180 185 190
Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu Ser Asp Phe Phe Arg Met
195 200 205
Arg Arg Gln Glu Ile Lys Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp
210 215 220
Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr
225 230 235 240
Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser
245 250 255
Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr
260 265 270
Leu Ala Lys Arg Ala Arg Asp Glu Arg Glu Val Pro Val Gly Ala Val
275 280 285
Leu Val Leu Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Ala Ile
290 295 300
Gly Leu His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln
305 310 315 320
Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr
325 330 335
Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser
340 345 350
Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly Ala
355 360 365
Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His Arg
370 375 380
Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu
385 390 395 400
Cys Tyr Phe Phe Arg Met Pro Arg Gln Val Phe Asn Ala Gln Lys Lys
405 410 415
Ala Gln Ser Ser Thr Asp Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
420 425 430
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
435 440 445
Gly Gly Gly Ser Met Ser Lys Leu Glu Lys Phe Thr Asn Cys Tyr Ser
450 455 460
Leu Ser Lys Thr Leu Arg Phe Lys Ala Ile Pro Val Gly Lys Thr Gln
465 470 475 480
Glu Asn Ile Asp Asn Lys Arg Leu Leu Val Glu Asp Glu Lys Arg Ala
485 490 495
Glu Asp Tyr Lys Gly Val Lys Lys Leu Leu Asp Arg Tyr Tyr Leu Ser
500 505 510
Phe Ile Asn Asp Val Leu His Ser Ile Lys Leu Lys Asn Leu Asn Asn
515 520 525
Tyr Ile Ser Leu Phe Arg Lys Lys Thr Arg Thr Glu Lys Glu Asn Lys
530 535 540
Glu Leu Glu Asn Leu Glu Ile Asn Leu Arg Lys Glu Ile Ala Lys Ala
545 550 555 560
Phe Lys Gly Asn Glu Gly Tyr Lys Ser Leu Phe Lys Lys Asp Ile Ile
565 570 575
Glu Thr Ile Leu Pro Glu Phe Leu Asp Asp Lys Asp Glu Ile Ala Leu
580 585 590
Val Asn Ser Phe Asn Gly Phe Thr Thr Ala Phe Thr Gly Phe Phe Asp
595 600 605
Asn Arg Glu Asn Met Phe Ser Glu Glu Ala Lys Ser Thr Ser Ile Ala
610 615 620
Phe Arg Cys Ile Asn Glu Asn Leu Thr Arg Tyr Ile Ser Asn Met Asp
625 630 635 640
Ile Phe Glu Lys Val Asp Ala Ile Phe Asp Lys His Glu Val Gln Glu
645 650 655
Ile Lys Glu Lys Ile Leu Asn Ser Asp Tyr Asp Val Glu Asp Phe Phe
660 665 670
Glu Gly Glu Phe Phe Asn Phe Val Leu Thr Gln Glu Gly Ile Asp Val
675 680 685
Tyr Asn Ala Ile Ile Gly Gly Phe Val Thr Glu Ser Gly Glu Lys Ile
690 695 700
Lys Gly Leu Asn Glu Tyr Ile Asn Leu Tyr Asn Gln Lys Thr Lys Gln
705 710 715 720
Lys Leu Pro Lys Phe Lys Pro Leu Tyr Lys Gln Val Leu Ser Asp Arg
725 730 735
Glu Ser Leu Ser Phe Tyr Gly Glu Gly Tyr Thr Ser Asp Glu Glu Val
740 745 750
Leu Glu Val Phe Arg Asn Thr Leu Asn Lys Asn Ser Glu Ile Phe Ser
755 760 765
Ser Ile Lys Lys Leu Glu Lys Leu Phe Lys Asn Phe Asp Glu Tyr Ser
770 775 780
Ser Ala Gly Ile Phe Val Lys Asn Gly Pro Ala Ile Ser Thr Ile Ser
785 790 795 800
Lys Asp Ile Phe Gly Glu Trp Asn Val Ile Arg Asp Lys Trp Asn Ala
805 810 815
Glu Tyr Asp Asp Ile His Leu Lys Lys Lys Ala Val Val Thr Glu Lys
820 825 830
Tyr Glu Asp Asp Arg Arg Lys Ser Phe Lys Lys Ile Gly Ser Phe Ser
835 840 845
Leu Glu Gln Leu Gln Glu Tyr Ala Asp Ala Asp Leu Ser Val Val Glu
850 855 860
Lys Leu Lys Glu Ile Ile Ile Gln Lys Val Asp Glu Ile Tyr Lys Val
865 870 875 880
Tyr Gly Ser Ser Glu Lys Leu Phe Asp Ala Asp Phe Val Leu Glu Lys
885 890 895
Ser Leu Lys Lys Asn Asp Ala Val Val Ala Ile Met Lys Asp Leu Leu
900 905 910
Asp Ser Val Lys Ser Phe Glu Asn Tyr Ile Lys Ala Phe Phe Gly Glu
915 920 925
Gly Lys Glu Thr Asn Arg Asp Glu Ser Phe Tyr Gly Asp Phe Val Leu
930 935 940
Ala Tyr Asp Ile Leu Leu Lys Val Asp His Ile Tyr Asp Ala Ile Arg
945 950 955 960
Asn Tyr Val Thr Gln Lys Pro Tyr Ser Lys Asp Lys Phe Lys Leu Tyr
965 970 975
Phe Gln Asn Pro Gln Phe Met Gly Gly Trp Asp Lys Asp Lys Glu Thr
980 985 990
Asp Tyr Arg Ala Thr Ile Leu Arg Tyr Gly Ser Lys Tyr Tyr Leu Ala
995 1000 1005
Ile Met Asp Lys Lys Tyr Ala Lys Cys Leu Gln Lys Ile Asp Lys
1010 1015 1020
Asp Asp Val Asn Gly Asn Tyr Glu Lys Ile Asn Tyr Lys Leu Leu
1025 1030 1035
Pro Gly Pro Asn Lys Met Leu Pro Lys Val Phe Phe Ser Lys Lys
1040 1045 1050
Trp Met Ala Tyr Tyr Asn Pro Ser Glu Asp Ile Gln Lys Ile Tyr
1055 1060 1065
Lys Asn Gly Thr Phe Lys Lys Gly Asp Met Phe Asn Leu Asn Asp
1070 1075 1080
Cys His Lys Leu Ile Asp Phe Phe Lys Asp Ser Ile Ser Arg Tyr
1085 1090 1095
Pro Lys Trp Ser Asn Ala Tyr Asp Phe Asn Phe Ser Glu Thr Glu
1100 1105 1110
Lys Tyr Lys Asp Ile Ala Gly Phe Tyr Arg Glu Val Glu Glu Gln
1115 1120 1125
Gly Tyr Lys Val Ser Phe Glu Ser Ala Ser Lys Lys Glu Val Asp
1130 1135 1140
Lys Leu Val Glu Glu Gly Lys Leu Tyr Met Phe Gln Ile Tyr Asn
1145 1150 1155
Lys Asp Phe Ser Asp Lys Ser His Gly Thr Pro Asn Leu His Thr
1160 1165 1170
Met Tyr Phe Lys Leu Leu Phe Asp Glu Asn Asn His Gly Gln Ile
1175 1180 1185
Arg Leu Ser Gly Gly Ala Glu Leu Phe Met Arg Arg Ala Ser Leu
1190 1195 1200
Lys Lys Glu Glu Leu Val Val His Pro Ala Asn Ser Pro Ile Ala
1205 1210 1215
Asn Lys Asn Pro Asp Asn Pro Lys Lys Thr Thr Thr Leu Ser Tyr
1220 1225 1230
Asp Val Tyr Lys Asp Lys Arg Phe Ser Glu Asp Gln Tyr Glu Leu
1235 1240 1245
His Ile Pro Ile Ala Ile Asn Lys Cys Pro Lys Asn Ile Phe Lys
1250 1255 1260
Ile Asn Thr Glu Val Arg Val Leu Leu Lys His Asp Asp Asn Pro
1265 1270 1275
Tyr Val Ile Gly Ile Ala Arg Gly Glu Arg Asn Leu Leu Tyr Ile
1280 1285 1290
Val Val Val Asp Gly Lys Gly Asn Ile Val Glu Gln Tyr Ser Leu
1295 1300 1305
Asn Glu Ile Ile Asn Asn Phe Asn Gly Ile Arg Ile Lys Thr Asp
1310 1315 1320
Tyr His Ser Leu Leu Asp Lys Lys Glu Lys Glu Arg Phe Glu Ala
1325 1330 1335
Arg Gln Asn Trp Thr Ser Ile Glu Asn Ile Lys Glu Leu Lys Ala
1340 1345 1350
Gly Tyr Ile Ser Gln Val Val His Lys Ile Cys Glu Leu Val Glu
1355 1360 1365
Lys Tyr Asp Ala Val Ile Ala Leu Ala Asp Leu Asn Ser Gly Phe
1370 1375 1380
Lys Asn Ser Arg Val Lys Val Glu Lys Gln Val Tyr Gln Lys Phe
1385 1390 1395
Glu Lys Met Leu Ile Asp Lys Leu Asn Tyr Met Val Asp Lys Lys
1400 1405 1410
Ser Asn Pro Cys Ala Thr Gly Gly Ala Leu Lys Gly Tyr Gln Ile
1415 1420 1425
Thr Asn Lys Phe Glu Ser Phe Lys Ser Met Ser Thr Gln Asn Gly
1430 1435 1440
Phe Ile Phe Tyr Ile Pro Ala Trp Leu Thr Ser Lys Ile Asp Pro
1445 1450 1455
Ser Thr Gly Phe Val Asn Leu Leu Lys Thr Lys Tyr Thr Ser Ile
1460 1465 1470
Ala Asp Ser Lys Lys Phe Ile Ser Ser Phe Asp Arg Ile Met Tyr
1475 1480 1485
Val Pro Glu Glu Asp Leu Phe Glu Phe Ala Leu Asp Tyr Lys Asn
1490 1495 1500
Phe Ser Arg Thr Asp Ala Asp Tyr Ile Lys Lys Trp Lys Leu Tyr
1505 1510 1515
Ser Tyr Gly Asn Arg Ile Arg Ile Phe Arg Asn Pro Lys Lys Asn
1520 1525 1530
Asn Val Phe Asp Trp Glu Glu Val Cys Leu Thr Ser Ala Tyr Lys
1535 1540 1545
Glu Leu Phe Asn Lys Tyr Gly Ile Asn Tyr Gln Gln Gly Asp Ile
1550 1555 1560
Arg Ala Leu Leu Cys Glu Gln Ser Asp Lys Ala Phe Tyr Ser Ser
1565 1570 1575
Phe Met Ala Leu Met Ser Leu Met Leu Gln Met Arg Asn Ser Ile
1580 1585 1590
Thr Gly Arg Thr Asp Val Ala Phe Leu Ile Ser Pro Val Lys Asn
1595 1600 1605
Ser Asp Gly Ile Phe Tyr Asp Ser Arg Asn Tyr Glu Ala Gln Glu
1610 1615 1620
Asn Ala Ile Leu Pro Lys Asn Ala Asp Ala Asn Gly Ala Tyr Asn
1625 1630 1635
Ile Ala Arg Lys Val Leu Trp Ala Ile Gly Gln Phe Lys Lys Ala
1640 1645 1650
Glu Asp Glu Lys Leu Asp Lys Val Lys Ile Ala Ile Ser Asn Lys
1655 1660 1665
Glu Trp Leu Glu Tyr Ala Gln Thr Ser Val Lys His Gly Ser Pro
1670 1675 1680
Lys Lys Lys Arg Lys Val Gly Ser Ala Glu Tyr Val Arg Ala Leu
1685 1690 1695
Phe Asp Phe Asn Gly Asn Asp Glu Glu Asp Leu Pro Phe Lys Lys
1700 1705 1710
Gly Asp Ile Leu Arg Ile Arg Asp Lys Pro Glu Glu Gln Trp Trp
1715 1720 1725
Asn Ala Glu Asp Ser Glu Gly Lys Arg Gly Met Ile Pro Val Pro
1730 1735 1740
Tyr Val Glu Lys Tyr Met Thr Asp Ala Glu Tyr Val Arg Ile His
1745 1750 1755
Glu Lys Leu Asp Ile Tyr Thr Phe Lys Lys Gln Phe Phe Asn Asn
1760 1765 1770
Lys Lys Ser Val Ser His Arg Cys Tyr Val Leu Phe Glu Leu Lys
1775 1780 1785
Arg Arg Gly Glu Arg Arg Ala Cys Phe Trp Gly Tyr Ala Val Asn
1790 1795 1800
Lys Pro Gln Ser Gly Thr Glu Arg Gly Ile His Ala Glu Ile Phe
1805 1810 1815
Ser Ile Arg Lys Val Glu Glu Tyr Leu Arg Asp Asn Pro Gly Gln
1820 1825 1830
Phe Thr Ile Asn Trp Tyr Ser Ser Trp Ser Pro Cys Ala Asp Cys
1835 1840 1845
Ala Glu Lys Ile Leu Glu Trp Tyr Asn Gln Glu Leu Arg Gly Asn
1850 1855 1860
Gly His Thr Leu Lys Ile Trp Ala Cys Lys Leu Tyr Tyr Glu Lys
1865 1870 1875
Asn Ala Arg Asn Gln Ile Gly Leu Trp Asn Leu Arg Asp Asn Gly
1880 1885 1890
Val Gly Leu Asn Val Met Val Ser Glu His Tyr Gln Cys Cys Arg
1895 1900 1905
Lys Ile Phe Ile Gln Ser Ser His Asn Gln Leu Asn Glu Asn Arg
1910 1915 1920
Trp Leu Glu Lys Thr Leu Lys Arg Ala Glu Lys Arg Arg Ser Glu
1925 1930 1935
Leu Ser Ile Met Ile Gln Val Lys Ile Leu His Thr Thr Lys Ser
1940 1945 1950
Pro Ala Val Gly Ser Pro Lys Lys Lys Arg Lys Val Ser Gly Gly
1955 1960 1965
Ser Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly Lys Gln
1970 1975 1980
Leu Val Ile Gln Glu Ser Ile Leu Met Leu Pro Glu Glu Val Glu
1985 1990 1995
Glu Val Ile Gly Asn Lys Pro Glu Ser Asp Ile Leu Val His Thr
2000 2005 2010
Ala Tyr Asp Glu Ser Thr Asp Glu Asn Val Met Leu Leu Thr Ser
2015 2020 2025
Asp Ala Pro Glu Tyr Lys Pro Trp Ala Leu Val Ile Gln Asp Ser
2030 2035 2040
Asn Gly Glu Asn Lys Ile Lys Met Leu Ser Gly Gly Ser Pro Lys
2045 2050 2055
Lys Lys Arg Lys Val
2060
<210> 86
<211> 6201
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 86
atgccgaaga agaagcgcaa ggtcatgacc gacgcggagt atgtgcgcat ccacgagaag 60
ctcgacatct acaccttcaa gaagcagttc ttcaacaaca agaagagcgt ctcccacagg 120
tgctacgtgc tcttcgagct gaagaggcgc ggcgagcgca gggcctgctt ctggggctac 180
gccgtgaaca agccgcagag cggcaccgag cgcggcatcc acgccgagat cttcagcatc 240
cgcaaggtgg aggagtacct cagggacaac ccgggccagt tcaccatcaa ctggtacagc 300
tcctggagcc cggtaagttt ctgcttctac ctttgatata tatataataa ttatcattaa 360
ttagtagtaa tataatattt caaatatttt tttcaaaata aaagaatgta gtatatagca 420
attgcttttc tgtagtttat aagtgtgtat attttaattt ataacttttc taatatatga 480
ccaaaatttg ttgatgtgca gtgcgcggac tgcgccgaga agatcctgga gtggtacaac 540
caggagctga ggggcaacgg ccacaccctg aagatctggg cctgcaagct ctactacgag 600
aagaacgcga ggaaccagat cggcctgtgg aacctccgcg acaacggcgt cggcctcaac 660
gtgatggtct ccgagcacta ccagtgctgc cgcaagatct tcatccagtc cagccacaac 720
cagctcaacg agaacaggtg gctggagaag accctgaaga gggccgagaa gcgcaggtcc 780
gagctcagca tcatgatcca ggtgaagatc ctccacacca cgaagtcccc cgccgtggcg 840
gagtacgttc gggctctgtt cgacttcaac ggcaacgacg aggaggacct cccgttcaag 900
aagggcgaca tcctgcgcat cagggacaag ccggaggagc agtggtggaa cgccgaggac 960
tccgagggca agaggggcat gatcccggtc ccctacgtgg agaagtacat gtccgaggtg 1020
gagttcagcc acgagtactg gatgaggcac gctctcaccc tggctaagag ggcgtgggac 1080
gagagggagg tgccggtggg cgccgtgctc gtccacaaca accgcgtgat cggcgagggc 1140
tggaacaggc ccatcggcag gcacgaccca accgctcacg ccgagatcat ggctctcagg 1200
cagggcggcc tggtcatgca gaactacagg ctgatcgacg cgaccctcta cgtgaccctc 1260
gagccctgcg tcatgtgcgc gggcgccatg atccactcca ggatcggcag ggtggtcttc 1320
ggcgctaggg acgccaagac gggcgctgcg ggcagcctca tggacgtgct gcaccacccc 1380
ggcatgaacc accgcgtcga gatcaccgag ggcatcctcg cggacgagtg cgctgcgctc 1440
ctgtccgact tcttcaggat gcgcaggcag gagatcaagg cccagaagaa ggcgcagtcc 1500
agcaccgact ccggcggctc cagcggcggc tccagcggca gcgagacccc gggcacgtcc 1560
gagagcgcga cgcccgagag cagcggcggc tccagcggcg gctcctcgga ggtcgagttc 1620
agccatgagt actggatgag gcatgccctg actctcgcta agagggcgcg ggatgagcgc 1680
gaggtgccgg tgggggccgt gctcgtcctg aacaaccgcg tgatcgggga gggctggaac 1740
cgggctatcg gcctccacga cccaacggcc catgccgaga tcatggccct gaggcagggc 1800
ggcctggtca tgcaaaacta caggctcatc gacgccaccc tctacgtgac cttcgagcca 1860
tgcgtgatgt gcgcgggggc catgatccac tcgaggattg ggagggtggt cttcggcgtg 1920
cgcaacgcta agacgggggc cgccggcagc ctcatggacg tcctgcacta cccgggcatg 1980
aaccacaggg tggagattac cgagggcatc ctggccgatg agtgcgccgc gctcctgtgc 2040
tacttcttcc gcatgcccag gcaggtcttc aacgcgcaga agaaggccca gagctccact 2100
gatgggggcg ggggctcagg cgggggcggg agcggcggcg ggggctctgg gggcggcggc 2160
agcggcgggg gcggcagcgg gggcggcggg tcgatgagca agctggagaa gttcacgaac 2220
tgctactccc tcagcaagac cctgaggttc aaggcgatcc cggtcggcaa gacccaggag 2280
aacatcgaca acaagcggct gctggtggag gacgagaaga gggctgagga ctacaagggc 2340
gtgaagaagc tcctggaccg ctactacctg tccttcatca acgacgtgct ccacagcatc 2400
aagctcaaga acctgaacaa ctacatcagc ctcttcagga agaagacgcg caccgagaag 2460
gagaacaagg agctcgagaa cctggagatc aacctgagga aggagatcgc caaggcgttc 2520
aagggcaacg agggctacaa gtccctcttc aagaaggaca tcatcgagac gatcctcccg 2580
gagttcctgg acgacaagga cgagatcgcc ctggtcaact ccttcaacgg cttcaccacg 2640
gcgttcaccg gcttcttcga caaccgcgag aacatgttca gcgaggaggc caagtccacg 2700
agcatcgcgt tcaggtgcat caacgagaac ctcacccgct acatctccaa catggacatc 2760
ttcgagaagg tcgacgcgat cttcgacaag cacgaggtgc aggagatcaa ggagaagatc 2820
ctgaacagcg actacgacgt cgaggacttc ttcgagggcg agttcttcaa cttcgtcctc 2880
acgcaggagg gcatcgacgt gtacaacgcc atcatcggtg gcttcgtgac cgagtccggc 2940
gagaagatca agggcctgaa cgagtacatc aacctctaca accagaagac caagcagaag 3000
ctgccgaagt tcaagcccct gtacaagcag gtgctctccg acagggagtc cctcagcttc 3060
tacggcgagg gctacacgag cgacgaggag gtcctggagg tgttccgcaa caccctcaac 3120
aagaacagcg agatcttctc cagcatcaag aagctcgaga agctgttcaa gaacttcgac 3180
gagtactcca gcgccggcat cttcgtcaag aacggcccgg cgatctccac gatcagcaag 3240
gacatcttcg gcgagtggaa cgtgatccgc gacaagtgga acgccgagta cgacgacatc 3300
cacctcaaga agaaggcggt ggtcaccgag aagtacgagg acgacaggcg caagtccttc 3360
aagaagatcg gctccttcag cctcgagcag ctgcaggagt acgccgacgc ggacctgagc 3420
gtggtcgaga agctcaagga gatcatcatc cagaaggtcg acgagatcta caaggtgtac 3480
ggctccagcg agaagctctt cgacgcggac ttcgtcctcg agaagtccct gaagaagaac 3540
gacgccgtgg tcgcgatcat gaaggacctc ctggactccg tgaagagctt cgagaattac 3600
atcaaggcct tcttcggcga gggcaaggag acgaacaggg acgagtcctt ctacggcgac 3660
ttcgtcctgg cctacgacat cctcctgaag gtggaccaca tctacgacgc gatccgcaac 3720
tacgtgaccc agaagccgta cagcaaggac aagttcaagc tctacttcca gaacccccag 3780
ttcatgggcg gctgggacaa ggacaaggag acggactaca gggcgaccat cctgcgctac 3840
ggcagcaagt actacctcgc catcatggac aagaagtacg cgaagtgcct gcagaagatc 3900
gacaaggacg acgtcaacgg caactacgag aagatcaact acaagctcct gccgggcccc 3960
aacaagatgc tcccgaaggt gttcttctcc aagaagtgga tggcctacta caaccccagc 4020
gaggacatcc agaagatcta caagaacggc acgttcaaga agggcgacat gttcaacctg 4080
aacgactgcc acaagctcat cgacttcttc aaggactcca tcagccgcta cccgaagtgg 4140
tccaacgcct acgacttcaa cttcagcgag accgagaagt acaaggacat cgcgggcttc 4200
taccgcgagg tcgaggagca gggctacaag gtgtccttcg agtccgccag caagaaggag 4260
gtcgacaagc tggtggagga gggcaagctc tacatgttcc agatctacaa caaggacttc 4320
tccgacaaga gccacggcac gcccaacctg cacaccatgt acttcaagct cctgttcgac 4380
gagaacaacc acggccagat caggctgtcc ggcggcgccg agctcttcat gaggagggcg 4440
agcctgaaga aggaggagct ggtggtccac cccgctaaca gcccaatcgc gaacaagaac 4500
ccggacaacc ccaagaagac cacgaccctg tcctacgacg tgtacaagga caagaggttc 4560
agcgaggacc agtacgagct ccacatcccg atcgcgatca acaagtgccc caagaacatc 4620
ttcaagatca acaccgaggt ccgcgtgctc ctgaagcacg acgacaaccc ctacgtgatc 4680
ggcatcgcta ggggcgagag gaacctcctg tacatcgtgg tcgtggacgg caagggcaac 4740
atcgtggagc agtactccct caacgagatc atcaacaact tcaacggcat caggatcaag 4800
acggactacc acagcctcct ggacaagaag gagaaggaga ggttcgaggc ccgccagaac 4860
tggacctcca tcgagaacat caaggagctg aaggcgggct acatcagcca ggtcgtgcac 4920
aagatctgcg agctcgtcga gaagtacgac gccgtgatcg ccctcgcgga cctgaactcc 4980
ggcttcaaga acagccgcgt caaggtggag aagcaggtct accagaagtt cgagaagatg 5040
ctcatcgaca agctgaacta catggtggac aagaagtcca acccctgcgc tacgggcggc 5100
gcgctgaagg gctaccagat caccaacaag ttcgagagct tcaagtccat gagcactcag 5160
aacggcttca tcttctacat cccggcgtgg ctcacgtcca agatcgaccc cagcaccggc 5220
ttcgtcaacc tcctgaagac gaagtacacc tccatcgccg acagcaagaa gttcatctcc 5280
agcttcgacc gcatcatgta tgtgccggag gaggacctgt tcgagttcgc cctcgactac 5340
aagaacttct cccgcacgga cgcggactac atcaagaagt ggaagctgta cagctacggc 5400
aaccgcatcc gcatcttcag gaaccccaag aagaacaacg tcttcgactg ggaggaggtg 5460
tgcctgacct ccgcgtacaa ggagctcttc aacaagtacg gcatcaacta ccagcagggc 5520
gacatcaggg ctctcctgtg cgagcagagc gacaaggcct tctactccag cttcatggcg 5580
ctgatgtccc tcatgctgca gatgaggaac tcgatcaccg gcaggacgga cgtggccttc 5640
ctcatctccc cggtgaagaa cagcgacggc atcttctacg actccaggaa ctacgaggcc 5700
caggagaacg cgatcctccc aaagaacgcg gacgccaacg gcgcctacaa catcgccagg 5760
aaggtcctct gggctatcgg ccagttcaag aaggcggagg acgagaagct ggacaaggtg 5820
aagatcgcca tcagcaacaa ggagtggctc gagtacgccc agacctcggt caagcacggc 5880
agcccgaaga agaagcgcaa ggtgtccggc ggcagcacga acctgtccga catcatcgag 5940
aaggagaccg gcaagcagct cgtgatccag gagagcatcc tcatgctgcc ggaggaggtc 6000
gaggaggtca tcggcaacaa gcccgagtcc gacatcctcg tccacacggc ctacgacgag 6060
tccaccgacg agaacgtgat gctcctgacc tcggacgctc ccgagtacaa gccatgggcc 6120
ctggtcatcc aggacagcaa cggcgagaac aagatcaaga tgctctccgg cggcagcccg 6180
aagaagaagc gcaaagtgtg a 6201
<210> 87
<211> 2060
<212> PRT
<213> Artificial Sequence
<220>
<223> Fusion protein
<400> 87
Met Pro Lys Lys Lys Arg Lys Val Met Thr Asp Ala Glu Tyr Val Arg
1 5 10 15
Ile His Glu Lys Leu Asp Ile Tyr Thr Phe Lys Lys Gln Phe Phe Asn
20 25 30
Asn Lys Lys Ser Val Ser His Arg Cys Tyr Val Leu Phe Glu Leu Lys
35 40 45
Arg Arg Gly Glu Arg Arg Ala Cys Phe Trp Gly Tyr Ala Val Asn Lys
50 55 60
Pro Gln Ser Gly Thr Glu Arg Gly Ile His Ala Glu Ile Phe Ser Ile
65 70 75 80
Arg Lys Val Glu Glu Tyr Leu Arg Asp Asn Pro Gly Gln Phe Thr Ile
85 90 95
Asn Trp Tyr Ser Ser Trp Ser Pro Val Ser Phe Cys Phe Tyr Leu Tyr
100 105 110
Ile Tyr Asn Asn Tyr His Leu Val Val Ile Tyr Phe Lys Tyr Phe Phe
115 120 125
Gln Asn Lys Arg Met Tyr Ile Ala Ile Ala Phe Leu Phe Ile Ser Val
130 135 140
Tyr Ile Leu Ile Tyr Asn Phe Ser Asn Ile Pro Lys Phe Val Asp Val
145 150 155 160
Gln Cys Ala Asp Cys Ala Glu Lys Ile Leu Glu Trp Tyr Asn Gln Glu
165 170 175
Leu Arg Gly Asn Gly His Thr Leu Lys Ile Trp Ala Cys Lys Leu Tyr
180 185 190
Tyr Glu Lys Asn Ala Arg Asn Gln Ile Gly Leu Trp Asn Leu Arg Asp
195 200 205
Asn Gly Val Gly Leu Asn Val Met Val Ser Glu His Tyr Gln Cys Cys
210 215 220
Arg Lys Ile Phe Ile Gln Ser Ser His Asn Gln Leu Asn Glu Asn Arg
225 230 235 240
Trp Leu Glu Lys Thr Leu Lys Arg Ala Glu Lys Arg Arg Ser Glu Leu
245 250 255
Ser Ile Met Ile Gln Val Lys Ile Leu His Thr Thr Lys Ser Pro Ala
260 265 270
Val Ala Glu Tyr Val Arg Ala Leu Phe Asp Phe Asn Gly Asn Asp Glu
275 280 285
Glu Asp Leu Pro Phe Lys Lys Gly Asp Ile Leu Arg Ile Arg Asp Lys
290 295 300
Pro Glu Glu Gln Trp Trp Asn Ala Glu Asp Ser Glu Gly Lys Arg Gly
305 310 315 320
Met Ile Pro Val Pro Tyr Val Glu Lys Tyr Met Ser Glu Val Glu Phe
325 330 335
Ser His Glu Tyr Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala
340 345 350
Trp Asp Glu Arg Glu Val Pro Val Gly Ala Val Leu Val His Asn Asn
355 360 365
Arg Val Ile Gly Glu Gly Trp Asn Arg Pro Ile Gly Arg His Asp Pro
370 375 380
Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met
385 390 395 400
Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr Val Thr Leu Glu Pro
405 410 415
Cys Val Met Cys Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val
420 425 430
Val Phe Gly Ala Arg Asp Ala Lys Thr Gly Ala Ala Gly Ser Leu Met
435 440 445
Asp Val Leu His His Pro Gly Met Asn His Arg Val Glu Ile Thr Glu
450 455 460
Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu Ser Asp Phe Phe Arg
465 470 475 480
Met Arg Arg Gln Glu Ile Lys Ala Gln Lys Lys Ala Gln Ser Ser Thr
485 490 495
Asp Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly
500 505 510
Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly
515 520 525
Ser Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu
530 535 540
Thr Leu Ala Lys Arg Ala Arg Asp Glu Arg Glu Val Pro Val Gly Ala
545 550 555 560
Val Leu Val Leu Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Ala
565 570 575
Ile Gly Leu His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg
580 585 590
Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu
595 600 605
Tyr Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His
610 615 620
Ser Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly
625 630 635 640
Ala Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His
645 650 655
Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu
660 665 670
Leu Cys Tyr Phe Phe Arg Met Pro Arg Gln Val Phe Asn Ala Gln Lys
675 680 685
Lys Ala Gln Ser Ser Thr Asp Gly Gly Gly Gly Ser Gly Gly Gly Gly
690 695 700
Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
705 710 715 720
Gly Gly Gly Gly Ser Met Ser Lys Leu Glu Lys Phe Thr Asn Cys Tyr
725 730 735
Ser Leu Ser Lys Thr Leu Arg Phe Lys Ala Ile Pro Val Gly Lys Thr
740 745 750
Gln Glu Asn Ile Asp Asn Lys Arg Leu Leu Val Glu Asp Glu Lys Arg
755 760 765
Ala Glu Asp Tyr Lys Gly Val Lys Lys Leu Leu Asp Arg Tyr Tyr Leu
770 775 780
Ser Phe Ile Asn Asp Val Leu His Ser Ile Lys Leu Lys Asn Leu Asn
785 790 795 800
Asn Tyr Ile Ser Leu Phe Arg Lys Lys Thr Arg Thr Glu Lys Glu Asn
805 810 815
Lys Glu Leu Glu Asn Leu Glu Ile Asn Leu Arg Lys Glu Ile Ala Lys
820 825 830
Ala Phe Lys Gly Asn Glu Gly Tyr Lys Ser Leu Phe Lys Lys Asp Ile
835 840 845
Ile Glu Thr Ile Leu Pro Glu Phe Leu Asp Asp Lys Asp Glu Ile Ala
850 855 860
Leu Val Asn Ser Phe Asn Gly Phe Thr Thr Ala Phe Thr Gly Phe Phe
865 870 875 880
Asp Asn Arg Glu Asn Met Phe Ser Glu Glu Ala Lys Ser Thr Ser Ile
885 890 895
Ala Phe Arg Cys Ile Asn Glu Asn Leu Thr Arg Tyr Ile Ser Asn Met
900 905 910
Asp Ile Phe Glu Lys Val Asp Ala Ile Phe Asp Lys His Glu Val Gln
915 920 925
Glu Ile Lys Glu Lys Ile Leu Asn Ser Asp Tyr Asp Val Glu Asp Phe
930 935 940
Phe Glu Gly Glu Phe Phe Asn Phe Val Leu Thr Gln Glu Gly Ile Asp
945 950 955 960
Val Tyr Asn Ala Ile Ile Gly Gly Phe Val Thr Glu Ser Gly Glu Lys
965 970 975
Ile Lys Gly Leu Asn Glu Tyr Ile Asn Leu Tyr Asn Gln Lys Thr Lys
980 985 990
Gln Lys Leu Pro Lys Phe Lys Pro Leu Tyr Lys Gln Val Leu Ser Asp
995 1000 1005
Arg Glu Ser Leu Ser Phe Tyr Gly Glu Gly Tyr Thr Ser Asp Glu
1010 1015 1020
Glu Val Leu Glu Val Phe Arg Asn Thr Leu Asn Lys Asn Ser Glu
1025 1030 1035
Ile Phe Ser Ser Ile Lys Lys Leu Glu Lys Leu Phe Lys Asn Phe
1040 1045 1050
Asp Glu Tyr Ser Ser Ala Gly Ile Phe Val Lys Asn Gly Pro Ala
1055 1060 1065
Ile Ser Thr Ile Ser Lys Asp Ile Phe Gly Glu Trp Asn Val Ile
1070 1075 1080
Arg Asp Lys Trp Asn Ala Glu Tyr Asp Asp Ile His Leu Lys Lys
1085 1090 1095
Lys Ala Val Val Thr Glu Lys Tyr Glu Asp Asp Arg Arg Lys Ser
1100 1105 1110
Phe Lys Lys Ile Gly Ser Phe Ser Leu Glu Gln Leu Gln Glu Tyr
1115 1120 1125
Ala Asp Ala Asp Leu Ser Val Val Glu Lys Leu Lys Glu Ile Ile
1130 1135 1140
Ile Gln Lys Val Asp Glu Ile Tyr Lys Val Tyr Gly Ser Ser Glu
1145 1150 1155
Lys Leu Phe Asp Ala Asp Phe Val Leu Glu Lys Ser Leu Lys Lys
1160 1165 1170
Asn Asp Ala Val Val Ala Ile Met Lys Asp Leu Leu Asp Ser Val
1175 1180 1185
Lys Ser Phe Glu Asn Tyr Ile Lys Ala Phe Phe Gly Glu Gly Lys
1190 1195 1200
Glu Thr Asn Arg Asp Glu Ser Phe Tyr Gly Asp Phe Val Leu Ala
1205 1210 1215
Tyr Asp Ile Leu Leu Lys Val Asp His Ile Tyr Asp Ala Ile Arg
1220 1225 1230
Asn Tyr Val Thr Gln Lys Pro Tyr Ser Lys Asp Lys Phe Lys Leu
1235 1240 1245
Tyr Phe Gln Asn Pro Gln Phe Met Gly Gly Trp Asp Lys Asp Lys
1250 1255 1260
Glu Thr Asp Tyr Arg Ala Thr Ile Leu Arg Tyr Gly Ser Lys Tyr
1265 1270 1275
Tyr Leu Ala Ile Met Asp Lys Lys Tyr Ala Lys Cys Leu Gln Lys
1280 1285 1290
Ile Asp Lys Asp Asp Val Asn Gly Asn Tyr Glu Lys Ile Asn Tyr
1295 1300 1305
Lys Leu Leu Pro Gly Pro Asn Lys Met Leu Pro Lys Val Phe Phe
1310 1315 1320
Ser Lys Lys Trp Met Ala Tyr Tyr Asn Pro Ser Glu Asp Ile Gln
1325 1330 1335
Lys Ile Tyr Lys Asn Gly Thr Phe Lys Lys Gly Asp Met Phe Asn
1340 1345 1350
Leu Asn Asp Cys His Lys Leu Ile Asp Phe Phe Lys Asp Ser Ile
1355 1360 1365
Ser Arg Tyr Pro Lys Trp Ser Asn Ala Tyr Asp Phe Asn Phe Ser
1370 1375 1380
Glu Thr Glu Lys Tyr Lys Asp Ile Ala Gly Phe Tyr Arg Glu Val
1385 1390 1395
Glu Glu Gln Gly Tyr Lys Val Ser Phe Glu Ser Ala Ser Lys Lys
1400 1405 1410
Glu Val Asp Lys Leu Val Glu Glu Gly Lys Leu Tyr Met Phe Gln
1415 1420 1425
Ile Tyr Asn Lys Asp Phe Ser Asp Lys Ser His Gly Thr Pro Asn
1430 1435 1440
Leu His Thr Met Tyr Phe Lys Leu Leu Phe Asp Glu Asn Asn His
1445 1450 1455
Gly Gln Ile Arg Leu Ser Gly Gly Ala Glu Leu Phe Met Arg Arg
1460 1465 1470
Ala Ser Leu Lys Lys Glu Glu Leu Val Val His Pro Ala Asn Ser
1475 1480 1485
Pro Ile Ala Asn Lys Asn Pro Asp Asn Pro Lys Lys Thr Thr Thr
1490 1495 1500
Leu Ser Tyr Asp Val Tyr Lys Asp Lys Arg Phe Ser Glu Asp Gln
1505 1510 1515
Tyr Glu Leu His Ile Pro Ile Ala Ile Asn Lys Cys Pro Lys Asn
1520 1525 1530
Ile Phe Lys Ile Asn Thr Glu Val Arg Val Leu Leu Lys His Asp
1535 1540 1545
Asp Asn Pro Tyr Val Ile Gly Ile Ala Arg Gly Glu Arg Asn Leu
1550 1555 1560
Leu Tyr Ile Val Val Val Asp Gly Lys Gly Asn Ile Val Glu Gln
1565 1570 1575
Tyr Ser Leu Asn Glu Ile Ile Asn Asn Phe Asn Gly Ile Arg Ile
1580 1585 1590
Lys Thr Asp Tyr His Ser Leu Leu Asp Lys Lys Glu Lys Glu Arg
1595 1600 1605
Phe Glu Ala Arg Gln Asn Trp Thr Ser Ile Glu Asn Ile Lys Glu
1610 1615 1620
Leu Lys Ala Gly Tyr Ile Ser Gln Val Val His Lys Ile Cys Glu
1625 1630 1635
Leu Val Glu Lys Tyr Asp Ala Val Ile Ala Leu Ala Asp Leu Asn
1640 1645 1650
Ser Gly Phe Lys Asn Ser Arg Val Lys Val Glu Lys Gln Val Tyr
1655 1660 1665
Gln Lys Phe Glu Lys Met Leu Ile Asp Lys Leu Asn Tyr Met Val
1670 1675 1680
Asp Lys Lys Ser Asn Pro Cys Ala Thr Gly Gly Ala Leu Lys Gly
1685 1690 1695
Tyr Gln Ile Thr Asn Lys Phe Glu Ser Phe Lys Ser Met Ser Thr
1700 1705 1710
Gln Asn Gly Phe Ile Phe Tyr Ile Pro Ala Trp Leu Thr Ser Lys
1715 1720 1725
Ile Asp Pro Ser Thr Gly Phe Val Asn Leu Leu Lys Thr Lys Tyr
1730 1735 1740
Thr Ser Ile Ala Asp Ser Lys Lys Phe Ile Ser Ser Phe Asp Arg
1745 1750 1755
Ile Met Tyr Val Pro Glu Glu Asp Leu Phe Glu Phe Ala Leu Asp
1760 1765 1770
Tyr Lys Asn Phe Ser Arg Thr Asp Ala Asp Tyr Ile Lys Lys Trp
1775 1780 1785
Lys Leu Tyr Ser Tyr Gly Asn Arg Ile Arg Ile Phe Arg Asn Pro
1790 1795 1800
Lys Lys Asn Asn Val Phe Asp Trp Glu Glu Val Cys Leu Thr Ser
1805 1810 1815
Ala Tyr Lys Glu Leu Phe Asn Lys Tyr Gly Ile Asn Tyr Gln Gln
1820 1825 1830
Gly Asp Ile Arg Ala Leu Leu Cys Glu Gln Ser Asp Lys Ala Phe
1835 1840 1845
Tyr Ser Ser Phe Met Ala Leu Met Ser Leu Met Leu Gln Met Arg
1850 1855 1860
Asn Ser Ile Thr Gly Arg Thr Asp Val Ala Phe Leu Ile Ser Pro
1865 1870 1875
Val Lys Asn Ser Asp Gly Ile Phe Tyr Asp Ser Arg Asn Tyr Glu
1880 1885 1890
Ala Gln Glu Asn Ala Ile Leu Pro Lys Asn Ala Asp Ala Asn Gly
1895 1900 1905
Ala Tyr Asn Ile Ala Arg Lys Val Leu Trp Ala Ile Gly Gln Phe
1910 1915 1920
Lys Lys Ala Glu Asp Glu Lys Leu Asp Lys Val Lys Ile Ala Ile
1925 1930 1935
Ser Asn Lys Glu Trp Leu Glu Tyr Ala Gln Thr Ser Val Lys His
1940 1945 1950
Gly Ser Pro Lys Lys Lys Arg Lys Val Ser Gly Gly Ser Thr Asn
1955 1960 1965
Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly Lys Gln Leu Val Ile
1970 1975 1980
Gln Glu Ser Ile Leu Met Leu Pro Glu Glu Val Glu Glu Val Ile
1985 1990 1995
Gly Asn Lys Pro Glu Ser Asp Ile Leu Val His Thr Ala Tyr Asp
2000 2005 2010
Glu Ser Thr Asp Glu Asn Val Met Leu Leu Thr Ser Asp Ala Pro
2015 2020 2025
Glu Tyr Lys Pro Trp Ala Leu Val Ile Gln Asp Ser Asn Gly Glu
2030 2035 2040
Asn Lys Ile Lys Met Leu Ser Gly Gly Ser Pro Lys Lys Lys Arg
2045 2050 2055
Lys Val
2060
<210> 88
<211> 6183
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 88
atgtccgagg tggagttcag ccacgagtac tggatgaggc acgctctcac cctggctaag 60
agggcgtggg acgagaggga ggtgccggtg ggcgccgtgc tcgtccacaa caaccgcgtg 120
atcggcgagg gctggaacag gcccatcggc aggcacgacc caaccgctca cgccgagatc 180
atggctctca ggcagggcgg cctggtcatg cagaactaca ggctgatcga cgcgaccctc 240
tacgtgaccc tcgagccctg cgtcatggta agtttctgct tctacctttg atatatatat 300
aataattatc attaattagt agtaatataa tatttcaaat atttttttca aaataaaaga 360
atgtagtata tagcaattgc ttttctgtag tttataagtg tgtatatttt aatttataac 420
ttttctaata tatgaccaaa atttgttgat gtgcagtgcg cgggcgccat gatccactcc 480
aggatcggca gggtggtctt cggcgctagg gacgccaaga cgggcgctgc gggcagcctc 540
atggacgtgc tgcaccaccc cggcatgaac caccgcgtcg agatcaccga gggcatcctc 600
gcggacgagt gcgctgcgct cctgtccgac ttcttcagga tgcgcaggca ggagatcaag 660
gcccagaaga aggcgcagtc cagcaccgac tccggcggct ccagcggcgg ctccagcggc 720
agcgagaccc cgggcacgtc cgagagcgcg acgcccgaga gcagcggcgg ctccagcggc 780
ggctcctcgg aggtcgagtt cagccatgag tactggatga ggcatgccct gactctcgct 840
aagagggcgc gggatgagcg cgaggtgccg gtgggggccg tgctcgtcct gaacaaccgc 900
gtgatcgggg agggctggaa ccgggctatc ggcctccacg acccaacggc ccatgccgag 960
atcatggccc tgaggcaggg cggcctggtc atgcaaaact acaggctcat cgacgccacc 1020
ctctacgtga ccttcgagcc atgcgtgatg tgcgcggggg ccatgatcca ctcgaggatt 1080
gggagggtgg tcttcggcgt gcgcaacgct aagacggggg ccgccggcag cctcatggac 1140
gtcctgcact acccgggcat gaaccacagg gtggagatta ccgagggcat cctggccgat 1200
gagtgcgccg cgctcctgtg ctacttcttc cgcatgccca ggcaggtctt caacgcgcag 1260
aagaaggccc agagctccac tgatggcagc gcggagtacg ttcgggctct gttcgacttc 1320
aacggcaacg acgaggagga cctcccgttc aagaagggcg acatcctgcg catcagggac 1380
aagccggagg agcagtggtg gaacgccgag gactccgagg gcaagagggg catgatcccg 1440
gtcccctacg tggagaagta catgaccgac gcggagtatg tgcgcatcca cgagaagctc 1500
gacatctaca ccttcaagaa gcagttcttc aacaacaaga agagcgtctc ccacaggtgc 1560
tacgtgctct tcgagctgaa gaggcgcggc gagcgcaggg cctgcttctg gggctacgcc 1620
gtgaacaagc cgcagagcgg caccgagcgc ggcatccacg ccgagatctt cagcatccgc 1680
aaggtggagg agtacctcag ggacaacccg ggccagttca ccatcaactg gtacagctcc 1740
tggagcccgt gcgcggactg cgccgagaag atcctggagt ggtacaacca ggagctgagg 1800
ggcaacggcc acaccctgaa gatctgggcc tgcaagctct actacgagaa gaacgcgagg 1860
aaccagatcg gcctgtggaa cctccgcgac aacggcgtcg gcctcaacgt gatggtctcc 1920
gagcactacc agtgctgccg caagatcttc atccagtcca gccacaacca gctcaacgag 1980
aacaggtggc tggagaagac cctgaagagg gccgagaagc gcaggtccga gctcagcatc 2040
atgatccagg tgaagatcct ccacaccacg aagtcccccg ccgtgggggg cgggggctca 2100
ggcgggggcg ggagcggcgg cgggggctct gggggcggcg gcagcggcgg gggcggcagc 2160
gggggcggcg ggtcgatgag caagctggag aagttcacga actgctactc cctcagcaag 2220
accctgaggt tcaaggcgat cccggtcggc aagacccagg agaacatcga caacaagcgg 2280
ctgctggtgg aggacgagaa gagggctgag gactacaagg gcgtgaagaa gctcctggac 2340
cgctactacc tgtccttcat caacgacgtg ctccacagca tcaagctcaa gaacctgaac 2400
aactacatca gcctcttcag gaagaagacg cgcaccgaga aggagaacaa ggagctcgag 2460
aacctggaga tcaacctgag gaaggagatc gccaaggcgt tcaagggcaa cgagggctac 2520
aagtccctct tcaagaagga catcatcgag acgatcctcc cggagttcct ggacgacaag 2580
gacgagatcg ccctggtcaa ctccttcaac ggcttcacca cggcgttcac cggcttcttc 2640
gacaaccgcg agaacatgtt cagcgaggag gccaagtcca cgagcatcgc gttcaggtgc 2700
atcaacgaga acctcacccg ctacatctcc aacatggaca tcttcgagaa ggtcgacgcg 2760
atcttcgaca agcacgaggt gcaggagatc aaggagaaga tcctgaacag cgactacgac 2820
gtcgaggact tcttcgaggg cgagttcttc aacttcgtcc tcacgcagga gggcatcgac 2880
gtgtacaacg ccatcatcgg tggcttcgtg accgagtccg gcgagaagat caagggcctg 2940
aacgagtaca tcaacctcta caaccagaag accaagcaga agctgccgaa gttcaagccc 3000
ctgtacaagc aggtgctctc cgacagggag tccctcagct tctacggcga gggctacacg 3060
agcgacgagg aggtcctgga ggtgttccgc aacaccctca acaagaacag cgagatcttc 3120
tccagcatca agaagctcga gaagctgttc aagaacttcg acgagtactc cagcgccggc 3180
atcttcgtca agaacggccc ggcgatctcc acgatcagca aggacatctt cggcgagtgg 3240
aacgtgatcc gcgacaagtg gaacgccgag tacgacgaca tccacctcaa gaagaaggcg 3300
gtggtcaccg agaagtacga ggacgacagg cgcaagtcct tcaagaagat cggctccttc 3360
agcctcgagc agctgcagga gtacgccgac gcggacctga gcgtggtcga gaagctcaag 3420
gagatcatca tccagaaggt cgacgagatc tacaaggtgt acggctccag cgagaagctc 3480
ttcgacgcgg acttcgtcct cgagaagtcc ctgaagaaga acgacgccgt ggtcgcgatc 3540
atgaaggacc tcctggactc cgtgaagagc ttcgagaatt acatcaaggc cttcttcggc 3600
gagggcaagg agacgaacag ggacgagtcc ttctacggcg acttcgtcct ggcctacgac 3660
atcctcctga aggtggacca catctacgac gcgatccgca actacgtgac ccagaagccg 3720
tacagcaagg acaagttcaa gctctacttc cagaaccccc agttcatggg cggctgggac 3780
aaggacaagg agacggacta cagggcgacc atcctgcgct acggcagcaa gtactacctc 3840
gccatcatgg acaagaagta cgcgaagtgc ctgcagaaga tcgacaagga cgacgtcaac 3900
ggcaactacg agaagatcaa ctacaagctc ctgccgggcc ccaacaagat gctcccgaag 3960
gtgttcttct ccaagaagtg gatggcctac tacaacccca gcgaggacat ccagaagatc 4020
tacaagaacg gcacgttcaa gaagggcgac atgttcaacc tgaacgactg ccacaagctc 4080
atcgacttct tcaaggactc catcagccgc tacccgaagt ggtccaacgc ctacgacttc 4140
aacttcagcg agaccgagaa gtacaaggac atcgcgggct tctaccgcga ggtcgaggag 4200
cagggctaca aggtgtcctt cgagtccgcc agcaagaagg aggtcgacaa gctggtggag 4260
gagggcaagc tctacatgtt ccagatctac aacaaggact tctccgacaa gagccacggc 4320
acgcccaacc tgcacaccat gtacttcaag ctcctgttcg acgagaacaa ccacggccag 4380
atcaggctgt ccggcggcgc cgagctcttc atgaggaggg cgagcctgaa gaaggaggag 4440
ctggtggtcc accccgctaa cagcccaatc gcgaacaaga acccggacaa ccccaagaag 4500
accacgaccc tgtcctacga cgtgtacaag gacaagaggt tcagcgagga ccagtacgag 4560
ctccacatcc cgatcgcgat caacaagtgc cccaagaaca tcttcaagat caacaccgag 4620
gtccgcgtgc tcctgaagca cgacgacaac ccctacgtga tcggcatcgc taggggcgag 4680
aggaacctcc tgtacatcgt ggtcgtggac ggcaagggca acatcgtgga gcagtactcc 4740
ctcaacgaga tcatcaacaa cttcaacggc atcaggatca agacggacta ccacagcctc 4800
ctggacaaga aggagaagga gaggttcgag gcccgccaga actggacctc catcgagaac 4860
atcaaggagc tgaaggcggg ctacatcagc caggtcgtgc acaagatctg cgagctcgtc 4920
gagaagtacg acgccgtgat cgccctcgcg gacctgaact ccggcttcaa gaacagccgc 4980
gtcaaggtgg agaagcaggt ctaccagaag ttcgagaaga tgctcatcga caagctgaac 5040
tacatggtgg acaagaagtc caacccctgc gctacgggcg gcgcgctgaa gggctaccag 5100
atcaccaaca agttcgagag cttcaagtcc atgagcactc agaacggctt catcttctac 5160
atcccggcgt ggctcacgtc caagatcgac cccagcaccg gcttcgtcaa cctcctgaag 5220
acgaagtaca cctccatcgc cgacagcaag aagttcatct ccagcttcga ccgcatcatg 5280
tatgtgccgg aggaggacct gttcgagttc gccctcgact acaagaactt ctcccgcacg 5340
gacgcggact acatcaagaa gtggaagctg tacagctacg gcaaccgcat ccgcatcttc 5400
aggaacccca agaagaacaa cgtcttcgac tgggaggagg tgtgcctgac ctccgcgtac 5460
aaggagctct tcaacaagta cggcatcaac taccagcagg gcgacatcag ggctctcctg 5520
tgcgagcaga gcgacaaggc cttctactcc agcttcatgg cgctgatgtc cctcatgctg 5580
cagatgagga actcgatcac cggcaggacg gacgtggcct tcctcatctc cccggtgaag 5640
aacagcgacg gcatcttcta cgactccagg aactacgagg cccaggagaa cgcgatcctc 5700
ccaaagaacg cggacgccaa cggcgcctac aacatcgcca ggaaggtcct ctgggctatc 5760
ggccagttca agaaggcgga ggacgagaag ctggacaagg tgaagatcgc catcagcaac 5820
aaggagtggc tcgagtacgc ccagacctcg gtcaagcacg gcagcccgaa gaagaagcgc 5880
aaggtgtccg gcggcagcac gaacctgtcc gacatcatcg agaaggagac cggcaagcag 5940
ctcgtgatcc aggagagcat cctcatgctg ccggaggagg tcgaggaggt catcggcaac 6000
aagcccgagt ccgacatcct cgtccacacg gcctacgacg agtccaccga cgagaacgtg 6060
atgctcctga cctcggacgc tcccgagtac aagccatggg ccctggtcat ccaggacagc 6120
aacggcgaga acaagatcaa gatgctctcc ggcggcagcc cgaagaagaa gcgcaaagtg 6180
tga 6183
<210> 89
<211> 2054
<212> PRT
<213> Artificial Sequence
<220>
<223> Fusion protein
<400> 89
Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu
1 5 10 15
Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala
20 25 30
Val Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro
35 40 45
Ile Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg
50 55 60
Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu
65 70 75 80
Tyr Val Thr Leu Glu Pro Cys Val Met Val Ser Phe Cys Phe Tyr Leu
85 90 95
Tyr Ile Tyr Asn Asn Tyr His Leu Val Val Ile Tyr Phe Lys Tyr Phe
100 105 110
Phe Gln Asn Lys Arg Met Tyr Ile Ala Ile Ala Phe Leu Phe Ile Ser
115 120 125
Val Tyr Ile Leu Ile Tyr Asn Phe Ser Asn Ile Pro Lys Phe Val Asp
130 135 140
Val Gln Cys Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val
145 150 155 160
Phe Gly Ala Arg Asp Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp
165 170 175
Val Leu His His Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly
180 185 190
Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu Ser Asp Phe Phe Arg Met
195 200 205
Arg Arg Gln Glu Ile Lys Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp
210 215 220
Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr
225 230 235 240
Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser
245 250 255
Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr
260 265 270
Leu Ala Lys Arg Ala Arg Asp Glu Arg Glu Val Pro Val Gly Ala Val
275 280 285
Leu Val Leu Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Ala Ile
290 295 300
Gly Leu His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln
305 310 315 320
Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr
325 330 335
Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser
340 345 350
Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly Ala
355 360 365
Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His Arg
370 375 380
Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu
385 390 395 400
Cys Tyr Phe Phe Arg Met Pro Arg Gln Val Phe Asn Ala Gln Lys Lys
405 410 415
Ala Gln Ser Ser Thr Asp Gly Ser Ala Glu Tyr Val Arg Ala Leu Phe
420 425 430
Asp Phe Asn Gly Asn Asp Glu Glu Asp Leu Pro Phe Lys Lys Gly Asp
435 440 445
Ile Leu Arg Ile Arg Asp Lys Pro Glu Glu Gln Trp Trp Asn Ala Glu
450 455 460
Asp Ser Glu Gly Lys Arg Gly Met Ile Pro Val Pro Tyr Val Glu Lys
465 470 475 480
Tyr Met Thr Asp Ala Glu Tyr Val Arg Ile His Glu Lys Leu Asp Ile
485 490 495
Tyr Thr Phe Lys Lys Gln Phe Phe Asn Asn Lys Lys Ser Val Ser His
500 505 510
Arg Cys Tyr Val Leu Phe Glu Leu Lys Arg Arg Gly Glu Arg Arg Ala
515 520 525
Cys Phe Trp Gly Tyr Ala Val Asn Lys Pro Gln Ser Gly Thr Glu Arg
530 535 540
Gly Ile His Ala Glu Ile Phe Ser Ile Arg Lys Val Glu Glu Tyr Leu
545 550 555 560
Arg Asp Asn Pro Gly Gln Phe Thr Ile Asn Trp Tyr Ser Ser Trp Ser
565 570 575
Pro Cys Ala Asp Cys Ala Glu Lys Ile Leu Glu Trp Tyr Asn Gln Glu
580 585 590
Leu Arg Gly Asn Gly His Thr Leu Lys Ile Trp Ala Cys Lys Leu Tyr
595 600 605
Tyr Glu Lys Asn Ala Arg Asn Gln Ile Gly Leu Trp Asn Leu Arg Asp
610 615 620
Asn Gly Val Gly Leu Asn Val Met Val Ser Glu His Tyr Gln Cys Cys
625 630 635 640
Arg Lys Ile Phe Ile Gln Ser Ser His Asn Gln Leu Asn Glu Asn Arg
645 650 655
Trp Leu Glu Lys Thr Leu Lys Arg Ala Glu Lys Arg Arg Ser Glu Leu
660 665 670
Ser Ile Met Ile Gln Val Lys Ile Leu His Thr Thr Lys Ser Pro Ala
675 680 685
Val Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
690 695 700
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Met
705 710 715 720
Ser Lys Leu Glu Lys Phe Thr Asn Cys Tyr Ser Leu Ser Lys Thr Leu
725 730 735
Arg Phe Lys Ala Ile Pro Val Gly Lys Thr Gln Glu Asn Ile Asp Asn
740 745 750
Lys Arg Leu Leu Val Glu Asp Glu Lys Arg Ala Glu Asp Tyr Lys Gly
755 760 765
Val Lys Lys Leu Leu Asp Arg Tyr Tyr Leu Ser Phe Ile Asn Asp Val
770 775 780
Leu His Ser Ile Lys Leu Lys Asn Leu Asn Asn Tyr Ile Ser Leu Phe
785 790 795 800
Arg Lys Lys Thr Arg Thr Glu Lys Glu Asn Lys Glu Leu Glu Asn Leu
805 810 815
Glu Ile Asn Leu Arg Lys Glu Ile Ala Lys Ala Phe Lys Gly Asn Glu
820 825 830
Gly Tyr Lys Ser Leu Phe Lys Lys Asp Ile Ile Glu Thr Ile Leu Pro
835 840 845
Glu Phe Leu Asp Asp Lys Asp Glu Ile Ala Leu Val Asn Ser Phe Asn
850 855 860
Gly Phe Thr Thr Ala Phe Thr Gly Phe Phe Asp Asn Arg Glu Asn Met
865 870 875 880
Phe Ser Glu Glu Ala Lys Ser Thr Ser Ile Ala Phe Arg Cys Ile Asn
885 890 895
Glu Asn Leu Thr Arg Tyr Ile Ser Asn Met Asp Ile Phe Glu Lys Val
900 905 910
Asp Ala Ile Phe Asp Lys His Glu Val Gln Glu Ile Lys Glu Lys Ile
915 920 925
Leu Asn Ser Asp Tyr Asp Val Glu Asp Phe Phe Glu Gly Glu Phe Phe
930 935 940
Asn Phe Val Leu Thr Gln Glu Gly Ile Asp Val Tyr Asn Ala Ile Ile
945 950 955 960
Gly Gly Phe Val Thr Glu Ser Gly Glu Lys Ile Lys Gly Leu Asn Glu
965 970 975
Tyr Ile Asn Leu Tyr Asn Gln Lys Thr Lys Gln Lys Leu Pro Lys Phe
980 985 990
Lys Pro Leu Tyr Lys Gln Val Leu Ser Asp Arg Glu Ser Leu Ser Phe
995 1000 1005
Tyr Gly Glu Gly Tyr Thr Ser Asp Glu Glu Val Leu Glu Val Phe
1010 1015 1020
Arg Asn Thr Leu Asn Lys Asn Ser Glu Ile Phe Ser Ser Ile Lys
1025 1030 1035
Lys Leu Glu Lys Leu Phe Lys Asn Phe Asp Glu Tyr Ser Ser Ala
1040 1045 1050
Gly Ile Phe Val Lys Asn Gly Pro Ala Ile Ser Thr Ile Ser Lys
1055 1060 1065
Asp Ile Phe Gly Glu Trp Asn Val Ile Arg Asp Lys Trp Asn Ala
1070 1075 1080
Glu Tyr Asp Asp Ile His Leu Lys Lys Lys Ala Val Val Thr Glu
1085 1090 1095
Lys Tyr Glu Asp Asp Arg Arg Lys Ser Phe Lys Lys Ile Gly Ser
1100 1105 1110
Phe Ser Leu Glu Gln Leu Gln Glu Tyr Ala Asp Ala Asp Leu Ser
1115 1120 1125
Val Val Glu Lys Leu Lys Glu Ile Ile Ile Gln Lys Val Asp Glu
1130 1135 1140
Ile Tyr Lys Val Tyr Gly Ser Ser Glu Lys Leu Phe Asp Ala Asp
1145 1150 1155
Phe Val Leu Glu Lys Ser Leu Lys Lys Asn Asp Ala Val Val Ala
1160 1165 1170
Ile Met Lys Asp Leu Leu Asp Ser Val Lys Ser Phe Glu Asn Tyr
1175 1180 1185
Ile Lys Ala Phe Phe Gly Glu Gly Lys Glu Thr Asn Arg Asp Glu
1190 1195 1200
Ser Phe Tyr Gly Asp Phe Val Leu Ala Tyr Asp Ile Leu Leu Lys
1205 1210 1215
Val Asp His Ile Tyr Asp Ala Ile Arg Asn Tyr Val Thr Gln Lys
1220 1225 1230
Pro Tyr Ser Lys Asp Lys Phe Lys Leu Tyr Phe Gln Asn Pro Gln
1235 1240 1245
Phe Met Gly Gly Trp Asp Lys Asp Lys Glu Thr Asp Tyr Arg Ala
1250 1255 1260
Thr Ile Leu Arg Tyr Gly Ser Lys Tyr Tyr Leu Ala Ile Met Asp
1265 1270 1275
Lys Lys Tyr Ala Lys Cys Leu Gln Lys Ile Asp Lys Asp Asp Val
1280 1285 1290
Asn Gly Asn Tyr Glu Lys Ile Asn Tyr Lys Leu Leu Pro Gly Pro
1295 1300 1305
Asn Lys Met Leu Pro Lys Val Phe Phe Ser Lys Lys Trp Met Ala
1310 1315 1320
Tyr Tyr Asn Pro Ser Glu Asp Ile Gln Lys Ile Tyr Lys Asn Gly
1325 1330 1335
Thr Phe Lys Lys Gly Asp Met Phe Asn Leu Asn Asp Cys His Lys
1340 1345 1350
Leu Ile Asp Phe Phe Lys Asp Ser Ile Ser Arg Tyr Pro Lys Trp
1355 1360 1365
Ser Asn Ala Tyr Asp Phe Asn Phe Ser Glu Thr Glu Lys Tyr Lys
1370 1375 1380
Asp Ile Ala Gly Phe Tyr Arg Glu Val Glu Glu Gln Gly Tyr Lys
1385 1390 1395
Val Ser Phe Glu Ser Ala Ser Lys Lys Glu Val Asp Lys Leu Val
1400 1405 1410
Glu Glu Gly Lys Leu Tyr Met Phe Gln Ile Tyr Asn Lys Asp Phe
1415 1420 1425
Ser Asp Lys Ser His Gly Thr Pro Asn Leu His Thr Met Tyr Phe
1430 1435 1440
Lys Leu Leu Phe Asp Glu Asn Asn His Gly Gln Ile Arg Leu Ser
1445 1450 1455
Gly Gly Ala Glu Leu Phe Met Arg Arg Ala Ser Leu Lys Lys Glu
1460 1465 1470
Glu Leu Val Val His Pro Ala Asn Ser Pro Ile Ala Asn Lys Asn
1475 1480 1485
Pro Asp Asn Pro Lys Lys Thr Thr Thr Leu Ser Tyr Asp Val Tyr
1490 1495 1500
Lys Asp Lys Arg Phe Ser Glu Asp Gln Tyr Glu Leu His Ile Pro
1505 1510 1515
Ile Ala Ile Asn Lys Cys Pro Lys Asn Ile Phe Lys Ile Asn Thr
1520 1525 1530
Glu Val Arg Val Leu Leu Lys His Asp Asp Asn Pro Tyr Val Ile
1535 1540 1545
Gly Ile Ala Arg Gly Glu Arg Asn Leu Leu Tyr Ile Val Val Val
1550 1555 1560
Asp Gly Lys Gly Asn Ile Val Glu Gln Tyr Ser Leu Asn Glu Ile
1565 1570 1575
Ile Asn Asn Phe Asn Gly Ile Arg Ile Lys Thr Asp Tyr His Ser
1580 1585 1590
Leu Leu Asp Lys Lys Glu Lys Glu Arg Phe Glu Ala Arg Gln Asn
1595 1600 1605
Trp Thr Ser Ile Glu Asn Ile Lys Glu Leu Lys Ala Gly Tyr Ile
1610 1615 1620
Ser Gln Val Val His Lys Ile Cys Glu Leu Val Glu Lys Tyr Asp
1625 1630 1635
Ala Val Ile Ala Leu Ala Asp Leu Asn Ser Gly Phe Lys Asn Ser
1640 1645 1650
Arg Val Lys Val Glu Lys Gln Val Tyr Gln Lys Phe Glu Lys Met
1655 1660 1665
Leu Ile Asp Lys Leu Asn Tyr Met Val Asp Lys Lys Ser Asn Pro
1670 1675 1680
Cys Ala Thr Gly Gly Ala Leu Lys Gly Tyr Gln Ile Thr Asn Lys
1685 1690 1695
Phe Glu Ser Phe Lys Ser Met Ser Thr Gln Asn Gly Phe Ile Phe
1700 1705 1710
Tyr Ile Pro Ala Trp Leu Thr Ser Lys Ile Asp Pro Ser Thr Gly
1715 1720 1725
Phe Val Asn Leu Leu Lys Thr Lys Tyr Thr Ser Ile Ala Asp Ser
1730 1735 1740
Lys Lys Phe Ile Ser Ser Phe Asp Arg Ile Met Tyr Val Pro Glu
1745 1750 1755
Glu Asp Leu Phe Glu Phe Ala Leu Asp Tyr Lys Asn Phe Ser Arg
1760 1765 1770
Thr Asp Ala Asp Tyr Ile Lys Lys Trp Lys Leu Tyr Ser Tyr Gly
1775 1780 1785
Asn Arg Ile Arg Ile Phe Arg Asn Pro Lys Lys Asn Asn Val Phe
1790 1795 1800
Asp Trp Glu Glu Val Cys Leu Thr Ser Ala Tyr Lys Glu Leu Phe
1805 1810 1815
Asn Lys Tyr Gly Ile Asn Tyr Gln Gln Gly Asp Ile Arg Ala Leu
1820 1825 1830
Leu Cys Glu Gln Ser Asp Lys Ala Phe Tyr Ser Ser Phe Met Ala
1835 1840 1845
Leu Met Ser Leu Met Leu Gln Met Arg Asn Ser Ile Thr Gly Arg
1850 1855 1860
Thr Asp Val Ala Phe Leu Ile Ser Pro Val Lys Asn Ser Asp Gly
1865 1870 1875
Ile Phe Tyr Asp Ser Arg Asn Tyr Glu Ala Gln Glu Asn Ala Ile
1880 1885 1890
Leu Pro Lys Asn Ala Asp Ala Asn Gly Ala Tyr Asn Ile Ala Arg
1895 1900 1905
Lys Val Leu Trp Ala Ile Gly Gln Phe Lys Lys Ala Glu Asp Glu
1910 1915 1920
Lys Leu Asp Lys Val Lys Ile Ala Ile Ser Asn Lys Glu Trp Leu
1925 1930 1935
Glu Tyr Ala Gln Thr Ser Val Lys His Gly Ser Pro Lys Lys Lys
1940 1945 1950
Arg Lys Val Ser Gly Gly Ser Thr Asn Leu Ser Asp Ile Ile Glu
1955 1960 1965
Lys Glu Thr Gly Lys Gln Leu Val Ile Gln Glu Ser Ile Leu Met
1970 1975 1980
Leu Pro Glu Glu Val Glu Glu Val Ile Gly Asn Lys Pro Glu Ser
1985 1990 1995
Asp Ile Leu Val His Thr Ala Tyr Asp Glu Ser Thr Asp Glu Asn
2000 2005 2010
Val Met Leu Leu Thr Ser Asp Ala Pro Glu Tyr Lys Pro Trp Ala
2015 2020 2025
Leu Val Ile Gln Asp Ser Asn Gly Glu Asn Lys Ile Lys Met Leu
2030 2035 2040
Ser Gly Gly Ser Pro Lys Lys Lys Arg Lys Val
2045 2050
<210> 90
<211> 23
<212> DNA
<213> Zea mays
<400> 90
aatcaatggg aagcctatct acc 23
<210> 91
<211> 1284
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 91
atgtccgagg tggagttcag ccacgagtac tggatgaggc acgctctcac cctggctaag 60
agggcgtggg acgagaggga ggtgccggtg ggcgccgtgc tcgtccacaa caaccgcgtg 120
atcggcgagg gctggaacag gcccatcggc aggcacgacc caaccgctca cgccgagatc 180
atggctctca ggcagggcgg cctggtcatg cagaactaca ggctgatcga cgcgaccctc 240
tacgtgaccc tcgagccctg cgtcatggta agtttctgct tctacctttg atatatatat 300
aataattatc attaattagt agtaatataa tatttcaaat atttttttca aaataaaaga 360
atgtagtata tagcaattgc ttttctgtag tttataagtg tgtatatttt aatttataac 420
ttttctaata tatgaccaaa atttgttgat gtgcagtgcg cgggcgccat gatccactcc 480
aggatcggca gggtggtctt cggcgctagg gacgccaaga cgggcgctgc gggcagcctc 540
atggacgtgc tgcaccaccc cggcatgaac caccgcgtcg agatcaccga gggcatcctc 600
gcggacgagt gcgctgcgct cctgtccgac ttcttcagga tgcgcaggca ggagatcaag 660
gcccagaaga aggcgcagtc cagcaccgac tccggcggct ccagcggcgg ctccagcggc 720
agcgagaccc cgggcacgtc cgagagcgcg acgcccgaga gcagcggcgg ctccagcggc 780
ggctcctcgg aggtcgagtt cagccatgag tactggatga ggcatgccct gactctcgct 840
aagagggcgc gggatgagcg cgaggtgccg gtgggggccg tgctcgtcct gaacaaccgc 900
gtgatcgggg agggctggaa ccgggctatc ggcctccacg acccaacggc ccatgccgag 960
atcatggccc tgaggcaggg cggcctggtc atgcaaaact acaggctcat cgacgccacc 1020
ctctacgtga ccttcgagcc atgcgtgatg tgcgcggggg ccatgatcca ctcgaggatt 1080
gggagggtgg tcttcggcgt gcgcaacgct aagacggggg ccgccggcag cctcatggac 1140
gtcctgcact acccgggcat gaaccacagg gtggagatta ccgagggcat cctggccgat 1200
gagtgcgccg cgctcctgtg ctacttcttc cgcatgccca ggcaggtctt caacgcgcag 1260
aagaaggccc agagctccac tgat 1284
<210> 92
<211> 422
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 92
Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu
1 5 10 15
Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala
20 25 30
Val Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro
35 40 45
Ile Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg
50 55 60
Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu
65 70 75 80
Tyr Val Thr Leu Glu Pro Cys Val Met Val Ser Phe Cys Phe Tyr Leu
85 90 95
Tyr Ile Tyr Asn Asn Tyr His Leu Val Val Ile Tyr Phe Lys Tyr Phe
100 105 110
Phe Gln Asn Lys Arg Met Tyr Ile Ala Ile Ala Phe Leu Phe Ile Ser
115 120 125
Val Tyr Ile Leu Ile Tyr Asn Phe Ser Asn Ile Pro Lys Phe Val Asp
130 135 140
Val Gln Cys Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val
145 150 155 160
Phe Gly Ala Arg Asp Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp
165 170 175
Val Leu His His Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly
180 185 190
Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu Ser Asp Phe Phe Arg Met
195 200 205
Arg Arg Gln Glu Ile Lys Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp
210 215 220
Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr
225 230 235 240
Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser
245 250 255
Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr
260 265 270
Leu Ala Lys Arg Ala Arg Asp Glu Arg Glu Val Pro Val Gly Ala Val
275 280 285
Leu Val Leu Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Ala Ile
290 295 300
Gly Leu His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln
305 310 315 320
Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr
325 330 335
Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser
340 345 350
Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly Ala
355 360 365
Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His Arg
370 375 380
Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu
385 390 395 400
Cys Tyr Phe Phe Arg Met Pro Arg Gln Val Phe Asn Ala Gln Lys Lys
405 410 415
Ala Gln Ser Ser Thr Asp
420
Claims (27)
- N-말단에서 C-말단 방향으로, 이종성 도메인, 제1 링커 서열, 및 V형 CRISPR-Cas 효소를 포함하는 융합 단백질로서, 제1 링커 서열은 반복된 GGGGS 서열을 포함하는, 융합 단백질.
- 제1항에 있어서, 이종성 도메인은 데아미나제, 폴리머라제, 뉴클레아제, 릴랙사제, 알킬트랜스퍼라제, 메틸트랜스퍼라제, 아데노신 데아미나제, 시티딘 데아미나제, 옥시다제, 티민 알킬트랜스퍼라제, 아데닌 옥시다제, 아데노신 메틸트랜스퍼라제, 글리코실라제 또는 핵 국재화 신호인, 융합 단백질.
- 제2항에 있어서, 이종성 도메인은 데아미나제 도메인인, 융합 단백질.
- 제3항에 있어서, 데아미나제 도메인은 시티딘 데아미나제인, 융합 단백질.
- 제4항에 있어서, 시티딘 데아미나제 도메인은 활성화-유도 시티딘 데아미나제("AID")인, 융합 단백질.
- 제4항에 있어서, 시티딘 데아미나제 도메인은 아포리포단백질 B mRNA-편집 복합체("APOBEC") 도메인인, 융합 단백질.
- 제6항에 있어서, APOBEC 도메인은 APOBEC1 패밀리 데아미나제인, 융합 단백질.
- 제7항에 있어서, APOBEC 도메인은 SEQ ID NO: 1과 적어도 70% 동일한 서열을 포함하는, 융합 단백질.
- 제3항에 있어서, 데아미나제 도메인은 아데닌 데아미나제인, 융합 단백질.
- 제9항에 있어서, 아데닌 데아미나제는 TadA 도메인인, 융합 단백질.
- 제10항에 있어서, TadA 도메인은 SEQ ID NO: 92와 적어도 70% 동일한 서열을 포함하는, 융합 단백질.
- 제1항에 있어서, V형 CRISPR-Cas 효소는 V-A형(Cas12a) 효소인, 융합 단백질.
- 제12항에 있어서, Cas12a 도메인은 SEQ ID NO: 3, SEQ ID NO: 6, SEQ ID NO: 22, SEQ ID NO: 45, SEQ ID NO: 46, SEQ ID NO: 47, 및 SEQ ID NO: 48로 구성된 군으로부터 선택되는, 융합 단백질.
- 제13항에 있어서, Cas12a 도메인은 촉매적 비활성이고, SEQ ID NO: 3, SEQ ID NO: 6, 및 SEQ ID NO: 22로 구성된 군으로부터 선택되는, 융합 단백질.
- 제1항에 있어서, 제1 링커 서열은 적어도 3 회 반복된 GGGGS를 포함하는, 융합 단백질.
- 제15항에 있어서, 제1 링커 서열은 적어도 6 회 반복된 GGGGS를 포함하는, 융합 단백질.
- 제1항 내지 제16항 중 어느 한 항에 있어서, 융합 단백질은 SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 13, 및 SEQ ID NO: 44로 이루어진 군으로부터 선택된 서열을 포함하는, 융합 단백질.
- 제1항 내지 제17항 중 어느 한 항에 있어서, 우라실 DNA 글리코실라제 억제제("UGI") 도메인을 추가로 포함하는, 융합 단백질.
- 제18항에 있어서, UGI 도메인은 SEQ ID NO: 8을 포함하는, 융합 단백질.
- 제19항에 있어서, UGI 도메인은 서열 SGGS를 포함하는 제2 링커에 의해 Cas12a 효소에 연결되는, 융합 단백질.
- 제1항에 있어서, SEQ ID NO: 17, SEQ ID NO: 24, SEQ ID NO: 35, SEQ ID NO: 39, SEQ ID NO: 43, SEQ ID NO: 50, SEQ ID NO: 52, SEQ ID NO: 54, SEQ ID NO: 56, SEQ ID NO: 81, SEQ ID NO: 83, SEQ ID NO: 85, SEQ ID NO:87, 및 SEQ ID NO:89로 이루어진 군으로부터 선택된 서열을 포함하는, 융합 단백질.
- 제1항에 있어서, DNA와 접촉될 때, 반복된 GGGGS 서열 이외의 제1 링커 서열을 갖는 융합 단백질에 비해 증가된 빈도로 표적내 편집을 생성하고 감소된 빈도로 표적외 편집을 생성하는, 융합 단백질.
- 식물 게놈 DNA를 편집하는 방법으로서, 상기 방법은 식물 게놈 DNA를
(a) 선택적으로 UGI 도메인을 포함하여, 제1항 내지 제17항 중 어느 한 항의 융합 단백질; 및
(b) 단계 (a)의 융합 단백질을 식물 게놈 DNA의 표적 DNA 서열에 표적화하는 가이드 RNA("gRNA")와 접촉시키는 단계를 포함하고,
편집된 식물 게놈 DNA는 반복된 GGGGS 서열 이외의 제1 링커를 갖는 융합 단백질에 의해 편집된 식물 게놈 DNA에 비해 감소된 표적외 편집을 포함하는, 방법. - 감소된 표적외 편집으로 식물 게놈 DNA를 편집하는 방법으로서, 상기 방법은 식물 게놈 DNA를
(a) 선택적으로 UGI 도메인을 포함하여, 제1항 내지 제17항 중 어느 한 항의 융합 단백질; 및
(b) 단계 (a)의 융합 단백질을 식물 게놈 DNA의 표적 DNA 서열에 표적화하는 가이드 RNA("gRNA")와 접촉시키는 단계를 포함하고,
편집된 식물 게놈 DNA는 반복된 GGGGS 서열 이외의 제1 링커를 갖는 융합 단백질에 의해 편집된 식물 게놈 DNA에 비해 감소된 표적외 편집을 포함하는, 방법. - 제24항에 있어서, 융합 단백질은 SEQ ID NO: 24를 포함하는, 방법.
- 감소된 표적외 편집으로 편집된 식물의 집단을 수득하는 방법으로서, 상기 방법은
(a) 편집될 게놈 DNA를 포함하는 식물 세포의 집단을 수득하는 단계;
(b) 제1항 내지 제16항 중 어느 한 항 및 선택적으로 UGI 도메인의 융합 단백질을 인코딩하는 뉴클레오티드 서열을 수득하는 단계;
(c) 식물 세포의 집단을 단계 (b)의 뉴클레오티드 서열로 형질 전환함으로써, 식물 세포의 집단 내 핵산 서열에 의해 인코딩되는 융합 단백질을 발현하는 단계;
(d) 형질 전환된 식물 세포 집단을 식물로 성장시키는 단계로서, 식물 중 적어도 하나가 편집되는 단계; 및
(e) 단계 (d)의 산물로부터 적어도 하나의 편집된 식물을 선택함으로써, 편집된 식물의 집단을 수득하는 단계를 포함하고,
편집된 식물의 집단은 반복된 GGGGS 서열 이외의 제1 링커를 갖는 융합 단백질에 의해 편집된 식물에 비해 감소된 표적외 편집을 포함하는, 방법. - 제26항에 있어서, 뉴클레오티드 서열은 SEQ ID NO: 17, SEQ ID NO: 24, SEQ ID NO: 35, SEQ ID NO: 39, SEQ ID NO: 43, SEQ ID NO: 50, SEQ ID NO: 52, SEQ ID NO: 54, SEQ ID NO: 56, SEQ ID NO: 81, SEQ ID NO: 83, SEQ ID NO: 85, SEQ ID NO:87, 및 SEQ ID NO:89로 이루어진 군으로부터 선택된 융합 단백질에 대해 인코딩하는, 방법.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNPCT/CN2019/108026 | 2019-09-26 | ||
PCT/CN2019/108026 WO2021056302A1 (en) | 2019-09-26 | 2019-09-26 | Methods and compositions for dna base editing |
PCT/US2020/051383 WO2021061507A1 (en) | 2019-09-26 | 2020-09-18 | Methods and compositions for dna base editing |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20220066111A true KR20220066111A (ko) | 2022-05-23 |
Family
ID=75166246
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020227012388A KR20220066111A (ko) | 2019-09-26 | 2020-09-18 | Dna 염기 편집을 위한 방법 및 조성물 |
Country Status (11)
Country | Link |
---|---|
US (1) | US20220403396A1 (ko) |
EP (1) | EP4034648A4 (ko) |
JP (1) | JP2022549430A (ko) |
KR (1) | KR20220066111A (ko) |
CN (1) | CN114761547A (ko) |
AU (1) | AU2020354372A1 (ko) |
CA (1) | CA3149273A1 (ko) |
CL (2) | CL2022000745A1 (ko) |
IL (1) | IL290572A (ko) |
MX (1) | MX2022003577A (ko) |
WO (2) | WO2021056302A1 (ko) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
MX2022012683A (es) * | 2020-04-09 | 2023-01-11 | Verve Therapeutics Inc | Edicion de bases de pcsk9 y metodos de uso de la misma para el tratamiento de enfermedades. |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2439472A1 (en) * | 2001-02-27 | 2002-09-06 | University Of Rochester | Methods and compositions for modifying apolipoprotein b mrna editing |
WO2017070632A2 (en) * | 2015-10-23 | 2017-04-27 | President And Fellows Of Harvard College | Nucleobase editors and uses thereof |
CA3032699A1 (en) * | 2016-08-03 | 2018-02-08 | President And Fellows Of Harvard College | Adenosine nucleobase editors and uses thereof |
JP2020510439A (ja) * | 2017-03-10 | 2020-04-09 | プレジデント アンド フェローズ オブ ハーバード カレッジ | シトシンからグアニンへの塩基編集因子 |
KR102687373B1 (ko) * | 2017-03-23 | 2024-07-23 | 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 | 핵산 프로그램가능한 dna 결합 단백질을 포함하는 핵염기 편집제 |
JP7364472B2 (ja) * | 2017-05-18 | 2023-10-18 | ザ・ブロード・インスティテュート・インコーポレイテッド | 標的化された核酸編集のための系、方法、及び組成物 |
WO2018213726A1 (en) * | 2017-05-18 | 2018-11-22 | The Broad Institute, Inc. | Systems, methods, and compositions for targeted nucleic acid editing |
EP3658573A1 (en) * | 2017-07-28 | 2020-06-03 | President and Fellows of Harvard College | Methods and compositions for evolving base editors using phage-assisted continuous evolution (pace) |
WO2019041296A1 (zh) * | 2017-09-01 | 2019-03-07 | 上海科技大学 | 一种碱基编辑系统及方法 |
CN111757937A (zh) * | 2017-10-16 | 2020-10-09 | 布罗德研究所股份有限公司 | 腺苷碱基编辑器的用途 |
CN110157727A (zh) * | 2017-12-21 | 2019-08-23 | 中国科学院遗传与发育生物学研究所 | 植物碱基编辑方法 |
CN109957569B (zh) * | 2017-12-22 | 2022-10-25 | 苏州齐禾生科生物科技有限公司 | 基于cpf1蛋白的碱基编辑系统和方法 |
US20210079366A1 (en) * | 2017-12-22 | 2021-03-18 | The Broad Institute, Inc. | Cas12a systems, methods, and compositions for targeted rna base editing |
BR112020012696A2 (pt) * | 2017-12-22 | 2020-11-24 | The Broad Institute Inc. | diagnóstico multiplex com base em sistema efetor crispr |
WO2019161783A1 (en) * | 2018-02-23 | 2019-08-29 | Shanghaitech University | Fusion proteins for base editing |
CN113913454B (zh) * | 2018-11-07 | 2023-07-21 | 中国农业科学院植物保护研究所 | 一套用于水稻的人工基因编辑系统 |
-
2019
- 2019-09-26 WO PCT/CN2019/108026 patent/WO2021056302A1/en active Application Filing
-
2020
- 2020-09-18 EP EP20868850.7A patent/EP4034648A4/en active Pending
- 2020-09-18 JP JP2022518227A patent/JP2022549430A/ja active Pending
- 2020-09-18 MX MX2022003577A patent/MX2022003577A/es unknown
- 2020-09-18 CA CA3149273A patent/CA3149273A1/en active Pending
- 2020-09-18 CN CN202080081866.3A patent/CN114761547A/zh active Pending
- 2020-09-18 AU AU2020354372A patent/AU2020354372A1/en active Pending
- 2020-09-18 KR KR1020227012388A patent/KR20220066111A/ko unknown
- 2020-09-18 WO PCT/US2020/051383 patent/WO2021061507A1/en unknown
- 2020-09-18 US US17/763,384 patent/US20220403396A1/en active Pending
-
2022
- 2022-02-13 IL IL290572A patent/IL290572A/en unknown
- 2022-03-24 CL CL2022000745A patent/CL2022000745A1/es unknown
-
2023
- 2023-11-17 CL CL2023003425A patent/CL2023003425A1/es unknown
Also Published As
Publication number | Publication date |
---|---|
CN114761547A (zh) | 2022-07-15 |
MX2022003577A (es) | 2022-04-25 |
CL2022000745A1 (es) | 2022-10-28 |
EP4034648A1 (en) | 2022-08-03 |
WO2021061507A1 (en) | 2021-04-01 |
US20220403396A1 (en) | 2022-12-22 |
CL2023003425A1 (es) | 2024-06-07 |
EP4034648A4 (en) | 2023-11-01 |
IL290572A (en) | 2022-04-01 |
JP2022549430A (ja) | 2022-11-25 |
CA3149273A1 (en) | 2021-04-01 |
WO2021056302A1 (en) | 2021-04-01 |
AU2020354372A1 (en) | 2022-03-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107109427B (zh) | 用于鉴定和富集包含位点特异性基因组修饰的细胞的方法和组合物 | |
KR102339365B1 (ko) | 키메라 게놈 조작 분자 및 방법 | |
CN111770992B (zh) | CRISPR-Cas12j酶和系统 | |
CN108795972B (zh) | 不使用转基因标记序列分离细胞的方法 | |
JP2023145691A (ja) | 遺伝子操作のためのヌクレアーゼシステム | |
CN106715694B (zh) | 核酸酶介导的dna组装 | |
AU2016380351A1 (en) | Novel CRISPR-associated transposases and uses thereof | |
KR102253223B1 (ko) | 식물 내 담배 특이 니트로사민 감소 | |
CN112105728B (zh) | CRISPR/Cas效应蛋白及系统 | |
AU2016334225A1 (en) | Novel RNA-guided nucleases and uses thereof | |
CN101784667A (zh) | 来自玉米的次生壁形成基因及其用途 | |
CN114641568A (zh) | Rna指导的核酸酶及其活性片段及变体以及使用方法 | |
KR20210099608A (ko) | 게놈 편집을 통한 유전자 침묵화 | |
US20210087557A1 (en) | Methods and compositions for targeted genomic insertion | |
KR20220137166A (ko) | 전이유전자성 마커 서열을 이용하지 않는 세포 단리 방법 | |
KR20220066111A (ko) | Dna 염기 편집을 위한 방법 및 조성물 | |
JP2022522823A (ja) | 天然miRNAのゲノム編集による標的遺伝子発現の抑制 | |
US11459577B2 (en) | Targeted insertion sites in the maize genome | |
WO2024080067A1 (ja) | ゲノム編集方法およびゲノム編集用組成物 | |
US20230114951A1 (en) | Targeted insertion sites in the maize genome | |
CN114502733A (zh) | 花期基因及其使用方法 | |
CN117255859A (zh) | 具有同源指导rna识别位点的可去除植物转基因基因座 |